היפותזה בדיקה במימון: קונספט & דוגמאות

Ivor Cummins at Ketofest 2017 - The Chronic Disease Spectrum: A Story of Root Cause and Solution (נוֹבֶמבֶּר 2024)

Ivor Cummins at Ketofest 2017 - The Chronic Disease Spectrum: A Story of Root Cause and Solution (נוֹבֶמבֶּר 2024)
היפותזה בדיקה במימון: קונספט & דוגמאות
Anonim

יועץ ההשקעות שלך מציע לך תוכנית הכנסה חודשית ההכנסה אשר מבטיח תשואה משתנה בכל חודש. אתה תשקיע בו רק אם אתה בטוח של ממוצע של 180 $ הכנסה חודשית. היועץ שלך גם אומר לך כי במשך 300 החודשים האחרונים, את הסכימה היה חוזר עם ערך ממוצע של 190 $ וסטיית תקן של 75 $. אתה צריך להשקיע בתוכנית זו?

בדיקת ההשערה מגיעה לסיוע לקבלת החלטות כאלה.

-> ->

מאמר זה מניח את היכרותם של הקוראים עם מושגים של טבלת תפוצה רגילה, נוסחה, ערך p ו יסודות קשורים של סטטיסטיקה.

לקבלת מידע נוסף על יישומים מעשיים של נתונים כדי לקבוע את הסיכון, ראה "5 דרכים למדוד את הסיכון בקרן נאמנות".

בדיקת ההשערה (או בדיקת מובהקות) היא מודל מתמטי לבדיקת תביעה, רעיון או השערה על פרמטר של עניין בקבוצת אוכלוסייה מסוימת, תוך שימוש בנתונים הנמדדים במדגם שנקבע. חישובים מבוצעים על דגימות נבחרות כדי לאסוף מידע מכריע יותר על המאפיינים של האוכלוסייה כולה, המאפשרת דרך שיטתית לבדוק תביעות או רעיונות על מערך הנתונים כולו.

הנה דוגמה פשוטה: (א) מנהל בית הספר מדווח כי תלמידים בבית הספר שלה ציון ממוצע של 7 מתוך 10 בבחינות. כדי לבדוק את ההשערה הזו, אנו מקליטים סימנים של 30 תלמידים (מדגם) מכל אוכלוסיית התלמידים של בית הספר (נניח 300) וחישוב ממוצע המדגם. לאחר מכן ניתן להשוות את הממוצע המדגם (המחושב) למשמעות האוכלוסייה (המדווחת) ולנסות לאשר את ההשערה.

דוגמה נוספת: (ב) התשואה השנתית של קרן נאמנות מסוימת היא 8%. נניח כי קרן נאמנות קיימת כבר 20 שנה. אנחנו לוקחים מדגם אקראי של תשואות שנתיות של קרן הנאמנות, למשל, חמש שנים (מדגם) ולחשב את הממוצע שלה. לאחר מכן, אנו משווים את הממוצע המדגם (המחושב) לאוכלוסייה (הנתבעת) כדי לאמת את ההשערה.

מתודולוגיות שונות קיימות עבור בדיקת ההשערה. ארבעת הצעדים הבסיסיים הבאים מעורבים:

שלב 1: הגדר את ההשערה:

בדרך כלל הערך המדווח (או הסטטיסטיקה של התביעות) מצוין כהשערה ונחשב נכון. הדוגמאות לעיל, היפותזה תהיה:

  • דוגמה א ': תלמידי בית הספר ציון ממוצע של 7 מתוך 10 בבחינות
  • דוגמה B: התשואה השנתית של קרן הנאמנות היא 8% לשנה

כאמור התיאור מהווה את " השערת Hull (H 0 ) " והוא הניח להיות אמיתי. כמו משפט המושבעים מתחיל בהנחה חפותו של החשוד ואחריו נחישות אם ההנחה היא שקרית. באופן דומה, בדיקת ההשערה מתחילה בקביעה ובהנחה של "השערת האפס", ולאחר מכן התהליך קובע אם ההנחה עשויה להיות נכונה או שקרית.

הנקודה החשובה היא, כי אנו בודקים את השערת האפס משום שיש אלמנט של ספק לגבי תוקפו. כל מידע שהוא נגד השערת האפס האמורה נלכד בהיפותזה החלופית (H 1 ). ל 8% לשנה לסיכום, היפותזה אלטרנטיבית היא סתירה ישירה להיפותזת האפס. כמו במשפט, חבר מושבעים מניח את חפותו של החשוד (השערת האפס). התובע חייב להוכיח אחרת (חלופה). כמו כן, על החוקר להוכיח כי השערת האפס נכונה או שקרית. אם התובע לא יצליח להוכיח את ההיפותזה האלטרנטיבית, חבר המושבעים צריך לשחרר את "החשוד" (בבסיס ההחלטה על השערת האפס). באופן דומה, אם החוקר נכשל להוכיח היפותזה חלופית (או פשוט לא עושה כלום), אז השערת null הוא הניח להיות נכון.

  • שלב 2: קבע את הקריטריונים להחלטה הקריטריונים לקבלת החלטות חייבים להיות מבוססים על פרמטרים מסוימים של מערכי נתונים וכאן מגיע החיבור לחלוקה רגילה לתמונה. על פי הסטטיסטיקה הסטנדרטית על הפצת הדגימה, "עבור כל גודל מדגם n, התפלגות הדגימה של X̅ היא נורמלית אם האוכלוסייה X שממנה המדגם מצויר מחולקת בדרך כלל. "לפיכך, ההסתברויות של
  • כל מדגם אפשרי אחר אומר אחד יכול לבחור מופצים בדרך כלל. עבור e. ז. , לקבוע אם התשואה היומי הממוצע, של כל המניות הרשומות על שוק המניות XYZ, סביב השנה החדשה יותר מ -2%.

H

0

: השערות אלטרנטיביות: כלומר 2% (זה מה שאנחנו רוצים להוכיח)

H < קח את המדגם (למשל של 50 מניות מתוך סך 500) ולחשב את הממוצע של המדגם.

לחלוקה רגילה, 95% מהערכים נמצאים בתוך 2 סטיות תקן של האוכלוסייה. לפיכך, התפלגות נורמלית זו והנחת גבול מרכזית עבור מערך הנתונים המדגם מאפשרת לנו ליצור 5% כרמת מובהקות. זה הגיוני כמו תחת הנחה זו, יש פחות מ 5% הסתברות (100-95) של מקבל outliers כי הם מעבר 2 סטיות תקן מן האוכלוסייה מתכוון. בהתאם לאופי של מערכי נתונים, רמות משמעותיות אחרות ניתן לקחת ב 1%, 5% או 10%. עבור חישובים פיננסיים (כולל מימון התנהגותי), 5% הוא הגבול המקובל. אם אנו מוצאים כל חישובים כי ללכת מעבר רגיל 2 סטיות תקן, אז יש לנו מקרה חזק של חריגים לדחות את ההשערה null. סטיות תקן חשובות ביותר להבנת נתונים סטטיסטיים. למידע נוסף עליהם על ידי צפייה בסרטון של אינסטופדיה על סטיות תקן.

מבחינה גרפית, זה מיוצג כדלקמן:

בדוגמה לעיל, אם הממוצע של המדגם הוא הרבה יותר מ -2% (אומרים 3. 5%), אז אנחנו דוחים את השערת האפס.ההשערה האלטרנטיבית (כלומר, 2%) מתקבלת, המאשרת כי התשואה הממוצעת היומי של המניות אכן מעל 2%. עם זאת, אם הממוצע של המדגם אינו צפוי להיות גדול משמעותית מ -2% (ולהישאר בבית סביב 2. 2%), אז אנחנו לא יכולים לדחות את השערת האפס. האתגר בא על איך להחליט על מקרים כאלה טווח קרוב. כדי להגיע למסקנה מדגימות ותוצאות נבחרות, יש לקבוע רמת של משמעות

, דבר המאפשר סיכום על השערת האפס. ההיפותזה האלטרנטיבית מאפשרת לקבוע את רמת החשיבות או את המושג "ערך קריטי" להחלטה על מקרים כה קרובים, על פי ההגדרה הסטנדרטית, "ערך קריטי הוא ערך חתך המגדיר את הגבולות שמעבר להם פחות מ -5% ניתן להשיג אמצעים אם השערת האפס נכונה.האמצעים לדוגמה שהתקבלו מעבר לערך קריטי יביאו להחלטה לדחות את השערת האפס "בדוגמה לעיל, אם הגדרנו את הערך הקריטי כ- 2%, ואת ממוצע מחושב מגיע ל -2% 2. אז אנחנו דוחים את השערת האפס, ערך קריטי יוצר תיחום ברור לגבי קבלה או דחייה. דוגמאות נוספות לכך - ראשית, הבה נבחן כמה צעדים ומושגים מרכזיים. שלב 3: חישוב הנתונים הסטטיסטיים של הבדיקה:

שלב זה כרוך בחישוב הדמויות הנדרשות, הידועות כסטטיסטיקות בדיקה (כמו ממוצע, z-score, p-value וכו '), עבור המדגם שנבחר. הערכים השונים שיש לחשבם מכוסים בחלק מאוחר יותר עם דוגמאות.

שלב 4: להסיק מסקנות על ההיפותזה עם הערך המחושב, להחליט על השערת האפס. אם ההסתברות לקבל מדגם ממוצע היא פחות מ -5%, אז המסקנה היא לדחות

את השערת האפס. אחרת,

קבל

ושמור על השערת האפס. סוגי טעויות בקבלת החלטות: יכולות להיות ארבע תוצאות אפשריות בקבלת החלטות מבוססות מדגם, בכל הנוגע לתחולה הנכונה לכלל האוכלוסייה:

החלטה להישמר

החלטה לדחות > תקף לגבי כל האוכלוסייה

נכון

שגוי

(TYPE 1 Error - a) לא חל על כל האוכלוסייה שגוי (שגיאת TYPE 2 - b) נכון

המקרים "נכון" הם אלה שבו ההחלטות נלקחו על דגימות הם ישים באמת לכל האוכלוסייה. מקרים של טעויות מתעוררים כאשר מחליטים לשמור (או לדחות) את השערת האפס על סמך חישובי מדגם, אך החלטה זו אינה חלה על כלל האוכלוסייה. מקרים אלה מהווים שגיאות מסוג 1 (אלפא) וסוג 2 (ביתא), כפי שמצוין בטבלה שלמעלה.

בחירת הערך הקריטי הנכון מאפשרת לבטל את שגיאות אלפא מסוג 1 או להגביל אותם לטווח מקובל.

אלפא מציין את השגיאה ברמת מובהקות, ונקבעת על ידי החוקר. כדי לשמור על רמת 5% סטנדרטית או רמת ביטחון עבור חישובי הסתברות, זה נשמר ב 5%.

על פי המדדים וההגדרות הרלוונטיים לקבלת החלטות:

"קריטריון זה (אלפא) נקבע בדרך כלל ב -0.05 (a = 0. 05), ואנו משווים את רמת אלפא לערך p. כאשר ההסתברות לשגיאה מסוג I היא פחות מ -5% (p <0. 05), אנו מחליטים לדחות את השערת האפס; אחרת, אנו שומרים על השערת האפס. "

המונח הטכני המשמש להסתברות זו הוא

p-value

. היא מוגדרת "ההסתברות לקבל תוצאה מדגם, בהתחשב בעובדה שהשווי הנקוב בהשערת האפס נכון. ערך p להשגת תוצאת מדגם מושווה לרמת המשמעות ".

טעות מסוג II, או שגיאת בטא, מוגדרת כ"הסתברות לשמירה לא נכונה של השערת האפס, כאשר למעשה היא אינה תקפה על כלל האוכלוסייה. "

כמה דוגמאות נוספות ימחישו זאת וחישובים אחרים.

דוגמה 1. תוכנית הכנסה חודשית קיימת תוכנית המבטיחה תשואה חודשית משתנה. משקיע ישקיע בה רק אם יובטח לו הכנסה חודשית של 180 דולר. יש לו דוגמה של תשואות של 300 חודשים שיש להם ממוצע של 190 דולר וסטיית תקן של 75 דולר. האם הוא צריך להשקיע בתוכנית זו?

בואו נגדיר את הבעיה. המשקיע ישקיע את התוכנית אם הוא או היא מובטחת של הרצוי 180 $ התשואה הממוצעת שלו. < :

זיהוי ערך קריטי X

L

עבור המדגם הממוצע, שהוא גדול מספיק כדי לדחות את השערת האפס - i. ה. דוחה את השערת האפס אם ממוצע המדגם> ערך קריטי> ערך קריטי X = L

P (זיהוי שגיאת אלפא מסוג I) = P (דחה H

  • 0
  • בהתחשב בכך ש < 0 הוא נכון),
  • אשר יושג כאשר ממוצע המדגם עולה על גבולות קריטיים i. ה.

= P (בהתחשב בכך ש-

0

נכון) = אלפא

מבחינה גרפית, נטילת אלפא = 0. 05 (5% רמת מובהקות), Z 0. 05

= 1. 645 (מתוך השולחן Z או טבלת ההפצה הרגילה) => X L

= 180 + 1. 641 (75 / sqrt (300)) = 187 12 מאחר שממוצע המדגם (190) גדול מהערך הקריטי (187 12), השערת האפס נדחית, והמסקנה היא שההחזר החודשי הממוצע הוא אכן גדול מ 180 $, כך המשקיע יכול לשקול להשקיע בתוכנית זו.

שיטה 2 - שימוש בסטטיסטיקות בדיקה סטנדרטיות : ניתן להשתמש גם בערך הסטנדרטי z. מבחן סטטיסטי, Z = (ממוצע מדגם - ממוצע אוכלוסיה) / (std-dev / sqrt (מספר דגימות) כלומר

לאחר מכן, אזור הדחייה הופך ל Z = (190 - 180) / 75 = אזור הדחייה ברמת מובהקות של 5% הוא Z> Z 0. 05 = 1. 645

מאז Z = 2. 309 מ -1,645, ניתן לדחות את השערת האפס במסקנה דומה שהוזכרה לעיל.

שיטה 3 - חישוב ערך P: אנו שואפים לזהות P (ממוצע המדגם> = 190, כאשר ממוצע = 180) << = P (Z> = (190- 180) / (75 / sqrt (300)) = P (Z> = 2. 309) = 0. 0084 = 0. 84%

הטבלה הבאה כדי להסיק חישובי ערך p מסכם כי יש הוכחה הוכחה החזר חודשי ממוצע להיות גבוה מ 180.

p-value ההסקה פחות מ 1%

עדויות מאושרות השערת אלטרנטיבה תומכת בין 1% ל 5%

עדות חזקה

השערת אלטרנטיבה תומכת > בין 5% ל -10% עדויות חלשות

השערה תומכת אלטרנטיבית

יותר מ -10%

אין עדות

היפותזה תומכת אלטרנטיבית

דוגמה 2: תובע חדש של מניות (XYZ) כי תעריפי התיווך שלו נמוכים מזה של ברוקר המניות הנוכחי שלך (ABC). נתונים זמינים מחברת מחקר עצמאית עולה כי הממוצע ו- std-dev של כל לקוחות הברוקר ABC הם 18 $ ו 6 $ בהתאמה. מדגם של 100 לקוחות של ABC הוא נלקח עמלות תיווך מחושבים עם שיעורי חדש של ברוקר XYZ. אם ממוצע המדגם הוא 18 $. 75 ו std- dev הוא זהה ($ 6), האם כל היקש יכול להיעשות על ההבדל של הצעת חוק התיווך הממוצע בין ABC ו XYZ ברוקר? H

0

: השערת האפס: ממוצע = 18

H

1

: השערה חלופית: אומר 18 (זה מה שאנחנו רוצים להוכיח)

אזור דחייה: Z <= - z

2. 5

ו- Z> = Z

2. 5 (בהנחה שרמת מובהקות של 5%, מפוצלת 2) 5 בכל צד)

Z = (ממוצע מדגם - ממוצע) / (std-dev / sqrt (מספר דגימות) = (18 (1)

2. 5

= 1. 96. זה מסיק כי אין ראיות מספיקות להסיק כי יש הבדל בין שיעורי הברוקר הקיים שלך החדש.

לחלופין, P = ערך = P (Z1. 25)

= 2 * 0. 1056 = 0. 2112 = 21. 12% שהוא גדול מ -0.05 או 5%, ומוביל לאותה מסקנה. , הוא מיוצג על ידי: נקודות ביקורת עבור בדיקה היפותטית שיטה:

-

שיטת סטטיסטית על בסיס הנחות - שגיאה נוטה כמפורט במונחים של שגיאות אלפא ביתא

- פרשנות של p- ערך יכול להיות מעורפל, המוביל לתוצאות מבלבל

השורה התחתונה

בדיקת ההשערה מאפשרת מודל מתמטי לאמת תביעה או רעיון עם רמת ביטחון מסוימת. עם זאת, כמו רוב הכלים והמודלים הסטטיסטיים, גם זה קשור למספר מגבלות. השימוש במודל זה לקבלת החלטות פיננסיות צריך להיחשב בקריטיות, תוך שמירה על כל התלות בראש. שיטות חלופיות כמו הייעוד הבייסי הם גם שווה לחקור עבור ניתוח דומה.