מודלים סטטיסטיים: שיטות, תיאור, יישום

תוכן עניינים:

מודלים סטטיסטיים: שיטות, תיאור, יישום
מודלים סטטיסטיים: שיטות, תיאור, יישום
Anonim

ההנחות המגולמות במודלים סטטיסטיים מתארות קבוצה של התפלגויות הסתברות, שחלקן מניחות כמקורבות נאותה של ההתפלגות. קבוצה מסוימת של נתונים נבחרה מההגדרה. התפלגויות ההסתברות הגלומות במודלים סטטיסטיים הם שמבדילים מודלים סטטיסטיים ממודלים מתמטיים אחרים, לא סטטיסטיים.

Image
Image

חיבור למתמטיקה

שיטה מדעית זו מעוגנת בעיקר במתמטיקה. מודל סטטיסטי של מערכות ניתן בדרך כלל על ידי משוואות מתמטיות המתייחסות למשתנים מקריים אחד או יותר ואולי גם משתנים לא מקריים אחרים. לפיכך, מודל סטטיסטי הוא "ייצוג פורמלי של תיאוריה" (הרמן אדר, מצטט את קנת' בולן).

כל מבחני ההשערה הסטטיסטית וכל האומדנים הסטטיסטיים נגזרים ממודלים סטטיסטיים. באופן כללי יותר, מודלים סטטיסטיים הם חלק מהבסיס להסקה סטטיסטית.

שיטות של סטטיסטיקהדוגמנות

באופן לא רשמי, מודל סטטיסטי יכול להיחשב כהנחה סטטיסטית (או קבוצה של הנחות סטטיסטיות) עם תכונה מסוימת: הנחה זו מאפשרת לנו לחשב את ההסתברות של כל אירוע. כדוגמה, שקול זוג קוביות רגילות עם שש צדדים. נלמד שתי הנחות סטטיסטיות שונות לגבי העצם.

ההנחה הסטטיסטית הראשונה מהווה את המודל הסטטיסטי, מכיוון שרק בהנחה אחת נוכל לחשב את ההסתברות של כל אירוע. ההנחה הסטטיסטית החלופית אינה מהווה מודל סטטיסטי, מכיוון שעם הנחה אחת בלבד איננו יכולים לחשב את ההסתברות של כל אירוע.

מודל סטטיסטי טיפוסי
מודל סטטיסטי טיפוסי

בדוגמה שלמעלה עם ההנחה הראשונה, קל לחשב את ההסתברות לאירוע. עם זאת, בכמה דוגמאות אחרות, החישוב עשוי להיות מורכב או אפילו לא מעשי (לדוגמה, הוא עשוי לדרוש מיליוני שנים של חישוב). בהנחה שמהווה מודל סטטיסטי, קושי זה מתקבל על הדעת: ביצוע החישוב אינו חייב להיות מעשי, אלא אפשרי תיאורטית.

דוגמאות לדגמים

נניח שיש לנו אוכלוסייה של תלמידי בית ספר עם ילדים בחלוקה שווה. גובהו של ילד יהיה קשור מבחינה סטוגסטית לגיל: למשל, כאשר אנו יודעים שילד בן 7, הדבר משפיע על ההסתברות שהילד יהיה בגובה 5 רגל (כ-152 ס מ). נוכל להמציא את הקשר הזה במודל רגרסיה ליניארית, לדוגמה: צמיחה=b0 + b1agei+ εi, כאשר b0 הוא הצומת, b1 הוא הפרמטר שבו מוכפל הגיל בעת קבלת תחזית הצמיחה, εi הוא מונח השגיאה. זה מרמז שגובה צפוי לפי גיל עם שגיאה מסוימת.

מודל חוקי חייב להתאים לכל נקודות הנתונים. אז קו ישר (heighti=b0 + b1agei) לא יכול להיות משוואה עבור מודל נתונים - אלא אם הוא מתאים לכל נקודות הנתונים בדיוק, כלומר כל נקודות הנתונים שוכנות בצורה מושלמת על הקו. יש לכלול את מונח השגיאה εi במשוואה כדי שהמודל יתאים לכל נקודות הנתונים.

סטטיסטיקת מגדר
סטטיסטיקת מגדר

כדי להסיק מסקנות סטטיסטיות, ראשית עלינו להניח כמה התפלגויות הסתברות עבור εi. לדוגמה, אנו יכולים להניח שההתפלגות של εi היא גאוסית, עם אפס ממוצע. במקרה זה, למודל יהיו 3 פרמטרים: b0, b1 והשונות של ההתפלגות גאוסית.

תיאור כללי

מודל סטטיסטי הוא מחלקה מיוחדת של מודל מתמטי. מה שמבדיל מודל סטטיסטי ממודלים מתמטיים אחרים הוא שהוא לא דטרמיניסטי. הוא משמש למודל נתונים סטטיסטיים. לפיכך, במודל סטטיסטי המוגדר באמצעות משוואות מתמטיות, למשתנים מסוימים אין ערכים ספציפיים, אלא יש להם התפלגויות הסתברות; כלומר, חלק מהמשתנים הם סטוכסטיים. בדוגמה למעלה, ε הוא משתנה סטוכסטי; ללא המשתנה הזה, המודל היהיהיה דטרמיניסטי.

מודלים סטטיסטיים משמשים לעתים קרובות בניתוח ומודלים סטטיסטיים, גם אם התהליך הפיזי שמודל הוא דטרמיניסטי. למשל, הטלת מטבעות היא באופן עקרוני תהליך דטרמיניסטי; אך בדרך כלל הוא מעוצב כסטוקסטי (באמצעות תהליך ברנולי).

סטטיסטיקות התחממות
סטטיסטיקות התחממות

דגמים פרמטריים

מודלים פרמטריים הם המודלים הסטטיסטיים הנפוצים ביותר. לגבי מודלים סמי-פרמטריים ולא-פרמטריים, אמר סר דיוויד קוקס: "הם כוללים בדרך כלל פחות הנחות לגבי המבנה והצורה של ההתפלגות, אבל בדרך כלל מכילים הנחות עצמאות חזקות". כמו כל המודלים האחרים שהוזכרו, הם משמשים לעתים קרובות גם בשיטה הסטטיסטית של מידול מתמטי.

דגמים מרובי רמות

מודלים מרובי רמות (הידועים גם בתור מודלים ליניאריים היררכיים, מודלים מקוננים של נתונים, מודלים מעורבים, מקדמים אקראיים, מודלים של אפקטים אקראיים, מודלים של פרמטרים אקראיים או מודלים מחולקים) הם מודלים של פרמטרים סטטיסטיים המשתנים ביותר מרמה אחת. דוגמה לכך היא מודל הישגי תלמידים המכיל מדדים לתלמידים בודדים וכן מדדים לכיתות בהן התלמידים מקובצים. ניתן לחשוב על מודלים אלה כהכללות של מודלים ליניאריים (בפרט, רגרסיה ליניארית), אם כי ניתן להרחיב אותם גם למודלים לא ליניאריים. מודלים אלה הפכוהרבה יותר פופולרי ברגע שכוח מחשוב ותוכנה מספקים הפכו זמינים.

פלח סטטיסטיקה
פלח סטטיסטיקה

מודלים מרובי רמות מתאימים במיוחד לפרויקטי מחקר שבהם הנתונים עבור המשתתפים מאורגנים ביותר מרמה אחת (כלומר, נתונים מקוננים). יחידות ניתוח הן בדרך כלל אינדיבידואלים (ברמה נמוכה יותר) המקוננות בתוך יחידות הקשר/מצטברות (ברמה גבוהה יותר). בעוד שהרמה הנמוכה ביותר של נתונים במודלים מרובים היא בדרך כלל אינדיבידואלית, ניתן לשקול מדידות חוזרות ונשנות של אנשים. לפיכך, מודלים רב-שכבתיים מספקים סוג חלופי של ניתוח לניתוח מדדים חוזרים חד-משתנים או רב-משתנים. ניתן לשקול הבדלים אינדיבידואליים בעקומות הגדילה. בנוסף, ניתן להשתמש במודלים רב-שכבתיים כחלופה ל-ANCOVA, כאשר ציוני משתנים תלויים מותאמים למשתנים נלווים (למשל, הבדלים אינדיבידואליים) לפני בדיקת הבדלי טיפול. מודלים מרובי-שכבות מסוגלים לנתח ניסויים אלה ללא הנחה של שיפועים אחידים של רגרסיה הנדרשים על-ידי ANCOVA.

ניתן להשתמש במודלים מרובי-מפלסים עבור נתונים עם רמות רבות, אם כי מודלים דו-מפלסים הם הנפוצים ביותר ושאר המאמר מתמקד באלה. יש לבחון את המשתנה התלוי ברמת הניתוח הנמוכה ביותר.

גרף לחץ אטמוספרי
גרף לחץ אטמוספרי

בחירת דגמים

בחירת דגםהיא המשימה של בחירה מתוך סט של מודלים מועמדים בהתחשב בנתונים, המתבצעת במסגרת מודלים סטטיסטיים. במקרים הפשוטים ביותר, מערך נתונים קיים כבר נחשב. עם זאת, המשימה עשויה לכלול גם עיצוב ניסויים כך שהנתונים שנאספו מתאימים היטב למשימת בחירת המודל. בהינתן מודלים מועמדים בעלי יכולת ניבוי או הסבר דומה, המודל הפשוט ביותר עשוי להיות הבחירה הטובה ביותר (התער של אוקאם).

Konishi & Kitagawa אומרים, "רוב בעיות ההסקה הסטטיסטיות יכולות להיחשב לבעיות הקשורות למודלים סטטיסטיים." באופן דומה, אמר קוקס, "כיצד התרגום של הנושא למודל הסטטיסטי נעשה הוא לעתים קרובות החלק החשוב ביותר בניתוח."

בחירת הדגמים יכולה להתייחס גם לבעיה של בחירת כמה מודלים מייצגים מתוך מערך גדול של מודלים חישוביים למטרות החלטה או אופטימיזציה תחת אי ודאות.

תבניות גרפיות

מודל גרפי, או מודל גרפי הסתברותי, (PGM) או מודל הסתברותי מובנה, הוא מודל הסתברותי שעבורו הגרף מבטא את המבנה של קשר מותנה בין משתנים אקראיים. הם משמשים בדרך כלל בתורת ההסתברות, סטטיסטיקה (במיוחד סטטיסטיקה בייסיאנית) ולמידת מכונה.

מודל סטטיסטי עם גרף
מודל סטטיסטי עם גרף

דגמים כלכליים

מודלים כלכליים הם מודלים סטטיסטיים המשמשים באקונומטריה. מודל אקונומטרי מגדיר את הקשרים הסטטיסטיים הקיימים בין כמויות כלכליות שונות הקשורות לתופעה כלכלית מסוימת. מודל אקונומטרי יכול להיגזר ממודל כלכלי דטרמיניסטי שלוקח בחשבון אי ודאות, או ממודל כלכלי שהוא עצמו סטוכסטי. עם זאת, אפשר גם להשתמש במודלים אקונומטריים שאינם קשורים לשום תיאוריה כלכלית מסוימת.

מוּמלָץ: