מודל סטטיסטי: מהות השיטה, בנייה וניתוח

תוכן עניינים:

מודל סטטיסטי: מהות השיטה, בנייה וניתוח
מודל סטטיסטי: מהות השיטה, בנייה וניתוח
Anonim

מודל סטטיסטי הוא השלכה מתמטית המגלמת קבוצה של הנחות שונות לגבי היצירה של כמה נתונים לדוגמה. המונח מוצג לעתים קרובות בצורה מאוד אידאלית.

ההנחות המובעות במודל הסטטיסטי מציגות קבוצה של התפלגויות הסתברות. רבים מהם נועדו להעריך נכונה את ההתפלגות שממנה נלקחת קבוצה מסוימת של מידע. התפלגויות ההסתברות הגלומות במודלים סטטיסטיים הם שמבדילים את ההשלכה משינויים מתמטיים אחרים.

תחזית כללית

מודלים של תהליכים סטטיסטיים
מודלים של תהליכים סטטיסטיים

מודל מתמטי הוא תיאור של המערכת באמצעות מושגים ושפה מסוימים. הם חלים על מדעי הטבע (כגון פיזיקה, ביולוגיה, מדעי כדור הארץ, כימיה) ודיסציפלינות ההנדסה (כגון מדעי המחשב, הנדסת חשמל), כמו גם מדעי החברה (כגון כלכלה, פסיכולוגיה, סוציולוגיה, מדעי המדינה).

המודל יכול לעזור להסביר את המערכת ולמד את ההשפעה של מרכיבים שונים, ועשה תחזיות של התנהגות.

מודלים מתמטיים יכולים ללבוש צורות רבות, כולל מערכות דינמיות, תחזיות סטטיסטיות, משוואות דיפרנציאליות או פרמטרים תיאורטיים של המשחק. סוגים אלו ואחרים עשויים לחפוף, ומודל זה כולל מבנים מופשטים רבים. באופן כללי, תחזיות מתמטיות יכולות לכלול גם רכיבים לוגיים. במקרים רבים, איכותו של תחום מדעי תלויה במידת ההתאמה של המודלים המתמטיים שפותחו תיאורטית עם התוצאות של ניסויים חוזרים ונשנים. חוסר הסכמה בין תהליכים תיאורטיים ומדידות ניסוי מוביל לעתים קרובות להתקדמות חשובה ככל שמתפתחות תיאוריות טובות יותר.

במדעי הפיזיקה, המודל המתמטי המסורתי מכיל מספר רב של האלמנטים הבאים:

  • משוואות בקרה.
  • תת-מודלים נוספים.
  • הגדר משוואות.
  • משוואות מכוננות.
  • הנחות ומגבלות.
  • תנאי התחלה וגבול.
  • אילוצים קלאסיים ומשוואות קינמטיות.

נוסחה

מודל סטטיסטי, ככלל, נקבע על ידי משוואות מתמטיות המשלבות משתנה מקרי אחד או יותר, ואולי גם משתנים טבעיים אחרים. באופן דומה, השלכה נחשבת "המושג הפורמלי של מושג."

כל בדיקות ההשערות הסטטיסטיות וההערכות הסטטיסטיות מתקבלות ממודלים מתמטיים.

מבוא

מודלים מתמטיים סטטיסטיים
מודלים מתמטיים סטטיסטיים

באופן לא רשמי, ניתן לראות מודל סטטיסטי כהנחה (או קבוצת הנחות) עם תכונה ספציפית: הוא מאפשר לחשב את ההסתברות של כל אירוע. כדוגמה, שקול זוג קוביות רגילות עם שש צדדים. יש לחקור שתי הנחות סטטיסטיות שונות לגבי העצם.

ההנחה הראשונה היא:

עבור כל אחת מהקוביות, ההסתברות לקבל אחד מהמספרים (1, 2, 3, 4, 5 ו-6) היא: 1/6.

מהנחה זו, נוכל לחשב את ההסתברות של שתי הקוביות: 1:1/6×1/6=1/36.

באופן כללי יותר, אתה יכול לחשב את ההסתברות לכל אירוע. עם זאת, צריך להבין שאי אפשר לחשב את ההסתברות לכל אירוע לא טריוויאלי אחר.

רק הדעה הראשונה אוספת מודל מתמטי סטטיסטי: בשל העובדה שעם הנחה אחת בלבד ניתן לקבוע את ההסתברות של כל פעולה.

בדוגמה לעיל עם אישור ראשוני, קל לקבוע את האפשרות של אירוע. עם כמה דוגמאות אחרות, החישוב עשוי להיות קשה או אפילו לא ריאלי (לדוגמה, הוא עשוי לדרוש שנים רבות של חישובים). עבור אדם המעצב מודל ניתוח סטטיסטי, מורכבות כזו נחשבת בלתי מתקבלת על הדעת: יישום חישובים לא אמור להיות בלתי אפשרי מעשי ובלתי אפשרי תיאורטית.

הגדרה פורמלית

במונחים מתמטיים, המודל הסטטיסטי של מערכת נחשב בדרך כלל כזוג (S, P), כאשר S הואקבוצת התצפיות האפשריות, כלומר מרחב המדגם, ו-P היא קבוצת התפלגויות ההסתברות על S.

האינטואיציה של הגדרה זו היא כדלקמן. ההנחה היא שקיימת התפלגות הסתברות "אמיתית" הנגרמת על ידי התהליך שיוצר נתונים מסוימים.

Set

הוא זה שקובע את הפרמטרים של המודל. פרמטריזציה דורשת בדרך כלל ערכים שונים כדי לגרום להתפלגות שונות, כלומר

תוצאה של דגם
תוצאה של דגם

חייב להחזיק (במילים אחרות, זה חייב להיות בזריקות). נאמר כי פרמטריזציה העונה על הדרישה ניתנת לזיהוי.

דוגמה

גרף סטטיסטיקה
גרף סטטיסטיקה

נניח שיש מספר מסוים של תלמידים בגילאים שונים. גובה הילד יהיה קשור סטוגסטית לשנת הלידה: למשל, כאשר תלמיד בית ספר בן 7, הדבר משפיע על ההסתברות לגדילה, רק כך שהאדם יהיה גבוה מ-3 סנטימטרים.

אתה יכול לנסח גישה זו למודל רגרסיה בקו ישר, לדוגמה, באופן הבא: גובה i=b 0 + b 1agei + εi, כאשר b 0 הוא הצומת, b 1 הוא הפרמטר לפיו גיל מוכפל בעת השגת ניטור גובה. זהו מונח שגיאה. כלומר, הוא מניח שהגובה נחזה לפי גיל עם שגיאה מסוימת.

טופס תקף חייב להתאים לכל נקודות המידע. לפיכך, הכיוון הליווי (רמה i=b 0 + b 1agei) אינו מסוגל להיות משוואה עבור מודל נתונים - אם הוא אינו עונה בבירור על כל הנקודות. כְּלוֹמַרללא יוצא מן הכלל, כל המידע מונח ללא רבב על הקו. יש להזין את מרווח השגיאה εi למשוואה כך שהטופס יתאים לחלוטין לכל פריטי המידע.

כדי להסיק מסקנות סטטיסטיות, ראשית עלינו להניח כמה התפלגויות הסתברות עבור ε i. לדוגמה, אפשר להניח שלהתפלגות ε i יש צורה גאוסית עם ממוצע אפס. במקרה זה, למודל יהיו 3 פרמטרים: b 0, b 1 והשונות של ההתפלגות הגאוסית.

אתה יכול לציין באופן רשמי את הדגם בתור (S, P).

בדוגמה זו, המודל מוגדר על ידי ציון S ולכן ניתן להניח כמה הנחות לגבי P. ישנן שתי אפשרויות:

ניתן להעריך את הצמיחה הזו לפי פונקציה לינארית של גיל;

שהשגיאות בקירוב מופצות כמו בתוך גאוס.

הערות כלליות

פרמטרים סטטיסטיים של מודלים הם מחלקה מיוחדת של הקרנה מתמטית. מה מייחד מין אחד ממשנהו? אז זהו שהמודל הסטטיסטי אינו דטרמיניסטי. לפיכך, בה, בניגוד למשוואות מתמטיות, למשתנים מסוימים אין ערכים מסוימים, אלא יש להם התפלגות של אפשרויות. כלומר, משתנים בודדים נחשבים סטוכסטיים. בדוגמה למעלה, ε הוא משתנה סטוכסטי. בלעדיו, ההשלכה תהיה דטרמיניסטית.

לרוב נעשה שימוש בבניית מודל סטטיסטי, גם אם התהליך החומרי נחשב לדטרמיניסטי. למשל, הטלת מטבעות היא, באופן עקרוני, פעולה שקובעת מראש.עם זאת, ברוב המקרים זה עדיין מעוצב כסטוכסטי (באמצעות תהליך ברנולי).

לפי קונישי וקיטגאווה, יש שלוש מטרות למודל סטטיסטי:

  • תחזיות.
  • כריית מידע.
  • תיאור של מבנים סטוכסטיים.

גודל ההצגה

נניח שיש מודל חיזוי סטטיסטי, המודל נקרא פרמטרי אם ל-O יש ממד סופי. בפתרון, עליך לכתוב ש

הבדל דגם
הבדל דגם

כאשר k הוא מספר שלם חיובי (R מייצג כל מספרים ממשיים). כאן k נקרא הממד של המודל.

כדוגמה, אנו יכולים להניח שכל הנתונים מגיעים מהתפלגות גאוסית חד-משתנית:

נוסחת סטטיסטיקה
נוסחת סטטיסטיקה

בדוגמה זו, הממד של k הוא 2.

וכדוגמה נוספת, ניתן להניח שהנתונים מורכבים מנקודות (x, y), אשר מניחים שהן מפוזרות בישר עם שיורי גאוס (עם אפס ממוצע). אז הממד של המודל הכלכלי הסטטיסטי שווה ל-3: חיתוך הקו, השיפוע שלו ושונות התפלגות השיירים. יש לציין שבגיאומטריה ישר יש מימד של 1.

למרות שהערך שלמעלה הוא מבחינה טכנית הפרמטר היחיד שיש לו ממד k, לפעמים הוא נחשב כמכיל k ערכים נפרדים. לדוגמה, עם התפלגות גאוסית חד-ממדית, O הוא הפרמטר היחיד בגודל 2, אך לפעמים נחשב כמכיל שנייםפרמטר בודד - ערך ממוצע וסטיית תקן.

מודל תהליך סטטיסטי אינו פרמטרי אם קבוצת ערכי ה-O היא אינסופית ממדים. זה גם חצי פרמטרי אם יש לו גם פרמטרים סופיים ממדים וגם פרמטרים אינסופיים. באופן פורמלי, אם k הוא ממד של O ו-n הוא מספר הדגימות, למודלים חצי פרמטריים ולא פרמטריים יש

נוסחת דגם
נוסחת דגם

אז המודל הוא חצי פרמטרי. אחרת, ההקרנה אינה פרמטרית.

מודלים פרמטריים הם הסטטיסטיקה הנפוצה ביותר. לגבי תחזיות חצי פרמטריות ולא פרמטריות, סר דיוויד קוקס קבע:

"בדרך כלל, הם כוללים הכי מעט השערות לגבי מרקם וצורת התפלגות, אבל הם כוללים תיאוריות חזקות לגבי ספיקה עצמית."

דגמים מקוננים

אל תבלבלו אותם עם תחזיות מרובות רמות.

שני מודלים סטטיסטיים מקוננים אם ניתן להמיר את הראשון לשני על ידי הטלת אילוצים על הפרמטרים של הראשון. לדוגמה, לקבוצה של כל ההתפלגויות גאוסיות יש קבוצה מקוננת של התפלגויות ממוצעות אפס:

כלומר, עליך להגביל את הממוצע בקבוצה של כל ההתפלגויות גאוסיות כדי לקבל התפלגויות עם ממוצע אפס. כדוגמה שנייה, למודל הריבועי y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) יש מודל ליניארי מוטבע y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - כלומר, פרמטר b2 שווה ל-0.

בשתי הדוגמאות הללו, לדגם הראשון יש מימדיות גבוהה יותר מהדגם השני. זה קורה לעתים קרובות, אבל לא תמיד. דוגמה נוספת היא קבוצת ההתפלגויות גאוסיות עם ממוצע חיובי, שיש לה ממד 2.

השוואת דגמים

מודל סטטיסטי
מודל סטטיסטי

יש ההנחה שקיימת התפלגות הסתברות "אמיתית" העומדת בבסיס הנתונים הנצפים שנגרמו מהתהליך שיצר אותם.

וכמו כן ניתן להשוות מודלים זה לזה, באמצעות ניתוח חקרני או אישור. בניתוח חקרני מגבשים מודלים שונים ונערכת הערכה עד כמה כל אחד מהם מתאר את הנתונים. בניתוח מאשש, ההשערה שנוסחה קודם לכן מושווה להשערה המקורית. קריטריונים נפוצים לכך כוללים P 2, גורם בייסיאני והסתברות יחסית.

המחשבה של קונישי וקיטגאווה

“ניתן לחשוב על רוב הבעיות במודל מתמטי סטטיסטי כשאלות חיזוי. הם מנוסחים בדרך כלל כהשוואות של מספר גורמים."

יתר על כן, סר דיוויד קוקס אמר: "כתרגום מהנושא, הבעיה במודל הסטטיסטי היא לרוב החלק החשוב ביותר בניתוח."

מוּמלָץ: