רשתות בייסיאניות: הגדרה, דוגמאות וכיצד הן פועלות

תוכן עניינים:

רשתות בייסיאניות: הגדרה, דוגמאות וכיצד הן פועלות
רשתות בייסיאניות: הגדרה, דוגמאות וכיצד הן פועלות
Anonim

רשת אמונה, החלטה, מודל בייסיאני (יאן) או מודל גרף א-ציקלי מונע הסתברותי הוא סכימה וריאנטית (סוג של מודל סטטיסטי) המייצגת קבוצה של משתנים והתלות המותנית שלהם באמצעות גרף א-ציקלי מכוון (DAG)).

לדוגמה, רשת בייסיאנית יכולה לייצג קשרים הסתברותיים בין מחלות ותסמינים. בהינתן האחרון, ניתן להשתמש ברשת כדי לחשב את האפשרות של מחלות שונות. בסרטון למטה תוכלו לראות דוגמה של רשת אמונות בייסיאנית עם חישובים.

Image
Image

יעילות

אלגוריתמים יעילים יכולים לבצע הסקה ולמידה ברשתות בייסיאניות. רשתות המדגימות משתנים (כגון אותות דיבור או רצפי חלבונים) נקראות רשתות דינמיות. הכללות של רשתות בייסיאניות שיכולות לייצג ולפתור בעיות תחת אי ודאות נקראות דיאגרמות השפעה.

Essence

פורמליתרשתות בייסיאניות הן DAG שהצמתים שלהם מייצגים משתנים במובן הבייזי: ניתן לצפות בהם בערכים, משתנים נסתרים, פרמטרים לא ידועים או השערות. כי זה מאוד מעניין.

דוגמה לרשת בייסיאנית

שני אירועים יכולים לגרום לדשא להירטב: ספרינקלר פעיל או גשם. לגשם יש השפעה ישירה על השימוש בממטרה (כלומר שכאשר יורד גשם, הממטרה לרוב אינה פעילה). ניתן לעצב מצב זה באמצעות רשת בייסיאנית.

נוסחה אופיינית
נוסחה אופיינית

סימולציה

מכיוון שהרשת הבייסיאנית היא מודל שלם למשתנים שלה ולקשרים ביניהם, ניתן להשתמש בה כדי לענות על שאילתות הסתברותיות לגביהם. לדוגמה, ניתן להשתמש בו כדי לעדכן ידע על המצב של תת-קבוצה של משתנים כאשר נצפים נתונים אחרים (משתני ראיות). תהליך מעניין זה נקרא הסקה הסתברותית.

לאחר מכן נותן נתון אוניברסלי מספיק עבור יישומי גילוי בעת בחירת ערכים עבור תת-קבוצה של משתנים. לפיכך, אלגוריתם זה יכול להיחשב כמנגנון ליישום אוטומטי של משפט בייס על בעיות מורכבות. בתמונות במאמר ניתן לראות דוגמאות לרשתות אמונות בייסיאניות.

רשת בייסיאנית מעשית
רשת בייסיאנית מעשית

שיטות פלט

שיטות ההסקה המדויקות הנפוצות ביותר הן: חיסול משתנה, המבטל (על ידי אינטגרציה או סיכום) את הבלתי ניתן לצפייהפרמטרים שאינם שאילתה אחד אחד על ידי הקצאת הסכום למוצר.

הפצה בלחיצה של "עץ" ששומר חישובים במטמון כך שניתן לבצע שאילתות על משתנים רבים בבת אחת ולהפיץ הוכחות חדשות במהירות; והתאמה ו/או חיפוש רקורסיביים, המאפשרים פשרות בין מרחב וזמן ומתאימים ליעילות של חיסול משתנה כאשר נעשה שימוש בשטח מספיק.

לכל השיטות הללו יש מורכבות מיוחדת שתלויה באופן אקספוננציאלי באורך הרשת. האלגוריתמים המשוערים הנפוצים ביותר הם חיסול מיני-קטע, התפשטות אמונה מחזורית, התפשטות אמונה כללית ושיטות וריאציות.

סוגי רשתות
סוגי רשתות

רשת

כדי לציין באופן מלא את הרשת הבייסיאנית ובכך לייצג באופן מלא את התפלגות ההסתברות המשותפת, יש צורך לציין עבור כל צומת X את התפלגות ההסתברות עבור X עקב ההורים של X.

ההפצה של X על ידי הוריו יכולה להיות כל צורה. נהוג לעבוד עם התפלגויות בדידות או גאוסיות מכיוון שזה מפשט חישובים. לפעמים ידועים רק אילוצי הפצה. לאחר מכן תוכל להשתמש באנטרופיה כדי לקבוע את ההתפלגות הבודדת בעלת האנטרופיה הגבוהה ביותר בהתחשב באילוצים.

באופן דומה, בהקשר הספציפי של רשת בייסיאנית דינמית, ההתפלגות המותנית לאבולוציה הזמנית של הסמוימצב מוגדר בדרך כלל כדי למקסם את קצב האנטרופיה של התהליך האקראי המרומז.

רשת אמון בייסיאנית
רשת אמון בייסיאנית

למקסם הסתברות ישירה (או הסתברות אחורית) הוא לעתים קרובות מסובך בהתחשב בנוכחותם של משתנים לא נצפים. זה נכון במיוחד עבור רשת החלטות בייסיאנית.

גישה קלאסית

הגישה הקלאסית לבעיה זו היא אלגוריתם מקסום הציפיות, המחליף לסירוגין את חישוב הערכים הצפויים של משתנים בלתי נצפים התלויים בנתונים הנצפים עם מקסום ההסתברות הכוללת (או הערך האחורי), בהנחה שהצפוי שחושב קודם לכן הערכים נכונים. בתנאים של סדירות מתונה, תהליך זה מתכנס לערכים המקסימליים (או המקסימליים לאחור) של הפרמטרים.

גישה בייסיאנית שלמה יותר לפרמטרים היא להתייחס אליהם כמשתנים נוספים שלא נצפים ולחשב את ההתפלגות האחורית המלאה על כל הצמתים בהינתן הנתונים הנצפים, ולאחר מכן לשלב את הפרמטרים. גישה זו עשויה להיות יקרה ולגרום לדגמים גדולים, מה שהופך את גישות כוונון הפרמטרים הקלאסיות לנגישות יותר.

במקרה הפשוט ביותר, רשת בייסיאנית מוגדרת על ידי מומחה ולאחר מכן משמשת לביצוע הסקה. ביישומים אחרים, משימת הקביעה קשה מדי עבור אדם. במקרה זה, יש ללמוד את המבנה של הרשת העצבית הבייסיאנית ואת הפרמטרים של התפלגויות מקומיות בין הנתונים.

רשתות בייסיאניות
רשתות בייסיאניות

שיטה חלופית

שיטה חלופית ללמידה מובנית משתמשת בחיפוש אופטימיזציה. זה דורש יישום של פונקציית הערכה ואסטרטגיית חיפוש. אלגוריתם ניקוד נפוץ הוא ההסתברות האחורית של מבנה בהינתן נתוני אימון כגון BIC או BDeu.

הזמן הנדרש לחיפוש ממצה המחזיר מבנה שממקסם את הניקוד הוא על-מעריכי במספר המשתנים. אסטרטגיית החיפוש המקומית עורכת שינויים מצטברים כדי לשפר את הערכת המבנה. פרידמן ועמיתיו שקלו להשתמש במידע הדדי בין משתנים כדי למצוא את המבנה הרצוי. הם מגבילים את קבוצת מועמדי האב ל-k צמתים ומחפשים אותם ביסודיות.

שיטה מהירה במיוחד ללימוד BN בדיוק היא לדמיין את הבעיה כבעיית אופטימיזציה ולפתור אותה באמצעות תכנות מספרים שלמים. אילוצי אציקליות מתווספים לתוכנית המספרים השלמים (IP) במהלך הפתרון בצורה של מטוסי חיתוך. שיטה כזו יכולה להתמודד עם בעיות של עד 100 משתנים.

גרפים ורשתות
גרפים ורשתות

פתרון בעיות

כדי לפתור בעיות עם אלפי משתנים, יש צורך בגישה אחרת. האחת היא תחילה לבחור סדר אחד ולאחר מכן למצוא את מבנה ה-BN האופטימלי ביחס לסדר זה. זה מרמז על עבודה במרחב החיפוש של הזמנה אפשרית, וזה נוח מכיוון שהוא קטן יותר מהמרחב של מבני רשת. לאחר מכן נבחרות ונבדקות מספר הזמנות. שיטה זו התבררההכי זמין בספרות כאשר מספר המשתנים עצום.

שיטה נוספת היא התמקדות בתת-מחלקה של מודלים מתפרקים שעבורם MLEs סגורים. לאחר מכן תוכל למצוא מבנה עקבי עבור מאות משתנים.

לימוד רשתות בייסיאניות ברוחב מוגבל של שלושה קווים הכרחי כדי לספק הסקה מדויקת ניתנת לפירוש, שכן המורכבות במקרה הגרוע ביותר של האחרונה היא מעריכית באורך העץ k (על פי השערת הזמן המעריכית). עם זאת, כמאפיין גלובלי של הגרף, הוא מגדיל מאוד את המורכבות של תהליך הלמידה. בהקשר זה, K-tree יכול לשמש ללמידה יעילה.

רשת קצרה
רשת קצרה

Development

פיתוח של רשת בייסיאנית של אמון מתחיל לעתים קרובות עם יצירת DAG G כך ש-X מספק תכונה מקומית של Markov ביחס ל-G. לפעמים זהו DAG סיבתי. נאמדות התפלגויות ההסתברות המותנות של כל משתנה על הוריו ב-G. במקרים רבים, בפרט כאשר המשתנים בדידים, אם ההתפלגות המשותפת של X היא המכפלה של ההתפלגויות המותנות הללו, אז X הופך לרשת בייסיאנית ביחס ל G.

"שמיכת הקשר" של מרקוב היא סט של קשרים. שמיכת המרקוב הופכת את הצומת לבלתי תלוי בשאר החלקים החסרים של הצומת עם אותו שם והיא מספיק ידע כדי לחשב את התפלגותו. X היא רשת בייסיאנית ביחס ל-G אם כל צומת אינו תלוי מותנה בכל שאר הצמתים, בהתחשב במרקוביאן שלושמיכה.

מוּמלָץ: