מודל הנתונים היחסי הוא הגדרה, מושג, מבנה ותיאוריה של נורמליזציה

תוכן עניינים:

מודל הנתונים היחסי הוא הגדרה, מושג, מבנה ותיאוריה של נורמליזציה
מודל הנתונים היחסי הוא הגדרה, מושג, מבנה ותיאוריה של נורמליזציה
Anonim

מודל הנתונים ההתייחסותיים הוא גישה ייחודית לניהול פרמטרים תוך שימוש במבנה ושפה לפי לוגיקה פרדיקטית של סדר אחד. הוא תואר לראשונה בשנת 1969 על ידי המדען האנגלי Codd. בפרויקט זה, כל הפרמטרים מוצגים כטופלים המקובצים בקשרים מסוימים.

מטרת מודל הנתונים הרלוונטיים…

מודל ייצוג נתונים יחסי
מודל ייצוג נתונים יחסי

…הוא לספק שיטה הצהרתית לציון מודלים ושאילתות.

המשתמשים מציינים ישירות איזה מידע מכיל מסד הנתונים ואיזו תיאוריה הם רוצים ממנו. וגם תן לתוכנת ניהול מסדי הנתונים לדאוג לתאר את המבנים לאחסון אותו. גם הליך אחזור המידע לצורך מענה לבקשות חשוב.

רוב ה-RDB משתמשים בהגדרות נתונים של SQL ובשפת חיפוש. מערכות אלו מיישמות את מה שניתן לראות כקירוב הנדסי למודל יחסי.

טבלה בסכימת מסד נתונים של SQL מתאימה למשתנה פרדיקט. אילוצי מפתח ושאילתות SQL תואמות לפרדיקטים.

עם זאת, מסדי נתונים כאלה חורגים מהמודל היחסי בפרטים רבים, וקוד התנגד בתוקף לשינויים הפוגעים בעקרונות המקוריים.

סקירה כללית

סוגי מודלים של נתונים מודל נתונים יחסי
סוגי מודלים של נתונים מודל נתונים יחסי

הרעיון המרכזי של מודל הנתונים ההתייחסותיים הוא התיאור של מסד הנתונים כולו כקבוצה של פרדיקטים למרכיב הסופי של המשתנים, המתארים את ההגבלות על ערכים אפשריים ושילוביהם. התוכן בכל זמן נתון הוא המודל הסופי (ההגיוני). כלומר, מערכת יחסים, אחת לכל משתנה פרדיקט, כך שכל הרכיבים מסופקים. זהו מודל הנתונים ההתייחסותיים.

Alternatives

מבנה מודל נתונים יחסי
מבנה מודל נתונים יחסי

מודלים אחרים הם מערכות היררכיות ורשתות. חלקם, המשתמשים בארכיטקטורות ישנות יותר, עדיין פופולריים במרכזי נתונים בעלי קיבולת גבוהה. או במקרים בהם המערכות הקיימות הן כה מורכבות ומופשטות, עד שהמעבר אליהן באמצעות המודל ההתייחסותי יהיה יקר באופן בלתי רגיל. כמו כן יש לציין את מסדי הנתונים החדשים מונחה עצמים.

יישום

מושגי מודל נתונים יחסי
מושגי מודל נתונים יחסי

היו כמה ניסיונות להגיע למימוש האמיתי של RMD, שהוגדר במקור על ידי Codd והוסבר על ידי אחריםמדענים.

מודל ייצוג הנתונים היחסי היה העיקרי מסוגו, שתואר במונחים מתמטיים פורמליים. בסיסים היררכיים ורשתיים היו קיימים לפני מערכות יחסים, אך המפרט שלהם היה יחסית לא פורמלי. לאחר הגדרת RMD, נעשו ניסיונות רבים להשוות ולהבדיל בין מודלים שונים - וזה הוביל לתיאורים קפדניים יותר של מערכות מוקדמות. למרות שהאופי הפרוצדורלי של ממשקי מניפולציית הנתונים עבור מסדי נתונים היררכיים ורשתיים הגביל את האפשרויות לפורמליזציה.

Themes

הנחת היסוד לגבי הרעיון של מודל נתונים יחסי היא שכולם מיוצגים כ"p" מתמטי - יחסים טיפוסיים, "Cn" - קשר זוגי, שהוא תת-קבוצה במכפלה הקרטזית של כמה תחומים. במודל המתמטי, חשיבה לגבי נתונים כאלה מתבצעת בלוגיקה פרדיקטית דו-ערכית, כלומר לכל משפט קיימות שתי הערכות אפשריות: נכון או לא נכון (ואין ערך שלישי, כגון לא ידוע או לא ישים, שכל אחד מהם קשור לעתים קרובות למושג 0). הנתונים מעובדים באמצעות חשבון או אלגברה, ששווים בעוצמת הביטוי.

סוגי מודלים של נתונים, מודל נתונים רלציוני

RMD מאפשר למפתח ליצור תצוגה עקבית והגיונית של מידע. כל זה מושג על ידי שילוב האילוצים המוצהרים בעיצוב מסד הנתונים, המכונה בדרך כלל הסכמה הלוגית. התיאוריה היא לפתח תהליךנורמליזציה של מודל, לפיה ניתן לבחור עיצוב עם מאפיינים רצויים מסוימים מתוך סט של חלופות שוות מבחינה לוגית. בתוכניות גישה וביישומים ופעולות אחרות, הפרטים מטופלים על ידי מנוע ה-DBMS ואינם באים לידי ביטוי במודל הלוגי. זאת בניגוד לנוהג הנפוץ שבו כוונון ביצועים מצריך לעתים קרובות שינויים בפונקציית הלוגיקה.

מודל הנתונים הרלוציוני הבסיסי מייצג אבן בניין - זהו תחום או סוג של מידע, בדרך כלל מופחת למינימום. tuple הוא קבוצה מסודרת של ערכי תכונות. והם, בתורם, הם זוג הדדי של שם וסוג. זה יכול להיות ערך סקלרי או מורכב יותר.

קשר מורכב מכותרת וגוף

היסודות של מודל הנתונים ההתייחסותיים
היסודות של מודל הנתונים ההתייחסותיים

הראשון הוא קבוצה של תכונות.

הגוף (עם היחס ה-nth) הוא קבוצה של tuples.

הכותרת המשגעת היא גם הנושא של כל מבנה.

מודל הנתונים היחסי מוגדר כקבוצה של n-טופלים. גם במתמטיקה וגם ב-MRD, קבוצה היא אוסף לא מסודר של אלמנטים ייחודיים שאינם משוכפלים, למרות שכמה DBMSs כופים רצף על הנתונים שלהם. במתמטיקה, לטופל יש סדר ומאפשר שכפול. E. F. Codd הקים במקור tuples באמצעות הגדרה מתמטית זו.

מאוחר יותר אחד הרעיונות הגדולים של E. F. Codd היה ששימוש בשמות תכונות במקום סדר יהיה הרבה יותר נוח (בדרך כללמקרה) בשפת מחשב מבוססת מערכת יחסים. הצהרה זו שימושית עד היום. למרות שהמושג השתנה, השם "טופל" לא השתנה. תוצאה מיידית וחשובה של הבחנה זו היא שבמודל היחסי התוצר הקרטזיאני הופך לקומוטטיבי.

טבלה היא ייצוג חזותי נפוץ של מערכות יחסים. tuple דומה למושג של מחרוזת.

Relvar הוא משתנה בעל שם של סוג מסוים של משיק שאליו מוקצה בכל עת יחס כלשהו מהסוג הזה, למרות שהמבט עשוי להכיל tuples null.

יסודות של מודל הנתונים היחסים: כל המידע מיוצג על ידי ערכי מידע בקשרים. בהתאם לעיקרון זה, הבסיס היחסי הוא קבוצה של relvars, והתוצאה של כל שאילתה מיוצגת כ-tangency.

העקביות של מסד נתונים יחסי לא נאכפת על ידי כללים המובנים ביישומים המשתמשים בו, אלא על ידי אילוצים שהוכרזו כחלק מהסכמה הלוגית ונאכפים על ידי ה-DBMS עבור כל היישומים. הגבלות מתבטאות בשימוש באופרטורים להשוואה רלציונית, שרק אחד מהם הוא תת-קבוצה (⊆), מספיק תיאורטית. בפועל, צפויים להיות זמינים מספר קיצורי דרך שימושיים, מתוכם מפתחות מועמדים ואילוצי מקור חיצוני הם החשובים ביותר. זה מה שעוסק במודל הנתונים ההתייחסותיים.

פרשנות

כדי להעריך במלואה את RMD, יש צורך להבין את הפרשנות המיועדתכקשר.

גוף המגע נקרא לפעמים הרחבה שלו. הסיבה לכך היא שיש לפרש את זה כמייצג עלייה בפרדיקט כלשהו. זוהי קבוצת המשפטים האמיתיים שניתן ליצור על ידי החלפת כל משתנה חופשי בשם.

ישנה התכתבות אחד לאחד בין מודלים של נתונים-יחסי אובייקט. כל טופלה של גוף היחס מספק ערכי תכונה כדי ליצור את הפרדיקט על ידי החלפת כל אחד מהמשתנים החופשיים שלו. התוצאה היא אמירה הנחשבת לאמיתה עקב התרחשות של tuple בגוף היחס. לעומת זאת, כל תהליך שהכותרת שלו תואמת את שם הקשר אך אינו מופיע בגוף נחשב כשווא.

הנחה זו ידועה כהשערת העולם הסגור. זה מופר לעתים קרובות במאגרי מידע מעשיים, שבהם היעדר טופל עשוי לגרום לכך שהאמת של המשפט המקביל אינה ידועה. לדוגמה, היעדר מונחים מסוימים ("ג'ון", "ספרדית") בתרשים כישורי השפה לא בהכרח מהווה הוכחה לכך שנער בשם ג'ון אינו דובר ספרדית.

יישום לבסיסי נתונים, תורת הנורמליזציה

נושא המידע המשמש ב-RDM רלציוני טיפוסי עשוי להיות קבוצה של מספרים שלמים, קבוצה של מחרוזות תווים שמרכיבות תאריכים, או שני בוליאנים אמיתיים ושקריים, וכן הלאה. שמות הנושאים המתאימים לדמויות אלה יכולים להיות מחרוזות עם השמות "אינדקס", "עשה את העבודה הדרושה","זמן", "בוליאני" וכן הלאה וכן הלאה.

עם זאת, חשוב להבין שתיאוריית ההתייחסות אינה מציינת באילו סוגים יש לתמוך. וזה אכן נכון, נכון לעכשיו, צפוי שהוראות יהיו זמינות לגופים מותאמים אישית בנוסף לאלו המובנים שמספקת המערכת.

תכונה

מודל הנתונים ההתייחסותיים מייצג
מודל הנתונים ההתייחסותיים מייצג

זהו המונח המשמש בתיאוריה למה שנקרא בדרך כלל עמודה. באופן דומה, טבלה משמשת בדרך כלל במקום המונח התיאורטי tangency (למרות שהוא בשום אופן לא שם נרדף ל-relation ב-SQL). מבנה הנתונים של טבלה מצוין כרשימה של הגדרות עמודות, כל אחת עם שם עמודה ייחודי וסוג הערכים המותרים לה.

ערך תכונה הוא ערך במיקום ספציפי, כגון ג'ון דו ו-35.

טופל זהה בעצם לשורה, אלא שב-SQL RDBMS, שבו המשמעויות של העמודות בשורה מסודרות, הטפולים אינם מופרדים. במקום זאת, כל ערך הגדרה מזוהה אך ורק לפי השם שלו, לא לפי המיקום הסידורי שלו ב-tuple. שם התכונה יכול להיות שם או גיל.

Attitude

מודל הנתונים ההתייחסותיים הוא
מודל הנתונים ההתייחסותיים הוא

זוהי טבלת הגדרות מבנה יחד עם הופעת הנתונים באותו מבנה. ההגדרה היא הכותרת, והנתונים בה הם הגוף, קבוצה של שורות. משתנה הקשר נקרא בדרך כלל הטבלה הראשית. הכותרת של הערך שהוקצה לו בכל זמן מתאים לזה שצוין בתא הנתון, והגוף שלו תואם לזה שהוקצה לו לאחרונה, תוך הפעלת הצהרת עדכון כלשהי (בדרך כלל INSERT, UPDATE או DELETE).

ניסוח תיאורטי סט

מושגים בסיסיים במודל ההתייחסותי של יחסים הם שמות ושמות של תכונות. הם צריכים להיות מיוצגים כמחרוזות כגון "אדם" ו"שם" ובדרך כלל יצטרכו להשתמש במשתנים כדי להרחיב אותם. מושג בסיסי נוסף הוא קבוצה של ערכים אטומיים המכילים משמעויות הכרחיות וחשובות כמו מספרים ומיתרים.

מוּמלָץ: