מחסן נתונים זה בעצם בסיס נתונים אנליטי הניתן לקריאה בלבד ומשמש כבסיס לתהליך קבלת החלטות. בעזרתו אנו לומדים על מבנה הארגון.
OLAP Cube היא איזושהי קוביה כאשר כל פאה בה הוא מימד, נושא כלשהו, טבלה. כך ניתן לנתח באמצעות כלים קיימים את המבנה של הארגון ולבצע פעולות בצורה יותר ברורה.
Dice - בחירת תת קוביה על ידי קיבוע של שני מימדים או יותר. למשל, אם ישנה קוביה עם מימדים כמו זמן, מוצר, איזור בעולם, dicing יהיה לדוגמה בחירה של תקופת זמן מסוימת וקטגוריה של מוצר להתמקד בהם.
Slice - בחירה של מימד אחד מתוך הקוביה. יצירת תת קוביה חדש על ידי קיבוע של אחד המימדים. למשל, ניתוח מכירות בהתמקדות ביבשת אחד בלבד מבלי להתחשב בזמן או במוצר.
Drill Down - מרחיבים נתונים לתתי קבוצות שלהם. מעבר מנתונים פחות מפורטים לנתונים מפורטים יותר. כמו למשל מעבר מניתוח מכירות על פי רבעונים לניתוח מכירות על פי חודשים. זה ורול אפ אלו הפכים.
Roll Up - צמצום הנתונים לקבוצות שמכילות חלק מהנתונים הקיימים. מסכמים נתונים מרמה נמוכה יותר לרמה גבוהה יותר. לדוגמה, אם אתם מנתחים מכירות באופן יומי, רול אפ יהיה סכימת הנתונים לסכומים חודשיים או שנתיים.
Shachar Adam0 נקודות ·
יותר מ-6 חודשים
( תגובות)
מוניטין: 126
בביצוע רול אפ אפשר לעבור ממימד ספציפי למימד גבוה/גנרי יותר ובכך להגן על אנונימיות. לדוגמה רחוב->שכונה->עיר. האנונימיות של עיר גבוהה יותר מאנונימיות של רחוב.
*** מועד א 2022 ***
אילו שדות ממדים חייבים להופיע בטבלת עובדות על החלוקה הגיאוגרפית של האוכלוסייה במדינת ישראל?
שני האופרטורים מוגדרים בתת חלון תחת האופרטורים בחלון הראשי
Shachar Adam0 נקודות ·
יותר מ-6 חודשים
( תגובות)
מוניטין: 126
Optimize selection מבצע אופטימיזציה לפיצ'רים של המודל ויכול להכיל בתוכו תהליך(מקונן), cross validation גם הוא מבצע אופטימיזציה ובוחר את הפיצ'רים הטובים ביותר.
*** מועד א 2023 ***
צריכה הדלק(ק"מ לליטר) הוא משתנה מהסוג
מספר הערכים שנותן אנטורפיה שתיים זה לוג 2 של 4 ולכל הפחות 4
Shachar Adam0 נקודות ·
יותר מ-6 חודשים
( תגובות)
מוניטין: 126
על מנת לקבל אנטרופיה של 2 צריך לפחות ארבעה ערכים, וגם עם ארבעה ערכיםף צריך שהתפלגותם תהיה אחידה כלומר ההסתברות לכל אחד מהערכים הוא רבע, אין דרך להגיע לנאטרופיה של 2 עם פחות מ4 ערכים.
*** מועד א 2023 ***
עבור ערך גבוה מאוד של m הערך של m-estimate שואף ל-
מודלים של דאטה סיינס נקראים גם קופסה שחורה. פחות קל לבני אדם להבין בצורה מיידית את הבחירות שלהם, יש פגיעה באקספליינביליות לעומת מודלים סטטיסטיים שמובנים על עקרונות סטטיסטיים ברורים שיותר קל להסביר.
Shachar Adam0 נקודות ·
יותר מ-6 חודשים
( תגובות)
מוניטין: 126
היה גם במועד א ב-2018. ההסבר שם היה שמודלים של דאטה סיינס הינם קופסא שחורה מורכבת מקופסא אפורה
*** מועד א 2023 ***
דה נרמול(de-normalization) של טבלאות במחסן הנתונים מקטין את: