לאחר בניית עץ החלטה ב-R באמצעות הספרייה CARET נבנתה confusion matrix באמצעות הפקודה confusionMatrix(predicted,reference=testing$Class)<CM איזה מדדה לא ניתן לחשב מתוך הפלש של הפקודה?
היפרקובייה היא הכללה של הצורה הגאומטרית קובייה לממדים רבים. למרות שנהוג להשתמש במושג היפרקובייה ביחס לקובייה ממימד גבוה מ-3, הגדרתה הפורמלית של היפרקובייה מתייחס לכל מימד, מ-0 ומעלה.
מיין לפי
מריצים SVM ו-ANN פעמיים כאשר לא משנים את הקלט בין ההרצות
SVM הוא אלגוריתם דטרמיניסטי - כל פעם שנריץ SVM על אותם נתונים נקבל אותה תוצאה. לעומת זאת רשת נוירונים לא נחשבת לאלגוריתם דטרמיניסטי- הרצת מספר פעמים של אותו אלגוריתם על אותם נתונים יכולה להביא לתוצאה שונה (סדר התצפיות יכול להשפיע, בחירת המשקלים וכו').
קניית חלב ולחם תוריד את אחוז הרשומות שמכילות לחם וחמאה- כלומר ירידה בsupport. וגם תוריד את הconfidence של החוק כי העלנו את מספר הרשומות של קנייה שמכילה לחם אבל העם לא קנינו חמאה אלא חלב.
מיין לפי
במאגר נתוני אחריות היסטוריים של יצרנית מכוניות גדולה חסר קילומטראז' של רכב כללשהו בתאריך מסויים לפני כשנה. מהי הדרך המדוייקת ביותר להשלים בדיעבד את הנתון החסר?
באמצעות גרף ניתן לנתח בצורה הטובה ביותר את הקשרים בין חברים (שמיוצגים גקודקודים) והקשרים כקשתות.
מיין לפי
אלגוריתם CART פיצל בקודקוד השורש משתנה רציך בעל 10 ערכי פיצול אפשריים על הערך החמישי מתוך 10. אותו משתנה רציף פוצל שוב בשני הקודקודים של השכבה הבאה. מהו מספר העצים השונים, בעלי סה"כ שלושה קודקודים מפוצלים כל אחד, שניתן לבנות באמצעות CART במקרה הזה?
נקח לדוגמה את המשתנים 1-10 שהם רציפים ואומרים שהקודקוד פוצל בערך החמישי משמע 5. אז הקודקוד יפוצל לצד שמאל לערכים שקטנים או שווים לחמש ואילו לצד ימין לערכים שגדולים מחמש. מה שמשאיר לנו לרמה הבא בצד שמאל את הערכים 1-4 (4 ערכים) ובצד ימין את הערכים 6-10 (5 ערכים) כך שיוצא שמספר העצים השונים שאפשר ליצור ע"פ חלוקה למשתנים הללו הוא 4 כפול 5 שזה 20.