למדה- מגדירה את הרוחב של הקרנל ביחס ישר.
ככל שהלמדה יותר גדולה- השונות קטנה והטעות גדלה. אם האזור יותר גדול כלומר למדה יותר גדולה אז מספר השכנים יגדל וחישוב ממוצע של יותר תצפיות יקטין את השונות. הטעות תגדל כי הממוצע לא בהכרח מייצג כל תצפית ותצפית.
מיין לפי
נתון עץ החלטה בעל קודקוד שורש המפוצל ע"פ משתנה רציף ושני קודקודים טרמינליים. מה התנאי לכך שהעץ מפריד לינארית בין הסיווגים?
אם בעץ יש שני קודקודים טרמינליים ואנו נרצה להפריד לינארית בין הסיווגים (כלומר נדמיין קו לינארי שמכל צד נמצאים הרשומות מאותו סיווג) אז בהכרח נרצה שדיוק האימון של העץ תהיה 100% כך תהיה הפרדה מלאה לפי הקו הלינארי בין הסיווגים.
אחת מפונקציות האקטיבציה הפופולריות ביותר היא פונקציית ReLU שמאופיינת בכך שכאשר X<0 היא שווה ל-0 וכאשר X>=0 היא שווה ל-X. אז עבור קלט חיובי נקבל X ונגזרת שלו היא 1.