על חברים דסבת

לחץ כאן לכל השאלות

סמנו נכון/לא נכון: כאשר מדברים על Data Leakage מדובר בזליגה של ידע מהטסט לטריין. אם למשל מנרמלים את הנתונים לפי מינימום ומקסימום: אז יותר נכון לעשות את הפיצול לטריין וטסט, ורק אז לבצע את הנרמול. - קודם על הטריין - ואז להמיר את הטסט לפי ערכי המינימום ומקסמום שראינו בטריין. אם עושים נרמול על כל הנתונים ורק אז מפצלים, יש סיכוי לזליגת מידע, כיוון שאם ערכי המינימום והמקסימום בסוף הוסקו מרשומות שהוגרלו לטסט, לא היינו אמורים להיות מודעים אליהם בזמן הטריין.

1
done
by
מיין לפי

* השאלה נוספה בתאריך: 27-03-2024