Discuss, Learn and be Happy חזרה לדיון

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

חברה מסחרית מעוניינת להציע מבצע חדש ללקוחות נבחרים. מדובר במשימה של?

1
done
done
ניתן לומר שזו בעיית סיווג מכייון שמספר המבצעים הוא משתנה בדיד ולא רציף ולכן ניתן לומר שכל לקוח יכול לקבל או לא לקבל את המבצע (סיווג מוגבל). ומצד שני נרצה לחלק את הלקוחות שלנו לאשכולות, מכייון שאם מחלקים את הלקוחות לאשכולות לכל אשכול מתאימים את המבצע שלו.
by
מיין לפי

מה האינפורמציה ההדדית המקסימלית בין גיל (בשנים) לשנת לידה כאשר הגיל המרבי שווה ל-21?

1
done
חישוב אינפורמציה הדדית מקסימלית נעשית ע"י log2m ואם עושים לוג ל21 מקבלים 4.4
by
מיין לפי

מורכבות מודל רגרסיה תלוי ב-?

1
done
כשיש יותר מקדמים במשוואת הרגרסיה היא יותר מורכבת (למחשבה במשוואת רגרסיה שיש יותר מקדמים הקו לא לינארי/ לא פשוט)
by
מיין לפי

איזו פעולה אינה נחשבת לניקוי נתונים?

1
done
כאשר אנו מנרמלים את הנתונים זהו לא ניקוי, נתון שגוי לפני נרמול ואחרי נרמול נשאר שגוי. נרמול נתונים זו משימה של הכנת הנתונים לשימוש באלגוריתם של כריית מידע. כל שאר האפשריות הן דרכי פעולה לניקוי נתונים לפני השימוש בהם.
by
מיין לפי

צמצום מימדים (dimensionality reduction)

1
done
done
כפי שכתוב במחברת: צמצום מימדים- צמצום מספר העמודות בטבלה. מקטין את הרעש בנתונים- תצפיות חריגות. מקטין את המרחק בין התצפיות (לטובת לדוגמה שיטות כמו KNN) משמע שהצפיפות בין התצפיות תגדל.
by
מיין לפי

ע"פ תורת האינפורמציה, אי וודאות האירוע (event uncertainy) שווה למקסימום אם

1
done
אי וודאות האירוע כלומר אנטרופיה היא מקסימלית כאשר לכל התוצאות יש אותה הסתברות אז האי וודאות היא הגבוהה ביותר, כלומר התפלגות אחידה.
by
מיין לפי

ע"פ תורת האינפורמציה, ערך אפשרי של אנטרופיה נכלל בתחום הבא:

1
done
אנטורפיה לא יכולה להיות שלילית אבל היא כן יכולה להיות גדולה מ-1 כאשר מספר הסיווגים הוא לא בינארי.
by
מיין לפי

חלוקת ערכים לפי רוחב שווה (equal-width)

1
done
done
כפי שכתוב במחברת: חסרונות- כשיש ערכים חריגים אז ההפרש יהיה גדול מידי ואז חלק מהאינטרוולים יהיו ריקים. אם ההתפלגות של הערכים מאוד לא אחידה אז חלק מהאינטרוולים יכילו יותר תצפיות וחלק פחות ולכן היא מתאימה יותר להתפלגות אחידה כדי שיהיה בערך אותו מספר ערכים באינטרוולים.
by
מיין לפי

באיזה שלב של גילוי ידע בבסיסי נתונים מתבצע בחירת התכונות (feature selection)?

1
done
feature selection נעשה בשלב הכנת הנתונים
by
מיין לפי

התבנית 50% מנוסעי הרכבת לבאר שבע הם סטודנטים היא?

1
done
done
בהרצאה 1 דובר על דוגמאות לתבניות מועילות והסתברותיות (בלבד) ניתנה דוגמה לתבנית מועילה והסתברותית- 90% מהמכוניות הנוסעות על כביש 40 נכנסות לב"ש. ניתן לראות כי זה מבוסס על אותה דוגמה. KDD- מציאת תבניות במאגרי מידע.
by
מיין לפי