Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

*** 2019 מועד א *** במאגר נתוני אחריות היסטוריים של יצרנית מכוניות גדולה חסר קילומטראז' של רכב כלשהו בתאריך מסוים לפני כשנה. מה היא הדרך המדויקת ביותר להשלים בדיעבד את הנתון החסר?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
אם בעל הרכב היה זוכר את הקילומטראז' לפני כשנה היה עדיף את תשובה ד, אך כיוון שזו לא הנחה סבירה, מוטב להריך כמה הוא נסע לפי גיל הרכב. זה לא תלוי בדגם אלא בכמה נסעו מאז שקנו את הרכב.
by

*** 2019 מועד א *** ב-Epachnikov quadratic kernel הערך של למבדה(פרמטר ההחלקה) נמצא ביחס הפוך ל-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
ערך קטן יותר של פרמטר ההחלקה λ (lambda) מתאים לרוחב פס צר יותר של הגרעין. המשמעות היא שההשפעה של נקודות נתונים בודדות על הערך החזוי תהיה מקומית יותר, מה שיוביל למשקל גבוה יותר בנקודות סמוכות. זה מביא לאומדן מתנועע או מתנודד יותר, מה שיכול להוביל לשונות גבוהה יותר בערך החזוי. במילים אחרות, העקומה המשוערת הופכת רגישה יותר לתנודות בנתונים, מה שגורם לשונות גבוהה יותר בתחזיות. לעומת זאת, ערך גדול יותר של λ מביא לרוחב פס של ליבה רחב יותר, אשר מחליק את האומדן על ידי מתן משקל שווה יותר למספר גדול יותר של נקודות שכנות. זה נוטה להפחית את השונות בערך החזוי אך עשוי להכניס הטיה על ידי החלקת יתר של העקומה.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
פרמטר ההחלקה λ (lambda) קובע את רוחב הפס של הקרנל. λ קטן יותר מוביל לגרעין צר יותר, אשר שם דגש רב יותר על נקודות הנתונים הקרובות יותר לנקודה המוערכת. λ גדול יותר מביא לגרעין רחב יותר, שנותן משקל רב יותר לנקודות נתונים רחוקות יותר.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
כאשר הלמבדה קטן שונות הערך החזוי גבוהה וכאשר הוא גדול אז ההיפך. למבדה קטן שם דגש על שכנים קרובים בעוד גדול שם דגש גם על שכניים רחוקים יותר.
by
by Shachar Adam
Shachar Adam 0 נקודות · לפני 5 חודשים
מוניטין: 131
גבוה*
by
by Shachar Adam
Shachar Adam 0 נקודות · לפני 5 חודשים
מוניטין: 131
גבוהה**
by

*** מועד א 2019 *** באיזו מחלקה מספריית scikit-learn ב-Python תשתמשו על מנת לקודד משתנה מטרה מטיפוס string אל טיפוס נומרי(Integer)?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
כי LabelEncoder מאפשר לקודד משתנה מטיפוס סטרינג לטיפוס נומרי
by

*** מועד א 2019 *** אלגוריתם CART פיצל בקודקוד השורש משתנה רציף בעל 10 ערכי פיצול אפשריי על הערך החמישי מתוך 10. אותו משתנה רציף פוצל שוב בשני הקודקודים של השכבה הבאה. מהו מספר העצים השונים, בעלי סך הכל שלושה קודקודים מפוצלים כל אחד, שניתן לבנות באמצעות CART במקרה הזה?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בענף אחד יוותר 4 ערכי פיצול אפשריים, כאשר בענף השני יוותרו 5 ערכי פיצול אפשריים. משום שנתון כי פיצלו עם הערך החמישי וניתן לייצר ארבע כפול 5 כלומר 20 עצי החלטה שונים.
by

*** מועד א 2019 *** כמה חיבורים יש ברשת נוירונים מלאכותית מהסוג autoencoder בעלת 100 קלטים ושכבה פנימית אחת הכוללת 10 נוירונים?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
יש 100 כפול 10 חיבורים בין הקלט לשכבה הפנימית ובנוסף יש עוד 100 כפול 10 חיבורים בין השכבה הפנימית לשכבת הפלט
by

*** מועד א 2019 *** ניתוח קשרים בין חברים ברשת חברתית היא בדרך כלל משימה של:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
ניתוח קשרים בין חברים ברשת חברתית כרוך בחקר היחסים והאינטראקציות בין אנשים כצמתים בגרף. כל חיבור מייצג קצה בגרף. ניתוח נתונים גרפי מותאם במיוחד לטיפול במבני נתונים הקשורים זה לזה ומשמש לחשיפת דפוסים, קהילות, מרכזיות ותובנות אחרות בתוך הרשת. לאפשרויות האחרות שציינת יש מוקדים שונים: סיווג: זה כולל סיווג נקודות נתונים למחלקות או קטגוריות מוגדרות מראש. זו לא הגישה המתאימה ביותר לניתוח חיבורי רשת חברתית. ניתוח אשכולות: אשכולות עוסקת בקיבוץ נקודות נתונים דומות על סמך תכונות מסוימות. למרות שניתן להשתמש בו להיבטים מסוימים של ניתוח רשתות חברתיות, הוא אינו תופס במלואו את המורכבות של מערכות יחסים ברשת חברתית. כללי שיוך: כריית כללי שיוך משמשת בדרך כלל כדי לגלות קשרים בין פריטים במערך נתונים של עסקאות. ייתכן שזו לא הגישה המתאימה ביותר לניתוח חיבורי רשת חברתית. לעומת זאת, ניתוח נתוני גרף נועד לטפל במבנה ובמערכות היחסים הטבועות ברשת חברתית, מה שהופך אותה לבחירה הרלוונטית ביותר למשימה זו.
by

*** מועד ב 2019 *** ברצוננו לחלק תצפיות לשתי קבוצות זהות בגודלן(במידת האפשר). באיזה מדד כדאי להשתמש?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
על כך מתבסס השם של המדד Twoing=2. חלוקה לשתי קבוצות בגודל זהה.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מדד זה שואף לחלק את המידע באופן שווה לשני צידי העץ
by

*** מועד ב 2019 *** מודל SVM צפוי להיות מדויק יותר כאשר:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
המטרה היא צמצום ערכים חריגים. המודל טוב יותר ככל שהשוליים גדולים יותר.
by

*** מועד ב 2019 *** בקוביית נתונים(data cube) הכוללת שלושה מימדים(date, location, customer_group) המונח apex מתייחס לתא(cell) הבא:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
apex אינו מתייחס לאחד מערכי המימדים ולכן אף תשובה אינה נכונה
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בהקשר של קוביית נתונים, המונח "אפקס" מתייחס לנקודה העליונה ביותר או לרמת הצבירה הגבוהה ביותר במערך נתונים רב-ממדי. קוביית נתונים היא ייצוג רב מימדי של נתונים המאפשר ניתוח יעיל וגמיש של מידע מנקודות מבט שונות. בקוביית נתונים, apex מייצג את הרמה המסוכמת או המצטברת ביותר של היררכיית הנתונים. זו הנקודה שבה כל הממדים מצטברים לרמה הגבוהה ביותר האפשרית שלהם. ככל שאתה מתרחק מהקודקוד ויורד במורד ההיררכיה, אתה ניגש לרמות מפורטות יותר של נתונים, ומפרק את המידע לקטגוריות או ממדים עדינים יותר.
by

** מועד ב 2018 ** כמות השדות המינימאלית בטבלאת העובדות (Fact table) של תרשים הכוכב שווה ל-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
א זו בטוח לא התשובה הנכונה
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בסכימת כוכבים, טבלת העובדות מייצגת את מאגר הנתונים המרכזי המכיל את המדדים הכמותיים (עובדות) המנותחים. טבלת העובדות מכילה בדרך כלל מפתחות זרים המפנים לטבלאות ממדים, המספקות הקשר ומידע תיאורי נוסף על העובדות. מספר השדות (עמודות) בטבלת העובדות מתאים למספר העובדות השונות הנמדדות. כל שדה מייצג מדד כמותי שונה. לכן, הכמות המינימלית של שדות בטבלת העובדות של סכימת כוכבים שווה למספר העובדות שאחריהן עוקבים ומנותחים. אז, התשובה הנכונה היא אכן "מספר העובדות".
by