Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

*** מועד א 2018 *** כמות החלוקות האפשריות של קובץ נתונים לאשכולות תלויה ב-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
תשובה ב בטוח לא נכונה
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מספר החלוקות האפשריות של קובץ נתונים לאשכולות אינו נקבע על פי מספר האשכולות או מספר התצפיות בקובץ. במקום זאת, מספר החלוקות או הדרכים האפשריות לאשכול הנתונים תלוי בהתפלגות הבסיסית של נקודות הנתונים, באלגוריתם המשמש לאשכולות, ובכל אילוצים או הנחות שיושמו במהלך תהליך האשכול. מספר האשכולות ומספר התצפיות אמנם ממלאים תפקיד בבחירה ובפרשנות של תוצאות אשכולות, אך הם אינם קובעים ישירות את המספר הכולל של חלוקות אפשריות של הנתונים לאשכולות. אלגוריתמי אשכולות שואפים לקבץ נקודות נתונים דומות יחד, והתוצאה יכולה להשתנות על סמך גורמים כמו הפרמטרים של האלגוריתם ומאפייני הנתונים. לסיכום, מספר החלוקים האפשריים של קובץ נתונים לאשכולות מושפע מגורמים שונים מעבר למספר האשכולות או התצפיות, מה שהופך את "אף אחד מהדברים לעיל" לתשובה הנכונה.
by

*** מועד א 2018 *** קבוצת-על של קבוצת פריטים סגורה(closed) יכולה לכסות:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בהגדרה קבוצה סגורה היא קבוצה שאין לה קבוצת על עם אותו מספר טרנזאקציות, והמספר יכול רק לרדת כי אחרת הקבוצה לא תהיה סגורה
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
קבוצה סגורה היא תבנית שכיחה שאין לה תבנית על בעלת אותו Support
by

** מועד ב 2018 ** לאחר בניית עץ החלטה ב-R באמצעות הספריה CARET נבנתה confution matrix באמצעות הפקודה (predicted, reference= testing$Class)CM<-confutionMatrix. איזה מדד לא ניתן לחשב מתוך פלט הפקודה

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
עומק מקסימלי תלוי במודל. ה-Confusion Matrix מתייחסת לסיווגים של טסט לבין התוצאות האמיתיות של הסיווג
by

תצפית חריגה היא:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
תצפית רחוקה ממרכזי האשכולות לא משויכת לאף אחד מהאשכולות ולכן חריגה. אם הייתה רחוקה ממרכז אחד הייתה יכולה להיות שייכת לאשכול אחר
by

** מועד ב 2018 ** בקוביית נתונים (data cube) הכוללת שלושה מימדים (month, city, costumer_group) המונח apex מתייחס לתא (cell) הבא:

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בקוביית נתונים, apex מייצג את הרמה המסוכמת או המצטברת ביותר של היררכיית הנתונים. זו הנקודה שבה כל הממדים מצטברים לרמה הגבוהה ביותר האפשרית שלהם. ככל שאתה מתרחק מהקודקוד ויורד במורד ההיררכיה, אתה ניגש לרמות מפורטות יותר של נתונים, ומפרק את המידע לקטגוריות או ממדים עדינים יותר. לדוגמה, שקול קוביית נתונים המייצגת נתוני מכירות עבור עסק קמעונאי. קודקוד הקובייה עשוי לייצג את סך המכירות עבור כל המוצרים, כל האזורים וכל תקופות הזמן. כאשר אתה מטה בממדים, אתה עשוי לראות סכומי ביניים עבור מוצרים, אזורים או תקופות זמן ספציפיים, ובסופו של דבר מגיעים לרמת הפירוט הנמוכה ביותר, כגון מכירות של מוצרים בודדים באזור ספציפי במהלך תקופת זמן מסוימת.
by

** מועד א 2017 ** נתון: h- מודל כלשהו ממרחב המודלים האפשריים h, H'-מודל אלטרנטיבי, D- כל האוכלוסיה. מהו מצב של התאמת יתר (overfitting) של המודל h?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
המצב של התאמת יתר- טעות האימון מאוד קטנה כי המודל מתאים את עצמו לתפיות האימון אך בשל כך המודל לא טוב עבור רשומות טסט חדשות. כלומר הוא התאים את עצמו יותר מדי לטריין.
by

** מועד א 2017 ** המטרה העיקרית של מפתחות מלאכותיים (Surrogate keys) במחסני הנתונים היא

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
אנו רוצים ליצור איזושהי שכבת אבסטרקציה בין מחסן הנתונים למערכת התפעולית לכן נשתמש במפתחות מלאכותיים שמשנים את המפתחות לנומריים ב-DWH
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מפתחות סרוגייט יוצרים הפשטה בין המערכת התפעולית למחסן הנתונים על ידי מתן מזהה ייחודי לכל רשומה במחסן הנתונים שאינו תלוי במפתחות הטבעיים במערכת התפעולית. זה מאפשר להשתמש במחסן הנתונים לניתוח ללא צורך לדאוג לשינויים במפתחות הטבעיים במערכת התפעולית.
by

** מועד א 2017 ** מופע במלה במסמך טקסט (מופיעה/ לא מופיעה) הוא משתנה מסוג

1
mood
by
מיין לפי
by Liran k
Liran k 0 נקודות · יותר מ-6 חודשים
מוניטין: 1
אי מופע של מילה במסמך טקסט- חסר משמעות לכן משתנה מסוג אסימטרי
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
משתנה בינארי סימטרי: במשתנה בינארי סימטרי, כל מונח (מילה) מיוצג כקיים (1) או כחסר (0) במסמך. ייצוג זה הוא סימטרי מכיוון שהוא מתייחס לנוכחות ולהיעדרו של מונח כחשובים באותה מידה. ההתמקדות היא אם המונח קיים או לא, ולא נעשית הבחנה ספציפית בין שתי המדינות. משתנה בינארי א-סימטרי: לעומת זאת, משתנה בינארי א-סימטרי יכול לייצג תרחיש שבו שני מונחים קשורים באופן ספציפי, כגון מונח אחד המרמז על היעדר מונח אחר.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
העתקתי מGPT ויש פה טעות. בגדול במשתנה אסימטרי מונח אחד מצביע על אחר
by

** מועד א 2017 ** השאלה האלגוריתם k Nearset Neighbors מניח ש-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
אלגוריתם זה יכול לעבוד רק על תכונות מנבאות רציפות
by

** מועד א 2017 ** נתונה פונקציה Y שווה 3 כפול X. האינפורמציה ההדדית בין X ל- Y שווה ל-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
H(x|y)=H(y|x)=0 כיוון שוואי מהווה פונקציה של איקס. לכן -> H(x;y)=H(x)-H(x|y)=H(y)-H(y|x) נצמצם ונקבל H(x;y) = H(x)=H(y)
by