Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

** מועד א 2022 ** איזו פעולה צפויה לשפר את אנונימיות הנתונים האישיים במחסן הנתונים?

1
sentiment_very_satisfied
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מחסן נתונים זה בעצם בסיס נתונים אנליטי הניתן לקריאה בלבד ומשמש כבסיס לתהליך קבלת החלטות. בעזרתו אנו לומדים על מבנה הארגון. OLAP Cube היא איזושהי קוביה כאשר כל פאה בה הוא מימד, נושא כלשהו, טבלה. כך ניתן לנתח באמצעות כלים קיימים את המבנה של הארגון ולבצע פעולות בצורה יותר ברורה. Dice - בחירת תת קוביה על ידי קיבוע של שני מימדים או יותר. למשל, אם ישנה קוביה עם מימדים כמו זמן, מוצר, איזור בעולם, dicing יהיה לדוגמה בחירה של תקופת זמן מסוימת וקטגוריה של מוצר להתמקד בהם. Slice - בחירה של מימד אחד מתוך הקוביה. יצירת תת קוביה חדש על ידי קיבוע של אחד המימדים. למשל, ניתוח מכירות בהתמקדות ביבשת אחד בלבד מבלי להתחשב בזמן או במוצר. Drill Down - מרחיבים נתונים לתתי קבוצות שלהם. מעבר מנתונים פחות מפורטים לנתונים מפורטים יותר. כמו למשל מעבר מניתוח מכירות על פי רבעונים לניתוח מכירות על פי חודשים. זה ורול אפ אלו הפכים. Roll Up - צמצום הנתונים לקבוצות שמכילות חלק מהנתונים הקיימים. מסכמים נתונים מרמה נמוכה יותר לרמה גבוהה יותר. לדוגמה, אם אתם מנתחים מכירות באופן יומי, רול אפ יהיה סכימת הנתונים לסכומים חודשיים או שנתיים.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
בביצוע רול אפ אפשר לעבור ממימד ספציפי למימד גבוה/גנרי יותר ובכך להגן על אנונימיות. לדוגמה רחוב->שכונה->עיר. האנונימיות של עיר גבוהה יותר מאנונימיות של רחוב.
by

*** מועד א 2022 *** אילו שדות ממדים חייבים להופיע בטבלת עובדות על החלוקה הגיאוגרפית של האוכלוסייה במדינת ישראל?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
כמות התושבים נכללת בתוך יישוב, יישוב נכלל בתוך מחוז, ולכן יישוב ושנה חייבים להופיע מפני שהם אינם מוכלים זה בזה.
by

*** מועד א 2023 *** מה סביר להניח שמבצעת שורת הפקודה הבאה בשפת Python שמתמשת בספריית scikit-learn? model.fit(data[predictors, data[outcome])

1
mood
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
הפקודה fit מבצעת אימון של דאטה על תוצאות אימון, כלומר מייצרים פה מודל חדש שלא היה קודם
by

*** מועד א 2023 *** מה משותף לאופרטורים Optimize Selection ו-Cross validation בתוכנת RapidMiner?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
שני האופרטורים מוגדרים בתת חלון תחת האופרטורים בחלון הראשי
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
Optimize selection מבצע אופטימיזציה לפיצ'רים של המודל ויכול להכיל בתוכו תהליך(מקונן), cross validation גם הוא מבצע אופטימיזציה ובוחר את הפיצ'רים הטובים ביותר.
by

*** מועד א 2023 *** צריכה הדלק(ק"מ לליטר) הוא משתנה מהסוג

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
צריכת דלק הוא משתנה מספרי עם ערך 0 מוגדר ולכן מסוג משתנה יחס
by

*** מועד א 2023 *** מה ידוע בוודאות על מספר הערכים של משתנה מקרי בעל אנטרופיה של 2.0?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מספר הערכים שנותן אנטורפיה שתיים זה לוג 2 של 4 ולכל הפחות 4
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
על מנת לקבל אנטרופיה של 2 צריך לפחות ארבעה ערכים, וגם עם ארבעה ערכיםף צריך שהתפלגותם תהיה אחידה כלומר ההסתברות לכל אחד מהערכים הוא רבע, אין דרך להגיע לנאטרופיה של 2 עם פחות מ4 ערכים.
by

*** מועד א 2023 *** עבור ערך גבוה מאוד של m הערך של m-estimate שואף ל-

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
nc+mp חלקי n+m
by

*** מועד א 2023 *** ידוע כי פיתות, חומוס וקולה הם מוצרים הנקנים יחד בהסתברות גבוהה. מה ניתן לומר בוודאות לגבי פיתות וקולה?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
פיתות וקולה םה תת קבוצה של פיתוח חומוס וקולה. תת קבוצה של קבוצה שכיחה, שכיחה גם היא.
by

*** מועד א 2023 *** מה מאפיין מודלים של מדעי הנתונים לעומת מודלים סטטיסטיים?

1
done
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
מודלים של דאטה סיינס נקראים גם קופסה שחורה. פחות קל לבני אדם להבין בצורה מיידית את הבחירות שלהם, יש פגיעה באקספליינביליות לעומת מודלים סטטיסטיים שמובנים על עקרונות סטטיסטיים ברורים שיותר קל להסביר.
by
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
היה גם במועד א ב-2018. ההסבר שם היה שמודלים של דאטה סיינס הינם קופסא שחורה מורכבת מקופסא אפורה
by

*** מועד א 2023 *** דה נרמול(de-normalization) של טבלאות במחסן הנתונים מקטין את:

1
mood
by
מיין לפי
by Shachar Adam
Shachar Adam 0 נקודות · יותר מ-6 חודשים
מוניטין: 131
השאילתות יהיו יותר פשוטות ומתאימות למרחב המקורי של הנתונים. לא יהיה צורך להמיר את הנתונים בכל הרצת שאילתה.
by