Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

נתונה טבלה R עם 1,000 רשומות המבוזרות באופן אחיד על 4 שרתים, וטבלה S עם 50,000 רשומות המבוזרות באופן אחיד על 5 שרתים. הנח כי מבצעים פעולת join בין שתי הטבלאות בעזרת symmetric fragment and replace. איזה משפט מהבאים מתאים לגבי האופן שבו יבוצע חישוב ה JOIN.

1
done
במצב כזה מוכנים לבזבז אחסון וכוח חישוב כדי לוודא שהתהליך מתרחש מהר. מחלקים את R ל-n חתיכות (במקרה 4 שרתים) ואת S ל-m חתיכות (במקרה זה 5 שרתים) מכאן שכמות השרתים שנצטרך זה m*n = 20 . כל חתיכה של R נשלחת לכל שרת בו היא תתחבר לכל החתיכות של S ולהפך וכל שרת יבצע את ה-join.
by
מיין לפי

רשום איזה מהמשפטים הבאים נכון גם עבור HDFS וגם עבור Zookeeper (יתכנו מספר תשובות נכונות, ניקוד יינתן רק לתשובה מלאה).

1
done
by
מיין לפי

נתונה טבלה המכילה 6^10 המבוזרות באופן אחיד על 100 שרתים בעזרת consistent hashing. הניחו כי הנתונים מבוזרים באופן אחיד על כל השרתים וה- replication factor הוא 4. כעת מוסיפים שרת חדש (לא בהכרח במיקום המיטבי). המספר המקסימלי של רשומות שייתכן ונדרש להעתיק אל שרת זה? ניתן להניח כי אין virtual nodes. רשום בטבלה שבעמוד הראשון את התשובה (מספר בלבד!) והסבר קצר.

1
done
by
מיין לפי

נתונה טבלה Employee עם שדות ID, Name, Sex, Salary. השדה ID הוא המפתח של הטבלה. ניתן להניח כי יש עליו אינדקס. השדה Sex מציין את מין העובד. ניתן להניח כי העובדים מתחלקים חצי-חצי לנשים וגברים. השדה Salary מציין את משכורת העובד. ניתן להניח כי אין המון עובדים שמרוויחים פחות מ 7,000. הנתונים של הטבלה מבוזרים על 10 שרתים. באיזה סוג שאילתא יתכן ויהיה יתרון משמעותי מבחינת זמן הריצה, לביזור רשומות בעזרת range partitioning לעומת round robin?

1
done
בראונד רובין אנחנו נעבור על כל הטבלה (כי מחולק באופן רנדומלי) כנראה כדי להביא את העובדים שהמשכורת שלהם קטנה מ7,000 והם מיעוט. לעומת זאת, מי שהתלבט על תשובה מס' 2 אנחנו נחלק את השרתים 50% לגברים ו50% לנשים אז על כל שאילתא אנחנו נעבור בחצי טבלה אם זה היה ריינג' פרטישן או בטבלה מלאה אם זה ראונד רובין - ההבדל פה הוא פחות משמעותי מהמקרה הראשון.
by
מיין לפי

איזו סוג של מקבול יאפשר קיצור של ה response time של שאילתא בודדת? רשמו בטבלה שבעמוד הראשון את כל התשובות הנכונות, רק סימון מלא יקבל ניקוד

1
done
done
done
intra query- בתוך שאילתה. להקטין את הזמן שייקח לשאילתה אחת לסיים. בתוך זה יש: inter operation- להריץ חלקים שונים של אותה שאילתה במקביל. intra operation- להריץ כל תת אופרציה בשאילתה.
by
מיין לפי

מה בהכרח יודפס לאחר הרצת הבלוק?

1
done
by
מיין לפי

מה יודפס לאחר הרצה של התוכנית:?

1
done
בפעם הראשונה תתוסף עמודה 1 לטבלה. בפעם השנייה תתוסף עמודה 2 ולכן פעם הראשונה יודפס 1 ובפעם השנייה יודפס 12
by
מיין לפי

מה יודפס לאחר הרצה של התוכנית?

1
done
הוא דורס את הערך הקודם עבור key1
by
מיין לפי

מה זה Gossip?

1
done
by
מיין לפי

מה ניתן לבצע בעזרת PreparedStatement . רשמו בטבלה שבעמוד הראשון את כל התשובות הנכונות. רק תשובה מלאה תזכה בניקוד.

1
sentiment_very_satisfied
done
done
by
מיין לפי