Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

נתונים שני מודלים מאומנים: 1. M1: מודל w2v מסוג skip-gram 2. M2: מודל BERT בשני המודלים שיכוני המילים (enbeddings) הם באותו מימד. בהנתן משפט s ומילה w במשפט, המודל מחזיר את x - וקטור השיכון של המילה במשפט. כלומר M;(s, w) = x הפונקציה SIM מקבלת שני ווקטורים ומחזירה את הדימיון הקוסינוסי ביניהם. נתונים הפסוקים הבאים: 1. וישלח ידו ויחזק בו ויהי למטה בכפו (שמות,ד, ד) 2. אם ימדו שמים מלמעלה ויחקרו מוסדי ארץ למטה (ירמיהו, לא, לו) נייצג את המחרוזת 'למטה" על ידי האות μ סמנו את החיווי הסביר ביותר!

1
done
הסבר: מודל word2vec (skip-gram) יוצר embeddings שמבוססים על הקשר סביב המילה במרחב מילים מצומצם. מודל זה יעיל בלכידת יחסים סמנטיים ישירים בין מילים קרובות בטקסט. לעומת זאת, BERT מבוסס על הבנה רחבה יותר של ההקשר, המבוססת על מבנים תחביריים ויחסים בין מילים רחוקות יותר במשפט. בגלל האופי של word2vec המתמקד בקשרים סמנטיים קרובים, הדמיון בין מילים בודדות במודלים אלו (ביחוד כאשר מדובר במילים קרובות סמנטית) יהיה גבוה יותר לעומת BERT.
by
מיין לפי

נתונה רשת בארכיטקטורת הטרנספורמר (transformer). האנקודר (encoder) יכול לקבל רצף באורך מקסימלי של s מילים. מימד שיכוני המילים (embeddings) של המודל הוא d. המודל מקבל קלט ספציפי W בן k מילים. נתון כי: .k=221 ,s=1024, d=200 מה יהיה מימד הווקטור המציין את מיקום המילה בקלט (ה-positional encoding vector)? נמקו את בחירתך במקום המיועד בתחתית העמוד!

1
done
כל טוקן מקבל אמבדינג לכן יש ל (k,d) ולכן גם positional encoding יהיה (k,d) שהd בעצם מסמל את המיקום של המילה
by
מיין לפי

מהי ההנחה הנאיבית במודל Naive Bayes ומה ההשלכה (לחיוב או לשלילה) האפשרית שלה?

1
done
by
מיין לפי

הצורה הכללית של רגרסיה לוגיסטית לסיווג נתונה על ידי:

1
done
by
מיין לפי

נתון חלק ממשפט והגזירה שלו:

1
sentiment_very_satisfied
by
מיין לפי

המשוררת יונה וולך כתבה כי "עברית היא שפה סקס מניאקית", כלומר בעברית יש 'מין' לשמות עצם והטיית הפועל חייבת להיות בהתאמה למין של שם העצם (הילד רץ, הילדה רצה). הציעו אלגוריתם ללימוד המין הדקדוקי של שמות עצם. על האלגוריתם לתמוך בשתי פונקציות: train(params) get_gender(sentence, target noun) .המקבל משפט: (למשל, התפוח לא נפל רחוק מהעץ), ושם עצם מטרה (למשל, תפוח) ומחזיר ז' או ני בהתאם לשם העצם מהם הפרמטרים שתקבל הפונקציה train? הגדירו היטב את קורפוס האימון. הגדירו היטב את פרוצדורת האימון. האם האלגוריתם אותו הצעתם ינתח נכונה את המשפטים הבאים שלא הופיעו בקורפוס האימון (שם עצם המטרה מסומן בקו תחתון): א. הכוס עמדה על השולחן ב. השולחן עמד בסלון ג. הכוס על השולחן עמדה ליפול באם האלגוריתם שהצעתם טועה באחת או יותר מהדוגמאות, הסבירו למה.

1
done
done
done
done
by
מיין לפי

הפסיק האוקספורדי (Oxford Comma) הוא פסיק המופיע לפני ו' החיבור במשפטי רשימה (בניגוד למה שלמדנו בשיעורי לשון בתיכון!) למשל, "אתמול ראיתי את הההורים שלי, בטמן, וקאט-וומן". מתנגדי ה-OC טוענים שבשום מקרה לא מוסיפים פסיק לפני ו' החיבור. חסידי הם טוענים שהוא הכרחי על מנת להבדיל בין משמעויות שונות: 1. ללא פסיק: "אתמול ראיתי את הההורים שלי, בטמן וקאט-וומן" משמעות המשפט היא שראיתי רק שני אנשים - ההורים שלי שהם בטמן וקאט וומן. 2. עם פסיק "אתמול ראיתי את הההורים שלי, בטמן, וקאט-וומן" משמעות המשפט היא שראיתי ארבעה אנשים - ההורים שלי+בטמן+קאט-וומן. את מחסידי ה-OC. הציעי מתווה אלגוריתמי להחלטה האם להוסיף את הפסיק החמקמק למשפט נתון. צייני את האלגוריתם בו תשתמשי, את הקורפוס לאימון, את מבנה הקלט, והאם נדרש עיבוד מקים (preprocessing) ו/או חילוץ פיצ'רים. נמקי בקצרה את בחירותייך!

1
done
done
mood
done
by
מיין לפי

מדד ה-precision בבעיית סיווג בינארית מחושב כ:

1
done
by
מיין לפי

במשימת NER - זיהוי ישויות (Named-Entity Recognition) נקבל טקסט ונרצה לחלץ ממנו ישויות מסוגים ספציפיים - בדרך כלל אנשים, מקומות, חברות מסחריות וישויות גאו-פוליטיות. למשל, במשפט: "נאום הסופגניה' הוא הכינוי לנאומו המכונן של הנשיא קנדי במערב ברלין, אחרי הקמת חומת ברלין על ידי ברלין המזרחית. קנדי הכריז הגרמנית 'איש בין איין ברלינר-משפט שיכול להתפרש כתמיכה במובלעת הדמוקרטית ([גם] אני ברלינאי) או כ'אני סופגניה'". ישית במשפט הן: קנדי (PERSON), מערב ברלין (LOCATION), ברלין המזרחית (GEO-POLITICAL ENTIRY). סמנו את כל הישויות הגאו-פוליטיות במשפט הבא (סימון מילים שגויות עשוי להוריד נקודות(: .Washington and Beijing exchange threats after Trump's speech in Stockholm

1
done
done
by
מיין לפי

סמנו את התשובה הנכונה

1
done
by
מיין לפי