Discuss, Learn and be Happy דיון בשאלות

help brightness_4 brightness_7 format_textdirection_r_to_l format_textdirection_l_to_r

ננרמל את הדקדוק כפי שנלמד בכיתה ונגזור את המשפט ממחדש על פי הדקדוק המנורמל. איזה מבנה(סימן)יתווסף לעץ?

1
done
by
מיין לפי

סמנו את כל המשפטים שיוכרו כחוקיים על ידי הדקדוק הנתון לעיל:

1
done
done
done
by
מיין לפי

פיתחת בהצלחה אלגוריתם NER לאנגלית. האלגוריתם אומן על משפטים כמו: Nikola Tesla, the famous inventor, emigrated to the United States at the age of 32 ובבדיקה זיהה בהצלחה את כל הישויות במשפט Tesla died at 86 in NYC, USA לעומת זאת, כשאותו אלגוריתם בדיוק אומן על קורפוס עברי, המכיל בדיוק את אותם משפטים כמו קורפוס האימון האנגלי (למשל, "ניקולה טסלה, הממציא המפורסם, היגר לארצות הברית בגיל 32"), האלגוריתם כשל בזיהוי מלא של הישויות במשפט: "טסלה נפטר בארצות הברית בגיל 86." מה יכולים להיות הגורמים לכישלון בשימוש באלגוריתם על קורפוס עברי?

1
done
done
by
מיין לפי

השאלות הבאות יעסקו במובאה שלהלן. בשאלות רב ברירה יש לסמן את התשובה הנכונה ביותר ולנמק במקום המיועד להלן אנקדוטה מתוך פסקת הפתיחה מהמבוא לספר 'יודופוביה - גישות כלפי היהודים בעולם העתיק': על פי המתואר, האם ניתן להסיק בוודאות, כפי שטוען פרופ' שפר, שהמילה judenfreundlich אכן אינה קיימת במילון? נמק

1
done
לא ניתן להסיק בוודאות כי מילה זו לא במילון, כפי שראינו בערוץ הרועש בעבודה 1 שלנו, יכולים להיות 2 הסברים: הראשון, מילה זו כן במילון אבל מופיעה הרבה פחות (ואם מדבר על כל BIGRAM לדוגמא אז היא מופיעה פחות בהיתן הקונטקסט המדובר) השני, הפרמטר אלפא, שקובע מה ההתסברות שאין טעות במילה הנוכחית - נמוך מדי, ומנגד, אולי ההסברןיות של מחיקה של r והחלפה של u בi גבוהות (סך הכל 2 edit distance זה לגיטימי)
by
מיין לפי

בהנחה שהמילה אכן אינה במילון של התוכנה, ולפי האלגוריתמים שנלמדו בקורס, האם סביר שצודק פרופ' שפר בהסברן ("המילון אינו מכיל את המילה ולכן מציע את התחליף הקרוב ביותר מבחינת סדר התווים"). נמקו!

1
done
by
מיין לפי

במידה ופרופסור שפר צודק בטענתו שהמילון אינו מכיל את המילה ומציע את המילה עם האיות הקרוב ביותר, הוא צודק גם בטענתו "הגרמנים מעולם לא היו, ולעולם אינם, ידידותיים כלפי היהודים"? נמקו!

1
done
בשביל להסיק דבר כזה צריך לבחון את הדטא שעליו אומן המודל (אולי אומן על מידע מוטה, שנאסף מפורום אנטישמי) יש גם לבחון את המודל עצמו (אולי הוא נותן מעט מדי משקל למילה המקורית)
by
מיין לפי