מבוא לעיבוד שפה טבעית מבוא לעיבוד שפה טבעית

לחץ כאן לכל השאלות

נתון LM, מודל שפה גנרטיבי פשוט מבוסס בי-גרמס (bigrams) שנלמד על קורפוס האימון הכולל את המשפטים הבאים (משפט בשורה): a cat sat on the mat the bat sat on the mat on a mat a bat quietly sat the cat sat on the mat and spat the fat rat sat on the mat and spat - don’t over react the boy holding a baseball bat sat on the mat the cat and the bat sat on my hat כמו כן, נתונים שני המשפטים הבאים (שאינם בקורפוס האימון): A. the bat sat on the mat and spat B. the cat sat on the mat and spat

1
done
ההסתברות למשפט a יותר גבוה מכוון שאנו מסתכלים בחלוניות , ההסתברות לthe cat או the bat היא זהה (2/5) ואילו ההסתברות לbat sat היא 4/5 (דוגמה אחת מתוך 5 לא) ואילו ההסתברות לcat sat היא 2/3 אחכ ההסתברות היא זהה מכוון שזה בדיוק אותו משפט, אך מכוון שמדובר בכפל הסתבריות ֿ(מניחים אי תלות) נבחר במשפט הראשון . (ניתן להניח כי prior זהה בכולם) .
by
מיין לפי

* השאלה נוספה בתאריך: 20-07-2025