הנדסת מערכות תוכנה ומידע מבוא לעיבוד שפה טבעית 2

לחץ כאן לכל השאלות

במודל מרקובי נבצע החלקת לפלאס. כלומר במידה והמודל הוא יוניגרמי שמחושב על קורפוס של N מילים ו-V מילים מה יהיה המכנה המתוקן בחישוב המוחלק לרצף של n מילים כאשר המודל הוא טריגרמי מספר המילים (tokens)בקורפוס הוא 1,000,000 מספר המילים (types)בקורפוס הוא 50,000 מספר ה-bigrams השונים בקורפוס הוא 10,000,000 ומספר ה-trigrams השונים בקורפוס הוא 100,000,000 נמק את בחירתך במקום המיועד בתחתית העמוד!

1
done
חישוב לפלס עבור טרי גרם הוא C(w1,w2,w3)/(C(w1,w2)+V) גודל המילון הוא 50k ו הN הוא C(w1,w2) כי זה אורך הקונטקסט
by
מיין לפי

* השאלה נוספה בתאריך: 20-07-2025