הנדסת מערכות תוכנה ומידע מבוא לעיבוד שפה טבעית 2

לחץ כאן לכל השאלות

הפסיק האוקספורדי (Oxford Comma) הוא פסיק המופיע לפני ו' החיבור במשפטי רשימה (בניגוד למה שלמדנו בשיעורי לשון בתיכון!) למשל, "אתמול ראיתי את הההורים שלי, בטמן, וקאט-וומן". מתנגדי ה-OC טוענים שבשום מקרה לא מוסיפים פסיק לפני ו' החיבור. חסידי הם טוענים שהוא הכרחי על מנת להבדיל בין משמעויות שונות: 1. ללא פסיק: "אתמול ראיתי את הההורים שלי, בטמן וקאט-וומן" משמעות המשפט היא שראיתי רק שני אנשים - ההורים שלי שהם בטמן וקאט וומן. 2. עם פסיק "אתמול ראיתי את הההורים שלי, בטמן, וקאט-וומן" משמעות המשפט היא שראיתי ארבעה אנשים - ההורים שלי+בטמן+קאט-וומן. את מחסידי ה-OC. הציעי מתווה אלגוריתמי להחלטה האם להוסיף את הפסיק החמקמק למשפט נתון. צייני את האלגוריתם בו תשתמשי, את הקורפוס לאימון, את מבנה הקלט, והאם נדרש עיבוד מקים (preprocessing) ו/או חילוץ פיצ'רים. נמקי בקצרה את בחירותייך!

1
done
done
done
done
by
מיין לפי

* השאלה נוספה בתאריך: 20-07-2025