|
ד"ר ג'יהאד אל סאנע [צילם: דני מכליס]
|
|
|
|
|
באוניברסיטת בן-גוריון בנגב הצליחו חוקרים לפתח מערכת ראשונה מסוגה לזיהוי כתב-יד ערבי בזמן-אמיתי, וזאת ברמת דיוק גבוהה מאד של כ-97%. המערכת מאפשרת למשתמש לכתוב בעט על לוח אלקטרוני. הלוח מזין את כתב-היד למחשב, שמנתח ומתרגם אותו לאותיות מודפסות, באלפית השנייה. הפיתוח נרשם באחרונה כפטנט.
החוקרים, ד"ר ג'יהאד אל-סאנע והסטודנט שלו לתואר שני (מסטר) פאדי ביאדסה מהמחלקה למדעי המחשב באוניברסיטה, פיתחו את המערכת על-בסיס מחקר המבוסס על שיטות מתקדמות של למידה, תוך שימוש בגיאומטריה חישובית לניתוח העקומות, הלולאות והנקודות שבונה מודל הסתברותי של זיהוי. המערכת מזהה כתב-יד ממוצע, ובנויה ללמוד כתבי-יד חדשים במהלך הכתיבה.
עכבר ומקלדת הם ההתקנים השכיחים ביותר להעברת אינפורמציה טקסטואלית למחשב. התפתחות של מחשבי כף-יד ומחשבי הלוח האישיים, המאפשרים כתיבה בכתב-יד על לוח קטן, מחייבת שיטות חדשות לזיהוי כתב-יד ותרגומו לטקסט מודפס במחשב. ד"ר אל סאנע הסביר כי כאשר השימוש במחשב הופך להיות מרכיב חשוב במתן שירות לאזרח, יש יתרון עצום לשימוש בכתב-יד במקום בהקלדה, בעיקר במדינות מתפתחות. לדבריו, קיימות כיום מערכות לזיהוי כתב-יד לטיני באחוזים טובים, אבל אין כל מערכת מעשית לזיהוי כתב-יד ערבי, העשויה לשמש כשישית מתושבי כדור הארץ.
זיהוי כתב-יד ערבי הינו בעיה קשה, מאחר שכתב זה מחובר באופן טבעי, ומשום שרוב האותיות הערביות מכילות נקודות שממוקמות מעל או מתחת לאות. "אנו מתחייבים לאותה צורה של כתיבה טבעית ללא שינוי. למשל בחלק ממחשבי כף-היד, אפילו לאותיות הלטינית יש שינוי קטן באותיות, כדי שיהיה אפשר לזהותם בצורה מהירה וללא שגיאות", הבטיח ד"ר אל סאנע.
באשר לפוטנציאל הכלכלי של הפיתוח, אמר אל סאנע כי מדובר באוכלוסיית יעד של כמיליארד בני אדם הדוברים את השפה הערבית, שפת האורדו (פקיסטן) וכורדית, שעשויים להיות משתמשים פוטנציאליים של הפיתוח. חברת היישום של אוניברסיטת בן-גוריון "ב.ג. נגב טכנולוגיות" פועלת בימים לאיתור השקעות בפרויקט.