Paleography text alignment tool 


מספר פרויקט: 140802

שמות הסטודנטים המציגים: 
אוריה רצון
לי כהן

שם הפרויקט: Paleography text alignment tool

שם המנחה: ד"ר טל הסנר

שם הסדנה: פיתוח אפליקציות
 

תקציר הפרויקט:

זהו כלי חדשני הנועד להתגבר על הקושי בעיבוד טקסטים עתיקים. קיימים אלפי כתבי עת עתיקים המאוחסנים ברחבי העולם, העוברים תהליך של שימור דיגיטלי ע"י סריקתם ותרגומם לטקסט.
מאמצים ומשאבים רבים מושקעים ביצירת כמויות עתק של מאגרי מידע אלו, אך עם זאת לא ניתן לנצלם כיאות, כיוון שכיום לא קיימים כלים המאפשרים יישור אותיות התמליל לקואורדינאטות המתאימות להן בתמונות כתב יד באופן אמין.
בעקבות כך, התהליך נעשה באופן ידני על ידי מומחים המסוגלים לזהות את האותיות באופן אמין. מספר מומחים אלו קטן מאד ביחס לכמות כתבי העת המטופלים. מיותר לציין שעקב תנאים האלו התהליך מאד איטי.
הכלי, אותו פיתחנו יאפשר באמצעות אלגוריתם חדשני לעיבוד תמונה לזהות כל אות בכתבי העת העתיקים ולהתאים את הקואורדינאטות שלה לאות טקסט המייצגת אותה. 
הדבר יחסוך שעות עבודה בקנה מידה עצום לתהליך, ובכך יאיץ את תהליך חקר כתבי העת העתיקים בצורה משמעותית.