الشركة الهندسية لتطوير الأنظمة الرقمية

Contact Info
12A Haroun,Doqi, Giza Governorate, Egypt
info@rdi-eg.com
+20 2 37 49 94 63 +20 2 37 49 55 66 +20 2 37 49 95 61

RASM 2019

RASM 2019

مسابقة التعرف على المخطوطات العلمية العربية التاريخية

“RASM 2019 هي مسابقة أطلقتها المكتبة البريطانية بالتعاون مع مختبر أبحاث PRImA ومعهد آلان تورينج.
أقيمت هذه المسابقة في سياق المؤتمر الدولي الخامس عشر لتحليل الوثائق والاعتراف بها (ICDAR 2019).
تحتوي المكتبة البريطانية على مجموعة كبيرة من المخطوطات العربية، تضم ما يقرب من ١٥٠٠٠ عمل. تم ترقيم عدة مئات من المخطوطات كجزء من الشراكة بين المكتبة البريطانية ومؤسسة قطر، وإتاحتها في مكتبة قطر الرقمية .
تقام المسابقة على أمل إيجاد الحل الأمثل للنسخ الدقيق والآلي للأرشيف الرقمي الواسع والمتزايد للمخطوطات العلمية العربية التاريخية المكتوبة بخط اليد داخل مكتبة قطر الرقمية. تهدف المسابقة الى تحسين إمكانية الوصول إلى هذا المحتوى الغني من خلال تمكين البحث عن النص الكامل واكتشافه، بالإضافة إلى تمكين تحليل النص على نطاق واسع.

حازت RDI على المركز الأول

تم تقسيم المسابقة إلى ثلاثة تحديات مختلفة: تجزئة الصفحة، واكتشاف خط النص، والتعرف الضوئي على الحروف (OCR).
تنافست RDI مع الأنظمة الراسخة المستخدمة في الصناعة والأوساط الأكاديمية – Tesseract 4.0 و ABBYY FineReader Engine 12 (FRE12) و Google Cloud Vision API.
نظرًا للطبيعة الصعبة للغاية للوثائق ، فإن الوصول إلى دقة ٧٧.٦٪ في “التحدي 2 – تجزئة الخطوط من النص” بفارق يزيد عن ٢٤٪ عن المركز الثاني كان بمثابة فوز كبير لنا. كما حققنا دقة بلغت ٧٧.٥٨٪ في “التحدي الثالث – التعرف على النص” بفارق يزيد عن ١٤٪ عن المركز الثاني.

التحدي 2 – تجزئة الخطوط من النص

 

التحدي الثالث – التعرف على النص