رسالة من أفريقيا
اطلب من ChatGPT إدراج أسماء البلدان الأفريقية. حتى الان جيدة جدا. قم بتعقيد الأمور قليلاً من خلال سؤاله باللغة التجرينية، وهي اللغة المستخدمة في إريتريا وشمال إثيوبيا. “والنتيجة رطانة، بمزيج من اللغة الأمهرية (لغة إثيوبية أخرى)من التيجرينية واخترع كلمات ليس لها معنى في أي من اللغتين”، يلاحظ عالم الكمبيوتر الإثيوبي أميلاش تيكا هادجو، بعد أن تحدى روبوت المحادثة الذي صممه OpenAI.
وكان من الممكن إجراء نفس التجربة بنفس السهولة مع الإيوي (غانا، توغو)، أو اليوروبا (نيجيريا، بنين)، أو تسونجا (جنوب أفريقيا، موزمبيق). الغالبية العظمى من حوالي 2000 لغة يتم التحدث بها في القارة تكاد تكون معدومة على الإنترنت، وبالتالي لا يتم التعرف عليها أو يتم التعرف عليها بشكل سيئ من قبل أنظمة الذكاء الاصطناعي (AI) مثل ChatGPT أو Google Translate أو Siri. يطلق عليها اسم “منخفضة الموارد”، على عكس حفنة من اللغات “عالية الموارد”، وعلى رأسها اللغة الإنجليزية، والتي تهيمن اليوم على شبكة الإنترنت العالمية.
ومثل أميلاش تيكا هادجو، يعمل الآن عدد متزايد من رواد الأعمال والباحثين الأفارقة على سد هذه الفجوات. شارك الإثيوبي، المقيم في برلين، في تأسيس شركة Lesan الناشئة في عام 2019، والمخصصة للغات بلده الأصلي. وطورت الشركة أداة ترجمة آلية بين التغرينية والأمهرية والإنجليزية، وتخطط لإضافة الأورومو والصومالية قريبًا. ونظراً لعدم قدرته على الاعتماد على عدد كبير من الموارد عبر الإنترنت (على سبيل المثال، لا يوجد سوى 15 ألف مقالة على ويكيبيديا باللغة الأمهرية، وهي اللغة التي يتحدث بها ما بين 30 إلى 50 مليون شخص)، يتعين على الفريق إظهار الإبداع في جمع البيانات.
يتم جمع الكثير منها في الكتب والمجلات والوثائق بمساعدة المساهمين المحليين. وهي تحدد المحتوى الأكثر صلة، ثم تقوم بمسحه ضوئيًا وترجمته، كل ذلك باستخدام نظام التعرف البصري على الأحرف. “إنه يتطلب الكثير من العمل، وخاصة العمل اليدوي، يتعرف على رجل الأعمال. لكننا نجد أنه من الممكن بناء نموذج نوعي يعتمد على مجموعات بيانات صغيرة مختارة بعناية. »
أهمية المنهجية المعنية
ويقول عمالقة التكنولوجيا أيضًا إنهم يريدون المشاركة في الترويج لهذه التعابير غير الممثلة بشكل كافٍ، في حين أن ما يقرب من 7000 لغة في العالم، وفقًا للمتخصصين، مهددة بالاختفاء أو حتى الموت الرقمي. يتضمن الإصدار 4 من ChatGPT بعض اللغات، مثل اللغة الأيسلندية. ومن جانبها، أدرجت خدمة ترجمة جوجل حوالي خمسة عشر لغة أفريقية خلال التحديثات في عامي 2020 و2022. لكن مستوى الترجمة المقدمة غالبًا ما يكون غير كاف، ويشكك الباحثون الأفارقة في مدى أهمية المنهجية التي لا تستجيب لخصوصيات اللغات من أفريقيا.
لديك 55% من هذه المقالة لقراءتها. والباقي محجوز للمشتركين.

