أعلنت جوجل عن فتح الكود المصدري الخاص بنموذج مدرب مسبقا لنظام معالجة اللغات الطبيعية، Natural language processing (NLP)، خاصتها، والتي تطلق عليه اسم “بي إي آر تي” BERT، وذلك لإتاحة الفرصة أمام الباحثين في مجال أنظمة معالجة اللغات الطبيعية لاستخدامه.

ويستخدم نموذج “بي إي آر تي” في مهام متعددة بمجال معالجة اللغات الطبيعية على الحاسوب، ومنها الرد على الأسئلة والاستدلال اللغوي، وذلك دون الحاجة للقيام بتغييرات جوهرية محددة لكل مهمة يخصص لها.

ويعد النموذج أحد نتاجات قسم أبحاث الذكاء الاصطناعي في جوجل، حيث قال الباحثان في القسم، جاكوب ديفلن ومينج وي شانج، أن من أسباب طرح النموذج بشكل مفتوح المصدر هو مواجهة أحد التحديات الكبيرة في مجال معالجة اللغات الطبيعية على الحاسوب وهو نقص البيانات التي يتم تدريب الذكاء الاصطناعي عليها.

وأضافا عبر مدونة جوجل للذكاء الاصطناعي “مع النماذج المدربة مسبقا في مجال معالجة اللغات الطبيعية والقائمة على التعلم العميق (مثل بي إي آر تي) يُمكن للباحثين الحصول على نتائج والاستفادة بشكل أكبر من كميات أكثر من البيانات”.

ويتمنى الباحثان، أن يسد النموذج المطروح الفجوة الموجودة في الوقت الحالي في النماذج التي تخدم الباحثين في مجال معالجة اللغات الطبيعية، وأن يسهم في إيجاد نماذج أقوى لشرح اللغة تستخدم الكم الهائل من النصوص غير المشروحة (المفهومة للحاسوب) على الإنترنت.

ويتوفر الكود المصدري لنموذج “بي إي آر تي” على منصة جيت هب، ويدعم بشكله الحالي اللغة الإنجليزية فقط، إلا أن جوجل تأمل أن توافره أمام جميع الباحثين يساعد في زيادة عدد اللغات المدعومة.

ويمكن إيجاد النموذج عبر الرابط التالي، https://github.com/google-research/bert، أو يُمكن البدء باستخدامه مباشرة باستخدام النسخة الموجودة على الرابط التالي https://arxiv.org/abs/1810.04805

اترك تعليقاً