تعتبر اللغة أمراً كبيراً وغامضاً. حيث تتغير معاني الكلمات وفقاً للسياق، كما أنه يوجد كلمات متطابقة في التهجئة ومختلفة في اللفظ والمعنى، إضافة إلى تحريف اللغة المعيارية بالمصطلحات العامية. ولهذا، فإن قدرتنا على بناء حواسيب تفهمنا تكاد تكون معجزة.
تطورت الأنظمة المخصصة لفهم لغة البشر بشكل كبير في السنوات الأخيرة، حيث اعتمد الباحثون وسائل جديدة في الذكاء الاصطناعي مثل التعلم العميق. وتقوم هذه الطرق على تلقيم الخوارزميات بكميات هائلة من البيانات للتوصل إلى الروابط من بين الكلمات والجمل. يسمى هذا بالإعراب، أو التحليل اللغوي، أي تحديد الدور الذي تلعبه كل كلمة في الجملة.
نشرت شركة جوجل الرماز البرمجي لنظام اللغة الخاص بها والمسمى "سينتاكس نت"، إضافة إلى برنامج تم تدريبه مسبقاً على اللغة الإنكليزية يسمى "بارسي ماكبارسفيس". وقد أثبتت اختبارات جوجل أن دقة بارسي ماكبارسفيس في فهم الكلمات بشكل صحيح تتجاوز 94%، وهو رقم قريب للغاية من النسبة المعيارية لموظفي جوجل الذين حققوا 96% في نفس المهمة. وباستخدام سينتاكس نت، سيتمكن الباحثون من خارج جوجل من تدريب وتطبيق أنظمتهم الخاصة لفهم لغات أخرى، أو محاولة التفوق على نتيجة جوجل.
يعمل النظام بدراسة كل جملة مرات متعددة، وتكوين عدة فرضيات حول كل رابط محتمل بين الكلمات في كل مرة. وتبنى هذه الفرضيات على جمل وكلمات تم تلقيمها للخوارزمية من قبل، وتسمى ببيانات التدريب. يقوم النظام بترتيب الفرضيات أثناء تجريب عدة احتمالات للمعنى الممكن لكل كلمة، وأخيراً يتوصل إلى النتيجة النهائية بناء على الاحتمال الأعلى لكل كلمة. يسمي الباحثون هذه الطريقة بـ "البحث الشعاعي"، وهو مصطلح صيغ لأول مرة في جامعة كارنيجي ميلون في 1976.
لا يشكل فهم اللغة أمراً صعباً بالنسبة لجوجل، خصوصاً أن منصتها مبنية بالكامل على فهم ما يريد المستخدمون العثور عليه في عمليات البحث. من الواضح أن سينتاكس نت مبني ضمن "تنسور فلو-Tensor Flow"، منصة التعلم الآلي مفتوحة المصدر لجوجل، ولمزيد من المعلومات، يمكنك أن تقرأ منشور الإعلان عن هذا العمل العام الماضي ضمن مدونة جوجل باللغة الإنكليزية (هنا).