الشرطة الصينية تستخدم نظارات شمسية للتعرف على الوجوه. كيف تعمل؟

لم يعد التعرف على الوجوه مجرد حيلة محصورة بأفلام الخيال العلمي حول المستقبل الكئيب أو المسلسلات التلفزيونية حول التحقيقات الجنائية، بل تحول إلى تقنية متزايدة الانتشار. فقد أصبح بإمكانك فتح قفل جهاز آيفون إكس بمجرد توجيه وجهك إليه. كما أنه لديك الخيار باستخدام وجهك كتذكرة صعود إلى الطائرة إذا كنت تطير مع شركة جيت بلو من بوسطن إلى أروبا أو جمهورية الدومينيكان، وذلك بنظام يعتمد على خوارزمية خارجية للإدارة الأميركية للجمارك وحماية الحدود لتحديد التطابقات. والآن، بدأ استخدام شكل جديد للتقنية، يتضمن كاميرا مثبتة على نظارة شمسية للشرطة الصينية أثناء العمل ضمن الحشود، وذلك كما أوردت مجلة Wall Street Journal.

إضافة إلى النظارات، يتضمن النظام الصيني أداة متصلة محمولة، تحوي بيانات وجهية محلية، وذلك للسماح للنظام بالعمل بسرعة. ووفقاً لنفس المجلة، فقد تمكنت الشرطة بهذه الطريقة من اعتقال سبعة أشخاص متورطين بجرائم متنوعة ضمن إحدى محطات القطار لإحدى المدن، إضافة إلى آخرين يستخدمون هويات مزيفة.

إليكم فيما يلي كيفية عمل تقنيات التعرف على الوجوه بشكل عام، وما هي إحدى مشاكلها الرئيسية (إضافة إلى مسألة التعدي على الحريات الشخصية).

البحث عن الوجوه أولاً، ومن ثم التطابقات

يقول ديفيد فورسيث، خبير في الذكاء الاصطناعي، ومسؤول علوم الحاسوب في مجلس جامعة إلينويس في أوربانا-شامباين، أن برمجيات التعرف على الوجوه بشكل عام تعمل وفق عملية من خطوتين.

الخطوة الأولى هي اكتشاف أماكن الوجوه ضمن الصورة المعنية، حيث يبحث النظام عن قطعة مستطيلة من الصورة تحوي ملامح شخص ما، ويتجاهل كل ما عداها، مثل إشارات التوقف والسيارات.

أما الخطوة الثانية فهي التحقق من مطابقة هذا الوجه لأي من الوجوه في قاعدة البيانات. "وتبين لنا أنها تعد معضلة صعبة"، كما يقول فورسيث، بالمقارنة مع الخطوة الأولى، لأن "الملامح البشرية متشابهة" (على الأقل بالنسبة للخوارزميات).

يقول فورسيث إن النظام لا ينظر إلى الصورة كما يفعل البشر، بل ينظر إلى تمثيل لها على شكل بيانات تتألف من أرقام: "يجب أن يعزز هذا التمثيل من الخصائص التي تميز الوجوه عن بعضها"، مثل التفاصيل الدقيقة كشكل الشفاه، والأنوف، والأعين. كما يجب ألا يتأثر هذا التمثيل بالعوامل الخارجية التي يمكن أن يتعرض لها، مثل تعرض الوجه للإضاءة القوية. يقوم البرنامج بعد هذا بتفحص التمثيل للتأكد من وجود مطابقة ما ضمن قاعدة البيانات.

يضيف هورسيث: "شهدت السنوات العشر الأخيرة تطورات وتغيرات هامة في مجال تقنيات التصنيف. وقد أصبحت عملية بناء تمثيل الصورة عالية التعقيد والفعالية".

تحتاج أنظمة الذكاء الاصطناعي إلى كميات هائلة من البيانات حتى تتعلم أداء عملها بشكل جيد، وليس التعرف على الوجوه استثناء من هذه القاعدة. يتابع هورسيث: "حالياً، أفضل طريقة نعرفها، وبفرق كبير عن الطرق الأخرى، هي استخدام عدد هائل من صور الوجوه"، وذلك لبناء وتدريب هذه الأنظمة. تحتاج الخوارزميات إلى أن تتعلم ما هي التفاصيل التي يجب أن تركز عليها للتمييز بنجاح ما بين الوجوه المختلفة.

مشكلة التطابق الخاطئ

ولكن، على الرغم من التطور الكبير في هذه التقنية، فما زالت مجالاً صعباً للغاية. يقول هورسيث: "إن عواقب الخطأ قد تكون وخيمة". أي أن نظام التعرف على الوجوه قد يعطي تطابقات خاطئة، ويمكن أن يعتقد أنه اكتشف شخصاً ضمن قواعد البيانات، على عكس الواقع.

هناك فرق أساسي بين استخدام هذه التقنية بهذه الطريقة، كما في حالة الصين، وبين استخدامها كما في حالة آيفون إكس. ففي حالة الهاتف، يقوم المستخدم بإظهار وجهه عمداً أمام الهاتف من أجل فتح القفل، وهو تفاعل قليل المخاطر، ففي حالة الفشل في التعرف على صاحب الهاتف، يمكن ببساطة فتح الجهاز بالرمز السري، على الرغم من أن آبل تقول أن احتمال نجاح شخص آخر في قفل الجهاز عن طريق نظام التعرف على الوجه هو واحد بالمليون، حيث أن الجهاز بحاجة للتعرف على تفاصيل وجه المستخدم فقط، وذلك بشكل ثلاثي الأبعاد. ولكن استخدام هذه التقنية لمسح عشرات الوجوه لحشود من الناس في أماكن مثل المطارات أو محطات القطار يشكّل تحدياً صعباً، لأن التطابق الخاطئ قد لا يؤثر على شخص واحد فحسب، بل على المسافرين الذين قد يتعرضون للتأخير أيضاً.

ويختم هورسيث محذراً: "في الواقع، إن استخدام هذه التقنية قد يكون شائكاً للغاية".