تهدف تكنولوجيا التصوير الحاسوبي إلى أتمتة المهام التي تستغرق وقتاً طويلاً أو غير المثيرة للاهتمام، مثل تعديل الإضاءة في مشهد، واستبدال السماء في صورة ما، وانتقاء الصور المرغوب الاحتفاظ بها من بين مئات الصور المتماثلة. ولكن بالنسبة للعديد من المصورين، فإن وسم الصور بكلمات مفتاحية وكتابة أوصاف نصية تجعل هذه الإجراءات تبدو مثيرة.
عندما ننظر إلى صورة، من المفترض أن تشرح نفسها بنفسها. مع ذلك، فالصور لا تصف نفسها في الكثير من النواحي. نحن نتعامل مع مكتبات تضم آلاف الصور الرقمية، لذلك ليس هناك ضمانة أن نتمكّن من إيجاد الصور التي نبحث عنها عند مسح شاشات ممتلئة بالصور. لكن الذكاء الاصطناعي يمكنه أن يساعدنا.
الكلمات المفتاحية، المصطلحات، النصوص الوصفية، العبارات، والتعابير
لا يمكنني المبالغة في التأكيد على مزايا ربط الكلمات المفتاحية بالصور. كم مرة تصفّحت صورك وحاولت أن تتذكر متى تم التقاط الصور التي تبحث عنها؟ وكم مرة مرت هذه الصور دون أن تنتبه لها، أو أدركت أنها مخزنة في موقع آخر؟ إذا كانت هذه الصور مترابطة بكلمات مفتاحية، فستتمكن غالباً من إيجادها في غضون دقيقتين فقط أو أقل.
يكمن التحدي في وسم الصور في المقام الأول.
يبدو لي أن الناس يقومون بوسم الصور بطريقتين وحيدتين متعاكستين تماماً. من ناحية، هناك المقاربة الوصفية المفرطة، والتي تعتمد على تضمين أكبر عدد ممكن من المصطلحات لوصف محتويات الصورة. يمكن أن تعبر هذه المصطلحات عن أنواع مختلفة وفئات فرعية من الصور، كما يمكن أن تعبر عن مفاهيم ذات صلة بها، وإلى ما هنالك من الأوصاف اللغوية الرائعة ولكن المبهمة.
الطريقة الثانية لوسم الصور هي الأكثر شيوعاً حسب اعتقادي، ويعتقد المصورون الذين يتّبعونها أن وسم الصور بالكلمات المفتاحية هو مجرد نشاط مستهلك ومضيّع للجهد. المصورون الفوتوغرافيون يريدون تعديل الصور، وليس تصنيفها!
هنا يمكن أن تكون تكنولوجيا الذكاء الاصطناعي مفيدة. تستخدم العديد من التطبيقات آليات مسح الصور لتحديد محتوياتها واستخدام تلك البيانات لمساعدتك عندما تجري عمليات البحث.
على سبيل المثال، يؤدي البحث عن عبارة «عباد الشمس» في تطبيق «صور آبل» (Apple Photos) إلى إظهار الصور في مكتبتي التي تحتوي على زهور عباد الشمس (ولسبب غير مفهوم، صورة لقطع البطاطا المهروسة والمقلية). في كل حالة من هذه الحالات، لم أقم بتعيين كلمة مفتاحية محددة للصور.
بالمثل، يستفيد تطبيق «لايت روم» (Lightroom) المخصص للحاسوب (التطبيق الأحدث، وليس «لايت روم كلاسيك» (Lightroom Classic) من تقنية «أدوبي سينسيه» (Adobe Sensei) لاقتراح النتائج عندما أكتب «عباد الشمس» في حقل البحث. وعلى الرغم من أني وسمت بعض الصور بكلمات مفتاحية (تظهر في أعلى قائمة النتائج)، فقد اقترح التطبيق أيضاً عبارة «عباد الشمس في الغروب» كمصطلح بحث.
هذا أمر مفيد، ولكن خطوات التنفيذ غامضة إلى حد ما. يستخدم تطبيقا لايت روم وصور آبل بياناتهما الداخلية الخاصة بدلاً من إنشاء كلمات مفتاحية يمكنك البحث باستخدامها.
ماذا لو لم تستخدم أياً من هذين التطبيقين؟ ربما تكون مكتبة صورك موجودة في تطبيق لايت روم كلاسيك، أو في مجلدات قمت بإنشائها على قرص التخزين في الحاسوب.
اقرأ أيضاً: أصبح بإمكانك استخدام إعداداتك المفضلة السابقة لبرنامج لايتروم على هاتفك
إنشاء الكلمات المفتاحية باستخدام تطبيق «إكساير فوتو»
قمت بإجراء تجربة سريعة لأداتين من تطبيق «إكساير» حتى اكتشف مدى عمليتها. تطبيق «إكساير فوتو» هو تطبيق مستقل يقوم بالتعرف على الصور وينشئ نوع البيانات الوصفية التي أتحدث عنها بالضبط. تقوم أداة «إكساير سيرتش 2» بنفس الشيء، تماماً مثل الإضافات في تطبيق لايت روم كلاسيك.
لقد قمت بتحميل 895 صورة في إكساير فوتو، وأنجز التطبيق مسحها ووسمها في بضع دقائق فقط. كانت الكلمات المفتاحية التي أنشأها التطبيق مناسبة لوصف الصور. على سبيل المثال، استطاع التطبيق التمييز بين البالغين والأطفال في الصور التي تحتوي على أشخاص. يمكنك إضافة الكلمات المفتاحية أو إزالتها ثم ربطها مرة أخرى بالصور أو حفظها في ملفات جانبية مخصصة للصور ذات الصيغة «آر أيه دبليو».
لذا، إذا كان مجرد التفكير في إضافة كلمات مفتاحية يجعلك ترغب في القيام بأي شيء آخر، يمكنك الآن استخدام ميزات الوسم الخاصة بهذا التطبيق دون بذل الكثير من الجهد.
اقرأ أيضاً: نصائح وحيل لالتقاط صورٍ أفضل بواسطة الهاتف الذكي
توليد نصوص بديلة للصور
لا يقتصر استخدام النصوص على إنشاء الكلمات المفتاحية والبحث عن الصور. يستطيع العديد من الأشخاص المكفوفين أو ضعاف البصر فهم محتويات الصور الموجودة عبر الإنترنت، معتمدين على تكنولوجيا قراءة الشاشة التي تقرأ محتوى صفحات الإنترنت بصوت عالٍ. لذلك من المهم عند مشاركة الصور تضمين نص بديل يصف محتواها كلما أمكن ذلك.
على سبيل المثال، عند نشر صورة في موقع «إنستقرام» أو «فيسبوك»، يمكنك إضافة نص بديل، إلّا أنه ليس من الواضح دائماً كيفية القيام بذلك. على موقع إنستقرام، وبمجرد تحديد الصورة وكتابة التعليق عليها، انتقل لأسفل الصفحة، وانقر على الإعدادات المتقدمة، ثم ضمن عنوان إمكانية الوصول، انقر على كتابة نص بديل.
يمكن أن تكون النصوص البديلة المولّدة تلقائياً جيدة أو سيئة. على سبيل المثال، يصف النص البديل المنشأ تلقائياً على موقع فيسوك صورة الورقة المبينة أعلاه بأنها «قد تكون صورة قريبة للطبيعة»، وهو وصف دقيق من الناحية الفنية، ولكنه ليس مفيداً للغاية.
عند احتواء الصورة على عناصر محددة أكثر، يكون النص البديل المولّد باستخدام الذكاء الاصطناعي أكثر دقة. في الصورة أدناه، وهي صورة شخصية التقطت باستخدام طيارة بدون طيار، ولّد موقع فيسبوك الوصف التالي: «قد تكون صورة لشخصين واقفين، وطريق».
أحد الأمثلة الأخرى هو محاولة شركة «مايكروسوفت» استخدام التعلم الآليّ لإنشاء تعليقات نصيّة للصور. في ورقة بحثية نُشرت في فبراير/شباط 2021، وصف الباحثون عملية تسمى «التدريب البصري الأولي على المفردات» (أو «فيفو»، اختصاراً) لتوليد تعليقات أكثر دقة.
لذا، على الرغم من إحراز تقدم ملحوظ، لا يزال هناك إمكانيات كبيرة للتحسن.
لا ضير في أتمتة بعض المهام
يصاب المصورون بالقلق عندما يواجهون فكرة أن الذكاء الاصطناعي قد يستبدلهم بطريقة ما، ولكن لا يبدو أن إنشاء كلمات مفتاحية وتعليقات ونصوص بديلة يعرضهم لذلك. هذا أحد المناحي التي يسعدني فيها بالتأكيد السماح للآلات بإنجاز العمل نيابة عني، بشرط أن تكون النتائج دقيقة بالطبع.