في شهر يونيو من العام المنصرم، كتبت جوجل أنها تعلم خوارزميات الذكاء الاصطناعي لديها كيفية توليد صور للأشياء، أو بتعبير آخر، كيف "تحلم". وقد حاول الذكاء الاصطناعي توليد صور لأشياء كان قد رآها من قبل، مثل الأثقال الرياضية المخصصة لليد. ولكنه واجه بضعة مشاكل. فقد نجح في توليد أشياء ذات شكل يشبه هذه الأثقال، غير أن مقابض هذه الأثقال كانت تبرز منها أذرع بشرية، وذلك لأن الأذرع والأثقال كانت مرتبطة بشكل وثيق في نظر الذكاء الاصطناعي. على مدى عام كامل، تم تنقيح هذه العملية بشكل كبير، ما يعني أن هذه الخوارزميات تعلمت عن العالم أفكاراً أكثر اكتمالاً.
أظهر بحث جديد أن الذكاء الاصطناعي أصبح قادراً على توليد صور أكثر واقعية لأجسام رآها من قبل، حتى لو تم تدريبه باستخدام مجموعة معيارية من الصور. وعن طريق هذه العملية، تمكن الباحثون أيضاً من تركيب هذه الصور بشكل متتابع لتشكيل فيديوهات منخفضة الدقة لأفعال مختلفة، مثل القفز المظلي وعزف الكمان. وتركز هذه الورقة البحثية، التي صدرت عن جامعة وايومينج وجامعة ألبرت لودفيج في فريبرج وشركة جيوميتريك إنتيليجينس، على شبكات التوليد العميقة، والتي لا تقوم بتوليد هذه الصور وحسب، بل انها قادرة على إظهار مدى تأثير كل عصبون في الشبكة على فهم النظام ككل.
إن تفحص الصور التي يولدها النموذج أمر هام لأنه يقدم للباحثين فكرة أفضل عن كيفية معالجة نموذجهم للبيانات. إنها طريقة للاطلاع على آليات العمل الداخلية للخوارزميات التي تعمل عادة بشكل مستقل عن التدخل البشري. ويمكن بالتالي تعديل النظام ليصبح أسرع وأكثر دقة، وذلك بمعرفة كل حساب يقوم به كل عصبون في الشبكة.
كتب الفريق حول هذا العمل: "عند استخدام الصور الحقيقية، من الصعب تحديد ميزاتها التي تعلمها عصبون ما. على سبيل المثال، إذا تفعّل عصبون بصورة جزازة عشب على العشب، فمن الصعب أن نحدد ما إذا كان (يهمه) العشب، ولكن إذا كانت الصورة تحتوي على العشب فقط، يمكننا أن نكون أكثر ثقة أن العصبون تعلم أن ينتبه إلى هذا السياق".
يعمل الفريق على إعادة العمل في هذا البحث من جديد، وبهذه النتائج، أصبح لديهم أداة مهمة لمتابعة العمل.