متفرقات

ثورة «سورا»… الذكاء الاصطناعي يُحوّل النصَّ إلى فيديو دقيق التفاصيل

أعلنت شركة «أوبن إيه آي»، مُبتكِرة برنامج «تشات جي بي تي» ومولّد الصور «دال – إي»، عن أداة جديدة أطلقت عليها اسم «سورا»، تُستخدَم لإنشاء مقاطع فيديو واقعية تصل مدّتها إلى دقيقة، بمجرّد إدخال طلب نصّي، وهو ابتكار كبير في مجال الذكاء الاصطناعي.

وأوضحت الشركة الناشئة المتحالفة مع «مايكروسوفت» أنّ هذه المنصّة الجديدة، المستندة إلى بحوث سابقة أُجريَت على برنامجي «دال – إي»، و«جي بي تي»، لا تزال قيد الاختبار، لكنّها عرضت مع ذلك بعض مقاطع الفيديو، وشرحت طريقة نشوئها.

وشرحت «أوبن إيه آي» على موقعها الإلكتروني أنّ البرنامج يستطيع إنشاء مقاطع فيديو تصل مدّتها إلى دقيقة، «مع الحفاظ على الجودة المرئية واحترام طلب المستخدم»، وفق ما نقلت عنها «وكالة الصحافة الفرنسية».

وأضافت أن في إمكان «سورا» إنشاء «مَشاهد معقّدة تضمّ شخصيات عدة، وأنواعاً محدّدة من الحركات، وتفاصيل دقيقة».

كذلك يتيح إنشاء فيديو من صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة، وفق «أوبن إيه آي»، التي أشار رئيسها سام ألتمان عبر «إكس» إلى أنها ستتيح استخدام الأداة الجديدة «لعدد محدود» من مبتكري المحتوى، في إطار مرحلة تجريبية، داعياً المستخدمين إلى تقديم مقترحات تتعلّق بإنشاء مقاطع فيديو، ما لبث بعد لحظات أن عرض أبرزها على المنصّة.

من بين هذه المقاطع، واحد يظهر فيها كلبان يتعاركان وسط الثلج في منطقة جبلية، ويُظهر فيديو آخر حيواناً وهمياً يطير، نصفه بطة ونصفه تنين، في مشهد رائع لغروب الشمس، وعلى ظهره حيوان قداد (هامستر) يرتدي ملابس رياضية.

وتشكّل أداة «سورا» أساساً لـ«برامج قادرة على فهم العالم الحقيقي ومحاكاته»، وفق الشركة الناشئة التي تأمل في أن تكون «خطوة مهمة في تحقيق الذكاء الاصطناعي العام»، وهو نظام شديد الاستقلالية تفوق قدراته ما يستطيعه البشر في معظم المهمّات المُربحة اقتصادياً.

ونبّهت «أوبن إيه آي» إلى أنّ ثمة «عيوباً» في «النموذج الحالي» للمنصّة، منها الالتباس بين اليسار واليمين، أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو.

وأوضحت أنّ شخصاً في الفيديو «قد يأكل جزءاً من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على تلك القطعة» في مشهد ثانٍ من المقطع، مؤكدة أنّ مسألة الأمن ستكون أساسية بشأن هذه الأداة، ومشيرة إلى أنها ستنظّم عمليات محاكاة لتحديد حدود المنصّة بشكل أفضل.

أضافت «أوبن إيه آي»: «سنعمل على إشراك صنّاع السياسات، والمعلّمين، والفنانين في مختلف أنحاء العالم لفهم مخاوفهم، وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة».

وسبق لمجموعات «ميتا»، و«غوغل»، و«رَنواي إيه آي»، أن عرضت نماذج عن تطبيقات مماثلة تُسمّى «text-to-video» (تحويل النصوص إلى مقاطع فيديو)، تسعى إلى ابتكارها.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى