سورا توربو ثورة في عالم إنشاء الفيديوهات
اكتشف برنامج Sora Turbo الجديد من OpenAI، الذي يغير طريقة إنشاء مقاطع الفيديو بالذكاء الاصطناعي! ابدأ بكتابة مطالبات نصية لتحصل على فيديوهات عالية الجودة بسرعة. تعرف على إمكانياته وتحدياته في عالم السينما. خَبَرَيْن.
ما هو سورا توربو وهل يُعتبر نقطة تحول في مجال الذكاء الاصطناعي؟
يُحدث برنامج Sora، وهو برنامج لتوليد مقاطع الفيديو بالذكاء الاصطناعي (Sora)، الذي أنشأته شركة OpenAI الناشئة في عام 2021، ضجة كبيرة حيث خرج الآن من مرحلة البحث وتم إطلاقه رسميًا للجمهور تحت الاسم الجديد Sora Turbo.
وقد أثار إطلاق البرنامج ضجة كبيرة بين المستخدمين عبر الإنترنت، مما دفع الشركة إلى إيقاف إنشاء حسابات جديدة مؤقتًا بعد أن وجدت نفسها غارقة في سيل من الزيارات.
يستخدم Sora مطالبات نصية لإنشاء المحتوى، على غرار برامج إنشاء المحتوى الأخرى مثل ChatGPT. وعلى عكس برامج الذكاء الاصطناعي التقليدية التي تنتج ردوداً مكتوبة، ينشئ Sora مقاطع فيديو عالية الجودة بناءً على المدخلات النصية للمستخدم.
- سورا جيد بشكل مثير للاشمئزاز، gj @sama
- إضافته إلى @everartai في أسرع وقت ممكن حتى تتمكن من إضفاء الحيوية على صورك pic.twitter.com/wMehxOc8cm
- جاي أ (@jay _azhang) 9 ديسمبر 2024
شاهد ايضاً: نيو جلين: كيف تسعى شركة بلو أوريجن التابعة لجيف بيزوس لمنافسة سبيس إكس التابعة لإيلون ماسك
ووفقًا لبيان من OpenAI الذي رافق الإصدار في 9 ديسمبر، فإن برنامج Sora Turbo هو تحسين على برنامج Sora الأصلي حيث يتيح إنشاء مقاطع فيديو أسرع ومقاطع فيديو بجودة أعلى ومجموعة من ميزات تحرير الفيديو التي تمكن المستخدمين من قص وإنشاء تسلسلات فيديو، وتغيير عناصر في الفيديو مع الحفاظ على أجزاء أخرى من الفيديو.
فما هو برنامج Sora Turbo بالضبط وكيف يغير صناعة إنشاء الفيديو؟
كيف يعمل Sora Turbo؟
تكمن قوة سورا والعديد من مولدات الفيديو الأخرى التي تعمل بالذكاء الاصطناعي في قدرتها على محاكاة ما يمكن للبشر القيام به باستخدام معدات تصوير عالية الجودة ولكن في وقت قصير للغاية.
يمكن للمستخدمين إعطاء البرنامج مطالبات ليس فقط بشأن ما يجب تضمينه في الفيديو، ولكن أيضًا بشأن نوع الكاميرا التي يريدون استخدامها، واختيار العدسة، وإعداد الإضاءة، والجماليات البصرية، والتركيب والتركيب والقصص المصورة.
مثال على المطالبة باستخدام بعض هذه التفاصيل يمكن أن يكون على النحو التالي:
"استخدم عدسة تصوير عن بُعد متوسطة (85 مم) لالتقاط صورة شخصية حميمية لبائع متجول يعمل ليلاً. أضيء المشهد بمزيج من أضواء الكشك الدافئة المتوهجة الخاصة بالبائع وأضواء المدينة المحيطة الأكثر برودة في الخلفية. ركز على تفاصيل يدي البائع أثناء إعداده للطعام أو البضائع، مع موازنة الإطار مع وجهه المعبر. يجب أن تثير الصورة العمل الشاق والفخر بمهنتهم."
ما مدى جودة سورا توربو؟
ليست مثالية.
يقوم المستخدمون بكتابة مطالبة نصية حول نوع الفيديو الذي يرغبون في إنشائه ويقوم سورا بإنشاء الفيديو. هناك قيود في الإصدار الحالي. جودة الفيديو تصل إلى 1080 بكسل بمعدل 30 إطاراً في الثانية ويمكن أن تصل مدته إلى 20 ثانية فقط.
هذا مثال لفيديو سورا توربو من إيمي كوسانا، وهي فنانة وسائط متعددة والمغنية الرئيسية في فرقة ساتلايت يونغ، وهي فرقة موسيقية مستوحاة من موسيقى البوب اليابانية في الثمانينيات وموضوعات الخيال العلمي، باستخدام موضوعات من تاكينوكو زوكو، وهي فرقة أزياء من الثمانينيات. على الرغم من وجود حد أقصى مدته 20 ثانية، تتيح ميزة Sora Storyboard للمستخدمين تجميع عدة مقاطع فيديو تم إنشاؤها بالذكاء الاصطناعي معًا وترتيبها بالتتابع، كما هو موضح في الفيديو أدناه.
تظهر أخطاء واضحة أيضًا في بعض مقاطع الفيديو. على سبيل المثال، في مقطع الفيديو أعلاه، عند علامة 36 ثانية، يقوم أحد الراقصين بالالتفاف بزاوية 180 درجة حول الرقبة، وهو أمر غير ممكن بالطبع من الناحية البشرية، ويستمر في روتين الرقص. وقالت الشركة إنه سيتعين عليها العمل أكثر لحل مثل هذه الأخطاء.
وفي مثال لفيديو لامرأة تطبخ، نشره سام ألتمان، مؤسس شركة OpenAI، في فبراير/شباط، سيلاحظ المشاهدون أن الملعقة في يد المرأة اليمنى تختفي بعد توقفها عن الخلط.
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
- سام ألتمان (@sama) 15 فبراير 2024
كيف تم استقبال سورا توربو في الصناعة؟
يشعر بعض خبراء الصناعة والمخرجين المبدعين بالقلق بشأن الكيفية التي قد تعطل بها سورا صناعة السينما، وخاصة هوليوود.
في شهر مارس الماضي، قال أحد المديرين التنفيذيين في هوليوود للجزيرة شريطة عدم الكشف عن هويته: "لا أراه تهديدًا للإنتاج بقدر ما هو تهديد للطريقة التي يتم بها الإنتاج كما نعرفه حاليًا".
وأشار إلى التغييرات التي طرأت على الطريقة التي كانت تتم بها مرحلة ما بعد الإنتاج في الماضي - مثل عندما بدأ الناس في تحرير الفيديو على أجهزة الكمبيوتر المحمولة الشخصية بدلاً من الدفع لشركات ما بعد الإنتاج للقيام بهذا العمل.
وقال: "لقد تم القضاء على الكثير من الناس في هذا الانتقال، بينما استطاع آخرون فجأةً تحمّل تكاليف محرر مناسب دون النفقات العامة التي تتطلبها شركات ما بعد الإنتاج".
هل سورا هو مولد الفيديو الوحيد الذي يعمل بالذكاء الاصطناعي؟
لا، ليس كذلك. ينمو سوق مولدات الفيديو بالذكاء الاصطناعي كل يوم. ومع ذلك، فإن أحد الفوارق الواضحة بين سورا والمنافسين الآخرين، هو جودة الفيديو التي لا مثيل لها والواقعية التي يستطيع سورا إنتاجها.
وعلاوة على ذلك، يأتي الإصدار الجديد، Sora Turbo، مع مجموعة من ميزات تحرير الفيديو المتقدمة التي قد يجدها المستخدمون في Adobe Premiere Pro أو Final Cut Pro، وهما برنامجان شائعان جدًا لتحرير الفيديو يستخدمان في صناعة الأفلام والتلفزيون وإنشاء المحتوى عبر الإنترنت.
بالإضافة إلى ذلك، تحظى سورا بدعم مالي من شركة البرمجيات العملاقة مايكروسوفت. وقد استثمرت مايكروسوفت حتى الآن ما يقرب من 14 مليار دولار مع أحدث ضخ نقدي بقيمة 10 مليارات دولار في 23 يناير. ووفقًا لما ذكرته شبكة CNBC في أكتوبر، تمتلك OpenAI الآن خط ائتمان متجدد بقيمة 4 مليارات دولار، ليصل إجمالي السيولة لديها إلى أكثر من 10 مليارات دولار. هذا المبلغ من الاستثمار يوفر لـ Sora مستوى من الرافعة المالية لا يمتلكه العديد من المنافسين الآخرين.
ما هي مولدات الفيديو الأخرى المتاحة؟
هناك العديد من مولدات الفيديو الأخرى التي تعمل بالذكاء الاصطناعي من الدرجة الأولى، بما في ذلك:
Runway Gen 3
تأسست Runway في عام 2018 وجمعت الشركة تمويلاً إجمالياً قدره 237 مليون دولار أمريكي، ويقال إنها تجري محادثات مع شركة جنرال أتلانتيك لرأس المال الاستثماري لجمع 450 مليون دولار أمريكي في تمويل جديد، وفقاً لما ذكرته مجلة The Information، وهي مجلة تغطي صناعة التكنولوجيا وصناعة رأس المال الاستثماري. يمكن للنسخة المجانية من Runway Gen 3 إنشاء مقاطع فيديو مدتها 10 ثوانٍ بدقة 720 بكسل مع 30 إطارًا في الثانية. بالنسبة للمشتركين المدفوعين، يمكن ضبط مقاطع الفيديو على دقة 1440 بكسل أو 2160 بكسل.
وعلى غرار "سورا"، يمكنه إنشاء فيديو بناءً على مطالبة نصية ولكنه يميل بشكل كبير إلى منشئي وسائل التواصل الاجتماعي والمسوقين الذين يستخدمونه لإنشاء الإعلانات بسبب سرعته العالية وكفاءته في مشاريع الفيديو القصيرة.
أحد تحديات الفيديو الطويل الذي يتم إنشاؤه بالذكاء الاصطناعي هو الاتساق عبر مقاطع الفيديو المتعددة التي تم إنشاؤها. تتطلب مقاطع الفيديو الأطول تنقيحًا تفاعليًا سريعًا تفاعليًا لجعل جميع مقاطع الفيديو متشابهة.
كلينغ للذكاء الاصطناعي
Kling، التي تدعمها شركة Kuaishou، والمعروفة دوليًا باسم Kwai، هي شركة تكنولوجيا صينية كبرى مقرها في بكين، الصين. تم الكشف عن Kling في يونيو 2024، وهي تطرح نفسها كمنافس لمنصات مثل Sora التابعة لشركة OpenAI. تستطيع Kling إنشاء مقاطع فيديو تصل مدتها إلى دقيقتين بدقة 1080 بكسل بمعدل 30 إطاراً في الثانية.
ميني ماكس
MiniMax، وهي شركة صينية ناشئة للذكاء الاصطناعي مدعومة من مجموعة علي بابا القابضة، وهي شركة متعددة الجنسيات متخصصة في التجارة الإلكترونية وخدمات الإنترنت والخدمات التكنولوجية ومقرها الصين، وكانت آخر جولة تمويل لها بقيمة 600 مليون دولار في مارس. تأسست شركة MiniMax في عام 2021 على يد موظفين سابقين في شركة SenseTime، وهي شركة رائدة في مجال الذكاء الاصطناعي مقرها في شاتين، هونغ كونغ.
يمكن لـ Minimax إنشاء مقاطع فيديو مدتها ست ثوانٍ بدقة 720 بكسل و25 إطاراً في الثانية.