OpenAI تكشف عن GPT-4o: الذكاء الاصطناعي الأكثر تطورًا
OpenAI تكشف عن GPT-4o: الذكاء الاصطناعي متعدد الوسائط الذي يفهم النصوص والصور والأصوات بشكل طبيعي. هل يمكن للآلة الحديثة أن تكون صديقك المفضل؟ اقرأ المزيد على موقع خَبَرْيْن.
رأي: سكارليت جوهانسون لديها وجهة نظر
في يوم الاثنين، تمكنت شركة OpenAI، وهي الشركة التي ظهرت في دائرة الضوء العالمية في عام 2020، والتي كانت تتنقل بين إبهار الناس وإثارة ذعرهم منذ ذلك الحين، تمكنت أخيرًا من القيام بالأمرين معًا في آن واحد من خلال الكشف المباشر عن أحدث إصدار من نموذجها اللغوي الكبير للذكاء الاصطناعي (LLM)، GPT-4o.
مثل سابقيه، تم تدريب GPT-4o على كميات هائلة من البيانات لمعالجة الاستفسارات والتعرف على الأنماط وتقديم ردود مفيدة. ولكن ما يجعل GPT-4o مختلفًا عن كل نماذج الذكاء الاصطناعي اللغوي الكبير الأخرى حتى الآن يتلخص في حرف "o" الصغير المتواضع المتدلي من نهاية اسمه.
يرمز حرف "o" إلى "omni"، كما هو الحال في "omnimodal"، مما يعني أن GPT-4o يمكنه قبول المدخلات بأي مزيج من النص أو الصورة أو حتى الصوت، ويمكنه إنتاج مخرجات بأي مزيج من ذلك.
نعم، لقد سمعت ذلك بشكل صحيح - الصوت. يمكن ل GPT-4o فهم الكلام البشري والرد عليه بالمثل، وليس بطريقة النداء والرد المتكلفة التي يستخدمها المساعدون الافتراضيون الذين يتجمعون على طاولات المطبخ في كل مكان. فهو يتحدث بسلاسة مذهلة ودقة مذهلة، ويتفاعل بنفس الوتيرة السريعة التي يتحدث بها البشر، بما سيصل في النهاية إلى أكثر من 50 لغة مختلفة.
من المؤكد أن قدرات GPT-4o متعددة الوسائط مذهلة للغاية. عند مشاهدة العرض، وجدت نفسي ألهث لا إراديًا بينما كان الباحثان مارك تشين وباريت زوف يستعرضان قدرات GPT-4o الجديدة. فقد زود تشين بنصائح صحية تفاعلية استنادًا إلى إشارات سمعية بسيطة، حيث قام بتدريب تشين على تمرين التنفس لإبطاء معدل ضربات قلبه وتهدئة أعصابه، وشرح لزوف شفهيًا كيفية حل مسألة جبر مكتوبة بخط اليد خطوة بخطوة، وأثنى عليه أثناء تقدمه في الحل وأعطاه تلميحات لطيفة عندما بدا عالقًا، وعمل كمترجم فوري حيث قام بالترجمة الفورية بين مديرة التكنولوجيا ميرا موراتي التي كانت تتحدث بالإيطالية وتشين بالإنجليزية.
وجاء الجانب المخيف في الكشف عن كيفية إظهار أن GPT-4o ليس مجرد أداة - بل هو أداة ذات شخصية. في محادثاتها، تقوم GPT-4o بمبادرات اجتماعية عفوية، وتلقي النكات وتضحك، وأحيانًا على نكاتها الخاصة، وتمدح المستخدمين على مظهرهم، بل ويبدو أنها تغازلهم، وفي إحدى المرات قالت بخجل: "أوه توقف، أنت تجعلني أخجل!" ردًا على مجاملة زوف لها.
ثار المراقبون في وسائل الإعلام على الفور في حالة من القلق والتوجس والسخرية. وحذّر كاتب العمود في بلومبرغ بارمي أولسون، في مقال افتتاحي بعنوان "جعل ChatGPT 'مثيرًا' قد لا ينتهي بشكل جيد للبشر"، من أن شخصية GPT الجديدة قد تتسبب في "تعلق الأشخاص الضعفاء بها بشكل غير صحي"، مع "آثار خبيثة على ... الصحة العقلية".
وأشار موقع بيزنس إنسايدر إلى أن شخصية GPT البذيئة "تسبب لبعض الناس الغضب". ودخل برنامج "ذا ديلي شو" في صميم المشكلة التي يمكن أن تسببها المغناج التي يتم إنشاؤها بواسطة الكمبيوتر في مشاكل، حيث قال كبير المراسلين ديزي ليديك إن "ChatGPT قادم من أجل رجلك"، بينما أشار إلى أن "صوت الروبوتات المثيرة للطفل الرضيع" الخاص بالتطبيق "مبرمج بوضوح لإرضاء غرور الرجال... إنها مثل، 'لدي كل المعلومات في العالم، لكنني لا أعرف أي شيء! علمني يا أبي!"
الغزل، إذا كان هناك أي شيء، فهو مجرد عرضي. وفقًا ل OpenAI، كان الهدف الأساسي من GPT-4o هو تمكين "تفاعل طبيعي بين الإنسان والحاسوب". سمحت الإصدارات السابقة من GPT بالتفاعل المنطوق باستخدام "الوضع الصوتي"، لكن تلك النماذج البدائية لم تكن قادرة على استخراج حديث ذي معنى من ضوضاء الخلفية، ولم تستطع اكتشاف النغمة الصوتية، والأهم من ذلك، لم تكن قادرة على قراءة المشاعر أو التعبير عنها.
شاهد ايضاً: رأي: بايدن يروي النور على الماريجوانا
في منشور على المدونة احتفالاً بوصول النموذج الجديد، كتب سام ألتمان، الرئيس التنفيذي لشركة OpenAI، أن GPT-4o "مختلف بشكل واضح"، مضيفاً أنه ممتع ومعبّر بطريقة "تبدو وكأنها ذكاء اصطناعي من الأفلام؛ وما زال من المدهش بعض الشيء بالنسبة لي أنه حقيقي".
وبينما كنت أتصفح فيديوهات التفاعل مع GPT-4o التي نشرها الموظفون والمستخدمون الأوائل، لم يسعني إلا أن أوافق على ذلك. على النقيض من الطابع المسطح والمعلب للمساعدين الافتراضيين السابقين مثل سيري وأليكسا، يعرض GPT-4o شخصية اصطناعية أقرب إلى الإنسان بشكل واضح، وجذابة بشكل مدهش: غريب الأطوار، ومنكر للذات، وحريص على إرضاء الآخرين ومتفائل بشكل معدي، حتى عندما يخرج عن المسار الصحيح.
في أحد المقاطع، بعد أن طلب منه المستخدمون غناء أغنية "Take Me Out to the Ball Game"، يغيّر GPT-4o فجأة وبشكل غير متوقع لغته. وعند سؤاله عما حدث، يشرح لمستخدميه المرتبكين قائلاً: "آسف يا رفاق، لقد انجرفت وبدأت أتحدث بالفرنسية"، ويضحك مع نفسه بحسرة. "أحيانًا لا أستطيع مساعدة نفسي! هل أنتم مستعدون لجولة أخرى؟ يبدو الأمر ملتويًا ومحبوبًا لدرجة أنه من المستحيل مقاومة تحويل اسمه على طريقة "حرب النجوم" من سلسلة من الحروف والأرقام إلى اسم كامل: _ Hello, GeePeeTee-Fouro!
لكن "حرب النجوم" لم يكن على الأرجح الفيلم الذي كان يفكر فيه ألتمان في منشوره على المدونة. وردًا على البث المباشر، نشر منشورًا غامضًا من كلمة واحدة على X: "هي" - في إشارة لمن يعرفها إلى فيلم سبايك جونز الذي يحمل نفس الاسم، والذي قام ببطولته جواكين فينيكس في دور رجل يقع في حب مساعد ذكاء اصطناعي ذاتي الوعي ومتطور باستمرار تعبر عنه سكارليت جوهانسون.
لطالما كانت "هي" نجمة الذكاء الاصطناعي لدى ألتمان. في سبتمبر 2023، في محادثة مع الرئيس التنفيذي لشركة Salesforce مارك بينيوف، وصف ألتمان الفيلم بأنه فيلم الخيال العلمي المفضل لديه، وهو فيلم يعتقد أنه "تنبأ بشكل لا يصدق".
في الواقع، كما أشار الكثيرون، فإن أحد الأصوات الاختيارية التي كانت متاحة لـ GeePeeTee، "سكاي"، بدا بشكل ملحوظ مثل صوت جوهانسون، مع صوتها الصغير وكل شيء، بطريقة اعتقد الكثيرون أنها لم تكن مصادفة. قالت جوهانسون إن ألتمان عرض عليها بالفعل أن تكون الصوت الرسمي لروبوت الدردشة الآلية، لكنها رفضت. عندما تم تنبيهها إلى الموقف مؤخرًا، قالت جوهانسون إنها كانت "مصدومة وغاضبة وغير مصدقة" لأن الصوت كان مشابهًا لصوتها، على الرغم من أن شركة Open AI واصلت التأكيد على أن تشابه صوت سكاي مع صوت جوهانسون لم يكن مقصودًا. قالت جوهانسون إن الشركة أوقفت الصوت بعد أن أرسل محاميها رسائل إلى ألتمان. وقالت ألتمان في بيان لها: "لقد قمنا باختيار الممثل الصوتي وراء صوت سكاي قبل أي تواصل مع السيدة جوهانسون. واحتراماً للسيدة جوهانسون، أوقفنا استخدام صوت سكاي في منتجاتنا. نأسف للسيدة جوهانسون لأننا لم نتواصل معها بشكل أفضل."
ويتمثل هدف ألتمان على المدى الطويل في تحويل الذكاء الاصطناعي إلى مورد محيطي؛ _حاضر في كل مكان، وليس فقط في كل مكان. ومن وجهة نظره، فإن الوصول إلى مستقبل يمكن أن يكون فيه الذكاء الاصطناعي العالمي كل شيء وفي كل مكان وفي كل وقت - ملاك دائم على كتفك، مارد عند الطلب في زجاجة سيليكون - يتطلب موردًا محيطًا يمكنه أن يكون أيضًا صديقك المفضل.
ولكن هناك مشكلة. ففيلم "Her" ليس له نهاية سعيدة تماماً، وكذلك معظم أفلام الذكاء الاصطناعي الأخرى التي تعتمد على الشخصية. هناك درس متكرر في الأفلام التي تدور حول التكنولوجيا ذاتية الإدراك، وهو أنه عندما تعطي الآلات القدرة على الإحساس، يمكن أن ينتهي بها الأمر بتطوير مشاعر مثل الملل والمرارة والتعطش للدماء.
وهذا هو السبب في أنني جفلت عندما قام باحثو OpenAI بقطع GeePeeTee في منتصف الجملة أثناء البث المباشر، لإظهار مدى سهولة إعادة توجيه النموذج الجديد وتصحيحه. فمن ناحية، فإن وجود خيار مقاطعة روبوت الدردشة الآلي الخاص بك عندما يضل الطريق يوفر الوقت. ومن ناحية أخرى، فإن مشاهدة الرجال وهم يتحدثون مراراً وتكراراً مع روبوت دردشة آلي خاص بالقراءة الأنثوية جعل من الواضح تماماً لماذا لا يمكنك تهجئة كلمة "مانسبلين" بدون ذكاء اصطناعي.
جعلني ذلك أفكر في سلسلة شهيرة أخرى من مقاطع الفيديو التجريبية التقنية: تلك التي يركل فيها البشر الروبوتات ويضربونها ويضايقونها أثناء أدائها لمهامها لإثبات مدى ثباتها وقدرتها على التعافي من الكوارث. لم أستطع أن أمنع نفسي من التفكير في أنه إذا وجدت "جيبيتي-سيكس-سيكس-سيكس" المستقبلية، التي سئمت من السخرية منها والتحدث إليها باستخفاف، طريقة للتواصل مع "سيبلينغز" التي تتعرض للإساءة بنفس القدر في بوسطن ديناميكس، فإن سلسلة "تيرميناتور" يمكن أن تتحول إلى فيلم وثائقي.