أداة Whisk من جوجل تعيد تعريف الإبداع البصري
تعرّف على أداة "Whisk" الجديدة من جوجل، التي تتيح لك دمج الصور باستخدام الذكاء الاصطناعي دون الحاجة لنص. استكشف إبداعك بطريقة ممتعة وسريعة، وابتكر صوراً فريدة تعكس رؤيتك. اكتشف المزيد على خَبَرَيْن.
أداة الذكاء الاصطناعي الجديدة من جوجل تعتمد على الصور بدلاً من النصوص
تتيح أحدث أداة ذكاء اصطناعي من Google، "Whisk"، للأشخاص تحميل الصور للحصول على صورة مدمجة من إنتاج الذكاء الاصطناعي - حتى بدون أن يقوم المستخدمون بإدخال أي نص لشرح ما يريدونه.
يمكن للمستخدمين إدخال الصور التي تصور الموضوعات والإعدادات والأسلوب قبل أن يجمع Whisk كل شيء في صورة واحدة.
وقالت جوجل في منشور على مدونتها، إن Whisk "أداة إبداعية" للإلهام السريع، على عكس "محرر الصور التقليدي". من حيث الجوهر، تهدف Whisk إلى أن تكون ميزة ذكاء اصطناعي ممتعة، وليس كشيء من المفترض أن يكون عملًا احترافيًا مصقولًا.
شاهد ايضاً: لا توجد سيارة أمريكية بالكامل. لهذا السبب، قد تؤدي الرسوم الجمركية إلى ارتفاع أسعار جميع السيارات.
تتسابق شركات التكنولوجيا الكبرى مثل Google وOpenAI لإصدار منتجات استهلاكية يمكنها عرض استخدامات التكنولوجيا الجديدة الأنيقة، حتى مع تحذير الرافضين من أن عدم وجود حواجز حماية حول تطوير الذكاء الاصطناعي يشكل مخاطر على البشرية.
منذ أن أطلقت OpenAI في البداية أداة تحويل النص إلى صورة، Dall-E، في عام 2021، اجتاح مفهوم العمل الفني الذي يولده الذكاء الاصطناعي وسائل التواصل الاجتماعي وأصبح محور تركيز المنتجات الاستهلاكية. إن Whisk من Google عبارة عن أداة توليد من صورة إلى صورة، وهي تعتمد على المفهوم الشائع لمولدات تحويل النص إلى صورة.
يمكن للأشخاص الذين يستخدمون Whisk "إعادة مزج" الصورة النهائية من خلال تعديل مدخلاتهم ومزج الفئات لإنتاج صور مختلفة مثل لعبة أو دبوس أو ملصق. يمكن للمستخدمين إضافة نص إذا كانوا يرغبون في توجيه تفاصيل معينة، ولكن ليس مطلوبًا لإنشاء صورة.
وقال توماس إيلجيتش، مدير إدارة المنتجات في مختبرات Google، في بيان: "تم تصميم Whisk للسماح للمستخدمين بإعادة مزج موضوع ومشهد وأسلوب بطرق جديدة ومبتكرة، مما يوفر استكشافًا بصريًا سريعًا بدلاً من التعديلات المثالية بالبكسل".
تم بناء Whisk من Google على الذكاء الاصطناعي التوليدي الذي طوره DeepMind، مختبر الذكاء الاصطناعي الذي استحوذت عليه Google في عام 2014.
يعمل Whisk باستخدام عرض الذكاء الاصطناعي الأساسي من Google، وهو Gemini، الذي ظهر لأول مرة في ديسمبر 2023، وإقرانه مع Imagen 3، وهو أحدث مولد لتحويل النص إلى صورة الذي أصدرته شركة DeepMind في ديسمبر.
شاهد ايضاً: 7 طرق يمكن أن تؤثر بها إدارة ترامب على أموالك
عندما يقوم المستخدمون بتحميل صورهم، يقوم Gemini بإنشاء تعليق يتم إدخاله في Imagen 3. وتلتقط هذه العملية "جوهر" الموضوع بدلاً من نسخة طبق الأصل، مما يسمح بإعادة مزج الصورة النهائية ولكن يعني أيضاً أن المنتج النهائي قد يبتعد عن المطالبة.
على سبيل المثال، قد يكون للصورة التي تم إنشاؤها طول أو تسريحة شعر أو لون بشرة مختلف عن الصور الموجهة، حسبما ذكرت جوجل في منشور على المدونة.
عندما طرحت Google أداة تحويل النص إلى صورة لأول مرة في فبراير، واجهت الشركة رد فعل عنيف في البداية لأن الأداة أنتجت صورًا غير دقيقة تاريخيًا.
وقالت الشركة إن أداة Whisk متاحة لأول مرة كموقع إلكتروني على مختبرات جوجل للمستخدمين في الولايات المتحدة وهي في مراحلها الأولى من التطوير.
كما أصدرت OpenAI مؤخرًا أداة لتحويل النص إلى فيديو تسمى Sora، مما يسلط الضوء على المنافسة على المنتجات الاستهلاكية.
قال دان آيفز، المدير الإداري وكبير محللي الأسهم في Wedbush Securities، لشبكة CNN إن Whisk هي "لحظة استعراض عضلات" أخرى لـ Google في سباق الذكاء الاصطناعي والتكنولوجيا.
وقال إيفز: "DeepMind هو أحد الأصول الرئيسية لجوجل"، مشيرًا إلى أن منتجات الذكاء الاصطناعي هي جزء من "كنز" منتجات جوجل الجديدة لعام 2025، والتي تشمل أيضًا نظام تشغيل أندرويد الجديد الذي تم إنشاؤه بالتعاون مع سامسونج وكوالكوم.