تتلقى أدوات الذكاء الاصطناعي التوليدية من Google بعض التعزيزات التي عرضتها الشركة في Google I/O. بدءًا من هذا الأسبوع، تطرح الشركة الإصدار التالي من مولد الصور Imagen، والذي يعيد تقديم القدرة على توليد أشخاص بالذكاء الاصطناعي (بعد جدال محرج في وقت سابق من هذا العام). يضيف روبوت الدردشة Gemini من Google أيضًا Gems، وهي طريقة الشركة في التعامل مع الروبوتات ذات التعليمات المخصصة، على غرار GPTs المخصصة من ChatGPT.
Imagen 3 من Google هو الإصدار المُحدّث من مولد الصور الخاص بها، والذي سيأتي إلى Gemini. تقول الشركة إن نموذج الذكاء الاصطناعي من الجيل التالي “يضع معيارًا جديدًا لجودة الصورة” وتم بناؤه بحواجز وقائية لتجنب الإفراط في التصحيح من أجل التنوع، مثل صور الذكاء الاصطناعي التاريخية الغريبة التي انتشرت على نطاق واسع في وقت مبكر من هذا العام.
كتب مدير منتجات جيميني ديف سيترون في بيان صحفي: “عبر مجموعة واسعة من المعايير، يعمل Imagen 3 بشكل إيجابي مقارنة بنماذج توليد الصور الأخرى المتاحة”. تتيح لك الأداة توجيه توليد الصورة بمطالبات إضافية إذا لم يعجبك ما يخرج في المرة الأولى.
يقول سيترون إن Imagen 3 يعمل “بشكل إيجابي” مقارنة بالمنافسة. كما يتضمن أداة SynthID من Google لوضع علامة مائية على الصور، مما يوضح أنها مصنوعة بواسطة الذكاء الاصطناعي وليست المقالة الأصلية.
يقول سيترون إن القدرة على توليد الأشخاص ستعود في الأيام القادمة للمستخدمين المدفوعين، بعد أشهر من سحب Google للميزة. ويقول إن الحواجز الجديدة ستمنع توليد “أفراد واقعيين يمكن التعرف عليهم” – وهو أمر بعيد كل البعد عن التزييف العميق الإشكالي الذي تم إنشاؤه بواسطة Grok من Elon Musk. كما أن الأطفال محظورون أيضًا (كما هو الحال مع مولدات الصور الأخرى) وأي مشاهد دموية أو عنيفة أو جنسية. ويؤكد مدير المنتج التوقعات بقوله إن صور Gemini لن تكون مثالية، لكنه يعد بأن الشركة ستستمر في الاستماع إلى تعليقات المستخدمين وتحسينها وفقًا لذلك.
بدءًا من هذا الأسبوع، سيكون طراز Imagen 3 متاحًا لجميع المستخدمين، ولكن إعادة تقديم الصور التي تضم أشخاصًا ستبدأ بالمستخدمين المدفوعين. يمكن لمستخدمي Gemini Advanced وBusiness وEnterprise الناطقين باللغة الإنجليزية توقع عودة إنشاء الصور البشرية “خلال الأيام القادمة”.
تم عرض Gems في البداية في Google I/O 2024، وهي روبوتات دردشة مخصصة من Google مع تعليمات من إنشاء المستخدم. إنها في الأساس إجابة Gemini على GPTs من OpenAI، والتي طرحها منافس Google في أواخر العام الماضي. تبدأ Gems في الطرح في الأيام القليلة القادمة.
“باستخدام Gems، يمكنك إنشاء فريق من الخبراء لمساعدتك في التفكير في مشروع صعب، أو تبادل الأفكار حول حدث قادم، أو كتابة تعليق مثالي لمنشور على وسائل التواصل الاجتماعي”، كما كتب Citron. “يمكن لـ Gem الخاص بك أيضًا تذكر مجموعة مفصلة من التعليمات لمساعدتك في توفير الوقت في المهام المملة أو المتكررة أو الصعبة.”
بالإضافة إلى اللوحة الفارغة من Gems المخصصة، سيتضمن Gemini أحجارًا معدة مسبقًا “لمساعدتك في البدء” وإلهام أفكار جديدة. تتضمن Gems المعدة مسبقًا:
مدرب التعلم – لمساعدتك على فهم الموضوعات المعقدة
Brainstormer – لإلهام أفكار جديدة
دليل المهنة – يرشدك خلال ترقيات المهارات والقرارات والأهداف
محرر الكتابة – يقدم ملاحظات بناءة حول القواعد النحوية والأسلوب والبنية
شريك الترميز – ترقية مهارات الترميز للمطورين وإلهام مشاريع جديدة
بدأت Gems في الظهور اليوم على سطح المكتب والجوال. ومع ذلك، فهي متاحة فقط لمشتركي Gemini Advanced وBusiness وEnterprise، لذا ستحتاج إلى خطة مدفوعة للتحقق منها.