نعرض لكم زوارنا أهم وأحدث الأخبار فى المقال الاتي:
ما أداة “Whisk” الجديدة من جوجل وكيف تستخدمها لتوليد الصور دون أوامر نصية؟, اليوم الخميس 19 ديسمبر 2024 01:07 صباحاً
يُشكل إنشاء أمر نصي ووصف دقيق لتوليد صورة باستخدام الذكاء الاصطناعي تحديًا كبيرًا، إذ غالبًا ما تكون النتائج مخيبة للآمال وتتطلب تعديلات متكررة، ولكن مع أداة (Whisk) الجديدة من جوجل، أصبحت هذه العملية بسيطة للغاية، إذ تتيح لك هذه الأداة استخدام الصور بدلًا من النصوص التفصيلية للحصول على صور معدلة أو مُعاد تخيلها.
ولكن كيف تستخدم أداة (Whisk) الصور لتوليد صور جديدة، وكيف يمكنك استخدامها، وكيف ستفتح أفاقًا جديدة للإبداع الفني؟
كيف تعمل أداة (Whisk)؟
تُعدّ أداة (Whisk) هي أحدث أداة تجريبية في منصة (Labs.google)، وتستند في عملها إلى نموذجي الذكاء الاصطناعي (Gemini)، و (Imagen 3) من جوجل. ولكنها لا تقوم بنسخ الصور الأصلية، بل تستخلص العناصر الرئيسية منها لإنشاء الصورة الجديدة، ويشمل ذلك:
- الموضوع: العنصر الرئيسي في الصورة، مثل: الشخص أو الحيوان الأليف أو الكائن.
- المشهد: الخلفية أو المكان الذي يؤطر الموضوع، مثل: الشاطئ الهادئ أو المدينة الصاخبة.
- الأسلوب: النمط الفني الجمالي للصورة، مثل: الألوان المائية أو الرسوم المتحركة أو الأنماط المستقبلية.
ويبدأ العمل بتحليل نموذج (Gemini) للصور المُدخلة تلقائيًا، ولا يقتصر هذا التحليل على مجرد تعرّف العناصر الظاهرة في الصورة، بل يتعداه إلى فهم سياق الصورة وتفاصيلها الدقيقة، ثم ينشئ (Gemini) وصف نصي مفصل لكل صورة، ويهدف هذا الوصف إلى التقاط جوهر الصورة، أي العناصر والخصائص الرئيسية التي تميزها، بدلًا من مجرد تقديم نسخة طبق الأصل عنها، إذ يتضمن ذلك وصفًا دقيقًا للموضوع الرئيسي، والخلفية، والألوان، والإضاءة، وأي تفاصيل أخرى ذات صلة.
ثم تُستخدم الأوصاف النصية المفصلة كمدخلات لنموذج (Imagen 3) – وهو أحدث نموذج لتوليد الصور من جوجل – لتوجيه عملية توليد الصور، وبفضل هذه العملية، يصبح من السهل إعادة مزج العناصر المختلفة من الصور – التي تشمل: الموضوعات، والمشاهد، والأنماط – بطرق جديدة ومبتكرة، فعلى سبيل المثال، يُمكن دمج موضوع من صورة مع خلفية من صورة أخرى بأسلوب فني محدد من صورة ثالثة، مما ينتج صورة جديدة تمامًا تحمل مزيجًا فريدًا من هذه العناصر.
وتجدر الإشارة إلى أن هذه الأداة تركز في التقاط جوهر الصور المُدخلة وليس إنشاء نسخة طبق الأصل عنها. ويعني ذلك أن الهدف ليس إعادة إنتاج الصور الأصلية، بل فهم العناصر الرئيسية فيها واستخدامها كقاعدة لإنشاء صورة جديدة تعبر عن فكرة أو مفهوم معين.
كيف تستخدم هذه الأداة لتوليد صور إبداعية؟
- للبدء، توجه إلى الصفحة الرئيسية لأداة (Whisk) وسجل الدخول باستخدام حساب جوجل.
- بعد تسجيل الدخول، يمكنك اختيار قالب من ثلاثة قوالب أساسية لتوليد الصور، ولكل منها تأثير بصري مختلف، وتشمل:
- قالب الملصق (Sticker): ينتج هذا القالب صورًا مسطحة ثنائية الأبعاد، تشبه الملصقات الرقمية المُستخدمة في تطبيقات المراسلة، ويتميز هذا النمط ببساطته ووضوح عناصره.
- قالب (Enamel Pin): يضفي هذا القالب بعض العمق والبريق على الصورة، ويناسب هذا النمط الصور التي تريد إبراز تفاصيلها بشكل أنيق.
- قالب (Plushie): يحول هذا القالب الصورة إلى شكل ثلاثي الأبعاد يشبه الدمى، ويضفي هذا النمط لمسة مرحة على الصور.
- بشكل افتراضي، تحدد أداة (Whisk) تلقائيًا صورة للأسلوب بناءً على القالب الذي تختاره، ومع ذلك، ستتاح لك لاحقًا إمكانية تغيير هذا النمط يدويًا.
- اختر الصورة التي تريد استخدامها للموضوع، وهنا يمكنك اختيار صور من الصور التي توفرها الأداة لاستخدامها كمواضيع، أو تحميل أي صورة من جهازك لاستخدامها كموضوع، وتتيح لك هذه الميزة إدخال عناصر شخصية أو محددة في إبداعاتك.
- بعد اختيار الموضوع، يحلل نموذج (Gemini) الصور المُدخلة لتحديد النمط والموضوع بدقة ثم يجمعهما لإنشاء صورة جديدة.
- إذا لم تكن راضيًا عن النتيجة الأولية، يمكنك بسهولة تغيير صورة الموضوع ومعاودة الإنشاء للحصول على نتيجة مختلفة.
التحكم الإبداعي المتقدم (البدء من الصفر):
بالإضافة إلى الطريقة الافتراضية السابقة، توفر أداة (Whisk) خيار (البدء من الصفر) start from scratch، الذي يمنحك تحكمًا كاملًا في العملية الإبداعية.
وعند اختيار هذا الخيار، يُمكنك اتباع الخطوات التالية لتوليد الصور:
- اختر صورًا للموضوع والمشهد والأسلوب، إما عن طريق تحميل أي صور من جهازك، أو عن طريق كتابة مطالبات نصية تقليدية لوصف ما تريد ظهوره في الصورة، إذ إن هذا الخيار أيضًا متاح في الأداة مع أن تركيزها الأساسي في استخدام الصور كمدخلات.
- بمجرد تحديد جميع العناصر (الموضوع، المشهد، النمط)، اطلب من Whisk إنشاء الصورة الجديدة، وستعرض الأداة مجموعة من الصور المختلفة بناءً على التحديدات التي أدخلتها.
- يمكنك تحسين النتائج عن طريق الضغط على خيار (Refine) الظاهر في الزاوية العلوية اليسرى من الصورة الناتجة، ويتيح لك هذا الخيار تغيير الصور المستخدمة في إنشاء الصورة، أو تعديل المطالبات النصية.
- ولحفظ الصور وتنزيلها، ستجد جميع الصور التي أنشأتها محفوظة تلقائيًا في مكتبة (Whisk) الخاصة بك، ويمكنك من هناك حذف أي صور لا تريدها وتنزيل الصور التي تعجبك، ويُذكر أن جميع التنزيلات تُحفظ بتنسيق JPG، مما يتيح لك استخدامها بسهولة في تطبيقات وخدمات أخرى.
ما استخدامات أداة (Whisk) العملية؟
تتعدى استخدامات (Whisk) كونها مجرد أداة تجربة ممتعة، إذ تقدم إمكانيات واسعة في مجالات مختلفة، ومنها:
- التصميم الجرافيكي: يمكن للفنانين إنشاء نماذج أولية سريعة من خلال إدماج الإلهامات من صور مختلفة.
- التسويق: تتيح للعلامات التجارية إنشاء صور إعلانية فريدة من خلال دمج عناصر المنتجات مع أنماط حياة العملاء والمواضيع الإبداعية.
- إنشاء المحتوى: تتيح للمؤثرين والمدونين إنشاء صور جذابة وفريدة من نوعها.
تخيل إنشاء بطاقة تهنئة للعطلات بدمج صورة عائلية مع مشهد جبلي ثلجي ونمط بطاقة بريدية قديمة في ثوانٍ معدودة!
نظرة للمستقبل:
تحافظ أداة (Whisk) على توازن دقيق بين الإبداع والتحكم، فعلى عكس الأدوات التي تعتمد بنحو كبير على الخوارزميات المحددة سابقًا، تتيح لك أداة (Whisk) المشاركة الفعالة في تشكيل النتيجة، إذ يلبي مزيج المطالبات المرئية والنصية احتياجات كل من المبدعين الذين يعتمدون على الحدس وأولئك الذين يفضلون التخصيص التفصيلي.
ومع أن أداة (Whisk) لا تزال في مرحلة الاختبار، لكنها تسلط الضوء على التزام جوجل بتطوير الذكاء الاصطناعي التوليدي، فمع تطورها، يمكن أن تصبح أداة أساسية للفنانين والمصممين وكل من يتطلع إلى توسيع آفاقه الإبداعية، فمن خلال دمج التكنولوجيا مع الخيال، تقدم أداة (Whisk ) لمحة عن المستقبل لا يعرف فيه سرد القصص المرئية حدودًا.
نسخ الرابط تم نسخ الرابط
أخبار متعلقة :