نموذج Stable Cascade: جيل جديد من الذكاء الإصطناعي يحوّل النص إلى صور

Stable Cascade

أطلقت شركة Stability AI مؤخرًا نموذج جديد من الذكاء الإصطناعي يُدعى “Stable Cascade” يزعم هذا النموذج أنه يُقدم  أداء أفضل ومزيد من الميزات مقارنةً بنموذجه السابق، “Stable Diffusion”، الذي يستخدم على نطاق واسع من قبل أدوات الذكاء الاصطناعي الأخرى لإنشاء الصور من النص.

ما هو “Stable Cascade” وكيف يعمل؟

“Stable Cascade” هو نموذج لتحويل النصوص إلى صور يمكنه: 

  1. إنتاج صور واقعية ومتنوعة من الجمل الطبيعية.
  2. أداء مهام تحرير الصور المختلفة، مثل زيادة دقة الصورة الحالية، أو تعديل جزء معين من الصورة، أو إنشاء صورة جديدة من حواف صورة أخرى.

على عكس “Stable Diffusion”، الذي يعتبر نموذج لغوي كبير واحد، فإن “Stable Cascade” يتكون من ثلاثة نماذج صغيرة تعمل معًا باستخدام بنية “Würstchen” الهيكلية. 

  • النموذج الأول: المرحلة “C”، بضغط النص المطلوب إلى رمز متقادم، وهو تمثيل مضغوط للصورة المرغوبة.
  • النموذج الثاني: المرحلة “A”, يقوم بفك تشفير الرمز المتقادم إلى صورة منخفضة الدقة. 
  • النموذج الثالث: المرحلة “B”, يقوم بتحسين الصورة منخفضة الدقة إلى صورة عالية الدقة.

ووفقًا لـ ” Stability AI، يمكن لـ “Stable Cascade” إنشاء صورة في حوالي 10 ثوانٍ، مقارنة بـ 22 ثانية لنموذج “SDXL”، الذي يعتبر أكبر نسخة من “Stable Diffusion”.

وعلاوة على ذلك، يعمل “Stable Cascade” على تحسين جودة وتنوع الصور المنشأة، حيث يمكنه مزامنة الصورة بشكل أفضل مع الجملة المطلوبة، وإنتاج المزيد من الاختلافات في نفس الصورة.

أين يمكنني العثور على “Stable Cascade” وماذا يمكنني فعله به؟

“Stable Cascade” متاح حاليًا على موقع “GitHub” لأغراض البحث فقط، وليس للاستخدام التجاري، كما قدمت “Stability AI” دفتر ملاحظات يوضح كيفية استخدام “Stable Cascade” لمهام إنشاء الصور وتحريرها المختلفة. يمكنك أيضًا استكشاف بعض الأمثلة على الصور التي تم إنشاؤها بواسطة “Stable Cascade” على موقعهم الإلكتروني.

أما من ناحية استخداماته وتطبيقاته، فيمكنك استخدام Stable Cascade في تطبيقات مختلفة، مثل: إنشاء المحتوى، والتصميم، والتعليم، والترفيه، وغيرها. على سبيل المثال، يمكنك استخدام “Stable Cascade” لإنشاء صور لشخصيات خيالية، أو مناظر طبيعية، أو حيوانات، أو شعارات، أو أي شيء آخر يمكنك وصفه بالنص.

يمكنك أيضًا استخدام “Stable Cascade” لتحسين أو تعديل الصور الحالية، مثل زيادة دقتها، أو تغيير أسلوبها، أو إضافة أو إزالة الكائنات، أو إنشاء صور جديدة من حوافها.

“Stability AI” ليست الشركة الوحيدة التي تعمل على نماذج تحويل النصوص إلى صور، حيث أصدرت شركات تكنولوجية أخرى مثل google و Apple نماذجها الخاصة، مثل ” DALL-E” و “iGPT”. تستخدم هذه النماذج أساليب وبنيات مختلفة، مثل المحولات والنماذج الذاتية التعليم، لإنشاء الصور من النص.

ومع ذلك، تمتلك “Stability AI” أيضًا الفرصة للتعاون مع الباحثين والمطورين الآخرين، والاستفادة من خبرتها في طريقة التشتت الثابتة، لإنشاء نماذج أكثر قوة وفائدة لإنشاء الصور وتحريرها.

تعليقات (0)

إغلاق
error: المحتوي محمي من النسخ...
whatsapp