جوجل تطلق "نانو بانانا برو".. جيل جديد من نماذج توليد الصور بدقة 4K
كشفت شركة "جوجل" عن إصدار محسن بالكامل من نموذجها المتخصص في توليد الصور، يحمل اسم "نانو بانانا برو"، وذلك بعد أيام قليلة فقط من إعلانها عن نموذجها اللغوي العملاق "جيميني 3".
ويأتي النموذج الجديد بقدرات متقدمة تعزز دقة المخرجات ومرونة التحكم، مع إضافة مهام تحرير احترافية والبحث المباشر عبر الإنترنت من داخل النموذج نفسه.
وبحسب تقرير نشره موقع تك كرانش، فقد صُمّم "نانو بانانا برو" ليستهدف المستخدمين المحترفين الذين يحتاجون إلى سيطرة أكبر على تفاصيل الصورة، بدءًا من زوايا الالتقاط والإضاءة وعمق المجال والتركيز، وصولاً إلى معالجة الألوان.
دقة أعلى ونصوص أوضح
يوفر النموذج قفزة كبيرة في جودة الصور، إذ بات بإمكانه إنتاج مخرجات بدقة 2K و4K مقارنة بالجيل السابق الذي كان يقتصر على دقة 1024×1024 بكسل.
كما تم تحسين قدرته على كتابة النصوص داخل الصور بدقة أكبر وبخطوط وأنماط ولغات متعددة.
ويستطيع النموذج دمج ما يصل إلى 14 عنصرًا بصريًا في الصورة الواحدة، واستخدام 6 صور مرجعية عالية الجودة، إضافة إلى الحفاظ على ملامح خمسة أشخاص في المخرجات. لكن هذه التطورات تأتي مع تكلفة مالية أعلى وسرعة إنتاج أقل بفعل حجم المعالجة.
ففي حين كانت تكلفة توليد صورة واحدة في النسخة السابقة تبلغ 0.039 دولار، ارتفع السعر في النسخة الجديدة إلى 0.139 دولار للصورة بدقة 1080p أو 2K، وإلى 0.24 دولار للصورة بدقة 4K.
دمج تدريجي في منظومة "جوجل"
بدأت "جوجل" بالفعل بطرح "نانو بانانا برو" ضمن مجموعة واسعة من خدماتها:
اعتماد النموذج بشكل افتراضي داخل تطبيق جيميني، مع وضع حدود معينة للاستخدام المجاني.
منح مشتركي Google AI Plus وPro وUltra سقف استخدام أعلى، وتفعيله في Notebook LM.
إتاحته في وضع الذكاء الاصطناعي داخل البحث لمشتركي Pro وUltra داخل الولايات المتحدة.
دمجه في Flow لإنتاج الفيديو، إضافة إلى Slides و Vids لعملاء Workspace.
توفيره للمطورين عبر Gemini API وAI Studio وبيئة التطوير الجديدة Antigravity.
بهذه التحديثات، تضع "جوجل" نموذجها الجديد في موقع تنافسي قوي ضمن سوق نماذج توليد الصور، مع التركيز على المحترفين الذين يبحثون عن مخرجات عالية الجودة وتحكم دقيق في التفاصيل.



