يكمن الاختلاف الجوهري في DiffusionGemma في منهجه. فبينما تُولّد معظم نماذج الذكاء الاصطناعي النصوص كلمةً كلمة، كما لو كان شخص ما يكتب على آلة كاتبة، يقوم هذا النموذج الجديد بإنشاء وتنقيح كتل كاملة تصل إلى 256 رمزًا في آنٍ واحد.
يبدأ DiffusionGemma بعناصر نائبة عشوائية ويُحسّنها عبر خطوات متعددة، على غرار آلية عمل مولدات الصور القائمة على الانتشار.
يحتوي هذا النموذج على 26 مليار مُعامل، وهو مُرخص بموجب رخصة Apache 2.0، ولكنه لا يُفعّل سوى 3.8 مليار مُعامل أثناء التشغيل. وهذا يُتيح له العمل ضمن ذاكرة فيديو تبلغ حوالي 18 جيجابايت، مما يُمكّنه من العمل على وحدات معالجة الرسومات الاستهلاكية عالية الأداء.
ولتوضيح ذلك، يمكن أن تتجاوز سرعة المعالجة 1000 كلمة في الثانية على وحدة معالجة الرسومات NVIDIA H100، وتصل إلى حوالي 700 كلمة في الثانية على وحدة معالجة الرسومات NVIDIA GeForce RTX 5090. ويمكن للمستخدم الذي يمتلك جهازًا محمولًا مزودًا بأجهزة متوافقة، نظريًا، تشغيل مساعدي الذكاء الاصطناعي المحليين دون الاعتماد على الحوسبة السحابية.
تعاونت جوجل وإنفيديا بشكل وثيق لتحسين تقنية DiffusionGemma لأجهزة الكمبيوتر المكتبية ومحطات العمل وأنظمة DGX. وهذا يعني أن بإمكان كل من مُحبي أبل ومستخدمي سامسونج الاستفادة من مزاياها، شريطة امتلاكهم للأجهزة المناسبة.توصي الشركة بهذا النموذج لمهام مثل التحرير عبر الإنترنت، وملء الأكواد، والهياكل الرياضية، والتسلسلات البيولوجية، حيث يتيح نظام الانتباه ثنائي الاتجاه تصحيح الأخطاء فورًا.
مع ذلك، يُعطي DiffusionGemma الأولوية للسرعة على حساب الجودة المطلقة. بالنسبة للتطبيقات التي تتطلب أفضل النتائج الممكنة، تقترح جوجل استخدام النماذج القياسية من عائلة Gemma 4. النموذج متاح حاليًا للتنزيل من Hugging Face، ويمكن اختباره عبر واجهات برمجة تطبيقات NVIDIA أو تثبيته محليًا على أجهزة متوافقة. كما سيتم توفير الدعم الرسمي لملف llama.cpp قريبًا.



.jpg)