Revue de Recherche
Gemma 4 : nouvelle génération de modèles open source de Google
Google lance Gemma 4, ses modèles IA open source les plus puissants à ce jour. Raisonnement avancé, multimodalité, 4 formats adaptés à chaque hardware : tout ce qu’il faut savoir.
Depuis quelques années, la bataille autour des modèles d’intelligence artificielle ouverts (dits « open source ») fait rage. D’un côté, des géants comme OpenAI ou Anthropic misent sur des modèles propriétaires. De l’autre, une mouvance croissante pousse à rendre l’IA accessible à tous, sans barrières. C’est dans ce contexte que Google DeepMind vient de lancer Gemma 4, sa quatrième génération de modèles ouverts.
We just released Gemma 4 — our most intelligent open models to date.
— Google (@Google) April 2, 2026
Built from the same world-class research as Gemini 3, Gemma 4 brings breakthrough intelligence directly to your own hardware for advanced reasoning and agentic workflows.
Released under a commercially… pic.twitter.com/W6Tvj9CuHW
Gemma 4, qu’est-ce que c’est exactement ?
Gemma 4 est une famille de modèles d’IA open source construits à partir des mêmes recherches et technologies que Gemini 3, le modèle phare de Google. Concrètement, cela signifie que Gemma 4 hérite de certaines des avancées les plus récentes de Google en matière d’IA. Toutefois, il librement téléchargeable et utilisable, y compris à des fins commerciales, grâce à une licence Apache 2.0.
L’objectif affiché est d’offrir un niveau d’intelligence maximal par rapport au nombre de paramètres utilisés. En d’autres termes, faire beaucoup avec peu de ressources. Sur le classement indépendant Arena AI, le modèle 31B de Gemma 4 se hisse à la troisième place mondiale des modèles open source, devançant des modèles jusqu’à 20 fois plus lourds.

Quatre tailles de modèles Gemma 4 pour tous les usages
C’est l’un des arguments les plus différenciants de Gemma 4, Google propose quatre variantes distinctes, pensées pour des environnements matériels très différents.
Les modèles E2B et E4B (pour « Effective 2B » et « Effective 4B ») sont conçus pour les appareils mobiles et les objets connectés. Ils tournent entièrement hors ligne, avec une latence quasi nulle, sur des smartphones, des Raspberry Pi ou des cartes embarquées. De plus, ils intègrent nativement le traitement de l’audio, des images et de la vidéo, idéal pour des applications grand public.

Les modèles 26B et 31B s’adressent aux développeurs et chercheurs qui travaillent sur des machines plus puissantes. Le 26B utilise une architecture dite « Mixture of Experts » (MoE). Il n’active qu’une partie de ses paramètres à la fois (environ 3,8 milliards sur 26), ce qui le rend très rapide. Le 31B, lui, est un modèle « dense » qui maximise la qualité des résultats et offre une base solide pour le fine-tuning (l’adaptation à des cas d’usage spécifiques).
Cette gamme en quatre tailles est stratégique, elle permet à chacun, étudiant, startup, grande entreprise de choisir le modèle adapté à son matériel et à ses besoins, sans être contraint d’investir dans une infrastructure coûteuse.
Capacités pensées pour les workflows agentiques avec Gemma 4
Au-delà de ses performances brutes, Gemma 4 introduit des fonctionnalités importantes pour les usages modernes de l’IA. Les quatre modèles supportent nativement des workflows agentiques. l’IA peut appeler des fonctions externes, produire des données structurées (JSON) et interagir avec d’autres outils ou APIs pour accomplir des tâches de façon autonome. C’est une évolution majeure par rapport aux simples chatbots.
Gemma 4 gère également de longs contextes, jusqu’à 256 000 tokens. Soit l’équivalent de centaines de pages de texte traités en une seule requête. Il est capable de comprendre et de générer du contenu dans plus de 140 langues, et excelle dans des tâches visuelles comme la lecture de graphiques ou la reconnaissance de texte dans des images.
Côté accessibilité, les modèles sont disponibles sur Hugging Face, Kaggle et Ollama, et compatibles avec les outils les plus populaires de l’écosystème (vLLM, LM Studio, Keras, etc.).
La famille Gemma 4 de Google, que retenir ?
Avec Gemma 4, Google envoie un signal fort à l’ensemble de la communauté IA, l’intelligence artificielle de pointe n’est plus réservée aux entreprises disposant d’infrastructures massives. En proposant quatre tailles adaptées à chaque contexte , du smartphone au serveur et en s’appuyant sur la technologie de Gemini 3, Gemma Google repositionne l’open source comme un levier crédible face aux modèles propriétaires.
[1] Gemma 4 : Octet par octet, les modèles ouverts les plus performants