Google a franchi une nouvelle étape dans la course à la génération d’images avec intelligence artificielle avec le lancement de Nano Banana 2, nom sous lequel est connu le modèle Gemini 3.1 Flash Image, conçu pour offrir des images fidèles avec une vitesse de réponse presque instantanée. L’entreprise promet ainsi d’éliminer le compromis traditionnel entre qualité et vitesse, apportant des capacités jusqu’ici réservées au Nano Banana Pro à un modèle beaucoup plus rapide et accessible.
Selon Google, Nano Banana 2 combine la connaissance avancée du monde, le raisonnement et la qualité visuelle de sa version Pro avec l’architecture haute vitesse de Gemini Flash, vous permettant de générer et d’éditer des images en quelques secondes et avec une résolution allant jusqu’à 4K. Cet équilibre entre détails et performances pointe directement vers les cas d’utilisation qui nécessitent une interaction en temps réel, des flux créatifs aux outils de productivité et de marketing.
Nouvelles
Parmi ses principales nouveautés se distingue une cohérence sans précédent dans l’industrie : le modèle est capable de conserver l’apparence de jusqu’à cinq personnages et la fidélité de jusqu’à 14 objets dans le même flux de travail, quelque chose spécialement conçu pour les storyboards, les récits visuels ou les campagnes où la continuité de la marque est essentielle. L’entreprise souligne également l’amélioration de l’éclairage, des textures et de la netteté, rapprochant le résultat d’une finition studio même dans des scénarios complexes.
Le texte devient un autre des grands axes du modèle. Nano Banana 2 peut générer un texte parfaitement lisible intégré à l’image – par exemple sur des cartes, des affiches ou des maquettes marketing – et également le traduire et le localiser directement dans la composition elle-même. Cela ouvre la porte à des flux créatifs où une même conception graphique peut être automatiquement adaptée à différentes langues et marchés sans quitter l’environnement visuel.
Connexion avec la réalité
Pour améliorer sa connexion à la réalité, le modèle s’appuie sur la base de connaissances du monde réel de Gemini et sur les informations en temps réel provenant de la recherche sur le Web, ce qui lui permet de représenter les sujets avec plus de précision et de faciliter la création d’infographies et de visualisations de données. De cette manière, les tâches telles que convertir des notes en diagrammes, générer des graphiques explicatifs ou illustrer des actualités avec des diagrammes visuels deviennent beaucoup plus directes.
La provenance du contenu généré est renforcée grâce à l’intégration de la technologie de filigrane SynthID et des informations d’identification C2PA, qui ajoutent des signaux invisibles et des métadonnées standardisées aux images. Avec cela, Google cherche à permettre aux utilisateurs de savoir non seulement si l’IA a été utilisée dans une image, mais aussi quel modèle est intervenu et dans quel contexte cela s’est produit.
Performance et public
En termes de performances, Nano Banana 2 fonctionne sur l’architecture Gemini 3.1 Flash Image, avec des temps de génération estimés entre 4 et 6 secondes pour des images de haute qualité, et avec des coûts qui pourraient être entre 30 et 50 % inférieurs à Nano Banana Pro, selon l’analyse de la communauté des développeurs. Ce rapport qualité-prix le positionne comme une option particulièrement attractive pour le e-commerce, les créateurs de contenu et les plateformes qui ont besoin de produire de gros volumes d’images.
Nano Banana 2 atteint un large public : il est intégré à l’application Gemini, à la recherche Google, à Google AI Studio, à Google Cloud, à Google Ads et à Flow, ce qui facilite son adoption par les utilisateurs finaux et son intégration dans des produits et services tiers via l’API.