Google appuyez sur l’accélérateur. Ce mercredi, le géant américain de la technologie a annoncé le lancement de Gémeauxvotre modèle de intelligence artificielle (IA) la plus puissante à ce jour.
Un modèle de langage est algorithme l’apprentissage profond qui est entraîné avec de grands volumes de données pour permettre aux machines de reconnaître, résumer, traduire et créer du texte, ainsi que des images, des vidéos, de l’audio ou du code informatique. En d’autres termes, c’est la technologie derrière les applications de IA générative comme le populaire ChatGPTalimenté par OpenAI et Microsoftet que Google veut renverser.
Gemini sera utilisé à partir de ce mercredi pour améliorer barde, l’assistant conversationnel de l’entreprise, une amélioration qui sera disponible en anglais dans plus de 170 pays et territoires. De plus, Google a l’intention d’accorder une licence à ses entreprises clientes afin qu’elles puissent intégrer cette IA dans leur propre ‘applications‘. Les développeurs Android peuvent également l’utiliser pour les appareils mobiles.
Gemini est conçu pour être multimodal, c’est-à-dire qu’il est capable de générer un clip vocal suite à une demande de texte ou d’analyser une image spécifique pour en extraire une description écrite.
Trois modèles
Créé en collaboration avec Esprit profond, filiale de recherche en IA de Google, Gemini aura trois tailles : Gemini Ultra, la plus puissante et développée pour les tâches « très complexes » ; Gemini Pro, qui fonctionnera pour une grande variété de tâches ; et Gemini Nano, opérationnel pour des tâches spécifiques sur les appareils. Ce dernier alimentera les tâches d’IA générative du téléphone mobile Google Pixel 8 Pro.
Gemini Ultra « est le premier modèle qui surpasse les experts humains dans la compréhension multitâche du langage, l’une des méthodes les plus populaires pour tester les connaissances et la capacité de résolution de problèmes des modèles d’IA », a déclaré la société dans un communiqué publié sur son site Web.
Pour l’instant, cette version Ultra sera testée par des experts pour éviter les erreurs et ne sera disponible au public qu’au début de l’année prochaine. Gemini Pro sera disponible pour les développeurs Google et les entreprises clientes à partir du 13 décembre.
L’intention de l’entreprise est qu’à partir de 2024, les capacités de Gemini serviront à alimenter tous les produits et services de Google, depuis son moteur de recherche jusqu’au navigateur Chrome ou aux publicités dont elle tire la majorité de ses revenus.
« Généraliser et comprendre »
Bien que les capacités du modèle annoncé aujourd’hui n’aient pas encore été testées, le PDG de Google, Sundar Pichai, a assuré qu' »il peut généraliser et comprendre sans problèmes » des matières complexes comme les mathématiques, la physique, le droit, la médecine, l’histoire et l’éthique. Gemini Pro surpasserait GPT-3.5le modèle de langage derrière ChatGPT, mais on ne sait pas s’il pourrait être assimilé à GPT-4le plus avancé d’OpenAI.
« C’est la première fois depuis la sortie de ChatGPT il y a un an que quelqu’un se rapproche du niveau d’OpenAi en matière d’intelligence artificielle », a déclaré l’analyste technologique Antonio Ortiz. Le neuroscientifique cognitif et expert en IA Gary Marcus aussi coïncide dans cette approche.
Google n’a pas précisé s’il envisageait de facturer aux utilisateurs l’utilisation de la version la plus avancée de Bard, son ChatGPT, et s’il envisageait de monétiser ce nouveau modèle d’IA. Il n’a pas non plus donné de détails sur la façon dont Gemini s’est entraîné.
Le géant américain, propriété de Alphabet, travaille chez Gemini depuis plusieurs mois. Son annonce a peut-être été en partie accélérée en raison de la pression exercée par des concurrents, d’OpenAI à Anthropiquequi ont donné ces dernières semaines plus de détails sur leurs produits les plus avancés.