Google continue d’étoffer sa famille de modèles d’intelligence artificielle Gemini 2.0. À peine plus d’un an après le lancement très discutable de la première version de Gemini, Google suit le mouvement de ses concurrents et diversifie ses modèles.
La semaine dernière, GoogleGoogle a ouvert l’accès gratuitement à Gemini 2.0 Flash via l’applicationapplication et le chatbot sur le Web. Désormais, il sera aussi disponible pour les développeurs via l’API sur Google AI Studio et VertexVertex AI, ce qui signifie que l’intelligence artificielle (IA) pourra être directement intégrée dans des applications tierces. Toutefois, la plus grande nouveauté est l’arrivée de Gemini 2.0 FlashFlash Thinking, disponible gratuitement en version expérimentale dans l’application et l’accès Web au chatbot. Il s’agit d’une version de Gemini qui prend plus de temps pour réfléchir, comme OpenAI o3 ou DeepSeek-R1.
Le modèle de raisonnement Gemini 2.0 Flash Thinking a la particularité d’afficher sa chaîne de pensée (CoT), ce qui permet de suivre les étapes de raisonnement. Mais il se distingue surtout des modèles de raisonnement concurrents, car il est multimodal : il accepte en entrée les fichiers et images. Bien que ce soit aussi le cas d’OpenAI o3, ce dernier n’est pas vraiment multimodal. Il se contente d’utiliser la reconnaissance optique de caractères (OCR) pour extraire le texte des images. Le chatbot de Google les traite directement.
Gemini sort aussi en version allégée et en version pro
Google a aussi annoncé deux nouveaux modèles, Gemini 2.0 Flash-Lite et Gemini 2.0 Pro. La version Lite est un modèle plus léger, destiné aux développeurs. Comme elle consomme moins de ressources, elle coûtera moins cher à utiliser. La version Pro, à l’inverse, s’adresse à requêtes plus complexes, et selon Google, a des performances particulièrement élevées pour la génération de code de programmation. De plus, il est doté d’une fenêtrefenêtre de contexte de deux millions de jetonsjetons, soit le double du modèle de base Gemini 2.0 Flash. Cela équivaut à environ 3 000 pages.
Les deux IA sont disponibles pour les développeurs dans une version expérimentale sur les plateformes Google AI Studio et Vertex AI. La version Pro est aussi disponible dans l’application Gemini, mais uniquement pour les abonnés Gemini Advanced.