qu’est-ce que Gemini 2.0 Flash Thinking, l’IA qui allie réflexion et multimodalité

paultensor
Lecture en 3 min
À propos des liens affiliés : Sur ce site, certains liens sont affiliés. Cela signifie que si vous cliquez et effectuez un achat, je peux recevoir une petite commission, sans frais supplémentaires pour vous. Je m’engage à recommander uniquement des produits et services que j’ai testés ou qui reflètent des standards de qualité élevés. Ces contributions me permettent de maintenir ce site et de continuer à partager du contenu qui vous est utile. Merci pour votre confiance et votre soutien !

Google continue d’étoffer sa famille de modèles d’intelligence artificielle Gemini 2.0. À peine plus d’un an après le lancement très discutable de la première version de Gemini, Google suit le mouvement de ses concurrents et diversifie ses modèles.

La semaine dernière, GoogleGoogle a ouvert l’accès gratuitement à Gemini 2.0 Flash via l’applicationapplication et le chatbot sur le Web. Désormais, il sera aussi disponible pour les développeurs via l’API sur Google AI Studio et VertexVertex AI, ce qui signifie que l’intelligence artificielle (IA) pourra être directement intégrée dans des applications tierces. Toutefois, la plus grande nouveauté est l’arrivée de Gemini 2.0 FlashFlash Thinking, disponible gratuitement en version expérimentale dans l’application et l’accès Web au chatbot. Il s’agit d’une version de Gemini qui prend plus de temps pour réfléchir, comme OpenAI o3 ou DeepSeek-R1.

Le modèle de raisonnement Gemini 2.0 Flash Thinking a la particularité d’afficher sa chaîne de pensée (CoT), ce qui permet de suivre les étapes de raisonnement. Mais il se distingue surtout des modèles de raisonnement concurrents, car il est multimodal : il accepte en entrée les fichiers et images. Bien que ce soit aussi le cas d’OpenAI o3, ce dernier n’est pas vraiment multimodal. Il se contente d’utiliser la reconnaissance optique de caractères (OCR) pour extraire le texte des images. Le chatbot de Google les traite directement.

Gemini sort aussi en version allégée et en version pro

Google a aussi annoncé deux nouveaux modèles, Gemini 2.0 Flash-Lite et Gemini 2.0 Pro. La version Lite est un modèle plus léger, destiné aux développeurs. Comme elle consomme moins de ressources, elle coûtera moins cher à utiliser. La version Pro, à l’inverse, s’adresse à requêtes plus complexes, et selon Google, a des performances particulièrement élevées pour la génération de code de programmation. De plus, il est doté d’une fenêtrefenêtre de contexte de deux millions de jetonsjetons, soit le double du modèle de base Gemini 2.0 Flash. Cela équivaut à environ 3 000 pages.

Les deux IA sont disponibles pour les développeurs dans une version expérimentale sur les plateformes Google AI Studio et Vertex AI. La version Pro est aussi disponible dans l’application Gemini, mais uniquement pour les abonnés Gemini Advanced.

Partager cet article