Gemini 2.5 Computer Use est la nouvelle arme de Google dans le domaine de l’intelligence artificielle. Ce modèle d’IA, intégré à la famille Gemini, est capable de cliquer, faire défiler et saisir du texte dans un navigateur. Il permettrait aux agents IA de réaliser des actions concrètes sur le web, sans passer par une API. Quelle est encore cette nouveauté IA ?
Sommaire :
Gemini 2.5 Computer Use : un modèle d’IA qui agit dans le navigateur
Gemini 2.5 Computer Use marque une belle avancée dans la conception des agents intelligents. En effet, contrairement aux modèles qui se limitent à l’analyse de texte, il interagit directement avec les interfaces utilisateurs. Il peut remplir un formulaire, soumettre une requête ou même manipuler des éléments graphiques comme un menu déroulant.
Le modèle repose sur une boucle d’interaction continue. Il reçoit une capture d’écran de l’interface, analyse la situation, choisit une action à effectuer, puis réévalue le résultat avant de poursuivre.
Google précise que Gemini 2.5 Computer Use peut accomplir 13 actions différentes, comme cliquer, taper du texte ou déplacer des éléments.
Cette technologie est principalement conçue pour le web. Google admet d’ailleurs que le modèle n’est pas encore optimisé pour le contrôle d’un système d’exploitation complet, contrairement à certains concurrents.

VOIR AUSSI : Gemini prend place sur Google TV : une arrivée progressive sur les téléviseurs connectés
Une approche performante, mais encore incomplète
Selon les tests menés par Google et Browserbase, Gemini 2.5 Computer Use surpasse ses rivaux sur plusieurs benchmarks de navigation web et mobile. Dont les solutions d’OpenAI et d’Anthropic. Tout cela en maintenant une latence réduite. En outre, des partenaires comme Poke.com et Autotab ont même observé jusqu’à 50 % de rapidité supplémentaire dans certaines tâches.
Cependant, le modèle reste limité à un usage navigateur. Là où ChatGPT Agent ou Claude peuvent accéder à l’ensemble d’un environnement informatique, Gemini 2.5 Computer Use se restreint à l’espace web. Cette approche plus prudente garantit une meilleure sécurité, même si ce choix limite son champ d’application.
Avec Gemini 2.5 Computer Use, Google démontre sa volonté d’intégrer ses IA dans des environnements concrets. Heureusement, l’accent sur la sécurité et la précision n’est pas mis à l’écart.
IdealoGeek est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :






