Le 19 mai dernier, le Shoreline Amphitheatre de Mountain View a vibré au rythme d’une conférence Google I/O historique. En deux heures d’un keynote dense comptant une vingtaine d’annonces, le message de Sundar Pichai et de ses équipes a été limpide. L’intelligence artificielle n’est plus une simple fenêtre de discussion ou un gadget de démonstration. Google positionne l’IA comme la couche d’interface universelle entre l’utilisateur, ses outils professionnels et ses appareils.
Voici les résumés des principales annonces de ces deux jours de Google I/O.
Sommaire :
Gemini 3.5 et Gemini Omni : la nouvelle infrastructure de l’IA
Au cœur des annonces figure le lancement de la nouvelle génération de modèles. Gemini 3,5 Flash s’impose comme le nouveau moteur par défaut de l’écosystème. Il est spécifiquement conçu spécifiquement pour la vitesse d’exécution dans les flux de travail complexes et à long horizon. Ce nouveau Gemini surpasse le modèle 3.1 Pro sur les benchmarks de codage et d’exécution agentique (76,2 % sur Terminal-Bench 2.1).
En s’exécutant quatre fois plus vite que ses concurrents directs. Il est d’ores et déjà adopté en production par des géants comme Shopify ou Salesforce. Son grand frère, Gemini 3.5 Pro, axé sur le raisonnement lourd, arrivera en juin.
Parallèlement, Google a dévoilé Gemini Omni. Un modèle nativement multimodal capable de traiter et de fusionner le texte, l’image, l’audio et la vidéo. Plus qu’un outil multimédia, Omni se comporte comme une surface créative unifiée. Il propulse notamment Google Pics, une toute nouvelle application de conception graphique et de génération d’images intégrée à Workspace. Gemini Omni offre une approche extrêmement intuitive de la création et du montage vidéo grâce au langage naturel.
VOIR AUSSI : Googlebook : l’ambitieux projet de Google pour réinventer le PC portable qui sera infusé au Gemini
Antigravity 2.0 : l’outil de production des agents autonomes
La véritable rupture de cette édition réside dans le passage à l’échelle industrielle des agents. Google a présenté sa plateforme Antigravity 2.0, pivot complet vers l’IA capable d’agir en totale autonomie. Elle se décline en quatre surfaces :
- Une application de bureau pour orchestrer plusieurs agents en arrière-plan ;
- Une interface en ligne de commande (CLI) ;
- Un SDK complet ;
- Une version Enterprise connectée à Google Cloud.
Pour les développeurs, l’introduction des Managed Agents via l’API Gemini représente un réel bond. Un simple appel permet de provisionner un agent complet doté d’un environnement Linux isolé, d’une capacité de raisonnement et d’un état persistant entre les sessions. Pour stimuler cet écosystème, Google lance le hackathon Build with Gemini XPRIZE, doté de 2 millions de dollars. Le plus grand de son histoire.
VOIR AUSSI : Votre compte Google est-il sécurisé contre le piratage ? 5 réglages à vérifier
Search, Workspace et Android: l’IA comme interface globale
L’IA s’immisce désormais là où le travail se déroule déjà, transformant l’expérience utilisateur de fond en comble :
- Un mode Search très avancé : le moteur de recherche ne se contente plus de lister des liens. Il devient une surface de produit générée à la volée par l’IA, capable de créer des mises en page personnalisées et de gérer des agents d’information. Le shopping subit la même transformation avec l’Universal Cart. Un panier d’achat intelligent et partagé entre Search, YouTube et Gmail ;
- Workspace “Live”: la suite bureautique s’enrichit de Gmail Live pour fouiller ses courriels par conversation, et de Docs Live, qui transcrit et structure la voix en temps réel ;
- Android et Gemini Spark : sur mobile, l’application Gemini intègre Gemini Spark, un agent personnel basé sur le cloud capable d’accomplir des tâches complexes en arrière-plan. Sur le système, la fonctionnalité Android Halo fait remonter les informations agentiques directement dans la barre de statut.
Les lunettes Android XR et l’horizon AGI
Le volet matériel a été marqué par la présentation des premières lunettes audio de la gamme Android XR attendues pour l’automne. Un partenariat très attendu avec Samsung. Dépourvues d’écran, mais d’un design soigné (signé Gentle Monster et Warby Parker), elles intègrent :
- Une navigation vocale ;
- La traduction en direct ;
- La capture média, compatibles Android et iOS.
En clôture, Demis Hassabis, patron de Google DeepMind, a jeté un pavé dans la mare. Il affirme que l’AGI (Intelligence Artificielle Générale) n’était plus qu’à « quelques années seulement ». Une ambition soutenue par l’annonce du nouveau processeur TPU 8i et des travaux de DeepMind sur le projet Co-Scientist. Ce dernier étant un système multi-agents conçu pour accélérer la recherche scientifique en simulant le fonctionnement physique du monde.
VOIR AUSSI : Comment composer une musique avec Lyria 3 depuis Gemini ? Voici les conseils de Google
Le point de vigilance pour les entreprises
Si la perspective de voir débarquer des « employés numériques » autonomes séduit les PME pour leur productivité, ce virage soulève d’importantes questions de gouvernance. Les Managed Agents s’exécutant sur Google Cloud, les entreprises européennes devront analyser l’exposition de leurs données sensibles au Cloud Act américain. De plus, l’autonomie stricte de ces agents (sans validation humaine à chaque étape) impose une réflexion juridique rigoureuse. Surtout face aux exigences de l’AI Act, de NIS2 et de DORA.
La question qui se pose est : sommes-nous prêts à confier les clés de nos flux de travail à ces nouveaux « collègues virtuels » ? L’avenir nous le dira, et visiblement, cet avenir n’est qu’à quelques lignes de code.
IdealoGeek est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :






