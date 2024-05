Alors que beaucoup de passionnés attendaient les annonces du Google I/O 2024, OpenAI a pris de l’avance en dévoilant, GPT-4o, la veille de l’évènement. Ce modèle multimodal peut entretenir une conversation avec une voix naturelle. Il parvient même à commenter des images en temps réel. Pour démontrer sa force par rapport à son rival, Google a fait des annonces saisissantes lors de son keynote du 14 mai 2024. Apparemment, le géant des moteurs de recherche veut nous prouver qu’il reste un acteur incontournable dans la course à l’IA générative avec le Google Gemini améliorée.

Google Gemini, quelles sont ses nouvelles fonctionnalités ?

Comme chaque année, depuis plus de 15 ans maintenant, la firme de Mountain View présente les dernières nouveautés de ses services. Pour l’édition 2024, l’intelligence artificielle a complètement envahi et dominé l’ensemble de la présentation. Sans surprise, les visiteurs et les participants ont droit aux dernières nouveautés de Gemini, l’IA conversationnelle de Google.

Parmi les annonces phares, on trouve les versions améliorées du chatbot. Gemini 1.5 Pro utilise désormais une architecture « Mixture of Experts ». il peut traiter jusqu’à 1 million de tokens de contexte. Cela élargit beaucoup sa fenêtre d’analyse par rapport aux 128 000 tokens de GPT-4. Sundar Pichai, le PDG du groupe Alphabet, soit la maison mère de Google, a aussi présenté Gemini 1.5 Flash.

Il s’agit d’une version plus légère et optimisée pour des tâches à basse latence, tout en assurant des réponses ultrarapides. Les démonstrations laissent voir que Gemini peut fournir des analyses détaillées à partir de documents volumineux, d’heures de vidéo. Le chatbot Google peut même étudier un code informatique complexe. Gemini Advanced est proposé dans le cadre de l’offre premium Google One AI. Cette version débloque des capacités avancées comme l’analyse de données et la personnalisation.

Google Gemini remplacera progressivement l’Assistant Google sur Android et peut-être bientôt sur iOS. Une situation qui va mettre Apple dans une position délicate. En fait, la marque à la pomme pourrait intégrer ChatGPT dans la prochaine mouture de son système d’exploitation. Sauf si elle parvient à développer son propre modèle de langage.

Projet Astra, la réponse de Google pour faire face à GPT-4o ?

Le clou du spectacle du keynote Google I/O 2024 fut la présentation du projet Astra. DeepMind le décrit comme le « futur des assistants IA » de Google. L’Astra vise à créer une intelligence artificielle générale et multimodale, pouvant interagir de manière naturelle avec son environnement.

Ce projet est alimenté par l’intelligence artificielle Google Gemini. Il se présente sous la forme d’une application Android offrant une interaction vocale et visuelle en temps réel. Dans une démonstration, on a pu voir Astra répondre instantanément à des questions qu’on lui pose pendant qu’il analyse son environnement. Pour l’analyse, le chatbot utilise juste l’appareil photo du smartphone sur lequel le compte est connecté.

Cette démonstration rappelle celle de GPT-4o d’OpenAI dévoilée le 13 mai 2024. Malgré une voix de synthèse légèrement moins naturelle, on peut dire qu’Astra reste un sérieux rival d’OpenAI. De plus, il bénéficie des capacités multimodales avancées développées par DeepMind. Cette dernière étant spécialisée dans l’intelligence artificielle.

Pour l’instant, Astra est un prototype. La firme de Mountain View prévoit d’intégrer certaines de ses fonctionnalités dans l’application Gemini cette année même. Google doit encore réduire le temps de réponse pour permettre une conversation vraiment naturelle avec son utilisateur. OpenAI revendiquerait cette prouesse avec son nouveau modèle GPT-4o.

En outre, le géant américain de la technologie envisage d’intégrer Astra à des lunettes de réalité augmentée. Cela pourrait réinventer l’expérience des Google Glass abandonnées il y a quelques années. Son objectif est d’offrir un assistant IA visuel omniprésent, capable de commenter l’environnement de l’utilisateur et de l’assister dans diverses tâches.

Voici les autres nouveautés présentées lors du Google I/O 2024

Le Google I/O 2024 a été l’occasion pour la firme de Mountain View de dévoiler de nombreuses nouveautés liées à l’IA. Parmi ceux-ci, on peut citer :

La nouvelle version du système d’exploitation mobile Android 15 accueillera Gemini Nano. C’est une version locale et respectueuse de la vie privée. Elle permettra même à Gemini de détecter les tentatives d’arnaques lors des appels téléphoniques.

L’IA Overviews sera intégrée directement au moteur de recherche Google. Cette fonctionnalité basée sur Gemini générera des résumés organisés à partir des résultats. Cela relèguera alors les sites web classiques au second plan.

Dans Google Photos, avec l’outil « Ask Photos », il sera possible de demander à Gemini de retrouver des souvenirs spécifiques parmi vos images. Vous pouvez par exemple taper : « Montre-moi les photos de mon fils » et l’intelligence artificielle va le faire.

Dans Google Workspace, les applications de productivité de Google comme Gmail et Google Meet bénéficieront d’une intégration de Google Gemini. Ils pourront, entre autres, faire la synthèse automatique de vos e-mails ou de vos réunions.

Le modèle d’IA dédié à la création d’images, Imagen, passe à la version 3 avec une meilleure compréhension du langage. Google a également dévoilé Veo, un nouvel outil de génération de vidéos à haute résolution à partir de textes, d’images et des vidéos existantes. Celui-ci vient rivaliser avec Sora d’OpenAi.

Les Gems sont semblables au GPT Store d’OpenAI. Ces assistants virtuels personnalisables permettront aux utilisateurs de Gemini de modeler l’IA selon leurs besoins spécifiques.

L’offre Google One AI Premium en France

Pour accompagner le déploiement de son modèle LLM, Google a annoncé le lancement de son offre Google One AI Premium en France. Elle sera proposée à partir de 21,99 euros par mois. Avec cet abonnement, les utilisateurs auront accès à la version Gemini 1.5 Pro. Ils bénéficieront également de 2 To de stockage cloud et d’autres services Google. Cette offre n’est autre qu’une réponse directe à GPT Plus lancé par OpenAI pour accéder à ChatGPT en version premium.