GPT-5 arrive dans quelques semaines : voici les nouveautés en vue

Plus de deux ans après la sortie de GPT-4 et de nombreuses mises à jour, OpenAI va sortir un tout nouveau modèle d’intelligence artificielle : GPT-5. C’est Sam Altman, PDG de l’entreprise, qui l’a lui-même annoncé dans un podcast. De nombreuses nouveautés sont annoncées. Elles vont étendre les capacités que l’on connaît déjà à la version actuelle. Cependant, GPT-5 ne devrait pas être une avancée majeure, contrairement au passage du 3.5 à 4. Pour le moment, l’entreprise entretient le flou, mais quelques nouveautés ont déjà fuité.

Sommaire :

Mémoire plus étendue

Il y a quelques semaines, ChatGPT avait été doté d’une mémoire étendue pour retenir les informations entre diverses conversations. Avec la sortie de GPT-5, les choses risquent d’être encore plus persistantes, car l’IA finirait de connaître son utilisateur et même anticiper certaines de ses questions.

Selon son co-créateur, cela va permettre à l’utilisateur de gagner du temps dans ses requêtes, puisque l’outil a déjà connaissance de ses préférences. « L’ordinateur connaît désormais suffisamment de choses sur moi et sur le reste de ma vie pour anticiper ce que je veux qu’il fasse, parfois même d’une manière à laquelle je n’aurais pas pensé moi-même. », a-t-il affirmé.

Raisonnement chain-of-thought

Ce que l’on traduit par “chaîne de pensée” ou encore raisonnement par étape est déjà perceptible naturellement chez Gemini 2.5. Il permet au modèle de mieux analyser la requête de l’utilisateur, la comprendre afin d’y répondre convenablement. OpenAI va en équiper GPT-5 et il en sera de même pour tous les modèles qui vont suivre.

De l’avis de Sam Altman, GPT 4.5 est le dernier modèle non chain-of-thought lancé par OpenAI. L’intégration d’une telle fonctionnalité va permettre de décupler la qualité des réponses du modèle. À cet effet, Sam affirme : « L’une des choses qui a vraiment enthousiasmé les gens au début des modèles GPT était qu’il était possible d’obtenir de meilleures performances en disant au modèle ‘réfléchissons étape par étape’. […] Les modèles de raisonnement vont encore plus loin ».

VOIR AUSSI : Risque de perdre son emploi ou sa vie privée : 5 choses à ne jamais dire à ChatGPT ou autres IA

Meilleures capacités multimodales

La multimodalité va atteindre un autre niveau avec l’arrivée de GPT-5. « Vous pourriez vouloir quelque chose qui soit beaucoup plus conscient de son environnement, qui s’inscrive beaucoup plus dans votre contexte de vie. Vous voudrez peut-être interagir avec lui autrement qu’en tapant et en regardant un écran ». Ceci annonce que de nouvelles capacités multimodales vont être ajoutées à ChatGPT ou que celles qu’il possède actuellement vont être grandement améliorées.

ChatGPT possède déjà l’audio, mais manque toujours l’option live vidéo de Gemini. On ignore encore si elle va arriver avec le GPT-5.

Orientation plus agentique

L’autre amélioration du nouveau modèle d’OpenAI est son orientation très agentique. Elle va permettre à ChatGPT d’interagir avec des environnements numériques et des interfaces logicielles. Cette dimension avait déjà posé ses pas avec l’arrivée d’Operator ajouté au modèle o3. Sa capacité agentique deviendra plus naturelle avec ce nouveau modèle et ce sera « un grand pas en avant ».

Des mots de Sam Altman lui-même, le déploiement de ce nouveau modèle ne sera pas une transition radicale. Les modèles atteignent un niveau un peu plus complexe et les mises sont devenues plus régulières.