CriticGPT d’OpenAI : quand une IA se permet de corriger une IA

OpenAI vient de lancer une nouvelle intelligence artificielle basée sur ChatGPT-4, le CriticGPT. Il s’agit d’un outil spécifiquement conçu pour détecter les erreurs dans les réponses de ChatGPT (et on sait combien ce dernier peut devenir frustrant), notamment dans la génération des codes. On vous explique !

Sommaire :

Vers un ChatGPT plus fiable ?

La firme de Sam Altman lance une nouvelle IA pour corriger les erreurs générées par ChatGPT. En 2023, des chercheurs de l’Université Purdue ont constaté qu’environ 52 % des réponses du chatbot sur Stack Overflow sont erronées. Le plus inquiétant, c’est que ces erreurs sont, parfois, difficiles à repérer, même pour les humains expérimentés.

Ce constat pousse la société américaine à développer CriticGPT, un outil de critique basé sur le modèle GPT-4. Il a pour mission de vérifier la fiabilité des codes produits par le chatbot conversationnel et d’en identifier les failles. Pour cela, il utilise la méthode d’entraînement Reinforcement Learning from Human Feedback. Par rapport à celle de ChatGPT, cette RLHF se distingue par son processus d’apprentissage unique.

Des formateurs en IA introduisent volontairement des erreurs dans le code généré par ChatGPT avant de les critiquer. Cette approche permet au nouvel outil de développer une compétence pointue dans la détection des bugs.

Lors de l’analyse du code, CriticGPT produit des critiques ciblées. Il excelle surtout dans l’identification des bugs naturels et insérés manuellement. Il réduit également les « nitpicks », ou les critiques mineures peu utiles. En outre, il limite les hallucinations, soit des problèmes imaginaires que l’IA pourrait inventer dans ses réponses.

Selon OpenAI, les équipes utilisant cet outil de critiques surpassent celles travaillant sans assistance dans 60 % des cas. La société a aussi introduit la technique « Force sampling beam search » (FSBS). Cette méthode consiste à produire des critiques plus longues et détaillées. Pour s’y faire, elle essaie de trouver un équilibre entre la détection de vrais problèmes et l’évitement des fausses alertes.

VOIR AUSSI : Claude 3.5 Sonnet : meilleur que GPT-4o et Gemini 1.5 Pro ?

Une intelligence artificielle avec encore quelques limites

Malgré ses performances impressionnantes, CriticGPT est loin d’être un outil parfait. Même OpenAI admet que ses suggestions ne sont toujours pas correctes et que le risque d’hallucination puisse persister.

Actuellement, il est efficace pour les réponses courtes, mais doit encore évoluer pour gérer des tâches plus longues et complexes. De plus, il se concentre sur des erreurs spécifiques et doit encore s’adapter aux erreurs réparties sur plusieurs parties d’une réponse. On tient donc à souligner que, bien qu’il soit prometteur, CriticGPT ne se substitue pas à l’expertise humaine.

La firme de San Francisco fait preuve de transparence sur ces limites. Elle s’engage à poursuivre le développement et l’amélioration de son outil de critiques, reconnaissant qu’il reste du chemin à parcourir.

Noter cet article

CriticGPT d’OpenAI : quand une IA se permet de corriger une IA

CriticGPT est une IA qui corrige les erreurs de ChatGPT. Comment cet outil peut-il améliorer ChatGPT ? Découvrons-le.

Vers un ChatGPT plus fiable ?

Une intelligence artificielle avec encore quelques limites

Gemini AI sur Android : Google offre un nouveau design sur l’appli

Samsung Galaxy S25 : l’abandon de l’Exynos et du Snapdragon ?

Google Gemini serait bientôt sur l’écran de verrouillage des smartphones Android ?

Xiaomi arrête la mise à jour pour ces 8 smartphones

Samsung arrête la mise à jour pour un de ses téléphones

Cette fonctionnalité décharge 4 fois plus vite votre batterie iPhone et Android

Setup gamer : 10 astuces pour organiser ton set up gaming

Faut-il mettre un antivirus sur son smartphone Android / iPhone ?

Ces trois smartphones sont en train d’être abandonnés par Samsung

Google va arrêter de prendre en charge ces Pixels