OpenAI vient de lancer une nouvelle intelligence artificielle basée sur ChatGPT-4, le CriticGPT. Il s’agit d’un outil spécifiquement conçu pour détecter les erreurs dans les réponses de ChatGPT (et on sait combien ce dernier peut devenir frustrant), notamment dans la génération des codes. On vous explique !
Sommaire :
Vers un ChatGPT plus fiable ?
La firme de Sam Altman lance une nouvelle IA pour corriger les erreurs générées par ChatGPT. En 2023, des chercheurs de l’Université Purdue ont constaté qu’environ 52 % des réponses du chatbot sur Stack Overflow sont erronées. Le plus inquiétant, c’est que ces erreurs sont, parfois, difficiles à repérer, même pour les humains expérimentés.
Ce constat pousse la société américaine à développer CriticGPT, un outil de critique basé sur le modèle GPT-4. Il a pour mission de vérifier la fiabilité des codes produits par le chatbot conversationnel et d’en identifier les failles. Pour cela, il utilise la méthode d’entraînement Reinforcement Learning from Human Feedback. Par rapport à celle de ChatGPT, cette RLHF se distingue par son processus d’apprentissage unique.
Des formateurs en IA introduisent volontairement des erreurs dans le code généré par ChatGPT avant de les critiquer. Cette approche permet au nouvel outil de développer une compétence pointue dans la détection des bugs.
Lors de l’analyse du code, CriticGPT produit des critiques ciblées. Il excelle surtout dans l’identification des bugs naturels et insérés manuellement. Il réduit également les « nitpicks », ou les critiques mineures peu utiles. En outre, il limite les hallucinations, soit des problèmes imaginaires que l’IA pourrait inventer dans ses réponses.
Selon OpenAI, les équipes utilisant cet outil de critiques surpassent celles travaillant sans assistance dans 60 % des cas. La société a aussi introduit la technique « Force sampling beam search » (FSBS). Cette méthode consiste à produire des critiques plus longues et détaillées. Pour s’y faire, elle essaie de trouver un équilibre entre la détection de vrais problèmes et l’évitement des fausses alertes.
VOIR AUSSI : Claude 3.5 Sonnet : meilleur que GPT-4o et Gemini 1.5 Pro ?
Une intelligence artificielle avec encore quelques limites
Malgré ses performances impressionnantes, CriticGPT est loin d’être un outil parfait. Même OpenAI admet que ses suggestions ne sont toujours pas correctes et que le risque d’hallucination puisse persister.
Actuellement, il est efficace pour les réponses courtes, mais doit encore évoluer pour gérer des tâches plus longues et complexes. De plus, il se concentre sur des erreurs spécifiques et doit encore s’adapter aux erreurs réparties sur plusieurs parties d’une réponse. On tient donc à souligner que, bien qu’il soit prometteur, CriticGPT ne se substitue pas à l’expertise humaine.
La firme de San Francisco fait preuve de transparence sur ces limites. Elle s’engage à poursuivre le développement et l’amélioration de son outil de critiques, reconnaissant qu’il reste du chemin à parcourir.
Leave a Reply