CriticGPT d’OpenAI : quand une IA se permet de corriger une IA

CriticGPT est une IA qui corrige les erreurs de ChatGPT. Comment cet outil peut-il améliorer ChatGPT ? Découvrons-le.

openai-introduces-criticgpt-a-new-artificial-intelligence

OpenAI vient de lancer une nouvelle intelligence artificielle basĂ©e sur ChatGPT-4, le CriticGPT. Il s’agit d’un outil spĂ©cifiquement conçu pour dĂ©tecter les erreurs dans les rĂ©ponses de ChatGPT (et on sait combien ce dernier peut devenir frustrant), notamment dans la gĂ©nĂ©ration des codes. On vous explique !

Vers un ChatGPT plus fiable ? 

La firme de Sam Altman lance une nouvelle IA pour corriger les erreurs gĂ©nĂ©rĂ©es par ChatGPT. En 2023, des chercheurs de l’UniversitĂ© Purdue ont constatĂ© qu’environ 52 % des rĂ©ponses du chatbot sur Stack Overflow sont erronĂ©es. Le plus inquiĂ©tant, c’est que ces erreurs sont, parfois, difficiles Ă  repĂ©rer, mĂȘme pour les humains expĂ©rimentĂ©s.

Ce constat pousse la sociĂ©tĂ© amĂ©ricaine Ă  dĂ©velopper CriticGPT, un outil de critique basĂ© sur le modĂšle GPT-4. Il a pour mission de vĂ©rifier la fiabilitĂ© des codes produits par le chatbot conversationnel et d’en identifier les failles. Pour cela, il utilise la mĂ©thode d’entraĂźnement Reinforcement Learning from Human Feedback. Par rapport Ă  celle de ChatGPT, cette RLHF se distingue par son processus d’apprentissage unique.

Des formateurs en IA introduisent volontairement des erreurs dans le code généré par ChatGPT avant de les critiquer. Cette approche permet au nouvel outil de développer une compétence pointue dans la détection des bugs.

Lors de l’analyse du code, CriticGPT produit des critiques ciblĂ©es. Il excelle surtout dans l’identification des bugs naturels et insĂ©rĂ©s manuellement. Il rĂ©duit Ă©galement les « nitpicks », ou les critiques mineures peu utiles. En outre, il limite les hallucinations, soit des problĂšmes imaginaires que l’IA pourrait inventer dans ses rĂ©ponses.

Selon OpenAI, les Ă©quipes utilisant cet outil de critiques surpassent celles travaillant sans assistance dans 60 % des cas. La sociĂ©tĂ© a aussi introduit la technique « Force sampling beam search » (FSBS). Cette mĂ©thode consiste Ă  produire des critiques plus longues et dĂ©taillĂ©es. Pour s’y faire, elle essaie de trouver un Ă©quilibre entre la dĂ©tection de vrais problĂšmes et l’évitement des fausses alertes.

chatgpt-supprimer-historique (1)

VOIR AUSSI : Claude 3.5 Sonnet : meilleur que GPT-4o et Gemini 1.5 Pro ? 

Une intelligence artificielle avec encore quelques limites 

MalgrĂ© ses performances impressionnantes, CriticGPT est loin d’ĂȘtre un outil parfait. MĂȘme OpenAI admet que ses suggestions ne sont toujours pas correctes et que le risque d’hallucination puisse persister.

Actuellement, il est efficace pour les rĂ©ponses courtes, mais doit encore Ă©voluer pour gĂ©rer des tĂąches plus longues et complexes. De plus, il se concentre sur des erreurs spĂ©cifiques et doit encore s’adapter aux erreurs rĂ©parties sur plusieurs parties d’une rĂ©ponse. On tient donc Ă  souligner que, bien qu’il soit prometteur, CriticGPT ne se substitue pas Ă  l’expertise humaine.

La firme de San Francisco fait preuve de transparence sur ces limites. Elle s’engage Ă  poursuivre le dĂ©veloppement et l’amĂ©lioration de son outil de critiques, reconnaissant qu’il reste du chemin Ă  parcourir.

Noter cet article
Andy Rakotondrabe
Rédacteur pigiste spécialisé sur la thématique des NTIC. "L'ordinateur est né pour résoudre des problÚmes qui n'existaient pas auparavant." - Bill Gates