OpenAI vient de lancer une nouvelle intelligence artificielle basĂ©e sur ChatGPT-4, le CriticGPT. Il sâagit dâun outil spĂ©cifiquement conçu pour dĂ©tecter les erreurs dans les rĂ©ponses de ChatGPT (et on sait combien ce dernier peut devenir frustrant), notamment dans la gĂ©nĂ©ration des codes. On vous expliqueâ!
Sommaire :
Vers un ChatGPT plus fiableâ?
La firme de Sam Altman lance une nouvelle IA pour corriger les erreurs gĂ©nĂ©rĂ©es par ChatGPT. En 2023, des chercheurs de lâUniversitĂ© Purdue ont constatĂ© quâenviron 52 % des rĂ©ponses du chatbot sur Stack Overflow sont erronĂ©es. Le plus inquiĂ©tant, câest que ces erreurs sont, parfois, difficiles Ă repĂ©rer, mĂȘme pour les humains expĂ©rimentĂ©s.
Ce constat pousse la sociĂ©tĂ© amĂ©ricaine Ă dĂ©velopper CriticGPT, un outil de critique basĂ© sur le modĂšle GPT-4. Il a pour mission de vĂ©rifier la fiabilitĂ© des codes produits par le chatbot conversationnel et dâen identifier les failles. Pour cela, il utilise la mĂ©thode dâentraĂźnement Reinforcement Learning from Human Feedback. Par rapport Ă celle de ChatGPT, cette RLHF se distingue par son processus dâapprentissage unique.
Des formateurs en IA introduisent volontairement des erreurs dans le code généré par ChatGPT avant de les critiquer. Cette approche permet au nouvel outil de développer une compétence pointue dans la détection des bugs.
Lors de lâanalyse du code, CriticGPT produit des critiques ciblĂ©es. Il excelle surtout dans lâidentification des bugs naturels et insĂ©rĂ©s manuellement. Il rĂ©duit Ă©galement les «ânitpicksâ», ou les critiques mineures peu utiles. En outre, il limite les hallucinations, soit des problĂšmes imaginaires que lâIA pourrait inventer dans ses rĂ©ponses.
Selon OpenAI, les Ă©quipes utilisant cet outil de critiques surpassent celles travaillant sans assistance dans 60 % des cas. La sociĂ©tĂ© a aussi introduit la technique «âForce sampling beam searchâ» (FSBS). Cette mĂ©thode consiste Ă produire des critiques plus longues et dĂ©taillĂ©es. Pour sây faire, elle essaie de trouver un Ă©quilibre entre la dĂ©tection de vrais problĂšmes et lâĂ©vitement des fausses alertes.
VOIR AUSSI : Claude 3.5 Sonnet : meilleur que GPT-4o et Gemini 1.5 Proâ?Â
Une intelligence artificielle avec encore quelques limites
MalgrĂ© ses performances impressionnantes, CriticGPT est loin dâĂȘtre un outil parfait. MĂȘme OpenAI admet que ses suggestions ne sont toujours pas correctes et que le risque dâhallucination puisse persister.
Actuellement, il est efficace pour les rĂ©ponses courtes, mais doit encore Ă©voluer pour gĂ©rer des tĂąches plus longues et complexes. De plus, il se concentre sur des erreurs spĂ©cifiques et doit encore sâadapter aux erreurs rĂ©parties sur plusieurs parties dâune rĂ©ponse. On tient donc Ă souligner que, bien quâil soit prometteur, CriticGPT ne se substitue pas Ă lâexpertise humaine.
La firme de San Francisco fait preuve de transparence sur ces limites. Elle sâengage Ă poursuivre le dĂ©veloppement et lâamĂ©lioration de son outil de critiques, reconnaissant quâil reste du chemin Ă parcourir.
Leave a Reply