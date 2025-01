OpenAI vient encore de franchir un cap décisif dans l’intelligence artificielle. Grâce à son nouveau modèle o3, il a réussi une percée spectaculaire en obtenant un score de 75,7 % sur le benchmark ARC-AGI-1. Il enregistre même 87,5 % avec une configuration haute puissance. Cette avancée marque un tournant pour le raisonnement automatisé, presque humain. Elle ouvre la voie à des modèles capables d’adaptation inédite. Décryptez les implications de cette évolution majeure. ChatGpt c’est bien, mais le o3 l’est encore plus, et à l’exponentiel.

Une avancée majeure dans l’IA grâce au benchmark ARC-AGI

Le benchmark ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) est une référence dans la recherche en IA. Conçu en 2019 par François Chollet, il teste la capacité d’un modèle à résoudre des problèmes abstraits nécessitant logique, adaptation et déduction. Pendant plusieurs années, aucun modèle n’a pu dépasser 5 % de réussite, même avec GPT-4o en 2024.

Toutefois, fin 2024, avec o3, OpenAI change la donne. Ce modèle a atteint 75,7 % dans des conditions normales et 87,5 % avec une puissance de calcul 172 fois supérieure. Cette incroyable amélioration remet en question toutes les intuitions sur les capacités des IA actuelles. Contrairement aux systèmes classiques, cette nouvelle génération ne se contente pas d’analyser des données existantes. Elle démontre une véritable capacité d’adaptation et de raisonnement humain.

La percée pose également les bases des futures évaluations en IA. En 2025, le benchmark ARC-AGI-2 sera lancé aux côtés de l’ARC Prize, avec un objectif clair. Pousser l’IA encore plus loin en cherchant une solution open source haute efficacité capable d’atteindre 85 % de réussite. En effet, ce n’est pas encore accessible au grand public en raison des ressources de calcul colossales qu’ils nécessitent.

Source : Arcprize.org

Les implications concrètes du nouveau modèle d’OpenAI

Le succès d’OpenAI et l’ARC-AGI ne signifie pas que l’AGI sera disponible demain. Néanmoins, il indique que nous nous en approchons plus vite que prévu. Plusieurs applications majeures pourraient émerger :

Des assistants virtuels véritablement intelligents : ces modèles comprendraient des requêtes complexes et s’adapteraient aux besoins des utilisateurs sans entraînement spécifique.

: ces modèles comprendraient des requêtes complexes et s’adapteraient aux besoins des utilisateurs sans entraînement spécifique. Une démocratisation du codage : grâce à un raisonnement avancé, tout le monde pourrait programmer en fournissant simplement quelques exemples d’entrée/sortie.

: grâce à un raisonnement avancé, tout le monde pourrait programmer en fournissant simplement quelques exemples d’entrée/sortie. Des avancées en santé : l’IA pourrait détecter des maladies précocement et proposer des traitements adaptés en temps réel.

: l’IA pourrait détecter des maladies précocement et proposer des traitements adaptés en temps réel. Une éducation sur mesure : imaginez un tuteur IA qui adapte ses méthodes d’enseignement à chaque élève, rendant l’apprentissage plus efficace.

Cependant, cette évolution pose aussi des défis. Comme mentionné, l’énorme puissance de calcul nécessaire rend ces modèles impraticables pour le grand public. Leur contrôle par des entreprises privées pourrait accentuer les inégalités. À l’inverse, si des modèles open source atteignent 85 % de réussite, une adoption plus large et équitable pourrait devenir possible.

Si 2024 a marqué l’essor des petits LLM. 2025 s’annonce comme l’année des « modèles raisonnants ». En effet, nous pouvons aussi mentionner le « R1 » de DeepSeek, le QwQ d’Alibaba, le Phi-4 de Microsoft et le « Gemini 2.0 Flash Thinking Experiment » de Google.

Bien que des obstacles subsistent, cette percée prouve que les prochaines années seront décisives pour voir si cette révolution profite réellement à tous. Toutefois, il faut préciser qu’OpenAI reste très prudent avec o3. Il a accordé un accès anticipé aux modèles o3 et o3-mini à des chercheurs en sécurité. Cela leur permet de procéder à un test avant leur lancement officiel, prévu fin janvier pour o3-mini, suivi de peu par o3. À se demander si un modèle qui raisonne plus est-il donc plus dangereux ? Un petit air de science-fiction dans l’air, diriez-vous…