Close Menu
IdealoGeek.fr
    Facebook X (Twitter) Instagram
    IdealoGeek.fr
    • 🤖 Culture Geek
    • 📱 High-Tech
    • 💻 Informatique
    • 💸 Business
    IdealoGeek.fr
    IdealoGeek.fr » High-Tech » IA et raisonnement humain : l’o3 d’OpenAI atteint un nouveau sommet sur l’ARC-AGI

    IA et raisonnement humain : l’o3 d’OpenAI atteint un nouveau sommet sur l’ARC-AGI

    Avec son nouveau modèle, le o3, OpenAI atteint un nouveau sommet et raisonne presque comme un humain. Qu'est-ce qui a changé ?
    Andy RakotondrabePar Andy Rakotondrabe24 janvier 202504 Minutes
    OpenAI-Model-03

    OpenAI vient encore de franchir un cap décisif dans l’intelligence artificielle. Grâce à son nouveau modèle o3, il a réussi une percée spectaculaire en obtenant un score de 75,7 % sur le benchmark ARC-AGI-1. Il enregistre même 87,5 % avec une configuration haute puissance. Cette avancée marque un tournant pour le raisonnement automatisé, presque humain. Elle ouvre la voie à des modèles capables d’adaptation inédite. Décryptez les implications de cette évolution majeure. ChatGpt c’est bien, mais le o3 l’est encore plus, et à l’exponentiel.

    Sommaire :

    • Une avancée majeure dans l’IA grâce au benchmark ARC-AGI
    • Les implications concrètes du nouveau modèle d’OpenAI

    Une avancée majeure dans l’IA grâce au benchmark ARC-AGI

    Le benchmark ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) est une référence dans la recherche en IA. Conçu en 2019 par François Chollet, il teste la capacité d’un modèle à résoudre des problèmes abstraits nécessitant logique, adaptation et déduction. Pendant plusieurs années, aucun modèle n’a pu dépasser 5 % de réussite, même avec GPT-4o en 2024.

    Toutefois, fin 2024, avec o3, OpenAI change la donne. Ce modèle a atteint 75,7 % dans des conditions normales et 87,5 % avec une puissance de calcul 172 fois supérieure. Cette incroyable amélioration remet en question toutes les intuitions sur les capacités des IA actuelles. Contrairement aux systèmes classiques, cette nouvelle génération ne se contente pas d’analyser des données existantes. Elle démontre une véritable capacité d’adaptation et de raisonnement humain.

    La percée pose également les bases des futures évaluations en IA. En 2025, le benchmark ARC-AGI-2 sera lancé aux côtés de l’ARC Prize, avec un objectif clair. Pousser l’IA encore plus loin en cherchant une solution open source haute efficacité capable d’atteindre 85 % de réussite. En effet, ce n’est pas encore accessible au grand public en raison des ressources de calcul colossales qu’ils nécessitent.

    OpenAI-Model-03-Arcprize-test
    Source : Arcprize.org

    VOIR AUSSI : Intelligence Artificielle : de grands changements à venir sur Windows 11 avec IA Explorer ? 

    Les implications concrètes du nouveau modèle d’OpenAI

    Le succès d’OpenAI et l’ARC-AGI ne signifie pas que l’AGI sera disponible demain. Néanmoins, il indique que nous nous en approchons plus vite que prévu. Plusieurs applications majeures pourraient émerger :

    • Des assistants virtuels véritablement intelligents : ces modèles comprendraient des requêtes complexes et s’adapteraient aux besoins des utilisateurs sans entraînement spécifique.
    • Une démocratisation du codage : grâce à un raisonnement avancé, tout le monde pourrait programmer en fournissant simplement quelques exemples d’entrée/sortie.
    • Des avancées en santé : l’IA pourrait détecter des maladies précocement et proposer des traitements adaptés en temps réel.
    • Une éducation sur mesure : imaginez un tuteur IA qui adapte ses méthodes d’enseignement à chaque élève, rendant l’apprentissage plus efficace.

    Cependant, cette évolution pose aussi des défis. Comme mentionné, l’énorme puissance de calcul nécessaire rend ces modèles impraticables pour le grand public. Leur contrôle par des entreprises privées pourrait accentuer les inégalités. À l’inverse, si des modèles open source atteignent 85 % de réussite, une adoption plus large et équitable pourrait devenir possible.

    Si 2024 a marqué l’essor des petits LLM. 2025 s’annonce comme l’année des « modèles raisonnants ». En effet, nous pouvons aussi mentionner le « R1 » de DeepSeek, le QwQ d’Alibaba, le Phi-4 de Microsoft et le « Gemini 2.0 Flash Thinking Experiment » de Google.

    Bien que des obstacles subsistent, cette percée prouve que les prochaines années seront décisives pour voir si cette révolution profite réellement à tous. Toutefois, il faut préciser qu’OpenAI reste très prudent avec o3. Il a accordé un accès anticipé aux modèles o3 et o3-mini à des chercheurs en sécurité. Cela leur permet de procéder à un test avant leur lancement officiel, prévu fin janvier pour o3-mini, suivi de peu par o3. À se demander si un modèle qui raisonne plus est-il donc plus dangereux ? Un petit air de science-fiction dans l’air, diriez-vous…

    Noter cet article

    IdealoGeek est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :

    Suis-nous sur Google ⭐➡️
    Partager Facebook Twitter LinkedIn WhatsApp
    Andy Rakotondrabe
    Andy Rakotondrabe
    • X (Twitter)
    • LinkedIn

    Rédacteur pigiste spécialisé sur la thématique des NTIC. "L'ordinateur est né pour résoudre des problèmes qui n'existaient pas auparavant." - Bill Gates

    Articles similaires
    Google-Traduction (1)

    Google Traduction progresse sur l’argot et lance la traduction vocale temps réel au casque grâce à l’IA Gemini

    Ayaneo-Pocket-Play

    Ayaneo Pocket Play: un smartphone gaming coulissant inspiré du Xperia Play

    Salons Tech 2025

    Top 5 salons Tech les plus populaires qui se sont tenus en 2025 : retour sur une année mouvementée

    Google-Doppl-image

    Google Doppl : Google lance une app d’essayage virtuel pour renforcer le e-commerce mode

    Fairphone-Fairbuds-XL

    Fairphone dévoile ses nouveaux Fairbuds XL et confirme son arrivée aux États-Unis

    Google-Preferred-Sources-blog (1)

    Google déploie enfin Preferred Sources à l’échelle mondiale

    Laisser une réponse Annuler la réponse

    Derniers articles High-Tech
    Google-Traduction (1)
    Google Traduction progresse sur l’argot et lance la traduction vocale temps réel au casque grâce à l’IA Gemini
    Ayaneo-Pocket-Play
    Ayaneo Pocket Play: un smartphone gaming coulissant inspiré du Xperia Play
    Salons Tech 2025
    Top 5 salons Tech les plus populaires qui se sont tenus en 2025 : retour sur une année mouvementée
    Articles populaires High-Tech
    Windows 11 25H2: Microsoft force la mise à jour sur certains PC
    Les 5 nouveaux objets que prépare Apple pour la maison
    Cybersécurité : quelles sont les arnaques en ligne qui ont explosé en France (et dans le monde) cette année ?
    Les meilleurs smartphones compacts en 2025 : notre top 3 en novembre
    Amazon Leo : le nouveau nom du rival de Starlink confirme l’ambition spatiale d’Amazon
    YouTube Recap: la plateforme lance son premier récap vidéo personnalisé
    OnePlus 15 enfin certifié : le feu vert de la FCC ouvre la voie à son lancement aux États-Unis
    Comet débarque sur Android : le navigateur IA de Perplexity accélère la concurrence
    Choisir le meilleur smartphone pour de la capture vidéo : notre top 3 (fin 2025) !
    Les smartphones qui captent le mieux en zone rurale (tests réseaux 2025)
    Facebook X (Twitter)
    © 2025 IdealoGeek.fr | Mentions légales | Plan du site | Contact

    Tapez ci-dessus et appuyez sur Enter pour effectuer la recherche. Appuyez sur Esc pour annuler.