Close Menu
IdealoGeek.fr
    Facebook X (Twitter) Instagram
    IdealoGeek.fr
    • 🤖 Culture Geek
    • 📱 High-Tech
    • 💻 Informatique
    • 💸 Business
    IdealoGeek.fr
    IdealoGeek.fr » High-Tech » OpenAI enrichit Realtime API avec de nouvelles fonctions vocales

    OpenAI enrichit Realtime API avec de nouvelles fonctions vocales

    OpenAI déploie de nouvelles fonctions de traduction et de transcription. Découvrez les évolutions vocales de l'interface OpenAI Realtime API.
    Andy RakotondrabePar Andy Rakotondrabe11 mai 202603 Minutes
    OpenAI-Realtime

    OpenAI poursuit le développement de ses outils audio avec une importante mise à jour de sa Realtime API. L’entreprise annonce l’arrivée de plusieurs fonctionnalités de voix intelligentes capables de converser, traduire et transcrire en temps réel. Avec GPT-Realtime-2, GPT-Realtime-Translate et GPT-Realtime-Whisper, OpenAI cherche à transformer les interfaces vocales classiques. Vous aurez ainsi des assistants capables de comprendre des échanges complexes et d’agir pendant une conversation. Toutes les infos ici.

    Sommaire :

    • GPT-Realtime-2 veut rapprocher les assistants vocaux du raisonnement humain
    • Traduction et transcription en direct pour les usages multilingues

    GPT-Realtime-2 veut rapprocher les assistants vocaux du raisonnement humain

    La principale nouveauté concerne GPT-Realtime-2, un nouveau modèle vocal conçu pour des conversations plus naturelles et plus fluides. OpenAI explique que cette version intègre un raisonnement de niveau GPT-5, contrairement à GPT-Realtime-1.5. En effet, ce dernier se concentrait davantage sur la réactivité vocale.

    L’objectif est de permettre aux applications de gérer des demandes complexes sans casser le flux de la conversation. Le modèle peut accepter des interruptions, tenir compte des corrections de l’utilisateur et exécuter des tâches multi-étapes pendant l’échange. OpenAI évoque également la possibilité d’utiliser des outils externes directement depuis la conversation vocale.

    Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice agents.

    Voice agents are now real-time collaborators that can listen, reason, and solve complex problems as conversations unfold.

    Now available in the API… pic.twitter.com/2DY1LU2vO8

    — OpenAI (@OpenAI) May 7, 2026

    Quels secteurs professionnels sont les plus avantagés ? Les services client figurent parmi les usages les plus évidents. Cependant, OpenAI cite aussi l’éducation, les médias, les plateformes créatives et l’événementiel. Dans ces domaines, la faible latence et la continuité des échanges restent essentielles pour offrir une expérience crédible.

    Sur le plan tarifaire, GPT-Realtime-2 fonctionne avec une facturation par tokens audio. Le coût annoncé atteint 32 dollars par million de tokens audio en entrée, soit environ 29,8 euros. En sortie, nous sommes à 64 dollars par million de tokens audio, soit près de 59,6 euros. OpenAI ajoute également un tarif réduit de 0,4 dollar pour l’entrée en cache, soit environ 0,37 euro.

    Cette approche reste toutefois potentiellement coûteuse pour les usages intensifs ou les assistants particulièrement bavards. Les entreprises devront donc surveiller attentivement leur consommation.

    VOIR AUSSI : Anthropic double les limites de Claude Code grâce à un partenariat stratégique avec SpaceX

    Traduction et transcription en direct pour les usages multilingues

    OpenAI lance également GPT-Realtime-Translate et GPT-Realtime-Whisper. Le premier assure une traduction en temps réel avec plus de 70 langues reconnues en entrée et 13 langues disponibles en sortie. Le système tente de conserver le rythme naturel du locuteur afin de limiter les délais pendant les échanges.

    GPT-Realtime-Whisper se concentre de son côté sur la transcription vocale instantanée. Le modèle convertit la parole en texte au fil de la conversation. Aussi, vous pourrez générer des sous-titres ou des comptes rendus en direct.

    Les deux services utilisent une facturation à la minute. OpenAI annonce environ 0,034 dollar par minute pour la traduction, soit près de 0,032 euro. Pour la transcription ça sera 0,017 dollar par minute soit environ 0,016 euro.

    OpenAI affirme enfin avoir intégré plusieurs garde-fous destinés à limiter les abus, notamment contre le spam, la fraude ou les contenus nuisibles. Certaines conversations peuvent ainsi être automatiquement interrompues si elles enfreignent les règles de sécurité de la plateforme.

    Noter cet article

    IdealoGeek est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :

    Suis-nous sur Google ⭐➡️
    Partager Facebook Twitter LinkedIn WhatsApp
    Andy Rakotondrabe
    Andy Rakotondrabe
    • X (Twitter)
    • LinkedIn

    Rédacteur pigiste spécialisé sur la thématique des NTIC. "L'ordinateur est né pour résoudre des problèmes qui n'existaient pas auparavant." - Bill Gates

    Articles similaires
    Oppo-smartphone (1)

    OPPO prépare aussi un smartphone 10  000 mAh à moins de 300 euros

    Redmagic-11S-Pro

    Le REDMAGIC 11S Pro sort bientôt : comment l’obtenir moins cher avant tout le monde ?

    Microsoft Surface RTX Spark Dev Box

    Microsoft Surface RTX Spark Dev Box : un mini PC IA exécutant 120 milliards de paramètres

    Apple (1)

    iPhone Ultra pliable : Apple miserait sur un système de refroidissement inédit

    WWDC-26-iOS-27

    Apple tease iOS 27 avec « All Systems Glow » et un nouveau Siri

    Wi-Fi 7 vs Wi-Fi 6 - 1

    Wi-Fi 6 vs Wi-Fi 7 : quelles différences et faut-il changer d’équipement maintenant ?

    Laisser une réponse Annuler la réponse

    Derniers articles High-Tech
    Oppo-smartphone (1)
    OPPO prépare aussi un smartphone 10  000 mAh à moins de 300 euros
    Redmagic-11S-Pro
    Le REDMAGIC 11S Pro sort bientôt : comment l’obtenir moins cher avant tout le monde ?
    Microsoft Surface RTX Spark Dev Box
    Microsoft Surface RTX Spark Dev Box : un mini PC IA exécutant 120 milliards de paramètres
    Articles populaires High-Tech
    Apple tease iOS 27 avec « All Systems Glow » et un nouveau Siri
    Galaxy Z Fold 8 Ultra : pourquoi Samsung pourrait changer toute sa stratégie pliable
    Soundcore Liberty 5 Pro et 5 Pro Max : Anker mise sur l’IA pour réinventer les écouteurs premium
    Le « Dua Lipa TV Box » vire au scandale judiciaire pour Samsung et la facture est salée : 15 millions de dollars
    Électricité domestique : comprendre l’installation électrique d’une maison
    Anthropic double les limites de Claude Code grâce à un partenariat stratégique avec SpaceX
    Apple 2026 : quels produits attendre et lesquels acheter dès maintenant ?
    OLED vs Mini-LED vs Micro-RGB: quelles différences réellement ?
    Quels protocoles domotiques choisir pour une maison vraiment connectée ?
    Google Pixel « Standard », « Pro » et « a » : quelle gamme vous conviendrait ?
    Facebook X (Twitter)
    © 2026 IdealoGeek.fr | Mentions légales | Plan du site | Contact

    Tapez ci-dessus et appuyez sur Enter pour effectuer la recherche. Appuyez sur Esc pour annuler.