Alors que la course à l’IA multimodale s’intensifiait sur le texte et l’image, Google DeepMind vient de franchir une étape majeure dans l’audio. Déployé ce 19 février 2026, le modèle Lyria 3 s’intègre nativement dans Gemini. Il permet à n’importe quel utilisateur de composer des morceaux en quelques secondes. Voici les détails.
Sommaire :
Lyria 3 sur Gemini : une génération musicale multimodale et paramétrable
Avec Lyria 3, Gemini peut générer des morceaux de 30 secondes à partir d’un simple descriptif textuel, mais aussi d’une image ou d’une vidéo. Le principe est similaire aux outils de génération visuelle. Vous décrivez le style, l’ambiance ou le thème souhaité. Puis, le système produit un titre complet en quelques secondes.
Deux modes sont disponibles :
- Le mode texte vers musique : permets de définir précisément le genre, l’époque, le tempo, les instruments, le type de voix (genre, timbre, tessiture) ainsi que les paroles. Il est possible de laisser Lyria 3 générer automatiquement les paroles ou d’intégrer un texte structuré avec des balises comme [Couplet] ou [Refrain]. Une galerie de modèles prédéfinis facilite la prise en main ;
- Le mode image ou vidéo vers musique : c’est l’approche multimodale du modèle. Gemini analyse le contenu visuel importé et compose un morceau cohérent avec l’atmosphère détectée. Cette capacité constitue l’un des principaux apports de Lyria 3 par rapport aux versions précédentes.
Chaque piste générée comprend alors un titre, des paroles et une pochette produite via le modèle Nano Banana. Les fichiers peuvent être téléchargés et partagés. En revanche, la durée est limitée à 30 secondes, ce qui restreint les usages professionnels ou les compositions plus élaborées.
Google indique que Lyria 3 produit des morceaux plus réalistes et musicalement complexes que les itérations antérieures. Toutefois, la version bêta peut encore présenter des limites en matière de cohérence stylistique ou de qualité de mixage.
VOIR AUSSI : Record pour l’application Google Gemini : son adoption massive change l’échelle de l’IA grand public
Disponibilité, limites et encadrement
La génération musicale avec Lyria 3 est disponible sur ordinateur pour les utilisateurs de plus de 18 ans. Un déploiement mobile est annoncé prochainement. Huit langues sont prises en charge au lancement : anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. En outre, les abonnements Google AI Plus, Pro et Ultra bénéficient de plafonds d’utilisation plus élevés.
Concernant les droits, Google affirme que Lyria 3 est conçu pour favoriser la création originale et non l’imitation d’artistes existants. En effet, toutes les pistes sont marquées de façon imperceptible par SynthID. Une technologie de tatouage numérique (watermarking) permettant d’identifier formellement une musique comme étant générée par IA. Et ceci, même après compression ou modification du fichier.
Avec l’intégration de Lyria 3, Gemini franchit une nouvelle étape dans l’extension de ses capacités génératives. La combinaison texte, image et audio confirme l’orientation multimodale de la stratégie de Google.
IdealoGeek est un média indépendant. Soutiens-nous en nous ajoutant à tes favoris sur Google Actualités :






