Comment composer une musique avec Lyria 3 depuis Gemini ? Voici les conseils de Google

Gemini s’est d’abord signalé par les textes, avant de passer aux images. Les vidéos sont venues ensuite, même si muettes. Désormais, l’outil IA intègre directement un autre modèle qui permet de générer de la musique. Gemini s’est enrichi de cette fonctionnalité majeure courant mi-février, avec Lyria 3, le dernier modèle audio développé par DeepMind. Vous pouvez l’essayer dès aujourd’hui gratuitement. Mais pour obtenir un bon résultat, voici les conseils de Google.

Les 5 paramètres d’une composition avec Lyria 3

Pour exploiter pleinement les capacités de Lyria 3, il convient de structurer les requêtes autour de cinq paramètres fondamentaux.

Genre et époque : il définit l’esthétique globale et les codes musicaux. Cela oriente le choix des instruments. Exemple: Jazz des années 50, K-pop aux influences Motown.
Tempo et Dynamique : il permet de régler la vitesse (BPM) et l’évolution de l’intensité. Exemple : ballade lente, montée en puissance sur le refrain.
Instrumentation : si vous avez des instruments précis en tête, c’est le lieu de les nommer pour avoir des timbres précis pour la mélodie et le rythme. Exemple : synthétiseurs 80s, violons classiques sur base funk.
Voix : voix d’homme ou de femme ? Soprano, ténor ou baryton ? Texture grave, aérienne ou soul ? Ce paramètre détermine le genre, la texture et la tessiture vocale.
Paroles : vous pouvez soumettre directement des paroles à l’IA ou lui donner un thème et lui permettre de faire parler sa créativité.

Avec ces 5 paramètres, vous n’avez plus qu’à attendre pour avoir une musique convenable.

VOIR AUSSI : Les 10 principes pour reconnaître une vidéo IA

Les 6 conseils de Google pour une génération de musique efficace avec Lyria 3

Initialiser par une description textuelle

Le point de départ peut être une description narrative simple. Lyria 3 est capable d’interpréter des contextes variés, qu’il s’agisse d’un morceau Afrobeats inspiré d’une recette de cuisine ou d’un titre Skate Punk adressé à un proche. L’idée est de transformer un sujet du quotidien en thématique musicale.

Utiliser des sources d’inspiration visuelles

L’une des particularités de Gemini est sa capacité multimodale. L’utilisateur peut soumettre une photo de vacances ou une vidéo personnelle. Le modèle analyse alors les éléments visuels (ambiance, couleurs, sujet) pour composer un environnement sonore cohérent avec l’image fournie.

Ancrer le morceau dans un style et une époque

Afin d’éviter des résultats trop génériques, il est recommandé de spécifier une période historique ou un genre précis. Cette instruction oriente immédiatement le modèle vers des banques d’instruments et des structures rythmiques adaptées.

Préciser les détails techniques (voix et dynamique)

Pour un résultat professionnel, le prompt doit inclure des détails sur la texture vocale (soufflée, puissante, harmonisée) et sur la structure du morceau. Indiquer une section purement instrumentale ou une transition spécifique entre l’introduction et le corps du titre permet une meilleure maîtrise du rendu final.

Maîtriser le contenu textuel

L’utilisateur dispose de deux options pour les paroles :

Délégation totale : fournir un thème (ex: « une chanson pour un anniversaire ») et laisser l’IA rédiger.
Contrôle manuel : utiliser la balise Lyrics: suivie du texte. Il est alors possible d’utiliser des marqueurs comme [Verse] ou [Hook] et d’indiquer les chœurs entre parenthèses.

Exportation et partage

Une fois la génération terminée, le fichier est disponible aux formats MP3 ou MP4. À noter que chaque morceau est automatiquement doté d’une pochette d’album générée par Nano Banana. Vous pouvez alors partager votre musique ou la diffuser sur les plateformes.