Midjourney vs DALL-E : quelles sont les diffĂ©rences entre les deux gĂ©nĂ©rateurs d’images ?

Les meilleures IA gĂ©nĂ©ratives d’images actuellement sont Midjourney et DALL-E. Mais entre les deux, les approches sont diffĂ©rentes et les rendus ne sont pas les mĂȘmes.

Midjourney et DALL-E

En plus de gĂ©nĂ©rer des rĂ©ponses aux questions, l’un des domaines dans lequel l’IA gĂ©nĂ©rative se dĂ©marque en ce moment est la gĂ©nĂ©ration d’image. Un bout de phrase et quelques secondes suffisent pour que le modĂšle d’intelligence artificielle vous produise une image toute faite. Dans ce domaine, les meilleurs sont DALL-E et Midjourney. Si le premier bĂ©nĂ©ficie de la popularitĂ© d’OpenAI, grĂące Ă  ChatGPT, le deuxiĂšme reste trĂšs plĂ©biscitĂ©. Il provient d’un laboratoire indĂ©pendant qui l’a lancĂ© en 2022. Alors, pourquoi choisir l’un plus tĂŽt que l’autre ? Nous avons tentĂ© de comparer les deux modĂšles d’IA dans cet article Ă  travers cinq points.

Les Ă©diteurs

DALL-E a Ă©tĂ© dĂ©veloppĂ© par OpenAI et a Ă©voluĂ© Ă  travers diffĂ©rentes versions, dont la derniĂšre est DALL-E 3. Ce dernier modĂšle reprĂ©sente une avancĂ©e significative par rapport Ă  ses prĂ©dĂ©cesseurs, DALL-E 1 et DALL-E 2. Son dĂ©veloppement au sein d’OpenAI, le crĂ©ateur de ChatGPT, renforce sa rĂ©putation en tant que rĂ©fĂ©rence dans le domaine de la gĂ©nĂ©ration d’images.

En parallÚle, MidJourney, créé par David Holze, ancien chercheur de la NASA, a atteint sa version 5.2. Cette derniÚre itération continue de fournir des résultats impressionnants.

Les approches d’entrainement 

DALL-E a Ă©tĂ© formĂ© sur une immense base de donnĂ©es composĂ©e de millions de paires image-texte provenant d’extraits d’internet. Cette mĂ©thode d’entraĂźnement sur un ensemble de donnĂ©es aussi vaste a permis au modĂšle d’apprendre les relations complexes entre les images et les descriptions textuelles associĂ©es. DALL-E applique aussi des filtres pour Ă©viter le contenu interdit et est conçu pour ne pas reproduire exactement les visages rencontrĂ©s au cours de son apprentissage.

En revanche, MidJourney adopte une approche diffĂ©rente en utilisant un agglomĂ©rat de contenus web pour former son modĂšle de diffusion. PlutĂŽt que de se concentrer uniquement sur des paires image-texte, MidJourney exploite des ensembles de donnĂ©es ouvertes provenant de diverses sources en ligne. 

VOIR AUSSI : Droits d’auteur et IA : L’essentiel sur le plan lĂ©gal 

Les modes de gĂ©nĂ©ration d’image

DALL-E opte pour un processus de diffusion pour la gĂ©nĂ©ration d’images. Ce processus commence par un motif initial alĂ©atoire de points, qu’il ajuste progressivement pour former une image.

À l’inverse, Midjourney a un processus de gĂ©nĂ©ration basĂ© sur l’inversion du bruit. Lorsqu’un utilisateur entre une requĂȘte, l’IA commence par crĂ©er un champ de bruit visuel. Ensuite, le processus d’inversion du bruit intervient en soustrayant lentement le bruit par Ă©tape pour rĂ©vĂ©ler une image nette et affinĂ©e.

Le rendu

La compĂ©tition entre MidJourney et DALL-E  est ardue, car les deux se positionnent en tant que rĂ©fĂ©rences majeures dans le domaine de la gĂ©nĂ©ration d’images.

MidJourney V5 se dĂ©marque par son rendu rĂ©aliste et dĂ©taillĂ©, offrant des rĂ©sultats particuliĂšrement saisissants pour ceux qui recherchent un aspect visuel authentique. Les images gĂ©nĂ©rĂ©es sont souvent apprĂ©ciĂ©es pour leur qualitĂ© artistique.  

Chaise en citrouille d'IA
DALL-E en haut ; Midjourney en bas

Les rĂ©sultats de DALLE-3 tendent Ă  ĂȘtre plus diversifiĂ©s. DALL-E se distingue aussi par sa capacitĂ© Ă  prendre en compte tous les dĂ©tails d’un prompt et Ă  incorporer du texte dans l’image.

Il faut aussi noter que chacune de ces IA excelle dans certains styles. Le choix entre les deux dĂ©pend au finish des prĂ©fĂ©rences personnelles et du budget de l’utilisateur.

Processus d’accĂšs

L’accĂšs Ă  DALL-E dĂ©pend de la version qui est utilisĂ©e. Pour accĂ©der Ă  DALL-E 2 (OpenAI Labs), il faut crĂ©er un compte sur le site officiel d’OpenAI. Si vous avez dĂ©jĂ  un compte ChatGPT, vous pouvez utiliser ses identifiants pour vous connecter, acheter des crĂ©dits et commencer Ă  gĂ©nĂ©rer des images avec DALL-E 2. Pour ce qui est de DALL-E 3, vous devez bien entendu ĂȘtre abonnĂ© Ă  ChatGPT Plus ou Entreprise. Ensuite, connectez-vous Ă  la plateforme d’OpenAI, sĂ©lectionnez GPT-4 et choisissez le plugin DALL-E 3 dans le menu dĂ©roulant.

D’un autre cĂŽtĂ©, l’accĂšs Ă  MidJourney se fait Ă  travers Discord, la plateforme de communication en ligne. Les utilisateurs doivent crĂ©er un compte Discord, puis rejoindre le serveur spĂ©cifique de MidJourney. Une fois Ă  l’intĂ©rieur, la commande « /imagine » est utilisĂ©e pour dĂ©clencher le processus de gĂ©nĂ©ration.

Midjourney vs DALL-E : qui l’emporte entre les deux IA gĂ©nĂ©ratives d’images ?

Noter cet article
Avatar photo
Rédacteur passionné par l'innovation. "Le digital est la possibilité de faire plus avec moins." - Nicholas Negroponte