En plus de gĂ©nĂ©rer des rĂ©ponses aux questions, lâun des domaines dans lequel lâIA gĂ©nĂ©rative se dĂ©marque en ce moment est la gĂ©nĂ©ration dâimage. Un bout de phrase et quelques secondes suffisent pour que le modĂšle dâintelligence artificielle vous produise une image toute faite. Dans ce domaine, les meilleurs sont DALL-E et Midjourney. Si le premier bĂ©nĂ©ficie de la popularitĂ© dâOpenAI, grĂące Ă ChatGPT, le deuxiĂšme reste trĂšs plĂ©biscitĂ©. Il provient dâun laboratoire indĂ©pendant qui lâa lancĂ© en 2022. Alors, pourquoi choisir lâun plus tĂŽt que lâautreâŻ? Nous avons tentĂ© de comparer les deux modĂšles dâIA dans cet article Ă travers cinq points.
Sommaire :
Les Ă©diteurs
DALL-E a Ă©tĂ© dĂ©veloppĂ© par OpenAI et a Ă©voluĂ© Ă travers diffĂ©rentes versions, dont la derniĂšre est DALL-E 3. Ce dernier modĂšle reprĂ©sente une avancĂ©e significative par rapport Ă ses prĂ©dĂ©cesseurs, DALL-E 1 et DALL-E 2. Son dĂ©veloppement au sein d’OpenAI, le crĂ©ateur de ChatGPT, renforce sa rĂ©putation en tant que rĂ©fĂ©rence dans le domaine de la gĂ©nĂ©ration d’images.
En parallÚle, MidJourney, créé par David Holze, ancien chercheur de la NASA, a atteint sa version 5.2. Cette derniÚre itération continue de fournir des résultats impressionnants.
Les approches dâentrainement
DALL-E a Ă©tĂ© formĂ© sur une immense base de donnĂ©es composĂ©e de millions de paires image-texte provenant d’extraits d’internet. Cette mĂ©thode d’entraĂźnement sur un ensemble de donnĂ©es aussi vaste a permis au modĂšle d’apprendre les relations complexes entre les images et les descriptions textuelles associĂ©es. DALL-E applique aussi des filtres pour Ă©viter le contenu interdit et est conçu pour ne pas reproduire exactement les visages rencontrĂ©s au cours de son apprentissage.
En revanche, MidJourney adopte une approche différente en utilisant un agglomérat de contenus web pour former son modÚle de diffusion. PlutÎt que de se concentrer uniquement sur des paires image-texte, MidJourney exploite des ensembles de données ouvertes provenant de diverses sources en ligne.
VOIR AUSSI : Droits dâauteur et IA : Lâessentiel sur le plan lĂ©gal
Les modes de gĂ©nĂ©ration dâimage
DALL-E opte pour un processus de diffusion pour la gĂ©nĂ©ration d’images. Ce processus commence par un motif initial alĂ©atoire de points, qu’il ajuste progressivement pour former une image.
Ă l’inverse, Midjourney a un processus de gĂ©nĂ©ration basĂ© sur l’inversion du bruit. Lorsqu’un utilisateur entre une requĂȘte, l’IA commence par crĂ©er un champ de bruit visuel. Ensuite, le processus d’inversion du bruit intervient en soustrayant lentement le bruit par Ă©tape pour rĂ©vĂ©ler une image nette et affinĂ©e.
Le rendu
La compĂ©tition entre MidJourney et DALL-E est ardue, car les deux se positionnent en tant que rĂ©fĂ©rences majeures dans le domaine de la gĂ©nĂ©ration d’images.
MidJourney V5 se démarque par son rendu réaliste et détaillé, offrant des résultats particuliÚrement saisissants pour ceux qui recherchent un aspect visuel authentique. Les images générées sont souvent appréciées pour leur qualité artistique.
Les rĂ©sultats de DALLE-3 tendent Ă ĂȘtre plus diversifiĂ©s. DALL-E se distingue aussi par sa capacitĂ© Ă prendre en compte tous les dĂ©tails d’un prompt et Ă incorporer du texte dans l’image.
Il faut aussi noter que chacune de ces IA excelle dans certains styles. Le choix entre les deux dĂ©pend au finish des prĂ©fĂ©rences personnelles et du budget de lâutilisateur.
Processus d’accĂšs
L’accĂšs Ă DALL-E dĂ©pend de la version qui est utilisĂ©e. Pour accĂ©der Ă DALL-E 2 (OpenAI Labs), il faut crĂ©er un compte sur le site officiel d’OpenAI. Si vous avez dĂ©jĂ un compte ChatGPT, vous pouvez utiliser ses identifiants pour vous connecter, acheter des crĂ©dits et commencer Ă gĂ©nĂ©rer des images avec DALL-E 2. Pour ce qui est de DALL-E 3, vous devez bien entendu ĂȘtre abonnĂ© Ă ChatGPT Plus ou Entreprise. Ensuite, connectez-vous Ă la plateforme d’OpenAI, sĂ©lectionnez GPT-4 et choisissez le plugin DALL-E 3 dans le menu dĂ©roulant.
D’un autre cĂŽtĂ©, l’accĂšs Ă MidJourney se fait Ă travers Discord, la plateforme de communication en ligne. Les utilisateurs doivent crĂ©er un compte Discord, puis rejoindre le serveur spĂ©cifique de MidJourney. Une fois Ă l’intĂ©rieur, la commande « /imagine » est utilisĂ©e pour dĂ©clencher le processus de gĂ©nĂ©ration.
Midjourney vs DALL-E : qui l’emporte entre les deux IA gĂ©nĂ©ratives d’images ?
Leave a Reply