[go: up one dir, main page]

Aller au contenu

Midjourney

Un article de Wikipédia, l'encyclopédie libre.
Midjourney
Description de l'image Midjourney Emblem — Discord.svg.

Informations
Créateur Midjourney
Première version [1]Voir et modifier les données sur Wikidata
Dernière version V6.1 ()[2]Voir et modifier les données sur Wikidata
Version avancée V6 (alpha) (21 décembre 2023[3])
Langues AnglaisVoir et modifier les données sur Wikidata
Type Generative artificial intelligence website (d)
Modèle d'intelligence artificielle (d)
Réseau de neurones artificielsVoir et modifier les données sur Wikidata
Documentation docs.midjourney.comVoir et modifier les données sur Wikidata
Site web www.midjourney.com

Midjourney (qui mot à mot signifie voyage intermédiaire) est un laboratoire de recherche indépendant qui produit un programme d'intelligence artificielle générative du même nom. Ce programme permet de créer des images à partir de descriptions textuelles, suivant un fonctionnement similaire à celui de DALL-E d'OpenAI[4],[5]. Il est basé sur des réseaux de neurones et un modèle de diffusion, utilisant des algorithmes d’apprentissage automatique et de traitement du langage naturel pour comprendre les prompts (demandes) des utilisateurs. Les modèles de diffusion permettent à l'IA de générer des images à partir d'un nuage de points en y ajoutant progressivement des détails, tandis que les transformateurs aident à interpréter et à générer des réponses visuelles précises. Midjourney est l'une des deux grandes IA génératrices d'images, l'autre étant DALL-E. Midjourney est souvent présentée comme produisant des images plus artistiques et créatives que DALL-E.

Midjourney est fondée par David Holz, cofondateur de Leap Motion. Son IA est publiée en version bêta ouverte le 12 juillet 2022, utilisable via un bot Discord. Midjourney est aussi une communauté (par défaut, les images qu'on y génère sont publiques et paragées dans la galerie de l'utilisateur, visibles de tous. Pour les besoins professionnels, une fonction Stealth Mode, permet de rendre « privées » ses images.

  • V1 : Février 2022 ; elle permet de générer des illustrations à partir de descriptions textuelles simples[6].
  • V2 : Avril 2022 ; l'IA gagne en performances et en qualité d'image[7].
  • V3 : Juillet 2022 ; de nouvelles fonctionnalités apparaissent, et l'IA comprend mieux les descriptions textuelles[8].
  • V4 : Novembre 2022 ; cette version marque un bond qualitatif dans la qualité de l'image, et dans l'interprétation des prompts. Elle est réputée avoir aussi été la plus ludique, inatendue et poétique.
  • V5 : Mars 2023 ; le réalisme est amélioré et les images gagnent en détail et précision.
    • V5.1 : Mai 2023 ; quelques ajustements et optimisations améliorent encore la qualité des images.
    • V5.2 : Juin 2023 ; apparition des fonctionnalités de dézoomage (pilotéess par des flèches directionnelles).
  • V6 : Décembre 2023 Avancées remarquables, y compris la génération d’images en 3D et la possibilité d’ajouter du texte aux illustrations.

En 2022, le programme est utilisé par le magazine britannique The Economist pour l'illustration de la couverture de son numéro de juin 2022[9].

En aout, le quotidien italien Corriere della Sera publie une bande dessinée créée avec Midjourney par l'écrivain Vanni Santoni[10]. Et quelques jours après (le ), une œuvre générée par une intelligence artificielle gagne un concours de beaux-arts, la Colorado State Fair Fine Arts Competition (Colorado, États-Unis) : Théâtre D’opéra Spatial[11], de Jason M. Allen, générée par Midjourney.

Le caractère exceptionnel et visuellement fascinant de nombreuses images générées avec Midjourney, de même que leur capacité à élargir le champ de l'imagination est rapidement reconnue, tant par les universitaire qui étudient l'IA ou la créativité que par les créateurs praticiens[12],[13],[14]. Dans une étude conduite par Lyu Wang et ses collègues, Midjourney est choisi par un panel d’experts en esthétique pour générer des peintures expérimentales[13]. Jaruga-Rozdolska promeut Midjourney cmme aide à la créativité en architecture[12], tandis que Ruskov l'utilise comme aide à la création d’illustrations inspirées de contes de fées[15]. Y. Zhang et C. Liu, en 2024, confirment que Midjourney a aussi un potentiel important pour les secteurs de la mode et du design, tout en posant de nouvelles questions éthiques, qui engagent à porter attention à « la transparence de la créativité axée sur l’IA pour prévenir les pratiques trompeuses »[16].

En 2023, la version V6 intègre la possibilité de travailler l'image en 3D, ce qui peut notamment intéresser les designers et les créateurs[17]. Midjourney intègre également peu à peu la génération de vidéos[18]. Deux fonctions nouvelles sont le Zoom qui permett, contrairement à ce que leur nom semble indiquer, de dézoomer sur une image : l'IA élargit la composition en prolongeant le fond de l'image existante en ajoutant par exemple du contexte à un portrait, une nature morte, un objet, etc. Des flèches directionnelles permettent d’étendre l’image dans une direction spécifique (gauche, droite, haut et bas) et il est possible de préciser ce que l'on souhaite voir apparaitre dans le fond. La fonction complémentaire Custom Zoom permet de faire ce travail par étape pour mieux contrôler le résultat[19].

Nouvelle plateforme : Une nouvelle plateforme est accessible aux utilisateurs ayant généré plus de 5 000 images, leur permettant de générer des images directement sans passer par Discord. Puis 2023, Midjourney devient également disponible en mode site web (dans besoin de passer par Discord).

Une option mangas apparait (Niji Midjourney), disponible en ajoutant le code « –niji 6 » au prompt.

En 2024 le PDG David Holz a annoncé une version v7 avant la fin de l’année, un modèle vidéo, et un éditeur d’images 3D qui pourrait évoquer l'Holodeck de Star Trek, susceptible de servir à des jeux, des films. Et depuis mai 2024, Midjourney est directement accessible aux personnes ayant créé au moins 100 images.

Critiques, controverses

[modifier | modifier le code]
Image externe
Fausses photos d'actualité générées par Midjourney (mars 2023)[20].

En août 2022, quand une œuvre générée par une intelligence artificielle gagne le concours de beaux-arts évoqué plus haut, alors que le jury et les autres artistes ignoraient que cette œuvre avait en grande partie été conçue artificiellement, une polémique est née : peut-on, veut-on ou doit-on qualifier d'art une œuvre qui n'a pas été complètement produite de la main et l'esprit d'un artiste ; une œuvre issue d'un système d'intelligence artificielle qui a utilisé des millions d'images existantes pour son apprentissage, ce qui pose la question d'une nouvelle forme de plagiat[21],[22]. Dans ce cas, les organisateurs du concours en ont changé les modalités pour l'année suivante[23].

En janvier 2023, trois artistes — Sarah Andersen, Kelly McKernan et Karla Ortiz — intentent une action en justice contre Stable Diffusion, Midjourney et DeviantArt, créateurs des générateurs d'art par intelligence artificielle Stable Diffusion, Midjourney et DreamUp, affirmant que ces sociétés ont violé les droits de millions d'artistes en entraînant leurs outils d'intelligence artificielle sur cinq milliards d'images extraits du Web « sans le consentement des artistes originaux »[24]. De nombreux artistes s'estiment spoliés ou craignent de le devenir[25],[26], deepfakes[27], manipulation de l'opinion[28], de plus en plus de voix s'élèvent pour que leur usage soit contrôlé et réglementé[29],[30].

En mars 2023, de fausses photos, produites avec Midjourney et diffusées sur Internet, mettant en scène des personnalités dans des situations extravagantes deviennent presqu'instantanément virales — le président Macron ramassant des poubelles, Donald Trump arrêté par des policiers, le Pape habillé en doudoune blanche[20]... —, confortant les craintes de détournement des images créées par AI.

Midjourney est loin de pouvoir prendre en compte la physique des matériaux et les fonctionnalités de l'architecture ainsi que de nombreux objets complexes[31], mais selon S Tanugraha, il se montre intéressant pour ce qui concerne les aspects esthétiques, et il est à ce titre apprécié par de nombreux artistes, créateurs designers, architectes[32] et enseignant considèrent que Midjourney (et d'autres IA de ce type) peuvent contribuer à leur créativité, et à l'innovation méthodologique dans la formation des futurs designers[33]. Selon Mohesh Radhakrishna (2024)), Midjourney peut être utilisé, avec prudence, sans entraver le processus créatif de l'architecte, y compris dans les écoles d'architectures où il devient important d'enseigner et aider à une telle utilisation consciente de l'IA pour les générations futures d'artistes et d'architecte[34].

Notes et références

[modifier | modifier le code]
  1. « https://docs.midjourney.com/legacy/docs/models » (consulté le )
  2. « https://medium.com/kinomoto-mag/midjourney-v6-1-a-game-changer-in-ai-image-generation-f1d967237e4b »
  3. « Midjourney sur Twitter : "We're now alpha-testing our V6 models Midjourney." / Twitter », sur Twitter (consulté le ).
  4. (en) « Huge "foundation models" are turbo-charging AI progress », sur The Economist (consulté le ).
  5. (en) Hertzmann, « Give this AI a few words of description and it produces a stunning image – but is it art? », sur The Conversation (consulté le ).
  6. Hasina H, « De version en version, Midjourney impressionne ! », (consulté le )
  7. « Midjourney sur Twitter : "We recently started testing a V2 algorithm, it's much better with characters and animals. Let's do a Monday experiment. What do you want to see? Reply below 👇" / Twitter », sur Twitter (consulté le ).
  8. Midjourney, « Midjourney sur Twitter : "Today we're starting to test our V3 image generation algorithms. Come by our Discord to play with them. 128 pics below from 2 new beautiful settings. https://t.co/oRuiazMKP4" / Twitter », sur Twitter (consulté le ).
  9. « How a computer designed this week’s cover », The Economist,‎ (lire en ligne, consulté le ).
  10. (it) IDA BOZZI, « Su «La Lettura», Highsmith inedita e le città che mutano », sur Corriere della Sera, (consulté le ).
  11. Voir Théâtre D’opéra Spatial, sur choualbox.com.
  12. a et b Anna Jaruga-Rozdolska, « Artificial intelligence as part of future practices in the architect’s work: MidJourney generative tool as part of a process of creating an architectural form », Architectus, no 3(71),‎ (ISSN 1429-7507 et 2084-5227, DOI 10.37190/arc220310, lire en ligne, consulté le )
  13. a et b Yanru Lyu, Xinxin Wang, Rungtai Lin et Jun Wu, « Communication in Human–AI Co-Creation: Perceptual Analysis of Paintings Generated by Text-to-Image System », Applied Sciences, vol. 12, no 22,‎ , p. 11312 (ISSN 2076-3417, DOI 10.3390/app122211312, lire en ligne, consulté le )
  14. Yanru Lyu, Minghong Shi, Yanbo Zhang et Rungtai Lin, « From Image to Imagination: Exploring the Impact of Generative AI on Cultural Translation in Jewelry Design », Sustainability, vol. 16, no 1,‎ , p. 65 (ISSN 2071-1050, DOI 10.3390/su16010065, lire en ligne, consulté le )
  15. Ruskov, M (2023). Grimm in Wonderland: Prompt Engineering with Midjourney to Illustrate Fairytales. arXiv , arXiv:2302.08961.
  16. (en) Yanbo Zhang et Chuanlan Liu, « Unlocking the Potential of Artificial Intelligence in Fashion Design and E-Commerce Applications: The Case of Midjourney », Journal of Theoretical and Applied Electronic Commerce Research, vol. 19, no 1,‎ , p. 654–670 (ISSN 0718-1876, DOI 10.3390/jtaer19010035, lire en ligne, consulté le )
  17. « Midjourney 6 : de grandes nouveautés arrivent enfin sur la meilleure IA génératrice d'images », sur www.meilleure-innovation.com, (consulté le )
  18. GeeKanJi, « Midjourney : une nouvelle IA pour créer de la 3D et de la vidéo », sur Cosmo Games, (consulté le )
  19. SimonV, « Utiliser le Zoom Out de Midjourney 5.2 », sur Space studio, (consulté le )
  20. a et b Photos créées par des IA : une bascule vertigineuse et dangereuse, Jonathan Bouchet-Petersen, 31 mars 2023, Libération.
  21. (es) Gabriela Castillo, « ¿Por qué quieren prohibir el arte que hace la Inteligencia Artificial? », sur Cultura Colectiva, (consulté le ).
  22. Bastien L., « L’IA MidJourney gagne un concours d’art, les artistes humains enragent », sur lebigdata.fr, (consulté le ).
  23. (en) Josue Perez, « Colorado State Fair staff to review digital art requirements following AI controversy », sur chieftain.com (consulté le ).
  24. (en) James Vincent, « AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit », sur The Verge, .
  25. Intelligence artificielle : «Le droit d’auteur protège une création précise, mais pas une manière de créer», Clémentine Mercier, 31 décembre 2022, Libération.
  26. [vidéo] Pourquoi les intelligences artificielles mettent en péril les artistes, Caurentin Courtois et Clémentine Mercier, 18 janvier 2023, Libération.
  27. (en) Deep fakes: Can you distinguish between fake and genuine photos?, Manos Tsakiris, 31 janvier 2023, World Economic Forum.
  28. (en) The AI program used to generate fake viral images of Pope Francis and Donald Trump just suspended free trials — but professional photographers say they're still concerned, Jordan Hart, 30 mars 2023, Business Insider.
  29. « Recommandation sur l’éthique de l’intelligence artificielle ; Publié en 2022 par l’Organisation des Nations Unies pour l’éducation, la science et la culture à Paris », sur unesdoc.unesco.org (consulté le ).
  30. UNESCO (2023) Recommandation sur l’éthique de l’intelligence artificielle
  31. (en) Stephen Tanugraha, « Review Using Artificial Intelligence-Generating Images: Exploring Material Ideas from MidJourney to Improve Vernacular Designs », Journal of Artificial Intelligence in Architecture, vol. 2, no 2,‎ , p. 48–57 (ISSN 2829-6257 et 2962-5629, DOI 10.24002/jarina.v2i2.7537, lire en ligne, consulté le ).
  32. (en) Linus Tan et Max Luhrs, « Using Generative AI Midjourney to enhance divergent and convergent thinking in an architect’s creative design process », The Design Journal, vol. 27, no 4,‎ , p. 677–699 (ISSN 1460-6925 et 1756-3062, DOI 10.1080/14606925.2024.2353479, lire en ligne, consulté le ).
  33. (en) Ivan M. Tsidylo et Esteve Sendra Chele, « Artificial intelligence as a methodological innovation in the training of gurure designers : Midjourney tools », Information Technologies and Learning Tools, vol. 97, no 5,‎ , p. 203–214 (ISSN 2076-8184, DOI 10.33407/itlt.v97i5.5338, lire en ligne, consulté le ).
  34. (en) Tanvi Naik, Hrishikumar Gostu et Rahul Sharma, « Navigating Ethics of AI-Powered Creativity in Midjourney », 2024 3rd International Conference for Innovation in Technology (INOCON), IEEE, vol. 2,‎ , p. 1–6 (DOI 10.1109/inocon60754.2024.10511571, lire en ligne, consulté le ).

Sur les autres projets Wikimedia :

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]