une IA capable de traduire des mots en images ! › Nouvelles Geek - 1

Nvidia a récemment annoncé la sortie de la deuxième version de son intelligence artificielle GauGAN. Il était déjà capable de transformer des croquis en images photoréalistes. Maintenant, vous pouvez les générer simplement à partir de mots !

Mettre en image ce que l’on a en tête… C’est un peu le but de GauGAN. Ce dernier avait déjà offert au public une possibilité innovante, celle de générer des paysages photoréalistes à partir de croquis dessinés par l’utilisateur. Cette fois, avec GauGAN2, les scientifiques ont choisi de faire la part belle aux mots. Avec votre nouveau système, décrivez simplement la scène que vous souhaitez voir apparaître en quelques mots, par exemple « coucher de soleil sur une plage », pour voir apparaître l’image correspondante.

Envie d’un coucher de soleil sur une montagne, sur des rochers ou par temps de pluie ? Il suffit de le préciser pour changer le paysage. Et pour ses créateurs, l’IA peut même permettre de restituer des paysages fantastiques avec un peu de dextérité : « Imaginez, par exemple, recréer un paysage de la planète emblématique de Tatooine dans la franchise Star Wars, qui possède deux soleils. Tout ce dont vous avez besoin est le texte « soleil des dunes du désert » pour créer un point de départ, après quoi les utilisateurs peuvent rapidement dessiner un deuxième soleil. « 

Après avoir passé les mots, les utilisateurs peuvent ajuster l’image à leur guise. Cliquer sur un bouton crée une « segmentation d’image ». C’est-à-dire une partition qui classe les pixels en différents éléments. A partir de là, l’utilisateur peut, en passant par les phases d’esquisse, d’effacement, d’ajout d’éléments, influencer l’image finale. Par exemple, vous pouvez tracer grossièrement les contours d’un rocher à l’aide de la balise « rock », pour faire apparaître un rocher de la forme que vous choisissez dans l’image de base. S’agissant du processus itératif, si des mots sont ajoutés, ils peuvent également être intégrés sous forme d’éléments concrets, superposant l’image existante.

Intelligence artificielle basée sur le paysage

Une base de 10 millions de paysages différents a été utilisée pour « entraîner » l’intelligence artificielle de Nvidia. Pour ce faire, ils ont créé un système spécifique de « réseau de neurones artificiels » pour le fonctionnement de l’IA. Plus précisément, il s’agit d’un système inspiré du fonctionnement des neurones biologiques, qui a ensuite abordé les méthodes statistiques. L’intelligence artificielle « se nourrit » d’une grande quantité de données pour en extraire des connexions logiques et les traiter pour obtenir un résultat. Par conséquent, la nourriture de cette IA était très bien soignée.

Le modèle, explique Nvidia, est basé sur des réseaux génératifs conflictuels (d’où le nom GAN dans GauGAN). En bref, il s’agit d’une sorte d’algorithme d’apprentissage non supervisé, conçu pour générer des images réalistes. Comment ça marche : Deux réseaux se positionnent comme des « adversaires » et doivent d’une manière ou d’une autre se défier. Le premier réseau génère un échantillon, dans ce cas une image. Votre adversaire, l’autre réseau, essaie de déterminer si l’échantillon proposé est réel ou s’il a été conçu à partir de zéro par l’IA. Par conséquent, cette opération oblige l’IA à faire des efforts pour se rapprocher le plus possible de la réalité et des images plausibles.

Cet outil auteur étonnant pourrait être utilisé par les artistes, notamment pour créer des références qui correspondent exactement à leurs besoins. Selon l’explication de Nvidia, l’objectif est également de permettre aux débutants de créer des paysages à partir de rien.

Nous le testons pour vous…

Côté novice, la démo que Nvidia propose actuellement sur son site internet n’est pas toujours satisfaisante. Le passage des mots à l’image peut donner lieu à quelques surprises, comme ce ruisseau au milieu d’une forêt dense qui a répondu à la demande « forêt à côté d’un lac », c’est-à-dire « forêt à côté d’un lac ». D’un lac « …

Paysage généré par GauGAN2 AI pour une première requête « forêt au bord d’un lac ».

Cependant, après quelques essais (en modifiant le style en cliquant sur l’icône du dé), il est possible d’obtenir des images répondant à la demande du paysage. Notez que l’IA semble avoir une préférence pour les paysages naturels.

Nouvelle tentative de « forêt au bord d’un lac ».

Les résultats obtenus pour les requêtes de type « ville aux gratte-ciels » étaient parfois assez édifiants. Concernant l’intégration de nouveaux éléments à travers les sketchs, le test n’a pas été très concluant malgré un certain acharnement de la part de son journaliste dévoué. GauGAN2 fait aussi parfois preuve de créativité dans l’assemblage de concepts qu’il capture en images. C’est ainsi que nous avons pu obtenir cette belle image, en tête d’article, digne des plus belles cartes postales, entrant simplement « ville balnéaire à côté d’une immense forêt avec de grands arbres et de nuages ​​», c’est-à-dire « ville balnéaire paradisiaque à côté de une immense forêt avec de grands arbres et des nuages’ dans la barre de texte, puis cliquez plusieurs fois sur les dés pour changer le style.

En y passant plus de temps, il ne fait aucun doute qu’il devrait être possible d’obtenir des résultats encore plus édifiants. Comme il s’agit d’une démo, on peut en tout cas s’attendre à ce que la version finale soit plus intuitive. Pour les curieux, la version d’essai est disponible en démos d’IA…

– Article révisé et amélioré par Jonathan Paiano

Une démonstration vidéo :

Nvidia

Script PHP, Elementor Pro Weadown, Thème WordPress, Fs Poster Plugin Nulled, Journal – Thème WordPress News & WooCommerce, Wordfence Premium Nulled, Dokan Pro Nulled, Plugins, Elementor Pro Weadown, Astra Pro Nulled, Premium Addons for Elementor, Yoast Nulled, Flatsome Annulé, Annonce de produit personnalisé Woocommerce, Wpml Nulled, Thème Woodmart Nulled, Cartes-cadeaux PW WooCommerce Pro Nulled, Avada 7.4 Nulled, Journal 11.2, Jannah Nulled, Jnews 8.1.0 Nulled, WP Reset Pro, Woodmart Theme Nulled, Business Consulting Nulled, Rank Math Seo Pro Weadown, Slider Revolution Nulled, Consulting 6.1.4 Nulled, WeaPlay, Nulledfire