Bien sûr que l’ia est révolutionnaire.
L’ia n’est pas intelligente, c’est un algorithme plutôt même des algo..
Et chaque jour qui passe désormais voit une amélioration de leurs utilisations. Mais c’en est encore à un stade expérimental non intégré pour tous. Vous aurez accès à une « conversation » sur edge de Microsoft, avec un chatGPT qui avec bing, le moteur de recherche de Microsoft, concurrence directement le monopole publicitaire de google. Améliorée dans le planning en quelques semaines et parce qu’elle est éminemment « poli..ssée », la technologie est intégrée et refuse toute réponse sur un mode pruderie et effarouchement à l’américaine (autant dire hypocrisie et naïveté+conformisme).
Nombre d’artistes sont dans une ignorance qui les laisse supposer qu’ils vont être supplantés par l’ia. Alors il va falloir expliquer, initier, apprendre, et même si de quelques medias on ressort l’idée d’une invasion ia, de plagia, de copies, de vols de données. Au final ces personnes sont complètement larguées et soumises à une peur d’être spoliées de leurs droits et de leurs images donc (on reste encore au stade du numérique). C’est pourquoi la blockchain aurait été une garantie de plus, sous l’appelation de NFTs, mais cet élément est un système d’opportunité et de brassage financier tout autant que « l’élite » artistique sert de poubelle aux blanchisseurs.
Il y a certaines vérités: les artistes massifs, historiques, culturels et autres stars de site de graphistes ressortent à travers les algorithmes comme des « formateurs » d’images. Car voilà, la création d’images toutes faites passe par le choix de noms d’artistes ou de leur style, chose qui sont encore limitées à quelques mots (dit token) et qui ne permettent pas de tout décrire d’une scène pour avoir une image complète.
Les ia de création d’images utilisent généralement deux types d’algorithmes:
- Les réseaux de neurones convolutifs (CNN) et les réseaux de génération adversaire (GAN).
- Les CNN sont utilisés pour extraire des fonctionnalités d’images existantes
- et les GAN sont utilisés pour générer des images nouvelles et uniques. Les GAN fonctionnent en deux parties: un générateur et un discriminateur.
- Le générateur crée des images à partir de bruit aléatoire (nuage de points)
- et le discriminateur essaie de distinguer les images générées de celles qui existent déjà, et cela grâce à une traduction sémantiques des images (ce qu’elles sont) pour « coller » au texte de la demande humaine.
Process de création: comment crée-t-on une image ia ?
… D’abord les outils de contexte de création : photo avec réglages, peintures avec style et époque, puis le sujet accentué par des parenthèses, sorte d’îlots de focalisations de la trame.
Comment ça marche ? Et bien il s’agit au départ de reconstituer des images à partir de nuages de points, une sorte de carte hasardeuse (ou bien alors une image toute faite (img2img) ou plus précise dans l’identité (pix2pix) voire la pose (controlnet)), dans lequel l’algorithme consiste à tracer des formes proches de ce qui est demandé: du groupe de points à la forme de l’objet.
Au tout début il s’agissait de recréer ou d’améliorer des photos anciennes, les reprendre et combler les déchirures. De passer d’une image très pixellisée à une image nette.
Le PROMPT donc est ce texte de départ décrivant l’objet de l’image.