H16
Pour celui qui se tient (même vaguement) au courant des progrès de l’informatique, il est évident que l’intelligence artificielle a beaucoup évolué en 20 ans. L’actualité récente montre qu’on est à présent bien loin des pathétiques essais de l’époque, qui permettaient péniblement d’obtenir de ces programmes un peu plus qu’une reconnaissance approximative des caractères, des systèmes experts un peu déséquilibrés ou des analyses d’images qui ne se trompaient pas la moitié du temps.
Ces dernières années ont notamment vu apparaître des monstres de calcul dont le nombre de variables (comptées en dizaines de milliards, comme pour GPT3 par exemple) nécessitent des matériels informatiques adaptés, essentiellement dérivés de cartes graphiques : les réseaux neuronaux pouvant être modélisés par des vecteurs et des matrices, ce que les cartes graphiques manipulent de façon courante, il était logique que des spécialisations de ces cartes apparaissent pour le cas particulier de développements en intelligence artificielle.
Au passage, cela explique les performances – notamment financières – des sociétés spécialisées dans la production de ces cartes comme NVidia qui annonce de façon régulière les nouvelles moutures de ses cartes destinées aux traitements massivement parallèles que l’intelligence artificielle emploie.
Les dernières années ont donc été logiquement remplies d’avancées marquantes dans le domaines, même si certains gros titres de la presse grand public font penser que les résultats laissent à désirer ; ainsi, en 2016, une intelligence artificielle de Microsoft, lâchée sur les réseaux sociaux pour y entretenir des discussions ouvertes, avait rapidement tourné au fiasco en développant un penchant comique pour un nazisme particulièrement décontracté.
Le domaine de la compréhension et la manipulation de texte a ainsi énormément progressé au point de permettre aux moteurs actuels de manipuler des concepts et des contextes complexes. Couplés à des moteurs d’analyse et de création d’images, on arrive maintenant à produire, à volonté, des images répondant à des descriptions plus ou moins précises. Les moteurs apparus ces deux ou trois dernières années permettent des prouesses de plus en plus stupéfiantes.
Citons notamment Dall-E (nom provenant d’un jeu de mot entre l’artiste Dali et Wall-E, la création de Pixar), dont on pourra comprendre le fonctionnement et voir ses performances dans la vidéo suivante :
Au passage, si l’on est intéressé par l’état de l’art en matière de traitement de l’image et d’intelligence artificielle, la chaîne Two Minute Papers est probablement la référence à suivre.
Sur le principe et sans rentrer dans le détail, ce genre de moteur construit une image en ayant établi auparavant une bibliothèque de concepts et d’images correspondantes en indexant et analysant des milliers d’images, parfois catégorisées et décrites, parfois non. La compréhension des concepts est assez profonde puisque ces moteurs savent généralement reprendre le style, les couleurs, les grandes caractéristiques d’une référence artistique.
À ce titre, MidJourney, un autre moteur d’intelligence artificielle procédant globalement de la même façon et maintenant disponible au travers de Discord, propose ainsi de réaliser des images composites de différents sujets au choix de l’utilisateur, et éventuellement, « à la façon » d’un artiste choisi.
Pour prendre un exemple parmi des centaines disponibles à présent, un développeur web s’est ainsi amusé à demander à MidJourney la ville de Lyon dans le style de différents peintres connus (Dali, Van Gogh, Monet, Giger) ou selon différents contextes (apocalyptique, futuriste, etc.) ce qui donne une série d’illustration particulièrement illustrative des capacités de ce genre de moteurs.
On comprend rapidement que le résultat brut, une fois retraité par un artiste, permet d’aboutir très rapidement à une œuvre finalisée de qualité professionnelle. C’est en tout cas ce qu’a récemment prouvé Jason Allen dans un concours artistique mené dans le Colorado, concours qu’il a remporté…
Comme on pouvait s’y attendre, un vif débat s’en est suivi : doit-on récompenser une telle réalisation alors qu’elle est, essentiellement, le résultat d’un processus algorithmique et non une création artistique humaine ? Le débat s’est aussi porté sur l’avenir des illustrateurs et des graphistes qui, devant les réalisations de plus en plus performantes de ces moteurs, voient leur valeur ajoutée fondre rapidement.
Ce n’est pas une question purement théorique : plus récemment encore, c’est un certain Greg Rutkowski, un illustrateur assez connu notamment dans les jeux vidéos, qui a noté que son style est devenu une référence plus demandée que Picasso dans le moteur Stable Diffusion. Des milliers d’images sont ainsi générées par des utilisateurs de ce moteur, dans le style de ce peintre… dont les images originales sont progressivement noyées par la déferlante de productions automatiques.
Outre les problèmes de notoriété que ceci entraîne, se pose aussi la question du respect des œuvres initiales dans la mesure où, pour pouvoir réaliser des images « dans le style » d’un artiste, il a été au préalable nécessaire de fournir les productions de cet artiste au moteur pour analyse.
En outre, jusqu’à quel point s’agit-il d’inspiration ou de plagiat, quelle part revient au procédé algorithmique, quelle part dépend des idées de l’utilisateur, de ses saisies à l’invite du programme, et est-ce suffisant pour caractériser un travail original qui met à l’abri d’éventuelles poursuites légales ? En fait, les questions légales ne manquent pas à mesure que les technologies d’intelligence artificielle se développent ainsi.
Et ces questions légales vont rapidement se doubler de questions sociétales et psychologiques lorsque ces procédés algorithmiques vont progressivement influencer toujours plus de professions, artistiques puis intellectuelles : ce qui se passe actuellement avec ces moteurs spécialisés est une excellente illustration de ce qui devrait arriver rapidement dans un nombre croissant de professions puisque ce qu’on peut faire sur les images, on peut le faire en musique ; il existe déjà des outils productions, comme Aiva et il ne fait aucun doute que les prochaines années offriront des concerts écrits intégralement ou presque par des moteurs d’intelligence artificielle, dans « le style de » l’un ou l’autre compositeur connu et qu’il sera impossible de distinguer vraiment de l’artiste de référence…
Et si l’on s’éloigne de l’art, il faut savoir que ces moteurs produisent actuellement des textes automatiques pour la météo, les résultats de sports, les actions boursières, et ces articles répétitifs qu’on trouve un peu partout dans les journaux. Des institutions comme le Washington Post, la BBC, ou Bloomberg utilisent déjà ces outils de façon quotidienne.
Sans surprise, les étapes suivantes (le droit ou la médecine sont des exemples fréquemment cités) promettent des cris d’orfraie chez les professionnels concernés, cris qui rejoindront ceux des artistes et des journalistes progressivement dépossédés de leur valeur ajoutée.
On comprend ici que la transformation en cours sera sans commune mesure avec ce qui s’est passé dans l’Histoire récente des inventions humaines. Les précédentes (machines à vapeur, moteur à explosion, radio, électronique, etc.) diminuaient le coût du labeur physique puis permettaient de réduire ou d’annuler le coût des distances (que ce soit pour le transfert de biens, de personnes, ou d’information) ; les prochaines inventions, basées sur l’intelligence artificielle, ne se contenteront pas d’abaisser la valeur marginale des œuvres de l’esprit : elles vont permettre de s’affranchir purement et simplement du maillon humain dans un nombre croissant de professions.
La capacité d’adaptation de nos sociétés à ce changement drastique sera sans nul doute mise à l’épreuve.
Du reste, on s’étonne que la profession intellectuelle à la plus faible valeur ajoutée ne soit pas déjà sur le pont pour interdire purement et simplement ces facétieux algorithmes : mais comme bien souvent, les politiciens sont incapables de voir le changement quand il se présente.