ChatGPT ne sera jamais Ghibli
L'intelligence artificielle vous promet de vous transformer en personnage du studio Ghibli en un clic, au grand dam de toute une communauté créative. Pourquoi est-ce si grave, dans le fond?

La dernière version du logiciel d’OpenAI, chatGPT, permet de générer des images en reprenant plusieurs styles codifiés reconnus, ce qui représente une évolution estimable pour l’intelligence artificielle générative et sa capacité à produire des images de bonne qualité (avec le bon nombre de doigts!). Quelques heures après sa mise à disposition, chatGPT “cassait internet” avec son effet reprenant les codes graphiques du studio Ghibli: couleurs douces, personnages aux grands yeux et aux angles arrondis, notamment.
Tout le monde y a été de son portrait “ghiblisé” sur les réseaux sociaux. Les memes les plus célèbres sont rendus mignons, les comptes des plus grandes marques en ont profité pour pouvoir participer à la conversation sociale, et même les instances les plus violentes de la planète (pensez: l’administration américaine en pleine chasse aux migrants ou l’armée israélienne en plein génocide) y ont vu une occasion pour se donner un air sympathique. Le buzz a été tel que Sam Altman, CEO de OpenAI, a affirmé que les processeurs des superordinateurs utilisés pour générer l’effet surchauffaient tellement qu’ils étaient littéralement en train de fondre, ce qui forçait la compagnie à limiter le nombre de requêtes par utilisateur.
Face à ce “beau succès”, les voix critiques ont été celles des artistes, notamment celles des illustrateur-ices. Elles n’ont d’ailleurs pas attendu cette dernière trend pour se manifester, puisqu’il y a quelques mois, un filtre Ghibli avait déjà fait le buzz sur TikTok. A l’époque, j’avais aimé la réaction toute simple du dessinateur Adam Ellis qui s’était filmé en train de faire un auto-portrait inspiré du style Ghibli, non pas en utilisant un bête filtre, mais en dessinant à la main, avec pour conclusion “Does my drawing look exactly like a Ghibli movie? Not entirely. But that’s the whole point of making art. Internalizing your influences and making something new. Drawing is fun. Try it sometimes.”
Les objections des artistes se concentrent en général sur trois points:
le vol des oeuvres d’art, le non respect du copyright et le plagiat de l’IA pour entraîner son modèle à rendre ce genre de style: c’est une question encore plus débattue depuis la révélation de l’immensité du piratage des livres et articles scientifiques dont s’est rendu coupable OpenAI. La question matérielle de l’IA pose concrètement la question du devenir des travailleur-euses créatifs et si, il y a quelques mois encore, les rendus étaient trop médiocres pour tromper qui que ce soit, les avancées ont de quoi inquiéter les dessinateurs et graphistes.
le cynisme d’un faux “hommage” à Ghibli et son créateur Hayao Miyazaki alors que ce dernier s’est ouvertement déclaré contre le remplacement de l’humain par la machine dans la création. C’est en effet une trahison de l’esprit du studio, qui met au centre des thèmes de ses films les thématiques du respect de l’environnement et de la non-violence. Miyazaki est notoirement anti-guerre, antifasciste et inspiré par le marxisme et le socialisme et cela se reflète dans ses oeuvres. Porco Rosso, Princesse Mononoke et Le voyage de Chihiro en sont les exemples les plus connus bien sûr. (sans oublier que Ghibli, ce n’est pas que Miyazaki, et que cette philosophie est incarnée dans d’autres oeuvres issues du studio imputées à d’autres réalisateurs, comme par exemple Le tombeau des lucioles d’Isao Takahata)
Le coût écologique de l’IA, qu’on commence à peine à découvrir. Brûler la planète pour générer des textes médiocres et des images oubliables, c’est en effet désespérant
Tout en souscrivant à ces critiques, je pense que malheureusement elles ne vont pas assez loin dans ce qu’elles reprochent à l’IA générative. En effet, ces critiques bien qu’essentielles, ne sont que des répliques de critiques qui auraient pu avoir été faites à d’autres moments de l’Histoire, au sujet d’autres bonds technologiques appliquées à l’art. Par exemple, l’arrivée de la photographie a vivement été critiquée par les artistes et dessinateurs qui y voyaient une concurrence déloyale. Idem pour le dessin numérique vis-à-vis des dessinateurs ou peintres traditionnels. Pourtant, avec le temps, ce que nous avons appris c’est que ces nouvelles manières de créer ne sont pas venue annihiler des disciplines artistiques mais au contraire ont trouvé leur place à leurs côté ou les mettre en exergue. Si ce n’était “que ça” le problème de l’IA générative, on pourrait se dire qu’elle finirait elle aussi par trouver une manière de dialoguer en harmonie avec les autres disciplines artistiques établies. Or, on est loin, très loin du compte, et les critiques habituelles qui lui sont faites ne prennent pas compte de cette différence fondamentale de nature.
(petit aparté pour souligner que ce que je dis là s’applique en fait au cas particulier de l’IA générative, type ChatGPT, DALL-E, Sora et autres, et non pas de l’IA de manière générale. L’IA non-générative cohabite depuis longtemps avec les artistes sans souci particulier: pensez par exemple aux fonctionnalités de détourage intelligent de Photoshop ou les correcteurs d’orthographe dans les logiciels de texte; ce sont dans ce cas des outils qui facilitent la vie sans brûler les étapes du processus créatif)
J’ai l’impression que le coeur du problème de l’IA générative, et ce qui rend cette technologie fondamentalement problèmatique est double:
du côté du “créateur” des images (ou plutôt devrions-nous dire du “prompteur”): contrairement aux autres nouvelles disciplines artistiques qui sont venues s’ajouter aux techniques traditionnelles, l’arrivée de l’IA n’a pas nécessité des créateurs de développer des nouvelles compétences, d’adapter leur processus créateur (puisque ledit processus créateur est réduit à néant!), de se buter à des difficultés et devoir les résoudre ou les contourner. En plus de la disparition de la technicité du geste d’art, ce qui me gêne le plus dans cette “évolution” (véritable régression) est que, en l’absence de temps passé entre le début d’une oeuvre et sa complétion, l’artiste n’a pas le temps de se questionner sur son oeuvre, d’y verser ses doutes, ses certitudes ou ses références, d’y incorporer du soi, du vécu, des expérimentations, du sens.
Celles et ceux qui créent (professionnellement ou non) le savent, le résultat final n’est qu’une petite partie de la motivation et du plaisir de l’activité; tout le sens que nous y mettons se mérite par la cohabitation sur une échelle de temps avec le chantier artistique. L’IA générative fait brûler les étapes du processus créatif mais également de la “carrière” artistique: entre votre premier jour d’utilisation de l’IA générative et la 50ème année, vous ne vous serez pas amélioré dans ce que vous faites, et c’est un problème fondamental. En l’absence d’évolution des compétences, ou plus précisément en l’absence d’un point de départ à partir duquel construire son propre style et sa grammaire, vous ne pouvez pas vous retrouver dans cet état que j’appellerais d’introspection active qui est le seul à pouvoir créer les conditions d’une création originale.
La mort des conditions de la création n’est certes absolument pas un enjeu problématique pour les industries centrées sur la consommation et la valorisation boursière (au contraire elles s’en réjouissent), pour autant, c’est ce qui révolte et bouleverse profondément les artistes. Aucune oeuvre générée par l’IA ne peut avoir de profondeur parce qu’aucune n’est créé par dialogue sédimentaire entre idéation et matérialisation. Et ça, c’est une question de civilisation: que reste-t-il aux humains qui n’exercent pas leur effort d’introspection et de cognition? Le fascisme... pour lequel la finalité n’est autre que l’objectification à des fins de domination de tout geste humain.du côté du “receveur” des images (ou plutôt devrions-nous dire du “consommateur”): dans deux semaines, qui se rappellera encore de tous les selfies passés au filtre Ghibli? Qui s’émouvra en y pensant ? Personne bien évidemment. Le remâchage d’anciennes références nostalgiques ne remplace pas le fait de dialoguer avec une oeuvre, de se laisser attraper par son message, de se surprendre à changer de perspective à la faveur d’une vision novatrice. Dans 20ans, vous pourrez revoir Le tombeau des lucioles et pleurer comme au premier jour, mais vous ne trouverez pas plus d’intérêt à votre selfie façon Ghibli qu’à vos snaps avec filtre oreilles de chien des années 2015. Et pourtant, si, en tant que “consommateur”, si on laisse cet “art” génératif prendre la place de l’autre, en étant l’audience docile par laquelle se justifie la destruction des métiers créatifs, nous n’aurons bientôt plus de nourriture intellectuelle. La qualité passable de ce qui est produit par l’IA ne pourra pas remplir ce besoin si tout ce qui reste sont des machines qui tournent en boucle sur une infinité d’itérations de la même soupe. Nous nous habituons à baisser nos standards de public et cette spirale descendante ne peut pas tenir infiniment.
Nous ne sommes pas tou-x-tes des artistes mais nous avons tou-x-tes un besoin vital d’abstraction, de sens et d’émerveillement à étancher. Nous nous tirons une balle dans le pied à offrir notre temps d’émotion disponible à ces pseudo-oeuvres, en nous habituant à tolérer leur médiocrité et leur fadeur. Car les machines peuvent bien émuler une “moyenne” de ce qui existe déjà, mais le fait qu’elles ne peuvent pas savoir pourquoi elles le font a pour conséquence que nous, nous ne pouvons pas savoir pourquoi nous les regardons, à part pour repousser un peu l’angoisse de l’ennui.
La question n’est en fait pas vraiment “est-ce que chatGPT peut tuer Ghibli?”, car la machine n’a pas ce pouvoir sur ce qu’elle ne comprend pas. Car il y a une chose que chatGPT ne pourra jamais voler ou répliquer : l’inattendu. Un chat qui se transforme en bus pour emmener les enfants à l’école, un porc antifasciste qui conduit des avions, des petits esprits miniature qui veillent sur la forêt, le tout dans un storytelling cohérent, une vision d’auteur assumée et une invitation à la réflexion. En tant que public, nous aurons toujours faim de ces oeuvres quand elles nous seront proposées de manière honnête et engageante sur la forme et sur le fond. Le fait de voir notre internet se peupler de simulacres de créations artistiques se fait à notre corps défendant, car nous ressentons bien qu’elle a pour but notre propre déshumanisation.
Par contre, la vraie question qui demeure est “qui, armé de cet outil puissant qu’est l’IA générative, a intérêt à tuer Ghibli?” et là, malheureusement, c’est une autre histoire. Sans une volonté politique fascisante à essayer d’imposer partout où c’est possible l’IA générative, celle-ci ne serait rien d’autre qu’un outil encombrant pour qui prendrait la poussière sur une étagère. J’insiste sur cette dimension de volonté politique pour deux raisons qui explique la promotion agressive de l’IA générative : la première c’est que, perçue comme un avantage stratégique entre puissances mondiales, chacun tente de l’imposer avant les autres même là où elle n’est pas demandée, pour créer la dépendance des autres envers soi (dans un objectif de contrôle). La deuxième raison, c’est qu’il y a déjà un domaine politique où son immense pouvoir a fait basculer les équilibres de force: la désinformation et les agents de fake news, qui ont intérêt à ce que nous, public, ne sachions même plus à quoi ressemble une vraie image, un vrai texte, une vraie voix. Et s’il faut tuer les vraies industries créatives pour nous enlever cette capacité de discernement, ils n’hésiteront pas un instant. C’est particulièrement frappant quand on voit la nouvelle administration Trump injecter 500 milliards de dollars dans le projet Stargate tout en détruisant le Département de l’Education.
Mais une fois le constat posé, on fait quoi de ça? Je vous avoue, je désespère un peu de la perspective quand on est des millions d’utilisateur-ices à se jeter sur un filtre Ghibli. L’écrasante majorité d’entre nous joue avec l’IA comme un gadget, sans entrevoir les dangers à long terme de destruction stratégique de la soutenabilité des créatifs et des artistes. Pourtant, j’en suis persuadée, nous serons tou-x-tes affecté-e-x-s par un tel braquage, quand bien même nous ne sommes que public et non professionnels de la culture.
De mon côté, en l’absence d’une réponse claire à ce dilemme… je m’entraîne dans mon cahier de notes à dessiner mes proches dans le style Ghibli. Ca ne ressemble pas à grand chose, mais ça me permet de renouveler mon émerveillement pour les maître du trait qui nous offrent le privilège de voyager dans leurs imaginaires.