Sora, l’IA vidéaste d’OpenAI, fait trembler l’audiovisuel

Prouesse technique - Il n’aura fallu qu’un prompt pour obtenir ces résultats saisissants… et enflammer l’univers de la vidéo.
Christophe Charlot
Christophe Charlot Journaliste

La présentation, par OpenAI, des premières images vidéo hyper-réalistes générées par Sora, une intelligence artificielle, a saisi les internautes. Bluffante, la prouesse technique fait trembler le monde de l’audiovisuel et du marketing digital. Quant aux experts politiques, ils s’inquiètent d’une date de lancement trop proche… à la veille des élections.

Des mammouths ultra-réalistes déambulant dans la neige. Des poissons en papier nageant aux côtés de tortues et d’hippocampes également en papier. Un top-modèle asiatique marchant dans les rues de ce qu’on pense être Tokyo : ces mini-clips font le tour des réseaux sociaux et des médias depuis un peu plus d’une semaine.

A l’heure des images de synthèse et des réalisations incroyables de studios comme Pixar, ils n’ont pourtant rien de si spécial. A ceci près qu’ils ont été générés non pas par des équipes de 150 ou 200 personnes qui auraient œuvré pendant plusieurs mois, mais par une “simple” intelligence artificielle mise au point par OpenAI et baptisée Sora. Il n’aura fallu qu’un prompt, cette phrase par laquelle l’utilisateur donne une indication à une IA générative, pour obtenir un résultat saisissant… et enflammer l’univers de la vidéo.

Car les quelques tests de text-to-video réalisés et dévoilés il y a un an à peine – on y voyait notamment l’acteur Will Smith manger des spaghettis – étaient d’une qualité vraiment très moyenne. L’IA, à l’époque, avait beaucoup de mal à générer des mouvements fluides. La bouche du personnage sortait de son visage et les spaghettis étaient positionnés plutôt à côté des lèvres que dedans – des approximations qui n’incitaient pas à croire dans les possibilités, à très court terme, de ce genre de technologie. Mais voilà qu’aujourd’hui, OpenAI, l’entreprise américaine qui a secoué l’univers de la tech avec ChatGPT, veut confirmer son statut de pionnier. Cette fois, sur le créneau de la vidéo.

Si Sora fait grand bruit, OpenAI n’est pas le premier à dégainer la génération de vidéos issues d’une intelligence artificielle. Une série d’intervenants s’activent déjà sur le créneau. Pas plus tard qu’en janvier, Google a dévoilé Lumière, modèle d’IA permettant aussi la génération de vidéos (de quelques secondes seulement) sur la base d’une image fixe ou d’un prompt. Nul doute que les leaders de la tech ont d’ores et déjà entamé la course devant mener à cette prochaine étape de l’IA générative. Car après le texte et l’image, c’est certainement sur le créneau de la vidéo qu’ils vont se battre. Et sans même connaître les futurs vainqueurs de cette lutte à plusieurs centaines de millions de dollars, on sait que la grande gagnante sera la technologie elle-même. En effet, la concurrence pour le progrès va permettre à ces (déjà) géants de l’IA de faire avancer les modèles pour les rendre toujours plus performants.

80% des contenus de marque par une IA ?

C’est bien cela qui alimente les passions aujourd’hui : les possibilités réelles de Sora (à ce stade, seuls quelques happy few peuvent y avoir accès et la tester)… et son impact. Car les commentaires et les spéculations vont bon train, tant dans les médias qu’en ligne. Beaucoup voient dans Sora le risque d’une véritable tornade soufflant sur l’industrie de l’audiovisuel, capable de ravager certains métiers de la création. Si elle confirme sa capacité à générer des mini-séquences d’une minute, cette IA pourrait jouer un vrai rôle de création de contenus courts, formats très utilisés dans l’univers de la publicité aujourd’hui. “Quatre-vingt pour cent des contenus de marque seront générés par de l’intelligence artificielle”, prédit auprès de l’AFP l’agence internationale d’origine française Fred & Farid, qui a déjà travaillé pour Budweiser et Longchamp et a noué des collaborations avec les plus grandes stars de la planète. Elle ajoute que “la production ne sera plus un sujet mais [que] cela remettra le génie créatif au cœur du métier”.

La responsable de l’agence de pub française OTTA pense la même chose : “il y aura de la casse du côté de la production”, affirme-t-elle à l’AFP, précisant que de petites entreprises aux budgets réduits pourraient avoir recours à des IA pour générer des vidéos. Tout comme aujourd’hui déjà, le secteur de la pub et du marketing fait appel à ChatGPT pour générer des slogans publicitaires, il se tournera vers Sora pour des contenus vidéo.

“Le public va s’habituer aux ­imperfections des images créées par de l’IA.’’ – Cédric Cauderlier (Mountain View)

Cédric Cauderlier, le créateur de l’agence belge de marketing digital Mountain View, analyse aussi les retombées du phénomène dans le milieu de la pub vidéo online. Pour cet expert, même si l’intelligence artificielle ne pourra garantir une qualité aussi bonne que celle d’agences humaines et de spécialistes de la publicité, “le public va s’habituer aux imperfections des images créées par de l’IA et cela ne le choquera plus. Du coup, certains clients d’agences voudront l’exploiter, réduire les coûts et accepteront de sacrifier un peu de leur identité de marque. Tandis que les autres passeront par des agences classiques qui n’utilisent pas l’IA dans la production.”

Le spécialiste estime que les intelligences artificielles auront plus de mal à reproduire fidèlement certains produits ou à respecter très strictement des univers et les codes des marques. Il est, du reste, toujours compliqué (à ce jour, en tout cas) d’obtenir très précisément le rendu souhaité. Il faut parfois accepter des imperfections et faire une balance entre coûts et rendu de la vidéo. Cédric Cauderlier prédit dès lors que les vidéos made by IA concurrenceront, dans un premier temps, des contenus produits par des humains “s’ils ont une durée de vie limitée. Par exemple, une vidéo courte pour la Saint-Valentin : ce ne sont généralement pas des contenus à forte valeur ajoutée et dans ce cas, les boîtes pourront plus facilement accepter de les faire faire par des IA. Elles remplaceront, en quelque sorte, les images de stock.”

Au regard des possibilités offertes par l’intelligence artificielle actuellement, Cédric Cauderlier se montre toutefois dubitatif quant aux conséquences que pourrait avoir Sora sur le secteur du cinéma et de la télévision, qui dispose de codes bien spécifiques et de standards de qualité élevés.

Des films d’animation 90% moins chers

Cédric Cauderlier tempère d’ailleurs les risques liés à Sora et à l’IA sur le travail : “des managers se disent qu’ils devront virer la moitié des équipes studio à cause de Sora, mais c’est une mauvaise compréhension de l’IA et de ce qu’elle sera capable de faire, analyse-t-il. On économisera du temps mais on ne remplacera pas les gens car cela reste un outil, et pour arriver à quelque chose de très pro et adapté aux besoins, cela prendra aussi du temps. L’IA permettra de remplacer un programme de montage ou d’effets spéciaux mais nécessitera probablement toujours une intervention humaine pour arriver aux objectifs”. Un avis optimiste, que beaucoup ne partagent pas.

Jeffrey Katzenberg, le fondateur de DreamWorks, prédit que l’intelligence ­artificielle générative réduira, à terme, les coûts des films d’animation de… 90%.

A Hollywood, certaines personnalités s’inquiètent en effet ouvertement de l’arrivée de technologies comme Sora. L’acteur et réalisateur Perry Tyler, par exemple, a récemment confirmé qu’il voyait des IA comme Sora avoir à terme des retombées majeures sur son industrie puisqu’elles permettront à des cinéastes de réaliser des productions à des coûts bien moins importants qu’actuellement. Avec des outils d’intelligence artificielle, à l’avenir, ‘‘je n’aurai plus à me déplacer, commente-t-il. Si je veux me retrouver dans la neige au Colorado, ce sera du texte à générer. Si je veux écrire une scène sur la Lune, ce sera aussi du texte, et cette IA pourra générer le rendu en un rien de temps. Si je veux avoir deux personnes dans les montagnes, je n’aurai pas besoin de construire un décor dans les montagnes, je n’aurai pas besoin d’installer un décor sur mon terrain. Je peux m’asseoir dans un bureau et faire cela avec un ordinateur…’’

Perry Tyler a d’ailleurs expliqué qu’il lui était déjà arrivé d’utiliser des outils IA pour deux longs métrages à venir: ‘‘En post-production et sur le plateau, j’ai pu utiliser cette technologie pour éviter d’avoir à passer des heures à me maquiller !’’ Cela fait des mois que Perry Tyler suit les évolutions de l’IA. Au vu des développements actuels, le producteur a décidé de mettre en stand-by les agrandissements de ses studios, un projet à 800 millions d’euros. Jeffrey Katzenberg, le fondateur de DreamWorks, prédit, de son côté, que l’intelligence artificielle générative réduira, à terme, les coûts des films d’animation de… 90%. De quoi perturber “gravement” le secteur des médias et du divertissement.

Porno et élections…

Les capacités actuelles (ou en devenir) de Sora (et de tous les concurrents qui émergeront) ne se contentent pas d’effrayer une partie du monde de l’audiovisuel : nombre d’observateurs voient déjà les usages dangereux qui pourraient être faits de la génération de vidéos ultra-réalistes. A commencer par les dirigeants d’OpenAI eux-mêmes, qui ne veulent pas mettre cette technologie dans les mains de tous sans en avoir étudié les effets potentiellement néfastes et la manière de les contrer. Sans les citer, ils craignent les deepfakes et les arnaques en tout genre. Aujourd’hui déjà, les faussaires aiment réaliser des vidéos mettant en scène des personnalités.

Deepfakes – La chanteuse ­Taylor Swift a fait l’objet ces dernières semaines de fausses vidéos la représentant.

Taylor Swift en a d’ailleurs fait les frais ces dernières semaines, avec des vidéos qui la représentent dans des scènes pornographiques. Avec une IA générative accessible à tous les particuliers et sans garde-fous, les risques de multiplication de fakes et de désinformation sont à craindre. Y compris dans l’univers politique. Alors que de nombreuses élections, dont la présidentielle américaine, approchent, les interrogations sont plus prégnantes que jamais. Certes, OpenAI n’a pas encore annoncé la mise de son outil à la disposition du grand public. Mais certains prédisent un lancement en 2024 encore…

L’intelligence artificielle est présente dans la plupart des secteurs, ou presque, avec ses partisans et ses détracteurs, mais quel est son impact?

Partner Content