On a testé l’avatar vidéo en mouvement, une nouveauté de HeyGen

Diederick Legrain
Diederick Legrain Formateur IA

On connaissait la facilité de créer un jumeau virtuel en vidéo en quelques minutes avec HeyGen : maintenant, on peut l’utiliser en mouvement.

HeyGen est bien connu des fans de jumeau virtuel en vidéo : la plateforme américaine est arrivée à un degré d’imitation hallucinant à partir d’un échantillon de deux minutes de vidéo.

Seule limite : jusqu’à présent, l’enregistrement de « l’humain » devait être statique, assis ou debout, avec une panoplie de gestes très réduite. Quiconque hochait un peu la tête ou faisait des gestes brusques avec les mains se voyait affublé d’un jumeau virtuel atteint de frénésie. C’était drôle mais sans intérêt professionnellement, cela va sans dire.

On attendait donc beaucoup de la dernière nouveauté annoncée depuis des mois :  la réalisation d’avatars en mouvement, en décor naturel !

C’est possible désormais et cela ne coûte pas plus cher que les avatars statiques.

Comment enregistrer le modèle pour un avatar en mouvement

HeyGen recommande plusieurs précautions:

  • Filmer et parler sans interruption pendant au moins deux minutes et idéalement trois minutes,
  • Vous pouvez marcher, vous asseoir, vous lever, mais gardez la tête au centre de l’image,
  • Faire des pauses entre les phrases et avoir un maximum de variétés d’expressions,
  • Garder le visage face à la caméra, ou maximum de 30° de côté,
  • Le « caméraman » qui tient le smartphone doit éviter les mouvements brusques.

Pour l’expérience, je me suis filmé moi-même avec un selfie stick, ce qui n’est pas idéal. Voici le résultat (avec une surprise à la fin) :

L’affichage de ce contenu a été bloqué pour respecter vos choix en matière de cookies. Cliquez ici pour régler vos préférences en matière de cookies et afficher le contenu.
Vous pouvez modifier vos choix à tout moment en cliquant sur « Paramètres des cookies » en bas du site.

Une réussite technique finalement peu utile !

A l’analyse, c’est très réussi techniquement même après un seul essai.

Le rendu de l’image est impeccable mais le son de la voix manque de naturel : c’est une voix « studio », un défaut connu de HeyGen, mais c’est encore plus flagrant dans un environnement naturel où l’on attend une fluidité maximale.

Même en passant par ElevenLabs, la meilleure plateforme de rendu de la voix, ce n’est pas optimal.

Cela dit, il suffirait d’appliquer un petit effet à la voix, ce qui est possible sur n’importe quel logiciel de montage, pour arriver à un rendu « plein air », mais c’est une étape supplémentaire et les fans d’IA comme votre serviteur aiment les solutions simples !

Par contre, l’avatar en mouvement semble peu pertinent pour une utilisation fréquente : qui a envie de voir la même vidéo avec les mêmes mouvements et les mêmes décors répliquée à l’infini ?

Oui, il y a moyen d’effacer l’arrière-plan et de le remplacer par un autre, mais il faudrait trouver un décor filmé par une caméra qui épouse exactement le même mouvement que l’avatar : encore plus complexe !

Bref, pour l’entreprise, cette fonctionnalité n’apporte pas de réelle plus-value, malgré son évolution impressionnante d’un pur point de vue technologique.

L’intelligence artificielle est présente dans la plupart des secteurs, ou presque, avec ses partisans et ses détracteurs, mais quel est son impact?

Partner Content