L’intelligence artificielle ne se contente plus d’écrire ou de parler. Elle sait désormais voir, en direct. Et comprendre ce qu’elle voit. Une nouvelle frontière technologique est en train de s’ouvrir : celle de l’analyse vidéo en temps réel par l’IA générative. Voici cinq cas d’usage qui pourraient se développer.
Posé le long de la Vistule, à Cracovie, un couple amoureux s’interroge sur l’étrange bâtiment qu’il aperçoit sur l’autre rive. L’homme dégaine son téléphone et se connecte à ChatGPT. Il appuie sur le bouton en bas à droite de son écran lui permettant de discuter oralement avec l’assistant d’OpenAI… puis sur la petite caméra qui discrètement s’affiche en bas à gauche. Cette fonctionnalité discrète, mais présente depuis quelques semaines (quelques mois aux États-Unis), lui permet de filmer en direct ce qu’il voit tout en conversant oralement avec l’intelligence artificielle.
Peu de personnes ont d’ores et déjà ce réflexe. Pourtant, l’expérience est fluide… et bluffante. En quelques secondes seulement, ChatGPT a identifié le bâtiment en face et donné quelques explications sur le lieu, et même sur le moment que vivait ce couple au bord de l’eau. “Vous avez l’air de prendre un apéro et il y a une bonne ambiance”, s’exclame le robot.
Ce geste anodin témoigne pourtant d’un bouleversement sans précédent. Jusqu’ici, ChatGPT répondait à des textes, des commandes ou des documents. Depuis quelques mois, l’IA sait aussi parfaitement traiter ce que filme une caméra, en direct. Elle identifie les objets, reconnaît des situations, détecte des émotions, déduit des contextes. Et elle peut commenter, analyser, guider, alerter. Le tout en langage naturel.
En clair : ChatGPT peut désormais “regarder” le monde avec vous. Et cela ouvre un nouveau champ des possibles complètement hallucinant. Cette capacité de l’IA est de nature à changer les interactions entre l’humain et la machine…
Tourisme enrichi par l’IA
Imaginez : vous pointez votre smartphone vers un monument à Rome, et une voix synthétique, naturelle et fluide, vous raconte son histoire, ses secrets d’architecture, ses anecdotes, dans la langue de votre choix. Mieux : l’IA reconnaît que vous êtes avec des enfants, ou que vous regardez une statue particulière, et adapte ses commentaires.
Certaines applications proposent déjà des expériences enrichies via la réalité augmentée (Google Maps notamment, qui permet un guidage en AR), mais l’arrivée d’une IA comme GPT, couplée à la vision au travers de votre caméra, ouvre une dimension nouvelle : le commentaire contextuel intelligent, en direct, sans script préenregistré. Avec, pourquoi pas, la possibilité de vous faire des propositions commerciales : vous êtes devant le Vittoriano de Rome et ce restaurant à deux pas propose des cocktails à moitié prix durant la prochaine demi-heure…
L’immobilier sous un autre angle
Autre domaine : l’immobilier. Grâce à l’IA, il devient possible de filmer une pièce vide et d’obtenir en direct des suggestions d’aménagements. Ce que fait déjà la start-up belge Nodalview, spécialisée dans la “Proptech” sur base de photos.
“C’est très pratique et utile pour les gens car cela leur permet de se projeter, souligne Thomas Lepelaars, son CEO. Mais ce qu’on fait qui leur plaît surtout, c’est de voir ce que cela donne via l’image. On peut le faire en génération photo, mais ChatGPT ne le fait pas en vidéo pour le moment.”
Toutefois, ChatGPT peut commenter une visite filmée, identifier les matériaux, les défauts apparents. “À terme, on pourrait imaginer que grâce à la vidéo, l’IA puisse servir pour de l’inspection d’endroits, pour détecter de l’humidité, des griffes et puisse réaliser des états des lieux”, continue le patron de Nodalview…
Le retail augmenté
“À terme, je pense que ce genre de fonctionnalité permettra d’avoir un réel assistant dans la poche de chaque consommateur, prédit d’emblée Pierre-Alexandre Billiet, CEO de Gondola, média spécialisé dans le retail. Dans les magasins, on filmera les produits que l’on achète pour vérifier des informations. La consommation de masse est en train de diminuer et ces outils vont accélérer la consommation plus personnalisée. Les consommateurs auront plus confiance dans ces assistants que dans des marques ou des retailers avec lesquels la confiance a tendance à s’éroder.”
Dans l’univers du shopping non-alimentaire, les ‘ modeux’ pourront utiliser la caméra de leur smartphone couplée à l’IA pour avoir des conseils personnalisés en fonction de leur garde-robe. Des recommandations d’achats supplémentaires en direct : “Avec cette robe bleue, pourquoi pas un sac blanc cassé de telle marque ?”, pourrait réagir l’IA. Et potentiellement, vérifier les promos en ligne, voire, lorsque l’IA ‘agentique’ se sera imposée, le commander directement.
Du côté du B to B dans le retail, cela permet des analyses de rayons bien plus rapides. Un commercial peut filmer les rayons et obtenir des informations et des conseils en direct. Sans oublier l’analyse en vidéo des rayons, qui intéresse différents profils et permet l’étude du placement, du prix ou de la concurrence. En même temps qu’elle filme, l’IA peut générer des rapports, des recommandations, des alertes…
Médecine et vision : des usages sensibles, mais prometteurs
Dans la santé, l’IA visuelle en vidéo pourra servir à pas mal de choses. On pense par exemple à la détection précoce de symptômes. Tout en restant très prudente et particulièrement consensuelle aujourd’hui, l’IA de ChatGPT est déjà capable de commenter une tache que vous avez sur la peau. “Ce peut être un bleu sans importance. Si cela ne fait pas mal et si cela n’évolue pas, c’est sans doute anodin, mais si tu as un doute, mieux vaut consulter un spécialiste.”
ChatGPT s’y connaît déjà pas mal en santé même si son IA est bridée pour éviter les dérapages. Une fonctionnalité d’IA vidéo live serait, sans conteste, le premier pas vers une consultation virtuelle. Une rougeur sur la peau, une douleur anormale au doigt, un mollet gonflé, etc., seraient autant de prétextes poussant l’utilisateur à se filmer pour demander conseil à l’IA, avant même d’aller voir le médecin.
“Cela arrivera”, prédit Laurent Alexandre, auteur et observateur avisé de l’IA. Mais l’expert voit plutôt, dans un premier temps, débarquer des caméras IA à côté des médecins dans un certain nombre de cas.
Une fonctionnalité d’IA vidéo en direct serait, sans conteste, le premier pas vers une consultation virtuelle.
“Dans le champ opératoire, une caméra sur le front du chirurgien va pouvoir faire l’analyse en temps réel de l’opération et permettre de revoir la stratégie opératoire du chirurgien. Dans le domaine de la psychiatrie aussi, on peut imaginer des caméras qui enregistrent la dynamique gestuelle du patient et permettre de donner une analyse complémentaire à celle du médecin.
Enfin, l’IA en vidéo live pourra faire des analyses de consultation en même temps que le praticien. L’IA voit la consultation et peut signaler au médecin ce qu’elle a constaté. Cela ne remplace pas le médecin, mais l’accompagne…”
Suivez Trends-Tendances sur Facebook, Instagram, LinkedIn et Bluesky pour rester informé(e) des dernières tendances économiques, financières et entrepreneuriales.