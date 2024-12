Google a lancé un nouvel outil d’intelligence artificielle (IA) de génération d’images. Il faut lui donner des images, et non écrire un texte, pour qu’il crée des images. “Whisk” se veut avant tout un outil d’exploration créative.

D’habitude, une IA générative, cela marche comme ça : on écrit un texte, et le bot génère un contenu. Par exemple : “Dessine-moi un mouton.” On peut ajouter des informations sur la taille de l’image, le décor, les couleurs, le style (photo argentique, peinture abstraite, etc.)… et le bot fournit l’image d’un mouton.

Mais Google a décidé de lancer un nouveau concept : une IA générative où il ne faut pas entrer une commande, ou prompt, en utilisant du texte, mais où il faut télécharger des images. Il faut ajouter l’image d’un sujet, une autre d’un décor et une troisième d’un style, dans des cases prédéfinies. Ces cases proposent aussi des images prêtes à l’emploi qu’on peut choisir (et on peut aussi y ajouter du texte, si on préfère). Puis Whisk, comme s’appelle ce bot, va générer une image qui reprend ces différents éléments.

Si le contenu ne correspond pas à ce que l’on voulait, on peut alors éditer l’image pour modifier des éléments. Là, il faudra cependant entrer un prompt écrit.

Vidéo de fonctionnement du bot :



D’ailleurs, un peu de technique : Gemini, le LLM de Google, va analyser ces images et écrire une description détaillée. Il la transmet à Imagen 3, le modèle de génération d’images de Google. “Ce procédé permet de capturer l’essence de votre sujet, et non une réplique exacte”, explique Google dans un communiqué.

Un outil créatif

“Promptez moins, jouez plus”. Voilà le slogan avec lequel Google présente l’outil. Et c’est effectivement plus comme cela qu’il faut le comprendre : comme un jeu, ou un outil créatif pour explorer des idées. Il se veut moins comme un éditeur d’images traditionnel. “Nous l’avons conçu pour une exploration visuelle rapide, et non pour des éditions au pixel près”, décrit Google.

Il n’est pas encore disponible en Europe. Il a seulement été lancé aux Etats-Unis, ce mardi. Mais s’il fonctionne bien, on peut imaginer qu’il sera également rendu disponible ailleurs dans le monde.

Pour Google, c’est en tout cas un cheval de plus dans la course à l’IA.