Smart Innovation : les IA Génératives


Introduction

Fin Avril, Sébastien et la communauté SmartInnovation vous ont proposé d’explorer les dessous des IA génératives (GenAI) dans un premier volet consacré aux images. Le but était d’expliquer, et d’implémenter, des modèles permettant de générer de nouvelles informations observables à partir de représentations latentes.

Définition

L’IA générative inclut tout système de génération de données synthétiques, originales, proposant des motifs et des structures similaires à des données d’entraînement.

Il existe aujourd’hui des modèles pour générer des images, des textes, des vidéos, de la musique, ou bien de nouvelles molécules thérapeutiques.

Nous avons en préambule vulgarisé le rôle du hasard et de l’espace latent (représentation compacte des données) dans la génération de nouvelles données, en proposant une comparaison avec le rôle de l’ADN dans la morphogénèse d’un organisme.

Des modèles génératifs

Nous nous sommes ensuite intéressés à la définition et l’implémentation de 3 modèles génératifs :

– les auto encodeurs conventionnels
– les auto encodeurs variationnels
– les réseaux génératifs antagonistes (GAN)

Les auto encodeurs conventionnels

Les auto encodeurs sont un type de réseau de neurones dont le but est de reconstruire une image donnée avec comme contrainte une représentation intermédiaire de plus petite dimensions.

Cependant, les auto encodeurs ne proposent pas une représentation simple de l’espace latent. Il est donc difficile de l’échantillonner pour générer des nouvelles données.

Les auto encodeurs variationnels

Les auto encodeurs variationnels sont des modèles probabilistes qui fournissent des distributions latentes plus compactes, adaptées à la génération de nouvelles informations.

Les réseaux génératifs antagonistes (GAN)

Finalement, les GAN sont une des plus grandes innovations des 10 dernières années. Deux réseaux de neurones s’affrontent dans un jeu à somme nulle : un générateur G qui joue le rôle de ‘faussaire’ et dont le but est de créer des informations crédibles, et le discriminateur D qui joue le rôle d’expert dont le but est de distinguer les fausses informations des données réelles.

Mise en pratique chez Ntico

Après une analyse du pseudo-code d’un GAN et une implémentation en Java/Python, nous avons fait la démonstration d’une application interne de DeepFake, en temps réel, sur plusieurs collaborateurs Ntico.

Une fois l’apprentissage terminé, nous avons montré qu’il existait une arithmétique vectorielle dans les espaces latents permettant de réaliser des interpolations et extrapolations sémantiques sur des données.

Deep Fake

x

Arithmétique vectorielle

Conclusion

Nous avons vu comment certains modèles à base de réseaux de neurones profonds permettaient de créer de nouvelles informations (images) à partir d’un ensemble d’apprentissage.

Il est important de noter que de tels modèles ne sont pas de simples perroquets stochastiques. Ils sont capables d’apprendre les éléments structurants d’un type d’informations, et de créer de nouveaux éléments observables inédits respectant les mêmes structures.

En ce sens, les IA génératives s’inspirent des données réelles sans en faire des copies exactes.

Chez Ntico Logistics, les modèles génératifs sont créés pour générer des données synthétiques utilisables dans la simulation de processus logistiques (picking).

Une autre application prometteuse pourrait être la création de campagnes marketing contextualisées. En utilisant des photos d’un prompt et des images réelles de produits, les IA génératives peuvent être exploitées pour générer des visuels publicitaires attrayants et personnalisés.