L’IA générative : révolution créative ou nouvelle boîte de Pandore
Après les controversés Deepfakes, qui ont manipulé l’identité visuelle, aujourd’hui le niveau de sophistication des derniers logiciels permet autant de prouesses qu’il ne provoque de préoccupations éthiques.
De nouveaux outils
DALL.E2, GPT-3, Midjourney, ces outils d’intelligence artificielle générative sont aujourd’hui sur le devant de la scène en raison de leur capacité à créer de manière très performante de nouveaux contenus grâce à l’utilisation de techniques d’apprentissage automatique avancées. Les modèles d’intelligence artificielle générative fonctionnent de différentes manières, en utilisant des approches telles que les GAN, les VAE et les Transformers, qui sont parmi les méthodes les plus populaires et les plus utilisées aujourd’hui.
En conjuguant ces différentes approches et en les adaptant aux tâches de génération de contenus, les modèles d’intelligence artificielle générative repoussent les limites de la créativité et offrent des résultats saisissants.
En ce qui concerne la première approche, les GAN (Generative Adversarial Networks), il s’agit de réseaux de neurones génératifs auxquels l’on a recours pour produire du contenu réaliste à partir de données d’entrée. Ils se composent d’un générateur et d’un discriminateur qui s’entraînent en compétition. Cela permet d’améliorer leurs performances au fil de l’entraînement. Ensuite, les VAE (Variational Auto-Encoders) consistent en une variante des auto-encodeurs. Ils utilisent un type de réseau de neurones en forme d’entonnoir pour encoder les données d’entrée dans un espace caché (appelé espace latent), puis les décoder pour les reconstruire. Cela permet de générer de nouvelles données similaires à celles qu’ils ont apprises lors de leur entraînement. Et enfin, les modèles d’intelligence artificielle générative se servent d’approches telles que les Transformers, qui utilisent des mécanismes d’attention pour capturer les relations entre les parties des données.
En conjuguant ces différentes approches et en les adaptant aux tâches de génération de contenus, les modèles d’intelligence artificielle générative repoussent les limites de la créativité et offrent des résultats saisissants.
Les machines prennent le pas sur la créativité humaine ?
Les processus d’apprentissage et de création des humains diffèrent de ceux des systèmes d’intelligence artificielle. Les humains n’utilisent pas de données sensorielles réduites à un bruit aléatoire ni ne créent à partir d’un pur hasard pour ensuite filtrer. Notre processus d’apprentissage et de création est plus complexe et nuancé.
On peut les assimiler à des perroquets capables d’écouter et de reproduire la parole humaine avec précision.
À ce titre, le célèbre linguiste Noam CHOMSKY a mis en évidence le fait qu’un modèle génératif tel que le GPT-3 ne produit pas les mots d’une langue en connaissance de leur signification, de la même manière qu’il pourrait produire des mots dans une langue sans signification ou inexistante. Ainsi, l’outil n’a pas la capacité de comprendre le sens du langage, ce qui est une caractéristique fondamentalement humaine.
Cela dit, pourrait-on affirmer que ces machines sont tout de même intelligentes ? En réponse à cette question, on pourrait avancer que quand bien même un modèle d’intelligence artificielle peut accomplir des tâches complexes et réussir le test de Turing, une évaluation qui mesure sa capacité à produire des résultats similaires à ceux d’un être humain, cela ne signifie pas qu’il est doté d’une véritable intelligence. En effet, les programmes d’IA générative que nous connaissons peuvent être comparés à des imitateurs très compétents, mais dépourvus d’intelligence. On peut les assimiler à des perroquets capables d’écouter et de reproduire la parole humaine avec précision. Avec suffisamment d’entraînement, ces perroquets peuvent apprendre à créer des dialogues dramatiques et chargés en émotion dignes de feuilletons ou de télénovelas brésiliennes. En ce sens, si on les récompense en leur donnant des biscuits lorsqu’ils trouvent de meilleures phrases et qu’on les sanctionne lorsqu’ils se trompent, ils pourraient continuer à progresser.
Corrélativement, l’IA générative s’avère une technologie polyvalente et qui a des implications dans plusieurs domaines d’activités. Récemment, Google a révolutionné la création musicale avec MusicLM, un générateur de musique par l’intelligence artificielle. Grâce à des descriptions textuelles ou des mélodies fredonnées, cette technologie peut composer de nouveaux morceaux musicaux. Un exploit qui ouvre de nouvelles perspectives dans le monde de la création musicale. Un autre exemple est celui du développement No code, permettant aux non-initiés en programmation de créer des applications sans écrire de code. Autrement dit, on peut se passer des langages de code complexes. Dans ce sens, l’IA générative promet de révolutionner le développement logiciel en rendant la programmation accessible à tous.
En revanche, ce qui se présente comme une avancée pourrait se révéler un véritable cauchemar pour les équipes informatiques chargées de la sécurité des systèmes et des données. En effet, l’IA générative pose un défi majeur en matière de sécurité informatique en raison de sa capacité à contourner les mesures de sécurité traditionnelles et à générer du contenu trompeur. Ce qui complique la détection et la prévention des fraudes. Sous ce prisme, son utilisation soulève également des questions éthiques urgentes telles que la protection de la vie privée et la responsabilité en cas de préjudice causé par ses résultats. De plus, la propriété des contenus générés et l’utilisation de contenus protégés par le droit d’auteur comme données d’entraînement posent des problèmes juridiques qui suscitent des débats animés autour de la protection des droits des créateurs.
Nouvelle source d’inquiétudes
L’impact environnemental de l’entraînement des modèles d’intelligence artificielle générative déclenche de fortes inquiétudes. En réalité, les récentes avancées sont principalement le fruit de l’utilisation massive de modèles existants, accompagnés de quantités astronomiques de données. Le monopole exercé par les grandes entreprises dans ce domaine est un problème flagrant, étant donné que seules ces entreprises disposent des ressources nécessaires pour entraîner ces systèmes.
De fait, les grandes entreprises technologiques ont tendance à opter pour une approche peu éthique en exploitant des travailleurs sous-payés, presque réduits à l’esclavage, dans des pays d’Afrique ou d’Asie pour accomplir cette tâche.
Dans ce contexte, les datacenters qui les hébergent deviennent de plus en plus grands et nécessitent une quantité croissante d’énergie, ce qui, par conséquent, crée des désordres écologiques considérables.
En outre, pour parvenir à des modèles d’IA générative performants, une grande quantité de données ne suffit pas. Il est également nécessaire d’associer ces données à des labels. C’est ce qu’on appelle le data labeling ou étiquetage, qui permet à la machine d’identifier les éléments présentés par les données. Ce processus de labellisation, souvent fastidieux et chronophage, soulève de sérieuses préoccupations. De fait, les grandes entreprises technologiques ont tendance à opter pour une approche peu éthique en exploitant des travailleurs sous-payés, presque réduits à l’esclavage, dans des pays d’Afrique ou d’Asie pour accomplir cette tâche.
Parallèlement, bien que l’étiquetage d’images d’animaux, de textes littéraires ou de pages Wikipédia puisse sembler acceptable, la réalité est bien plus sombre pour des modèles comme ChatGPT ou DALL-E. En effet, ces outils nécessitent l’étiquetage de contenus extrêmement sensibles, tels que des images d’esclavage, du contenu pédopornographique ou des textes décrivant des scènes abominables. Ce travail est essentiel pour sécuriser ces modèles et éviter qu’ils ne produisent de tels contenus répréhensibles. Néanmoins, il est tout à fait inacceptable que des individus soient exploités dans des conditions inhumaines, rémunérés moins de 2 euros par jour pour effectuer cette tâche traumatisante pendant de longues périodes. Cette pratique abusive, visant à réduire les coûts de main-d’œuvre, touche à des questions fondamentales en termes de respect de la dignité humaine et d’inégalités.
En somme, l’avenir incertain de l’IA générative divise les opinions, fluctuant entre fascination et inquiétude. Les ordinateurs ont récemment franchi une étape marquante en créant des images et des textes fictifs étonnamment convaincants. Reste à savoir si ces modèles, tels que DALL-E, évolueront vers une intelligence plus profonde ou s’ils se contenteront d’être les meilleurs imitateurs au monde. Seul le temps révélera le véritable potentiel et les limites de cette technologie captivante.