Comprendre l’intelligence artificielle : des fondations historiques aux usages génératifs

Pour bien utiliser l’intelligence artificielle, il faut d’abord en comprendre les grands principes. L’IA n’est pas une technologie unique, mais un ensemble de méthodes qui permettent à une machine d’accomplir des tâches habituellement réalisées par des humains : lire, écrire, analyser, classer, générer du contenu ou encore piloter des systèmes complexes.

Dans ce chapitre, Frédéric Josué, président de 18M.io, consultant spécialisé en marketing et communication, apporte un éclairage pédagogique sur les fondements de l’IA. Son parcours est disponible ici : https://www.linkedin.com/in/frederic-josue-322465/. Il est également joignable à cette adresse : frederic.josue@18m.io.

IA, machine learning et deep learning : trois niveaux à distinguer

L’intelligence artificielle désigne la capacité d’une machine à imiter certaines formes d’intelligence humaine. Le machine learning, ou apprentissage automatique, constitue une branche de l’IA : au lieu d’être programmée règle par règle, la machine apprend à partir d’exemples et de données.

Le deep learning, ou apprentissage profond, est lui-même une sous-catégorie du machine learning. Il s’appuie sur des réseaux de neurones artificiels inspirés du cerveau humain et permet de traiter de très grandes quantités de données. C’est dans cette famille technologique que s’inscrit l’IA générative.

Apparue conceptuellement dès les années 1950-1960, l’IA a longtemps été freinée par le manque de données et de puissance de calcul. Cette période de ralentissement est connue sous le nom d’« hiver de l’intelligence artificielle ». Le véritable renouveau intervient à partir de 2010 avec l’explosion du Big Data : internet, les réseaux sociaux et les usages mobiles fournissent alors des masses de données comportementales exploitables pour entraîner les modèles.

Un tournant majeur a lieu en 2017 avec l’invention des architectures Transformer, qui deviennent la base des grands modèles de langage comme GPT, pour Generative Pretrained Transformer.

IA symbolique et IA statistique : deux logiques différentes

L’histoire de l’IA oppose deux grandes approches.

La première est l’IA symbolique, dominante jusqu’aux années 1980. Elle repose sur des règles explicites : par exemple, si un patient a plus de 38,5 °C de fièvre, alors il est considéré comme malade. Cette IA est déterministe : ses décisions sont traçables, car elles découlent de règles clairement définies.

La seconde est l’IA statistique, qui domine depuis les années 1980. Elle repose sur des données, des exemples et des probabilités. C’est le cas du machine learning, du deep learning et des modèles comme ChatGPT. Cette approche est beaucoup plus puissante à grande échelle, mais aussi plus opaque : les modèles peuvent produire des erreurs, extrapoler ou « halluciner », sans que l’on puisse toujours expliquer précisément leur raisonnement interne.

La vectorisation du monde : le principe clé de l’IA générative

L’IA générative fonctionne grâce à une idée centrale : traduire le monde en données numériques. Une image est représentée par des pixels et des couleurs. Une position géographique est décrite par des coordonnées de latitude et de longitude. Un mot, quant à lui, peut être représenté sous forme de vecteur multidimensionnel.

C’est le principe du word embedding : les mots sont placés dans un espace vectoriel où leur distance traduit leur proximité sémantique. Ainsi, « chat » et « chien » seront plus proches que « chat » et « humain », car ils partagent certaines caractéristiques. De même, « thé » et « café » seront plus proches entre eux que du mot « haricot », car ils renvoient à des usages et contextes similaires.

Cette représentation permet aux modèles de langage de comprendre les relations entre les mots, les nuances de sens et le contexte dans lequel ils apparaissent.

Comment fonctionne l’IA générative ?

L’IA générative transforme une instruction, appelée prompt, en contenu : texte, image, musique, vidéo ou message vocal. Les trois lettres de GPT permettent de comprendre son fonctionnement.

G pour génératif : le modèle produit du contenu nouveau à partir de ce qu’il a appris.

P pour pré-entraîné : il a été entraîné sur de vastes ensembles de données passées. Il dispose donc d’une culture générale très large, mais peut manquer d’informations récentes ou spécifiques.

T pour Transformer : cette architecture analyse le contexte grâce à des mécanismes d’attention. Elle évalue l’importance relative des mots dans une phrase ou un document afin de produire une réponse cohérente.

Les Transformers sont dits auto-régressifs : ils génèrent le texte progressivement, mot après mot, en se basant uniquement sur ce qui précède. Par exemple, face à une phrase évoquant le soleil couchant, l’horizon, la nuit et les teintes dorées, le modèle pourra prédire qu’un mot comme « obscurité » est une suite probable. Il ne « pense » pas comme un humain : il calcule la suite la plus vraisemblable à partir de patterns appris.

Ce que permettent les grands modèles de langage

Les grands modèles de langage ouvrent de nombreuses possibilités pour le marketing, la communication et la relation client. Ils peuvent analyser de grands volumes de données, identifier des tendances, faire émerger des insights, créer des personas ou encore simuler des comportements de consommateurs.

Ils permettent aussi de produire des contenus personnalisés selon différents publics cibles. L’un de leurs atouts est la personnalisation émotionnelle : on peut demander à un modèle d’adopter un ton plus empathique, engageant, descriptif ou encourageant selon l’objectif recherché.

Ces technologies accélèrent également la production de contenus, notamment lorsqu’elles sont connectées à des outils métiers. Par exemple, il est possible d’intégrer ChatGPT à Make pour synthétiser chaque jour des newsletters et générer des mails clients : https://www.make.com. On peut aussi associer une base de connaissance à un chatbot capable de répondre à des questions sous forme de messages vocaux.

Mais ces usages posent aussi des questions : les gains réels de productivité restent difficiles à mesurer, les coûts d’implémentation peuvent être importants et les équipes doivent être formées pour utiliser ces outils efficacement.

Pour aller plus loin

Le chapitre recommande plusieurs ressources pédagogiques courtes proposées par Meta avec Simplon :

La tokenisation : https://youtu.be/BJd-9IoCXWY?si=GUqn4763AnksN0JN
Les modèles de diffusion : https://youtu.be/Foe3wwm-x7A?si=mrtRoyhffrGL4GNI
Les modèles de langage : https://youtu.be/AsSYK2Aw88U?si=I8bPHCqHFjYfk983

Pour un tour d’horizon plus complet, le chapitre renvoie également à l’intervention d’Hugues Bersini au Collège de Belgique, intitulée « ChatGPT, la brève histoire d’une IA régressive » : https://youtu.be/VTRDr1FKCys?si=HhzcL47-m0QFfBj7.

Conclusion

L’IA générative n’est pas une rupture isolée, mais l’aboutissement de plusieurs décennies de recherche en intelligence artificielle, machine learning, deep learning, traitement du langage naturel et Big Data. Sa puissance repose sur la transformation du réel en données vectorisées, puis sur la capacité des modèles Transformer à prédire, générer et adapter du contenu en fonction d’un contexte.

Pour les organisations, elle représente une opportunité majeure : mieux analyser les données, produire plus vite, personnaliser les messages et enrichir l’expérience client. Mais son usage exige aussi de la méthode, de la formation et une compréhension claire de ses limites : une IA générative ne raisonne pas comme un humain, elle calcule des probabilités à partir de données passées.

Commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *