Au-delà du web : Pourquoi l'IA s'entraîne sur vos messages Slack (et vos frappes au clavier)
Des startups en faillite qui revendent leurs historiques Slack pour des centaines de milliers de dollars. Un géant comme Meta qui commence à enregistrer les mouvements de souris et les frappes au clavier de ses propres employés. Que se passe-t-il dans les laboratoires de la Silicon Valley ?
Un article récent de Forbes et TechCrunch (avril 2026) révèlent un virage majeur dans la manière dont l'Intelligence Artificielle est entraînée — et cela concerne directement la vie privée de tout employé.
Internet est épuisé. Littéralement.
Ilya Sutskever, ancien scientifique en chef d'OpenAI, l'a affirmé : les laboratoires ont consommé la majeure partie des données publiques d'Internet dès la fin 2024. Le problème ? Un livre numérisé permet à une IA d'écrire un poème, mais pas de se comporter comme un collègue compétent.
Pour construire la prochaine génération d'IA, baptisée "Agentic AI" (des agents capables d'exécuter des tâches logicielles de manière autonome), il faut un tout autre carburant : capturer le "bruit du monde réel". Comment utilise-t-on un menu déroulant pour coder un logiciel ? Comment une équipe gère un incident logiciel à 18h un vendredi ?
De la ruée vers les "fantômes" aux employés sur écoute
La première source de ce nouvel "or noir" a été de ressusciter les fantômes numériques. Lorsqu'une startup fait faillite, elle laisse derrière elle des années de workflows Jira et de boucles d'emails. Une récente économie a fleuri (plus d'une centaine de transactions ces derniers mois) où des entreprises liquidées revendent ces archives de travail.
Mais la nécessité d'apprentissage va plus loin. TechCrunch a révélé que la maison mère de Facebook s'est mise à installer son programme ‘Model Capability Initiative’. L'objectif ? Enregistrer en temps réel les mouvements de souris, les clics et les captures d'écran de ses employés américains.
Interrogé sur le sujet, un porte-parole de Meta a défendu cette méthode par une réalité technique implacable : si l'on veut construire des agents capables d'aider les humains à utiliser des ordinateurs, les modèles ont impérativement besoin d'exemples réels (comment on clique sur des boutons, comment on scrolle ou comment on navigue dans des menus). L'entreprise a assuré que l'outil ne ciblait que certaines applications et qu'il y avait "des garde-fous en place pour protéger le contenu sensible". Promesse suffisante ?
Un dilemme éthique et légal
Malgré les assurances technologiques, transformer des comportements professionnels en carburant pour l'IA soulève des questions.
Ifeoma Ajunwa, professeure de droit à l'Université de Yale, explique que ces méthodes soumettent les cols blancs à un degré de surveillance en temps réel inédit. De son côté, Marc Rotenberg, fondateur du Center for AI and Digital Policy, a saisi le Sénat américain en alertant : "Ce ne sont pas des données génériques. Ce sont des personnes identifiables."
Le danger le plus concret porte un nom technique : la régurgitation. Des études menées par des géants de la Tech ont démontré que les modèles d'IA peuvent recracher mot pour mot d'infimes séquences de leurs données d'entraînement. Si l'anonymisation de tous ces textes échoue, ou si les fameux "garde-fous" comportementaux dysfonctionnent, rien ne garantit qu'un modèle ne divulguera pas demain les mots de passe, les secrets industriels ou les conversations sensibles de collaborateurs qui n'ont jamais consenti à nourrir un algorithme.
Qu'en pensez-vous ? La promesse de garde-fous suffit-elle à confier nos clics et échanges à l'IA ? 👇