Les modèles de langage menacent l'anonymat en ligne
Une étude révèle que l'IA peut identifier les identités réelles derrière des pseudonymes sur des forums comme Reddit, mettant en péril la vie privée en ligne.
Une étude révèle que l'IA peut identifier les identités réelles derrière des pseudonymes sur des forums comme Reddit, mettant en péril la vie privée en ligne.
© RusPhotoBank
Des chercheurs de l'Institut fédéral suisse de technologie de Zurich, en collaboration avec des spécialistes d'Anthropic, affirment que les grands modèles de langage actuels peuvent déjà identifier les véritables identités d'utilisateurs cachés derrière des pseudonymes à grande échelle. Selon une étude qui n'a pas encore été examinée par des pairs, la protection classique de l'anonymat sur Internet perd rapidement de son efficacité.
Dans une expérience, les scientifiques ont créé un agent d'IA qui a analysé les publications et profils d'utilisateurs sur des forums, en les croisant avec des données ouvertes. Sur la base de textes provenant de plateformes comme Hacker News et Reddit, le système a réussi à déterminer les identités réelles dans environ deux tiers des cas. Un tel travail prendrait des heures à un humain pour le faire manuellement, tandis que le modèle l'a effectué automatiquement et à grande échelle.
La méthode s'est avérée efficace même lors de la mise en correspondance de différentes sources de données, allant des commentaires de forums aux profils LinkedIn et aux entretiens anonymes. Même des textes neutres, comme des réponses à des enquêtes sur l'utilisation de l'IA, ont permis au modèle dans certains cas d'identifier des individus spécifiques. Plus un utilisateur partageait activement ses opinions, plus il était facile pour l'algorithme de cibler sa recherche.
Les auteurs soulignent qu'ils n'ont pas révélé les identités de personnes réelles et ont développé des mécanismes spéciaux pour évaluer en toute sécurité les capacités du système. Néanmoins, la conclusion de l'étude est préoccupante : la "flou" précédent des empreintes numériques ne garantit plus la protection. Selon les scientifiques, les utilisateurs, les plateformes et les régulateurs doivent réévaluer leur compréhension de la vie privée à l'ère de l'IA, sous peine de voir l'anonymat sur Internet confronté à de sérieuses menaces.