Los modelos de lenguaje identifican usuarios anónimos en internet
Un estudio revela que los grandes modelos de lenguaje pueden identificar las identidades reales de usuarios anónimos en foros, amenazando la privacidad en línea.
Un estudio revela que los grandes modelos de lenguaje pueden identificar las identidades reales de usuarios anónimos en foros, amenazando la privacidad en línea.
© RusPhotoBank
Un equipo de investigadores del Instituto Federal Suizo de Tecnología de Zúrich, en colaboración con especialistas de Anthropic, afirma que los grandes modelos de lenguaje actuales ya son capaces de identificar las identidades reales de usuarios que se esconden tras seudónimos a gran escala. Según un estudio que aún no ha sido revisado por pares, la protección convencional del anonimato en internet está perdiendo rápidamente su efectividad.
En un experimento, los científicos crearon un agente de inteligencia artificial que analizó publicaciones y perfiles de usuarios en foros, cotejándolos con datos abiertos. A partir de textos de plataformas como Hacker News y Reddit, el sistema logró determinar las identidades reales en aproximadamente dos tercios de los casos. Este trabajo le llevaría a una persona horas completarlo manualmente, mientras que el modelo lo realizó de forma automática y a gran escala.
El método demostró ser efectivo incluso al comparar diferentes fuentes de datos, desde comentarios en foros hasta perfiles de LinkedIn y entrevistas anónimas. Hasta textos neutros, como respuestas a encuestas sobre el uso de la IA, permitieron al modelo en algunos casos identificar a individuos específicos. Cuanto más activamente compartía opiniones un usuario, más fácil le resultaba al algoritmo acotar la búsqueda.
Los autores subrayan que no revelaron las identidades de personas reales y desarrollaron mecanismos especiales para evaluar de forma segura las capacidades del sistema. No obstante, la conclusión del estudio es preocupante: la anterior "borrosidad" de las huellas digitales ya no garantiza protección. Según los científicos, los usuarios, las plataformas y los reguladores deben reevaluar su comprensión de la privacidad en la era de la inteligencia artificial, o el anonimato en internet podría enfrentar serias amenazas.