Zürichin sveitsiläisen teknillisen korkeakoulun tutkijat yhteistyössä Anthropic-asiantuntijoiden kanssa väittävät, että nykyiset suuret kielimallit pystyvät jo massamittakaavassa tunnistamaan käyttäjien todelliset henkilöllisyydet pseudonyymien takaa. Tähänastisen vertaisarvioinnin läpikäymättömän tutkimuksen mukaan perinteinen nimettömyyden suoja internetissä menettää nopeasti tehokkuuttaan.
Kokeessa tutkijat rakensivat tekoälyagentin, joka analysoi käyttäjien julkaisuja ja profiileja keskustelupalstoilla ja vertaili niitä avoimiin tietoihin. Hacker Newsin ja Redditin kaltaisilta alustoista kerättyjen tekstien perusteella järjestelmä onnistui määrittämään todelliset henkilöllisyydet noin kahdessa kolmasosassa tapauksista. Vastaava työ veisi ihmiseltä tunteja manuaalisesti, mutta malli suoritti sen automaattisesti ja laajassa mittakaavassa.
Menetelmä osoittautui toimivaksi myös eri tietolähteitä yhdistettäessä, kuten foorumikommentteja LinkedIn-profiileihin ja anonyymeihin haastatteluihin. Jopa puolueettomat tekstit, kuten vastaukset tekoälyn käyttöä koskeviin kyselyihin, mahdollistivat mallille joissakin tapauksissa tiettyjen yksilöiden tunnistamisen. Mitä aktiivisemmin käyttäjä jakoi mielipiteitään, sitä helpompi algoritmille hakuavaruuden kaventaminen oli.
Tutkijat korostavat, että he eivät paljastaneet todellisten ihmisten henkilöllisyyksiä ja kehittivät erityisiä mekanismeja järjestelmän kykyjen turvalliseen arviointiin. Tutkimuksen johtopäätös on kuitenkin huolestuttava: aiempi digitaalisten jalanjälkien ”sumu” ei enää takaa suojaa. Tutkijoiden mukaan käyttäjien, alustojen ja sääntelijöiden on uudistettava käsitystään yksityisyydestä tekoälyn aikakaudella, tai internetin nimettömyys saattaa kohdata vakavia uhkia.