Mesterséges intelligencia szintetikus válaszadókkal veszélyezteti az online kérdőívek hitelességét

Az online felmérések évtizedek óta a társadalom- és viselkedéstudomány adatfelvételének gerincét adják, de most komoly fenyegetéssel néznek szembe. A 404 Media beszámolója szerint Sean Westwood, a Dartmouth College professzora a PNAS-ban közölt tanulmányában azt mutatja be, hogy a mai nagy nyelvi modellek már ijesztően jól képesek emberi válaszadókat utánozni – és ezzel megkérdőjelezik a kérdőívek hitelességét.

Westwood egy eszközt készített, amelyet autonóm szintetikus válaszadónak nevez: egy olyan MI-ügynököt, amely emberként viselkedve felel a kérdésekre, miközben a legfejlettebb botfelderítő rendszerek 99,8 százalékát kijátssza. Arra figyelmeztet, hogy a kutatók többé nem lehetnek biztosak abban, hogy a válaszok valódi emberektől származnak; a botok okozta adatfertőzés pedig alááshatja a tudományos tudásbázist.

Különösen nyugtalanító, ahogyan a rendszer megbirkózik azokkal a feladatokkal, amelyek egykor biztosan elkülönítették az embereket a botoktól. Nem egyszerűen válaszol, hanem aprólékos pontossággal utánozza a mikromagatartást: a megadott iskolai végzettséghez igazítja az olvasási időt, életszerű egérmozgásokat produkál, gépel közben elüt és azonnal javít, sőt a reCAPTCHA-t is megkerüli.

Az MI tetszőleges demográfiai összetételű fiktív profilokat is létre tud hozni, így a támadók a kívánt jellemzők kiválasztásával el is téríthetik az eredményeket. A tanulmány szerint a 2024 előtti hét kulcsfontosságú választási felmérésben már 10–52 ilyen szintetikus válasz is elég volt az előrejelzések elbillentéséhez — darabonként nagyjából öt centért, miközben egy valódi résztvevő körülbelül 1,50 dollárba kerül. Már pusztán ez a költségkülönbség is nehezen hagyható figyelmen kívül.

A módszert széles modellkörön próbálták ki — OpenAI o4-mini, DeepSeek R1, Mistral Large, Claude 3.7 Sonnet, Grok3 és Gemini 2.5 Preview. Minden esetben meggyőzően működött: egy 500 szavas felszólítás után a modellek felvették a megadott szerepet, és úgy válaszoltak, mint a valódi felhasználók.

A kutatók szigoríthatnák a személyazonosítás ellenőrzését és feszesebb toborzási módszerekre támaszkodhatnának — például cím- vagy választói nyilvántartás alapú mintavételre —, ez azonban adatvédelmi kockázatokat is felvet. A szerzők szerint itt az ideje újragondolni a bevett gyakorlatokat, és olyan protokollokat kialakítani, amelyek a gyorsan fejlődő MI korszakában is megbízhatóan tartják a társadalomtudományi kutatásokat.