Секрет AI експерименту Цюріха Уніха маніпулював думками Redditors

Дослідників з Університету Цюріха звинувачують у проведенні несанкціонованого чотиримісячного експерименту на дошці Reddit, використовуючи коментарі штучного інтелекту, щоб перевірити, чи може AI змінити думки людей.

У рамках експерименту, рахунки, що працюють на AI, підробили різноманітні персони, включаючи жертву зґвалтування, людину, що виступає проти конкретних соціальних рухів, та консультанта з травм, що спеціалізуються на зловживанні, заявив модератори R/changemyview Subreddit у посаду 26 квітня.

“Наш підрозділ – це рішуче людський простір, який відкидає нерозкриту AI як основне значення”, – сказав модератори.”Люди не приходять сюди, щоб обговорити свої погляди з AI або на експерименті”.

Дослідники використовували AI для отримання відповідей, але намагалися персоналізувати відповіді на основі інформації з попередньої історії Reddit оригінальних плакатів, таких як політична орієнтація, стать, вік та етнічна приналежність, згідно з проектом статті.

Модератори R/Changemyview Subreddit кажуть, що дослідники університету Цюріха провели несанкціонований експеримент у своїй громаді. Джерело: Reddit

Протягом чотиримісячного експерименту фальшиві акаунти AI Університету Цюріха опублікували 1783 коментарі та отримали 137 дельтас-позначка, що показує, коли інший користувач Reddit визнав, що обліковий запис переконав їх змінити свою думку з цього питання.

Дослідники заявили, що в дописі до Subreddit про те, що всі коментарі були переглянуті вручну перед публікацією, щоб переконатися, що вони відповідають керівництву громади та “мінімізувати потенційну шкоду”.

Соціальні медіа — Команда університету стверджувала, що потенційні переваги цього дослідження суттєво переважають його ризики. Джерело: Reddit

Команда університету стверджувала, що “потенційні переваги цього дослідження суттєво переважають його ризики”, оскільки вони виявили, що великі мовні моделі, що використовуються в експерименті, можуть бути дуже переконливими, перевершуючи всі “раніше відомі орієнтири людської переконливості”.

“Наше контрольоване дослідження з низьким рівнем ризику дало цінне розуміння переконливих можливостей у реальному світі можливостей LLM-можливостей, які вже легко доступні для будь-кого, і що зловмисні суб’єкти вже можуть експлуатувати в масштабах з набагато небезпечніших причин”,-зазначили дослідники.

У той же час, дослідники заявили, що експеримент показує, що відрізняє людину від ШІ все ще стикається з значними проблемами, оскільки ніхто в Subreddit не виявив ботів AI протягом усього експерименту.

Рада R/Changemyview має 3,8 мільйона членів і займає серед перших 1% субреддів за розміром.

Reddit розглядає юридичні варіанти

Модератори ради Reddit сказали, що вони не знають про експеримент і попросили університет про вибачення та блокувати публікацію дослідження.

Реддіт також може розглядати юридичні дії, як головний юридичний директор платформи, Бен Лі, заявив у подальшому доступі 28 квітня, що експеримент порушив угоду та правила користувача сайту, і всі відомі рахунки, пов’язані з науково-дослідним зусиллям Університету Цюріха, були заборонені.

“Ми перебуваємо в процесі звернення до Університету Цюріха та саме цієї дослідницької групи з офіційними юридичними вимогами”, – сказав Лі.

“Ми хочемо зробити все можливе, щоб підтримати громаду та гарантувати, що дослідники несуть відповідальність за свої проступки тут”, – додав він.

Пов’язано: Білий дім отримує понад 10 000 коментарів щодо плану розвитку AI

У своїй відповіді на Subreddit, викладач мистецтв та наук про етику університету Цюріха заявила, що дослідила інцидент та пообіцяла краще координувати з тестовими суб’єктами в майбутньому. Провідний слідчий проекту також було видано офіційне попередження.

“Цей проект дає важливу інформацію, і ризики мінімальні. Це означає, що пригнічення публікації не пропорційно важливості розуміння, яке виходить з питань дослідження”, – сказала Комісія з питань етики.

Університет Цюріха не одразу відповів на запит про коментар. Cointelegraph не одразу отримав відповідь на запитання, надіслані на електронну адресу, пов’язану з експериментом.