Секрет AI експерименту Цюріха Уніха маніпулював думками Redditors

Разное

Дослідників з Університету Цюріха звинувачують у проведенні несанкціонованого чотиримісячного експерименту на дошці Reddit, використовуючи коментарі штучного інтелекту, щоб перевірити, чи може AI змінити думки людей.

У рамках експерименту, рахунки, що працюють на AI, підробили різноманітні персони, включаючи жертву зґвалтування, людину, що виступає проти конкретних соціальних рухів, та консультанта з травм, що спеціалізуються на зловживанні, заявив модератори R/changemyview Subreddit у посаду 26 квітня.

“Наш підрозділ – це рішуче людський простір, який відкидає нерозкриту AI як основне значення”, – сказав модератори.”Люди не приходять сюди, щоб обговорити свої погляди з AI або на експерименті”.

Дослідники використовували AI для отримання відповідей, але намагалися персоналізувати відповіді на основі інформації з попередньої історії Reddit оригінальних плакатів, таких як політична орієнтація, стать, вік та етнічна приналежність, згідно з проектом статті.

Модератори R/Changemyview Subreddit кажуть, що дослідники університету Цюріха провели несанкціонований експеримент у своїй громаді. Джерело: Reddit

Протягом чотиримісячного експерименту фальшиві акаунти AI Університету Цюріха опублікували 1783 коментарі та отримали 137 дельтас-позначка, що показує, коли інший користувач Reddit визнав, що обліковий запис переконав їх змінити свою думку з цього питання.

Дослідники заявили, що в дописі до Subreddit про те, що всі коментарі були переглянуті вручну перед публікацією, щоб переконатися, що вони відповідають керівництву громади та “мінімізувати потенційну шкоду”.

Соціальні медіа
Команда університету стверджувала, що потенційні переваги цього дослідження суттєво переважають його ризики. Джерело: Reddit

Команда університету стверджувала, що “потенційні переваги цього дослідження суттєво переважають його ризики”, оскільки вони виявили, що великі мовні моделі, що використовуються в експерименті, можуть бути дуже переконливими, перевершуючи всі “раніше відомі орієнтири людської переконливості”.

“Наше контрольоване дослідження з низьким рівнем ризику дало цінне розуміння переконливих можливостей у реальному світі можливостей LLM-можливостей, які вже легко доступні для будь-кого, і що зловмисні суб’єкти вже можуть експлуатувати в масштабах з набагато небезпечніших причин”,-зазначили дослідники.

У той же час, дослідники заявили, що експеримент показує, що відрізняє людину від ШІ все ще стикається з значними проблемами, оскільки ніхто в Subreddit не виявив ботів AI протягом усього експерименту.

Рада R/Changemyview має 3,8 мільйона членів і займає серед перших 1% субреддів за розміром.

Reddit розглядає юридичні варіанти

Модератори ради Reddit сказали, що вони не знають про експеримент і попросили університет про вибачення та блокувати публікацію дослідження.

Реддіт також може розглядати юридичні дії, як головний юридичний директор платформи, Бен Лі, заявив у подальшому доступі 28 квітня, що експеримент порушив угоду та правила користувача сайту, і всі відомі рахунки, пов’язані з науково-дослідним зусиллям Університету Цюріха, були заборонені.

“Ми перебуваємо в процесі звернення до Університету Цюріха та саме цієї дослідницької групи з офіційними юридичними вимогами”, – сказав Лі.

“Ми хочемо зробити все можливе, щоб підтримати громаду та гарантувати, що дослідники несуть відповідальність за свої проступки тут”, – додав він.

Пов’язано: Білий дім отримує понад 10 000 коментарів щодо плану розвитку AI

У своїй відповіді на Subreddit, викладач мистецтв та наук про етику університету Цюріха заявила, що дослідила інцидент та пообіцяла краще координувати з тестовими суб’єктами в майбутньому. Провідний слідчий проекту також було видано офіційне попередження.

“Цей проект дає важливу інформацію, і ризики мінімальні. Це означає, що пригнічення публікації не пропорційно важливості розуміння, яке виходить з питань дослідження”, – сказала Комісія з питань етики.

Університет Цюріха не одразу відповів на запит про коментар. Cointelegraph не одразу отримав відповідь на запитання, надіслані на електронну адресу, пов’язану з експериментом.

Джерело
Оцініть автора
CryptoHamster.org
Додати коментар