Категории: Разное

Дослідники з Китаю розробили механізм корекції галюцинацій для моделей AI

Команда вчених з Університету науки і технологій Китаю та лабораторії Tencent YouTu розробили інструмент для боротьби з «галюцинаціями» моделей штучного інтелекту (ШІ).

Галюцинація — це тенденція моделі штучного інтелекту генерувати результати з високим рівнем достовірності, які не з’являються на основі інформації, наявної в її навчальних даних. Ця проблема пронизує дослідження великої мовної моделі (LLM). Його ефекти можна побачити в таких моделях, як ChatGPT від OpenAI і Claude від Anthropic.

Команда USTC/Tencent розробила інструмент під назвою «Дятел», який, як вони стверджують, здатний виправляти галюцинації в мультимодальних великих мовних моделях (MLLM).

Ця підмножина ШІ включає такі моделі, як GPT-4 (особливо його візуальний варіант, GPT-4V) та інші системи, які перетворюють бачення та/або іншу обробку в генеративну модальність ШІ поряд з моделюванням на основі тексту.

Відповідно до попередньої дослідницької роботи команди, Woodpecker використовує три окремі моделі штучного інтелекту, окрім MLLM, що коригується на галюцинації, для виконання корекції галюцинацій.

До них відносяться GPT-3.5 turbo, Grounding DINO і BLIP-2-FlanT5. Разом ці моделі працюють як оцінювачі, щоб ідентифікувати галюцинації та дати команду моделі, що виправляється, повторно генерувати вихідні дані відповідно до своїх даних.

У кожному з наведених вище прикладів магістр права галюцинує неправильну відповідь (зелений фон) на підказку (синій фон). Виправлені відповіді «Дятел» показані на червоному тлі.(Джерело зображення: Yin, et. al., 2023).

Щоб виправити галюцинації, моделі штучного інтелекту, які працюють над «Дятлом», використовують п’ятиетапний процес, який включає «виділення ключових понять, формулювання запитань, візуальну перевірку знань, створення візуальних тверджень і корекцію галюцинацій».

Дослідники стверджують, що ці методи забезпечують додаткову прозорість і «покращення точності на 30,66%/24,33% порівняно з базовим MiniGPT-4/mPLUG-Owl». Вони оцінили численні «готові» MLLM за допомогою свого методу та дійшли висновку, що Woodpecker можна «легко інтегрувати в інші MLLM».

За темою: люди та штучний інтелект часто віддають перевагу підступним відповідям чат-ботів, ніж правді — Дослідження

Оціночна версія Woodpecker доступна на Gradio Live, де будь-хто допитливий може перевірити інструмент у дії.

Alexander Zhdanov

Недавние статьи

Технологія з нульовим знанням, заснована на хеші, може забезпечити квантовий захист Ethereum — XinXin Fan

Доктор XinXin Fan, керівник відділу криптографії в IoTeX, нещодавно став співавтором наукової статті під назвою…

4 години ago

Ставки фінансування біткойнів зросли на 20% на основних біржах — що відбувається?

Ціна біткойна піднялася цього тижня з того місця, де вона зупинилася на попередньому тижні, досягнувши…

4 години ago

Deribit переносить 783 мільйони доларів Ethereum у холодне сховище: позитивний сигнал для ETH?

Незважаючи на те, що Ethereum, здається, почав своє власне значне зростання, нещодавно цей актив зазнав…

6 години ago

Цей аналітик правильно передбачив стрибок ціни біткойна до 99 000 доларів, але його прогноз не здійснився

Криптовалютний аналітик, який точно спрогнозував зростання ціни біткойна до історичного максимуму в 99 000 доларів…

7 години ago

Біткойн може досягти $180 тис. до кінця 2025 року — засновник TYMIO

Ціна Bitcoin (BTC) може досягти $180 тис. До кінця 2025 року — вважає Георгій Вербицький…

8 години ago

Cardano досягає 2-річного максимуму в $0,97, аналітики оптимізувати ціль в $1

Cardano (ADA) показало одну з найкращих показників за останні три тижні, піднявшись на 200% до…

10 години ago