Категории: Разное

ChatGPT вперше здає іспит з неврології

Останнє оновлення OpenAI своєї великої мовної моделі (LLM), ChatGPT 4.0, склало іспит з клінічної неврології з 85% правильних відповідей у ​​дослідженні з підтвердженням концепції. Автори дослідження вважають, що після деякого доопрацювання LLM можуть мати «значне застосування» в клінічній неврології.

Результати експерименту, проведеного групою дослідників з Університетської лікарні Гейдельберга та Німецького центру дослідження раку в Гейдельберзі, були опубліковані 7 грудня. У тесті, проведеному 31 травня, брали участь два LLM, ChatGPT 3.5 і його пізніша версія. версія, ChatGPT 4.0.

Дослідники використали банк питань для іспиту з неврології від Американської ради з психіатрії та неврології з невеликою когортою питань від Європейської ради з неврології.

За темою: демо-версію Google Gemini тепер звинувачують у «підробці»

У той час як стара версія ChatGPT набрала 66,8%, правильно відповівши на 1306 із 1956 питань, новіша модель, ChatGPT 4.0, набрала 85% із 1662 правильними відповідями. Середній бал серед людей склав 73,8%. ChatGPT 4.0 перевершив людей-користувачів у питаннях, пов’язаних з поведінкою, когнітивними та психологічними питаннями, і фактично «пройшов» іспит з неврології, оскільки 70% правильних відповідей зазвичай вважаються прохідним балом у навчальних закладах.

Однак обидві моделі продемонстрували слабшу продуктивність у завданнях, які вимагали «мислення вищого порядку», ніж у питаннях, які вимагали лише «мислення нижчого порядку».

На думку групи дослідників, які проводили експеримент, ці результати є рекомендацією використовувати LLMs у клінічній неврології після деяких модифікацій:

«Ці висновки свідчать про те, що з подальшим удосконаленням великі мовні моделі можуть мати значне застосування в клінічній неврології».

Дослідники зазначають, що є ще кілька застережень. Хоча існує чітка перспектива для застосування LLMs у документації та системах підтримки прийняття рішень, неврологи повинні бути обережними щодо їх використання на практиці, оскільки вони все ще недосконалі щодо когнітивних завдань високого рівня. У розмові з Cointelegraph один із авторів дослідження, доктор Варун Венкатарамані, сказав:

Ми розглядаємо наше дослідження більше як підтвердження концепції можливостей LLM. Потрібна розробка і, ймовірно, навіть конкретне тонке налаштування LLM, щоб зробити їх належним чином застосовними для клінічної неврології.

Штучний інтелект вже працює над деякими важливими завданнями в галузі охорони здоров’я, такими як пошук ліків від раку для AstraZeneca або боротьба з надмірним призначенням антибіотиків у Гонконзі.

Anna Kuznetsova

Недавние статьи

Криптовалютний аналітик пояснює, що може спровокувати ралі Ethereum до $6000

Аналітик розповів, що, можливо, має статися, щоб Ethereum піднявся до позначки в 6000 доларів, виходячи…

4 години ago

99,6% трейдерів Pump. fun не отримали понад 10 тисяч доларів прибутку: дані

Згідно з останніми даними Dune, майже всі трейдери на Pump.fun, децентралізованій платформі для створення мемкойнів…

4 години ago

Співзасновник Wolf Capital визнав себе винним у $9,4 млн Понці, обіцяв 547% прибутку

Співзасновник і головний трейдер криптовалютної інвестиційної фірми визнав себе винним у змові з шахрайством за…

6 години ago

Тестування Dogecoin Ключова зона попиту – чи може DOGE піднятися вище $0,40?

Після нещодавнього загальноринкового розпродажу Dogecoin зіткнувся зі значним тиском, зазнавши падіння на 20% від локальних…

7 години ago

Чи є падіння Dogecoin на 30% шансом купити зі знижкою? Ось відповідний рівень для перегляду

Нещодавні зміни ціни свідчать про те, що Dogecoin застряг на шляху корекції вже більше місяця,…

8 години ago

Пропозицію акціонерів корпоративного казначейства біткойн надіслано Meta

Пропозиція акціонера Meta, подана Ітаном Пеком, вимагала від соціальної медіа-компанії конвертувати частину своїх 72 мільярдів…

10 години ago