ChatGPT V4 превосходит планку, SAT и может выявлять эксплойты в контрактах ETH.

Автор Alexander Zhdanov На чтение 3 мин Просмотров 61 Опубликовано 15.03.2023 Обновлено 15.03.2023

GPT-4, последняя версия чат-бота с искусственным интеллектом (AI), ChatGPT, может сдавать тесты в старших классах и экзамены на юридический факультет с оценками в 90-м процентиле и имеет новые возможности обработки, которые были недоступны в предыдущей версии.

14 марта его создатель OpenAI поделился цифрами результатов тестов GPT-4, показав, что он также может преобразовывать изображения, аудио и видео в текст в дополнение к более творческой и надежной обработке «гораздо более тонких инструкций».

«Он проходит смоделированный экзамен на адвоката с оценкой около 10% лучших участников теста», — добавил OpenAI. «Напротив, оценка GPT-3.5 была около нижних 10%».

Цифры показывают, что GPT-4 набрал 163 балла в 88-м процентиле на экзамене LSAT — тесте, который студенты колледжей должны пройти в Соединенных Штатах, чтобы поступить в юридический вуз.

Результаты экзаменов GPT-4 и GPT-3.5 ряда недавних экзаменов в США. Источник: OpenAI

Оценка GPT4 ставит ее в хорошие условия для поступления в 20 лучших юридических школ, и всего на несколько баллов меньше заявленных оценок, необходимых для поступления в престижные школы, такие как Гарвард, Стэнфорд, Принстон или Йель.

Предыдущая версия ChatGPT набрала всего 149 баллов на LSAT, что означает, что она попала в нижние 40%.

GPT-4 также набрал 298 баллов из 400 на Едином экзамене для юристов — тесте, который сдают недавно окончившие учебу студенты юридических факультетов, что позволяет им заниматься адвокатской практикой в любой юрисдикции США.

Баллы UBE должны были быть допущены к юридической практике в каждой юрисдикции США. Источник: Национальная конференция адвокатов.

Старая версия ChatGPT боролась с трудностями в этом тесте, заняв 10% худших результатов с результатом 213 баллов из 400.

Что касается экзаменов SAT Evidence-Based Reading & Writing и SAT Math, сдаваемых учащимися средних школ США для оценки их готовности к поступлению в колледж, GPT-4 набрал 93-й и 89-й процентили соответственно.

GPT-4 преуспел и в «точных» науках, набрав намного выше среднего процентиля по биологии (85–100%), химии (71–88%) и физике 2 (66–84%).

Результаты экзаменов GPT-4 и GPT-3.5 ряда недавних экзаменов в США. Источник: OpenAI.

Однако его оценка AP Calculus была довольно средней, занимая от 43r до 59-го процентиля.

Еще одна область, в которой не хватало GPT-4, — это экзамены по английской литературе, в которых баллы находились в диапазоне от 8-го до 44-го процентиля по двум отдельным тестам.

OpenAI заявила, что GPT-4 и GPT-3.5 взяли эти тесты из практических экзаменов 2022–2023 годов, и что инструменты обработки языка не проходили «специального обучения»:

«Мы не проводили специальной подготовки к этим экзаменам. Меньшая часть проблем на экзаменах была замечена моделью во время обучения, но мы считаем, что результаты репрезентативны».

Результаты вызвали страх и в сообществе Twitter.

Связанный: Как ChatGPT повлияет на пространство Web3?Отраслевые ответы

Ник Алмонд, основатель FactoryDAO, 14 марта сообщил своим 14 300 подписчикам в Твиттере, что GPT4 собирается «напугать людей» и «обрушит» глобальную систему образования.

Бывший директор Coinbase Конор Гроган сказал, что вставил активный смарт-контракт Ethereum в GPT-4, сразу же указал на несколько «уязвимостей безопасности» и рассказал, как можно использовать код:

Более ранние аудиты смарт-контрактов в ChatGPT показали, что его первая версия также способна в разумной степени обнаруживать ошибки в коде.

Роуэн Чунг, основатель информационного бюллетеня AI «The Rundown», поделился видео о том, как GPT транскрибирует нарисованный от руки поддельный веб-сайт на листе бумаги в код.