GPT-4, последняя версия чат-бота с искусственным интеллектом (AI), ChatGPT, может сдавать тесты в старших классах и экзамены на юридический факультет с оценками в 90-м процентиле и имеет новые возможности обработки, которые были недоступны в предыдущей версии.
14 марта его создатель OpenAI поделился цифрами результатов тестов GPT-4, показав, что он также может преобразовывать изображения, аудио и видео в текст в дополнение к более творческой и надежной обработке «гораздо более тонких инструкций».
«Он проходит смоделированный экзамен на адвоката с оценкой около 10% лучших участников теста», — добавил OpenAI. «Напротив, оценка GPT-3.5 была около нижних 10%».
Цифры показывают, что GPT-4 набрал 163 балла в 88-м процентиле на экзамене LSAT — тесте, который студенты колледжей должны пройти в Соединенных Штатах, чтобы поступить в юридический вуз.
Оценка GPT4 ставит ее в хорошие условия для поступления в 20 лучших юридических школ, и всего на несколько баллов меньше заявленных оценок, необходимых для поступления в престижные школы, такие как Гарвард, Стэнфорд, Принстон или Йель.
Предыдущая версия ChatGPT набрала всего 149 баллов на LSAT, что означает, что она попала в нижние 40%.
GPT-4 также набрал 298 баллов из 400 на Едином экзамене для юристов — тесте, который сдают недавно окончившие учебу студенты юридических факультетов, что позволяет им заниматься адвокатской практикой в любой юрисдикции США.
Старая версия ChatGPT боролась с трудностями в этом тесте, заняв 10% худших результатов с результатом 213 баллов из 400.
Что касается экзаменов SAT Evidence-Based Reading & Writing и SAT Math, сдаваемых учащимися средних школ США для оценки их готовности к поступлению в колледж, GPT-4 набрал 93-й и 89-й процентили соответственно.
GPT-4 преуспел и в «точных» науках, набрав намного выше среднего процентиля по биологии (85–100%), химии (71–88%) и физике 2 (66–84%).
Однако его оценка AP Calculus была довольно средней, занимая от 43r до 59-го процентиля.
Еще одна область, в которой не хватало GPT-4, — это экзамены по английской литературе, в которых баллы находились в диапазоне от 8-го до 44-го процентиля по двум отдельным тестам.
OpenAI заявила, что GPT-4 и GPT-3.5 взяли эти тесты из практических экзаменов 2022–2023 годов, и что инструменты обработки языка не проходили «специального обучения»:
«Мы не проводили специальной подготовки к этим экзаменам. Меньшая часть проблем на экзаменах была замечена моделью во время обучения, но мы считаем, что результаты репрезентативны».
Результаты вызвали страх и в сообществе Twitter.
Связанный: Как ChatGPT повлияет на пространство Web3?Отраслевые ответы
Ник Алмонд, основатель FactoryDAO, 14 марта сообщил своим 14 300 подписчикам в Твиттере, что GPT4 собирается «напугать людей» и «обрушит» глобальную систему образования.
Бывший директор Coinbase Конор Гроган сказал, что вставил активный смарт-контракт Ethereum в GPT-4, сразу же указал на несколько «уязвимостей безопасности» и рассказал, как можно использовать код:
Более ранние аудиты смарт-контрактов в ChatGPT показали, что его первая версия также способна в разумной степени обнаруживать ошибки в коде.
Роуэн Чунг, основатель информационного бюллетеня AI «The Rundown», поделился видео о том, как GPT транскрибирует нарисованный от руки поддельный веб-сайт на листе бумаги в код.