Категории: Новости

Новая модель искусственного интеллекта Nvidia с открытым исходным кодом превосходит GPT-4o в тестах

15 октября Nvidia бесцеремонно представила новую модель искусственного интеллекта, которая, как утверждается, превосходит по производительности самые современные системы искусственного интеллекта, включая GPT-4o и Claude-3.

Согласно сообщению на платформе социальных сетей X.com из учетной записи Nvidia AI Developer, новая модель, получившая название Llama-3.1-Nemotron-70B-Instruct, «является ведущей моделью» на Chatbot Arena lmarena. AI.

Nvidia AI объявляет результаты тестов Nemotron. Источник: NVIDIA AI.

Немотрон

Llama-3.1-Nemotron-70B-Instruct, по сути, является модифицированной версией Llama-3.1-70B-Instruct от Meta с открытым исходным кодом. Часть названия модели «Немотрон» отражает вклад Nvidia в конечный результат.

«Стадо» моделей искусственного интеллекта ламы, как их называет Meta, предназначено для использования в качестве основы с открытым исходным кодом для разработчиков.

В случае с Nemotron компания Nvidia приняла вызов и разработала систему, призванную быть более «полезной», чем популярные модели, такие как ChatGPT от OpenAI и Claude-3 от Anthropic.

Nvidia использовала специально подобранные наборы данных, передовые методы точной настройки и собственное современное оборудование искусственного интеллекта, чтобы превратить стандартную модель Meta в, возможно, самую «полезную» модель искусственного интеллекта на планете.

Сообщение инженера на X.com, в котором он выражает восхищение возможностями Nemotron. Источник: Шаян Таслим

«Я задал ему несколько вопросов по программированию, которые обычно задаю для сравнения программ LLM, и получил одни из лучших ответов. лол, черт возьми».

Бенчмаркинг

Когда дело доходит до определения того, какая модель ИИ является «лучшей», не существует четкой методологии. В отличие, например, от измерения температуры окружающей среды с помощью ртутного термометра, не существует единой «истины», когда речь идет о производительности модели ИИ.

Разработчики и исследователи должны определить, насколько хорошо модель ИИ работает так же, как оцениваются люди: посредством сравнительного тестирования.

Связанный: «Загрузка разума» ИИ может позволить мертвым торговать вечно

Бенчмаркинг ИИ предполагает предоставление различным моделям ИИ одних и тех же запросов, задач, вопросов или проблем, а затем сравнение полезности результатов. Часто из-за субъективности того, что считается полезным, а что нет, для определения производительности машины посредством слепых оценок используются люди-контролеры.

В случае с Nemotron, похоже, что Nvidia утверждает, что новая модель превосходит существующие современные модели, такие как GPT-4o и Claude-3, с довольно большим отрывом.

Вершина таблицы лидеров Chatbot Arena. Источник: LMArenea. AI

На изображении выше показаны рейтинги автоматического «сложного» теста в таблицах лидеров Chatbot Arena. Хотя Llama-3.1-Nemotron-70B-Instruct от Nvidia, похоже, нигде не указана на платах, если утверждение разработчика о том, что она набрала 85 баллов в этом тесте, справедливо, то это будет де-факто топ-модель в этом конкретном разделе..

Что делает это достижение, возможно, еще более интересным, так это то, что Llama-3.1-70B — это модель ИИ среднего уровня с открытым исходным кодом от Meta. Существует гораздо более крупная версия Llama-3.1, версия 405B (где число означает, сколько миллиардов параметров было настроено в модели).

Для сравнения, GPT-4o, по оценкам, был разработан с более чем одним триллионом параметров.

Alexander Zhdanov

Автор и инвестор в криптовалюты, являюсь экспертом в этой области. Не только пишу статьи о криптовалютах и блокчейн технологиях, но и являюсь активным участником криптосообщества, занимающимся инвестированием в различные криптовалюты. Использую знания и опыт в написании статей, чтобы помочь читателям понять сложные аспекты криптоиндустрии и принимать обоснованные решения относительно инвестирования в криптовалюты. Делюсь личными опытами и инсайтами, полученными в ходе инвестиций, чтобы помочь другим инвесторам делать обоснованные выборы.

Недавние статьи

Биткоин стоимостью 99 тысяч долларов отреагировал на объявление Генслера об уходе из SEC

Биткоин (BTC) в четверг подскочил выше 99 000 долларов, установив новый рубеж, а затем немного…

3 часа ago

Биткоин, не обеспокоенный истечением срока действия опционов на 2,6 миллиарда долларов, продолжает расти до 100 тысяч долларов

Биткоин остается на пути к отметке в 100 000 долларов, несмотря на опасения инвесторов по…

6 часов ago

Токен Ethena растет благодаря интеграции USDe с Deribit

Deribit, одна из крупнейших в мире бирж криптовалютных деривативов, планирует интегрировать синтетический доллар Ethena USDe…

7 часов ago

Allianz, крупнейший страховщик Германии, покупает 24% облигаций MicroStrategy на сумму 2,6 миллиарда долларов.

Крупнейшая страховая компания Германии Allianz приобрела почти четверть конвертируемых банкнот MicroStrategy на сумму 2,6 миллиарда…

8 часов ago

По словам законодателя, техасская монета, обеспеченная золотом, призвана помочь принятию Биткоин

Законодатель из Техаса считает, что предложенная штатом цифровая валюта, обеспеченная золотом, может сыграть ключевую роль…

9 часов ago

Цена эфира составит $3,7 тыс. , несмотря на китовую распродажу на $1,3 млрд.

Несмотря на массовые распродажи со стороны ранних инвесторов стоимостью в миллионы, некоторые из самых популярных…

10 часов ago