Категории: Новости

Новая модель искусственного интеллекта Nvidia с открытым исходным кодом превосходит GPT-4o в тестах

15 октября Nvidia бесцеремонно представила новую модель искусственного интеллекта, которая, как утверждается, превосходит по производительности самые современные системы искусственного интеллекта, включая GPT-4o и Claude-3.

Согласно сообщению на платформе социальных сетей X.com из учетной записи Nvidia AI Developer, новая модель, получившая название Llama-3.1-Nemotron-70B-Instruct, «является ведущей моделью» на Chatbot Arena lmarena. AI.

Nvidia AI объявляет результаты тестов Nemotron. Источник: NVIDIA AI.

Немотрон

Llama-3.1-Nemotron-70B-Instruct, по сути, является модифицированной версией Llama-3.1-70B-Instruct от Meta с открытым исходным кодом. Часть названия модели «Немотрон» отражает вклад Nvidia в конечный результат.

«Стадо» моделей искусственного интеллекта ламы, как их называет Meta, предназначено для использования в качестве основы с открытым исходным кодом для разработчиков.

В случае с Nemotron компания Nvidia приняла вызов и разработала систему, призванную быть более «полезной», чем популярные модели, такие как ChatGPT от OpenAI и Claude-3 от Anthropic.

Nvidia использовала специально подобранные наборы данных, передовые методы точной настройки и собственное современное оборудование искусственного интеллекта, чтобы превратить стандартную модель Meta в, возможно, самую «полезную» модель искусственного интеллекта на планете.

Сообщение инженера на X.com, в котором он выражает восхищение возможностями Nemotron. Источник: Шаян Таслим

«Я задал ему несколько вопросов по программированию, которые обычно задаю для сравнения программ LLM, и получил одни из лучших ответов. лол, черт возьми».

Бенчмаркинг

Когда дело доходит до определения того, какая модель ИИ является «лучшей», не существует четкой методологии. В отличие, например, от измерения температуры окружающей среды с помощью ртутного термометра, не существует единой «истины», когда речь идет о производительности модели ИИ.

Разработчики и исследователи должны определить, насколько хорошо модель ИИ работает так же, как оцениваются люди: посредством сравнительного тестирования.

Связанный: «Загрузка разума» ИИ может позволить мертвым торговать вечно

Бенчмаркинг ИИ предполагает предоставление различным моделям ИИ одних и тех же запросов, задач, вопросов или проблем, а затем сравнение полезности результатов. Часто из-за субъективности того, что считается полезным, а что нет, для определения производительности машины посредством слепых оценок используются люди-контролеры.

В случае с Nemotron, похоже, что Nvidia утверждает, что новая модель превосходит существующие современные модели, такие как GPT-4o и Claude-3, с довольно большим отрывом.

Вершина таблицы лидеров Chatbot Arena. Источник: LMArenea. AI

На изображении выше показаны рейтинги автоматического «сложного» теста в таблицах лидеров Chatbot Arena. Хотя Llama-3.1-Nemotron-70B-Instruct от Nvidia, похоже, нигде не указана на платах, если утверждение разработчика о том, что она набрала 85 баллов в этом тесте, справедливо, то это будет де-факто топ-модель в этом конкретном разделе..

Что делает это достижение, возможно, еще более интересным, так это то, что Llama-3.1-70B — это модель ИИ среднего уровня с открытым исходным кодом от Meta. Существует гораздо более крупная версия Llama-3.1, версия 405B (где число означает, сколько миллиардов параметров было настроено в модели).

Для сравнения, GPT-4o, по оценкам, был разработан с более чем одним триллионом параметров.

Alexander Zhdanov

Автор и инвестор в криптовалюты, являюсь экспертом в этой области. Не только пишу статьи о криптовалютах и блокчейн технологиях, но и являюсь активным участником криптосообщества, занимающимся инвестированием в различные криптовалюты. Использую знания и опыт в написании статей, чтобы помочь читателям понять сложные аспекты криптоиндустрии и принимать обоснованные решения относительно инвестирования в криптовалюты. Делюсь личными опытами и инсайтами, полученными в ходе инвестиций, чтобы помочь другим инвесторам делать обоснованные выборы.

Недавние статьи

Dogecoin подскочил на 16% за последнюю неделю: впереди еще больше прироста?

Dogecoin (DOGE), изначально являвшийся всего лишь мемом, снова демонстрирует значительную рыночную силу.16 октября 2024 года…

3 часа ago

Большинство избирателей США предпочитают кандидата, выступающего за криптовалюту — Grayscale CLO

Более половины избирателей в Соединенных Штатах с большей вероятностью проголосуют за кандидата, поддерживающего криптовалюту, чем…

4 часа ago

Возможен ли биткоин стоимостью 100 000 долларов? Аналитик раскрывает основные катализаторы

Поскольку биткоин (BTC) приближается к отметке в 70 000 долларов, криптовалютное сообщество гудит от прогнозов…

5 часов ago

Нишад Сингх просит отбыть срок, заявляя об «ограниченной» роли в преступлениях FTX

Признав себя виновным в мошенничестве в 2023 году, бывший технический директор FTX Нишад Сингх попросил…

6 часов ago

Веб-сайт Ambient Finance взломан, команда предупреждает пользователей дождаться исправления

Интерфейс Ambient Finance — децентрализованного торгового протокола — был взломан 17 октября, и команда предупредила…

6 часов ago

Аналитик говорит, что это ралли цен на биткоин имеет «другое звучание», и ставит следующую цель на уровне 109 000 долларов

Новая целевая цена Биткоин была установлена ​​на уровне 109 000 долларов США, при этом аналитик…

7 часов ago