Французский стартап Mistral AI добавил новую запатентованную модель большого языка (LLM) на все более переполненный рынок искусственного интеллекта, утверждая, что его новый Mistral Large может дать конкурентам несколько крупных конкурентов.
В сообщении от 26 февраля парижская фирма отметила, что Mistral Large превзошла несколько известных LLM, за исключением GPT-4, в тесте на «понимание многозадачного языка» и показала хорошие результаты в нескольких тестах по математике и программированию.
Однако производительность Mistral Large не сравнивалась с такими устройствами, как Grok от xAI и Gemini Ultra от Google, которые были выпущены в ноябре прошлого года и в начале февраля соответственно.
Гийом Лампле, основатель и главный научный сотрудник фирмы, утверждает, что Mistral Large «значительно превосходит» более ранние модели Mistral AI. Mistral AI также представила «Le Chat» — интерфейс чата с искусственным интеллектом в верхней части своих моделей — аналогичный тому, как ChatGPT построен на GPT-3.5 и GPT-4.
Today, we are releasing Mistral Large, our latest model. Mistral Large is vastly superior to Mistral Medium, handles 32k tokens of context, and is natively fluent in English, French, Spanish, German, and Italian.
We have also updated Mistral Small on our API to a model that is… pic.twitter.com/MO4m6UIJUV
— Guillaume Lample (@GuillaumeLample) February 26, 2024
Фирма, получившая в декабре финансирование в размере 487 миллионов долларов от таких компаний, как Nvidia, Salesforce и Andreessen Horowitz, отметила, что Mistral Large знает более 20 000 слов на английском языке, а также свободно говорит на французском, испанском, немецком и итальянском языках.
В то время как первая модель Mistral AI была выпущена под лицензией с открытым исходным кодом, Mistral Large представляет собой закрытую проприетарную модель, похожую на последние LLM, выпущенные OpenAI, что привело к разочарованию некоторых наблюдателей по X.
Хотя сторонние платформы для ранжирования чат-ботов с искусственным интеллектом, такие как Chatbot Arena, не оценивали Mistral Large, его более ранняя модель Mistral Medium занимает шестое место среди списка из более чем 60 LLM.
Тысячи парных рейтингов Chatbot Arena обрабатываются с помощью модели Брэдли-Терри, которая использует случайную выборку для получения рейтинга «Эло», оценивая, какая модель с наибольшей вероятностью выиграет в прямой конкуренции с другой моделью.
Фирма также недавно объявила о своем партнерстве с Microsoft, что сделает Mistral Large доступным в Azure AI Studio и Azure Machine Learning.
We're announcing a multi-year partnership with @MistralAI, as we build on our commitment to offer customers the best choice of open and foundation models on Azure. https://t.co/k1L7lfFeES
— Satya Nadella (@satyanadella) February 26, 2024
«Доверие Microsoft к нашей модели — это шаг вперед на нашем пути», — заявила Mistral AI о своей коммерческой программе LLM.
Mistral Large будет использовать «суперкомпьютерную инфраструктуру» Azure для обучения и масштабирования, а обе компании также будут сотрудничать в исследованиях и разработках в области искусственного интеллекта, согласно заявлению от 26 февраля Эрика Бойда, корпоративного вице-президента Microsoft Azure AI Platform.
По теме: Илон Маск запускает чат-бота с искусственным интеллектом Grok и говорит, что он может превзойти ChatGPT
Mistral Large стоит 8 долларов за миллион входных токенов и 24 доллара за миллион выходных токенов, что делает его лишь немного дешевле, чем GPT-4 Turbo — 10 и 30 долларов соответственно.
По данным Bloomberg, в декабре прошлого года Mistral был оценен почти в 2 миллиарда долларов.