Французький стартап Mistral AI додав нову запатентовану велику мовну модель (LLM) на все більш переповнений ринок ШІ, стверджуючи, що його новий Mistral Large може дати перевагу кільком основним конкурентам.
У дописі від 26 лютого паризька фірма зазначила, що Mistral Large перевершила кілька помітних LLM, за винятком GPT-4, у тесті на «багатозадачне розуміння мови» та показала високі результати в кількох математичних тестах і тестах з кодування.
Однак продуктивність Mistral Large не порівнювалася з такими, як Grok від xAI і Gemini Ultra від Google, які були випущені в листопаді минулого року та на початку лютого відповідно.
Гійом Лампл, засновник і головний науковий співробітник фірми, стверджує, що Mistral Large «значно перевершує» попередні моделі Mistral AI. Mistral AI також представив «Le Chat» — інтерфейс чату зі штучним інтелектом на основі своїх моделей — подібно до того, як ChatGPT побудовано на GPT-3.5 і GPT-4.
Today, we are releasing Mistral Large, our latest model. Mistral Large is vastly superior to Mistral Medium, handles 32k tokens of context, and is natively fluent in English, French, Spanish, German, and Italian.
We have also updated Mistral Small on our API to a model that is… pic.twitter.com/MO4m6UIJUV
— Guillaume Lample (@GuillaumeLample) February 26, 2024
Фірма, яка в грудні отримала 487 мільйонів доларів фінансування від Nvidia, Salesforce і Andreessen Horowitz, зазначила, що Mistral Large знає понад 20 000 слів англійською, а також вільно володіє французькою, іспанською, німецькою та італійською.
У той час як перша модель Mistral AI була випущена за ліцензією з відкритим вихідним кодом, Mistral Large є закритою пропрієтарною моделлю, подібною до останніх LLM, випущених OpenAI, що викликало розчарування у деяких спостерігачів на X.
Хоча сторонні платформи рейтингу чат-ботів зі штучним інтелектом, такі як Chatbot Arena, не оцінювали Mistral Large, його попередня модель Mistral Medium посідає шосте місце в списку з понад 60 LLM.
Тисячі парних рейтингів Chatbot Arena обробляються за допомогою моделі Бредлі-Террі, яка використовує випадкову вибірку для отримання рейтингу «Elo», оцінюючи, яка модель з найбільшою ймовірністю виграє в прямій конкуренції з іншою моделлю.
Фірма також нещодавно оголосила про партнерство з Microsoft, яке зробить Mistral Large доступним у Azure AI Studio та Azure Machine Learning.
We're announcing a multi-year partnership with @MistralAI, as we build on our commitment to offer customers the best choice of open and foundation models on Azure. https://t.co/k1L7lfFeES
— Satya Nadella (@satyanadella) February 26, 2024
«Довіра Microsoft до нашої моделі — це крок вперед на нашому шляху», — сказав Mistral AI про свій комерційний LLM.
Згідно із заявою Еріка Бойда, корпоративного віце-президента Microsoft Azure AI Platform, Mistral Large використовуватиме «суперкомп’ютерну інфраструктуру» Azure для навчання та масштабування, а дві компанії також співпрацюватимуть у дослідженні та розробці ШІ.
За темою: Ілон Маск запускає чат-бот зі штучним інтелектом «Grok», каже, що він може перевершити ChatGPT
Mistral Large коштує 8 доларів за один мільйон токенів введення та 24 долари за мільйон токенів виведення, що робить його лише трохи дешевшим за GPT-4 Turbo — 10 і 30 доларів відповідно.
За даними Bloomberg, у грудні минулого року “Містраль” оцінили майже в 2 мільярди доларів.