Сектор больших языковых моделей продолжает расти, поскольку StabilityAI, производитель популярного инструмента для создания изображений Stable Diffusion, запустил набор инструментов языковых моделей с открытым исходным кодом.
Общедоступные альфа-версии пакета, получившие название StableLM, в настоящее время содержат модели с тремя и семью миллиардами параметров, при этом модели с 15, 30 и 65 миллиардами параметров отмечены как «в процессе», а модель со 175 миллиардами запланирована для разработки в будущем.
Announcing StableLM❗
We’re releasing the first of our large language models, starting with 3B and 7B param models, with 15-65B to follow. Our LLMs are released under CC BY-SA license.
We’re also releasing RLHF-tuned models for research use. Read more→ https://t.co/R66Wa4gbnW pic.twitter.com/gvDDJMFBYJ
— Stability AI (@StabilityAI) April 19, 2023
Для сравнения, GPT-4 имеет количество параметров, оцениваемое в один триллион, что в шесть раз больше, чем у его предшественника GPT-3.
Однако количество параметров может не быть равномерным показателем эффективности LLM, как отметил Stability AI в своем сообщении в блоге, объявляющем о запуске StableLM:
«StableLM обучается на новом экспериментальном наборе данных, построенном на The Pile, но в три раза большем с 1,5 триллионами токенов контента […] Богатство этого набора данных дает StableLM удивительно высокую производительность в разговорных задачах и задачах кодирования, несмотря на его небольшой размер от 3 до7 миллиардов параметров».
В настоящее время неясно, насколько надежны модели StableLM. Команда StabilityAI отметила на странице организации в Github, что будет опубликована дополнительная информация о возможностях LM, включая спецификации модели и настройки обучения.
Связанный: Microsoft разрабатывает собственный ИИ-чип для поддержки ChatGPT
При условии, что модели продемонстрируют достаточно хорошие результаты при тестировании, появление мощной альтернативы OpenAI ChatGPT с открытым исходным кодом может оказаться интересным для мира торговли криптовалютой.
Как сообщает Cointelegraph, люди создают продвинутых торговых ботов на основе GPT API и новых вариантов, которые включают доступ к сторонним инструментам, таким как BabyAGI и AutoGPT.
Добавление моделей с открытым исходным кодом может стать благом для технически подкованных трейдеров, которые не хотят платить надбавки за доступ к OpenAI.
Желающие могут протестировать живой интерфейс для модели StableLM с параметрами 7B, размещенной на HuggingFace. Однако на момент публикации этой статьи наши попытки сделать это привели к тому, что веб-сайт был перегружен или перегружен.
Биткоинеры и правительственные чиновники Соединенных Штатов критиковали решение губернатора Аризоны Кэти Хоббс наложить вето на…
Биткоин сохраняет свою бычью форму с апреля, так как в первые два дня мая он…
Основатель OKX и генеральный директор STAR Сюй публично защищал обмен криптовалютами после того, как основатель…
Наряду с общим рынком криптовалют, Ethereum (ETH) зарегистрировал значительное восстановление рынка в конце апреля, чтобы…
Цена на биткоин началась месяц с аналогичного бычьего импульса, как и в последние недели апреля,…
Цена Ethereum может столкнуться с еще одним значительным аварией, поскольку алгоритм машинного обучения Coincodex прогнозирует…