Категории: Разное

Нові оновлення OpenAI покращують голосові та зорові можливості ШІ

Розробник штучного інтелекту OpenAI увійшов у жовтень з декількома оновленнями своїх моделей, що допомогло його моделям ШІ брати участь у кращих розмовах і покращити розпізнавання зображень.

1 жовтня OpenAI оприлюднив чотири оновлення, які представляють нові інструменти, призначені для того, щоб розробникам було легше створювати моделі штучного інтелекту.

Воно говорить!

Одним із основних оновлень є Realtime API, який дозволяє розробникам створювати голосові програми, згенеровані штучним інтелектом, за допомогою єдиного запиту.

Інструмент, доступний для тестування, підтримує мультимодальний досвід із низькою затримкою, передаючи потокове аудіо введення та виведення, уможливлюючи природні розмови, подібні до розширеного голосового режиму ChatGPT.

Раніше розробникам доводилося «зшивати» кілька моделей, щоб створити такий досвід. Аудіовхід зазвичай потрібно було повністю завантажити й обробити, перш ніж отримати відповідь, що означало вищу затримку для додатків у реальному часі, таких як голосові розмови.

За темою: Apple, Google використовуватимуть штучний інтелект для збереження домінування — ARK Invest Кеті Вуд

Завдяки можливості потокового передавання Realtime API розробники тепер можуть увімкнути негайну природну взаємодію, подібно до голосових помічників. API працює на GPT-4, випущеному в травні 2024 року, який може обробляти аудіо, зображення та текст у режимі реального часу.

ШІ тепер чітко бачить

Інше оновлення включає інструмент тонкого налаштування для розробників, що дозволяє їм покращувати відповіді штучного інтелекту, створені на основі введених зображень і тексту.

За словами розробника, точні налаштування на основі зображень дозволяють штучному інтелекту краще розуміти зображення, у свою чергу покращуючи можливості візуального пошуку та виявлення об’єктів. Процес включає відгуки людей, які надають приклади хороших і поганих відповідей.

На додаток до оновлень голосу та зору, OpenAI також запровадив «дистиляцію моделі» та «швидке кешування», які дозволяють меншим моделям навчатися у більших і зменшують витрати та час на розробку шляхом повторного використання вже обробленого тексту.

Розширені можливості його моделей є ключовою перевагою продажу, оскільки основну частину прибутку OpenAI отримує від компаній, які створюють власні програми на основі технології OpenAI.

Згідно з даними Reuters, наступного року дохід OpenAI зросте до 11,6 мільярда доларів проти 3,7 мільярда доларів у 2024 році.

CryptoHamster

Недавние статьи

Lamborghini додає автомобілі до ігор Web3 разом з Animoca, партнером Motorverse

Виробник автомобілів класу люкс Automobili Lamborghini анонсував платформу Web3 під назвою «Fast ForWorld», яка дозволить…

4 години ago

Чи підштовхне ізраїльсько-іранський конфлікт біткойн далі до падіння? Аналітики обговорюють

Ціна біткойна різко впала до 60 164 доларів США у вівторок після загострення геополітичної напруженості…

4 години ago

Ava Protocol, партнер Sony Soneium для автоматизації блокчейну без коду

Ava Protocol, постачальник інфраструктури Web3, співпрацює з Soneium, блокчейном рівня 2 від Sony Block Solutions…

4 години ago

Onchain грошовий фонд Франкліна Темплтона працює на блокчейні Aptos

Aptos Foundation і глобальний гігант з управління активами Franklin Templeton оголосили про інтеграцію Фонду уряду…

5 години ago

Міський міністр Великобританії просуває блокчейн-гілти, незважаючи на занепокоєння уряду

Міський міністр Сполученого Королівства Туліп Сіддік виступив за впровадження gilt на основі блокчейну, форми державних…

5 години ago

Стайблкойни тепер становлять 43% від обсягу передачі криптовалюти країн Африки на південь від Сахари: Chainalysis

Зараз транзакції зі стейблкойнами становлять майже половину загального обсягу транзакцій у країнах Африки на південь…

5 години ago