OpenAI наконец запускает «Расширенный голосовой режим» для выбора пользователей ChatGPT

Новости

После нескольких задержек, которые, как сообщается, были связаны с безопасностью и тонкой настройкой, долгожданный «Расширенный голосовой режим» (AVM) OpenAI для ChatGPT теперь доступен в альфа-версии для избранных пользователей.

Функция AVM была анонсирована и продемонстрирована еще в мае. Он позволяет пользователям общаться в реальном времени с моделью искусственного интеллекта ChatGPT через модуль синтеза речи.

Помните Дуплекс?

Те, кто знаком с этой концепцией, возможно, помнят объявление Google в 2018 году о том, что его служба искусственного интеллекта «Duplex» будет доступна «скоро». На мероприятии для разработчиков IO компания продемонстрировала систему искусственного интеллекта, способную звонить в компании от вашего имени и назначать встречи с людьми в режиме реального времени.

Основная идея, по мнению Google, заключалась в том, чтобы ИИ был достаточно надежным, чтобы справляться с обычным разговором и подтверждать правильную информацию.

Проект Duplex в конечном итоге был закрыт, но его наследие, по-видимому, продолжает жить в ChatGPT OpenAI.

Расширенный голосовой режим

AVM обеспечивает общение в реальном времени, которое пытается имитировать дискуссии между людьми. ChatGPT отвечает на запросы пользователей человеческим голосом с естественным ритмом. Пользователи могут прервать чат-бота на полуслове, и, судя по демо-версии, он может отслеживать сказанное.

Компания запускает эту функцию в ограниченной альфа-версии, чтобы продолжить оценку ее возможностей и последствий для безопасности. Хотя майские демонстрации были впечатляющими, были и некоторые сбои, и нетрудно представить сценарии, в которых технология может быть использована не по назначению.

Источник: ОпенАИ.

Согласно OpenAI, безопасность является первоочередной заботой компании. В сообщении на X, объявляющем о запуске этой функции, компания написала:

«Мы протестировали голосовые возможности GPT-4o с более чем 100 внешними участниками Red Team на 45 языках. Чтобы защитить конфиденциальность людей, мы научили модель говорить только четырьмя заданными голосами и создали системы для блокировки выходных сигналов, отличающихся от этих голосов. Мы также внедрили защитные меры для блокировки запросов на контент, содержащий насилие или защищенный авторским правом».

По данным OpenAI, запланированное развертывание AVM уже началось и будет продолжаться с добавлением новых пользователей «по мере поступления». Компания ожидает, что эта функция станет доступна всем подписчикам Plus осенью.

Связанный: OpenAI приостанавливает голос ChatGPT, обвиненный в подражании Скарлетт Йоханссон

Источник

Автор и инвестор в криптовалюты, являюсь экспертом в этой области. Не только пишу статьи о криптовалютах и блокчейн технологиях, но и являюсь активным участником криптосообщества, занимающимся инвестированием в различные криптовалюты.

Использую знания и опыт в написании статей, чтобы помочь читателям понять сложные аспекты криптоиндустрии и принимать обоснованные решения относительно инвестирования в криптовалюты. Делюсь личными опытами и инсайтами, полученными в ходе инвестиций, чтобы помочь другим инвесторам делать обоснованные выборы.

Оцените автора
CryptoHamster.org
Добавить комментарий