После нескольких задержек, которые, как сообщается, были связаны с безопасностью и тонкой настройкой, долгожданный «Расширенный голосовой режим» (AVM) OpenAI для ChatGPT теперь доступен в альфа-версии для избранных пользователей.
Функция AVM была анонсирована и продемонстрирована еще в мае. Он позволяет пользователям общаться в реальном времени с моделью искусственного интеллекта ChatGPT через модуль синтеза речи.
Те, кто знаком с этой концепцией, возможно, помнят объявление Google в 2018 году о том, что его служба искусственного интеллекта «Duplex» будет доступна «скоро». На мероприятии для разработчиков IO компания продемонстрировала систему искусственного интеллекта, способную звонить в компании от вашего имени и назначать встречи с людьми в режиме реального времени.
Основная идея, по мнению Google, заключалась в том, чтобы ИИ был достаточно надежным, чтобы справляться с обычным разговором и подтверждать правильную информацию.
Проект Duplex в конечном итоге был закрыт, но его наследие, по-видимому, продолжает жить в ChatGPT OpenAI.
AVM обеспечивает общение в реальном времени, которое пытается имитировать дискуссии между людьми. ChatGPT отвечает на запросы пользователей человеческим голосом с естественным ритмом. Пользователи могут прервать чат-бота на полуслове, и, судя по демо-версии, он может отслеживать сказанное.
Компания запускает эту функцию в ограниченной альфа-версии, чтобы продолжить оценку ее возможностей и последствий для безопасности. Хотя майские демонстрации были впечатляющими, были и некоторые сбои, и нетрудно представить сценарии, в которых технология может быть использована не по назначению.
Согласно OpenAI, безопасность является первоочередной заботой компании. В сообщении на X, объявляющем о запуске этой функции, компания написала:
«Мы протестировали голосовые возможности GPT-4o с более чем 100 внешними участниками Red Team на 45 языках. Чтобы защитить конфиденциальность людей, мы научили модель говорить только четырьмя заданными голосами и создали системы для блокировки выходных сигналов, отличающихся от этих голосов. Мы также внедрили защитные меры для блокировки запросов на контент, содержащий насилие или защищенный авторским правом».
По данным OpenAI, запланированное развертывание AVM уже началось и будет продолжаться с добавлением новых пользователей «по мере поступления». Компания ожидает, что эта функция станет доступна всем подписчикам Plus осенью.
Связанный: OpenAI приостанавливает голос ChatGPT, обвиненный в подражании Скарлетт Йоханссон
Доктор СиньСинь Фан, руководитель отдела криптовалюты в IoTeX, недавно стал соавтором исследовательской работы под названием…
Цена Биткоина на этой неделе выросла с того места, где она остановилась на предыдущей неделе,…
В то время как Ethereum, похоже, начал свой крупный рост, недавно этот актив испытал значительную…
Криптовалютный аналитик, который точно спрогнозировал рост цены Биткоина до исторического максимума в $99 000 (ATH),…
Цена Биткоина (BTC) может достичь $180 000 к концу 2025 года, считает Георгий Вербицкий, основатель…
Кардано (ADA) продемонстрировал один из лучших показателей за последние три недели, поднявшись более чем на…