Модель штучного інтелекту Gemini від Google вплітається в більшість технологій технічного гіганта, а ШІ незабаром з’явиться в Gmail, на YouTube і на смартфонах компанії.
У програмній промові на конференції розробників компанії I/O 2024 14 травня генеральний директор Сундар Пічаї розповів про деякі з найближчих місць, де з’явиться модель ШІ.
Пічаї згадав штучний інтелект 121 раз у своєму 110-хвилинному виступі, коли ця тема займала центральне місце — Gemini, який був запущений у грудні, потрапив у центр уваги.
Google використовує велику мовну модель (LLM) практично в усіх своїх пропозиціях, включаючи Android, Пошук і Gmail, і ось на що можуть розраховувати користувачі в майбутньому.
Gemini отримує більше контексту, оскільки він зможе взаємодіяти з програмами. У майбутньому оновленні користувачі зможуть викликати Gemini, щоб взаємодіяти з додатками, наприклад перетягувати зображення, створене штучним інтелектом, у повідомлення.
Користувачі YouTube також зможуть натиснути «Запитати це відео», щоб знайти певну інформацію у відео від ШІ.
Платформа електронної пошти Google, Gmail, також отримує інтеграцію зі штучним інтелектом, оскільки користувачі зможуть шукати, узагальнювати та створювати проекти своїх електронних листів за допомогою Gemini.
Помічник зі штучним інтелектом зможе виконувати дії з електронними листами для більш складних завдань, таких як допомога в обробці повернень електронної комерції шляхом пошуку в папці “Вхідні”, пошуку квитанції та заповнення онлайн-форм.
Google також представила новий досвід під назвою Gemini Live, де користувачі можуть проводити «поглиблені» голосові чати зі штучним інтелектом на своїх смартфонах.
Чат-бот можна перервати під час відповіді для роз’яснень, і він адаптуватиметься до моделей мовлення користувачів у режимі реального часу. Крім того, Gemini також може бачити та реагувати на фізичне оточення за допомогою фотографій або відео, знятих на пристрій.
Google працює над розробкою інтелектуальних агентів ШІ, які можуть міркувати, планувати та виконувати складні багатоетапні завдання від імені користувача під наглядом. Мультимодальний означає, що штучний інтелект може виходити за межі тексту та обробляти зображення, аудіо та відео.
Приклади та випадки раннього використання включають автоматизацію повернення покупок і вивчення нового міста.
За темою: «Вбивця GPT-4» від Google Gemini вийшов, ось як ви можете його спробувати
Серед інших оновлень, які плануються для моделі штучного інтелекту фірми, — заміна Google Assistant на Android з Gemini, повністю інтегрованою в мобільну операційну систему.
Нова функція «Запитувати фотографії» дозволяє шукати в Library фотографій за допомогою запитів на природній мові, розроблених Gemini. Він може розуміти контекст, розпізнавати об’єкти та людей і узагальнювати фотоспогади у відповідь на запитання.
Згенеровані штучним інтелектом підсумкові відомості про місця та райони відображатимуться на Картах Google, використовуючи аналітичні дані з картографічних даних платформи.
Криптовалютний аналітик, який точно спрогнозував зростання ціни біткойна до історичного максимуму в 99 000 доларів…
Ціна Bitcoin (BTC) може досягти $180 тис. До кінця 2025 року — вважає Георгій Вербицький…
Cardano (ADA) показало одну з найкращих показників за останні три тижні, піднявшись на 200% до…
Біржові фонди Spot Bitcoin (ETF) пережили свій четвертий найкращий тиждень інвестицій, тоді як ETF, що…
Ціна Dogecoin нещодавно показала класичну модель бичачого прапора на своєму ціновому графіку, технічний індикатор, який…
Ціна ефіру може спостерігати неминучу корекцію в найближчі тижні, перш ніж вона відновить стабільне зростання…