Будущее искусственного интеллекта может включать скорее корпоративные поглощения, чем восстание роботов. Об этом заявил генеральный директор AI-компании Anthropic Дарио Амодей.
Амодей недавно обсудил будущее искусственного интеллекта в интервью с Ноем Смитом и Эриком Торенбергом в подкасте Econ 102. Трио затронуло все: от военного использования ИИ до замены людей более эффективными машинами.
Однако, пожалуй, наиболее интересно то, что Амодей рассказал о внутренних усилиях компании по разработке эффективной иерархической структуры для выполнения задач с помощью сети моделей искусственного интеллекта.
Сети внутри сетей
Искусственный интеллект, с которым сегодня знакомо большинство людей, представлен в виде чат-ботов и генераторов изображений. ChatGPT от OpenAI и Claude от Anthropic — это современные системы искусственного интеллекта, разработка которых по отдельности обошлась в десятки миллиардов долларов.
Но большинство полезных приложений для технологии, лежащей в основе этих систем, не требуют их полных возможностей. Если, например, вы используете Claude для генерации кода Python для приложения Web3, вы, вероятно, не получите никакой пользы от способности модели генерировать стихи на французском языке.
Как описал Амодей в интервью, нынешнее мышление компании, похоже, связано с идеей создания роев ИИ, способных объединяться в сети для выполнения конкретных задач.
Основная предпосылка будет заключаться в том, что «большие модели управляют маленькими моделями». Амодей добавил, что более крупные модели создадут до сотен меньших, более быстрых и эффективных моделей для выполнения задач.
Хотя Амодей использовал аналогию с рабочими пчелами, поддерживающими свою матку, то, что он описал, очень похоже на типичную корпоративную инфраструктуру.
Наверху будет базовая модель Claude, самая мощная система Anthropic. А под этим будет несколько дорогостоящих фундаментальных моделей, обученных в таких широких областях, как математика, программирование и анализ настроений. Под этими машинами высшего звена будет целый ряд специализированных моделей, предназначенных для выполнения конкретных задач. И, наконец, у специалистов среднего звена мы найдем одноразовые модели начального уровня, рассчитанные на краткосрочное использование.
Преимущество этой конструкции потенциально может означать, что конечные пользователи на каждом уровне будут иметь доступ к конкретным возможностям, которые им нужны, через единый простой пользовательский интерфейс.
Связанный: Физика для финансовых технологий: как квантовый ИИ может сделать людей лучшими трейдерами криптовалют