Anthropic, дослідницька організація штучного інтелекту (AI), відповідальна за модель великої мови Claude (LLM), нещодавно опублікувала визначне дослідження того, як і чому чат-боти AI вирішують генерувати результати, які вони роблять.
У центрі дослідження команди лежить питання про те, чи системи LLM, такі як Claude, ChatGPT від OpenAI і Bard від Google, покладаються на «запам’ятовування» для генерування результатів, чи існує глибший зв’язок між навчальними даними, тонким налаштуванням і тим, що зрештою виводиться.
https://twitter.com/AnthropicAI/status/1688946699254071296?ref_src=twsrc%5Etfw
Злиття шарів нейронної мережі разом із величезним розміром наборів даних означає, що сфера цього поточного дослідження обмежена попередньо підготовленими моделями, які не були точно налаштовані. Його результати ще не зовсім застосовні до Claude 2 або GPT-4, але це дослідження, здається, є кроком у цьому напрямку.
У майбутньому команда сподівається застосувати ці методи до більш складних моделей і, зрештою, розробити метод визначення того, що саме робить кожен нейрон у нейронній мережі під час функціонування моделі.
Законодавець Техасу вважає, що запропонована штатом цифрова валюта, забезпечена золотом, може зіграти ключову роль у…
Незважаючи на великі розпродажі від перших інвесторів на мільйони, деякі з найпопулярніших галузевих аналітиків вважають,…
Ціна Ethereum (ETH) нарешті змінилася після тижня бічного руху. За останню годину друга за величиною…
Ціна біткойна показала найбільшу місячну свічку в історії криптовалюти, оскільки перша в світі криптовалюта вперше…
Комісія з торгівлі товарними ф’ючерсами США (CFTC) зіграла ключову роль у впровадженні стратегії «регулювання через…
Популярний гаманець Web3 Best Wallet надає інвесторам можливість придбати частку в його майбутньому через попередній…