Останні кілька місяців компанії, такі як @ perplexity_ai, @ browsercompany і @ OpenAI, презентували власні agentic browsers.
Для них це логічний крок — отримати контроль над браузерним рівнем, адже це дозволяє керувати всією операційною системою та користувацьким досвідом.
Більшість дій у таких браузерах зосереджені на read layer: читанні, поясненні й підсумовуванні контенту на екрані. Однак браузери на кшталт Comet дозволяють запускати browser agents, які можуть виконувати дії (write) від вашого імені.

@ perplexity_ai Comet із Reddit
Наразі, якщо ви хочете, щоб ваш agentic browser здійснював для вас трейдинг, процес виглядає так:

Описаний вище процес займає близько 10 секунд, з яких лише приблизно 2 секунди йде на обробку swap onchain.
Browser agent постійно робить скріншоти поточного вікна, обробляє їх і виконує дії через DOM. Якщо інтерфейс додатка складний, цей процес сповільнюється.
У криптовалюті, де вирішальною є кожна мілісекунда, ви захочете, щоб ваш агент діяв максимально швидко. Уявіть, що ви не змогли купити токен у потрібний момент, бо ваш агент (тут — браузер) намагався розібратися зі складним інтерфейсом, подібним до Bloomberg Terminal.

Інтерфейс статистики McD у 2016 році
Жодна LLM не зможе легко орієнтуватися в такому інтерфейсі, а більшість протоколів і застосунків у крипто мають незручні UI.
Agentic browser не може використати головну перевагу крипто — публічність даних і протоколів.
Будь-який агент, що взаємодіє з крипто,
Кожен користувач повинен мати базове право доступу до систем, які дозволяють створювати та виконувати складні фінансові задачі без написання скриптів, програмування чи розгортання власної інфраструктури — лише за допомогою простих англійських prompt.
Один якісний prompt цінніший за тисячу рядків коду.
У SendAI ми працюємо над тим, щоб кожен користувач мав це фундаментальне право.





