OpenRouter аналізує звіт про 100 трильйонів токенів: для чого люди насправді використовують AI, підйом китайських моделей та секрети утримання користувачів

2025-12-06 05:57:07

Генерація анотацій у процесі

Звіт OpenRouter показує, що ШІ входить у епоху агентного мислення, а китайські open-source моделі завдяки ролеплею та програмувальним можливостям стрімко завойовують глобальний ринок, а також ділиться реальними сценаріями використання від користувачів.

(Попередній контекст: Кеті Вуд заявила, що «ШІ — це не бульбашка»: відбувається повторення моменту вибуху багатства, як у часи інтернету.) (Додатковий фон: Google офіційно представила «Gemini 3»! Визнано найрозумнішою ШІ-моделлю у світі. Які особливості?)

Агрегатор AI-моделей OpenRouter цього тижня оприлюднив вагомий річний звіт «Звіт про стан ШІ у 2025 році». Звіт не базується на опитуваннях чи новинному хайпі, а є емпіричним аналізом даних у 100 трильйонів (100 Trillion) токенів, згенерованих на платформі OpenRouter.

Ці дані охоплюють понад 300 великих мовних моделей (LLM) і понад 60 постачальників, надаючи новий погляд на те, як саме ШІ використовується у реальному світі.

Зміна парадигми: від «передбачення наступного слова» до «агентного мислення» Якщо до 2024 року гонка AI стосувалася того, хто краще генерує текст, то тема 2025 року — це «мислення». Звіт відзначає: минулий рік став справжньою точкою біфуркації в еволюції LLM.

Запуск o1 і початок епохи мислення Звіт визначає 5 грудня 2024 року як ключову віху індустрії: саме цього дня OpenAI випустила першу масово адаптовану reasoning-модель — o1. До цього навіть найпотужніші моделі (як-от Claude 3.5 Sonnet чи GPT-4) по суті були ймовірнісними предикторами з одним проходом уперед. Вони наслідували мислення на основі патернів тренувальних даних, а не виконували реальні внутрішні обчислення.

Поява o1 усе змінила. Вона ввела обчислювальний процес під час інференсу: модель перед остаточною відповіддю проводить внутрішнє багатоступеневе обдумування (Deliberation), приховане планування (Latent Planning) та самокорекцію.

Підтвердження даними: За статистикою OpenRouter, з початку 2025 року частка токенів, що спрямовуються до «reasoning-оптимізованих моделей», зростає експоненційно. До кінця 2025 року понад 50% використання токенів припадає на такі мислячі моделі. Це означає, що користувачі вже не сприймають ШІ просто як чат-бот, а як «мозок», здатний вирішувати складні логічні задачі.

Зростання агентних робочих процесів Разом із зростанням мисленнєвих можливостей на перший план виходить ще одне поняття — «агентні робочі процеси». Користувачі починають створювати складні автоматизовані системи, у яких моделі не просто відповідають на питання, а й «вживають дії».

Звіт особливо аналізує дані щодо «інструментальних викликів» (tool calling) — здатності AI-моделей використовувати зовнішні інструменти (пошук в інтернеті, виконання програм, запити до баз даних).

Тренд: Використання tool calling упродовж 2025 року демонструє сталий і значний ріст.

Лідери моделей: Спочатку цю сферу очолювали gpt-4o-mini від OpenAI та серія Claude 3.5 від Anthropic. Але вже в другій половині року ринок став різноманітним: Gemini Flash від Google, Grok Code Fast від xAI та китайська GLM 4.5 швидко наздогнали лідерів за здатністю роботи з інструментами, що стимулювало поширення корпоративної автоматизації.

Відкрите проти закритого: зліт китайських моделей У екосистемі моделей звіт показує двоколійний світ: хоча закриті моделі домінують у виручці, open-source моделі (OSS) є ключовими у галузі інновацій та спеціалізованих ніш.

Закриті моделі домінують, але open-source швидко зростає Попри те, що закриті моделі (GPT-5, Claude 4.5 тощо) досі охоплюють близько 70% загального споживання токенів, за останній рік частка відкритих моделей зросла майже до 30%. Це означає, що розробники та компанії дедалі частіше шукають баланс між контрольованістю, приватністю та вартістю, а якісні open-source моделі дають таку можливість.

Домінування китайських open-source моделей Вражаючий факт із звіту: розроблені в Китаї open-source моделі стали основою світового open-source-ландшафту.

Ключові гравці: Серія Qwen (通义千问) від Alibaba, DeepSeek (深度求索) і Kimi від Moonshot AI займають значну частку глобальних запитів на OpenRouter.

Конкурентні переваги: Звіт підкреслює: стрімке зростання китайських моделей забезпечене «щільними ітераційними циклами» та «дуже конкурентною якістю моделей». Наприклад, Qwen 2.5 Coder у програмуванні напряму кидає виклик багатьом закритим моделям.

Унікальне позиціонування: Дані показують, що китайські open-source моделі мають відносно менше «контент-фільтрації» (порівняно з жорсткими захисними бар’єрами у західних моделях), тому вони особливо популярні у світі для креативного письма, рольових ігор (Roleplay) та продовження історій.

«М-подібна» еволюція розмірів моделей Усередині open-source ринку відбуваються цікаві структурні зміни:

Занепад малих моделей: Попри запуск малих моделей на кшталт Gemma від Google, загальне використання знижується. Користувачі бачать, що інтелектуальна стеля малих моделей обмежує їх у складних завданнях.

Золота ера середніх моделей: Моделі близько 32B параметрів (32 мільярди) стали «солодкою точкою». Qwen 2.5 Coder 32B, наприклад, ідеально балансує між продуктивністю та вартістю reasoning, створюючи справжній product-market fit.

Диверсифікація великих моделей: У сегменті від 70B до 200B+ параметрів немає монополії — натомість спостерігається конкуренція різних моделей (Llama 3, Qwen 72B тощо), і користувачі перемикаються між ними залежно від завдань.

Реальні сценарії: що люди роблять із ШІ? Мабуть, це найцікавіша частина звіту. Використовуючи систему GoogleTagClassifier від OpenRouter, дослідники проаналізували мільярди запитів і класифікували їхній контент, зруйнувавши уявлення, що «ШІ використовується переважно для бізнес-продуктивності».

Рольові ігри Дані показують: рольові ігри — найбільша категорія використання open-source моделей (OSS), понад 60%.

Феномен: Величезна кількість користувачів застосовує ШІ для діалогів із віртуальними персонажами, створення інтерактивних новел та занурених ігрових досвідів. Це не просто нішове хобі, а величезний ринок із стійким попитом.

Драйвери: Користувачі віддають перевагу open-source моделям для roleplay, бо такі моделі (особливо з неамериканських лабораторій) зазвичай мають менше цензури та забезпечують багатший, більш вільний інтерактив.

Бізнес-цінність: Ці користувачі показують вражаючу лояльність: вони формують глибокий емоційний зв’язок із вибраними моделями та виробляють сталі звички використання.

Програмування Одразу за рольовими іграми йде категорія програмування — одна з тих, що зростає найшвидше…

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.