11:25
Офіційний реліз DeepSeek V3.2: посилені можливості Agent, інтеграція мислення та розумування
Згідно з повідомленням Jinse Finance, сьогодні ми одночасно випускаємо дві офіційні версії моделей: DeepSeek-V3.2 та DeepSeek-V3.2-Speciale. DeepSeek-V3.2 — це наша перша модель, яка інтегрує мислення у використання інструментів і підтримує одночасно як режим мислення, так і немислячий режим виклику інструментів. Ми запропонували метод синтезу даних для навчання великих агентів, створивши велику кількість завдань з підкріпленого навчання "важко вирішити, легко перевірити" (1800+ середовищ, 85 000+ складних інструкцій), що значно підвищило здатність моделі до узагальнення. (DeepSeek)

