Китайская стартап-компания в сфере искусственного интеллекта MiniMax представила новую модель ИИ M2.1, вновь бросив вызов глобальной конкуренции в области генеративного ИИ. Эта модель значительно усиливает разнообразие языков программирования и способности к адаптации к реальным рабочим условиям, демонстрируя улучшенные характеристики не только в области помощи с кодом, но и в написании документов и ведении диалогов.
Выпущенная версия M2.1 значительно улучшила понимание и точность генерации различных языков программирования благодаря обновлению производительности по сравнению с предыдущей моделью M2. Поддерживаемые языки были расширены до Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript и других. Также были получены значительные улучшения в оценках способности дизайна пользовательского интерфейса и эстетики на платформах Web, Android и iOS.
Особенно выделяется то, что M2.1 не только усиливает правильность выполнения простого кода, но и улучшает его способность интерпретировать и следовать сложным задачам или детальным инструкциям, что позволяет создать более соответствующий реальной офисной среде ИИ. MiniMax в связи с этим улучшил диалоговые возможности модели и способности к написанию документов, и пояснил, что она демонстрирует отличные результаты в широком диапазоне от повседневного общения до написания технической документации и структурированных ответов.
Соучредитель и генеральный директор открытой платформы AI-агентов Kilo Code Скотт Брейтенотер заявил: «В ходе первоначального тестирования M2.1 продемонстрировал выдающиеся результаты на протяжении всего процесса разработки, включая проектирование архитектуры, компоновку кода, рецензирование и развертывание» и оценил, что модель одновременно соответствует соотношению цена-качество и высокому уровню производительности.
Эта модель также оценивается с помощью нового бенчмарка под названием VIBE (Vision and Interactive Benchmark for Execution). VIBE основан на пяти ключевых областях: веб, моделирование, Android, iOS, разработка бэкенда, и проводит комплексную оценку взаимодействующей логики и визуальных элементов сгенерированных результатов, используя агентный язык верификации. По информации от MiniMax, M2.1 набрала в этом бенчмарке в среднем 88.6 балла, при этом в области веб и Android были достигнуты отличные результаты в 91.5 и 89.7 балла соответственно.
M2.1 также была сравнена по производительности с основными AI моделями. В результате оценки наравне с основными моделями таких крупных компаний, как Anthropic, Google, OpenAI, DeepSeek, M2.1 также продемонстрировала мощные способности к решению проблем в сложных бенчмарках, таких как “Последний экзамен человечества” и “Toolathon”. Особенно в проекте HLE без инструментов она получила 22.0 балла, а в综合测试 MMLU(Pro) в области гуманитарных, научных и технических дисциплин получила 88 баллов, сравнявшись с топовыми AI моделями.
M2.1 в настоящее время доступен для загрузки через собственное API MiniMax или Hugging Face, а представитель компании, обслуживающий MiniMax, также работает на основе M2.1. Выпуск этой модели демонстрирует ускоренное развитие поддержки многоязычного кодирования и рынка AI-агентов, а также указывает на то, что универсальность и конкурентоспособность генеративного ИИ, происходящего из Китая, продолжают расширяться.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Китайский мини Max, снова бросает вызов глобальной генеративной войне с помощью AI модели 'M2.1'
Китайская стартап-компания в сфере искусственного интеллекта MiniMax представила новую модель ИИ M2.1, вновь бросив вызов глобальной конкуренции в области генеративного ИИ. Эта модель значительно усиливает разнообразие языков программирования и способности к адаптации к реальным рабочим условиям, демонстрируя улучшенные характеристики не только в области помощи с кодом, но и в написании документов и ведении диалогов.
Выпущенная версия M2.1 значительно улучшила понимание и точность генерации различных языков программирования благодаря обновлению производительности по сравнению с предыдущей моделью M2. Поддерживаемые языки были расширены до Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript и других. Также были получены значительные улучшения в оценках способности дизайна пользовательского интерфейса и эстетики на платформах Web, Android и iOS.
Особенно выделяется то, что M2.1 не только усиливает правильность выполнения простого кода, но и улучшает его способность интерпретировать и следовать сложным задачам или детальным инструкциям, что позволяет создать более соответствующий реальной офисной среде ИИ. MiniMax в связи с этим улучшил диалоговые возможности модели и способности к написанию документов, и пояснил, что она демонстрирует отличные результаты в широком диапазоне от повседневного общения до написания технической документации и структурированных ответов.
Соучредитель и генеральный директор открытой платформы AI-агентов Kilo Code Скотт Брейтенотер заявил: «В ходе первоначального тестирования M2.1 продемонстрировал выдающиеся результаты на протяжении всего процесса разработки, включая проектирование архитектуры, компоновку кода, рецензирование и развертывание» и оценил, что модель одновременно соответствует соотношению цена-качество и высокому уровню производительности.
Эта модель также оценивается с помощью нового бенчмарка под названием VIBE (Vision and Interactive Benchmark for Execution). VIBE основан на пяти ключевых областях: веб, моделирование, Android, iOS, разработка бэкенда, и проводит комплексную оценку взаимодействующей логики и визуальных элементов сгенерированных результатов, используя агентный язык верификации. По информации от MiniMax, M2.1 набрала в этом бенчмарке в среднем 88.6 балла, при этом в области веб и Android были достигнуты отличные результаты в 91.5 и 89.7 балла соответственно.
M2.1 также была сравнена по производительности с основными AI моделями. В результате оценки наравне с основными моделями таких крупных компаний, как Anthropic, Google, OpenAI, DeepSeek, M2.1 также продемонстрировала мощные способности к решению проблем в сложных бенчмарках, таких как “Последний экзамен человечества” и “Toolathon”. Особенно в проекте HLE без инструментов она получила 22.0 балла, а в综合测试 MMLU(Pro) в области гуманитарных, научных и технических дисциплин получила 88 баллов, сравнявшись с топовыми AI моделями.
M2.1 в настоящее время доступен для загрузки через собственное API MiniMax или Hugging Face, а представитель компании, обслуживающий MiniMax, также работает на основе M2.1. Выпуск этой модели демонстрирует ускоренное развитие поддержки многоязычного кодирования и рынка AI-агентов, а также указывает на то, что универсальность и конкурентоспособность генеративного ИИ, происходящего из Китая, продолжают расширяться.