Xiaomi представила свою «рассуждающую» нейросеть MiMo
Компания Xiaomi впервые выпустила собственную открытую языковую модель — MiMo.
В пресс-релизе её называют «рассуждающей»: по словам разработчиков, она лучше справляется с задачами, где нужно логическое и математическое мышление.
Что известно о MiMo
- MiMo — это семейство из четырёх моделей: базовая (MiMo-7B-Base), с дообучением под задачи RLHF (MiMo-7B-RL-Zero и MiMo-7B-RL), и SFT-версия (MiMo-7B-SFT);
- Архитектура — 7 миллиардов параметров, как у многих современных «малых» LLM;
- Области применения: генерация и объяснение кода, решение математических задач, задачи с несколькими логическими шагами;
- По заявлению Xiaomi, MiMo опережает модели o1-mini, GPT-4o и QwQ в внутренних тестах по математике и коду. Однако независимых сравнений пока не опубликовано.
Модель обучала недавно сформированная команда Xiaomi по направлению искусственного интеллекта. Компания открыто признала, что начала гонку за AGI позже других, но видит в этом стратегическое направление — наряду с бытовой электроникой и экосистемными сервисами. Модель уже доступна на GitHub и Hugging Face.
Для Xiaomi это первый публичный шаг в сторону генеративного ИИ — и заявка на собственную платформу, а не только на использование сторонних моделей в смартфонах и гаджетах. Открытый выпуск модели — редкий ход среди китайских компаний, особенно в сфере reasoning-моделей.
Ранее стоковый сервис Freepik представил собственную генеративную модель F-Lite.