Нейросеть Grok Imagine научилась создавать короткие видео — с речью и музыкой
Компания xAI выпустила обновлённую модель Grok Imagine v0.9, которая теперь умеет генерировать короткие видео с речью персонажей и фоновой музыкой. Новая версия доступна бесплатно в веб-версии и в приложениях на iOS и Android, сообщил Илон Маск в X.
Главное обновление — режим Speech. Теперь пользователи могут вводить текст, который персонажи произносят в видео. Речь синтезируется прямо в ролике с реалистичной артикуляцией и синхронизацией губ. Подробности в материале Postium.

Как пользоваться Grok Imagine и создавать видео
Видео по-прежнему ограничены 6 секундами, но качество выросло заметно: движения стали плавнее, освещение естественнее, звук — чище, а фоны — детальнее.
Остались и прежние режимы:
- Custom — для сюжетных сцен по текстовому описанию;
- Fun — упрощённые анимации и юмористические ситуации;
- Spicy — ролики с частично обнажёнными персонажами и эротичными движениями (режим не рекомендуется для коммерческого использования).
Инструкция по шагам:
Шаг 1. Перейдите на сайт xAI или откройте приложение Grok на iOS или Android. Выберите вкладку Imagine.
Шаг 2. Опишите сцену, лучше на английском языке: кто в кадре, что делает, какая атмосфера. Как это сделать наиболее правильно, смотрите в гайде — промты для генерации видео.
Шаг 3. Сначала Грок нарисует несколько вариантов картинки по вашему запросу, далее вы сможете их оживить. Для этого нажмите на кнопку «Play».
Шаг 4. После этого, когда видео будет готово, внизу выберите режим Speech и добавьте текст, который должен сказать персонаж.
Через несколько секунд появится короткое видео с озвучкой. Клип можно скачать, зациклить и сразу опубликовать в соцсетях. Пока генерация занимает 15–25 секунд, но разработчики обещают ускорение и поддержку более длинных роликов в будущих версиях.
Для авторов и маркетологов Grok Imagine становится инструментом моментального видеоконтента: можно создать рекламный тизер, мем или поздравление буквально за минуту. Речь добавляет эффект присутствия — персонажи «оживают», и ролики воспринимаются как настоящие короткие сцены.
Релиз Grok Imagine v0.9 совпал с выходом Sora 2 от OpenAI — новой версии видеомодели, которая создаёт фотореалистичные клипы длиной до минуты с динамической камерой и физикой объектов. В отличие от Sora 2, рассчитанной на профессиональные проекты, Grok Imagine фокусируется на простоте и скорости: короткие форматы, минимальные настройки и массовая доступность.
Первая версия Grok Imagine вышла в августе 2025 года и умела генерировать только немые видео. За два месяца качество улучшилось настолько, что пользователи отмечают «скачок на уровне поколения» — особенно в деталях лиц и синхронизации движений.


