1. Основы ИИ-видео и типы промптов
Основы ИИ-видео и типы промптов
ИИ-видео — это видеоролики, которые генерируются или преобразуются моделями машинного обучения по текстовому описанию, референсам (картинкам/кадрам), исходному видео и дополнительным условиям (композиция, движение камеры, стиль, ограничения). В этом курсе мы будем учиться формулировать промпты так, чтобы получать предсказуемый результат: нужный сюжет, кадр, движение и визуальный язык.
Что такое ИИ-видео и чем оно отличается от ИИ-изображений
ИИ-видео можно представить как последовательность кадров, которые должны быть:
Главное отличие от генерации изображений — временная согласованность. В видео модель должна удерживать одну и ту же сцену и логику происходящего на протяжении секунд.
Если вы знакомы с тем, что такое диффузионные модели, вам будет проще понять, почему видео сложнее: шум нужно «убирать» не только в одном кадре, но и согласованно во времени. Если нет — достаточно помнить практическую мысль: промпт для видео почти всегда должен описывать не только картинку, но и изменение картинки во времени.
Полезные базовые справки:
Какие задачи решает ИИ-видео
ИИ-видео чаще всего используют для таких типов задач:
Важно: в рамках курса мы концентрируемся на промптинге — то есть на управлении результатом через описание, структуру и ограничения, а не на монтаже или цветокоррекции.
Основные режимы генерации ИИ-видео
Один и тот же промпт может вести себя по-разному в разных режимах. Поэтому полезно сразу различать, какой тип входных данных вы даете модели.
Text-to-Video (текст в видео)
Вы задаете описание сцены, и модель генерирует ролик с нуля.
Когда подходит:
Риск:
Image-to-Video (картинка в видео)
Вы даете изображение (референс-кадр), и модель генерирует движение и небольшие изменения.
Когда подходит:
Риск:
Video-to-Video (видео в видео)
Вы даете исходное видео и просите преобразовать стиль, окружение или отдельные свойства.
Когда подходит:
Риск:
!Схема, показывающая три основных режима генерации ИИ-видео и их входные данные
Почему промпты для видео требуют структуры
Текстовое описание сцены — это только часть управления. В видео критичны параметры, которые в изображениях часто можно не уточнять.
Обычно полезно явно задавать:
Типы промптов в ИИ-видео
Под «типом промпта» будем понимать роль текста в управлении результатом. На практике один проект почти всегда использует несколько типов промптов одновременно.
Базовый (сценический) промпт
Это описание сцены «как есть»: субъект, окружение, действие, атмосфера.
Шаблон:
Пример (универсальный):
Кинематографический промпт (камера и постановка)
Это указания, которые превращают сцену в «снятый кадр»: тип плана, движение камеры, объектив, глубина резкости, композиция.
Что обычно уточняют:
Пример:
Тайминговый промпт (время и события)
Видео — это не только «что», но и «когда». Тайминговый промпт помогает модели понять последовательность.
Есть два удобных способа задавать тайминг.
Пример мини-раскадровки (без привязки к конкретному инструменту):
Стилистический промпт (визуальный язык)
Это описание художественного исполнения: реализм, анимация, пленочный вид, графика, цветовая палитра, освещение.
Важно: стиль — это не только «как называется», но и из чего состоит. Лучше задавать стиль через признаки.
Пример:
Ограничивающий промпт (constraints)
Это текст, который снижает случайность результата: запрещает нежелательные элементы или задает жесткие рамки.
Ограничения бывают двух видов:
На практике многие инструменты поддерживают отдельный формат negative prompt (негативный промпт). Даже если отдельного поля нет, запреты можно аккуратно вписывать в общий промпт.
Пример:
Референс-промпт (промпт для сходства)
Иногда ваша задача — не придумать сцену, а попасть в уже существующий образ: персонаж, стиль бренда, узнаваемая эстетика.
Референсность можно собирать из трех источников:
Практическое правило: для консистентности повторяйте «якоря» — уникальные детали, по которым модель «узнает» персонажа или сцену.
Пример якорей:
Промпт-шот (prompt per shot)
Для роликов из нескольких планов (даже если это всего 2–3 склейки) полезно писать промпт отдельно на каждый шот. Это повышает управляемость.
Мини-шаблон для каждого шота:
Сводная таблица: типы промптов и их назначение
| Тип промпта | На что влияет | Когда применять | Типичная ошибка | |---|---|---|---| | Базовый (сценический) | Сюжет и содержание кадра | Всегда, это основа | Слишком общие слова без деталей | | Кинематографический | Камера, композиция, «снятость» | Когда важна режиссура и ощущение кино | Конфликтующие команды: «вид сверху» и «крупный план лица» | | Тайминговый | Последовательность событий | Когда в ролике есть развитие | Просить слишком много событий за 4–6 секунд | | Стилистический | Визуальная эстетика | Когда нужен узнаваемый визуальный язык | Называть стиль без признаков (цвет, свет, фактура) | | Ограничивающий / negative | Стабильность и чистота результата | Когда появляются артефакты и «лишнее» | Запрещать слишком много, делая сцену «неживой» | | Референсный | Сходство и консистентность | Когда нужно повторять персонажа/бренд | Не фиксировать «якоря», менять формулировки | | Промпт-шот | Управляемость многопланового ролика | Для клипов, рекламы, сторителлинга | Пытаться описать весь ролик одним абзацем |
Как выглядит хороший промпт для ИИ-видео
Хороший промпт обычно обладает тремя качествами:
Ниже — практичный формат «блочного промпта», который можно адаптировать под разные инструменты.
Пример (в одном блоке):
Частые ошибки новичков
Как эта статья связана с дальнейшими темами курса
В этой статье вы освоили базовый словарь: режимы генерации и типы промптов по роли. Дальше в курсе мы будем: