Создание промптов для ИИ-видеороликов

Курс учит формулировать эффективные промпты для генерации видеороликов с помощью ИИ: от идеи и сценария до визуального стиля и финальной доработки. Вы освоите структуру промпта, управление движением и камерой, а также итерационное улучшение результата под нужный формат.

1. Основы ИИ-видео и типы промптов

Основы ИИ-видео и типы промптов

ИИ-видео — это видеоролики, которые генерируются или преобразуются моделями машинного обучения по текстовому описанию, референсам (картинкам/кадрам), исходному видео и дополнительным условиям (композиция, движение камеры, стиль, ограничения). В этом курсе мы будем учиться формулировать промпты так, чтобы получать предсказуемый результат: нужный сюжет, кадр, движение и визуальный язык.

Что такое ИИ-видео и чем оно отличается от ИИ-изображений

ИИ-видео можно представить как последовательность кадров, которые должны быть:

  • визуально качественными
  • согласованными между собой (один и тот же персонаж, одежда, фон)
  • связными по движению (без «рывков», лишних объектов, внезапных смен)
  • Главное отличие от генерации изображений — временная согласованность. В видео модель должна удерживать одну и ту же сцену и логику происходящего на протяжении секунд.

    Если вы знакомы с тем, что такое диффузионные модели, вам будет проще понять, почему видео сложнее: шум нужно «убирать» не только в одном кадре, но и согласованно во времени. Если нет — достаточно помнить практическую мысль: промпт для видео почти всегда должен описывать не только картинку, но и изменение картинки во времени.

    Полезные базовые справки:

  • Diffusion model
  • Prompt engineering
  • Какие задачи решает ИИ-видео

    ИИ-видео чаще всего используют для таких типов задач:

  • генерация ролика с нуля по тексту
  • оживление изображения (анимация картинки)
  • стилизация/перерисовка исходного видео
  • генерация вставок (B-roll), переходов, фоновых сцен
  • превизуализация (черновые версии сцен до съемки)
  • Важно: в рамках курса мы концентрируемся на промптинге — то есть на управлении результатом через описание, структуру и ограничения, а не на монтаже или цветокоррекции.

    Основные режимы генерации ИИ-видео

    Один и тот же промпт может вести себя по-разному в разных режимах. Поэтому полезно сразу различать, какой тип входных данных вы даете модели.

    Text-to-Video (текст в видео)

    Вы задаете описание сцены, и модель генерирует ролик с нуля.

    Когда подходит:

  • нужен новый сюжет, которого нет в исходниках
  • важнее идея и атмосфера, чем точное совпадение с конкретным актером/локацией
  • Риск:

  • сложнее удерживать постоянство персонажей и деталей от кадра к кадру
  • Image-to-Video (картинка в видео)

    Вы даете изображение (референс-кадр), и модель генерирует движение и небольшие изменения.

    Когда подходит:

  • нужно «оживить» иллюстрацию, постер, концепт
  • требуется стабильный внешний вид персонажа
  • Риск:

  • модель может «ломать» анатомию при активном движении
  • иногда движение получается слишком однообразным
  • Video-to-Video (видео в видео)

    Вы даете исходное видео и просите преобразовать стиль, окружение или отдельные свойства.

    Когда подходит:

  • нужна стилизация (например, «как анимационный фильм»)
  • важна сохранность движения и тайминга
  • Риск:

  • промпт конкурирует с реальным исходником: часть элементов может упорно сохраняться
  • !Схема, показывающая три основных режима генерации ИИ-видео и их входные данные

    Почему промпты для видео требуют структуры

    Текстовое описание сцены — это только часть управления. В видео критичны параметры, которые в изображениях часто можно не уточнять.

    Обычно полезно явно задавать:

  • кто/что в кадре (субъект)
  • где происходит действие (сцена)
  • что происходит (действие)
  • как это снято (камера)
  • как это выглядит (стиль, свет, цвет)
  • как долго и с какой динамикой (тайминг)
  • Типы промптов в ИИ-видео

    Под «типом промпта» будем понимать роль текста в управлении результатом. На практике один проект почти всегда использует несколько типов промптов одновременно.

    Базовый (сценический) промпт

    Это описание сцены «как есть»: субъект, окружение, действие, атмосфера.

    Шаблон:

  • кто/что + где + что делает + ключевые детали + атмосфера
  • Пример (универсальный):

  • Одинокий путешественник в желтом дождевике идет по мокрой улице ночного города, отражения неона в лужах, легкий туман, спокойная задумчивая атмосфера.
  • Кинематографический промпт (камера и постановка)

    Это указания, которые превращают сцену в «снятый кадр»: тип плана, движение камеры, объектив, глубина резкости, композиция.

    Что обычно уточняют:

  • план: общий/средний/крупный
  • движение: панорама, наезд, отъезд, следование за персонажем
  • оптика: широкоугольный/портретный характер, боке
  • композиция: правило третей, ведущие линии
  • Пример:

  • Крупный план лица, мягкий контровой свет, малая глубина резкости, медленный наезд камеры, кинематографичный реализм.
  • Тайминговый промпт (время и события)

    Видео — это не только «что», но и «когда». Тайминговый промпт помогает модели понять последовательность.

    Есть два удобных способа задавать тайминг.

  • Через короткий сценарий в одной фразе
  • Через «мини-раскадровку» по отрезкам времени
  • Пример мини-раскадровки (без привязки к конкретному инструменту):

  • 0–2с: персонаж стоит, оглядывается, свет вывески мигает
  • 2–4с: персонаж делает шаг вперед, камера плавно следует
  • 4–6с: в кадр попадает проезжающая машина, блики на мокром асфальте
  • Стилистический промпт (визуальный язык)

    Это описание художественного исполнения: реализм, анимация, пленочный вид, графика, цветовая палитра, освещение.

    Важно: стиль — это не только «как называется», но и из чего состоит. Лучше задавать стиль через признаки.

    Пример:

  • Пленочный вид, мягкое зерно, слегка приглушенные цвета, теплые тени, световые ореолы, ощущение съемки на 35mm.
  • Ограничивающий промпт (constraints)

    Это текст, который снижает случайность результата: запрещает нежелательные элементы или задает жесткие рамки.

    Ограничения бывают двух видов:

  • запреты на содержимое (например, «без текста в кадре»)
  • запреты на артефакты и ошибки (например, «без лишних конечностей»)
  • На практике многие инструменты поддерживают отдельный формат negative prompt (негативный промпт). Даже если отдельного поля нет, запреты можно аккуратно вписывать в общий промпт.

    Пример:

  • Без надписей, без логотипов, без водяных знаков, без искажений лица, без лишних пальцев.
  • Референс-промпт (промпт для сходства)

    Иногда ваша задача — не придумать сцену, а попасть в уже существующий образ: персонаж, стиль бренда, узнаваемая эстетика.

    Референсность можно собирать из трех источников:

  • текстовые признаки (цвета, материалы, эпоха, настроение)
  • референс-изображения/кадры (если инструмент поддерживает)
  • повторяющиеся элементы в формулировке (одинаковые детали в каждом шоте)
  • Практическое правило: для консистентности повторяйте «якоря» — уникальные детали, по которым модель «узнает» персонажа или сцену.

    Пример якорей:

  • рыжие кудрявые волосы, шрам на правой брови, зеленая куртка-бомбер, круглая серьга в левом ухе
  • Промпт-шот (prompt per shot)

    Для роликов из нескольких планов (даже если это всего 2–3 склейки) полезно писать промпт отдельно на каждый шот. Это повышает управляемость.

    Мини-шаблон для каждого шота:

  • субъект и действие
  • место и детали
  • камера
  • стиль/свет
  • ограничения
  • Сводная таблица: типы промптов и их назначение

    | Тип промпта | На что влияет | Когда применять | Типичная ошибка | |---|---|---|---| | Базовый (сценический) | Сюжет и содержание кадра | Всегда, это основа | Слишком общие слова без деталей | | Кинематографический | Камера, композиция, «снятость» | Когда важна режиссура и ощущение кино | Конфликтующие команды: «вид сверху» и «крупный план лица» | | Тайминговый | Последовательность событий | Когда в ролике есть развитие | Просить слишком много событий за 4–6 секунд | | Стилистический | Визуальная эстетика | Когда нужен узнаваемый визуальный язык | Называть стиль без признаков (цвет, свет, фактура) | | Ограничивающий / negative | Стабильность и чистота результата | Когда появляются артефакты и «лишнее» | Запрещать слишком много, делая сцену «неживой» | | Референсный | Сходство и консистентность | Когда нужно повторять персонажа/бренд | Не фиксировать «якоря», менять формулировки | | Промпт-шот | Управляемость многопланового ролика | Для клипов, рекламы, сторителлинга | Пытаться описать весь ролик одним абзацем |

    Как выглядит хороший промпт для ИИ-видео

    Хороший промпт обычно обладает тремя качествами:

  • конкретность: меньше «красиво», больше наблюдаемых деталей
  • непротиворечивость: команды не спорят друг с другом
  • приоритеты: вы явно понимаете, что важнее — сюжет, стиль или камера
  • Ниже — практичный формат «блочного промпта», который можно адаптировать под разные инструменты.

  • Сцена: кто, где, что происходит
  • Камера: план, движение, перспектива
  • Стиль: свет, цвет, фактуры
  • Время: длительность, развитие действия
  • Ограничения: что исключить
  • Пример (в одном блоке):

  • Молодая женщина-велосипедистка едет по утреннему мосту над рекой, легкий туман, на фоне силуэты небоскребов.
  • Средний план сбоку, камера плавно сопровождает движение, легкая тряска handheld очень умеренная.
  • Холодная палитра, мягкий рассеянный свет, реалистичная съемка, естественные материалы, тонкое зерно.
  • 6 секунд: старт с медленного движения, затем чуть быстрее, в конце легкий поворот руля.
  • Без текста и логотипов, без искажений рук и лица, без резких смен кадра.
  • Частые ошибки новичков

  • Перегруженность
  • Когда в одном промпте слишком много сущностей и событий, модель начинает «компромиссить» и результат теряет управляемость.

  • Нечеткие глаголы и абстракции
  • Слова вроде красивый, эпичный, атмосферный полезны только вместе с конкретикой: свет, цвет, погода, материалы, план.

  • Конфликтующие указания
  • Пример конфликта: «съемка сверху» и одновременно «крупный план лица». Выбирайте одно или разбивайте на шоты.

  • Отсутствие ограничений
  • Если появляются артефакты (текст в кадре, «лишние» детали), ограничения — это не косметика, а часть управления.

  • Попытка добиться монтажа внутри одного шота
  • Большинство моделей лучше справляются с одним непрерывным планом. Монтаж логичнее делать шотами.

    Как эта статья связана с дальнейшими темами курса

    В этой статье вы освоили базовый словарь: режимы генерации и типы промптов по роли. Дальше в курсе мы будем:

  • собирать промпты по устойчивым шаблонам (для рекламы, клипов, сторителлинга)
  • учиться повышать консистентность персонажей и окружения
  • разбирать, как писать промпты «по шотам» и собирать их в ролик
  • системно работать с ограничениями и исправлением типичных артефактов
  • 2. Сценарий, раскадровка и структура промпта

    Сценарий, раскадровка и структура промпта

    ИИ-видео почти всегда выигрывает от предварительной режиссуры на бумаге: вы заранее решаете, что именно должно быть в ролике, в какой последовательности и какими шотами это показать. В прошлой статье мы разобрали типы промптов (сценический, кинематографический, тайминговый, стилистический, ограничивающий и другие). Теперь соберем из них рабочий процесс: идея → сценарий → раскадровка → шот-лист → промпты по шотам.

    Зачем ИИ-видео нужен сценарий, если есть промпт

    Промпт управляет генерацией, но без сценария вы часто получаете:

  • случайный набор эффектных кадров без понятного смысла
  • перегруженный промпт, в котором «всё сразу»
  • конфликт команд: стиль и камера описаны, а действие и логика — нет
  • Сценарий и раскадровка дают две вещи:

  • структуру времени (что происходит раньше/позже)
  • структуру внимания (что зритель должен заметить в каждом шоте)
  • Полезные определения:

  • Сценарий — текстовое описание событий и действий.
  • Раскадровка — последовательность кадров (обычно эскизы), показывающая планы и монтаж.
  • Сценарий для ИИ-видео: самый практичный формат

    Для коротких роликов (4–15 секунд) удобен формат микросценария: одна цель, минимум персонажей, ясное действие.

    Микросценарий в 5 строк

  • Цель ролика: что зритель должен понять/почувствовать.
  • Кто/что главное: персонаж или объект.
  • Где: локация и время суток.
  • Что происходит: одно действие, которое можно показать.
  • Финальный акцент: чем заканчиваем (объект, эмоция, деталь).
  • Пример (6–8 секунд, продуктовый шот без брендов):

  • Цель: показать ощущение бодрости от холодного напитка.
  • Главное: стеклянная бутылка с каплями конденсата.
  • Где: минималистичная кухня утром, мягкий свет.
  • Действие: рука ставит бутылку на стол, капли блестят.
  • Финал: крупный план горлышка и пузырьков, короткая пауза.
  • Раскадровка: переводим «историю» в «шоты»

    Раскадровка помогает ответить на главный вопрос промптинга для видео: какой именно кадр мы генерируем прямо сейчас.

    Минимальная раскадровка без рисунков

    Если вы не рисуете, делайте текстовую раскадровку — по сути это шот-лист.

    На каждый шот зафиксируйте:

  • План: общий/средний/крупный и что в фокусе.
  • Композиция: где объект, что на переднем/заднем плане.
  • Движение: что движется (персонаж, объект, камера).
  • Ключевая деталь: один «якорь внимания» (например, капли на стекле).
  • Длительность: сколько секунд.
  • !Три кадра раскадровки, показывающие последовательность шотов

    От раскадровки к структуре промпта

    В прошлой статье мы говорили, что хороший промпт для видео лучше собирать блоками. Здесь важно добавить правило:

    > Один шот — один главный промпт.

    Если вам нужны 3 разных плана, почти всегда надежнее сделать 3 генерации (или 3 промпта), чем пытаться «смонтировать» всё внутри одного шота.

    Блочная структура промпта для одного шота

    Ниже — универсальный шаблон. Он не привязан к конкретной модели и подходит для Text-to-Video, Image-to-Video и Video-to-Video.

    Шот-лист как главный мост между «идеей» и «промптами»

    Шот-лист — это список шотов с назначением каждого кадра. Для промптинга он особенно полезен тем, что вы заранее распределяете информацию:

  • что обязано попасть в кадр
  • что можно оставить на усмотрение модели
  • что нужно запретить
  • Поля шот-листа, которые экономят десятки итераций

  • Назначение шота: «установить место», «показать действие», «подчеркнуть деталь».
  • Главный объект: один.
  • Второстепенные элементы: максимум 1–2.
  • Риск модели: что часто ломается (руки, текстуры, лица, стекло, отражения).
  • План Б: чем заменить сложный элемент (например, вместо «пить из бутылки» — «ставит бутылку на стол»).
  • Якоря консистентности: как удерживать одинаковость между шотами

    В ИИ-видео (и особенно в серии шотов) «узнаваемость» держится на повторении. Якоря — это повторяющиеся признаки, которые вы копируете из шота в шот.

    Какие якоря работают лучше всего

  • материал и фактура: «матовое стекло», «полированный металл», «шерсть крупной вязки»
  • уникальная деталь: «скол на правом краю», «наклейка без текста», «кольцо на указательном пальце»
  • цвет и форма: «бутылка из зеленого стекла с длинным горлышком»
  • световая схема: «мягкий боковой свет слева, легкий контровой»
  • фон: «белая плитка на стене, деревянная столешница»
  • Типичная ошибка

    Менять формулировки якорей в надежде «разнообразить». Для консистентности лучше повторять одинаковые слова, если это важный элемент.

    Тайминг: как описывать действие так, чтобы оно помещалось в секунды

    У видео есть жесткое ограничение: мало времени. Самый частый провал новичков — попытка уместить много событий.

    Практичное правило:

  • 4–6 секунд: одно действие + один визуальный акцент
  • 7–12 секунд: два действия или одно действие с явным развитием
  • Два удобных способа задать тайминг

  • Одна фраза с динамикой
  • Пример: 6 секунд: камера медленно приближается, рука ставит бутылку, капли мерцают, в конце короткая пауза на крупном плане.

  • Разметка по отрезкам времени
  • 1. 0–2с: общий/средний план, рука входит в кадр 2. 2–4с: бутылка касается стола, конденсат и блики видны отчетливо 3. 4–6с: камера ближе, акцент на пузырьках, остановка движения

    Ограничения: как заранее защититься от типичных артефактов

    Ограничения (в том числе negative prompt) полезно писать после того, как вы сформулировали сцену, иначе легко «задушить» кадр запретами.

    Частые ограничения для коммерческих и презентационных шотов:

  • без текста в кадре
  • без логотипов и водяных знаков
  • без лишних пальцев/искажений рук
  • без деформации стекла и неестественных отражений
  • без резких смен кадра и мерцания
  • Полный пример: из микросценария в промпты по шотам

    Задача: сделать 8–10 секунд ролик из трех шотов про свежий напиток без брендинга.

    Шот-лист

  • Шот 1 (3с): показать место и объект.
  • Шот 2 (3с): показать действие — бутылку ставят на стол.
  • Шот 3 (2–4с): деталь — капли и пузырьки крупно.
  • Промпт для шота 1

    Промпт для шота 2

    Промпт для шота 3

    Проверка качества перед генерацией: быстрый чек-лист

  • Можно ли пересказать каждый шот одним предложением? Если нет — шот перегружен.
  • Есть ли в каждом шоте один главный объект и один акцент? Если два равноправных акцента — разбейте.
  • Камера не противоречит сцене? Например, «крупный план» не должен требовать видеть всю локацию.
  • Якоря повторяются одинаково? Если меняете слова — меняете и результат.
  • Ограничения реально защищают от проблем? Добавляйте запреты только там, где уже знаете риск.
  • !Схема процесса от идеи до промптов по шотам

    Как это связано с предыдущей статьей

    В статье про основы и типы промптов мы разобрали какие бывают промпты и за что они отвечают. Здесь вы применили это как систему производства:

  • сценарий дает смысл и последовательность
  • раскадровка дает кадры и монтажную логику
  • блочная структура промпта превращает каждый шот в управляемую задачу
  • Следующий шаг в практике — научиться делать устойчивые шаблоны промптов под типовые форматы (реклама, клип, сторителлинг) и повышать консистентность результата от итерации к итерации.

    3. Визуальный стиль: персонажи, локации, свет и композиция

    Визуальный стиль: персонажи, локации, свет и композиция

    В предыдущих статьях мы разобрали типы промптов и процесс идея → сценарий → раскадровка → промпты по шотам. Теперь добавим слой, который делает ИИ-видео узнаваемым и управляемым: визуальный стиль. Под стилем здесь мы понимаем не «название эстетики», а набор наблюдаемых решений: как выглядят персонажи, где они находятся, каким светом снято и как организован кадр.

    Главная практическая мысль:

    > Визуальный стиль лучше задавать не абстрактными словами, а через повторяемые признаки (якоря), которые можно скопировать из шота в шот.

    Что именно считается визуальным стилем в ИИ-видео

    В контексте промптинга визуальный стиль удобно разложить на четыре управляемых блока:

  • Персонажи: внешность, одежда, материалы, характерные детали.
  • Локации: место, эпоха, фактуры, предметы, погодные условия.
  • Свет: источник, направление, жесткость, цветовая температура, контровой/заполняющий.
  • Композиция: план, ракурс, глубина резкости, размещение объектов в кадре.
  • Это напрямую продолжает блочную структуру промпта из прошлой статьи, но с акцентом на то, что именно повторять, чтобы сохранить целостность ролика.

    Персонажи: как описывать так, чтобы модель «узнавала» героя

    Проблема ИИ-видео — не придумать персонажа, а удержать его неизменным во времени и между шотами. Для этого полезно собирать паспорт персонажа: короткий набор признаков, которые вы вставляете в каждый шот.

    Паспорт персонажа: минимальный набор якорей

    Хороший паспорт обычно включает:

  • Силуэт и возраст: «стройный мужчина 35–40», «подросток невысокого роста».
  • Волосы: цвет, длина, форма, пробор.
  • Лицо: 1–2 заметные особенности (не перегружайте).
  • Одежда: конкретные предметы и материалы.
  • Уникальная деталь: то, что трудно перепутать.
  • Практическое правило: одна уникальная деталь сильнее, чем пять общих.

    Как формулировать внешность без «субъективных» слов

    Слова вроде красивый и харизматичный хуже управляют результатом, чем наблюдаемые признаки. Заменяйте оценку на описание:

  • вместо красивый → «симметричные черты, аккуратная прическа, чистая кожа»
  • вместо стильный → «минималистичная куртка из матовой кожи, монохромная палитра»
  • вместо злодейский → «жесткий контровой свет, резкие тени под глазами, холодная палитра»
  • Пример паспорта персонажа (якоря, которые копируются в каждый шот)

  • Женщина 28–32, короткое каре черного цвета, ровный пробор слева.
  • Тонкая золотая серьга-кольцо в правом ухе.
  • Светло-серый шерстяной плащ, черные кожаные перчатки.
  • Небольшая родинка под левым глазом.
  • Ограничения для персонажей (когда есть риск артефактов)

    Частые ограничения, которые уместны именно в шотах с человеком:

  • без лишних пальцев, без деформации кистей
  • без искажений лица, без “плывущих” глаз
  • без резкой смены прически и одежды между кадрами
  • Локации: как сделать мир правдоподобным и стабильным

    Локация работает как «контейнер» для сцены: она поддерживает смысл и удерживает стиль. В промпте лучше описывать локацию через материалы, предметы и световые условия, а не через общие слова.

    Скелет локации: из чего собирать описание

    Чтобы локация была читаемой, обычно достаточно:

  • Тип места: улица, офис, квартира, лесная тропа.
  • Эпоха/контекст: современность, ретрофутуризм, 90-е.
  • Материалы: бетон, мокрый асфальт, латунь, дерево.
  • Предметы-идентификаторы: 2–3 объекта, которые сразу «называют» место.
  • Погода/воздух: туман, дождь, пыль, дымка.
  • Якоря локации для серии шотов

    Выбирайте 3–5 якорей и повторяйте их формулировками почти без изменений:

  • «мокрый асфальт с отражениями неона»
  • «узкая улица с кирпичными фасадами»
  • «пар от люка на дороге»
  • «неоновая вывеска без читаемого текста»
  • Так вы снижаете шанс, что модель «пересоберет» место в каждом шоте заново.

    Типичные ошибки при описании локаций

  • Слишком много объектов: модель начнет заменять предметы случайно.
  • Конфликт эпох: «средневековая таверна» и «стеклянные небоскребы» в одном кадре.
  • Локация без материалов: «красивый дом» хуже, чем «дом из светлого бетона, большие окна, деревянные панели».
  • Свет: самый быстрый способ управлять «дороговизной» кадра

    Свет — это не только эстетика, но и читаемость формы. Для ИИ-видео полезно описывать свет так же, как это делают операторы: источник → направление → жесткость → цвет → контровой/заполняющий.

    Словарь света, который реально помогает в промпте

  • Мягкий свет: плавные тени, «коммерческий» и дружелюбный вид.
  • Жесткий свет: резкие тени, драматичность.
  • Контровой свет: отделяет персонажа от фона.
  • Заполняющий свет: уменьшает контраст в тенях.
  • Практикалсы: источники света внутри сцены (лампы, вывески, свечи).
  • Если вы хотите углубиться в термины, полезны базовые статьи:

  • Кинематография
  • Освещение (фотография))
  • Три готовые «световые схемы» для промптов

    | Схема | Как выглядит | Что писать в промпте | Где полезно | |---|---|---|---| | Мягкий дневной | ровно, чисто | «мягкий рассеянный дневной свет из окна слева, легкий заполняющий, естественные блики» | продукт, lifestyle | | Ночной неон | цветные блики | «неоновый контровой свет, влажные отражения, холодные тени, легкий туман» | город, киберпанк | | Драматичный ключевой | контраст | «один жесткий ключевой источник сверху-слева, глубокие тени, слабый заполняющий» | триллер, портрет |

    !Сравнение трех световых схем и направления источников

    Ограничения для света (борьба с мерцанием и «прыгающей» экспозицией)

    В видео частая проблема — нестабильность яркости и бликов. Уместные ограничения:

  • без мерцания, без скачков экспозиции
  • стабильные блики на металле/стекле
  • без резких изменений цветовой температуры
  • Композиция: как сделать кадр понятным и «киношным»

    Композиция — это то, куда смотрит зритель и почему он смотрит именно туда. Для промпта полезно фиксировать не «красивую композицию», а конкретные правила: план, точка внимания, размещение объекта, глубина резкости.

    Для базовой ориентации можно опираться на:

  • Композиция (изобразительное искусство))
  • Правило третей
  • Четыре параметра композиции, которые стоит указывать почти всегда

  • План: общий/средний/крупный.
  • Точка внимания: что в фокусе (лицо, руки, объект).
  • Размещение: «в центре», «в левой трети», «на переднем плане справа».
  • Глубина резкости: малая (размытый фон) или большая (резко почти всё).
  • Пример формулировок, которые помогают модели

  • «крупный план, объект в правой трети кадра, фон сильно размытый, фокус на каплях конденсата»
  • «общий план, персонаж в центре, ведущие линии улицы уходят в перспективу»
  • «низкий ракурс, камера на уровне пояса, легкий наезд»
  • !Иллюстрация, как задавать размещение объекта и точку внимания

    Как собирать стиль в промпте: «стиль-паспорт» проекта

    Чтобы ролик не распался на разные «случайные красивые кадры», полезно завести стиль-паспорт (иногда это называют style bible): короткий блок, который вы вставляете во все шоты, а внутри шота меняете только действие и план.

    Шаблон стиль-паспорта (копируется в каждый шот)

    Пример стиль-паспорта (городская неоновая сцена)

    Примеры: один сюжет, три разных визуальных стиля

    Ниже один и тот же микросюжет: персонаж подходит к двери и останавливается. Меняется только стиль.

    Вариант A: реалистичный «коммерческий»

    Вариант B: ночной неон, более контрастно

    Вариант C: «анимационный» вид через признаки (не через названия)

    Частые проблемы и как чинить их промптами

    Персонаж «плывет» между кадрами

    Причины:

  • якоря персонажа меняются словами
  • слишком много деталей одежды и аксессуаров
  • Что делать:

  • Сократите паспорт до 4–6 признаков.
  • Повторяйте формулировки дословно.
  • Уберите детали, которые модель часто ломает (сложные принты, множество украшений).
  • Локация меняется в каждом шоте

    Причины:

  • в промпте нет материалов и предметов-идентификаторов
  • вы просите разные эпохи или стили одновременно
  • Что делать:

  • Добавьте 3–5 якорей локации и повторяйте.
  • Уберите «лишние» объекты.
  • Зафиксируйте время суток и погоду.
  • Свет «мигает» или бликует по-разному

    Причины:

  • слишком активные источники (неон, отражения на мокром)
  • не задана стабильность
  • Что делать:

  • добавьте ограничения: «без мерцания, без скачков экспозиции»
  • сделайте свет проще: меньше источников, мягче контраст
  • Как эта тема продолжает курс

    В первых двух статьях мы научились:

  • различать типы промптов и понимать их роль
  • превращать идею в шоты и писать промпты на каждый шот
  • Эта статья добавляет практику управления визуальным языком через:

  • якоря персонажа и локации
  • понятные параметры света
  • композиционные указания, которые можно повторять
  • Дальше (в следующих темах курса) этот подход позволит:

  • быстрее собирать серии шотов с консистентным персонажем
  • делать шаблоны под типовые форматы (реклама, клип, сторителлинг)
  • системно улучшать результат итерациями, не «переизобретая» стиль каждый раз
  • 4. Движение, камера и монтаж: управление динамикой в промпте

    Движение, камера и монтаж: управление динамикой в промпте

    ИИ-видео отличается от ИИ-изображений тем, что кадр должен быть согласован во времени: персонажи не «плывут», объекты не исчезают, а движение выглядит намеренным. В прошлых статьях курса вы научились писать промпты по шотам и фиксировать визуальный стиль через якоря. Теперь добавим третий ключевой слой управляемости: динамику — движение внутри кадра, работу камеры и монтажную логику.

    Главная практическая мысль:

    > Динамика лучше управляется, когда вы разделяете: движение объекта, движение камеры и монтаж между шотами — и описываете их как три разные задачи.

    Что такое «динамика» в ИИ-видео

    Под динамикой будем понимать три компонента:

  • Движение в кадре: что делает персонаж или объект, как меняется поза, траектория, скорость.
  • Движение камеры: откуда камера смотрит, как перемещается (или стоит), что у нее в фокусе.
  • Монтаж: как несколько шотов складываются в сцену и что зритель должен понять после склейки.
  • В промпте важно не просто написать «динамично», а указать наблюдаемые команды, которые можно проверить: «камера медленно делает наезд», «персонаж делает шаг и останавливается», «в конце короткая пауза на крупном плане».

    Движение в кадре: как задавать действие так, чтобы оно “поместилось” в секунды

    ИИ-модели лучше всего справляются с простым, читаемым действием, особенно на 4–8 секундах. Чем сложнее хореография (особенно руки, взаимодействие с мелкими предметами, быстрые повороты головы), тем выше риск артефактов.

    Три уровня сложности действия

    | Уровень | Что просить | Почему это стабильно | Типичный риск | |---|---|---|---| | Стабильный | стоять, идти, повернуть голову, поднять объект крупного размера | мало деформаций и пересборки | может получиться «вяло» | | Средний | взять предмет, открыть дверь, обойти препятствие | появляется причинно-следственная логика | руки и контакт с предметом | | Рискованный | танец, драка, сложные жесты, быстрые повороты тела | много суставов и фаз движения | “ломает” анатомию и одежду |

    Как описывать движение: формула из 4 элементов

    Чтобы действие стало управляемым, описывайте его через:

  • кто движется (персонаж/объект)
  • траектория (вперед, вправо, к камере, по дуге)
  • скорость (медленно, плавно, резко, с остановкой)
  • финальная точка (где и в каком состоянии заканчиваем)
  • Пример (одно действие): персонаж делает два шага вперед по мокрому асфальту, замедляется и останавливается у двери, в конце замирает на секунду.

    Микротайминг внутри одного шота

    Тайминг полезно задавать либо одной фразой, либо простым разбиением по времени.

    Так вы снижаете вероятность, что модель попытается «успеть всё сразу».

    Движение камеры: словарь, который работает в промпте

    Камера — это не «красиво снято», а набор параметров: план, угол, перемещение, фокус, стабильность.

    !Шпаргалка по базовым движениям камеры

    Базовые типы движения камеры

  • Статичная камера: лучше всего для стабильности персонажа и деталей.
  • Наезд/отъезд: добавляет «киношность» без сложной геометрии.
  • Панорама/наклон: удобно, когда вы открываете объект или следуете за ним.
  • Следование: камера движется вместе с персонажем, важно указать плавность.
  • Облет (orbit): эффектно, но рискованно для консистентности фона и тела.
  • Стабильность камеры: что именно писать

    Чтобы избежать “дрожи” и хаоса, фиксируйте характер стабилизации:

  • стабилизированная камера, плавное движение, без рывков
  • легкий handheld, очень умеренная дрожь
  • без резких ускорений камеры, без дерганых панорам
  • Важно: если вы пишете одновременно «handheld» и «идеально стабилизировано», это конфликт, который ухудшает результат.

    Фокус и глубина резкости как часть динамики

    Динамика — это не только движение, но и смена внимания. Часто достаточно управлять фокусом:

  • фокус на лице, фон размытый (малая глубина резкости)
  • фокус на руках и объекте на переднем плане
  • легкое дыхание фокуса без заметных скачков
  • Если инструмент часто дает “пампинг” фокуса, добавляйте ограничение: без прыгающего фокуса, без резких перефокусировок.

    Монтаж: как “делать динамику” без сложного движения в одном шоте

    Самый надежный способ повысить динамику — монтаж шотами, а не попытка «внутреннего монтажа» в одной генерации. Это продолжает правило из прошлой статьи: один шот — один главный промпт.

    Монтажные роли шотов

    Обычно сцена собирается из 2–5 шотов, у каждого есть роль:

  • Установочный (где мы?)
  • Действие (что происходит?)
  • Акцент (что важно увидеть?)
  • Реакция (как персонаж отреагировал?)
  • Финал (на чем остановить взгляд?)
  • Типовые монтажные связки, которые хорошо дружат с ИИ

    | Связка | Что делает | Почему удобна | Что уточнить в промптах | |---|---|---|---| | Общий → средний → крупный | приближает внимание | легко удерживать смысл | повторяйте якоря персонажа и локации | | Деталь → действие → деталь | создает ритм | можно избегать сложных рук | фиксируйте один и тот же объект | | Статика → движение → статика | ощущение контроля | меньше артефактов | в конце делайте паузу 0.5–1с |

    !Схема, как собрать динамику монтажом из трех шотов

    Переходы: что реально можно “просить” в промпте

    Большинство генераторов лучше работают, когда каждый шот — самостоятельный непрерывный план, а склейку вы делаете потом. Но в промпте можно заранее подготовить монтаж:

  • Матч по движению: закончите шот движением вправо и начните следующий движением вправо.
  • Матч по композиции: объект в правой трети в конце шота и в правой трети в начале следующего.
  • Матч по свету: одинаковое направление ключевого света в соседних шотах.
  • Внутри промптов это выражается простыми фразами: “в конце движения короткая пауза, персонаж в левой трети, свет слева” — и это же повторяется в начале следующего шота.

    Как собрать “библию движения” для проекта

    Как вы делали стиль-паспорт (персонаж, локация, свет, палитра), так же полезно сделать короткий блок для динамики и вставлять его во все шоты.

    Шаблон: паспорт динамики (копируется во все шоты)

    Смысл: вы удерживаете единый темп ролика, даже если меняете планы.

    Практический пример: сцена из трех шотов с управляемой динамикой

    Задача: 9 секунд, один персонаж подходит к двери в ночном городе. Динамика строится не сложным действием, а ритмом и камерой.

    Шот-лист

  • Шот 1 (3с): установочный — где мы и кто герой.
  • Шот 2 (4с): действие — герой идет к двери, камера следует.
  • Шот 3 (2с): акцент — рука на ручке, короткая пауза.
  • Общие якоря (копируются в каждый шот)

  • Персонаж: женщина 28–32, короткое черное каре с пробором слева, светло-серый шерстяной плащ, черные кожаные перчатки, тонкая золотая серьга-кольцо в правом ухе, родинка под левым глазом.
  • Локация: узкая ночная улица с кирпичными фасадами, мокрый асфальт с отражениями неона, пар от люка, неоновая вывеска без читаемого текста.
  • Свет: неоновые практикалсы, холодный контровой свет сзади, мягкий заполняющий спереди.
  • Промпт шота 1 (установочный)

    Промпт шота 2 (действие + мягкое следование)

    Промпт шота 3 (акцент + пауза)

    Эта сцена выглядит динамично за счет:

  • смены планов (общий → средний → крупный)
  • одного понятного действия (подходит и касается ручки)
  • паузы в конце (зрителю есть за что “зацепиться”)
  • Типичные проблемы динамики и как чинить промптами

    Камера “сходит с ума” или делает странные траектории

    Что сделать:

  • уточнить: камера статична или плавный наезд без бокового смещения
  • добавить ограничения: без резких вращений камеры, без рывков, без внезапных зумов
  • упростить: вместо “облет вокруг персонажа” → “медленный наезд на персонажа”
  • Движение выглядит “ускоренным” или “рваным”

    Что сделать:

  • указать: плавное движение, реалистичная инерция, без резких ускорений
  • добавить: в конце короткая пауза (часто стабилизирует финальные кадры)
  • сократить действие: меньше фаз, меньше “и потом”
  • Монтаж “не клеится”: шоты выглядят как разные сцены

    Что сделать:

  • повторять якоря дословно: одежда, прическа, 3–5 якорей локации
  • повторять световую схему: контровой сзади, заполняющий спереди
  • использовать матч-композицию: объект в той же трети кадра, похожий угол камеры
  • Чек-лист перед генерацией шота (динамика)

  • Один шот содержит одно основное действие?
  • Камера описана однозначно: план + движение + стабильность?
  • Тайминг соответствует длительности: 4–6 секунд = одно действие?
  • Есть ли “точка остановки” (пауза или финальная поза), чтобы шот не разваливался в конце?
  • Ограничения защищают от типичных проблем: рывки камеры, мерцание, прыгающий фокус, деформация рук?
  • Как эта тема связана с предыдущими статьями курса

  • Из статьи про типы промптов вы берете разделение на сцену, камеру, тайминг, стиль и ограничения.
  • Из статьи про сценарий и раскадровку вы берете правило один шот — один промпт и шот-лист.
  • Из статьи про визуальный стиль вы берете якоря персонажа, локации и света.
  • Добавив динамику, вы получаете полноценную систему управления ИИ-видео: смысл (сценарий) → кадры (шоты) → единый стиль (якоря) → управляемое движение (камера + действие + монтаж).

    Полезные справки по базовым терминам (для расширения словаря камеры и монтажа):

  • Кинематография
  • Панорама (кинематография))
  • Монтаж
  • 5. Итерации, контроль качества и адаптация под платформы

    Итерации, контроль качества и адаптация под платформы

    ИИ-видео редко получается «с первого раза». Даже при хорошем сценарии, раскадровке, стиле и динамике (темы прошлых статей) результат почти всегда требует итераций: вы генерируете, оцениваете, диагностируете проблемы и точечно правите промпт.

    Главная практическая мысль:

    > Управляемое качество в ИИ-видео — это не «магический промпт», а повторяемый цикл: план → генерация → проверка → точечная правка → повтор.

    Почему итерации неизбежны именно в видео

    В изображениях вы проверяете один кадр. В видео вы проверяете последовательность кадров, и появляются дополнительные классы ошибок:

  • временная нестабильность: мерцание, прыгающая экспозиция, «пампинг» фокуса
  • потеря консистентности: у персонажа меняется лицо, одежда, предметы в руках
  • ломающееся движение: «резиновая» анатомия, странная физика, внезапные ускорения
  • дрожь камеры и фона: особенно при активных движениях камеры и сложных текстурах
  • Поэтому в этом уроке мы соберем практику: как итеративно улучшать шоты, как формализовать контроль качества и как заранее адаптировать промпты под разные платформы.

    !Блок-схема показывает повторяемый цикл улучшения результата

    Итерационный цикл: как улучшать шот без хаоса

    Чтобы итерации не превращались в случайные попытки, фиксируйте что именно вы меняете и зачем.

    Правило одной правки

    За одну итерацию меняйте один смысловой блок промпта:

  • либо СЦЕНА (объекты и действие)
  • либо КАМЕРА (план/движение/стабилизация)
  • либо СТИЛЬ/СВЕТ
  • либо ТАЙМИНГ
  • либо ОГРАНИЧЕНИЯ
  • либо ЯКОРЯ
  • Если менять всё сразу, вы не поймете, что сработало.

    Мини-лог итераций

    Ведите простую таблицу (в заметках или в файле проекта):

    | Поле | Что записывать | Зачем | |---|---|---| | Шот | S02 | чтобы не путаться при многосценном ролике | | Версия | v03 | чтобы можно было откатиться | | Изменение | «убрал orbit, сделал slow push-in» | фиксирует одну правку | | Ожидаемый эффект | «меньше дрожи фона» | задает критерий успеха | | Итог | «дрожь снизилась, но руки все еще ломает» | направляет следующую итерацию |

    Быстрый диагноз по симптомам

    | Симптом в видео | Частая причина | Что править в промпте | |---|---|---| | Мерцание яркости/цвета | сложный свет, отражения, автоэкспозиция модели | ограничения: «без мерцания, без скачков экспозиции», упростить световую схему | | «Прыгает» фокус | малая ГРИП + активное движение | «камера статична», «фокус стабилен», ограничения: «без прыгающего фокуса» | | Меняется одежда/лицо | слабые или неповторяемые якоря | сократить паспорт персонажа, повторять дословно | | Лишние объекты в кадре | слишком общая сцена | добавить конкретику локации и запреты: «без лишних людей/предметов» | | Дрожит фон при движении камеры | сложное движение камеры | заменить orbit на статичный/наезд, добавить «стабилизированная камера» | | Ломаются руки/пальцы | рискованное действие, мелкие манипуляции | упростить действие, сменить план (не показывать кисть крупно), добавить ограничения |

    Контроль качества: что именно проверять в ИИ-видео

    Контроль качества полезно делать на уровне шота, до того как вы соберете монтаж.

    Чек-лист качества одного шота

    Проверяйте шот по четырем группам критериев.

    #### Смысл и читаемость

  • главный объект понятен с первого просмотра
  • действие укладывается в длительность (обычно 4–6 секунд = одно действие)
  • нет «случайного сюжета»: лишних событий, которые отвлекают
  • #### Визуальная консистентность (якоря)

  • персонаж совпадает с паспортом: волосы, одежда, уникальная деталь
  • локация узнаваема: материалы и 2–3 предмета-идентификатора
  • световая схема стабильна: направление и цвет не скачут
  • #### Временная стабильность

  • нет мерцания и скачков экспозиции
  • нет «плавления» геометрии (стены, двери, надписи, предметы)
  • движение выглядит физически правдоподобно (без внезапных рывков)
  • #### Техническая пригодность под монтаж

  • есть точка остановки: короткая пауза в конце или стабильная финальная поза
  • начало/конец не содержат сильных артефактов (иначе сложно склеивать)
  • кадр не перегружен мелкими деталями, которые будут «шуметь» после компрессии платформ
  • Контроль качества серии шотов (сцены)

    Для сцены из 3–5 шотов добавьте проверку «склейки на бумаге»:

  • Матч по якорям: повторяются ключевые слова про персонажа и локацию.
  • Матч по свету: соседние шоты не конфликтуют по времени суток и направлению света.
  • Матч по композиции: если нужен плавный монтаж, оставляйте объект в одной и той же трети кадра.
  • Ритм: чередуйте статичный шот и шот с движением, чтобы снизить риск артефактов.
  • Точечные правки промпта: что менять, чтобы исправить конкретную проблему

    Ниже — практические «рычаги», которые обычно дают максимальный эффект при минимальной правке.

    Рычаг 1: упростить действие, но сохранить смысл

    Если ломаются руки или контакт с предметом:

  • заменить «открывает замок ключом» → «кладет ключ на стол рядом с замком»
  • заменить «пьет из бутылки» → «ставит бутылку на стол, конденсат блестит»
  • Смысл остается, риск снижается.

    Рычаг 2: стабилизировать камеру

    Если фон «плывет»:

  • заменить «orbit вокруг персонажа» → «медленный наезд без бокового смещения»
  • добавить: «стабилизированная камера, плавное движение, без рывков»
  • Рычаг 3: усилить якоря, но сократить их количество

    Парадокс: слишком много якорей может ухудшить консистентность.

    Практичный диапазон:

  • персонаж: 4–6 якорей (волосы, одежда, 1 уникальная деталь)
  • локация: 3–5 якорей (материалы и 2–3 идентификатора)
  • Важно: повторяйте якоря дословно между шотами.

    Рычаг 4: отрицательные ограничения, только когда вы знаете проблему

    Ограничения полезны, когда вы уже видите конкретную ошибку:

  • «без текста, без логотипов, без водяных знаков»
  • «без мерцания, без скачков экспозиции»
  • «без лишних пальцев, без деформации кистей»
  • Если запретов слишком много, кадр может стать «стерильным» и потерять живость.

    Адаптация под платформы: как думать о формате еще на уровне промпта

    Платформа влияет на то, как будет смотреться кадр после обрезки, компрессии и наложения интерфейса.

    Главные параметры платформ

    | Платформа | Частый формат | Типичная длительность | Что важно для промпта | |---|---|---|---| | TikTok | 9:16 | 6–20с | безопасные зоны под интерфейс, крупнее объект | | Instagram Reels | 9:16 | 6–30с | место под текст/субтитры, читаемый силуэт | | YouTube Shorts | 9:16 | 10–30с | четкий хук в первые 1–2 секунды | | YouTube (обычный) | 16:9 | 10–60с и больше | более широкий кадр, больше «воздуха» |

    Форматы и требования отличаются, но общий принцип один:

    > Промпт должен учитывать кадрирование: где будет главный объект и где вы оставляете место под субтитры/оверлеи.

    Безопасные зоны: оставьте место под интерфейс и текст

    В вертикальных видео интерфейс часто закрывает нижнюю часть и правый край. Поэтому в промпте полезно задавать композицию так:

  • главный объект в центре или в верхней трети
  • не размещать важные детали у нижней кромки
  • оставить «чистую» область фона для будущих субтитров
  • Примеры формулировок:

  • «композиция: главный объект в центре, свободное пространство внизу кадра, чистый фон без деталей»
  • «персонаж в верхней трети, нижняя треть кадра — однотонный фон для субтитров»
  • !Схема безопасных зон для вертикального видео

    Компрессия платформ: почему мелкие детали вредны

    Почти все платформы сильно сжимают видео. Это ухудшает:

  • мелкие узоры (рябь, муар)
  • тонкие линии (решетки, мелкая клетка)
  • сложные мерцающие отражения
  • На уровне промпта это решается так:

  • просить «крупные читаемые формы», «чистые материалы без мелкого узора»
  • избегать «мелкого текста на объектах» (и вообще просить «без текста»)
  • упрощать фон: меньше мелких объектов, больше крупных масс света и тени
  • Шаблоны промптов под платформы

    Ниже — не «магические тексты», а примеры того, какие параметры добавлять к вашему обычному блочному промпту.

    Вертикальный шот 9:16 (Reels/Shorts/TikTok)

    Горизонтальный шот 16:9 (YouTube)

    Финальный pre-flight: что сделать перед «последней» генерацией

    Перед тем как делать финальные версии шотов (особенно если вы планируете несколько дублей для выбора), пройдите короткий контроль.

  • промпт разбит на блоки: сцена, камера, стиль, тайминг, ограничения, якоря
  • якоря персонажа и локации копируются дословно между шотами
  • камера описана однозначно и не конфликтует сама с собой
  • действие одно и помещается в длительность
  • композиция учитывает платформу: кадрирование и место под интерфейс/субтитры
  • ограничения соответствуют уже замеченным проблемам, а не «на всякий случай»
  • Связь с предыдущими статьями курса

  • Из темы сценария и раскадровки вы берете шот-лист и правило один шот — один промпт.
  • Из темы визуального стиля вы берете якоря персонажа, локации и света, которые критичны для консистентности.
  • Из темы движения, камеры и монтажа вы берете контроль динамики: простое действие, понятная камера, монтажный ритм.
  • Эта статья добавляет завершающий производственный слой: как доводить шоты до качества итерациями и как заранее писать промпты так, чтобы ролик был пригоден под конкретную платформу.