Создание нейромодели: Midjourney, Nano Banana, Veo и Kling

1. Что такое нейромодель и требования к консистентности

Что такое нейромодель и требования к консистентности

Зачем вообще нужна нейромодель в этом курсе

В контексте генеративных нейросетей под нейромоделью в практическом смысле часто понимают не «обученную с нуля модель», а устойчиво воспроизводимый образ (персонажа, объекта, стиля или мира), который вы умеете получать в разных сценах и ракурсах.

В этом курсе мы будем собирать такую нейромодель из четырёх инструментов:

Midjourney — удобно для поиска дизайна, образа, стиля и первых эталонных кадров.

Nano Banana — используем как дополнительный генератор/помощник пайплайна (роль зависит от ваших задач: варианты, правки, связующее звено между этапами).

Veo — генерация видео-сцен, когда важна кинематографичность и динамика.

Kling — генерация видео-сцен, когда нужна управляемость и серийность клипов.

Смысл курса: получить не «одну красивую картинку», а пакет согласованных материалов (изображения и видео), где зритель верит, что это один и тот же персонаж/объект/мир.

Что такое нейромодель в прикладном смысле

Нейромодель здесь — это система из трёх частей:

Эталон: 3–10 «канонических» изображений (или кадров), которые фиксируют внешний вид.

Описание: текстовая спецификация (промпт-формула) и набор правил, которые нельзя нарушать.

Процесс: последовательность шагов (какие генерации делаем в каком инструменте и как проверяем совпадение).

Важно: даже если инструмент не обучает отдельную модель «под вас», вы всё равно строите нейромодель как повторяемый рецепт, который выдаёт консистентный результат.

!Схема, показывающая из каких частей состоит нейромодель и как инструменты связываются в процесс

Что такое консистентность и почему без неё нейромодель «не работает»

Консистентность — это согласованность результата между разными генерациями: чтобы «тот же» персонаж оставался тем же, стиль не «плавал», а мир не превращался в другой.

Если консистентности нет, вы получаете набор случайных удачных кадров, которые:

нельзя смонтировать в ролик;

нельзя собрать в серию постов;

нельзя использовать как бренд-персонажа;

нельзя масштабировать (каждый новый кадр приходится «выбивать» заново).

Виды консистентности: что именно должно совпадать

Ниже — основные уровни консистентности. В реальном проекте вы заранее решаете, какие из них обязательны.

Консистентность идентичности (самое важное)

Это совпадение того, кого или что видит зритель.

Для персонажа обычно фиксируют:

форму лица и ключевые пропорции;

причёску (длина, пробор, текстура волос);

возрастной диапазон;

отличительные признаки (шрам, родинка, татуировка, форма бровей);

телосложение.

Для объекта/продукта фиксируют:

силуэт и габаритные пропорции;

материал и фактуру;

конструктивные элементы (кнопки, швы, крепления);

логотипы и маркировку (если применимо).

Консистентность стиля

Это единое художественное «как сделано».

Типовые параметры:

техника (фотореализм, 3D, аниме, иллюстрация);

характер деталей (минимализм/детализация);

тип освещения (мягкий студийный свет, контровой, неон);

цветокор (тёплый, холодный, контрастный, пастельный).

Если стиль «скачет», зритель воспринимает это как разные проекты, даже если персонаж похож.

Консистентность мира (сеттинг)

Это согласованность окружения и правил реальности:

эпоха и технологии (современность, ретрофутуризм, средневековье);

география/архитектура;

одежда и реквизит, соответствующие миру;

физические правила (например, «без магии», «низкая гравитация»).

Консистентность кадра и камеры

Это то, что часто ломает видео и серии изображений:

тип объектива и перспектива;

крупность (портрет, по пояс, полный рост);

угол камеры (сверху/снизу/на уровне глаз);

глубина резкости и характер размытия;

композиционные привычки (центрирование, правило третей).

Временная консистентность (для видео)

Для видео достаточно, чтобы совпадало не только «кто», но и «как он меняется во времени»:

отсутствие «мигания» деталей (узор одежды, украшения);

плавность движений без внезапной смены формы лица;

стабильность света по кадрам (если это не задумано);

предсказуемость объектов в руках (чтобы они не исчезали).

Практический стандарт: что считать достаточно консистентным

Вам нужен не абстрактный идеал, а критерии «принимаем/переделываем». Удобный подход — задавать порог по трём уровням.

Уровень А (строго): можно монтировать подряд крупные планы; персонаж узнаваем в каждом кадре.

Уровень B (рабочий): можно делать серию картинок/постов; различия допустимы, но не меняют идентичность.

Уровень C (черновик): подходит для поиска идей, но не для финала.

Чтобы это было измеримо, заранее выберите 5–7 «контрольных признаков» (например: форма бровей, пробор, цвет глаз, форма носа, тип освещения, палитра, материал одежды) и проверяйте их на каждой генерации.

Почему генераторы «ломают» консистентность

Причины почти всегда практические, а не «вам не повезло»:

вы описали персонажа слишком общими словами, и модель каждый раз дорисовывает детали по-разному;

вы смешали в одном промпте взаимоисключающие стили;

у вас нет эталонов (или эталоны разные);

вы меняете ракурс, освещение и эмоцию одновременно — и получаете другого человека;

вы просите «новую сцену», но не фиксируете неизменные параметры (одежда, причёска, аксессуары);

для видео не закрепили исходный дизайн персонажа эталонными кадрами.

Инструменты курса и их роль в консистентности

Ниже — безопасная логика распределения задач (без привязки к «магическим настройкам», которые могут отличаться по версиям).

Midjourney: делаем дизайн-заморозку — находим канон персонажа/объекта и стиль; получаем эталонные изображения.

Nano Banana: используем как инструмент для дополнительных вариантов, уточнений, промежуточных правок и поддержки серии (когда нужно много попыток и быстрый перебор).

Veo: переносим канон в видео, начиная с простых сцен, где легче удержать идентичность (стабильный свет, спокойные движения).

Kling: строим серийность клипов и тестируем повторяемость на разных сценах, сохраняя канон.

Официальные страницы инструментов, чтобы сверять текущие возможности и ограничения:

Midjourney

Google DeepMind Veo

Kling AI

Документ нейромодели: библия персонажа/объекта

Чтобы добиться консистентности, вам нужен короткий документ (1–2 страницы), который вы будете копировать в работу.

Минимальная структура

Кто это: одно предложение (роль/архетип, без лишней лирики).

Неизменные признаки: 7–12 пунктов, которые нельзя менять.

Разрешённые вариации: что можно менять (одежда по сезонам, эмоции, реквизит).

Запрещённые вариации: что нельзя (смена возраста, другая форма лица, другой стиль).

Словарь стиля: 10–20 ключевых слов (цвет, свет, фактура, эстетика).

Эталонные кадры: ссылки/файлы, помеченные как «канон».

Пример формулировки неизменных признаков

Чтобы нейросети было сложнее «съехать», пишите признаки так, чтобы их можно было проверить глазами:

«короткое каре до линии челюсти, прямой пробор» вместо «красивая причёска»

«кожаная куртка чёрная, матовая, без логотипов» вместо «тёмная одежда»

«мягкий студийный свет слева» вместо «хорошее освещение»

Шаблон промпта: как фиксировать постоянное и менять переменное

Удобная практика — разделять промпт на константы и переменные.

Смысл: вы меняете только блок ПЕРЕМЕННЫЕ, а первые два блока максимально стабильны. Так вы строите нейромодель как повторяемую систему.

Чеклист проверки консистентности перед тем, как двигаться дальше

Перед генерацией видео и серий обязательно проверьте эталонные кадры.

Персонаж узнаваем в 5 разных ракурсах.

Одинаково читаются ключевые признаки (волосы/брови/нос/подбородок или конструктив объекта).

Одежда и материалы не «переизобретаются» от кадра к кадру.

Стиль стабилен (свет, палитра, детализация).

В 2–3 тестовых сценах (простых) нейромодель выдерживает изменения фона.

!Матрица помогает решить, какие параметры должны быть постоянными, а какие можно менять без потери идентичности

Итог

Нейромодель в этом курсе — это канонический образ + правила + процесс, который позволяет получать согласованные изображения и видео в Midjourney, Nano Banana, Veo и Kling. Главная цель первой стадии — определить, что именно обязано быть одинаковым (идентичность и стиль) и как вы будете это проверять, прежде чем переходить к масштабированию серии и к видео.

2. Дизайн персонажа: референсы, бриф, стиль и ограничения

Дизайн персонажа: референсы, бриф, стиль и ограничения

Зачем нужен этап дизайна персонажа

В предыдущей статье мы определили нейромодель как канон + правила + процесс, который даёт консистентный результат. Этот этап — про то, как быстро и осознанно собрать канон персонажа так, чтобы:

Midjourney стабильно воспроизводил внешний вид в разных сценах.

Nano Banana мог быстро накидывать варианты, не ломая идентичность.

Veo и Kling получали понятный «исходник» для видео, где любая неточность заметнее.

Главная идея: сначала вы проектируете персонажа как продукт (через бриф, референсы и ограничения), а уже потом «выбиваете» эталонные кадры генерацией.

Что именно мы проектируем: 4 слоя дизайна

Чтобы консистентность не расползалась, полезно разделить дизайн на слои.

Идентичность: лицо/форма/силуэт, возраст, ключевые признаки.

Материальная часть: одежда, аксессуары, фактуры, реквизит.

Стиль: визуальный язык (фото, 3D, иллюстрация), свет, цвет, детализация.

Кинематографичность: камера, крупности, «как это снимается» (важно для будущего видео).

Если вы не фиксируете слой, генератор будет «додумывать» его заново в каждом кадре.

Референсы: как собирать и использовать

Что такое референс в рамках нейромодели

Референс — это пример решения, который помогает точно описать желаемый результат. Важно: референс не обязательно «копировать». Его задача — зафиксировать параметры, которые вы потом превратите в текстовые правила.

Какие референсы нужны

Соберите минимум по одному референсу на каждый блок:

Лицо/голова: форма лица, брови, нос, губы, прическа.

Тело/силуэт: рост, пропорции, осанка.

Одежда: крой, слои, материалы, силуэт.

Фактура: кожа, ткань, металл, пластик, степень «новизны».

Цвет и свет: палитра, контраст, температура света.

Камера: пример крупности и оптики (портрет/полный рост, «ширик»/«портретник»).

Практическое правило «не мешать всё сразу»

Если вы смешиваете референсы из разных визуальных миров (например, «глянцевое фото», «аниме», «пластилиновая 3D-графика») в одном персонаже без чётких указаний, вы почти гарантированно получите плавающий стиль.

Чтобы этого избежать:

Выберите один базовый визуальный язык (например, «фотореализм»).

Остальные референсы используйте как подсказки для деталей, а не как альтернативные стили.

!Пример структуры мудборда, чтобы референсы не конфликтовали и сразу раскладывались по слоям

Бриф персонажа: короткий документ, который экономит десятки генераций

Бриф — это текст, который вы сможете:

вставлять в промпты как «константы»;

превращать в список проверяемых признаков;

использовать как ТЗ для серии изображений и видео.

Шаблон брифа (заполните один раз)

#### Ядро

Кто персонаж: одно предложение (роль и функция в истории/бренде).

Где живёт: мир/эпоха/сеттинг одной строкой.

Ключевое впечатление: 3–5 прилагательных (например: «собранный, умный, немного опасный»).

#### Внешность (фиксируем проверяемо)

Возрастной диапазон: конкретно (например: «28–35»).

Телосложение: коротко (например: «стройный, спортивный, узкие плечи»).

Лицо: 3–6 признаков, которые легко увидеть.

Волосы: длина, пробор, текстура.

Особые приметы: родинка/шрам/тату/украшение.

#### Одежда и реквизит

Базовый комплект одежды: 3–6 пунктов (с материалами).

Что всегда при нём: 1–3 предмета.

Что нельзя добавлять: например «без логотипов и надписей».

#### Стиль и камера

Техника: фотореализм / 3D / иллюстрация (выбрать одно).

Свет: тип и направление (например: «мягкий студийный слева»).

Палитра: 3–6 цветов словами.

Камера: привычные крупности и угол (например: «портрет на уровне глаз»).

Чем бриф отличается от «описания персонажа для сюжета»

Сюжетное описание может быть художественным. Бриф для нейромодели должен быть инженерным: всё, что важно, формулируется так, чтобы это можно было проверить глазами.

Стиль: как выбрать и зафиксировать, чтобы он не «плыл»

Выберите один «главный стиль»

Удобная стратегия — выбрать стиль как комбинацию из трёх фиксированных компонентов:

Медиум: фото / кино / 3D / иллюстрация.

Качество и детализация: «натуральная кожа и ткань видны», «умеренная резкость», «микродетали».

Свет и цвет: «мягкий», «контрастный», «тёплый/холодный», палитра.

Словарь стиля

Сделайте список из 10–20 слов, которые вы будете повторять в каждом промпте.

Примеры слов про свет: «мягкий», «контровой», «рассеянный дневной».

Примеры про цвет: «приглушённые», «монохром», «неоновые акценты».

Примеры про картинку: «кинематографично», «реалистичная кожа», «умеренная зернистость».

Важно: если вы постоянно меняете словарь стиля, консистентность будет снижаться даже при одинаковом персонаже.

Ограничения: что запрещаем, чтобы консистентность выросла

Ограничения — это не «занудство», а защита канона. Чем больше вы планируете сцен и видео, тем важнее запреты.

Типовые запреты для персонажа

Возраст/пол/этничность: если это критично для узнаваемости.

Кардинальная смена причёски: длина, пробор, текстура.

Логотипы и текст на одежде: часто «мигают» и меняются.

Случайные аксессуары: очки, серьги, пирсинг, если не канон.

Экстремальные гримасы на раннем этапе: сначала закрепите нейтральные эмоции.

Типовые запреты для стиля

Не смешивать «иллюстрация» и «фото» в одном каноне.

Не менять одновременно свет, палитру и камеру на этапе закрепления.

Не добавлять «модные» слова, которые уводят стиль (например, если вы не планировали «аниме»-эстетику, не используйте такие маркеры).

Как превратить бриф в промпт-формулу (константы и переменные)

Ниже — практичная структура, совместимая с логикой предыдущей статьи: вы удерживаете блоки констант, а меняете только сцену.

Если вы видите, что персонаж «уплывает», почти всегда помогает:

усилить блоки идентичности и одежды (сделать признаки конкретнее);

временно упростить сцену (нейтральный фон, спокойная поза);

уменьшить число одновременно изменяемых переменных.

Практический пайплайн дизайна в контексте курса (до видео)

На этом этапе ваша цель — получить 3–10 эталонных изображений (канон), с которыми вы пойдёте дальше в Nano Banana, Veo и Kling.

Шаг 1: разведка в Midjourney

Сгенерируйте 20–60 вариантов по одному брифу, меняя только 1–2 параметра.

Выберите 2–3 кандидата, максимально близких к канону.

Уточните детали (волосы, одежда, особая примета), пока кандидат не станет устойчивым.

Официальная страница инструмента: Midjourney

Шаг 2: канонический набор кадров

Сделайте набор, который закрывает базовые ракурсы и пригодится для будущего видео.

Портрет анфас (нейтральная эмоция).

Портрет 3/4.

Профиль.

По пояс.

Полный рост.

Шаг 3: тест на «переносимость»

С теми же константами попробуйте 3 простых сцены.

Другой фон (но без смены света и палитры).

Другая поза (но без сложной динамики).

Другая эмоция (мягкая: улыбка/внимание).

Если переносимость слабая — возвращайтесь к брифу и ограничениям, а не «добивайте случайностью».

Шаг 4: подготовка к видео (Veo и Kling)

Для видео важнее всего:

устойчивый профиль и 3/4 (они чаще всего «ломаются»);

отсутствие мелких нестабильных деталей (сложные узоры, мелкий текст);

чётко заданная камера и свет.

Официальные страницы инструментов, чтобы сверять актуальные возможности:

Google DeepMind Veo

Kling AI

Мини-шаблон «библии персонажа» (то, что вы унесёте в следующие уроки)

Соберите в один документ:

Короткий бриф (ядро, внешность, одежда, стиль).

Неизменные признаки: 7–12 пунктов.

Разрешённые вариации: 3–8 пунктов.

Запрещённые вариации: 5–12 пунктов.

Словарь стиля: 10–20 слов.

Канон-кадры: 3–10 изображений, помеченных как эталон.

Именно этот документ превращает «мне нравится вот такая картинка» в управляемую нейромодель, с которой можно серийно работать.

3. Midjourney: генерация образа, промпты, позы, свет и ракурсы

Midjourney: генерация образа, промпты, позы, свет и ракурсы

Роль Midjourney в пайплайне нейромодели

Midjourney в этом курсе выполняет ключевую задачу: быстро найти и зафиксировать канон персонажа или объекта, чтобы затем переносить его в серию изображений и в видео (Nano Banana, Veo, Kling) без потери идентичности.

Из предыдущих статей у вас уже есть:

понимание, что нейромодель = канон + правила + процесс

бриф персонажа и ограничения

идея разделения промпта на константы и переменные

Теперь соберём это в практический способ работы именно в Midjourney.

Полезные источники по синтаксису и параметрам Midjourney:

Midjourney

Midjourney Documentation

!Общая карта процесса: где Midjourney находится и какую часть консистентности он фиксирует

Как устроена генерация в Midjourney и что важно для консистентности

Midjourney отвечает на ваш промпт вероятностно: при каждом запуске он может «додумывать» детали. Поэтому для нейромодели важно не просто сделать красивый кадр, а снизить свободу интерпретации.

Практическая цель этапа Midjourney:

получить 3–10 эталонных изображений, которые вы называете каноном

зафиксировать: лицо и пропорции, волосы, ключевые элементы одежды, базовый свет и базовую камеру

подготовить набор ракурсов, который выдержит перенос в другие сцены и в видео

Промпт-формула для нейромодели: что писать и в каком порядке

Чтобы персонаж повторялся, промпт должен быть инженерным, как бриф из предыдущего урока: минимум метафор, максимум наблюдаемых признаков.

Структура промпта: константы и переменные

Используйте одну и ту же структуру, меняя только блок сцены.

Почему это работает:

Midjourney каждый раз «цепляется» за повторяющиеся формулировки

вы контролируете изменения: меняете одно (например фон), но не перепридумываете персонажа

Слова, которые обычно вредят консистентности

На этапе закрепления канона избегайте слов, которые заставляют модель импровизировать:

слишком общие оценки: красивая, идеальная, стильная

размытые указания: в тренде, в духе модных журналов

многослойные стилевые миксы: аниме + фото + пластилин + 3D

Вместо этого давайте признаки, которые можно проверить глазами.

Управление параметрами Midjourney: что трогать в первую очередь

Конкретные команды и интерфейс могут отличаться в зависимости от версии Midjourney, но логика параметров остаётся стабильной: часть параметров отвечает за форму кадра, часть за свободу вариаций, часть за повторяемость.

Ниже перечислены параметры, которые чаще всего используют для консистентного дизайна. Сверяйте актуальный синтаксис в Midjourney Documentation.

| Задача | Что фиксировать | Зачем это нужно | |---|---|---| | Одинаковая композиция серии | соотношение сторон --ar | разные кадры проще сравнивать и отбирать в канон | | Снижение «творческой вольности» | умеренный уровень стилизации --stylize | меньше неожиданных деталей и «съезда» лица | | Управляемость перебора | уровень случайности --chaos | высокие значения дают больше расхождений между вариантами | | Повторяемость удачного результата | --seed | помогает воспроизводить близкие вариации в той же логике | | Запрет нежелательных элементов | негативные ограничения --no | снижает появление текста, логотипов, лишних аксессуаров |

Правило этапа канона:

сначала фиксируйте --ar и базовый стиль

затем стабилизируйте лицо и одежду

только потом усложняйте сцену

Референсы в Midjourney: как использовать картинки, не теряя стиль

Midjourney поддерживает промпты с изображениями: вы можете подать ссылку на картинку как ориентир, а затем описать текстом, что именно нужно сохранить.

Практический смысл для нейромодели:

картинка помогает удержать уникальные черты лица и одежды

текст фиксирует стиль, свет и запреты

Рекомендация по процессу:

возьмите 1 канон-кадр, который ближе всего к нужному лицу

используйте его как reference для получения новых ракурсов

не добавляйте сразу новый свет, новую эмоцию и новый фон

Если вы видите «плавание», временно упростите:

нейтральный фон

одна и та же крупность

нейтральная эмоция

Поза: как задавать так, чтобы не ломалась идентичность

Поза в генерации опасна тем, что вместе с телом часто меняется:

форма челюсти

расстояния между чертами лица

длина шеи и плечи

Базовый набор поз для закрепления канона

Начните с поз, где риск минимальный:

стоя ровно, руки вдоль тела

по пояс, плечи расслаблены

лёгкий поворот корпуса на 10–20 градусов

Только после этого переходите к динамике:

шаг

поворот головы

жест рукой

Как описывать позу в промпте

Пишите коротко и однозначно:

neutral pose, relaxed shoulders

hands not visible или hands down

head turned slightly to the left

Избегайте на старте:

сложной акробатики

взаимодействия с мелкими предметами

сильных наклонов к камере

Свет: как зафиксировать и почему он влияет на «узнаваемость»

Одна из причин, почему персонаж кажется другим, даже если черты лица похожи, это свет.

Три рабочих схемы света для нейромодели

Выберите одну базовую схему и держите её в эталонах.

Мягкий студийный свет слева

Рассеянный дневной свет из окна сбоку

Пасмурный уличный свет без жёстких теней

Что важно фиксировать словами:

источник: студийный, дневной, уличный

направление: слева, справа, сверху

характер: мягкий или жёсткий

На этапе канона полезно запрещать:

неон

разноцветные источники света

контровой свет, который «съедает» контуры лица

Ракурсы и камера: как собрать эталонный набор кадров

Для переноса в видео (Veo и Kling) вам нужен набор ракурсов, который покрывает типовые углы и крупности.

Канонический набор ракурсов

Соберите минимум 5 кадров в одном стиле.

портрет анфас, нейтральная эмоция

портрет 3/4

профиль

по пояс

полный рост

!Пример того, как выглядит базовый эталонный набор ракурсов для «канона»

Как описывать камеру

Чтобы Midjourney меньше импровизировал, фиксируйте:

крупность: портрет, по пояс, полный рост

угол: на уровне глаз

оптику как словами: portrait lens look, 85mm look, 35mm wide angle look

Практический совет:

закрепляйте лицо на портретной оптике

для полного роста делайте отдельный блок эталонов, потому что генераторы часто «переизобретают» тело

Пошаговый процесс: от брифа к канону в Midjourney

Ниже процесс, который связывает предыдущие статьи с практикой.

Стадия поиска

Берёте бриф и превращаете его в промпт-константы.

Генерируете серию вариантов, меняя только 1–2 признака за итерацию.

Выбираете 2–3 кандидата, которые ближе всего к идее.

Стадия закрепления

Выбираете одного кандидата как основного.

Получаете 5 ракурсов из раздела про канонический набор.

Проверяете, что совпадают контрольные признаки из первой статьи (например: пробор, форма бровей, особая примета, материалы одежды).

Стадия переносимости

Делаете 3 простые сцены с теми же константами.

Меняете по одной переменной:

фон

лёгкая эмоция

небольшая поза

Если идентичность «плывёт», вы возвращаетесь к:

уточнению констант (делаете их более проверяемыми)

усилению запретов (убираете всё лишнее)

упрощению сцены

Типовые ошибки и быстрые исправления

| Симптом | Частая причина | Что сделать | |---|---|---| | каждый раз «новое лицо» | слишком общие слова, нет особых примет | добавить 3–6 проверяемых признаков лица, зафиксировать волосы и пробор | | «скачет» одежда | одежда описана как “тёмная/модная” | указать крой и материал, запретить логотипы и принты | | стиль превращается в другой | смешаны эстетики и источники света | выбрать один медиум, зафиксировать свет и палитру | | профиль не похож на анфас | ракурс + свет поменялись одновременно | сначала получить профиль при том же свете и крупности | | руки и предметы «ломают» кадр | сложная динамика и мелкие детали | убрать предметы, начать с поз без рук в кадре |

Что должно быть готово после этого урока

К концу работы в Midjourney у вас должен появиться набор, который вы положите в библию персонажа:

3–10 канонических изображений

список неизменных признаков (7–12 пунктов)

словарь стиля (10–20 слов)

промпт-шаблон с константами и переменными

список запретов, которые реально уменьшили «плавание»

Именно этот пакет станет входом в следующие этапы курса, где мы будем масштабировать серию (в том числе через Nano Banana) и переносить персонажа в видео (Veo и Kling).

4. Консистентность личности: сиды, вариации и контроль деталей

Консистентность личности: сиды, вариации и контроль деталей

Зачем нужен этот урок

В предыдущих материалах вы:

определили нейромодель как канон + правила + процесс

сделали бриф и ограничения

научились получать канон в Midjourney через константы и переменные

Дальше обычно возникает проблема: вы нашли «то самое лицо», но при смене ракурса, позы или сцены персонаж становится похожим, но другим. Этот урок — про практику удержания личности (идентичности) через управляемые вариации: сиды, аккуратный перебор и контроль деталей.

Официальные источники, где сверяйте актуальный синтаксис параметров:

Midjourney

Midjourney Documentation

Что именно мы удерживаем, когда говорим «личность»

Под консистентностью личности мы понимаем повторяемость набора признаков, по которым зритель без усилий узнаёт персонажа.

Типовой набор контрольных признаков (выберите 7–12 и зафиксируйте в библии персонажа):

форма лица и подбородка

линия бровей и их расстояние

форма носа

форма губ

расстояние между глазами и их посадка

причёска: длина, пробор, текстура

цвет глаз

1–2 особые приметы (шрам, родинка, прядь, серёжка если она канон)

базовый свет (характер и направление)

базовая «камера» (крупность и угол)

Ключевая мысль: если вы не измеряете личность через проверяемые признаки, вы будете «догонять ощущение», а это всегда десятки лишних генераций.

Сид: что это и зачем он нужен

Сид (seed) — это параметр, который помогает генератору повторять близкую логику изображения при тех же входных условиях. В практическом смысле сид позволяет:

воспроизводить удачную «основу» кадра и получать вариации, не уходя в другой тип лица

сравнивать изменения честно: вы меняете один параметр и видите, что именно он делает

Важно понимать ограничения:

сид не гарантирует точную копию, особенно если вы сильно меняете сцену, свет, крупность или добавляете новые требования

сид лучше работает как инструмент стабильного перебора на этапе закрепления канона, чем как «магическая кнопка идентичности»

Практическое правило работы с сидом

Держите сид фиксированным, пока вы делаете одну задачу.

Примеры задач:

собрать 5 ракурсов при одном свете

подобрать одну устойчивую прическу и один устойчивый комплект одежды

подобрать нейтральную эмоцию, которая не меняет черты лица

Как только задача решена — можно менять сид, но только если вы уверены, что канон уже закреплён эталонами.

Вариации без потери личности: метод «одна переменная за раз»

Самый частый источник «съезда лица» — вы меняете сразу много вещей: позу, ракурс, эмоцию, фон, свет, одежду. Для нейромодели это выглядит как запрос на нового персонажа.

Используйте метод управляемого перебора:

Зафиксируйте константы (идентичность, одежда, стиль, камера) и сид.

Выберите одну переменную.

Сделайте серию из 4–12 попыток.

Отберите 1–2 результата, которые проходят чеклист личности.

Только после этого переходите к следующей переменной.

!Диаграмма показывает, как делать вариации, не ломая идентичность

Что считать «одной переменной»

Хорошие примеры (низкий риск):

фон при том же свете и той же крупности

лёгкий поворот головы на 10–20 градусов

смена крупности в пределах портретных (например, от крупного портрета к по пояс)

Плохие примеры (высокий риск):

одновременно «ночь + неон + динамика + широкий угол + новая одежда»

смена эмоции на экстремальную (крик, сильный смех) одновременно со сменой ракурса

Контроль деталей: как не утонуть в мелочах и не потерять лицо

Детали — главный враг консистентности: чем их больше, тем больше точек, где модель может «мигать». Поэтому нужен контроль: что фиксируем жёстко, что допускаем как вариацию.

Классы деталей

Удобно разделить детали на три класса.

| Класс | Что входит | Правило для нейромодели | |---|---|---| | Критические | лицо, волосы, особые приметы, базовая одежда-силуэт | фиксируем жёстко, повторяем в каждом промпте | | Поддерживающие | цветокор, фактура ткани, тип света, аксессуар (если канон) | фиксируем, но допускаем небольшую погрешность | | Шум | мелкий текст, сложные узоры, случайные украшения, мелкий реквизит | по возможности запрещаем на этапе закрепления |

Запреты как инструмент контроля

Запреты нужны не ради «негативного промпта», а ради уменьшения пространства для случайностей.

Типовые запреты на этапе канона:

без текста, надписей и логотипов

без сложных узоров на одежде

без лишних украшений (если они не канон)

без очков (если они не канон)

без сильного грима и экстремальных эмоций

Если вы планируете видео в Veo или Kling, запреты становятся ещё важнее: мелкие и нестабильные детали в движении часто «дрожат» и «перепридумываются».

Как «чинить» личность, если она поплыла

Ниже — практичная диагностика: симптом → причина → действие. Это важнее любых «секретных настроек», потому что масштабируется на любые генераторы.

| Симптом | Частая причина | Что сделать | |---|---|---| | «Каждый раз другое лицо» | константы слишком общие; нет особых примет; одновременно меняете много переменных | добавить 3–6 проверяемых признаков лица; зафиксировать волосы и пробор; вернуться к «одна переменная за раз» | | «Анфас похож, профиль нет» | профиль генерируется как новый дизайн; меняется свет/крупность | получать профиль при том же свете и близкой крупности; временно упростить фон | | «Одежда всегда чуть другая» | одежда описана оценочно; много мелких деталей | описать крой и материал; запретить принты/логотипы; выбрать один базовый комплект | | «Вроде тот же, но настроение/возраст скачет» | эмоция и свет меняются вместе; слова типа «glamour / fashion» добавляют импровизацию | зафиксировать возраст диапазоном; сделать нейтральную эмоцию каноном; убрать слова, которые меняют эстетику |

Мини-процесс: как собрать устойчивый пакет эталонов под будущие видео

Чтобы Veo и Kling меньше «перерисовывали» персонажа, вам нужен не один портрет, а связанный набор.

Рекомендуемый пакет эталонов (минимум):

портрет анфас, нейтральная эмоция

портрет 3/4, тот же свет

профиль, тот же свет

по пояс, нейтральная поза

полный рост, простая поза

Правило добавления эталона в канон:

На эталоне должны читаться ваши 7–12 контрольных признаков.

На эталоне не должно быть «шума», который вы не сможете стабильно повторять.

Эталон должен быть пригоден как опора для переноса в другие инструменты (Nano Banana для быстрых вариантов, Veo и Kling для видео).

Как связать Midjourney с Nano Banana, Veo и Kling, не ломая личность

В рамках пайплайна курса логика такая:

Midjourney даёт канон и набор проверенных формулировок констант.

Nano Banana полезен как быстрый перебор/уточнение, когда вам нужно много попыток или мягкие корректировки, но вы всё равно сверяетесь с теми же контрольными признаками.

Veo и Kling требуют особенно строгого канона: видео усиливает любые расхождения, потому что зритель сравнивает кадры во времени.

Практический вывод: чем лучше вы настроили сиды, вариации и контроль деталей на статике, тем меньше времени вы потеряете на «плавание» в видео.

Итог

Консистентность личности достигается не одной настройкой, а дисциплиной процесса:

фиксируете константы и используете сид для управляемого перебора

меняете одну переменную за раз

контролируете детали через классы (критические, поддерживающие, шум)

добавляете в канон только те кадры, которые проходят чеклист личности

Это превращает Midjourney-генерацию из «охоты за удачей» в воспроизводимую систему, которая дальше переносится в Nano Banana и в видео (Veo, Kling).

5. Nano Banana: закрепление лица, правки, апскейл и ретушь

Nano Banana: закрепление лица, правки, апскейл и ретушь

Роль Nano Banana в пайплайне нейромодели

В предыдущих уроках вы собрали канон в Midjourney: эталонные кадры, список неизменных признаков, словарь стиля, промпт-формулу с константами и переменными. Теперь задача — сделать этот канон практически переносимым в серию и в видео.

Nano Banana в рамках курса используем как инструмент для:

закрепления узнаваемости лица через работу от эталона к эталону

точечных правок без пересоздания всего кадра

апскейла (увеличения разрешения) и подготовки картинок для видео-генераторов

быстрой ретуши и устранения типовых артефактов (текст, лишние аксессуары, «ломающиеся» детали)

!Схема, показывающая место Nano Banana между каноном и видео

Термины, которые понадобятся

Чтобы дальше не было «магии», зафиксируем понятия простыми словами.

Image-to-image: генерация по исходной картинке, когда изображение является опорой, а текст управляет изменениями.

Inpainting: правка только выделенной области (например, исправить глаз, убрать логотип).

Outpainting: дорисовка за пределами исходного кадра (например, расширить фон или кадрировать под другой формат).

Апскейл: увеличение разрешения изображения с попыткой сохранить детали и резкость.

Ретушь: исправления «косметического» уровня, которые не должны менять идентичность (пятна, артефакты, лишние элементы).

Принцип консистентности в Nano Banana

В Midjourney вы удерживали личность через константы, ограничения и дисциплину «одна переменная за раз». В Nano Banana принцип тот же, но появляется важное отличие.

Midjourney чаще полезен для создания канона.

Nano Banana чаще полезен для сохранения канона при правках.

Практическое правило:

если вам нужно заменить 10% кадра, делайте inpainting

если вам нужно заменить 60% кадра, скорее всего вы уже делаете новый дизайн и рискуете «потерять человека»

Подготовка входных материалов

Перед правками подготовьте набор, с которым вы не будете спорить каждый раз.

Минимальный комплект для работы

3–10 канон-кадров из Midjourney (анфас, 3/4, профиль, по пояс, полный рост)

список 7–12 контрольных признаков личности из урока про консистентность

промпт-шаблон с константами и переменными

список запретов (без текста, без логотипов, без случайных украшений)

Как выбрать «главный эталон лица»

Выберите один кадр, который будет чаще всего использоваться как опора в image-to-image.

Критерии хорошего главного эталона:

нейтральная эмоция

чётко видны брови, линия носа, форма губ

стабильная причёска (без «летящих» прядей, если они не канон)

простой свет (без неона и разноцветных источников)

Закрепление лица: работа от эталона

Закрепление лица в Nano Banana — это серия контролируемых преобразований, где вы постоянно сверяете результат с контрольными признаками.

Базовый процесс закрепления

Берёте главный эталон лица как опорную картинку.

Используете тот же блок констант (идентичность, волосы, особые приметы).

Меняете только одну переменную (например, фон или лёгкий поворот головы).

Отбираете 1–2 удачных результата и добавляете их в канон как вторичные эталоны.

Зачем вторичные эталоны:

один эталон плохо переносится на все ракурсы

для видео особенно важны 3/4 и профиль, и их лучше закреплять отдельными «чистыми» опорами

Что считается «съездом личности» при правке

Если вы видите хотя бы 2–3 пункта из списка ниже, результат лучше не ретушировать дальше, а откатиться.

поменялась форма подбородка или скул

«переехали» брови или изменилась их дуга

изменилось расстояние между глазами

стал другим возраст (резко моложе или старше)

появилась другая линия роста волос

Правки через inpainting: как исправлять, не ломая канон

Inpainting — главный режим полезных правок, потому что вы ограничиваете свободу генератора.

Типовые задачи inpainting

исправить один глаз, который «поплыл»

поправить форму губ при лёгкой улыбке

убрать текст, логотип, водяной знак

удалить случайные украшения, очки, пирсинг

исправить руки, если они попали в кадр и выглядят неестественно

Правило «маленькой маски»

Чем меньше область правки, тем выше шанс сохранить идентичность.

Практика:

сначала правьте самую маленькую область (например, только зрачок и веко)

расширяйте маску только если точечная правка не сработала

!Сравнение маленькой и большой маски для inpainting

Как писать текст для inpainting

Текст в правке должен быть ещё более конкретным, чем в обычной генерации.

пишите, что именно изменить: «правый глаз: такой же размер, такое же направление взгляда, естественная симметрия»

повторяйте ключевые константы: «те же брови, тот же пробор, тот же шрам»

избегайте слов, которые «перерисовывают» лицо целиком: идеальная красота, модельная внешность, гламур

Outpainting и адаптация под форматы

Outpainting полезен, когда вам нужно подготовить материалы под будущие сцены и видео.

Когда outpainting оправдан

сделать больше пространства над головой для титров (если это часть задачи)

расширить фон под нужное соотношение сторон

привести серию к одному кадрированию

Что лучше не делать outpainting-ом на этапе канона

дорисовывать сложные узоры на одежде

добавлять мелкий реквизит в руки

менять освещение и время суток

Причина простая: мелкие детали и сильные смены условий потом «мигают» в видео.

Апскейл: зачем он нужен и как не испортить лицо

Апскейл нужен не ради «8K ради 8K», а чтобы:

уменьшить мыло и артефакты перед ретушью

подготовить кадры для видео-генерации, где низкое разрешение усиливает дефекты

сделать эталоны более читаемыми для последующих image-to-image шагов

Практические правила апскейла

сначала апскейл, потом ретушь мелочей (так вы ретушируете по более чистой базе)

проверяйте, не изменились ли контрольные признаки лица (иногда апскейл «дорисовывает» брови или текстуру кожи)

не используйте агрессивное «улучшение деталей», если оно меняет форму глаз, губ, линии волос

Как понять, что апскейл навредил

появилась «пластиковая кожа» вместо естественной текстуры

поменялась форма ноздрей или контур губ

изменилась линия роста волос или пробор стал другим

Если это происходит, лучше выбрать более мягкий режим апскейла или использовать другой эталон.

Ретушь: что исправляем, а что запрещаем

Ретушь в нейромодели — это не про «сделать красивее», а про «сделать стабильнее».

Что ретушируем смело

пятна и случайные артефакты на коже, которые не являются каноном

мусор на фоне, случайные элементы окружения

дефекты одежды, если они не меняют крой и материал

Что ретушировать опасно

симметрия лица целиком

изменение формы носа и подбородка

усиление макияжа, если он не является частью канона

Таблица: приоритеты правок

| Элемент | Приоритет | Почему | |---|---:|---| | Текст, логотипы, надписи | высокий | часто «мигают» и меняются между кадрами | | Глаза и взгляд | высокий | главный маркер узнаваемости | | Брови и пробор | высокий | быстро ломают идентичность | | Руки (если в кадре) | средний | важны, но лучше сначала собирать канон без них | | Фон и мелкий реквизит | низкий | не должен конкурировать с идентичностью |

Пакетирование результата: как оформить канон после Nano Banana

Чтобы дальше в Veo и Kling вы работали быстро, соберите результат в библию персонажа.

Рекомендуемая структура папки проекта:

01_canon_midjourney (исходные эталоны)

02_canon_nanobanana (улучшенные эталоны после правок)

03_variations (контролируемые вариации сцен)

04_video_inputs (кадры, которые пойдут в Veo и Kling)

Что добавить в документ нейромодели после этого урока:

главный эталон лица + 2–4 вторичных эталона (3/4, профиль, по пояс)

список типовых правок, которые вы делали успешно (например: «убрать логотипы через inpainting маленькой маской»)

обновлённый список запретов (что реально мешало консистентности именно у вас)

Мини-чеклист перед переходом к видео

Перед Veo и Kling убедитесь, что у вас есть стабильная база.

один главный эталон лица в хорошем качестве

отдельные устойчивые эталоны 3/4 и профиля

базовая одежда без мелких нестабильных узоров

серия из 3–5 изображений, где вы меняли только одну переменную и личность сохранилась

Итог

Nano Banana в пайплайне нейромодели — это этап усиления канона: вы не столько «генерите новое», сколько закрепляете лицо и стиль через точечные правки, аккуратные вариации, апскейл и ретушь. Если вы держите дисциплину констант, делаете inpainting маленькими масками и проверяете контрольные признаки после каждого шага, персонаж становится заметно более переносимым в серию и в видео.

6. Veo и Kling: видео с нейромоделью, сцены, движения и липсинк

Veo и Kling: видео с нейромоделью, сцены, движения и липсинк

Роль Veo и Kling в пайплайне курса

На предыдущих этапах вы сделали главное: зафиксировали канон персонажа в Midjourney и усилили его переносимость в Nano Banana (эталоны, контрольные признаки, запреты, аккуратные правки).

Veo и Kling в этом курсе нужны для следующего шага: превратить канон в движущиеся сцены, сохранив узнаваемость во времени.

Veo используйте, когда приоритет: кинематографичность, сложные сцены, выразительная камера и свет.

Kling используйте, когда приоритет: серийность клипов, управляемый повторяемый формат, быстрый перебор вариантов.

Официальные страницы, чтобы сверять текущие возможности (функции и интерфейсы быстро меняются):

Google DeepMind Veo

Kling AI

!Диаграмма показывает место Veo и Kling в общем процессе курса

Что должно быть готово перед видео

Видео усиливает любые несоответствия: зритель сравнивает персонажа не между картинками, а между соседними кадрами. Поэтому перед переходом в Veo/Kling проверьте базу.

Минимальный набор входных материалов:

1 главный эталон лица (нейтральная эмоция, хороший свет)

2–4 вторичных эталона (3/4, профиль, по пояс)

список 7–12 контрольных признаков (из урока про консистентность)

базовый комплект одежды без текста и сложных узоров

словарь стиля (10–20 слов, которые вы повторяете)

список запретов (без логотипов, без случайных аксессуаров и так далее)

Если этого нет, вы будете лечить проблемы уже в видео, а это обычно дороже по времени, чем исправить статические эталоны.

Главная сложность видео: временная консистентность

В статике достаточно, чтобы персонаж был узнаваем. В видео добавляется временная консистентность.

Типовые проблемы:

мигание деталей: узор одежды, серьги, пуговицы появляются и исчезают

плывущие пропорции лица: меняется челюсть, посадка глаз, линия роста волос

дрожащий свет: тени прыгают между кадрами

нестабильные руки: форма пальцев меняется от кадра к кадру

Поэтому стратегия курса: сначала делаем простые сцены с низким риском, и только потом усложняем.

Как проектировать сцены так, чтобы нейромодель выдержала видео

Думайте как режиссёр, который снимает персонажа в условиях, где актёр должен быть узнаваем всегда.

Матрица риска для сцен

Ниже — практичная матрица, которая помогает выбирать, что генерировать сначала.

| Элемент сцены | Низкий риск | Высокий риск | |---|---|---| | Движение | лёгкий поворот головы, спокойная поза | бег, танец, резкие жесты | | Камера | статичная, уровень глаз | активный трекинг, зум, дрон | | Свет | мягкий ровный | неон, контровой, строб | | Одежда | однотонная, без узоров | мелкий принт, сложная фактура | | Реквизит | нет или крупный простой | мелкие предметы в руках | | Крупность | по пояс, средний план | экстремальный крупный план или полный рост в динамике |

Рекомендация для первых клипов:

средний план или по пояс

мягкий свет

минимальное движение

простой фон

!Матрица помогает выбрать безопасные сцены для старта

Входные режимы: text-to-video и image-to-video

Точные названия режимов зависят от конкретного интерфейса, но логика обычно одна.

Text-to-video: вы описываете сцену текстом.

Image-to-video: вы даёте опорный кадр (эталон) и просите оживить его.

Для нейромодели чаще безопаснее начинать с image-to-video, потому что эталон сильнее держит лицо и одежду.

Промпт-структура для видео: константы, переменные и запреты

В видео дисциплина из прошлых уроков становится ещё важнее: вы повторяете константы буквально.

Ниже — универсальный шаблон, который вы адаптируете под Veo и Kling.

Практическое правило: если клип «плывёт», не добавляйте новых деталей в промпт. Наоборот, упростите сцену и вернитесь к одному движению.

Построение серии: список шотов вместо одной длинной сцены

Стабильнее получать не «один большой ролик», а серию коротких клипов (шотов), которые потом можно смонтировать.

Рекомендуемый стартовый набор из 5 шотов:

средний план: лёгкий поворот головы

средний план: взгляд в сторону и обратно

по пояс: шаг вперёд без рук в кадре

по пояс: персонаж оборачивается на 20–30 градусов

портрет 3/4: короткая реплика или имитация речи (для теста мимики)

Плюсы шот-листа:

проще диагностировать, что именно ломает консистентность

проще заменить один неудачный фрагмент

проще удерживать один свет и одну камеру

!Пример минимальной раскадровки для теста нейромодели в видео

Управление движением: как задавать действия, чтобы лицо не «перерисовывалось»

Главная ошибка в видео-промптах: просить одновременно сложное действие и сложную съёмку. Для нейромодели это почти гарантированный съезд.

Рекомендации по движению:

формулируйте движение как малую амплитуду: «поворачивает голову на 10–15 градусов», «медленно моргает», «слегка кивает»

избегайте «быстро», «резко», «хаотично» на этапе закрепления

сначала тестируйте движения без рук в кадре

Рекомендации по эмоциям:

начните с нейтральной мимики и лёгкой улыбки

экстремальные эмоции добавляйте только после того, как базовые шоты стабильны

Камера и композиция: стабилизируем то, что часто ломается

Для консистентности полезно держать постоянными:

угол камеры: на уровне глаз

тип кадра: средний план или по пояс

характер глубины резкости: умеренная, без экстремального размытия

Что повышает риск:

широкий угол (сильная перспектива меняет лицо)

быстрые пролёты камеры (трек, панорама)

резкие смены крупности внутри одного клипа

Если вам нужна динамика, добавляйте её по одному элементу:

сначала движение персонажа при статичной камере

затем движение камеры при статичном персонаже

только потом объединяйте

Как удерживать идентичность через эталоны

Если инструмент позволяет задавать референс-изображение, используйте это как «якорь». Практика:

для каждого типа шота выбирайте подходящий эталон

для 3/4 используйте эталон 3/4, для профиля — эталон профиля

не пытайтесь одним портретом удержать полный рост в движении

Если у вас есть выбор между:

«сильнее следовать эталону»

«сильнее следовать тексту»

то на этапе закрепления видео почти всегда выгоднее следовать эталону, а текст использовать для описания движения и сцены.

Итерационный процесс: как работать быстро и не терять контроль

Видео-генерация редко получается идеально с первого раза. Чтобы не утонуть в переборе, используйте строгий цикл.

Выберите один шот (например, средний план с поворотом головы).

Зафиксируйте константы, стиль и запреты.

Сделайте 4–10 попыток, меняя только один параметр.

Оцените по чеклисту.

Если шот стабилен, добавьте следующий.

Чеклист качества видео-шота

Считайте шот «годным», если выполняются пункты:

узнаваемы 7–12 контрольных признаков

нет заметного мигания аксессуаров и узоров

свет не прыгает

форма лица не меняется на ключевых кадрах

Липсинк: как подойти к речи, чтобы не разрушить нейромодель

Под липсинком понимают синхронизацию движения губ с речью (по аудио или по тексту, в зависимости от инструмента и режима).

Важно: наличие встроенного липсинка зависит от конкретной версии инструмента и вашего доступа. Если в Veo или Kling нет нужного режима в вашем интерфейсе, используйте тот же принцип подготовки и делайте липсинк в отдельном решении, а затем сравнивайте результат с эталонами.

Подготовка персонажа к липсинку

Чтобы губы и лицо не «плыли», сделайте базовые условия:

крупность: портрет или 3/4, без сильного широкого угла

свет: мягкий и стабильный

эмоция: нейтральная, без сильной улыбки

фон: простой

волосы: не закрывают рот и контур щёк

Как писать промпт для речи

Цель промпта — не «сделать красиво», а сохранить лицо и получить аккуратную артикуляцию.

Практическая тактика для липсинка

Чтобы повысить шанс стабильности:

начинайте с коротких фраз 1–2 секунды

избегайте скороговорок и крика

лучше сделать 3 коротких дубля, чем один длинный

Типовые проблемы в Veo и Kling и что с ними делать

| Симптом | Частая причина | Действие | |---|---|---| | лицо «меняется» в середине клипа | слишком много движения или сложный свет | упростить движение, убрать контровой/неон, сократить длительность | | одежда мигает или меняется | узор, текстура, мелкие детали | заменить на однотонную одежду, усилить запреты «без принтов/логотипов» | | руки ломаются | жесты + мелкие предметы | убрать руки из кадра, перенести реквизит на потом | | персонаж становится «другим человеком» при новом шоте | один эталон не переносится | использовать отдельный эталон под нужный ракурс (3/4, профиль) | | липсинк выглядит неестественно | слишком длинная фраза, активная мимика | сократить фразу, нейтрализовать эмоцию, сделать крупнее план |

Что должно быть готово после урока

К концу этого урока у вас должен появиться набор, который можно монтировать и масштабировать.

5–10 коротких стабильных шотов с одним персонажем

промпт-шаблон для видео с вашими константами и запретами

таблица ваших «опасных факторов» (что именно ломает консистентность в ваших сценах)

1–3 тестовых клипа с речью или имитацией речи (если вы планируете липсинк)

Ключевой результат: вы переводите нейромодель из статического канона в управляемую видеосерию, где изменения происходят по вашей задумке, а не по случайности генератора.

7. Пайплайн продакшена: контент-план, публикация, юридические и этические вопросы

Пайплайн продакшена: контент-план, публикация, юридические и этические вопросы

Зачем этот этап нужен, если нейромодель уже «готова»

В предыдущих уроках вы собрали канон в Midjourney, закрепили лицо и правки в Nano Banana, а затем научились получать стабильные шоты в Veo и Kling. На практике этого всё ещё недостаточно, чтобы выпускать контент регулярно.

Продакшен-пайплайн отвечает на три вопроса:

Что именно мы выпускаем и в каком объёме (контент-план и форматы).

Как мы делаем это повторяемо и без хаоса (процесс, файлы, версии, контроль качества).

Что можно публиковать без рисков (юридические и этические правила).

!Общая карта процесса от канона до публикации и обратной связи

Что такое «продакшен-стандарт» для нейромодели

Продакшен-стандарт — это набор договорённостей, которые вы повторяете от выпуска к выпуску.

Минимальный стандарт удобно зафиксировать в одном документе (или в Notion/Google Docs):

цель серии и целевая платформа

форматы: длительность, соотношение сторон, частота

канон: эталоны, контрольные признаки, запреты

«опасные факторы»: что именно ломает консистентность у вашей нейромодели

юридические правила проекта: что нельзя использовать (бренды, лица, музыка)

Это логическое продолжение библии персонажа из прошлых уроков: вы добавляете не только «как выглядит», но и «как выпускается».

Контент-план: как проектировать серию, а не отдельные удачные ролики

Контент-план в нейропродакшене должен защищать вас от двух провалов:

вы делаете много попыток, но они не складываются в серию

вы публикуете разное по стилю и «размываете» узнаваемость

Шаг постановки цели: что считается успехом

Сформулируйте цель измеримо, но не усложняйте.

Примеры рабочих целей:

выпускать 3 коротких клипа в неделю в одном стиле

собрать 20 шотов для монтажа промо-ролика

сделать 10 вертикальных видео с репликами персонажа

Важно: цель влияет на выбор инструмента.

Midjourney лучше подходит для поиска и расширения библиотеки кадров.

Nano Banana — для стабилизации эталонов и точечных правок.

Veo — для более кинематографичных сцен.

Kling — для серийности и быстрого перебора.

Ссылки на официальные страницы, чтобы проверять актуальные возможности:

Midjourney

Документация Midjourney

Google DeepMind Veo

Kling AI

Форматы и рубрики: ограничьте вариативность заранее

Чтобы нейромодель выглядела консистентно, полезно заранее выбрать небольшое число повторяемых «рубрик».

Примеры рубрик для нейромодели:

«Портретная реплика»: 5–10 секунд, 3/4, мягкий свет, нейтральный фон

«Шот-демонстрация одежды»: по пояс, шаг вперёд, без рук в кадре

«Сцена в локации»: тот же свет и камера, меняется только фон

«FAQ-персонажа»: серия коротких ответов, стабильный сет

Ограничения рубрик — это не творческая бедность, а способ резко снизить «плавание» идентичности.

Контент-матрица: константы и переменные уже на уровне плана

Используйте идею из прошлых уроков: константы не трогаем, переменные меняем дозировано.

Пример контент-матрицы для месяца:

| Блок | Константы | Переменные | Риск для консистентности | |---|---|---|---| | Серия портретов | лицо, волосы, свет, камера, одежда | текст реплики, фон | низкий | | Локации | лицо, одежда, камера | место, реквизит крупный | средний | | Динамика | лицо, одежда, свет | движение, камера | высокий |

Практическое правило: 70–80% контента делайте в низком и среднем риске, а высокий риск оставляйте на эксперименты.

Шот-лист как единица планирования

Планируйте не «ролик», а список коротких шотов, как в уроке про видео. Это удобнее для контроля и замены брака.

Пример шот-листа на неделю:

Средний план: поворот головы на 10–15 градусов

Средний план: взгляд в сторону и обратно

По пояс: шаг вперёд, руки вне кадра

Портрет 3/4: короткая реплика (1–2 секунды)

По пояс: оборачивается на 20–30 градусов

Организация файлов и версий: чтобы не потерять канон и не перепутать удачные варианты

Без аккуратной структуры вы быстро столкнётесь с ситуацией: «есть классный кадр, но я не помню, чем он был сделан и как повторить».

Именование файлов: минимальный стандарт

В названии файла держите то, что реально помогает повторить результат:

персонаж или проект

тип кадра

версия

дата

Пример: iris_portrait_3-4_v03_2026-02-05.png

Если вы ведёте несколько вариантов одной сцены, добавляйте суффикс: take01, take02.

Лог промптов и настроек

Храните рядом с изображением текстовый файл или строку в таблице.

Минимальный набор полей:

инструмент (Midjourney, Nano Banana, Veo, Kling)

промпт (константы и переменные)

запреты

референс(ы), если использовались

сид/параметры (если применимо)

результат: «в канон / в вариации / брак» и причина

Это превращает генерацию из «счастливого случая» в воспроизводимый процесс.

Контроль качества перед публикацией: два чеклиста вместо бесконечных правок

В продакшене полезно разделить контроль на два независимых блока.

Чеклист консистентности

Перед экспортом проверьте:

читаются ваши 7–12 контрольных признаков лица

не «мигают» волосы, пробор, брови, особые приметы

одежда не меняет крой и материал от шота к шоту

свет и цветокор не прыгают без задумки

нет нестабильных деталей: мелкий текст, сложные узоры, случайные украшения

Чеклист технического качества

Перед публикацией проверьте:

кадрирование и safe-зоны под выбранную платформу

читаемость лица (не слишком тёмно, не слишком размазано)

отсутствие артефактов: «сломанные» пальцы, плавающие предметы, неожиданные надписи

аудио (если есть): уровень громкости, шумы, синхронизация

субтитры и титры: без ошибок, не перекрывают лицо

Публикация: адаптация под платформы и стабильная упаковка

Главная задача публикации — сделать контент узнаваемым и пригодным для серии.

Унификация «упаковки»

Определите заранее:

формат и соотношение сторон (например, вертикаль 9:16)

стиль обложек (один шаблон)

длину роликов (например, 6–12 секунд)

тональность описаний и повторяемые элементы

!Пример того, как планировать серии, чтобы не ломать консистентность

Ритм публикаций и «обратная петля»

Чтобы нейромодель улучшалась, заложите регулярный цикл:

Публикация

Сбор реакций (комментарии, удержание, клики)

Вывод: что ломало идентичность, что зашло по стилю

Обновление брифа, запретов и шот-листа

Не усложняйте метрики. Для короткого видео обычно достаточно:

удержание просмотра

комментарии по узнаваемости

сохранения и репосты

Юридические вопросы: что вы обязаны проверить до публикации

Законы и правила отличаются по странам и платформам, поэтому ниже — практический минимум, который снижает риски. При коммерческом использовании и особенно при работе с реальными людьми разумно консультироваться с юристом.

Лицензия инструмента и условия использования

Даже если контент «сгенерирован», вы используете конкретный сервис, у которого есть условия.

Что важно проверять в условиях:

можно ли использовать контент коммерчески

что сервис считает «вашими правами» на результат

есть ли требования к атрибуции

что запрещено: незаконный контент, имитация личности, вводящий в заблуждение контент

Полезная точка входа для Midjourney:

Условия использования Midjourney

Для других инструментов проверяйте условия в интерфейсе сервиса или на официальном сайте.

Авторское право и «охрана» AI-контента

В разных юрисдикциях AI-материалы могут иметь ограниченную или неоднозначную охраноспособность. Практический вывод для продакшена:

не стройте бизнес-модель только на предположении, что у вас будет исключительное авторское право на «чисто сгенерированный» контент

фиксируйте человеческий вклад: сценарий, монтаж, компоновка, цвет, звук, дизайн-концепция

Официальные разъяснения США, которые часто цитируются как ориентир:

Страница Бюро авторского права США по теме AI

Право на изображение и согласие человека

Если ваша нейромодель похожа на реального человека или вы используете фото-референсы конкретной личности, возникает риск нарушения прав на изображение, права на частную жизнь и претензий о вводящем в заблуждение использовании.

Практические правила снижения риска:

не используйте лицо реального человека в коммерческих целях без явного согласия

избегайте «двойников» публичных персон, если это может восприниматься как подмена личности

храните подтверждения согласия в папке проекта

Товарные знаки и бренды

Типовая проблема нейрогенерации — случайные логотипы, узнаваемые бренды и дизайн упаковок.

Что делать:

в промптах и запретах фиксируйте «без логотипов и текста»

удаляйте следы брендов через inpainting

не используйте чужой товарный знак так, будто это ваш проект или реклама, если у вас нет прав

Музыка, голоса и липсинк

Если вы добавляете музыку, голос или «реплику персонажа», у вас появляются отдельные права.

Минимальный практический стандарт:

используйте музыку и звуки из библиотек с понятной лицензией

храните ссылки/лицензии рядом с экспортом

не имитируйте голос конкретного человека без согласия

Реклама и раскрытие информации

Если контент коммерческий или может восприниматься как рекомендация, часто требуется маркировка рекламы и честное раскрытие условий.

Для ориентира по практике раскрытия в рекламе (особенно при работе с инфлюенсерами) полезны материалы регуляторов:

Руководство FTC по отзывам, рекомендациям и инфлюенсерам

Платформы также могут иметь собственные правила публикации и маркировки.

Этические вопросы: как не превратить нейромодель в инструмент обмана

Этика здесь не «про настроение», а про устойчивость проекта: доверие аудитории и отсутствие конфликтов.

Прозрачность

Если зритель может принять ролик за реальную съёмку, полезно явно обозначать, что это синтетический персонаж.

Варианты формулировок:

«Синтетический персонаж / AI-персонаж»

«Видео создано с использованием генеративной графики»

Согласие и уважение к личности

Этический минимум:

не делайте контент, который может навредить реальному человеку, даже если «юридически пронесло»

не используйте чужую внешность как «продукт» без согласия

Предвзятость и стереотипы

Генераторы могут усиливать клише.

Практика контроля:

проверяйте сценарии и визуальные решения на стереотипные связки (внешность ↔ профессия ↔ моральная оценка)

избегайте дискриминирующих описаний в промптах

Контент с высоким риском

Для учебного и коммерческого продакшена разумно исключать:

несовершеннолетних персонажей в сомнительных контекстах

политическую агитацию от имени «реального человека»

медицинские и финансовые обещания без доказательств

Финальный продакшен-чеклист перед релизом

Перед публикацией одного выпуска пройдите короткий список:

есть ли ссылка на исходные эталоны и понятен ли путь воспроизводимости

пройдён чеклист консистентности (лицо, волосы, одежда, свет)

удалены логотипы, текст, случайные бренды

есть права на музыку/звук или использована безопасная библиотека

контент не выглядит как подмена реального человека без согласия

добавлена маркировка и раскрытие, если это реклама или может вводить в заблуждение

Итог

Продакшен-пайплайн превращает нейромодель из набора удачных генераций в устойчивый медиапродукт.

Контент-план задаёт рамки, где консистентность сохраняется серийно.

Файловая структура, лог промптов и версии делают результат воспроизводимым.

Два чеклиста защищают качество: консистентность и техника.

Юридические и этические правила снижают риск блокировок, жалоб и потери доверия.

Следуйте принципу курса: фиксируйте константы, меняйте переменные дозировано и улучшайте процесс через обратную связь.