Создание нейромодели: Midjourney, Nano Banana, Veo и Kling

Курс о том, как спроектировать и собрать «нейромодель» (стабильный виртуальный персонаж) и выпускать с ней фото- и видеоконтент. Разберём создание образа, консистентность, пайплайн генерации и финальную подготовку материалов к публикации.

1. Что такое нейромодель и требования к консистентности

Что такое нейромодель и требования к консистентности

Зачем вообще нужна нейромодель в этом курсе

В контексте генеративных нейросетей под нейромоделью в практическом смысле часто понимают не «обученную с нуля модель», а устойчиво воспроизводимый образ (персонажа, объекта, стиля или мира), который вы умеете получать в разных сценах и ракурсах.

В этом курсе мы будем собирать такую нейромодель из четырёх инструментов:

  • Midjourney — удобно для поиска дизайна, образа, стиля и первых эталонных кадров.
  • Nano Banana — используем как дополнительный генератор/помощник пайплайна (роль зависит от ваших задач: варианты, правки, связующее звено между этапами).
  • Veo — генерация видео-сцен, когда важна кинематографичность и динамика.
  • Kling — генерация видео-сцен, когда нужна управляемость и серийность клипов.
  • Смысл курса: получить не «одну красивую картинку», а пакет согласованных материалов (изображения и видео), где зритель верит, что это один и тот же персонаж/объект/мир.

    Что такое нейромодель в прикладном смысле

    Нейромодель здесь — это система из трёх частей:

  • Эталон: 3–10 «канонических» изображений (или кадров), которые фиксируют внешний вид.
  • Описание: текстовая спецификация (промпт-формула) и набор правил, которые нельзя нарушать.
  • Процесс: последовательность шагов (какие генерации делаем в каком инструменте и как проверяем совпадение).
  • Важно: даже если инструмент не обучает отдельную модель «под вас», вы всё равно строите нейромодель как повторяемый рецепт, который выдаёт консистентный результат.

    !Схема, показывающая из каких частей состоит нейромодель и как инструменты связываются в процесс

    Что такое консистентность и почему без неё нейромодель «не работает»

    Консистентность — это согласованность результата между разными генерациями: чтобы «тот же» персонаж оставался тем же, стиль не «плавал», а мир не превращался в другой.

    Если консистентности нет, вы получаете набор случайных удачных кадров, которые:

  • нельзя смонтировать в ролик;
  • нельзя собрать в серию постов;
  • нельзя использовать как бренд-персонажа;
  • нельзя масштабировать (каждый новый кадр приходится «выбивать» заново).
  • Виды консистентности: что именно должно совпадать

    Ниже — основные уровни консистентности. В реальном проекте вы заранее решаете, какие из них обязательны.

    Консистентность идентичности (самое важное)

    Это совпадение того, кого или что видит зритель.

    Для персонажа обычно фиксируют:

  • форму лица и ключевые пропорции;
  • причёску (длина, пробор, текстура волос);
  • возрастной диапазон;
  • отличительные признаки (шрам, родинка, татуировка, форма бровей);
  • телосложение.
  • Для объекта/продукта фиксируют:

  • силуэт и габаритные пропорции;
  • материал и фактуру;
  • конструктивные элементы (кнопки, швы, крепления);
  • логотипы и маркировку (если применимо).
  • Консистентность стиля

    Это единое художественное «как сделано».

    Типовые параметры:

  • техника (фотореализм, 3D, аниме, иллюстрация);
  • характер деталей (минимализм/детализация);
  • тип освещения (мягкий студийный свет, контровой, неон);
  • цветокор (тёплый, холодный, контрастный, пастельный).
  • Если стиль «скачет», зритель воспринимает это как разные проекты, даже если персонаж похож.

    Консистентность мира (сеттинг)

    Это согласованность окружения и правил реальности:

  • эпоха и технологии (современность, ретрофутуризм, средневековье);
  • география/архитектура;
  • одежда и реквизит, соответствующие миру;
  • физические правила (например, «без магии», «низкая гравитация»).
  • Консистентность кадра и камеры

    Это то, что часто ломает видео и серии изображений:

  • тип объектива и перспектива;
  • крупность (портрет, по пояс, полный рост);
  • угол камеры (сверху/снизу/на уровне глаз);
  • глубина резкости и характер размытия;
  • композиционные привычки (центрирование, правило третей).
  • Временная консистентность (для видео)

    Для видео достаточно, чтобы совпадало не только «кто», но и «как он меняется во времени»:

  • отсутствие «мигания» деталей (узор одежды, украшения);
  • плавность движений без внезапной смены формы лица;
  • стабильность света по кадрам (если это не задумано);
  • предсказуемость объектов в руках (чтобы они не исчезали).
  • Практический стандарт: что считать достаточно консистентным

    Вам нужен не абстрактный идеал, а критерии «принимаем/переделываем». Удобный подход — задавать порог по трём уровням.

  • Уровень А (строго): можно монтировать подряд крупные планы; персонаж узнаваем в каждом кадре.
  • Уровень B (рабочий): можно делать серию картинок/постов; различия допустимы, но не меняют идентичность.
  • Уровень C (черновик): подходит для поиска идей, но не для финала.
  • Чтобы это было измеримо, заранее выберите 5–7 «контрольных признаков» (например: форма бровей, пробор, цвет глаз, форма носа, тип освещения, палитра, материал одежды) и проверяйте их на каждой генерации.

    Почему генераторы «ломают» консистентность

    Причины почти всегда практические, а не «вам не повезло»:

  • вы описали персонажа слишком общими словами, и модель каждый раз дорисовывает детали по-разному;
  • вы смешали в одном промпте взаимоисключающие стили;
  • у вас нет эталонов (или эталоны разные);
  • вы меняете ракурс, освещение и эмоцию одновременно — и получаете другого человека;
  • вы просите «новую сцену», но не фиксируете неизменные параметры (одежда, причёска, аксессуары);
  • для видео не закрепили исходный дизайн персонажа эталонными кадрами.
  • Инструменты курса и их роль в консистентности

    Ниже — безопасная логика распределения задач (без привязки к «магическим настройкам», которые могут отличаться по версиям).

  • Midjourney: делаем дизайн-заморозку — находим канон персонажа/объекта и стиль; получаем эталонные изображения.
  • Nano Banana: используем как инструмент для дополнительных вариантов, уточнений, промежуточных правок и поддержки серии (когда нужно много попыток и быстрый перебор).
  • Veo: переносим канон в видео, начиная с простых сцен, где легче удержать идентичность (стабильный свет, спокойные движения).
  • Kling: строим серийность клипов и тестируем повторяемость на разных сценах, сохраняя канон.
  • Официальные страницы инструментов, чтобы сверять текущие возможности и ограничения:

  • Midjourney
  • Google DeepMind Veo
  • Kling AI
  • Документ нейромодели: библия персонажа/объекта

    Чтобы добиться консистентности, вам нужен короткий документ (1–2 страницы), который вы будете копировать в работу.

    Минимальная структура

  • Кто это: одно предложение (роль/архетип, без лишней лирики).
  • Неизменные признаки: 7–12 пунктов, которые нельзя менять.
  • Разрешённые вариации: что можно менять (одежда по сезонам, эмоции, реквизит).
  • Запрещённые вариации: что нельзя (смена возраста, другая форма лица, другой стиль).
  • Словарь стиля: 10–20 ключевых слов (цвет, свет, фактура, эстетика).
  • Эталонные кадры: ссылки/файлы, помеченные как «канон».
  • Пример формулировки неизменных признаков

    Чтобы нейросети было сложнее «съехать», пишите признаки так, чтобы их можно было проверить глазами:

  • «короткое каре до линии челюсти, прямой пробор» вместо «красивая причёска»
  • «кожаная куртка чёрная, матовая, без логотипов» вместо «тёмная одежда»
  • «мягкий студийный свет слева» вместо «хорошее освещение»
  • Шаблон промпта: как фиксировать постоянное и менять переменное

    Удобная практика — разделять промпт на константы и переменные.

    Смысл: вы меняете только блок ПЕРЕМЕННЫЕ, а первые два блока максимально стабильны. Так вы строите нейромодель как повторяемую систему.

    Чеклист проверки консистентности перед тем, как двигаться дальше

    Перед генерацией видео и серий обязательно проверьте эталонные кадры.

  • Персонаж узнаваем в 5 разных ракурсах.
  • Одинаково читаются ключевые признаки (волосы/брови/нос/подбородок или конструктив объекта).
  • Одежда и материалы не «переизобретаются» от кадра к кадру.
  • Стиль стабилен (свет, палитра, детализация).
  • В 2–3 тестовых сценах (простых) нейромодель выдерживает изменения фона.
  • !Матрица помогает решить, какие параметры должны быть постоянными, а какие можно менять без потери идентичности

    Итог

    Нейромодель в этом курсе — это канонический образ + правила + процесс, который позволяет получать согласованные изображения и видео в Midjourney, Nano Banana, Veo и Kling. Главная цель первой стадии — определить, что именно обязано быть одинаковым (идентичность и стиль) и как вы будете это проверять, прежде чем переходить к масштабированию серии и к видео.

    2. Дизайн персонажа: референсы, бриф, стиль и ограничения

    Дизайн персонажа: референсы, бриф, стиль и ограничения

    Зачем нужен этап дизайна персонажа

    В предыдущей статье мы определили нейромодель как канон + правила + процесс, который даёт консистентный результат. Этот этап — про то, как быстро и осознанно собрать канон персонажа так, чтобы:

  • Midjourney стабильно воспроизводил внешний вид в разных сценах.
  • Nano Banana мог быстро накидывать варианты, не ломая идентичность.
  • Veo и Kling получали понятный «исходник» для видео, где любая неточность заметнее.
  • Главная идея: сначала вы проектируете персонажа как продукт (через бриф, референсы и ограничения), а уже потом «выбиваете» эталонные кадры генерацией.

    Что именно мы проектируем: 4 слоя дизайна

    Чтобы консистентность не расползалась, полезно разделить дизайн на слои.

  • Идентичность: лицо/форма/силуэт, возраст, ключевые признаки.
  • Материальная часть: одежда, аксессуары, фактуры, реквизит.
  • Стиль: визуальный язык (фото, 3D, иллюстрация), свет, цвет, детализация.
  • Кинематографичность: камера, крупности, «как это снимается» (важно для будущего видео).
  • Если вы не фиксируете слой, генератор будет «додумывать» его заново в каждом кадре.

    Референсы: как собирать и использовать

    Что такое референс в рамках нейромодели

    Референс — это пример решения, который помогает точно описать желаемый результат. Важно: референс не обязательно «копировать». Его задача — зафиксировать параметры, которые вы потом превратите в текстовые правила.

    Какие референсы нужны

    Соберите минимум по одному референсу на каждый блок:

  • Лицо/голова: форма лица, брови, нос, губы, прическа.
  • Тело/силуэт: рост, пропорции, осанка.
  • Одежда: крой, слои, материалы, силуэт.
  • Фактура: кожа, ткань, металл, пластик, степень «новизны».
  • Цвет и свет: палитра, контраст, температура света.
  • Камера: пример крупности и оптики (портрет/полный рост, «ширик»/«портретник»).
  • Практическое правило «не мешать всё сразу»

    Если вы смешиваете референсы из разных визуальных миров (например, «глянцевое фото», «аниме», «пластилиновая 3D-графика») в одном персонаже без чётких указаний, вы почти гарантированно получите плавающий стиль.

    Чтобы этого избежать:

  • Выберите один базовый визуальный язык (например, «фотореализм»).
  • Остальные референсы используйте как подсказки для деталей, а не как альтернативные стили.
  • !Пример структуры мудборда, чтобы референсы не конфликтовали и сразу раскладывались по слоям

    Бриф персонажа: короткий документ, который экономит десятки генераций

    Бриф — это текст, который вы сможете:

  • вставлять в промпты как «константы»;
  • превращать в список проверяемых признаков;
  • использовать как ТЗ для серии изображений и видео.
  • Шаблон брифа (заполните один раз)

    #### Ядро
  • Кто персонаж: одно предложение (роль и функция в истории/бренде).
  • Где живёт: мир/эпоха/сеттинг одной строкой.
  • Ключевое впечатление: 3–5 прилагательных (например: «собранный, умный, немного опасный»).
  • #### Внешность (фиксируем проверяемо)

  • Возрастной диапазон: конкретно (например: «28–35»).
  • Телосложение: коротко (например: «стройный, спортивный, узкие плечи»).
  • Лицо: 3–6 признаков, которые легко увидеть.
  • Волосы: длина, пробор, текстура.
  • Особые приметы: родинка/шрам/тату/украшение.
  • #### Одежда и реквизит

  • Базовый комплект одежды: 3–6 пунктов (с материалами).
  • Что всегда при нём: 1–3 предмета.
  • Что нельзя добавлять: например «без логотипов и надписей».
  • #### Стиль и камера

  • Техника: фотореализм / 3D / иллюстрация (выбрать одно).
  • Свет: тип и направление (например: «мягкий студийный слева»).
  • Палитра: 3–6 цветов словами.
  • Камера: привычные крупности и угол (например: «портрет на уровне глаз»).
  • Чем бриф отличается от «описания персонажа для сюжета»

    Сюжетное описание может быть художественным. Бриф для нейромодели должен быть инженерным: всё, что важно, формулируется так, чтобы это можно было проверить глазами.

    Стиль: как выбрать и зафиксировать, чтобы он не «плыл»

    Выберите один «главный стиль»

    Удобная стратегия — выбрать стиль как комбинацию из трёх фиксированных компонентов:

  • Медиум: фото / кино / 3D / иллюстрация.
  • Качество и детализация: «натуральная кожа и ткань видны», «умеренная резкость», «микродетали».
  • Свет и цвет: «мягкий», «контрастный», «тёплый/холодный», палитра.
  • Словарь стиля

    Сделайте список из 10–20 слов, которые вы будете повторять в каждом промпте.

  • Примеры слов про свет: «мягкий», «контровой», «рассеянный дневной».
  • Примеры про цвет: «приглушённые», «монохром», «неоновые акценты».
  • Примеры про картинку: «кинематографично», «реалистичная кожа», «умеренная зернистость».
  • Важно: если вы постоянно меняете словарь стиля, консистентность будет снижаться даже при одинаковом персонаже.

    Ограничения: что запрещаем, чтобы консистентность выросла

    Ограничения — это не «занудство», а защита канона. Чем больше вы планируете сцен и видео, тем важнее запреты.

    Типовые запреты для персонажа

  • Возраст/пол/этничность: если это критично для узнаваемости.
  • Кардинальная смена причёски: длина, пробор, текстура.
  • Логотипы и текст на одежде: часто «мигают» и меняются.
  • Случайные аксессуары: очки, серьги, пирсинг, если не канон.
  • Экстремальные гримасы на раннем этапе: сначала закрепите нейтральные эмоции.
  • Типовые запреты для стиля

  • Не смешивать «иллюстрация» и «фото» в одном каноне.
  • Не менять одновременно свет, палитру и камеру на этапе закрепления.
  • Не добавлять «модные» слова, которые уводят стиль (например, если вы не планировали «аниме»-эстетику, не используйте такие маркеры).
  • Как превратить бриф в промпт-формулу (константы и переменные)

    Ниже — практичная структура, совместимая с логикой предыдущей статьи: вы удерживаете блоки констант, а меняете только сцену.

    Если вы видите, что персонаж «уплывает», почти всегда помогает:

  • усилить блоки идентичности и одежды (сделать признаки конкретнее);
  • временно упростить сцену (нейтральный фон, спокойная поза);
  • уменьшить число одновременно изменяемых переменных.
  • Практический пайплайн дизайна в контексте курса (до видео)

    На этом этапе ваша цель — получить 3–10 эталонных изображений (канон), с которыми вы пойдёте дальше в Nano Banana, Veo и Kling.

    Шаг 1: разведка в Midjourney

  • Сгенерируйте 20–60 вариантов по одному брифу, меняя только 1–2 параметра.
  • Выберите 2–3 кандидата, максимально близких к канону.
  • Уточните детали (волосы, одежда, особая примета), пока кандидат не станет устойчивым.
  • Официальная страница инструмента: Midjourney

    Шаг 2: канонический набор кадров

    Сделайте набор, который закрывает базовые ракурсы и пригодится для будущего видео.

  • Портрет анфас (нейтральная эмоция).
  • Портрет 3/4.
  • Профиль.
  • По пояс.
  • Полный рост.
  • Шаг 3: тест на «переносимость»

    С теми же константами попробуйте 3 простых сцены.

  • Другой фон (но без смены света и палитры).
  • Другая поза (но без сложной динамики).
  • Другая эмоция (мягкая: улыбка/внимание).
  • Если переносимость слабая — возвращайтесь к брифу и ограничениям, а не «добивайте случайностью».

    Шаг 4: подготовка к видео (Veo и Kling)

    Для видео важнее всего:

  • устойчивый профиль и 3/4 (они чаще всего «ломаются»);
  • отсутствие мелких нестабильных деталей (сложные узоры, мелкий текст);
  • чётко заданная камера и свет.
  • Официальные страницы инструментов, чтобы сверять актуальные возможности:

  • Google DeepMind Veo
  • Kling AI
  • Мини-шаблон «библии персонажа» (то, что вы унесёте в следующие уроки)

    Соберите в один документ:

  • Короткий бриф (ядро, внешность, одежда, стиль).
  • Неизменные признаки: 7–12 пунктов.
  • Разрешённые вариации: 3–8 пунктов.
  • Запрещённые вариации: 5–12 пунктов.
  • Словарь стиля: 10–20 слов.
  • Канон-кадры: 3–10 изображений, помеченных как эталон.
  • Именно этот документ превращает «мне нравится вот такая картинка» в управляемую нейромодель, с которой можно серийно работать.

    3. Midjourney: генерация образа, промпты, позы, свет и ракурсы

    Midjourney: генерация образа, промпты, позы, свет и ракурсы

    Роль Midjourney в пайплайне нейромодели

    Midjourney в этом курсе выполняет ключевую задачу: быстро найти и зафиксировать канон персонажа или объекта, чтобы затем переносить его в серию изображений и в видео (Nano Banana, Veo, Kling) без потери идентичности.

    Из предыдущих статей у вас уже есть:

  • понимание, что нейромодель = канон + правила + процесс
  • бриф персонажа и ограничения
  • идея разделения промпта на константы и переменные
  • Теперь соберём это в практический способ работы именно в Midjourney.

    Полезные источники по синтаксису и параметрам Midjourney:

  • Midjourney
  • Midjourney Documentation
  • !Общая карта процесса: где Midjourney находится и какую часть консистентности он фиксирует

    Как устроена генерация в Midjourney и что важно для консистентности

    Midjourney отвечает на ваш промпт вероятностно: при каждом запуске он может «додумывать» детали. Поэтому для нейромодели важно не просто сделать красивый кадр, а снизить свободу интерпретации.

    Практическая цель этапа Midjourney:

  • получить 3–10 эталонных изображений, которые вы называете каноном
  • зафиксировать: лицо и пропорции, волосы, ключевые элементы одежды, базовый свет и базовую камеру
  • подготовить набор ракурсов, который выдержит перенос в другие сцены и в видео
  • Промпт-формула для нейромодели: что писать и в каком порядке

    Чтобы персонаж повторялся, промпт должен быть инженерным, как бриф из предыдущего урока: минимум метафор, максимум наблюдаемых признаков.

    Структура промпта: константы и переменные

    Используйте одну и ту же структуру, меняя только блок сцены.

    Почему это работает:

  • Midjourney каждый раз «цепляется» за повторяющиеся формулировки
  • вы контролируете изменения: меняете одно (например фон), но не перепридумываете персонажа
  • Слова, которые обычно вредят консистентности

    На этапе закрепления канона избегайте слов, которые заставляют модель импровизировать:

  • слишком общие оценки: красивая, идеальная, стильная
  • размытые указания: в тренде, в духе модных журналов
  • многослойные стилевые миксы: аниме + фото + пластилин + 3D
  • Вместо этого давайте признаки, которые можно проверить глазами.

    Управление параметрами Midjourney: что трогать в первую очередь

    Конкретные команды и интерфейс могут отличаться в зависимости от версии Midjourney, но логика параметров остаётся стабильной: часть параметров отвечает за форму кадра, часть за свободу вариаций, часть за повторяемость.

    Ниже перечислены параметры, которые чаще всего используют для консистентного дизайна. Сверяйте актуальный синтаксис в Midjourney Documentation.

    | Задача | Что фиксировать | Зачем это нужно | |---|---|---| | Одинаковая композиция серии | соотношение сторон --ar | разные кадры проще сравнивать и отбирать в канон | | Снижение «творческой вольности» | умеренный уровень стилизации --stylize | меньше неожиданных деталей и «съезда» лица | | Управляемость перебора | уровень случайности --chaos | высокие значения дают больше расхождений между вариантами | | Повторяемость удачного результата | --seed | помогает воспроизводить близкие вариации в той же логике | | Запрет нежелательных элементов | негативные ограничения --no | снижает появление текста, логотипов, лишних аксессуаров |

    Правило этапа канона:

  • сначала фиксируйте --ar и базовый стиль
  • затем стабилизируйте лицо и одежду
  • только потом усложняйте сцену
  • Референсы в Midjourney: как использовать картинки, не теряя стиль

    Midjourney поддерживает промпты с изображениями: вы можете подать ссылку на картинку как ориентир, а затем описать текстом, что именно нужно сохранить.

    Практический смысл для нейромодели:

  • картинка помогает удержать уникальные черты лица и одежды
  • текст фиксирует стиль, свет и запреты
  • Рекомендация по процессу:

  • возьмите 1 канон-кадр, который ближе всего к нужному лицу
  • используйте его как reference для получения новых ракурсов
  • не добавляйте сразу новый свет, новую эмоцию и новый фон
  • Если вы видите «плавание», временно упростите:

  • нейтральный фон
  • одна и та же крупность
  • нейтральная эмоция
  • Поза: как задавать так, чтобы не ломалась идентичность

    Поза в генерации опасна тем, что вместе с телом часто меняется:

  • форма челюсти
  • расстояния между чертами лица
  • длина шеи и плечи
  • Базовый набор поз для закрепления канона

    Начните с поз, где риск минимальный:

  • стоя ровно, руки вдоль тела
  • по пояс, плечи расслаблены
  • лёгкий поворот корпуса на 10–20 градусов
  • Только после этого переходите к динамике:

  • шаг
  • поворот головы
  • жест рукой
  • Как описывать позу в промпте

    Пишите коротко и однозначно:

  • neutral pose, relaxed shoulders
  • hands not visible или hands down
  • head turned slightly to the left
  • Избегайте на старте:

  • сложной акробатики
  • взаимодействия с мелкими предметами
  • сильных наклонов к камере
  • Свет: как зафиксировать и почему он влияет на «узнаваемость»

    Одна из причин, почему персонаж кажется другим, даже если черты лица похожи, это свет.

    Три рабочих схемы света для нейромодели

    Выберите одну базовую схему и держите её в эталонах.

  • Мягкий студийный свет слева
  • Рассеянный дневной свет из окна сбоку
  • Пасмурный уличный свет без жёстких теней
  • Что важно фиксировать словами:

  • источник: студийный, дневной, уличный
  • направление: слева, справа, сверху
  • характер: мягкий или жёсткий
  • На этапе канона полезно запрещать:

  • неон
  • разноцветные источники света
  • контровой свет, который «съедает» контуры лица
  • Ракурсы и камера: как собрать эталонный набор кадров

    Для переноса в видео (Veo и Kling) вам нужен набор ракурсов, который покрывает типовые углы и крупности.

    Канонический набор ракурсов

    Соберите минимум 5 кадров в одном стиле.

  • портрет анфас, нейтральная эмоция
  • портрет 3/4
  • профиль
  • по пояс
  • полный рост
  • !Пример того, как выглядит базовый эталонный набор ракурсов для «канона»

    Как описывать камеру

    Чтобы Midjourney меньше импровизировал, фиксируйте:

  • крупность: портрет, по пояс, полный рост
  • угол: на уровне глаз
  • оптику как словами: portrait lens look, 85mm look, 35mm wide angle look
  • Практический совет:

  • закрепляйте лицо на портретной оптике
  • для полного роста делайте отдельный блок эталонов, потому что генераторы часто «переизобретают» тело
  • Пошаговый процесс: от брифа к канону в Midjourney

    Ниже процесс, который связывает предыдущие статьи с практикой.

    Стадия поиска

  • Берёте бриф и превращаете его в промпт-константы.
  • Генерируете серию вариантов, меняя только 1–2 признака за итерацию.
  • Выбираете 2–3 кандидата, которые ближе всего к идее.
  • Стадия закрепления

  • Выбираете одного кандидата как основного.
  • Получаете 5 ракурсов из раздела про канонический набор.
  • Проверяете, что совпадают контрольные признаки из первой статьи (например: пробор, форма бровей, особая примета, материалы одежды).
  • Стадия переносимости

  • Делаете 3 простые сцены с теми же константами.
  • Меняете по одной переменной:
  • фон
  • лёгкая эмоция
  • небольшая поза
  • Если идентичность «плывёт», вы возвращаетесь к:
  • уточнению констант (делаете их более проверяемыми)
  • усилению запретов (убираете всё лишнее)
  • упрощению сцены
  • Типовые ошибки и быстрые исправления

    | Симптом | Частая причина | Что сделать | |---|---|---| | каждый раз «новое лицо» | слишком общие слова, нет особых примет | добавить 3–6 проверяемых признаков лица, зафиксировать волосы и пробор | | «скачет» одежда | одежда описана как “тёмная/модная” | указать крой и материал, запретить логотипы и принты | | стиль превращается в другой | смешаны эстетики и источники света | выбрать один медиум, зафиксировать свет и палитру | | профиль не похож на анфас | ракурс + свет поменялись одновременно | сначала получить профиль при том же свете и крупности | | руки и предметы «ломают» кадр | сложная динамика и мелкие детали | убрать предметы, начать с поз без рук в кадре |

    Что должно быть готово после этого урока

    К концу работы в Midjourney у вас должен появиться набор, который вы положите в библию персонажа:

  • 3–10 канонических изображений
  • список неизменных признаков (7–12 пунктов)
  • словарь стиля (10–20 слов)
  • промпт-шаблон с константами и переменными
  • список запретов, которые реально уменьшили «плавание»
  • Именно этот пакет станет входом в следующие этапы курса, где мы будем масштабировать серию (в том числе через Nano Banana) и переносить персонажа в видео (Veo и Kling).

    4. Консистентность личности: сиды, вариации и контроль деталей

    Консистентность личности: сиды, вариации и контроль деталей

    Зачем нужен этот урок

    В предыдущих материалах вы:

  • определили нейромодель как канон + правила + процесс
  • сделали бриф и ограничения
  • научились получать канон в Midjourney через константы и переменные
  • Дальше обычно возникает проблема: вы нашли «то самое лицо», но при смене ракурса, позы или сцены персонаж становится похожим, но другим. Этот урок — про практику удержания личности (идентичности) через управляемые вариации: сиды, аккуратный перебор и контроль деталей.

    Официальные источники, где сверяйте актуальный синтаксис параметров:

  • Midjourney
  • Midjourney Documentation
  • Что именно мы удерживаем, когда говорим «личность»

    Под консистентностью личности мы понимаем повторяемость набора признаков, по которым зритель без усилий узнаёт персонажа.

    Типовой набор контрольных признаков (выберите 7–12 и зафиксируйте в библии персонажа):

  • форма лица и подбородка
  • линия бровей и их расстояние
  • форма носа
  • форма губ
  • расстояние между глазами и их посадка
  • причёска: длина, пробор, текстура
  • цвет глаз
  • 1–2 особые приметы (шрам, родинка, прядь, серёжка если она канон)
  • базовый свет (характер и направление)
  • базовая «камера» (крупность и угол)
  • Ключевая мысль: если вы не измеряете личность через проверяемые признаки, вы будете «догонять ощущение», а это всегда десятки лишних генераций.

    Сид: что это и зачем он нужен

    Сид (seed) — это параметр, который помогает генератору повторять близкую логику изображения при тех же входных условиях. В практическом смысле сид позволяет:

  • воспроизводить удачную «основу» кадра и получать вариации, не уходя в другой тип лица
  • сравнивать изменения честно: вы меняете один параметр и видите, что именно он делает
  • Важно понимать ограничения:

  • сид не гарантирует точную копию, особенно если вы сильно меняете сцену, свет, крупность или добавляете новые требования
  • сид лучше работает как инструмент стабильного перебора на этапе закрепления канона, чем как «магическая кнопка идентичности»
  • Практическое правило работы с сидом

    Держите сид фиксированным, пока вы делаете одну задачу.

    Примеры задач:

  • собрать 5 ракурсов при одном свете
  • подобрать одну устойчивую прическу и один устойчивый комплект одежды
  • подобрать нейтральную эмоцию, которая не меняет черты лица
  • Как только задача решена — можно менять сид, но только если вы уверены, что канон уже закреплён эталонами.

    Вариации без потери личности: метод «одна переменная за раз»

    Самый частый источник «съезда лица» — вы меняете сразу много вещей: позу, ракурс, эмоцию, фон, свет, одежду. Для нейромодели это выглядит как запрос на нового персонажа.

    Используйте метод управляемого перебора:

  • Зафиксируйте константы (идентичность, одежда, стиль, камера) и сид.
  • Выберите одну переменную.
  • Сделайте серию из 4–12 попыток.
  • Отберите 1–2 результата, которые проходят чеклист личности.
  • Только после этого переходите к следующей переменной.
  • !Диаграмма показывает, как делать вариации, не ломая идентичность

    Что считать «одной переменной»

    Хорошие примеры (низкий риск):

  • фон при том же свете и той же крупности
  • лёгкий поворот головы на 10–20 градусов
  • смена крупности в пределах портретных (например, от крупного портрета к по пояс)
  • Плохие примеры (высокий риск):

  • одновременно «ночь + неон + динамика + широкий угол + новая одежда»
  • смена эмоции на экстремальную (крик, сильный смех) одновременно со сменой ракурса
  • Контроль деталей: как не утонуть в мелочах и не потерять лицо

    Детали — главный враг консистентности: чем их больше, тем больше точек, где модель может «мигать». Поэтому нужен контроль: что фиксируем жёстко, что допускаем как вариацию.

    Классы деталей

    Удобно разделить детали на три класса.

    | Класс | Что входит | Правило для нейромодели | |---|---|---| | Критические | лицо, волосы, особые приметы, базовая одежда-силуэт | фиксируем жёстко, повторяем в каждом промпте | | Поддерживающие | цветокор, фактура ткани, тип света, аксессуар (если канон) | фиксируем, но допускаем небольшую погрешность | | Шум | мелкий текст, сложные узоры, случайные украшения, мелкий реквизит | по возможности запрещаем на этапе закрепления |

    Запреты как инструмент контроля

    Запреты нужны не ради «негативного промпта», а ради уменьшения пространства для случайностей.

    Типовые запреты на этапе канона:

  • без текста, надписей и логотипов
  • без сложных узоров на одежде
  • без лишних украшений (если они не канон)
  • без очков (если они не канон)
  • без сильного грима и экстремальных эмоций
  • Если вы планируете видео в Veo или Kling, запреты становятся ещё важнее: мелкие и нестабильные детали в движении часто «дрожат» и «перепридумываются».

    Как «чинить» личность, если она поплыла

    Ниже — практичная диагностика: симптом → причина → действие. Это важнее любых «секретных настроек», потому что масштабируется на любые генераторы.

    | Симптом | Частая причина | Что сделать | |---|---|---| | «Каждый раз другое лицо» | константы слишком общие; нет особых примет; одновременно меняете много переменных | добавить 3–6 проверяемых признаков лица; зафиксировать волосы и пробор; вернуться к «одна переменная за раз» | | «Анфас похож, профиль нет» | профиль генерируется как новый дизайн; меняется свет/крупность | получать профиль при том же свете и близкой крупности; временно упростить фон | | «Одежда всегда чуть другая» | одежда описана оценочно; много мелких деталей | описать крой и материал; запретить принты/логотипы; выбрать один базовый комплект | | «Вроде тот же, но настроение/возраст скачет» | эмоция и свет меняются вместе; слова типа «glamour / fashion» добавляют импровизацию | зафиксировать возраст диапазоном; сделать нейтральную эмоцию каноном; убрать слова, которые меняют эстетику |

    Мини-процесс: как собрать устойчивый пакет эталонов под будущие видео

    Чтобы Veo и Kling меньше «перерисовывали» персонажа, вам нужен не один портрет, а связанный набор.

    Рекомендуемый пакет эталонов (минимум):

  • портрет анфас, нейтральная эмоция
  • портрет 3/4, тот же свет
  • профиль, тот же свет
  • по пояс, нейтральная поза
  • полный рост, простая поза
  • Правило добавления эталона в канон:

  • На эталоне должны читаться ваши 7–12 контрольных признаков.
  • На эталоне не должно быть «шума», который вы не сможете стабильно повторять.
  • Эталон должен быть пригоден как опора для переноса в другие инструменты (Nano Banana для быстрых вариантов, Veo и Kling для видео).
  • Как связать Midjourney с Nano Banana, Veo и Kling, не ломая личность

    В рамках пайплайна курса логика такая:

  • Midjourney даёт канон и набор проверенных формулировок констант.
  • Nano Banana полезен как быстрый перебор/уточнение, когда вам нужно много попыток или мягкие корректировки, но вы всё равно сверяетесь с теми же контрольными признаками.
  • Veo и Kling требуют особенно строгого канона: видео усиливает любые расхождения, потому что зритель сравнивает кадры во времени.
  • Практический вывод: чем лучше вы настроили сиды, вариации и контроль деталей на статике, тем меньше времени вы потеряете на «плавание» в видео.

    Итог

    Консистентность личности достигается не одной настройкой, а дисциплиной процесса:

  • фиксируете константы и используете сид для управляемого перебора
  • меняете одну переменную за раз
  • контролируете детали через классы (критические, поддерживающие, шум)
  • добавляете в канон только те кадры, которые проходят чеклист личности
  • Это превращает Midjourney-генерацию из «охоты за удачей» в воспроизводимую систему, которая дальше переносится в Nano Banana и в видео (Veo, Kling).

    5. Nano Banana: закрепление лица, правки, апскейл и ретушь

    Nano Banana: закрепление лица, правки, апскейл и ретушь

    Роль Nano Banana в пайплайне нейромодели

    В предыдущих уроках вы собрали канон в Midjourney: эталонные кадры, список неизменных признаков, словарь стиля, промпт-формулу с константами и переменными. Теперь задача — сделать этот канон практически переносимым в серию и в видео.

    Nano Banana в рамках курса используем как инструмент для:

  • закрепления узнаваемости лица через работу от эталона к эталону
  • точечных правок без пересоздания всего кадра
  • апскейла (увеличения разрешения) и подготовки картинок для видео-генераторов
  • быстрой ретуши и устранения типовых артефактов (текст, лишние аксессуары, «ломающиеся» детали)
  • !Схема, показывающая место Nano Banana между каноном и видео

    Термины, которые понадобятся

    Чтобы дальше не было «магии», зафиксируем понятия простыми словами.

  • Image-to-image: генерация по исходной картинке, когда изображение является опорой, а текст управляет изменениями.
  • Inpainting: правка только выделенной области (например, исправить глаз, убрать логотип).
  • Outpainting: дорисовка за пределами исходного кадра (например, расширить фон или кадрировать под другой формат).
  • Апскейл: увеличение разрешения изображения с попыткой сохранить детали и резкость.
  • Ретушь: исправления «косметического» уровня, которые не должны менять идентичность (пятна, артефакты, лишние элементы).
  • Принцип консистентности в Nano Banana

    В Midjourney вы удерживали личность через константы, ограничения и дисциплину «одна переменная за раз». В Nano Banana принцип тот же, но появляется важное отличие.

  • Midjourney чаще полезен для создания канона.
  • Nano Banana чаще полезен для сохранения канона при правках.
  • Практическое правило:

  • если вам нужно заменить 10% кадра, делайте inpainting
  • если вам нужно заменить 60% кадра, скорее всего вы уже делаете новый дизайн и рискуете «потерять человека»
  • Подготовка входных материалов

    Перед правками подготовьте набор, с которым вы не будете спорить каждый раз.

    Минимальный комплект для работы

  • 3–10 канон-кадров из Midjourney (анфас, 3/4, профиль, по пояс, полный рост)
  • список 7–12 контрольных признаков личности из урока про консистентность
  • промпт-шаблон с константами и переменными
  • список запретов (без текста, без логотипов, без случайных украшений)
  • Как выбрать «главный эталон лица»

    Выберите один кадр, который будет чаще всего использоваться как опора в image-to-image.

    Критерии хорошего главного эталона:

  • нейтральная эмоция
  • чётко видны брови, линия носа, форма губ
  • стабильная причёска (без «летящих» прядей, если они не канон)
  • простой свет (без неона и разноцветных источников)
  • Закрепление лица: работа от эталона

    Закрепление лица в Nano Banana — это серия контролируемых преобразований, где вы постоянно сверяете результат с контрольными признаками.

    Базовый процесс закрепления

  • Берёте главный эталон лица как опорную картинку.
  • Используете тот же блок констант (идентичность, волосы, особые приметы).
  • Меняете только одну переменную (например, фон или лёгкий поворот головы).
  • Отбираете 1–2 удачных результата и добавляете их в канон как вторичные эталоны.
  • Зачем вторичные эталоны:

  • один эталон плохо переносится на все ракурсы
  • для видео особенно важны 3/4 и профиль, и их лучше закреплять отдельными «чистыми» опорами
  • Что считается «съездом личности» при правке

    Если вы видите хотя бы 2–3 пункта из списка ниже, результат лучше не ретушировать дальше, а откатиться.

  • поменялась форма подбородка или скул
  • «переехали» брови или изменилась их дуга
  • изменилось расстояние между глазами
  • стал другим возраст (резко моложе или старше)
  • появилась другая линия роста волос
  • Правки через inpainting: как исправлять, не ломая канон

    Inpainting — главный режим полезных правок, потому что вы ограничиваете свободу генератора.

    Типовые задачи inpainting

  • исправить один глаз, который «поплыл»
  • поправить форму губ при лёгкой улыбке
  • убрать текст, логотип, водяной знак
  • удалить случайные украшения, очки, пирсинг
  • исправить руки, если они попали в кадр и выглядят неестественно
  • Правило «маленькой маски»

    Чем меньше область правки, тем выше шанс сохранить идентичность.

    Практика:

  • сначала правьте самую маленькую область (например, только зрачок и веко)
  • расширяйте маску только если точечная правка не сработала
  • !Сравнение маленькой и большой маски для inpainting

    Как писать текст для inpainting

    Текст в правке должен быть ещё более конкретным, чем в обычной генерации.

  • пишите, что именно изменить: «правый глаз: такой же размер, такое же направление взгляда, естественная симметрия»
  • повторяйте ключевые константы: «те же брови, тот же пробор, тот же шрам»
  • избегайте слов, которые «перерисовывают» лицо целиком: идеальная красота, модельная внешность, гламур
  • Outpainting и адаптация под форматы

    Outpainting полезен, когда вам нужно подготовить материалы под будущие сцены и видео.

    Когда outpainting оправдан

  • сделать больше пространства над головой для титров (если это часть задачи)
  • расширить фон под нужное соотношение сторон
  • привести серию к одному кадрированию
  • Что лучше не делать outpainting-ом на этапе канона

  • дорисовывать сложные узоры на одежде
  • добавлять мелкий реквизит в руки
  • менять освещение и время суток
  • Причина простая: мелкие детали и сильные смены условий потом «мигают» в видео.

    Апскейл: зачем он нужен и как не испортить лицо

    Апскейл нужен не ради «8K ради 8K», а чтобы:

  • уменьшить мыло и артефакты перед ретушью
  • подготовить кадры для видео-генерации, где низкое разрешение усиливает дефекты
  • сделать эталоны более читаемыми для последующих image-to-image шагов
  • Практические правила апскейла

  • сначала апскейл, потом ретушь мелочей (так вы ретушируете по более чистой базе)
  • проверяйте, не изменились ли контрольные признаки лица (иногда апскейл «дорисовывает» брови или текстуру кожи)
  • не используйте агрессивное «улучшение деталей», если оно меняет форму глаз, губ, линии волос
  • Как понять, что апскейл навредил

  • появилась «пластиковая кожа» вместо естественной текстуры
  • поменялась форма ноздрей или контур губ
  • изменилась линия роста волос или пробор стал другим
  • Если это происходит, лучше выбрать более мягкий режим апскейла или использовать другой эталон.

    Ретушь: что исправляем, а что запрещаем

    Ретушь в нейромодели — это не про «сделать красивее», а про «сделать стабильнее».

    Что ретушируем смело

  • пятна и случайные артефакты на коже, которые не являются каноном
  • мусор на фоне, случайные элементы окружения
  • дефекты одежды, если они не меняют крой и материал
  • Что ретушировать опасно

  • симметрия лица целиком
  • изменение формы носа и подбородка
  • усиление макияжа, если он не является частью канона
  • Таблица: приоритеты правок

    | Элемент | Приоритет | Почему | |---|---:|---| | Текст, логотипы, надписи | высокий | часто «мигают» и меняются между кадрами | | Глаза и взгляд | высокий | главный маркер узнаваемости | | Брови и пробор | высокий | быстро ломают идентичность | | Руки (если в кадре) | средний | важны, но лучше сначала собирать канон без них | | Фон и мелкий реквизит | низкий | не должен конкурировать с идентичностью |

    Пакетирование результата: как оформить канон после Nano Banana

    Чтобы дальше в Veo и Kling вы работали быстро, соберите результат в библию персонажа.

    Рекомендуемая структура папки проекта:

  • 01_canon_midjourney (исходные эталоны)
  • 02_canon_nanobanana (улучшенные эталоны после правок)
  • 03_variations (контролируемые вариации сцен)
  • 04_video_inputs (кадры, которые пойдут в Veo и Kling)
  • Что добавить в документ нейромодели после этого урока:

  • главный эталон лица + 2–4 вторичных эталона (3/4, профиль, по пояс)
  • список типовых правок, которые вы делали успешно (например: «убрать логотипы через inpainting маленькой маской»)
  • обновлённый список запретов (что реально мешало консистентности именно у вас)
  • Мини-чеклист перед переходом к видео

    Перед Veo и Kling убедитесь, что у вас есть стабильная база.

  • один главный эталон лица в хорошем качестве
  • отдельные устойчивые эталоны 3/4 и профиля
  • базовая одежда без мелких нестабильных узоров
  • серия из 3–5 изображений, где вы меняли только одну переменную и личность сохранилась
  • Итог

    Nano Banana в пайплайне нейромодели — это этап усиления канона: вы не столько «генерите новое», сколько закрепляете лицо и стиль через точечные правки, аккуратные вариации, апскейл и ретушь. Если вы держите дисциплину констант, делаете inpainting маленькими масками и проверяете контрольные признаки после каждого шага, персонаж становится заметно более переносимым в серию и в видео.

    6. Veo и Kling: видео с нейромоделью, сцены, движения и липсинк

    Veo и Kling: видео с нейромоделью, сцены, движения и липсинк

    Роль Veo и Kling в пайплайне курса

    На предыдущих этапах вы сделали главное: зафиксировали канон персонажа в Midjourney и усилили его переносимость в Nano Banana (эталоны, контрольные признаки, запреты, аккуратные правки).

    Veo и Kling в этом курсе нужны для следующего шага: превратить канон в движущиеся сцены, сохранив узнаваемость во времени.

  • Veo используйте, когда приоритет: кинематографичность, сложные сцены, выразительная камера и свет.
  • Kling используйте, когда приоритет: серийность клипов, управляемый повторяемый формат, быстрый перебор вариантов.
  • Официальные страницы, чтобы сверять текущие возможности (функции и интерфейсы быстро меняются):

  • Google DeepMind Veo
  • Kling AI
  • !Диаграмма показывает место Veo и Kling в общем процессе курса

    Что должно быть готово перед видео

    Видео усиливает любые несоответствия: зритель сравнивает персонажа не между картинками, а между соседними кадрами. Поэтому перед переходом в Veo/Kling проверьте базу.

    Минимальный набор входных материалов:

  • 1 главный эталон лица (нейтральная эмоция, хороший свет)
  • 2–4 вторичных эталона (3/4, профиль, по пояс)
  • список 7–12 контрольных признаков (из урока про консистентность)
  • базовый комплект одежды без текста и сложных узоров
  • словарь стиля (10–20 слов, которые вы повторяете)
  • список запретов (без логотипов, без случайных аксессуаров и так далее)
  • Если этого нет, вы будете лечить проблемы уже в видео, а это обычно дороже по времени, чем исправить статические эталоны.

    Главная сложность видео: временная консистентность

    В статике достаточно, чтобы персонаж был узнаваем. В видео добавляется временная консистентность.

    Типовые проблемы:

  • мигание деталей: узор одежды, серьги, пуговицы появляются и исчезают
  • плывущие пропорции лица: меняется челюсть, посадка глаз, линия роста волос
  • дрожащий свет: тени прыгают между кадрами
  • нестабильные руки: форма пальцев меняется от кадра к кадру
  • Поэтому стратегия курса: сначала делаем простые сцены с низким риском, и только потом усложняем.

    Как проектировать сцены так, чтобы нейромодель выдержала видео

    Думайте как режиссёр, который снимает персонажа в условиях, где актёр должен быть узнаваем всегда.

    Матрица риска для сцен

    Ниже — практичная матрица, которая помогает выбирать, что генерировать сначала.

    | Элемент сцены | Низкий риск | Высокий риск | |---|---|---| | Движение | лёгкий поворот головы, спокойная поза | бег, танец, резкие жесты | | Камера | статичная, уровень глаз | активный трекинг, зум, дрон | | Свет | мягкий ровный | неон, контровой, строб | | Одежда | однотонная, без узоров | мелкий принт, сложная фактура | | Реквизит | нет или крупный простой | мелкие предметы в руках | | Крупность | по пояс, средний план | экстремальный крупный план или полный рост в динамике |

    Рекомендация для первых клипов:

  • средний план или по пояс
  • мягкий свет
  • минимальное движение
  • простой фон
  • !Матрица помогает выбрать безопасные сцены для старта

    Входные режимы: text-to-video и image-to-video

    Точные названия режимов зависят от конкретного интерфейса, но логика обычно одна.

  • Text-to-video: вы описываете сцену текстом.
  • Image-to-video: вы даёте опорный кадр (эталон) и просите оживить его.
  • Для нейромодели чаще безопаснее начинать с image-to-video, потому что эталон сильнее держит лицо и одежду.

    Промпт-структура для видео: константы, переменные и запреты

    В видео дисциплина из прошлых уроков становится ещё важнее: вы повторяете константы буквально.

    Ниже — универсальный шаблон, который вы адаптируете под Veo и Kling.

    Практическое правило: если клип «плывёт», не добавляйте новых деталей в промпт. Наоборот, упростите сцену и вернитесь к одному движению.

    Построение серии: список шотов вместо одной длинной сцены

    Стабильнее получать не «один большой ролик», а серию коротких клипов (шотов), которые потом можно смонтировать.

    Рекомендуемый стартовый набор из 5 шотов:

  • средний план: лёгкий поворот головы
  • средний план: взгляд в сторону и обратно
  • по пояс: шаг вперёд без рук в кадре
  • по пояс: персонаж оборачивается на 20–30 градусов
  • портрет 3/4: короткая реплика или имитация речи (для теста мимики)
  • Плюсы шот-листа:

  • проще диагностировать, что именно ломает консистентность
  • проще заменить один неудачный фрагмент
  • проще удерживать один свет и одну камеру
  • !Пример минимальной раскадровки для теста нейромодели в видео

    Управление движением: как задавать действия, чтобы лицо не «перерисовывалось»

    Главная ошибка в видео-промптах: просить одновременно сложное действие и сложную съёмку. Для нейромодели это почти гарантированный съезд.

    Рекомендации по движению:

  • формулируйте движение как малую амплитуду: «поворачивает голову на 10–15 градусов», «медленно моргает», «слегка кивает»
  • избегайте «быстро», «резко», «хаотично» на этапе закрепления
  • сначала тестируйте движения без рук в кадре
  • Рекомендации по эмоциям:

  • начните с нейтральной мимики и лёгкой улыбки
  • экстремальные эмоции добавляйте только после того, как базовые шоты стабильны
  • Камера и композиция: стабилизируем то, что часто ломается

    Для консистентности полезно держать постоянными:

  • угол камеры: на уровне глаз
  • тип кадра: средний план или по пояс
  • характер глубины резкости: умеренная, без экстремального размытия
  • Что повышает риск:

  • широкий угол (сильная перспектива меняет лицо)
  • быстрые пролёты камеры (трек, панорама)
  • резкие смены крупности внутри одного клипа
  • Если вам нужна динамика, добавляйте её по одному элементу:

  • сначала движение персонажа при статичной камере
  • затем движение камеры при статичном персонаже
  • только потом объединяйте
  • Как удерживать идентичность через эталоны

    Если инструмент позволяет задавать референс-изображение, используйте это как «якорь». Практика:

  • для каждого типа шота выбирайте подходящий эталон
  • для 3/4 используйте эталон 3/4, для профиля — эталон профиля
  • не пытайтесь одним портретом удержать полный рост в движении
  • Если у вас есть выбор между:

  • «сильнее следовать эталону»
  • «сильнее следовать тексту»
  • то на этапе закрепления видео почти всегда выгоднее следовать эталону, а текст использовать для описания движения и сцены.

    Итерационный процесс: как работать быстро и не терять контроль

    Видео-генерация редко получается идеально с первого раза. Чтобы не утонуть в переборе, используйте строгий цикл.

  • Выберите один шот (например, средний план с поворотом головы).
  • Зафиксируйте константы, стиль и запреты.
  • Сделайте 4–10 попыток, меняя только один параметр.
  • Оцените по чеклисту.
  • Если шот стабилен, добавьте следующий.
  • Чеклист качества видео-шота

    Считайте шот «годным», если выполняются пункты:

  • узнаваемы 7–12 контрольных признаков
  • нет заметного мигания аксессуаров и узоров
  • свет не прыгает
  • форма лица не меняется на ключевых кадрах
  • Липсинк: как подойти к речи, чтобы не разрушить нейромодель

    Под липсинком понимают синхронизацию движения губ с речью (по аудио или по тексту, в зависимости от инструмента и режима).

    Важно: наличие встроенного липсинка зависит от конкретной версии инструмента и вашего доступа. Если в Veo или Kling нет нужного режима в вашем интерфейсе, используйте тот же принцип подготовки и делайте липсинк в отдельном решении, а затем сравнивайте результат с эталонами.

    Подготовка персонажа к липсинку

    Чтобы губы и лицо не «плыли», сделайте базовые условия:

  • крупность: портрет или 3/4, без сильного широкого угла
  • свет: мягкий и стабильный
  • эмоция: нейтральная, без сильной улыбки
  • фон: простой
  • волосы: не закрывают рот и контур щёк
  • Как писать промпт для речи

    Цель промпта — не «сделать красиво», а сохранить лицо и получить аккуратную артикуляцию.

    Практическая тактика для липсинка

    Чтобы повысить шанс стабильности:

  • начинайте с коротких фраз 1–2 секунды
  • избегайте скороговорок и крика
  • лучше сделать 3 коротких дубля, чем один длинный
  • Типовые проблемы в Veo и Kling и что с ними делать

    | Симптом | Частая причина | Действие | |---|---|---| | лицо «меняется» в середине клипа | слишком много движения или сложный свет | упростить движение, убрать контровой/неон, сократить длительность | | одежда мигает или меняется | узор, текстура, мелкие детали | заменить на однотонную одежду, усилить запреты «без принтов/логотипов» | | руки ломаются | жесты + мелкие предметы | убрать руки из кадра, перенести реквизит на потом | | персонаж становится «другим человеком» при новом шоте | один эталон не переносится | использовать отдельный эталон под нужный ракурс (3/4, профиль) | | липсинк выглядит неестественно | слишком длинная фраза, активная мимика | сократить фразу, нейтрализовать эмоцию, сделать крупнее план |

    Что должно быть готово после урока

    К концу этого урока у вас должен появиться набор, который можно монтировать и масштабировать.

  • 5–10 коротких стабильных шотов с одним персонажем
  • промпт-шаблон для видео с вашими константами и запретами
  • таблица ваших «опасных факторов» (что именно ломает консистентность в ваших сценах)
  • 1–3 тестовых клипа с речью или имитацией речи (если вы планируете липсинк)
  • Ключевой результат: вы переводите нейромодель из статического канона в управляемую видеосерию, где изменения происходят по вашей задумке, а не по случайности генератора.

    7. Пайплайн продакшена: контент-план, публикация, юридические и этические вопросы

    Пайплайн продакшена: контент-план, публикация, юридические и этические вопросы

    Зачем этот этап нужен, если нейромодель уже «готова»

    В предыдущих уроках вы собрали канон в Midjourney, закрепили лицо и правки в Nano Banana, а затем научились получать стабильные шоты в Veo и Kling. На практике этого всё ещё недостаточно, чтобы выпускать контент регулярно.

    Продакшен-пайплайн отвечает на три вопроса:

  • Что именно мы выпускаем и в каком объёме (контент-план и форматы).
  • Как мы делаем это повторяемо и без хаоса (процесс, файлы, версии, контроль качества).
  • Что можно публиковать без рисков (юридические и этические правила).
  • !Общая карта процесса от канона до публикации и обратной связи

    Что такое «продакшен-стандарт» для нейромодели

    Продакшен-стандарт — это набор договорённостей, которые вы повторяете от выпуска к выпуску.

    Минимальный стандарт удобно зафиксировать в одном документе (или в Notion/Google Docs):

  • цель серии и целевая платформа
  • форматы: длительность, соотношение сторон, частота
  • канон: эталоны, контрольные признаки, запреты
  • «опасные факторы»: что именно ломает консистентность у вашей нейромодели
  • юридические правила проекта: что нельзя использовать (бренды, лица, музыка)
  • Это логическое продолжение библии персонажа из прошлых уроков: вы добавляете не только «как выглядит», но и «как выпускается».

    Контент-план: как проектировать серию, а не отдельные удачные ролики

    Контент-план в нейропродакшене должен защищать вас от двух провалов:

  • вы делаете много попыток, но они не складываются в серию
  • вы публикуете разное по стилю и «размываете» узнаваемость
  • Шаг постановки цели: что считается успехом

    Сформулируйте цель измеримо, но не усложняйте.

    Примеры рабочих целей:

  • выпускать 3 коротких клипа в неделю в одном стиле
  • собрать 20 шотов для монтажа промо-ролика
  • сделать 10 вертикальных видео с репликами персонажа
  • Важно: цель влияет на выбор инструмента.

  • Midjourney лучше подходит для поиска и расширения библиотеки кадров.
  • Nano Banana — для стабилизации эталонов и точечных правок.
  • Veo — для более кинематографичных сцен.
  • Kling — для серийности и быстрого перебора.
  • Ссылки на официальные страницы, чтобы проверять актуальные возможности:

  • Midjourney
  • Документация Midjourney
  • Google DeepMind Veo
  • Kling AI
  • Форматы и рубрики: ограничьте вариативность заранее

    Чтобы нейромодель выглядела консистентно, полезно заранее выбрать небольшое число повторяемых «рубрик».

    Примеры рубрик для нейромодели:

  • «Портретная реплика»: 5–10 секунд, 3/4, мягкий свет, нейтральный фон
  • «Шот-демонстрация одежды»: по пояс, шаг вперёд, без рук в кадре
  • «Сцена в локации»: тот же свет и камера, меняется только фон
  • «FAQ-персонажа»: серия коротких ответов, стабильный сет
  • Ограничения рубрик — это не творческая бедность, а способ резко снизить «плавание» идентичности.

    Контент-матрица: константы и переменные уже на уровне плана

    Используйте идею из прошлых уроков: константы не трогаем, переменные меняем дозировано.

    Пример контент-матрицы для месяца:

    | Блок | Константы | Переменные | Риск для консистентности | |---|---|---|---| | Серия портретов | лицо, волосы, свет, камера, одежда | текст реплики, фон | низкий | | Локации | лицо, одежда, камера | место, реквизит крупный | средний | | Динамика | лицо, одежда, свет | движение, камера | высокий |

    Практическое правило: 70–80% контента делайте в низком и среднем риске, а высокий риск оставляйте на эксперименты.

    Шот-лист как единица планирования

    Планируйте не «ролик», а список коротких шотов, как в уроке про видео. Это удобнее для контроля и замены брака.

    Пример шот-листа на неделю:

  • Средний план: поворот головы на 10–15 градусов
  • Средний план: взгляд в сторону и обратно
  • По пояс: шаг вперёд, руки вне кадра
  • Портрет 3/4: короткая реплика (1–2 секунды)
  • По пояс: оборачивается на 20–30 градусов
  • Организация файлов и версий: чтобы не потерять канон и не перепутать удачные варианты

    Без аккуратной структуры вы быстро столкнётесь с ситуацией: «есть классный кадр, но я не помню, чем он был сделан и как повторить».

    Рекомендуемая структура проекта

    Её можно расширять, но полезно иметь минимум:

  • 00_model_bible (бриф, контрольные признаки, запреты, словарь стиля)
  • 01_canon_midjourney (исходные эталоны)
  • 02_canon_nanobanana (улучшенные/исправленные эталоны)
  • 03_shots_veo_kling (исходные видео-черновики)
  • 04_edits (монтажные проекты, цветокор)
  • 05_exports (финальные рендеры под платформы)
  • 06_legal (разрешения, лицензии, ссылки на условия)
  • Именование файлов: минимальный стандарт

    В названии файла держите то, что реально помогает повторить результат:

  • персонаж или проект
  • тип кадра
  • версия
  • дата
  • Пример: iris_portrait_3-4_v03_2026-02-05.png

    Если вы ведёте несколько вариантов одной сцены, добавляйте суффикс: take01, take02.

    Лог промптов и настроек

    Храните рядом с изображением текстовый файл или строку в таблице.

    Минимальный набор полей:

  • инструмент (Midjourney, Nano Banana, Veo, Kling)
  • промпт (константы и переменные)
  • запреты
  • референс(ы), если использовались
  • сид/параметры (если применимо)
  • результат: «в канон / в вариации / брак» и причина
  • Это превращает генерацию из «счастливого случая» в воспроизводимый процесс.

    Контроль качества перед публикацией: два чеклиста вместо бесконечных правок

    В продакшене полезно разделить контроль на два независимых блока.

    Чеклист консистентности

    Перед экспортом проверьте:

  • читаются ваши 7–12 контрольных признаков лица
  • не «мигают» волосы, пробор, брови, особые приметы
  • одежда не меняет крой и материал от шота к шоту
  • свет и цветокор не прыгают без задумки
  • нет нестабильных деталей: мелкий текст, сложные узоры, случайные украшения
  • Чеклист технического качества

    Перед публикацией проверьте:

  • кадрирование и safe-зоны под выбранную платформу
  • читаемость лица (не слишком тёмно, не слишком размазано)
  • отсутствие артефактов: «сломанные» пальцы, плавающие предметы, неожиданные надписи
  • аудио (если есть): уровень громкости, шумы, синхронизация
  • субтитры и титры: без ошибок, не перекрывают лицо
  • Публикация: адаптация под платформы и стабильная упаковка

    Главная задача публикации — сделать контент узнаваемым и пригодным для серии.

    Унификация «упаковки»

    Определите заранее:

  • формат и соотношение сторон (например, вертикаль 9:16)
  • стиль обложек (один шаблон)
  • длину роликов (например, 6–12 секунд)
  • тональность описаний и повторяемые элементы
  • !Пример того, как планировать серии, чтобы не ломать консистентность

    Ритм публикаций и «обратная петля»

    Чтобы нейромодель улучшалась, заложите регулярный цикл:

  • Публикация
  • Сбор реакций (комментарии, удержание, клики)
  • Вывод: что ломало идентичность, что зашло по стилю
  • Обновление брифа, запретов и шот-листа
  • Не усложняйте метрики. Для короткого видео обычно достаточно:

  • удержание просмотра
  • комментарии по узнаваемости
  • сохранения и репосты
  • Юридические вопросы: что вы обязаны проверить до публикации

    Законы и правила отличаются по странам и платформам, поэтому ниже — практический минимум, который снижает риски. При коммерческом использовании и особенно при работе с реальными людьми разумно консультироваться с юристом.

    Лицензия инструмента и условия использования

    Даже если контент «сгенерирован», вы используете конкретный сервис, у которого есть условия.

    Что важно проверять в условиях:

  • можно ли использовать контент коммерчески
  • что сервис считает «вашими правами» на результат
  • есть ли требования к атрибуции
  • что запрещено: незаконный контент, имитация личности, вводящий в заблуждение контент
  • Полезная точка входа для Midjourney:

  • Условия использования Midjourney
  • Для других инструментов проверяйте условия в интерфейсе сервиса или на официальном сайте.

    Авторское право и «охрана» AI-контента

    В разных юрисдикциях AI-материалы могут иметь ограниченную или неоднозначную охраноспособность. Практический вывод для продакшена:

  • не стройте бизнес-модель только на предположении, что у вас будет исключительное авторское право на «чисто сгенерированный» контент
  • фиксируйте человеческий вклад: сценарий, монтаж, компоновка, цвет, звук, дизайн-концепция
  • Официальные разъяснения США, которые часто цитируются как ориентир:

  • Страница Бюро авторского права США по теме AI
  • Право на изображение и согласие человека

    Если ваша нейромодель похожа на реального человека или вы используете фото-референсы конкретной личности, возникает риск нарушения прав на изображение, права на частную жизнь и претензий о вводящем в заблуждение использовании.

    Практические правила снижения риска:

  • не используйте лицо реального человека в коммерческих целях без явного согласия
  • избегайте «двойников» публичных персон, если это может восприниматься как подмена личности
  • храните подтверждения согласия в папке проекта
  • Товарные знаки и бренды

    Типовая проблема нейрогенерации — случайные логотипы, узнаваемые бренды и дизайн упаковок.

    Что делать:

  • в промптах и запретах фиксируйте «без логотипов и текста»
  • удаляйте следы брендов через inpainting
  • не используйте чужой товарный знак так, будто это ваш проект или реклама, если у вас нет прав
  • Музыка, голоса и липсинк

    Если вы добавляете музыку, голос или «реплику персонажа», у вас появляются отдельные права.

    Минимальный практический стандарт:

  • используйте музыку и звуки из библиотек с понятной лицензией
  • храните ссылки/лицензии рядом с экспортом
  • не имитируйте голос конкретного человека без согласия
  • Реклама и раскрытие информации

    Если контент коммерческий или может восприниматься как рекомендация, часто требуется маркировка рекламы и честное раскрытие условий.

    Для ориентира по практике раскрытия в рекламе (особенно при работе с инфлюенсерами) полезны материалы регуляторов:

  • Руководство FTC по отзывам, рекомендациям и инфлюенсерам
  • Платформы также могут иметь собственные правила публикации и маркировки.

    Этические вопросы: как не превратить нейромодель в инструмент обмана

    Этика здесь не «про настроение», а про устойчивость проекта: доверие аудитории и отсутствие конфликтов.

    Прозрачность

    Если зритель может принять ролик за реальную съёмку, полезно явно обозначать, что это синтетический персонаж.

    Варианты формулировок:

  • «Синтетический персонаж / AI-персонаж»
  • «Видео создано с использованием генеративной графики»
  • Согласие и уважение к личности

    Этический минимум:

  • не делайте контент, который может навредить реальному человеку, даже если «юридически пронесло»
  • не используйте чужую внешность как «продукт» без согласия
  • Предвзятость и стереотипы

    Генераторы могут усиливать клише.

    Практика контроля:

  • проверяйте сценарии и визуальные решения на стереотипные связки (внешность ↔ профессия ↔ моральная оценка)
  • избегайте дискриминирующих описаний в промптах
  • Контент с высоким риском

    Для учебного и коммерческого продакшена разумно исключать:

  • несовершеннолетних персонажей в сомнительных контекстах
  • политическую агитацию от имени «реального человека»
  • медицинские и финансовые обещания без доказательств
  • Финальный продакшен-чеклист перед релизом

    Перед публикацией одного выпуска пройдите короткий список:

  • есть ли ссылка на исходные эталоны и понятен ли путь воспроизводимости
  • пройдён чеклист консистентности (лицо, волосы, одежда, свет)
  • удалены логотипы, текст, случайные бренды
  • есть права на музыку/звук или использована безопасная библиотека
  • контент не выглядит как подмена реального человека без согласия
  • добавлена маркировка и раскрытие, если это реклама или может вводить в заблуждение
  • Итог

    Продакшен-пайплайн превращает нейромодель из набора удачных генераций в устойчивый медиапродукт.

  • Контент-план задаёт рамки, где консистентность сохраняется серийно.
  • Файловая структура, лог промптов и версии делают результат воспроизводимым.
  • Два чеклиста защищают качество: консистентность и техника.
  • Юридические и этические правила снижают риск блокировок, жалоб и потери доверия.
  • Следуйте принципу курса: фиксируйте константы, меняйте переменные дозировано и улучшайте процесс через обратную связь.