Создание фотореалистичных изображений и аватаров
В предыдущих материалах курса мы разобрали, что ИИ умеет делать с фото и видео, где это делать (облако или локально) и как писать промпты, чтобы управлять результатом. Теперь переходим к одному из самых востребованных сценариев: фотореализм и создание аватаров.
Под фотореализмом в контексте генерации мы будем понимать изображения, которые выглядят как кадр с реальной камеры: правдоподобный свет, кожа, оптика, материалы, естественные несовершенства. Аватар — это повторяемый персонаж (часто похожий на вас или на вымышленного героя), который сохраняет узнаваемость в разных сценах.
Что считается хорошим фотореализмом
Фотореалистичное изображение обычно “собирается” из нескольких признаков. Если вы научитесь управлять ими, качество вырастет заметнее, чем от добавления десятков случайных прилагательных в промпт.
Свет и тени
Свет — главный фактор правдоподобия.
Уточняйте тип света: мягкий, жёсткий, контровой, студийный.
Уточняйте источник: окно, софтбокс, неон, закат.
Следите за логикой: один главный источник света обычно выглядит реалистичнее, чем “всё светится отовсюду”.Оптика и “камера”
Даже если вы не фотограф, термины “объектива” помогают модели выбрать правильную перспективу и глубину резкости.
35mm часто даёт более широкий, “репортажный” вид.
50mm выглядит нейтрально и похоже на “обычный” взгляд.
85mm часто даёт классический портрет с приятным размытием фона.Добавляйте подсказки:
крупность: “крупный план”, “поясной портрет”, “в полный рост”
глубина резкости: “размытый фон”, “bokeh”Материалы и микродетали
Фотореализм — это не “идеальная кожа”. Наоборот, слишком гладкая картинка быстро начинает выглядеть “пластиковой”. Полезные детали:
текстура кожи, поры, лёгкий шум
реалистичная ткань (шерсть, деним, хлопок)
правдоподобные отражения (стекло, металл)Естественные несовершенства
Парадокс: небольшие “несовершенства” делают результат убедительнее.
слегка растрёпанные волосы
мелкие складки на одежде
лёгкая зернистость, мягкая виньеткаВажно: не путайте “естественные несовершенства” с артефактами генерации (кривые пальцы, разъехавшиеся глаза, сломанные предметы).
Инструменты: как выбрать путь под фотореализм и аватар
Из предыдущей статьи про выбор платформы полезно помнить принцип: облако быстрее стартует, локально даёт больше контроля.
Для быстрого старта под фотореалистичные портреты часто выбирают Midjourney или Adobe Firefly.
Для точных правок, повторяемости и сложных пайплайнов чаще используют Stable Diffusion через интерфейсы, например AUTOMATIC1111 или ComfyUI.
Для последующего “оживления” аватара и коротких сцен удобно подключать видео-инструменты, например Runway.Справочные ссылки:
Midjourney Documentation
Adobe Firefly
Stable Diffusion (репозиторий)
stable-diffusion-webui (AUTOMATIC1111)
ComfyUI
RunwayБазовый рабочий процесс: от портрета к серии
Ниже — универсальная схема, которая подходит почти для любого инструмента.
!Схема шагов для получения фотореалистичного результата и повторяемого аватара
Практическая логика такая:
Сначала добейтесь нормальной композиции и света.
Потом закрепите узнаваемость персонажа.
И только затем “полируйте” детали через локальные правки.Шаблон промпта для фотореалистичного портрета
Промпт удобнее писать как техническое задание из блоков. Вот рабочий шаблон:
Пример:
Негативный промпт для “чистки” артефактов
Во многих пайплайнах (особенно на базе Stable Diffusion) есть поле negative prompt. Его задача — уменьшать вероятность типовых проблем.
Пример базового негативного промпта:
Если модель всё равно ошибается, чаще всего помогает не расширение негативного промпта, а переход к локальным правкам.
Как сделать аватар, который повторяется
Главная сложность аватара — консистентность, то есть стабильность внешности от кадра к кадру.
Ниже два подхода: без обучения и с обучением. Вы можете начать с первого и перейти ко второму, когда появится цель делать много контента с одним и тем же персонажем.
Подход без обучения: промпт + референс + дисциплина
Подходит, если вам нужно:
5–20 изображений персонажа
несколько разных локаций и одежд
умеренная похожесть, без требования “один в один”Что повышает консистентность:
Один и тот же базовый промпт (сохраните его как шаблон).
Фиксация важных параметров генерации (включая seed, если он доступен).
1–2 сильных референса, а не десятки случайных.
Одинаковая логика света и камеры в серии.Мини-правило итераций:
Меняйте только одну сущность за раз: либо локацию, либо одежду, либо эмоцию.Подход с обучением: персональная “надстройка” под персонажа
Если вам нужна высокая узнаваемость (например, персонаж-ведущий для контента), обычно используют обучение под конкретного человека или героя. В разных экосистемах это может называться по-разному, но смысл один: вы даёте модели набор изображений персонажа, чтобы она лучше воспроизводила именно его.
Термины, которые вы можете встретить:
Датасет — набор изображений, на которых вы обучаете или настраиваете модель под персонажа.
Дообучение — процедура, которая добавляет модели “знание” о конкретном персонаже.
LoRA — популярный формат компактной “надстройки” к модели, который позволяет подмешивать стиль или персонажа без полного переобучения.Важно: разные платформы по-разному поддерживают обучение. Многие облачные сервисы вообще не дают дообучать модель напрямую, а локальные решения дают больше свободы, но требуют больше настройки.
Как собрать датасет для аватара (если вы используете дообучение)
Хороший датасет — это не “много фоток”, а “правильные фотки”. Цель — чтобы модель поняла, что в персонаже постоянно, а что может меняться.
Рекомендации для старта:
Количество: примерно 15–30 фото часто достаточно для первой версии.
Разнообразие: разные углы (анфас, 3/4, профиль), разные выражения лица.
Чистота: без сильных фильтров, без тяжёлой обработки, без водяных знаков.
Единый персонаж: только один человек в кадре, без групповых фото.
Разный фон: чтобы модель не “привязала” лицо к одной стене.!Примеры подходящих и неподходящих фото для датасета аватара
Правки, без которых фотореализм часто “не дотягивает”
Сильный результат почти всегда делается в два этапа: генерация основы и точечные правки.
Inpainting: исправление рук, лица и мелких ошибок
Inpainting — это дорисовка внутри выделенной области.
Используйте inpainting, когда:
лицо “почти хорошее”, но глаза или зубы странные
руки и пальцы выглядят неправильно
нужно убрать объект (посторонний предмет, лишний аксессуар)Правило промпта для inpainting:
описывайте в основном то, что должно появиться в маске, а не весь кадрOutpainting: расширение кадра под формат
Outpainting — расширение изображения за пределы исходника.
Полезно для:
перевода квадратного портрета в вертикальный 9:16
добавления “воздуха” под текст в обложке или рекламеЧтобы outpainting выглядел естественно:
повторяйте ключевые слова про свет и стиль
избегайте резкой смены локации в расширяемой областиАпскейл: доведение до публикации
После правок часто делают апскейл (увеличение разрешения) и лёгкое улучшение деталей.
Встроенные апскейлеры есть во многих интерфейсах.
Отдельные инструменты тоже популярны, например Topaz Labs.Цель апскейла — не “придумать новое лицо”, а аккуратно поднять разрешение и убрать мелкие артефакты.
Частые проблемы фотореализма и быстрые решения
| Проблема | Почему так происходит | Что сделать практично |
|---|---|---|
| “Пластиковая” кожа | Слишком агрессивная “красота” и сглаживание | Уменьшить слова про “perfect skin”, добавить “natural skin texture”, править локально |
| Кривые руки/пальцы | Типовая слабая зона моделей | Сгенерировать больше вариантов, затем inpainting рук |
| Странные зубы/глаза | Мелкая анатомия часто ломается | Не увеличивать детализацию в тексте, а исправить inpainting |
| “Мыльная” картинка | Слабые настройки качества или неудачный вариант | Выбрать более удачную основу, затем апскейл |
| Аватар “плавает” от кадра к кадру | Нет фиксации параметров и референсов | Фиксировать seed, базовый промпт, референс, менять по одному параметру |
Мини-чек-лист: чтобы аватар выглядел как один и тот же человек
Запишите “паспорт персонажа”: возраст, прическа, цвет глаз, особенности.
Зафиксируйте базовый промпт и не переписывайте его каждый раз с нуля.
Сохраняйте параметры удачных генераций: seed, формат, стиль, модель.
Делайте серию через вариации от удачного кадра, а не через “всё заново”.
Проблемные зоны исправляйте inpainting, а не полным перегенерированием.Права, безопасность и этика для аватаров
Аватары особенно чувствительны к теме личности и согласия.
Используйте лицо реального человека только с его разрешения, особенно для публикации и коммерции.
Не делайте контент, который может вводить зрителя в заблуждение (имитация реальных людей, “доказательства”, фейковые заявления).
Уточняйте правила выбранной платформы по использованию загруженных изображений и по коммерческим правам.Что дальше по курсу
Вы уже умеете:
формулировать управляемые промпты
выбирать инструменты под задачу
собирать фотореалистичный кадр через генерацию и правки
повышать консистентность аватараСледующий логичный шаг — перенести эти навыки в движение: как “оживлять” портреты, делать короткие сцены с персонажем, удерживать стиль и собирать клипы в цельный ролик.