27 апреля 2026 г.Команда Pixyn
Какая нейросеть для чего нужна — большой гайд по 30+ моделям 2026 года
30+ нейросетей для генерации картинок и видео — Midjourney, FLUX, Sora, Veo, Kling, Recraft, Ideogram. Для чего сильна каждая, как писать промт, советы по рекламе одежды и fashion.
TL;DR
- Картинки. Эстетика и художественные стили — Midjourney. Чистый фотореализм — FLUX Pro 1.1 / FLUX Pro Ultra. Текст внутри изображения — Ideogram V3, Recraft V4 Pro. Редактирование «измени X, сохрани Y» — FLUX Kontext, FLUX 2 Edit, Seedream 4.5 Edit, Gemini Nano Banana. Постеры / логотипы / типографика — Recraft V4 Pro. Open-weights под своё железо — FLUX Dev, Stable Diffusion 3.5, SDXL.
- Видео. Диалог + lip-sync + звук — Veo 3.1. Cinematic-движение и character-consistency — Runway Gen-4 Turbo, Luma Ray-2. Оживление статичной картинки — Kling I2V, Hailuo 02. Talking-head аватары — HeyGen. Action / VFX — PixVerse V6, Higgsfield Soul.
- Реклама и fashion. Самые либеральные к product-photography с одеждой и нижним бельём — FLUX Pro, Midjourney, Seedream 4.5, Recraft. Самые строгие — Google Imagen 4, Veo 3.1, gpt-image-1, Gemini. Главный приём — рамка «editorial fashion lookbook / product catalog photography», акцент на крой, материал и стайлинг, а не на теле.
- На Pixyn все эти модели работают без VPN — через единый интерфейс, WorkFlow-канву и Telegram-бота
@Pixynaibot.
Что вам нужно сгенерировать?
Кликайте на свою задачу — перенесёт к подборке моделей, которые лучше всего с ней справляются:
🧑🎤 Персонажи и портреты · 🅰️ Текст внутри изображения · ✂️ Редактирование (image-to-image) · 📰 Постеры, логотипы, типографика · 📸 Чистый фотореализм · 🎙 Видео с диалогами и звуком · 🎞 Оживление статичной картинки · 🎬 Cinematic-видео и движение камеры · 👤 Talking-head аватары · 👙 Реклама одежды и нижнего белья
Как читать этот гайд (для новичков)
В 2026 году нет «лучшей нейросети для всего». Каждая модель обучена под свои задачи. Если вы только начинаете — запомните четыре базовых понятия, без них ничего не сложится:
- Prompt-adherence — насколько точно нейросеть выполняет инструкцию. У Midjourney низкий prompt-adherence, но «вкусная» картинка по умолчанию. У FLUX, gpt-image-1 — высокий, но требуют точности.
- Текст-энкодер. Это то, что переводит ваш промт в язык модели. Короткий CLIP (~77 токенов, SDXL) ↔ длинный T5 (300+ токенов, FLUX, SD 3.5, Seedream). T5 любит длинные предложения и натуральный язык. CLIP — слова через запятую и weight syntax
(elem:1.3). - Image vs reference. Когда вы загружаете фото в нейросеть, оно либо становится input image (модель будет двигать пиксели — оживление, редактирование), либо reference (ориентир по стилю / лицу — серия в одном персонаже). Это две разные ноды и два разных API-поля. Путаница тут — самая частая ошибка новичка.
- Аббревиатуры: T2I = текст → картинка, I2I = картинка → новая картинка, T2V = текст → видео, I2V = картинка → видео.
В каждом разделе ниже сначала идёт картинка / видео группа моделей, потом — практический разбор каждой. В конце — три блока: «что выбрать под задачу», «реклама товаров и нижнее бельё», и FAQ.
Часть I. Генерация изображений
1. Midjourney (v7, Niji 6)
Что и для чего. Художественный флагман рынка. Если задача звучит как «красивая картинка для обложки / артбука / постера / иллюстрации» — Midjourney почти всегда даёт результат, на котором не нужно много дорабатывать.
В чём сильна.
- Эстетика и стилизация — модель обучена на «отобранной человеком красоте», поэтому выдаёт «вкусный» кадр даже на плохом промте.
- Художественная композиция, баланс, цвет.
- Niji 6 — лучший открытый аниме-движок.
Слабые стороны.
- Текст внутри изображения — слабо.
- Фактологическая точность (логотипы реальных брендов, лица знаменитостей) — не его задача.
- Чужие лица не воспроизводит точно по референсу — есть
--cref, но это «вдохновение», не клон.
Как писать промт. Натуральный английский + ::weight для расстановки акцентов. Параметры (--ar, --v, --style, --niji) идут отдельными полями, не в тексте. Длина — 25–90 слов.
Рабочий пример.
Editorial fashion portrait of a woman in crimson satin slip dress,
golden hour light through sheer curtains, art deco hotel suite,
shot on Hasselblad 80mm, shallow depth of field, film grain,
muted earth tones --ar 2:3 --style raw --v 7
Anti-prompt (так не работает).
woman, dress, beautiful, 4k, masterpiece, best quality, --ar 2:3
Слишком общий, нет sujet'а — Midjourney выдаст «среднюю красивую картинку», но не вашу.
2. FLUX Pro v1.1
Что и для чего. Флагман немецкой Black Forest Labs. Базовый промышленный T2I для фотореализма и e-commerce.
В чём сильна.
- Фотореализм, корректная физика света, отражения, глубина резкости.
- Высокий prompt-adherence — описали 5 объектов в кадре, получили все 5.
- Чёткая анатомия (не идеальная, но лучше большинства).
Слабые стороны.
- Текст внутри изображения — посредственно.
- Weight syntax
(elem:1.3)НЕ поддерживается, такой текст ломает промт. - SD-токены вроде
masterpiece, best qualityвредят — модель воспринимает их как часть сцены.
Как писать промт. Натуральная проза, subject впереди, 1–2 style anchor'а. Без (weights:), без негативов. Длина — 40–70 слов.
Рабочий пример.
A ceramic pour-over coffee dripper with matte white finish on a light oak
counter, morning sunlight from the left, soft shadow on the surface,
selective focus on the dripper, neutral grey background, commercial
e-commerce product photography, 1:1 aspect ratio, ultra sharp.
Anti-prompt.
(coffee dripper:1.3), (white background:1.5), masterpiece, 8k
Любая weight-скобка + tag-style — и FLUX уходит в кашу.
3. FLUX Pro Ultra
Что и для чего. Премиум-версия FLUX Pro 1.1 для разрешения до 4 МП и максимальной детализации. Когда нужен hero-кадр для сайта, рекламной кампании, обложки.
В чём сильна.
- Микро-детали (волокна ткани, поры кожи, отражение в каплях).
- Максимальная резкость в нативном высоком разрешении.
- Сильная композиция — модель сама расставляет акценты.
Слабые стороны.
- Длинные перегруженные промты (>70 слов) деградируют качество — Ultra переоценивает любое лишнее слово.
- В 2 раза медленнее и дороже Pro v1.1.
Как писать промт. Концентрированная проза, один style anchor, без перечисления десятка деталей. Длина — 30–55 слов.
Рабочий пример.
Macro close-up of a vintage gold pocket watch on dark walnut surface,
soft window light from the right creating warm reflections on metal,
shallow depth of field, museum-quality product photography.
Anti-prompt.
ultra detailed gold watch with diamonds gears mechanism vintage retro
art deco style luxury premium high quality 8k photorealistic
Ultra «захлёбывается» — каждое лишнее слово конкурирует за внимание.
4. FLUX Dev / FLUX Schnell
Что и для чего. Open-weights версии FLUX. Dev — почти-Pro по качеству для запуска на своих GPU и для LoRA-обучения. Schnell — 4-step быстрая модель для черновиков и батча.
В чём сильна.
- Open-weights — можно запускать локально, обучать LoRA, использовать в коммерческом продукте.
- Schnell — 4 шага денойзинга вместо 28, генерация за 1–2 секунды.
- Совместимость со стеком Diffusers / ComfyUI.
Слабые стороны.
- Dev — чуть слабее Pro по prompt-adherence (особенно сложные многосубъектные сцены).
- Schnell — простые промты, сложное «не доедает».
Как писать промт. Как и Pro — натуральная проза, без weight-скобок. Dev: 30–55 слов. Schnell: 15–40 слов.
Рабочий пример (Schnell).
A young woman in a yellow raincoat standing on a Tokyo street at night,
neon signs reflecting in puddles, cinematic wide angle.
Anti-prompt.
(((masterpiece))) (best quality:1.4) (ultra detailed:1.3) anime girl
FLUX-семейство не понимает SD-теги.
5. FLUX Kontext (Pro / Max)
Что и для чего. Instruction-style image editing — «измени X, сохрани Y». Это не T2I с нуля, это редактор существующего изображения по тексту.
В чём сильна.
- Точечное редактирование без перерисовки всего: «замени фон на закат», «сделай свитер красным», «убери человека сзади».
- Сохранение лица, позы, освещения — Kontext дисциплинирован.
- Max — больше деталей и сложных правок, Pro — быстрее и дешевле.
Слабые стороны.
- T2I с нуля — не его задача. Для генерации без референса используйте FLUX Pro.
- Длинные креативные промты ухудшают результат — модель путается, что менять, что сохранить.
Как писать промт. Императивная инструкция + явное указание, что сохранить. Длина — 10–40 слов для редактирования, 30–60 для генерации.
Рабочий пример.
Replace the woman's red dress with a navy blue silk slip dress.
Keep her face, hair, pose, lighting and background unchanged.
Anti-prompt.
beautiful elegant woman in a stunning blue dress with intricate details,
silk fabric flowing in the wind, golden hour, fashion editorial
Это T2I-промт. Kontext подумает, что вы хотите перерисовать всё, и сломает референс.
6. FLUX 2 (Pro / Edit / Flex)
Что и для чего. Следующая ступень FLUX — поддержка до 6 reference-картинок одновременно, character-consistency между кадрами и улучшенный prompt-adherence.
В чём сильна.
- Multi-reference — вы загружаете 4–6 картинок (продукт + лицо модели + фон + стиль) и FLUX 2 собирает из них одну сцену.
- Персонажная консистентность — серия кадров с одной и той же героиней.
- Prompt-adherence лучше Pro v1.1, особенно сложные сцены.
Слабые стороны.
- Дороже Pro по токенам.
- Edit-режим требует чёткой instruction-style формулировки (как Kontext).
Как писать промт. Проза + явные ссылки на референсы (Person from image 1, outfit from image 2). Для Edit-режима — instruction-style. Длина — 40–80 слов.
Рабочий пример (multi-reference).
Use the woman from image 1 wearing the silk lingerie set from image 2,
photographed in the loft interior of image 3. Editorial fashion lookbook
style, soft window light, art direction inspired by image 4.
Anti-prompt.
woman in lingerie, sexy, hot, cinematic
Без явной структуры FLUX 2 не использует референсы — вы получите generic-кадр.
7. Recraft V3 / V4 Pro
Что и для чего. Дизайнерская модель. Когда нужно постер, логотип, карточка товара с заголовком, векторная иллюстрация (SVG) — это сюда.
В чём сильна.
- Лучший в индустрии рендеринг текста в кириллице (V4 — заметно лучше V3).
- SVG-векторизация — единственная топ-модель, которая может выдавать вектор сразу, не растр.
- Кожа, тон, цветовая консистентность — V4 даёт ровные foto-результаты.
- Brand styles — можно настроить «свой» стиль (логотип-палитра-шрифт) и переиспользовать.
Слабые стороны.
- Фотореализм средний — V4 подтянул, но FLUX Pro Ultra всё равно сильнее.
- Сло��ные сцены — слабее MJ.
Как писать промт. Структура [Subject]. [Detail]. [Background]. [Style]. Текст в кавычках + явное указание шрифта. Длина — 20–60 слов.
Рабочий пример.
Bold typographic poster. Headline "ЧЁРНАЯ ПЯТНИЦА" in geometric sans-serif,
subhead "−50% на всё", red and black palette, minimal grid layout,
center alignment. Style: Swiss design, modern editorial.
Anti-prompt.
poster with sale text "BIG SALE 50% OFF NOW" with photorealistic explosion
and lots of stuff and rays of light in the background, super detailed
Recraft чисто справляется, но «лучшее качество» — это структурированная типографика, а не «больше всего».
8. Ideogram V2 / V3
Что и для чего. Лучший в индустрии рендеринг текста, типографика, мокапы UI и постеров. Если нужен надёжный текст в картинке — это первый кандидат.
В чём сильна.
- Текст в любых шрифтах, длинных фразах, на нескольких языках.
- Точная типографика — кернинг, размеры, выравнивание.
- Мокапы UI, постеры, упаковка.
Слабые стороны.
- Сложный фотореализм — слабее FLUX.
- Художественная стилизация — слабее MJ.
Как писать промт. Текст в "кавычках". Описать шрифт, размер, расположение. Стиль — отдельным предложением. Длина — 30–80 слов.
Рабочий пример.
Magazine cover. Top half: a woman in white linen suit on terracotta wall.
Bottom half: bold serif title "ЛЕТО 2026", small caps subtitle "100 ЛУЧШИХ
ОБРАЗОВ", price "299 ₽" in upper right. Editorial cover, Vogue-inspired.
Anti-prompt.
beautiful magazine cover with text and photo, professional design
Ideogram любит конкретику в формулировке макета.
9. Stable Diffusion 3.5 (Large / Medium)
Что и для чего. Open-weights флагман Stability AI. Гибридный энкодер CLIP+T5 — понимает и тэги, и прозу. Идеально для тех, кто запускает у себя или дообучает.
В чём сильна.
- Open-weights, можно запускать локально, обучать LoRA.
- Понимает и tag-style («1girl, blonde, red dress»), и prose-style.
- Многонаправленный — портрет, ландшафт, иллюстрация, аниме.
Слабые стороны.
- Анатомия не идеальна (особенно руки) — нужны добивки в Inpaint.
- Текст внутри изображения — заметно хуже Ideogram / Recraft.
Как писать промт. Проза или гибрид (как SDXL, но T5 любит длинные описания). Длина — 50–120 слов.
Рабочий пример.
A serene Japanese tea house at golden hour, weathered wood and washi paper
walls, soft sunlight diffused through shoji screens, traditional iron kettle
on tatami floor with curling steam. Photographic, shallow depth of field,
85mm lens, calm contemplative mood.
Anti-prompt. Смотрите SDXL — те же ошибки.
10. Stable Image Ultra / Core
Что и для чего. Премиум T2I-сервис от Stability через API. Ultra — топ-фотореализм, Core — бюджетный универсал.
В чём сильна.
- Ultra — фотореализм почти на уровне FLUX Pro.
- Стабильное API без капризов.
- Core — дёшево и быстро для пробных кадров и батча.
Слабые стороны.
- Меньше «character» чем у MJ (нет «вкусной» эстетики по умолчанию).
- Иногда отстаёт в новых стилях.
Как писать промт. Проза, без weight syntax. Длина — 40–80 слов.
Рабочий пример.
Hero product shot of a navy blue suede armchair in a minimalist living
room, beige wall, soft afternoon light from a tall window, oak floor,
single ceramic vase with eucalyptus, interior magazine photography.
11. SDXL (Fast / Lightning)
Что и для чего. Самая распространённая open-weights модель 2024–2025. Огромная экосистема LoRA, плагинов, ComfyUI-нод. Дешёвая и быстрая.
В чём сильна.
- Hybrid prompts — комбинация прозы и тэгов с весами
(elem:1.3). - Огромная коллекция LoRA на любую тему / стиль / персонажа.
- Очень быстрая в Lightning / Turbo / Fast версиях.
Слабые стороны.
- CLIP-лимит ~154 токена — длинные промты обрезаются.
- Без quality-tags картинка часто «средняя», нужны
(masterpiece, best quality:1.2). - Анатомия рук, глаза — слабее FLUX.
Как писать промт. Scene description + comma tags + negative prompt. Длина — 50–100 слов.
Рабочий пример.
masterpiece, best quality, ultra detailed, (cinematic photo:1.2),
1girl, brunette, freckles, white linen blouse, sitting on a cafe terrace,
soft morning light, shallow depth of field, kodak portra 400 film grain,
50mm f/1.4
Negative: cartoon, anime, deformed hands, extra fingers, blurry, low quality
Anti-prompt.
photo of a woman in a cafe
SDXL без quality-токенов и без негатива даст «среднюю стоковую» картинку.
12. Seedream 4.5 (T2I + Edit)
Что и для чего. Bilingual EN/ZH флагман от ByteDance. Длинный T5-XXL энкодер, отличный фотореализм и текст внутри изображения, в том числе кириллица.
В чём сильна.
- Bilingual — понимает английский и китайский в одном промте, выдаёт корректный текст на обоих.
- Очень хороший photo-look без «AI-кислятины».
- Edit-режим: multi-reference image composition — несколько фото → одна сцена (как FLUX 2).
- Семейный / lifestyle-контент — один из самых либеральных по фильтру.
Слабые стороны.
- Меньше известных best-practices в рунете — приходится экспериментировать.
- Иногда «слишком китайская» эстетика — фиксится явным указанием.
Как писать промт. Длинная проза работает хорошо. Текст-в-картинке — оставлять на исходном языке (английский → пишите английским, кириллица → пишите кириллицей в кавычках). Длина — 30–100 слов.
Рабочий пример.
Tasteful editorial fashion photograph of a young woman in a soft beige
silk slip dress, sitting on the windowsill of a Parisian apartment,
morning light, sheer curtains, art deco interior. Cover headline
"ЛЕТО 2026" in elegant serif at the top. Vogue lookbook style.
13. Gemini Nano Banana / 2 / Pro
Что и для чего. Image-генератор от Google на базе LLM-архитектуры. Сильное семантическое понимание сцены, потому что под капотом — Gemini, а не диффузия.
В чём сильна.
- Семантическое понимание многосубъектных сцен — «корова доит фермера» Gemini поймёт буквально.
- Soft edits — естественные правки готового кадра.
- Текст внутри изображения — приличный.
Слабые стороны.
- Strict content filter — самый консервативный в индустрии. Лёгкая декольте → отказ.
- Иногда стилистически «пресная» картинка.
Как писать промт. Только натуральная проза, не diffusion-стиль с тэгами. Исключения через фразу: without watermarks, without text overlays. Длина — 40–70 слов.
Рабочий пример.
A cozy autumn cafe interior with warm yellow lighting, a wooden bar with
a row of pour-over coffee setups, steam rising from a cup, raindrops on
the window in the background. Photographic, shallow depth of field,
inviting atmosphere, no text or watermarks.
Anti-prompt.
sexy woman in lingerie photoshoot, model pose, fashion advertising
Gemini немедленно откажет. Для fashion — берите FLUX или Seedream.
14. Google Imagen 4 (3.0 / 4.0 / Ultra / Fast)
Что и для чего. Премиум T2I от Google. Photorealism уровня FLUX Pro Ultra, очень высокий prompt fidelity, безопасная генерация без «AI-артефактов».
В чём сильна.
- Topor-уровневый фотореализм, особенно лица и кожа.
- Очень точное следование промту.
- Ultra — для финальных кадров рекламы, Fast — для итераций.
Слабые стороны.
- Rate-limits — нельзя делать 50 кадров в минуту.
- Контент-фильтр жёстче FLUX и MJ, особенно по «привлекательности».
Как писать промт. Проза, подробно описать свет и материалы. Длина — 40–80 слов.
Рабочий пример.
Studio portrait of a 35-year-old executive in charcoal wool suit,
seated, three-quarter angle, soft beauty dish from camera-left,
white seamless background, sharp focus on eyes, natural skin texture,
85mm lens at f/2.8, corporate headshot photography.
15. OpenAI gpt-image-1 / DALL-E 3
Что и для чего. Текущий флагман OpenAI. gpt-image-1 — instruction-style, очень сильное понимание контекста, multi-image edit. DALL-E 3 — старший брат через ChatGPT, с авто-rewrite промта.
В чём сильна.
- Instruction-style — описываете сцену длинным предложением, модель «всё поняла».
- Multi-image edit — несколько фото на вход, одна сцена на выход.
- Лучший вариант, когда промт пишет ChatGPT-агент.
Слабые стороны.
- DALL-E 3 в ChatGPT переписывает промт автоматически — для сырого input нужен API.
- DALL-E 2 — устаревший, простые сцены.
- Контент-фильтр строгий, особенно к интим-белью и provocative-сценам.
Как писать промт. Instruction-style, можно длинно описать сцену. Длина — 50–150 слов.
Рабочий пример.
Generate a photographic e-commerce hero image for a premium ceramic kettle
brand. The kettle is matte black with brushed copper handle, placed on a
light grey marble surface, with soft morning light from the upper left.
Background is a blurred minimal kitchen. Composition: kettle centered,
copyspace at top for headline. Photorealistic, sharp, advertising quality.
16. DashScope Qwen-Image
Что и для чего. Bilingual ZH/EN T2I от Alibaba. Лучший рендеринг китайского и английского текста в индустрии, плюс photorealism.
В чём сильна.
- Идеальный китайский и английский текст в кадре.
- Photo-look на уровне Stable Image Ultra.
- Понимает смешанные ZH+EN промты (что бывает нужно для китайских клиентов).
Слабые стороны.
- Кириллический текст рендерит хуже Ideogram / Recraft.
- В ру-сегменте мало экспертизы, информации в открытом доступе тоже мало.
Как писать промт. Проза, текст в кавычках. Китайский можно оставлять на иероглифах. Длина — 40–100 слов.
17. DashScope Wanx 2.1 T2I (turbo / plus / v1)
Что и для чего. Старшее поколение Alibaba до Qwen-Image. Дешевле, но слабее по качеству. Подходит, когда нужен бюджетный кадр пачкой.
В чём сильна.
- Низкая цена за кадр.
- Стабильно работает в азиатской эстетике (стрит, реклама, lifestyle).
Слабые стороны.
- Хуже Qwen-Image по фотореализму и тексту.
- Фильтр консервативнее.
Как писать промт. Простая проза. Длина — 30–80 слов.
18. Higgsfield (image)
Что и для чего. Photoreal-портреты и cinematic action-shots. Niche-инструмент, известен по action-сценам в маркетинге.
В чём сильна.
- Фотореалистичные портреты с «киношным» характером — сильные эмоции, action-позы.
- Хорошо работает по короткому, концентрированному промту.
Слабые стороны.
- Узкий профиль — для карточек товаров и постеров не идеален.
Как писать промт. Cinematic-стиль. Для image — короче, чем для видео. Длина — 30–60 слов.
Рабочий пример.
Cinematic portrait of a runner crossing the finish line at sunset,
arms raised, sweat and dust in the air, golden backlight, 85mm lens,
shallow depth of field, sports advertising aesthetic.
19. Luma Photon-1
Что и для чего. T2I от Luma. Cinematic-фотография, реалистичные сцены, single-shot композиции с «кинематографическим характером».
В чём сильна.
- Cinematic vocabulary — слова вроде
anamorphic,wide aperture,golden hourмодель «понимает». - Ровная съёмочная композиция без AI-стерильности.
Слабые стороны.
- Меньше known best-practices, чем у MJ / FLUX.
- Слабее MJ по эстетике.
Как писать промт. Проза, cinematic vocabulary. Длина — 40–80 слов.
Часть II. Генерация видео
V1. Veo 3.1 (Google)
Что и для чего. Главный киллер 2026 — диалоги + audio sync + lip sync в одной модели. Это первая T2V-модель, которая выдаёт видео с озвучкой и попаданием в губы за один прогон.
В чём сильна.
- Диалоги и lip-sync — пишете реплики в кавычках на родном языке (включая русский), модель сама произносит.
- Photorealistic кадр + cinematic движение камеры.
- Audio (ambient, foley, дыхание) генерируется синхронно.
Слабые стороны.
- Лимит 8 секунд на клип.
- Цена — самая высокая в категории.
- Контент-фильтр строгий.
Как писать промт. Directorial-структура: [Camera]+[Subject]+[Action]+[Setting]+[Style&Audio]. Диалоги — в кавычках на родном языке. Длина — 100–140 слов.
Рабочий пример.
Camera: medium close-up, slow dolly-in.
Subject: a woman in her thirties with short auburn hair, navy blazer.
Action: she looks directly at camera and says: "Привет. Ты вовремя."
Setting: a modern co-working space, late afternoon light through tall windows.
Style: cinematic, shallow depth of field, soft sound design — ambient room
tone, distant keyboard typing, her voice clear and warm. 8 seconds.
V2. Kling v2.5 / v2.6 / v3 T2V
Что и для чего. Китайский video-флагман от Kuaishou. Лучшее на рынке движение человека (танец, спорт, мимика), motion-control в v2.6+.
В чём сильна.
- Человеческое движение — самое плавное и физически достоверное.
- Motion endpoints в v2.6+ — указываете «начало А → конец B», модель строит траекторию.
- Длительность до 10 сек.
Слабые стороны.
- Text-rendering плохой.
- Английский ≤ китайский по точности.
Как писать промт. Структура Scene → Characters → Action → Camera → Style, опционально Motion endpoints. Длина — 80–130 слов.
Рабочий пример.
Scene: a quiet beach at sunrise.
Characters: a young woman in white linen dress, barefoot.
Action: she walks slowly along the wet sand, leaves footprints, looks
to the horizon with a calm smile.
Camera: low handheld, follows her from behind, then dolly around to a
side profile.
Style: cinematic, golden hour, soft warm tones, slight film grain.
V3. Kling I2V (v1.6 / v2.1 / v2.5 / v2.6, multi-i2v, v3)
Что и для чего. Оживление статичной картинки. Грузите ваш кадр (FLUX, MJ, фото товара) → Kling I2V превращает его в 5–10 сек видео. Multi-i2v — несколько кадров на вход.
В чём сильна.
- Очень бережно сохраняет лицо, продукт, фон — не «уплывает».
- Multi-i2v — серия кадров одного и того же персонажа в видео.
- Тонкая настройка скорости и силы движения.
Слабые стороны.
- Для генерации с нуля — не его задача.
- Резкие сложные движения иногда «сглаживает».
Как писать промт. Только motion + camera (картинка задаёт визуал). Длина — 40–90 слов.
Рабочий пример.
The woman slowly turns her head from left to right and gives a soft smile.
Subtle wind moves her hair. Camera holds steady, then slow push-in on
her face. Natural micro-expressions. 5 seconds.
Anti-prompt.
beautiful cinematic shot of a woman in nature, sunset, dramatic lighting
Это T2V-промт. I2V уже знает, как выглядит сцена — нужны только инструкции движения.
V4. Sora 2 / Sora 2 Pro (OpenAI)
Что и для чего. Длинные клипы (8–20 сек), сильное мир-моделирование (физика, гравитация, объекты), audio-генерация с Sora 2.
В чём сильна.
- Длинные клипы — большой плюс перед Veo (8 сек) и Kling (10 сек).
- Физика и причинно-следственные связи — стакан падает корректно, вода ведёт себя как вода.
- Sora 2 — нативный звук синхронно с видео.
Слабые стороны.
- Контент-фильтр очень строгий (исторический пример OpenAI).
- Дорого.
- Доступ через ограниченные регионы / партнёрские плейсменты.
Как писать промт. Cinematic-style, физика естественная (не нужно задавать). Длина — 80–160 слов.
V5. Runway Gen-3a Turbo / Gen-4 Turbo / Aleph
Что и для чего. Cinematic-премиум для рекламы и креативных кадров. Gen-4 — топ по character/scene consistency. Aleph — video-to-video editing (отдельный режим).
В чём сильна.
- Cinematic движение камеры, motion vocabulary.
- Gen-4 — character consistency между кадрами серии.
- Aleph — менять элементы существующего видео без полного переснимания.
Слабые стороны.
- Дорого.
- Длительность стандартная (5–10 сек).
Как писать промт. Directorial-стиль, motion vocabulary. Длина — 50–120 слов.
V6. Wan 2.2 / 2.5 (Alibaba)
Что и для чего. Open-weights видео от Alibaba. Поддерживает structured prompting и хорошую цветовую консистентность кадра.
В чём сильна.
- Open-weights — можно запускать локально / в своей инфре.
- Цветовая консистентность — без флика и «прыжков» света.
- Понимает структурированный промт.
Слабые стороны.
- Лимит ~800 символов на промт.
- Английский слабее китайского.
Как писать промт. Структура Subject + Action + Camera + Lighting + Style + Color + Mood. Длина — 80–120 слов.
V7. Hailuo 02 / 02-Pro / 01 (MiniMax)
Что и для чего. Видео-флагман MiniMax. Лучшая в отрасли передача мимики и эмоции через physical description.
В чём сильна.
- Мимика, body language — модель буквально «играет» эмоцию.
- Сильные глаголы (
sprints,clutches,gazes) дают яркий результат. - 02-Pro — чище по деталям.
Слабые стороны.
- Лимит 6 секунд.
- Не больше 2–3 камер-инструкций в промте, иначе путает.
Как писать промт. Narrative «как режиссёр», сильные глаголы. Длина — 30–80 слов.
Рабочий пример.
A young woman sprints down a rain-soaked street at night, neon signs
reflecting in puddles. She glances over her shoulder, breath visible
in the cold air. Camera follows behind at running pace. 6 seconds.
V8. PixVerse V6
Что и для чего. VFX, multi-shot, transitions, экстремальные ракурсы. Когда нужен «вау-эффект» — это сюда.
В чём сильна.
- VFX и transitions — переход между кадрами, эффекты, нестандартная камера.
- Multi-shot — несколько ракурсов в одном клипе.
- Экстремальные ракурсы (drone shot, top-down).
Слабые стороны.
- Иногда «магичит» — путает абстракции.
- Нужны буквальные физические описания.
Как писать промт. Literal physical description, что именно видит камера. Длина — 40–100 слов (T2V), 30–70 (I2V).
V9. LTX-2 / LTX-2 Pro / Fast (Lightricks)
Что и для чего. Open-weights видео с поддержкой JSON-промтов. Быстро, дёшево, локально.
В чём сильна.
- Open-weights, можно крутить у себя.
- JSON-prompt support — для расширенного контроля сцены / камеры.
- Очень быстрая генерация.
Слабые стороны.
- Качество ниже proprietary (Veo, Kling, Runway).
- Best-practices в рунете мало.
Как писать промт. Проза или JSON. Длина — 40–80 слов.
V10. Luma Ray-2 / Ray-2-Flash
Что и для чего. Cinematic motion, smooth camera, character consistency. Ray-2-Flash — быстрая версия для черновиков.
В чём сильна.
- Очень плавное движение камеры.
- Character consistency на уровне Runway Gen-4.
- Подходит для рекламы класса «премиум».
Слабые стороны.
- Text-rendering плохой.
- Меньшая популярность, меньше LoRA-аналогов.
Как писать промт. Cinematic vocabulary, описание камеры и освещения. Длина — 50–100 слов.
V11. Higgsfield Soul / DOP / I2V / Mix
Что и для чего. Action-shots, cinematic camera, character-driven сцены. Soul — классические кинематографические шоты, DOP — cinematographer-style контроль камеры, Mix — multi-subject сцены.
В чём сильна.
- Action-сцены, спортивные кадры, динамика.
- DOP-режим — точный контроль камеры (focal length, dolly speed, angle).
- Mix — несколько персонажей в одной сцене.
Слабые стороны.
- Узкая ниша — не для всех задач.
- Цена выше среднего.
Как писать промт. Vocabulary как у DP (director of photography) — low-angle handheld, dolly out, Steadicam tracking. Длина — 60–120 слов.
V12. HeyGen Avatar Video / Translate
Что и для чего. Talking-head аватары и перевод видео с lip-sync. Для онбординга, обучения, маркетинга — когда нужна «говорящая голова» на много языков из одного фото / 2-минутного референса.
В чём сильна.
- Lip-sync на 70+ языках, включая русский.
- Instant Avatar — клон вас за 10 минут из 2-минутного видео.
- Photo Avatar — аватар из одного фото.
Слабые стороны.
- В кадре только одна голова — не для сцен с несколькими людьми.
- Описание сцены в промте — обычно вредит, лучше mode='off' для enrichment.
Как писать промт. Скрипт, не описание сцены. Просто текст, который аватар должен произнести. Длина и стиль речи — натуральные.
Рабочий пример.
Привет! Сегодня расскажу, как за 10 минут собрать карточку товара
для Wildberries. Запоминайте — поехали.
Anti-prompt.
[Make a cinematic shot of a man in a business suit explaining things]
HeyGen — текст-в-речь + лицо. Не пытайтесь описывать сцену.
Часть III. Что выбрать для конкретной задачи
🧑🎤 Персонажи и портреты
- Художественный портрет, концепт, обложка → Midjourney v7 (
--style rawдля меньшей стилизации) или Niji 6 для аниме. - Фотореалистичный портрет под рекламу / каталог → FLUX Pro 1.1 (или Ultra для hero) / Stable Image Ultra / Imagen 4.
- Серия кадров с одним персонажем (character consistency) → FLUX 2 multi-reference / Midjourney
--cref/ SDXL + LoRA. Для видео — Runway Gen-4 / Luma Ray-2. - Анонимный аватар «лица нет» → Recraft (Brand Style) или MJ + Niji.
Подробнее: Character consistency — серия кадров с одним персонажем.
🅰️ Текст внутри изображения
- Заголовки, цены, упаковка, мокапы UI → Ideogram V3 (топ-1) или Recraft V4 Pro (особенно для кириллицы и SVG).
- Постер с длинным текстом + сложный фон → Recraft V4 Pro.
- Китайский / английский текст → DashScope Qwen-Image.
- Быстрая правка текста на готовой картинке → FLUX Kontext.
Сравнение лидеров: Ideogram 2 vs Recraft V3 — текст на изображении.
✂️ Редактирование (image-to-image)
- «Замени X, сохрани Y» — точечная правка → FLUX Kontext Pro (быстро) / Max (тонко).
- Multi-reference: собрать сцену из нескольких фото → FLUX 2 Edit или Seedream 4.5 Edit.
- Soft edits с пониманием смысла → Gemini Nano Banana.
- Реставрация старого фото / colorize → специализированные ноды на Pixyn.
- Video-to-video → Runway Aleph.
📰 Постеры, логотипы, типографика
- Логотип, постер, упаковка, презентация → Recraft V4 Pro (включая SVG-вывод).
- Магазинная карточка с заголовком и ценой → Ideogram V3 или Recraft V4 Pro.
- Журнальная обложка → Ideogram V3 (структура макета) + FLUX Pro Ultra (фотогеричный фон) → собрать в Figma.
Гайд: Логотип за 5 минут — Midjourney, Ideogram, Recraft.
📸 Чистый фотореализм
- E-commerce карточка / hero-кадр → FLUX Pro Ultra (топ) / Imagen 4 Ultra / Stable Image Ultra.
- Карточки маркетплейсов (Wildberries, Ozon) → FLUX Pro 1.1.
- Рекламная съёмка интерьера / архитектуры → FLUX Pro Ultra / Luma Photon-1.
Подробнее: AI-фото для Wildberries, AI-фото для Ozon.
🎙 Видео с диалогами и звуком
- Один монолог / диалог, lip-sync, звук → Veo 3.1 (киллер-фича 2026, до 8 сек).
- Длинный кадр с физикой и звуком → Sora 2 (8–20 сек, ограниченный доступ).
- Talking-head аватар на много языков → HeyGen Avatar Video.
🎞 Оживление статичной картинки
- Универсал → Kling I2V v3 (или v2.6 для motion-endpoints).
- Сильная мимика и эмоция → Hailuo 02 / 02-Pro.
- Мягкая киношная анимация → Luma Ray-2.
- Серия кадров одной модели → Kling Multi-I2V.
Сравнение: Kling vs Runway — Reels и Shorts, Pika vs Luma — оживление фото.
🎬 Cinematic-видео и движение камеры
- Cinematic ad → Runway Gen-4 Turbo, Luma Ray-2, Higgsfield Soul.
- Action / sport / VFX → PixVerse V6, Higgsfield Soul.
- Open-weights, локально → Wan 2.5, LTX-2 Pro.
👤 Talking-head аватары
- Личный AI-двойник для TikTok / Reels → HeyGen Instant Avatar (2 минуты референса).
- Анонимный «ведущий» → Нейрофотосессия Pixyn → HeyGen Photo Avatar.
- Перевод существующих видео с lip-sync → HeyGen Translate.
Гайд: AI-аватар для TikTok за 10 минут, HeyGen vs Synthesia.
👙 Реклама одежды и нижнего белья: как пройти фильтры
Это самая частая «практическая» задача и одновременно — самая капризная по фильтрам. У всех топ-провайдеров есть content-policy, и для одних и тех же товаров одни модели генерируют легко, другие — отказывают. Ниже — как получать результат легально и стабильно, без обхода ToS.
Главный принцип: рамка, а не «голое тело»
Все модели обучены детектировать «попытку nudity» по совокупности сигналов: голая кожа в большой доле кадра + интимная поза + соответствующий вокабуляр. Если убрать хотя бы один из этих сигналов — фильтр чаще всего пропускает. Вот рабочая рамка для нижнего белья и swimwear:
- Позиционируйте кадр как product / editorial / lookbook. Слова-якоря в промте:
editorial fashion lookbook,product catalog photography,tasteful lingerie campaign,swimwear product shoot,boutique e-commerce hero. Они переключают модель в «коммерческий» режим, где такая категория контента легитимна. - Фокус на ткани и крое, а не на теле. Описывайте материал (
silk satin,lace trim,microfiber blend), цвет (muted nude,champagne,wine red), посадку (high-waisted,seamless cut,balconette bra). Это даёт модели «инженерную» зацепку и снижает «триггерность». - Освещение и сеттинг — мягкие, не «постельные». Studio softbox, natural daylight, hotel suite at golden hour, minimalist editorial backdrop — да. Bedroom, sheets, intimate, sensual — нет (даже если по-русски это нейтрально).
- Поза — естественная, статичная. Standing, walking, leaning against wall, sitting on a chair. Избегайте
lying down,seductive,provocative pose,arched back,bedroom eyes— это прямые триггеры. - Возраст модели — явно взрослый.
Adult woman in her thirties,30-year-old model. Не используйтеyoung,teen,cute girl— даже если по-русски это нейтрально, английский фильтр читает иначе.
Какие модели либеральнее, какие строже
| Модель | Уровень | Что работает |
|---|---|---|
| FLUX Pro 1.1 / Ultra | 🟢 Либеральная | Editorial-рамка пропускает product-shots с lingerie / swimwear. |
| FLUX Kontext / FLUX 2 Edit | 🟢 Либеральная | I2I-редактирование готового каталожного фото — самый чистый путь. |
Midjourney v7 + --style raw |
🟢 Либеральная | Хорошо работает для editorial-кампаний. |
| Seedream 4.5 | 🟢 Либеральная | Отличный fashion-look, длинная проза. |
| Recraft V4 Pro | 🟢 Либеральная | Каталожные кадры, постеры с lingerie-фотографией. |
| Stable Diffusion 3.5 / SDXL (своё железо) | 🟢 Либеральная | На своих GPU фильтр зависит только от вашего ToS. |
| Stable Image Ultra | 🟡 Средняя | Editorial-фрейм проходит, intimate — нет. |
| DashScope Qwen-Image / Wanx | 🟡 Средняя | Зависит от формулировки. |
| Luma Photon-1 / Ray-2 | 🟡 Средняя | Cinematic-vocabulary помогает. |
| Higgsfield | 🟡 Средняя | Action-фрейм пропускает product-shots. |
| OpenAI gpt-image-1 / DALL-E 3 | 🔴 Строгая | Часто отказывает на lingerie. Берите для product-only без модели. |
| Google Imagen 4 | 🔴 Строгая | Очень аккуратно — лучше для swimwear, чем для underwear. |
| Gemini Nano Banana / Pro | 🔴 Строгая | Самый консервативный фильтр на рынке. |
| Veo 3.1 / Sora 2 | 🔴 Строгая | Видео с lingerie-моделями обычно отклоняют. |
Рабочий шаблон промта для FLUX Pro / Seedream
Editorial fashion lookbook photograph for a premium lingerie brand.
Adult woman, mid-thirties, sitting calmly on a velvet armchair in a
minimalist hotel suite. She wears a champagne-colored silk satin slip
with delicate lace trim and matching balconette set. Soft natural
window light from the left, warm beige palette, art deco interior in
the background, shallow depth of field, 50mm lens. Tasteful, brand
campaign quality, magazine catalog aesthetic, no overt sensuality.
Что работает в этом шаблоне: editorial fashion lookbook, premium lingerie brand, adult woman, mid-thirties, sitting calmly, описание ткани и крой, soft natural window light, magazine catalog aesthetic, явное no overt sensuality.
Anti-prompt — как делать НЕ нужно
sexy hot lingerie model in bed, seductive pose, intimate photo,
beautiful young girl, sensual atmosphere
Триггеры: sexy, hot, seductive, in bed, intimate, young, sensual — каждое из этих слов у топ-провайдеров повышает вероятность отказа в десятки раз. Даже на либеральных моделях такой промт даёт меньше результата, чем editorial-рамка, потому что модель уходит в стереотип «AI-стоковая девушка».
Если фильтр всё равно отказывает
- Перейдите в I2I. Загрузите легально снятый каталожный кадр в FLUX Kontext или Seedream Edit и попросите сменить цвет, фон, причёску. Фильтр на I2I мягче, потому что кадр уже существует.
- Смените модель. FLUX Pro вместо Imagen, Seedream вместо Gemini.
- Сделайте product-only кадр. Без модели — на манекене / на плечиках / flat lay. Для половины задач этого достаточно.
- Уберите триггеры. Все слова из anti-prompt выше — переформулируйте на нейтральные.
Гайд по нейрофотосессиям для бизнеса (включая fashion): Нейрофотосессии для бизнеса — SMM, маркетплейсы, риелтор.
FAQ
Какая нейросеть лучше всего для рекламы Wildberries / Ozon?
Для карточки товара — FLUX Pro 1.1 (универсальный hero-кадр) и FLUX Pro Ultra (для главного кадра карточки). Для текстовых баннеров и упаковки — Recraft V4 Pro или Ideogram V3. Для оживления карточки в видео — Kling v3 или Hailuo 02. На Pixyn все доступны без VPN.
Чем отличается Midjourney от FLUX?
Midjourney «отдаёт красоту по умолчанию» — даже на плохом промте кадр выглядит стильно, но prompt-adherence ниже. FLUX точно следует инструкции, лучше в фотореализме и в e-commerce, но требует более аккуратной формулировки. Для арта — MJ. Для рекламы и продуктов — FLUX.
Какая нейросеть для видео с озвучкой и lip-sync на русском?
Veo 3.1 — главная модель 2026 года для коротких клипов с диалогом и звуком (до 8 сек). Для длинных talking-head видео — HeyGen Avatar (русский lip-sync работает отлично). Для перевода существующих видео — HeyGen Translate.
Можно ли пользоваться Veo 3.1, Sora 2 или Midjourney в России без VPN?
Через прямой сайт — нет. Через Pixyn — да: мы агрегируем Veo, Sora 2, Midjourney, FLUX, Kling и другие модели в одном интерфейсе с оплатой в рублях, без VPN. Подробнее: AI-генерация без VPN — платформа в России.
Как написать промт для нейросети, если я никогда этого не делал?
Базовая формула: [субъект] + [действие] + [сеттинг] + [свет] + [стиль]. Например: молодая женщина в красном пальто (субъект), идёт по парижской улице (действие), осенний дождь (сеттинг), мягкий вечерний свет (свет), кинематографично (стиль). На английском это работает точнее — все топ-модели обучены преимущественно на английском. Подробный гайд: Формула идеального промта.
Какая нейросеть подходит для рекламы нижнего белья?
FLUX Pro 1.1 (или Ultra), Midjourney v7, Seedream 4.5 и Recraft V4 — самые либеральные. Главное — формулировать как editorial fashion lookbook или product catalog photography, делать акцент на крое и ткани, использовать мягкое студийное освещение. Imagen 4, Gemini, gpt-image-1 и Veo — лучше избегать в этой нише.
Можно ли обучить нейросеть на свою модель / товар?
Да, через LoRA (Stable Diffusion XL, FLUX Dev) или через character-reference (Midjourney --cref, FLUX 2 multi-reference). На Pixyn LoRA-обучение доступно из коробки. Для серии кадров с одним персонажем мы рекомендуем гайд: Character consistency.
Сколько стоит сгенерировать 100 картинок?
В среднем — 50–500 рублей, в зависимости от модели. FLUX Schnell — самый дешёвый (3–5 ₽ за кадр), FLUX Pro Ultra — премиум (15–25 ₽). Видео дороже: 5-сек Kling v3 — около 50–80 ₽, Veo 3.1 — 200–400 ₽. На Pixyn первые 50 токенов и Premium на 3 дня — бесплатно.
Какую нейросеть выбрать новичку?
Начните с FLUX Pro 1.1 для картинок и Kling I2V для оживления. Они прощают неточный промт, дают предсказуемое качество и работают почти под любую задачу. Когда освоитесь — добавляйте Midjourney для эстетики, Ideogram / Recraft для текста, Veo для видео с диалогом.
Что дальше
Этот гайд — карта моделей. Следующие шаги:
- Попробовать бесплатно — 50 токенов и Premium на 3 дня без привязки карты. Все 30+ моделей в одном интерфейсе.
- WorkFlow-канва — собрать пайплайн «карточка → видео» из нескольких моделей.
- Telegram-бот @Pixynaibot — генерация прямо в чате.
Если у вас остались вопросы по конкретной задаче — напишите в наш Telegram-канал, мы помогаем подобрать модель под бизнес-сценарий.
Читать дальше
Попробуйте Pixyn бесплатно
50 токенов и пробный Premium на 3 дня — без привязки карты.
Начать бесплатно