Showcase — реальные работы

Подборка реальных артефактов которые этот пайплайн уже сгенерировал. Все примеры — из production-runs Performante (apparatus, bas-dent, performante-ai-agency). Каждая секция показывает что выдаёт конкретный скилл — не схема в HTML, а реальный MP4/PNG/MP3 файл.

Все примеры embedded локально в папке examples/ (~152MB). Работает офлайн без интернета. Размер ZIP-архива базы знаний с примерами ≈ 110-130MB.

📸 Постеры (creative-poster + creative-orchestrator)

9 финальных постеров для клиента Apparatus KZ (B2B Kazakh медтехника). Сгенерированы через creative-poster (Gemini 3 Pro Image), brand-injection из apparatus/brand.yaml, multi-aspect outpainted из 4:5 в 9:16. Аппараты: T608, ETC5, T8.

Все постеры подчиняются 6 hard rules зашитым в SYSTEM_RULES: нет CTA-кнопки, нет brand-логотипа, нет softbox в кадре, ₸ это реальный символ (не Т), нет text truncation, continuous background. Вижуальный QA пройден через qa_review.py с Vision LLM.

Реальная карусель про T608 — Запусти УВТ-кабинет за 30 дней. 7 слайдов, template = product_launch, рендер через Remotion (TSX), $0 на slides. Свайпни горизонтально:

Open the carousel preview HTML с payload-сайдбаром (GR-1): preview_carousel_t608.html

🎬 Veo 3.1 клипы (video-clipgen)

3 примера сырого материала сгенерированного Veo 3.1 по brief'у клиента bas-dent (стоматология, Алматы). Эти клипы — raw input для video-director:

Veo clip #1 — стоматология lifestyle
Veo clip #2 — клиника interior
Veo clip #3 — врач-пациент

📱 Phone-camera клипы (video-analyzer)

Собственные клипы клиента с телефона. Прошли через video-analyzer — extracted frames + Vision-описание + автоклассификация (scene_type, mood), теперь часть clip library:

Phone clip A — клиника, iPhone
Phone clip B — врач у кресла

🎙️ Voiceover (video-voiceover)

Два примера озвучки от ElevenLabs (model eleven_multilingual_v2). Первый — raw output, второй — после audio_process.py postprocessing chain (silence-removal + EQ + leveler + loudnorm -16 LUFS):

Voiceover #1 — Performante AI Agency промо (русский)
Voiceover #2 (post-processed) — Performante AI Agency, после audio_process

🎵 Background music (video-director)

Один из треков из проектной music-library (используется director'ом с music-ducking 0.20 под voiceover):

bg_track_01 — типичный uplifting corporate (apparatus/music/)

🎞️ Финальные voiceover-видео (video-orchestrator → video-captions)

Полный pipeline output клиента bas-dent: copywriter → voiceover → director → captions. С karaoke-субтитрами поверх:

Имплантация — expert · voiceover + music + karaoke captions · ~30 сек
Гнатология — track2 · voiceover + music (повышенный громкости) + captions

📺 Финальные textover-видео (video-orchestrator → video-remotion)

Тот же pipeline но без озвучки — только клипы + музыка + анимированный текст-overlay через Remotion TextoverAd preset. Длина фикс. 15 сек. Apparatus T608/ETC5/T8 — 3 девайса:

T608 textover · 15s · Apparatus
ETC5 textover · 15s · Apparatus
T8 textover · 15s · Apparatus

Postеры для тех же кампаний (parallel static-track):

📸 Reference photos (creative-poster input)

Brand-references из apparatus/references/. Загружаются в Gemini через --reference X.jpg --reference-role hero, попадают в prompt SUBJECT как «use IMAGE A as the apparatus device»:

⚡ Higgsfield real renders (video-clipgen-higgsfield) LIVE · May 2026

Реальные генерации через оплаченный Higgsfield ultra plan (3010 → 2974 credits, потрачено $2.20). На одном и том же reference (apparatus ESWT T9 device) — три разных video-модели + Soul-image херо. Видно как меняется композиция/качество/стиль одного и того же объекта через разные backends:

Cinematic Studio Video V2 · slow orbit, premium studio · 5s · 3.3M · 7.5 credits ($0.47)
Google Veo 3.1 Lite · clinic + doctor lifestyle · ~5s · 2.0M · ~18 credits ($1.13)
Kling 3.0 · slow 360 orbit, glossy surface · 5s · 4.4M · ~10 credits ($0.63)

А вот hero-image через Soul V2 (text-to-image, конкурент Gemini 3 Pro Image / FLUX):

Авторизация настроена. CLI установлен в ~/.npm-global/bin/higgsfield (добавлен в PATH через ~/.zshrc). Доступно 36 моделей через одну авторизацию: Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Soul Cast, Cinematic Studio V2/V3, FLUX.2, Soul, Nano Banana Pro, GPT Image 2, Seedream V5 и др.
Команды:
higgsfield model list --video        # список video-моделей
higgsfield model list --image        # image-моделей
higgsfield generate create <model> --prompt "..." --image <file> --wait
higgsfield generate cost <model> --prompt "..."   # estimate credits
higgsfield account status            # баланс
BYOK (bring-your-own-key) у Higgsfield НЕТ. Все генерации списываются с HF credits на твоем плане. Если нужен прямой billing Google Cloud / OpenAI / Anthropic — для Veo есть наш video-clipgen (через GOOGLE_API_KEY напрямую). Цена примерно та же ($0.47-1.13/клип), но bills попадают к Google не к HF.

👤 Soul-ID custom avatar (anatoliy_stepanov) LIVE

Аватар Анатолия натренирован на 5 фото через higgsfield soul-id create --soul-2. Тренировка заняла 5 минут (25 credits = $1.56). После — каждая генерация в любой Soul-модели может использовать --custom_reference_id cacb64a4-... чтобы получить то же лицо в новой сцене.

Все 4 портрета — один и тот же человек в разных сценах/ракурсах/стилях. Лицо сгенерировано заново каждый раз (не вставка-копия), но узнаваемо то же самое:

Команда генерации:
higgsfield generate create text2image_soul_v2 \
  --prompt "..." \
  --custom_reference_id cacb64a4-7e89-4e49-8651-8babcca7916d \
  --aspect_ratio 3:4 \
  --wait
Стоимость:
  • Тренировка одна-разовая: 25 credits ($1.56) · 5-15 мин на GPU
  • Каждая генерация с аватаром: ~0.2-1 credit ($0.01-0.06) — как обычная Soul-генерация
  • Аватар reusable бесконечно: 100 future генераций = ~$5-10
Используй только в Soul-моделях. --custom_reference_id принимают: text2image_soul_v2, soul_cinematic, soul_location. НЕ работает в Veo / Kling / Wan / Cinematic Studio (там другие модели, нет fine-tuning hook'а).

🔄 Soul-ID v2 retrained — 17 photos, 6 production-ready scenes (9:16) LATEST

Соул-ID anatoliy_v2 (eb985ea0-d4e3-4828-9186-116567dae4f8) — переобученная модель на 17 фото (vs 5 в v1). Качество сходства лица значительно выше. Все 6 сцен в 9:16 production-ready aspect, готовы для Reels/Stories. 2-step pipeline: Soul image v2 (с avatar) → Cinematic Studio Video V2 image-to-video. ~$0.72 за video-аватар.

1. Founder office · за столом с MacBook · push-in к лицу · soft window light · 4.6M
2. Conference speaker · с микрофоном на сцене · dolly push-in · stage lights · 4.7M
3. Cafe phone · в кафе с телефоном · handheld UGC · golden hour · 4.3M
4. Walking downtown Almaty · steadicam follow · urban · late afternoon · 8.0M
5. Podcast studio · за микрофоном · side ambient light · headphones · 4.2M
6. Premium dark editorial · черная студия · gold rim light · magazine cover · 4.3M
Стоимость батча: 6 сцен × (Soul image ~$0.06 + Cinematic Studio V2 ~$0.47) = ~$3.20-4.32 total. Реально потрачено: ~69 credits ($4.32). Wall-clock: ~9 минут на все 6 (на M1/M2 Mac, paralleled).
Сравнение v1 vs v2:
v1 (anatoliy_stepanov)v2 (anatoliy_v2) ← used here
Тренировочных фото5 (минимум)17 (хорошее покрытие)
Сходство лицаOK (~70-80%)Высокое (~85-95%)
Soul-ID UUIDcacb64a4-7e89-4e49-8651-8babcca7916deb985ea0-d4e3-4828-9186-116567dae4f8
Стоимость тренировки$1.56 (one-time)$1.56 (one-time)
Старые v1 видеосм. Showcase → 🎬 Video-аватар (4 scenes, mixed aspects)
Production-ready use case: 6 видео в 9:16 готовы вставлять в Reels/Stories/TikTok-ad voiceover'ом сверху. Это и есть main use case Soul-ID — один раз обучил лицо за $1.56, потом за ~$0.50 каждое получаешь твоё лицо в любом сценарии за 1.5-2 минуты.

🎬 Video-аватар (2-step: Soul image → Cinematic Studio Video) LIVE

Аватар «anatoliy_stepanov» в движении — 4 видео из 4 уже сгенерированных Soul-портретов. Pipeline: Soul-ID image (с --avatar) → Cinematic Studio Video V2 (image-to-video) → 5-сек видео с тем же лицом. Лицо двигается, делает поворот головы, моргает естественно. Стоимость video-step: 7.5 credits ($0.47) каждое:

Business push-in · slow camera push-in to face · 3:4 · 4.7M · из 1_business_portrait.png
Casual coffee shot · candid lifestyle · 1:1 · 5.5M · из 2_casual_lifestyle.png
Cinematic side push · dramatic editorial · 16:9 · 4.1M · из 3_cinematic.png
Founder turn from screens · tech founder · 9:16 · 5.3M · из 4_founder_vibe.png
2-step pipeline для video-аватара:
# Step 1: photo с твоим лицом в нужной сцене (1-2 мин, ~$0.06)
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_image.sh \
  --prompt "<сцена>" \
  --avatar cacb64a4-7e89-4e49-8651-8babcca7916d \
  --aspect 9:16 \
  --output portrait.png

# Step 2: image → 5-сек video (1-2 мин, $0.47)
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \
  --prompt "<что делает лицо в кадре>" \
  --image portrait.png \
  --aspect 9:16
Итого: ~$0.53 за video-avatar в любой сцене, 3-5 мин wall-clock.
Это НЕ talking-head с lip-sync. Лицо двигается естественно (поворот головы, моргание, лёгкое выражение), но НЕ читает скрипт. Для talking-head — Marketing Studio Video с avatars+hooks (см. ниже).

🎙️ Marketing Studio talking-head avatars (14 preset)

Higgsfield предоставляет 14 preset video-talking-heads готовых к использованию в DTC ads workflow. Это аналог Synthesia/HeyGen — лицо читает любой текст с lip-sync. Используются через marketing_studio_video model + avatar UUID + MS hook (сценарий):

AvatarGenderUUID
Jaydenmale672be390-36ab-4d79-bb95-ff562a57c79c
Stefanmale35cd52c0-e92b-44b1-b56d-b4ea5e609c00
Felixmale83711427-335b-4b9c-b89a-b6fa78579b49
Malikmale94950cff-b90a-4416-8384-ce554ff387e1
Taemale6c21ac3e-1f76-4a35-91a6-60f334a0fafa
Mei / Yuna / Adriana / Clara / Maria / Sofia / Valentina / Jia / Lilyfemale (9 ср.)см. list.sh avatars или higgsfield marketing-studio avatars list
Custom MS avatar из 1 фото: higgsfield marketing-studio avatars create --name X --image <upload_id>. Это будет UGC-style talking-head с лицом клиента (Synthesia/HeyGen pattern), но используется ТОЛЬКО внутри Marketing Studio templates.
MS Video usage:
higgsfield generate create marketing_studio_video \
  --avatars '["672be390-36ab-4d79-bb95-ff562a57c79c"]' \
  --hook_id 3d45fb46-254f-4c83-9685-8e3d28945a67 \
  --duration 15 \
  --generate_audio true \
  --aspect_ratio 9:16
Производит talking-head video с lip-sync по pre-set hook (например «Product Hit» — продукт влетает в кадр, реакция, pivot to product).

📊 Типы аватаров в Higgsfield — итоговая таблица

Soul-ID (наш anatoliy)MS preset (Jayden и 13 др.)MS Custom avatar
ЧтоОбученная модель лицаГотовая talking-head модельTalking-head из 1 фото клиента
Что выдаётImage + image-to-video (2-step)Talking-head video с lip-syncTalking-head video с lip-sync
Сколько фото нужно5-20 (training)0 — готовые1 фото клиента
Setup time5-15 мин training0 — instant~1 мин
Setup cost25 credits ($1.56)$0$0
Per-generation cost~$0.06 image + $0.47 video = ~$0.53$0.94+ за 15s talking-head$0.94+ за 15s
Где работаетЛюбая Soul-модель + Cinematic Studio (через image)Только Marketing Studio videoТолько Marketing Studio video
Lip-sync озвучки❌ нет (только artistic motion)✅ да (через MS hook)✅ да (через MS hook)
Когда братьCinematic «лицо в сцене» для production-pipelineUGC-style ads с готовым «спикером бренда»Talking-head с лицом клиента для одной кампании

🖼️ Higgsfield Image Creatives (Product Photoshoot + DTC Ads) LIVE

Реальные image-генерации через 3 Higgsfield-системы для статичных креативов на reference apparatus ESWT T9. Без Soul-ID (это про продукт, не лицо):

Product Photoshoot — 10 mode-specific промптов

Backend сам собирает структурированный prompt под выбранный mode. Тестировали 3 mode'а из 10 доступных (всего есть: product_shot · lifestyle_scene · moodboard_pin · hero_banner · social_carousel · ad_creative_pack · virtual_model_tryout · conceptual_product · closeup_product_with_person · restyle):

Команда:
higgsfield product-photoshoot create \
  --mode lifestyle_scene \
  --aspect_ratio 1:1 \
  --prompt "T608 in modern Almaty physiotherapy clinic..." \
  --image ~/video-projects/apparatus/references/ref_eswt_t9.jpg \
  --count 2
Цена: ~3-5 credits / image ($0.20-0.30). 6 image обошлись в ~$1.81.
Gotchas:
  • Некоторые modes имеют свой default aspect_ratio который НЕ в стандартном списке (например lifestyle_scene упал без явного --aspect_ratio) — всегда передавай аспект.
  • in_use не существует — правильное имя closeup_product_with_person.
  • Не все mode имена очевидны — higgsfield product-photoshoot create --help покажет ошибку с правильным списком.

DTC Ads Engine — Stat Surround preset

Полный готовый постер с автогенерируемой композицией: продукт центрирован, 4 stat callouts с curved arrows к продукту, 5 gold stars, brand logo. Огромный hidden system-prompt в backend (instructions про contrast / texture / micro-story / camera unpredictability — каждый раз делает уникальный сценарий):

Команда:
higgsfield marketing-studio dtc-ads generate \
  --prompt "<твой brief>" \
  --format-id 1a4cf715-...stat-surround \
  --aspect-ratio 1:1 \
  --quality low --resolution 1k
Доступно 30+ формат-пресетов: Headline / Special Offer / Customer Quote / Star Review / Stat Surround / Magazine Style / Then vs Now / Behind the Product / и др. Полный список: higgsfield marketing-studio ad-formats list.
Известная проблема (не починили): DTC #2 «Then vs Now» (format-id ad65db31) не работает с нашим setup'ом — джоба запускается, но возвращает status=failed без подробностей. Tried: с/без brand-kit, с/без media, low/high quality. Скипнули. Возможно нужно сначала создать product через MS products и передать --product, или этот конкретный format требует специальных media inputs (до/после).

Brand-kit + Web-product auto-fetch

Под капотом для DTC ads:

КомандаЧто делаетStored
brand-kits fetch --url Парсит сайт клиента, вытаскивает colors / fonts / logo examples/web-fetch/brand_kit_apparatus.json
webproducts fetch --url Парсит product page, вытаскивает name / price / photos / description examples/web-fetch/web_product_t608.json
Workflow для нового клиента:
# 1. Auto-fetch brand-kit + product с их сайта (1 раз, $0.10)
higgsfield marketing-studio brand-kits fetch --url https://CLIENT.com --wait
higgsfield marketing-studio webproducts fetch --url https://CLIENT.com/product --wait

# 2. Generate batch postеров с auto-branding ($0.20-0.50 каждый)
higgsfield marketing-studio dtc-ads generate \
  --prompt "..." --format-id <preset> \
  --brand-kit-id <id> --product <id>

🎤 Lip-sync через Sync.so API LIVE · May 2026

Talking-head video с lip-sync — взяли готовый Soul-аватар video (тот что зашёл — founder_office) + ElevenLabs voiceover ("низкий Анатолий") → Sync.so lipsync-2-pro → видео где лицо в кадре синхронизируется с новым audio. Цена: $0.18 (free trial 3 gen/мес). Wall-clock: 25 секунд.

Use case Performante: «Заменим вашего таргетолога на ИИ и приведем в 2 раза больше заявок при том же бюджете» — питч-хук для DTC/B2B. Tе же кадры, любой новый сценарий за 30 сек и копейки. Можно генерить десятки версий под разные ниши клиентов.

Pipeline 3-step

Step 1: Soul-ID v2 image → Cinematic Studio Video V2video-аватар (тот что нравится, founder_office)

Step 2: ElevenLabs TTS «низкий Анатолий» voice → voiceover.mp3

Step 3: video + audio → Sync.so lipsync-2-protalking-head с lip-sync

Input → Output

INPUT video · founder_office (Cinematic Studio V2, 5s) · 4.6M · без lip-sync
OUTPUT · lipsync-2-pro · 9:16 · 3.4M · говорит «Заменим вашего таргетолога на ИИ...» ✅ зашёл, in DB #207

INPUT audio (ElevenLabs «низкий Анатолий»)

hook_replace_targetolog.mp3 · 3.76 сек · ElevenLabs eleven_multilingual_v2 · voice_id FI50SWkk09X7AAhLwclD (клон Анатолия в perform аккаунте)

Команда (одной строкой)

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_lipsync_sync.sh \
  --video ~/Desktop/video-pipeline-kb/examples/video-avatar-v2/1_founder_office.mp4 \
  --audio ~/Desktop/video-pipeline-kb/examples/voiceover-lipsync/hook_replace_targetolog.mp3 \
  --model lipsync-2-pro

# → multipart POST к api.sync.so/v2/generate
# → poll каждые 5 сек (обычно 20-30 сек total)
# → download mp4 через x-api-key header

Sync.so models

ModelQualityЦена / genMax длина
sync-3★★★★★ best$1+ (free trial: 1/мес)15s
lipsync-2-proUSED★★★★ premium$0.50 (реально $0.18 на нашу)20s
lipsync-2★★★ fast/cheap$0.20-0.4020s
react-1prompt-guided emotion$0.5015s
lipsync-1.9.0-betalegacy, max speed$0.2020s
Why Sync.so over Higgsfield Cloud Speak: Higgsfield's /higgsfield-ai/speak endpoint падает на HTTP 500 даже с credits (мы перепробовали разные image/audio combinations и payload schemas). Sync.so работает с первой попытки + поддерживает direct multipart upload (нет нужды в public file host). Подробно: video-clipgen-higgsfield → Sync.so section.
Дальше можно:
  • Сгенерить lipsync для остальных Soul-аватаров (podcast_studio / premium_dark) под разные питчи
  • Auto-pipeline: video-copywriter → ElevenLabs → Sync.so → director (5-step batch)
  • Sync.so поддерживает MP4/MOV/WebM/AVI до 20MB на видео — наши Cinematic Studio outputs все попадают

🚧 Coming soon (нет real outputs)

Эти скиллы созданы недавно или не были задействованы в Apparatus/bas-dent — у нас нет реальных примеров. Сгенерим когда понадобится:

СкиллЧто показатьСтоимость генерации example
creative-explainer-video3-мин туториал «как установить T608» с ElevenLabs VO + scene-based timeline~$0.55
video-screencastДо/после dedupe-cleanup (raw → clean cut)$0 (own recording)
video-motionfxAnimated chart / data-viz clip / 3D showcase$0 (local)
video-reviewerJSON-отчёт qa-review с issues + fixes$0.001 (Gemini Vision)

Скажи — какие хочешь сгенерим и положим сюда?

🎯 Hook overlay presets (15 шт, video-captions)

15 hook-overlay пресетов из ~/.claude/skills/video-captions/templates_src/components/hook-presets/. Каждый — стиль анимации hook-текста (первые 2-3 сек видео) который Captions skill накладывает поверх клипов. Превью все на одном тексте «Запусти за 30 дней» с одним gradient backdrop'ом — видно как сильно меняется ощущение:

stencil · trafaret typography
neon · светящийся текст с glow
glitch · cyberpunk distortion
cyber · matrix-style typing
3d-pop · 3D «выпрыгивающий» текст
scale-pop · monochrome scale animation (для talking-head)
marker · рукописный маркер-эффект
highlight-marker · текст с подсветкой как highlighter
karaoke-row · word-by-word подсветка
typewriter · посимвольная печать
chip-bg · текст в chip-капсулах
gradient · gradient-fill text
bold-statement · крупный bold-сplash
editorial · serif-magazine типографика
minimal · helvetica clean fade
Каждый hook ~3-5s · 1080×1920 · ~200-400KB. Все на gradient backdrop'е. На реальном видео hook накладывается ПОВЕРХ клипа из clip library — backdrop тут только для preview. Подробнее: video-captions.

⚛️ Remotion templates (video-remotion)

5 локально-рендеренных Remotion-template'ов из ~/.claude/skills/video-remotion. Всё рендерится через npx remotion render, $0, ~30-60s каждый. Используется для intro-cards, CTA, lower-third подписей, kinetic typography и анимированных charts:

IntroCard · animated title card · 3s · 228K
CtaCard · call-to-action end card · 4s · 400K
LowerThird · name/title strip · 4s · 294K
KineticText · phrase-by-phrase typography · 8s · 563K
DataChart · animated counter «127 клиник» · 5s · 305K
TextoverAd · full 15s textover-ad preset «big-shake» — главная композиция для textover-роликов · 990K
NB: render.py wrapper в скилле сейчас глючит (передаёт --codec h264 что новый Remotion CLI не принимает). Эти ролики сделаны прямым вызовом npx remotion render src/index.ts <Composition> out.mp4 --props .... Фикс в render.py = убрать --codec h264 когда output это .mp4.

🎨 16 aesthetic-пресетов creative-poster REAL RENDERS

Реальные рендеры всех 16 пресетов на самой дешёвой Gemini-модели (gemini-2.5-flash-image, $0.02/рендер, итого $0.32). Один и тот же оффер «Запуск за 30 дней / ROI проверен / Окупится за 90 дней» через 16 разных эстетик.

Также есть CSS-mockups для каждого пресета — показывают стилевую идею без real-renders. Подробное описание каждого пресета (typography, palette, layout hints, avoid-list) — там же.

Превью всех 16 пресетов смотри на странице справочник → 16 aesthetic-пресетов — там CSS-мокапы typography + color palette + layout-sketch для каждого пресета. Real-renders по любому пресету можно догенерить (~$0.04 каждый, $0.64 за все 16).