Showcase — реальные работы
Подборка реальных артефактов которые этот пайплайн уже сгенерировал. Все примеры — из production-runs Performante (apparatus, bas-dent, performante-ai-agency). Каждая секция показывает что выдаёт конкретный скилл — не схема в HTML, а реальный MP4/PNG/MP3 файл.
examples/ (~152MB). Работает офлайн без интернета. Размер ZIP-архива базы знаний с примерами ≈ 110-130MB.
📸 Постеры (creative-poster + creative-orchestrator)
9 финальных постеров для клиента Apparatus KZ (B2B Kazakh медтехника). Сгенерированы через creative-poster (Gemini 3 Pro Image), brand-injection из apparatus/brand.yaml, multi-aspect outpainted из 4:5 в 9:16. Аппараты: T608, ETC5, T8.
qa_review.py с Vision LLM.
🎠 Карусель Instagram (creative-carousel)
Реальная карусель про T608 — Запусти УВТ-кабинет за 30 дней. 7 слайдов, template = product_launch, рендер через Remotion (TSX), $0 на slides. Свайпни горизонтально:
Open the carousel preview HTML с payload-сайдбаром (GR-1): preview_carousel_t608.html
🎬 Veo 3.1 клипы (video-clipgen)
3 примера сырого материала сгенерированного Veo 3.1 по brief'у клиента bas-dent (стоматология, Алматы). Эти клипы — raw input для video-director:
📱 Phone-camera клипы (video-analyzer)
Собственные клипы клиента с телефона. Прошли через video-analyzer — extracted frames + Vision-описание + автоклассификация (scene_type, mood), теперь часть clip library:
🎙️ Voiceover (video-voiceover)
Два примера озвучки от ElevenLabs (model eleven_multilingual_v2). Первый — raw output, второй — после audio_process.py postprocessing chain (silence-removal + EQ + leveler + loudnorm -16 LUFS):
🎵 Background music (video-director)
Один из треков из проектной music-library (используется director'ом с music-ducking 0.20 под voiceover):
🎞️ Финальные voiceover-видео (video-orchestrator → video-captions)
Полный pipeline output клиента bas-dent: copywriter → voiceover → director → captions. С karaoke-субтитрами поверх:
📺 Финальные textover-видео (video-orchestrator → video-remotion)
Тот же pipeline но без озвучки — только клипы + музыка + анимированный текст-overlay через Remotion TextoverAd preset. Длина фикс. 15 сек. Apparatus T608/ETC5/T8 — 3 девайса:
Postеры для тех же кампаний (parallel static-track):
📸 Reference photos (creative-poster input)
Brand-references из apparatus/references/. Загружаются в Gemini через --reference X.jpg --reference-role hero, попадают в prompt SUBJECT как «use IMAGE A as the apparatus device»:



⚡ Higgsfield real renders (video-clipgen-higgsfield) LIVE · May 2026
Реальные генерации через оплаченный Higgsfield ultra plan (3010 → 2974 credits, потрачено $2.20). На одном и том же reference (apparatus ESWT T9 device) — три разных video-модели + Soul-image херо. Видно как меняется композиция/качество/стиль одного и того же объекта через разные backends:
А вот hero-image через Soul V2 (text-to-image, конкурент Gemini 3 Pro Image / FLUX):
~/.npm-global/bin/higgsfield (добавлен в PATH через ~/.zshrc). Доступно 36 моделей через одну авторизацию: Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Soul Cast, Cinematic Studio V2/V3, FLUX.2, Soul, Nano Banana Pro, GPT Image 2, Seedream V5 и др.
higgsfield model list --video # список video-моделей higgsfield model list --image # image-моделей higgsfield generate create <model> --prompt "..." --image <file> --wait higgsfield generate cost <model> --prompt "..." # estimate credits higgsfield account status # баланс
👤 Soul-ID custom avatar (anatoliy_stepanov) LIVE
Аватар Анатолия натренирован на 5 фото через higgsfield soul-id create --soul-2. Тренировка заняла 5 минут (25 credits = $1.56). После — каждая генерация в любой Soul-модели может использовать --custom_reference_id cacb64a4-... чтобы получить то же лицо в новой сцене.
Все 4 портрета — один и тот же человек в разных сценах/ракурсах/стилях. Лицо сгенерировано заново каждый раз (не вставка-копия), но узнаваемо то же самое:
higgsfield generate create text2image_soul_v2 \ --prompt "..." \ --custom_reference_id cacb64a4-7e89-4e49-8651-8babcca7916d \ --aspect_ratio 3:4 \ --wait
- Тренировка одна-разовая: 25 credits ($1.56) · 5-15 мин на GPU
- Каждая генерация с аватаром: ~0.2-1 credit ($0.01-0.06) — как обычная Soul-генерация
- Аватар reusable бесконечно: 100 future генераций = ~$5-10
--custom_reference_id принимают: text2image_soul_v2, soul_cinematic, soul_location. НЕ работает в Veo / Kling / Wan / Cinematic Studio (там другие модели, нет fine-tuning hook'а).
🔄 Soul-ID v2 retrained — 17 photos, 6 production-ready scenes (9:16) LATEST
Соул-ID anatoliy_v2 (eb985ea0-d4e3-4828-9186-116567dae4f8) — переобученная модель на 17 фото (vs 5 в v1). Качество сходства лица значительно выше. Все 6 сцен в 9:16 production-ready aspect, готовы для Reels/Stories. 2-step pipeline: Soul image v2 (с avatar) → Cinematic Studio Video V2 image-to-video. ~$0.72 за video-аватар.
| v1 (anatoliy_stepanov) | v2 (anatoliy_v2) ← used here | |
|---|---|---|
| Тренировочных фото | 5 (минимум) | 17 (хорошее покрытие) |
| Сходство лица | OK (~70-80%) | Высокое (~85-95%) |
| Soul-ID UUID | cacb64a4-7e89-4e49-8651-8babcca7916d | eb985ea0-d4e3-4828-9186-116567dae4f8 |
| Стоимость тренировки | $1.56 (one-time) | $1.56 (one-time) |
| Старые v1 видео | см. Showcase → 🎬 Video-аватар (4 scenes, mixed aspects) | — |
🎬 Video-аватар (2-step: Soul image → Cinematic Studio Video) LIVE
Аватар «anatoliy_stepanov» в движении — 4 видео из 4 уже сгенерированных Soul-портретов. Pipeline: Soul-ID image (с --avatar) → Cinematic Studio Video V2 (image-to-video) → 5-сек видео с тем же лицом. Лицо двигается, делает поворот головы, моргает естественно. Стоимость video-step: 7.5 credits ($0.47) каждое:
# Step 1: photo с твоим лицом в нужной сцене (1-2 мин, ~$0.06) ~/.claude/skills/video-clipgen-higgsfield/scripts/gen_image.sh \ --prompt "<сцена>" \ --avatar cacb64a4-7e89-4e49-8651-8babcca7916d \ --aspect 9:16 \ --output portrait.png # Step 2: image → 5-сек video (1-2 мин, $0.47) ~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \ --prompt "<что делает лицо в кадре>" \ --image portrait.png \ --aspect 9:16Итого: ~$0.53 за video-avatar в любой сцене, 3-5 мин wall-clock.
🎙️ Marketing Studio talking-head avatars (14 preset)
Higgsfield предоставляет 14 preset video-talking-heads готовых к использованию в DTC ads workflow. Это аналог Synthesia/HeyGen — лицо читает любой текст с lip-sync. Используются через marketing_studio_video model + avatar UUID + MS hook (сценарий):
| Avatar | Gender | UUID |
|---|---|---|
| Jayden | male | 672be390-36ab-4d79-bb95-ff562a57c79c |
| Stefan | male | 35cd52c0-e92b-44b1-b56d-b4ea5e609c00 |
| Felix | male | 83711427-335b-4b9c-b89a-b6fa78579b49 |
| Malik | male | 94950cff-b90a-4416-8384-ce554ff387e1 |
| Tae | male | 6c21ac3e-1f76-4a35-91a6-60f334a0fafa |
| Mei / Yuna / Adriana / Clara / Maria / Sofia / Valentina / Jia / Lily | female (9 ср.) | см. list.sh avatars или higgsfield marketing-studio avatars list |
higgsfield marketing-studio avatars create --name X --image <upload_id>. Это будет UGC-style talking-head с лицом клиента (Synthesia/HeyGen pattern), но используется ТОЛЬКО внутри Marketing Studio templates.
higgsfield generate create marketing_studio_video \ --avatars '["672be390-36ab-4d79-bb95-ff562a57c79c"]' \ --hook_id 3d45fb46-254f-4c83-9685-8e3d28945a67 \ --duration 15 \ --generate_audio true \ --aspect_ratio 9:16Производит talking-head video с lip-sync по pre-set hook (например «Product Hit» — продукт влетает в кадр, реакция, pivot to product).
📊 Типы аватаров в Higgsfield — итоговая таблица
| Soul-ID (наш anatoliy) | MS preset (Jayden и 13 др.) | MS Custom avatar | |
|---|---|---|---|
| Что | Обученная модель лица | Готовая talking-head модель | Talking-head из 1 фото клиента |
| Что выдаёт | Image + image-to-video (2-step) | Talking-head video с lip-sync | Talking-head video с lip-sync |
| Сколько фото нужно | 5-20 (training) | 0 — готовые | 1 фото клиента |
| Setup time | 5-15 мин training | 0 — instant | ~1 мин |
| Setup cost | 25 credits ($1.56) | $0 | $0 |
| Per-generation cost | ~$0.06 image + $0.47 video = ~$0.53 | $0.94+ за 15s talking-head | $0.94+ за 15s |
| Где работает | Любая Soul-модель + Cinematic Studio (через image) | Только Marketing Studio video | Только Marketing Studio video |
| Lip-sync озвучки | ❌ нет (только artistic motion) | ✅ да (через MS hook) | ✅ да (через MS hook) |
| Когда брать | Cinematic «лицо в сцене» для production-pipeline | UGC-style ads с готовым «спикером бренда» | Talking-head с лицом клиента для одной кампании |
🖼️ Higgsfield Image Creatives (Product Photoshoot + DTC Ads) LIVE
Реальные image-генерации через 3 Higgsfield-системы для статичных креативов на reference apparatus ESWT T9. Без Soul-ID (это про продукт, не лицо):
Product Photoshoot — 10 mode-specific промптов
Backend сам собирает структурированный prompt под выбранный mode. Тестировали 3 mode'а из 10 доступных (всего есть: product_shot · lifestyle_scene · moodboard_pin · hero_banner · social_carousel · ad_creative_pack · virtual_model_tryout · conceptual_product · closeup_product_with_person · restyle):
higgsfield product-photoshoot create \ --mode lifestyle_scene \ --aspect_ratio 1:1 \ --prompt "T608 in modern Almaty physiotherapy clinic..." \ --image ~/video-projects/apparatus/references/ref_eswt_t9.jpg \ --count 2Цена: ~3-5 credits / image ($0.20-0.30). 6 image обошлись в ~$1.81.
- Некоторые modes имеют свой default aspect_ratio который НЕ в стандартном списке (например
lifestyle_sceneупал без явного--aspect_ratio) — всегда передавай аспект. in_useне существует — правильное имяcloseup_product_with_person.- Не все mode имена очевидны —
higgsfield product-photoshoot create --helpпокажет ошибку с правильным списком.
DTC Ads Engine — Stat Surround preset
Полный готовый постер с автогенерируемой композицией: продукт центрирован, 4 stat callouts с curved arrows к продукту, 5 gold stars, brand logo. Огромный hidden system-prompt в backend (instructions про contrast / texture / micro-story / camera unpredictability — каждый раз делает уникальный сценарий):
higgsfield marketing-studio dtc-ads generate \ --prompt "<твой brief>" \ --format-id 1a4cf715-...stat-surround \ --aspect-ratio 1:1 \ --quality low --resolution 1kДоступно 30+ формат-пресетов: Headline / Special Offer / Customer Quote / Star Review / Stat Surround / Magazine Style / Then vs Now / Behind the Product / и др. Полный список:
higgsfield marketing-studio ad-formats list.
format-id ad65db31) не работает с нашим setup'ом — джоба запускается, но возвращает status=failed без подробностей. Tried: с/без brand-kit, с/без media, low/high quality. Скипнули. Возможно нужно сначала создать product через MS products и передать --product, или этот конкретный format требует специальных media inputs (до/после).
Brand-kit + Web-product auto-fetch
Под капотом для DTC ads:
| Команда | Что делает | Stored |
|---|---|---|
brand-kits fetch --url |
Парсит сайт клиента, вытаскивает colors / fonts / logo | examples/web-fetch/brand_kit_apparatus.json |
webproducts fetch --url |
Парсит product page, вытаскивает name / price / photos / description | examples/web-fetch/web_product_t608.json |
# 1. Auto-fetch brand-kit + product с их сайта (1 раз, $0.10) higgsfield marketing-studio brand-kits fetch --url https://CLIENT.com --wait higgsfield marketing-studio webproducts fetch --url https://CLIENT.com/product --wait # 2. Generate batch postеров с auto-branding ($0.20-0.50 каждый) higgsfield marketing-studio dtc-ads generate \ --prompt "..." --format-id <preset> \ --brand-kit-id <id> --product <id>
🎤 Lip-sync через Sync.so API LIVE · May 2026
Talking-head video с lip-sync — взяли готовый Soul-аватар video (тот что зашёл — founder_office) + ElevenLabs voiceover ("низкий Анатолий") → Sync.so lipsync-2-pro → видео где лицо в кадре синхронизируется с новым audio. Цена: $0.18 (free trial 3 gen/мес). Wall-clock: 25 секунд.
Pipeline 3-step
Step 2: ElevenLabs TTS «низкий Анатолий» voice → voiceover.mp3
Step 3: video + audio → Sync.so lipsync-2-pro → talking-head с lip-sync
Input → Output
INPUT audio (ElevenLabs «низкий Анатолий»)
FI50SWkk09X7AAhLwclD (клон Анатолия в perform аккаунте)Команда (одной строкой)
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_lipsync_sync.sh \ --video ~/Desktop/video-pipeline-kb/examples/video-avatar-v2/1_founder_office.mp4 \ --audio ~/Desktop/video-pipeline-kb/examples/voiceover-lipsync/hook_replace_targetolog.mp3 \ --model lipsync-2-pro # → multipart POST к api.sync.so/v2/generate # → poll каждые 5 сек (обычно 20-30 сек total) # → download mp4 через x-api-key header
Sync.so models
| Model | Quality | Цена / gen | Max длина |
|---|---|---|---|
sync-3 | ★★★★★ best | $1+ (free trial: 1/мес) | 15s |
lipsync-2-pro ← USED | ★★★★ premium | $0.50 (реально $0.18 на нашу) | 20s |
lipsync-2 | ★★★ fast/cheap | $0.20-0.40 | 20s |
react-1 | prompt-guided emotion | $0.50 | 15s |
lipsync-1.9.0-beta | legacy, max speed | $0.20 | 20s |
/higgsfield-ai/speak endpoint падает на HTTP 500 даже с credits (мы перепробовали разные image/audio combinations и payload schemas). Sync.so работает с первой попытки + поддерживает direct multipart upload (нет нужды в public file host). Подробно: video-clipgen-higgsfield → Sync.so section.
- Сгенерить lipsync для остальных Soul-аватаров (podcast_studio / premium_dark) под разные питчи
- Auto-pipeline: video-copywriter → ElevenLabs → Sync.so → director (5-step batch)
- Sync.so поддерживает MP4/MOV/WebM/AVI до 20MB на видео — наши Cinematic Studio outputs все попадают
🚧 Coming soon (нет real outputs)
Эти скиллы созданы недавно или не были задействованы в Apparatus/bas-dent — у нас нет реальных примеров. Сгенерим когда понадобится:
| Скилл | Что показать | Стоимость генерации example |
|---|---|---|
| creative-explainer-video | 3-мин туториал «как установить T608» с ElevenLabs VO + scene-based timeline | ~$0.55 |
| video-screencast | До/после dedupe-cleanup (raw → clean cut) | $0 (own recording) |
| video-motionfx | Animated chart / data-viz clip / 3D showcase | $0 (local) |
| video-reviewer | JSON-отчёт qa-review с issues + fixes | $0.001 (Gemini Vision) |
Скажи — какие хочешь сгенерим и положим сюда?
🎯 Hook overlay presets (15 шт, video-captions)
15 hook-overlay пресетов из ~/.claude/skills/video-captions/templates_src/components/hook-presets/. Каждый — стиль анимации hook-текста (первые 2-3 сек видео) который Captions skill накладывает поверх клипов. Превью все на одном тексте «Запусти за 30 дней» с одним gradient backdrop'ом — видно как сильно меняется ощущение:
⚛️ Remotion templates (video-remotion)
5 локально-рендеренных Remotion-template'ов из ~/.claude/skills/video-remotion. Всё рендерится через npx remotion render, $0, ~30-60s каждый. Используется для intro-cards, CTA, lower-third подписей, kinetic typography и анимированных charts:
--codec h264 что новый Remotion CLI не принимает). Эти ролики сделаны прямым вызовом npx remotion render src/index.ts <Composition> out.mp4 --props .... Фикс в render.py = убрать --codec h264 когда output это .mp4.
🎨 16 aesthetic-пресетов creative-poster REAL RENDERS
Реальные рендеры всех 16 пресетов на самой дешёвой Gemini-модели (gemini-2.5-flash-image, $0.02/рендер, итого $0.32). Один и тот же оффер «Запуск за 30 дней / ROI проверен / Окупится за 90 дней» через 16 разных эстетик.
















Также есть CSS-mockups для каждого пресета — показывают стилевую идею без real-renders. Подробное описание каждого пресета (typography, palette, layout hints, avoid-list) — там же.
Превью всех 16 пресетов смотри на странице справочник → 16 aesthetic-пресетов — там CSS-мокапы typography + color palette + layout-sketch для каждого пресета. Real-renders по любому пресету можно догенерить (~$0.04 каждый, $0.64 за все 16).






