Skill #5+ · Higgsfield AI backend (36 models)

video-clipgen-higgsfield

Доступ к 36 моделям через одну авторизацию: Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Cinematic Studio V2/V3, Soul Cast, Soul V2, FLUX.2, Nano Banana Pro, GPT Image 2, Seedream V5 и др. + Soul-ID custom avatar training для face-consistency. CLI установлен, авторизация настроена, аватар «anatoliy_stepanov» уже натренирован.

Путь

~/.claude/skills/video-clipgen-higgsfield/

CLI

~/.npm-global/bin/higgsfield v0.1.40

Auth

OAuth token (через higgsfield auth login)

ultra plan · ~3010 credits/мес

🎬 Примеры работы

Открой Showcase → ⚡ Higgsfield real renders — 3 video (Cinematic Studio V2 / Veo 3.1 / Kling 3.0) на одном reference apparatus ESWT T9.

И Showcase → 👤 Soul-ID avatar — обученный Soul-ID «anatoliy_stepanov» (5 фото → 5 мин тренировки, $1.56), плюс 4 demo-генерации того же лица в 4 разных сценах.

А также Showcase → 🎬 Video-аватар — тот же anatoliy_stepanov В ДВИЖЕНИИ: 4 видео через 2-step pipeline (Soul image-with-avatar → Cinematic Studio Video V2). Стоимость одного video-avatar: ~$0.53.

Marketing Studio video-avatars — 14 готовых talking-head моделей (Jayden, Stefan, Mei...) для lip-sync DTC-ads. Подробно: Showcase → 🎙️ MS talking-head avatars.

Что делает простыми словами

Это второй backend для генерации видео и изображений, в дополнение к video-clipgen (прямой Veo через Google Cloud). Higgsfield агрегирует 36 моделей под одной авторизацией и добавляет фичи которых нет у конкурентов:

Soul-ID custom avatars — тренируешь лицо на 5-20 фото за 5-15 мин, потом генерируешь то же лицо в любой новой сцене сколько угодно раз (~$0.06 за генерацию)
Cinematic Studio — 80+ named camera-presets (dolly_zoom / vertigo / orbit / FPV / arc / crane). Veo камеру не контролирует.
36 моделей через одну auth — Veo, Kling, Wan, Seedance, Sora, Cinematic Studio, Soul Cast, FLUX, Nano Banana Pro, GPT Image 2, Seedream...
Image-to-video из статичных brand-ассетов — лучший в классе через Cinematic Studio V2
Marketing Studio workflows — DTC ad templates с готовыми pre-set'ами

Пишет в ту же clips table что и video-clipgen — Director использует обе модели прозрачно.

Bash-обёртки (recommended)

4 ready-made скрипта в ~/.claude/skills/video-clipgen-higgsfield/scripts/:

Скрипт	Что делает	Пример
`train_avatar.sh`	Upload фото + создание Soul-ID + ожидание	`./train_avatar.sh anatoliy face1.jpg face2.jpg ... face5.jpg`
`gen_image.sh`	Image generation (Soul / FLUX / Nano Banana...)	`./gen_image.sh --prompt "..." --avatar <id> --aspect 3:4`
`gen_video.sh`	Video clip (Cinematic Studio / Veo / Kling / Wan...)	`./gen_video.sh --prompt "..." --image file.jpg --model cinematic_studio_video_v2`
`list.sh`	Inventory (avatars / models / jobs / balance)	`./list.sh balance` · `./list.sh avatars`

Полные примеры команд

Тренировка нового аватара

~/.claude/skills/video-clipgen-higgsfield/scripts/train_avatar.sh \
  doctor_basdent \
  ~/Downloads/doctor_01.jpg \
  ~/Downloads/doctor_02.jpg \
  ~/Downloads/doctor_03.jpg \
  ~/Downloads/doctor_04.jpg \
  ~/Downloads/doctor_05.jpg

# → uploads 5 фото → создаёт Soul-ID → polls 5-15 мин → сохраняет в avatars.txt
# Cost: 25 credits ($1.56)

Image с уже обученным аватаром

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_image.sh \
  --prompt "Confident young businessman in modern Almaty office, soft window light, premium suit" \
  --avatar cacb64a4-7e89-4e49-8651-8babcca7916d \
  --aspect 3:4 \
  --output ~/Desktop/portrait.png

# → 1-2 мин, ~$0.06

Cinematic video с product reference

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \
  --prompt "Slow cinematic orbit around medical device, premium studio lighting" \
  --image ~/video-projects/apparatus/references/ref_eswt_t9.jpg \
  --aspect 16:9

# → Cinematic Studio V2 (default), 5s, ~$0.47

Veo 3.1 без image

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \
  --model veo3_1_lite \
  --prompt "Professional clinic, doctor holding shockwave therapy device, soft natural light"

# → Veo 3.1 Lite через HF credits (~$1.13), вместо Google Cloud billing

Зарегистрированные аватары

Date	Name	Soul-ID	Type
2026-05-17	`anatoliy_stepanov`	`cacb64a4-7e89-4e49-8651-8babcca7916d`	soul_2

Реестр в ~/.claude/skills/video-clipgen-higgsfield/avatars.txt (auto-обновляется через train_avatar.sh). Списать: list.sh avatars.

36 моделей cheat-sheet

Video (16)

Model ID	Что	Best for	~Cost
`cinematic_studio_video_v2`	DoP successor, 5s image-to-video	Default — premium product orbit/push-in	7.5cr ($0.47)
`cinematic_studio_3_0`	Newest Cinematic Studio	Premium hero shots	~15cr ($0.94)
`veo3_1_lite`	Google Veo 3.1 Lite	Generic Veo-style content	~18cr ($1.13)
`veo3_1`	Veo 3.1 full	Premium Veo content	~25cr ($1.56)
`kling3_0`	Kling v3.0	Product orbits, smooth motion	~10cr ($0.63)
`wan2_7`	Wan 2.7 (best physics)	Realistic motion, complex physics	~12cr
`seedance_2_0`	Seedance 2.0 Bytedance	Good motion variety	~10cr
`soul_cast`	Soul Cast character video	Talking head с Soul-ID	~15cr
`minimax_hailuo`	Minimax Hailuo	Asian-style scenes	~8cr
+ grok_video, marketing_studio_video, kling2_6, wan2_6, seedance1_5, veo3, cinematic_studio_video	—	см. `list.sh models`	—

Image (20)

Model ID	Что	Best for	~Cost
`text2image_soul_v2`	Higgsfield Soul V2	Photoreal portraits (supports --avatar)	~3cr ($0.19)
`soul_cinematic`	Soul Cinematic	Editorial portraits (supports --avatar)	~3cr
`soul_location`	Soul Location	Environment-focused (supports --avatar)	~3cr
`flux_2`	FLUX.2	General-purpose	~2cr
`nano_banana_2`	Google Nano Banana Pro	Premium photoreal	~4cr
`gpt_image_2`	OpenAI GPT Image 2	OpenAI quality	~5cr
`seedream_v5_lite`	Seedream V5 Lite	Latest Seedream	~3cr
+ flux_kontext, nano_banana, nano_banana_flash, imagegen_2_0, seedream_v4_5, grok_image, openai_hazel, kling_omni_image, z_image, cinematic_studio_2_5, ms_image, marketing_studio_image, image_auto	—	см. `list.sh models`	—

Soul-ID flow

5-20 фото лица
↓
train_avatar.sh → upload + create Soul-ID
↓
~5-15 мин training (25 credits)
↓
avatars.txt registry с saved soul_id
↓
gen_image.sh --avatar <id> --prompt "..."
↓
Photoreal generation в новой сцене с тем же лицом (~$0.06/штука, reusable forever)

Совместимые модели (принимают --avatar / custom_reference_id):

text2image_soul_v2
soul_cinematic
soul_location

НЕ совместимые: Veo, Kling, Wan, Cinematic Studio, FLUX, Nano Banana, Seedance (у них нет hook'а для fine-tuning).

Cost reference (реальные данные)

Operation	Credits	$
Soul-ID training (one-time per face)	25	$1.56
Soul V2 image (с/без avatar)	0.2-3	$0.01-0.19
Cinematic Studio video V2 (5s)	7.5	$0.47
Veo 3.1 Lite (5-10s)	~18	$1.13
Kling 3.0 (5s)	~10	$0.63
Wan 2.7 (5s)	~12	$0.75
Seedance 2.0 (5s)	~10	$0.63
Soul Cast video (5s)	~15	$0.94
Hook + product pipeline (Soul image + Cinematic Studio)	~10	~$0.65
Character series (train + 5 portraits + 3 videos)	~70	~$4.40

Setup (one-time)

# Configure npm prefix без sudo
npm config set prefix ~/.npm-global
npm install -g @higgsfield/cli

# Add to PATH (persist в ~/.zshrc)
export PATH="$HOME/.npm-global/bin:$PATH"

# Auth (открывает браузер для OAuth)
higgsfield auth login

# Verify
higgsfield account status
higgsfield model list --video
higgsfield model list --image

Python SDK путь (secondary)

Если нужна интеграция с нашей clips table (чтобы video-director подхватывал клипы как обычные), есть Python-обёртки:

# pip install higgsfield-client  (если ещё не стоит)
python3 ~/.claude/skills/video-clipgen-higgsfield/scripts/higgsfield_generate.py video \
  --project-dir ~/video-projects/apparatus \
  --image references/ref_eswt_t9.jpg \
  --prompt "..." \
  --camera-preset orbit_slow

# → пишет в clips table + project_clips junction

Альтернатива bash-обёрткам (которые сохраняют в Desktop без DB). Выбирай по use case:

Bash — ad-hoc генерация для preview / клиенту
Python (с --project-dir) — для production pipeline (Director подхватит автоматически)

Veo через Higgsfield vs Veo напрямую

Путь	Чей биллинг	Когда брать
`higgsfield generate create veo3_1`	HF credits (твой ultra plan)	Один auth для 36 моделей, не нужно отдельно настраивать Google Cloud
video-clipgen (Veo напрямую)	Google Cloud (твоя карта)	Direct billing transparency, интеграция с clips table, чуть дешевле

Цена примерно одинаковая (~$0.50-1.50/клип). Если уже в HF ultra-plan с запасом credits — проще через HF. Если хочешь Google-billing — через video-clipgen.

Место в пайплайне

brief.md / hook idea
↓
video-clipgen (Veo direct) для generic | video-clipgen-higgsfield для cinematic + avatars
↓
Оба пишут в одну clips table (source="veo" или source="higgsfield")
↓
video-director миксует клипы независимо от backend
↓
video-captions → video-reviewer
↓
Финальный .mp4

🌐 Higgsfield Cloud API (Speak lip-sync) NEW

Отдельный billing от Ultra plan! Cloud API (cloud.higgsfield.ai) — pay-as-you-go, требует separate top-up.

Setup

# 1. cloud.higgsfield.ai → Sign up → API Keys → Generate (получаешь key+secret pair)
# 2. cloud.higgsfield.ai/billing → top-up $5-10 (без credits = HTTP 500/403)
# 3. Сохрани keys в shared DB:
sqlite3 ~/video-projects/director.db \
  "INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_KEY','<key>');"
sqlite3 ~/video-projects/director.db \
  "INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_SECRET','<secret>');"

Auth + endpoint

Authorization: Key <api_key>:<api_secret>
Content-Type: application/json

POST https://platform.higgsfield.ai/{model_id}

Не Bearer, не Basic — custom "Key" prefix с : разделителем.

Lip-sync через Speak endpoint

Endpoint	Required body	Цена
`POST /higgsfield-ai/speak`	`image_url` + `audio_url` + `prompt`	$0.86-4.22 / generation

Audio = WAV only! MP3 НЕ принимается endpoint'ом (требует audio/x-wav). Bash-wrapper auto-конвертит mp3 → wav 16kHz mono через ffmpeg.

Bash-wrapper

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_lipsync.sh \
  --image /path/to/face.png \
  --audio /path/to/voiceover.mp3 \
  --prompt "Tech founder speaking confidently in 9:16 portrait"

# Делает:
# 1. mp3 → WAV 16kHz mono
# 2. Резолвит keys из shared DB
# 3. Upload через Python SDK (правильный multipart)
# 4. POST к /higgsfield-ai/speak
# 5. Polls status каждые 5 сек
# 6. Скачивает result в ~/Desktop/hf_speak_<TS>.mp4

Известные model_id для Cloud API

Model ID (full URL path)	Что
`higgsfield-ai/speak`	Lip-sync (image + audio → talking video)
`higgsfield-ai/dop/preview/lite`	DoP image-to-video lite
`higgsfield-ai/dop/preview/standard`	DoP standard
`higgsfield-ai/dop/preview/turbo`	DoP turbo
`higgsfield-ai/soul/standard`	Soul image generation
`bytedance/seedance/v1/pro/image-to-video`	Seedance pro
`kling-video/v2.1/pro/image-to-video`	Kling 2.1 pro
+ 30 моделей	Полный gallery: cloud.higgsfield.ai/explore

🛍️ Marketing Studio — DTC ads через CLI

Через CLI higgsfield marketing-studio ... — целая система для DTC-style рекламы:

Команда	Что
`brand-kits fetch --url`	Auto-import colors/fonts/logo с сайта клиента
`webproducts fetch --url`	Auto-import name/photos/description с product page
`products create`	Manual product registration
`avatars list`	14 preset talking-head (Jayden, Stefan, Mei...) + custom создать из 1 фото
`hooks list`	9+ stunt visual scenarios (Product Hit, Spicy, Camera Bump, Epic Fail...)
`ad-formats list`	30+ headline templates (Stat Surround, Then vs Now, Magazine Style...)
`dtc-ads generate --prompt --format-id`	Готовый DTC постер с auto-branding

Product Photoshoot — 10 mode-specific промптов

higgsfield product-photoshoot create \
  --mode lifestyle_scene \
  --aspect_ratio 1:1 \
  --prompt "T608 in modern Almaty clinic" \
  --image product.jpg \
  --count 3

Modes: product_shot, lifestyle_scene, moodboard_pin, hero_banner, social_carousel, ad_creative_pack, virtual_model_tryout, conceptual_product, closeup_product_with_person, restyle.

Gotcha: lifestyle_scene падает без явного --aspect_ratio. in_use не существует — use closeup_product_with_person.

🚧 Web-only фичи (не через API)

Фича	Где	Что
Lip-Sync Studio	higgsfield.ai/lipsync-studio	6 lip-sync моделей: Speak v2, lipsync-2, InfiniteTalk, Kling AI Avatar, Kling Lipsync, Veo 3. 40+ языков. Через main account credits.
Supercomputer	higgsfield.ai/supercomputer	Autonomous AI-agent для end-to-end production. 40+ tools, 3-layer memory, self-learning по brand guidelines. Аналог нашего video-orchestrator в их экосистеме.

🪲 Известные проблемы / gotchas (всё реально проверено)

Проблема	Решение
`speech_to_video` убран из CLI	Use Cloud API `higgsfield-ai/speak` через `gen_lipsync.sh`
Cloud API HTTP 500 Internal Server Error	Нет credits на cloud account, top-up в cloud.higgsfield.ai/billing
MP3 не принимается Speak endpoint	Конвертить в WAV 16kHz mono (auto в `gen_lipsync.sh`)
`--skip-sync` в `preview_hook_presets.py` ломает первый run	Запустить ОДИН раз без `--skip-sync`
Render.py wrapper передаёт `--codec h264` что новый Remotion CLI ломает	Use прямой `npx remotion render` без `--codec`
`in_use` mode не существует	Use `closeup_product_with_person`
Soul V2: «magazine cover» → надпись VOG на лице	Use «clean studio portrait» / «photoreal photography»
HEVC phone clips не играют в Chrome/Firefox	Перекодировать в H.264 через ffmpeg
DTC Ad `quality=high resolution=2k` стабильно 500	Use `quality=low resolution=1k`
`lifestyle_scene` падает без aspect_ratio	Передавать явно (`--aspect_ratio 1:1`)

Pairs with

video-clipgen — companion (Veo напрямую через Google)
video-director — consumes higgsfield-клипы идентично Veo-клипам
video-analyzer — re-analyze higgsfield-клипы для richer descriptions
video-voiceover — нарратив над silent higgsfield-клипами
creative-poster — alternative для статичных Soul-портретов

References

@higgsfield/cli — official CLI (v0.1.40)
@higgsfield/client — Node.js SDK
higgsfield-client — Python SDK
higgsfield.ai — dashboard + pricing