Skill #5+ · Higgsfield AI backend (36 models)

video-clipgen-higgsfield

Доступ к 36 моделям через одну авторизацию: Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Cinematic Studio V2/V3, Soul Cast, Soul V2, FLUX.2, Nano Banana Pro, GPT Image 2, Seedream V5 и др. + Soul-ID custom avatar training для face-consistency. CLI установлен, авторизация настроена, аватар «anatoliy_stepanov» уже натренирован.

Путь
~/.claude/skills/video-clipgen-higgsfield/
CLI
~/.npm-global/bin/higgsfield v0.1.40
Auth
OAuth token (через higgsfield auth login)
Подписка
ultra plan · ~3010 credits/мес

🎬 Примеры работы

Открой Showcase → ⚡ Higgsfield real renders — 3 video (Cinematic Studio V2 / Veo 3.1 / Kling 3.0) на одном reference apparatus ESWT T9.
И Showcase → 👤 Soul-ID avatar — обученный Soul-ID «anatoliy_stepanov» (5 фото → 5 мин тренировки, $1.56), плюс 4 demo-генерации того же лица в 4 разных сценах.
А также Showcase → 🎬 Video-аватар — тот же anatoliy_stepanov В ДВИЖЕНИИ: 4 видео через 2-step pipeline (Soul image-with-avatar → Cinematic Studio Video V2). Стоимость одного video-avatar: ~$0.53.
Marketing Studio video-avatars — 14 готовых talking-head моделей (Jayden, Stefan, Mei...) для lip-sync DTC-ads. Подробно: Showcase → 🎙️ MS talking-head avatars.

Что делает простыми словами

Это второй backend для генерации видео и изображений, в дополнение к video-clipgen (прямой Veo через Google Cloud). Higgsfield агрегирует 36 моделей под одной авторизацией и добавляет фичи которых нет у конкурентов:

  1. Soul-ID custom avatars — тренируешь лицо на 5-20 фото за 5-15 мин, потом генерируешь то же лицо в любой новой сцене сколько угодно раз (~$0.06 за генерацию)
  2. Cinematic Studio — 80+ named camera-presets (dolly_zoom / vertigo / orbit / FPV / arc / crane). Veo камеру не контролирует.
  3. 36 моделей через одну auth — Veo, Kling, Wan, Seedance, Sora, Cinematic Studio, Soul Cast, FLUX, Nano Banana Pro, GPT Image 2, Seedream...
  4. Image-to-video из статичных brand-ассетов — лучший в классе через Cinematic Studio V2
  5. Marketing Studio workflows — DTC ad templates с готовыми pre-set'ами
Пишет в ту же clips table что и video-clipgen — Director использует обе модели прозрачно.

Bash-обёртки (recommended)

4 ready-made скрипта в ~/.claude/skills/video-clipgen-higgsfield/scripts/:

СкриптЧто делаетПример
train_avatar.sh Upload фото + создание Soul-ID + ожидание ./train_avatar.sh anatoliy face1.jpg face2.jpg ... face5.jpg
gen_image.sh Image generation (Soul / FLUX / Nano Banana...) ./gen_image.sh --prompt "..." --avatar <id> --aspect 3:4
gen_video.sh Video clip (Cinematic Studio / Veo / Kling / Wan...) ./gen_video.sh --prompt "..." --image file.jpg --model cinematic_studio_video_v2
list.sh Inventory (avatars / models / jobs / balance) ./list.sh balance · ./list.sh avatars

Полные примеры команд

Тренировка нового аватара

~/.claude/skills/video-clipgen-higgsfield/scripts/train_avatar.sh \
  doctor_basdent \
  ~/Downloads/doctor_01.jpg \
  ~/Downloads/doctor_02.jpg \
  ~/Downloads/doctor_03.jpg \
  ~/Downloads/doctor_04.jpg \
  ~/Downloads/doctor_05.jpg

# → uploads 5 фото → создаёт Soul-ID → polls 5-15 мин → сохраняет в avatars.txt
# Cost: 25 credits ($1.56)

Image с уже обученным аватаром

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_image.sh \
  --prompt "Confident young businessman in modern Almaty office, soft window light, premium suit" \
  --avatar cacb64a4-7e89-4e49-8651-8babcca7916d \
  --aspect 3:4 \
  --output ~/Desktop/portrait.png

# → 1-2 мин, ~$0.06

Cinematic video с product reference

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \
  --prompt "Slow cinematic orbit around medical device, premium studio lighting" \
  --image ~/video-projects/apparatus/references/ref_eswt_t9.jpg \
  --aspect 16:9

# → Cinematic Studio V2 (default), 5s, ~$0.47

Veo 3.1 без image

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \
  --model veo3_1_lite \
  --prompt "Professional clinic, doctor holding shockwave therapy device, soft natural light"

# → Veo 3.1 Lite через HF credits (~$1.13), вместо Google Cloud billing

Зарегистрированные аватары

DateNameSoul-IDType
2026-05-17 anatoliy_stepanov cacb64a4-7e89-4e49-8651-8babcca7916d soul_2

Реестр в ~/.claude/skills/video-clipgen-higgsfield/avatars.txt (auto-обновляется через train_avatar.sh). Списать: list.sh avatars.

36 моделей cheat-sheet

Video (16)

Model IDЧтоBest for~Cost
cinematic_studio_video_v2DoP successor, 5s image-to-videoDefault — premium product orbit/push-in7.5cr ($0.47)
cinematic_studio_3_0Newest Cinematic StudioPremium hero shots~15cr ($0.94)
veo3_1_liteGoogle Veo 3.1 LiteGeneric Veo-style content~18cr ($1.13)
veo3_1Veo 3.1 fullPremium Veo content~25cr ($1.56)
kling3_0Kling v3.0Product orbits, smooth motion~10cr ($0.63)
wan2_7Wan 2.7 (best physics)Realistic motion, complex physics~12cr
seedance_2_0Seedance 2.0 BytedanceGood motion variety~10cr
soul_castSoul Cast character videoTalking head с Soul-ID~15cr
minimax_hailuoMinimax HailuoAsian-style scenes~8cr
+ grok_video, marketing_studio_video, kling2_6, wan2_6, seedance1_5, veo3, cinematic_studio_videoсм. list.sh models

Image (20)

Model IDЧтоBest for~Cost
text2image_soul_v2Higgsfield Soul V2Photoreal portraits (supports --avatar)~3cr ($0.19)
soul_cinematicSoul CinematicEditorial portraits (supports --avatar)~3cr
soul_locationSoul LocationEnvironment-focused (supports --avatar)~3cr
flux_2FLUX.2General-purpose~2cr
nano_banana_2Google Nano Banana ProPremium photoreal~4cr
gpt_image_2OpenAI GPT Image 2OpenAI quality~5cr
seedream_v5_liteSeedream V5 LiteLatest Seedream~3cr
+ flux_kontext, nano_banana, nano_banana_flash, imagegen_2_0, seedream_v4_5, grok_image, openai_hazel, kling_omni_image, z_image, cinematic_studio_2_5, ms_image, marketing_studio_image, image_autoсм. list.sh models

Soul-ID flow

5-20 фото лица

train_avatar.sh upload + create Soul-ID

~5-15 мин training (25 credits)

avatars.txt registry с saved soul_id

gen_image.sh --avatar <id> --prompt "..."

Photoreal generation в новой сцене с тем же лицом (~$0.06/штука, reusable forever)

Совместимые модели (принимают --avatar / custom_reference_id):

НЕ совместимые: Veo, Kling, Wan, Cinematic Studio, FLUX, Nano Banana, Seedance (у них нет hook'а для fine-tuning).

Cost reference (реальные данные)

OperationCredits$
Soul-ID training (one-time per face)25$1.56
Soul V2 image (с/без avatar)0.2-3$0.01-0.19
Cinematic Studio video V2 (5s)7.5$0.47
Veo 3.1 Lite (5-10s)~18$1.13
Kling 3.0 (5s)~10$0.63
Wan 2.7 (5s)~12$0.75
Seedance 2.0 (5s)~10$0.63
Soul Cast video (5s)~15$0.94
Hook + product pipeline (Soul image + Cinematic Studio)~10~$0.65
Character series (train + 5 portraits + 3 videos)~70~$4.40

Setup (one-time)

# Configure npm prefix без sudo
npm config set prefix ~/.npm-global
npm install -g @higgsfield/cli

# Add to PATH (persist в ~/.zshrc)
export PATH="$HOME/.npm-global/bin:$PATH"

# Auth (открывает браузер для OAuth)
higgsfield auth login

# Verify
higgsfield account status
higgsfield model list --video
higgsfield model list --image

Python SDK путь (secondary)

Если нужна интеграция с нашей clips table (чтобы video-director подхватывал клипы как обычные), есть Python-обёртки:

# pip install higgsfield-client  (если ещё не стоит)
python3 ~/.claude/skills/video-clipgen-higgsfield/scripts/higgsfield_generate.py video \
  --project-dir ~/video-projects/apparatus \
  --image references/ref_eswt_t9.jpg \
  --prompt "..." \
  --camera-preset orbit_slow

# → пишет в clips table + project_clips junction

Альтернатива bash-обёрткам (которые сохраняют в Desktop без DB). Выбирай по use case:

Veo через Higgsfield vs Veo напрямую

ПутьЧей биллингКогда брать
higgsfield generate create veo3_1HF credits (твой ultra plan)Один auth для 36 моделей, не нужно отдельно настраивать Google Cloud
video-clipgen (Veo напрямую)Google Cloud (твоя карта)Direct billing transparency, интеграция с clips table, чуть дешевле

Цена примерно одинаковая (~$0.50-1.50/клип). Если уже в HF ultra-plan с запасом credits — проще через HF. Если хочешь Google-billing — через video-clipgen.

Место в пайплайне

brief.md / hook idea

video-clipgen (Veo direct) для generic | video-clipgen-higgsfield для cinematic + avatars

Оба пишут в одну clips table (source="veo" или source="higgsfield")

video-director миксует клипы независимо от backend

video-captions video-reviewer

Финальный .mp4

🌐 Higgsfield Cloud API (Speak lip-sync) NEW

Отдельный billing от Ultra plan! Cloud API (cloud.higgsfield.ai) — pay-as-you-go, требует separate top-up.

Setup

# 1. cloud.higgsfield.ai → Sign up → API Keys → Generate (получаешь key+secret pair)
# 2. cloud.higgsfield.ai/billing → top-up $5-10 (без credits = HTTP 500/403)
# 3. Сохрани keys в shared DB:
sqlite3 ~/video-projects/director.db \
  "INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_KEY','<key>');"
sqlite3 ~/video-projects/director.db \
  "INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_SECRET','<secret>');"

Auth + endpoint

Authorization: Key <api_key>:<api_secret>
Content-Type: application/json

POST https://platform.higgsfield.ai/{model_id}

Не Bearer, не Basic — custom "Key" prefix с : разделителем.

Lip-sync через Speak endpoint

EndpointRequired bodyЦена
POST /higgsfield-ai/speak image_url + audio_url + prompt $0.86-4.22 / generation
Audio = WAV only! MP3 НЕ принимается endpoint'ом (требует audio/x-wav). Bash-wrapper auto-конвертит mp3 → wav 16kHz mono через ffmpeg.

Bash-wrapper

~/.claude/skills/video-clipgen-higgsfield/scripts/gen_lipsync.sh \
  --image /path/to/face.png \
  --audio /path/to/voiceover.mp3 \
  --prompt "Tech founder speaking confidently in 9:16 portrait"

# Делает:
# 1. mp3 → WAV 16kHz mono
# 2. Резолвит keys из shared DB
# 3. Upload через Python SDK (правильный multipart)
# 4. POST к /higgsfield-ai/speak
# 5. Polls status каждые 5 сек
# 6. Скачивает result в ~/Desktop/hf_speak_<TS>.mp4

Известные model_id для Cloud API

Model ID (full URL path)Что
higgsfield-ai/speakLip-sync (image + audio → talking video)
higgsfield-ai/dop/preview/liteDoP image-to-video lite
higgsfield-ai/dop/preview/standardDoP standard
higgsfield-ai/dop/preview/turboDoP turbo
higgsfield-ai/soul/standardSoul image generation
bytedance/seedance/v1/pro/image-to-videoSeedance pro
kling-video/v2.1/pro/image-to-videoKling 2.1 pro
+ 30 моделейПолный gallery: cloud.higgsfield.ai/explore

🛍️ Marketing Studio — DTC ads через CLI

Через CLI higgsfield marketing-studio ... — целая система для DTC-style рекламы:

КомандаЧто
brand-kits fetch --urlAuto-import colors/fonts/logo с сайта клиента
webproducts fetch --urlAuto-import name/photos/description с product page
products createManual product registration
avatars list14 preset talking-head (Jayden, Stefan, Mei...) + custom создать из 1 фото
hooks list9+ stunt visual scenarios (Product Hit, Spicy, Camera Bump, Epic Fail...)
ad-formats list30+ headline templates (Stat Surround, Then vs Now, Magazine Style...)
dtc-ads generate --prompt --format-idГотовый DTC постер с auto-branding

Product Photoshoot — 10 mode-specific промптов

higgsfield product-photoshoot create \
  --mode lifestyle_scene \
  --aspect_ratio 1:1 \
  --prompt "T608 in modern Almaty clinic" \
  --image product.jpg \
  --count 3

Modes: product_shot, lifestyle_scene, moodboard_pin, hero_banner, social_carousel, ad_creative_pack, virtual_model_tryout, conceptual_product, closeup_product_with_person, restyle.

Gotcha: lifestyle_scene падает без явного --aspect_ratio. in_use не существует — use closeup_product_with_person.

🚧 Web-only фичи (не через API)

ФичаГдеЧто
Lip-Sync Studio higgsfield.ai/lipsync-studio 6 lip-sync моделей: Speak v2, lipsync-2, InfiniteTalk, Kling AI Avatar, Kling Lipsync, Veo 3. 40+ языков. Через main account credits.
Supercomputer higgsfield.ai/supercomputer Autonomous AI-agent для end-to-end production. 40+ tools, 3-layer memory, self-learning по brand guidelines. Аналог нашего video-orchestrator в их экосистеме.

🪲 Известные проблемы / gotchas (всё реально проверено)

ПроблемаРешение
speech_to_video убран из CLIUse Cloud API higgsfield-ai/speak через gen_lipsync.sh
Cloud API HTTP 500 Internal Server ErrorНет credits на cloud account, top-up в cloud.higgsfield.ai/billing
MP3 не принимается Speak endpointКонвертить в WAV 16kHz mono (auto в gen_lipsync.sh)
--skip-sync в preview_hook_presets.py ломает первый runЗапустить ОДИН раз без --skip-sync
Render.py wrapper передаёт --codec h264 что новый Remotion CLI ломаетUse прямой npx remotion render без --codec
in_use mode не существуетUse closeup_product_with_person
Soul V2: «magazine cover» → надпись VOG на лицеUse «clean studio portrait» / «photoreal photography»
HEVC phone clips не играют в Chrome/FirefoxПерекодировать в H.264 через ffmpeg
DTC Ad quality=high resolution=2k стабильно 500Use quality=low resolution=1k
lifestyle_scene падает без aspect_ratioПередавать явно (--aspect_ratio 1:1)

Pairs with

References