video-clipgen-higgsfield
Доступ к 36 моделям через одну авторизацию: Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Cinematic Studio V2/V3, Soul Cast, Soul V2, FLUX.2, Nano Banana Pro, GPT Image 2, Seedream V5 и др. + Soul-ID custom avatar training для face-consistency. CLI установлен, авторизация настроена, аватар «anatoliy_stepanov» уже натренирован.
🎬 Примеры работы
Что делает простыми словами
Это второй backend для генерации видео и изображений, в дополнение к video-clipgen (прямой Veo через Google Cloud). Higgsfield агрегирует 36 моделей под одной авторизацией и добавляет фичи которых нет у конкурентов:
- Soul-ID custom avatars — тренируешь лицо на 5-20 фото за 5-15 мин, потом генерируешь то же лицо в любой новой сцене сколько угодно раз (~$0.06 за генерацию)
- Cinematic Studio — 80+ named camera-presets (dolly_zoom / vertigo / orbit / FPV / arc / crane). Veo камеру не контролирует.
- 36 моделей через одну auth — Veo, Kling, Wan, Seedance, Sora, Cinematic Studio, Soul Cast, FLUX, Nano Banana Pro, GPT Image 2, Seedream...
- Image-to-video из статичных brand-ассетов — лучший в классе через Cinematic Studio V2
- Marketing Studio workflows — DTC ad templates с готовыми pre-set'ами
clips table что и video-clipgen — Director использует обе модели прозрачно.
Bash-обёртки (recommended)
4 ready-made скрипта в ~/.claude/skills/video-clipgen-higgsfield/scripts/:
| Скрипт | Что делает | Пример |
|---|---|---|
train_avatar.sh |
Upload фото + создание Soul-ID + ожидание | ./train_avatar.sh anatoliy face1.jpg face2.jpg ... face5.jpg |
gen_image.sh |
Image generation (Soul / FLUX / Nano Banana...) | ./gen_image.sh --prompt "..." --avatar <id> --aspect 3:4 |
gen_video.sh |
Video clip (Cinematic Studio / Veo / Kling / Wan...) | ./gen_video.sh --prompt "..." --image file.jpg --model cinematic_studio_video_v2 |
list.sh |
Inventory (avatars / models / jobs / balance) | ./list.sh balance · ./list.sh avatars |
Полные примеры команд
Тренировка нового аватара
~/.claude/skills/video-clipgen-higgsfield/scripts/train_avatar.sh \ doctor_basdent \ ~/Downloads/doctor_01.jpg \ ~/Downloads/doctor_02.jpg \ ~/Downloads/doctor_03.jpg \ ~/Downloads/doctor_04.jpg \ ~/Downloads/doctor_05.jpg # → uploads 5 фото → создаёт Soul-ID → polls 5-15 мин → сохраняет в avatars.txt # Cost: 25 credits ($1.56)
Image с уже обученным аватаром
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_image.sh \ --prompt "Confident young businessman in modern Almaty office, soft window light, premium suit" \ --avatar cacb64a4-7e89-4e49-8651-8babcca7916d \ --aspect 3:4 \ --output ~/Desktop/portrait.png # → 1-2 мин, ~$0.06
Cinematic video с product reference
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \ --prompt "Slow cinematic orbit around medical device, premium studio lighting" \ --image ~/video-projects/apparatus/references/ref_eswt_t9.jpg \ --aspect 16:9 # → Cinematic Studio V2 (default), 5s, ~$0.47
Veo 3.1 без image
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_video.sh \ --model veo3_1_lite \ --prompt "Professional clinic, doctor holding shockwave therapy device, soft natural light" # → Veo 3.1 Lite через HF credits (~$1.13), вместо Google Cloud billing
Зарегистрированные аватары
| Date | Name | Soul-ID | Type |
|---|---|---|---|
| 2026-05-17 | anatoliy_stepanov |
cacb64a4-7e89-4e49-8651-8babcca7916d |
soul_2 |
Реестр в ~/.claude/skills/video-clipgen-higgsfield/avatars.txt (auto-обновляется через train_avatar.sh). Списать: list.sh avatars.
36 моделей cheat-sheet
Video (16)
| Model ID | Что | Best for | ~Cost |
|---|---|---|---|
cinematic_studio_video_v2 | DoP successor, 5s image-to-video | Default — premium product orbit/push-in | 7.5cr ($0.47) |
cinematic_studio_3_0 | Newest Cinematic Studio | Premium hero shots | ~15cr ($0.94) |
veo3_1_lite | Google Veo 3.1 Lite | Generic Veo-style content | ~18cr ($1.13) |
veo3_1 | Veo 3.1 full | Premium Veo content | ~25cr ($1.56) |
kling3_0 | Kling v3.0 | Product orbits, smooth motion | ~10cr ($0.63) |
wan2_7 | Wan 2.7 (best physics) | Realistic motion, complex physics | ~12cr |
seedance_2_0 | Seedance 2.0 Bytedance | Good motion variety | ~10cr |
soul_cast | Soul Cast character video | Talking head с Soul-ID | ~15cr |
minimax_hailuo | Minimax Hailuo | Asian-style scenes | ~8cr |
| + grok_video, marketing_studio_video, kling2_6, wan2_6, seedance1_5, veo3, cinematic_studio_video | — | см. list.sh models | — |
Image (20)
| Model ID | Что | Best for | ~Cost |
|---|---|---|---|
text2image_soul_v2 | Higgsfield Soul V2 | Photoreal portraits (supports --avatar) | ~3cr ($0.19) |
soul_cinematic | Soul Cinematic | Editorial portraits (supports --avatar) | ~3cr |
soul_location | Soul Location | Environment-focused (supports --avatar) | ~3cr |
flux_2 | FLUX.2 | General-purpose | ~2cr |
nano_banana_2 | Google Nano Banana Pro | Premium photoreal | ~4cr |
gpt_image_2 | OpenAI GPT Image 2 | OpenAI quality | ~5cr |
seedream_v5_lite | Seedream V5 Lite | Latest Seedream | ~3cr |
| + flux_kontext, nano_banana, nano_banana_flash, imagegen_2_0, seedream_v4_5, grok_image, openai_hazel, kling_omni_image, z_image, cinematic_studio_2_5, ms_image, marketing_studio_image, image_auto | — | см. list.sh models | — |
Soul-ID flow
↓
train_avatar.sh → upload + create Soul-ID
↓
~5-15 мин training (25 credits)
↓
avatars.txt registry с saved soul_id
↓
gen_image.sh --avatar <id> --prompt "..."
↓
Photoreal generation в новой сцене с тем же лицом (~$0.06/штука, reusable forever)
Совместимые модели (принимают --avatar / custom_reference_id):
text2image_soul_v2soul_cinematicsoul_location
НЕ совместимые: Veo, Kling, Wan, Cinematic Studio, FLUX, Nano Banana, Seedance (у них нет hook'а для fine-tuning).
Cost reference (реальные данные)
| Operation | Credits | $ |
|---|---|---|
| Soul-ID training (one-time per face) | 25 | $1.56 |
| Soul V2 image (с/без avatar) | 0.2-3 | $0.01-0.19 |
| Cinematic Studio video V2 (5s) | 7.5 | $0.47 |
| Veo 3.1 Lite (5-10s) | ~18 | $1.13 |
| Kling 3.0 (5s) | ~10 | $0.63 |
| Wan 2.7 (5s) | ~12 | $0.75 |
| Seedance 2.0 (5s) | ~10 | $0.63 |
| Soul Cast video (5s) | ~15 | $0.94 |
| Hook + product pipeline (Soul image + Cinematic Studio) | ~10 | ~$0.65 |
| Character series (train + 5 portraits + 3 videos) | ~70 | ~$4.40 |
Setup (one-time)
# Configure npm prefix без sudo npm config set prefix ~/.npm-global npm install -g @higgsfield/cli # Add to PATH (persist в ~/.zshrc) export PATH="$HOME/.npm-global/bin:$PATH" # Auth (открывает браузер для OAuth) higgsfield auth login # Verify higgsfield account status higgsfield model list --video higgsfield model list --image
Python SDK путь (secondary)
Если нужна интеграция с нашей clips table (чтобы video-director подхватывал клипы как обычные), есть Python-обёртки:
# pip install higgsfield-client (если ещё не стоит) python3 ~/.claude/skills/video-clipgen-higgsfield/scripts/higgsfield_generate.py video \ --project-dir ~/video-projects/apparatus \ --image references/ref_eswt_t9.jpg \ --prompt "..." \ --camera-preset orbit_slow # → пишет в clips table + project_clips junction
Альтернатива bash-обёрткам (которые сохраняют в Desktop без DB). Выбирай по use case:
- Bash — ad-hoc генерация для preview / клиенту
- Python (с --project-dir) — для production pipeline (Director подхватит автоматически)
Veo через Higgsfield vs Veo напрямую
| Путь | Чей биллинг | Когда брать |
|---|---|---|
higgsfield generate create veo3_1 | HF credits (твой ultra plan) | Один auth для 36 моделей, не нужно отдельно настраивать Google Cloud |
| video-clipgen (Veo напрямую) | Google Cloud (твоя карта) | Direct billing transparency, интеграция с clips table, чуть дешевле |
Цена примерно одинаковая (~$0.50-1.50/клип). Если уже в HF ultra-plan с запасом credits — проще через HF. Если хочешь Google-billing — через video-clipgen.
Место в пайплайне
↓
video-clipgen (Veo direct) для generic | video-clipgen-higgsfield для cinematic + avatars
↓
Оба пишут в одну
clips table (source="veo" или source="higgsfield")
↓
video-director миксует клипы независимо от backend
↓
video-captions → video-reviewer
↓
Финальный .mp4
🌐 Higgsfield Cloud API (Speak lip-sync) NEW
Отдельный billing от Ultra plan! Cloud API (cloud.higgsfield.ai) — pay-as-you-go, требует separate top-up.
Setup
# 1. cloud.higgsfield.ai → Sign up → API Keys → Generate (получаешь key+secret pair)
# 2. cloud.higgsfield.ai/billing → top-up $5-10 (без credits = HTTP 500/403)
# 3. Сохрани keys в shared DB:
sqlite3 ~/video-projects/director.db \
"INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_KEY','<key>');"
sqlite3 ~/video-projects/director.db \
"INSERT OR REPLACE INTO api_keys VALUES('HIGGSFIELD_API_SECRET','<secret>');"
Auth + endpoint
Authorization: Key <api_key>:<api_secret>
Content-Type: application/json
POST https://platform.higgsfield.ai/{model_id}
Не Bearer, не Basic — custom "Key" prefix с : разделителем.
Lip-sync через Speak endpoint
| Endpoint | Required body | Цена |
|---|---|---|
POST /higgsfield-ai/speak |
image_url + audio_url + prompt |
$0.86-4.22 / generation |
audio/x-wav). Bash-wrapper auto-конвертит mp3 → wav 16kHz mono через ffmpeg.
Bash-wrapper
~/.claude/skills/video-clipgen-higgsfield/scripts/gen_lipsync.sh \ --image /path/to/face.png \ --audio /path/to/voiceover.mp3 \ --prompt "Tech founder speaking confidently in 9:16 portrait" # Делает: # 1. mp3 → WAV 16kHz mono # 2. Резолвит keys из shared DB # 3. Upload через Python SDK (правильный multipart) # 4. POST к /higgsfield-ai/speak # 5. Polls status каждые 5 сек # 6. Скачивает result в ~/Desktop/hf_speak_<TS>.mp4
Известные model_id для Cloud API
| Model ID (full URL path) | Что |
|---|---|
higgsfield-ai/speak | Lip-sync (image + audio → talking video) |
higgsfield-ai/dop/preview/lite | DoP image-to-video lite |
higgsfield-ai/dop/preview/standard | DoP standard |
higgsfield-ai/dop/preview/turbo | DoP turbo |
higgsfield-ai/soul/standard | Soul image generation |
bytedance/seedance/v1/pro/image-to-video | Seedance pro |
kling-video/v2.1/pro/image-to-video | Kling 2.1 pro |
| + 30 моделей | Полный gallery: cloud.higgsfield.ai/explore |
🛍️ Marketing Studio — DTC ads через CLI
Через CLI higgsfield marketing-studio ... — целая система для DTC-style рекламы:
| Команда | Что |
|---|---|
brand-kits fetch --url | Auto-import colors/fonts/logo с сайта клиента |
webproducts fetch --url | Auto-import name/photos/description с product page |
products create | Manual product registration |
avatars list | 14 preset talking-head (Jayden, Stefan, Mei...) + custom создать из 1 фото |
hooks list | 9+ stunt visual scenarios (Product Hit, Spicy, Camera Bump, Epic Fail...) |
ad-formats list | 30+ headline templates (Stat Surround, Then vs Now, Magazine Style...) |
dtc-ads generate --prompt --format-id | Готовый DTC постер с auto-branding |
Product Photoshoot — 10 mode-specific промптов
higgsfield product-photoshoot create \ --mode lifestyle_scene \ --aspect_ratio 1:1 \ --prompt "T608 in modern Almaty clinic" \ --image product.jpg \ --count 3
Modes: product_shot, lifestyle_scene, moodboard_pin, hero_banner, social_carousel, ad_creative_pack, virtual_model_tryout, conceptual_product, closeup_product_with_person, restyle.
lifestyle_scene падает без явного --aspect_ratio. in_use не существует — use closeup_product_with_person.
🚧 Web-only фичи (не через API)
| Фича | Где | Что |
|---|---|---|
| Lip-Sync Studio | higgsfield.ai/lipsync-studio | 6 lip-sync моделей: Speak v2, lipsync-2, InfiniteTalk, Kling AI Avatar, Kling Lipsync, Veo 3. 40+ языков. Через main account credits. |
| Supercomputer | higgsfield.ai/supercomputer | Autonomous AI-agent для end-to-end production. 40+ tools, 3-layer memory, self-learning по brand guidelines. Аналог нашего video-orchestrator в их экосистеме. |
🪲 Известные проблемы / gotchas (всё реально проверено)
| Проблема | Решение |
|---|---|
speech_to_video убран из CLI | Use Cloud API higgsfield-ai/speak через gen_lipsync.sh |
| Cloud API HTTP 500 Internal Server Error | Нет credits на cloud account, top-up в cloud.higgsfield.ai/billing |
| MP3 не принимается Speak endpoint | Конвертить в WAV 16kHz mono (auto в gen_lipsync.sh) |
--skip-sync в preview_hook_presets.py ломает первый run | Запустить ОДИН раз без --skip-sync |
Render.py wrapper передаёт --codec h264 что новый Remotion CLI ломает | Use прямой npx remotion render без --codec |
in_use mode не существует | Use closeup_product_with_person |
| Soul V2: «magazine cover» → надпись VOG на лице | Use «clean studio portrait» / «photoreal photography» |
| HEVC phone clips не играют в Chrome/Firefox | Перекодировать в H.264 через ffmpeg |
DTC Ad quality=high resolution=2k стабильно 500 | Use quality=low resolution=1k |
lifestyle_scene падает без aspect_ratio | Передавать явно (--aspect_ratio 1:1) |
Pairs with
- video-clipgen — companion (Veo напрямую через Google)
- video-director — consumes higgsfield-клипы идентично Veo-клипам
- video-analyzer — re-analyze higgsfield-клипы для richer descriptions
- video-voiceover — нарратив над silent higgsfield-клипами
- creative-poster — alternative для статичных Soul-портретов
References
- @higgsfield/cli — official CLI (v0.1.40)
- @higgsfield/client — Node.js SDK
- higgsfield-client — Python SDK
- higgsfield.ai — dashboard + pricing