Higgsfield Supercomputer — архитектура (reference)

Первоисточник: разбор пайплайна Higgsfield Supercomputer, который мы изучали в мае 2026 при проектировании своих trend-picker и video-clone-competitor. Эта страница — «откуда взяли идеи»: их слои, их скиллы, и точный мэппинг на наши локальные аналоги.

Происхождение данных. Описание слоёв и блоков «Анализ»/«Идентичность» (brand-analyzer, product-analyzer, trend-picker, video-adapt, soul-id, element) — дословно из ответа чат-агента Higgsfield Supercomputer (как нам его презентовали). Слои «Производство»/«Генерация»/«Дистрибуция» — реконструированы из их публичной документации, GitHub (higgsfield-ai/skills, OSideMedia/higgsfield-ai-prompt-skill) и Marketing Studio CLI. Это не официальная документация Higgsfield, а наш рабочий конспект для построения собственной системы.

Главный вывод после изучения: большинство «скиллов» Supercomputer — это внутренняя абстракция их чат-агента, а не публичные CLI-команды. Через CLI реально доступны: higgsfield-generate, higgsfield-soul-id, higgsfield-product-photoshoot, higgsfield-marketplace-cards + Marketing Studio (brand-kits fetch, webproducts fetch, dtc-ads generate). Остальное (trend-picker, video-adapt, *-flow, connector, xurl) — оркестрация внутри их веб-агента, программно не вызывается. Поэтому мы клонировали концепции, а не зависели от их подписки.

Общая схема системы

ВХОД (бриф / продукт / ссылка / идея)
       │
       ▼
┌─────────────────────────────────────┐
│         СЛОЙ АНАЛИЗА                 │
│  brand-analyzer │ product-analyzer   │
│  trend-picker   │ video-adapt        │
└──────────────┬──────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ИДЕНТИЧНОСТИ              │
│  soul-id (лицо актёра)               │
│  element (персонаж / локация / prop) │
└──────────────┬──────────────────────┘
               │
               ▼
┌──────────────────────────────────────────────────────────────────┐
│                    СЛОЙ ПРОИЗВОДСТВА                              │
│                                                                  │
│  РЕКЛАМА              UGC                   ДРУГИЕ ФОРМАТЫ        │
│  ─────────            ───                   ───────────────      │
│  tv-ad                ugc-flow              podcast-flow         │
│  motion-design-flow   ugc-product-flow      cinematic-flow       │
│  product-photoshoot   ugc-try-on-flow       cartoon-flow         │
│  amazon-product-      ugc-tutorial-flow     video-adapt          │
│    listing            ugc-unboxing-flow                          │
└──────────────┬───────────────────────────────────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ГЕНЕРАЦИИ                 │
│  image-generation                    │
│  video-generation                    │
│  montage (сборка финального видео)   │
└──────────────┬──────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ДИСТРИБУЦИИ               │
│  connector (Notion / Slack / Drive)  │
│  xurl (Twitter/X)                    │
│  youtube / telegram_send             │
└─────────────────────────────────────┘

Блок 1 — Анализ (входные данные)

Дословно из ответа их агента.

brand-analyzer

Что делает: Заходит на сайт бренда, вытаскивает логотип, палитру (HEX), типографику, hero-изображения, слоган, целевую аудиторию.

Вход: URL сайта
Выход: JSON-объект client_brand + загруженные файлы активов локально
Когда запускать: Всегда первым, если у тебя есть клиент. Результат идёт во все последующие генерации как визуальный reference.

→ Наш аналог: video-project-setup/scripts/brand_fetch.py (local scraper, без paid API) + опционально higgsfield marketing-studio brand-kits fetch. реализовано

product-analyzer

Что делает: Разбирает страницу продукта (Amazon, Shopify, AliExpress, любой магазин) или анализирует фото продукта. Определяет категорию, механику использования, механику открытия упаковки.

Вход: URL продукта или фото
Выход: Структурированный объект продукта → кормит downstream-пайплайны
Когда запускать: До любого UGC, TV-рекламы, фотосессии продукта.

→ Наш аналог: video-project-setup/scripts/product_fetch.py (schema.org Product JSON-LD + OpenGraph + gallery scraping). реализовано

trend-picker

Что делает: Исследует Instagram, TikTok, YouTube, YouTube Shorts, Meta Ad Library, TikTok Ad Library. Ранжирует по engagement velocity. Анализирует топ-видео через Gemini. Генерирует концепции контента.

Три режима:

trend_discovery — что сейчас вирально в нише
viral_analysis — почему конкретное видео сработало
creator_dna — клонирование стиля конкретного автора

Вход: @username / URL профиля / ключевые слова / ниша
Выход: Рейтинг видео + концепции + DNA-профиль автора

→ Наш аналог: trend-picker — те же 3 режима, но на HikerAPI (instagram-cli MCP) + video-analyzer + LLM in-session. Без зависимости от Higgsfield/Gemini. реализовано

video-adapt

Что делает: Полная адаптация чужого видео. Анализирует источник (YouTube/TikTok/Instagram), извлекает локации и создаёт элементы, адаптирует сцену за сценой через Gemini, генерирует через Seedance.

Три кейса:

Замена продукта (твой продукт вместо чужого)
Замена аватара (твой актёр вместо чужого)
1:1 воссоздание только с заменой локации

Вход: URL видео-источника + режим
Выход: Новое видео сцена за сценой

→ Наш аналог: video-clone-competitor — те же 3 кейса (product-swap / avatar-swap / location-swap), но PySceneDetect + video-analyzer + backend-agnostic regen (auto-routing Higgsfield ↔ direct Veo). реализовано

Блок 2 — Идентичность

soul-id — дословно из ответа их агента. element — реконструкция из их Cinema Studio Elements System.

soul-id

Что делает: Тренирует постоянную модель лица из 1–100 фото. После тренировки один и тот же человек появляется стабильно во всех генерациях.

Вход: Папка с фотографиями лица (jpg/png/webp)
Время тренировки: до 30 минут
Выход: reference_id (UUID) → используется в text2image_soul_v2

→ Наш аналог: уже подключено в video-clipgen-higgsfield через train_avatar.sh (аватар «anatoliy_stepanov» натренирован). Higgsfield-only — единственный provider с persistent face training; альтернативы (Veo/Runway/Sora) не умеют. оправданная зависимость

element

Что делает: Тренирует персистентный «элемент» — персонаж (не лицо), локацию или prop (объект). Позволяет переиспользовать один и тот же объект/локацию между генерациями. Часть Cinema Studio Elements System (5 source tabs × 6 категорий).

Вход: фото объекта / локации / персонажа
Выход: reference на элемент для composition в Cinematic Studio

→ Наш аналог: частично — reference images в video-clipgen (Veo до 3 ref-фото) и video-clipgen-higgsfield (I2V с image-ref). Персистентной тренировки prop/локации у нас нет — используем reference photos per-generation. partial

Блок 3 — Производство (форматные пайплайны)

Реконструкция из их Marketing Studio + GitHub. Большинство — внутренние flow их веб-агента, не CLI.

Скилл	Что делает (реконструкция)	Наш аналог
`tv-ad`	Полноценный рекламный ролик с нарративной структурой (hook → demo → CTA)	video-orchestrator (voiceover/textover pipelines)
`motion-design-flow`	Motion-graphics ролик, data-viz, анимированный текст/графика	video-motionfx + video-remotion
`product-photoshoot`	Студийная/lifestyle фотосессия продукта, 10 режимов (CLI-доступно)	creative-orchestrator (10 modes через Gemini, default) + опц. Higgsfield
`amazon-product-listing`	Карточки маркетплейса: main image + secondary + A+ modules (CLI: `marketplace-cards`)	❌ не делаем (Amazon-карточки вне нашей ниши)

UGC

Скилл	Что делает (реконструкция)	Наш аналог
`ugc-flow`	Базовый UGC-ролик «реальный человек говорит в камеру»	copywriter (UGC voice) → clipgen (Seedance)
`ugc-product-flow`	UGC-демо продукта в руках	copywriter + clone-competitor (product-swap)
`ugc-try-on-flow`	Примерка/использование продукта на человеке	Higgsfield product-photoshoot `virtual_model_tryout` mode
`ugc-tutorial-flow`	Туториал «как пользоваться»	creative-explainer-video
`ugc-unboxing-flow`	Распаковка продукта	copywriter + clipgen (unboxing prompt)

Другие форматы

Скилл	Что делает (реконструкция)	Наш аналог
`podcast-flow`	Подкаст-формат (talking head, длинный, разговорный)	video-screencast (talking-head) + captions
`cinematic-flow`	Кинематографичный ролик с camera control	video-clipgen-higgsfield (Cinematic Studio V2/V3)
`cartoon-flow`	Мультяшный/анимированный стиль	❌ не делаем (вне ниши; при нужде — Remotion/motionfx)
`video-adapt`	(дубль из Блока 1 — адаптация чужого видео)	video-clone-competitor

Блок 4 — Генерация

Реконструкция. Это базовый слой движков, на которые опираются форматные пайплайны.

Скилл	Что делает	Наш аналог
`image-generation`	Генерация статики (Soul V2, FLUX.2, Nano Banana Pro, GPT Image 2, Seedream V5)	creative-poster (Gemini 3 Pro, default) + video-clipgen-higgsfield (image models)
`video-generation`	Генерация видео (Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Cinematic Studio)	video-clipgen (direct Veo) + video-clipgen-higgsfield (36 моделей)
`montage`	Сборка финального видео из клипов (slash `/montage`)	video-director (FFmpeg монтаж + music ducking)

Блок 5 — Дистрибуция

Реконструкция. У нас этот слой намеренно не реализован (YAGNI) — публикуем вручную или через Trello.

Скилл	Что делает	Наш статус
`connector`	Выгрузка в Notion / Slack / Google Drive	❌ не реализовано (ручной upload). Идея на будущее.
`xurl`	Постинг в Twitter / X	❌ не реализовано (не наш канал)
`youtube`	Загрузка на YouTube	❌ не реализовано
`telegram_send`	Отправка в Telegram	🟡 частично — есть `trello-add` для задач; автопостинг готовых креативов в TG — идея на будущее

Что реально callable через CLI vs внутренняя абстракция

Компонент Supercomputer	Реальность	CLI-команда (если есть)
brand-analyzer	✅ Callable	`higgsfield marketing-studio brand-kits fetch --url`
product-analyzer	✅ Callable	`higgsfield marketing-studio webproducts fetch --url`
product-photoshoot	✅ Callable	`higgsfield product-photoshoot create --mode` (10 modes)
amazon-product-listing	✅ Callable	`higgsfield marketplace-cards create`
soul-id	✅ Callable	`higgsfield-soul-id` / `train_avatar.sh`
image/video-generation	✅ Callable	`higgsfield-generate` (30+ моделей)
montage	🟡 Slash-команда	`/montage` (web-агент)
tv-ad / motion-design-flow / *-flow	❌ Абстракция агента	— (внутренняя оркестрация Supercomputer)
trend-picker	❌ Абстракция агента	— (но Marketing Studio имеет частичные куски)
video-adapt	❌ Абстракция агента	—
element	🟡 UI-фича	Cinema Studio Elements (web UI, не CLI)
connector / xurl / youtube / telegram_send	❌ Абстракция агента	—

Итоговый мэппинг: их слой → наш аналог → статус

Higgsfield Supercomputer	Наш аналог	Статус
brand-analyzer	`video-project-setup/scripts/brand_fetch.py`	✅ реализовано (local-first)
product-analyzer	`video-project-setup/scripts/product_fetch.py`	✅ реализовано (local-first)
trend-picker	trend-picker (3 mode)	✅ реализовано (без Higgsfield)
video-adapt	video-clone-competitor (3 mode)	✅ реализовано (backend-agnostic)
soul-id	video-clipgen-higgsfield	✅ Higgsfield-only (оправдано)
element	reference images (video-clipgen)	🟡 partial
Производство (*-flow)	video-orchestrator + форматные скиллы	✅ свои аналоги
Генерация (image/video/montage)	clipgen / clipgen-higgsfield / director	✅ реализовано
Дистрибуция (connector/xurl/youtube/telegram)	trello-add + ручной upload	❌ намеренно не реализовано (YAGNI)

Резюме: мы воспроизвели интеллектуальные слои Supercomputer (Анализ + video-adapt) локально, без зависимости от их $199/мес подписки — кроме Soul-ID (face training, объективно незаменим) и Cinematic Studio camera moves. Слой Дистрибуции сознательно пропустили. Подробности развязки зависимостей: Архитектура → Backend-agnostic.