Higgsfield Supercomputer — архитектура (reference)

Первоисточник: разбор пайплайна Higgsfield Supercomputer, который мы изучали в мае 2026 при проектировании своих trend-picker и video-clone-competitor. Эта страница — «откуда взяли идеи»: их слои, их скиллы, и точный мэппинг на наши локальные аналоги.

Происхождение данных. Описание слоёв и блоков «Анализ»/«Идентичность» (brand-analyzer, product-analyzer, trend-picker, video-adapt, soul-id, element) — дословно из ответа чат-агента Higgsfield Supercomputer (как нам его презентовали). Слои «Производство»/«Генерация»/«Дистрибуция» — реконструированы из их публичной документации, GitHub (higgsfield-ai/skills, OSideMedia/higgsfield-ai-prompt-skill) и Marketing Studio CLI. Это не официальная документация Higgsfield, а наш рабочий конспект для построения собственной системы.
Главный вывод после изучения: большинство «скиллов» Supercomputer — это внутренняя абстракция их чат-агента, а не публичные CLI-команды. Через CLI реально доступны: higgsfield-generate, higgsfield-soul-id, higgsfield-product-photoshoot, higgsfield-marketplace-cards + Marketing Studio (brand-kits fetch, webproducts fetch, dtc-ads generate). Остальное (trend-picker, video-adapt, *-flow, connector, xurl) — оркестрация внутри их веб-агента, программно не вызывается. Поэтому мы клонировали концепции, а не зависели от их подписки.

Общая схема системы

ВХОД (бриф / продукт / ссылка / идея)
       │
       ▼
┌─────────────────────────────────────┐
│         СЛОЙ АНАЛИЗА                 │
│  brand-analyzer │ product-analyzer   │
│  trend-picker   │ video-adapt        │
└──────────────┬──────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ИДЕНТИЧНОСТИ              │
│  soul-id (лицо актёра)               │
│  element (персонаж / локация / prop) │
└──────────────┬──────────────────────┘
               │
               ▼
┌──────────────────────────────────────────────────────────────────┐
│                    СЛОЙ ПРОИЗВОДСТВА                              │
│                                                                  │
│  РЕКЛАМА              UGC                   ДРУГИЕ ФОРМАТЫ        │
│  ─────────            ───                   ───────────────      │
│  tv-ad                ugc-flow              podcast-flow         │
│  motion-design-flow   ugc-product-flow      cinematic-flow       │
│  product-photoshoot   ugc-try-on-flow       cartoon-flow         │
│  amazon-product-      ugc-tutorial-flow     video-adapt          │
│    listing            ugc-unboxing-flow                          │
└──────────────┬───────────────────────────────────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ГЕНЕРАЦИИ                 │
│  image-generation                    │
│  video-generation                    │
│  montage (сборка финального видео)   │
└──────────────┬──────────────────────┘
               │
               ▼
┌─────────────────────────────────────┐
│       СЛОЙ ДИСТРИБУЦИИ               │
│  connector (Notion / Slack / Drive)  │
│  xurl (Twitter/X)                    │
│  youtube / telegram_send             │
└─────────────────────────────────────┘

Блок 1 — Анализ (входные данные)

Дословно из ответа их агента.

brand-analyzer

Что делает: Заходит на сайт бренда, вытаскивает логотип, палитру (HEX), типографику, hero-изображения, слоган, целевую аудиторию.

  • Вход: URL сайта
  • Выход: JSON-объект client_brand + загруженные файлы активов локально
  • Когда запускать: Всегда первым, если у тебя есть клиент. Результат идёт во все последующие генерации как визуальный reference.

Наш аналог: video-project-setup/scripts/brand_fetch.py (local scraper, без paid API) + опционально higgsfield marketing-studio brand-kits fetch. реализовано

product-analyzer

Что делает: Разбирает страницу продукта (Amazon, Shopify, AliExpress, любой магазин) или анализирует фото продукта. Определяет категорию, механику использования, механику открытия упаковки.

  • Вход: URL продукта или фото
  • Выход: Структурированный объект продукта → кормит downstream-пайплайны
  • Когда запускать: До любого UGC, TV-рекламы, фотосессии продукта.

Наш аналог: video-project-setup/scripts/product_fetch.py (schema.org Product JSON-LD + OpenGraph + gallery scraping). реализовано

trend-picker

Что делает: Исследует Instagram, TikTok, YouTube, YouTube Shorts, Meta Ad Library, TikTok Ad Library. Ранжирует по engagement velocity. Анализирует топ-видео через Gemini. Генерирует концепции контента.

Три режима:

  • trend_discovery — что сейчас вирально в нише
  • viral_analysis — почему конкретное видео сработало
  • creator_dna — клонирование стиля конкретного автора
  • Вход: @username / URL профиля / ключевые слова / ниша
  • Выход: Рейтинг видео + концепции + DNA-профиль автора

Наш аналог: trend-picker — те же 3 режима, но на HikerAPI (instagram-cli MCP) + video-analyzer + LLM in-session. Без зависимости от Higgsfield/Gemini. реализовано

video-adapt

Что делает: Полная адаптация чужого видео. Анализирует источник (YouTube/TikTok/Instagram), извлекает локации и создаёт элементы, адаптирует сцену за сценой через Gemini, генерирует через Seedance.

Три кейса:

  1. Замена продукта (твой продукт вместо чужого)
  2. Замена аватара (твой актёр вместо чужого)
  3. 1:1 воссоздание только с заменой локации
  • Вход: URL видео-источника + режим
  • Выход: Новое видео сцена за сценой

Наш аналог: video-clone-competitor — те же 3 кейса (product-swap / avatar-swap / location-swap), но PySceneDetect + video-analyzer + backend-agnostic regen (auto-routing Higgsfield ↔ direct Veo). реализовано


Блок 2 — Идентичность

soul-id — дословно из ответа их агента. element — реконструкция из их Cinema Studio Elements System.

soul-id

Что делает: Тренирует постоянную модель лица из 1–100 фото. После тренировки один и тот же человек появляется стабильно во всех генерациях.

  • Вход: Папка с фотографиями лица (jpg/png/webp)
  • Время тренировки: до 30 минут
  • Выход: reference_id (UUID) → используется в text2image_soul_v2

Наш аналог: уже подключено в video-clipgen-higgsfield через train_avatar.sh (аватар «anatoliy_stepanov» натренирован). Higgsfield-only — единственный provider с persistent face training; альтернативы (Veo/Runway/Sora) не умеют. оправданная зависимость

element

Что делает: Тренирует персистентный «элемент» — персонаж (не лицо), локацию или prop (объект). Позволяет переиспользовать один и тот же объект/локацию между генерациями. Часть Cinema Studio Elements System (5 source tabs × 6 категорий).

  • Вход: фото объекта / локации / персонажа
  • Выход: reference на элемент для composition в Cinematic Studio

Наш аналог: частично — reference images в video-clipgen (Veo до 3 ref-фото) и video-clipgen-higgsfield (I2V с image-ref). Персистентной тренировки prop/локации у нас нет — используем reference photos per-generation. partial


Блок 3 — Производство (форматные пайплайны)

Реконструкция из их Marketing Studio + GitHub. Большинство — внутренние flow их веб-агента, не CLI.

Реклама

СкиллЧто делает (реконструкция)Наш аналог
tv-adПолноценный рекламный ролик с нарративной структурой (hook → demo → CTA)video-orchestrator (voiceover/textover pipelines)
motion-design-flowMotion-graphics ролик, data-viz, анимированный текст/графикаvideo-motionfx + video-remotion
product-photoshootСтудийная/lifestyle фотосессия продукта, 10 режимов (CLI-доступно)creative-orchestrator (10 modes через Gemini, default) + опц. Higgsfield
amazon-product-listingКарточки маркетплейса: main image + secondary + A+ modules (CLI: marketplace-cards)❌ не делаем (Amazon-карточки вне нашей ниши)

UGC

СкиллЧто делает (реконструкция)Наш аналог
ugc-flowБазовый UGC-ролик «реальный человек говорит в камеру»copywriter (UGC voice) → clipgen (Seedance)
ugc-product-flowUGC-демо продукта в рукахcopywriter + clone-competitor (product-swap)
ugc-try-on-flowПримерка/использование продукта на человекеHiggsfield product-photoshoot virtual_model_tryout mode
ugc-tutorial-flowТуториал «как пользоваться»creative-explainer-video
ugc-unboxing-flowРаспаковка продуктаcopywriter + clipgen (unboxing prompt)

Другие форматы

СкиллЧто делает (реконструкция)Наш аналог
podcast-flowПодкаст-формат (talking head, длинный, разговорный)video-screencast (talking-head) + captions
cinematic-flowКинематографичный ролик с camera controlvideo-clipgen-higgsfield (Cinematic Studio V2/V3)
cartoon-flowМультяшный/анимированный стиль❌ не делаем (вне ниши; при нужде — Remotion/motionfx)
video-adapt(дубль из Блока 1 — адаптация чужого видео)video-clone-competitor

Блок 4 — Генерация

Реконструкция. Это базовый слой движков, на которые опираются форматные пайплайны.

СкиллЧто делаетНаш аналог
image-generationГенерация статики (Soul V2, FLUX.2, Nano Banana Pro, GPT Image 2, Seedream V5)creative-poster (Gemini 3 Pro, default) + video-clipgen-higgsfield (image models)
video-generationГенерация видео (Veo 3.1, Kling 3.0, Wan 2.7, Seedance 2.0, Cinematic Studio)video-clipgen (direct Veo) + video-clipgen-higgsfield (36 моделей)
montageСборка финального видео из клипов (slash /montage)video-director (FFmpeg монтаж + music ducking)

Блок 5 — Дистрибуция

Реконструкция. У нас этот слой намеренно не реализован (YAGNI) — публикуем вручную или через Trello.

СкиллЧто делаетНаш статус
connectorВыгрузка в Notion / Slack / Google Drive❌ не реализовано (ручной upload). Идея на будущее.
xurlПостинг в Twitter / X❌ не реализовано (не наш канал)
youtubeЗагрузка на YouTube❌ не реализовано
telegram_sendОтправка в Telegram🟡 частично — есть trello-add для задач; автопостинг готовых креативов в TG — идея на будущее

Что реально callable через CLI vs внутренняя абстракция

Компонент SupercomputerРеальностьCLI-команда (если есть)
brand-analyzer✅ Callablehiggsfield marketing-studio brand-kits fetch --url
product-analyzer✅ Callablehiggsfield marketing-studio webproducts fetch --url
product-photoshoot✅ Callablehiggsfield product-photoshoot create --mode (10 modes)
amazon-product-listing✅ Callablehiggsfield marketplace-cards create
soul-id✅ Callablehiggsfield-soul-id / train_avatar.sh
image/video-generation✅ Callablehiggsfield-generate (30+ моделей)
montage🟡 Slash-команда/montage (web-агент)
tv-ad / motion-design-flow / *-flow❌ Абстракция агента— (внутренняя оркестрация Supercomputer)
trend-picker❌ Абстракция агента— (но Marketing Studio имеет частичные куски)
video-adapt❌ Абстракция агента
element🟡 UI-фичаCinema Studio Elements (web UI, не CLI)
connector / xurl / youtube / telegram_send❌ Абстракция агента

Итоговый мэппинг: их слой → наш аналог → статус

Higgsfield SupercomputerНаш аналогСтатус
brand-analyzervideo-project-setup/scripts/brand_fetch.py✅ реализовано (local-first)
product-analyzervideo-project-setup/scripts/product_fetch.py✅ реализовано (local-first)
trend-pickertrend-picker (3 mode)✅ реализовано (без Higgsfield)
video-adaptvideo-clone-competitor (3 mode)✅ реализовано (backend-agnostic)
soul-idvideo-clipgen-higgsfield✅ Higgsfield-only (оправдано)
elementreference images (video-clipgen)🟡 partial
Производство (*-flow)video-orchestrator + форматные скиллы✅ свои аналоги
Генерация (image/video/montage)clipgen / clipgen-higgsfield / director✅ реализовано
Дистрибуция (connector/xurl/youtube/telegram)trello-add + ручной upload❌ намеренно не реализовано (YAGNI)
Резюме: мы воспроизвели интеллектуальные слои Supercomputer (Анализ + video-adapt) локально, без зависимости от их $199/мес подписки — кроме Soul-ID (face training, объективно незаменим) и Cinematic Studio camera moves. Слой Дистрибуции сознательно пропустили. Подробности развязки зависимостей: Архитектура → Backend-agnostic.