Performante Video Pipeline

Production-grade рекламный конвейер для агентства: 18 скиллов, 4 типа выхода (видео-объявления / постеры / карусели / explainer-видео) + 2 новых intelligence-слоя (auto-concept generation, scene-by-scene competitor clone), shared SQLite база, multi-project архитектура, backend-agnostic подход (минимизация vendor lock-in). Эта база знаний — всё что нужно чтобы продолжить работу над системой.

🔓 Backend-agnostic (2026-05-19) — Higgsfield AI теперь опциональный backend, а не required dependency. Brand/product fetch идёт через local Python scraper по умолчанию (без paid API). Image generation — Gemini 3 Pro Image по умолчанию (вместо Higgsfield product-photoshoot). Video regen в clone-pipeline — auto-routing между direct Veo и Higgsfield. Higgsfield дёргаем только там где он реально незаменим (Soul-ID face training, Cinematic Studio camera moves). Подробнее: Архитектура → Backend-agnostic.
Если ты только что присоединился к проекту — иди по порядку:
Обзор системыАрхитектураПайплайныOnboarding-чеклист. Этого хватит чтобы понять что и где. Конкретные скиллы — открывай по мере необходимости через сайдбар.
🎬 Хочешь сразу увидеть как это выглядит? Открой Showcase реальных работ — 30+ embedded артефактов (постеры, карусели, Veo-клипы, voiceover mp3, финальные видео-объявления). Всё что пайплайн уже сгенерил для apparatus, bas-dent и performante-ai-agency.

Что это за система

Анатолий Степанов руководит агентством Performante — Meta-таргет в Казахстане для клиник, медтехники, фитнеса, ресторанов. На каждого клиента нужно 10-30 креативов в месяц: видео-объявления, статика, карусели, кейс-стади. Делать руками невозможно — нужна фабрика. Эта система — та самая фабрика.

Входы: брифы клиентов + референсы (фото, видео конкурентов). Выходы: готовые .mp4/.png/.zip креативы, проверенные QA, с метаданными прицепленными к проектам в общей БД. Один человек на одного клиента может выкатывать в день столько креативов, сколько раньше выкатывала команда из трёх за неделю.

Что выдаёт система

VIDEO ADS

Видео-объявления

9-30 сек .mp4 с озвучкой (ElevenLabs), музыкой и анимированными субтитрами. Текст — копирайтером, видео — собирается из clip library Director'ом.

STATIC

Статичные постеры

4:5 / 9:16 / 1:1 / 2:3 .png через Gemini 3 Pro Image + brand-library. Auto-QA по Vision, multi-aspect outpaint, variant explosion по углам.

CAROUSEL

Instagram-карусели

5-10 swipe-слайдов в ZIP + PDF preview. Через Remotion (TSX), не Gemini — нет проблем с Cyrillic/CTA/softbox.

EXPLAINER

Длинные explainer-видео

2-5 мин туториалы / кейс-стади / демо. Remotion + ElevenLabs TTS, scene-based timeline, optional bg-music.

18 скиллов одной таблицей

# Скилл Что делает Когда вызвать
0video-project-setup UPDСоздаёт новый проект + auto-fetch brand/products с URL через локальный scraper (BeautifulSoup + schema.org, без paid API; Higgsfield optional fallback)«добавь проект», «новый клиент»
1video-orchestrator UPDTop-level: + upstream trend-discovery mode; smart routing concepts → правильный backend (UGC → Seedance, cinematic → Cinematic Studio, talking-head → Soul Cast, motion graphics → MotionFX)«сделай 3 ролика», «produce ads»
2video-copywriterПишет тексты озвучки (7 типов: storytelling / direct / expert / textover / telegram / threads / reference)«напиши скрипт», «придумай текст»
3video-voiceoverОзвучка через ElevenLabs с rotation по голосам проекта«озвучь», «нужен TTS»
4video-directorПодбирает клипы под озвучку, монтирует через FFmpeg (2-3 варианта)«собери ролик», «смонтируй»
5video-clipgenГенерирует клипы через Veo 3.1 (direct Google Cloud, по брифу + reference photos)«сгенерируй клипы», «нужен материал»
5+video-clipgen-higgsfield MCSLA36 моделей через Higgsfield + Soul-ID + MCSLA prompt formula + 10 жанровых шаблонов + 11 sub-skills (Cinema Studio docs, Seedance/Kling/Soul deep-dives). MCSLA backend-agnostic.«higgsfield», «soul-id», «cinematic camera»
6video-analyzerАнализирует видео (frame extract + LLM vision), добавляет в clip library«проанализируй видео», «добавь в базу»
7video-remotionАнимированные motion-graphics клипы через Remotion (intro/CTA/lower-third)«нужно интро», «анимированная заставка»
8video-motionfx26 Remocn-компонентов + Three.js для data-viz / charts / 3D«анимированный график», «3D showcase»
9video-captionsWhisper + ASS + FFmpeg → karaoke-субтитры локально«добавь субтитры»
10video-reviewerVision-QA готового ролика: scores + issues + suggested fixes«проверь видео», «оцени качество»
11video-screencastTalking-head / Screen Studio: silence detect + dedupe takes + voice cleanup«смонтируй запись», «убери дубли»
11+trend-picker NEWAuto-concept generation поверх instagram-research + video-analyzer + LLM. 3 режима: trend_discovery / viral_analysis / creator_dna. Output: N ready-to-go concept briefs (hook + structure + CTA + MCSLA model).«найди тренды», «концепции для рекламы», «в стиле @handle»
11++video-clone-competitor NEWScene-by-scene clone чужого ролика (URL → yt-dlp / instagram-cli → PySceneDetect → video-analyzer → LLM adapt → regen с auto-routing higgsfield/veo → ffmpeg stitch). 3 mode: product-swap / avatar-swap / location-swap.«клонируй ролик», «пересними с нашим продуктом»
12creative-posterСтатичные постеры через Gemini Image (brand-lib, presets, multi-aspect, QA)«сделай постер»
13creative-orchestrator UPDTop-level для статики + 10 product-photoshoot modes через Gemini prompt templates (по умолчанию; Higgsfield product-photoshoot opt-in только для auto-branding по brand_kit_id)«сделай 5 постеров», «фабрика креативов»
14creative-carouselInstagram-карусели через Remotion (9 типов слайдов, 5 шаблонов)«сделай карусель»
15creative-explainer-videoДлинные narrated видео через Remotion + ElevenLabs (9 типов сцен, 4 шаблона)«сделай туториал», «case study video»

🧠 Intelligence layer (новое, 2026-05)

Два новых скилла добавляют upstream-интеллект к существующему конвейеру — превращают competitive intel в готовые брифы и клоны:

CONCEPTS

trend-picker (3 режима)

  • trend_discovery: niche → 8 концептов на основе топ-10 рилсов
  • viral_analysis: 1 URL → 1 clone-ready brief
  • creator_dna: @handle → 9-секционный DNA-профиль + N концептов в стиле автора

Output: concepts.json по строгой схеме + trend-report.md. Routing per concept в нужный backend.

CLONE

video-clone-competitor (3 mode)

  • product-swap: наш продукт вместо чужого
  • avatar-swap: наш Soul-ID вместо их актёра
  • location-swap: наша локация

Backend-agnostic regen: --backend auto разводит сцены между Higgsfield (Soul-ID/cinematic) и direct Veo (cheaper). ~50% экономия на типичном reel.

Принципы системы

Multi-project — Performante держит много клиентов параллельно. Каждый = папка ~/video-projects/<slug>/ со своим project.yaml, brand.yaml, brief.md, references/. Ресурсы (клипы, голоса, музыка) — общие через junction-таблицы. Подробно: Архитектура.
One shared SQLite~/video-projects/director.db. Schema v8. Все скиллы читают/пишут одну базу, scoping через junction-таблицы. Подробно: База данных.
Skill = standalone CLI — каждый скилл это папка ~/.claude/skills/<name>/ с SKILL.md + scripts/*.py. Скрипты автономны, можно вызвать руками. Claude находит скилл по MANDATORY TRIGGERS в SKILL.md.
Brand-injection auto — все creative-* скиллы автоматически подгружают project/brand.yaml (colors, fonts, voice, forbidden words) и инжектят в prompt. Не нужно повторять brand-info в каждом вызове.
GR-1: Preview pages обязательны — каждый сгенерированный артефакт (постер / карусель / explainer-видео) автоматически создаёт self-contained preview.html с payload-сайдбаром (промпт / референсы / brand / model / стоимость). Подробно: GR-1.

Куда смотреть когда что-то сломалось

СимптомКуда копать
Скилл не вызвался когда должен былSKILL.md → секция MANDATORY TRIGGERS. Добавь свой триггер.
«project not found»Запусти video-project-setup или проверь ~/video-projects/<slug>/project.yaml
БД пустая / нет таблицpython schema.py init <project-dir> или migrate — см. БД
Gemini Image: ₸ заменилось на Т, или CTA-кнопка нарисоваласьИзвестный баг Gemini. Для карусели — используется Remotion (нет бага). Для poster — отрегенерь, проверь промпт. creative-poster
Veo генерит белиберду в кадре (текст / интерфейсы)Veo-промпт должен явно запрещать text/labels/screens/captions. См. clipgen
ElevenLabs квота кончиласьСмени voice_id или API-key в project.yaml. voiceover
Whisper неверно расшифровал — субтитры с ошибкамиВсегда передавай --text с оригинальным копирайтерским текстом в captions. См. captions

Куда дальше

Если ты новый разработчик и читаешь это впервые:

  1. Обзор системы — что было до, почему так построено, эволюция (Veo-only → +Remotion + ElevenLabs + Gemini Image)
  2. Multi-project архитектура — как организован ~/video-projects/, как резолвится проект из user-команды, что в project.yaml
  3. База данных — schema v8, junction-таблицы, типичные SQL-запросы
  4. 7 пайплайнов — flow-диаграммы для всех 4 типов выхода + screencast
  5. Onboarding-чеклист — что установить локально, env-vars, как запустить первый проект

Дальше — открывай конкретные скиллы по мере необходимости. Каждая страница скилла самодостаточна (что делает / как / триггеры / gotchas).