Performante Video Pipeline

Production-grade рекламный конвейер для агентства: 18 скиллов, 4 типа выхода (видео-объявления / постеры / карусели / explainer-видео) + 2 новых intelligence-слоя (auto-concept generation, scene-by-scene competitor clone), shared SQLite база, multi-project архитектура, backend-agnostic подход (минимизация vendor lock-in). Эта база знаний — всё что нужно чтобы продолжить работу над системой.

🔓 Backend-agnostic (2026-05-19) — Higgsfield AI теперь опциональный backend, а не required dependency. Brand/product fetch идёт через local Python scraper по умолчанию (без paid API). Image generation — Gemini 3 Pro Image по умолчанию (вместо Higgsfield product-photoshoot). Video regen в clone-pipeline — auto-routing между direct Veo и Higgsfield. Higgsfield дёргаем только там где он реально незаменим (Soul-ID face training, Cinematic Studio camera moves). Подробнее: Архитектура → Backend-agnostic.

Если ты только что присоединился к проекту — иди по порядку:
Обзор системы → Архитектура → Пайплайны → Onboarding-чеклист. Этого хватит чтобы понять что и где. Конкретные скиллы — открывай по мере необходимости через сайдбар.

🎬 Хочешь сразу увидеть как это выглядит? Открой Showcase реальных работ — 30+ embedded артефактов (постеры, карусели, Veo-клипы, voiceover mp3, финальные видео-объявления). Всё что пайплайн уже сгенерил для apparatus, bas-dent и performante-ai-agency.

Что это за система

Анатолий Степанов руководит агентством Performante — Meta-таргет в Казахстане для клиник, медтехники, фитнеса, ресторанов. На каждого клиента нужно 10-30 креативов в месяц: видео-объявления, статика, карусели, кейс-стади. Делать руками невозможно — нужна фабрика. Эта система — та самая фабрика.

Входы: брифы клиентов + референсы (фото, видео конкурентов). Выходы: готовые .mp4/.png/.zip креативы, проверенные QA, с метаданными прицепленными к проектам в общей БД. Один человек на одного клиента может выкатывать в день столько креативов, сколько раньше выкатывала команда из трёх за неделю.

Что выдаёт система

VIDEO ADS

Видео-объявления

9-30 сек .mp4 с озвучкой (ElevenLabs), музыкой и анимированными субтитрами. Текст — копирайтером, видео — собирается из clip library Director'ом.

STATIC

Статичные постеры

4:5 / 9:16 / 1:1 / 2:3 .png через Gemini 3 Pro Image + brand-library. Auto-QA по Vision, multi-aspect outpaint, variant explosion по углам.

CAROUSEL

Instagram-карусели

5-10 swipe-слайдов в ZIP + PDF preview. Через Remotion (TSX), не Gemini — нет проблем с Cyrillic/CTA/softbox.

EXPLAINER

Длинные explainer-видео

2-5 мин туториалы / кейс-стади / демо. Remotion + ElevenLabs TTS, scene-based timeline, optional bg-music.

18 скиллов одной таблицей

#	Скилл	Что делает	Когда вызвать
0	video-project-setup UPD	Создаёт новый проект + auto-fetch brand/products с URL через локальный scraper (BeautifulSoup + schema.org, без paid API; Higgsfield optional fallback)	«добавь проект», «новый клиент»
1	video-orchestrator UPD	Top-level: + upstream trend-discovery mode; smart routing concepts → правильный backend (UGC → Seedance, cinematic → Cinematic Studio, talking-head → Soul Cast, motion graphics → MotionFX)	«сделай 3 ролика», «produce ads»
2	video-copywriter	Пишет тексты озвучки (7 типов: storytelling / direct / expert / textover / telegram / threads / reference)	«напиши скрипт», «придумай текст»
3	video-voiceover	Озвучка через ElevenLabs с rotation по голосам проекта	«озвучь», «нужен TTS»
4	video-director	Подбирает клипы под озвучку, монтирует через FFmpeg (2-3 варианта)	«собери ролик», «смонтируй»
5	video-clipgen	Генерирует клипы через Veo 3.1 (direct Google Cloud, по брифу + reference photos)	«сгенерируй клипы», «нужен материал»
5+	video-clipgen-higgsfield MCSLA	36 моделей через Higgsfield + Soul-ID + MCSLA prompt formula + 10 жанровых шаблонов + 11 sub-skills (Cinema Studio docs, Seedance/Kling/Soul deep-dives). MCSLA backend-agnostic.	«higgsfield», «soul-id», «cinematic camera»
6	video-analyzer	Анализирует видео (frame extract + LLM vision), добавляет в clip library	«проанализируй видео», «добавь в базу»
7	video-remotion	Анимированные motion-graphics клипы через Remotion (intro/CTA/lower-third)	«нужно интро», «анимированная заставка»
8	video-motionfx	26 Remocn-компонентов + Three.js для data-viz / charts / 3D	«анимированный график», «3D showcase»
9	video-captions	Whisper + ASS + FFmpeg → karaoke-субтитры локально	«добавь субтитры»
10	video-reviewer	Vision-QA готового ролика: scores + issues + suggested fixes	«проверь видео», «оцени качество»
11	video-screencast	Talking-head / Screen Studio: silence detect + dedupe takes + voice cleanup	«смонтируй запись», «убери дубли»
11+	trend-picker NEW	Auto-concept generation поверх instagram-research + video-analyzer + LLM. 3 режима: trend_discovery / viral_analysis / creator_dna. Output: N ready-to-go concept briefs (hook + structure + CTA + MCSLA model).	«найди тренды», «концепции для рекламы», «в стиле @handle»
11++	video-clone-competitor NEW	Scene-by-scene clone чужого ролика (URL → yt-dlp / instagram-cli → PySceneDetect → video-analyzer → LLM adapt → regen с auto-routing higgsfield/veo → ffmpeg stitch). 3 mode: product-swap / avatar-swap / location-swap.	«клонируй ролик», «пересними с нашим продуктом»
12	creative-poster	Статичные постеры через Gemini Image (brand-lib, presets, multi-aspect, QA)	«сделай постер»
13	creative-orchestrator UPD	Top-level для статики + 10 product-photoshoot modes через Gemini prompt templates (по умолчанию; Higgsfield product-photoshoot opt-in только для auto-branding по brand_kit_id)	«сделай 5 постеров», «фабрика креативов»
14	creative-carousel	Instagram-карусели через Remotion (9 типов слайдов, 5 шаблонов)	«сделай карусель»
15	creative-explainer-video	Длинные narrated видео через Remotion + ElevenLabs (9 типов сцен, 4 шаблона)	«сделай туториал», «case study video»

🧠 Intelligence layer (новое, 2026-05)

Два новых скилла добавляют upstream-интеллект к существующему конвейеру — превращают competitive intel в готовые брифы и клоны:

CONCEPTS

trend-picker (3 режима)

trend_discovery: niche → 8 концептов на основе топ-10 рилсов
viral_analysis: 1 URL → 1 clone-ready brief
creator_dna: @handle → 9-секционный DNA-профиль + N концептов в стиле автора

Output: concepts.json по строгой схеме + trend-report.md. Routing per concept в нужный backend.

CLONE

video-clone-competitor (3 mode)

product-swap: наш продукт вместо чужого
avatar-swap: наш Soul-ID вместо их актёра
location-swap: наша локация

Backend-agnostic regen: --backend auto разводит сцены между Higgsfield (Soul-ID/cinematic) и direct Veo (cheaper). ~50% экономия на типичном reel.

Принципы системы

Multi-project — Performante держит много клиентов параллельно. Каждый = папка ~/video-projects/<slug>/ со своим project.yaml, brand.yaml, brief.md, references/. Ресурсы (клипы, голоса, музыка) — общие через junction-таблицы. Подробно: Архитектура.

One shared SQLite — ~/video-projects/director.db. Schema v8. Все скиллы читают/пишут одну базу, scoping через junction-таблицы. Подробно: База данных.

Skill = standalone CLI — каждый скилл это папка ~/.claude/skills/<name>/ с SKILL.md + scripts/*.py. Скрипты автономны, можно вызвать руками. Claude находит скилл по MANDATORY TRIGGERS в SKILL.md.

Brand-injection auto — все creative-* скиллы автоматически подгружают project/brand.yaml (colors, fonts, voice, forbidden words) и инжектят в prompt. Не нужно повторять brand-info в каждом вызове.

GR-1: Preview pages обязательны — каждый сгенерированный артефакт (постер / карусель / explainer-видео) автоматически создаёт self-contained preview.html с payload-сайдбаром (промпт / референсы / brand / model / стоимость). Подробно: GR-1.

Куда смотреть когда что-то сломалось

Симптом	Куда копать
Скилл не вызвался когда должен был	SKILL.md → секция MANDATORY TRIGGERS. Добавь свой триггер.
«project not found»	Запусти `video-project-setup` или проверь `~/video-projects/<slug>/project.yaml`
БД пустая / нет таблиц	`python schema.py init <project-dir>` или `migrate` — см. БД
Gemini Image: ₸ заменилось на Т, или CTA-кнопка нарисовалась	Известный баг Gemini. Для карусели — используется Remotion (нет бага). Для poster — отрегенерь, проверь промпт. creative-poster
Veo генерит белиберду в кадре (текст / интерфейсы)	Veo-промпт должен явно запрещать text/labels/screens/captions. См. clipgen
ElevenLabs квота кончилась	Смени voice_id или API-key в project.yaml. voiceover
Whisper неверно расшифровал — субтитры с ошибками	Всегда передавай `--text` с оригинальным копирайтерским текстом в captions. См. captions

Куда дальше

Если ты новый разработчик и читаешь это впервые:

Обзор системы — что было до, почему так построено, эволюция (Veo-only → +Remotion + ElevenLabs + Gemini Image)
Multi-project архитектура — как организован ~/video-projects/, как резолвится проект из user-команды, что в project.yaml
База данных — schema v8, junction-таблицы, типичные SQL-запросы
7 пайплайнов — flow-диаграммы для всех 4 типов выхода + screencast
Onboarding-чеклист — что установить локально, env-vars, как запустить первый проект

Дальше — открывай конкретные скиллы по мере необходимости. Каждая страница скилла самодостаточна (что делает / как / триггеры / gotchas).