Performante Video Pipeline
Production-grade рекламный конвейер для агентства: 18 скиллов, 4 типа выхода (видео-объявления / постеры / карусели / explainer-видео) + 2 новых intelligence-слоя (auto-concept generation, scene-by-scene competitor clone), shared SQLite база, multi-project архитектура, backend-agnostic подход (минимизация vendor lock-in). Эта база знаний — всё что нужно чтобы продолжить работу над системой.
Обзор системы → Архитектура → Пайплайны → Onboarding-чеклист. Этого хватит чтобы понять что и где. Конкретные скиллы — открывай по мере необходимости через сайдбар.
Что это за система
Анатолий Степанов руководит агентством Performante — Meta-таргет в Казахстане для клиник, медтехники, фитнеса, ресторанов. На каждого клиента нужно 10-30 креативов в месяц: видео-объявления, статика, карусели, кейс-стади. Делать руками невозможно — нужна фабрика. Эта система — та самая фабрика.
Входы: брифы клиентов + референсы (фото, видео конкурентов). Выходы: готовые .mp4/.png/.zip креативы, проверенные QA, с метаданными прицепленными к проектам в общей БД. Один человек на одного клиента может выкатывать в день столько креативов, сколько раньше выкатывала команда из трёх за неделю.
Что выдаёт система
Видео-объявления
9-30 сек .mp4 с озвучкой (ElevenLabs), музыкой и анимированными субтитрами. Текст — копирайтером, видео — собирается из clip library Director'ом.
Статичные постеры
4:5 / 9:16 / 1:1 / 2:3 .png через Gemini 3 Pro Image + brand-library. Auto-QA по Vision, multi-aspect outpaint, variant explosion по углам.
Instagram-карусели
5-10 swipe-слайдов в ZIP + PDF preview. Через Remotion (TSX), не Gemini — нет проблем с Cyrillic/CTA/softbox.
Длинные explainer-видео
2-5 мин туториалы / кейс-стади / демо. Remotion + ElevenLabs TTS, scene-based timeline, optional bg-music.
18 скиллов одной таблицей
| # | Скилл | Что делает | Когда вызвать |
|---|---|---|---|
| 0 | video-project-setup UPD | Создаёт новый проект + auto-fetch brand/products с URL через локальный scraper (BeautifulSoup + schema.org, без paid API; Higgsfield optional fallback) | «добавь проект», «новый клиент» |
| 1 | video-orchestrator UPD | Top-level: + upstream trend-discovery mode; smart routing concepts → правильный backend (UGC → Seedance, cinematic → Cinematic Studio, talking-head → Soul Cast, motion graphics → MotionFX) | «сделай 3 ролика», «produce ads» |
| 2 | video-copywriter | Пишет тексты озвучки (7 типов: storytelling / direct / expert / textover / telegram / threads / reference) | «напиши скрипт», «придумай текст» |
| 3 | video-voiceover | Озвучка через ElevenLabs с rotation по голосам проекта | «озвучь», «нужен TTS» |
| 4 | video-director | Подбирает клипы под озвучку, монтирует через FFmpeg (2-3 варианта) | «собери ролик», «смонтируй» |
| 5 | video-clipgen | Генерирует клипы через Veo 3.1 (direct Google Cloud, по брифу + reference photos) | «сгенерируй клипы», «нужен материал» |
| 5+ | video-clipgen-higgsfield MCSLA | 36 моделей через Higgsfield + Soul-ID + MCSLA prompt formula + 10 жанровых шаблонов + 11 sub-skills (Cinema Studio docs, Seedance/Kling/Soul deep-dives). MCSLA backend-agnostic. | «higgsfield», «soul-id», «cinematic camera» |
| 6 | video-analyzer | Анализирует видео (frame extract + LLM vision), добавляет в clip library | «проанализируй видео», «добавь в базу» |
| 7 | video-remotion | Анимированные motion-graphics клипы через Remotion (intro/CTA/lower-third) | «нужно интро», «анимированная заставка» |
| 8 | video-motionfx | 26 Remocn-компонентов + Three.js для data-viz / charts / 3D | «анимированный график», «3D showcase» |
| 9 | video-captions | Whisper + ASS + FFmpeg → karaoke-субтитры локально | «добавь субтитры» |
| 10 | video-reviewer | Vision-QA готового ролика: scores + issues + suggested fixes | «проверь видео», «оцени качество» |
| 11 | video-screencast | Talking-head / Screen Studio: silence detect + dedupe takes + voice cleanup | «смонтируй запись», «убери дубли» |
| 11+ | trend-picker NEW | Auto-concept generation поверх instagram-research + video-analyzer + LLM. 3 режима: trend_discovery / viral_analysis / creator_dna. Output: N ready-to-go concept briefs (hook + structure + CTA + MCSLA model). | «найди тренды», «концепции для рекламы», «в стиле @handle» |
| 11++ | video-clone-competitor NEW | Scene-by-scene clone чужого ролика (URL → yt-dlp / instagram-cli → PySceneDetect → video-analyzer → LLM adapt → regen с auto-routing higgsfield/veo → ffmpeg stitch). 3 mode: product-swap / avatar-swap / location-swap. | «клонируй ролик», «пересними с нашим продуктом» |
| 12 | creative-poster | Статичные постеры через Gemini Image (brand-lib, presets, multi-aspect, QA) | «сделай постер» |
| 13 | creative-orchestrator UPD | Top-level для статики + 10 product-photoshoot modes через Gemini prompt templates (по умолчанию; Higgsfield product-photoshoot opt-in только для auto-branding по brand_kit_id) | «сделай 5 постеров», «фабрика креативов» |
| 14 | creative-carousel | Instagram-карусели через Remotion (9 типов слайдов, 5 шаблонов) | «сделай карусель» |
| 15 | creative-explainer-video | Длинные narrated видео через Remotion + ElevenLabs (9 типов сцен, 4 шаблона) | «сделай туториал», «case study video» |
🧠 Intelligence layer (новое, 2026-05)
Два новых скилла добавляют upstream-интеллект к существующему конвейеру — превращают competitive intel в готовые брифы и клоны:
trend-picker (3 режима)
- trend_discovery: niche → 8 концептов на основе топ-10 рилсов
- viral_analysis: 1 URL → 1 clone-ready brief
- creator_dna: @handle → 9-секционный DNA-профиль + N концептов в стиле автора
Output: concepts.json по строгой схеме + trend-report.md. Routing per concept в нужный backend.
video-clone-competitor (3 mode)
- product-swap: наш продукт вместо чужого
- avatar-swap: наш Soul-ID вместо их актёра
- location-swap: наша локация
Backend-agnostic regen: --backend auto разводит сцены между Higgsfield (Soul-ID/cinematic) и direct Veo (cheaper). ~50% экономия на типичном reel.
Принципы системы
~/video-projects/<slug>/ со своим project.yaml, brand.yaml, brief.md, references/. Ресурсы (клипы, голоса, музыка) — общие через junction-таблицы. Подробно: Архитектура.
~/video-projects/director.db. Schema v8. Все скиллы читают/пишут одну базу, scoping через junction-таблицы. Подробно: База данных.
~/.claude/skills/<name>/ с SKILL.md + scripts/*.py. Скрипты автономны, можно вызвать руками. Claude находит скилл по MANDATORY TRIGGERS в SKILL.md.
project/brand.yaml (colors, fonts, voice, forbidden words) и инжектят в prompt. Не нужно повторять brand-info в каждом вызове.
preview.html с payload-сайдбаром (промпт / референсы / brand / model / стоимость). Подробно: GR-1.
Куда смотреть когда что-то сломалось
| Симптом | Куда копать |
|---|---|
| Скилл не вызвался когда должен был | SKILL.md → секция MANDATORY TRIGGERS. Добавь свой триггер. |
| «project not found» | Запусти video-project-setup или проверь ~/video-projects/<slug>/project.yaml |
| БД пустая / нет таблиц | python schema.py init <project-dir> или migrate — см. БД |
| Gemini Image: ₸ заменилось на Т, или CTA-кнопка нарисовалась | Известный баг Gemini. Для карусели — используется Remotion (нет бага). Для poster — отрегенерь, проверь промпт. creative-poster |
| Veo генерит белиберду в кадре (текст / интерфейсы) | Veo-промпт должен явно запрещать text/labels/screens/captions. См. clipgen |
| ElevenLabs квота кончилась | Смени voice_id или API-key в project.yaml. voiceover |
| Whisper неверно расшифровал — субтитры с ошибками | Всегда передавай --text с оригинальным копирайтерским текстом в captions. См. captions |
Куда дальше
Если ты новый разработчик и читаешь это впервые:
- Обзор системы — что было до, почему так построено, эволюция (Veo-only → +Remotion + ElevenLabs + Gemini Image)
- Multi-project архитектура — как организован
~/video-projects/, как резолвится проект из user-команды, что вproject.yaml - База данных — schema v8, junction-таблицы, типичные SQL-запросы
- 7 пайплайнов — flow-диаграммы для всех 4 типов выхода + screencast
- Onboarding-чеклист — что установить локально, env-vars, как запустить первый проект
Дальше — открывай конкретные скиллы по мере необходимости. Каждая страница скилла самодостаточна (что делает / как / триггеры / gotchas).