Как создать киношные AI-видео с одним лицом? Полный туториал 2026

12:19

Как создать киношные AI-видео с одним лицом? Полный туториал 2026

RixAI 27.12.2025 1 501 просмотров 77 лайков обн. 18.02.2026

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

Как новичку делать киношные AI-видео, где персонаж не меняет лицо каждые 5 секунд? В этом видео я раскрываю подход «Режиссерская сетка 3х3», которая позволяет сохранять единый стиль и создавать сложные сюжеты с нуля. 🎁 Забирай подробную PDF-инструкцию в моем Telegram: https://t.me/+NmiOwLntWek2NDky Ссылка на SYNTX AI: https://syntx.ai/welcome/06Eoljlo Мы пройдем весь путь: от генерации сценария и стартового кадра до финальной сборки в CapCut с озвучкой. Разберем работу с нейросетями Nano Banana Pro (для фото), Kling AI, Veo 3.1 (для видео), а также бесплатные альтернативы (Grok AI). В этом выпуске: - 6 шагов к идеальному ролику: Сценарий - Сетка - Видео. - Как убрать водяные знаки с AI-изображений (2 способа). - Почему длинный сюжет убивает качество и как делить его на сцены. - Секрет «Сетки 3х3»: Получаем 9 ракурсов одной сцены. - Kling AI vs Grok: Что выбрать для анимации (платно/бесплатно)? - Озвучка персонажей через ElevenLabs и добавление SFX. Эта система работает даже если вы никогда не создавали ai-видео. Смотри внимательно и повторяй! Не забудь подписаться и забрать инструкцию в моем телеграм-канале! 👇 ТАЙМКОДЫ: 00:00 Демонстрация результата: AI-сцена с перестрелкой 00:59 Формула успеха: 6 шагов от идеи до рендера 01:41 Инструменты: Nan Banana Pro, Synx и удаление вотермарок 02:18 Шаг 1: Пишем сценарий правильно (простые слова, без лишнего) 03:03 Лайфхак: Делим длинную историю на эпизоды-сетки 03:22 Шаг 2 и 3: Стартовый кадр и Режиссерская сетка 3х3 04:27 Шаг 4 и 5: Отбор лучших дублей и экстракция кадров 06:00 Шаг 6: Генерация видео (Kling AI, Synx, Google Veo) 07:11 Промты для видео: Как использовать Prompt Cowboy и Perplexity 09:58 Бесплатный способ: Генерация через Grok (сразу с озвучкой) 10:37 Саунд-дизайн: Голос ElevenLabs и звуковые эффекты 11:22 Финальная сборка в CapCut и итоги системы #ai #aivideo #нейросети #klingai #nanobanana #kling #видеомонтаж #туториал #chatgpt #grok #фильммейкинг #монтажвидео #elevenlabs #искусственныйинтеллект #гайд #aiart

Оглавление (12 сегментов)

Result demo: AI-powered shootout scene

В этом видео я покажу систему, как новичку стабильно получать киношные кадры в одной стилистике и превращать их в видео. Мы пройдём весь путь от сценария до финальной сборки ролика. Сразу скажу, у меня есть подробная инструкция в PDF. Я отдаю её абсолютно бесплатно. Ссылка будет в описании или в закреплённом комментарии. А в этом видео я покажу всю логику и весь процесс вживую, чтобы ты смог это повторить самостоятельно. Но прежде чем перейти к разбору всех этих шагов и всей этой логики, посмотри видео, которое у меня получилось сгенерировать благодаря этой системе. Как же я устал от этого сила. Мне показалось или я что-то слышал? — У тебя есть ровно 5 секунд, чтобы сказать, что тебе нужно. После этого я нажимаю на курок. — Я принёс новогоднее настроение, мой сын.

Formula for success: 6 steps from idea to render

— С Новым годом, сын мой. Ну что ж, давай теперь перейдём, конечно же, к разбору этой системы. Как ты видишь, у меня есть небольшая презентация. Да, вот такой результат можно получить, даже если вы никогда не делали AI видео. И теперь давайте перейдём непосредственно к самой формуле. Вся система состоит из шести шагов. Первое - это, конечно же, сценарий. Второе - это стартовое изображение. Третье - это режиссёрская сетка. Четвёртое - отбор лучших кадров. Пятое - это экстракция без потери

Tools: Nan Banana Pro, Synx, and watermark removal

качества. И шестое - это, конечно же, генерация видео. Ну и, если нужно, это озвучка и звуковые эффекты. Начнём с инструмента для генерации картинок, потому что это основа. Я вообще использую nano Banan Pro. Мне она нравится, потому что она стоит дёшево, часто доступна бесплатно и может выдавать картинку в хорошем качестве, вплоть до 4K. Доступ к ней можно получить платно через Synнx AI, либо бесплатно через GMIN. Если используешь бесплатный вариант, иногда может появляться watermark. И, кстати говоря, в инструкции я добавил два способа, как это решается. Либо через готовый сайт для удаления меток, либо через расширение, которое называется Monky. которая автоматически убирает те при

Step 1: Writing the script correctly (simple words, no fluff)

генерации изображения. Теперь давай, конечно же, перейдём к первому шагу - это сценарий. Здесь не нужен какой-то суперпром. Тебе не надо быть сценаристом. Достаточно простыми словами описать, что происходит в сцене. Правильного или неправильного фактически нет. Ты пробуешь и по результату понимаешь, что докрутить, а, ну, и что-то где-то поправить. Давай я приведу пример. У меня есть тестовый сюжет: "Домашняя сцена у камина". Тёплая деревянная атмосфера. Я сижу в кресле, курю сигару. Потом через камин залетает Дед Мороз, и я вскакиваю, направляю на него пистолет и спрашиваю, кто он такой. Это просто пример, чтобы ты понял уровень вообще детализации. Очень важное правило. Если у тебя длинная история, не пытайся запихнуть всё в одну сцену. Найросеть не удержит последовательность и просто-напросто получится каша.

Life hack: Dividing a long story into grid-like episodes

Длинный сюжет нужно делить на короткие эпизоды по локациям. Например, сетка номер один. Герой идёт по заснежному лесу, находит дом, подходит к двери. Сетку номер два. Герой заходит внутрь, камин. Он снимает перчатки, садится, пьёт какао. И дальше также. То есть одна сетка, один короткий эпизод. Теперь шаг второй. Стартовый кадр. Стартовое

Steps 2 and 3: Starting shot and 3x3 Director's grid

изображение нужно, чтобы на эйросеть считало персонажа и стиль, то есть лицо, одежду, свет, настроение. Это якорь, который поможет удержать консистентность. Как мы видим, здесь у меня в примере, конечно, изображён такой Санта-Клаус с автоматом. Ну, короче, общая идея понятна, да? То есть мы впоследствии, сейчас мы дойдём до, ну, следующих шагов, мы будем использовать как бы вот эту вот всю консистен консистентность и делать вот эту вот разбивку нашу сетку волшебную. Третий шаг - это режиссёрская сетка 3х3, как раз-таки о чём я и говорил. То есть мы берём стартовый кадр и свой сценарий, потом запускаем большой промт, который, кстати говоря, есть в моей инструкции полный. И этот промт, он генерирует девять разных ракурсов одной сцены. Здесь есть очень важный момент, что один прогон, он фактически никогда не даёт идеальный результат. То есть где-то может поплыть лицо, где-то сломаются какие-то детали. Иногда сетка вообще получается очень плохая, и он использует вообще незнакомые лица и персонажи, да, а не те, которые мы прикрепляли. Поэтому нормально делать там тричетыре, иногда пять-шесть в целом прогонов и выбирать одну-две сетки, где большая часть кадров выглядит стабильно и в одной стилистике.

Steps 4 and 5: Selecting the best takes and extracting frames

Дальше четвёртый шаг - это выбор лучших кадров. То есть мы смотрим на сетку и выбираем кадры, которые лучше всего подходят под последовательность. Обычно тебе нужно не все девять, а, скажем, четыре кадров, которые красиво складываются в мини-сцену. Ну что ж, переходим к пятому шагу - это экстракция кадров и сетки без потери качества. На самом деле, я тестировал много разных вариантов и подписывал изображения, и, а, говорил на эросетите, чтобы она извлекла из там первого столбика первой строчки. И лучше всего работает самый простой - это ты просто берёшь и подписываешь каждый кадр, например, фреймame 1, frame 2, frame 3. И так вот до девяти, например. Это можно сделать абсолютно в любом редакторе, хоть встроенном на компьютере, хоть в каком-то стороннем, например, в той же самой канве, ну или там чем ты вообще пользуешься на постоянной основе. А тут важный момент есть, чтобы, ну, самое главное был были читаемы вот эти надписи, да, и цифры. А я в инструкции тоже об этом прописал. Ты можешь открыть её и посмотреть пошагово. Я там, ну, всё, всё это, короче, изложил. То же самое. Просто мы этот шаг сейчас разобрали, и давай теперь пойдём дальше. Потом ты отправляешь эту подписанную сетку в нейросеть и пишешь запрос на извлечение. А в моём документе я использую определённую формулировку. Я тоже её всю прописал. То есть она начинается так, как типа extract the steel image of frame. И пишу, ну, конкретный как бы кадр и подставляю номер. Итак, ты по очереди вытаскиваешь нужные кадры отдельными картинками. И в итоге у тебя получается не сетка, а набор как бы чистых кадров в хорошем качестве. И это некое твоё сырьё для последующей генерации видео. И дальше у

Step 6: Video generation (Kling AI, Synx, Google Veo)

нас идёт самое сложное - это генерация видео. Здесь у нас есть несколько путей, а это платные, если ты хочешь максимальное качество контролей без лишних запар, и бесплатные способы, чтобы просто быстро протестировать и начать делать вообще что-то, первые ролики какие-то. Давай начнём с платного. Я делаю это через бота, который называется Syntaxi. А там ты выбираешь модели для генерации. Чаще всего я использую клинк, потому что это одна из самых сильных моделей по качеству и по сюжетным переходам. Ну, в частности, CLK O1 image to video. А логикасть достаточно простая. Ты берёшь несколько своих кадров, я иногда вставлял до четырёх, и прямо словами описываешь, что должно происходить между ними, то есть какие движения, какие переходы, что меняется в кадре. И дальше запускаешь генерацию. Ну, например, несколько раз. Потом ты отсматриваешь все варианты, которые получились, и выбираешь, соответственно, самые лучшие. И потом уже, ну, начинаешь с этим работать. Это я тоже сейчас скажу в самом конце. А вопрос, как грамотно ставить этот грёбаный запрос на генерацию видео? Первое, я в своём PDF-документе, а, указал некоторые полезные ссылки на агентов GPT, через которых ты можешь это сделать и протестировать вообще, ну, как бы функционал генерации запросов для нейросети, для генерации видео. А

Prompts for video: How to use Prompt Cowboy and Perplexity

второй вариант, он немножко такой архитекторский. У меня на канале есть видео по сервису Промткавбой. Этот сервис помогает составлять крутые промты для нейросети. Идея такая, то есть ты делаешь исследовательский промт на тему того, как правильно составлять пром в такой-то нейросети, там, например, в клинк или в Voешь его в Perplexity. Ну, то есть сначала в промт Кобой закидываешь, он тебе делает готовый промт, ты его копируешь и закидываешь уже потом для исследования в Perplexity. И найросеть тебе собирает информацию со всех источников, вообще с интернета, как правильно, что писать, делать, вставлять, и у тебя как бы получается готовая инструкция. Дальше ты её экспортируешь в PDF-формате и отправляешь вообще абсолютно в любую найронку. И всё, твоя нейронка обучена, как правильно писать промты для генерации видео в определённой нейросети. Бум. А важный нюанс. В режиме CL O1 Image to video нет озвучки. То есть визуал может быть очень сильный, но звук это уже как бы отдельным шагом делает, друг мой. И тут нужно понимать, что это неплохо и нехорошо. С одной стороны, вопрос: готов ли ты потом запариться и сделать эту озвучку. Зато по логики картинки, логики движения, клинк обычно даёт самый лучший результат. Если тебе нужно, чтобы видео было с озвучкой сразу, в Synx есть режимы, где появляется нативное аудио. Но там как бы сразу и цена X2, например, есть варианты на 5 и на 10 секунд, а стоимость на генерацию ощутимо выше. У меня, например, а, это выходило в два раза, то есть, а, как бы 42 токена, по-моему, или там 22, короче, не помню уже точно. А это выходило без озвучки, и когда я переключался в режим с озвучкой, выбирал модель, у меня как бы цена сразу X2 росла. А, кстати говоря, на момент записи этого видео 26 декабря, а, сейчас в синтаксе есть акция, что на модель CL O1 и Image to видео есть скидка 30% на генерацию. Поэтому пользуюсь. Она, эта скидка действует до 1 января 2026 года. И я как бы попал в неё и создал, в том числе вот этот вот ролик. Дальше ещё один есть вариант. Это с озвучкой от Google Vo31. Он генерирует примерно 8 секунд. Ну не примерно, а точно. И делает это сразу как бы со звуком. Но есть как бы ограничение. Ты можешь прикрепить только два изображения. И это, на самом деле, большой минус, потому что когда тебе нужен более управляемый сюжет, двух кадров оказывается недостаточно. И вот здесь важный момент, который многие не понимают. Чем больше опорных кадров ты можешь прикрепить, тем быстрее и точнее ты управляешь ценой. А в клинк есть режимы, где можно прикреплять четыре изображения. Например, этот режим называ называется Elements Elements. Ну, вы поняли идею. И это по практике моей очень сильно ускоряет вообще создание конечного видео. Потому что, если мы бы работали с двумя изображениями, то, соответственно, нам бы пришлось просто сделать большее количество генерации и найти вот эти вот самые золотые слитки, то есть большее количество видео проанализировать. Теперь давай я

Free method: Generation via Grok (directly from Voice acting)

поделюсь бесплатным путём. Это грок. А качество, конечно, будет хуже, чем уроли, но он идеален, чтобы просто начать и почувствовать весь процесс. В грок я выбираю раздел Imagine, затем видео, ставлю соотношение 3х2, пишу запрос и запускаю генерацию. И важный плюс, грок делает видео сразу с озвучкой. Поэтому новичкам я бы советовал начать именно с этой наэросеть грок, чтобы быстро получить первый результат без лишних сложностей. А когда ты уже почувствуешь с кайфом весь процесс, переходишь на клинк и начинаешь выжимать уже как бы на качество. Теперь давай поговорим про озвучку и звуковые эффекты. Если ты получил видео без звука, а я делаю голос через 11 Laps.

Sound design: ElevenLabs voice and sound effects

Там есть несколько разделов, как voice changer. То есть я записываю фразы, подбираю голос, генерирую несколько вариантов, обычно около там пяти-7ми, может больше, да, смотря как пойдёт. И потом выбирая самые лучшие. Плюс там же можно добавлять звуковые эффекты, и это действительно сильно улучшает ощущение кино, особенно когда в кадре есть резкие события, вот как шаги, хлопки, вспышки, звук двери, огонь, камины и так далее. В принципе, я это и сделал вот в примере своего видео, которое я показывал в начале. И финальный этап - это, конечно же, сборка ролика. Ты берёшь свои видеофрагменты или кадры, а, выстраиваешь их в мини-историю, задаёшь ритм, подгоняешь под голос музыку, добавляешь минимальные субтитры, может быть, какие-то звуки, ключевые акценты и так далее, и так далее, и экспортируешь. Всё это можно сделать

Final assembly in CapCut and system results

спокойно в кэпкате. А-а, ну, если вы ника до этого с этим не работали, конечно, для вас будет сложно создать полноценный, а, полноценную режиссуру. Но а не забывайте, у меня есть свой собственный Telegram-канал, на который вы можете подписаться. Я там, а, стараюсь абсолютно всем помочь. То есть, если вы на каком-то шаге запнётесь, я, ну, вплоть до того, что запишу вам просто отдельное видео и подскажу, как вам решить вашу задачу, да? Ну, то есть, короче, мы там плотненько общаемся, так что подписывайся. Поэтому ещё раз коротко повторю всю систему. Это сценарий, стартовый кадр, сетка 3х3, отбор лучших кадров, экстракция кадров по номерам и генерация видео платно или бесплатно и при необходимости озвучка и звуки, и, конечно же, сборка в финальный ролик. Если хочешь забрать мою инструкцию, она бесплатная, ссылка в описании или в закреплённом комментарии. Если остались вопросы, напиши в комментариях, на каком шаге у тебя затык: сценарий, сетка, экстракция, ну или видео. И по традиции с тебя лайк и подписка, а с меня заебательский контент.

Другие видео автора — RixAI

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник