За 5 минут Claude Code в связке с архитектором OpenAI o3 и кодером Antroipic Claude Opus 4 написал программу, которая качает любой YouTube-ролик и расшифровывает его офлайн с помощью локальной OpenAI Whisper. Плюс лайфхаки — как приучить Claude Code «думать и планировать» вместо кучи лишнего кода.
Вступай в сообщество вайбкодеров https://t.me/vibecod3rs
Канал Сережи Риса про вайбкодинг и практическое применение ИИ https://t.me/ris_ai
Взял подписку Claude Max за 100 $ и проверил, стоит ли она своих денег. которая качает ролик, гоняет через локальный Whisper и выдаёт чистый текст. Никаких облаков — всё на моём Mac. Смотри, как за 5 минут получить идеальный транскрипт и где Claude Opus 4 действительно спасает.
0:00 – Зачем тратить $100 на Claude Max и что будем строить
1:30 – Одним промптом описываем MVP-пайплайн (YouTube → Whisper → TXT)
3:30 – Настройка локального Whisper и подготовка окружения
6:00 – Claude Code генерирует структуру проекта, быстрый запуск
10:30 – Первый транскрипт: проверка, исправление ошибок на лету
12:00 – Итоги и советы: как за 5 минут получить стабильный CLI-транскрайбер
Зачем тратить $100 на Claude Max и что будем строить
Привет. В этом видео я тестирую подписку Clсов. Она даёт доступ к ClД и топовой модели Clopus S4 на достаточно хороших лимитах. Я использую её ежедневно, и в этом видео я показываю, как я её использую. Для тестов я подумал, что будет классно сделать трансбер YouTube видео, который работает локально и использует модель WHPI. Она работает локально и позволяет тебе локально на моём Макбуке транскрибировать видео м в текст, который дальше я могу отправить на анализ и смотреть получать и сайты из видео, не смотря их. Начинаю, как обычно, с промта. И я диктую микрофон, чего я хочу сделать. Привет. А подготовь, пожалуйста, мне промт для приложения, которое будет скачивать видео с ЮтуЮба, транскрибировать его с помощью модели WISPRй и на выходе давать мне текст. Это должно быть очень простое, не Prodдаction Ready приложение, это MVP. При этом код должен быть написан хорошо, должен быть enterprise с уровня, его должно быть немного, но при этом его должно быть а в будущем удобно поддерживать. Код должен быть написан хорошо, должен быть enterprise уровня, его должно быть немного, но при этом а в будущем удобно поддерживать. Выбрана модель O3. O3 самый лучший парень для генерации промтов. Ты опытный Python-разработчик уровня Senor Stff. Нужно быстро собрать его IP утилит для
Одним промптом описываем MVP-пайплайн (YouTube → Whisper → TXT)
скачивания епролика, извлечения аудио и отправки его в ASR модель Open WPAR. Супер. Задача. Принимаем на вход URL YouTube видео, скачиваем аудио или видеофайлы при необходимости конвертируем, отправляем audio Wiper для загрузки. Да, это правильно. Пока не понял, где здесь протоп. Пользую никаких других обёрток. Просто вот локально. Она должна работать у меня локально. Это важно. На всякий случай уточнил. Главный совет, лучше поработать всегда над промтом вначале его уточнить, чтобы потом не править никаких ошибок, потому что если у тебя в промте какая-то логическая ошибка, лучше будет легче начать заново проект, чем переписывать его потом. Source, да, без внешней, да, правильно. Pythonm to текст на придумыва уже название утилита YouTube URL модель base. Окей. Скачать видео через Я сейчас добавлю. Слушай, очень важно, поскольку это должно быть впи очень простое решение. Не нужны никакие параметры, то есть название утилиты и ссылка на видео. Всё, больше ничего должно быть. MVP простое решение. Если ты это не укажешь, он будет добавлять тебе безопасность. Всёвсёвсвсёвсё тебе добавит и ты не дойдёшь до этапа, когда он любит делать комбайны. Вот. Ограничивайте свой м. Это важно. О'кей. Log можно код без тестов. Юнит тесты только юниттесты тоже не нужны. Быстрый старп. А, отлично. Теперь собери мне, пожалуйста, промт в XML-формате. Никаких тестов мне тоже не нужно. И всё, что не нужно, не нужно указывать, что это не нужно. Нормально. Тестируем промт. Клод-код. Давайте пока его запустим. Let's fucking go. У меня просто запуск лода кода с флагом наpass perion, чтобы он меня ничего не спрашивал, не спрашивал лишних вопросов. А не могу сказать, что я рекомендую это для новичков, тех, кто я с этим не сталкивался, но стоило объяснить, почему
Настройка локального Whisper и подготовка окружения
я так его запустил. Обратите внимание, три итерации у нас прошло для получения промта, и это нормально. бывает 10, бывает 20, бывает несколько дней я тестирую прот, чтобы именно всё было то, что нужно в каких-то разных терасах. Потом собираю его вместе. Сборка экстремально простого колан инструмента CLI, который по одной команде скачивает аудио из YouTube про ролика, конвертирует его 16 кГц локальным. Вроде всё правильно. Мне тестируем clд код. Проверим, какая модель выбрана. У меня выбран режим дефолтный. И по умолчанию он просто даёт на 20% больше э кредитов для опуса, но он всегда использует опус. А это понятно. Что здесь есть интересного? Я вставляю свой промт на 69 строк. Дальше важные вещи, которые я всегда указываю - это думай и планируй. Мне кажется, этого хватит. Поехали. Вот эти вещи, они активируют два режима. Режим размышления, он показывается вот такого вот белым цветом. Второй режим - это планирование. Он создаёт в себе план, которому он следует. Начиная с создания сила инструмента to текст согласно спеке. Создать структуру проекта, реализовать settings, реализовать utils, разывать downloader, transcriber, main Py. А сейчас немного советов по работе с клодкодом. Во-первых, он дико креативный парень, и его нужно очень жёстко ограничивать. История с тем, что ты просто написал пару строчек: "Хочу вот это, сделай мне, пожалуйста". Не работает. Его нужно крайне жёстко ограничивать, иначе он пойдёт в дикий креатив и сделает тебе в 10 раз больше того, что ты попросил, сделай то, что ты не просил. И я так много раз на него бесился, выбешивался и материл его, почём свет стоит. Промты, очень жёсткие. Промты, как ни странно. Самое смешное, что он поддерживает файлы локальный по анологию с курсо RLS. И даже в этом случае у меня, когда я писал, например, что каждую новую фичу делай в новой ветке, вот он в какой-то момент у меня проигнорировал эти правила, запушил всё в мей, стригернул мне билд на продакшене. Вот. И потом сказал: "Блин, да, я должен был следовать правилу. Извини, пожалуйста". Так, отлично, мы подходим к концу. 210 секунд и 6к токенов. Главный вопрос: получится ли у него это сделать у клода опуса
Claude Code генерирует структуру проекта, быстрый запуск
с первой попытки? Допустим. О'кей, запускаем. Ему нужно экранировать, да? Ему нужно экранировать знак вопроса. Поэтому тоже сразу совет. Что-то сделал, просите, чтобы он сам запустил. Ну, это тоже момент, потому что может, конечно, уйти в цикл, особенно если это проект, например, на Нексте и у тебя есть ээ линтер. Я столько раз попадался на эту ловушку на том, что он пытается всё исправить. В итоге он заканчивает тем, что он для каждого файла добавляет исключение в Linter и какой-то делает кошмар установкой. Да что не так с Wсppром было ещё? Что я важно забыл здесь использовать конк MCP, а это must have MCP для получения актуальной документации. Так, попытка номер два. Запускаем транскрипцию видео. Пока ещё ошибок не было. Пока ещё пытается запустить. 200 секунд плюс 160 6 минут. 6 минут он всё это дело пытается кодить. О'кей. Аудио. Аудио закончилось, конвертировалось. Загружаем. Не поддерживаем язык. Авто нужно исправить вот для вот этих вещей. А для этих вещей очень контекствен, потому что там есть списки всех параметров и примера кода, что самое важное. По-хорошему, в идеале, когда ты делаешь такой пром, тебе нужно ещё и дополнить примерами кода из документации, как что вызывать. Особенно, если ты делаешь что-то с API внешним. Must have. Давай ещё раз. Если будет ошибка, используй. К се MCP Коньк се Смотрите, если бы я указал в начале бы, у меня бы не было бы этой ошибки, я бы сэкономил себе несколько минут жизни. Отлично, отлично, отлично. Дай мне основные инсайты из этого видео. Всё классно, всё работает. Итак, что мы сделали под эту YouTube видео? Мы создали сила инструмент wi toтекст. Простую талицу для транскрибации YouTube видео. Локально скачивание аудио с YouTube одной команды. Локальная транскрибация через Vспер без отправки данных в облако. То есть работа локально, приватно, супер. Автоматически сохранить что-то в текстовый файл. Технологии, которые мы использовали Python 3, YouTube DLP, FFMPC, Open AI Whisper. Всё супер просто, очень быстро. За 5 минут создали рабочий инструмент, который скачал видео с Apple DBD DC, транскбирал трёхминутное видео, сохранил полный текст для анализа. Одна команда полностьюбаса, готовый текст для работы. Вот так вот. Я считаю, что Clobus отличный, отличный напарник для работы. Главное его правильно и чётко инструировать, потому что иначе он может, э, сойти с ума и делает то, что делает то, что его не просили. В общем, если вам понравилось это видео, ставьте лайк, нажимайте колокольчик, пишите комментарии, а какое видео вы бы хотели увидеть э дальше. До новых встреч.