Протестировал GPT Codex 5.3 на 4 реальных проектах! Проверяю, как справляется модель с разными типами задач: игры, лендинги, веб и мобильные приложения.
🔥 Что тестировал в видео:
1️⃣ Flappy Bird — аналог легендарной игры
• Со второго раза запустилась
• Полностью рабочая версия
2️⃣ Продающий лендинг для AI-компании
• Создан, но дизайн оставляет желать лучшего
3️⃣ Веб-приложение для очистки JSON
• Со второго раза запустилось после исправления ошибок
• Полностью рабочее приложение
4️⃣ Flutter-приложение подбора фильмов через свайпы
• Запустилось с первого раза
• Функционал работает, но дизайн средний
💡 Особенности GPT Codex 5.3:
Пока доступен БЕСПЛАТНО
Справляется с задачами, но не всегда с первого раза
Дизайн проектов оставляет желать лучшего
Логика и функционал работают корректно
Показываю честные результаты работы, все косяки и победы. GPT Codex 5.3 — хороший инструмент для вайб-кодинга, пока он остаётся бесплатным!
Сравниваю подходы к решению одинаковых задач с другими нейросетями. Какая модель справляется лучше? Стоит ли использовать GPT Codex 5.3 для реальных проектов?
⚡ Темы видео: GPT Codex 5.3 обзор, GPT 5.3 Codex тест, бесплатный GPT Codex, создание проектов с AI, Flappy Bird нейросеть, Flutter разработка, JSON инструмент, подбор фильмов приложение, продающий лендинг, vibe coding, программирование с AI, OpenAI Codex, честный обзор GPT, сравнение нейросетей, GPT vs Claude, AI для разработки, coding assistant, веб разработка с нейросетями, мобильная разработка AI, создание игр с AI, новые нейросети 2026, лучшие AI для кодинга.
#GPTCodex53 #VibeCoding #OpenAICodex #АйКодинг
Оглавление (4 сегментов)
Segment 1 (00:00 - 05:00)
Всем привет. Меня зовут Костя, и в этом видео мы протестируем GPT 5. 3 кодекс. Посмотрим, конкурент ли он клот опусу последнему, как он себя ведёт, как он строит проекты и стоит ли на него переходить или его тоже использовать. Всё узнаем на тестах. Давайте посмотрим, что про него говорит Open AI. То есть он вырос относительно своей предыдущей версии 5. 2 кодекс, а, то есть примерно там на 10% чуть больше. Также он хорошо умеет делать игры, он прекрасно строит интерфейсы, то есть в дизайн он должен уметь. Ну и в целом как бы вырос, да. Посмотрим также бенчмарки следующие. То есть SV нас интересует, насколько он стал лучше именно в программировании. Ну, то есть не сильно стал он лучше. приростом 0. 4%, но он стал в других бенчмарках сильно лучше. То есть у него прирост там по 13, по 26%, по 10. То есть в киберсекьюрити, ну, то есть в кибербезопасности он стал гораздо лучше, например. Пока что нет абсолютно никакой информации о стоимости IP. Будем ориентироваться на предыдущую его версию. То есть API стоит, э, 1. 75 за входные токены за 1 млн и 14 долларов за выходные. И цена не растёт от количества выходных токенов. То есть, как, допустим, у того же клода. По ценам у нас 20 долларов за самую базовую версию, так же как у клод-кода, и 200 аж долларов за про-версию. То есть даже версий за 100 долларов нет, что очень печально. Но до 4 марта сейчас можно абсолютно бесплатно пользоваться кодексом. Ну, то есть хоть через сила версию, хоть через десктопную версию. То есть э сейчас пока что можно использовать кодекс бесплатно. Тестировать я его буду через его родную программу, то есть через его IDEM. Это кодекс, так и называется. Вот таким образом он выглядит. То есть здесь есть чат, видно код, который он написал, и, соответственно, здесь проектики и так далее. Можно версии менять. В общем, такая айдешка. Она доступна только на данный момент на MacOS. Обещают, что она в скором времени появится на Windows. А на Windows вы пока что можете использовать кодекси, то есть это терминальная программа, как у того же клода, то есть д-код. Я открываю кодекс. Здесь будет происходить вся разработка. Обратите внимание, что я выбрал 53. Кодекс. На ней мы и будем всё проверять. И какие у нас есть проекты? А проекты у нас следующие. Мы протестируем сначала на игре. Это копия Flappy Bird. Он должен написать, он должен также создать продающий лендинг. И задачки идут уже дальше посложнее. Это веб-приложение, которое очищает Jon от битых ссылок. То есть картинки там, а, могут быть сбитыми ссылками. Его задача отфильтровать их и выдать по итогу аэ чистый JON. И мобильное приложение, которое по свайпу подбирает нам фильм, а также по настроению. Такие вот тесты у нас имеются. Давайте начинать с игры. Я перекидываю папочку. У нас внутри я могу показать, что есть. Это Project Game MD. Все эти проекты будут доступны на GitHub. То есть вы можете скачать, посмотреть. Я ссылку приложу, в закреплённом комментарии найдёте. Итак, в Project Game у нас описана игра. Ну, то есть Flappy Bird, какая там логика должна быть, что в игре должно быть, чего не должно быть и так далее. То есть у него есть вся инфа об этом. И мы ему пишем следующее. Аа, используя create, наверное, на английском будем писать create project. И напишем ему, как файлик наш называется. Вот так он называется. Давайте выберем ему хай. Как минимум экстра хай ему вряд ли нужен для игры. Хай вот будет достаточно. То есть это насколько он будет обдумывать эту задачу. Итак, мы ему скормили наш проект. Он сейчас его читает. Как только он его сделает, мы посмотрим, что он сделал и справился ли он с этой задачей. Итак, он справился с нашей задачей, написал нам игру. Сейчас мы проверим, что он сделал. Для этого мы перейдём в Flappy Bird clone, который он сделал, и отправим вот так индекс. И что мы тут видим? С задачей он не справился. То есть никакой игры у нас здесь нет, что крайне странно. Давайте его попросим исправить, потому что на данный момент мы не видим никакой игры. Что, кстати, странно, как он мог не справиться с такой простой задачей? Я
Segment 2 (05:00 - 10:00)
повышу, пожалуй, обдумань достхай и отправлю ему. Что игра не работает, стартовый экран у нас пустой. Нет кнопок начать и самой игры тоже нет. То есть вот у нас такой вот у нас экран. И всё. Пускай он исправляет, потому что задача простая. Он как бы с такой простой задачей не справился. Я прямо аж удивлён. Итак, он исправил, говорит, что исправил проблему с пустым стартовым экраном. Сейчас мы это проверим. Мы просто обновим. Ну да, он исправил. Так, нажмите, чтобы начать. Пробел. Клик касание. Я пробел буду нажимать. Ну да, счёт идёт. Всё вроде бы как работает. Да, всё теперь работает. С задачей он справился, но не с первого раза. Это очень примечательно. А у нас следующий проект. На этот раз, я надеюсь, он справится с первого раза, потому что у нас это просто лендинг. То есть у нас аналогичный будет промт. Я его отсюда скопирую из Game. И здесь вот в лендинге добавлю его. Сразу выставлю хай на всякий случай, потому что на хае, видимо, у него есть какие-то проблемы. Так, я выставляю хай. Говорим создать проект. Только проект не так называется. Проект у нас называется Project Land. Я здесь перепишу, напишу, что здесь land у нас и что там у нас содержится в самом ленде. То есть здесь описание, здесь нужно продуктовый лендинг создать. Он достаточно простой, но который проверяет, насколько нейронка хороша в дизайне. Отправляем и будем смотреть, что он сделает. Как только сделает, я вернусь. Он реализовал. Давайте смотреть. Так что у нас тут есть? А, MVP за 14 дней. Ну, это плохо. То есть большинство на данный момент нейронок, они в дизайне, ну, так себе. Может быть, в лендингах слабые, в каких-то, а, в интерфейсах покруче, но пока что вот это всё, это выглядит очень слабо. Просто у меня есть дизайн, который выполнял тот же Флш, а, который Gemнит 3флш. Это у него это гораздо сильнее получается. Он прям делает круто. Это очень слабо. Это слабенький результат. Ну, лендинги лендингами это не так важно. Важно больше на логику работа. Давайте проверять на логику. У меня есть проект именно завязанный на логике, что фильтрацию нужно будет сделать там достаточно интересно. Итак, вот у нас есть проектик, он заранее уже на нексте. Ну, то есть это пустой проект некста. И в нём есть файлик, который нужно отфильтровать, и сам файлик проекта, то есть это single page application. Итак, мы ему пишем примерно то же самое project from. И вот тут вот только имя поменяем, что у нас проект по-другому. Ну, то есть MDФай по-другому называется. Create project from вот project spay. Отправляем ему, пускай создаёт. Как только создаст, посмотрим, что он создавал. Итак, он написал, что он справился с задачей. Нужно только открыть терминал и запустить проект. У нас есть здесь встроенный терминал. Нужно написать npm rdev, и он откроется по localл hсту 3. 000. Вот он local host. Так, загрузка и проект не запускается. Какие-то проблемы? Давайте их напишем. Напишем вот эти вот проблемы, из-за которых у нас ничего не запускается. Пусть он их решает. Итак, я помимо первого раза ещё раз ей переотправлял ошибки. И после этого вроде бы как всё заработало. Интересно то, что кодекс 53 у него с первого раза также ничего не работает, как у китайской неронки Quent 3+ 3 с5 п. Ладно, сейчас посмотрим. Может быть, здесь у неё всё с первого раза работает. А так, я отправляю ей тестовый файл. Так, она их рентрит, смотрит, где у нас биты картинки ссылками. О'кей.
Segment 3 (10:00 - 15:00)
О'кей. Выбираем только валидные. А где я могу это выбрать? Ага, вот я выбираю. Я выбрал 53. Нажимаю скачать. Проверяем мы вот таким образом. То есть заново сюда отправляем. Да, здесь только валидный. Да, само приложение по логике именно работает. Рабочее. Всё классно. то, что она не с первого раза проект может запустить, это, конечно, печалит. Ну и что, финальный наш тест. Открываем снова кодекс, выбираем нашу папку mobile, закидываем и просим её создать. Так, я вот из лендинга возьму вот это вот Create Project. Выбираю mobile и пишу сюда, что у нас в мобайле есть пустой флатер проект. И, конечно же, такой же MD файл с описанием проекта. Что нужно сделать? Я копирую вот это название, меняю и отправляем всё на extra high. С просто хай он вообще не справляется даже с какой-то простой задачей. С экстра хай там через раз, как мы видим, но по итогу справляется, что на что нужно как бы учесть тоже. Ладно, как только оно всё сделается, то мы вернёмся и посмотрим, что оно нам сотворило. Итак, он написал, что он справился с задачей, и я уже прожал здесь flatter run, чтобы он запустился. Вот я здесь набрал просто flatter run и всё. Открываем симулятор, будем смотреть. Так, а почему у нас вот эта картинка не на весь экран? Или так должно быть? По-моему, так не должно быть. О'кей. Свайп. Свайп. Так. Свайп. Нравится. Почему нравится? Не нравится, когда он просто должен подбирать. Мм. О'кей. Допустим, проваливаемся вовнутрь. Тихое место. День первый. Лайк. Так, ну пока что по дизайну тут слабовато, конечно. Так, хорошо. Теги добавил. Настроение смотрим. Почему он на английском языке? Подобрать фильм. Но фильм он подбирает. Хорошо. Фани, то есть забавный дolул. Ещё всё везде и сразу. О'кей. Ну да, функционал работает. Сейчас мы ещё поиск проверим. Так, ну, допустим, адвенюра ещё и по времени можно найти. Ну да, поиск. Можно сказать, что тоже работает. Избранная. Избранная работает. Так, только тут свёрстка чуть не то. О, зато он здесь сделал тему. Это круто. А язык у нас только один. Ну, он условно справился, но вот по дизайну к нему огромные вопросики. То есть это работает всё не совсем так, как предполагалось. Вот только вот по вот этому и по настроению. То, что он здесь всё на английском написал, это тоже не круто. В остальном он справился как бы хорошо. Всё работает. Всё работает с первого раза. Всё классно. У нас напрашивается вывод. А вывод у нас следующий, что за 20 долларов он работает хуже, чем CД CД. Ну, то есть чем C opus, чем даже Sнеet. Он работает гораздо хуже. Ну, то есть результаты, я не знаю, в связи с чем, то есть с выходом с парка ли это или что, но на данный момент он выдаёт плохие результаты на наших тестах, которые даже а квен проходило на ура, а здесь у него какие-то сложности даже с дизайном, там, с вёрсткой какой-то банальной. То есть ну приложение выглядит, ну, некрасиво. А стоит ли вообще использовать кодекс 5. 3? Пока он бесплатный. Вполне себе, да. Как только он станет платным, ну, то есть после четвёртого, ну, я бы не покупал подписку, потому что те результаты, которые он делает лично на моих тестах, лично на моих задачах, это плюс-минус повседневные мои задачи, которые в тесте. Я бы его не использовал, но сейчас я его использую, потому что он бесплатный. Я вас прошу оставить своё мнение по поводу кодекса 5. 3. Может, у
Segment 4 (15:00 - 15:00)
вас какая-то абсолютно другая ситуация. Возможно, на ваших задачах он справляется гораздо лучше. А поделитесь своим опытом использования его. А также поставьте обязательно лайк, обязательно подпишитесь на Telegram-канал. А я с вами прощаюсь. До скорых встреч. Yeah.