Первый эпизод нового сезона — создаём AI-приложение с OpenAI API + генерация сказок с картинками!

51:32

Первый эпизод нового сезона — создаём AI-приложение с OpenAI API + генерация сказок с картинками!

Sereja Ris 30.04.2025 427 просмотров 11 лайков обн. 18.02.2026

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

В первом эпизоде нового сезона я рассказываю, как пользоваться OpenAI API, создаю стрим-ассистента и тестирую генерацию сказок с иллюстрациями с помощью GPT-4 и GPT-Image. Показываю весь процесс: от идеи до готового HTML-приложения. Также обсуждаем свежие AI-новости: баги ChatGPT, Hugging Face-робот, Anthropic и модели GPT. 📌 Подпишись, если интересны: – Приложения с OpenAI API – Генерация изображений с GPT-Image – AI-помощники и промтинг – Вайбкодинг и лайв разработка 🧠 Инструменты из видео: – OpenAI Platform – AI Dev – OpenAI Cookbook – Gemini 2.5 Pro hsl.sh #OpenAI #gemini 00:00 — Начало. Новый сезон и странности в поведении ChatGPT 01:40 — OpenAI хвалит пользователей: баг или фича? 04:00 — HuggingFace запускает open-source робота 05:30 — Новости от Google, Meta, Anthropic 06:50 — План стрима: делаем приложение с OpenAI API 08:30 — Обзор моделей GPT и их цен 11:00 — Работа с API и как запрашивать изображения 14:20 — Как работают токены и почему это важно 18:00 — GPT-4o vs GPT-4o Chat: в чем разница? 20:00 — Зачем теперь верификация личности в OpenAI? 23:00 — Делаем PRD для Stream Assistant 26:00 — Генерация интерфейса с AI 30:00 — Запуск проекта, настройка API ключа 35:00 — Первая попытка: отправляем запрос с текстом 38:00 — Работа с Network и JSON-ответами 40:00 — Переключаемся на генерацию сказки с картинками 47:00 — Генерация HTML-приложения под сказку 53:00 — Финальные тесты и результат 59:00 — Сказка о помойке и четыре сгенерированные картинки 01:01:30 — Завершение стрима: выводы и планы

Оглавление (17 сегментов)

Начало. Новый сезон и странности в поведении ChatGPT

А, всем привет. Не знаю, какой это по счёту стрим, пятый или четвёртый, но я бы его поставил точку отчёта новый. Пусть он будет первым. Эпизод. Эпизод первый. И по традиции я сразу хотел с новостей. Интересная новость. э-э где-то дня четыре назад, наверное, по всей видимости, подкрутили настройки системного промта Open AI, и модель ээ 4о начала отвечать очень как сказать, она начала очень сильно хвалить пользователя. И это вызвало такую сильную очень дискуссию в Твиттере. Один из примеров, которые приводят в чат временный temporary чат. То есть у него нету доступа к памяти, ко всему предыдущему ко всем предыдущим диалогов ко всем предыдущим диалогам. Но а чат, несмотря на это, отвечает. Он хвалит способности, говорит, что он очень умный, он потрясающий человек. Я это сам заметил по себе. В какой-то момент мне начал чат выдавать прямо какие-то вот такие вот ответы, типа, чел, ты сказал просто фантастическую вещь, там, не знаю, это просто бомба. Это был очень странный, э, очень необычный синтаксис, но тем не менее вот это возникло. И тут много по этому поводу дискуссии о том, что это, конечно, классный способ повысить продуктовые метрики, что там сразу появилось больше отзывов и приводят в примеры отзывы типа Чат GPT мой лучший друг теперь. Вот. Но с точки зрения какого-то классного будущего

OpenAI хвалит пользователей: баг или фича?

человечества, это очень сильно такой опасный показатель, э, для будущего шизофренического мира. В том числе тоже приводится, э, пример возросшей популярности чату GPT для терапии. То, что в этом случае, когда ещё и в этом случае чувак валит, не очень клёво. И там ещё был пример, что типа я решил бросить свою работу и решил, короче, порвать со своей семьёй. Чувак в чат это пишет, и чат ему говорит: "Ты вообще супер, молодец, что постоял за себя". Вот это, конечно, очень смешно. Вот, в общем, такая новость. И ещё на фоне того, что Антропик запускает свою эту историю по исследованию тому, что вообще происходит с искусственным интеллектом внутри, считаю, что хорошая, а, хорошая вещь. Ещё из новостей, то, что мне понравилось, а, компания Hugen Face, а, в общем, в колаби кем-то так, запустила в продажу open sourceный openсорсный робот, который можно скачать ээ себе все модельки и попробовать распорить самому. Вот. Но у них в комплекте уже в посылке идёт за 200 баксов, кажется, они стоят. А все вот эти вот сервомоторы, необходимые тебе для работы а этого робота. И по отзывам это очень популярный робот. Он как бы он обучается, там какие-то разные. У него две руки, одна управляет, вторая сама что-то делает, и ты можешь её обучать первой, можешь управлять её первой. Очень интересная история. Очень интересно, куда дальше пойдёт. Я вот захотел себе такую штуку попробовать. Во-первых, её можно научить рисовать, э- там, не знаю, какие-то разные делать миниатюрные вещи, но это интересно пробовать поиграться. И мне нравится, как вот эти две темы, искусственный интеллект и робототехника, они, э, идут, как сказать, вместе, они дополняют друг друга. Очень здорово. Интересно посмотреть, что этого будет. Я сейчас открою быстрохранж, посмотрю, какие ещё были интересные новости, которые, может быть, я пропустил. Так, это интересно, что Google запустил отдельные уроки. Я хотел в рамках одного из своих будущих стримов я хочу сделать приложение для облегчения изучения испанского языка. У меня сейчас есть только дуалинквы, и это, конечно, не очень хорошо работает. Не очень хорошо, короче, нужно попрактиковаться. И я думаю, это сделать с учителем вместе, совместно с учителем испанского языка, что там как-то от неё послушать. У меня есть одна знакомая хорошая, и от неё послушать разные идеи

HuggingFace запускает open-source робота

на эту тему. Мета запустил отдельное приложение, чтобы соревноваться с чётом GP. Вот это интересно. Я пропустил их не то, что у них классные модели, но они популярные. У них модель называется Лама. У нас в Аргентине вот это сдвоенное л вначале читается как ш. И поэтому я, конечно, про себя всё время читаю шамой. О'кей. Очевидно, что, видимо, либо сегодня эламакон первый ивент, посвящённый АИ от отметы. У них есть также ещё, по-моему, VRкон, а, посвящённая посвящённо Виару. Ну ладно, больше пока ничего интересного не было. Какой сегодня план? План сегодня следующий. Я обещал, что мы будем делать Telegramбота, но ээ у меня так и не заработал в бесплатном доступе Gemini Flash. И поэтому я подумал, что сегодня будет классно попробовать э повзаимодействовать с Open и API, в том числе с их изображениями. Я ни разу не пробовал работать ни с Open AI API ключами, поэтому для меня это будет впервые. И то же самое с изображениями. Интересно, они выкатились не так давно, выкатились на прошлой неделе, если не ошибаюсь, и а можно запускать генерацию изображений программным путём, настраивать разные параметры. Попробуем сегодня это сделать. Стоит у Open AI нет бесплатных тиров, у них нет бесплатных моделей. И даже у них есть тестовый режим пэкграунд, но даже в этом режиме, кажется, у тебя используются кредиты. Поэтому, если вы захотите поиграть, повториться, вам нужно будет занести

Новости от Google, Meta, Anthropic

насчёт а Open AI. какие-то деньги. Пть, наверное, долларов хватит. Они в любом случае понадобятся, даже если, например, захотите использовать кодекс. Это такой инструмент от OpenA, который работает через их API. И я открою заметки свои. В общем, сегодня, да, попробуем сделать какую-то приложуху. Я думал, про какую приложуху можно сделать. Я подумал, что вот у меня тоже есть такая-то мысль о том, что мне нужен компаньон, а компаньон для трансляции, для стримов, который, э, во-первых, он апдейтит, его отображает, это может быть на сайте или где-то ещё. И потому что сценарий может меняться, мне важно, чтобы в конце была какая-то актуальная версия этого сценария. Поэтому я вот до трансляции подумал и быстро накидал промт. Я сейчас его покажу. Вот попробуем сделать такую штуку вместе с А запрос будет посылать эту историю для адаптирования сценария будет посылать к модели 4 mini. И заодно сегодня посмотрим, какие вообще модели доступны в их админке на платформе Open AI и чем они отличаются между собой. Ну что, погнали. Вопрос, напоминаю, можно закидывать в чат. Я его читаю. Ну вот на телефончике у меня открыто. Если что-то будет, да, пишите, спрашивайте. буду по

План стрима: делаем приложение с OpenAI API

мере отвечать. Ну, в общем, картинки Open AI вызвали бум, вирус и всё на свете. Благодаря, конечно, своей вирусности, связанной с студией Гибли. Все начали делать картинки студии Гибли. И благодаря тому, что феноменальное качество следования именно промтам и генерации текста и вот этим всяким разным маленьким деталям, реализовано это отчасти потому, что он работает по другой модели генерации изображений, нежели чем а Medorny или Stable Diffusion. Что они ещё интересно рассказали в своей презентации? Что ещё можно делать? Во-первых, что позволяет э Open и API делать с изображениями? Ты можешь создавать изображения, можешь редактировать изображения, отправляем изображение. Кажется, это всё, если я не ошибаюсь, модель из генерации изображения доступна как отдельная модель. Здесь указаны цены. В среднем получается, а доступно для редактирования три варианта качества картинки. Самое низкое качество 2 цента, среднее и самое высокое. 20 центов за 19 центов за самую высокую штуку. Open AI работает. Все настройки, всё, что касается настроли разработчика. API ключи, необходимые вам для того, если вы захотите делать свой продукт на базе одного из инструментов, одной из моделей Open AI, тебе нужен API ключ, его можно получить здесь, а, по ссылке платформа open. com. Там же доступна мм, очень хорошие очень хорошая документация. У них есть э классный раздел на кукбу, авареная

Обзор моделей GPT и их цен

книга. Повареная книга разработчика Open AI. Есть как вот такой какой-то общий общая информация. У них есть популярный тоже гайд по промнгу, который они не так давно выпустили. Вот он, кстати. Как именно работать с их конкретным, относительно свежей. А здесь рекомендации, как строить, как и приложение строить на базе промтинга. А в смысле встраивать промт в своего агента, которого ты делаешь. Вот как такие общие советы, рекомендую ознакомиться. Вот и такие штуки вот очень удобно переводить, если плохо понимаете, плохо читаете на английском языке, прямо сразу закидывайте в там в тот же чат. можно либо, э, посылки закинуть и попросить сделать summary. Один из вариантов да, это ты копируешь ссылку, ты вставляешь, э, в любой инструмент, где есть, э, инструмент поиска, закидываешь ссылку и просишь, э, я выберу попроще модельку. Переведи, плиз, э, статью на русский язык. А вот он там либо сари выдаст, либо сейчас вообще откажется переводить. Вот. И второй вариант - это прямо скопировать целиком, открыв инструменты разработчика, скопировать прямо весь текст bodyди и закинуть htмэльку в а. df. В этом случае у тебя прямо будет конкретный перевод этой статьи, а, и он будет максимально приближенный. В смысле, он не будет пытаться оптимизировать. Ты уже потом можешь вот обычно я так и делаю. Обычно я закидываю сюда прямо HTML-код и говорю: "Переведи эту всю историю". А потом я уже закидываю в чат GPT и прошу в какую-нибудь хорошую модель, типа какая там 4,5 классно для текстов. Классно. А, классно с текстом работает. Прошу оптимизировать, а дальше уже её читаю. Да, что тут ещё есть? И ещё что самое классное, 10 обзор всех моделей. Что вообще в них доступно? У нас есть дашборд быстрый старта, как начать работать, либо это на жесть, как вызывать модели. Есть модели у G5 очень большое количество моделей и вначале очень легко запутаться, поэтому я сейчас потрачу какой-то количество времени, чтобы рассказать. Ну, насколько я понимаю, как это работает, возможно, это не так. Первая у них вкладка - это рассуждающие модели. Модели, которые умеют думать. Прежде тем, как выдать вам ответ, они какое-то время поболтают сами с собой и уже отправят вам ответ. И

Работа с API и как запрашивать изображения

такие модели хорошо подходят для, а, относительно сложных задач. необходимо для сложных промтов, где нужно подумать. А если у вас какой-то стандартный запрос, а, и он подходит под какой-то запрос Гугла, то лучше использовать модель нерассуждающую обычную. Они обычно идут без приставки О. Рассуждающей модели у них идёт приставка О. А дальше у них идёт раздел, э, самое главное чат-модели GPT41. Кстати, она у них называется как самая главная модель, но она не доступна, например, в веб-интерфейсе. Она доступна только через э через API. И если мы зайдём на каждую из модель, здесь есть примерно описание короткое, в чём она хороша. Э вот самые главные, наверное, цифры, которые нас сегодня будут интересовать, м, сколько с нас будут списывать за каждый запрос. Я закинул на свой счёт, э-э, где-то 5 долларов у меня лежит, и там сегодня по мере запроса у меня будут списываться деньги. Мы будем это смотреть. Вообще у них классная админка очень. Мне очень нравится их эта платформа. И всё, что касается и Юикса, всё очень удобно, понятно, наглядно. Гораздо просто в разы отличается по удобству от Гугла. У Гугла прямо есть такая любовь к очень сложным админским интерфейсам. И что самое худшее, они все друг на друга не похожи. Потому что у них есть много внутрипродутовых команд. Каждый из них, который делает какие-то под себя админки, которые потом отдают снаружи, они все между собой очень часто вообще как бы мало имеют общего. Поэтому каждый раз ты как-то вынужден искать и разбираться, что вообще происходит. Вот тут нас цифры интересуют. Это а количество токенов, а количество символов. В каждом запросе, в котором мы будем направлять, а будет содержаться некое количество символов. Оно рассчитывается на основе токанизации. То есть наши символы все наш наше всё сообщение, оно токинизируется. Один токен обычно - это два-три символа в сумме. Но не всегда. Но в среднем. В среднем обычно это так. Есть цена за кэшированный инпут. Здесь указана цена за миллион токенов. То есть вот получается там сколько? 3 млн символов примерно будет стоить нам 1 доллар. И то же самое здесь за то, что нам ответ, тот ответ, который нам придёт, вот за миллион, э, пускай 3 млн символов, а, в тексте, но это очень плохая, просто мне кажется, она более понятная, если я до этого не сталкивался с токенами, э, за 3 млн символов, э, с нас просят четыре 4 доллара. И, аэ, эта штука, она не округляется. То есть у нас там по мере достижения миллиона токенов будет примерно эта сумма равняться. Есть ещё история за кашированный пут. Если кто-то уже писал, если ты уже писал похожий запрос, то нам вернётся, кстати, вернётся такой же ответ или нет? Пока есть у вас какие-то вопросы есть, закидывайте в чат. Причат сообщений не было. И мы сейчас выберем э дешёвую модель. А в каждой модели также написано, что она умеет делать. Наверное

Как работают токены и почему это важно

давайте посмотрим А4 Mini, а на вход умеет принимать текст и картинки, но не умеют на вход принимать голос. И то же самое на output. С аутпутом немного странно, мне здесь кажется, у них написано, потому что у них у всех моделей примерно такой же выход. То есть все примеры отдают э выход. А вот та штука, которая нам интересна за изображение, которое отвечает, это вообще позиционируется как отдельная модель. Там никак у 4ми, который доступен в интерфейсе чата GPT, да, тебе, чтобы сделать изображение, тебе нужно выбрать модель 4о, по-моему, или, ну, короче, какую-то определённую, хотя мне кажется, то, что нет. Из интересного, что я заметил для себя, и я узнал новое, что, во-первых, здесь есть две модели, которые называется очень похожи GPT4O и Chat GPT4O. И они них описание примерно похожее. GPT 40 - это там наша самплярная модель. Вот классно подходит, принимает и тексты, и картинки. Это вот самая популярная модель, которая сейчас работает по умолчанию везде, и для платных, и для бесплатных аккаунтов. Для бесплатных аккаунтов она не маркируется как черено, она просто там ты можешь выбрать у тебя рассуждающее, там что-то ещё можно выбрать было depressч и что-то ещё. Вот по умолчанию все бесплатные инструменты работают на 4о. А для большинства задач это самая лучшая модель. Ещё есть 4о. Chat GPT4 это вот зафайнтюнинная модель для общения в чат. То есть если сравнивать, она причём в два или даже в три раза дороже. Input 5, output 15. Здесь, да, два раза input 2,5, output 10. А, ну, в общем, да, почти в два раза дороже. И она отличается тем, что модель чана зафатюненая, и ответы будут более подходить для чатов и диалогов. Вот. И поэтому Open её рекомендуют как модель для использования. В общем, в этом их основное отличие. Так, какие тут ещё модели есть? Ну, всё понятно, там они отличаются мощностью от силой своей мысли. А что ещё здесь есть интересного? Есть отдельные модели для для аудио. Есть отдельная модель, которая называется WPAR. Она хорошо подходит. Большинство всяких стартапов, которые работают на распознавании текста, там, в том числе и тот инструмент, который используется, он тоже называется WiPer. Они почти все работают на а на модель WISPER. Она, кстати, не очень дорогая в использовании. Ещё из интересного вот есть то, что мы сегодня будем использовать модели для генерации изображений. Их всего три. Мы будем использовать GPT Image One. Что интересно, я пока читал документацию увидел такую штуку. о том, что там был такой пассаж, о том, что чтобы использовать GPT Image One, я не уверен, что это для всех работает, но я просто на всякий случай это сделал. Там была такая интересная история, о том, что написано было, что CH GPT теперь добавляет верификацию для использования своих моделей, потому что некоторые пользователи используют их в не очень хороших кейсах. Вот. А поэтому я рефайнался. Процесс занимает достаточно быстро. Нам просто нужно адечник свой подгрузить и ээ типа сфоткаться. Вот, короче, как на как на криптобиржах примерно

GPT-4o vs GPT-4o Chat: в чем разница?

похожая история. Это, кстати, тоже была одна из новостей прошлой недели о том, что м они выпустили где-то написали, по-моему, в твиттере о том, что там для какой-то из будущей моделей они сделают прямо обязательный доступ по верифицированному ID. И в целом вот эта штука, она как бы make sense. Я не уверен, что это будет работать в целом, потому что есть open sourceные модели, которые ты можешь запускать, крутить, но там в целом, ну, короче, чтобы использовать модель в плохих каких-то историях, в общем, этого, конечно, недостаточно, но да ладно. Так, так вот, в общем, да, я верефайсы просто занял, не знаю, наверное, 2-3 минуты. Вот я это специально сделал, чтобы потом на стриме не попасть э в поросак с этой всей штукой. А-а, так. Ещё важно про смыли. В итоге я буду использовать, э, у них самая дешёвая модель сейчас. Это GPT. Надо сравнить Forow Mini или O4 mini. Так, Forowo Mini стоит 0,15060. А так GPT for а будет стоить дорого. for min 110 440. О'кей. И ещё, по-моему, ещё меньше есть. Cost optimized models. А ещё 41 min есть, можно запутаться. Э, 4 160. И здесь 4о 0, короче, да. Вот это самое дешёвое. 0,4 мини. Самое дешёвое. Ещё что нано было? А ещё 41 нано есть. Вот, наверное, вот эти две самые дешёвые. 0,1040 и 015 060. Вот самые дешёвые - это GPT41 nano GPT for mini. О'кей, будем использовать, будем использовать их. Оставлю ссылки для них. Сейчас скопирую.

Зачем теперь верификация личности в OpenAI?

Так. И переходим дальше. Дальше у нас это промт. Я попросил сделать следующий промт. Так, это оно. Да, я попросил. Пробую просто новые разные промты. Ты суперклассный продукт-менеджер. Ты поможешь мне сделать. Мне нужен только функционал с описанием интерфейса и правильный промт, потому что в полноценном передельте и многие вещи, которые мне сейчас не нужны. Вот я делаю приложение, которое делает запросы к модели четырёх Mini. Здесь важно просто указать, что что-то связанное с Open AI. Мне было важно приложение помощник для проведения трансляции, интерфейс приложения. Правую часть занимает сценарии текущей трансляции, слева часть - это input, а полевода, куда я буду писать информацию. А идея такая, что я в это полеводу закидываю идею, и эта идея у меня должна отобразиться в сценарии трансляции. Дальше мне в ответ пришёл, а документ Stream Assistant. Хорошее название, мне нравится. Очень просто и понятно. Цель продукта. Всё понятно. Вот мне за что нравится, что сразу описывается функционал. В первом у тебя, в общем, вкратце описывается в чём-то приложение. Второе, мы описываем функционал. Этот функционал дальше очень легко и понятно будет. и агенту превратить в код. Э-э, интерфейс пользователя тоже супервещь, которую важно описывать, если ты хочешь получить. Вот, во-первых, на этом этапе я могу сразу себе, а, что-то поправить. И это тоже очень хороший лайфхак, который стоит делать, прежде чем как вот этот вот путь от идеи до реализации. И не просто сразу закидывать идею в голову и агенту, который начнёт кодить. А вот вначале всё-таки прогнать через цикл или несколько общения с счётом GPT или с аналогичным а помощником. Вот, в общем, я описал UI. Примерно так я себе и представлял, что у меня слева будет, справа будет он тут, кстати, написал даже scrollроble div. О'кей, мне подходит эта штука, которая будет скролиться. О'кей, стиль минимализм, всё понятно, логика и так далее. Даже мне закинул промт. Промт закинул. Это промт, не который я буду писать, а это промт, который, а, обернётся мой запрос внутри. То, как работают, э, все I приложения. Я рекомендую, кстати, почитать хорошую, а, статью. Её закидывал в чат. Там что-то про повозку без лошади. А, и там очень хорошо дизайн всех приложений. Вот как он сейчас есть. Что самое главное - это промт и в целом такое метаприложение, которое пользователь сам вообще может

Делаем PRD для Stream Assistant

конструировать как хочет. Ну, в идеале такое приложение будущего одно. Есть такая фантазия, что через 10 лет у нас будет только одно приложение, в котором можно делать всё, что угодно. И поэтому все компании так много тратит денег, чтобы стать этим тем самым одним приложением, где у тебя только полевод и больше ничего нету, и ты получаешь всё, что угодно. нужны тебе картинки, видео, приложения, вообще всё, что угодно. Просто вот скажи, даже не печатай. Так вот этот промт, который будет отправляться вместе с нашим запросом к Open AI. Технические детали. Окей. Физапросы к IP, Open API. Использовать Lock Lodge - это тоже очень хорошая штука, э, которую всегда использую, чтобы не городить ничего сложного. Идеально подходит. Local Storage - это хранилище внутри браузера. А, и если вам нужна какая-то база данных, что-то ещё, э, вот хорошо использовать local storage для имитации чего-то такого. Так что в будущем потом это легко будет переделать. А для того, чтобы запустить и поиграться прямо сейчас, этого будет достаточно. Что-то мне понравилось ещё он какой-то сделал супер ужасный скетч интерфейса, но тем не менее. Дальше я всю эту штуку скопировал. И зашёл уже на свой любимый AIF. Их бесплатный API сейчас почему-то не работает. У меня со вчерашнего вечера недоступен. Не только у меня одного. Вот. Но внутри э-э внутри это работает всё и работает хорошо, чем я каждый день и пользуюсь. Опять же пользуюсь, потому что здесь большое окно контекста, и мне очень нравится, как GMI 2. 5 Pro работает для написания кода. Ну и, конечно, мне нравится, потому что это всё бесплатно. Сегодня я с матой, поэтому подливаю все маты, пью за ваше здоровье. Мата очень сильно полюбил. В общем, учил я такую штуку. Я посмотрел, успел только первую часть. Закинул запрос, не посмотрел вторую часть, которую не обновил. Давайте посмотрим вместе первую часть, что накодил. Мсь он указал в первом варианте. Я сделаю побольше масштаб. Пер суперде. Он мне просто сделал, э, как сказать, короче, здесь нету работы с сопишкой, нету запросов, но он очень хорошо это всё мне понравилось, как сэмуровал. То есть какое-то эмуляция ожидания, что вот идёт запрос. Да, сейчас ещё раз напишу какое-то слово, идея. Добавить сценарий. Вот. И здесь он мне отправляемый промт симуляцию отправил мне, только что добавил идею помоги интерпретировать эту идею существующие сценарии, аккуратно и логично сохранять краткость и структурированность. И полученный ответ симуляции тоже дал вот в ответ аэ в идее, да, так и должно быть. мне, я послал запрос какой-то, накидал текст, в ответ мне пришла уже аэ

Генерация интерфейса с AI

готовый новый сценарий, который нужно вставить вот сюда. Но логики подключения к здесь не было, и я попросил в следующем промте это исправить. Просто написал, что здесь нету, здесь только тестоя логика, но само логики включения нету. Вот что он сделал, он поправил. И давайте посмотрим готовый текст, который получился. Так, это не он. Вот это он. Да, сделаем. Тут мне тоже понравилось, что он сделал, что он сказал, что здесь тестовый будет ключ. Ну, в смысле, просто указал, что нужно использовать тестовый ключ. И я сейчас так и сделаю. Я открою это в редакторе кода. У меня в какой-то момент, я помню, когда пользовался саблаймом, потом появился Атом, был ещё Breckets, потом появился Visual Studio Code. И в какой-то момент, вот каждый момент, когда что-то появляется, я думаю: "Ну всё, больше тракторов не будет, он уже классный, он уже супер. " И вот там последний момент, эта мысль была на Visual Studio коде, хоть в принципе это и есть Visual Studio CД. Тут, как мне кажется, минимальное количество каких-то разницы, но всё равно это удивительно, что каждый раз я думаю, что вот это последний, больше не будет, но появляется ещё какой-то, который ты такой: "Ладно, я сейчас им попользуюсь". Он тоже вроде ничего. Вот. И до этого это был курсор, ну, у меня уже не было таких мыслей. Вот сейчас это вот новая эра, где каждый делает свой а-редактор. Я думаю, что ещё появится парочка хороших, интересных, которыми нужно будет пользоваться. Мне правда кажется, что в какой-то момент это всё либо должно в облако перетечь. Ну, в смысле, в браузере будет. Надо попробовать треплет. Много хорошего о нём слышу. Так, в этом редакторе кода мы открываем. Я сделаю новое окно, открою новую папку, которую я сделаю, назову эту папку этой датой. 290425. В этот в эту папку я скопирую тот файл, который у меня скачался. У меня скопировался должен быть здесь. Нет, он мне не хочет. О'кей. Мак мне не позволяет в этом интерфейсе копировать. В этом, я думаю, получится 26. Так, погнали. Эту штуку я сразу переименую в индекс, чтобы он в сервере открывался по умолчанию. Запущу сразу сервер. Угу, всё есть, всё работает. И дальше найду, куда нужно вставить мой API ключ. Одна из причин, которых я прошу не писать комментарии, что он их излично пишет и пользы от них на самом деле не так много, и они только как бы ухудшают поиск, потому что я сейчас вот пытаюсь найти API ключ. Вот оно здесь. Сюда нужно вставить мой ключ. Предварительно я завёл. Платформа Open AI. Мы заходим сюда. Здесь у тебя есть проект. Тебе нужно сделать новый проект. Я завёл. как бы думал, что ещё один из вариантов - это можно сделать сказки. Я периодически делаю для сына сказки, и я делал картинки для этих сказок. И это было утомительно, потому что те каждую картинку нужно делать. Я всё ждал, пока выйдет опишка, но в какой-то момент сделаю сказки. Завели проект. И в этом проекте теперь ты где-то должен получить опишку. Здесь, кстати, вот ещё есть режим Playground, где ты можешь уже попробовать э конкретные модели, что они будут отвечать очень, ну, перед тем, как, а, в своём приложении их, э, подделать. Где же были ключи? Вот они, API ключи здесь. А, я сделал новый ключ. И что важно, тебе нужно этот ключ сразу куда-то скопировать, потому что он показывается только один раз. И только после этого тебе нужно его будет завести заново, если ты его не скопировал. Или где-то потерял ключ временный, поэтому не страшно, если кто-то его увидит и начнёт его использовать. Вот я вставлю сюда мой ключ. Так, заменить на

Запуск проекта, настройка API ключа

ваш ключ. Заменил. Так, да, на одной строке очень, кстати, вот минус, э, следите внимательно за автодополнение, потому что он вот сейчас добавил э дефис копия ключу моему, но почему-то решил, что там не хватает дефиса. В общем, да, проверяйте аккуратно тоже за автодополнением, которое работает внутри файлов. Так, я бы какой-то бы вообще какую-то кнопку бы добавил включатьвыключать её по кнопке. Мне там не через контекст на окно лазить, потому что иногда, правда, он мешает. Так, давайте проверим. Я скопировал. И по идее, по идее больше ничего делать не надо, но скорее всего что-то будет работать не так. Так, вот он мой сервер. Ещё раз. Так, напишите идею сюда. О'кей, давайте проверим. Сейчас буду диктовать. Хочу сделать э сказки для моего сына, и мне нужно использовать мм модель для генерации изображений. Для этой идеи единственное, что я хочу сделать, я хочу убедиться, какую модель э выбрал Джени, куда она будет отправлять. К GPT четырёх Mini. О'кей, подходит. Мне кажется, её мы выбрали как одну из самых дешёвых. По-моему, самые дешёвые - это 41 нано. У них проблему с неймингом признал даже Сабальтман SEO Open. Ai он в твите написал, что типа да, чуваки, реально наш нейминг- это, конечно, это трабл. Обещал пофиксить всю эту историю. Короче, не буду проверять, верю. Всё, погнали проверим. Всё, что нужно сделать, это Почему он пропал? Ладно. А, хочу сделать, э, сказки для моего сына. Текст будет генерировать четырёх, картинки будет генерировать GPT Image 1. О'кей. Я открою сразу консоль разработчика, чтобы посмотреть вкладка Network. Вкладка Network показывает все сетевые запросы. А её важно заново открыть, потому что если ты уже сделал сетевый запрос, её открыл, он логировать запросы не будет. Вот я нажимаю кнопку добавить сценарий и запрос мне, кстати, что классно отправил. Мне вот что видно, что мне тоже очень нравится. Пользователь только что добавил вот что отправилось к модели. Пользователь, сейчас перенесу иконку. А пользователь только что добавил новую идею. Хочу сделать сказки для моего сына. Текст будет генерировать четыре мини. В общем, весь текст. Помоги форматировать результат для прямого отображения в текстовом блоке. используй переносы строк, если нужно, а не добавлять никаких вступлений или заключений, вроде вот обновлённые сценарии. Просто верни сам обновлённый текст сценария. Всё круто. Посмотрим, что пришло от Open AI. Ответ пришёл в формате JON. Формат, используемый для, а, передачи информации между веб-приложениями. Это такой стандарт. И он выглядит как такая непонятная штука в фигурных скобках. Но если знать, чего смотреть, а, и нажимать на кнопки, то можно быстро найти, что же нам ответили. И вот здесь пришёл ответ во вкладке контент. А вот, собственно, это есть ответ, который пришёл. Сейчас на этом этапе можно посмотреть, сохранилась ли информация об этом запросе. платформе Open AI. Я захожу сюда, я захожу, качество в дашборд. И мне нужна вкладка Usage. И здесь будет, да, вот двадцать девятое сегодня, э, апрель. Вот один запрос. Там очень мало токенов, очень мало символов, поэтому запрос пока меньше 1 цента он указывает. Ну, в общем, это всё будет здесь. Здесь есть э также другие вкладки. Супер у них мне очень нравится их дашборд. Очень всё подробно, но это нам пока а не нужно. В рамках этого стрима мы не будем смотреть. Если у вас есть сейчас, ребят, какие-то вопросы, может быть, идеи, напишите их, пожалуйста, в чат. Да, сейчас скину промт для GPT. Описание переди. Ну, на самом деле, там никакого промта. Мм, там просто я прошу сделал не переди. Вот и всё. То, что я закинул, было вот это вот. Ну, на самом деле, наверное, важно только самая первая часть. Вот я скину весь. Так, и промты, кстати, я постоянно ресё с помощью depress perplexity, ну, либо чаты. чат просто там их ограниченное количество, а в Плекси у меня годовой аккаунт, и поэтому я вот использую resarch de resarch и просто прошу там типич запрос выглядит как звучит как

Первая попытка: отправляем запрос с текстом

мм дай мне топпрамты для н цели создания приложений или там с описанием ролей что-то что-то в таком роде что там было последнего интересного вот изфн сделай мне пожалуйста Пока нет ничего показать. А, в общем, как-то так. Поэтому в самих пронтах, как вот на данный момент я не вижу чего-то такого, э, суперценного. То есть как бы вот я просто, как сказать, позировал. Нет, господи, я забыл это слово. Принёс, э, передал промтинг чату. Я его прошу постоянно делать. Мне промты хорошие, классные. Закидываю максимально контекстом. Прямо вот озвучиваю всё, что думаю, а потом прошу сделать мне классный промт. И этот промт уже я сам редактирую. Вот обычно получается хорошо. А я раньше использовал как это называется, метапромтинг, когда у тебя есть отдельный промт для построения других промтов. Я раньше такую штуку использовал, она какая-то очень сложная. А там прямо у тебя промты получаются супержирнючие, просто мегажирные. И там ещё важно очень, например, вот в этой методике важно указывать э примеры, а примеры, как ты хочешь, у тебя выглядел твой ответ. Вот. И там ответы тоже были такие ж жирные. Там каждый запрос по 30. 000 токенов был. Но там прямо ты на каждым запросом сидишь минут по 15, наверное. То Влад написал то, что он юзает сколько, да, через тул скинул. Кстати, полезный тул. Его можно ещё установить, э, как он называется такой тул можно ещё установить кода, который будет прямо внизу показывать, сколько токенов занимает твой файл. Аэ, встречал такую штуку. В целом интересный. Каждый раз испытываю трудности, чтобы попасть в чат. Вот такой, да. А, и он, кстати, показывает, как, э, как считается такинизация, как он обновляет. Ну, что вот, я так понимаю, это один токен, да? Это второй токен. Вот что он эти все типа слова объединяет в токены. Вот. И типа дальше считает вот это вот слово назапрос правим шестнадцати токеном. Давайте сейчас ради прикола какой-нибудь вот этот запрос отправлю. Т, что ушло. А вот интересно смотреть, как он, как он их считает. Вот. А вот это вот то, что отправляется, это вот язык понятный, а понятный вл. Это вот символ, на котором он общается, да? Есть какая-то вот эта вот огромная огромный массив знаний. И в этом массиве знаний, а вот эти токены - это символы, которые понятны. Это 13 - это что? 13 - это точка. Вот интересно смотреть. Ну, короче, интересно. Прикольные штуки, типа, что вот тринадцатый токен, токен под номером 13 в русском языке - это точка. А, а двенадцатый, что? Двенадцатый - это тирешка. Видимо, не в русском, а в целом во всём. То есть там единая база.

Работа с Network и JSON-ответами

А 279 - это символ новой строки. Вот как он их разбивает. Что ещё здесь интересного? А, о'кей. А, ну вот он ещё здесь, кстати, посчитал системный промт, видимо. А, где-то есть. Все приложения обычно строятся из двух промтов. Это системный промт и usепромт. Зер - это то, что системный. Обычно он закрыт от пользователя и пользовательский промт. И они потом собираются в одно целое и посылаются. А, о'кей, осталось мало времени. Самое главное, так, о'кей, эта штука работает. Теперь нужно быстро придумать идею для того, чтобы генерировать картинки. И я сейчас прямо быстро то же самое прошу сделать э а здесь ещё одна из историй, по которой я прошёл, потому что он классно работает с библиотеками, если что-то нужно быстро заскафолдить, какой-то быстрый сделать ээ набросок приложения. И он работает с библиотеками, э, с их актуальными с их актуальным вызовом, их актуальное использование лучше, чем, чем чат, чем чат GPT и моделича GPT. Так, сюда я спрошу, значит, давайте какую-то тестовую штуку сделаем. Ну, давайте сказки. А, слушай, я делаю приложение для сказок для своего сына, и у меня есть текст, который будет генерироваться, а, моделью четырёх мини. Мне нужно, чтобы для каждого абзаца ещё и сгенерировалось изображение. То есть на вход у меня будет идея для сказки, на выходе у меня будет какое-то количество абзацев, заголовок, и для каждого абзаца у меня будет картинка. Давай для теста возьмём четыре абзаца. Так, отлично. Я думаю, что я не буду м ладно, прогоню всё-таки на всякий случай. Я сейчас напишу сюда. Делай то

Переключаемся на генерацию сказки с картинками

же самое. такой же документ, но для другой идеи. Я думаю, что он её быстро сгенерирует. Имеете в виду тоже, что вот для таких вещей, чем у тебя модель жирнее дороже, тем лучше, потому что я чаще использую О3, но я не сравнивал детально вот прямо конкретно. Просто как-то ОО3 часто бывают классные, короче, классные доки он делает. А-а, всё, что касается структурирования инфы, он прямо хорошо это делает. Так, о'кей. Э-э, полевода input, всё супер. Э, яркий детский визуальный стиль, всё равно. Технические детали, работа через два API, всё верно, gpt для текста. Модель генерации изображений. Здесь я сейчас укажу, что это будет, э, GPT Image One. Всё, этого хватит. Ну, кстати, удобно. Интерфейс. Инпут для идеи. Кнопка сгенерируеть сказку ниже. Сказка идеально. Обзац один. Заголовок идеально. Копирую. Вставляю V. df. Сделай, пожалуйста, приложение в едином HTML-файле. Так, приложение в едином HTM. Очень важно просить его сделать HTML-файл, чтобы он не выдавал тебе разные куски кода. Отдельно CSS, JS. И здесь я удалю вопросы. в этом промте и удалю модель генерации изображения конкретную GPT Image 1, кажется, она так называется. Run. Я сейчас на всякий случай открою у себя дополнительно документацию по этой модели для генерации изображений на случай, если что-то пойдёт не так. GPT 1. А так документация. Неудобно, что у них здесь нет ссылки на документацию быструю. Можно сравнить. Было бы классно, если бы у них вот здесь при нажатии на point было бы ссылка на документацию, как использовать. А так снапшоты. Хмм, ну давайте так поищем GPT идж 1. Так, копи reference. Вот, наверное, это оно мне и нужно, да? Image generation response мне нужен был, да, вот create image, вот этот путь, который будет изображение по промту. Вот пример. Вот это я искал. Я искал пример запроса, что в запросе указывается модель GPT Image 1, указывается prompt N это количество, указывается размер. Я не вижу здесь, где указывается качество. Наверное, качество и будет являться размером. Хотя из того, что я читал до этого, у меня почему-то О'кей. N - это количество изображений, output compressions. А вот quality. По умолчанию, по умолчанию quality будет авто. То есть он может в какой-то момент решить то, что а нужно самое высокое. Вот я бы здесь quality всё-таки поставил low, потому что разница в цене очень большая. High medium and low supported for GPT Image One. Окей. Вот, в принципе, то, что и надо знать. А так я вот эту ссылку сейчас себе скопирую запросик куда-нибудь под руку. Так, скачаю код, который мне выдал. Придумаю идею для сказку про ёжика. Открою сразу, посмотрю, что он будет делать. А придумай сказку, как м Иф гулял с папой и попал в мусорку. И там они устроили м бардак из помойки. Какие-то абсурдные идеи всегда хорошо работают. Так, погнали. Сгенерируй сказку, пожалуйста. Введи идею для сказку. В смысле? Я же только что её вёл. Что же ты мне рассказываешь? Так, ладно. тест. А нет, слушай, она уже есть. Придумаете вашу идею для сказки. И он почему-то не хочет мне её придумывать. И в принципе на этом всё. На этом заканчивается история. И я сейчас просто перенесу полученный файл сюда. Назову его мм image gen. Назовую image gen. Зайду всё. Теперь посмотрю, что в этом файле, а как API работает. Проверю. Имитация вызова, имитация запроса. Вот у меня, кстати, с, да, проимитировал запросы. Может быть, может быть такое, что для GM 2 и5 Pro стоит системный пром. Что если тебя просят с первого раза, поменяй, пожалуйста, логику тестовых запросов на реальные запросы к Open AI. Такое же может быть, потому что уже не первый раз он с первого раза, несмотря на то, что я прошу и в промте указываю, что слушай, нужно, чтобы было нужны, чтобы были реальные запросы. И там технических было указаны модели. Вот он уже второй раз подряд мне делает, э делает тестовый запрос. Хотя это тоже классно, что Хотя, ну, кстати, он не сработал, да, потому что он, а, почему-то мне заругался на inпу, что-то ему там не понравилось. Вот. Ладно, сейчас, э, получим второй вариант, потестим его, если не получится, смотрим. И я планирую уложиться а в 15 минут максимум, лучше в 10. Так, всё ещё пишут. Ещё одну из странных новостей, которую я сейчас вспомнил, внезапно абсурдно. Да, о том, что Сео Бинанса это прямо написали всякие таблоиды, всякие финансовые штуки пишут то, что Сео Бинанс написал, заявил о том, что он думает, что Сатошина комота - это тот чел неизвестный наним, который придумал биткои, что это Аис будущего. Мне понравилась эта теория. Так, это же новая, да, штука, которая она просто подходит на очень похожа на предыдущую. А так здесь появилась новая ошибка. Что хорошо. что он пишет мне, что не указан файл. И это хорошо. То же самое сделаю. Я сейчас перенесу сюда, в папку этого проекта этот файлик. Так, это папка проекта. И сюда перекидываю свежесозданный файлик. Старый я удаляю. Давай сейчас назову image gen, чтобы самому не потеряться. Здесь я должен найти API ключ. Так, так. Э, что-нибудь типа. Вот он. Так, а где его? Вот он. Open API key. Очень интересно, что он его

Генерация HTML-приложения под сказку

инициализирует в условии, а дефолтным параметром. Такая не самая классная штука, как мне кажется. Ну ладно, пойдёт. А выше? Мне кажется, выше всё-таки, да? Погнали. Нет, нет. Здесь, здесь, здесь. А вот он точно нормас. Так, спасибо. И он опять мне теряшку добавил, блин. Вот он, короче, любит добавлять. Так, давайте проверим, что получилось. Ну что, дубль два. Сделай, пожалуйста, мне сказку про то, как мы со своим сыном Ивом гуляли по улице, и нас внезапно проглотила помойка, и мы из этой помойки выбирались. Страница другая. Блин, спасибо большое за то, что помогаешь. Так, а что? Страница-то другая. Вроде всё то. Нет, ладно, сейчас проверим. А, в смысле, здесь тоже верно. Это очень круто. Я вот себе очень хочу этого ассистента и ассистента, потому что так много всё время не очернующее, когда чужие трансляции особенно смотришь, кажется: "Блин, чел, просто вот она здесь у тебя эта ошибка, ты на неё смотришь, почему же у тебя не получается? " Генерируем волшебство, пожалуйста, подождите. А так запрос ответа. Запрос пошёл. Приключение в помойке. Отлично. У меня есть, а, пришли ответы по абзацам. Так, и он сразу закинул четыре запроса на картинке. А-э, пришли ответы одно. А что я заметил? Третье. О, супер. Четыре картинки, а они не отобразились. О, отобразились. У, класс. Давайте посмотрим, что получилось. Очень интересно. Однажды папа и его маленькие сыны гуляли по улице. Они радовались, смеялись и искали красивые цветочки. Вдруг из-за угла выглянула большая странная помойка, которая улыбалась и шевелилась. "Не бойся, Иф, это просто помойка", - сказал папа и шагнули ближе. Такая помойка выскочила, и сейчас она нас съест. А, но вдруг помойка открыла свою крышку и проглотила их. "Упс", - воскликнул Ив, когда они оказались внутри. Здесь было темно и пахло разными странными запахами. "Не бойся, Иф, давай найдём выход", - сказал папа и включил свой фонарик. Даже вот он попытался, кстати, сделать текст, что он странно на английском языке. Я забыл указать качество. Сейчас посмотримка, сколько он съел. А они начали искать путь наружу, перебирая мусор и разные вещи. Иф нашёл старую игрушку и сказал: "Смотри, папа, здесь много забавного". Они вместе смеялись и продолжали искать выход, пока не наткнулись на большую коробку. Мне интересно, это ИФ превратился в девочку или они нашли девочку в помойке или что вообще произошло? Внезапно исчез. Папа вообще потерялся или это папа? Это Иф. Непонятно. А папа открыл коробку, и там оказался яркий свет. "Ура, это выход! " - закричали они вместе и выскочили наружу. Они быстро выбежали из помойки и снова оказались на улице, где светило солнце. "Это было весело", - сказал Иф и обнял папу. "Давай больше никогда не гулять рядом с помойками". Кстати, папа больше всего похож на себя, считаю. Очень хорошо получился. Неплохо. That was fun. Let's never wonder near the dums again. Те, кстати, тоже неплохо получился. Последнее. Всё у нас классно получилось. Шалась удалась. Хочу проверить, э, меня Open AI меня обокрал или нет. На 80 центов пробанная дробь. 16 центов. 16 центов я сгенерировал четыре картинки. Скорее всего, это был МИД. Скорее всего, это было среднее качество, учитывая, что если у нас был первый запрос, то у нас сейчас ушло на запрос, а, где-то в районе 15 тире1 центов, а, на вот эти все запросы, а получается, что среднюю, наверное, по 4 цента за картинку. И это вкладывается в их цену, по-моему, я не помню, сколько там было. Я помню, там самая дорогая 19 центов. То есть это точно не самый дорогой шоу, но и не самый дешёвый. Больше запросов мы не делали. В общем, это было весело. Спасибо вам, классно, что мы уложились во время. До новых встреч. Всем удачи, успехов. Пишите вопросы в чат, не стесняйтесь писать, скидывать какие-то классные штуки. В общем, удачи и до новых встреч. y

Другие видео автора — Sereja Ris

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник