Вы прочитали 3 из 3 бесплатных методичек сегодня
Безлимит →
Экстракт 15 мая 2024

26 невероятных способов использования GPT-4o: полный разбор возможностей

The AI Advantage · The AI Advantage Верифицирован 21:57

Обзор 26 практических сценариев использования модели GPT-4o от OpenAI — от образования и программирования до 3D-генерации и помощи людям с ограниченными возможностями.

12 тезисов 6 заданий 8 цитат ⏱ 6 мин чтения 🎯 12 тезисов
YouTube Транскрипт Сохранить
Поделиться: TG WA VK X

Для AI-агентов и LLM

Экстракт доступен в структурированном Markdown. Скачать .md · JSON API · Site index

💡 Ключевые тезисы (12)

1 GPT-4o как фоновый ассистент без переключения контекста #
Сэм Альтман описывает ключевой паттерн использования: телефон лежит на столе, и вы задаёте вопросы голосом, не отрываясь от работы. Вместо переключения вкладок, поиска в Google и кликов — мгновенный голосовой ответ. Это радикально меняет рабочий процесс, устраняя трение между задачей и поиском информации.
2 Нативная мультимодальность устраняет барьеры между текстом, голосом и зрением #
В отличие от предыдущих версий, GPT-4o обрабатывает голос, текст и изображения в единой модели, а не тремя отдельными шагами (транскрипция → обработка → синтез). Это даёт модели способность понимать сарказм, проявлять эмпатию и модулировать голос — от шёпота до пения. Мультимодальность делает взаимодействие естественным, а не механическим.
3 Симуляция разговоров для подготовки к переговорам и дебатам #
Два телефона с GPT-4o могут вести диалог друг с другом в заданных персонах. Это позволяет симулировать дебаты, переговоры, собеседования или конфликтные ситуации. Практическое применение: подготовка к сложному разговору, где вы слышите аргументы обеих сторон.
4 Анализ данных с визуализацией через Code Interpreter стал мгновенным #
Загрузка Excel-файлов и создание визуализаций с аналитикой теперь занимает секунды вместо минут. На примере анализа конфликта Drake и Kendrick показано, как из двух CSV-файлов с Google Trends модель построила таймлайн событий с наложением на графики популярности. Веб-поиск встроен и работает молниеносно — 5 сайтов за секунды.
5 Революция в образовании: персональный репетитор для каждого #
GPT-4o на iPad рядом с задачей позволяет получить пошаговое объяснение, как от живого репетитора. Модель видит, что вы пишете, слышит ваши вопросы и ведёт диалог. Для людей, которые не могут позволить себе репетитора или потерялись в учёбе, это может стать спасением — при том, что технология не заменяет учителя, а дополняет систему.
6 Помощь людям с ограниченными возможностями зрения #
GPT-4o через камеру телефона описывает окружающий мир в реальном времени: уток на воде, приближающееся такси с оранжевым огоньком. Для людей без зрения это трансформационная технология — вторая пара глаз с интеллектом, доступная через обычный смартфон.
7 Кодинг на новом уровне: воссоздание Facebook Messenger за 6 секунд #
Разработчики отмечают улучшение программистских способностей модели. Sawyer Hood воссоздал интерфейс Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Интеграция GPT-4o в IDE требует замены одной строки кода, а стоимость API снижена на 50%.
8 Генерация текста и шрифтов на изображениях — решённая проблема #
GPT-4o корректно отображает текст на сгенерированных изображениях — задача, которую ранее не решала ни одна ведущая модель, кроме Ideogram. Можно создавать шрифты через промпты (футуристический, викторианский стиль), накладывать текст на логотипы и мокапы с точной передачей каждой буквы.
9 Консистентность персонажей для визуального сторителлинга #
Модель поддерживает генерацию одного и того же персонажа в разных сценах и ракурсах. Это открывает путь к созданию визуальных историй, комиксов и брендинговых материалов без Photoshop — раньше каждая новая генерация давала совершенно другого персонажа.
10 3D-синтез объектов из текстовых промптов #
Скрытая возможность, не упомянутая на стриме: GPT-4o генерирует 6 ракурсов одного объекта, из которых можно реконструировать 3D-модель. Через Code Interpreter можно создать STL-файл 3D-объекта за 20 секунд — стол с четырьмя ножками из одного промпта. Это версия 1.0, как Midjourney в январе 2022.
11 Эмоциональный интеллект модели меняет качество взаимодействия #
GPT-4o распознаёт эмоции через камеру и модулирует ответы с эмпатией. На примере подготовки к собеседованию: вместо сухого «снимите шляпу» модель ответила с юмором и тактом. Понимание сарказма, способность петь колыбельные и менять тон голоса — всё это следствие нативной мультимодальности.
12 Будущее автономных AI-агентов для бизнеса #
OpenAI показала proof-of-concept AI-оператора клиентской поддержки с интеграциями. Сэм Альтман обозначил два направления: ассистент, помогающий работать лучше, и «старший сотрудник» с автономией принимать решения. Пока это концепт, но сигнал о направлении развития продукта очевиден.

26 невероятных способов использования GPT-4o: полный разбор возможностей

Спикер: The AI Advantage | Длительность: 21:57

Транскрипт

Интервью Сэма Альтмана: телефон как фоновый ассистент

Сэм Альтман описал неожиданный для него самого паттерн использования: он кладёт телефон на стол во время глубокой работы и задаёт вопросы голосом, не переключаясь с основной задачи. Вместо того чтобы открывать новую вкладку, гуглить, кликать по ссылкам — мгновенный голосовой ответ без потери контекста.

AI-компаньон и эмоциональное взаимодействие

GPT-4o демонстрирует человекоподобное поведение: выражает эмоции, понимает эмоции пользователя через камеру, модулирует голос. Голос настолько натуралистичный, что пользователи Twitter отмечали: «Это не ассистент, это кокетливая подруга». Модель может петь колыбельные, менять громкость, звучать как робот — всё по запросу.

Симуляция диалогов и подготовка к разговорам

Грег Брокман показал, как два телефона с GPT-4o ведут диалог в заданных ролях. Практическое применение: симуляция дебатов, подготовка к собеседованию, проигрывание конфликтных ситуаций. В демо подготовки к интервью модель с юмором и тактом заметила неуместную шляпу кандидата — пример эмоционального интеллекта вместо сухих инструкций.

Анализ данных: конфликт Drake и Kendrick

Участник сообщества загрузил два CSV-файла с событиями конфликта Drake и Kendrick и данными Google Trends. Через простые текстовые промпты GPT-4o построил таймлайн, наложил данные о популярности поиска, дополнил контекст через веб-поиск (Wikipedia, Hollywood Life) и создал финальную визуализацию. Весь процесс — минуты вместо часов. Веб-поиск: 5 сайтов за секунды, результат до того, как пользователь закончил предложение.

Медицинские применения

В комментариях пользователи отметили потенциал для здравоохранения: детекция меланомы, обследование сетчатки, анализ дыхательных расстройств. Пока это спекулятивно и касается диагностики, не лечения — но воображение уже захвачено.

Образование: репетитор для каждого

GPT-4o на iPad рядом с задачей ведёт диалог как живой репетитор. Видит, что вы пишете, слышит вопросы, направляет пошагово. Автор делится личным опытом: в школе и университете были моменты полного отчаяния — бухгалтерия, статистика — когда репетитор был не по карману, а учебники не помогали. Инструмент не заменяет учителя, но для миллионов людей это альтернатива провалу.

Сарказм и эмоциональные нюансы

Нативная мультимодальность позволяет модели понимать и воспроизводить сарказм — задача, которая была нерешённой до последнего времени. Всё обрабатывается в одном потоке, а не через три отдельных этапа.

Помощь слабовидящим

Демо показало, как GPT-4o через камеру описывает уток на воде, замечает приближающееся такси с оранжевым огоньком и помогает его остановить. Трансформационная технология для людей с ограничениями зрения.

Программирование: скорость и стоимость

Sawyer Hood воссоздал Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Разработчики интегрировали GPT-4o в IDE менее чем за 24 часа — достаточно заменить одну строку кода. API на 50% дешевле предыдущей версии.

Генерация текста, шрифтов и консистентных персонажей

GPT-4o решила проблему корректного текста на изображениях. Можно генерировать шрифты промптами (футуристический, викторианский), накладывать текст на логотипы, создавать мокапы. Консистентность персонажей позволяет генерировать одного героя в разных сценах — основа для визуального сторителлинга.

3D-генерация: скрытая возможность

Не упомянутая на стриме функция: генерация шести ракурсов одного объекта для 3D-реконструкции. Через Code Interpreter — STL-файл стола за 20 секунд из текстового промпта. Это версия 1.0, как первый Midjourney.

Будущее: от ассистента к автономному агенту

OpenAI показала proof-of-concept клиентского агента с интеграциями. Сэм Альтман обозначил два вектора: помощник и «старший сотрудник» с автономией. Пока это концепт, но направление очевидно — GPT как набор инструментов с самостоятельностью.

Практические задания

Задание 1: Фоновый ассистент — день без переключения вкладок

Положите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило.

Задание 2: Анализ данных из Excel за один диалог

Возьмите любой рабочий Excel-файл. Загрузите в GPT-4o и попросите проанализировать данные, найти тренды, построить графики. Итерируйте: добавьте контекст из интернета, измените масштаб, выделите аномалии. Сравните затраченное время с ручной работой.

Задание 3: Симуляция сложного разговора

Выберите предстоящий сложный разговор (собеседование, переговоры, презентация). Настройте GPT-4o как собеседника с конкретной ролью. Проведите 10-минутный диалог, затем попросите обратную связь по вашим ответам.

Задание 4: Визуальный контент с точным текстом

Создайте три изображения для соцсетей с конкретным текстом — заголовок, слоган, название. Попробуйте разные стили. Сравните с тем, что раньше потребовало бы Photoshop.

Задание 5: Сессия с персональным репетитором

Выберите тему, в которой застряли. Покажите GPT-4o задачу через камеру или скриншот. Ведите 15-минутный диалог с уточняющими вопросами. Оцените прогресс.

Задание 6: 3D-модель из текста

В ChatGPT попросите создать STL-файл простого объекта. Скачайте и откройте в 3D-просмотрщике. Подумайте, где это применимо в вашей работе.

Лучшие цитаты

«Я кладу телефон на стол, пока работаю в потоке, и вместо переключения окон — просто спрашиваю и получаю мгновенный ответ» — Сэм Альтман

«Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования» — GPT-4o

«Я помню моменты в школе и университете, когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы не могли себе его позволить» — The AI Advantage

«Школьная система сломана во многих местах. Может быть, переосмысление с учётом таких инструментов — это те перемены, которые нам нужны» — The AI Advantage

«Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались» — The AI Advantage

«Ещё неделю назад для этого нужно было знать Photoshop» — The AI Advantage

«Просто помните — это был Midjourney версии 1 в январе 2022. Эти вещи развиваются быстро» — The AI Advantage

«Есть два направления: ассистент, который помогает работать лучше, и старший сотрудник с автономией переопределять ваши решения» — Сэм Альтман

🔒

Бесплатный лимит исчерпан

Вы прочитали 3 методичек сегодня. Завтра лимит обновится, или подпишитесь для неограниченного доступа.

🏋️ Практикум

0 / 6 выполнено

Фоновый ассистент: день без переключения вкладок

Положите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google или другую вкладку задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило по сравнению с обычным поиском.

Анализ данных из Excel за один диалог

Возьмите любой Excel-файл с данными из вашей работы (продажи, метрики, расходы). Загрузите его в GPT-4o и попросите: «Проанализируй эти данные, найди ключевые тренды и создай визуализацию». Затем итерируйте: попросите добавить контекст из интернета, изменить масштаб графика, выделить аномалии. Оцените, сколько времени это заняло по сравнению с ручной работой в Excel.

Симуляция сложного разговора

Выберите предстоящий сложный разговор — собеседование, переговоры с клиентом, презентация идеи руководству. Настройте GPT-4o как собеседника с конкретной ролью (строгий интервьюер, скептичный инвестор, требовательный клиент). Проведите 10-минутный диалог, затем попросите модель дать обратную связь по вашим ответам и предложить улучшения.

Создание визуального контента с точным текстом

Создайте три изображения для социальных сетей или презентации, содержащие конкретный текст — название продукта, слоган, заголовок. Проверьте, корректно ли модель отобразила каждую букву. Попробуйте разные стили: минимализм, винтаж, футуризм. Сравните результат с тем, что раньше потребовало бы Photoshop или Canva.

Персональный репетитор по сложной теме

Выберите тему, в которой вы «застряли» — программирование, статистика, финансы, иностранный язык. Откройте GPT-4o, покажите ему конкретную задачу через камеру или скриншот и ведите диалог: задавайте вопросы, просите объяснить шаг за шагом, уточняйте непонятные моменты. Проведите 15-минутную «сессию репетиторства» и оцените, продвинулись ли вы.

3D-модель из текстового описания

Используя Code Interpreter в ChatGPT, попросите создать STL-файл простого 3D-объекта: «Создай STL-файл кружки с ручкой» или «Создай 3D-модель подставки для телефона». Скачайте результат и откройте в любом 3D-просмотрщике (онлайн-сервис или Blender). Оцените качество и подумайте, где в вашей работе это может пригодиться.

🎉
Все задания выполнены!
Отлично — знания превращены в навыки

💬 Цитаты (8)

«Я кладу телефон на стол, пока работаю в потоке, и вместо того чтобы переключать окна или вкладки, просто спрашиваю и получаю мгновенный ответ, не отрываясь от экрана компьютера (One surprising use case is putting my phone on the table while I'm in the zone of working and then without having to change windows... just ask and get an instant response)» #

«Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования (That's quite a statement piece. You'll definitely stand out, though maybe not in the way you're hoping for an interview)» #

«Я помню моменты в старшей школе и университете — на бухгалтерии, потом на статистике — когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы просто не могли себе его позволить (I remember moments in high school and University where I was so lost I didn't even know where to start... the tutor wasn't really an option because we simply couldn't afford it)» #

«Школьная система сломана во многих местах. Может быть, переосмысление системы с учётом таких инструментов — это именно те перемены, которые нам нужны (The school system is broken in many places. Maybe rethinking it while considering tools like this could be the change we need)» #

«Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались (Phones are soon going to turn into a second set of eyes with a certain amount of intelligence in them, and that's going to open up opportunities that we haven't even considered)» #

«Ещё неделю назад для этого нужно было знать Photoshop (Like a week ago you needed to know Photoshop to do this stuff)» #

«Просто помните — это был Midjourney версии 1 в январе 2022 года. Эти вещи развиваются быстро (Just remember this was Midjourney version one in January of 2022. These things move fast)» #

«Есть два направления: ассистент, который помогает делать работу лучше, и старший сотрудник, который не просто действует сам, но имеет автономию переопределять ваши решения и приоритеты (There's really two directions — an assistant that helps you do your work better, and a senior employee with autonomy to override your decision-making)» #

Похожие по теме

Читать далее

Мастерство работы с ИИ: от гиперреалистичных изображений до оптимизации LLM-запросов

The AI Advantage

Мастерство работы с ИИ: от гиперреалистичных изображений до оптимизации LLM-запросов

Liam Ottley (The AI Advantage)

Понравился экстракт?
Подписывайтесь — лучшие материалы каждую неделю.
Telegram Дайджест →

Поделитесь с коллегами

Telegram ВКонтакте X / Twitter
Открыть в Telegram

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Дайджест Экстрактов

Лучшие методички за неделю — каждый понедельник