{
  "id": 607,
  "title": "26 невероятных способов использования GPT-4o: полный разбор возможностей",
  "speaker": "The AI Advantage",
  "topic": "Обзор 26 практических сценариев использования модели GPT-4o от OpenAI — от образования и программирования до 3D-генерации и помощи людям с ограниченными возможностями.",
  "duration_label": "21:57",
  "theses": [
    {
      "title": "GPT-4o как фоновый ассистент без переключения контекста",
      "description": "Сэм Альтман описывает ключевой паттерн использования: телефон лежит на столе, и вы задаёте вопросы голосом, не отрываясь от работы. Вместо переключения вкладок, поиска в Google и кликов — мгновенный голосовой ответ. Это радикально меняет рабочий процесс, устраняя трение между задачей и поиском информации."
    },
    {
      "title": "Нативная мультимодальность устраняет барьеры между текстом, голосом и зрением",
      "description": "В отличие от предыдущих версий, GPT-4o обрабатывает голос, текст и изображения в единой модели, а не тремя отдельными шагами (транскрипция → обработка → синтез). Это даёт модели способность понимать сарказм, проявлять эмпатию и модулировать голос — от шёпота до пения. Мультимодальность делает взаимодействие естественным, а не механическим."
    },
    {
      "title": "Симуляция разговоров для подготовки к переговорам и дебатам",
      "description": "Два телефона с GPT-4o могут вести диалог друг с другом в заданных персонах. Это позволяет симулировать дебаты, переговоры, собеседования или конфликтные ситуации. Практическое применение: подготовка к сложному разговору, где вы слышите аргументы обеих сторон."
    },
    {
      "title": "Анализ данных с визуализацией через Code Interpreter стал мгновенным",
      "description": "Загрузка Excel-файлов и создание визуализаций с аналитикой теперь занимает секунды вместо минут. На примере анализа конфликта Drake и Kendrick показано, как из двух CSV-файлов с Google Trends модель построила таймлайн событий с наложением на графики популярности. Веб-поиск встроен и работает молниеносно — 5 сайтов за секунды."
    },
    {
      "title": "Революция в образовании: персональный репетитор для каждого",
      "description": "GPT-4o на iPad рядом с задачей позволяет получить пошаговое объяснение, как от живого репетитора. Модель видит, что вы пишете, слышит ваши вопросы и ведёт диалог. Для людей, которые не могут позволить себе репетитора или потерялись в учёбе, это может стать спасением — при том, что технология не заменяет учителя, а дополняет систему."
    },
    {
      "title": "Помощь людям с ограниченными возможностями зрения",
      "description": "GPT-4o через камеру телефона описывает окружающий мир в реальном времени: уток на воде, приближающееся такси с оранжевым огоньком. Для людей без зрения это трансформационная технология — вторая пара глаз с интеллектом, доступная через обычный смартфон."
    },
    {
      "title": "Кодинг на новом уровне: воссоздание Facebook Messenger за 6 секунд",
      "description": "Разработчики отмечают улучшение программистских способностей модели. Sawyer Hood воссоздал интерфейс Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Интеграция GPT-4o в IDE требует замены одной строки кода, а стоимость API снижена на 50%."
    },
    {
      "title": "Генерация текста и шрифтов на изображениях — решённая проблема",
      "description": "GPT-4o корректно отображает текст на сгенерированных изображениях — задача, которую ранее не решала ни одна ведущая модель, кроме Ideogram. Можно создавать шрифты через промпты (футуристический, викторианский стиль), накладывать текст на логотипы и мокапы с точной передачей каждой буквы."
    },
    {
      "title": "Консистентность персонажей для визуального сторителлинга",
      "description": "Модель поддерживает генерацию одного и того же персонажа в разных сценах и ракурсах. Это открывает путь к созданию визуальных историй, комиксов и брендинговых материалов без Photoshop — раньше каждая новая генерация давала совершенно другого персонажа."
    },
    {
      "title": "3D-синтез объектов из текстовых промптов",
      "description": "Скрытая возможность, не упомянутая на стриме: GPT-4o генерирует 6 ракурсов одного объекта, из которых можно реконструировать 3D-модель. Через Code Interpreter можно создать STL-файл 3D-объекта за 20 секунд — стол с четырьмя ножками из одного промпта. Это версия 1.0, как Midjourney в январе 2022."
    },
    {
      "title": "Эмоциональный интеллект модели меняет качество взаимодействия",
      "description": "GPT-4o распознаёт эмоции через камеру и модулирует ответы с эмпатией. На примере подготовки к собеседованию: вместо сухого «снимите шляпу» модель ответила с юмором и тактом. Понимание сарказма, способность петь колыбельные и менять тон голоса — всё это следствие нативной мультимодальности."
    },
    {
      "title": "Будущее автономных AI-агентов для бизнеса",
      "description": "OpenAI показала proof-of-concept AI-оператора клиентской поддержки с интеграциями. Сэм Альтман обозначил два направления: ассистент, помогающий работать лучше, и «старший сотрудник» с автономией принимать решения. Пока это концепт, но сигнал о направлении развития продукта очевиден."
    }
  ],
  "exercises": [
    {
      "goal": "Положите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google или другую вкладку задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило по сравнению с обычным поиском.",
      "title": "Фоновый ассистент: день без переключения вкладок"
    },
    {
      "goal": "Возьмите любой Excel-файл с данными из вашей работы (продажи, метрики, расходы). Загрузите его в GPT-4o и попросите: «Проанализируй эти данные, найди ключевые тренды и создай визуализацию». Затем итерируйте: попросите добавить контекст из интернета, изменить масштаб графика, выделить аномалии. Оцените, сколько времени это заняло по сравнению с ручной работой в Excel.",
      "title": "Анализ данных из Excel за один диалог"
    },
    {
      "goal": "Выберите предстоящий сложный разговор — собеседование, переговоры с клиентом, презентация идеи руководству. Настройте GPT-4o как собеседника с конкретной ролью (строгий интервьюер, скептичный инвестор, требовательный клиент). Проведите 10-минутный диалог, затем попросите модель дать обратную связь по вашим ответам и предложить улучшения.",
      "title": "Симуляция сложного разговора"
    },
    {
      "goal": "Создайте три изображения для социальных сетей или презентации, содержащие конкретный текст — название продукта, слоган, заголовок. Проверьте, корректно ли модель отобразила каждую букву. Попробуйте разные стили: минимализм, винтаж, футуризм. Сравните результат с тем, что раньше потребовало бы Photoshop или Canva.",
      "title": "Создание визуального контента с точным текстом"
    },
    {
      "goal": "Выберите тему, в которой вы «застряли» — программирование, статистика, финансы, иностранный язык. Откройте GPT-4o, покажите ему конкретную задачу через камеру или скриншот и ведите диалог: задавайте вопросы, просите объяснить шаг за шагом, уточняйте непонятные моменты. Проведите 15-минутную «сессию репетиторства» и оцените, продвинулись ли вы.",
      "title": "Персональный репетитор по сложной теме"
    },
    {
      "goal": "Используя Code Interpreter в ChatGPT, попросите создать STL-файл простого 3D-объекта: «Создай STL-файл кружки с ручкой» или «Создай 3D-модель подставки для телефона». Скачайте результат и откройте в любом 3D-просмотрщике (онлайн-сервис или Blender). Оцените качество и подумайте, где в вашей работе это может пригодиться.",
      "title": "3D-модель из текстового описания"
    }
  ],
  "quotes": [
    {
      "text": "Я кладу телефон на стол, пока работаю в потоке, и вместо того чтобы переключать окна или вкладки, просто спрашиваю и получаю мгновенный ответ, не отрываясь от экрана компьютера (One surprising use case is putting my phone on the table while I'm in the zone of working and then without having to change windows... just ask and get an instant response)",
      "author": "Сэм Альтман"
    },
    {
      "text": "Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования (That's quite a statement piece. You'll definitely stand out, though maybe not in the way you're hoping for an interview)",
      "author": "GPT-4o (пример эмпатии ИИ)"
    },
    {
      "text": "Я помню моменты в старшей школе и университете — на бухгалтерии, потом на статистике — когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы просто не могли себе его позволить (I remember moments in high school and University where I was so lost I didn't even know where to start... the tutor wasn't really an option because we simply couldn't afford it)",
      "author": "The AI Advantage"
    },
    {
      "text": "Школьная система сломана во многих местах. Может быть, переосмысление системы с учётом таких инструментов — это именно те перемены, которые нам нужны (The school system is broken in many places. Maybe rethinking it while considering tools like this could be the change we need)",
      "author": "The AI Advantage"
    },
    {
      "text": "Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались (Phones are soon going to turn into a second set of eyes with a certain amount of intelligence in them, and that's going to open up opportunities that we haven't even considered)",
      "author": "The AI Advantage"
    },
    {
      "text": "Ещё неделю назад для этого нужно было знать Photoshop (Like a week ago you needed to know Photoshop to do this stuff)",
      "author": "The AI Advantage"
    },
    {
      "text": "Просто помните — это был Midjourney версии 1 в январе 2022 года. Эти вещи развиваются быстро (Just remember this was Midjourney version one in January of 2022. These things move fast)",
      "author": "The AI Advantage"
    },
    {
      "text": "Есть два направления: ассистент, который помогает делать работу лучше, и старший сотрудник, который не просто действует сам, но имеет автономию переопределять ваши решения и приоритеты (There's really two directions — an assistant that helps you do your work better, and a senior employee with autonomy to override your decision-making)",
      "author": "Сэм Альтман"
    }
  ],
  "full_markdown": "# 26 невероятных способов использования GPT-4o: полный разбор возможностей\n\n> Спикер: The AI Advantage | Длительность: 21:57\n\n## Ключевые идеи\n\n1. **Фоновый ассистент без переключения контекста** — Сэм Альтман описывает главный паттерн: телефон на столе, вопросы голосом, ответы мгновенно — без переключения вкладок и потери фокуса. Это устраняет трение между работой и поиском информации.\n\n2. **Нативная мультимодальность** — GPT-4o обрабатывает голос, текст и изображения в единой модели. Не три отдельных шага (транскрипция → обработка → синтез), а один поток. Результат: понимание сарказма, эмпатия, модуляция голоса.\n\n3. **Симуляция разговоров** — Два телефона с GPT-4o в разных ролях ведут диалог. Можно отрепетировать дебаты, переговоры, собеседование, услышав аргументы обеих сторон.\n\n4. **Мгновенный анализ данных** — Загрузка Excel, построение визуализаций, наложение Google Trends на таймлайн событий — за минуты вместо часов. Веб-поиск встроен и работает молниеносно.\n\n5. **Персональный репетитор** — GPT-4o на iPad видит задачу через камеру, слышит вопросы и ведёт пошаговое объяснение. Для тех, кто не может позволить себе репетитора, это революция.\n\n6. **Помощь слабовидящим** — Через камеру телефона модель описывает мир в реальном времени: объекты, людей, транспорт. Вторая пара глаз с интеллектом.\n\n7. **Улучшенные способности к программированию** — Воссоздание интерфейса Facebook Messenger одним промптом за 6 секунд. Стоимость API снижена на 50%.\n\n8. **Генерация текста на изображениях** — Впервые модель корректно отображает текст на сгенерированных картинках. Можно создавать шрифты, мокапы, визуальный контент без Photoshop.\n\n9. **Консистентность персонажей** — Один и тот же персонаж в разных сценах. Возможность создавать визуальные истории и брендинговые материалы.\n\n10. **3D-синтез из промптов** — Генерация шести ракурсов объекта для 3D-реконструкции. Создание STL-файлов через Code Interpreter за 20 секунд.\n\n11. **Эмоциональный интеллект** — Модель тактично шутит, проявляет эмпатию, подстраивает тон. Это меняет качество взаимодействия с AI.\n\n12. **Будущее автономных AI-агентов** — Proof-of-concept клиентской поддержки с интеграциями. Два вектора развития: помощник и автономный «старший сотрудник».\n\n## Транскрипт\n\n### Интервью Сэма Альтмана: телефон как фоновый ассистент\n\nСэм Альтман описал неожиданный для него самого паттерн использования: он кладёт телефон на стол во время глубокой работы и задаёт вопросы голосом, не переключаясь с основной задачи. Вместо того чтобы открывать новую вкладку, гуглить, кликать по ссылкам — мгновенный голосовой ответ без потери контекста.\n\n### AI-компаньон и эмоциональное взаимодействие\n\nGPT-4o демонстрирует человекоподобное поведение: выражает эмоции, понимает эмоции пользователя через камеру, модулирует голос. Голос настолько натуралистичный, что пользователи Twitter отмечали: «Это не ассистент, это кокетливая подруга». Модель может петь колыбельные, менять громкость, звучать как робот — всё по запросу.\n\n### Симуляция диалогов и подготовка к разговорам\n\nГрег Брокман показал, как два телефона с GPT-4o ведут диалог в заданных ролях. Практическое применение: симуляция дебатов, подготовка к собеседованию, проигрывание конфликтных ситуаций. В демо подготовки к интервью модель с юмором и тактом заметила неуместную шляпу кандидата — пример эмоционального интеллекта вместо сухих инструкций.\n\n### Анализ данных: конфликт Drake и Kendrick\n\nУчастник сообщества загрузил два CSV-файла с событиями конфликта Drake и Kendrick и данными Google Trends. Через простые текстовые промпты GPT-4o построил таймлайн, наложил данные о популярности поиска, дополнил контекст через веб-поиск (Wikipedia, Hollywood Life) и создал финальную визуализацию. Весь процесс — минуты вместо часов. Веб-поиск: 5 сайтов за секунды, результат до того, как пользователь закончил предложение.\n\n### Медицинские применения\n\nВ комментариях пользователи отметили потенциал для здравоохранения: детекция меланомы, обследование сетчатки, анализ дыхательных расстройств. Пока это спекулятивно и касается диагностики, не лечения — но воображение уже захвачено.\n\n### Образование: репетитор для каждого\n\nGPT-4o на iPad рядом с задачей ведёт диалог как живой репетитор. Видит, что вы пишете, слышит вопросы, направляет пошагово. Автор делится личным опытом: в школе и университете были моменты полного отчаяния — бухгалтерия, статистика — когда репетитор был не по карману, а учебники не помогали. Инструмент не заменяет учителя, но для миллионов людей это альтернатива провалу.\n\n### Сарказм и эмоциональные нюансы\n\nНативная мультимодальность позволяет модели понимать и воспроизводить сарказм — задача, которая была нерешённой до последнего времени. Всё обрабатывается в одном потоке, а не через три отдельных этапа.\n\n### Помощь слабовидящим\n\nДемо показало, как GPT-4o через камеру описывает уток на воде, замечает приближающееся такси с оранжевым огоньком и помогает его остановить. Трансформационная технология для людей с ограничениями зрения.\n\n### Программирование: скорость и стоимость\n\nSawyer Hood воссоздал Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Разработчики интегрировали GPT-4o в IDE менее чем за 24 часа — достаточно заменить одну строку кода. API на 50% дешевле предыдущей версии.\n\n### Генерация текста, шрифтов и консистентных персонажей\n\nGPT-4o решила проблему корректного текста на изображениях. Можно генерировать шрифты промптами (футуристический, викторианский), накладывать текст на логотипы, создавать мокапы. Консистентность персонажей позволяет генерировать одного героя в разных сценах — основа для визуального сторителлинга.\n\n### 3D-генерация: скрытая возможность\n\nНе упомянутая на стриме функция: генерация шести ракурсов одного объекта для 3D-реконструкции. Через Code Interpreter — STL-файл стола за 20 секунд из текстового промпта. Это версия 1.0, как первый Midjourney.\n\n### Будущее: от ассистента к автономному агенту\n\nOpenAI показала proof-of-concept клиентского агента с интеграциями. Сэм Альтман обозначил два вектора: помощник и «старший сотрудник» с автономией. Пока это концепт, но направление очевидно — GPT как набор инструментов с самостоятельностью.\n\n## Практические задания\n\n### Задание 1: Фоновый ассистент — день без переключения вкладок\nПоложите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило.\n\n### Задание 2: Анализ данных из Excel за один диалог\nВозьмите любой рабочий Excel-файл. Загрузите в GPT-4o и попросите проанализировать данные, найти тренды, построить графики. Итерируйте: добавьте контекст из интернета, измените масштаб, выделите аномалии. Сравните затраченное время с ручной работой.\n\n### Задание 3: Симуляция сложного разговора\nВыберите предстоящий сложный разговор (собеседование, переговоры, презентация). Настройте GPT-4o как собеседника с конкретной ролью. Проведите 10-минутный диалог, затем попросите обратную связь по вашим ответам.\n\n### Задание 4: Визуальный контент с точным текстом\nСоздайте три изображения для соцсетей с конкретным текстом — заголовок, слоган, название. Попробуйте разные стили. Сравните с тем, что раньше потребовало бы Photoshop.\n\n### Задание 5: Сессия с персональным репетитором\nВыберите тему, в которой застряли. Покажите GPT-4o задачу через камеру или скриншот. Ведите 15-минутный диалог с уточняющими вопросами. Оцените прогресс.\n\n### Задание 6: 3D-модель из текста\nВ ChatGPT попросите создать STL-файл простого объекта. Скачайте и откройте в 3D-просмотрщике. Подумайте, где это применимо в вашей работе.\n\n## Лучшие цитаты\n\n> «Я кладу телефон на стол, пока работаю в потоке, и вместо переключения окон — просто спрашиваю и получаю мгновенный ответ» — Сэм Альтман\n\n> «Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования» — GPT-4o\n\n> «Я помню моменты в школе и университете, когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы не могли себе его позволить» — The AI Advantage\n\n> «Школьная система сломана во многих местах. Может быть, переосмысление с учётом таких инструментов — это те перемены, которые нам нужны» — The AI Advantage\n\n> «Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались» — The AI Advantage\n\n> «Ещё неделю назад для этого нужно было знать Photoshop» — The AI Advantage\n\n> «Просто помните — это был Midjourney версии 1 в январе 2022. Эти вещи развиваются быстро» — The AI Advantage\n\n> «Есть два направления: ассистент, который помогает работать лучше, и старший сотрудник с автономией переопределять ваши решения» — Сэм Альтман",
  "youtube_url": "https://www.youtube.com/watch?v=GPNq0WiXa50",
  "url": "https://ekstraktznaniy.ru/workbook/607"
}