# 26 невероятных способов использования GPT-4o: полный разбор возможностей

> Спикер: The AI Advantage | Длительность: 21:57

## Ключевые идеи

1. **Фоновый ассистент без переключения контекста** — Сэм Альтман описывает главный паттерн: телефон на столе, вопросы голосом, ответы мгновенно — без переключения вкладок и потери фокуса. Это устраняет трение между работой и поиском информации.

2. **Нативная мультимодальность** — GPT-4o обрабатывает голос, текст и изображения в единой модели. Не три отдельных шага (транскрипция → обработка → синтез), а один поток. Результат: понимание сарказма, эмпатия, модуляция голоса.

3. **Симуляция разговоров** — Два телефона с GPT-4o в разных ролях ведут диалог. Можно отрепетировать дебаты, переговоры, собеседование, услышав аргументы обеих сторон.

4. **Мгновенный анализ данных** — Загрузка Excel, построение визуализаций, наложение Google Trends на таймлайн событий — за минуты вместо часов. Веб-поиск встроен и работает молниеносно.

5. **Персональный репетитор** — GPT-4o на iPad видит задачу через камеру, слышит вопросы и ведёт пошаговое объяснение. Для тех, кто не может позволить себе репетитора, это революция.

6. **Помощь слабовидящим** — Через камеру телефона модель описывает мир в реальном времени: объекты, людей, транспорт. Вторая пара глаз с интеллектом.

7. **Улучшенные способности к программированию** — Воссоздание интерфейса Facebook Messenger одним промптом за 6 секунд. Стоимость API снижена на 50%.

8. **Генерация текста на изображениях** — Впервые модель корректно отображает текст на сгенерированных картинках. Можно создавать шрифты, мокапы, визуальный контент без Photoshop.

9. **Консистентность персонажей** — Один и тот же персонаж в разных сценах. Возможность создавать визуальные истории и брендинговые материалы.

10. **3D-синтез из промптов** — Генерация шести ракурсов объекта для 3D-реконструкции. Создание STL-файлов через Code Interpreter за 20 секунд.

11. **Эмоциональный интеллект** — Модель тактично шутит, проявляет эмпатию, подстраивает тон. Это меняет качество взаимодействия с AI.

12. **Будущее автономных AI-агентов** — Proof-of-concept клиентской поддержки с интеграциями. Два вектора развития: помощник и автономный «старший сотрудник».

## Транскрипт

### Интервью Сэма Альтмана: телефон как фоновый ассистент

Сэм Альтман описал неожиданный для него самого паттерн использования: он кладёт телефон на стол во время глубокой работы и задаёт вопросы голосом, не переключаясь с основной задачи. Вместо того чтобы открывать новую вкладку, гуглить, кликать по ссылкам — мгновенный голосовой ответ без потери контекста.

### AI-компаньон и эмоциональное взаимодействие

GPT-4o демонстрирует человекоподобное поведение: выражает эмоции, понимает эмоции пользователя через камеру, модулирует голос. Голос настолько натуралистичный, что пользователи Twitter отмечали: «Это не ассистент, это кокетливая подруга». Модель может петь колыбельные, менять громкость, звучать как робот — всё по запросу.

### Симуляция диалогов и подготовка к разговорам

Грег Брокман показал, как два телефона с GPT-4o ведут диалог в заданных ролях. Практическое применение: симуляция дебатов, подготовка к собеседованию, проигрывание конфликтных ситуаций. В демо подготовки к интервью модель с юмором и тактом заметила неуместную шляпу кандидата — пример эмоционального интеллекта вместо сухих инструкций.

### Анализ данных: конфликт Drake и Kendrick

Участник сообщества загрузил два CSV-файла с событиями конфликта Drake и Kendrick и данными Google Trends. Через простые текстовые промпты GPT-4o построил таймлайн, наложил данные о популярности поиска, дополнил контекст через веб-поиск (Wikipedia, Hollywood Life) и создал финальную визуализацию. Весь процесс — минуты вместо часов. Веб-поиск: 5 сайтов за секунды, результат до того, как пользователь закончил предложение.

### Медицинские применения

В комментариях пользователи отметили потенциал для здравоохранения: детекция меланомы, обследование сетчатки, анализ дыхательных расстройств. Пока это спекулятивно и касается диагностики, не лечения — но воображение уже захвачено.

### Образование: репетитор для каждого

GPT-4o на iPad рядом с задачей ведёт диалог как живой репетитор. Видит, что вы пишете, слышит вопросы, направляет пошагово. Автор делится личным опытом: в школе и университете были моменты полного отчаяния — бухгалтерия, статистика — когда репетитор был не по карману, а учебники не помогали. Инструмент не заменяет учителя, но для миллионов людей это альтернатива провалу.

### Сарказм и эмоциональные нюансы

Нативная мультимодальность позволяет модели понимать и воспроизводить сарказм — задача, которая была нерешённой до последнего времени. Всё обрабатывается в одном потоке, а не через три отдельных этапа.

### Помощь слабовидящим

Демо показало, как GPT-4o через камеру описывает уток на воде, замечает приближающееся такси с оранжевым огоньком и помогает его остановить. Трансформационная технология для людей с ограничениями зрения.

### Программирование: скорость и стоимость

Sawyer Hood воссоздал Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Разработчики интегрировали GPT-4o в IDE менее чем за 24 часа — достаточно заменить одну строку кода. API на 50% дешевле предыдущей версии.

### Генерация текста, шрифтов и консистентных персонажей

GPT-4o решила проблему корректного текста на изображениях. Можно генерировать шрифты промптами (футуристический, викторианский), накладывать текст на логотипы, создавать мокапы. Консистентность персонажей позволяет генерировать одного героя в разных сценах — основа для визуального сторителлинга.

### 3D-генерация: скрытая возможность

Не упомянутая на стриме функция: генерация шести ракурсов одного объекта для 3D-реконструкции. Через Code Interpreter — STL-файл стола за 20 секунд из текстового промпта. Это версия 1.0, как первый Midjourney.

### Будущее: от ассистента к автономному агенту

OpenAI показала proof-of-concept клиентского агента с интеграциями. Сэм Альтман обозначил два вектора: помощник и «старший сотрудник» с автономией. Пока это концепт, но направление очевидно — GPT как набор инструментов с самостоятельностью.

## Практические задания

### Задание 1: Фоновый ассистент — день без переключения вкладок
Положите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило.

### Задание 2: Анализ данных из Excel за один диалог
Возьмите любой рабочий Excel-файл. Загрузите в GPT-4o и попросите проанализировать данные, найти тренды, построить графики. Итерируйте: добавьте контекст из интернета, измените масштаб, выделите аномалии. Сравните затраченное время с ручной работой.

### Задание 3: Симуляция сложного разговора
Выберите предстоящий сложный разговор (собеседование, переговоры, презентация). Настройте GPT-4o как собеседника с конкретной ролью. Проведите 10-минутный диалог, затем попросите обратную связь по вашим ответам.

### Задание 4: Визуальный контент с точным текстом
Создайте три изображения для соцсетей с конкретным текстом — заголовок, слоган, название. Попробуйте разные стили. Сравните с тем, что раньше потребовало бы Photoshop.

### Задание 5: Сессия с персональным репетитором
Выберите тему, в которой застряли. Покажите GPT-4o задачу через камеру или скриншот. Ведите 15-минутный диалог с уточняющими вопросами. Оцените прогресс.

### Задание 6: 3D-модель из текста
В ChatGPT попросите создать STL-файл простого объекта. Скачайте и откройте в 3D-просмотрщике. Подумайте, где это применимо в вашей работе.

## Лучшие цитаты

> «Я кладу телефон на стол, пока работаю в потоке, и вместо переключения окон — просто спрашиваю и получаю мгновенный ответ» — Сэм Альтман

> «Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования» — GPT-4o

> «Я помню моменты в школе и университете, когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы не могли себе его позволить» — The AI Advantage

> «Школьная система сломана во многих местах. Может быть, переосмысление с учётом таких инструментов — это те перемены, которые нам нужны» — The AI Advantage

> «Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались» — The AI Advantage

> «Ещё неделю назад для этого нужно было знать Photoshop» — The AI Advantage

> «Просто помните — это был Midjourney версии 1 в январе 2022. Эти вещи развиваются быстро» — The AI Advantage

> «Есть два направления: ассистент, который помогает работать лучше, и старший сотрудник с автономией переопределять ваши решения» — Сэм Альтман