26 невероятных способов использования GPT-4o: полный разбор возможностей > Спикер: The AI Advantage | Длительность: 21:57 Ключевые идеи 1. Фоновый ассистент без переключения контекста — Сэм Альтман описывает главный паттерн: телефон на столе, вопросы голосом, ответы мгновенно — без переключения вкладок и потери фокуса. Это устраняет трение между работой и поиском информации. 2. Нативная мультимодальность — GPT-4o обрабатывает голос, текст и изображения в единой модели. Не три отдельных шага (транскрипция → обработка → синтез), а один поток. Результат: понимание сарказма, эмпатия, модуляция голоса. 3. Симуляция разговоров — Два телефона с GPT-4o в разных ролях ведут диалог. Можно отрепетировать дебаты, переговоры, собеседование, услышав аргументы обеих сторон. 4. Мгновенный анализ данных — Загрузка Excel, построение визуализаций, наложение Google Trends на таймлайн событий — за минуты вместо часов. Веб-поиск встроен и работает молниеносно. 5. Персональный репетитор — GPT-4o на iPad видит задачу через камеру, слышит вопросы и ведёт пошаговое объяснение. Для тех, кто не может позволить себе репетитора, это революция. 6. Помощь слабовидящим — Через камеру телефона модель описывает мир в реальном времени: объекты, людей, транспорт. Вторая пара глаз с интеллектом. 7. Улучшенные способности к программированию — Воссоздание интерфейса Facebook Messenger одним промптом за 6 секунд. Стоимость API снижена на 50%. 8. Генерация текста на изображениях — Впервые модель корректно отображает текст на сгенерированных картинках. Можно создавать шрифты, мокапы, визуальный контент без Photoshop. 9. Консистентность персонажей — Один и тот же персонаж в разных сценах. Возможность создавать визуальные истории и брендинговые материалы. 10. 3D-синтез из промптов — Генерация шести ракурсов объекта для 3D-реконструкции. Создание STL-файлов через Code Interpreter за 20 секунд. 11. Эмоциональный интеллект — Модель тактично шутит, проявляет эмпатию, подстраивает тон. Это меняет качество взаимодействия с AI. 12. Будущее автономных AI-агентов — Proof-of-concept клиентской поддержки с интеграциями. Два вектора развития: помощник и автономный «старший сотрудник». Транскрипт Интервью Сэма Альтмана: телефон как фоновый ассистент Сэм Альтман описал неожиданный для него самого паттерн использования: он кладёт телефон на стол во время глубокой работы и задаёт вопросы голосом, не переключаясь с основной задачи. Вместо того чтобы открывать новую вкладку, гуглить, кликать по ссылкам — мгновенный голосовой ответ без потери контекста. AI-компаньон и эмоциональное взаимодействие GPT-4o демонстрирует человекоподобное поведение: выражает эмоции, понимает эмоции пользователя через камеру, модулирует голос. Голос настолько натуралистичный, что пользователи Twitter отмечали: «Это не ассистент, это кокетливая подруга». Модель может петь колыбельные, менять громкость, звучать как робот — всё по запросу. Симуляция диалогов и подготовка к разговорам Грег Брокман показал, как два телефона с GPT-4o ведут диалог в заданных ролях. Практическое применение: симуляция дебатов, подготовка к собеседованию, проигрывание конфликтных ситуаций. В демо подготовки к интервью модель с юмором и тактом заметила неуместную шляпу кандидата — пример эмоционального интеллекта вместо сухих инструкций. Анализ данных: конфликт Drake и Kendrick Участник сообщества загрузил два CSV-файла с событиями конфликта Drake и Kendrick и данными Google Trends. Через простые текстовые промпты GPT-4o построил таймлайн, наложил данные о популярности поиска, дополнил контекст через веб-поиск (Wikipedia, Hollywood Life) и создал финальную визуализацию. Весь процесс — минуты вместо часов. Веб-поиск: 5 сайтов за секунды, результат до того, как пользователь закончил предложение. Медицинские применения В комментариях пользователи отметили потенциал для здравоохранения: детекция меланомы, обследование сетчатки, анализ дыхательных расстройств. Пока это спекулятивно и касается диагностики, не лечения — но воображение уже захвачено. Образование: репетитор для каждого GPT-4o на iPad рядом с задачей ведёт диалог как живой репетитор. Видит, что вы пишете, слышит вопросы, направляет пошагово. Автор делится личным опытом: в школе и университете были моменты полного отчаяния — бухгалтерия, статистика — когда репетитор был не по карману, а учебники не помогали. Инструмент не заменяет учителя, но для миллионов людей это альтернатива провалу. Сарказм и эмоциональные нюансы Нативная мультимодальность позволяет модели понимать и воспроизводить сарказм — задача, которая была нерешённой до последнего времени. Всё обрабатывается в одном потоке, а не через три отдельных этапа. Помощь слабовидящим Демо показало, как GPT-4o через камеру описывает уток на воде, замечает приближающееся такси с оранжевым огоньком и помогает его остановить. Трансформационная технология для людей с ограничениями зрения. Программирование: скорость и стоимость Sawyer Hood воссоздал Facebook Messenger одним промптом за 6 секунд — один HTML-файл. Разработчики интегрировали GPT-4o в IDE менее чем за 24 часа — достаточно заменить одну строку кода. API на 50% дешевле предыдущей версии. Генерация текста, шрифтов и консистентных персонажей GPT-4o решила проблему корректного текста на изображениях. Можно генерировать шрифты промптами (футуристический, викторианский), накладывать текст на логотипы, создавать мокапы. Консистентность персонажей позволяет генерировать одного героя в разных сценах — основа для визуального сторителлинга. 3D-генерация: скрытая возможность Не упомянутая на стриме функция: генерация шести ракурсов одного объекта для 3D-реконструкции. Через Code Interpreter — STL-файл стола за 20 секунд из текстового промпта. Это версия 1.0, как первый Midjourney. Будущее: от ассистента к автономному агенту OpenAI показала proof-of-concept клиентского агента с интеграциями. Сэм Альтман обозначил два вектора: помощник и «старший сотрудник» с автономией. Пока это концепт, но направление очевидно — GPT как набор инструментов с самостоятельностью. Практические задания Задание 1: Фоновый ассистент — день без переключения вкладок Положите телефон с ChatGPT рядом с рабочим компьютером. В течение рабочего дня вместо переключения на Google задавайте вопросы голосом, не отрывая взгляд от основной задачи. В конце дня запишите, сколько раз вы использовали голосового ассистента и сколько времени это сэкономило. Задание 2: Анализ данных из Excel за один диалог Возьмите любой рабочий Excel-файл. Загрузите в GPT-4o и попросите проанализировать данные, найти тренды, построить графики. Итерируйте: добавьте контекст из интернета, измените масштаб, выделите аномалии. Сравните затраченное время с ручной работой. Задание 3: Симуляция сложного разговора Выберите предстоящий сложный разговор (собеседование, переговоры, презентация). Настройте GPT-4o как собеседника с конкретной ролью. Проведите 10-минутный диалог, затем попросите обратную связь по вашим ответам. Задание 4: Визуальный контент с точным текстом Создайте три изображения для соцсетей с конкретным текстом — заголовок, слоган, название. Попробуйте разные стили. Сравните с тем, что раньше потребовало бы Photoshop. Задание 5: Сессия с персональным репетитором Выберите тему, в которой застряли. Покажите GPT-4o задачу через камеру или скриншот. Ведите 15-минутный диалог с уточняющими вопросами. Оцените прогресс. Задание 6: 3D-модель из текста В ChatGPT попросите создать STL-файл простого объекта. Скачайте и откройте в 3D-просмотрщике. Подумайте, где это применимо в вашей работе. Лучшие цитаты > «Я кладу телефон на стол, пока работаю в потоке, и вместо переключения окон — просто спрашиваю и получаю мгновенный ответ» — Сэм Альтман > «Это довольно смелое заявление. Вы определённо будете выделяться... хотя, возможно, не так, как вы надеетесь для собеседования» — GPT-4o > «Я помню моменты в школе и университете, когда я был настолько потерян, что даже не знал, с чего начать. Репетитор не был вариантом — мы не могли себе его позволить» — The AI Advantage > «Школьная система сломана во многих местах. Может быть, переосмысление с учётом таких инструментов — это те перемены, которые нам нужны» — The AI Advantage > «Телефоны скоро превратятся во вторую пару глаз с определённым уровнем интеллекта — и это откроет возможности, о которых мы даже не задумывались» — The AI Advantage > «Ещё неделю назад для этого нужно было знать Photoshop» — The AI Advantage > «Просто помните — это был Midjourney версии 1 в январе 2022. Эти вещи развиваются быстро» — The AI Advantage > «Есть два направления: ассистент, который помогает работать лучше, и старший сотрудник с автономией переопределять ваши решения» — Сэм Альтман