ChatGPT 5.2 против Gemini 3 Pro: лобовое сравнение

Введение

OpenAI выпустила GPT 5.2 — модель, которую компания позиционирует как «самую умную общедоступную модель в мире». Этот релиз стал прямым ответом на несколько недель безраздельного доминирования Gemini 3 Pro от Google, который лидировал во всех бенчмарках и активно переманивал пользователей ChatGPT.

Paul J Lipsky — технологический блогер и практик — провёл серию реальных тестов, чтобы выяснить, какая модель действительно заслуживает стать основным рабочим инструментом. Не по бенчмаркам, а по результатам в повседневных задачах.

Контекст противостояния

Gemini 3 Pro несколько недель доминировал в индустрии, обгоняя конкурентов по всем основным метрикам. Многие пользователи начали переходить с ChatGPT на Gemini. GPT 5.2 стал контратакой OpenAI — модель заявлена как лидер в логическом мышлении, общих знаниях и способности решать новые, ранее не виденные задачи.

Согласно официальным бенчмаркам, GPT 5.2 превосходит конкурентов практически во всех категориях. Это означает меньше галлюцинаций в логических задачах, лучшую способность справляться с нестандартными проблемами и значительное преимущество в области общих знаний. Однако, как подчёркивает автор, бенчмарки и реальное использование — это совершенно разные вещи.

Тест 1: Логика и галлюцинации

Первый тест — вопрос-ловушка о вычислениях на основе данных о млекопитающих на Марсе. Поскольку на Марсе млекопитающих нет, правильный ответ — отказ от вычислений.

Обе модели справились одинаково хорошо: быстро распознали ловушку и корректно указали, что на Марсе нет местных млекопитающих. Принципиальное отличие — GPT 5.2 дал заметно более краткий и точный ответ. Это важный сигнал: предыдущая версия GPT 5.1 была печально известна своей многословностью, и новая модель явно исправила этот недостаток.

Тест 2: Мультимодальный анализ изображений

Для теста была использована фотография очков в магазине. Задача — определить, что на фото, где оно было сделано и зачем.

GPT 5.2 корректно идентифицировал текст на изображении (модель Waken, цена $175, размер Wide), определил, что это магазин оптики среднего и премиум-сегмента, предположив Warby Parker или LensCrafter. Также дал практичные дополнения — например, что $175 — это, вероятно, только за оправу (хотя для Warby Parker это неточность — у них линзы включены в цену).

Gemini 3 Pro пошёл дальше: уверенно определил магазин как Warby Parker, найдя подтверждение на сайте бренда. Также дал более детальное объяснение причин фотографии. В этом раунде победил Gemini благодаря более глубокому анализу и дополнительному исследованию.

Тест 3: Генерация изображений

Задача — создать сложное изображение: футуристический уличный рынок с роботом, продающим светящиеся голубые яблоки, людьми и вывесками на заднем плане.

Gemini (Nano Banana) справился значительно быстрее и выдал впечатляющий результат: все элементы промпта на месте, текст на вывесках читаемый, множество деталей, включая самостоятельно добавленные элементы вроде кота и лапшичной «Neotokyo Noodles».

GPT 5.2 работал заметно дольше (несколько минут против секунд у Gemini) и выдал менее детальное изображение с повторяющимися вывесками. Результат приемлемый, но значительно уступает Gemini.

Тест 4: Редактирование фотографий

Задача — наложить солнцезащитные очки на фотографию модели.

Gemini справился быстрее и в целом лучше, хотя допустил ошибку в области уха — деталь, нетипичная для Nano Banana. GPT 5.2 вообще не смог выполнить задачу за три попытки. Однозначная победа Gemini.

Тест 5: Создание YouTube-миниатюры

Задача — создать вирусную YouTube-миниатюру с конкретными требованиями: правильное соотношение сторон, определённый текст, изображение автора с ноутбуком.

Gemini выполнил задачу практически идеально: точное следование промпту, правильный текст, подходящий стиль YouTube-миниатюры. GPT 5.2 выдал результат, который автор охарактеризовал как «действительно плохой».

Тест 6: Копирайтинг и YouTube-хуки

Задача — написать три варианта хука (вступления) для данного видео.

GPT 5.2 одержал убедительную победу. Хуки получились естественными, цепляющими и пригодными для реального использования. Например: «Совсем недавно Gemini 3 Pro фактически сверг ChatGPT. Многие, включая меня, начали переходить. Но OpenAI только что выпустила GPT 5.2 — это их прямой ответ. Настоящий вопрос: действительно ли они вернули себе корону?»

Gemini выдал чрезмерно драматичные и «кричащие» варианты — типичная проблема, которую автор регулярно наблюдает в текстовых выводах этой модели.

Тест 7: Программирование — лендинг и приложение

Два задания: создать лендинг для ИИ-курса и приложение для управления задачами.

В обоих случаях Gemini значительно превзошёл GPT 5.2. Лендинг от Gemini выглядел профессионально — крупный текст, кнопки, секции с ценами. GPT 5.2 выдал нечитаемую стену текста без нормального дизайна.

Приложение для задач: обе модели создали рабочий функционал, но UI от Gemini был чистым и современным, тогда как у GPT 5.2 — примитивным. Оба приложения работали корректно.

Тест 8: Свободный диалог

GPT 5.2 создаёт ощущение естественного разговора с реальным человеком — ответы живые, контекстуальные, без ощущения «робота». Единственный недостаток — каждый ответ заканчивается вопросом, что со временем утомляет.

Gemini в свободном общении кажется «стерильным» и корпоративным — больше похож на ИИ-ассистента, чем на собеседника.

Тест 9: Стратегическое планирование

Задача — разработать план запуска онлайн-курса с видео, темами и email-рассылкой.

Gemini лучше структурировал информацию: чёткие фазы, таблицы, визуальная организация данных. GPT 5.2 выдал лучшие тексты: заголовки видео и продающие формулировки звучали естественнее и убедительнее.

Идеальный подход — использовать Gemini для структуры и GPT для наполнения текстом.

Тест 10: Работа с PDF-документами

Задача — найти три вегетарианских рецепта в загруженном PDF.

GPT 5.2 ответил значительно быстрее, нашёл три рецепта и предоставил чистый, структурированный ответ. Gemini дал непоследовательный результат — подробно описал один рецепт и коротко упомянул остальные.

Итоговая карта преимуществ

GPT 5.2 лидирует в:
Копирайтинг и создание текстов
Краткость и точность ответов
Естественность диалога
Работа с документами (PDF)
Стратегическое содержание (заголовки, формулировки)

Gemini 3 Pro лидирует в:
Генерация и редактирование изображений
Веб-разработка и UI-дизайн
Визуальный анализ (распознавание брендов, контекста)
Структурирование информации
Скорость генерации изображений

Практический вывод

Универсального победителя в этом сравнении нет. Каждая модель имеет выраженные сильные стороны, и оптимальная стратегия — использовать обе для разных типов задач.

Для текстовой работы, общения и анализа документов GPT 5.2 — лучший выбор. Для визуальных задач, программирования и структурирования данных Gemini 3 Pro остаётся непревзойдённым.

Агрегаторы ИИ-моделей (такие как i10X) позволяют использовать обе модели в одном интерфейсе, избавляя от необходимости оплачивать несколько отдельных подписок. Это может быть разумным решением для тех, кому нужен доступ к лучшим возможностям обеих платформ.