ChatGPT 5.2 против Gemini 3 Pro: лобовое сравнение Введение OpenAI выпустила GPT 5.2 — модель, которую компания позиционирует как «самую умную общедоступную модель в мире». Этот релиз стал прямым ответом на несколько недель безраздельного доминирования Gemini 3 Pro от Google, который лидировал во всех бенчмарках и активно переманивал пользователей ChatGPT. Paul J Lipsky — технологический блогер и практик — провёл серию реальных тестов, чтобы выяснить, какая модель действительно заслуживает стать основным рабочим инструментом. Не по бенчмаркам, а по результатам в повседневных задачах. Контекст противостояния Gemini 3 Pro несколько недель доминировал в индустрии, обгоняя конкурентов по всем основным метрикам. Многие пользователи начали переходить с ChatGPT на Gemini. GPT 5.2 стал контратакой OpenAI — модель заявлена как лидер в логическом мышлении, общих знаниях и способности решать новые, ранее не виденные задачи. Согласно официальным бенчмаркам, GPT 5.2 превосходит конкурентов практически во всех категориях. Это означает меньше галлюцинаций в логических задачах, лучшую способность справляться с нестандартными проблемами и значительное преимущество в области общих знаний. Однако, как подчёркивает автор, бенчмарки и реальное использование — это совершенно разные вещи. Тест 1: Логика и галлюцинации Первый тест — вопрос-ловушка о вычислениях на основе данных о млекопитающих на Марсе. Поскольку на Марсе млекопитающих нет, правильный ответ — отказ от вычислений. Обе модели справились одинаково хорошо: быстро распознали ловушку и корректно указали, что на Марсе нет местных млекопитающих. Принципиальное отличие — GPT 5.2 дал заметно более краткий и точный ответ. Это важный сигнал: предыдущая версия GPT 5.1 была печально известна своей многословностью, и новая модель явно исправила этот недостаток. Тест 2: Мультимодальный анализ изображений Для теста была использована фотография очков в магазине. Задача — определить, что на фото, где оно было сделано и зачем. GPT 5.2 корректно идентифицировал текст на изображении (модель Waken, цена $175, размер Wide), определил, что это магазин оптики среднего и премиум-сегмента, предположив Warby Parker или LensCrafter. Также дал практичные дополнения — например, что $175 — это, вероятно, только за оправу (хотя для Warby Parker это неточность — у них линзы включены в цену). Gemini 3 Pro пошёл дальше: уверенно определил магазин как Warby Parker, найдя подтверждение на сайте бренда. Также дал более детальное объяснение причин фотографии. В этом раунде победил Gemini благодаря более глубокому анализу и дополнительному исследованию. Тест 3: Генерация изображений Задача — создать сложное изображение: футуристический уличный рынок с роботом, продающим светящиеся голубые яблоки, людьми и вывесками на заднем плане. Gemini (Nano Banana) справился значительно быстрее и выдал впечатляющий результат: все элементы промпта на месте, текст на вывесках читаемый, множество деталей, включая самостоятельно добавленные элементы вроде кота и лапшичной «Neotokyo Noodles». GPT 5.2 работал заметно дольше (несколько минут против секунд у Gemini) и выдал менее детальное изображение с повторяющимися вывесками. Результат приемлемый, но значительно уступает Gemini. Тест 4: Редактирование фотографий Задача — наложить солнцезащитные очки на фотографию модели. Gemini справился быстрее и в целом лучше, хотя допустил ошибку в области уха — деталь, нетипичная для Nano Banana. GPT 5.2 вообще не смог выполнить задачу за три попытки. Однозначная победа Gemini. Тест 5: Создание YouTube-миниатюры Задача — создать вирусную YouTube-миниатюру с конкретными требованиями: правильное соотношение сторон, определённый текст, изображение автора с ноутбуком. Gemini выполнил задачу практически идеально: точное следование промпту, правильный текст, подходящий стиль YouTube-миниатюры. GPT 5.2 выдал результат, который автор охарактеризовал как «действительно плохой». Тест 6: Копирайтинг и YouTube-хуки Задача — написать три варианта хука (вступления) для данного видео. GPT 5.2 одержал убедительную победу. Хуки получились естественными, цепляющими и пригодными для реального использования. Например: «Совсем недавно Gemini 3 Pro фактически сверг ChatGPT. Многие, включая меня, начали переходить. Но OpenAI только что выпустила GPT 5.2 — это их прямой ответ. Настоящий вопрос: действительно ли они вернули себе корону?» Gemini выдал чрезмерно драматичные и «кричащие» варианты — типичная проблема, которую автор регулярно наблюдает в текстовых выводах этой модели. Тест 7: Программирование — лендинг и приложение Два задания: создать лендинг для ИИ-курса и приложение для управления задачами. В обоих случаях Gemini значительно превзошёл GPT 5.2. Лендинг от Gemini выглядел профессионально — крупный текст, кнопки, секции с ценами. GPT 5.2 выдал нечитаемую стену текста без нормального дизайна. Приложение для задач: обе модели создали рабочий функционал, но UI от Gemini был чистым и современным, тогда как у GPT 5.2 — примитивным. Оба приложения работали корректно. Тест 8: Свободный диалог GPT 5.2 создаёт ощущение естественного разговора с реальным человеком — ответы живые, контекстуальные, без ощущения «робота». Единственный недостаток — каждый ответ заканчивается вопросом, что со временем утомляет. Gemini в свободном общении кажется «стерильным» и корпоративным — больше похож на ИИ-ассистента, чем на собеседника. Тест 9: Стратегическое планирование Задача — разработать план запуска онлайн-курса с видео, темами и email-рассылкой. Gemini лучше структурировал информацию: чёткие фазы, таблицы, визуальная организация данных. GPT 5.2 выдал лучшие тексты: заголовки видео и продающие формулировки звучали естественнее и убедительнее. Идеальный подход — использовать Gemini для структуры и GPT для наполнения текстом. Тест 10: Работа с PDF-документами Задача — найти три вегетарианских рецепта в загруженном PDF. GPT 5.2 ответил значительно быстрее, нашёл три рецепта и предоставил чистый, структурированный ответ. Gemini дал непоследовательный результат — подробно описал один рецепт и коротко упомянул остальные. Итоговая карта преимуществ GPT 5.2 лидирует в: Копирайтинг и создание текстов Краткость и точность ответов Естественность диалога Работа с документами (PDF) Стратегическое содержание (заголовки, формулировки) Gemini 3 Pro лидирует в: Генерация и редактирование изображений Веб-разработка и UI-дизайн Визуальный анализ (распознавание брендов, контекста) Структурирование информации Скорость генерации изображений Практический вывод Универсального победителя в этом сравнении нет. Каждая модель имеет выраженные сильные стороны, и оптимальная стратегия — использовать обе для разных типов задач. Для текстовой работы, общения и анализа документов GPT 5.2 — лучший выбор. Для визуальных задач, программирования и структурирования данных Gemini 3 Pro остаётся непревзойдённым. Агрегаторы ИИ-моделей (такие как i10X) позволяют использовать обе модели в одном интерфейсе, избавляя от необходимости оплачивать несколько отдельных подписок. Это может быть разумным решением для тех, кому нужен доступ к лучшим возможностям обеих платформ.