Разобрала GPT-5 и поняла, что за громкими словами на презентации скрывается совсем не то, что мы ожидали. Покажу, что реально изменилось, как теперь правильно промтить новую модель, что может скрываться за этими обновлениями — и почему до AGI нам всё ещё очень далеко.
🚀 Мой Telegram чат: https://t.me/+dPw_AwlCXA05Mzcy
С выходом GPT5 закончилась монополия человека на интеллект. Так компания Open AI хотели продать новую долгожданнейшую версию чата GPT5, которую ждали мы все. Новую версию чата представляли чуть ли не как карманного доктора наук в телефоне. Но аккуратно забыли упомянуть на презентации, что на главном тесте для будущего AGI GPT45 так и не смог приблизиться даже к грок. Они почти весь час своей презентации потратили на бенчмарки, показывая, что модель всё ближе к HI. Но в этот раз графики действительно запомнились всем, потому что на некоторых из них 50% было в два раза меньше, чем 47%. Слайды, очевидно, генерировали в чат GPT, так что пользователи стали сомневаться, тестировали ли они действительно или это придумал сам чат. Пользователи же, вдохновлённые громкими заявлениями, кинулись проверять умнейший ИИ и быстро охладели, когда на вопрос сколько пальцев у человека модель уверенно отвечала неверно. Это ли - разочарованно пишут сейчас в Твиттере. И после этого даже самые преданные фанаты Open AI начали переобуваться в воздухе на Полемаркет, где спорят, у кого будет лучше AI модель к августу двадцать пятого года, до презентации Open AI вела с отрывом 70% против тридцати у Google. Но стоило Альтману показать GPT 4. 5, как всё перевернулось прямо во время стрима. Google выстрелил до 80%, а Openi рухнул ниже двадцати. Иными словами, презентация развернула рынок. что, возможно, лидер скоро будет другой. Безусловно, в GPT5 есть и сильные стороны, поэтому об этом сейчас быстро расскажу. Если всю презентацию уложить в короткий список, то главных изменений в PT45 всего три. Первое, вместо кучи моделей теперь осталась одна универсальная. Вторая, немного изменился интерфейс. Третья: добавили пару новых функций вроде личностей и апдейтов для кода. Сейчас подробнее. Самое главное обновление. Теперь вместо нескольких разных моделей они представили одну модель GPT5. И это уже даже не просто модель, это теперь система. Внутри неё будет несколько моделей разной мощности, а между ними один роутер, маршрутизатор. По сути, ещё одна нейросеть, которая в реальном времени решает, какую модель позвать на ваш запрос. Быструю, если вопрос простой и ответ можно дать мгновенно, или, например, думающую, если запрос сложный и требует рассуждения. И с одной стороны, действительно, это удобно для обычных пользователей. Теперь не нужно ломать голову вообще, какую модель выбрать. Система сама решает, какая модель лучше справиться с задачей. Но тут у меня лично сразу вопрос: а почему я больше не могу сама выбирать? Я, например, знала, что GPT 45 шикарно пишет тексты. Я использовала её именно для написания моих текстов, помощи с ними, структурирования. А 4. 0 мы, например, с командой используем для бота. Но она прямо очень хорошо общалась с пользователями. То есть у меня был выбор, а теперь у меня его нет. И это раздражает особенно тех, кто создаёт продукты, потому что это для них рабочий инструмент. И у меня после этого закладываются сомнения некоторые, а не кроется ли из-за вот этим обновлением банальная оптимизация расходов? Ведь теперь пятёрка, одно и то же обновлений, доступна всем, даже бесплатным пользователям. То есть теперь самой продвинутой моделью могут пользоваться все бесплатно. Это либо сделано для маркетинга, либо можно предположить, что где-то внутри они могут подменять умную модель на более дешёвую, а нам говорить, что это лучший вариант. Так решила система. И тут как бы не поспоришь. Ну и ладно бы это работало идеально. Но в первый же день роутер сломался. 5 начал отвечать хуже GPT4. И сам Сэм Альтман на Редите признал, что была да серьёзная неполадка и полдня система работала некорректно. Вроде бы как починили, но остаток остался. В общем, сейчас на GPT5 обрушилась куча хейта. Пользователи стали просить сделать всё, как было. И в итоге команда сейчас всерьёз задумывается о том, чтобы вернуть хотя бы GPT4O для платных пользователей. Но Сюр заключается в другом. Они убрали для нас кнопки выбора модели, но они добавили официальные советы для более эффективного взаимодействия и говорят: "Так, если хотите, чтобы задача решалась более умно, напишите в промпте: "Подумай вдумчиво". Если нужно быстро, напишите, что быстро. Сомнительное очень удобство. То есть вместо удобного переключения теперь нужно шаманить с фразами. Оптимизация - это или усложнение? Вопрос открытый. Что думаете? Второе нововедение - это выбор личности чата. По словам Open AI, это никак не влияет на точность ответа, но это влияет на стиль и подачу ответа. Например, циника лучше включать для честной критики и жёстких оценок. личность робот для кода, инструкции и отладки, слушатель для
структурирования мысли и помощи в принятии решений, а ботаник, или, как теперь его называют, фанат своего дела для объяснения сложных вещей. Простыми словами, звучит, конечно, любопытно, но вопрос, насколько это удобно, потому что нельзя переключать личность во время общения с чатом. Это нужно делать, заходя отдельно каждый раз в настройки и переключая личность. И третье обновление - это кодинг. Здесь прямо GPT 4. 5 заметно подтянулся. Он лучше стал делать фронтенд. Можно сверстать сайт, интерфейс и даже игру по описанию. В целом в интернете очень много примеров именно с простыми играми, и у меня здесь закладывается сомнение. Поэтому я пошла спросить разработчика, который делает разнейшие продукты, и сказала, насколько он действительно стал лучше в коде. И он говорит, что да, стал код писать больше, больше строчек кода, быстрее, но когда я обратился к нему с реальной задачей, мне код как приходилось переписывать, так и приходится. Поэтому тоже сомнение. Я, конечно, попросила создать игру Змейка, но чтобы змея, например, ловила планеты, вот слева прошлая модель, справа новая модель, разница заметна, да, но опять же это простая задача. Это, по сути дела, были все самые главные обновления чата. И здесь мне хотелось бы немножечко с вами подискусировать, потому что, ну, честно, главный вопрос: мы с вами улучшаем модель для реальной пользы или мы просто создаём иллюзию прогресса? Потому что за 10 месяцев они, по сути дела, даже не обновили базу знания до двадцать пятого года. Всё, что мы получили - это одна модель личности, быстрый код и знания обновлены до двадцать четвёртого года. И мне кажется, что мы с вами уже как бы наигрались в вауэффекты. Теперь мы реально ждём каких-то практических улучшений, каких-то интеграций практических. Например, я не знаю, мне бы очень хотелось, чтобы были отдельные модели для отдельных классных задач, которые прямо обучены, натренированы под них. Например, идеально обученная модель для анализа документов или модель, которая блестяще пишет тексты в конкретной нише, или модель, натренированная под интеграцию с каким-то сервисом, с тем же Полимаркетом, как где-то сделал Грок, чтобы решать уже задачи на 100%, а не на 60. Вместо этого показывают просто красивые бенчмарки, на них уделяется большее количество времени, создают атмосферу, что мы на пути к AGI. Но если честно, пока вот сейчас это больше похоже на маркетинг, неже на технологический прорыв. Я, безусловно, не хочу никого хейтить. Я понимаю, что над этим работают команды. Ребята действительно трудятся. Я знаю очень многих команд и с Open AI, и с XAI, и там работы не початый край. То есть я не хейчу. Но вопрос скорее, наверное, больше к начальству, которое даёт им такие указания и задачи. ощущение, что развитие идёт как будто не совсем туда, куда действительно нужно. Или ещё у меня такое сомнение, что компании, возможно, поняли, что до HI им намного дольше, чем казалось, но вложены слишком большие деньги, надежды этих людей, страны президенты, и нужно как будто показывать видимость и поддерживать имидж. По факту, конечно, естественно, GPT45 стало немножечко аккуратнее, чуть быстрее, но прямо глобальных изменений, о которых говорилось, я не вижу. Лично я. Что вы думаете? Ну и, конечно же, из-за всего этого у меня в голове возникает как будто другой сценарий. По крайней мере, есть такое опасение, что из-за вот этой гонки и огромнейших денег, которые сейчас вливаются в компании, в AI, инвесторами, какой-нибудь институт выйдет и заявит, что он якобы сделал AI. Другие, чтобы не потерять рынок и внимание инвесторов, тут же подхватят и мы тоже. Люди начнут тестировать, поймут, что это совершенно не тот умный искусственный интеллект, о котором говорили. Это не конкурент человеку и машина, не способная решать настоящие сложные, сложные задачи. Разочарование, отток денег, пузырь лопается. Такое сомнение сейчас есть. Да, безусловно, модели улучшаются, безусловно, что-то меняется, технологии будут расти. Мы с вами живём в эпоху автоматизации, она никуда не денется. То есть всё, что мы видим, оно будет только развиваться и становиться лучше. Но вопрос теперь остаётся следующим: дойдём мы реально доя того интеллекта, с которым человек действительно сможет соперничать, или пока это всё просто кажется красивой вывеской?