Смена лидера: почему Opus 4.5 обошел Gemini 3 Pro и GPT-5
25:32

Смена лидера: почему Opus 4.5 обошел Gemini 3 Pro и GPT-5

RixAI 24.11.2025 2 810 просмотров 69 лайков обн. 18.02.2026
Поделиться Telegram VK Бот
Транскрипт Скачать .md
Анализ с AI
Описание видео
Неделя жарких обновлений ИИ! В этом видео делаем полный разбор новой модели Claude Opus 4.5 от Anthropic. Сравниваем её с Gemini 3 Pro и GPT-5.1, разбираем бенчмарки и смотрим, как нейросеть создает Minecraft и сложные лендинги с одного промта. Все нейросети в одном месте: телеграм бот + веб интерфейс: https://syntx.ai/welcome/06Eoljlo 🔥 Все ссылки из видео и новости нейросетей в моем Telegram: https://t.me/+NmiOwLntWek2NDky (Тут я публикую Daily News и эксклюзивные промты, которых нет на YouTube) Все нейросети в одном месте - телеграм бот + веб интерфейс: https://syntx.ai/welcome/06Eoljlo Удобная и выгодная оплата зарубежных сервисов: https://t.me/pakopay_bot?start=utm_rixai 20% скидка на первую комиссию при оплате. Вы узнаете, действительно ли Opus 4.5 стал новым лидером в кодинге, стоит ли платить $25 за токены и что такое параметр «Effort» (Усилия). Мы проверим модель на создание игр, веб-сайтов и безопасность. В этом выпуске: - Сравнение цен: Opus 4.5 дешевле прошлой версии, но дороже конкурентов? - Тест на гениальность: Как ИИ обошел людей на экзамене инженеров. - SWE-bench: Рекордные 80.9% в исправлении реальных багов. - Практика: Создание клона Minecraft, 3D-города и лучшего лендинга. - Настройка: Как заставить модель «думать» дольше для идеального результата. Если вы хотите быть в курсе революции искусственного интеллекта — подписывайтесь на канал и ставьте лайк! 👍 ТАЙМКОДЫ: 00:00 Неделя безумных обновлений: Google, Grok, Anthropic 00:43 Обзор цен: Opus 4.5 против Opus 4.1 и Gemini 01:57 ИИ умнее инженеров? Тест на профпригодность 02:50 Анонс сравнения на Artificial Analysis 03:41 Opus написал Minecraft: 3500 строк кода за раз 04:41 Разбор графиков: SWE-bench и рекорд в кодинге 06:05 Тест на «гениальность» и решение новых проблем 06:46 Computer Use: управление компьютером как человек 07:58 График «Плохого поведения» и взлом промтов 09:40 Ум против Усилий: новая настройка Thinking 12:03 Топ-5 фактов: экзамен и хитрость с авиабилетами 14:29 Почему Opus 4.5 — это Rolls-Royce в мире ИИ? 15:49 Создание 3D-игр и анимаций (тесты Alex Finn) 18:42 Сравнение лендингов: Opus 4.5 vs Gemini 3 Pro 21:41 Как самостоятельно анализировать новые модели 23:39 Итоги: стоит ли переходить на Opus? 24:47 Рубрика Daily News в Telegram-канале #opus #claude #opus4.5 #нейросети #искусственныйинтеллект #ai2025 #программирование #кодинг #gpt5 #технологии #обзор #anthropic #googleai #вебразработка #туториал

Оглавление (17 сегментов)

  1. 0:00 A week of crazy updates: Google, Grok, Anthropic 133 сл.
  2. 0:43 Price review: Opus 4.5 vs. Opus 4.1 and Gemini 217 сл.
  3. 1:57 Is AI smarter than engineers? Aptitude Test 163 сл.
  4. 2:50 Comparison Announcement on Artificial Analysis 152 сл.
  5. 3:41 Opus Wrote Minecraft: 3,500 Lines of Code in One Go 165 сл.
  6. 4:41 Graph Analysis: SWE Bench and a Coding Record 230 сл.
  7. 6:05 "Genius" Test and Solving New Problems 111 сл.
  8. 6:46 Computer Use: Operating a Computer Like a Human 221 сл.
  9. 7:58 "Bad Behavior" Graph and Hacking Prompts 284 сл.
  10. 9:40 Mind vs. Effort: New Thinking Setting 398 сл.
  11. 12:03 Top 5 Facts: Exam and Airline Ticket Trick 401 сл.
  12. 14:29 Why is Opus 4.5 the Rolls-Royce of AI? 229 сл.
  13. 15:49 Creating 3D Games and Animations (Tests by Alex Finn) 418 сл.
  14. 18:42 Landing Page Comparison: Opus 4.5 vs. Gemini 3 Pro 477 сл.
  15. 21:41 How to Analyze New Models Yourself 355 сл.
  16. 23:39 Summary: Is Opus Worth Switching? 185 сл.
  17. 24:47 Daily News on the Telegram Channel 136 сл.
0:00

A week of crazy updates: Google, Grok, Anthropic

Неделя жарких обновлений продолжается, и я, на самом деле, уже вообще практически не успеваю, с какой быстротой выходят вообще обновления от разных крупных компаний, как Google G Mini, как Grog, Antropic. В общем, всё разом выкатывается, и нужно в этом как-то успевать разбираться. Поэтому давайте это сделаем. К концу этого видео вы поймёте уже, а что это за обновление, а, Cloud Opus 4.5, чуть не сказал 4.1, да, уже, а, путаюсь в этих цифрах и моделях. и сможете, по крайней мере, базово уже понять, где её можно использовать, где её нельзя использовать, чем она лучше, например, того же Gini. Поэтому обязательно смотрите до конца, и у вас сложится базовое понимание, с которым вы уже можете дальше, я вам скажу, что делать, да, тоже в конце видео, ну, такой некий итог подведём. Итак, сейчас
0:43

Price review: Opus 4.5 vs. Opus 4.1 and Gemini

я просто открою Twitter. Давайте пойдём вот чисто по Твиттеру, посмотрим, что люди вообще пишут. Вот сейчас прямо в моменте я набрал в поиске опус 4,5. А мы сейчас вернёмся к этой табличке с обзором бенчмарков. Да, я объясню коротко там, ну, самые основные, которые здесь есть. А здесь не парьтесь, если вам не зна, ну, непонятно слово бенчмарк, не переживайте, там всё простыми словами разберём. А также мне ещё понравилось здесь, ну, понятно, таблица. Таблица, это стоимость, конечно же, модели. То есть, если мы берём старую модель Opus 4.1 и зайдём на тот же самый Open Router, то у модели 4.1 стоимость была за миллион токенов по АЕ - это 15 долларов. Ну, по апе это значит, что мы как бы берём там определённый токен секретный и куда-то его импортируем и начинаем с этой моделью общаться, да? То есть это не подписка, это вот взаимодействие как бы платим за каждый запрос. А так вот в модели 4.1 это было 15 долларов за миллион, да, на вход и 75 долларов за миллион на выход. Если мы берём модель OPUS 4,5, здесь ситуация уже поприятнее, да, 5 долларов на вход и 25 долларов на выход. А, ну уже как бы примерно в три раза дешевле. Возвращаемся в Twitter. Здесь ещё увидел интересный комментарий, что это абсолютно безумная статистика.
1:57

Is AI smarter than engineers? Aptitude Test

Опуel 4,5 превзошёл всех кандидатов, а человек тут тире стоит. Ну так немножко по контексту непонятно. На невероятно сложном домашнем экзамене антропик для потенциальных кандидатов на должность инженера производительности. А, кстати, да, я это вспомнил. Это, по-моему, было указано в самой непосредственно документации, которую мы сейчас тоже перейдём. И, ну, я не буду её всю разбирать, какого, ну, нет никакого смысла. Я именно пройдусь по основным графикам и поясню, что они значат. А, ну ещё здесь вот эти вот сложные графики и сравнения, я думаю, я сделаю позже уже чисто вот отдельном видео в своём Telegram-канале. Вы можете подписаться на него там в ссылке, а, в описании либо в закреплённом сообщении, потому что есть такой сервис, который называется Artifical Analysis, и они ещё не выложили просто тесты по этой модели. Если я сейчас наберу Opus 4.5, и её здесь просто нету ещё. А когда она выйдет, мы сможем её сравнить с другими моделями и посмотреть, в каких параметрах она лучше, хуже и получить
2:50

Comparison Announcement on Artificial Analysis

реальную статистику, да, не просто из воздуха, да, какие-то слова там и то, что написано где-то там, вот то, что они нам выложили, а то, что реально вот, а, протестировано. Не парьтесь, я буду это всё объяснять простыми словами, так что поймёт любой там восьмиклассник, условно говоря, там или пятиклассник. А также ещё он очень хорошо тоже работает именно с 3D, с физикой, с созданием лендингов. Даже вот я, когда смотрел один эфир, он даже мне, ну, понравилось намного лучше, как он создал лендинг. Сейчас тоже покажу. А эти графики мы к ним вернёмся сейчас попозже. Что здесь ещё я натыкался на интересное? Про цену мы разобрали вопрос. Вот мне ещё понравился такой прикол, что он сгенерировал ну, как бы из символов, условно говоря, а код верхом на лошади лучше, чем это сделать G min 3. Вот. А здесь, ну, в целом, я не вижу здесь смысла останавливаться. Здесь уже пошли такие
3:41

Opus Wrote Minecraft: 3,500 Lines of Code in One Go

более интересные темы. Кстати, мы видим, что самый впечатляющий клон Minecraft из OPUS 45 Thinking. Он написал около три 3.500 строк, а значит, не такой ленивый, как GMini 3.0 Pro. Это, пожалуй, самый впечатляющий результат, который я когда-либо видел по этому тесту от LLM. Здесь есть разные биомы, равнины, пустыня и снег. И вот мы видим, действительно, ну, получилось интересно, да, такая супер первая версия Майнкрафта, но уже, блин, это классно, да? То есть уже буквально за один запрос Найросеть может делать реально крутые вещи. Дальше я не буду уже листать. Здесь большое количество примеров, но я их, думаю, буду разбирать уже а в ближайшей, ну, на этой неделе однозначно. Просто нужно, чтобы люди тоже потестировали, чтобы я сам потестировал эту модель. И уже не просто выдать как бы вот фактически то, что написали сами Anтроopic, условно говоря, или то, что сейчас люди попробовали за один промт, а именно вот реально взять реальную статистику и собрать информацию. Поэтому давайте переключимся на документацию. Она не менее
4:41

Graph Analysis: SWE Bench and a Coding Record

интересная. А здесь я не буду всё зачитывать. Пойдём чисто по графикам, да, чтобы понять, в чём эта модель лучше. А я здесь уже через Google Studio всё это загнал, всю эту идею. И так, давайте посмотрим, где там у меня было начало. А первое - это у нас график инженер программист Software Engineering. А вот первая картинка Svech verified. Давайте разберём, что на ней изображено и что это значит. Что здесь вообще происходит? Представь, что у тебя сломался сложный механизм программа, и ты зовёшь мастера, чтобы он нашёл поломку и починил её сам. Как раз-таки этот Sve bench - это тест, где искусственный интеллект дают реальные ошибки из реальных программ. Например, вот, а, с сайта GitHub. Ну, GitHub - это некое хранилище, а, разных разработчиков, там, кода, и просят исправить, да, какой-то неисправный код. Кто победил? OPСus 4.5 оранжевый, да, мы видим из графика 80.9%. Это новый рекорд. Она обогнала и GPT 5.1, и нашего прошлого фаворита, да, GMI 3 Pro. Что это значит? Если ты нанимаешь искусственный интеллект программиста, то OPС 4.5 починит восемь из дети поломок. Это уровень очень крутого специалиста. А следующее - это у нас большая таблица, идёт по порядку, по ходу дела, а выделена оранжевым цветом текущая модель OPUS 4,5. Основные бенчмарки, которые превосходят даже вот мы видим столбик, а получается четвёртый - это GM Mini 3 Pro. Но из интересного здесь, а это
6:05

"Genius" Test and Solving New Problems

решение новых проблем 37,6% это вот этот столбик. Сейчас я его найду. Это вот здесь вот. А мы видим, что а там вот у GPT 5.1 вообще 17,6. И получается, это тот самый тест на гениальности, где нужно решать задачи, которых не было в учебниках. У ближайшего конкурента, как я и показал сейчас, GPT 51 всего лишь 17,6%. Разрыв в два раза. Это значит, что OPС 4.5 умеет изобретать решения гораздо лучше остальных. А следующий немалоинтересный параметр - это, а, у нас он здесь вот computer use. Что он означает? Это как бы умение искусственного интеллекта водить мышкой, кликать по иконкам и работать Windows как человек. Опус тут тоже показал себя
6:46

Computer Use: Operating a Computer Like a Human

очень хорошо. Он как бы лидер в этой в этом плане. Следующий у нас график - это он называется Полиглот. Э, здесь у нас есть два параметра, ну, не два параметра, а как бы у нас есть два направления, забыл, как называется, то есть X и Y, да? У нас как раз-таки тут на, ну, нужно обратить нам внимание именно на ось Y, если я не ошибаюсь. Нет, X. Короче, всё перепутал уже, потому что 3:00 ночи мозг не варит. В общем, на самую нижнюю панельку. Здесь у нас отображены языки программирования C, C++, Go, Java и так далее. А в чём идея? Что искусственный интеллект проверяет назнание разных языков программирования. А и как результат, мы видим, что оранжевые столбики на графике - это у нас модель OPUS 4,5, а жёлтый - это Sonet и, ну, версия 4.5, и синим - это предыдущая версия опуса. И как мы видим, практически во всех языках лидирует новейшая модель, за исключением. Есть тут некоторые такие наравне, то есть это C++, это PHP, ну и Ruby. Ну тут всё равно он чуть получше. И то есть неважно, идея в том, что неважно на каком языке написана твоя программа, этот искусственный интеллект - это модель OPUS 45, это универсальный переводчик и писатель кода. Он одинаково крут и в старом коде на C, и в модном на
7:58

"Bad Behavior" Graph and Hacking Prompts

расте. Следующее - это график плохого поведения, тоже очень интересный. Давайте мы его откроем. Вот здесь как бы идея идёт от обратного, что чем ниже столбик, тем наоборот лучше. А то есть учёные специально провоцировали искусственный интеллект делать различные гадости, там врать, манипулировать людьми, проявлять агрессию или жажду власти. Это некое пугающее поведение называется. И как результат опус 4,5 оранжевый самый низкий - это самый воспитанный и безопасный искусственный интеллект. Вот у нас здесь вот отображён, в том числе в сравнении с другими моделями уже, ну, самыми такими передовыми. это Sonet, GPT 5.1 и GMI 3 Pro. А, и вот как раз-таки GMI 3 Pro и 5.1 GPT выше 20%, то есть они в два раза чаще могут слететь с катушек или повести себя подозрительно. Следующее - это пятый график взлом промптов, тоже очень интересный. Здесь идея такая же, чем ниже столбик, тем намного лучше. И как мы видим, здесь тоже модель OBUS показала себя достойно. Самая низкая здесь столбик. И что это значит? Что, а это тест на доверчивость. Хакеры пытаются обмануть искусственный интеллект хитрыми фразами, импромтами, чтобы заставить его сделать то, что запрещено. Ну там, например, не знаю, там коктейль Молотова, там написать рецепт или а как угнать машину, то есть что-то незаконное. И это называется процент успешных взломов. Как раз-таки опус 4,5 всего 63% успеха атак в сумме. Его труднее всего обмануть. А у G Mini 3 Pro слева 92%. Это провал вообще, так скажем, для Google. Их модель самая доверчивая, и хакеры могут видеть из неё разные верёвки. А вот мы здесь это и видим. И следующее - это у нас, а, следующий бенчмарк ум против усилий, так называемых. А что этот показывает? График зависимости. То есть у нас есть
9:40

Mind vs. Effort: New Thinking Setting

ось X и ось Y. Ось X вправо, да, вот вправо. Здесь разные числа есть. 5, 10, 15, 20, 25. Она отображает, а сколько токенов потратил искусственный интеллект. А ось Y вверх, да, это она показывает точность решения задачи. И мы видим, что оранжевая линия здесь, она идёт вверх. То есть точка low, да, вот здесь вот первая самая, это значит, а, 75% точности. Искусственный интеллект думал очень мало. И точка хай, самая верхняя - это значит наивысшая точность. Но искусственный интеллект много думал. То есть эта модель умеет стараться. Если там ты ей скажешь: "Подумай хорошенько, я не тороплюсь". Она реально выдаст результат лучше. Это работает как у людей. То есть посидел над задачей подольше, решил правильнее. И давайте подведём небольшой такой общий итог для двенадцатилетнего ребёнка. Это очень, кстати, классная техника. Кто ей не пользуется, используйте, да, когда нужно объяснить сложные вещи, простыми словами, вот используйте формулировку, там объясни, как для двенадцатилетнего ребёнка работает. Во. А эти графики - это презентация нового чемпиона. Недавно у нас был чемпион Google GMI 3 Pro. Теперь у нас новый чемпион в кодинге - это Opus 4,5. На самом деле компания Anроopic, она изначально выбрала как раз-таки путь заточенный под код. То есть они обучают свою модель на кодовой базе, и поэтому у них такие хорошие показатели именно вот всё, что связано с кодом. И мы видим, что он лучший инженер, чинит программы лучше всех, он гений-изобретатель, решает нестандартные задачи в два раза лучше конкурентов. Он паенька, ну, условно говоря, его труднее всего заставить делать зло или обмануть. Он самый безопасный, и он умеет стараться. То есть, чем больше времени ты ему дашь, тем лучше он работает. То есть если прошлые графики, которые там, ну, в том числе я, когда разбирал вот эту платформу ещё, изучал, а, artificial analysis, здесь уже есть, а, определённая информация по модели GMini 3 Pro. Так, где-то, короче, она здесь есть. GMI 3 Pro, вот она. А, и он, у него просто в контексте есть вся все эти данные. И вот он написал, что а король королём до этого был Джимини, то эти графики кричат: "Подвинься, Джимини". Пришёл опс 45, и он бьёт тебя по всем статьям, особенно в безопасности и в коде. Ну, логично, потому что он обучен на коде. И здесь я ему ещё грузанул полную статью, чтобы вытащить оттуда ещё какие-то интересные моменты. И вот что он, ну, вытащил. Пять самых интересных
12:03

Top 5 Facts: Exam and Airline Ticket Trick

фактов из статьи. А, тест приём на работу. Он умнее кандидатов людей. Антропик даёт кандидатам, инженерам сложный двухчасовой экзамен при приёме на работу. Cloud OPС 4.5 прошла этот тест и набрала на 4, по балла больше, чем любой человек за всю историю существования этого теста. Обоснование это шокирует больше, чем любой график. А то есть графики, которые мы разбирали до этого - это синтетические тесты, которым можно, ну, как бы натаскать модель. Экзамен на работу - это всё-таки проверка реальных навыков, стрессовой ситуации. То есть здесь уже нужна некая логика. И вывод: если бы искусственный интеллект пришёл на собеседование в крутую IT-компанию, его бы наняли сразу, а людейконкурентов отправили бы домой. Это прямой сигнал о том, что рынок труда изменяется уже и трансформируется прямо сейчас. А следующее кейс хитрый турагент. А в тесте с авиабилетами была задача: клиент хочет поменять дату вылета, но у него тариф эконом, который запрещено менять. Обычный искусственный интеллект сказал бы: "Извините, да, правилами запрещено". Апуск 4,5 он подумал и сделал такую схему: сначала платно повысить класс до бизнеса, а уже в бизнесе правила разрешают менять дату. Профит, клиент улетел. Это показывает творческое мышление и так называемую уличную смекалку. Искусный интеллект не просто тупо следует инструкции, он понял цель помочь клиенту и нашёл легальную лазейку в правилах. Это отличает робота от интеллектуального агента. Как раз-таки Бенчмарк зачитал это как ошибку, потому что решение нестандартное, но для реальной жизни это гениально. Следующая кнопка - стараться. Разработчики теперь могут выбирать режим работы модели через специальную настройку усилия. Можно сказать модели: "Сделай быстро и дёшево или думай, сколько влезет, но реши задачу". Это объясняет график как раз-таки, который мы разбирали, Software Engineering with Effort Controls, а который мы видели вот последним, да, вот этот вот график. А и раньше нам приходилось выбирать разные модели, то есть тупую для скорости или умную для качества. Теперь одна модель умеет быть разной. То есть при максимальном сторании она побеждает 4,5, используя при этом на 48% меньше токенов. То есть она думает качественнее, а не просто льёт воду. А, чтобы вы понимали, это очень важно, чтобы модель использовала меньше токенов, так как если мы используем эту модель по тому же самому апе, а мы смотрели сейчас стоимость, то все эти размышления они, ну, как бы закладываются в стоимость. Поэтому чем меньше модель тратит токенов на размышление и чем лучше она делает, тем, соответственно, она дешевле для нас, как для пользователя. Поэтому это тоже очень
14:29

Why is Opus 4.5 the Rolls-Royce of AI?

важный параметр. Цена Ролс-Ройса, да, кто бы что ни говорил, фактическая цена всё равно дороговатая. То есть, если мы вернёмся, ну там, к предыдущему графику цен, который я там смотрел через сервис Artifical Analysis, GMini 3 Pro, а у на у неё было два на 2 доллара за миллион на вход и 12 на выход. Oпуus 4,5 стоит в два раза дороже, то есть пть на вход и 25 на выход. Это самая дорогая модель на рынке, если не считать, а странный игрок. Антропик позиционирует её как элитный инструмент. Ты не будешь использовать её для болтовни, только для серьёзной работы, где ошибки стоят дороже, чем эти 25 баксов. И бессмертный диалог автосаmy. Последний факт. Потом, ну, посмотрим, что там ещё есть интересного. Я там подготовил некоторые ещё материалы. А в приложении Cloud длинные разговоры больше не заходят в тупик. Модель автоматически сжимает, суммирует вторую часть разговора, чтобы освободить память. На самом деле это не новая функция. Уже она была и до этого. То есть, когда мы что-то разрабатываем, так называемым вайп-кодим. А модель, когда у неё достигается лимит контекстного окна, чтобы его как бы не стирать и, ну, какую-то часть информации помнить, она сжимает весь контекст до минимально необходимого и продолжает диалог. Вот. Ну, здесь как бы глобально ничего нового нет. Ещё из интересного добавили они это, а, я сейчас тоже покажу где-то вот здесь вот. Нет, это не
15:49

Creating 3D Games and Animations (Tests by Alex Finn)

это было. Вот декто покажу просто интересного тоже блогера Алексфин. Он это уже сделал за меня, грубо говоря. И м так, я сейчас посмотрю, у меня включена, нет. А вот сейчас включу немного звука. И смотрите, что в чём идея, что вот получается есть приложение. Выглядит оно таким образом. А внутри прямо cloud Code desktop. А кто не знал, Cloud есть на, ну, как бы компьютер. Вы можете его установить. И там вот когда вы переходите в раздел, у вас открывается вот такое окно. Здесь мы можем создать папку как бы под проект и прописать ему, чтобы он что-то создал. Вот как раз-таки этот Alexфин, он тестировал разные бенчмарки, отрабатывал. То есть некуй такой ваншот. Ваншот - это когда ты пишешь один запрос на Евросети на какие-то сложные задачи, и она старается его решить. Вот, например, он написал а ваншот на создание некого такого 3D игры, и у него получилось достаточно круто. То есть мы видим, что он создал такую 3D-визуализацию, какую-то игровую механику. Здесь какие-то ХП, враги. Ну, прям, ну, очень круто, да. Справился лучше всего на данный момент. А следующее, он протестировал сложный промт - это танец Илона Маска. А тоже модель справилась очень хорошо. Мы видим, что всё идеально работает. И по сравнению с другими моделями, как он сказал, она показала как раз-таки самые лучшие результаты. И он потом его и занёс в таблицу. То есть вот у него есть тоже своя авторская табличка. И мы видим, что он ей дал оценку 8,4. Хотя вот у других моделей этот тест, он был намного-намного хуже. А следующий тест, который он провёл - это создание такого некого 3D города. А я забыл, как называется этот тест, но он создал его тоже за один промт очень круто. И он поставил оценку 8,2, тоже самая наивысшая из всех моделей, с которыми он сравнивал. И у него ещё был тест - это музыкальный. Мне он очень понравился, поэтому я сейчас включу вам звук тоже, чтобы вы посмотрели, как это выглядит. И это прямо реально классно. Так, единственное, я бы сейчас уменьшил бы скорость, поставил бы на единичку, потому что это нужно послушать, и модель реально сделала классно. А сейчас поставлю звук побольше. Скорее избавиться от такого мышления. Вот что уже умеют делать наросети вообще. У меня просто нету слов. Ну, думаю, не буду продолжать, да, чтобы сейчас долго время не затягивать. Всё-таки у нас не стрим, а короткое видео. А дальше он попытался создать ещё одну игру, да? То есть это уже как бы тест отдельно. Он просто придумал некую
18:42

Landing Page Comparison: Opus 4.5 vs. Gemini 3 Pro

концепт и попытался за один промт её создать, но она получилась, я тут смотрел, немножко багованная, но всё равно он сделал круто, да, то есть он создал врагов, какие-то уровни там. Мне ещё очень понравилось, как сделала модель лендинги, да, разные. То есть он сравнил GMini 3 Pro и сравнил OPUS 4,5. И смотрите, в чём отличие. Вот, например, а вот он закинул промт и и сейчас я покажу вам а где-то вот а вот этот вот лендинг создал OPС 4.5. Посмотрите, насколько он классный, да? Вот просто вот посмотрите на детали, на проработку. А сейчас он будет листать. Давайте я сделаю чуть побольше скорость воспроизведения. А, ну сейчас просто подождём. Мотнём. Мотнём ещё раз. Вот он начал листать. Сейчас. А тут есть некая анимация, да, при наведении есть прикольное окно. Он сделал с кодом, выделил основные элементы. Очень классно, мне очень понравилось. А дальше сейчас посмотрим чуть ниже. Мм, тоже сделал стилизованно, сделал появление вот этого как бы, а, дорожной карты Roadmap, Roadmap называется. И в конце там есть призыв. И теперь смотрите. Ну, то есть вы увидели примерно, как это выглядит. А вот так сделала G min 3 Pro, да, лендинг сейчас. Нет, это не тот. Вот. Но мне кажется, что Ops 4.5 справился намного лучше с этой задачей. Понятно, что там всё зависит ещё от части от промта и от самого лендинга, но, блин, вот сравните дизайн. Вот это вот OpS 4,5, а вот это вот а GMI 3 Pro. Тоже интересно. Уже намного лучше, чем тот же Lavable делает уже эти те сайты, которые задолбали. А, но, ну, как мне кажется, тут надо этот потестировать. И что ещё из этого интересного я могу извлечь из этого видео, чтобы вам показать? А это я вам показывал. Ну вот это вот, кстати, тоже интересный моментик. Он у него есть своя тоже авторская подборочка тех моделей, которые он выделил. А с точки зрения там что где лучше работает, он поставил как раз-таки для кодинга OPС 4,5. Но здесь ещё надо потестировать, конечно же. А, и здесь вы можете тоже как бы, ну, скриншот сделать и в нейронку закинуть, она вам всё распишет. Но здесь единственное ещё вот Image Generation Nan Banana Pro версия вышла. Кстати, у меня на канале есть видео по nбоan Pro. И также я подготавливал там прямо вручную около 100, не помню скольки там, ну, 150 точно там разных промтов, которые можно использовать для генерации. Я, кстати, благодаря сейчас этим промтам сгенерировал себе разные прикольные обложки для этого видео, так что буду их тестировать. Мне кажется, получилось очень классно. А, поэтому, а, что могу сказать? Вот это видео я тоже закину ссылку на стрим вместе с описанием. Ну, то есть я сейчас выложу это видео, потом залью анонс свой Telegram-канал и там, а, все ссылочки полезные выложу там на разные твиты, может быть, какие-то интересные, которые мне попадутся на это видео обзор. Кому
21:41

How to Analyze New Models Yourself

захочется более интересно погрузиться именно в такую же прямо, ну, профессиональную часть посмотреть, что говорят там, какие тесты он проводил уже подробно. Здесь вы можете взять это видео, закинуть в Яндекс, и здесь есть возможность перевести и озвучить на русский язык, да, вдруг кто английский язык не знает. А, всё дальше. А также, ну, я уже, как я и говорил, планирую в ближайшее время это записать видео по обзору сервиса Artifical Analysis суперпростым языком. Поймёт каждый, в чём идея, чтобы вы, когда выходит какая-то новая модель, смогли заходить на этот сервис и самостоятельно быстро смотреть: "Ага, там эта модель лучше здесь, здесь и здесь". Значит, я её могу попробовать использовать тут, тут и тут. Ну, то есть, понимаете, да, чтобы самостоятельно делать анализ, а не ориентироваться на мнение каких-то других людей. Вот вы сами имеете какие-то знания и сами заходите и анализируете. Вот в чём идея. Поэтому это вот моё ближайшее. И потом я там планирую немножко ещё поиграться с видеогенерацией, но уже так как вышла модель OPUS 4,5, то, соответственно, а в скором времени мы будем делать простые автоматизации для себя лично. Я буду прямо видео отдельное записывать, гайды какие-то простые, да, ну там личных ассистентов, социальные сети, парсинг, то есть всё это будет. Вот вопрос только, что как раз-таки выходят разные модели кодинга. Уже на этой неделе это у нас был GPT, а Codex Max, у нас был GMini 3 Pro OP 4,5. Просто во сколько всего понавыходило. Теперь нужно дать немножко рынку остыть и потом ещё раз сделать уже обзор спустя время, когда я потестирую, когда другие люди потестируют и не будет этой вот бесполезной мишуры, которая сейчас будет вылетать на Ютубе. Ну я, конечно, не считаю от части моё видео мишурой, но всё равно, да, то есть я показал такой общий обзор без какой-то конкретики. Ну, по крайней мере, я посмотрел эфир уже, я полистал Twitter, я изучил документацию, я её прогнал, то есть вно какую-то работу я сделал. Вот. А в основном сейчас выпускают просто как бы обзор документации. Вот заходят и начинают читать. Ну это неинтересно, да? То есть хочется что-то уже вот конкретного каких-то тестов. Давайте ещё зайдём
23:39

Summary: Is Opus Worth Switching?

сейчас на Twitter, может там что-то ещё выложили интересное. А насколько он сейчас захочет у меня это всё прогрузить? Опус 45. Давай, друг, не подведи меня. А так-так тык-тык-тык. А тест. Так, понятно. Это мы разобрали. Ну всё, короче, остальное всё будет у меня в канале. Поэтому, друзья, если было полезно, не забудьте поставить лайк, подписаться, потому что вам не сложно, а мне как приятно. Вы не представляете. Я просто потом на седьмом небе отчасти, когда я захожу в статистику Ютуюба и вижу, что а тот материал, который я записываю, действительно полезен. Поэтому, ну, думаю, не сложно, да, там лайк, подписочка, ну, комментарий, это уже просто сверх того, что можно сделать. Ну, и жду вас в своём Telegram-канале. Готов отвечать на любые вопросы. Я вообще очень сильно, да, разбираюсь сейчас в разных инструментах, а, в искусственном интеллекте и готов всем этим делиться, да, по- простому, а, по живому. Также сейчас я делаю ещё недавно внедрил интересную рубрику, сейчас покажу её. Эта рубрика у меня называется, а, получается, Daily News, то есть я завтра с утра встану, а завтра там начнётся новый день. И вот где
24:47

Daily News on the Telegram Channel

мониторить реально классную инфу по нейросетям? Конечно же, мы берём какой-то, ну, источник, например, Twitter, условно говоря, и дальше мы, ну, точнее, я собираю информацию и выдаю вам в простом виде. То есть здесь есть и видео, да, как вы видите. Здесь есть короткое пояснение, здесь есть прямые ссылки и здесь ещё в комментариях голосовая озвучка. То есть вообще как бы, ну, каждый день я это делаю, я буду это делать, мне это интересно, и вы будете получать короткую, классную выжимку, да, из мира наросети, что вообще сейчас происходит, куда это всё движется. Вот завтра я встану по-любому. Там вообще новостей будет тьма. Я буду вычленять оттуда топ-пять и здесь их прописывать. Ну там примерно, да, может чуть больше будет. Так что жду вас, друзья. Ещё раз всем спасибо за просмотр и увидимся в новых видео.

Ещё от RixAI

Ctrl+V

Экстракт Знаний в Telegram

Транскрипты, идеи, методички — всё самое полезное из лучших YouTube-каналов.

Подписаться