Grok 4 Exceeds Expectations & More AI Use Cases

11:41

Grok 4 Exceeds Expectations & More AI Use Cases

The AI Advantage 11.07.2025 38 124 просмотров 934 лайков обн. 18.02.2026

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

Join The AI Advantage Community today to get access to our latest AI courses and way more 👉 https://bit.ly/community-aia It looked like it would be a quiet week in AI until Grok 4 released out of nowhere and blew expectations out of the water. This might actually be the smartest AI in the world. I'll show you my Grok 4 test results and talk about my opinions on the model, plus cover the other smaller updates in AI this week like Perplexity's new Comet browser and Gemini's Gems update. Enjoy! Links: https://x.com/xai/status/1943158495588815072 https://x.ai/ https://x.com/perplexity_ai/status/1942969263305671143 https://x.com/genspark_ai/status/1940392733790892509 https://labs.google/fx/tools/flow https://workspaceupdates.googleblog.com/2025/07/gems-in-the-side-panel-of-google-workspace-apps.html https://x.com/higgsfield_ai/status/1940835284104761454 https://x.com/higgsfield_ai/status/1942278424657269084 https://x.com/higgsfield_ai/status/1942700575310975008 Chapters: 00:00 What’s New? 00:27 Grok 4 07:06 AI Advantage Community 08:40 Perplexity Comet 09:15 Genspark AI Docs 09:39 Veo 3 Image to Video 10:27 Google Gems Update 11:08 Higgsfield AI Updates #ai Free AI Resources: 🔑 Get My Free ChatGPT Templates: https://bit.ly/newsletter-aia 🌟 Receive Tailored AI Prompts + Workflows: https://v82nacfupwr.typeform.com/to/cINgYlm0 👑 Explore Curated AI Tool Rankings: https://community.myaiadvantage.com/c/ai-app-ranking/ 💼 AI Advantage LinkedIn: https://www.linkedin.com/company/the-ai-advantage 🧑‍💻 Igor's Personal LinkedIn: https://www.linkedin.com/in/igorpogany/ 🐦 Twitter: https://x.com/IgorPogany 📸 Instagram: https://www.instagram.com/ai.advantage/ Premium Options: 🎓 Join the AI Advantage Courses + Community: https://bit.ly/community-aia 🛒 Discover Work Focused Presets in the Shop: https://shop.myaiadvantage.com/

Оглавление (8 сегментов)

What’s New?

Итак, сначала я думал, что эта неделя будет очень спокойной в мире ИИ, но с выходом Gro 4 у нас есть много тем для обсуждения в этом выпуске новостей об ИИ, которые вам пригодятся. В этом шоу, посвященном анализу всех новинок в области искусственного интеллекта, выпущенных на этой неделе, отбираются те, которые можно использовать уже сегодня и которые действительно важны. Сейчас лето, поэтому темп жизни немного замедлился. Так что большую часть этого эпизода мы будем говорить о Gro 4, а затем затронем такие вещи, как расширение возможностей Gemini по интеграции драгоценных камней в ваши Google Docs, что, на мой взгляд, действительно интересно, и еще несколько кратких заметок. Давайте начнем с разговора

Grok 4

о Gro 4. Это важное объявление, которое прозвучало в очень необычное для меня время здесь, в Европе. Сейчас я нахожусь в Словакии, навещаю родственников. Презентация состоялась в четверг утром, и компания XAI представила свой совершенно новый Gro 4. Итак, что же здесь главное? Что ж, это новый лидер по всем показателям, включая последний экзамен человечества и ArcGI, два самых сложных бенчмарка. Оно безоговорочно проходит проверку на соответствие атмосфере. Кстати, у меня есть подписка на Gro 4 Heavy за 300 долларов, и я провел несколько тестовых заданий, которые мы используем для этих моделей рассуждений, и во всех из них программа показала себя превосходно. Подробнее об этом чуть позже. А эта самая умная модель за всю историю также имеет новый голосовой режим для мобильных устройств. Миллионы людей наблюдают за нами прямо сейчас. Вы в восторге? О, я в восторге! Это действительно похоже на выступление на сцене старого театра «Вик», где вас окружает море лиц. Почему же это самая умная модель из когда-либо созданных? В своей часовой прямой трансляции, ссылку на которую вы найдете ниже, они дают довольно много пояснений. Но если вкратце, то они выделили в 10 раз больше вычислительных ресурсов для второй части обучения, обучения с подкреплением, и обучили модель использованию инструментов, тогда как предыдущая версия Grock имела доступ только к инструментам, но они не были включены в процесс обучения. Думаю, хорошая аналогия — это когда 70-летнему человеку дают телефон с инструкцией, и он сам пытается разобраться, как им пользоваться, верно? Но с другой стороны, если включить его в обучающие данные, это будет похоже на ребенка, выросшего со смартфоном. А если дать обоим этим людям, имеющим смартфоны, какое задание, то кто, по-вашему, справится лучше? У них одинаковые инструменты, но это не значит, что они могут использовать их одинаково. И я думаю, что эта аналогия применима и к старым моделям по сравнению с новыми. В версии OpenAI это будет ChatgPT40 против 03. O3 обучался на основе использования инструмента. Вот почему она так чертовски хороша в таких вещах, как просмотр веб-страниц и использование этих данных для предоставления вам более точных ответов. То же самое пока и с Гро. Программа прошла обучение использованию инструмента, и в ходе обучения вычислительные ресурсы были увеличены в 10 раз. Итак, это краткое изложение технической стороны вопроса: почему это так умно? Но на этом канале нас действительно интересует, как это работает в реальных условиях? Стоит ли вам рассматривать эту модель? И хотя у меня на данный момент всего несколько часов, я довольно уверен в своем мнении по этому поводу. Причина в том, что даваемые ответы не слишком длинные. При использовании открытых моделей AAI и Gemini часто получаются очень длинные ответы, на обработку и анализ которых уходит много времени. В то время как Грок, даже в сложных вопросах, относительно лаконичен. Но я думаю, что могу сформулировать свою точку зрения в одном предложении. Если вам нравятся модели 03 или 03 Pro, то эта вам точно понравится. Он примерно в пять- шесть раз быстрее, чем O3 Pro. Это более лаконичный вариант, который, тем не менее, затрагивает самые важные моменты. И здесь соблюдение условий задания остается на прежнем уровне, а это значит, что каждое слово, которое вы введете в задание, будет учтено и выполнено. А в чём же он не так хорош? Итак, начнём с упражнений по программированию. Я не говорю, что это плохо. На самом деле, это очень вкусно. Но уже по первым нескольким тестам, например, по базовому примеру, который я всегда запускаю — это приложение для составления списков дел, — оно многое говорит о визуальном языке моделей. Оно это делает, но не ждите такой же эстетики, как у Claude. И я видел другие мнения в Твиттере, которые отражают это же мнение: для задач разработки это не будет вашим первым выбором. Но для многих людей это не главная цель поступления в магистратуру. Лично для меня это в основном стратегические задачи, связанные с планированием, которые я постоянно выполняю как онлайн-предприниматель. И для этого Offrey и Offrey Pro оказались лучшими, а вот это, я думаю, лучше. Вот хороший пример конкретного тестового задания, которое мы используем в контексте одного из членов нашей команды, Даниэля. Он спрашивает о том, как сбалансировать свою неделю между прогулками с собакой, отдыхом, работой и всем остальным. И, не вдаваясь в подробности, этот ответ, по сравнению со всеми конкурентами, которых мы тестировали — Claw 4, Gemini 2. 5 Pro и Offrey 3 Pro — краткий, по существу, он дает вам расписание, которое ничего не упускает. Это приложение запрашивает информацию и предлагает различные методы повышения продуктивности, не перегружая вас списком из 15 разных дел, а просто предлагает три наиболее эффективных с кратким объяснением, почему? Команда разработчиков поясняет, что эта тяжелая модель Grock 4 работает следующим образом: она запускает несколько агентов, затем сравнивает результаты и выбирает лучшего из них. Подобное может происходить с некоторыми вычислительными моделями, но пока об этом прямо не говорилось. В целом, я считаю, что на данный момент это лучший голосовой помощник из всех существующих. Если вам нужны инструменты для программирования, обратите внимание на Claude и Gemini. Если вам нужно что-то для письма, то многое здесь субъективно, вероятно, это Клод. Но если вам нужен помощник для разработки стратегий и решения сложных задач, то, я думаю, именно здесь он по- настоящему раскрывает свой потенциал. Даже в вопросах, связанных с терапией/коучингом, система находит хороший баланс между персонализацией и практическими рекомендациями, не будучи при этом слишком навязчивой или перегружающей пользователя множеством вариантов. Я не знаю. Думаю, первое, что мне приходит в голову, это то, что мне просто очень нравится то, чем я занимаюсь. И, наконец, хочу отметить, что возможность бесплатного выполнения таких задач по устранению неполадок, которые я иногда называю технической поддержкой, стала неоспоримым стимулом для этого. Она просто отлично справляется с поиском информации в интернете, нахождением актуальной документации и последующим пошаговым руководством. Я не уверен, лучше ли это, но, по крайней мере, это ничуть не хуже. Но за это приходится платить. Получите доступ к Gro 4 Heavy, который использует этот многоагентный подход и затем предлагает вам наилучший ответ. Это стоит 300 долларов в месяц. Это на 50% больше, чем все тарифные планы конкурентов за 200 долларов. И стоит ли это того, решать вам. Платформа надёжная. В них есть основные функции, такие как проекты, а также новый голосовой режим для мобильных устройств, который я еще не успел протестировать. Вот небольшой фрагмент. В сравнении с продвинутой голосовой системой OpenAI, которую, да, именно так они и продемонстрировали в своей презентации. Они провели прямое сравнение с Open AI. Обычно мы так делаем в этой передаче, но, видимо, они просто осмелились на это. Эй, я сейчас назову число. А вы можете повторить мне это же число? Один. Понятно. Это похоже на забавную небольшую игру в эхо. Что дальше? Два. Итак, вы сказали два. Три. Вы это сделали. Четыре. Стабильно и устойчиво. Что дальше? Пять. Пять. Успешно справился. Это довольно весело. Вы можете продолжать в том же духе или снова изменить программу. Эй, Грок. Привет. Чем я могу вам сегодня помочь? Мы проведём небольшой тест. Можете повторить за мной? Один. Все в порядке. Что дальше? Два. Два. Что у тебя на уме? Три. Три. Вам нужно что-нибудь еще? Четыре. Четыре. Чем я могу вам помочь? Пять. Пять. Что дальше? Таким образом, по результатам тестов на ARC AGI 2, он вдвое превосходит показатель Claude Opus, который ранее был лидером. В рамках Международной математической олимпиады это первая модель, получившая идеальный результат в 100%. И всё это доступно сегодня через веб-приложение и API во всех регионах. Ценообразование API аналогично ценообразованию Sonnet 4. Довольно дорого, но вполне разумно. И в нём содержится 256 000 контекстных токенов. Следует отметить, что в API цена удваивается после 128 000 токенов. А еще они подчеркнули, что это только начало. На данный момент у Grock for есть простые инструменты. Вскоре они предоставят ему физические симуляторы корпоративного уровня и многое другое. Они рассчитывают совершить реальные технологические прорывы не позднее 2026 года, возможно, даже к концу 2025 года, что должно быть интересно. И независимо от вашего мнения об Илоне, эта модель впечатляет как по результатам тестов, так и по производительности в реальных условиях. И я собираюсь использовать это во всем, что делаю в течение следующих нескольких недель, и сообщу, если будет что-то еще сказать. Итак

AI Advantage Community

говоря об использовании этих моделей и о том, как их применять, как многие из вас знают, мы делаем гораздо больше, чем просто публикуем эти видео на YouTube, чтобы помочь отдельным лицам и компаниям максимально эффективно использовать эти инструменты. В частности, различные сравнения и тесты, которые я только что вам показал, мы создаём в основном для нашего сообщества. Итак, если вы хотите получить все подробности, наши результаты оценки, данные о задержке и все остальное, не тестируя все самостоятельно, мы поделимся этим там. Но мы также внесли существенные изменения в то, как управляем сообществом. И я хочу уделить секунд 30, чтобы показать вам, что изменилось, потому что кое-что из этого может помочь решить вашу проблему. Во-первых, сейчас мы создаём видеоруководства для сообщества. Лично я делаю это раз в месяц. Первая тема была посвящена сравнению коннекторов чата GPD и проектов чата GPD, а также тому, как управлять контекстом при их использовании. Это видео, которое нам просто не удалось выпустить на YouTube спустя более месяца после выхода коннекторов. Но в сообществе можно действительно поговорить об управлении контекстом, и вы сможете чаще любоваться моим прекрасным почерком, чем на этом YouTube-канале. Кроме того, это все руководства и ресурсы, которые мы выпустили за последние 3 месяца. Мы предлагаем пошаговые инструкции и регулярно проводим мероприятия для налаживания деловых контактов, где вы можете попасть в группы с единомышленниками и познакомиться с другими людьми, разделяющими вашу страсть к генеративному искусственному интеллекту. И последнее, что я хочу отметить: мы собираемся сначала выпустить наш курс по автоматизации и созданию агентов для начинающих, предназначенный для всего сообщества. Возможно, со временем мы начнём продавать его отдельно, но пока он будет доступен только членам сообщества. Итак, если вы хотели углубиться в эту тему и получить доступ к дополнительным лекциям и руководствам по более сложным и продвинутым методам, то именно поэтому мы последние 5 месяцев работали над курсом, который поможет вам начать автоматизировать процессы, и он почти готов. Итак, это лишь некоторые обновления основной подписки, которую мы предлагаем в Advantage. А теперь давайте завершим видео, обсудив самые интересные моменты этой недели, начиная

Perplexity Comet

с Perplexity Combat. Поэтому это вызвало много споров. Это веб-браузер с искусственным интеллектом от Perplexity, который стоит 200 долларов в месяц, и в настоящее время доступен в режиме раннего доступа. Вот в чём дело. Лично я пока не совсем понимаю смысл этих браузеров с искусственным интеллектом. Они похожи на обычные браузеры со встроенным плагином. Уверен, в будущем появятся новые функции, но на данный момент я не вижу смысла в этих браузерах с искусственным интеллектом. Однако ходят слухи, что OpenAI скоро выпустит свою собственную версию, так что, возможно, они сделают что-то революционное. На данный момент, даже несмотря на недоумение, я лично не вижу в этом никакой пользы. Возможно, я ошибаюсь, и вы можете оставить комментарий. Ещё один пример —

Genspark AI Docs

Genspark AI Docs. Это очень похоже на то, что Canva выпустила несколько месяцев назад с помощью Canva Docs, где вы можете использовать чат-бота для создания документов Word, таблиц Excel и т. д. Genpark тоже это делает. Мы это проверили. Ничего страшного, если вы захотите выполнить исследовательское задание. Визуально он выглядит довольно плохо, но, по сути, если вам нравится исследовательская работа, которую проводит такой агент, как Genpark, и вы хотите превратить её в документ, то Genpark AI Docs — хороший вариант для этого. Далее, вот еще

Veo 3 Image to Video

одна довольно интересная новость: VFree наконец-то добавил функцию добавления изображений к видео. Таким образом, до настоящего момента вы могли только преобразовывать текст в видео или использовать их изображение и модель внутри Flow, чтобы преобразовать текст в изображение, а затем это изображение в видео, но вы не могли загружать свои собственные изображения и преобразовывать их в видео. Теперь же внутри Flow это лежит в основе их подписок стоимостью 200 долларов. Боже мой, что происходит с iSpace? Он становится таким дорогим. Но да, если вы используете этот тарифный план и сервис Flow, вы наконец-то сможете загружать собственные изображения и превращать их в видео. Вот несколько примеров того, что люди в интернете уже сделали с этим. Это действительно здорово. Она также воспроизводит звук, как и следовало ожидать от VFree. Итак, теперь, когда я могу говорить, давайте обсудим, почему ты так упорно бросаешь мяч, зная, что я явно устала от игры в апортировку? Довольно впечатляюще, но непомерно дорого для большинства людей. Ещё один

Google Gems Update

интересный пример — расширение компанией Google своих «гемов» в Google Workspace. Итак, если вы не знакомы с этим, но если вы являетесь подписчиком одного из тарифных планов Google, вы можете создавать эти драгоценные камни. Это было бы эквивалентом GPT с OpenAI — своего рода настраиваемого чат-бота с инструкциями и файлами знаний. И теперь, впервые, они позволяют вынести этот ценный ресурс за пределы рабочего пространства Gemini и использовать его, например, в Google Docs или Google Sheets. Таким образом, вы можете использовать своего собственного ИИ- помощника для создания других документов вне приложения. Я действительно думаю, что это будет следующий шаг, особенно для пользователей среднего и продвинутого уровня. Я думаю, это действительно умный шаг, и мы будем видеть его все чаще, потому что это просто логично, и Google первыми предприняли такой шаг. И

Higgsfield AI Updates

наконец, у нас есть несколько обновлений для Хиксфилда, которые выпускаются еженедельно. В новой модели генерации изображений появилась функция восстановления изображений, а также 10 новых предустановок для генератора видео. Они каждую неделю добавляют что-то новое, и мне лично очень нравится, как выглядят их новые модели, особенно модель Soul. Что касается ручного управления их видеомоделью, я думаю, что в настоящее время они лидируют в этой области. Хотя другие модели, такие как V3 или китайские, превосходят их с точки зрения чисто визуального восприятия. И да, это, по сути, всё, что нужно знать о сегодняшнем выпуске AI Music in Use. В этом обзоре основное внимание уделялось релизу Gro 4. Итак, меня зовут Игорь, и я надеюсь, у вас будет замечательное время.

Другие видео автора — The AI Advantage

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник