Grok 4: что на самом деле умеет новый ИИ Илона Маска

14:35

Grok 4: что на самом деле умеет новый ИИ Илона Маска

Web3nity 15.07.2025 52 911 просмотров 1 758 лайков обн. 18.02.2026

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

В этом видео разбираемся, чем Grok 4 Илона Маска отличается от других ИИ: считывает настроение толпы, подключается к биржам и новостям, помогает в бизнесе и медицине, а в тестах впервые показал «живое мышление». Как его применять нам с вами — рассказываю простыми словами. ✨✨🌌давайте напишем Илону что мы зотим чтобы он добавил - https://x.com/web3nity/status/1945242033494307061?s=46 🚀 Мой Telegram чат: https://t.me/+dPw_AwlCXA05Mzcy #ИИ #AI #нейросети

Оглавление (3 сегментов)

Segment 1 (00:00 - 05:00)

Это самый умный и на планете. С этого началась презентация Грока, которая случилась 2 дня назад. Илон Маск лично представил эту модель и заявил, что впервые искусственный интеллект способен решать сложные задачи, в том числе и инженерные, ответы на которые нельзя просто найти ни в интернете, ни в учебниках. Сама презентация, она очень отличалась от других компаний. Она была более техническая, там было много объяснений технических, если вы её смотрели. И, возможно, было сложно уловить, что на самом деле крутого они сделали. Это не презентации Google, которые, знаете, показывают какие-то чудеса, и люди охают ахат, про них снимают видео. Вместо этого команда реально сейчас фокусируется на более стратегических вещах, чтобы сделать и реально полезным для человека, более точным. И сделали они действительно невероятные вещи. Поэтому в этом видео я вам об этом расскажу. Будет сначала заявление с презентации, потом я буду объяснять, что на самом деле это значит. Я очень рекомендую посмотреть это видео, чтобы понять, куда развивается Грок, чтобы вы, возможно, уже немножечко переходили и решали свои дела именно в Грокке. Это, возможно, будет один из самых практических и действительно полезных. Ии. В общем, поехали. Я думаю, грок вам очень понравится, и, возможно, вы начнёте уже на него переходить, если уже не перешли. Начнём с самого главного. Чем он на самом-то деле отличается от других моделей? И фишка тут в том, как его учили. Если по-простому, то любой не растите просто скармливают данные. тонны текстов, тонны задач, примеров, чтобы она училась находить закономерности, видела вот эти паттерны и давать правильные ответы, и её поощряют, если она даёт правильный ответ. Одна из больших проблем сейчас больших компаний, почему в принципе Неросети галлюционирует, да, одна из причин то, что данные и во-первых слишком много, они слишком грязные, просто их скармливают. Нересить вообще не понимает наш мир, она его не видит физически, поэтому как бы она делает очень много ошибок. Так вот, первое отличие, что сделала команда Грок - это они начали тратить больше вычислительной мощности и больше данных, чем предыдущей версии. То есть ему дали намного больше примеров и времени на обучение, но помимо этого его обучали с инструментами. Что значит инструменты? Инструменты - это как встроенные помощники, например, возможность ходить в интернет или выполнять кусочек кода, когда это нужно. Кстати, буквально час назад я разговаривала с разработчиком, который тренировал модели, и он говорит, что Ии он намного лучше обучается, когда ты ему даёшь конкретные примеры, когда ты ему показываешь, как выглядит браузер, даёшь ему много контекста, как и человек на самом-то деле. Так вот, разработчики изначально давали Ии пользоваться этими инструментами, заходить в поисковые системы, анализировать документы, запускать программы. Это очень похоже на то, как бы, если бы ученику дали не просто учебник, а ему показывали, как конкретно читать этот учебник, как искать информацию, как пользоваться компьютером, а не просто инструкция. Соответственно, из-за этого их модель, она намного лучше теперь ориентируется в интернете. Она находит правильные данные, проверяет себя. Если вы сейчас задаёте какой-то вопрос и он его не знает, он просто сам идёт в интернет, он быстренько находит актуальную информацию и вам её выдаёт. То есть, если грок сейчас спросите что-то сложное, и у него не будет актуальной информации, он пойдёт тогда быстренько проверит, проверит сам себя и потом вам это выдаст. Ну, такая вот логика. Это реально одно из очень важных и очень ключевых вещей. То есть они потратили больше времени, больше данных аккуратных, учились конкретными инструментами, чтобы ей лучше ориентировался. Потом помимо этого они выпустили, кстати, очень крутой инструмент, называется Heavy Gr. Ну или for heavy. И вот это уже что-то очень похоже на то, что заявлял Сэм Альтман. Но пока, мне кажется, они это не сделали. А именно, это специальный режим, когда модель задействует сразу же несколько агентов, как бы копии себя для решения одной задачи. То есть каждый из агентов Грок, он параллельно думает над одной и той же задачей. Они ищут информацию, потом сверяют между собой, выбирают лучше и потом тебе это выдают. Там, если где-то один аи ошибся, второй его проверил, третий там добавил какой-то ещё новой информации, только потом уже выдаёт тебе ответ, потому что даже самый умный одиночный и может ошибаться. А когда их несколько, то шанс, что ошибутся все, ну, намного ниже. Естественно, этот инструмент он не для простых задач. Это больше для людей, которые требуют комплексного такого подхода, да. Поэтому подписка Ви стоит 300 долларов в месяц. Но я думаю, что она того стоит. Я почему выпустила видео немножечко позже, потому что мне захотелось пойти в интернет. Точнее, именно захотелось подождать немного после конференции, посмотреть, что люди будут говорить, что будут тестировщики говорить, и собрать как бы эту информацию комплексной и поделиться ею вместе. Так вот, в Твиттере довольно-таки много позитивных отзывов на heavy. Сама я не тестировала, поэтому сказать не могу. И как говорят остальные люди, то есть хеви - это больше для тех случаев, когда вопрос действительно очень важен и не хочется прямо ошибиться, не хочется, чтобы Нерося тебе выдала какую-то ошибку. На презентации было очень много графиков, очень много там разных тестов, бичмарков. Я про это много говорить не буду, потому что мы с

Segment 2 (05:00 - 10:00)

вами не технори. Но одно стоит сказать, что грок по тестам превзошёл другие модели по именно гибкости мышления. Есть такой бичмарк, который называется ERCI. Это один из самых сложных тестов, который показывает, насколько модель может быть гибкая. То есть они там оценивают не насколько и хорошо заучивает знания, а именно способность учиться на лету. Так вот, Грок перегнал даже самую продвинутую модель Clotд OPUS 4, которая показала 8% правильных ответов, а Грок показал 15,1% правильных ответов. То есть он не просто угадывал, а дошёл до планки, с которой начинается уже живое мышление. Ну, естественно, мы сейчас можем сказать: "Да, все компании завышают свои показатели, и все говорят, что у нас самый умный ИИ". Но я бы про это не говорила, если бы не официальная команда ERCI, которая сказала такую фразу, как мы слышали, что Грок хорош, но не думали, что он станет номер один. То есть это команда, которая, в принципе, придумала этот бичмарк, протестировала и действительно подтвердила этот факт. Теперь, что это означает для нас? Они сейчас углубляются в то, чтобы Грок не просто запоминал какие-то данные, а он учился прямо во время использования, то есть во время теста, как настоящий человек. И это безумно важно. Все вот эти достижения показывают, куда они идут. Они сейчас понимают самую большую проблему, а именно в практичности использования искусственного интеллекта. Не просто выдачу фактов, а насколько они будут точными. И помещение, и в реальную среду, обучение на реальных задачах показывать ему контекст, плюс обучаться во время теста. И это всё они подкрепляют практическими кейсами, как это на самом деле нам может быть полезно. Я сейчас вам расскажу три классных применения. что делает Грок гроком и куда они уходят. И третье, кстати, используем. Я считаю, что это одним из самых стратегических и умных решений Грока, которые действительно может привести каждого из нас с туда. Первый был практически пример про симуляцию бизнеса. Что они сделали команда XI? Они позвали независимых исследователей, и они придумали такой эксперимент, как называется Wending Bench, где они попросили Ииграть и такого вот управляющего небольшим бизнесом по продаже напитков через автоматы. Задача была такая, что на протяжении длительного времени, а это прямо сотни циклов, должен был бы принимать решение, когда и чем пополнить автоматы, по какой цене продавать, как реагировать на спрос, когда делать скидки, как управлять запасами. В общем, такие вот стратегические действия. Учитывая аналитику, в конкурсе, естественно, участвовали разные модели. Так вот, Грок заработал больше всего. Он заработал 4. 694 доллара, продав около 5. 000 единиц, когда клод, например, 4 заработал всего 2. 000 долларов. А человек-бизнесмен на минуточку, всего лишь 844 доллара. То есть грок обошёл человека в пять-шесть раз. Ну то есть они показали, что на самом деле, если применить И если подключить И во все свои системы, да, позволить им управлять своим бизнесом, то есть принимать решения, то он сможет заработать намного больше денег, потому что, возможно, он более хладнокровный, более быстрый, он видит как бы такой огромный пласт данных, он их быстро анализирует. Естественно, в жизни это всё будет сложнее, если мы хотим это применить. Если вы хотите в свой бизнес применить искусственный интеллект, это уже вам сейчас нужно будет готовиться, потому что сейчас одна из самых больших проблем, с которой сталкивается предприниматель, по крайней мере, который приходит ко мне, в том, что у них очень грязные данные, их недостаточно, они вот так вот все в перемешку, естественно, и не будет хорошо управлять системой, когда вот так вот, когда вот такой вот хаос. Но в процессы, например, в продаже, в переписке, вы уже можете устанавливать AI, чтобы он был во время звонка с менеджером, переписки, он смотрел, как менеджер отвечает, и моментально мог, например, сказать: "Здесь лучше вот так вот ответить, а здесь вот ему лучше продать вот этот инструмент". Один студент создал такой и для HR, для собеседований здесь Сан-Франциско. Его, кстати, выгнали из университета из-за этого, не помню, Харвард или Стэнфорд. В общем, задача была и, что он в режиме реального времени он слушает вопросы работодателя и сразу же подсказывает тебе, как тебе лучше ответить, если ты отвечаешь что-то не так, он там тебя исправляет, то есть в режиме реального времени. И это прямо реально работало. И то же самое уже можно делать, по сути дела в продажах, в закупке, в переписках. Второй важный аспект, на котором сделали прямо акцент разработчики, в том, что он теперь умеет решать, грок 4 умеет решать задачу не только в вакууме, а он может прямо конкретно подключаться к процессам. То есть он может в режиме реального времени заходить на биржу и тянуть биржевые котировки, новости и сразу же их анализировать. А у них есть к этому доступы. Это, на самом деле, один из мощнейших инструментов, когда ты комбинируешь свежую информацию и логику. Всё, он может анализировать новости, он может анализировать цифры 24x7 и прямо выдавать вам такие вот осмысленные ответы, анализ. Конечно, как это будет конкретно применяться, нужно проверять, нужно тестировать, потому что модель только вышла и ещё не прошло достаточно времени, чтобы люди какие-то выявили, возможно, какие-то ошибки или наоборот. Но вот третья вещь, о которой я хочу

Segment 3 (10:00 - 14:00)

сказать, я прямо хочу акцентировать внимание на этом. Какое же стратегическое партнёрство они сделали? Грок 4 они запартнёрились с платформой, которая называется Полимаркеet. Что это за платформа и почему вам, кстати, тоже стоит за ней следить? Если вы не слышали, что такое Полимаркет, Полимаркет - это такая биржа ставок на реальные события. Люди там голосуют. Причём, я вам скажу так, что реально очень много вещей потом сбывается. Например, кто выиграет: Трамп или Байден? Люди голосуют. Ты видишь там реальный голоса людей куда тренд. Ходят даже некоторые слухи, что если хочешь узнать, что будет в ближайшем будущем, зайди на Полимаркет и просто посмотри, какие темы вообще там появляются. То есть какие ставки это коллективный прогноз. Люди реально ставят на то, во что они верят, а это мудрость толпы. Так вот, Грок 4 из-за их партнёрства они теперь могут официально использовать эти данные. Они прямо во время презентации вот здесь показывают, например, как это будет для спортивных прогнозов. То есть модель смотрит ставки на Полимаркете, одновременно мониторит социальные сети. И вот на основе всего она даёт свой прогноз. То есть не просто я думаю, она прямо объясняет, почему так вообще. Понимаете, крутость? Тут фишка в том, что соединяется как бы два мира. Собирается человеческие интуитивные какие-то предсказания и расчёты нейросети, потому что она может анализировать огромное количество данных. То есть мы больше чувствуем атмосферу, а нейросеть, она видит закономерности, она видит факты, она видит цифры. И вот вместе это просто потрясающий инструмент для предсказаний. Грок берёт данные из Полимаркета, потом смотрит, что люди думают об этом, анализируют новости, и после этого он выдаст вам ответ прямо с аргументами. Опять же, это нужно сейчас проверять на практике. Партнёрство только недавно состоялось, но вы понимаете, куда это всё движется. То есть они сделали акцент на практических применениях. И это буквально, кстати, недавно мы разговаривали с ребятами, что сейчас самая большая проблема и для людей - это найти применение. Реальное применение. Кстати, вот поэтому я хотела бы создать такую голосовалку. Я ещё сделаю это видео на английском языке, выставлю в Twitter, и я захочу, чтобы мы все пошли туда. Илан читает комментарии, особенно если их будет очень много, и прямо, чтобы под моим постом мы, например, отметили Илона Маска и написали: "А что вы хотите, чтобы Грок умел? " Я думаю, что если будет много наших комментариев, то на это точно обратят внимание, потому что сейчас X начал работать не по хэштегам, а там сейчас подключен и если он видит, что что-то очень важно, если очень много людей сейчас постят об этом, говорят, то он продвигает эту вещь. И, соответственно, Илон Маск это убедит. В общем, ребят, я думаю, что у нас есть все шансы, чтобы нас услышали. Кто-то один из нас напишет, возможно, это не заметит. А если вся толпа пойдёт писать и отмечать, то я думаю, что это даст эффект. Теперь немножечко личного взгляда, и мне очень интересно поделиться с вами. Мне очень интересно слышать ваше мнение. В общем, если подумать, если сделать вывод, то Грок 4 до недавнего времени был огромный минус. Ему действительно было сложно конкурировать с такими гигантами, особенно Open AI, который на рынке раньше всех. Он уже забрал большее количество пользователей. Люди, люди к нему привыкли. Я привыкла, вы привыкли. Где у них есть и своё приложение, да, и универсальные модели. У Google есть кучу сервисов, которые они могут подключить AI. Я лично считаю, что одним из самых главных преимуществ грока, куда они должны сфокусироваться- это на практические применя, на социальные сети, на вот предсказания, потому что у них есть доступ. Во-первых, у них есть доступ к двум самым мощным социальным сетям всего мира, а это Twitter X и это Telegram. а недавно случалось партнёрство, потому что именно в этих двух социальных сетях сидят люди от науки до криптовалюты. И там люди очень много говорят, прямо именно высказывают. Если Instagram - это просто фоточки, да, то тут они прямо конкретно пишут свои мысли. То есть там происходят прямо настоящие дискуссии, рынки, технологии, открытия, просто простые разговоры, что люди действительно думают, и они реально фокусируются на правильных вещах, что может их выделить и уже на самом-то деле выделяет от толпы. Потому что реальный бенчмарк - это жизнь. И тот, и который будет действительно нам помогать в жизни, которую мы будем использовать, тот и станет на самом деле топом, даже если он будет немножечко глупее другого. А вообще мне очень интересно послушать вас. Что вы думаете по этой ситуации? Напишите, стеровали ли вы грок, что вам понравилось, что вам не понравилось, переходите ли вы сейчас на грок, не переходите на грок. Почему если не переходите? У меня на самом деле до сих пор очень большой стык с этой привычкой что-то GPT. Я настолько к нему привыкла, но я сейчас уже понемножку начинаю переходить на грок, потому что мне нравятся там ответы, особенно когда мне нужна какая-то актуальная информация. Ну всё. А так всем пока. M.

Другие видео автора — Web3nity

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник