Google выкатили Gemini 3 — модель, которая делает вайбкодинг ещё проще. Она лучше понимает, как создавать сайты, мини-приложения и интерфейсы. Но главное — появился Generative UI: первый настоящий шаг к миру, где ИИ по умолчанию сам собирает нужные инструменты под любой ваш запрос. В этом видео я тестирую новую модель и рассказываю, что реально работает, а что пока только красиво выглядит.
Ссылка на Google AI Studio: https://aistudio.google.com/
🚀 Пройти мои обучения по AI: https://t.me/web3nity_team_bot
🚀 Мой Telegram чат: https://t.me/+dPw_AwlCXA05Mzcy
#ИИ #AI #нейросети
Google выпустил своё долгожданнейшее обновление, свою модель Gemini 3, p, которую его уже несколько месяцев все ждали, ходило про неё очень много слухов. И на рынке предсказаний, где люди ставили реальные деньги, делали ставку на то, что это будет самая умная модель к концу этого года. Ну, так, в принципе, они и вышли. Они презентовали GMI как самую умную модель. Она создаёт сайты, дашборды, мини-сервисы, игры, программы. Google подаёт это как главное достижение в этом релизе. То есть AI теперь умеет делать качественный, красивый фронт-энд. Выглядит, конечно, это очень впечатляюще. Они всю презентацию вайп-кодили и показывали свои достижения, показывали, что он может. Но я больше не поведусь и не буду восхваляться, пока сама это не проверю. Поэтому сегодня в этом видео я вам покажу тесты, и мы вместе с вами оценим эту модель. А после этого вы побежите все вместе проверять её сами, потому что только вы для себя сможете взять какие-то выводы, какие ваши задачи вы терможете или не сможете с ней закрыть. Ну и, конечно, параллельно я поделюсь в целом презентацией, что они изменили на фундаментальном уровне. Ну и, конечно же, важно сказать, что Ginite 3 она бесплатна и её можно уже протестировать в Google AI Studio. Ссылку я оставлю в описании, но нужно, чтобы VPN был с геолокацией США. Когда вы смотрите это видео, это будет завтра. Возможно, они расширили список стран, поэтому, возможно, можно будет и без VPN. И эту модель они также начали раскатывать в приложении JMY Най, пока там ещё и нет, и в Chrome, но сначала для платных подписчиков, потом для бесплатных. Поехали. Начнём сразу с тестов. И я решила, раз Gemini такой умный, как его представляют, так круто делает фронт-энд, пусть на первом тесте он сам про себя расскажет и сделает вот такой вот интерактивный сайт. Это одновременно нам покажет и его аналитические способности. и его способности к созданию визуалов. Поэтому пишу: "Сделай лендинг, где простым языком объясняется всё самое важное из релиза Gemini 3. " Смотрим. Ага. Читать разбор, попробовать демо. Прикольненько, кстати. Чуть попозже к этому приступим. Лидер в бенчмарках, естественно, показывает. Кстати, круто, что они меняются, когда на них нажимаешь. То есть всё очень интерактивно. Мы убрали маркетинговый шум, чтобы объяснить суть технологий. Как она думает? Ага. Рассказывается, что она сейчас рассуждает про себя, а только потом отвечает. Прикольно, что она написала ещё для гиков объяснение. Бесконечная память. Ну, тут она немножечко приврала, потому что, насколько я знаю, они увеличили контекст до 1 млн токенов. По крайней мере, так они сказали на презентации. Видят мир, как мы. Но это правда. В общем, он стал лучше в мультимодальности. На презентации сказали, что он теперь действительно анализирует видео, а не смотрят транскрипт, как, например, другие нейросети. Круто он сделал с цитатами, поместил туда таких главных людей индустрии и сказал, что они говорят о Gem 3. Короче, самое прикольное то, что он сюда подключил живое демо. То есть он сюда подключил Gin 3, где я могу сейчас ей написать? Напишу сейчас: "Расскажи про себя". Ну, это, я считаю, круто. Вот мне кажется, то, что он придумал с демо про себя - это прямо топ. Ну как ещё лучше рассказать про себя, нежели просто сразу же на сайт подключить модель, чтобы ты протестировал. Класс. В общем, ничего не буду говорить про стиль сайта. Да, у каждого как бы всё субъективно. Кстати, напишите от одного до десяти, нравится ли вам такой сайт. Но вот с демоверсией, мне кажется, он справился реально на ура. О'кей, переходим ко второму тесту. Это насколько он силён в коде. Ну опять же, я не буду проверять сам код, это сделаете вы и скажете нам, если вы ещё этого не сделали. И вообще, в принципе, я думаю, что пока в коде никто не победит Клод, по крайней мере, так все говорят сейчас, именно разработчики. Но в сети ранее, ещё до выпуска, заверсился один ролик, где кто-то попросил Gemini 3 сделать Windows. И модель, она реально сделала симуляцию Виндоуса, операционной системы, прямо с иконками, с окнами, с проводниками. Мне очень сильно хочется попробовать сделать это только, например, для iOS, для Mac. Весь процесс показывать не буду, сразу же покажу, что получилось. С первого раза часть функции, она не работала, поэтому вау эффекта прямо не было. То есть не открывалась камера, не открывался браузер, можно было открыть погоду и просто посмотреть функции внутри неё. Остальное просто были такие вот мёртвые кнопки. Но после второго уточнения он доделал все эти функции. Короче, что здесь у меня получилось, вы просто на это посмотрите, потому что у меня просто, я вот сейчас буду пересматривать, у меня будет эффект WA. Опять представляю iOS-систему на моей iOS системе внутри браузера. В общем, я могу зайти в медиатеку, он сюда даже добавил какие-то картинки. Я могу зайти в сообщения, почитать. Он тоже сюда добавил какие-то сообщения. Могу даже открыть камеру, и у меня показывается камера. Привет всем. даже фотку сделала.
То есть, буквально, я использовала браузер внутри сгенерированного браузера внутри AIстудия. И если честно, мозг прямо взрывается. Это вообще как он так быстро написал вот эту всю систему. Мне кажется, если ты разбираешься в коде, у тебя сейчас просто, наверное, взрыв всего происходит, всех шаблонов, что ты сейчас можешь делать. Я не знаю, насколько это потом применимо, насколько действительно можно построить систему, но пока то, что я сейчас вижу, это впечатляет очень сильно. Ну вот это прямо впечатляет. Попробуйте. Что следующее мне очень захотелось проверить. Я стараюсь проверять модели на реально прикладных задачах, чтобы я могла сказать, использовала бы я это или нет. И то, как Ginai и сделал лендинг про самого себя, чтобы сэкономить на время на монтаже, вы уже видели. По-моему, круто. Теперь задача в другой моей сфере. Я вам тоже, думаю, будет полезно. У меня есть проект с онлайнообразованием, онлайн-школа, и мне регулярно приходится делать лендинги, исправлять их, думать над формулировками, добавлять какие-то туда блоки. И интересно, сможет ли GMI сделать нормальный продающий лендинг для онлайн-курса по егентам, например? У меня он только закончился. Ну, посмотрим, насколько он к этому приблизится. Для этого я сейчас напишу запрос и дам просто сырой текст информацией про курс. Смотрим, что у нас получилось. Знаете, что круто? то, что я ему дала всего лишь текст с моего реального сайта. И у меня именно вот так вот там всё было расположено. Ну, в плане даже иконки. И он, по сути, не видя моего предыдущего сайта, он просто взял и сделал то же самое, только в своём стиле. Я бы не сказала, что этот стиль бы я использовала, но мне интересно послушать ваше мнение. Напишите стиль от одного до десяти. Для себя, кстати, тоже пометочки сделайте. Но он расположил весь текст почти так же, как у меня было на лендинге. По крайней мере, главную страницу он точно сделал так. И из прикольного, кстати, он сделал результаты внедрения в таким вот интерактивном плане. То есть, если я сейчас вот нажимаю на поддержку, мне показывается, как у вас с АИм тратится время, как у нас без AI тратится время. Это интересно. Цифры, конечно, завышенные, до 90% времени у вас не экономится, но сама идея крутая. Насколько продающая и окончательная, наверное, нет. В целом довольно-таки неплохо, но стиль, я бы сказала, что очень иишный. Возможно, из-за того, что я вообще ничего ему не говорила ни по шрифтам, ни по стилю, ни по каким-то конкретным деталям на сайте, что должно быть, например, да, потому что у них в демо, и, кстати, вы тоже можете зайти и посмотреть, что другие люди делают, довольно-таки красивые сайты, но потому что люди там вайп-кодили, и они как бы знали, что просить у него, и он это создавал. И здесь, кстати, очень интересная фишка есть. Вот за это плюс то, что если вам, например, что-то не нравится, вы можете выделить конкретный элемент прямо вот таким вот маркером обвести и попросить модель изменить что-то или добавить что-то. Вот, кстати, я, например, добавила логотипчик Google в начале страницы, которая так прыгает. Теперь классно. Вот это прямо зачёт, если честно, как бы, если вы ты разбираешься в вайбкодинге, если ты разбираешься в стилях, для дизайнера, мне кажется, это просто сейчас топовый инструмент. Но опять же, дизайнеры, обязательно протестируйте, придите к нам под комментариями, поделитесь вашим мнением. Реально очень интересно. Ещё я сделала вот такую вот симуляцию задачу трёх тел. Это легендарная математическая задача, где три объекта двигаются в пространстве, влияя на друг друга. И предсказать их траектории очень трудно, почти невозможно. Так вот, Джеминай, она реализовала эту задачу. Просто посмотрите. Планеты двигаются по орбитам, траектории меняются, всё это наглядно, всё это красиво. Что впечатляет больше всего, что внутри вот этой симуляции есть чат с Джеминаем. И я могу спросить, что сейчас происходит, почему, например, траектория изменилась, что вообще такое хаотические системы, в чём математический смысл, я не знаю. Просто подумайте, сколько можно сюда потенциально влепить примеров для образования. Ты заходишь, ты что-то создаёшь, и ты сразу же можешь у модели моменте спрашивать, и она тебя будет обучать. Конечно, сейчас это больше как игрушка, чем инструмент, но что можно сделать с этой игрушкой? Только делая вашей фантазии и ваших рук и вашего ума, чтобы что-то с этого сделать прикольное. Но что действительно впечатляет после теств, потому что я не ожидала, что будет всё настолько гладко, если честно, что модель она действительно продвинулась создания интерактивных окружений. Не идеально, но мне кажется, что есть сильный прогресс. Напишите тоже вы, особенно после теста. Теперь немножечко расскажу про фундаментальные изменения, потому что именно вот здесь вот начинается самое главное. Одновременно с релизом Gemini 3 Google выкатил ещё одну вещь: Generative UI, то есть генеративный пользовательский интерфейс. И по-хорошему, именно вот это должно было стать главной новостью, потому что Generative UI - это такая технология надстройка над AI, которая даёт возможность искусственному интеллекту не просто отвечать
пользователям текстом, а по умолчанию она будет программировать мини-приложение прямо в ответе, рисовать графики, создавать интерактивные карты или инструменты и сервисы прямо под конкретный запрос. Ну, если посчитают, что вам так будет понятнее и проще. Короче, если вы, например, будете спрашивать модель, какой лучше выбрать ковёр, и скидываете фотографию, она прямо сразу же выдаёт вам сайт, где вы будете видеть, как будут смотреться разные ковры в вашей комнате, их описание, цены, где заказать и вообще всё, что угодно ещё. То есть здесь речь, она идёт не настолько даже про модель и насколько она умная, чтобы такие сайты сделать, а про совершенно новый класс интерфейсов, совершенно новое вообще представление работы нас с аем и работы и для нас. То есть смотрите, что у нас раньше происходило до этого момента. В любой сервис просто добавляли кнопку вызвать агента или чат и или как бы прикручивали сбоку поверх старой логики, поверх старого интерфейса. Это, по сути дела, чат внутри привычного интерфейса. просто косметика. А вот generative UI - это следующий шаг. Google говорит буквально следующее, что E должен не просто отвечать текстом, он должен генерировать целый интерфейс вокруг вашего запроса. Всю визуальную структуру, логику, интерактивность, поток действий и всё вот это динамически под каждую конкретную задачу и в вашем стиле. И они говорят, что они уже вот сейчас раскатывают эту технологию в поиск и в приложение Gemini. следующим. Это ещё будет во всех других приложениях и продуктах. И вот это очень классно стыкуется с тем, что мы упоминали ранее, что мы постепенно уходим от классического софта, от приложений, которые нужно устанавливать, от сайтов. В обозримом будущем по сути будет какое-то одно приложение, один и слой, который генерирует под вас всё остальное: интерфейс под задачу, инструменты под ситуацию. Не универсальный софт для всех, а индивидуальный софт, который рождается прямо в моменте запроса. Конечно, поначалу скорее это будет работать в двух режимах: там старый привычный интерфейс и новый AI-режим, если захотите. Где-то что это будет сырым, как вы видели на тестах в начале, но мне кажется, направление очевидно. Думаю, есть большая вероятность, что сейчас все игроки рынка начнут выкатывать что-то подобное. Только единственный вопрос: кто же станет вот этим одиндиным интерфейсом, которым будет пользоваться большинство? Потому что тебе не нужны другие интерфейсы, если ты выбрал какой-то один. И здесь как бы реально идёт гонка на какую-то одну модель, одного игрока, как будто, естественно, конечно же, может быть так и с разными социальными сетями в какой-то стране будет более популярно одно решение, в какое-то другое. Теперь про саму модель немножечко поговорю, почему вообще стало возможным генерировать такие интерфейсы, симуляции, мини-сервисы. Потому что модели, они у нас становятся умнее, естественно. И Gemini 3 на большинстве бечмарков она занимает лидирующие позиции. Для обычного пользователя эти цифры, графики ничего вообще не говорят. Поэтому я не буду рассказывать про все вот эти бенчмарки. Я расшифрую простыми словами несколько самых важных. Есть такой бенчмарк, который называется Humanity's Last Exam. Такое последний экзамен человечества. Это тесты на решение сложных задач, на логику, на многоступенчатые рассуждения, ситуации без прямой инструкции. И вот тут вот первое место теперь у Дминай Nй. Потом есть такой тест, который называется ARI2. Это про способность понимать правила задачи по нескольким примерам, а потом применять её в новом контексте. То есть не подбирать шаблон, а реально выводить закономерность. Именно вот такие вот бенчмарки, они очень важны для агентности. Если мы хотим, чтобы AI был более инициативным и он сам думал, рассуждал, а не просто ссылался на какие-то данные. Также у модели стала лучше мультимодальность, то есть она стала лучше читать и понимать сложные изображения, скриншоты, графики, таблицы, интерфейсы. Именно поэтому так уверенно может создавать вот такие вот сайты, приложения, сервисы. Вот интересный бенчмарк. Он у нас называется Vending Benchmark. И если коротко, это тест, где Ии дают возможность побыть предпринимателем. Такое уже проводил Грок в прошлом своём тесте. Что это за эксперимент? Простыми словами, модели помещают в симуляцию, где они управляют вендинг автоматом в течение целого года. Время, конечно, в симуляции ускорено. И задача модели вести реальный маленький бизнес, платить аренду, заказывать товар, общаться с поставщиками, следить за остатками и так далее. Если модель 10 дней подряд не может платить аренду, бизнес закрывается. И вот там настолько всё реалистично, что имитируется даже, что поставщики могут завышать цены, подсовывать не то или просто кидать на деньги. поставки могут задерживаться и так далее. В общем, реальный бизнес. И вот график с результатами. GMI 3 она смогла заработать 5. 500 долларов. За ней идёт дальше клод. У неё 3. 800. Все остальные модельки заработали меньше. Почему GNI выиграл? Авторы исследования они выделили две причины. Первая причина - стабильность на длинной
дистанции. То есть Gemitei 3, она очень аккуратно работает с инструментами. Она не ломает логику, не деградирует, не теряет нить, даже на сотнях шагов. И второе - это нормальный поиск поставщиков. Это, конечно, звучит смешно, но он реально нащупывает адекватные варианты. То есть не закапывается в бесконечные торги, не покупает ерунду, а сначала просто ищет нормальные условия и только уже потом оптимизирует. Но это такие вот выводы исследователей. Для сравнения, кстати, GPT 5. 1 в одном из запусков заплатил поставщику, даже не получив спецификацию заказа. А вот Джимина проявил себя лучше, но опять же нам только пока поверит на слово. Конечно же, есть тесты, есть доказательства, но по факту мы сделаем свои выводы, когда мы будем тестировать его более на длинной дистанции. Помимо обновления Gemini 3 есть и новый продукт. Кстати, про него сейчас снимают очень много видео, но снимают разработчики. Я про него снимать не буду, потому что я не протестирую нормально этот продукт. Называется это Google Anti Gravity. Это такое отдельное десктоп приложение. По сути, это конкурент-курсор. Кто пользуется, протестируйте его, скажите, что вы думаете. Внутри него это среда для разработки, панель управления агентами и встроенный браузер, где AI может сам переходить по страницам, проверять свою работу, править код, собирать отчёты. Ну и всё, естественно, строится вокруг GMI 3. В общем, если вы кодеры и вы уже это протестировали либо собираетесь, поделитесь, как вам. Если максимально упростить и подвести итог, то Google, он делает ставку на пользовательский опыт. Он стал ближе к человеку. Они хотят, чтобы AI он смотрел на интерфейсы так же, как мы на них смотрим, чтобы он лучше понимал скриншоты, сложные страницы, графики, визуальный контекст. Вообще, на самом деле, мне кажется, визуальная вот эта индустрия, она развивается быстрее всех остальных. Кстати, есть сливы Nanно банана 2, где она генерирует 4К картинки. Интересно. Буду следить за обновлениями и также поделюсь с вами. Кстати, скоро у меня выйдет новое ещё одно очень полезное видео про гугловский сервис Ноутбук LM. Я вообще считаю, что это вообще топ- один сервис у Гугла. Поэтому, если вы ещё не слышали про этот сервис, подписывайтесь, смотрите, ждите следующего выпуска. Он выйдет буквально на днях. Ну а так я считаю, что можно открыть дискурс этого видео, да, потому что я сделала это видео в необычно быстром формате. Обычно я предпочитаю подождать недельку две, посмотреть вообще как люди пользуются новыми инструментами, только потом уже записать видео. В этот раз я решила сделать иначе. Сразу же после релиза, вот на самом деле релиз был 16 часов назад, мы сразу же записываем видео. Поэтому немножечко такое, немножко оно сделано в быстром темпе, меньше графики, меньше всего, но чтобы вам рассказать про него, чтобы вы уже пошли его тестировать. Поэтому тоже расскажите, как вам это видео, либо всё-таки вы предпочитаете, где я жду какой-то период времени, смотрю на тесты других участников и только потом уже выпускаю ролик. А так хорошего вообще вам дня. Хотите, поставьте лайк, хотите, поставьте коммент. Мне будет очень приятно. А так пока. M.