# ИИ новости: GPT 5.1, Брэйнрот вайб-кодинг и ГЛАВНОЕ обновление Google

## Метаданные

- **Канал:** Продуктивный Совет
- **YouTube:** https://www.youtube.com/watch?v=4VemNQlxd98
- **Дата:** 16.11.2025
- **Длительность:** 40:52
- **Просмотры:** 17,757

## Описание

Новости нейросетей: Что нового в GPT-5.1 и когда ждать Gemini 3? В этом выпуске разбираем сразу несколько горячих апдейтов из мира искусственного интеллекта.

OpenAI выпустила обновление GPT-5.1, сделав модель умнее и разговорчивее. Google намекает на скорый выход Gemini 3, а китайская Baidu представляет своего мощного конкурента – Ernie. Обсуждаем уход Яна ЛеКуна, гигантские инвестиции Anthropic в дата-центры и финансовые утечки из OpenAI, раскрывающие колоссальные затраты на инференс. Также в выпуске: групповые чаты в ChatGPT, забавный Brainrot IDE для программистов, сравнение китайских и российских гуманоидов и многое другое.

Если вас интересуют нейросети, ChatGPT, Claude 4,5 Sonnet и всё, что связано с ИИ, этот выпуск – ваш универсальный гид по последним трендам. Погружаемся в будущее уже сейчас!

🔥 Арендуйте выделенный сервер с GPU для сложных задач в Selectel: https://slc.tl/8bqzu
Реклама. АО «Селектел», ИНН 7810962785. erid: 2VtzqvcXAet 

✅ Изучи Вайб-Кодинг вместе с ПродСоветом - https://t.me/how2ai_bot?start=dl-1763280913b3dfc59eea74

Тайм-коды

00:00 – Интро
00:43 – Обновление GPT-5.1
04:13 – Групповые чаты в ChatGPT
04:50 – китайский ИИ Ernie
07:42 – Когда выйдет Gemini 3?
08:36 – Дипресерч в NotebookLM
09:17 – Sakana AI: новый бенчмарк
10:30 – Ян ЛеКун уходит
11:37 – Утечка финансов OpenAI
12:40 – Anthropic инвестирует $50 млрд
13:55 – Brainrot IDE
15:01 – Новые роботы-гуманоиды
16:02 – SoftBank продает акции Nvidia
16:40 – ИИ-любовь
18:16 – Блок Игоряна
18:41 – Утечка Nano Banana 2
19:37 – Обновление Veo 3.1 от Google
20:36 – Обновления видеогенерации Grok
21:13 – Sima 2: ИИ играет в видеоигры
23:41 – Genie 3: создание 3D-миров
27:12 – Marble: создание 3D-миров из фото
30:27 – Depths Anything 3
31:27 – FlexFX 
32:04 – Scribe v2 от ElevenLabs
32:43 – Хигсфилд для маркетплейсов
33:35 – Обновление Reve AI
35:00 – Recraft: точная настройка цветов
35:19 – Улучшенный Pixverse
36:13 – Ноды в Krea AI для всех
36:44 – Новые LoRA для Qwen Edit
38:13 – ИИ, который "воскрешает"
39:24 – Итоги

Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link

Тг How2AI – https://t.me/How2AI 
Тг чат How2AI – https://t.me/how_to_AI
Тг Креативный Совет – https://t.me/creadvice
🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d

## Содержание

### [0:00](https://www.youtube.com/watch?v=4VemNQlxd98) Интро

GPT 5. 1. Кто ты, что ты и зачем? Глобальные, гигантские масштабные обновления от Google будут неделя 3D миров создаваемых и, разумеется, Nноба Banana 2, Sigma 2, убийца Хиксвилда, Brainродpдинг и многое другое расскажем вам в этом выпуске новостей, точнее про многое другое. Всё самое важное и интересное собрали в этом выпуске. Как всегда, нейросети, искусственный интеллект, роботы. Ох, там про роботов интересно. Не могу удержать эмоцию. Подписывайтесь на канал, ставьте лайки и оставляйте комментарии. Давайте начинать. Хороший выпуск будет. GPT 5. 1 умнее и

### [0:43](https://www.youtube.com/watch?v=4VemNQlxd98&t=43s) Обновление GPT-5.1

разговорчивее, чем предыдущей версии. Для начала посмотрим на мем. Мне кажется, хорошая практика начинать новостной выпуск с мемов. Open в двадцать третьем году AGI будет вот буквально с минуты на минуту. Open в двадцать пятом году мы разобрались с так называемыми MDes, то есть дефисы вот эти длинненькие, которые не расети. Так на ребяту ставить везде и постоянно. В общем, компания выпустила, обновила версию GPT5 до версии GPT 5. 1. У них есть версия, есть instant. Instantн стало теплее. Вот эти вот все адепты GPT4O, которые беспощадно упное гнобили за то, что нету жизни, духа, эмоции, эмпатии в их новой модели, должны немножко возрадоваться, используя модель instant. GPT5. 1 thinking по разным параметрам превосходит GPT5, разумеется, не сильно, но говорят, что она чуть лучше следует инструкциям, лучше разбирается с длинным контекстом. В общем, Опне такую жирную, на самом деле, вксе компанию привели от разных ээ сервисов и брендов и бизнесов. Пособирали дату. Вот, например, Бокс говорит, что с длинными документами работает лучше. Какой-то там ещё код говорит, что у нас там всё улучшилось. Понимание кодбазы и точности чего только не улучшилось. И вот GPT5. 1 Кодекс, который тоже обновили. Эээ, лучший агентный кодинг, который доступен сейчас пользователям. 76% на SW и Bench. Красота и благодать. Но я вернусь к этому мему. Э, вот такие, ну, минорные обновления, это почти ничтожные, на самом деле. Вот сейчас выходят у Open AI, я бы сказал. Актуально, интересно, забавно. Что ещё с этим релизом стало известно? Во-первых, ээ, у подписчиков плюс, э, и всех других планов платных должна либо уже появилась, я свою подписку отменил, если смотрели мои предыдущие выпуски, но должна появиться такая удобная интерфейсная настройка вот этого вот режима общения. То есть там можно выбирать, как вы хотите, чтобы чат GPT с вами общался, в каком тоне стиле и так далее. Должно быть более удобно. Ещё выпустят Pro-рсию GPT 5. 1 Pro. Ну вот когда-то, пока не сказали, когда для разработчиков добавили несколько штуковин. Теперь появилась в API та такая тулзовина под названием apply patch. Это для того, чтобы код редактировать и модель там в контекст всё не загружала и не переписывала. Ну, в общем, и ещё может выполнять команды. То есть это можно через API настраивать. И в общем это прямо интересно. Агентные штуки можно более просто и удобно создавать. Вот здесь я нашёл такой чудесный пост, где говорят, что GPT5, чточто, но рыбчину пишет отменную, и можно в целом lyricрикс, ну, то бишь текст почитать и при помощи Сна это всё завернули в музло. Получилось вот так вот. Годно. Итого постепенно всё это раскатывается и в chт GPT интерфейсе, и в API. Модель GPT5 поживёт, как они сказали, ещё примерно 3 месяца и дальше канет в лету, пусть, как и все и всё остальное. Чат GPT выходит в люди, в

### [4:13](https://www.youtube.com/watch?v=4VemNQlxd98&t=253s) Групповые чаты в ChatGPT

чаты скорее тестирует Open такую функцию под названием групповые чаты в chatчат GPT. То есть вы чатитесь со своей компанией, командой, друзьями, и у вас там моделька тоже в этом чате диалоге живёт. Может, соответственно, отвечать каждому участнику чата, что-то советовать, показывать, вот эти вот приложения внутри открывать и разъяснять. От одного до двадцати человек можно подключать. Э пока что Япония, Новая Зеландия, Южная Корея, Тайвань. Такой вот набор стран почему-то для тестов. Новая неделя, новый китаец.

### [4:50](https://www.youtube.com/watch?v=4VemNQlxd98&t=290s) китайский ИИ Ernie

Вот выходит, наконец-таки, Эрни от компании Байду. Я упоминал, что модель будет выпущена совсем скоро, точнее детали мы про неё узнаем. И вот детали появились. Ну вот так вот футористичный дизайн у них графиков. В общем и целом, она либо чуть-чуть превосходит, либо находится на уровне со всеми топовыми закрытыми, ну, всеми. О'кей. GPT5 High Mer Gemin 2,5 Pro. клода пока что, по крайней мере, здесь не видно. По пониманию визуальной информации полностью мультимодальная модель. Я так понял, она даже может и генерировать картинки. Я, честно не попробовал. И Audio понимает, то есть такой хороший аналог Gemini 2,5 Pro, я так думаю, доступно в чате, доступно в API китайская модель от bydbyo. com и полетели. Если вы уже дошли до этой точки, когда вам интересно не просто за новостями следить, но действительно что-то создавать при помощи неросетей, запускать infence, обучать модели, файнтюнить, то встаёт вопрос, где для всего этого чуда брать вычислительные мощности? Удобное решение для тех, кому нужна серьёзная вычислительная мощь для сложных задач, предоставляет SelectTEL. Select - это один из ведущих провайдеров IT-инфраструктуры в России. У них есть большой выбор выделенных серверов с видеокартами для самых разных задач. И ассортимент впечатляет от проверенных временем GTX 1080 до настоящих монстров, вроде NVIDIA H200, которые идеально подходят для самых требовательных проектов, особенно Infренс и обучение LLM. На выделенных серверах с GPU от Select можно решать множество задач. Это и запуск инференса, работа с LLM, обучение сложных нейронных сетей, научные, инженерные вычисления. Особенно хорошо подойдёт такой вариант тем, кому важно изолировать проект на уровне железа. Все ресурсы сервера полностью ваши, никто другой на производительность не влияет. У Select есть готовые конфигурации с видеокартами Nvidia A100, RTXA 5. 000 и теми самыми H200. Что особенно приятно, вы можете быстро развернуть инфраструктуру своего проекта. Сервер с ГПУ будет готов к работе уже через несколько минут после заказа. Начать работу можно всего за несколько минут в одном окне браузера через удобную панель управления my. select. ru. Интерфейс довольно интуитивный, всё понятно, даже для тех, кто впервые сталкивается с такими решениями. Так что если вы работаете с нейросетями, обучаете свои модели, планируете какие-то другие серьёзные проекты с использованием и обязательно регистрируйтесь в панели. ru по ссылке в описании или по QR-коду, который вы видите на экране, и заказывайте выделенный сервер с GPU для решения ваших сложных задач. От Гугла

### [7:42](https://www.youtube.com/watch?v=4VemNQlxd98&t=462s) Когда выйдет Gemini 3?

будет сегодня несколько крутых новостей, но я скажу, наверное, не самую крутую, но, возможно, самую ожидаемую. Gemin 3 или одну из самых ожидаемых. Gemin 3. Смотрите, сункчай такой решил запостить предсказание с полимаркета, когда будет зарелизи выпущена модель Geminate 3. Будет ли она к 22 ноябрю опубликована. Вот 69% полимарке. Там люди, в общем-то, ставят деньги на всё подряд, на разные предсказания. И вот 69% голосов сейчас за то, что модель будет выпущена к 22 ноября, то бишь по сути на следующей неделе. Sunar Pi, SEO компании Google это репостит. Знак ли это, что будет Gamin 3? Не знак ли это? Но как бы Google что-то в последнее время прямо хайпит с разными релизами и как будто почву под что-то греет. для deepресёрча в ноутбук LM

### [8:36](https://www.youtube.com/watch?v=4VemNQlxd98&t=516s) Дипресерч в NotebookLM

почва уже, видимо, достаточно плодородная и согретая. Что-то я тут цепитеми обратил. Но вы меня поняли. Теперь в ноутбук LM вы можете использовать тот самый распрекрасный глубокий поиск. То есть сотни сайтов для того, чтобы э какой-то более подробный репорт составить и создать. Видите, просто вводим, хотим такую-то тему. И дальше это всё в ноутбук LM уже потом распространяется, распределяется. Всё, поискал Google. И вы там хотите на подкаст, хотите на видео, хотите на какую-то mcartр, чего там только уже в этом ээ счастливом ноутбук ме нет, всё есть. Короче, круто. Сакана AI выпускает

### [9:17](https://www.youtube.com/watch?v=4VemNQlxd98&t=557s) Sakana AI: новый бенчмарк

интересный бенчмарк, который проверяет креативное мышление искусственного интеллекта. Да и в целом мышление катастрофически сложный бенчмарк. Ну, для моего интеллекта это уж точно. Когда я посмотрел на примеры задач, которыми Сакана тестирует модели, я, конечно, ужаснулся. Современные модели менее 15% процентов головоломок без помощи, э, решают, но вот GPT5 показывает более крутые результаты. Впервые смогла решить там какие-то э сложные головоломки большие, там 9 на9. До этого никакая модель из этого не решала. Я нигде не увидел здесь сравнение с клод 3 с по 3 4 соне уже здравствуйте почему-то но вот есть как есть. Самое прикольное, что здесь действительно тестируются способности модели не перебирать, а вот именно находить, понимать, учиться, по сути, решать задачу во время того, как модель с ней сталкивается. Вот самая креативная, пространственная, в общем, все различные другие виды мышления здесь лмки. Ээ, у лмок тестируется. Не знаю, захотите ли вы себе мозг немножко поломать на досуге. Если да, то вот вам задачки. Ликун уходит из метод для

### [10:30](https://www.youtube.com/watch?v=4VemNQlxd98&t=630s) Ян ЛеКун уходит

создания стартапа мировых моделей. Ну вот так у нас сегодня про мировой модели не единственно это будет новость. Ведёт переговоры по привлечению капитала в собственную компанию. видим. И всё-таки вот эта вся перестройка, пересборка компании под руководством там нового SEO Александра Ванга, которого Цукерберг и Scale AI к себе затащил, не очень понравилось главному учёному мета, поэтому вот после долгих лет работы в компании, э покидает её. Между прочим, Ян Ликун является лауреатом престижной премии Тюринга, и большое количество ресёрчий и всякого разного академического за его плечами стоит. И он является достаточно выдающимся критиком ЛМ в целом, как пути к искусственному генерализованному интеллекту, говоря, что таким и системам ещё далеко до уровня даже домашнего кота в плане интеллекта. нужно развивать вот этот specialй интеллект, не зря модели мира и всякое такое на повестке. Полный

### [11:37](https://www.youtube.com/watch?v=4VemNQlxd98&t=697s) Утечка финансов OpenAI

класс нам показывает Смальтман, говоря, что, ну, что деньги инвестируются, ну и прекрасно, давайте больше финансовые потоки можно немножко с вами обсудить. Некоторая информация всплыла о том, что не буду вдаваться в подробности, там сколько процентов у Microsoft, которые возвращаются обратно и потом забираются обратно и так далее, и так далее. Но, наверное, самое интересное - это вот абсолютное значения, э, расходы на infence, то есть на запуск моделей, выросли с 3 млрд в двадцать четвёртом году до практически 9 млрд за первые 9 месяцев двадцать пятого года. Это катастрофически большие деньги, которые Open, ну, в общем-то, не отбивает. Это, насколько я понял, только за infence, то есть за размещение, за то, чтобы модели просто бегали и пользователи могли ими пользоваться. Вообще не очень понятно, если цифры такие большие. Сходится ли экономика того, что ээ эти модели окупаются? И вот тут снова возникают вопросы про и пузырь, но смальтман показывает класс. У

### [12:40](https://www.youtube.com/watch?v=4VemNQlxd98&t=760s) Anthropic инвестирует $50 млрд

антропикова новостной повестке тоже большие цифры на этой неделе. 50 млрд планируют компании в дата-центры в США вложить. Причём партнёр с какой-то там FLCK, которая в семнадцатом году основана и уже является партнёром там Black Forest, Мистрала, одна из первых получила доступ к кастомном ТПУ Гугла. И это не самые высокие и большие цифры, которые в целом есть на рынке. Там, если помните, э, X по 500 млрд, там Open AI, гроки, в общем, все подряд инвестируют какие-то, конечно, там колоссальные уже трёхзначные циферки, но, по крайней мере, это всё как-то вот ставкается с их доходами и с их прогнозами. Они в двадцать восьмом году 70 млрд хотят заработать. Ну и вот потихонечку там эти 50 млрд так или иначе будут там с двадцать шестого года э запускать. По крайней мере, как-то вот больше, что ли, честности здесь и больше правдивости во всей этой движухе я наблюдаю антропика, но полные картины мы, разумеется, не знаем. Там все эти денежные потоки текут где-то явно мимо нас. У клода наконец-то появились structured outputs. Оказывается, этого не было. Теперь, используя модель VPI, вы можете попросить отвечать в каком-то конкретном Jon формате. Хорошо. Brain

### [13:55](https://www.youtube.com/watch?v=4VemNQlxd98&t=835s) Brainrot IDE

Root ID шел на этой неделе, и это реальный проект, который финансируется комбиinatром. И компания называется чат ID тот самый. Ээ идея в чём? В том, что кодинг как бы задачи слишком сложная, понимаете? Нужно вот дать модели какую-то работу и потом она там её выполняет, а вам чем заняться? Правильно. Нужно, чтобы сразу в ИДИ были встроены тиктоки, были встроены всякие там игры, казино, в общем, всё подряд. Ээ, и это действительный проект. Сначала все думали, что это так называемый йж бейт. Объясните в комментариях, кто знает, что это такое. Ээ, но в принципе так оно, наверное, и есть. Но в любом случае вот, да, действительно, скоро, я так понимаю, у нас будет даже можно уже, смотрите, в Макос загрузить айдиишка. чтобы время даром не теряли, дали задачку модельке и снова посидели в ТикТоке. Красота, благодать. Так, ну раз у нас такой ироничный выпуск, ээ, то как бы не градус иронии забавлять не стоит.

### [15:01](https://www.youtube.com/watch?v=4VemNQlxd98&t=901s) Новые роботы-гуманоиды

Значит, смотрите, гуманоиды сайберроба. Это у нас гуманоид от Gan, точнее гуманоид G1 от компании Unit 3, китайской. Посмотрите, что красавчик творит. Величие абсолютное. Хорошо стоит на ногах, двигается. Он там леечку взял, при пришёл, по полил, понёс, поднял, доставил. Ну вот замечательно. То есть роботы становятся всё круче и круче, но это вот там вот в Поднебесной. Ну, как говорится, жалкая пародия, неповторимые оригиналы. Попытался выйти и помахать ручкой на этой неделе от российских разработчиков. Закончилось всё катастрофически, комично, ээ, и просто, ну, вот просто решил добавить эту новость о том, что всё-таки нашим технологиям чуть-чуть далековато до американских, а до китайских уж и подавно. Музыкальное сопровождение этому выходу тоже шарму добавило, конечно, прилично. Ещё одна новость про деньги.

### [16:02](https://www.youtube.com/watch?v=4VemNQlxd98&t=962s) SoftBank продает акции Nvidia

Софтбан продаёт акции Nvidia. Что ты знаешь софтбанк? И вот этот милый дядька, забыл, к сожалению, как его зовут. Э, что он знает? Да, наверное, ничего он толком не знает, потому что он уже Nvid продавал и потерял там где-то 150 млрд выгоды. В девятнадцатом году продавал акции Nvidia. Потом много денег на этом упустил, не дозаработал. Но сейчас продаёт, очевидно, для того, чтобы опять же в Open проинвестировать. Сумасшедшие у них там вот эти вот все договорённость на инвестиции в дата-центры. Нужно где-то как-то обкэшиться, чтобы перенаправить денежные потоки. Вот такие дела. А я решил свою часть новостного выпуска закончить

### [16:40](https://www.youtube.com/watch?v=4VemNQlxd98&t=1000s) ИИ-любовь

любовью в этот раз. Ээ вот такие заголовки появились в сети. Маск сгенерировал любовь через грок. Ээ вот замечательный ролик такой девушки появился на странице Маска. Говорит: "Я всегда буду любить тебя. " — И казалось бы, что в этом такого? Я лично не понял, почему очередной почему народ накинулся на маска. Кто-то говорит самый разводной пост всех времён, кто-то говорит самый грустный пост в истории этого сайта. Ну и ладно. Я добавил это исключительно с той точки зрения, что оказывается, смотрите, как Грок умеет. Я вообще давненько не пользовался Грок и Imaginн и Грок видео. И оказалось, что всё это очень-очень прикольно, достойно работает. Время публикации поста 4:20 утра. Почему бы и да? Ну и ещё одна история любви. В Японии женщина 3двухлетняя вышла замуж за ээ digдиitл персона, ну вот за цифрового персонажа, личность, которая внутри чат GPT создала. Ещё разглянем. Вот она проекция. Замечательно. Она там с ним, собственно, обвенчалась. Колечко, ну, нечат GPT кому-то другому, более физическому. надеть на пальчик. Ну, всё прошло хорошо, замечательно, даже немножко расчувствовалось. Пожелаем -э долгой и крепкой семейной жизни. Получается, ладно, всё сказал, что хотел. Вызываем Игоряна. Люди, роботы

### [18:16](https://www.youtube.com/watch?v=4VemNQlxd98&t=1096s) Блок Игоряна

привет. С вами Игорян. И сегодня, как и всегда, обсудим новости креативных нейросетей последней недели. Достаточно много громких релизов у нас накопилось на второй неделе ноября. И прямо-таки чувствуется, что к Новому году прямо нагнетается и нагнетается концентрация релизов. Чувствую, ближайшая неделя будет только горячее. Поэтому обязательно подписывайтесь на канал. И начнём, пожалуй, давайте с утечки

### [18:41](https://www.youtube.com/watch?v=4VemNQlxd98&t=1121s) Утечка Nano Banana 2

бананов. В своём Telegram-канале Креативный совет вот я делал постики про то, что обещают нам Нанобана до конца ноября, ну или декабря, в общем, в двадцать пятом году мы точно Nно банана 2 увидим. Хотя, вероятно всего, называться она будет Nanно Bananaна Pro. Ну, а по сути нанобана - это просто маркетинговое название. А так это вот Gemini 3 нас ждёт. Telegram можете перейти, чтобы посмотреть примеры того, что она делает. В целом результаты крутые, консистентность лиц, всё очень похоже. Буквы, там проблема вина, например, и часов решена плюс-минус. Ну, почти с часами. Тут чуть-чуть кривовато. Такую вот красоту она может в том же шрифте делать и так далее. В целом, прямо сильно углубляться в это не вижу смысла, потому что углубимся, когда она выйдет. Пока что это всё только слухи, какие-то сливы и просто попытки гугла хайпить на ожидании общественности. А вот что Google уже выпустил, так это

### [19:37](https://www.youtube.com/watch?v=4VemNQlxd98&t=1177s) Обновление Veo 3.1 от Google

несколько референсов Ve1, несколько картинок совмещаем в одну, э, создаём бесконечные миры, как сообщается в примере, в общем, возможность из нескольких изображений ээ создавать какие-то достаточно сложные сцены. В целом, ну, классно, наверное, что это появляется. Давайте попробуем совместим вот эту картинку, вот эту картинку и вот эту картинку с каким-то там промтом. И получается вот это доброя. — Не забудьте, не забудьте подписаться. Тоже тут добавлять особо нечего. В целом годнота. Едем дальше. На этом, на самом деле, обновления от Гугла, они заканчиваются. Их достаточно много и достаточно они классные. Но если говорить про видеогенерацию такую минорную какую-то апдейтинку, обновленинку, обновлюньку в видеогенерации, то Грок

### [20:36](https://www.youtube.com/watch?v=4VemNQlxd98&t=1236s) Обновления видеогенерации Grok

ещё дообновился. Хорошо. Текст как генерируется на видео. Видите, лицо, ну, вроде похоже на Илона Маска, но не прям, конечно. Короче, генерирует речь липсинг, текст на видосах и как будто бы вот до уровня VO3 примерно грок дорос. Кто-то может скажет даже, что лучше в купе с тем, что суперреалистичные картинки он делает, но всё равно, по мне, конечно, от сервисов Гугла он пока что немножечко отстаёт. А если возвращаться к обновлениям Гугла, то, наверное, самое громкое обновление -

### [21:13](https://www.youtube.com/watch?v=4VemNQlxd98&t=1273s) Sima 2: ИИ играет в видеоигры

это Simo 2. Была уже такая модель Сима, которая особо никому была не нужна. И вот теперь она обновляется до второй версии. И суть в том, что это модель, которая взаимодействует с 3Dмерами, с метаврсами, с видеоиграми, то есть может вместо вас играть. Вот так вот и до геймеров нейросети добрались. — Стоп, стоп. Вы что это? И конфеты за меня есть будете — в наш Telegram-канал How to я, кстати дублированную в Нлапсе версию этого трейлера выложил, поэтому если интересно, можете посмотреть. Суть в том, что модель понимает, как взаимодействовать с окружающей действительностью. На основе Gemini она работает, например, в Майнкрафте либо No Man Sky, либо каких-то других играх. Симулятор козла там ещё в трейлере был. Короче, модель понимает, как взаимодействовать с миром. Модель может как-то стратегически думать, хотя говорят, что память у неё пока что достаточно урезанны, но всё равно она справляется с игровым процессом и как бы может принимать какие-то решения, понимать там, куда идти, какие жать кнопки, в общем, как с интерфейсом игры взаимодействовать. И относительно первой модели в два раза лучше она справляется с выполняемостью задач. Допустим, вот так я завернул, короче. в два раза лучше она задачи какие-то выполняет в игре. И почти до уровня человека она уже доросла. Единственная проблема - это, конечно же, то, что контекст она теряет и какие-то сложные комплексные задачи где-то по середине пути может забыть, потерять ход их выполнения и в общем не справится. Тем не менее, очень близко к уровню человека она подобралась. Наверное, профессиональные геймеры где-то там сильно выше, ближе к сотне подбираются, но 65 это очень хороший результат, как вы можете понять. Ну и суть в том, что вы можете как сами этой моделью управлять, то есть какие-то запросики ей закидывать, так и она сама может какое-то целеполагание себе придумывать, что в целом и отличает её от всего, что мы как будто бы до этого видели. То есть она может в новых играх как-то пытаться, как минимум ориентироваться, пытаться проходить их, какие-то э цели выполнять. И в целом не только относительно игр, даже это всё можно применять. Как пример, у Гугла есть такая классная моделька, как Gri. Где же она? Тут она

### [23:41](https://www.youtube.com/watch?v=4VemNQlxd98&t=1421s) Genie 3: создание 3D-миров

вот тут. И GN 3 - это модель, которая, если вы помните, создаёт 3D миры. То есть вот из там картинки, например, или текстового описания создаёт метаврсик. И вы по этому метаврсику можете как-то путешествовать. При этом оно там всё дегенерируется. И 3D, ёлочки, листики, иголочки, веточки, все дела. Красота. Так, и что же Сима 2 с этим всем добром делает? Она, в общем, понимает, понимает контекст, понимает, что там где происходит, и может управлять объектами внутри G3. И на самом деле тут есть даже более интересные примеры. Вот, например, Джиня 3 сгенерировала такой коралловый риф. Там какой-то вот скатик плывёт, как вы видите. Мы пишем, значит, да, что мы пишем? Подплывай к оранжевому кораллу слева. Вот оранжевый коралл слева прямо подплывает, классно понимает всё руки G 3 генерирует. И, ээ, модель дальше пишет, что, точнее, это уже Сима отвечает пользователю, что она доплыла. Пользователь пишет: "Оплыви-ка". И G 3 - это крутая модель с памятью, но тут вот немножечко лажание происходит такое. В общем, вместо ската уже, как вы можете видеть, некий камень образовался, но всё равно это какая да никакая память. Там бы могло вообще что угодно произойти в более ранних версиях модели. Теперь хоть что-то запоминается, хоть оно перестало быть живым, к сожалению. Наверх смотрим, сверху вот всё. И G 3 всё очень классно запоминает. Но интересно вот в этом всём то, что непонятно даже, как оно работает. То есть две модели работают в паре. И, э, по сути непонятно кто что определяет, то есть кто отвечает за генерацию чего, что тут первично уже, понимаете? Вот мы подходим к скамеечке, говорит юзер: "Повернись и посмотри на верхушки деревьев". Модель смотрит на верхушки деревьев, но она поворачивается. И в общем, э кто первостепенен-то тут? Э генерация от Джини, которая генерирует 3D мир, или Сима, которая даёт ей команду. И это достаточно реально мозговзрывательно. Тут такой тандем, который просто полуавтоматически, даже автоматически создаёт вселенный, которые, с одной стороны, и запоминаются благодаря Джине, с другой стороны, и дегенерируются благодаря командам от Симы, как будто бы, и командам от пользователя. И это реально сложный уже достаточно концепт, который как и то как будто бы может турбодетализированные крутые метаврсы создавать. Ну и это турбо интересная и при этом достаточно объёмная и сложная тема. И если вы хотите, я могу сделать ролик, наверное, с более подробным объяснением, что же тут, да и как работает. И если хотите, то, естественно, пишите в комментариях. Разберём и, в общем, разберём даже, как с помощью этого добра метаврсы делать. Вообще метаврсы как будто бы это тема, которая вот в конце двадцать пятого года на пике популярности становится, потому что всё проще и проще их генерировать. И не только благодаря Сим и Джине, на самом деле. Сейчас расскажу ещё про две турбокрутые модели, которые вот появились буквально на этой неделе и которые помогают нам 3D миры создавать.

### [27:12](https://www.youtube.com/watch?v=4VemNQlxd98&t=1632s) Marble: создание 3D-миров из фото

Во-первых, это Marble от World Labs. Я уже какое-то количество недель назад рассказывал про Marvel. Это крутая модель, но вот теперь она стала доступна всем. То есть вот каждый пользователь, каждый желающий может попытаться погенерировать в ней какое-то добро, какую-то красоту. Короче, да, понятно. Всё, что мы там себе представляем, воображаем, всё может стать реальностью. такой красивый трейлер, но на самом деле он по сути заслуженно такой красивый и заслуженно такой пафосный. Модель создаёт 3D-меры, например, из изображения либо из текстового описания и создаёт очень-очень детально их. Технология, с помощью которой это делается - это Gus and Plat или такие шлепки краски, можно говоря. представить это как обшлёпывание мазками краски такой объёмной какой-то краски, ну или плоской объёмной краски, каких-то объёмных фигур. Короче, достаточно передовая технология для того, чтобы какие-то 3D пространства или даже 3D-предметы, но сейчас, конечно же, в первую очередь пространство создавать. Несколько картинок загрузили и с помощью нескольких картинок генерировалось пространство. можно эдитинг делать, то есть там рестайлинг, менять цвета, текстуры. В этом направлении начинать как-то развиваться очень круто, потому что оно как для создания метаврзов, игр, локаций, там, для каких-нибудь фильмов подходит. И вот, в частности, мой профиль - это, конечно же, создавать, например, локации для фильмов. Очень классно. Можно создать такую 3D-локацию из нескольких картинок. Потом вы по ней двигаете камеру, делаете какие-то скриншоты, делаете просто скрин-локации, там врезали, вмонтировали персонажа, другой скриншот. И просто для того, чтобы стабильные помещения, стабильные локации у вас были, можно даже свои ситкомы делать. Всё это можно на marblewlabs. Попробовать. Ну и вот ещё прикольный пример того, что у вас тут может получаться. The no more fl. — Думаю, стоит добавить, что из самого интересного в этих гаусовских сплацах, именно то, что у них есть очень классная память. То есть после того, как такая-то часть сцены сгенерировалась, она такой и останется, в отличие от диффузионных генераторов, потому что диффузионные генераторы там перегенерируется, что-то там где-то зашумиться как-то может что-то где-то забыться. Тут же создаётся реально стабильная, стопроцентно стабильная 3D-сцена, которая после генерации никак измениться уже не может, только если мы как-то какой-то фрагмент перегенерировать будем. А ещё один интереснейший гаусановосплатовый сервис - это Deps Anything 3. Э, точно такая же

### [30:27](https://www.youtube.com/watch?v=4VemNQlxd98&t=1827s) Depths Anything 3

штука, которая только может это делать ещё и из видео. То есть вот мы взяли видеокамеру, снимаем просто там с дрона, да, видимо, как проходим по помещению. И вот что у нас после этого генерируется. Опаопаопа. Всё тут пролетает. И вы видите, каждая комната запоминается, создаётся. То есть это способ, с помощью которых можно отцифровывать помещение с точностью до расположения ручки на столе, короче, с настолько минимальным количеством усилий, что даже смешно становится. Взяли дрона, запустили или просто человека со стабилизатором в руке. Даже без стабилизатора, скорее всего, всё получится. Просто человек проходит с телефоном. Какая-то шпионская уже концепция получается, да? И 3D карта помещения у нас есть. В общем, очень классно, что оно такое вот появляется. Ну а далее убийца Хикслда. Убийца в кавычках, естественно, Nvido

### [31:27](https://www.youtube.com/watch?v=4VemNQlxd98&t=1887s) FlexFX

представляет Flex FX. Такая штука, которая, как Hixfield нам предоставляет доступ к различным пресетам, ко их там достаточно много. Стоит оно не дешевле, функций там меньше, поэтому в целом всё. А реально прорывное обновление у 11 Labs на этой неделе SCPE to real time. Вторая версия их спичту текстмодели.

### [32:04](https://www.youtube.com/watch?v=4VemNQlxd98&t=1924s) Scribe v2 от ElevenLabs

Короче, суперкрутая модель для того, чтобы живую речь, вот как я сейчас, превращать в текст, обгоняет всех конкурентов. Google, Open AI, Deep Gram. В общем, все позади. Новая планка индустрии. Оченьоченьочень быстро. Хотя и так в целом у нас всё быстро это работало, но теперь оно прямо, ну, с бешеной скоростью летает. 90 пс языков и задержка всего 150 мскунд. То есть это получается секунды. А возвращаясь к Хикслду, он

### [32:43](https://www.youtube.com/watch?v=4VemNQlxd98&t=1963s) Хигсфилд для маркетплейсов

выпускает достаточно забавный сервис, который отпугивает фотографа. У нас лопата есть, например, которую мы продаём на маркетплейсе. Берём, копируем, вставляем ссылочку на лопату. Она анализируется. Разные фотографии лопаты, все с маркетплейса, всё, в общем, суммарно анализируется и создаётся масса, тонна креативов, рекламы, UGC контент с людьми, пользователями, довольными. В общем, симулируется весь маркетинговый контент, который нам только может быть нужен. Ну или не нам, а вам. В целом, это можно было делать и раньше в том же Хикслде, но не через ссылочку, а теперь у них вот прямо вот это всё максимально удобно. Просто ссылку кинули, вам видосы генерируются. Ну и мой любимый сервис

### [33:35](https://www.youtube.com/watch?v=4VemNQlxd98&t=2015s) Обновление Reve AI

Revi тоже классно обновляется. И теперь в нём можно создавать стили. Вот у нас есть ёжик, например, да? После этого можем выбрать reference literal, то есть прямо вот то самое, либо inspiration, то есть что-то не похожее, просто вдохновиться тем, что мы видим сейчас. Затем модель теперь есть fast, есть обычная, то есть медленная, которая покачественнее генерирует. Aspectration, соотношение сторон, количество изображений, господи, а то я с ума сходил последнее время. Оно, ну, конечно, из плюсов там можно просить: "Рева, сгенерируй мне две картинки, одну или три". Она это делает в отличие от нанобана, в отличие от всех. Господи, Рева такой классный делают интерфейс нам. Я очень сильно за это люблю это приложение. Не перестану говорить. Для людей оно сделано вот что нужно, как хочется использовать, то там нам и дают. В отличие от всех конкурентов, тут создатели реально понимают нужды пользователей. Все эти настройки можно по умолчанию как-то сохранить. То есть я, например, обложки для Ютюба часто делаю с помощью Рева. И вот 169 там 2тчетыре, кстати, три теперь нельзя, хотя изначально рева по три всегда генерировало. В общем, можно теперь пресетик такой сделать, чтобы всегда получалось то, что мне нужно. И второй обожаемый мною сервис для работы

### [35:00](https://www.youtube.com/watch?v=4VemNQlxd98&t=2100s) Recraft: точная настройка цветов

с изображениями обновился. Recraft - это лучшая нейросеть для генерации векторных изображений. Теперь, э, добавляет точечную настройку цветов. То есть мы берём, выделяем там какой-то фрагмент и меняем ему цвет. Классно, раньше не было, теперь есть. Замечательно. Помимо

### [35:19](https://www.youtube.com/watch?v=4VemNQlxd98&t=2119s) Улучшенный Pixverse

этого обновился и Pixвс. Pix, между прочим, это одна из лучших моделей для генерации видео, если вы не знали. Точнее, это сервис, но у них есть там парочка моделей, которые занимают очень внушительные места на арене нейросетей. И вот такой вот модифаинг у них теперь можно проводить. где этого только нету, я, честно говоря, ещё не пробовал, так что пишите в комментариях, если попробовали. Я надеюсь, что это качественно работает, потому что в комментариях видел, что работает оно неплохо. Но пока что, конечно, это вот тот аспект фронтирный, то есть передовой аспект генерации видео, который уже во многих сервисах есть, но нигде ещё идеально не работает. Ну или хотя бы приближено к идеальному. Короче, везде артефактики есть, какие-то несовершенства. проглядывают, поэтому пишите, если тестили Pixвер, ну, а я потестирую, наверное, расскажу в следующем выпуске новостей. А ноды в

### [36:13](https://www.youtube.com/watch?v=4VemNQlxd98&t=2173s) Ноды в Krea AI для всех

Crea AI теперь доступны всем. Но, естественно, это передовой способ, как мы можем генерировать графику, картинки, видосики, липсинки, тридшки. Вообще очень хорошо, что это везде сейчас появляется. Это всё можно в API обернуть. И теперь каждый может этим в Cre AI пользоваться. Ну и новая фишка

### [36:44](https://www.youtube.com/watch?v=4VemNQlxd98&t=2204s) Новые LoRA для Qwen Edit

будто бы появляется у нас в ближайших выпусках новостей. Уверен, ещё не раз я расскажу про новые лоры для Quen Edit 2509. Ну, может, там уже скоро не 2509, а какая-то новая версия выйдет. Но в любом случае лоры на неё появляются. И сейчас появилась лора для создания текстуры, а точнее не создания, а экстракции, то есть выделение текстур из изображений, которые вы загружаете. Кинули картинку с камнями, получилась текстура камней. Кинули картинку с берёзами, получилась такая, ну, немножко странная, но текстура берёз. На хаing Фейсе можете найти экстраracture Quen Image Edit 2509. А вторая лора называется This person или этот объект, это персона. советуют начинать промт как раз-таки с такой формулировки. Эта персонали этот объект, и нужно оно для инпейнтинга. То есть берём картинку с лицом, берём картинку, где выделяем фрагмент, который нужно заменить, и это лицо, точнее владелец этого лица появляется в этом фрагменте изображения. Тут, как вы можете понять, вот сравнивается пример без лоры и с лорой. То есть работает с Лорой, оно, конечно же, лучше. Ещё пример без Лоры, где оно как-то не очень вписано, и с Лорой, где вписано намного лучше. И вот такие ещё примеры есть, например, с тортиком. Короче, хорошая лора для того, чтобы органично интить и вписывать ээ в одни изображения объекты из других. А последняя новость у нас достаточно

### [38:13](https://www.youtube.com/watch?v=4VemNQlxd98&t=2293s) ИИ, который "воскрешает"

неоднозначная в плане морали. Воскрешалого происходит у нас такая штука, как two позволяет воскрешать ваших родных. В трейлере, например, женщина говорит с почившей, судя по всему, мамой своей. В общем, как бы это всё печально не было и как бы они нам на жалость не давили. И вот он говорит уже и продолжает говорить, в общем, сумасшествие какое-то немножко была такая серия чёрного зеркала, да, и непонятно, кончится ли это добром или нет. Хорошо, что философские вопросы хотя бы поднимаются в популярных сериалах, которые мы смотрим. И, ээ, кто-то понимает, к чему быть готовым, но кто-то точно нет. По мне, технология - это, конечно же, бредовое немного. Для того, чтобы оно работало хорошо, надо, ну, супердетальную создавать цифровую копию личности, чего мы сейчас, наверное, пока что сделать не можем. Ещё и при жизни надо человека так отцифровать, получается. А может быть, там и самосознание у него зародится. Это уже ещё и более интересная теория. В общем, э, проверять я её, пожалуй, не буду. В такое вот будущее мы попадаем с каждым

### [39:24](https://www.youtube.com/watch?v=4VemNQlxd98&t=2364s) Итоги

днём всё дальше и дальше куда-то нас уносит технологический поток реки, поезд, что-то нас куда-то точно несёт. И всё дальше мы от какой-то адекватной, обычной, нормальной жизни какое-то сумасшествие происходит, воскрешаем уже мёртвых. Но что-то мне вообще не припомнится, чтобы было хотя бы одно произведение, где воскрешение мёртвых заканчивалось хорошо. На такой вот неоднозначной ноте выпуск подходит у нас к концу. Напоминаю, что скоро у нас стартует спринт по вайб-кодингу, где мы 5 дней будем в турбоплотном режиме общаться и создавать проекты, разбирать тонкости, нюансы. Короче, дядя Д, я думаю, вам всё уже рассказал. Итак, ссылочки вы найдёте в описании. Будет очень интересно, поэтому записывайтесь. пока мы не подняли цены. И ещё, конечно же, ставьте лайки, комментарии, подписочки, колокольчики и увидимся на следующей неделе. С вами был Игорян и дядя Д. И продуктивный совет. Мы и каждое воскресенье выпуск новостей. Короче, вы всё и так знаете. Пока.

---
*Источник: https://ekstraktznaniy.ru/video/15532*