Новости ИИ: OpenAI объявила Красный Код, Загадочный Grok-4.20, Горячие обновы в ИИ-видео

39:34

Новости ИИ: OpenAI объявила Красный Код, Загадочный Grok-4.20, Горячие обновы в ИИ-видео

Продуктивный Совет 07.12.2025 20 190 просмотров 515 лайков

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

Новости нейросетей: OpenAI объявляет «Красный код». Сэм Альтман мобилизует все ресурсы, чтобы не уступить лидерство, пока DeepSeek бьет рекорды математических бенчмарков, а Google выпускает Gemini Deep Think в открытый доступ. Amazon вступает в гонку железа с чипом Trainium3, Альтман ведет переговоры о покупке ракетной компании, а стартап Poetic ставит рекорд в ARC AGI. Все главные новости мира нейросетей, искусственного интеллекта и технологий — в новом выпуске! Если вас интересуют нейросети, gpt 5, Claude и всё, что связано с ИИ, этот ролик – ваш универсальный гид по последним трендам нейросетей. Погнали! 🎄 Конструктор сайтов Cпейсвэб - https://sweb.ru/site-constructor/ai/?utm_source=youtube&utm_medium=constructor&utm_campaign=ProdAdvice - со встроенным ИИ. 🌐 ИИтоги 25 – запись на конференцию – https://entropy.talk/iitogi25/?utm_source=how2ai_yt&utm_medium=social&utm_campaign=iitogi25 👍 Арена 3D нейросетей - https://www.top3d.ai 📚 Поток по созданию ИИ Видео уже 15 декабря - https://t.me/how2ai_bot?start=dl-1765093009156458bb1a74 #новости #нейросети #технологии тайм-коды: тайм-коды: 00:00 – Интро 00:37 – Красный код OpenAI и Garlic 03:35 – Mistral 3: новый флагман 06:55 – DeepSeek-V3.2: золотая медаль 08:52 – Китайские гиганты обходят санкции 09:29 – Amazon представила чип Trainium3 10:30 – Модель Amazon Nova 2.0 11:45 – Альтман хочет свою ракету 12:45 – Grok 4.20 и трейдинг 13:41 – Оптимус побежал 13:47 – Gemini 3 Deep Think 14:33 – ИИтоги 25 15:30 – Google Workspace Studio 16:26 – Щедрый Google и лимиты 17:08 – Anthropic покупает Bun 17:34 – IPO Anthropic 18:13 – Они обещали упростить 19:03 – Poetiq побила рекорд ARC-AGI-2 20:15 – Новости креативных ИИ 20:33 – YVO3D версии 2 24:06 – David от Runway 25:12 – Pixverse 5.5 и звук 26:03 – 5 обновлений Kling 29:52 – Flora Fauna AI 30:09 – STARFlow-v от Apple 30:36 – Studio Mode в Gamma 31:02 – Recraft: логотипы и формы 31:19 – Seedream v4.5 от ByteDance 32:32 – Krea и Runway Эп билдер 32:54 – Что с Flux 2? 34:22 – 3D Point Tracks 35:08 – Live avatar Alibaba 35:25 – 11 Labs Reader 36:25 – Marengo 3 понимает видео 37:10 – Дизайн агент на Qwen 38:08 – Немного паранойи: AI очки Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link Тг How2AI – https://t.me/How2AI Тг чат How2AI – https://t.me/how_to_AI Тг Креативный Совет – https://t.me/creadvice 🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d

Оглавление (36 сегментов)

Интро

Уa очень большие проблемы, и вот как компания намерена их решать. Самое загадочное LLM этой недели. Грок 420. Сэм Альтман намерен производить ракеты. Ухты обновлений от видеогенераторов Runwayй и Клин. Адик наконец-то обновляет свои модели, и это круто. Люди-роботы, привет. Это Продсовет. Меня зовут Дядя Д. Все самые интересные и важные новости в мире неросетей искусственного интеллекта для вас собрали в этом выпуске. Подписывайтесь, чтобы поддержать наш канал, оставляйте лайки, комментарии.

Красный код OpenAI и Garlic

Погнали. Ну, разумеется, начнём с того, что Open Aua в огне, ну или в красном цвете. Красный код объявляет компания, потому что конкуренты очень и очень сильно наступают Open AA на пятки. Сэм Альтман во внутр Сэм Альтман во внутреннем письме своим сотрудникам рассказал о том, что компания объявляет красный код мобилизация всех ресурсов на то, чтобы улучшить чат GPT, а именно интеллектуальные способности моделей. Open хотела развивать разные продукты, направления, всякий пользовательский опыт, но после того, как вышел Gemin 3 и показал, что можно просто выбивать бенчмарки по математике и все остальные Open немножечко расстроились. Итого всякие и агенты, пульс, тот, про который вы, возможно, слышали, а, возможно, нет, абсолютно какая-то забыта, странная фича. Всё это отходит на второй план. И на следующей неделе, по заявлениям инсайдеров, нас ждёт новая reasoningмодель. А в начале двадцать шестого года запланирован запуск революционной модели под кодовым названием Garlic, то бишь чеснок. Вероятно, это будет какой-нибудь GPT 5. 5 или GPT6 вообще. Про Gardliлик нам известно вот что. позволяет упаковывать знания больших моделей в значительно меньшей архитектуры. Превосходит Gemin 3, Opus 4,5 во внутренних тестах по кодингу и рассуждениям. Помимо того, что будут прокачивать lm направления, конечно же, нужно что-то делать с генерацией картинок, потому что нано банана Pro абсолютно разрывает интернет и забирает вообще все лавры от там какого-то джена чат GPT, про который многие, в общем-то, уже забыли. Это тоже становится критическим и приоритетным направлением по словам Альтмана. Ну и в общем-то вот. Ждём больших и интересных обновлений от Openay. И вот уже The Verge нам сообщает, что у нас следующей неделе будет GPT 5. 2. То есть вот эта вот модель, про которую говорили the information ещё в самом начале этой недели. Статистика по скачиваниям и пользованию тоже, суд по всему, нам говорит, что это не пустые слова и не пустые ээ опасения со стороны компании. Глобальная база активных пользователей чат GPT выросла всего на 6% с августа по ноябрь двадцать пятого года. Дemней, в свою очередь по пользователям, вырос на 30%. И, конечно, тут Нанобана сыграло большую роль. Время, проведённое в Gemine, удвоилось, а в чат GPT упало на 10% в ноябре. Возможно, это связано с тем, что, в принципе, народ чуть меньше использует в новогодний период, ээ, все эти нейронки, какой-то уже такой предновогодний вайб у людей и сотрудников компаний. Но опять же, по статистике Gй-никак растёт. С другой стороны, там и в принципе было меньше пользователей. Напишите в комментах, что вы думаете, сдувается ли Open AI, пропала ли компания и у нас теперь тотальное доминирование гугла или всё-таки Альманс сейчас там где-то что-то подкрутит, и вновь чат GPT

Mistral 3: новый флагман

будет впереди планетой всей. Но ситуация определённо непростая, учитывая, что и openсоourсные ребята тоже не стоят на месте и потихонечку выкатывают разные интересные апдейты. Мистрал выпускает 3 на этой неделе. не только MRAL 3, но ещё разные э маленькие версии этой модели: 3B, 8B и 14B. Вот тут можете посмотреть на статистику сравнения с openнсорсными конкурентами. Страл показывает себя, в общем-то, неплохо. И в ряде доменов модели действительно очень круто себя перформят. Я как регулярно это делаю. Добавлю вам ещё такой benchmark. Вот это, собственно, то, что нам сотворил ээ Mistral 3. А это то, что сотворил Mistral 3 млрд параметров. Маленькие модельки всё-таки, конечно, ещё не способны делать то, что способны большие, но чего от них и ждать. Однако, что интересно, вот эта моделька Mistral 3 B маленькая может работать на webGPU. И вы прямо можете зайти на сайт, вот тут вот всё ей, э, разрешить, нажать Start Live and Caption, и, в общем-то, всё работает локально. И модель является мультимодальной. И тут она должна в какой-то момент, когда всё загрузится, начать меня видеть и даже со мной на мои вопросики разнообразные отвечать. В нашем Telegram-канале я ещё один такой вайб-чек провёл по Мистралу и попросил нагенерировать мне анимированную рок-банду. И получилось, на самом деле, у Мистрала достаточно хорошо. Вот он у меня последний в тесте. Лучше, чем то, что мне сделали новые версии Дипсика. Но пропсик после короткой рекламной паузы. Opena объявляет код красный. Anтроopic покупает баннер ради скорости. Deeps оптимизирует свои модели. Видите паттерн? Всё упирается в скорость и эффективность. И если вам нужно сделать что-то быстро, например, запустить сайт, сейчас самое время использовать и для этого. Это выпуск при поддержке Space Web, российского хостинг-провайдера, который встроил EИ прямо в свой конструктор сайтов. И это не маркетинговая фишка, а реально рабочий инструмент. Вот как работает. Вы отвечаете на несколько вопросов о своём проекте или бизнесе, и Нейросеть за пары минут генерирует вам готовый сайт с уникальным дизайном и наполнением. Не заготовки, не шаблоны, как у всех, а именно под ваши задачи. Дальше можно редактировать что угодно прямо в интерфейсе. Можно попросить иишку переписать текст, сгенерировать изображение, настроить структуру страниц. Кстати, никакого кода, никаких специальных знаний не требуется. При этом сайт сразу оптимизирован под SEO. и адаптирован под любые устройства, от десктопа до смартфона. С этим вам не нужно даже заморачиваться. Что нравится в подходе Space, они не пытаются продать вам что-то сложное, дорогое. У них есть полностью бесплатный базовый тариф для старта. Если нужно больше функций, то тарифы заметно дешевле, чем у большинства конкурентов. Плюс есть 30 дней бесплатного тестового периода на любом тарифе, чтобы вы могли всё попробовать без рисков. Если вы давно думали запустить свой проект, лендинг, даже интернет-магазин, но откладывали из-за недостатка знаний или дороговизны или сложности, то самое время попробовать. Ссылка на AI constructor Space We находится в описании под видео. Зайдите, потестируйте. Это даже проще

DeepSeek-V3.2: золотая медаль

чем вайpкодинг. Всё быстро, удобно, без головной боли. Итак, Deepsek версия 3. 2. Э, золотая медаль по математике и вообще тотальные крутейшие показатели по ряду бенчмарков, которые в первую очередь именно связаны с математикой. Показывает схожие результаты с GPT5 и с Geminiate 3. Открытая, напомню, openсорсная модель компании, у которой есть определённые сложности с тренировкой модели, потому что есть ограничения по видеокартам, но тем не менее она показывает крутейшие результаты. в этот раз выходит в двух версиях: Deepsic V3. 2 спешали и deepsic v3. 2 thinking. Использовали Deepsek Sparse Attention, новый механизм внимания, который специально оптимизирован для длинноконтекстных сценариев и обеспечивает работу с большим количеством информации. Требуется меньше вычислительных затрат, а работает лучше. Вот тут вновь, э, сравнение с другими компаниями, с другими моделями по бенчам. где-то, конечно, уступает, но вот ещё разочек на математике, на олимпиаде по математике 25, в общем-то, является полным топом. На Humanity Last Exam тоже абсолютно сумасшедший, крутейший результат в 30%, лучше, чем GPT 5 High. Однако, как уже говорил выше, я затестил эти модельки на своём вайпчеке. Вот что мне сгенерировал, по-моему, Dipsic V3. 2 обычный. Вот что мне сгенерировал спешали. Ну, по крайней мере, это первая рокбанда, которая выступает на Open Airре. В SVG формате от lлэмки я получил такой результат. Ну, в общем-то, прикольно. Спешали думает сильно-сильно дольше. То есть, если вы будете использовать её через, может, special это называется через API, у неё прямо больше токенов расходуется на ответ. И в целом ответы получаются объёмнее. Так что учитывайте этот моментик. Для простых задач в этом смысла нет, но для каких-то сложных, где

Китайские гиганты обходят санкции

нужно прямо порассуждать, модель будет работать круто. Ну и как, собственно, Китай справляется с тренировкой моделей, а в офшорах у них всё это тренируется. Как выясняется на этой неделе, доступ к Nvidia Q2 ограничен, хоть и DPC, судя по всему, успел там накопить приличное количество этих видеокарт, другие китайские компании этим похвастаться особо не могут. Поэтому ребята просто на договорах аренды оффшорных дата-центров, которые принадлежат ней китайским структурам, тренируют свои лмки. Где-то в Юго-Восточной Азии с страны по видеокарте натаскали и натренировали.

Amazon представила чип Trainium3

Судя по всему, так работает Alibab, так работает BДce. В видеокартах и вычислительных мощностях, кстати, нарастает конкуренция. Amazon на этой неделе выходит с чипом траниум 3. Наверное, так это произносится. Говорят, что хотят подтеснить Nvidю на рынке ИА инфраструктуры. Это новый трёхнанометровый техпроцесс, четырёхкратный рост производительности и памяти при сокращении энергопотребления на 40%. Каждый ультрасервер вмещает 144 чипа, а 1. 000 систем могут объединяться для создания кластеров до 1 млн чипов. раниум 3. Seo Amazon, кстати, говорит, что текущее поколение чипов уже достиглому тибиillon revenue. То есть это гигантский бизнес, который зарабатывает сумасшедшие деньги на AD AWS Bedrock. Основной клиент, между прочим, Anтроopic. Ну и, судя по всему, это подешевле, чем работать э на чипах Nvidia. И, кстати, Amazon объявляет уже о том, что у них четвёртое поколение

Модель Amazon Nova 2.0

этих чипов тоже где-то там разрабатывается, готовится, но конкретных дат, анонсов пока нет. Не только РДУ Amazon выпускает, но и саftну, если можно так назвать. Nova 2. 0 возвращается в игру. В принципе, Amazon со своей ээ обновлённой моделькой. Вот так вот она прыгает по индексу интеллекта от Artificial Analysis. И это много, это что-то в районе тридцати, даже чуть больше, э, пунктов. Это хороший, большой результат. чуть-чуть где-то уступает. Ну, то есть находится на уровне там Грок 4, колот 4,5, уступая, конечно, вот прямо текущим лидером вроде Gemin 3, но агентных способностях, вот на всех этих там Tben Bench Telecom и ifBench, которые оценивают то, как модели справляются с разными инструментами, с разными сложными долгими агентными сценариями, очень хорошие результаты 93%, например, на том же Тбнче. И, кстати, несколько версий моделей. Есть Nova 2, есть Nova 2 Lite, а есть ещё Нова Nova 2. 0 Omni. Это одна из немногих моделей, которые также, как и модельки Джеминой, могут воспринимать и видео, и аудио, и изображения. И вот на всём этом в качестве контекста давать вам ответы. Стоит подешевле, опять же, чем конкуренты. 1,25 на inпут и 10 долларов

Альтман хочет свою ракету

на аутпут за миллион токенов. В общем, достаточно бодро. Полный Star Wars разворачивается в инUS. Все хотят, во-первых, запустить что-то туда, в космос, потому что там солнечная энергия рядом, там можно вот это вот всё как-то использовать. Ну и Open не исключение. Оказывается, на протяжении лета и осени двадцать пятого года Альтман вёл переговоры с некой компанией под названием Stoke Space. это производители ракет и хотел выкупить компанию последовательное вложение в акционерный капитал сумма которого должна была составить миллиарды долларов и обеспечить контрольный пакет у Альтмана в руках SpaceX, например, под руководством Маска планирует развивать спутники Starlink V3 как датацентры для приложений Безс ээ там со своим Blue Origin Sundar P также в общем-то к этим орбитальным датацентрам немало интерес выказывают и высказывают, но это не

Grok 4.20 и трейдинг

единственный способ, назовём это getхай. У Илона Маска есть другой гроб 4. 20. Именно так называется будущая модель, мистическая модель, которая показала очень интересные результаты на финансовом бенчмарке. Есть какой-то бенч, который оценивает, как модели справляются с тем, чтобы зарабатывать деньги. мы, видим, в какой-то виртуальной среде, торгуя на рынке и вот здесь, собственно, получая какой-то доход на свою торговлю. И вот была мистическая модель на этом бетче на прошлой неделе, которая по словам Илон Маска, в общем-то, вот он раскрыл все карты. Это грок 420. В общем-то, никакой информации дополнительной о ней нет. На что оно способно, ээ какие у него там будут показатели, в чём она хороша или плоха. Грок 4. 1 быстренько этот релиз забылся, улетел куда-то в небытие. Ну вот сейчас подождём, что он будет на следующей неделе. Видимо, будет

Оптимус побежал

и GPT2, и Игрок 420. А ещё Оптимус побежал. Вот так вот научила Тесла

Gemini 3 Deep Think

бегать своего Оптимуса. Всё. Geminite 3 Deep Think стал доступен всем обладателям лишних 250 долларов в месяц. Подписчики EAI Ultra теперь получают доступ к этой модели. Это сумасшедшая, невероятно умная, мощная модель, которая золотую медалью на IMO и ICPC забирает. И здесь она использует параллельное мышление для изучения множественных гипотез одновременно. И это прямо супер эффективно для сложных математических задач. И неспроста на них Джемина очень круто себя показывает. Этот графичик вы уже видели. Это из релиза Gemin 3, но тогда deepН не был доступен никому или вот только там каким-то учёным, ограниченному кругу. Сейчас доступен

ИИтоги 25

тем, кто готов вот за этот интеллект заплатить. Очень интересные релизы мы наблюдаем от компании под конец этого года. И в принципе год выдался чертовски насыщенный, и индустрия претерпела некоторые изменения. Что это за изменения? Что нужно знать сейчас? О чём нужно думать, входя в 2026 год? Вот про это всё опытные эксперты из разных слоёв A-индустрии расскажут на конференции и итоге 2025 года. Организаторы провели очень тщательный отбор, собрали действительно крутейших экспертов, хедов, топов, CTO, различных стартапов, людей, которые в разработке, в эмэле уже десятки лет. И даже меня туда пригласили, за что им спасибо. Я тоже там проведу один небольшой трек. Приходите на конференцию. участие бесплатное, если выполнить ряд условий. Но если захотите конференцию поддержать, то можно за контент и заплатить. Ссылочку на конфу я оставлю в описании

Google Workspace Studio

этого ролика. 23 декабря встречаемся там. Ещё парочку интересных обновлений Гугла. Workspace Studio выкатывает платформу для создания иагентов без кодинга на базе Gemine 3. Идея простая: быстренько всё вот там вот накрутили, соединили, объяснили и агенту выдали и агенту доступ к разным сущностям этого воркспейса, там к чату, к календарю, драйву, Гмейлу. Описали какой-то процесс или автоматизацию, которую вы хотите, чтобы он выполнял, и он выполняет. Э, есть такие же похожие штуки. Microsoft экосистема, я точно знаю, но вот такая сейчас вещь появилась у Гугла. Если вы вот в этом Worркспейсе как-то что-то создаёте и работаете, то может быть полезно. Но лично я топлю за какие-то решения, которые open sourceные и позволяют вам вообще соединять ээ всё в рамках разных экосистем, например, Nat. Кстати, ролик интересный про N на этой

Щедрый Google и лимиты

неделе у нас выходил. Если не видели, то гляньте. И чуть-чуть Google расщедрился в антигравити. Чуть-чуть они расширили лимиты. Для подписчиков Pro и Ультра там приоритетный доступ, самые щедрые лимиты с квотами и скоростью, которые 5 часов обновляются. А для пользователей бесплатного тарифа просто перешли на более высокие еженедельные лимиты, но всё равно достаточно строгие лимиты будут вот в рамках там каких-то там 5 часов или часа. То есть ты много запросов не сделаешь, но как бы на на горизонте недели чуть-чуть дышать стало более свободно. Ну о'кей, я немножко попользовался антигравити. Мне, честно говоря, он понравился мало. Какой-то он забагованный, что-то где-то не отправляется, вылетает, не отвечает. В

Anthropic покупает Bun

общем, сомнительно, но о'кей. Antropic покупает бан. Вот такая неожиданная новость. Это JavaScript Runtime analog nexts, насколько я понимаю. Очень крутой инструментарий и менеджер пакетов, который позволяет прямо очень быстро-шустро разработчикам JavaScript Type Script ээ работать. Судя по всему, кДкод сильно забенефитил от

IPO Anthropic

бана, и неспроста они решили это всё в свою инфраструктуру добавить. И более того, есть вероятность, чтороopic ещё и на IPO выйдет раньше, чем Open AI. Напомню, Open AI намеревались стать публичными где-то там в двадцать седьмом году, но вот Financial Times говорит, что антроopic уже в двадцать шестом году может подсобраться и, в общем-то, бодро обойти здесь на повороте Opena A тоже. Последнее время Opena A что-то всем даёт себя обойти. Годовой доход к этому моменту уже хочется антропику довести до 26 млрд долларов США и, как сообщается, рассчитывать на оценку свыше 300 млрд долларов, что, в принципе, при таком доходе, да, не то чтобы уж сверх

Они обещали упростить

какие-то космические деньги, но с другой стороны ещё и на прибыль надо бы посмотреть. Ну и под конец забавное. Помните, GPT 5 явился к нам с таким тезисом: больше не будет вот этого кошмара с разными моделями. продолжает и Open AI, и Курсор, и, в общем, все подряд выпускать очередные гайды отдельно о том, как новая модель кодекс должна работать ещё лучше в их инфраструктуре и среде, и как её нужно использовать. И сами эти модели кодекса вот приобрели просто какой-то кошмарный катастрофический вид с точки зрения своих вариаций. Ээ, ну это да, это скриншот с курсора. Кодекс maxни, max, maxra high. Это просто какой-то мрак, друзья. Но вот сейчас так вот выглядит курсор и такой набор моделей GPT 5. 1 у

Poetiq побила рекорд ARC-AGI-2

вас есть. Упростили? Так, упростили. Ну и под завершение неожиданно некоторая компания поэтик, которая основана выходцами из Deepmind, взяла и вот так вот за пару дней тройку после выхода Gemine 3 ээ ушатала Arc AJI2 и достигла 54%. На этом бенчмарке они сделали какую-то метасистему, которая прикручивается к любой модели очень и очень круто. И, главное, более дёшево размышлять над эти над задачами RKJI и давать более классный результат. Geminate 3 45% и 77 долларов на задачу поэтик достигает 54% точности и всего 30,5 долларов на задачу. Это даже не какой-тонинг, это вот метасистема, которая, как они говорят, learned test time reasoning выполняет. В общем, катастрофически бодрая неделя с интересными релизами, такими глобальными, фундаментальными и с интересными подходами к тренировке моделей. Я думаю, много чего прорывного мы увидим и под канун Нового года, и в будущем году. Поэтому оставайтесь на связи и смотрите наши выпуски. Обо

Новости креативных ИИ

всём расскажем. А теперь вызываем Игоряна. Люди-роботы, привет. С вами как всегда Игоряна. Это новости креативных нейросетей последней недели. И начнём мы с релиза, который на самом деле был неделю назад, но я его пропустил. А релиз, между прочим, очень интересный.

YVO3D версии 2

IVA 3D версии 2 вышла. И это генеративная модель, которая генерирует 3Dмодели, да, модель для моделей. И отличительной чертой её является, ну, сумасшедшая детализация. То, как она прорисовывает текстуры, ну, это действительно впечатляет. И разрешение она поддерживает до 8к целых. Это, насколько мне известно, первая вообще модель с разрешением 8К, но могу ошибаться, поправьте в комментариях, если так. Очень впечатляющие, конечно, результаты она выдаёт. А если вам интересна тема 3D и вы не хотите упускать новые релизы, то я нашёл очень крутой сервис, который называется Top 3D AI. И суть максимально проста. Он закрывает нашу огромную боль. У нас есть арены для сравнения моделей, которые генерируют картинки. текстовых нейросетей, видео нейросетей, а вот для сравнения 3D нейросетей я что-то ничего не припомню. Так вот, топ 3D, как и понятно из названия, составили топ лучших нейросетей. На самом деле они не составили его, они составили базу, а распределение по топу уже формируется на основе того, как мы с вами, то есть пользователи, будем голосовать в слепых сравнениях. Вот, например, у нас есть промпт, компью, фотография компьютерной мышки, да, и вот как оно сделалось. Но тут, на самом деле, оба результата не впечатляющие. СМ 3D против M6 обе не лучшие модели, а тут вот, например, штаны. И, очевидно, правый вариант сильно лучше. Правый вариант вообще очень, кстати, впечатляющий. Смотрите, какая текстура у этих строб. Даже внутри они в целом неплохо сделаны, на самом деле. Такие вот модельки. Короче, до бесконечности можно это дело сравнивать друг с другом. Вот хорошие результаты прямо. И также тут есть compare mode, то есть если вам нужно какие-то две модели сравнить, то вы можете выбрать из списка. Ну вот, например, самые лучшие, что я знаю - это, например, IVA 3D 2. 0, о котором я только что рассказал, и Ньюan 3D. И можно прямо на конкретнейших примерах посмотреть вот как они робота сгенерировали. Ну, посмотрите, какая сумасшедшая детализация. Просто очень круто. И Han 3. 0 тоже неплохо делает. То есть тут намного более детализированные, более шероховатые получаются текстуры. Тут же что-то более идеальное. И в случае робота, на самом деле такого глянцевого, полированного робота, Ханьюан, по мне, даже справляется получше. В случае же дерева. Ну, тут вообще без вариантов, конечно, выигрывает Ива. Просто посмотрите, какая текстура у этой коры. Ну, это сумасшествие. Очень крутая модель. Ньюан тут однозначно проигрывает. Ну и на основе слепых сравнений, как и на других аренах, формируется лидерборд, где сейчас с отрывом выигрывает IVA 3D 2. 0, затем идёт Нюанan 3. 0, ну и так далее. Найти топ 3D AI сможете по ссылочке ww. topd. ai. На всякий случай продублируем её в описании под роликом. Рейтинги формируются на основе наших с вами отзывов, то есть можно ставить оценки в разных категориях, писать рецензии и так далее. А если перейти вовнутрь модели по кнопке Learn, то тут вы найдёте всё, что нужно про эту модель. И отзывы, и результаты генерации, и даже промокодики на скидки на подписку на этот сервис. Далее, то есть просто переходим Go to the Website и тут уже дальше пользуемся IVA, платим подписочку и так далее. Ну а теперь к самым актуальным новостям. Вы наверняка слышали, что на арене

David от Runway

Artificial Analysis появилась неизвестная модель Visper Thunder aka David. David, который уделывал Google Veo 3, Veo 3. 1 CL 2 Turbo и 42 Pro, короче, просто уделывал всех, причём с достаточно приличным отрывом. И этим Дэвидом оказался Rwayen 4 с поно. Модель получилась вроде как действительно хорошая. Я её, честно говоря, не тестировал и чуть позже объясню, почему. По результатам она действительно обгоняет предыдущих конкурентов. И помимо качества генерации, на самом деле, всё-таки ничего суперпровного тут как будто бы и нету. Это, если что, были примеры старых поколений ранове. И вот к концу видео оно доходит до ген 4,5. Есть прямо хорошие, впечатляющие, конечно, генерации. И если у вас есть подписка runwayй, то для вас это, конечно, шикарная новость. Но релиз был просто уничтожен в инфополе. Во-первых, в тот же день, за час до релиза runwayя вышел

Pixverse 5.5 и звук

Pix 55. А Pix, я вам напомню, это достаточно крутая модель, которая прямо вот под VO3 по LS corруu почти такой же результат. Runway Gen 4 там вообще вот на тридцать первом месте был. И теперь они выпустили модель, которая генерирует картинку вместе со звуком сразу же. То есть прямой конкурент VO3. Также такая фича, как мультишот Generation, у них появилась. То есть по одному промпту сразу несколько планов можно сгенерировать, но в остальном просто лучше, выше, сильнее. Всё-таки всё это ещё не модель следующего поколения, а лишь точка п и в случае равей. А реально прорывная неделя в сфере видеогенерации выдалась у Клинга. Клинг - это и так была одна из лучших моделей

5 обновлений Kling

для генерации видео. Теперь они как будто бы прямо с отрывом всех обгоняют, потому что на этой неделе они сделали 5 дней релизов. В первый день они выпустили КLН омни или клин О1. Про неё я, кстати, сделал отдельное видео, но коротко это модель, которая как нанобана понимает человеческий текст. обычную разговорную речь и с помощью этой разговорной речи может редактировать видео. И в отличие от всех конкурентов, делает она это очень и очень хорошо. Количество артефактов минимальное. Зацените, какой идёт, да, оранжевый. По сути, это модель для инпейнтинга, аутпейнтинга. стайлинга, апскейлинга, кородину не апскейлинга, но всего остального вообще, что можно с видео делать. Хотя, по сути, и обскейлить его можно, и восстанавливать какие-то старые повреждённые видео тоже можно, хоть всё ещё, естественно, не идеально, она лучше конкурентов, но артефакты, как я уже сказал, есть. Во второй день они выпустили O1. По сути, это нанобана, но для фото, короче, примерно то же самое. Работает она достаточно хорошо, хоть и похуже, чем Nan Banana Pro, тем не менее, может хорошо создавать изображения других ракурсов. Вот раскрашивать здания, как и Нанобана Pro, переодевать людей, делать вот другие ракурсы, как я сказал, что, наверное, самое полезное для генерации видео. Короче, свою функцию модель точно выполняет. Третий день они выпустили видео 2. 6 - это следующая модель, которая напрямую конкурирует с RВ 4,5, с VA 3. 1. И действительно, очень хорошее впечатляющее качество. И в отличие от Runway 4,5, тут есть звук. Русскай речи, правда, тут, к сожалению, нету, поэтому мимасы поделать не получится в клинге. Тем не менее, ну, огромное количество функционала нам навалили на этой неделе, и это только третий день. На четвёртый день они выпустили клинк Аваat 2. 0. И это прямо прямой конкурент Хайгена, потому что качество очень хорошее. LipsН прекраснейший, количество артефактов тоже маленькое. А на пятый день они выпустили Element Library. В целом, тут уже ничего интересного нету, но вот четыре прошлых дня - это, ну, сумасшедшее количество обновлений. Очень крутые нам подарки в декабре к Новому году, получается навалил клин Element Library - это, ну, там пресеты, всякие готовые штуки, плюс возможность сохранять ваши видео сразу же с результатом до после. Ну а для тех, кому тема генерации видео интересна, я думаю, она должна быть интересна всем, кто это смотрит. Иначе зачем вы это смотрите? И я обращаюсь прямо ко всем уровням: и новичкам, и суперпрошаренным ребятам. У нас через неделю, 15 декабря, стартует интенсив по видеогенерации. Там мы будем разбирать основы видеогенерации, продвинутые техники, топовые инструменты ниши на сегодня, всякие необычные workflow. И самое главное общаться в чате, задавать вопросы, ответы, устраивать созвоны, эфиры. Короче, будет такая плотная неделя работы, чтобы создать свои короткометражки или найти кого-то себе в команду, просто классно провести время, узнать что-то новое из индустрии. И поэтому хочу сказать, что всех буду рад там видеть. Мы, правда, много сил сейчас вкладываем в этот проект. очень хотим создать такую приятную, классную атмосферу для всего вышеперечисленного. И вот под этим видео будет специальная скидка, которая закончит действовать за неделю до начала интенсива. Поэтому успевайте по более низкой, выгодной цене туда залететь. Чем больше купят мед, тем выше будут подниматься цены. Все ссылочки найдёте в описании. И давайте ехать дальше. А следующее обновление у нас от Flora Fauna AI. Обновление

Flora Fauna AI

достаточно минорно. Я в целом удивлён, что так делать было нельзя. Но теперь асеты изображения видео можно менять прямо внутри workflow, не отходя от кассы. Apple, кстати, тоже свою видеомодель представляет, но тут ничего супер интересного нету. Можете на

STARFlow-v от Apple

Хагингфейсе Paper прочитать. Если очень коротко, то это не классическая диффузионная генерация, кои мы сейчас генерируем все видео, а генерация с помощью нормализующих потоков. Сейчас углубляться не буду. Если что, можно будет отдельное видео сделать. И в целом, может быть, про это и не надо будет рассказывать, если способ такой генерации не приживётся. Это вполне вероятно. Но тем не менее Apple заявляет, что метод жизнеспособный и копать в это направление продолжать можно. А гамма от Google тем временем

Studio Mode в Gamma

раскатывает студийный мод с nно бананы pro на всех пользователей. Очень качественные презентации создаются на автомате просто по простому промту. Гамма очень хорошее приложение, если вам нужно быстро качественную презентацию забабахать. Ну, смотрите, вообще сумасшествие. И всё это с точными данными. Всё это можно редактировать в PDF экспортировать и даже в pptx kn и так далее. А мой любимый тем временем

Recraft: логотипы и формы

выкатывает вот такую красоту. Hello, рисуем, да, хэл с сердечком. Это шутка, да, какая-то, видимо, была. Выбираем нанобанану. И у нас, смотрите, что происходит. Происходит красивый такой вот текст. Революция. Ну, а если без шуток и про что-то более передовое, то

Seedream v4.5 от ByteDance

вот вышел CDam 4,5. CD - это моделька от Bнceца китайского, точнее модель, потому что не особо она и маленькая. Очень большая штука. Конкурент нанобаны. Тут они почему-то видео показывают, хотя это модель для изображений. Очень качественные фотографии получаются. Очень классно, хотя пальцы периодически всё равно чуть-чуть не оттуда растут. Тем не менее, ну вот у вас, смотря на эту картинку, есть вообще претензии какие-то. У меня как будто бы очень мало. Конечно, выглядит отфотошоплено, но реализм супер-супер качественный. Плюс, повторюсь, это конкурентна бананы. То есть модель понимает живой язык. Можно просить там, поменяй причёску, сделай палец, поправь сделай чуть более реалистичный ещё апскейлинг тут есть. Но по ощущениям, конечно, дона бананы про не дотягивает. Кстати, те, кто пользуется Сидримом, напишите в комментарии, за что вам нравится именно CДРМ, вот что вы видите главными преимуществами этого сервиса. Потому что, по мне, вот на данный момент, конечно, Нано Banana Pro прямо, ну, более чем достаточно. Она и дешевле, и качественнее, как будто бы. Cre Appбиilder, про который я уже рассказывал, на самом деле. Берём вот

Krea и Runway Эп билдер

инпутные ноды, нодный интерфейс, создаём workflow в нём и потом всё это просто в таком простецком U, в общем, используем и радуемся жизни. И то же самое делает runway. Абсолютно похожую штуку выпускает в целом, ну, хорошо, мне удобство нравится. А что же Flx 2 Pro, который вышел на прошлой неделе на

Что с Flux 2?

арене? Tex to Image. Она занимает достойное второе место зана бананы pro. CD 4,5, кстати, проигрывает даже Сидриму 4. 0, но всё-таки для чего Flx 2 нам нужен, я не знаю, потому что у нас есть Nan Banana Pro, как будто бы это сейчас лучше, чем можно пользоваться. Есть с другой стороны FLX 2DF. Вот это уже достаточно крутая модель, потому что она open sourceная, и вы её можете просто себе на железо поставить и вообще бесплатно использовать. Ну только за электричество платить. А вот на арене editing, то есть редактирование изображений, CDM 4,5 вырывает уже лидерство у Сидрима 4. 0, а Flug 2 Pro очень-очень плохо себя показывает. При этом DEF-модель проигрывает квену 2509, который в ближайшее время должен обновиться и который на данный момент является лучшей open sourсной моделью для редактирования изображений. И в общем этим релизом Black Forest Labs, конечно же, немножечко не впечатлили нас. Обратите внимание, что моя любимая модель Revси уже на тринадцатом месте в топе. И это вообще сумасшествие, с какой скоростью модели выходит. Очень жду Рева второй версии. Думаю, будет весело посмотреть, как она всех уделает. Потому что Ревы - это всё-таки самый удобный интерфейс для того, чтобы картиночки генерировать. Ещё немножечко, э, 3D. Загружаем видео. Из видео получается векторная такая карта.

3D Point Tracks

И благодаря трёхмерным векторам можно редактировать содержание видео, сумасшествие. Вот это вообще то, что мы реально ждём. И вот на это куда интереснее будет смотреть, чем на всё то, что мы имеем сейчас. Чем-то, кстати, мне эта модель Рева напоминает, где вы можете точки двигать только в изображении, тут же вы сможете двигать пространства, векторы, плоскости. Ну и главное, для чего это нужно, наверное, - это бешеная стабильность. То есть все точечки будут на своих местах и все оригинальные детали, скорее всего, тоже будут сохраняться. Но до получения моделей по такой технологии, конечно же, нам предстоит ещё подождать сколько-то

Live avatar Alibaba

времени. Aliба выпускает realтайм аватаров, которые прямо в реальном времени генерируются, говорят и говорят в 20 FPS в диалогах. На Ване это всё работает, и они продолжают и продолжают говорить прямо как я сейчас. Далее 11

11 Labs Reader

Labs выпускает прекраснейшую вещь 11 Reader, то есть возможность читать книги вам вслух, делать из обычной книги аудиокнигу. И помимо того, что вам эту книгу читают, вы ещё можете её с лэмкой обсудить в этот момент. И по мне, вот это реально очень крутой сервис, который я, скорее всего, буду использовать, потому что часто во время чтения хочется какую-то информацию проверить. А информацию по литературе как раз-таки лмки знают достаточно хорошо. Начать дискутировать про там смыслы искусства, например, с лмками, ну, вообще очень классно. И по мне, это прямо вот предназначение, для которого они очень хорошо годятся, потому что там миллионы интерпретаций. Ты можешь от этих интерпретаций отказываться, соглашаться, спорить, пытаться какой-то максимально широкий спектр мнения охватить. И вот в этом LЛМ реально очень классно могут помогать. И ещё одна очень интересная модель у нас тут появилась. Значит, Marengo от 12

Marengo 3 понимает видео

Flaps. 12 Laps - это как 11 Laps, но на один повыше. Это вот примерно то же самое, что я вам только что про книги говорил, только про фильмы. Тут модель понимает до 4 часов спокойно, то есть реально очень длинные большие видео понимает. Очень хорошо это подойдёт для монтажа, для того чтобы находить какую-нибуд информацию там в записи лекции, например, или в том же фильме. Всё, что я вам посоветую, конечно же, это иметь свою голову на плечах, чтобы выводы в первую очередь самому делать, а уже потом к ллэмке обращаться, чтобы понять, что там, да, как, как по-другому можно было посмотреть. Но в первую очередь, в общем, думайте сами, потому что это вот одна из больших опасностей нашего будущего, то, что все будут думать как эллэмки через какое-то время.

Дизайн агент на Qwen

И дизайнт приближается к нам. Смотрите, какая красота. Ну вот это всё сделала нейросеть. не просто сделала нейросеть, не просто картинки, это прямо PSD лейауты целые. То есть модель обучили на 160. 000 PSD. Это формат фотошопа. И Квен 2, в общем, у нас доучили, чтобы вот такую красоту можно было делать. Только я наврал и, конечно же, генерируются не Пэсдшки, раз это км. Просто картинки, но при этом текст и всякие фрагменты генерируются в разных окошках. То есть в перспективе это можно будет и в PSD некие превращать, скорее всего, но точно не в ближайшее время, а пока модель даже не вышло. И только вот у нас йпер есть, а попользоваться этим всем добром нельзя. Думаю, самое время сказать, чтобы вы подписывались на канал, ставили колокольчик, чтобы не пропускать, когда это добро выйдет, потому что я, естественно, обязательно об этом расскажу. И последней новостью я

Немного паранойи: AI очки

немножечко подсыплю вам в десерт параноия. Параноидальный полдник. В общем, гражданин ходит по улице в AI очках. Очки с видением и очки подключены к LЛLM. LлMназирует то, что видит, в частности, лица людей, пробивает их по базе данных, и ты знаешь всё про человека, всё. Ну, ты знаешь его номер, ты знаешь всю информацию, можешь как-то шутить, пранковать кого угодно, либо что-то ещё более ужасное и менее невинное, чем пранки. В общем, в тяжёлые времена мы вступаем. И я видел, на самом деле, и раньше такие видео, но вот решил в этот раз наткнулся, поделиться с вами такой прекрасной красотой, потому что теперь оно работает всё ещё быстрее, ещё качественнее, с меньшим количеством галлюцинаций. Ну и на этом на сегодня всё. Надеюсь, это видео было вам полезно. Встретимся на интенсиве по видеогенерации с 15 по 22 декабря. С вас подписочка, колокольчик, лайк, комментарий. И с вами были я, Игорян, дядя Де в первой половине ролика был. И всё это вот прод совет. Пока. —

Другие видео автора — Продуктивный Совет

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник