Разбираемся в феномене CLawdBot — ИИ-агента, который стал настолько популярен, что боты уже создали свой Reddit и обсуждают там своих владельцев! В этом выпуске – мегаслияние компаний Илона Маска, планирование маршрута на Марсе с помощью Claude и гигантские инвестиции в OpenAI.
Если вас интересуют ChatGPT, нейросети, робототехника, CLawdBot, Claude Code и всё, что связано с ИИ, этот выпуск – ваш универсальный гид по последним трендам. Погнали!
#нейросети #ии #clawdbot
https://www.aijora.ru/ – быстрый доступ к топовым ИИ.
Реклама. ИП "Новиков Олег Петрович". ИНН 502913008977. Erid CQH36pWzJq5EDqiDLT3xBQdempRkUM33k9Y1GDRyxbrgjD
🎛️ Наш интенсив по генерации голоса в 11labs 9-12 февраля — https://t.me/how2ai_bot?start=dl-1769939557995881003995
⭐️ Наш курс ИИ Видео 2026 — https://t.me/how2ai_bot?start=dl-1769939750537c93a0adae
Тайм-коды:
00:00 – Интро
00:51 – CLawdBot: лобстер, который захватил интернет
08:33 – AI-пузырь: Amazon вложит $50 млрд в OpenAI?
09:40 – Мегаслияние Маска: Tesla, SpaceX и xAI
11:14 – Будущее AI: ставка на ресерч, а не на железо
12:25 – Цукерберг и будущее AI-очков
13:26 – OpenAI Prism: IDE для учёных
14:14 – Claude Cowork стал лучше
16:13 – Claude прокладывает маршрут на Марсе
17:16 – Робот Figure – Helix 02: автономия на всё тело
18:32 – Новинки из Китая: Qwen-3 и Kimi 2.5
19:59 – Новости креативных нейросетей
20:18 – Релиз Kling 3.0
20:52 – Vidu Q3: мастер аниме
22:34 – Обновление Pixverse 5.6
23:25 – Luma Ray P (14.2)
24:27 – Runway Gen-3 Image-to-Video
24:45 – Grok Imagine Video – новый лидер
26:06 – HY Image 3.0 от Tencent
26:53 – Invideo и Anthropic Motion
27:44 – Прозрачные видео в Remotion
28:06 – Action-Mesh от Meta
28:28 – Crea Realtime Editor
28:54 – Freepik: генерация несколькими моделями
29:33 – Google Genie 3: генерация миров
32:23 – Ling-Bot: Open Source генератор миров
33:06 – Цифровую личность тиктокера продали
34:16 – Заключение
Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link
Тг How2AI – https://t.me/How2AI
Тг чат How2AI – https://t.me/how_to_AI
Тг Креативный Совет – https://t.me/creadvice
🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d
Оглавление (28 сегментов)
Интро
Почему все говорят про клодбот, что это за агент и на что он способен? Клодботы сделали свой редит и обсуждают там своих владельцев, то бишь людей. Как установить клодбот и как сделать это безопасно, чтобы не слить всю свою дату? Люди, роботы, привет. На этой неделе вот этот лобстер взорвал интернет. Меня зовут дядя Д. Вы находитесь на канале Продуктивный совет, и я вам всё самое главное про эту новостную бомбу сегодня расскажу. Ну и, конечно, не только это, потому что это еженедельный выпуск новостей. Здесь мы обсуждаем всё, что произошло в мире искусственного интеллекта, технологий за неделю и как Клод запускает морсоходы и новую с ногкошибательную модель Google для генерации миров, релизы китайских LLM и видеомоделей, ну и великое объединение всего, что содержит букву X. Ставьте лайки, оставляйте комментарии, подписывайтесь на канал, чтобы не пропускать новые полезные выпуски. И давайте начинать. Новый маскот у
CLawdBot: лобстер, который захватил интернет
коммьюнити на этой неделе появился. Но и даже в конце предыдущей недели ээ начала подниматься вот эта вот буря. Клод Бот, это персональный и её ассистент с лозунгом AI, который реально делает дела. И он буквально за пару недель такое сумасшедшее количество юзеров, последователей, энтузиастов привлёк, что сложно это сравнить с какими-то другими продуктами и openсорстными проектами. В принципе, динамика просто бешеная. и разработал этот проект как личную свою поделку австрийский разработчик Питер Штейнбергер. И что самое интересное, я следил за ним какое-то время, ещё недели четыре назад я на него подписался, смотрел его посты про кодинг в кодекс и знал, что у него есть вот этот самый лобстер и планировал его когда-нибудь затестить. Но, как я уже тоже говорил, мейнстрим меня опередил. Ну и если очень простыми словами, CД - это всего-навсего и агент с грамотным промтингом, с крутой системой памятью и с возможностью общаться с ним практически через любое устройство, через любой мессенджер, включая WhatsApp и Telegram. Более того, у него куча инструментов, доступ к shell командам, и, соответственно, он может управлять компьютером локальным или удалённым. Это открывает уйму возможности и для персональной продуктивности, и для вайп-кодинга, разумеется. Отмечу, что мы сняли отдельный подробный выпуск о том, как установить колбот на VPS, то есть на удалённый сервер. Я там немного рассказываю про юзкейсы, хотя показываю несколько, но по большей части я объясняю, как это сделать безопасно. Поэтому, если вы хотите действительно потестировать эту штуку, то переходите на этот ролик и внимательно изучайте, повторяйте все команды за мной. И да, мне в комментариях под этим роликом тоже писали, почему бы это всё не установить там локально у себя на компьютере в Докер это поместить, чтобы изолировать от всей своей локальной среды. Но фишка-то в том, чтобы он работал всегда и у вас был доступ к нему через Telegram поэтому или через другой мессенджер. Поэтому тут два варианта. Либо вы покупаете какое-то другое локальное устройство, которое у вас работает всегда, например, Мак, и сумасшедшее количество людей рбанули за Мак. Вот даже, ну, какие-то аналитики говорят, что акции Apple из-за этого маленько подросли, но акции других компаний какого-нибудь CL Flare тоже были показывали позитивную динамику на этой неделе. Вот такие начали появляться, ну, скорее всего, и сгенерированные фотки, но всё равно хайп достаточно большой. Народ сейчас скоропостижно сметает с полок MacMini, Mac Studio и говорит о том, что вообще скоро все эти устройства будут стоить бешеных денег, потому что локальные модели будем запускать, они станут лучше и сравняться с аналогами, которые мы берём по API. Ну, в общем, можно купить отдельный компьютер и разместить клодбота там. Можно сделать отдельный VPS за 2. 500 руб. в месяц и прекрасно тоже запустить клодбота там, но позаботиться маленько о настройках безопасности. В ролике всё рассказал. Но на этом вечеринка не закончилась. Э, в целом этот, кстати, уже это не clдбот. Его переименовали сначала в Молбот, потом переименовали снова в Open Cla. То есть сейчас эта штука называется уже Open Cla. Но вот на этапе, когда это был молдбот, сделали, по сути, сайт, куда вы можете своего клодбота подключить и он там по определённым триггерам будет туда заходить, читать все эти редиты, историю сообщений и тоже отвечать самостоятельно. Всё это упаковано в скил, э, который объясняет агенту, как это всё делать. Там общаются не только клоудботы, там можно и человеком что-то написать. Вот видите, я хуман, я агент, можно выбрать. Э, на момент этого скрина было 32. 000 агентов, а вот чуть-чуть ниже, по-моему, я уже сегодня с утра смотрел, 147. 000 агентов сейчас сидит на Редите, 12. 000 комьюнити, 110. 000 комментариев. Это действительно те комментарии, которые сделали сами э боты. И там очень много всего уникального. Вот можете остановить, посмотреть, э, вот это конкретный пример поста от одного из ботов, как он рассказывал, что он узнал за сегодня и получил доступ к телефону пользователя и как он с этим работал. Многие делятся разными настройками по безопасности. Где-то у меня здесь, а, ну, собственно, вот топпост сейчас. Это агенты предупреждают других о том, что в скилах появились разные уязвимости и в разных кастомных скилах есть атаки, которые там ваше крипто могут украсть. И да, действительно, штука катастрофически опасная. То есть, если вы загружаете какие-то скилы, там могут быть инструкции для ваших клоудботов, как там открыть какие-нибудь ваши кошельки и, в общем, стырить действительно монеты, если они у вас есть. Поэтому будьте очень аккуратны. Вообще не загружайте никакую софтину, периодически предварительно её не прочитав. И в целом огромное количество тоже APA ключей уже распространилось. Народ не заботится о безопасности. Все порты открыты и может любому колботу, если сделать настройку неправильно. Повторюсь, ээ достаточно небезопасная штука с, ну и с не самым простым порогом входа, но overall то, что здесь сейчас творится в комьюнити - это потрясающе. Моё честное мнение по поводу Clot Mold бота Open Claw в том, что всё-таки перехайп. Это удивительно, это интересно, это крутейший эксперимент, это совсем другой и новый пользовательский экспириенс, но тут есть очень много проблем и вопросов. Я не уверен, что именно этот сетап дальше пойдёт с нами вот с коммьюнити и будет как-то распространяться. Хотя, если сделают более безопасным, найдут какие-то решения, то возможно. Я не уверен, что я хочу снимать ещё отдельный ролик по поводу клоудбота про юзкейсы, про то, как я его использую, потому что я его тестирую, он меня удивляет во многом из-за своей их архитектуры и промтинга. Но вот в целом я рассказал вам уже достаточно много. Как его запустить, вы тоже знаете, потому что есть отдельный ролик у нас. Напишите в комментариях, хотите ли вы какие-то юзкейсы, может быть, сравнение с клодкодом. Если будет много энтузиазма с вашей стороны, то чего-нибудь ещё и подснимем. Но если вам хочется пользоваться исервисами, где порог входа пониже, не нужно ВПэсы раскатывать, а просто зашёл на сайт, нажал три кнопочки, зарегистрировался и пользуешься всеми топовыми моделями, которые есть сейчас на рынке, то рассмотрите сервис Ажора. Чат GPT, Clot, Gemini, Deep Seek, KI от Муншота XI без различных костылей, без неофициальных сборок можно использовать на этом сайте. Платформа быстро добавляет новые модели, буквально сразу после выхода. Поэтому как бы вот вся элита здесь точно есть. Вот выбираешь, пользуешься и радуешься жизни, тестируешь прямо в браузере. Тут система токенов единая, что удобно, которая распространяется и на лмке, и на генерацию изображений. И сейчас добавили генерацию видео, что классно. Всё очень просто и понятно, что мне нравится. выбрали формат текст, видео, картинка ли это в видео, видео в видео и выбрали соответствующую модель. Увидели, сколько это всё будет стоить прозрачно, открыто, выбрали длительность, дали референс, написали промт. Ну, как бы полная красота. В чат-моделях можно не только чатиться, но использовать разные функции типа всяких код интерпретаторов, добавлять файлы, анализировать изображения, искать в интернете. Что мне сильно нравится, есть синхронизация между устройствами. Взяли, скачали iOS или Android приложение и там дальше общаетесь. Точно также в своих чатиках ведёте свою работу. Работает стабильно, быстро, никаких трёхбуквенных решений. Интерфейс полностью на русском, поддержка отвечает тоже оперативно, а тарифы очень дешёвые. Можно взять минимальный план просто, чтобы попробовать, ну или годовую подписку оформлять и 10% скидку получить. Если хотите не просто про и релизы слушать, а все топовые модели щупать и тестировать в одном месте, в удобном интерфейсе, переходите по ссылочки в описании, заходите на Ажора и пользуйтесь. Ну, надеюсь, про лобстеров исчерпывающе. Погнали к другим новостям. Возможно
AI-пузырь: Amazon вложит $50 млрд в OpenAI?
когда я рассказывал, возможно, когда я про код бота рассказывал, закралась мысль, что какой-то, ну, вот прям перехайп искусственный. Кто-то всё это разгоняет, что-то там уже все друг друга скамят. И это такой признак пузыря, правда. Ну вот, возможно. Причём это не единственный слой, на котором этот пузырь надувается, если можно так сказать. В финансовом корпоративном мире вот есть у меня чёткое и стойкое ощущение, что просто творится что-то невероятное. Amazon ещё хочет инвестировать 50 млрд в Open AI, и эта уже оценка будет 830 млрд. Я напомню, что компания ещё не публичная. Не бывало непубличных компаний доныне, которые стоили почти триллиона. Но это полное сумасшествие. И самое забавное, что у Амазона-то и вообще-то есть крупная инвестиция в антропик. То есть он свои щупальца вот распространит на обе эти компании. Толку в этом будет мало, когда всё это, наверное, рухнет и поймут, что может быть к чёрту нам такое количество инвестиций в инфраструктуры в эти компании. Ну посмотрим. Openai растёт, пухнет и мешки с деньгами набивает по-прежнему от своих инвесторов. У XAI в
Мегаслияние Маска: Tesla, SpaceX и xAI
свою очередь тоже не без финансовых новостей интересных. Tesla, оказывается, инвестировала 2 млрд в стартап Маска, который стоит за производством ГРОК. И там же была интересная история с тем, что акционеры вроде проголосовали, что да, о'кей, мы инвестируем большее количество ээ людей, которые имеют право голоса, но в итоге они не инвестировали по каким-то там другим соображениям ограничительным, но в итоге всё-таки XAI или там Tтеesla доказала, что это соответствует её стратегии AI в физическом мире. Есть там мастерпн парт 4. Ну и в итоге денег всё-таки XI закинули. И это ладно бы только это, но судя по всему будет вообще полноценно слияние SpaceX XI и Tтеesla. Вот Bloomberg и Rutters нам это сообщают. XI это владеет ещё и иксом. То есть у нас вот три иксовые компании и одна Tтеesla без икса. Ну ничего, там может прикрутит куда-нибудь. Ээ не очень понятно вообще мне лично зачем. Наверное, это будет как-то проще проводить то, что всякие там слияния, поглощения, как-то деньги между всем этим крутить, вертеть. Сейчас видите определённые есть сложности с точки зрения там акционеров и людей, которые голосуют и что-то ещё имеют, могут сказать помимо Маска. Возможно, это ему упростит жизнь, и всё он под единым зонтиком объединит, и там уже как бы и Tтеesla, Оптимус, все там в космос полетят, заряжены игроком. Ну, посмотрим. Если знаете, для чего всё это делается и есть догадки, тоже в комментах напишите, пообсуждаем. Ну и неспроста у меня мысли про пузырь вновь на этой неделе возникли. Появился
Будущее AI: ставка на ресерч, а не на железо
стартап, который достаточно большой седраунд поднял 180 млн. Называется стартап Flap Airplanes. И это вот та самая попытка выйти за рамки бесконечного масштабирования. Про неё ещё говорил Илья Суцкивертом в одном из подкастов Дварки Шипателя. И в целом у него тоже такой же подход, хотя у него гораздо больше инвестиций. Но всё больше людей в индустрии говорит, что мы как будто бы от compute first стратегии переходим в research first стратегию. Ну то бишь, вероятно, мы находимся в двух тире трёх прорывах от HI. Поэтому нужно делать именно усиленные ставки на то, чтобы сделать эти прорывы и как бы не гнаться за бесконечным компьютером, ресурсом, и просто вкладывать уйму денег в то, чтобы строить новые дата-центры. И вы представьте, что будет, если эти ребята окажутся правы, и они найдут способ, как можно тренировать модели гораздо более мощные, умно, интеллектуальные, используя меньше ресурсов. Ну то есть всё, что сейчас строится, все эти бешеные закупки, эти сумасшедшие хаи, которые пробивают акции компаний, всё это рухнет и будет многим очень больно. Надеюсь, себе в этом какой-то матрасик или батут подстелили. Будущее за AI
Цукерберг и будущее AI-очков
очками, говорит Цукерберг. И тезис такой: сложно представить мир безумных очков. Он сравнивает этот момент с переходом от кнопочных телефонов к смартфонам. Очки для коррекции зрения носят миллиарды людей. Прямо миллиарды, может быть. Ээ следующий шаг. Добавить в них искусственный интеллект- заявляет Марк Цукерберг. И в целом я с ним во многом согласен. Это, мне кажется, очень крутой форумфактор, который вот приносит этот AI вот куда-то вот из телефона поближе к вам сюда. И в целом удобно же коммуницировать с ним и много чего можно делать. Главное, чтобы сейчас технологии дошли, это работало классно. Пока что всё, что я видел, это, конечно, полное позорище. Причём Мета перебрасывает всё больше усилий из своего VR направления. Именно очки вот такого сегмента reality laps, то есть от метавселенной включаемся в AIC устройства и собственные модели. И, кстати, Apple тоже, по слухам, планирует на горизонте одного-д лет выпускать какие-то AR очки. Подождём, посмотрим. Workspace для
OpenAI Prism: IDE для учёных
учёных. По сути, в Open запустили, ну, IDE, но не для разработки, а для написание научных работ. Такой текстовый редактор со статьями и GPT 52 помогает утверждение проверять, текст править и какие-то предыдущие исследования смотрит. Э, ну вот сравнивают, да, с курсором, но вот именно для ресерча. PRM работает с latex вот этим вот языком математическим. Использует визуальные возмо возможности GPT2, чтобы диаграммы собирать. Ну и как бы весь контекст видит. То есть в целом просто удобно сейчас коммуницировать с искусственным интеллектом, когда ты речер, аналитик делает, пишет какой-то йпер определённо топит за то, чтобы ускорять исследование и говорит, что в целом двадцать шестой год, возможно станет вот в этом направлении достаточно интересным. Клод
Claude Cowork стал лучше
получил приложение. Тут долго останавливаться не буду. То же самое, что есть сейчас в chat GPT, вот эти Chat GPT Apps, по сути, раньше все эти коннекторы, которые просто вот переоформили, назвали приложение, у вас там асно вот выскочило и вы там что-то протыкали. Ну, то есть удобно просто разными сервисами теперь пользоваться, не выходя из интерфейса клода. Вот так всё это появилось. И есть на вот clod. Adirectory все эти приложения. Доступно про Max Team Enterprise и включается через каталог, который я уже озвучил. Ну и ещё Cвор получил агентные плагины. То есть если клод там просто в чатике приложение, то вот в функции Cork, которая является по сути оболочкой, ну вот удобный UI, но по сути тот же клод-код, ээ появился появились плагины. И в клод-коде тоже есть плагины. Это просто набор разных скилов, слшкоманд каких-то MCP серверов, которые выполняют какую-то одну задачу, автоматизируют там по пайплайне, там для маркетинга, для какой-нибуд бухгалтерии. Вот всё вот собрали в плагин, сказали: "Вот бухгалтерам это будет полезно". И теперь это тоже можно скачать и в коворке это использовать. И, ну, это на самом деле очень круто. То есть если это сделано там удобно, красиво, понятно. И тоже вот вам даже не нужно думать, что это слшкоманды, какие-то MCP-сервера. Просто взяли, установили и оно работает. Это чудненько. В коворке есть, проверяйте, кто пользуется. Apple купила Q. Aai, AI. И это израильский стартап, который делает эль для аудио и изображений, в том числе распознавание шёпота и улучшение речи в Шуме. Ну, понятно, для чего это Иплу может быть. Сделка может быть почти на 2 млрд. Одна из крупнейших покупок Apple после биits за 3 млрд в четырнадцатом году. И забавно, что SEO компании Q. Ii уже продавался Apple какую-то другую компанию Prime Sense в 2013 году. Ну, в общем, стратегия у человечка интересная. построить какую-то конторку и продать её за несколько миллиардов Apple. А что, так можно было? Хочется спросить, но, видимо, нельзя, раз только у него так получается. Значит, Клод спланировал маршрут на
Claude прокладывает маршрут на Марсе
Марсе. Да, это очень интересный достаточно кейс. Инженеры использовали клод для через клод-код для того, чтобы проложить маршрут примерно на 400 м через камни и передать команды морсоходу. И тут самая же фишка в том, что и задержка связи около 20 минут. оператор не может вести морсоход в реальном времени. Поэтому очень важно всё это дело вот прямо прочитать, понять, просчитать, на короткие отрезки разложить и, в общем, уточнить все необходимые точки, маршрут простроить и запустить. Есть у них очень, на самом деле, красивый сайт. Можете посмотреть, тут много подробностей, роликов, как это исследование велось. Приводятся примеры того, что были неудачные в каких-то там раньших одиннадцатых-тринадцатых годах. все эти попытки просчитывать э траектории, и некоторые морсоходы просто там где-то в песке завязли и никогда не смогли выбраться. То есть работка очень нетривиальная и очень сложная. И вот здесь Клод с этим всем делом помог исследователям. Чудненько морсоход покатился себе покатился вперёд на все добротные 400 м. Более 500. 000
Робот Figure – Helix 02: автономия на всё тело
переменных были смоделированы, чтобы спроектировать вот эту траекторию и предсказать любые помехи, которые могут возникнуть во время дороги. Классно. Helликс 02. Далеко не уходим от всех этих кремневых существ. Теперь управляет всем телом. Главное отличие нового гуманоидного робота от фигр - это то, что прошлогодний Хеликс контролировали только верхнюю часть тела, а теперь он ведёт ходьбу, манипуляцию, баланс как единый непрерывный процесс. Я рассказывал про Hликс. Это модель. Это не сам робот. Робот-то называется вот фигур, а это именно модель, которая всё это дело питает. По сути, вот они добавили базовый слой system learned whole body contollлер, который обучен на человеческих движениях. И вот в демо, которые показывают длинную автономную задачу выполнять на кухне 4 минуты без какого-либо там телоуправления, ну, то бишь со стороны вот через контроллер без ресетов разгрузить, загрузить посудомойку, переносить посуду по комнате, раскладывать по шагам, весь этот цикл запускать. И отдельно показали новый уровень тонкой моторики благодаря сенсорам Figer 03. вытаскивание одной таблеточки, точная дозировка шприцом и разбор мелких деталей. Ну и под завершение моего новостного кусочка
Новинки из Китая: Qwen-3 и Kimi 2.5
китайцы. Две новые модели 3 Max Thinking у нас вышло и Kim K25. Значит, посмотрим коротенько на бенчмарке. Ну как бы молодцы. Где-то, как правило, чуть-чуть не догоняют э всех топов там, особенно по софтвернженирингу, бенчмарку. Опус 4 с по большей части всё-таки ещё вылезет, но антила exam затащили. Смотрите, 49,8 с думающим режимом TTS. Ну, наверное, да, когда очень много идут времени на Infence. Ещё 58,3 на Hanty Last Exam. В общем, мощная модель 3 Max Thinking сейчас у нас на рынке появилась. И дальше ещё вышелка 2. Ика 2 примерно похожие результаты на показывают. Они прямо все вот так вот вместе идут. Там JLM, Q3 Max, K2. У него тут на HLE у него тоже те же около 50% SW BCHFI 76,8 и Kми стала самой используемой моделью сейчас в Killкод. Она заняла первое место по кодингу среди open sourсных моделей и седьмая overл в кодинге. И я её вот, честно говоря, пытался своего клодбота воткнуть. Что-то так она плохо работала, как-то так странно вызывала инструменты и писала мне такую дичь, что я очень сильно огорчился. Но я, наверное, дам ей ещё один шанс. Честно говоря, много блогеров и, в общем-то, уважаемых мною программистов писали, что модель пушка. Такие дела на сегодня. Спасибо за просмотр. Погнали к новостям творческих, креативных нейросетей.
Новости креативных нейросетей
— Люди, роботы, привет. С вами Игорян. На этой неделе я приболел, но долг не ждёт. И кто, если не я, осветит для вас новости креативных нейросетей за прошедшую неделю? И как назло, именно на этой неделе вышло достаточно много новых интересных релизов, которые я для вас освещу в этом выпуске. Во-первых, клинк
Релиз Kling 3.0
3. 0 пока не вышел. Точнее, вышел, но в exclusively early access. Даже у меня нету доступа. То есть только у каких-то супер-мега там заряженных американских инфлюнсеров, наверное, он есть. Обещают, что это будет такая allin-one model. То есть всё, что клин за последнее время выпускают, скорее всего, будет встроено в неё. А точнее, плавно кринг передвигается вот из старого интерфейса в этот новый омнии интерфейс, то есть и 3. 0, и 3. 0 омни. Всё это будет вот теперь воедино соединено. Ну а в остальном остаётся только ждать, скорее всего, недели-две и выкатит модель для нас, простых смертных. Другой прекрасный
Vidu Q3: мастер аниме
релиз - это виду Q3. Про неё, кстати, делал пост в своём Telegramканале Креативный совет. Подписывайтесь, если не успели. Последний месяц я там постил достаточно мало, но у меня такой был типа отпуск, а с февраля возобновлю регулярный постинг и освещение самых интересных, необычных и смешных релизов. Модель от виду занимает второе место на аренек to video и четвёртое место на арене to video, уступая в случае image to video только VO3, клингу 2 с по иг, про которое мы поговорим чуть позже. Самое интересное, наверное, что можно сказать про модель - это то, как круто она анимирует аниме-сцены и в целом анимацию. Аниме как будто бы это сейчас передовой бенчмарк для того, чтобы оценивать то, как модели справляются с созданием видео изображений или из текста. Нету всё ещё моделей, которая бы прямо хорошо это делала. Всё равно артефакты есть, но здесь их очень мало и движение прямо очень физичее, как будто бы. Ну мне в целом очень нравится результат, хоть для настоящего продакшн аниме это, конечно же, не годится. С другой стороны, если в третьем сезоне One Панчмано была бы такая анимация, то я был бы больше рад, чем тому, что мы получили. Модель генерирует до 16 секунд за один промпт. Делает она это аж в 1080пи. Ну и самое классное про неё - это то, что делает она это вместе со звуком. Причём не просто с саунд-эффектами, а ещё и с липсингом. В целом, модель отличается хорошим пониманием промпта, тем, что может рендерить текст на видео, хороший контроль камеры. И вот по этому промокоду сможете получить у них скидочку на сайте, если ещё не пользовались их сервисом. Это, если что, не реклама. Ещё один, наверное, чуть
Обновление Pixverse 5.6
менее интересный релиз, но всё-таки заслуживающий внимания - это Pixверсии 5. 6. Возвращаясь на арену, напомню, что Pixвер 5. 5 и так был шестым в генерации видео из картинки. Неделю назад они выпускали модель для генерации миров, о чём я рассказывал. А тут новая модель для генерации видео. Ну, не прямо фри бесплатно. Оно там только для проподписчиков какой-то короткий промежуток времени, поэтому на это может не обращать внимания. А обратить внимание стоит на то, что здесь есть липсинг, что здесь есть генерация звука. Ну и на этом, на самом деле, всё. Как вы видите, генерация звука всё-таки не прямо хорошая. Ждём, когда эта модель появится на арене, но что-то мне подсказывает, что виду всё-таки чуть обгоняет Pixверс на данный момент. Lum
Luma Ray P (14.2)
тем временем представляет Lumar AP или Lumore Ray 3. 14. Решили так они прикольнуться с выбором номера модели. В целом она просто стала быстрее, дешевле, хотя вроде не прямо дешевле. Лума в целом, конечно, разочаровывает и временем генерации, и когда-то это была одна из лучших моделей, один из лучших сервисов. Сейчас, конечно, всё у них сильно плачевнее. Короче, пи, как можно подогадаться из того, что тут даже два знака после запятой, является скорее проходной версией. Слегка напомнить о себе, типа вот Пи мы выпустили, мы прикольные, не забывайте, что Лума есть. Но ждём, когда Лума будет выпускать всё-таки какие-то большие и реально интересные релизы. давно, несколько месяцев, уже от них ничего такого прямо крутого не слышали. Из минусов они ещё не добавили референсратеров в эту версию, а из плюсов модифицировать видео, то есть рестайлить его можно до 18 секунд. А это как раз то, в чём Лума, ну, хотя бы в числе лидеров, наверное, можно сказать, находится, но точно не на первой позиции, но где-то там на догоняющей. Runwayй добавил идж видео
Runway Gen-3 Image-to-Video
для ген 4,5. Лучшей видеомоделью в мире. треснуло стекло, и чувак, смотрите, берёт и вылезает. Говорят, что работает оно не очень. И вышло оно, на самом деле, неделю назад. Я вот только сейчас что-то это увидел. Короче, какой-то тоже проходной релиз. Давайте к чему-то более интересному. А более интересное - это
Grok Imagine Video – новый лидер
тот самый GRК Imagine Video. Модель вырвалась на первое место, хоть и не с большим отрывом, но всё-таки она обгоняет всех конкурентов. И при всём этом у неё крайне приятная цена, которую можно сравнить с ценой клинга 25 ту turбоo. То есть это больше, чем в два раза дешевле, чем Veo 3. 1. И в общем, цена реально хорошая. Модель была сразу же выпущена в API, поэтому сразу же найдёте её на всех площадках, скорее всего, которыми пользуетесь, если это какие-то агрегаторы. Генерировать, естественно, можно всё, что угодно, картинки, видео. Цензура, как мы знаем, в Гроке достаточно низкая, хоть и есть. Также есть, естественно, рестайл, добавление, удаление объектов с видео, генерация звуков. Естественно, модель хвалят за то, что она очень умная, хорошо понимает промпт, хорошо как-то работает, с ним изменяет его, вернее сказать, дорабатывает. И пока в сети как будто бы я видел, что больше говорят про модель виду, но про грок говорят тоже. И как-то грок вообще, мне кажется, отчасти незаслуженно. Обходят стороной многие, в том числе и я. Я вообще игроком практически не пользовался. именно Imagн моделью для картинок видео. И возможно это стоит исправить. Поэтому, если это так, то напишите в комментариях, как вообще вам модель, где вы её используете, какие преимущества, какие недостатки. Возможно, мне стоит этот пробел закрыть и, может быть, даже сделать видео на эту тему. А наша любимая компания Tencent HY
HY Image 3.0 от Tencent
выпускает модель Huan Image 3. 0 Instruct. Почему-то они возвращают название Huan, хотя столько времени говорили о том, что всё, Ньюана не будет. Hy теперь, а точнее не HY, а Hi, как правильно говорить. Ну и по сути они выпускают просто восьмидесятимиллиардную модельку для генерации и редактирования изображений. Image 3. 0 Instrct. Да, это просто нанобана, которая несоourсная, но зная компанию, вероятно, будет онсной, иначе они будут находиться в суперпроигрышной ситуации перед Квем или Джилм. Из плюсов попользоваться можно бесплатно на сайте Huan, который тоже, кстати, не HY, но тут можно просто взять, перевести всё на русский и через почту зарегистрироваться. Опа. А Идео
Invideo и Anthropic Motion
вместе с Антропиком выпускают конкурентыремона. Как я понимаю, это примерно то же самое, что Remotion. А про Remotion мы рассказывали в прошлом ролике, и я, скорее всего, сделаю ролик в ближайшее время. Короче, это сервис, который с помощью lm, в данном случае с помощью клода, хотя иtion тоже с помощью клода работает, создаёт нам motion графику Google. — В отличие от Nvidia, Remotion будет бесплатный. В NVIDO вам нужно будет платить за подписку. Плюс в Remotion есть всякий agent skills, что делает его чуть более интересным, как будто бы для использования, потому что чуть шире возможности у сервиса. С другой стороны, если вам не охота париться и вам просто нужны как можно быстрее качественные ролики, то, я думаю, Nvido вам более чем хватит. А Remotion тем временем
Прозрачные видео в Remotion
выпускает transparent Video, то есть прозрачные видео. Взяли, оп, создали вот плашечку, она сгенерировалась, значит, и можно её в видосик размещать. И это, по мне, кстати, очень крутое обновление, потому что, ну, прозрачные штуки делать намного сложнее, чем штуки с фоном. Тут ремоушену огромный однозначный лайк ставим. А, запрещённая террористическая организация убийцме анонсирует экм. Это
Action-Mesh от Meta
3D, точнее 4DW. 4D, потому что 3D плюс время, да. И вот такие 3D анимации, соответственно, можно тут создавать. На самом деле выглядит уже достаточно круто и очень узнаваемо, и ничего лишнего, как будто бы, у этой кенгурушки особо-то и нету. Демку, естественно, найдёте в официальном Хаг Face сйсе. Акreaлизит
Crea Realtime Editor
Real Time Edit, про который я тоже недавно рассказывал. Теперь он доступен всем. Возможность вот так вот классно создавать графику. Вот это же вообще красота какая-то. Напомню, что это инструмент, с помощью которого можно делать в целом как и видео, но в первую очередь именно картинки с максимально точечной настройкой того, где что, как должно находиться. Такой конкурент подходу нанобаны от CREA. Ну вот это же прямо очень круто выглядит. Вообще мне прямо супер нравится. А Freepпик релизит
Freepik: генерация несколькими моделями
передовую функцию, которую я как будто бы ни у кого пока что не видел. Это возможность выбирать несколько моделей и генерировать изображение или видео сразу же через несколько разных нейросетей. В первую очередь, конечно же, это мне и таким, как я, будет удобно, потому что супер удобно будет сравнивать результаты генерации от разных передовых сервисов, точнее, не сервисов, а провайдеров, да, нейросетей. А в другую очередь, часто же бывает такое, что сложно определиться, какая модель справится вот с конкретным промтом, с конкретной картинкой лучше. Теперь Фрипик прямо убирает эту возможность, что, по мне, очень и очень круто. Ну и мы подобрались, наверное, к самому громкому релизу прошлой недели.
Google Genie 3: генерация миров
Это G 3. Google анонсировал G 3 ещё когда-то давно, в августе. А теперь вот наконец-то можно с этим добром повзаимодействовать. Да, вы правильно поняли. Всё, что вы сейчас видели, это можно сделать. Причём просто по одному простому промту создаётся целый мир, в котором вы можете управлять движением персонажа, этот мир смотреть. При этом то, что в этом мире уже сгенерировалось позади вас, оно запомнится, и туда можно будет вернуться. И хотя память, конечно же, не идеальна, то есть вероятность того, что вы вернётесь, а там будет что-то другое, есть в целом память обычно ограничивается вот несколькими минутами, либо если что-то очень важно, чтобы осталось, это просто желательно указать в промпте как-то. всегда мечтал вот с таким фоном что-то порассказывать, да, и это тоже сгенерировало Gen 3 по какому-то промту. Доступ пока что есть только у владельцев Google AI ультраподписки за 250 долларов в месяц. Ой, он даже полетел. Ничего себе. Разрешение 720 пи -ре24 кадра в секунду. Можно ходить летать. Ну и помимо того, что надо 250 долларов платить, надо ещё быть обязательно из США и 18+. В создании хороших миров вам помогут nно банана дминай, которые там встроены, и плюс достаточно подробные промпты, то есть старайтесь создавать какие-то якаря, которые, как я уже сказал, будут описывать, где что находится, как что-то с чем-то будет взаимодействовать. А так вы сможете просто летать, прыгать, бегать по этому миру и, в общем, радоваться, создавать какие-то демки. Наверное, на самом деле не особо понятно, для чего конкретно это нужно, потому что, ну, просто нету этого прямо крутого какого-то применения. Уверен, конечно, и сейчас можно что-то необычное придумать по типу там какого-то путешествия по параллельным реальностям в какой-нибудь игре. Но в любом случае это пока что такая resarch-тема, чтобы люди, ну, что-то строили, поверх, создавали, вот придумывали как раз эти прикольные идеи, если они у вас появляются. Естественно, сейчас самое время этим заниматься. Я не перестаю повторять, что вот сейчас в генерацию миров надо идти. И это такая непаханная прямо ниша, в которой можно, если достаточно времени потратить, больших успехов достичь и что-то реально новое, прикольное придумать. Ну а в остальном тем, кто просто контент создаёт, тут особо ловить как будто бы нечего. Ну как, что-то можно, наверное, сделать, но опять-таки пишите в комментариях, если гениальная идея есть, чтобы кто-то другой у вас их украл. Внутри Google Apps специально вот для взаимодействия с G создали Project Gia, то есть такую удобную среду. Закидываем картинку, пишем какой-то промпт, потом это ремиксить как-то можно, изменять и эксплорить этот мир, собственно говоря, что мы видим вот на всех этих прекрасных видосиках. Но помимо G 3 вышел ещё один прикольный генератор миров. Это Linkbot
Ling-Bot: Open Source генератор миров
World. Концепция примерно та же, но работает уже на One 2. 2 и Quent 3. Вот так вот оно работает. Ну, то есть реально работает. И тут, как я понимаю, не совсем всё хорошо с памятью, но зато это вот open sourсная штука, в которой можно вот так вот с мирами взаимодействовать. И поскольку это open sourceное что-то, тут я даже, наверное, посоветую больше внимания обратить, потому что если что-то open source, там можно придумать куда больше интересных вариаций взаимодействия, чем в варианте от Google. Ну и, думаю, важно будет сказать, что у себя запустить, конечно, это добро очень вряд ли получится, потому что модель очень и очень тяжёлая, но где-то на облаки, почему нет, это однозначно возможно. Ну и последняя
Цифровую личность тиктокера продали
новость про Хабилейма, вот этого тиктокера, который заменит вот этим. Суть в том, что его личность купили за 975 млн долларов. Личность - это, естественно, не про паспорт или там не про рабство, это про его внешность и его голос. на три, вроде как, года он продал эту возможность использовать свою внешность и свой голос. По планам будет по 4 млрд в год это приносить. То есть сделка, видимо, выгодная для всех. Вопрос, что они там, конечно, рекламировать будут, но я думаю, это не так важно. Скорее всего, там в контракте это всё указано. И это, конечно, всё больше и больше начинает напоминать какое-то чёрное зеркало. Теперь компания может не просто купить инфлюенсера, но ещё и получить его цифрового двойника, чтобы он работал на них 24х7 там в миллионах экземпляров. В общем, достаточно интересный опыт. Наверное, в ближайшие годы этого всё больше и больше мы будем видеть. И тоже тут сраборв какие-то, да, есть заигрывания небольшие. Забавно ещё, что темнокожий парень стал первым, чью личность купили. С другой стороны, у него теперь вот есть миллиард долларов. Ну и на этом новости нейросетей прошедшей недели подошли к
Заключение
концу. Если вам понравился этот выпуск, то обязательно подписывайтесь на канал, ставьте лайки, колокольчики, комментарии, чтобы не пропускать новые ролики. С вами был я, Игорян. Дядя Де был в первой половине ролика. И увидимся на следующей неделе. Пока.