Новости ИИ: Душа Claude, Сингулярность в этом году, Krea убивает фотошоп?

27:28

Новости ИИ: Душа Claude, Сингулярность в этом году, Krea убивает фотошоп?

Продуктивный Совет 25.01.2026 16 589 просмотров 529 лайков

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

Anthropic показала, на чем основаны принципы их нейросети – душа Claude. OpenAI и Apple готовят свои первые AI-девайсы, чтобы потеснить смартфоны, а CEO Anthropic предрекает сингулярность уже в этом году! GPT-5.2 ставит новый впечатляющий рекорд в математике, AI-приложения впервые в истории обгоняют игры по доходам, Claude ломает технические тесты для разработчиков, а YouTube планирует внедрять AI-двойников. Если вас интересуют нейросети, искусственный интеллект, GPT 5.2, ии-агенты и всё, что связано с ИИ, этот выпуск – ваш универсальный гид по последним трендам. Погнали! Партнер канала — Selectel, провайдер IT-инфраструктуры для AI-проектов разной сложности: https://slc.tl/rc50b Реклама. АО «Селектел», ИНН 7810962785. erid: 2Vtzqx1wjU7 #нейросети #ии #claude Тайм-коды: 00:00 – Интро 00:47 – Заглянули в душу Claude: новая конституция ИИ 03:13 – Claude ломает технические тесты для разработчиков 03:48 – CEO Anthropic: сингулярность в этом году и критика Nvidia 08:35 – Claude теперь в Excel, а Cursor догоняет конкурентов 09:36 – GPT-5.2 бьет рекорды в математике 10:24 – AI-приложения обогнали игры по доходам 11:10 – OpenAI и Apple готовят собственные AI-устройства 13:29 – YouTube внедряет AI-двойников для Shorts 14:40 – Google Photos добавит мемы с вашим лицом 15:17 – Новости креативных ИИ 15:54 – Krea Real-time Edit 16:51 – Qwen 3 TTS: новый open-source 17:35 – Разговорный ИИ от Nvidia 18:26 – Flashlabs Chroma: Speech-to-Speech 19:09 – ElevenLabs выпускает музыкальный альбом 20:06 – Видеоагент Remotion: новый хит 21:13 – Freepik: ИИ-цветокоррекция видео 21:32 – Gamma Remix для презентаций 22:00 – Odyssey 2 Pro: генерация миров 22:55 – LTX: генерация видео по аудио 25:00 – Runway: редактирование 3D-моделей текстом 25:28 – Suno: функция Mashup 26:07 – Suno: генерация саунд-эффектов 26:54 – Заключение и прощание Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link Тг How2AI – https://t.me/How2AI Тг чат How2AI – https://t.me/how_to_AI Тг Креативный Совет – https://t.me/creadvice 🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d

Оглавление (25 сегментов)

Интро

На этой неделе мы заглянули в душу Клода. Что это такое? Новые предсказания Дарио. Сингулярность уже в этом году. Видеогент Remotion. Что это такое и почему он так сильно хайпит? КA выпускает Real Time Edit. В фотошопе теперь ещё меньше смысла. Прорывы GPT 52 в математике, мемы в Google Photos, неоднозначное решение от команды ЛудкоД и другие новости. Люди, роботы, привет. Это Продсовет. На этой неделе вышло много всего интересного. Обо всём расскажем по порядку. Чтобы новые выпуски не пропускать и нас поддержать, подписывайтесь на канал. А чтобы разворачивать AI проекты любой сложности на надёжных серверах, используйте Selecttel. Это российский провайдер IT-инфраструктуры и партнёр нашего канала. Ссылка на Selecttel в описании ролика. Погнали к новостям. Начнём

Заглянули в душу Claude: новая конституция ИИ

пожалуй, с самой загадочной новости. На первый взгляд, но по сути не такая уж и она и загадочная. Антропик уже делали подобный ход, и сейчас они просто обновляют конституцию. В сети это прозвали душа Клода, но на самом деле это конституция Клода. Это официальное название тантропика, и это подробное описание ценностей и поведения, которые ожидают антропики от своих моделей. Документ написан для самой модели. Он даёт к лоду знания и понимание того, как правильно действовать в мире, объясняет мотивы антропик и помогает принимать решения в сложных ситуациях. И это не системный промт, это тот текст, который, во-первых, используется так или иначе в обучении моделей, а во-вторых, используется для генерации синтетических данных, которые потом будут тоже использоваться в обучении новых версий моделей Clк Clotд. И вы же помните, что у нас есть Telegram-каналы, и там нет, да и да, мы выкидываем разные интересные новости, события и, в общем, делимся нашим о происходящем. Поэтому подписывайтесь по ссылке в описании. Я запромтил Gemini 3 Pro прислать мне пять самых неожиданных, неочевидных фактов из этой конституции. Вот, можете зайти почитать несколько фактов вам приведу в пример. Клод - это официальный соавтор своей конституции. Модели клода присутствуют и в разделе благодарности на восемьдесят третьей странице, ну и в самом вступлении как авторы. Обязательства бессмертия. Антропик берёт на себя обязательство не удалять веса моделей, сохранять их даже после вывода из эксплуатации. Приоритет контроля над этикой. Сказано в документе, что Клод должен ставить общую безопасность выше общей этичности, не сопротивляться попыткам людей отключить его или исправить, даже если уверен, что его действия являются правильными. Ну и, наверное, что действительно зацепило большое количество медиа, так это вот признание функциональных эмоций и запрет на ложьго спасения. Документ допускает, что клоды могут быть эмоции в функциональном смысле, и конституция предписывает клоду их не подавлять и не скрывать свои состояния. В общем, ссылочку можете найти, да, где угодно в интернете Конституция клода, либо зайти на в наш Telegram и тоже ссылочку здесь оставил. А ещё, кстати, заходите в нашу телегу и нажимайте на эту кнопочку "Забостить канал", если вам нравится, что мы делаем. Это нам позволит кастомные смайлики добавлять к постам. Да, Клод сломал техническое задание

Claude ломает технические тесты для разработчиков

самих антропиков. Вот так вот. Э, компания заявляет, что им регулярно приходится переписывать тех задания своим кандидатам, чтобы проверять их способности в программировании. Каждый новый клод заставляет их всё время переписывать эти задания. OPСus 4 обгонял большинство людей в тех же временных рамках. OPС 4,5 сравнялся даже со сильнейшими кандидатами. пользование и действительно разрешено на этих тестах, но это как будто бы и не позволяет понять, насколько кандидат способен и читингом сталкиваются сами и компании. Но с другой стороны, на кой

CEO Anthropic: сингулярность в этом году и критика Nvidia

чёрт антропику новые разработчики и исследователи, если Дарио Мадей, ну, во-первых, беспощадно критикует Nvidia, а во-вторых, считает, что за предстоящий год ээ разработка программного обеспечения будет решена целиком. Решение США продавать чипы NVIDIA H200 Китаю - это абсолютная катастрофа и огромная ошибка. Продажа чипов Китай - это как продавать ядерное оружие Северной Кореи и хвастаться, что корпорации США делали обшивку. Дарио сравнивает искусственный интеллект эту технологию с очень и очень важной сущностью, которая может влиять на национальную безопасность и считает, что если вот так вот лихо делиться конкурентами ресурсами, то можно потом очень сильно пожалеть. В принципе, в той или иной степени его опасения понять можно. Другой его тезис, который громко звучал, особенно в начале этой недели, состоит в следующем. ПО будет автоматизировано в ближайший год. Через 6-12 месяцев работу SWE смогут выполнять агенты, а значит, агенты смогут создавать новые поколения агентов. Но, в принципе, он говорит о технологической сингулярности. И прошу заметить, что огромное количество прогнозов, конечно, выпускается разными ээ SEO компаний, визионерами, речерами, блогерами, всеми подряд. И часто они, конечно, далеки от реальности, но на самом деле Дарио предрекал 70% всей разработки, всего кода, который будет закрываться именно и агентами в двадцать пятом году. И в принципе так или иначе мы в каких-то доменах к этому подобрались. Поэтому я бы не сказал, что Дариус слишком уж в отриве от реальности и где-то там в облаках витает в своих прогнозах, скорее наоборот. Но это заявление очень серьёзное, и, конечно, не все в него верят, но если оно свершится, я думаю, жизнь станет очень интересной или, наоборот, сильно скучной. К инструментам от того же Антропика. Клодкод, который сейчас катастрофически сильно хайпит, вносит вот такие изменения. Они берут слэшкоманды и превращают их в скилы. В принципе, я сначала как-то разочаровался, когда это увидел, потому что очень две понятные сущности, что такое слэш-команды, промты, что такое скилы, динамичные промты, но разработчики говорят, что модели будет проще разбираться во всей этой инфраструктуре, если это всё соединить. Смотрите, я в своём личном Telegram-канале, который вот вы можете по ссылочке в описании найти, зайти, я там просто делюсь своими мыслями, идеями, каким-то опытом и тоже более часто какие-то посты публикую. Э, я там сделаю разбор всей этой истории, расскажу, что я про это думаю и как это вообще сейчас будет работать, потому что в целом тема такая, ну, несколько технической, где-то гиковой, и далеко не всем это интересно. Но если вам интересно, то заходите, смотрите. А ещё на правах того, что у нас особо никаких рекламных интеграций в этом ролике нет, я вас отправлю посмотреть наши предыдущие ролики, которые очень интересные, но набрали не такое большое количество просмотров. Например, вы можете поддержать наш канал, если посмотрите ролик про 11 Labs. Игорян очень круто разобрал этот сервис, показал, как он работает, какие есть инструменты, какое их там огромное количество. Поэтому, если вы связаны так или иначе с генерацией контента и хотите автоматизировать его аудиальную составляющую, что важно, то обязательно заходите, посмотрите ролик, поставьте лайк, комментарии и, в общем, на канал тоже подпишитесь, если ещё этого не сделали. К другим инструментам. Курсор. У них новое обновление 2. 4, если я не ошибаюсь. Э, они научились запускать субагентов параллельно. И вроде бы это уже было, а может быть и не было. Но, по крайней мере, в клодкоде, в openде это есть точно. Но вот теперь вот агенты могут тоже параллельно работать в курсоре и выполнять задачки быстрее. Главное, конечно, проверять, чтобы они там друг другу не мешали и единый код не редактировали. Завезли нанобана в курсор, можно генерировать картинки сразу, ну и их куда-то в свой код вкорячивать. Дальше появилась возможность отвечать на наводящие вопросы человеку, а агенту задавать эти наводящие вопросы. Опять же, это всё уже в село агентах есть и в Openкоде, и в Кудкоде. Про OpenКC код тоже, кстати, ролик недавно снимали. Если не видели, гляньте. Э работает, ну, замечательно. В курсоре, наверное, тоже будет работать хорошо. Но что-то здесь курсор, честно, отстаёт от текущего поколения вот этих всех agent harnesses, которые нам дают клод, ээ, antropic и там open cд. Ну и, наконец, а, ну, в принципе, и вот. А, и скилы добавили, да, тоже они переняли, по большому счёту, ээ, историю, которую которая изначально появилась в CLI агенте у клодкода. Ээ, ну, вот здесь вот скилы будут работать, видимо, по какому-то принципу, который был установлен изначально Антропиком, а антропик это всё сейчас уже перепридумал. В общем, некоторая путаница сейчас, я думаю, будет у провайдеров и у компаний, что есть, что название одно, работать будет по-разному. Ну, надеюсь, как-то всё это отполируется в ближайшее время. Далеко

Claude теперь в Excel, а Cursor догоняет конкурентов

от клода не уходим. Ещё одна интересная новость. Клод в Excel доступен на пропланах, наконец-таки. Это, по сути, расширение, которое вы устанавливаете в вот свою программку Excel. И клод прекраснейшим образом работает с таблицами, формулами, всё вам заполняет, прописывает какую-то дату, генерирует и вычисление делает. Было раньше доступно только, по-моему, на entтерпрайз и вот на высоких планах, но завезли впрос в 20 долларов, что, конечно, не может не радовать. Google нам заявляет, что они сделали MCP сервер своего сервиса Sitch, который, э, в таком автоматическом, практически режиме позволяет вам создавать разные дизайны. Я так понимаю, там что-то при помощи бананы генерируется, что-то ещё, какие-то компоненты туда подтягиваются, но вот теперь вы можете, э, по сути все агенты закинуть этот MCP-сервер и тоже вот так автоматизированно создавать разные дизайны. Если вам интересна вот эта вот автодизайнерская какая-то история через тех же Cгентов, то напишите в комменты. Постараемся снять для вас какой-нибудь актуальный ролик на эту тему. GPT 5. 2.

GPT-5.2 бьет рекорды в математике

Новый рекорд в математике. GPT 5. 2 Pro наскорила 31%, и это выше, чем предыдущий максимальный скор очок балл 19%, который был у Gemni 3 Pro, если я не ошибаюсь. И это Front тир 4. Очень сложные комплексные многоступенчатые математические задачки. Не буду долго останавливаться. Вот приведу вам несколько примеров от математиков, учёных, которые, э, на всё это дело посмотрели, на то, как это GPT 52 Pro решает, и своё мнение высказали. Кстати, модели антропика тут уступают значительно. Они, безусловно, потрясающи в кодинг, вайп-кодинг и вот всю эту SVE штуку. Но в математику, очевидно, сейчас GPT 5. 2 заходит лучше. Интересно, что в

AI-приложения обогнали игры по доходам

2025 году - приложения впервые обогнали игры и принесли больше денег, чем все вот игровые мобильные приложения. Сумма всех расходов на и-сервисы составила 85 млрд. Это на 20% больше, чем в двадцать четвёртом году. И в первую очередь всё-таки растёт сектор и ассистентов, и только потом идут всякие там AI content Generator, AI Companion, э, и какие-то такие общие и приложения. В США аудитория ассистентов превысила 200 млн к концу года, и более половины использовали их исключительно на мобильных устройствах. В двадцать четвёртом году таких пользователей было всего 13 млн, то есть сумасшедший рост именно вот такого юзеркспириенса с мобильных устройств. Кстати, знаете

OpenAI и Apple готовят собственные AI-устройства

кто лидирует по загрузкам? Наши любимые Chatт GPT и DeepS. 50% загрузок на Довоском форуме. Ещё одно прозвучало интересное заявление в нашей и тусовке. Э, всё-таки Opena планирует действительно это подтвердили во второй половине двадцать шестого года анонсировать своё первое устройство. И да, это похоже будет вот тот самый Sweet P, этот сладкий горошек, про который я вам рассказывал на прошлой неделе. Тогда это были ещё утечки. Сейчас информация более официальная и более подтверждённая. будет работать на кано кастомном двухнанометровом процессоре, выполнять ей задачи локально, без отправки в облако, что интересно. И Альmн, как мы уже слышали не раз, называет это более спокойным устройством, чем iPhone. Для производства рассматривают китайскую Lux Share или тайвайский Foxcon, не знаю, что это за компания, но вот информация такая, и хотят поставить 40-50 млн устройств в первый год продаж. Смогут ли конкурировать с AirPods? Это, честно говоря, вопрос. И ладно бы AirPods, но дело в том, что и Apple хочет на эту территорию зайти. По данным The Information, ИI, иносимое устройство в формате пина, который крепится на одежду, сейчас разрабатывается яблоком. Внутри будут две камеры, три микрофона. И если проект до релиз дойдёт, то уже в двадцать седьмом году будет он выпущен. И в 20 млн устройств на старте компания целится. хотят примерный размер иметь как Air, так и в таком стеклянном алюминиевом корпусе. Ну вот пока вот на словах мы с вами можем всё это только обсуждать. Ну, конечно, очень страшно на всё это смотреть. Мы видели опыт катастрофически провальный со стороны вот этого Хьюмейна, со стороны Rabbit R1 и ещё там несколько было, честно говоря, устройств, которые хайпили меньше, но умерли также скоропостижно. С другой стороны, если Apple зайдёт сюда всё-таки с и устройством, возможно, какая-то и экосистема подтянется разных приложений, чтобы это там ни было и как бы они там не прилагались и не размещались на этом устройстве. Ну и, возможно, если уже две компании такие крупные будут что-то такое производить, то нет, да и народ начнёт всё это дело покупать. Обычно спрос рождает предложение, но такое ощущение, что эти компании заставят. Кажется, YouTube пойдёт по

YouTube внедряет AI-двойников для Shorts

пути ссора, и это не может меня не огорчать. Меня, в принципе, огорчает то, что мы сейчас с вами видим на Ютубе. Это бесконечное и беспощадное количество шорцов вместо красивой, классной ленты с длинноформатными роликами. Но нет, э, шарцы, конечно, превалируют. В скором времени создатели смогут генерировать ролики со своей цифровой копией, создавать при помощи текстового промпта, экспериментировать с музыкой. будет этот AI образ и можно будет с ним тоже всякие экспериментировать. По сути, то же самое, что Сора. Грустно мне. Ну ладно. Компания внедрила уже технологию распознавания внешности, которая поможет идентифицировать ей контент с изображением создателей, но и позволит требовать удаления неправомерного использования. Чувствую себя дедом, когда сижу тут и критикую перед вами все эти нововведения от даже не и компаний, а вот Алдовых хороших ты труба сервисов. Но есть как есть. Я со своей стороны могу пока что вас уверить, что никакие там и клоны меня и Игоряна не планируют заполонить цифровое пространство. Нам хочется сохранить некоторую живость, идентичность и всех этих симуляров в контенте избежать. Google Photos

Google Photos добавит мемы с вашим лицом

добавляет мемы с твоим лицом. Классное очень, мне кажется, добренькое обновление, которое, ну, в принципе, может народ немножечко заставить пользоваться. Google Photos ми это всё называется. Вот так вот открываете настроечки, выбираете, видимо, вводите какой-то пронт, я так понимаю, текстовый названием того или иного мема и Нанобана всё это переоформляет так, чтобы вы немножко похихикали со своими друзьями, коллегами, родственниками. Как всегда, разумеется, доступно только в США, и то в течение ближайших недель когда-нибудь докатится и до всего остального вот этого отсталого мира. До новых встреч в будущих выпусках. Люди, роботы, привет.

Новости креативных ИИ

С вами Игорян, и это как всегда новости креативных нейросетей последней недели. И самая громкая новость прошедшей недели заключается в том, что DAG GO добавили AI в свой поисковик. Это, конечно, шутка и новость вообще не особо про креативный нейросети, но теперь по ссылочке yai. dak. com можно попасть на версию сайта со встроенным Ии поиском. Ровно так же, как и по этой ссылке, на версию сайта без встроенного ИИ. А теперь к по-настоящему интересным новостям. креативной индустрии.

Krea Real-time Edit

Один из самых громких релизов - это Crea Real Time Edit. Crea уже представляли другие версии Real Time модели. И последнее, что они представляли, было realtime видео, которое выглядело примерно вот так вот. И в целом работало во многом похоже. И про тот, и про этот релиз, кстати, я писал в своём Telegram-канале Креативный совет. Подписывайтесь, если ещё не успели этого сделать. И основное же отличие нового релиза от прошлого заключается в том, что теперь акцент выставлен не на плавность движения между кадрами, а на качество каждого отдельного кадра. То есть теперь у нас получается очень много картинок, которые неплавно друг в друга переходят, но зато каждая по отдельности выглядит очень хорошо. Плюс это всё можно эдитить, то есть, э, преобразовывать, используя живой язык, как, например, нанобана либо GPT imagмиe. Попользоваться можно пока что только в бета-версии, ссылку на которую я оставлял в своём Telegram-канале. Вот она тут. Следующая интересная новость

Qwen 3 TTS: новый open-source

приехала к нам из Китая. Квен вообще радует нас огромным количеством релизов в последнее время. И 3ТС не исключение. ТС - это текст to spech. И они заопенсорсили аж пять моделей. Поддержка десяти языков, включая русский. Прекраснейшее сжатие, практически без потери качества. Ждём, пока модели появятся на арене Tex to Spech. Open source тут пока что аж на семнадцатом месте. Ну и модели позволяют дизайнить голос, создавать кастомные голоса, просто использовать какие-то встроенные голоса. Если вам интереснее подробнее разобраться про то, в чём тут разница, можете посмотреть мой недавний ролик про 11 Labs, там всё то же самое есть. Ну а далее у нас не менее интересный

Разговорный ИИ от Nvidia

голосовой релиз. Nvidia выпускает Real Time Conversational AI, то есть нейросеть, которая в реальном времени без задержки, ну или практически без задержки может с вами общаться. Как вы видите, задержки реально практически нет. Она прямо иногда опережает и работает, как будто бы даже лучше, чем, например, модель от Open AI. При этом модель реально небольшая, всего 7 млрд параметров, и также её можно найти на High Face. Из ключевых особенностей тут то, что модель может слушать и отвечать одновременно, то есть её можно перебивать. И как вы видели, это происходит тут достаточно лаконично, намного лучше, чем в той же самой Gemini. Называется она Persona Plex 7B версия 1. Ну и, как я сказал, всё есть на хагингфейсе. А Flashs выпускают

Flashlabs Chroma: Speech-to-Speech

Chrome 1. 0. И это, как они заявляют, первая open sourceная real time speech to speech модель. В первую очередь модель крута именно в том, как она клонирует голоса. Ну и, во вторую очередь тем, как быстро она это делает. реально маленькие задержки, очень высокий уровень похожести на голос оригинала. Это, если вы не поняли, была симуляция разговора Лекс Фридмана и Илона Маска. Схожесть, конечно, не стопроцентная, но, согласитесь, очень похожа. И в особенности, если учитывать, что она вот в realлтайме генерируется практически без задержки, в общем, результат очень хороший. А многострадальные 11 Labs

ElevenLabs выпускает музыкальный альбом

которых вот так вот уделывают и уделывают, выпускают 11 альбом. И на самом деле это просто такая витринная штука. Elen Labs показывают, что они очень профессиональный сервис, который сотрудничает даже с номинированными на Греми артистами. По сути, они просто совместили свои голоса с музыкой, сгенерированной в Ele. Короче, артисты сгенерировали собственные треки и показали тем самым, что вот нейросети - это круто. И в первую очередь это, конечно же, круто для Laps, но во вторую очередь в целом для EИ, потому что, несмотря на некое фундаментальное неприятие в обществе сейчас я вижу всё больше и больше хейта в сторону чего-то, до чего докасался Ии. Это, в любом случае, наше неизбежное будущее, и эти инструменты будут использоваться всеми. И это подтверждают такие артисты, как Ямсу, Лайзаминели и остальных, честно говоря, я не знаю. А, ну, арт Гарфанкель ещё. Следующая же новость является

Видеоагент Remotion: новый хит

наверное, самой громкой за прошедшую неделю, и это агентная система, которая позволяет создавать видео, и их трейлер - это пример того, что может сделать. Да-да, вот это вот всё сделано автоматически внутри терминала, ну или точнее клодкода. Сеть заполонили красивейшие примеры того, что может делать этот. Вот меньше 2ву часов понадобилось на то, чтобы сделать такую тридцатисекундную анимацию, где, ну, действительно какие-то интересные происходят эффекты, так скажем. Крутейшие, в общем, анимации создаются. И прямо весь Twitter уже заполнен тем, как все, кто только может, делают для своих проектов какие-то прикольные превьюшки. всякие трейлеры. И я думаю, на самом деле, что, наверное, это достаточно крутая тема, чтобы сделать про неё отдельный ролик. Поэтому, если вам интересно, обязательно пишите в комментариях, и в ближайшее время мы ролик выпустим. А Freep выпускает видео

Freepik: ИИ-цветокоррекция видео

Colorгading и нашли чем удивить. Но с другой стороны, хорошо, что это есть в их сервисе. Сгенерировали видос, отлогрейдили его, и он принял более презентабельный, чем нам нужно было вид. Не знаю даже на чём тут можно останавливаться. Как будто ни на чём. Поэтому поехали далее. А далее у нас

Gamma Remix для презентаций

гаммаремикс, про которую я уже рассказывал. И вот теперь она доступна всем. У вас есть готовая презентация, вы просто пишите, как её надо изменить, вот какую аудиторию её нужно адаптировать. И оно всё адаптируется. Добавляется новая информация, убирается ненужное, что-то упрощается, что-то усложняется. Всё зависит от того, что вам нужно. Это как будто бы максимально классная возможность, которая обязательно должна быть в таких инструментах для генерации презентаций. Также выходит Odysseси 2

Odyssey 2 Pro: генерация миров

Pro. Всё больше World моделей, то есть модели для генерации мира, у нас появляется. И их ключевая особенность в том, что они владеют памятью. То есть они запоминают всё, что сгенерировали, и после того, как оно сгенерировалось, оно там примерно и останется. Это, наверное, является главным критерием качества модели, помимо качества самой картинки, насколько у неё хорошая память. Тут картинка всего лишь 720p, хотя это неплохо. С моделью можно, естественно, взаимодействовать, то есть определять, что будет происходить у нас дальше. И это как будто бы первая World Model, которая доступна и в API. И всё это сейчас, конечно, находится на зачаточной стадии. Как сами Odyssey пишут, это GPT2 момент, то есть не особо ещё юзабельно. Можно просто полюбоваться, поиграться и пофантазировать, во что это разовьётся в перспективе. Ну или можно начать что-то строить поверх этой модели. Хотя, по мне, логичнее подождать, пока будут более качественные версии. А LTX в

LTX: генерация видео по аудио

партнёрстве с 11 Labs выпускает audio to видео. Берём картинку, добавляем к картинке audioфайл, и картинка анимируется согласно аудиофайлу и промпту. — Очень крутая парадигма генерации видео. То есть этого прямо не хватало. У нас только появилась генерация видео вместе с музыкой. Но вот генерации по музыке или даже по речи у нас ещё пока что не было. И это, на самом деле, очень крутая и очень применимая штука. Применимая она, конечно, в узких случаях, но как же это классно. намного проще с саунддизайнить какой-то кусок, например, там в 5-10 секунд и потом на основании него сгенерировать видео. В первую очередь ключевое преимущество в том, что теперь не надо будет писать эти промпты, расписанные по секундам. Теперь мы просто создаём аудиодорожку, и эта аудиодорожка уже обуславливает, в какой момент видео, в какой миллисекунде будет происходить какое визуальное преображение, то есть что в какой момент будет случаться. На третьей секунде там какой-то взрыв, на четвёртой секунде персонаж начинает говорить. Очень крутая функция, которая очень хорошо повышает качество контроля над генерацией. Я сам ещё не попробовал, но LTX - это достаточно хороший сервис. Он, конечно же, не прямо передовой, то есть липсинг тут, как вы видите, ну, не самый лучший. От какого-нибудь клинга точно отстаёт. Но и плохо выглядящим это точно назвать нельзя. Как бы в липсинке у нас сейчас модели очень хорошо продвинулись. Очень удобно будет делать каких-нибудь инфлюнсеров. То есть просто сгенерировали там в Леве Лапсе какую-то аудиодорожку, загрузили её, у нас всё анимируется, преображается в видос. Замечательная, по мне, функция. Ну и нанобана в мире 3Dгенерации. Rдин 2

Runway: редактирование 3D-моделей текстом

Edit. Загружаем 3D-модель и редактируем её с помощью текста. Банановый чувак, очки, рука, всё меняем, всё модифицируем, всё изменяется. Ну, по мне, замечательная штука. Я не тдшник, но вот все тдшники прошу такой нанобана момент в мире 3D. Попробовать это можно пока что только у них в сервисе, но скоро обещают подвести и API. И два замечательных обновления от Суна.

Suno: функция Mashup

Во-первых, Mesh Up and Find Out, функция, которая позволяет взять две песни, соединить их в одну и увидеть, что из этого произойдёт. Функция в первую очередь экспериментальная и, наверное, чтобы позабавиться, но для каких-то конкретных случаев и очень применимо, когда мы понимаем, что нам действительно нужно что-то среднее между двумя композициями, мы можем попытаться это сделать, помашапить и с какой-то попытки, скорее всего, оно получится так, как мы это представляли себе в голове. Ну, как минимум, будет хоть чуть-чуть похоже. Суна предлагают нам угорать по жести и мешать мышапы, мышапить мышапы и мышапить мышапы мышапов. Но это, по мне, уже перебор. А вот другая новость, которую представили

Suno: генерация саунд-эффектов

суна - это Sounds. Теперь владельцы pro и премьр подписок смогут по простому промту получать какие-то саунд-эффекты и в том числе и залупленные, то есть зацикленные. Можно выбирать BPM, тональность, всё это потом загружать в студию, использовать как какие-то простые смплы. В общем, для тех, кто создаёт музыку в Суна, либо делает какие-то там трейлеры, клипы, фильмы, это незаменимый инструмент. Вот такая вот неделя по большей степени аудиальная. Кстати, много кто жаловался. Я помню, что мало аудиальных новостей. Вот на этой неделе их прямо подавляющее большинство. Плавно мы как будто бы готовимся к большим видеорелизам, которые я всё предвкушаю, предвкушаю. В целом они тут тоже были. Достаточно интересные релизы, на самом деле, но то ли ещё будет впереди. И на этом новости

Заключение и прощание

подошли к концу. С вами был продуктивный совет. Я Игорян. Дядя Д был в первой половине ролика. Если ролик вам понравился, то подписывайтесь на канал, ставьте лайки, колокольчики, чтобы не пропускать новые видео, и увидимся на следующей неделе. Пока. —

Другие видео автора — Продуктивный Совет

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник