Everything you need to know about The AI Advantage community: https://myaiadvantage.com/community
This week in AI had a pretty clear theme: AI video is improving rapidly and real people are using it in their work now. AI Video is transitioning for "great for making memes" to "great for making ANYTHING".
I'll show off the new Midjourney Video, plus I'll show you two new models from China that are already beating out Veo 3 on leaderboards. I'll top it all off by showing you the wild Kalshi commercial that aired during the NBA finals that was created almost entirely with AI video. All that and more in today's video! Enjoy.
Links:
https://myaiadvantage.com/community
https://www.midjourney.com/explore?tab=video_top
https://seed.bytedance.com/en/seedance
https://pollo.ai/m/seedance
https://artificialanalysis.ai/text-to-video/arena?tab=leaderboard&input=text
https://x.com/higgsfield_ai/status/1935042830520697152
https://x.com/apostraphi/status/1935390819407774032/video/3
https://x.com/ciguleva/status/1935757314096873581
https://x.com/8co28/status/1935497195320655882
https://x.com/Kalshi/status/1932891608388681791
https://www.topazlabs.com/astra
https://x.com/PJaccetturo/status/1932893260399456513
https://ads.tiktok.com/business/en-US/blog/tiktok-symphony-ai-tools?redirected=1&acq_banner_version=73758464
https://x.com/Baidu_Inc/status/1934982099112751197
https://x.com/MiniMax__AI/status/1934637031193514237
Chapters:
0:00 What’s New?
0:46 Midjourney V1
2:18 SeeDance 1.0 & Hailuo O2
2:55 AI Video Comparisons
8:11 Krea 1
8:52 AI Image Editors
10:48 AIA Community
13:15 Viral AI Ad
15:51 TikTok Symphony
16:13 Sales AI Avatars
16:42 MiniMax-M1
#ai
Free AI Resources:
🔑 Get My Free ChatGPT Templates: https://myaiadvantage.com/newsletter
🌟 Receive Tailored AI Prompts + Workflows: https://v82nacfupwr.typeform.com/to/cINgYlm0
👑 Explore Curated AI Tool Rankings: https://community.myaiadvantage.com/c/ai-app-ranking/
💼 AI Advantage LinkedIn: https://www.linkedin.com/company/the-ai-advantage
🧑💻 Igor's Personal LinkedIn: https://www.linkedin.com/in/igorpogany/
🐦 Twitter: https://x.com/IgorPogany
📸 Instagram: https://www.instagram.com/ai.advantage/
Premium Options:
🎓 Join the AI Advantage Courses + Community: https://myaiadvantage.com/community
🛒 Discover Work Focused Presets in the Shop: https://shop.myaiadvantage.com/
Итак, на всякий случай, если вы всю последнюю неделю жили в изоляторе, сообщаем, что за последние несколько дней произошла целая революция в индустрии видеоконтента с использованием искусственного интеллекта. И это включает в себя вирусную популярность рекламы, наконец-то выпущенную компанией Midjourney видеомодель, появление еще двух первоклассных моделей из Китая и многое другое. Обычно мы не уделяем основное внимание каналу по редактированию изображений и видео в этой программе, но на этой неделе произошло столько всего, и всё было настолько значимо, что мы всё протестировали. И, честно говоря, большинство вышедших на этой неделе фильмов и сериалов объединены видеороликами. Итак, я подробно расскажу вам об изменениях на конкретных примерах, чтобы вы быстро освоились и поняли, как расширились возможности этих инструментов, ведь теперь вы будете видеть их повсюду в интернете. И знаете что? Я говорю это не просто так и нечасто, но эти новые обновления меняют всё, что вы, возможно, уже знаете об искусственном интеллекте в видео. Итак, давайте перейдём к сегодняшнему выпуску новостей об искусственном интеллекте, которые вы можете использовать. Итак, как я уже
упоминал, мы рассмотрим несколько тем, новые модели видео, начиная с модели, используемой в середине пути, а затем более кратко затронем модели обработки изображений и редактирования изображений. Но я думаю, что релиз Mjourney превзошел все ожидания, которые, честно говоря, к этому моменту были довольно низкими, потому что на его создание ушло так много времени. Но у Mjourney наконец-то появилась видеомодель, и она выглядит просто потрясающе. Визуальное качество, соответствующее ожиданиям от Mjourney. Им удалось превратиться в свою видеомодель, что просто беспрецедентно с точки зрения художественного качества, которое достигается с помощью этой модели. И не поймите меня неправильно, можно было бы создать множество разных стилей с другими моделями, но этот выделяется, и все в этой сфере, в общем-то, с этим согласны. Посмотрите, например, на некоторые из них. Вы когда-нибудь видели подобные видеоролики, созданные с помощью искусственного интеллекта? Я думаю, у вас их нет, потому что их тогда не существовало. Это просто самое уникальное и творческое поколение, которое мы когда- либо видели в этой сфере. И всё это доступно по тарифному плану за 10 долларов в месяц. Принцип работы таков: вы просто генерируете изображение, как обычно. И по мере выполнения этих действий вы теперь можете превращать фотографии из mjourney в видеоролики. Это также работает для предыдущих поколений, которые, возможно, уже были в вашем аккаунте. На данный момент это ограничивается преобразованием изображения в видео, поскольку основано на поколении Mjourney. Поэтому преобразования текста в видео пока нет. Но это вполне логично, ведь визуальные образы и так были сильной стороной Mjourney. Но помимо этого общего и довольно эфемерного ощущения того, что это просто замечательно и красиво, мы сделали то, что делаем всегда, и пропустили несколько наших тестовых заданий через видеогенератор Mjourney. Это позволит нам объективно сравнить эту модель с некоторыми другими, появившимися на этой неделе, о которых я сейчас вам расскажу, а затем мы вместе рассмотрим все тестовые данные. Итак, на
этой неделе у нас вышло ещё два крупных релиза в сфере видео с использованием искусственного интеллекта. Одна из них — Seed Dance 1. 0, а вторая — новая Hilo 2. Это можно увидеть в таблице лидеров этой конкретной видеоаренды с использованием ИИ для преобразования текста в видео. Танец с семенами на самом деле превосходит VO3. Во времена предыдущего короля люди спорили, что лучше: VO3 или Cling. Что ж, теперь танец с семенем занимает более высокое место, чем оба этих танца. То же самое происходит и при преобразовании изображения в видео. Новый танцевальный трек Seed Dance 1. 0 Zero от Bite Dance (если вы не в курсе, это компания, стоящая за TikTok) также занимает первое место, а Hilio 2 находится совсем рядом. Однако получить к ним доступ не так уж просто, особенно к танцу с семенами
Итак, для тестирования мы использовали комбинацию API- интерфейса, доступного на file. ai, затем модель Hiluo 2, а для модели Seed Dance (не облегченной, а модели Seed Dance Pro) мы использовали Polo AI, и эти поколения оказались невероятно дорогими. Запуск всего нескольких поколений обошелся нам в 15 евро. Кредиты тут же закончились, но вот они. А теперь давайте сравним это с результатами тестирования версии V3. Итак, начнем с V3 и Mid Journey. Давайте начнём с нескольких видеороликов с женщиной и роботом. Анатомия в порядке. Робот выглядит фантастически, в нем есть что-то кинематографическое. Мне всегда нравится рассматривать этот пример с автомобилем, потому что отражения в кузове и движение колёс — отличный показатель того, насколько хорошо модель справляется с быстрым движением и сложными сценами. И этот конкретный пример с прогулкой по пляжу всегда является хорошей демонстрацией анатомии человека. Да, Mid Journey неплохо справляется с этим, но по стандартным показателям производительности он, конечно, не демонстрирует невероятных результатов, хотя дело не в этом. Дело в художественном качестве, которое вы там получаете. Теперь давайте перейдем к рассмотрению Hilu O2 на тех же примерах. Итак, это женщина и робот. И, как видите, руки здесь просто ужасно сделаны. Даже не годится. Даже на этом крупном плане лица видно гораздо больше движения. Я бы сказал, что с лицами у него не очень хорошо получается. Теперь давайте рассмотрим наш автомобиль. Как видите, движения камеры стало намного больше. И это действительно работает. Мне кажется, отражения удачные, смена ракурсов гораздо динамичнее, и колёса выглядят очень реалистично. В общем, весьма впечатляющий результат. И пляжная прогулка. Давайте рассмотрим анатомию. Полагаю, дела у этого проекта пойдут не очень хорошо. Да, это просто ужасно. Так что даже Мджорни лучше разбирается в анатомии. Так что, если вы хотите создавать модели людей, эта модель вам не подойдёт. А теперь давайте посмотрим на новую модель номер один, которую все так расхваливали еще до выхода Mourn. Вот пляжная прогулочная дорожка. И это просто невероятно. Я ещё не видел ни одного поколения. И мы столько раз пропускали эти кадры через все без исключения генераторы видео на основе ИИ, что эта женщина наконец-то повернулась, и это выглядело не так уж ужасно. Посмотрите-ка. Она делает небольшой полуоборот. Она позирует перед камерой. Нужно быть очень придирчивым, чтобы найти здесь что-то, что выглядит явно сгенерированным искусственным интеллектом. Я не говорю, что это невозможно. Я просто хочу сказать, что нужно быть очень придирчивым. Это впечатляет. А теперь давайте посмотрим на фотографию машины вон там. Отражения практически точны. Посмотрите-ка. Для большей наглядности в кадр добавили горящие шины. К тому же, колёса выглядят невероятно реалистично. Я не знаю. Я даже не думаю, что смогу придраться к чему-либо в этом вопросе. Ух ты. «Кошки» — это действительно впечатляющий мюзикл. Неудивительно, что он занимает лидирующие позиции как в преобразовании изображений в видео, так и в преобразовании текста в видео. А теперь давайте сменим тему и рассмотрим несколько примеров преобразования текста в видео. Так что в этом плане Mourney не могут конкурировать, потому что это всего лишь преобразование изображения в видео, но это нормально. Итак, начнём с того, что возьмём за эталон танец семян. Как вам эта женщина-диджей, крутящая пластинки на крыше, в постели с гепардом рядом? И опять же, анатомия довольно хорошая. Я не уверен, что когда-либо видел, чтобы человек танцевал именно так, но, думаю, это неплохо, особенно первые две секунды. А если бы это было в музыкальном клипе, вы бы никогда этого не заметили. И если не считать диджейского сета Pioneer, который, возможно, не совсем соответствует вашим ожиданиям с точки зрения текста, остальная часть сцены выглядит действительно здорово. А ещё у нас есть ленивец в розовых солнцезащитных очках, который лежит на надувном пончике в бассейне. О боже, это одно из лучших изображений анатомии ленивца, которые я когда-либо видел. Так что я не знаю. С точки зрения анатомии, это просто превосходит всё, что мы видели раньше. В этом нет никаких сомнений. Теперь давайте сравним это с моделью Hagu 0ero2, женщиной-диджеем на крыше. Как видите, сразу становится ясно, что это гораздо более динамично. Это панорамный снимок с центром Лос-Анджелеса на заднем плане. Но да, на мой взгляд, в этом случае это даже не так уж плохо. А что насчёт ленивца в бассейне? Посмотрите на этого парня, он просто отдыхает. Теперь это круто. Это весело, но не так хорошо, как предыдущая игра. как вы можете видеть здесь. Так что да, я думаю, здесь главными победителями являются два участника, которые в середине своего пути продемонстрировали совершенно уникальный художественный стиль и видение, которые им удалось перенести из генератора изображений в генератор видео. Я имею в виду, если вам нужно видео для главного раздела вашего сайта, то, вероятно, нет лучшего способа создать его, чем с помощью Mjourney video. И кстати, это также работает с такими вещами, как фильтры Niji и все стили, которые вы могли там создать. Вся красота Mjourney теперь перенесена на видеоформат, чего раньше просто не было. Если бы вы передали эти изображения другим генераторам, они бы просто наблюдали за ними. Они тренировались на реальных видеоматериалах, знаете, хорошо умели делать машины, модели и тому подобное, но не занимались абстрактными, прекрасными вещами вроде этого. А что касается всего остального, то C Dance 1. 0 Pro, несмотря на свою высокую стоимость, обеспечивает такой уровень качества, которого мы раньше не видели, разве что V3 может с ним сравниться. Но я бы сказал, что, если посмотреть на некоторые из этих сравнений, во многих случаях Cance демонстрирует даже лучшие результаты с точки зрения визуального качества. Но VFree поддерживает аудиокомпонент, чего нет ни в одном из этих сервисов. Итак, я думаю, что это три новые модели видео, на которые вам следует обратить внимание. И, по крайней мере, я надеюсь, что этот фрагмент поможет вам переосмыслить ваше представление о возможностях этих инструментов. Поэтому, если вы видите в социальных сетях что-то, что может показаться вам подозрительным, просто имейте в виду, что за последние несколько месяцев эти инструменты значительно улучшились. звук, художественные стили, гиперреалистичные сцены действия и анатомия человека. Всё это доступно любому потребителю, готовому заплатить десятки долларов за создание нескольких сцен, включая вас. Теперь есть еще два момента
Одна из них — это новый генератор изображений, о котором я хотел бы здесь кратко рассказать, а вторая — это возможность улучшать эти видеоролики, созданные с помощью ИИ, и выборочно редактировать только некоторые элементы. Для начала давайте рассмотрим генератор изображений. Компания Craya выпустила новый генератор изображений под названием Craya 1. И я думаю, что он действительно заслуживает вашего внимания, потому что, на мой взгляд, это единственный генератор изображений на основе ИИ, результаты работы которого совсем не похожи на результаты работы ИИ. Думаю, они специально так его тренировали. Это просто такой эстетичный, кинематографический стиль. В некоторых случаях очень четко, в других — очень художественно, но не совсем в том стиле, в котором это делала бы Mjourney. Это просто очень художественный инструмент, отличающийся от Мьюрнни по своему вкусу. Поэтому я посчитал нужным это здесь отметить.
Итак, далее мы поговорим о категории приложений для редактирования изображений. Моя цель здесь — расширить ваше понимание процесса редактирования изображений в чате GPT4, что, на всякий случай уточню, замечательно, но имеет явные ограничения. Например, если вы отредактируете изображение, человек всегда превратится в другого человека. А теперь появились инструменты, позволяющие редактировать изображения, не нарушая при этом целостность некоторых их элементов. Одним из недавних релизов является Flux Context. А на этой неделе выходит новинка от Hicksfield под названием Hicksfield Canvas. В результате мы взяли множество тестовых случаев, протестировали их с помощью различных инструментов, и вы сами можете увидеть разницу между выполнением этой задачи в GPT40 Flux Pro Context и на холсте Хиксфилда. Итак, как вы можете видеть, перед нами женщина в коричневом пальто. А если просто ввести это в GPT40, то изображение будет перегенерировано, код изменится, но при этом изменится и сама девушка. В данном случае ситуация довольно похожа, но если присмотреться, это все равно другой человек. А для обычных людей эта проблема гораздо, гораздо серьезнее. Теперь, если вы сделаете то же самое в контексте Flux, вы получите аналогичную возможность редактирования. И здесь это тоже меняет человека, но я бы сказал, что это происходит несколько тоньше, хотя всё равно это неприменимо, если вы действительно хотите сохранить человечность. Но этот новый инструмент Хиксфилда фактически предотвращает это, потому что здесь можно выполнить так называемое восстановление изображений. И в этом нет ничего нового. Существуют и другие инструменты, которые уже эффективно справляются с этой задачей, но этот работает просто отлично, в том числе и Photoshop. Но если вам нужен видеоформат, то именно этот вариант вам и следует рассмотреть, поскольку вы можете превратить отредактированное изображение в видео одним нажатием кнопки. И в своем рекламном ролике они демонстрируют именно такой результат применения техники импайнинга. Но да, если говорить реалистично, таким образом можно выборочно редактировать отдельные элементы изображения, а затем мгновенно превратить его в видео. И я думаю, что если сравнивать качество и удобство рабочего процесса, то это лучший вариант из всех, что мы видели до сих пор. Компания Hakes в последнее время демонстрирует отличные результаты, и если ваша цель — создавать рекламу с участием людей, то это, можно сказать, их специализация. Но да, все бесплатные программы, включая Flux и GPD4 для редактирования изображений, — это инструменты, которые должны быть в вашем арсенале, если вы работаете с изображениями и видео.
Итак, если вы смотрите это видео, вы прекрасно знаете, насколько утомительно и сложно следить за развитием ИИ и ориентироваться во всех различных интернет-ресурсах, где хранится эта информация. YouTube — это фантастика, но он может вызывать перегрузку органов чувств. На X вы быстро получаете полезную информацию, но она перемешана с кучей тем, которые вам, вероятно, даже не интересны. Я люблю Reddit, но часто кажется, что посты там просто созданы для того, чтобы кто-то попытался что-то доказать миру, поделившись своими знаниями лишь для того, чтобы доказать самому себе, какой он умный. Не всегда так, но если вы хоть немного знакомы с подобными вещами, то знаете, что в этих утверждениях есть доля правды. Я сам тоже искал альтернативу этому. После нескольких разговоров я понял, что мне на самом деле нужна атмосфера старого доброго форума. Наверное, чтобы понять, о чём я говорю, нужно быть хотя бы 25 или 26 лет. Но раньше, лет 10-15 назад, в интернете существовали традиционные форумы с настоящими дискуссиями. Даже старый Reddit представлял собой совершенно другую культуру, чем сегодня: там могли разворачиваться настоящие дискуссии, и вы действительно знали разных пользователей по именам, потому что их не было десятков тысяч. А если вы видели конкретную фотографию профиля, то сразу понимали: «Ого, этот человек создал новый пост». Мне бы очень хотелось это прочитать, потому что то, что они делают, отличается высоким качеством. А еще, как вы, возможно, знаете, мы создали собственное сообщество. Конечно, это сообщество не для всех, и оно платное, но я захожу туда каждый день, и у меня возникает то же чувство, что и в золотую эпоху интернет-форумов. В нашем сообществе люди искренние и отзывчивые, и никто не пишет посты просто для того, чтобы почувствовать себя лучше. Все присутствующие находятся на общем пути освоения этих инструментов, стремясь извлечь из них максимальную пользу для улучшения своей профессиональной или личной жизни. И никакого кликбейта здесь нет, потому что в этом нет смысла. В целом, вступать в сообщество следует только в том случае, если вы открыты для новых идей, можете себе это позволить и вам любопытно узнать о различных возможностях, которые, безусловно, скрывают инструменты искусственного интеллекта. Не все варианты использования очевидны. А если вы пройдете эти фильтры, вам не нужно будет использовать провокационные выражения, чтобы заставить людей кликнуть на руководство или курс. На самом деле люди так не общаются. Так людям приходится общаться, если речь идёт о распределении одного человека на сотни тысяч. Но если вы распределяете одного человека между несколькими десятками или сотнями, вам это не нужно. Таким образом, это создает уникальную атмосферу, которую я сам и многие другие участники очень ценят. И мне просто хотелось на секунду выразить это более по- человечески, немного поворчав на эту тему. Но это действительно место, где можно задавать искренние вопросы и получать на них внятные ответы. Делитесь своими успехами и чувствуйте, что вас действительно слышат, проходя этот путь приобретения и развития навыков в области генеративного искусственного интеллекта вместе с другими, кто находится на том же пути. Итак, если вам нравится этот канал и вы ищете место, где можно пообщаться с другими людьми, которые так же, как и вы, интересуются генеративным искусственным интеллектом и его возможностями, то это именно то, что вам нужно. Именно поэтому мы и создали это сообщество. Ладно, это всё, что я хотел сказать. А теперь перейдём к просмотру
видео. Итак, вкратце, я хочу немного поговорить об этой рекламе, которая стала вирусной в интернете. Это безумная реклама, полностью сгенерированная с помощью Vreee. А прежде чем мы начнём говорить о том, как это было сделано, давайте просто взглянем сюда вместе. Индиана победит, детка. Мы находимся во Флориде и спрашиваем людей, на что они ставят деньги. Я полностью поддерживаю команду из Оклахома-Сити. В Индиане живет настоящий бойцовский дух. Вырастут ли цены на яйца в этом месяце? Думаю, мы достигнем отметки в 20 долларов. Как вы думаете, сколько ураганов будет в этом году? Это же просто невероятно! Думаю, вы поняли суть. И вот, обычно на этом канале мы начинаем критиковать визуальные детали этих моделей, сравнивать их, но, честно говоря, в этом сюжете я показываю и акцентирую внимание на этом, потому что это демонстрирует, что для потребителя это на самом деле не имеет значения. Если контент привлекательный и интересный, то это не имеет значения. Если вы, например, остановили один из первых снимков, то что, чёрт возьми, происходит с её лицом? Почти никто этого не заметил. Это просто работает. А дело в том, что здесь аудио играет гораздо более важную роль в повествовании. Kelshi позволяет вам легально торговать чем угодно. В конечном счете, это реклама сайта азартных игр, но вы можете просто сделать эти вещи. И мне очень нравится видеть этот успех, потому что он действительно подчеркивает открывающиеся сейчас возможности. Эти инструменты скоро появятся, и мы будем о них рассказывать. А если вы готовы немного поэкспериментировать, то VFree существует уже месяц. Если у вас есть хорошие идеи и вы используете инструменты, о которых мы говорим в этой передаче каждую неделю, то у вас есть шанс завоевать часть этой новой доли рынка. Если вас это интересует. В заключение я хотел бы обратить внимание на создателя этой рекламы, который подробно рассказал о том, как он её создал. Всё это было сделано за 2 дня, и он предоставил нам как сам процесс, так и подсказки, а также концепцию, лежащую в его основе. Да, важно отметить, что тот факт, что это доступно и осуществимо, не означает, что это под силу каждому. Но мне эта часть показалась самой интересной. Он провел анализ от трех до 400 поколений, в результате чего получилось 15 пригодных для использования видеороликов, все они были созданы им самим. Поэтому, даже если вы пытаетесь сделать что-то подобное, не думайте, что вы можете просто сгенерировать два бесплатных клипа и получить конечный результат. В его случае, даже если предположить, что он использовал минимум 300 клипов, он применил лишь 5% от общего числа своих поколений. И это произойдет только в том случае, если у вас есть четкое представление о том, что вы хотите создать, а это, конечно, сначала нужно продумать. В противном случае, вы просто балуетесь. В общем, очень интересная история. Вирусные результаты получены с помощью общедоступных инструментов. Если эта новость вам сегодня не пригодится, то вся информация доступна и задокументирована в открытом доступе. В общем, это просто фантастическая новость, которую вы можете применить на практике уже сегодня, потому что не только модели, но и рабочий процесс, и подсказки уже доступны, и вы можете просто воспроизвести их или использовать в качестве источника вдохновения.
Итак, в сегодняшнем блиц-обзоре у нас несколько интересных новостей, в том числе тот факт, что TikTok еженедельно внедряет новые функции искусственного интеллекта. У них появилась новая штука под названием TikTok Symphony, которая, по сути, превращает изображения в видео. Итак, TikTok действительно полностью поддаётся тренду ИИ и заявляет: «Мы не просто поощряем контент, сгенерированный ИИ, на нашей платформе. Мы предоставим вам инструменты для его генерации прямо на нашей платформе». Далее
у нас есть очень странный факт: в Китае всё чаще эти сгенерированные ИИ аватары используются для онлайн-шоппинга. Возможно, вы слышали, что это очень популярно в Китае. Это своего рода система продаж в стиле QVC, но в социальных сетях. И на этой неделе некоторые из ведущих стримеров из Китая начали использовать аватары, чтобы заменить себя. Таким образом, теперь они могут вести прямые эфиры круглосуточно. И этот конкретный стрим с ИИ-аватаром набрал более 13 миллионов просмотров всего за шесть часов. Невероятно. Будущее действительно уже здесь. Затем у нас есть
ещё одна новая логическая модель LLM из Китая. Она полностью с открытым исходным кодом, включая открытые веса. Вы можете увидеть некоторые результаты здесь. Это ничего революционного, но достаточно значимого, чтобы упомянуть, примерно на одном уровне с моделями глубокого поиска, которые уже существуют. Доступно. Думаю, самое интересное в этой модели — это то, что у неё есть 1 миллион контекстных токенов, что при таком уровне производительности и открытом исходном коде действительно впечатляет для любого, кто сможет использовать эти токены. И это практически всё, что у нас есть на этой неделе. Этот выпуск был очень насыщен изображениями и видео, созданными с помощью ИИ. Обычно эти эпизоды больше посвящены программам магистратуры в области гуманитарных наук. Но если происходит революция, и если она происходит в гениальной сфере, мы здесь, чтобы её осветить. Надеюсь, что-то из этого было для вас полезным или вдохновляющим. И с этими словами, меня зовут Игорь, и я желаю вам прекрасного дня.