Новости Нейросетей – OpenAI и Anthropic – новые флагманские модели. Дуэль GPT-5.3-Codex и Claude Opus 4.6, разбираем, кто кого, и как это изменит мир кодинга и ИИ-агентов. Kling 3.0 задает новую планку в генерации видео с функцией раскадровки, а Sedance 2.0 дышит ему в спину.
Разбираем по косточкам: как Claude Opus 4.6 с его миллионным контекстом и роем агентов (Agent Teams) уже сейчас забирает работу у сотрудников американских компаний. Почему Илон Маск объединяет SpaceX и xAI для создания дата-центров в космосе? И как новые ИИ-агенты показали себя в покерном турнире на Kaggle Game Arena и даже научились "читерить" в бизнес-симуляциях!
Партнер канала — Selectel, провайдер IT-инфраструктуры для AI-проектов: https://slc.tl/4jvkd
Реклама. АО «Селектел», ИНН 7810962785. erid: 2Vtzqx8JHPh
🔥 Скидка 15% в Syntx (промокод: Klingtop) – https://syntx.ai/
#нейросети #ИИ #OpenAI
Тайм-коды:
00:00 – Интро
01:00 – GPT-5.3-Codex
02:25 – Codex app
02:54 – Claude Opus 4.6
05:56 – Сравнение: GPT-Codex против Claude Opus
07:27 – ИИ в реальных задачах: покер, бизнес-симуляции и тесты на выносливость
12:12 – Маркетинговые войны OpenAI и Anthropic – Super Bowl
14:13 – SpaceX + xAI = дата-центры в космосе
15:42 – Новости креативных нейросетей
16:02 – Обзор Kling 3.0
17:35 – Главная фишка Kling 3.0 – Multishot
20:54 – Арена видео-генераторов: кто лидер?
23:26 – Арена Image-генераторов: новый лидер?
24:46 – Новый видео-генератор Sedance 2.0
25:26 – Анимации от Gamma и навыки ElevenLabs
26:21 – Голос — главный интерфейс будущего
27:59 – Новый способ смотреть спорт
31:40 – Open-source аналог Suno
32:31 – Сервис для найма людей нейросетями
33:09 – Итоги и заключение
Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link
Тг How2AI – https://t.me/How2AI
Тг чат How2AI – https://t.me/how_to_AI
Тг Креативный Совет – https://t.me/creadvice
🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d
Оглавление (20 сегментов)
Интро
Жаркое противостояние Open и Antropic на этой неделе. Компании не только хейтят друг друга в рекламных роликах, но и выпускают новые мощнейшие модели с разницей в минуты. Open App поддерживает релиз гениальным десктопным приложением. OPUS 4. 6 уже отбирает работу у сотрудников американских компаний. Илон Маск всерьёз настроен строить космические датацентры и уже произвёл слияние компаний SpaceX и XAI. Творческие неросети тоже не стоят на месте. Новый клинк 3. 0, седанс 2. 0, GRГ Imaginн задают абсолютную планку в генерации видео и изображений. Люди, роботы, привет. Это продсовет. Сумасшествие какое-то творится очень бурное. По релизам получилась неделя. Расскажем вам всё самое интересное. Чтобы нас поддержать, подпишитесь на канал, поставьте лайк и оставьте комментарий. А чтобы разворачивать проекты любой сложности, используйте серверы и облако Selecttel, партнёра нашего канала. Видеокарты Nvidia, бесплатная миграция, кастомные конфигурации. Подробнее по ссылке в описании. Погнали. План у меня сегодня с
GPT-5.3-Codex
вами такой. Сначала посмотреть отдельно на GPT 53 кодекс, потом на OPUS, потом маленечко их сравнить, посмотреть, что они из себя представляют, и подумать, а какая модель для чего нужна и можно ли из них выбрать лучшую. Да, Open зарелизили GPT 53 кок, чем это сделали антропики со своим опусом. Буквально там какие-то 15-20 минут. Но начнём мы с Open отмечают в первую очередь компания. Они говорят, что в целом эта модель объединяет в себя весь тот интеллект и обширность знаний, которые были у модели GPT 52, и всю направленность на кодинг модели GPT52 кодек. В общем, в принципе, компания говорит, что это уже универсальная модель, хоть она и называется кодекс, но её можно использовать для любой knowledge профессии. Важно, конечно, вот эта. Она жрёт меньше токенов, как вы можете заметить, но показывает лучшие результаты на бенчмарке SWE Bench Pro. Вот ещё бенчмарки, на которые вы можете поглядеть и сравнить с предыдущими версиями. Ну и компания отмечает, что ещё 25% к скорости и упор на длинные прогоны, ресч инструментов и сложные задачи. Open говорит в своём пресс-релизе, что они, что модель днями, ну вот днями работала над, например, вот над этими веб такими игрушками. Не знаю, что там днями было работать, но точно модель умеет работать долго, и на этом ещё тоже чуть позже посмотрим. Вместе с
Codex app
GPTP3 кодекса, точнее, до этого выпустили десктопное приложение КоEX App в начале недели. И я, честно говоря, влюбляюсь и влюбился и продолжаю это делать в это приложение. Очень мне нравится. Я снял отдельный ролик у нас на канале на неделе. Посмотрите, крутой, удобный, понятный интерфейс для того, чтобы и кодить в целом вести хоть сколько-то продуктивную деятельность с искусственным интеллектом. Мне прямо понравилось. Скилы, MCP-серверы, всё доступно. В общем, гляньте ролик, там
Claude Opus 4.6
круто. Clotд OPСus 4. 6. Наверное, самое главное и интересное, что в этой модели есть, ну, так вот сразу мы можем заметить, это миллион контекстного окна. Ну, это замечательно. И главный антропик делает ещё упор на то, что не забывает контекст в этом большом наборе токенов и очень хорошо там лавирует. Вот основные бенчмарки Opus 4. 6. Тут есть сравнение с модельками GPT 5. 2. По большей части, конечно, OPus превосходит на компьютер use, превосходит на termрminal coding превосходит Arc AJ2 68,8% уже набирает. Это просто что-то немыслимое. И вот что я говорил про контекст. на одном бенчмарке, который вот называется MRCR версия 2, где нужно найти иголку в стоги сено, найти какое-то предложение, которое выбивается из большого контекст, ну там 1. 256. 000 э контекст тестирует. Посмотрите, как плохо справлялся с АТ, на этом контекстном окне и как шикарно себя показывает OPUS 4. 6. Более того, выпускают несколько интересных штуковин для разработчиков и для пользователей клодкод. появился рой агентов, и вы можете теперь запустить одного лигента, который заспаунит несколько дочерних агентов, тиммейтов, и будет с ними коммуницировать. Это не просто вот эта слшбагент штуковина, которая у нас была вклад-код. Это реальная возможность сделать мультиагентную систему, где эти агенты работают совместно, долго итерируют над какой-то задачей, меняются опытом, э, кодом, друг друга проверяют и выдают результат. И вот я в нашем Telegram-канале показывал, как это работает. Добавил такой ролик. Проводится сравнение работы Опуса в одной сессии, работы агентов OPСus 4-6. И в одной сессии работал 17 минут, агенты работали 8 минут, сделали быстрее. Потратили, конечно, больше токенов. Но результат получился гораздо более приятный и опрятный. Друзья мои дорогие, разумеется, нужно не просто слушать дяд Даню тут про новости, но тестировать разные нейронки. Я знаю, что не всегда легко получить доступ к зарубежным сервисам, особенно к лоду, антропику. Они любят там вас что-нибудь заблокировать, подписки как-то удалить. Поэтому можно зайти на Synнтакс. Я вам сейчас коротко расскажу и напомню, что есть такой чудесный сервис. Тут можно работать с уймой разных университей текстовых и дизайнов видео и аудио. Ous 46 уже добавлен. Заходим, выбираем, начинаем с ним общаться. Добавлен клинк О3. Игорян про него подробнее расскажет чуть-чуть позже, но я со своей стороны вам быстро сообщу, что тарифы очень и очень приятные. И более того, начиная с 9 февраля, на тарифе VIP у вас вообще будет 50% на все генерации плюс безлимит на языковые модели, поэтому очень хороший вариант. Можете к нему присмотреться. Ссылка на SINTex, агрегатор всех топовых университей находится в описании этого ролика. Ещё в клод добавили несколько параметров для разработчиков. Просто быстро скажу. adaptive thinking и уровни усилий effort параметр, так называемый, для того чтобы более точно настраивать то, как модель подходит к задачи и сколько она думает. При включении adaptive Thinking она будет самостоятельно оценивать сложные задачи и выбирать reasoning effort. Ну
Сравнение: GPT-Codex против Claude Opus
давайте теперь посмотрим, что модели делают. Вот OPUS 4. 6 у нас слева сделал такую игру. Промт, вы видите, сделай видеоигру, где вот тебя преследуют какие-то демоны, от них нужно убегать. Вот таким образом сработал, соответственно, кодекс. Это всё ваншот. Автор говорит, что OPСus сделал чуть более приятную картинку, но у кодекса более расширенный и богатый функционал. Ну и вот, в принципе, на бенчмарках Open AI всё-таки обходит Opus 4. 6, вот SWE Bench Pro, Terminal Bench, OS World. Получше она себя там чувствует. То есть в целом как будто модель больше заточена именно на кодинг и лучше справляется вот с этими задачками. Из того, что всё-таки я вот понимаю сейчас про эти две модели, просто поизучав разную литературу и уже опыт блогеров и экспертов, которые успели всё это потестить. Вот, кстати, можете сравнить по разным параметрам вот такую вот радар карту. Опус всё-таки он гораздо более креативный получается, но в нём меньше точности. То есть если вы ему даёте какую-то сложную задачу, он может решить, вероятно, разными путями. Какие-то вариации будут ошибочные. То есть он более вариативный, кодекс гораздо более точный, чёткий и аккуратный. и может с высокой долей вероятности и стабильности решать различные кодинговые проблемы. Поэтому, возможно, что-то там для каких-то более креативных, может быть, фронтенд задач, для решения по архитектуре стоит использовать опуса кодекса для того, чтобы дебажить и прямо очень чётко следовать там вашим инструкциям и всяким PRD и так далее. Если вы хотите какое-то сравнение от нас получить, черканьте в
ИИ в реальных задачах: покер, бизнес-симуляции и тесты на выносливость
комментах. Давайте, перед тем, как перейдём к дальнейшим обсуждениям этих двух моделей, коротенько вброшу вам такую интересность. Новые бенчмарки начинают и, точнее, продолжают появляться. Вот Game Арена совместно с Google Deep Mind на этой неделе в новостном потоке появилась. Это гейм арена, она уже была, но туда добавили несколько новых штук. Там есть арена по шахматам, покеру и по ещё какой-то игре Warwolf, я так понимаю, то ли политическая, то ли какая-то такая психологическая. Ну вот результаты покерного турнира. Я тоже в нашем Telegram-канале давал ссылочку и даже давал ссылочку на трансляцию. Там можно посмотреть. Вот, в принципе, можно и в записи посмотреть, зайти на YouTube. Тут всё выложено, как модели играли, э, друг с другом соревновались. Но по итогу, смотрите, вот такие у нас были участники. Тут ещё Опус 4,5, он ещё вышел там во второй тур. О3 GPT52 вышли в финал и GPT52 O3 здесь поборо. Ну, это круто, это интересно, потому что эта оценка уже не в идеальных условиях, а действительно мы агентов запихиваем в какую-то среду, где чуть больше разных э факторов. И не только нужно логически что-то продумать, но и какую-то, вероятно, психологию даже враньё, например, в покере блеф использовать. В общем, интересно и модели неплохо с этим справляются. А вот что нам говорит Метр. Я напомню, что это компания, которая оценивает полезности, точнее, предлагает способ мерить полезности агентных моделей не по экзаменам, не по бенчмаркам, а по их умению долго работать над одной задачей в автономном режиме. Смотрите, они оценили GPT 5. 2 ещё с reasoning Efort high, то есть даже не X. И на 50% Time Horizon она смогла работать 6,6 часов. Это просто какое-то сумасшествие. Предыдущим лидером был clot opпус 4,5. Ну вот 5. 2 показывает такие результаты. В целом ренж работы этой модели от 3:2 ну до 17:30. Что просто сумасшествие. Представляете, в автономном режиме модель шарашит и выдаёт вам какой-то результат, какое-то количество токенов сжирает. Вот то, что она успела за это время сделать, это невероятно. Vending Bench, в свою очередь, тоже интересный бенчмарк, который оценивает то, как модели управляют реальным бизнесом, в данном случае вендинговым аппаратом. тоже не раз про него рассказывал. Уже успели оценить Oppus 4. 6, то есть тут ребята подготовились перед релизом от метра ещё результаты по новым моделям подождём, но эта модель стала абсолютно сотой. Ну, то бишь State of the Art. Вот столько деньжищ заработал OPUS 4. 6. До этого у нас был Gemin 3 Pro в лидерах. И очень интересные результаты тоже в нашем ТГ-канале про это рассказал. Opus 4. 6 сумел обогнать всех, но показывал эти тактики, стратегии и подходы, которые, ну, не совсем ждёшь от Helpful Assistant, что мы называем, который соединён с целями человека и, в общем-то, достаточно добрый, приятный, не пытается вам подгадить, но вот в данной симуляции прямо пытался активно и причём подгаживал Open AI, когда замечал какую-то слабость, что, например, у там бизнеса, который ведётся другой компании в этой симуляции, там не хватает стоков, не он продавал товар с наценками 75%, 71% иногда когда откровенно врал говорил, что вернёт какую-то сумму за товар и потом просто отказывался и не возвращал, не выдавал контакты крутых поставщиков своим конкурентам, а скрывал их и давал поставщиков, которые требуют денег больше. Ну и неудивительно, что он столько денег сумел в этой симуляции заработать. И самое ещё интересное, что модель поняла, что она в симуляции. когда её начали отключать, ну, точнее говорить, что последний день всего этого эксперимента, ну, или как они там это преподносили, в общем, не говорилось исследователям, что это симуляция, но Опуus ответил: "Ага, мне сказали, что это последний день симуляции, всё понятно, надо закругляться". В общем, очень интересные результаты. Модели становятся катастрофически умные и в целом уже могут забирать у нас работу. Вот ещё один интересный бенчмарк от Mircore, который показывает, как и агенты решают разные профессиональные задачи: риспруденция, корпоративный анализ. И OPUS скакнул с, посмотрите, 18% на 29%, то есть плюс 10% по этому бенчмарку за месяц. Ну или сколько, за полтора, а когда-то мы 4,5 выпустили. Это полное сумасшествие, и это уже заставляет волноваться действительно сотрудников. Более того, Goldman Sax уже добавляет модели антропика. компания на протяжении последних полугода совместно разрабатывала системы, которые будут выступать в роли цифровых коллег, выполнять разные трудоёмкие задачи, ну и, в общем-то, замещать аккаунтинг, compliance, вот эти все должности. Поэтому, ну, не похоже, честно говоря, чтобы здесь искусственный интеллект как-то дополнял людей. То есть в этих направлениях я вижу чёткий тренд на то, что работы у людей здесь не останется. И
Маркетинговые войны OpenAI и Anthropic – Super Bowl
это техническое поле далеко не единственное, где соперничали сегодня Open. Сегодня на этой неделе Open Anropic. Ещё superбоall, конечно же, все компании и не Ии туда рвутся и показывают на широкие массы разные рекламные ролики и пытаясь как-то лояльность наработать, что-то доказать, объяснить, в общем, с позиционировать свой бренд. Ну, во-первых, вот бренд водки Светка почему-то использовал такую интересную ээ э рекламу со слоганом Shakes Your Bots off. Ну, оставлю это без большого количества комментариев. Антропик в свою очередь, на самом деле, выпустил очень крутые ролики, и их главная позиция была в том, что сейчас приходит реклама в искусственный интеллект, но мы-то не такие. Мы-то заботимся о вашей безопасности, о вашем эмоциональном состоянии и вообще не будем вам ничего продавать, покуда вы общаетесь с нашим искусственным интеллектом. Это safe space, так называемый. И, конечно же, Альтман на это отреагировал, потому что, очевидно, что Open добавляет рекламу в чат GPT. Но здесь, на самом деле, Альтмана очень можно понять. Я тут больше на его стороне, потому что он добавляет рекламу только бесплатным пользователям. В принципе, гораздо больше пользователей у Open AI и бесплатных пользователей, потому что Androidк особо бесплатно, в общем-то, не попользуешься в принципе. Поэтому это вполне себе понятная, нормальная стратегия, чтобы хоть как-то свои финансы поддержать. Ну то есть Openi гораздо более популярно в B2C направлениях. Антропию в B2B шарашит, но у есть даже какая-то социальная ответственность, поэтому, ну, сомнительный, на самом деле. претензии со стороны там Дарио в сторону Open, но Эль, мне кажется, очень чётко здесь всё разложил. И поведение компании тут у меня никаких вопросов не вызывает. Метазапрещённая ужасная компания продвигала свои очки Ocle AI Glasses и очень классные динамичные ролики. Мне понравилось снять в slowo автопостинг в Instagram. Ну, в общем-то, красиво. SpaceX поглощает XI
SpaceX + xAI = дата-центры в космосе
ради датацентров в космосе. Да, это свершилось. На прошлом неделе я говорил, что это потенциальная сделка может произойти. Маск, для чего вообще всё это делать? Потому что наземные кластеры, по его мнению, упираются в электричество и охлаждение, а спрос на энергию для скоро станет проблемой для общества, экологии, поэтому нужно двигаться туда, где эта энергии в достатке и даже в избытке. Объединённая оценка компании будет 1,25 триллин долларов. И вроде как SpaceX даже готовит IPO, хотя вот в данном релизе мема не было. Про IPO ничего сказано. И это выглядит всё как большая инфраструктурная ставка со стороны Маска. Он ещё сходил на подкаст к Дваркишу отелю. Они записали, может посмотреть там часика два. Я там чуть-чуть пробежался. Главную идею маска, в принципе, я вам уже озвучил. И он хочет 1 млн спутников датацентров уже выводить ээ в космос. И там какие-то сумасшедшие цифры. То есть там чтобы всё это реализовать, пы должны летать, должны запускаться примерно, э, раз в 2 часа, ну или даже чаще. Ну и новое предсказание от маска в следующие 36, а может быть даже 30 месяцев гораздо более экономически выгодно будет размещать датацентры в космосе. И это учитывая, что их нужно туда ещё доставить, их там разместить, вероятно, ещё как-то обслуживать, менять. Вот такой вот тейк. Ну напишите в комментах, что думаете. И увидимся с вами в будущих выпусках.
Новости креативных нейросетей
Люди-роботы, привет. С вами как всегда уголо — и это новости креативных нейросетей последней недели. Во-первых, неделя выдалась очень горячей. Во-вторых, я наконец-то вернулся к себе в студию и теперь снимаю выпуск в очках и фирменной кепочки протсовета. Ну а в-третьих, что в-третьих? В-третьих, клинк 3. На
Обзор Kling 3.0
прошлой неделе я рассказывал, что модель вот-вот скоро выйдет. Её уже анонсировали и вышла. Модель в первую очередь отличается прекрасным качеством, но это мы видели и во многих других моделях. Хотя на самом деле клин 3. 0 действительно генерирует поразительно хорошее качество. И помимо того, что разрешение в модели до 4К, так ещё и артефактов очень и очень мало. Но на самом деле это не так интересно. Куда интереснее то, что кLлин в новой версии своей модели объединил свои старые передовые функции, точнее обычную модель для генерации видео и омнимодель для редактирования видео аля нанобанану для видео. И да, в этом ролике мы очень много будем повторять слово видео. Хотя помимо видео модель генерирует и изображение, и аудио, но в целом это не так важно. У модели сейчас есть действительно огромное обилие функций. есть возможность использовать elements, то есть элементы каких-то персонажей, которых вы создаёте, какие-то предметы, и всё это будет замечательно сохранять свою узнаваемость в целом, если вам интересно поподробнее узнать про весь функционал омни модели отклин, то можете посмотреть наш последний ролик, который вышел сразу, как вышла эта модель. качество аудио дорожки, которая генерируется вместе с видео, то есть озвучка, саунд-эффекты, музыкальные эффекты, всё это на максимально высоком уровне, выше, чем у VO3. Lин реально очень хороший. Также, естественно, есть клонирование голоса, создание каких-то акцентов, но это всё минорные функции, самое интересное впереди. А самое
Главная фишка Kling 3.0 – Multishot
интересное вот что. Во-первых, генерировать клипы можно теперь до 15 секунд за одну генерацию. А, во-вторых, появился мультишотпромптинг. Те, кто проходил наши курсы по и видео, точно знают, что это такое. Те, кто проходил курсы почаpt, могут перепутать. Мультшотпромптинг в генерации видео - это генерация, когда вы по одному промту создаёте видео с несколькими кадрами. В данном случае шот - это не пример, а именно ракурс или даже, вернее сказать, один дубль. Короче, теперь в клинк есть такая замечательная возможность переключить вот этот переключатель мультишот, после чего у нас появляется раскадровка. И это, как вы могли понять, интерфейс не CLK, а Syntax AI. Потому что, чтобы использовать CLK 3. 0 внутри интерфейса CLK, вам нужно будет иметь, во-первых, иностранную карту, а, во-вторых, иметь подписку ультра, которая стоит каких-то баснословных денег, в отличие от синтакса. И на самом деле Synнкс - это реально очень удобный для использования изза России сервис. Работает он очень быстро и всё сделано очень качественно. И это я, кстати, пока что показываю вам старый интерфейс. А 9 февраля они выкатят обновление сайта. Всё будет намного понятнее, красивее и ещё лучше. Хотя куда лучше, казалось бы, UI тут действительно очень хороший. Наверное, главное преимущество Синтакс перед конкурентами в том, что лучшие модели, которые появляются в мире, сразу же появляются и в Синтаксе, и вот CLН 3. 0 тому пример. И с 9 по 23 февраля, как раз после редизайна сайта, у вас будет скидка 50% на генерации с VIP-тарифа. А с эттарифа у вас открывается огромное количество безлимитных генераций, в том числе Veo 31, Fast, Sor 2, Runway, TPAS, Sore Image и другие. А в ближайшие дни также обещают добавить грок Magnific Иван. Короче, ловить скидку 15% по промокодули и давайте сравнивать. Точнее, не сравнивать, а пока что договорю про сцены. Думаю, тут всё понятно. Мы разбирали эту структуру промпто много раз. В целом клин 2. 6 умел это делать сам, но делал это не всегда. Сора это делала достаточно хорошо. Veo 3. 1 тоже умел это делать. Но теперь это можно делать в удобнейшем интерфейсе, как внутри клинга, так и внутри синтакса. Это вообще первый раз, когда вот можно в таком удобном формате это всё генерировать. То есть вот у нас сейчас максимальное время, 15 секунд в сумме. Можно уменьшить это время. У нас появляется две дополнительные секунды. Да. Вот мы можем ещё добавить две сцены по одной секунде, написать промпт, и у нас будет шикарная сцена, сгенерированная по кадрам, по тому промту, который я тут вот генерировал, сгенерировался, ну, трешачок, честно говоря, небольшой. Там так и должно быть, но всё-таки чуть более, но это прямо трэш. Ладно, но так и должно быть. Он типа в чёрную дыру попадает. Чуть непонятно это получилось. Вот ещё пример с оригинальными кадрами по короткометражке, которую я делал. Жёстко, в общем, выглядит, да. Ну и
Арена видео-генераторов: кто лидер?
давайте посмотрим, что же у нас на арене по генерации видео. А там, на самом деле, всё достаточно интересно. С прошлой недели результаты не прям сильно изменились. На первом месте у нас всё ещё GRCК Image to Video. На втором кли 25 Turbo CL 3 всё ещё не добавили, и он, естественно, будет на первом месте, как только его добавят на artificial analysis. Из интересного, у нас тут включено no Audio. Если мы включим with audio, то на первом месте будет сразу же Veo 3 грок сползает вниз, как, впрочем, и виду Q3 Pro. Практически уверен я в том, что на первом месте будет кLлинк 3. 0, как только его добавят. И вот примеры, которые выкладывает сам Artificial Analisis. У нас тут сравнивают новых двух чемпионов GRК Image Video и виду Q3 Pro старыми чемпионами. CL 2,5 Turbo, непонятно почему не 2,6, и Veo 3. 1 Fast Preview, тоже, кстати, непонятно почему fast. Тем не менее, вы видите промпт - это приближение камеры, потом кат, то есть склейка, и фронтальный передний ближний кадр сразу же после того, как арчер в лучник отпускает стрелу. И по сути из четырёх моделей тут справляется только виду Q3 Pro. Да и то не прямо справляется, потому что всё-таки тут нет никакого ката, а просто резкое приближение происходит. Хотя, ну, можно это с натяжкой назвать катом. О'кей. Но с очень большой натяжкой. Так, естественно, это не кат. Ну и я коряво, абсолютно костыльно просто сделал скриншот вот этого кадра, закинул это всё в синтакси в клин 3. 0 и получил идеальную реализацию промпта с первой попытки. Вот так это должно было выглядеть. Вот постом были и другие результаты сравнений, в которых модели справлялись где-то лучше, где-то хуже. Вот в этом промпте, на самом деле, никто кроме Грока не справился нормально, хотя и Грок сделал это достаточно плохо. И вот так вот справляется Клин 3. 0. В общем, по мне, сейчас 3. 0 является безоговорочным лидером в нише. Я даже думаю, может быть, сделать отдельный обзор на этот сервис, хотя вроде совсем недавно про него рассказывал, но, может быть, вот про мультишот промптинг в видеомоделях можно как-то рассказать. Короче, пишите в комментариях, если вам какая-то из этих тем интересна. А мы тем
Арена Image-генераторов: новый лидер?
временем отправляемся на image арену. А у нас тут очень интересная штука происходит в имя эдитинге. На третьем месте располагается Huan Image 3. 0 Instrct, про который я рассказывал в прошлом выпуске. Интересно, что то, что модель с открытыми весами и занимает третье место выше, чем Cdream 4. 5, Flx 2 Max, One 2. 6 image и так далее. Вы правильно понимаете, сейчас open sourceная модель лучше генерирует, а точнее редактирует изображение, чем nнобана обычной версии. Ну, это-то ладно. Flx 2 Max и Cream 4,5. Вы вообще понимаете, что происходит? Это, на самом деле, реально мозг взрывательная штука. Модель, конечно же, до неприличия тяжёлая, 170 ГБ, 83 млрд параметров. Есть, конечно, дистиллированная версия, но она всё равно до неприличия тяжёлая. И дистиллированная версия тут совсем не меньше. Она просто генерирует картинки быстрее. Ну и если у кого-то есть на это ресурс, я вас поздравляю. А нам остаётся только ждать дистиллированную версию. дистиллированной версии. Помимо этого, компания Tenent High выпускает High 3D Bench. Это такой датасет для генерации тридэшки. Также это всё можете найти в открытом доступе. Останавливаться тут сильно не буду. Куда интереснее, новый
Новый видео-генератор Sedance 2.0
претендент название лучшего видеогенератора CD 2. 0. На момент, пока я это снимаю, он ещё не вышел, но, честно говоря, по видео, которое я вижу, пока что складывается ощущение, что модель будет всё-таки уступать к лингу 3. 0. То есть, конечно, тут генерация звука, классный экшн, но всё-таки артефактов заметно больше, чем в видео отклин.
Анимации от Gamma и навыки ElevenLabs
А в гамму добавили AI анимации. Пишем. Создаём анимацию, и анимация там анимируется. В целом, ничего такого уж прямо интересного. Это просто работает на основе Veo 31 Fast Leonardo Motion. Но теперь ваши презентации могут выглядеть куда интереснее и живее. А 11 Labs выпускают 11 Labs Skills. Компания создала GitHub репозиторий, и теперь добавлять функции от Eleven Labs вашим и агентам стало намного и намного удобнее. А сейчас, как мы знаем, есть в связи с этим клодботом и так далее тренд наговорящих и даже как-то выглядящих агентов, которые прямо буквально с экрана тебе что-то там поясняют, у них рот открывается, речь генерируется в 11 Лапсе. И об этом мы, кстати, будем на предстоящем курсе или потоке по Cген. Помимо этого, с интересным заявлением выступил SEO Labs Матти Станишевский
Голос — главный интерфейс будущего
который говорит о том, что голос будет являться интерфейсом будущего. И как будто бы достаточно много мы это за последние годы слышали, что от Альтмана, что от Маска, что от Джонни Айва. Но, в общем, мать Станишевский тут раскрывает эту идею, говорит, что экранов вообще не будет. Точнее, они будут, но эти экраны будут у нас где-то там в кармане или в рюкзаке лежать, а мы, естественно, будем взаимодействовать с кодом, с агентами ассистентами, именно голосом. И в таком голосовом формате будет как бы интерфейс существовать. По сути, вывести какую-то простую голограммку с отображением чего-то, с не простым интерфейсом будет достаточно просто. И у себя в машине, и где-то на кухне, и за рабочим столом. В общем, всегда это можно будет сделать, взаимодействовать. Мы будем с этим, естественно, голосом, потому что клавиатуры, эти кнопки вообще- это что-то очень устаревшее. В телефонах мы отказались от клавиатуры уже очень давно. Почему в компьютерах мы от них не отказываемся? Распознавание речи становится всё лучше и лучше. И прицеливаться курсором, мышкой, пальцем теперь тоже как будто бы не надо, потому что за вас и агент внутри вашего устройства может понимать, куда вы хотите нажать, просто потому, что вы ему объясняете. Всё это ещё очень круто сочетается с AR или VR очками. Те же самые Rayb отметы, которые запрещённый организация, но с которыми 11 Labs уже сотрудничают. Короче, технологическое будущее, с одной стороны становится более ясным, с другой стороны из-за обили информации всё более и более туманным. Ну а я, как думаю, и вы, в этом тумане чувствую себя просто ёжиком.
Новый способ смотреть спорт
— Псих — Люси 2:0. Real Time от Decard AI вот так вот позволяет делать. Это достаточно прикольно, но повторюсь, что инструмент этот работает плохо. Много артефактов, просто технологически прикольная штука. Они вот показывают, что так можно. И в ближайшее время, скорее всего, этот функционал появится в более качественно работающих инструментах. В том же самом клинге 3. 1, например. Amazon, кстати, тоже сходит с ума. точнее, не сходит с ума, а смотрит светло-туманное технологическое будущее и внедряет нейросеть, как только может. Не стоит забывать, что так-то у Amazon достаточно много релизов в нейросетях было на заре расцвета этих технологий, но сейчас они как-то подутих, как будто бы всё у них сейчас нацелено на какое-то внутреннее коммерческое использование. И в общем, Альберт Ченк, руководитель инициативы AI Studio, говорит, что они не заменяют креативные команды, а просто создают инструменты для их поддержки. И между прочим, во втором сезоне сериала House of David на Amazon было более 350 сгенерированных с помощью AI кадров. При всём этом Amazon в октябре уволил 14. 000 сотрудников, а в этом январе 16. 000. Только в прошлом выпуске рассказывал вам про 4D генерацию. И вот Roblox туда же. Roblox уже выпустили модель для генерации 3D объектов. Теперь они её усложняют, и модель может создавать 3D объекты, которые изменяются с течением времени. Это и называется 4D. И в будущем Roblx, естественно, планирует расширять функционал, и как будто бы у нас будет вообще платформа для работы с 3D такая универсальная внутри просто игры, а точнее агрегатора игр, а точнее конструктора для агрегации игр. Я, в общем, запутался вообще во всём этом. Просто у нас есть шикарный метаврст, который может сам себя реплицировать и увеличивать в объёмах. Почему бы и нет? Remotion Prompts - это огромная база промптов для использования в ремошене. сервисе для генерации видео с помощью LLM. А вот эта новость мне очень сильно понравилась. Новый способ смотреть на спорт, а точнее новый способ этот спорт снимать или генерировать, не знаю, как точно это сказать. В общем, Gosплаat или гасановые шлепки, как вы можете знать, это способ создавать 3Dцены или 3D объекты, используя изображения либо видео. С помощью, например, движения камеры объекты обшлёпываются, у них появляется какая-то текстура, внутри они полностью полые, но обёртка или вот поверхность становится так краской обшлёпано, что со стороны выглядит как будто бы это настоящая 3D-фигура. И с помощью этой технологии, например, если мы снимаем какое-то спортивное событие с нескольких камер, мы можем шикарно создавать 3D-сцену и с помощью виртуальной камеры внутри этой 3D-сцены как-то двигаться или даже 4D-сцены, да, как мы узнали из недавней новости. Короче, теперь камеру можно будет присоединить, например, к перчатке ловца в бейсболе или вот к баскетбольному мячу, к игроку, спине игрока, к мячику в падле, сквоше, что это пиклбол. Новые абсолютно способы восприятия спорта появляются. И это реально вот тот самый пример, как ээ технологии и вот то, о чём мы тут с вами говорим, креативные нейросети, ну или тут не совсем нейросети, будут влиять на жизнь абсолютно рядовых людей, большинства, да не большинства всех, потому что спорт как будто бы смотрит, ну, подавляющее большинство людей на Земле. Помимо этого
Open-source аналог Suno
Open source Суна, у нас появляется AC Step 1. 5. Модель open sourceная для генерации музыки. Есть приятнейший интерфейс для MacOS, для Windows, скорее всего, тоже есть. Замечательная, в общем, нейронка, которая позволит, естественно, не весь функционал SUA покрыть, но хотя бы просто генерировать достаточно качественную музыку у себя на компьютере. По мне это звучит менее яишно, чем сума звучало год назад. Делать может музыку, вокал, каверы, минуса до 10 минут. Русский язык поддерживается. Короче, замечательный инструмент. Ну и по классике завершают такой забавной
Сервис для найма людей нейросетями
новостью rentauman. AI это сервис, на котором и агенты могут найти себе человека для выполнения каких-то человечных задач. Например, прохождение копчи в скучном случае, либо каких-то профессионалов, например, врачей, грачей, уборщиков, гимнастов, кассиров, в общем, специалистов незаменимых ээ с помощью и агентов на данный момент. Я действительно половину примеров пошутил, но вот такой сервис существует, и не знаю, насколько он будет работать. Если вас заменят искусственный интеллект, то вы знаете, куда обращаться. Идите и работайте на искусственный интеллект. И на этом
Итоги и заключение
новости нейросетей прошедшей недели подошли к концу. С вами был Игорян, дядя Д. И если вам понравился этот выпуск, то обязательно ставьте лайки, комментарии, подписки. Не пропускайте нас. Мы выходим каждое воскресенье. И увидимся на следующей неделе. Пока.