Новости ИИ – Apple снова облажался, Ультразвуковой ChatGPT, ИИ-агенты для всех – Claude Cowork

30:35

Новости ИИ – Apple снова облажался, Ультразвуковой ChatGPT, ИИ-агенты для всех – Claude Cowork

Продуктивный Совет 18.01.2026 16 075 просмотров 439 лайков

Machine-readable: Markdown · JSON API · Site index

Смотреть на YouTube

Поделиться Telegram VK Бот

Транскрипт Скачать .md

Анализ с AI

Описание видео

Новости нейросетей – Anthropic выпускает Claude Cowork — полноценного AI-агента для ваших файлов, а OpenAI представляет GPT-5.2 Codex и заключает сделку на $10 млрд с Cerebras, чтобы сделать ChatGPT молниеносным. Разберем, как Google с помощью Gemini Personal Intelligence превращает ИИ в вашего личного помощника, и почему Apple ставит на Gemini, а не на собственную разработку, и раскроем утечки о секретном hardware-устройстве от OpenAI и Jony Ive. Если вас интересуют нейросети, робототехника, ChatGPT, GPT 5.2, Claude Code и всё, что связано с ИИ, этот выпуск – ваш универсальный гид по последним трендам. Погружаемся в будущее уже сейчас! 🔥 PolzaAI 250+ нейросетей по АПИ для разработчиков и ИИ-энтузиастов – https://polza.ai/?utm_source=blog&utm_medium=prod1801&erid=2VfnxwbVKus Реклама. ООО "ФЛЕЙЛИ", ИНН: 0272928204, erid: 2VfnxwbVKus #ИИ #нейросети #ChatGPT Тайм-коды: 00:00 – Интро 00:48 – Claude Cowork: AI-агент для ваших файлов 02:34 – GPT-5.2-Codex: новая модель для кодинга 06:01 – Забавное от OpenAI: переводчик и реклама в ChatGPT 09:30 – OpenAI и Cerebras: сделка на $10 млрд для ускорения ChatGPT 10:53 – Google Personal Intelligence: Gemini знает о вас всё 12:28 – Провалы Apple: почему Siri будет работать на Gemini 15:09 – Илон Маск, Grok и дипфейки 16:28 – ИИ решает сложнейшие математические задачи 17:31 – Суд Маска и OpenAI: новые подробности 18:37 – OpenAI инвестирует в стартап Альтмана 20:14 – Утечка: какое устройство готовят OpenAI и Jony Ive? 21:05 – Новости креативных нейросетей 21:18 – Обновления Google Veo и апскейлинг 22:37 – Мощная модель GLM Image 25:05 – Быстрая модель Flux 2 klein 25:55 – Tencent Hunyuan 3D Studio 26:35 – LTX 2 27:40 – Апскейл в Ideogram от Topaz 28:15 – Apple Creator Studio против Adobe Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link Тг How2AI – https://t.me/How2AI Тг чат How2AI – https://t.me/how_to_AI Тг Креативный Совет – https://t.me/creadvice 🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d

Оглавление (20 сегментов)

Интро

Clлод код выходит в люди. Antropic выпускает Clлод CвоG. Новая мощнейшая модель от Open AI GPT 5. 2 кодекс. Opena партнёрится с целирос, а значит, нас ждёт очень быстрый чат GPT. Продолжаем следить за судебной сагой Илона Маска и Open и к маску появляется всё больше и больше вопросов. Personal Intelligence, Google, провалы Apple, математические прорывы искусственного интеллекта и утечки хардверного устройства OpenA и Джонниy Ай. Люди, роботы, привет собрали все самые важные, интересные новости, которые в мире нересетей искусственного интеллекта за неделю произошли. Их было очень много, есть что обсудить. Настраивайтесь на продуктивный лад, ставьте лайки, комментарии оставляйте и подписывайтесь на канал, чтобы новые выпуски не пропускать и наш проект поддержать. Погнали. Cдко обрёл новую

Claude Cowork: AI-агент для ваших файлов

форму, новую упаковку под названием Clotдка CWork. Что сделали антропики? Ну, изначально ход был вообще великолепный. Они взяли, упаковали клод-код в красивый интерфейс приложения ClД, назвали это CWork и начали отдавать за 100 долларов в подписке. Но на самом деле под конец недели раскатили уже всем пользователям и на проплане тоже за 20 баксов. И эта штука, ну, по сути, вбирает в себя всё то, что умеет делать клодко. Если вы им пользовались, то, наверное, ничего прямо сверхнового для вас здесь не будет. Получает доступ к конкретным папкам на вашем компьютере. Он может читать, редактировать, создавать файлы автономно. Это всё и про организацию, и про трекинг расходов по скриншотам, создание отчётов и разбросанных заметок. Ну то есть это тот самый и агент с доступом к ко всем файлам на вашем устройстве. Я эту идею продвигаю уже какое-то количество, приличное количество времени. отдельный ролик про села агентов снимал, где вот именно эту концепцию пытался до вас донести, что это очень важно и круто, когда и модель обладает всем контекстом, всё, что ей необходимо, и вам не нужно бегать из браузера в браузер, из заметки в папку, в обсидиан, куда-нибудь там ещё, и делать постоянный Ctrl C, Ctrl V. Коворка отличается тем, что он всегда запрашивает разрешение перед значимыми действиями. Я так понял, здесь всё-таки добавили чуть больше контроля и безопасности, ээ, нежели в клодкод. И тут нет, в принципе, вот такой истории, что всё разрешить, давай там твори что-нибудь. Нет, здесь антропик понимает прекрасно риски, и они клодкаво здесь ограничивают, но глобально это тот же самый клод-код. Релиз, безусловно, значимый. Он большему количеству людей открывает доступ вот к такому пользовательскому опыту. Если вы уже успели поюзать, расскажите в комментариях, как вам. GPT 5. 2 кодекс и

GPT-5.2-Codex: новая модель для кодинга

для кодинга, и кипербезопасности. Вот так позиционируют новую модель Open. A они зарелизили версию кодекса, как правило, уже из поколения в поколение, можно даже так сказать, кодекс - это чуть более прокачанная и натасканная на кодинг. Попытался не произнести вот этого слова. Модель и чуть лучше показывает се на бенчмарках, там SWBch Pro, Terminal Bench. И вот, ну, в принципе, посмотрите, тут прямо небольшой отрыв на процентик лучше, чем GPT 5. 2. Здесь, ну, на 2% лучше, чем 5. 2, но лучше, чем 5. 1 кодекс Max, например, на Terminal bench 2. 0. Сильные стороны - это профессиональная разработческая работа, агентские возможности, улучшенное понимание контекста, надёжный Тулolколинг, ну, что, в принципе, терминал bench и меряет, насколько я понимаю. Работает с большими репозиториями. Лучше себя показывает с точки зрения вижена. Вот здесь, смотрите, такой скетч ей предоставили. И вот такой вот результат она смогла реализовать. Ну, как бы, в принципе, тут вот только вот этого отсека раздела, мне кажется, она не добавила. Всё остальное в той или иной степени она скодила круто. И говорят, конечно, что кибербезопасность тоже натаскали значительно. И несмотря на то, что GPT 5. 2 кок не достигла уровня high по preparedness Framework Open AI, это вот этот вот фреймвор, где они там меряют, насколько модель опасная становится с точки зрения своей автономности и вообще всего того, что в ней там внутри варится. Но Openif старается уже добавлять всякие гардрейлы, сейфгарды, разные системы, которые не дают модели натворить всякого безобразия в вашей кодбазе и не только. И смотрите, что интересно. Если вы очень увлечённый, ээ, молодой человек или девушка, который вот прямо хочет 5 кодекс попробовать, а, как мы знаем, проблемы есть с доступом из России и, в общем, не все регионы, да и вообще не все провайдеры сейчас дают 52 кодекс, но я удивился. Я не раз вам рассказывал про польза AI. Зашёл к ним, думаю, ну вот вряд ли что они добавили 52 кодекса, но нет, ребята уже оперативно добавили сюда эту модель. То есть вы можете её потестировать, сравнить на ваших банчюмарках, на кодинге, там в приложение ваше вставить, если вы разработчик. Расскажу про пользы AI подробнее. Это прекрасная возможность для всех разработчиков и энтузиастов начать пользоваться нерсетями без ограничений, получить удобный доступ к огромному количеству моделей и для генерации текст, и для генерации картинок, и даже звуковых эффектов. Заходим на пользу, регистрируемся. никаких ограничений с точки зрения вашего местоположения, с точки зрения оплаты. Российскими картами можно всё это прекрасно оплачивать. У польза понятная документация, интегрируется с популярными код-платформами, простое подключение, как уже не раз говорил, можно и в NTН себе его вкорячить и тоже своих агентов использовать при помощи пользы как провайдера. Перед тем, как это всё чудо тянуть в продакшню, у вас есть возможность открыть Playграунд, выбрать там любую модель, любую модальность, с которой вы хотите поработать, протестировать всё это там, посмотреть на всю свою статистику в консоли, ну и потом уже взять себе ключ и пойти с ним работать. Итого огромный выбор моделей на любой вкус и цвет. Работает надёжно, стабильно, из России, без заморочек с оплатой. Заходите по ссылочке в описании этого ролика, регистрируйтесь и пользуйтесь. Ну, поехали дальше. Э

Забавное от OpenAI: переводчик и реклама в ChatGPT

рубрика забавная от Opene. Я для вас прямо несколько штуковин собрал. Выпустили Translate. Да, теперь у нас Open GPT конкурирует с Гуглом. Идея в том, что вы без всяких там лишних промтов и заморочек вставили сюда текст и получили перевод. Давайте попробуем. Я вставляю свой промт и желаю получить перевод этого промта. Здесь промт для и модели. Ну, испанский, конечно, я понимаю достаточно плохо. Поэтому давайте поставим всё-таки, например, английский. Но нет. Ладно, и на испанском могу сказать, что здесь модель справилась. О, чуда. Но когда я тестировал-то в начале недели, вот, слушайте, ну, о'кей, пофиксили, смотрите, всё нормально, берёт и переводит мой пром. Но когда я в начале недели сразу после релиза потестировал эту функцию, то я получил не перевод текст, который я вставил, а ответ модели на этот текст, что мне показалось достаточно забавным. Ну, о'кей, главное зарелизить, задебажить можно потом. В принципе, задебажили быстро, молодцы. Ещё забавное. Во-первых, чаat GPT GO теперь доступен всем. Раньше это был план исключительно на целенный на Индию и, возможно, какие-то ещё регионы, где не сверхплат платёжеспособная аудитория. Но теперь его можно приобрести везде. Там больше у вас лимитов на использование разных моделей. Моделей там уже снова полным-полно. Какие-то там инстанты, не инстанты. Ну, в общем, в принципе го штука. Не могу сказать, что годное, но, наверное, есть в ней какой-то резон. Если хотите, не хотите платить 20 долларов, можно платить восемь. Но есть только называемый трейдоoф на бесплатном плане и на гоплане отныне компания начинает внедрять рекламу и выглядит это вот так вот. Они заявляют, что ответ будет всё равно независимый, то есть не будут прямо вкорячивать в ответ и как будто бы через ответ влиять на ваше мнение покупки или не покупки. Диалоги в чат GPT остаются по-прежнему приватными, и всё должно быть безопасно. Мы не планируем оптимизировать чат GPT на количество времени, которое вы там проводите, как-то делают всякие вот тиктоки, рилзы и так далее, которые выстраивают все свои алгоритмы так, чтобы вы там провели как можно больше времени. Э, но в любом случае, как бы всё, реклама теперь есть в чат GPT. Факт. — Однако на планах плюс и выше, и на всяких бизнесовых планов вас от этой участи избавили. Ну, спасибо на этом. В корпоративной среде есть несколько интересных и опять же забавных достаточно перестановок. Дело в том, что стартап Мира Murati Tink Machines, как вы помните, за мир и Murat извлёк из компании Open ещё несколько ключевых сотрудников, которые стали сооснователями компании. Ну так вот, выяснилось на этой неделе, что они возвращаются в Open Aua. Что творится в Think Machines, непонятно. Видимо, не всё там радужно и прекрасно, раз теряют ключевых руководителей и кадров. Более того, другой соснователь Дрюлок ещё в октябре двадцать пятого года покинул компанию Thinking Machines, чтобы присоединиться к запрещённой вот этой рептилоидной компании. Интересно, что скажут инвесторы, которые ещё сидраунд в июле на 2 млрд вложили в компанию и с оценкой 12 млрд. Ну, ждём каких-то дальнейших заявлений, ну, и, наверное, продуктов, resarch и хоть чего-нибудь от Tanken Маchines. То что-то давно про них слышно не было. У

OpenAI и Cerebras: сделка на $10 млрд для ускорения ChatGPT

Open ещё одна победа на переговорческом плане. заключает контракт, сделку с Celрес на 10 млрд, и компания CреbrС предоставит 750 МВтвы вычислительных мощностей с двадцать шестого по двадцать восьмой год компании OpenA. Если вы не знаете, то Cреbr - это потрясающая компания, которая делает свои чипы для инференса моделей. И на чипах Celebr модели просто показывают сумасшедшие результаты, летают с какими-то там, ну, наверное, тысячами токенов в секунду. Популярность серебра сильно возросла после того, как чат GPT в целом появился в двадцать втором году и весь AI бум начался, и спрос на вот такое использование чипов возрос, хотя компании-то уже около 10 лет. И ходили, конечно, вопросы, ээ, догадки, а ради чего этот целибс был приобретён, что конкретно будет инферен инференситься быстро, может быть, все эти думающие модели на пропланах для того, чтобы они думали там не по 15 минут, а по минуте, выполняя такой же объём задач. Но вот Аtman такой твит сделал недавно very fast cdex coming. То есть как будто бы хочет Open AI ускорить разработку, что тоже не может не радовать. Ну может какой-то кусочек ресурсов там и на пропланы запихнут. Ну и поделятся там с юзерами на плюс-планах просто в чатбоксе. Почему бы и нет? Мне кажется, всем будет приятно. В принципе, можно

Google Personal Intelligence: Gemini знает о вас всё

сказать, что Google такую новую эру в работе с своими иишками запустил, потому что он всё это очень плотно сейчас объединил в экосистему и назвал personal intelligence. Теперь Geminy позволяет вашему ассистенту не просто отвечать что-то на основе того контекста, который вы в чатике ей скинули, но связывается с Gmail, Photos, Search, YouTube истории. ээ идёт модель и самостоятельнот всю необходимую дату для того, чтобы ответить на вас вопрос. Становится действительно персонализированной. Google приводит такой пример. Если вы просите порекомендовать какие-то все сезонные шины для вашего автомобиля, модель пойдёт в Google Photos, найдёт ваш автомобиль, поймёт ещё, как вы его используете, ездите там по Афроду, не по А офроду, и решит, и поищет в интернете и предоставят вам необходимые рекомендации. Ну, это звучит потрясающе, честно говоря. Именно это, в принципе, именно то, чего мы и ждём от и компании вот таких кокосистемных решений, которые создают разную автоматизацию и вот эту рутину нашу с вами сокращают. Google говорит, что Gamin не тренируется напрямую на Gmail, на Google Photos, только ссылается на эти данные для генерации ответов. Э, есть гардрейлы для чувствительных тем. Будет избегать там разных предположений о здоровье. Ну и эта функция по умолчанию выключена. В принципе, я ставлю этому лайк. Я тут понял, что весь последующий кусок я решил записать без своей прекрасной говорящей головы, поэтому насладитесь мной последние 3 секунды и погнали дальше к новостям. Мне кажется, Logan

Провалы Apple: почему Siri будет работать на Gemini

Kill, один из там больших разработчиков в Гугле, не без сарказма ээ запостил вот такой такую цитату, которая, собственно, привела Эпллу на этой неделе. После тщательной детальной проверки Apple принял решение, что гугловские и технологии предоставляют максимальное качество для foundation основных основательных моделей Apple. В общем, стало известно, что Google и Apple подтверждают неэксклюзивное многолетнее партнёрство, и Apple будет использовать gemin модели и cloud технологии Google для будущих Apple Foundation моделей. Что будет с партнёрством Open AI? Что будет? Ну, антропик, ладно, там где-то фигурировал, но я так понимаю, тут ничего они ни к чему не пришли. Ну и все эти пловские потуги приводят к чему? К тому, что да, ни к чему они не приводят. Берём модели у конкурентов, по большому счёту. Кстати, Google платит приличное количество денег Apple, там какие-то десятки миллиардов долларов в год за то, что Google является поисковым движком по умолчанию в устройствах Apple, но здесь как будто бы должен платить уже Apple за всё это дело. Хотя, чёрт его знает. Влияние Apple в любом случае большое и пользовательская база гигантская. Может быть, Гуглу тоже здесь, э, равный от этого бенефит и польза. Наверняка Apple, конечно, будет нам говорить, что они там ещё много всякой приватности, всяких слоёв сверху безопасности навешивают и большую работу проделывают, но, конечно, критики им не избежать. Но опять же, это не эксклюзивное многолетнее партнёрство. То есть, в принципе, ээ Apple может использовать и другие модели, и других провайдеров, и там, может быть, и Open A в Siri останется. Но с другой стороны, зачем, если там всё это теперь питать будут гугловские сетки. А ещё Google делает с одной стороны сопоставимый, с другой стороны не очень релиз на этой неделе. Выпускает translate гема в трёх вариациях 4 12 и 27 млрд параметров. взяли за основу Гедесненьким образом это всё обучили. 12 млрд модель обгоняет гема 3x на27 млрд параметров на бенчмарке вот с таким непростым названием длинным. Я думаю, что это бенчмарк для того, чтобы как раз-таки оценивать способности к переводу. И модели, между прочим, остаются мультимодальными. Малюсенькая модель вообще для мобильных устройств, чтобы локально гонять, идеально подходит. Наг Hagen Face доступно. Это open source. можно деплоить Verртекс AI. На пятидесяти языковых парах обучены и почти 500 дополнительных для дальнейшего файнтюнинга исследователям и разработчикам. Продолжает развиваться

Илон Маск, Grok и дипфейки

история с Гроком и его Спайси остреньким режимом, который позволил генерировать достаточно явные, откровенный контент и вызвал огромное количество вопросов и к компании, и к основателю, и вообще ко всей этой системе безопасности. Напомню, Грок начал генерировать сексуализированные фотографии женщин и детей в конце прошлого года, после того, как создатели взрослого контента для маркетинга начали использовать модели грок. И это привело, в общем, к распространению понимания того, что это возможно. И в том числе актриса очень странных дел тоже была подвергнута вот такому вот генеративному харасмонту. Можно это назвать. Если помните, в прошлом выпуске показывал, какое количество сумасшедших рок нагенерировал дипфейков по сравнению с там с топсайтами, которые эти дипфейки генерируют там в тысячи раз больше. От комиссий, от сенаторов Еврокомиссии пришло сообщение, что давайте-ка сохраним все эти документы, касающиеся создания, обнаружения, модерации, монетизации этих и генерируемых изображений. Всё это в дальнейшем изучим. Но Илон Маск, к слову, всё это отрицает и вообще не в курсе, что такое было сделано его моделями. Сложнейшие математические

ИИ решает сложнейшие математические задачи

задачи решаются моделью GPT 5. 2. Есть такая коллекция поля Эрдюша из более чем тысячи гипотез. И с Рождества 15 задач перешли из статуса открытых в решённый. Причём 11 решений прямо приписаны и моделям. И Терен Стауй, очень известный математик, выдающийся, выделил восемь задач, где искусственный интеллект внёс значимый автономный прогресс. Где-то модели используются, чтобы просто помочь в рассуждениях и поиске решений. Где-то они решают всё автономно, где-то используются ещё дополнительные системы Proof Assistant LINAN от Microsoft Research, Аристотель от Harmonic, которые упрощают валидацию математических доказательств и формализацию. В общем, много вам всяких иззаций тут накидал. Просто напомню, что года три назад никто не верил в то, что все эти текстовые модели вообще хоть как-то начнут в дошкольную математику давать грамотные ответы. А тут вот такое. Теренстао подтверждает правильность. Ну вот можете посмотреть

Суд Маска и OpenAI: новые подробности

что говорит Илон Маск ээ в судебных своих документах и исках. А что действительно он писал в 2017 году и какие высказывания его были. В своём иске Мас говорит, что утверждал, чтобы Openi осталась благотворительной. Но вот полная записи разговоров показывают, что это просто кусочек фразы, которая была вырвана из контекста. И на самом деле Маск, в принципе, уверял, что можно переходить в корпоративные фоit структуры. И вообще на чём основан его текущий, как это уже назвали, harassмонт по отношению к Opena, большой вопрос. Такое ощущение, что просто компанию притормозить и вот не самыми честными путями ээ пообрабатывать своих конкурентов. Судебная вся эта тяжба продолжается. Я так понимаю, что суду действительно быть. И вот все эти документы сейчас поднимаются. Больше подробностей нам становится известно. Главная претензия Маска: вы тут всё нарушили. Я вас вкладывал деньги. Дайте мне долю и вообще заплатите мне кучу бабла, потому что вот я там вложил же в начале, помог. Ну а Opena как будто к маску претензий нет и не было. Защищаются как могут. А тем временем Opena инвестирует в

OpenAI инвестирует в стартап Альтмана

компанию Сэм Альтмана. Ну нет, не в само это был бы уж какой-то совсем абсурд, но у Альтмана есть компания Merge Labs, которая разрабатывает вот эти все самые компьютерные интерфейсы в наши прекрасные с вами ээ вещества, находящиеся в черепных коробках. И это всё-таки как-никак такая круговая сделка получается, потому что Altman владеет это этим Merchlabs и Open AI и Open инвестирует в Merlabs. И у компании выписала самый большой чек в сетраунде на 250 млн долларов с оценкой 850 млн. Другие инвесторы Bin Capital, Interface Fund, Fears и неожиданно Gap New. Merchlaps будет делать неинвазивный подход, и я вот прямо не до конца понимаю, что это значит, но будут интерфейсы с нейронами через молекулы вместо электродов. И для передачи данных используется ультразвук. Расскажите мне, биологи, технологи, айтишники, техноривы, в общем, что, как это будет работать. В любом случае, ещё, мне кажется, интересное поприще для Илона Маска, где можно будет посудиться с Open AI. У него же есть нейролин. Может быть, там тоже Merchlлаs как-то ему что-то должна. Но на самом деле, если так прямо сильно на будущее смотреть, то партнёрство очень понятное и очень грамотное. Open A сейчас там весь этот researching Development проведёт, ну, точнее, Merge Laps проведёт с деньгами Open AI и потом этим же Open AI все эти нейроинтерфейсы отдаст, и это будет такой как бы хардуерное уже и, наверное, не хардуерное, как это назвать, какое-то биологическое устройство, которое будет соединять наш интеллект с искусственным, ну, практически напрямую. И ещё одна

Утечка: какое устройство готовят OpenAI и Jony Ive?

утечка о хардверном устройстве Open Ai и Джонни Айва. Возможно, это будет, ээ, сладкий горошек. Sweet Pe ear Earbuds. Это всё называется на английском языке, но это, в принципе, не earbuds. Это какой-то вот такой продукт, который вставляется за вашим ухом. И я не очень понимаю, как он там держится, что это вообще такое, почему не в ухо уж тогда. Ну, наверное, чтобы там яишку слышать и хотя есть какие-то вот эти наушники там, которые позволяют это делать, но держатся плотно в ухе. В любом случае вот такая небольшая утечка была на этой неделе. Неизвестно, насколько это всё правда. И ожидаем мы в сентябре двадцать шестого какой-то там первый релиз. Но вот знайте, сладкий горошек потенциальный продукт Джонни Айва и Сама Альтмана. На этом у меня всё. Увидимся в будущих выпусках. Но не переключайтесь, Игорян вам про новости креативных нейросетей

Новости креативных нейросетей

расскажет. Люди-роботы, привет. С вами Игорян, и это как всегда новости креативных нейросетей последней недели. На этой неделе у нас было несколько маленьких интересных релизов и несколько релизов побольше. Давайте обо всём по

Обновления Google Veo и апскейлинг

порядку. Начнём с обновление от Google. Во-первых, во Flow появился upscalingнг до 4К. Картинки в нанобона Pro в 4К уже делать было можно, а вот видео из них не особо получались. Теперь же есть всё видео в 4К. Красота. Помимо этого, Google обновил ингредиенты Veo 3. 1. Ингредиенты - это, возможность некое количество изображений. объединять с помощью текста и превращать их в видео. И теперь эти картинки объединяются лучше. Персонажи получаются более стабильными, чем раньше, как и другие объекты, тигры, фоны. В общем, всё намного стабильнее, плавнее и красивше. Ну и генерация вертикальных видео 9х16 тоже подвезли. Нейрослоп будет делать ещё проще. только недавно рассказывал про замечательную лору для Квена, которая позволяет вот с помощью такой вот штуки менять, в общем, ракурс изображения. И теперь это завезли и во Фрипик, который является замечательным сервисом, про который мы, кстати, недавно делали ролик. Freпик вообще в последнее время очень много прикольных обновлений выпускает. Много достаточно нативных всяких прикольных функций появляются у них. Не оригинальных, но вот они отовсюду берут самое лучшее. и к себе это на площадку добавляют. Ну а далее у нас большой

Мощная модель GLM Image

релиз для всех поклонников буквы Z. И я, конечно же, говорю про китайскую компанию ZAI, которая выпускает GLM Image, передовую openсорсную модель для генерации изображений. У компании в целом уже была достаточно крутая модель Z image Image, которая тоже была open sourсной, но она была поменьше и запускалась на любом пользовательском железе. Ну, не прям любом, но в целом у многих она могла запуститься. И модель это, кстати, достаточно хорошая. Где-то на уровне Cdeream 3. 0 она находится. Новая же модель принципиально отличается. Она является очень большой. Чтобы полноценно пользоваться несжатой версией, вам понадобится около 80 ГБ видеопамяти. Это прямо для спокойного использования. Можно и на меньшем количестве, но там будет всё намного хуже работать. Квантизированные же версии, то есть версии с сжатыми весами, можно использовать даже до 24 ГБ оперативки. Но что же это вообще за релиз? Давайте я вам расскажу. Компания заявила, что модель уничтожает просто Nan Banan Pro Jip Tamage 1 по бенчмаркам с аккуратностью ввода текста. Но при тестах почему-то оказывается, что генерирует текст она в разы хуже. Для сравнения Nano Banana Pro Quen Image Edit 2512. И вот такой вот ужасный результат у Gelme, то есть оченьоченьочень плохо. Вот ещё JM, тут получше, но всё равно с косяками. И вот сравнение от нанобанах. Тут, кстати, косяки тоже есть, но вообще мы знаем, что нанобана, конечно, очень хорошо делает текст. Почему и как так тестировали эти модели, в общем, непонятно. Может быть, не совсем слепое было тестирование, но ключевой прикол этой модели и то, почему её сравнивают с Квеном, нано банана и GPT иджем, является то, что эта модель авторегрессивная, то есть она может думать над ответом, благодаря чему намного качественнее генерирует изображение, может редактировать изображение и, соответственно, с помощью неё можно делать всякие инструкции, работать с консистентными персонажами, как вот в примере компании, например, менять цвет волос. Но этим нас не удивить. Тут круто, что это open sourceная модель. Очень большая open sourceная модель, в которой нас в ближайшее время ждёт огромное количество экспериментов, всяких лор, файнтюнов и так далее. Короче, сырую версию ставить себе, если вы сможете это сделать. Абсолютно не имеет смысл. Какой-нибудь Quen Image Edit работает точно намного лучше. Но поживём, увидим. Эта модель в первую очередь это такой новый виток, как бы, из которого там уже будут новые

Быстрая модель Flux 2 klein

всякие интересные истории произрастать. Куда более интересный и применимый релиз - это Flug 2 C. Клян с немецкого маленький. И в данном случае маленький - это хорошо. Анонсировали модель ещё в ноябре, когда FLX 2 вышел. И вот теперь она выходит для нас версия 4 млрд, версия 9 млрд. 4 работает плоховато по отзывам людей, девять намного лучше. Можно бесплатно поиспользовать в демо апки от Blackфореста. Для этого заходите на сайт Black Forest Labs. Можно через API, можно локально. Естественно, поддерживается Image editing. Короче, очень классная, быстрая и дешёвая модель. Вот версия 9 млрд, вот версия 4 млрд. Ну, на самом деле, и это выглядит достойно, но девяточка прямо поприятнее, как будто бы. Ну, смотрите, как рясочка, листики, всё прорисовано. Вообще шикардос, только с глазами что-то

Tencent Hunyuan 3D Studio

непонятное. А Tent High выпускает 3D Studio 1. 2. Обновлён интерфейс, функционал. добавили туда partgen 1. 5. Видимо, до этого 1. 0 была версия. Partgen этой версии вышел уже в декабре, но, видимо, в студии его не было. Я каюсь не пользуюсь 3D от Hanan. 3D модель, кстати, тоже обновили до версии 3. 1, что тоже уже было, но теперь это вот в студии есть. Основные изменения вы можете увидеть на экране. Их, на самом деле, куда больше. И чтобы узнать, что они там наобновляли, просто зайдите и попользуйтесь. Напоминаю, что Tent High - это как бы лучшая среда, как будто бы, для генерации 3D сетов на вот сегодняшний день. А видеомодель LTX2

LTX 2

лидирует на open source арене видеогенераторов. Подробнее я рассказывал про LTX в прошлом ролике. Теперь вот она допоявилась на арене и безоговорочно занимает первые места. А Pix представляет нам R1 Real Time World Model. Кто-то говорит, что это первая real time world model, но это, конечно, не совсем так. Мы уже знаем примеры других realtime world модулей. Тем не менее, модель от Pix работает необычайно хорошо. Смотрите, какие длинные последовательности кадров она создаёт. Бежит солдатик, бежит. Да, сейчас он там под танк залетит, хоп, под танк. Кадр переводится. Бомба. Пум-пум-пум. И солдатик всё ещё тут. Модель запоминает солдатика. Короче, удерживает контекст мира, поэтому это есть мировая модель. В архитектуру, пожалуй, углубляться не буду. А основной прикол помимо памяти, как вы понимаете, что вот тут просто вы пишете, пишите, дорабатываете промпт, и то, что вы написали, происходит в реальном времени. Привет, deкарта. Ещё одно небольшое интересное обновление -

Апскейл в Ideogram от Topaz

это коллаборация IDграма Stop Slaps. Я, честно, IDграмом уже перестал пользоваться. модель немножечко отстала от передовых представителей ниши, хотя когда-то это был мой основной инструмент, который пришёл на смену Миджорни. Одна из больших проблем диаграмма была в том, что аплинг там осуществлялся только их первой версией модели, которая вышла уже, наверное, год два назад. Короче, UPS там был очень плохой, и теперь они завозят UPS от TPAS Labs, что, ну, шикарно. Это стандарт ниши, и как будто бы везде уже должен быть upscale от Topas Laps. И последний интересный релиз прошедшей недели - это

Apple Creator Studio против Adobe

Apple Creator Studio. Вроде как интересное обновление, вроде как нет. Подробнее я писал в своём Telegram-канале Креативный совет. Переходите, если интересно. Суть просто в том, что они объединили все приложения для работы с информацией, наверное, просто для работы с чем угодно. Тут их Excel, и их Word, и их PowerPoint, и также их монтажные программы, интерактивные доски, приложения для работы с музыкой и так далее. Что-то из этого было бесплатным, платным. Теперь вместо того, чтобы покупать что-то платное, вы можете просто оплатить подписку. И это, в первую очередь, укол в сторону Adдоби. Мы вообще знаем, что Adobe и Apple очень долго враждуют, потому что когда-то они там были вместе, потом поссорились. И сейчас эта подписка является прямым конкурентом Андоob, поскольку стоит раза в четыре-пять дешевле, хоть и предоставляет куда более узкий и не такой профессиональный функционал, но многим из вас и не нужен суперпрофессиональный функционал. В общем-то, этого может хватать абсолютно подавляющему числу людей. Я в целом не любитель подписок. Мне намного больше нравится концепция купил один раз и пользуешься до конца жизни. Но если вы начинаете только пробуете, думаете, вообще, может быть, мне это не надо платить какие-то 200 долларов за программу, взяли просто заплатили 13 долларов за месяц и спокойно пользуетесь своё удовольствие. Понимаете, нужно вам это дальше или нет. И на этом новости прошедшей недели подошли к концу. Не прямо турбогусто в креативном сегменте, как будто бы что-то намечается. Чувствуется такое затишье перед бурей, как будто бы в ближайшее время нас будут ждать очень большие релизы в огромном количестве. И чтобы их не пропускать, обязательно подписывайтесь на наш канал, ставьте колокольчики, ну и помогайте продвижению этого ролика, лайками, комментариями и всем, чем вы знаете. Также наши социальные сети там есть в описании под роликом. Да, это был продуктивный совет. Я Игорян, дядя Д был в первой половине ролика. И увидимся на следующей неделе. Пока. —

Другие видео автора — Продуктивный Совет

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Лучшие методички за неделю — каждый понедельник