Новости нейросетей: в этом выпуске разбираем релиз от OpenAI: модель, которая уничтожает конкурентов по цене, но не по "хайпу". Пока Сэм Альтман празднует 10-летие компании, Google выкатывает целую пачку обновлений для Gemini, включая Deep Research и невероятный Native Audio.
Искусственный интеллект уже пишет 85% кода в команде Sora. Также в выпуске: триумфальное возвращение Mistral с открытыми весами, почему TIME выбрал сразу 8 "человек года", экспансия китайских нейросетей в Кремниевую долину и первая нейросеть, обученная прямо на орбите Земли.
Все главные новости мира нейросетей, искусственного интеллекта и технологий — в новом выпуске! Если вас интересуют нейросети, gpt 5, Claude и всё, что связано с ИИ, этот ролик – ваш универсальный гид по последним трендам нейросетей. Погнали!
🎄 PolzaAI 250+ нейросетей по АПИ для разработчиков и ИИ-энтузиастов - https://polza.ai/?utm_source=blog&utm_medium=prod1412&erid=2VfnxvPNMhT
Реклама. ООО "ФЛЕЙЛИ", ИНН: 0272928204, erid: 2VfnxvPNMhT
🌐 ИИтоги 25 – запись на конференцию – https://entropy.talk/iitogi25/?utm_source=how2ai_yt2&utm_medium=social&utm_campaign=iitogi25
#новости #нейросети #технологии
тайм-коды:
0:00 – Интро.
00:41 – Обзор GPT-5.2 от OpenAI.
01:02 – OpenAI теперь конкурент Apple?
01:52 – GPT-5.2 - Профессиональный инструмент.
03:44 – Дешевеющий искусственный интеллект.
04:49 – Взрослый режим в ChatGPT.
05:04 – Sora для Android за 8 дней.
06:14 – OpenAI исполнилось 10 лет.
08:44 – Devstral 2 от Mistral.
10:02 – MCP передан Linux Foundation.
11:19 – Обновления аудиомоделей от Google.
11:32 – Gemini 2.5 Text-to-Speech.
12:04 – Gemini 2.5 Native Audio.
13:29 – Человек года по версии Time.
14:30 – Конференция "Итоги года в ИИ".
15:45 – Nvidia возвращается в Китай.
16:52 – Китайский ИИ в Кремниевой долине.
18:07 – OpenAI Skills в ChatGPT.
18:55 – Gemini Deep Research для разработчиков.
19:25 – Google Disco - Генерация веб-приложений.
20:33 – Первая LLM обучена в космосе.
21:39 – Disney партнерится с OpenAI.
24:36 – Photoshop внутри чат-бота.
26:14 – Kling 2.6 и GenFlare 2.0
28:00 – Hunyuan
28:13 – Креативные инструменты Google labs
30:35 – Figma edit
31:06 – Обнова Spline
31:36 – Генератор миров Runway.
32:31 – Генератор PSD
33:09 – 3D видео генератор
33:57 – Олимпийские игры сперматозоидов
Бусти – https://boosty.to/prodadvice/single-payment/donation/535968/target?share=target_link
Тг How2AI – https://t.me/How2AI
Тг чат How2AI – https://t.me/how_to_AI
Тг Креативный Совет – https://t.me/creadvice
🥸 Личный тг Дяди Д – https://t.me/true_dyadya_d
Оглавление (32 сегментов)
Интро.
GPT 5. 2. И это не самый главный релиз недели. Сумасшедшее количество обновлений от Google. Разберём их все. Искусственный интеллект уже пишет 85% всего кода. Первая нейросеть натренирована и запущена в космосе. И вот почему это важно. Формула- 1 и вообще весь спорт, который мы с вами видели ранее - это уже мувитон. Гонка сперматозоидов- другое дело. Люди-роботы, привет. Это Продсовет. Меня зовут дядя Д. Собрали самые важные, интересные новости в мире технологии, искусственного интеллекта, нейросетей? На канал подпишитесь, поставьте лайк, оставьте комментарий, чтобы наш проект поддержать и новые выпуски не пропустить. Погнали. Ну
Обзор GPT-5.2 от OpenAI.
давайте говорить про Open AI. Не супер подробно пообщаюсь с вами про GPT 5. 2, потому что выпустили отдельный ролик, где разобрали основные детали блога, анонса и даже провели сравнение. После того, как закончить этот ролик смотреть, сходите туда, гляньте, если интересно. Но это далеко не всё, что мы от Open узнали на этой неделе. Во-первых, судя
OpenAI теперь конкурент Apple?
по всему, компания себя больше теперь позиционирует как конкурент AppЛU, потому что будет хардвер и будет вся вот эта вот история. И вообще искусственный интеллект должен когда-то перекочевать из вот этого чатбокса, чат-интерфейса во что-то, ну, более осязаемое, как минимум, какое-то устройство. И вот, видимо, где-то внутри Opena есть уже такое представление, что скоро мы будем конкурировать не просто с Гуглом, не только с Гуглом или вообще не с Гуглом, а вот уже с хардверными устройствами. Хотя, в общем-то, и тут бы конкуренцию на поле и искусственного интеллекта им бы как-нибудь выиграть. Чего они стремятся делать, разумеется, появилась новость о том, что в целом AGI как таковой, Сора и вот всё вот это вот речерство в какой-то степени откладывается, потому что нужно догонять, догонять Geminate 3, догонять антропиков. И на этой неделе
GPT-5.2 - Профессиональный инструмент.
GPT 5. 2, в общем-то, была выпущена с этой целью показать, что мы могём. Я не знаю технических деталей, что это за модель, на чём она и как она натренирована. Как-то этой информации в сети, в поле в особенности не было. Но было много инфы о том, что модель беспощадно уничтожает всё на бенчмарках. И это, э, первая модель, которая вот прямо профессиональный инструмент. Дело в том, что есть такой бенчмарк под названием GPDвал, про который я в отдельном ролике говорил. Коротко он оценивает то, насколько модель способна выполнять действительные вот реальные задачи разных специалистов в разных секторах. И насколько она это выполняет лучше, чем человек. посчитать там какую-нибудь финансовую модель, составить таблицы, составить презентации. И, конечно, Open делает на это упор. Говорит, что мы создали такого агента, который уже может заменить людей на не супер сложных проектных задачах, но на задачах, которые там 40-60 минут занимают у людей. И модель берёт и, в общем, беспощадно всё это выполняет. Вот тут есть пример того, как сейчас, э, в сравнении с GPT 5. 1, GPT 5. 2 справа строит различные таблички и как это всё форматирует. Ну и действительно выглядит круто. Мне вот понравился такой интересный бенчмарк от Итона. Достаточно сложная задачка. Можете почитать, в чём здесь идея. Создать там D& D игру с определённой логикой в Excelтаблицах. И GPT5. 2 справилась с этим чудесно. Ну то есть не супер идеально стилизована, но логику учла. В то время как клот 4,5 OP сделал более стилизованно всё красиво и оформил, но сделал там несколько шорткатов. Ну, в общем, сократил себе, упростил себе жизнь, сократил некоторую логику, пустил детали. То есть на самом деле, ну вот, да, GPT 5. 2 может выполнять разные задачи, использовать инструменты и в каких-то областях заменять уже людей полноценно. Что ещё
Дешевеющий искусственный интеллект.
безусловно, круто. Стоит отметить и вообще осознать, что вот Arc HGI1 теперь GPT 5. 2 на этом бечмарке является абсолютным лидером. Если помните, мы писались кипятком, когда в целом модель О1 ещё на тот момент где-то она вот здесь вот уже затерялась давным-давно, э, хоть как-то смогла его решить и преодолеть то ли 50%, ну, там то ли там до 70%. А, пардон, всё-таки О3 тогда наскорило 88, и это стоило 4. 500 долларов за задачу. Сейчас GPT 5. 2 Pro X. Да, ещё добавили там какой-то сумасшедший Xig mode, когда она прямо супер долго думает, набирает 90,5% и 11 долларов за задачу за задачу. То есть это уменьшение сокращения стоимости в 390 раз. И вот это, на самом деле, по моему мнению, самое главное и самое интересное, что вот стоит осознать и принять для себя на этой неделе. Интеллект искусственный, становится дешёвый. Ну а что это значит, я думаю, вы можете сами спроецировать. Далее.
Взрослый режим в ChatGPT.
Взрослый режим ВЧАТ GPT ожидается в первом квартале 2026 года. Какой-нибудь там секстинг, текстинг и вот разные другие вот эти новомодные словечки, может вы лучше меня знаете, будет доступно. Ну, а из более прикладного и более интересного, э, Opena поделились
Sora для Android за 8 дней.
информацией о том, что они буквально за 8 дней при помощи кодекса, такого же кодекса, который доступен абсолютно всем пользователям, скодили приложение SA для Android. Безусловно, у них там были все наработки, вся эта кодбаза iOS и там все, в общем, всё, вся инфраструктура была сделана. Но тем не менее четыре инженера всего лишь-то с несколькими параллельными сессиями кодек написали примерно 85% кода приложения. 5 млрд токенов, это там что-то выскочило в районе там 40. 000 долларов, если я не ошибаюсь, если всё это пересчитать, достаточно дорого. Опять же, это цены через API. Если у вас там подписка на там GPT Pro, вероятно, было бы и дешевле. Конечно же, отмечает, что самое главное - это создавать так называемый implementation план, чтобы всё чётенько было прописано, и потом уже отправлять кодекс. И даже говорят, что работал более чем 24 часа автономно над написанием э кода. Инженеры, в свою очередь, больше уделяли внимание там код ревью, дебагингу, ну, и в целом там проверке плана и направления того, как работает модель. В общем-то, крутой результат и достаточно показательный. А
OpenAI исполнилось 10 лет.
ещё Open на этой неделе исполнилось 10 лет, а не такой интересный вот ролик, проморолик, ну или просто ролик выложили в целом, ну что, поздравить компанию определённо можно. Сэм Альтман в блоге написал такую информацию: "Я никогда не чувствовал себя более оптимистично э о наших ресерчах и нашей продуктовой дорожной карте. Нет никаких сомнений, что практически наверняка мы построим супернтеллект. Вряд ли он напишет, что я перестал верить в успех компании. Короткая рекламная пауза, которая будет полезна всем и энтузиастам, начинающим разработчикам, да и не начинающим разработчикам, а потом продолжим с новостями. Напомню вам, что есть классный сервис под названием Польза AI- это единый API шлюз к сотням нейросетей. Очень простая и быстрая регистрация, работает стабильно, можно платить с российской карты. Никаких трёхбуквенных решений и обходных путей не требуется. Что мне нравится, всё очень профессионально выглядит. У вас есть консоль. Здесь вы можете наблюдать вообще за всей своей статистикой, всеми своими тратами, когда вы будете работать через API. Тут нет подписки, но вы можете закинуть сюда любое количество средств и сразу начать пользоваться самыми разными моделями. Причём, ну, не обязательно всё это куда-то сразу заворачивать. Есть чат Playground. И здесь вам, пожалуйста, чат, в котором куча моделей. Ну просто куча. Всё вообще на любой вкус и цвет. Даже не знаю, зачем вам столько нужно, но это есть. Далее у нас, конечно же, есть изображение. И здесь Нанобана Pro, разумеется, флаксы, разумеется, cдримы, в общем, полный фарш. Все лидеры рынка сейчас видео тоже есть, VeoLink, полная красота и даже звук и музыка. Ну то есть, в принципе, чтобы работать сейчас с нейросетями, э платить всё российской картой, но вам не нужно сейчас бегать по разным сервисам. Можно зайти сюда. Далее, если вы разработчик, то погнали в документацию. Здесь вам всё чётенько, понятно. Все ваши энпоинты здесь есть. Даже, пожалуйста, с Найтеном можно интегрироваться. Ноукодеры привет. Взяли, сделали себе и агента, чтобы опять же там како-нибудь прокси не настраивать через Open. Aay, вот можно использовать пользу курсор, пайчам, ну и куча разной информации, которая вам будет полезна для того, чтобы свои приложения создавать. Итого удобная консоль, вся статистика, список моделей, ээ, зашкаливающий, надёжный, стабильный, выгодный российский сервис, который даёт вам полную свободу в работе с искусственным интеллектом. Ссылочка находится в описании этого ролика. Defr
Devstral 2 от Mistral.
2 отстрал. Сумасшедший, интересный релиз по моему представлению. Мистрал выпускает две модели: 123 млрд и 24 млрд. Это полный open source. Ну, Me Apatch 2. 0 лицензия. Посмотрите, какие крутые результаты показывает. Он показывает результаты на SW Bench Verified на уровне топовых китайских моделей, их топовых версий. Конечно же, уступает маленько пропритарным всем нашим ребятам, но как бы это open source. И более того, модели Крошки 24 млрд параметров. Ну, в принципе, я даже вот на своём М4 там сколько, 24 ГБ, 24 оперативы, я постараюсь это запустить и отчитаюсь в нашем где-нибудь одном из Telegram-каналев, возможно, в личном тоже. Ссылка на мой Telegram-канал есть в описании. Классный показатель перформанса на этом бенчмарке и размеры модели. И ещё выпускают Vipe CLI. Тоже, кстати говоря, о своём ТГ про это рассказал. Э, очень-очень простенький CLI агент, CCLI клиент. Ну, то есть там вообще количество функций катастрофически, их там нет никакое. То, что мы в клод-коде привыкли, там субагенты, слэш-команды, бла-бла-бла, но всё равно как бы с чего-то нужно начинать. И работает неплохо. И туда можно подключать локальные модели. Вероятно, не только мистрал. В общем, интересный релиз и очень достойный, достаточно неожиданный от французов. Спасибо им. Будем тестировать. MCP
MCP передан Linux Foundation.
передан в Linux Foundation. Это во-первых. А во-вторых, они создают Adentic Foundation вместе с OpenAlog - это которая, собственно, вот этот се тоже создала ДКДРЕ. Google, Microsoft, AWS, Cloud Flare, Blomberg, в общем, всех туда подтянули. Тут можете посмотреть такой roadmap, ну, наоборот, историю того, как развивался MCP, там первый спек, второй, третий, четвёртый. И вот сейчас говорят, что уже 97 млн плюс ээ месячных SDK загрузок на Python TypeScript. И вот в MCP Linux Foundation передали. Кроме MCP в фонд входит с от блока Open Source, всё его туда отдают, Agents MD от OpenA, ну и цель обеспечить прозрачную коллаборативную эволюцию агентного и чтобы не было такого, что все создают что-то своё, оно там никак не взаимодействует, никакой системности здесь нет. Ну и приходится немножечко юзерам страдать. Страдать нам не хочется, поэтому спасибо Linux Foundation, спасибо Антропику за это. Не, не очень понимаю, что там в этом Agents MD. Вот расскажите мне в комментах, что там такого гениального. Что просто вот файлик мы передаём в Linux Foundation. Насколько это весомый вклад сострена Open A? Может, что-то я не понимаю. Ну вот информация такая. Погнали к Гуглу. Очень много всего
Обновления аудиомоделей от Google.
интересного. Игорян вам ещё расскажет. Всё, что там в креативной сфере и стези произошло, но с точки зрения новых моделей они что-то сделали упорно этой неделе на аудио и сначала выпустили
Gemini 2.5 Text-to-Speech.
текст to spech. модель обновили gmin 2,5 флеш и pro нак to spech просто работает лучше адаптирует скорость речи умеет лучше понимать где паузы и когда шутка когда не шутка гораздо лучше понимает текст и ну воспроизводит тексттек to speчмодель из текста в аудио и конечно это всё прикольно для разных там озвучки разных персонажей в играх доступны новые модельки в Google Studia Playground Gaming API не вижу здесь каких-то прямо сумасшедших революционных юзкейсов но она Например, Gemin 2 Native Audio. То
Gemini 2.5 Native Audio.
что они сейчас выпускают, это полный фарш. Обходят GPT Real Time, что уже как бы серьёзно. Не в первый раз Google обходит что-то там от GPT. Они сделали, что Native Audio - это когда модель воспринимает аудио и вам отвечает тоже голосом. Следуют инструкции лучше. Качество многоходовых диалогов в потрясающе. Может вызывать функции и разные инструменты. Вот 71,5% набирает, обходя всех конкурентов. Вот такой ещё overall conversational quality говорят, уже 83% тоже большой скачок от предыдущего релиза. И что ещё интересно, это всё вкорячили в Google-переводчик. И вы можете через переводчик, воткнув себе вот в наушники, наушники в уши, точнее, а не наоборот, общаться с другими людьми, и модель будет всё это воспринимать, переводить, поддерживать сумасшедшее количество языков 70 п 2000 языковых пар, и все передовые конторы уже используют эту модель. шопе отмечает, что пользователи забывают о разговоре с AI через минуту использования. Классно. И, конечно, и для компаний, и в целом для нас, ээ, крестьян, просто вот ходить, путешествовать где-нибудь, общаться с другими крестьянами и понимать друг друга. Ну, расширяем границы. Классно.
Человек года по версии Time.
Человек года и не один. Тайм выпускает вот такую обложку, где человеком года в этот раз стали, ну, давайте посчитаем, 3 6 аж персон. У нас здесь Дженсен Хуанг, Илон Маск, Сэм Альтман, Цукерберг, Лиза Су из AMD, Антропик Дарио Мадей, Демис Хасибис и Worldlaps Fly. Что стоит знать про Тайм? Два раза выбирал Дональда Трампа человеком года. Ээ до этого выбирал Тейлор Свиф, потому что она спасла американскую экономику. А в 1938 году выбирал Адольфа Гитлера. Очень много хейта в сторону Тайм. Очень много хейтов тому в тему того, что вот эту замечательную историческую, иконическую фотографию испортили и поставили туда вместо рабочих зажравшихся бояр и корпоративных вот этих вот рептилоидов. Если в будущем году человеком года уже будет HI, то, ну, я лично не удивлюсь. Человек года - это, конечно, прекрасно, но какой-то практической пользы нам от этого нет. А
Конференция "Итоги года в ИИ".
вот итоги года в искусственном интеллекте подвести хотелось бы и разобраться, как изменилась индустрия в двадцать пятом году и что с ней будет в двадцать шестом. И я очень надеюсь, что если вы следите вообще за нашим каналом, за каналами наших коллег, то вы наверняка знаете кого-то из этих авторов. И вот эти Telegram-каналы у вас есть и у нас у всех есть прекрасная возможность вместе собраться, посидеть за кружечкой кофе, чая или чего покрепче и пообсуждать и MCP, и контекст инжениринг, и какой-нибудь плотный имеil, вообще, как это всё работает с технической точки зрения в целом. Поговорить об и новостях, о том, что произошло и произойдёт в этом в будущем году, про вайпкодинг, нормальный кодинг и кодинг. Вот про всё это, вот про всё это будем говорить на конференции и итоге года. 25, как вы могли заметить, я там тоже есть вот он, наш Telegram-канал здесь затисался. Поэтому приходите 4,2 часа плотной практики от экспертов индустрии, э для иинженеров, и для обычных пользователей и энтузиастов, для студентов, для разработчиков, тестировщиков. Точно вы найдёте какую-то интересную для вас информацию, потому что очень обширный набор тем получился. Прекрасно, что всё бесплатно, если подписываетесь на каналы авторов, поэтому ссылка находится в описании. Событие классное, приходите. NVIDIA
Nvidia возвращается в Китай.
возвращается в Китай. Э, получается, что всё, как бы, ограничения сняты. С чем это связано, не очень понятно. Может, потому что смысла в этом особо не было. Всё равно туда это всё протаскивали. Но США разрешил экспорт H2 в Китай. Ну и всё-таки оттуда 25% выручки всех продаж Nvidia получала, ну и будет получать вновь. Есть небольшое ограничение. возраст 18 месяцев тех чипов, которые будут и разрешены к поставке. Но опять же этот Трамп своей своим широким жестом всё это разрешил. Но с Конгрессом будет определённый конфликт, вроде как ещё на 30 месяцев они всё это дело заблокировать могут. И где-то один ещё Дарио Амадей сильно грустит, потому что он является таким ярым вообще противником Китая и в целом развитие искусственной интеллекта в Китае. И в общем топит за то, чтобы, конечно, штаты были впереди планеты все. Надо, значит, как-то на государственном уровне это регулировать. Но вот такое решение было принято. Джинсен от этого вряд ли сильно расстроился. С другой стороны, есть
Китайский ИИ в Кремниевой долине.
ощущение, что у Китая и так всё прекрасно. Несмотря на все экспортные, импортные, точнее, ограничения, да, как бы американские модели нахрен особо никому не сдались, а именно стартапом в Силиконовой долине. Кремневой, простите. Квен, вот кто теперь лидер. По загрузкам на Хагин Face Квен обогнал Ламу, и сейчас у него 385 мл загрузок против 346 ламы. И мало того, если бы они там просто загружали эту бедолагу Квен, у себя там где-то инфренсили, так в общем-то нет. Airbnb, оказывается, сильно полагается на Квен. Очень хорошо, быстро и дёшево. венчурный капиталист там какой-то говорит, что его компания перенесла почти все свои рабочие задачи на KIC2 намного дешевле, чем Open и Antropic. В общем, не только openсорными моделями, я так думаю, пользуются, но и беспощадно всё это дело закупают, платят за китайский API. Когitionн построил нового кодингагента агента на модели Jeep AI. Курсор выпустил ассистента, и пользователи начали замечать, что он внутри монолога своего переключается на китайский. Но, очевидно, там какой-то дипсик тоже имеется. Дёшево, сердито, хорошо. Ну и как бы не сильно хуже, чем американские аналоги. Open AI Skills в
OpenAI Skills в ChatGPT.
чат GPT. Вот так вот. Open AI втихую без каких-то фанфар добавляет skills в кодекс и в чат GPT. Что такое skills? Это вот эта прикольная система того, как модель может обращаться к разным кускам контекста, когда ей это необходимо. Супер вообще просто. Я планирую снять про это ролик. Это в первую очередь есть в clдкод антропик это придумал и работает там это замечательно сам этим пользуюсь. Но вот теперь даже это есть в чат GPT, это есть в кодекс. Э хорошие, в общем, штуки делает антропик, которые, очевидно, быстро перенимаются другими участниками рынка. Если вам про Skills интересно почитать, то могу напишите в комментариях, подбодрите почитать, посмотреть, подумать, по посозидать. В общем, сделаю ролик, если будет активность. Gemini выходит с depressarch
Gemini Deep Research для разработчиков.
для разработчиков тоже большой важный релиз. Это первый depresearch agent, доступный в API. Тут у нас полный state of the art на Humanity Last Exam 46,4%. Это лучше, чем Gemini 3 Pro. Это лучше, чем GPT 5 Pro и все depressch версии, э, которые есть сейчас. Ну, может, там чуть они уже получше, конечно, OpenA, но в любом случае это, конечно же, полный фарш. на бенчмарках показывает очень хорошо. А вот этот релиз Гугла мне
Google Disco - Генерация веб-приложений.
понятен сильно меньше. Называется Диск. Это экспериментальный инструмент на базе Gemin3, который вам создаёт веб-приложение из открытых вкладок браузера. Genabs анализирует контент ваших вкладок, историю запросов, автоматически предлагает такие веб-приложения, которые, ну, как бы помогают визуализировать то, что у вас там происходит, и тот поиск, который вы там ввели. Очень странно. Очень непонятно мне зачем, потому что, ну, кто сейчас это делает. Я захожу в Перплексти, и мне Перплексти выдаёт как бы весь этот resarch. То есть у меня не у меня нет открытых вкладок, но Google, наверное, думает, что у кого-то ещё есть. Ну, очевидно, Ээ своеобразно в любом случае это можно установить. Я так понимаю, это устанавливается как отдельный браузер только на MacOS. И вот таким вот путём почему-то Google решил двигаться в сторону агентной всей этой системы. Ну, как бы круто на самом деле, если это работает хорошо. Это опять же ещё один шаг в сторону того, что агенты выполняют за нас много-много всего. Если Google здесь натренировали агенты или как-то вот научились с этим взаимодействовать. Ну и до таких полноценных, мощных агентных браузеров тоже осталось недалеко. Первая LLM
Первая LLM обучена в космосе.
обучена в космосе, и это прикольно. И, кстати, этой LLM стала моделька NANG GPT от Андрея Карпаты. На Nvidia H100 на орбите команда StarCloud успешно всё это дело обучила на полном собрании сочинений Шекспира. Это абсолютно первый случай запуска моделей обучения на непосредственно в космосе. И ещё запустили Inнференс на предзагруженной модельки Гема. Тут адаптация всего хардвер для невесомости, радиации, экстремальных температур. В общем, вряд ли супер простая техническая задачка. Но и цель проекта снизить нагрузку на земные энергоресурсы, использовать неограниченную солнечную энергию, которая у нас есть в космосе. Дата-центры могут работать 24xх7 без зависимости от погоды, времени суток, получая постоянный доступ к солнечному свету, что, конечно, не может не впечатлять. Получается, что и тут искусственный интеллект нас обогнал. Нашему естественному потребовалось, ну, десятки тысяч лет, чтобы развиться, там, ракеты, построить, полететь. Этот взял, запрыгнул, полетел. даже ни одного винтика в ракету не винтив. Простим ему.
Disney партнерится с OpenAI.
— Люди, роботы, привет. С вами Продсовет. Я, как всегда, Игорян. И сегодня поговорим про новости креативных нейросетей последней недели. Наверное, одна из самых интересных новостей заключается в том, что Disney подписывает контракт с Open AI. С одной стороны, мы как будто бы уже должны были привыкнуть к тому, что большие нейросетевые компании заключают договоры с другими не нейросетевыми, но большими компаниями. В ближайшие годы этого, естественно, будет только больше и больше. Ну и сейчас вот Дисней, котором, между прочим, принадлежат не только принцессы и Микки Маус, но ещё и, например, Marvel или Пиксар. Даже Звёздные войны с недавних пор принадлежат Дисней. Ну или не прямо, с недавних, да, летит, конечно, время летит. И в общем, Дисней говорит: "Вот миллиард Open AI берите и ещё возьмите вот 200 плюс наших персонажей и поместите их в ссору". История игрушек вверх. Moана Monstide Out - это головоломка, да, вроде. Короче, принцессы, Микки Маусы, Хан Соло, Капитан Америка, Дэдпул и так далее. Также их можно будет в чат GPT рисовать, будто бы сейчас нельзя. Но теперь это будет прямо очень просто. И в целом чат никогда не будет отвечать вам, что сейчас он рисовать не будет, потому что вот это вот кому-то принадлежит персонаж, авторские права, тыры-пыры. И говорят, в общем, что уже в начале двадцать шестого года эта возможность появится. И логичное соглашение Open Ei с помощью сосоры будет генерировать видео. Им создадут там какой-то специальный API с какими-то повышенными мощностями, чтобы вообще артефактов не было. Это будет такая ссора про, которой у нас с вами никогда не будет доступа. Взамен рекламируется персонаж Диснея и плюс все они попадают к нам на площадки. То есть любые мемы с персонажами, мерчи, комиксы, любой фанатский контент будет создавать намного проще. Как будто бы достаточно логичное решение. При этом забавно будет отметить, что Дисней подавал в суд на Мижорни и писал угрозы Chactтер AI, которые позволяют создавать персонажей для общения. Большие компании всё лучше понимают, что против нейростей не попрёшь. Впрочем, ничего. Увидимся на интенсиве. А следующую новость вы могли наблюдать в нашем Telegram-канале How to AI, где мы постим новости, в частности LLM. И в общем, в наш любимый интерфейс для LLM GPT chatча GPT добавили Photoshop. И не только Photoshop, на самом деле, но и Adobe Express - это такая light-версия фотошопа для того, чтобы делать какие-то лейауты, мини картиночки с текстом и акробат, то есть это приложение для работы с PDF-файлами. Начинание хорошее, но работает это просто-таки ужасно. Пожалуйста, макаку можешь на пляж поместить? Да, поместил. То есть макаку поместил на пляж, дал картинку без макаки. Далее чат говорит: "Загрузи картинку пляжа". Пользователь говорит: "Нет, давай сам уж сделай, что лишнюю работу мне даёшь". Все мы знаем, как нейросети любят лениться. Всё ещё что-то там пытается выкабениваться. Выкабенивается. Давай, Tropical Beach. Всё, генерируй, пожалуйста, генерируй. Но Image
Photoshop внутри чат-бота.
Generation недоступен внутри Photoshop Тула. Почему-то внутри фотошопа, блин, даже нанобана есть. Камон. И, кстати, будет забавно, если в перспективе они добавят нано банану через Photoshop внутрь чата GPT. Это будет действительно удобная достаточно коллаборация. И в общем, пытки, пытки, пытки. И по итогу ничего не получается. В целом достаточно знакомая ситуация. Думаю, как у меня, так и у вас не раз такое было в Geminii при попытке сгенерировать что-то в нанобанане. По правде говоря, в последних версиях её как будто пофиксили. Сейчас оно работает намного лучше, но вот теперь эта проблема добралась до чата GPT. Хотя тут, кстати, была версия 5. 1. Может быть, 5. 2 будет работать лучше. А тем временем клин 2. 6 выбивается на арену, но почему-то вообще не в топ, а лишь на десятое место. Кандинский 5. 0, кстати, занимает почётное четырнадцатое место, вообще недалеко от клинга, что очень хороший результат. То есть лучше, чем Hilua 02 Pro, которая очень хорошая модель. Кандинскому лютый респект. Это, если что, российская модель от Сбера. Но большая проблема в том, что это LM арена, то есть не самая лучшая, на самом деле, арена. Я бы ей так не доверял. Наtificial Analis, то есть арене, которую я больше уважаю, пока что CLН 26 не появился, но появился Genflir 2. 0, про который вообще нигде ничего не написано. Модель эта вот только появилась, и я вообще не смог найти никакой информации о том, что это за модель, где её использовать. То есть понятно, байду, но я даже от байду никаких официальных релизов не увидел. В самом байду вообще ничего нету, никаких объявлений. Artificial analisis тоже
Kling 2.6 и GenFlare 2.0
молчит, хотя у них новая лучшая видеомодель. Итак, вот уже второй день происходит, я не могу получить ответ, что и где, как и почему. Вероятно, это какой-то предтест. Как когда выходил рановый ген 4,5, его назвали Дэвидом, и никто не знал, что это такое. И в целом эта практика известная. И банана когда-то так вышло, и Блюбри было, и в целом много кто такое практикует. Но тут почему-то компания Байду решила, что зачем скрывать название, как бы лишний хайп терять, но как будто бы из-за этого наоборот интриги чуть меньше. Плюс до этого всегда всё-таки artificial analisis какие-то анонсы делали и писали, что вот у них новый лидер, теперь этого не произошло. Я всё ещё не понимаю, как это так работает. Может, кстати, вы знаете в комментариях напишите ответ, и я просто что-то не догоняю. Такое, конечно, тоже может быть. Короче, буду ждать ответы. Ну а ханьюан тем временем переименовывается в ху хчвайхи хи хь ну х ан ю х допустим hy кому-то может стало проще, мне лично нет. А тем временем Google добавляет анимацию в Pamell. Pamil - это сервис, который позволяет генерировать контент для ваших брендов. То есть какие-то всяческие рекламные текстовые картиночки с текстом. И вот теперь, в общем, эти картиночки можно анимировать. Видите, текст появился сам, цветочек вставили. Красотища. Также Google обновляет Mixбоard, и у меня, честно говоря, уже немножечко едет крыша от количества сервисов, подсервисов, обновлений, дополнений, которые есть у Гугла. Миксбор - это такая интерактивная рабочая среда, в которой можно взаимодействовать с картинками, можно генерировать картинки
Hunyuan
в nanoban Pro, также взаимодействовать с файлами, например, с PDF. И всё это вот можно так вот выделить, объединить и на его основе сгенерировать что-то новое. Несколько досок теперь можно объединять
Креативные инструменты Google labs
в один проект. Поддерживаются пдфы, хейки и тифы. И в целом, как будто бы понятно, зачем это нужно. Тут суть в том, что просто вот у вас есть доска такая рабочая, то есть это, можно сказать, аналог мира или Фигмы, но с неизмеримо меньшим количеством функционала. Короче, что-то зачем-то это сделали. Но это вот Google, у них экспериментальные среды, и если что-то будет реально пользоваться популярностью и покажет себя как хорошее приложение, то они будут этим заниматься сильнее и выпустят это как полноценный сервис. А также Google обновляет DOPL. DOPЛ приложение для примерки одежды. Взяли, выбрали, примерили. Теперь там есть фит, то есть лента, на которой сразу же показаны какие-то одежды, ведущие на странице, где это можно всё добро купить. Я уже миллион раз говорил о том, насколько плохо примеривать одежду через AI. Это, конечно, лучше, чем ничего, но точности никогда не будет, потому что нейросеть не знает, какое у вас телосложение, также не знает, какой крой одежды, как этот крой сядет на ваше тело. Но как оно подойдёт, условно, к чему-то, что у вас есть, можно проверить, наверное. Но точности в этом, конечно же, никакой не будет. Лучшее, наверное, о чём стоит рассказать - это то, что волоу от Google можно вот так вот взять у вас видео, да, наливает. Потом выбираем чувака на первом кадре, пишем: "Удали, удали официанта, не нужен он". И вот чайник наливает чаёчек сам. Фигма Shop. Вот так вот я это озаглавил. возможность ещё более точечно взаимодействовать, редактировать изображение внутри Фигмы. Теперь вот так выделяем область, пишем там удали объекты ненужные и они удаляются, хотя всё остаётся таким, как было. Поверх пишем текст, выделяем вот ещё эту штуку, тоже её там удаляем. Доступна в Фигма дизайне и дро. А Spline тем временем Сплаine - это, кстати, замечательный сервис для работы с 3D внутри браузера. Ну, с таким, естественно, простеньким 3D выпускает канвас, который совмещает 2D вместе с 3D. Оп, всё там написали, текст поверх добавили какой-то. В целом это можно сделать и в Фигме, и внутри фотошопа просто чуть сложнее. Тут это прямо вот максимально нативно.
Figma edit
Авей выпускает генератор миров, то есть модель, которая генерирует миры. Есть тоже тренд некий на это сейчас. И Runway в целом как будто бы очень хорошо справляется с задачей генерации большого количества объектов. То есть вот много людей тут прямо вот особенно их много, естественно, артефакты есть, но, ну, я такого не видел, честно говоря, ещё в генерации миров. Много в чём модель, конечно, отстаёт от топовых представителей ниши, как будто бы, но с
Обнова Spline
другой стороны, вот по количеству именно разнообразия деталей, она очень сильно обгоняет всё, что я до сели видел. Ну, то есть движение прямо реально хорошее и, ну, круто, мне нравится. Физика хорошая, то есть прямо вот рыбки плавают, как должны плыть, там газы видели, поднимались, да, волны от лодки отходят. Это мне, честно говоря, нравится. То есть как будто бы мы уже очень близко подбираемся к генерации суперреализма какого-то. И только на прошлой неделе я говорил про PSDгенератор, который генерирует не PSD
Генератор миров Runway.
а просто картинки с текстом на основе квенмодели. Тут появился Омni PSD, реально PSD-генератор. PSD, если что, это не что-то цензурное, а формат файлов внутри фотошопа. Взяли картиночку, оп, сгенерировался текст, передник и задник отдельно друг от друга. Пока что у нас есть только исследование, то есть поиграться с этим нельзя. Но и как мы видим по превьюшке, тут, конечно же, не прям супер круто это пока что всё реализовано, но сам задел на то, что мы можем просто по промпту генерировать 3D-файлы, это уже очень круто. Так, ну и ещё я тут случайно на хагфейсе обратил внимание, что есть йпер, который ещё более популярен за сегодня, чем этот PSD генератор. И просто посмотрите, это типа тоже генератор миров. Но вообще какой-то сумасшедший. Это генератор таких как бы 3D миров для двух глаз. То есть картинки
Генератор PSD
чуть-чуть под разным углом, если обратите внимание. Ну, точнее, ладно, всё не так круто. Это просто модель, которая превращает монокулярную, то есть обычную картинку в картинку для 3D, то есть в картинку, которая с двух небольших разных углов показывает происходящее. Короче, чтобы можно было надеть 3D шлем в один глаз. Одна картинка, в другой другая. У тебя ощущение, что ты на что-то объёмное смотришь. Ну и последняя новость про гонки 2. 0. Вы уже могли слышать про гонки сперматозоидов.
3D видео генератор
Компания привлекла 10 млн долларов инвестициями, и они строят, в общем, как заявляется, следующий олимпийский вид спорта. В целом я забавы ради эту новость добавил. Вы знаете, я такое люблю. Но сама концепция сперматозоидных гонок мне дожуть нравится, потому что по сути это же соревнование людей, то есть это же реально клетки человека соревнуются друг с другом. Только тут не все клетки человека одного соревнуются со всеми клетками другого, а лишь избранные. Но почему нет? Это абсолютно отличается от, например, каких-нибудь гонок тараканов. Потому что таракан - это всё-таки другое животное, которое ты тренируешь. А тут для того, чтобы у тебя были хорошие бойцы, тебе надо следить за своим здоровьем, правильно питаться и, наверное, ещё предпринимать какое-то количество действий. Не знаю, от чего
Олимпийские игры сперматозоидов
прямо вот зависит скорость сперматозоидов. Это мы как раз-таки узнаем по итогу этих олимпиад. В первую очередь это, конечно же, генетика. Но, как и в любом спорте, генетика является очень важной составляющей. Но и фактор тренировок тут, скорее всего, имеет место быть, потому что какие-то образы жизни однозначно будут лучше влиять на качество и на скорость ваших бойцов, в том числе и занятия спортом, скорее всего, и питание, и там походы в баню с льдом в трусах. Это, если что, действительно важный фактор фертильности, поэтому не перегревайте своих малышей. И вот на такой позитивной ноте выпуск подошёл к концу. Если он вам понравился, то обязательно подписывайтесь на канал, чтобы не пропускать новые выпуски, и ставьте комментарии, лайки, колокольчики. В общем, вы знаете всё, что делать. С вами был продуктивный совет. Я Игорян, дядя Д был в первой половине ролика. Не забывайте про интенсив, который вот-вот уже начинается. Будем генерировать видео как ошалелое. И ещё увидимся. Пока. —