# Ты не опоздал: БОЛЬШОЙ переход к общему-ИИ начался. Сбер. Сергей Марков про нейросети и ИИ-агентов

## Метаданные

- **Канал:** Лебедев про Нейросети: уроки, секреты, лайфхаки
- **YouTube:** https://www.youtube.com/watch?v=836GW_n5NOY
- **Дата:** 11.07.2025
- **Длительность:** 39:32
- **Просмотры:** 2,033

## Описание

🎁 Хочешь разобраться в нейросетях с нуля? Забирай бесплатный курс «Нейросети. Быстрый старт» — всё по делу и без воды:  https://iiuniversitet.ru/ii_start?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437
📖 Обучайся сейчас — завтра может быть поздно. Скачай книгу «Нейросети: как обрести профессию будущего»: https://iiuniversitet.ru/futurebook_free?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437

⏩ И еще больше подарков, которые можно забрать сразу:
Скачай 2000 готовых промтов для ChatGPT  https://iiuniversitet.ru/2000prompts-free/?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437
🚀 АНКЕТА ПРЕДЗАПИСИ НА НОВЫЙ ПОТОК "Нейропродюсер" https://kurs.iiuniversitet.ru/predzapis_neuroproducer?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437
Закрытый мастер-класс "Контент конвейер: как создать безлимитку клиентов с нейросетями" https://iiuniversitet.ru/mk_neurocontent_life/?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437
Закрытый мастер-класс "ИИ-агенты: как автоматизировать работу и получить х2 доход" https://iiuniversitet.ru/mk_svyaski_life?utm_source=youtube&utm_medium=video&utm_campaign=opisanie&utm_term=marketograf&utm_content=YT-437

В этом видео 
Сергей Марков. От генеративного ИИ к интерактивному: основные направления развития технологий
Переход от генеративных моделей к интерактивному ИИ — главное, что ждет нас в 2025 году! В ролике: что такое ИИ-агенты, почему это новая революция, какие тренды и возможности открывают интерактивные системы, как использовать их в жизни и работе. Практические кейсы, простые объяснения и подарки — смотри до конца!

Навигация по видео: 
0:00 — Введение: эволюция ИИ от генеративного к интерактивному
0:40 — Почему определение ИИ и AGI до сих пор спорное
2:30 — Миссия искусственного интеллекта: расширять возможности человека
4:10 — Различие между узким ИИ и генерализованными системами
5:05 — Что такое AGI и как его определяют лидеры рынка
7:20 — Критика существующих определений AGI
10:00 — Почему важно практическое применение ИИ
13:17 — Новый фокус: не просто ИИ, а “практичный ИИ”
15:15 — Барьеры человеческого разума, которые помогает преодолевать ИИ
22:10 — Исторический экскурс: информационные революции
24:10 — Генеративный ИИ как новый этап развития
25:12 — Главные тренды: управляемость, сотворчество, персонализация
27:10 — От генеративных моделей к интерактивным агентам
29:23 — Что такое интерактивный ИИ и зачем нужны агенты
31:16 — Ключевые свойства ИИ-агентов: действия, память, фрейминг
35:01 — Как работает интерактивное взаимодействие: рефлексия, скаффолдинг
37:12 — Мультимодальные и омнимодальные системы будущего
38:01 — Как быстро меняются подходы в ИИ 

🚀 Также можете найти меня здесь:
Телеграм: https://t.me/marketograf 
ВКонтакте: https://vk.com/skillsupru
Дзен: https://dzen.ru/marketograf
Нейропрокачка https://t.me/+5DvJWeYvoFpmMGE6
Rutube https://rutube.ru/channel/41156136/

#нейросети #нейросеть #ии #chatgpt #чатгпт #ПавелЛебедев

## Содержание

### [0:00](https://www.youtube.com/watch?v=836GW_n5NOY) Введение: эволюция ИИ от генеративного к интерактивному

как от генеративного искусственного интеллекта перейти к интерактивному. Что эти системы объединяет? Искусственный интеллект, способный успешно выполнить любую интеллектуальную задачу, посильную для человека. Посильную какому человеку? Каким образом мы говорим о том, что задача решена успешно? Люди не всегда надёжны. Сейчас будет выступать Сергей Марков из Сбера, управляющий директор управления экспериментальных систем машинного обучения. и он расскажет про то, как от генеративного искусственного интеллекта перейти к интерактивному, про основные направления развития технологий. Когда я буду сегодня употреблять термин искусственный интеллект, я буду понимать прежде всего под ним область науки и технологии, которая занимается автоматизацией решения интеллектуальных задач. То есть

### [0:40](https://www.youtube.com/watch?v=836GW_n5NOY&t=40s) Почему определение ИИ и AGI до сих пор спорное

если есть какая-то задача, которую люди традиционно решают при помощи своего человеческого интеллекта, и мы создаём систему, которая способна помочь людям решать такие задачи, способна, может быть, в определённой ситуации даже подменить человека при решении такой задачи, то мы, собственно, и занимаемся работой в области искусственного интеллекта. Ну, э-э, тоже, наверное, несколько пафосных, но необходимых слов о роли вообще этих технологий для нашего общества. Но человечество - это такой вид, который, ээ, ну, вот стал много миллионов лет назад на путь технологического развития. Да, у нас с вами нету острых зубов и когтей, но мы с вами придумали ножи, пики, вилки, мечи и так далее, да, у нас нету с вами толстой шкуры, но мы придумали одежду. Вот. И наш человеческий разум, он обладает определёнными ограничениями в силу своей биологической природы, в том числе. Вот. Э, и для того, чтобы раздвинуть эти ограничения, мы создаём большое количество разных инструментов. технологий, которые, собственно, и формируют вот эту сферу искусственного интеллекта. И основная миссия, наверное, которая стоит перед технологиями искусственного интеллекта создателями - это усиление человеческого интеллекта, да, раздвижение границ возможностей для человека в интеллектуальном плане. Ну, ээ, вы, наверное, заметили, что это определение искусственного интеллекта, оно, конечно, э очень широкое. системы искусственного интеллекта попадает ээ в том числе системы очень узко специализированные. А, и вообще говоря, когда я рассказывал людям о том, что происходит в области искусственного интеллекта ещё 10 лет

### [2:30](https://www.youtube.com/watch?v=836GW_n5NOY&t=150s) Миссия искусственного интеллекта: расширять возможности человека

назад, то я обычно говорил, что, ну, вот смотрите, все системы искусственного интеллекта, которые нами были созданы до сих пор, а это системы так называемого узкого или слабого или прикладного, как говорят, искусственного интеллекта. Что эти системы объединяет? Их объединяет тот факт, что они предназначены для решения обычно какой-то одной интеллектуальной задачи. То есть, ээ, при помощи шахматной программы мы можем играть в шахматы, да, мы можем находить лучшие ходы шахматное позиции, но шахматная программа, она не может распознавать котиков на картинках, она не умеет играть в покер. Более того, она не умеет даже играть в шахматы на доске 9 на9. Да, только в стандартные шахматы на доске 8x8. И именно благодаря вот такой чрезвычайно узкой специализации, э, эта система способна э конкурировать ээ с такой штукой, как человеческий интеллект, по решении вот одной узкой интеллектуальной задачи. А на самом деле в природе есть живые организмы, которые тоже могут посоревноваться с человеком в решении каких-то отдельных интеллектуальных задач. Например, пчела в улье, оптимальный маршрут построит гораздо лучше и быстрее, чем это сделает человек. Хотя, э, нервная система человека состоит из примерно 86 млрд нейронов, а нервная система пчелы состоит всего из нескольких сотен тысяч нейронов. Но, мм, конечно, за последние десятилетия ээ мы проделали довольно большой путь в развитии технологий искусственного интеллекта. И о современных системах искусственного интеллекта уже можно говорить в какой-то

### [4:10](https://www.youtube.com/watch?v=836GW_n5NOY&t=250s) Различие между узким ИИ и генерализованными системами

мере о появлении у них некой генерализации. То есть системы типа chт или гигачата могут решать не какую-то одну интеллектуальную задачу, а могут решать довольно широкий спектр интеллектуальных задач, да, и написать за вас э не знаю, продающий текст или заготовку, по крайней мере, такого текста, да, провести мозговой штурм, выполнить перевод с одного языка на другой, ну и так далее, и так далее. И вот другой полюс систем искусственного интеллекта - это так называемый общий или универсальный искусственный интеллект, да, такой то ли святой грааль всей нашей сферы, да, мы мечтаем о том, чтобы создать системы, которые могли бы подобно человеческому мозгу, подобно человеческому интеллекту решать, ну, неопределённо широкий спектр

### [5:05](https://www.youtube.com/watch?v=836GW_n5NOY&t=305s) Что такое AGI и как его определяют лидеры рынка

интеллектуальных задач. То есть одна и та же система, э, умеет ээ много-много чего разного. И мы даже заранее не знаем, а что именно, да. Сталкиваясь с новыми вызовами, новыми интеллектуальными задачами, люди тоже иногда вполне себе оказываются способны их решать. А значит, сама по себе концепция общего искусственного интеллекта, она была сформулирована уже довольно давно. То есть сам термин AG, artificial General Intelligence, общий искусственный интеллект, она, а, появилась в далёком 1997 году. Э, и, ну, довольно забавный факт в том, что появилась она в работе под названием "Нанотехнологии международная безопасность". Вот. И, э, автор этой концепции - это Марк Губрут. Э, сегодня в любом там бизнес-учебнике, практически в любой популярной прессе, вы увидите вот примерно такое определение общего искусственного интеллекта, что общий искусственный интеллект - это искусственный интеллект, способный успешно выполнить любую интеллектуальную задачу, посильную для человека. Вот. Ээ, ну и понятно, что современные большие языковые модели, современные фундаментальные модели в некотором смысле движутся в этом направлении, да? То есть они всё ещё не являются общим искусственным интеллектом, но кажется мы приблизились к тому, чтобы создание таких систем стало возможным. Вот. Но, ээ, опять же, как видите, сам этот термин появился давно, когда, в общем-то, о создании таких систем ещё не шло и речи. И поэтому определение это носит довольно теоретический характер. Оно скорее обозначает направление, в котором движется технология. Но когда мы будем пытаться применять его, ну, скажем, как definition of, да, как определение того, создали мы или не создали такую систему, у нас возникнет куча проблем. Почему? Потому что, ну, вот смотрите, ээ, вот это определение. Искусственный интеллект, способный успешно выполнить любую интеллектуальную задачу, посильную для человека. Фактически можно задать вопрос каждому

### [7:20](https://www.youtube.com/watch?v=836GW_n5NOY&t=440s) Критика существующих определений AGI

слову в этом определении. Да, по сильную какому человеку, да? О каком человеке идёт речь? О среднестатистическом человеке или, может быть, о, э, самых лучших экспертах в каждой области? Или, может быть, речь идёт о м, ну, я не знаю, что есть какая-то задача, которую, например, во всём мире может сделать только один человек. Должны ли мы, значит, способность решать эту задачу считать необходимым требованием для того, чтобы признать систему HI? Вот. Ну, вторая проблема, да, в рамках какого лимита ресурсов мы, э, находим ответы, решаем эти задачи? Э вообще написать, например, программу, которая идеально играет в шахматы, очень легко. Вы просто пишите программу, которая перебирает абсолютно все варианты ходов, да, варианты ответных ходов и ответных на них и так далее. То есть всё дерево возможностей шахматной игры. и выбирает дальше тот ход, который ведёт к наилучшему для вас результату. Но и такая программа, она будет с гарантией всегда в любой шахматной позиции находить сильнейший ход. Но проблема только одна. Эта программа будет работать миллиарды лет в большинстве позиций, да? И ээ ну если мы создадим систему, которая действительно будет способна решать абсолютно любую интеллектуальную задачу, но на каждый ответ будет тратить миллиарды лет. триллион киловаттчасов и так далее. Вряд ли нас ээ устроит это как достижение какого-то практически важного результат. Опять же, что значит успешно выполнить любую интеллектуальную задачу? Ну, ээ успех мы измеряем каким образом? Если речь идёт о решении, э, уравнения, например, то легко проверить, совпадает ли ответ с эталона. А если речь идёт о творческой задаче, ну, то есть, например, нарисовать картину или написать текст, каким образом мы говорим о том, что задача решена успешно, да? Каковы конкретно критерии этой успешности? А действительно ли важ важны все интеллектуальные задачи? Но ведь с прикладной точки зрения, наверное, для нас имеют значение задачи полезные, да, те задачи, которые существуют в имеющихся бизнес-процессах, например, э в индустрии. Ээ может быть с практической точки зрения система, которая не будет способна решать не знаю, там ребусы, кроссворды. Она не будет подходить под это определение. Но с практической точки зрения она сможет, не знаю, заместить

### [10:00](https://www.youtube.com/watch?v=836GW_n5NOY&t=600s) Почему важно практическое применение ИИ

огромное количество ручного труда. Ну и самое главное, как проверять, да, как должна быть выстроена методология оценки успеха. В общем, короче говоря, как видите, у этого определения, у него очень много проблем. Да, конечно, м в ближайшие годы вы наверняка услышите очень много заявлений от ведущих исследовательских э-э команд о том, что система ээ система создана. Да, наверняка в какой-то момент об этом заявят Open AI, может заявить антропик, да, другие лидеры индустрии. Вот. Но как вы видите, проблем у определения AI очень много. И заявления эти, они будут носить скорее маркетинговый характер. Вот. Потому что, очевидно, что очень трудно договориться о том, что такое. И вот этот кризис, он заметен невооружённым взглядом. Я считаю апофиозом э появления вот такого определения общего искусственного интеллекта, да. Э значит система будет считаться достигшей уровня AGI, когда сможет генерировать прибыль не менее 100 млрд долларов. Но лично мне это напоминает разговор о красоте дома, да, в маленько в маленьком принце у Экзюпери есть там рассуждение о том, что взрослому очень трудно э объяснить, что дом красивый, да, но если вы ему скажете, что он стоит 100 млн лир, да, тогда он воскликнет: "Какая красота". Вот. Ээ, в целом важно понимать, что, ээ, определённые заявления, которые делаются крупными технологическими компаниями, они очень часто направлены на достижение вполне конкретных экономических целей, да, и они имеют слабое отношение, на самом деле, к научным реалиям. Вот. Ээ, в принципе, конечно, у нас сейчас перед нами приступа проступают контуры вот примерно какого-то такого мира, да, что есть технологические компании, которые создают ээ большие модели, ээ значит, будь то современные генеративные модели или будущие AGI системы, которые будут названы AGI системами, да, и, ээ, значит, эти компании будут поставлять вот этот самую базовую технологию, вот это вот своеобразное электричество другим участникам народного хозяйства, да, ну и вот все будут выстраиваться к ним за э вот этой вот необходимой технологией, за вот этим трактором, который будет нужен практически в любом существующем. Мы в этом смысле решили не заниматься непродуктивной деятельностью в плане там переопределения AGI, да, потому что, ну, вот термин AI, каждая лаборатория сегодня стремится дать ему своё какое-то определение, которое, значит, ну, решит вот эти вот проблемы с отсутствием definition of, с отсутствием чётких критериев. Вот.

### [13:17](https://www.youtube.com/watch?v=836GW_n5NOY&t=797s) Новый фокус: не просто ИИ, а “практичный ИИ”

Вот. Но я думаю, что нам лучше говорить о том, что, значит, нас интересует не просто AI, нас интересует AI практичный, да? Э, значит, ээ с точки зрения пользы, которая может быть принесена обществу, а значит, мы можем создать вот такое новое определение, сказать: "О'кей, мы не создаём AI, мы создаём практичный чаi, который направлен на решение определённых задач". Ну и дальше уже, ээ, заниматься содержательным выполнением этого определения, использовать его как, ээ, ну, некий такой компас, который показывает, э, направле необходимое направление развития технологий, да, то есть какие именно стороны технологии мы должны инвестировать в своё время ресурсы для того, чтобы, э, значит, увеличить пользу, которую эти технологии принесут обществу. Ну, вообще вот миссия информационных технологий, как, э, значит, технологии для расширения возможностей человека - это, ну, наверное, такая хорошая традиция. Ээ если мы обратимся к работам Дугласа Энгельбата. А Дуглас Англьбарт - это, кстати, человек, о котором обычно говорят, что это изобретатель компьютерной мыши. Вот. Но, вообще-то, Дуглас Ангельбарт - это человек, который изобрёл, э, основы практически всех современных интерфейсов человек-машины. Э то есть возможность создать ээ документы в разных окнах, да, возможность выделить там текст или часть изображения, применить к выделенному какую-то операцию, скопировать фрагмент, вставить его. Это всё идеи, которые были предложены в своё время Далсом Грвартом. И, значит, в самом начале шестидесятых годов он написал, э, так называемый

### [15:15](https://www.youtube.com/watch?v=836GW_n5NOY&t=915s) Барьеры человеческого разума, которые помогает преодолевать ИИ

концептуальный фреймворк расширения человеческих возможностей. Эта работа, она не теряет и до сих пор в своей актуальности. Значит, и в ней он развивал, собственно говоря, идею того, что технологии должны быть использованы для расширения возможности человека. Ну или вот другой известный учёный из области информационных технологий Эдуард Фредкин, он выражался ещё более поэтично, да, он говорил, что как партнёры с интеллектуальными системами, которые дополняют и компенсируют наши исправимые недостатки и в полной мере используют присущую нам креативность, мы могли бы развивать все области науки и искусства. Слительные крылья мы могли бы взлететь навстречу Феникс. То есть, в общем, есть такая определённая поэзия, миссии развития этих технологий. Вот. Ну, хорошо, мы говорим о раздвижении барьеров человеческого разума. О каких барьерах идёт речь? А, ну вот некоторые из них. Список отнюдь неполный, ээ, но он позволяет прикинуть, ну, вот что именно мы хотим преодолеть. Ну, во-первых, человеческий мозг, например, не очень быстрый, да? Мы, если говорят о мозге, часто в шутку называют его, да? То есть хардвер, software и есть, потому что значит это вот такая мокрая платформа, мокрые вычисления, потому что, значит, это система электрохимическая. Вот. И скорость распространения сигналов через синоптические мембраны в мозге, она ограничена, ээ, значит, разницей потенциалу. То есть, чтобы ион пропихнуть в ионный канал в синапсе, нужна какая-то разница потенциалов. Но если эта разница потенциалов превышает 1,27 В, то вода начинает разлагаться на водород и кислород, и ваш мозг просто взорвётся. Это не очень способствует какому-то продуктивному мышлению. Вот. Э люди не всегда надёжны, да? Те из вас, кто давал кому-то деньги в долг, знают, что у людей есть такое свойство, как ненадёжность, да? В некоторых ээ бизнес-процессах, индустриях мы, э, не можем полагаться на людей с точки зрения надёжности. У нас есть ограниченный параллелизм, ограничение возможности параллельно решать несколько интеллектуальных задач. Мы очень быстро теряем производительстве в качестве решениях задач, если решаем несколько задач одновременно. Коммуникативное ограничение, пропускная способность коры сенсорной коры головного мозга. Мы не можем с вами смотреть одновременно на одном экране, не знаю, 10 сериалов. А, хотя, ну, наверное, можно было от это в 10 раз больше удовольствие получать, но это так не работает. Э, люди довольно хрупкие. Ээ, мы с вами живём в очень узком диапазоне температур, ускорений, ээ, и концентрация кислорода и так далее. Э, у людей есть проблема со сложностью систем, которые они в состоянии проанализировать. такой барьер, порог сложности. Э, известный информатик Ссар Эдальга в шутку говорит так, что вот способность человека понимать ту или иную систему, она ограничена одним челобайком. То есть вот если исчерпывающее описание чего-либо вмещается в этот 1лобат, да, человек в состоянии понять ээ значит вот систему во всей её сложности и многообразия. Если нет, то мы с вами начинаем что-то упрощать обычно сильно или, значит, как-то однобоко понимать процессы. Ну в конце концов человек не может знать всего. И в мире встречаются системы, которые по уровню всей сложности далеко превосходят способности отдельно взятого человека к познанию такой сложности. Мы, конечно, создаём научные коллективы для этого, но, как вы понимаете, любой коллектив - это всегда тоже некоторые проблемы, да, некоторые проблемы с масштабированием. Если один строитель строит дом за год, это не значит, что миллион строителей возведут вам его за несколько секунд. Это важно учитывать. Память человека ограничена, ограничены его экспертные навыки и умения. У нас есть некоторые барьеры мотивации. Нам не всегда хочется решать какие-то задачи, а надо. Вот. Ну и в конце концов барьеры, масштабирования и репликации, да. Если вам завтра нужен кол-центр с тысяче операторов, да, то вряд ли вы за день сможете такой кол-центр создать и запустить. Вот. Э, а если через день вам этот кол-центр больше не нужен, да, вы не можете там одним днём всех людей уволить и всё это дело закрыть, да? То есть вот если вам нужно где-то в вашем бизнес-процессе уметь гибко масштабироваться, да, то если исполнительными исполнительные функции у вас там люди выполняют, то у меня для вас плохие новости. Вот. Ну, в отличие от людей, да, там запустить 1. 000 виртуальных роботов и потом потушить их уже, конечно, проблема. Вот. Ну, ээ, я иногда на мероприятиях, э, в шутку провожу такую такой интерактивчик, да, три предмета, что их объединяет, да, и, ну, обычно в зале, конечно, я уверен, что и среди вас кто-то уже догадался, значит, о чём здесь идёт речь, да? Речь идёт о каменном, бронзовом и железномках в истории человечества. Это концепция, которая нам известна со школьной скамьи. Но самое смешное в этой концепции то, что, в общем-то, она появилась только в начале XIX века, да? То есть до 19 века вы не найдёте в литературе упоминаний о каменном, бронзовом или железном веке. Вот. Ну и, вообще говоря, пока историков в основном финансировала церковь, да, книги по истории чаще всего начинались с рассказа о Адаме, Еве, райском саде и так далее. Вот. Ну, когда фондирование изменилось в эпоху промышленной революции, да, у вас возникла вот картина, которая человечество последовательно подчиняло свои воли разных субстанций: камень, бронзу, железо. Вот. Ну и в конце концов построила сталетейный завод во Франкфурте на Майне, который, конечно же, является венцом развития человеческой цивилизации. Вот, как вы понимаете, картина эта гораздо больше говорит не об реальной истории человечества, а о том обществе, в котором эта картина возникла. Вот. И вообще-то, ээ я вот заглянул в топ компании по капитализации и обнаружил, что стали заводов там теперь не так много. Вот топи мировом компании, чей бизнес так или иначе связан с обработкой информации. Что это значит? Вообще говоря, вот эту вот схему, её можно очень легко переизобрести и сказать

### [22:10](https://www.youtube.com/watch?v=836GW_n5NOY&t=1330s) Исторический экскурс: информационные революции

что, знаете, вообще в истории человечества, ну, конечно, там камень, ножница, бумага - это всё хорошо и важно, а, но, вообще-то, в истории человечества были другие важные революции, другие важные эпохи. Вот, ээ, о чём здесь идёт речь, да? Ну, во-первых, это эпоха устной речи. Когда-то вся информация между людьми, она, э, передавалась исключительно устном путём. Потом возникла письменность, и это стало очень важной революцией проводки информации. Теперь бабушка умерла, а рецепт любимого пирога остался. Вот. А можно написать инструкцию, как построить дом, и отправить её за там 500 км. И за 500 км люди, руководствуясь этой инструкции, построят дом. А потом произошла ещё одна важная революция, революция книгопечатания. и человечество вступило в эру книгопечата. Теперь тиражирование информации удешевилось примерно в 10. 000 раз. То есть, соответственно, это вызвало к жизни совершенно новые явления, процессы. Да. Если письменность до этого во многом сформировала торговлю, ремёсла, появление печатного слова тоже довольно радикальным образом наше общество трансформировало, дало основу создания современной науки, например, повысила доступность информации, в принципе вызвало к жизни какие-то явления, которые раньше были принципиально невозможны, типа там периодической печати. Вот. Ну а потом революция интернета. И это тоже очень важная революция. Потому что электронный документ, очевидно, ещё гораздо более доступен, ещё гораздо более дёшев в изготовлении. Ну а что дальше, да? Окажется, мы с вами находимся внутри ээ очередной важной революции, да, и смены парадигмы информационного метаболизма, не побоюсь этого слова, нашего общества, это появление технологий геративного искусственного интеллекта. И вот сегодня, ээ, значит, в тех системах, которые мы наблюдаем, э, мы можем легко

### [24:10](https://www.youtube.com/watch?v=836GW_n5NOY&t=1450s) Генеративный ИИ как новый этап развития

увидеть, ээ, картину самого ближайшего будущего, да, будущего, в котором вы систему искусственного интеллекта, например, попросите написать для вас книгу про, ну, я не знаю, про вантузы. И ещё несколько минут назад такой книги не было, да? А потом через небольшой промежуток времени система искусственного интеллекта обобщит всю информацию о вантузах, которая доступна в цифровом следе человечества, и создаст для вас по вашему запросу индивидуализированный текст. Ну и, как вы понимаете, это снова резкое удешевление создания и тиражирования информации. Вот. И это означает очень серьёзную серьёзные изменения практически во всех существующих сферах деятельности. Опять несколько слов о практичном AGI, куда на самом деле, например, мы стремимся развивать эти технологии, в каком направлении. В целом этот взгляд, наверное, разделяют многие представителей индустрии. Э у нас есть сегодня модели, которые пишут тексты, генерируют картинки, пишут музыку и так

### [25:12](https://www.youtube.com/watch?v=836GW_n5NOY&t=1512s) Главные тренды: управляемость, сотворчество, персонализация

далее. Концептуально задача генерации самого разного контента решена. Но чего мы хотим от этих моделей? Мы, конечно, хотим большую управляемости, да. Мы хотим, чтобы они лучше сложились инструкциям, чтобы мы могли детально описывать образ результата для того, чтобы получить нужный нам артефакт от генеративных систем. А мы хотим повышение точности и эффективности в сценариях сотворчества, когда человек работает совместно с машинами над созданием чего-то нового. Мы хотим, чтобы развивались технологии персонализации моделей, то есть, ну, тоже в некотором роде, значит, такая кастомизация, но когда, значит, система подстраивается под своего пользователя. Развитие технологий рабочего пространства. Нам важно работать часто не просто в режиме чата, да, иметь какое-то пространство рабочее, в котором будет в которым у нас будут храниться генеративные артефакты, с которыми мы сможем работать и так далее. Ну, опять же, на повестке дня снижение коммуникативных транзакционных затрат, то есть сни повышение скорости ответа систем, да, то, что называется снижением латентности, возможность взаимодействовать с системами генеративного искусственного интеллекта в самых разных модальностях, да, то есть картинки, звуки, тексты, видео и так далее. Всё это желательно любой произвольной смеси. Ну и, конечно, важное направление - это технологии информационной гигиены, так называемые. То есть мы понимаем, что увеличение объёмов информации, которые манипулирует общество, оно требует повышенного предъявляет повышенные требования к проверке фактов, к объяснимости, безопасности в плане кибербезопасности, борьбы с Фродом и так далее. Вот. Ну вот примеры там того, куда развиваются технологии, да, то есть от моделей, которые просто могут нарисовать картинку по вашему запросу, да, мы переходим к моделям, которые могут изменять картинку

### [27:10](https://www.youtube.com/watch?v=836GW_n5NOY&t=1630s) От генеративных моделей к интерактивным агентам

э в соответствии с э вашей инструкцией на естественном языке, да, поменять стиль, добавить, удалить какой-то объект, ээ поменять, ээ, не знаю, там, зиму на осень, заменить одного человека на другого и так далее. Другой хороший пример - это, э, переход от, э, режима работы с документами в формате чата к, ну, такому переизобретению текстового редактора в эпоху генеративного искусственного интеллекта, когда мы можем работать с текстом, с одной стороны, в привычном формате текстового редактора, да, но мы можем, например, выбрать любой фрагмент текста и применить к нему какую-то операцию, да, например, изменить стиль, ээ, расписать поподробнее, сократить, выделить главную мысль, приукрасить текст и так далее, да? Причём у вас есть палитры таких генеративных инструментов, и вы можете создавать новые нужные вам операции просто путём написания промта к генеративной модели. Вот. Ну вот пример два примера таких проекта, направленных на развитие практичного AGI. Значит, ну, то, что было заявлено в теме выступления, переход от генеративного искусственного интеллекта к интерактивному, который у нас стоит на повестке дня. Вот смотрите, в пределах революции глубокого обучения, которая продолжается последние 12 лет, 13 уже, в общем-то, у нас происходила важная смена парадигмы, да, мы начинали с систем главным образом дискриминативного искусства интеллекта, то есть систем, которые в состоянии решать задачи классификации, задачи распознавания образов и так далее. Мы живём с вами в эпоху генеративного искусственного интеллекта. Да, мы смогли в какой-то момент благодаря революции трансформеров, благодаря появлению трансформерных моделей эффективно использовать параллельные вычисления, создавать действительно гигантские нейросети. И эти гигантские нейросети оказались способны решать задачи, например, по генерации текстов, картинок, звуков и так далее. Что дальше? Вот Мустафа Сулейман, один из основателей Deep Mind, считает, что мы с

### [29:23](https://www.youtube.com/watch?v=836GW_n5NOY&t=1763s) Что такое интерактивный ИИ и зачем нужны агенты

вами вступаем в эпоху интерактивного искусственного интеллекта. То есть речь идёт о системах, а, которые будут способны решать, э-э, задачи не те простые генеративные задачи, которые решаются в один присест, да, а будут способны решать сложные задачи, когда решение задачи требует ээ многих шагов, да, и в процессе решения задачи система будет способна пользоваться внешними инструментами, взаимодействовать с другими системами, взаимодействовать с людьми, взаимодействовать с со своим заказчиком Да. То есть речь идёт о такой сложной цепочке интеллектуальных действий, которые включают в себя интеракции с разными элементами э окружающей среды. Да, и прототипы таких систем, они активно создаются сегодня. И давайте немножко поговорим о том, что под капотом таких систем. Значит, ээ, вообще строительным блоком интерактивного искусственного интеллекта являются так называемыми так называемые агенты. Слово агент, оно просто означает ээ способные действовать, да, э действующий. Но обычно в области современного искусственного интеллекта под агентными системами, ээ, не путать с агентскими, да, очень часто почему-то говорят агентские, видимо, заразились от маркетологов, у которых там агентские отчисления, агентские договоры и так далее. Так вот, агентные системы, ээ, значит, вот ключевыми свойствами агента обычно являются, во-первых, возможность действовать, то есть генерировать не просто текст, а генерировать команды для каких-то исполняющих систем. Возможность использовать инструменты внешние. Ну, это, например

### [31:16](https://www.youtube.com/watch?v=836GW_n5NOY&t=1876s) Ключевые свойства ИИ-агентов: действия, память, фрейминг

может быть, не знаю, калькулятор, быть поисковая система, да? То есть любая внешняя система, к которой наш агент может обращаться, которую он может использовать, решая свои задачи. Значит, дальше способность строить цепочки рассуждений, действий, да? То есть, ээ решать разбивать задачу на шаги отдельные, да, размышлений или действий. А наличие долгосрочной памяти тоже ключевое, важное для агентности свойства. Ну и так называемый фрейминг. Фрейминг - это ээ совокупность технологий, которые позволяют менять вам поведение модели нужным образом. Э, соответственно, происходит смена парадигмы фундаментальной модели, так называемой, а это такая базовая парадигма генеративного искусственного интеллекта. То есть модели фундаментальные или базовые - это модели, которые вначале предобучаются на гигантских объёмах информации и потом на финальной стадии могут быть либо доучены, ээ, тонко настроены под нужную вам задачу, ну либо там могут использоваться практически из коробки при помощи написания промтов. А значит и вот происходит смена фундаментальных моделей на фундаментальные агенты, то есть модели, которые могут быть использованы как основы для создания агентов. Ээ, ну вот пару слов ещё про цепочки рассуждений, да, на самом деле, ээ, наверняка многие из вас читали книгу Даниэла Даниэля Канимана, который недавно покинул нас. Ээ, значит, она по-английски называется thinking fast and slow. По-русски почему-то думай медленно, решай быстро. Вот. Но, э, название, вот, собственно, та концепция, названия, которая вынесена в заголовок книги Канимана, это идея о том, что у людей существует два как бы способа. мышления. То есть первое - это такой быстрый, когда мы быстро находим ответ на тот вопрос, который перед нами стоит, да? И второе - это размышление, да, когда мы, э, рассуждаем, э, строим определённые умозаключения последовательности мыслительных актов, которые ведут нас к решению задачи. Ну вот простой пример, как цепочки рассуждений может строить современная генеративная система, да, генеративная нейросеть. Значит, ээ, ну вот решение задачи по шагам, да, шаг за шагом. Вот. И оказывается, что такой подход он хорошо работает, особенно в сложных задачах. То есть при помощи такого пошагового рассуждения модели могут решать задачи, которые они не могут решить за один присест. Ну вот, э-э, один из таких нашумевших примеров построения рассуждения, это модель, э-э, пsк - R1, э, которая, значит, строит цепочки рассуждений, решая математическую задачу, например, замечает ошибку, которую она допустила в построенной цепочке рассуждений и способна ээ вернуться на шаг назад, да, и исправить свою ошибку. Это м довольно важное качество для рассуждающих систем. Вот. Ну немножко о ээ базовых технологиях ээ интерактивного искусственного интеллекта. Ну фрейминг, упомянутый мной, да, на самом деле есть много способов, как вы можете фундаментальную модель заставить изменить своё поведение, да? Вы можете написать прот, ээ, в котором явно сформулируете необходимое для модели поведения. Вы можете создать и подменить набор функций, которые вызывают модель. Вы можете соединить генерацию с поиском и так далее. Значит, ну вот супер простой пример применения такого паттерна. Мы говорим модели: "Действуй как

### [35:01](https://www.youtube.com/watch?v=836GW_n5NOY&t=2101s) Как работает интерактивное взаимодействие: рефлексия, скаффолдинг

писатель". Ну, мы можем просто попросить модель написать текст, да, он уже будет иногда неплох, да, но если мы хотим улучшить результаты при помощи метода интерактивного искусственного интеллекта, можем действовать вот так. Мы говорим модели: "Действуй как писатель, как самый талантливый писатель в мире". Да. Напиши текст, продающий текст про цветные вантузы. А потом полученный текст мы можем скормить той же самой модели, но дать ей другую инструкцию, сказать: "Действуй как критик, да, как Нистовый, Белинский, Чернышевский одном флаконе". Э раскритикуй этот текст, предложи, как его можно сделать лучше. Вот. Ну и на финальной стадии мы той же самой модели говорим: "Действуй теперь как редактор, опираясь на вот эти замечания, улучши исходный текст". Да. Такой паттерн он называется рефлексия, да? Ээ это самый простой паттерн интерактивности в агентных системах. Ну очевидно, что это частный случай более общего подхода. Этот более общий подход называется скафхолдинг от слова сFoldд, то есть строительная лиса или каркас. То есть мы можем вызовы моделей оборачивать какую-то более сложную логику, да? Ну, например, можем попросить модель написать не один текст, а, не знаю, 10 раз попросить модель написать текст, взять 10 текстов, попросить дальше модель саму же отранжировать, выбрать те тексты, которые лучше окажутся, да? Потом отобранные тексты пропустить через критика, да? Потом, значит, э, опять на основе критических замечаний э отранжировать результаты. Ну и потом уже финальный текст писать при помощи роли редактора. То есть, как видите, можно строить очень сложные ээ каркасы алгоритмические вокруг языковых моделей. Вот. Ну, ещё одно важное понятие, это модели мира. Важно понимать, что модели наши что-то знают об окружающем мире. Их модели мира не всегда точны, но у людей это тоже так. Некоторые люди думают, что Земля плоская, Луна сделанная из голландского сыра. Вот. Но так или иначе, если модели могут строить строенные цепочки рассуждений, значит, они могут понимать, какие причины ведут к каким следствиям в реальном мире. И это открывает для нас возможность для создания интерактивных систем, которые будут решать задачи реального мира. Ещё один важный тренд -

### [37:12](https://www.youtube.com/watch?v=836GW_n5NOY&t=2232s) Мультимодальные и омнимодальные системы будущего

это мультимодальность. Наши модели учатся использовать ээ очень разные типы. Здесь целью, конечно, является создание так называемых омнимодальных систем, то есть которые смогут на вход получать произвольную смесь. например, из текста, аудио, видео и картинок и на выход тоже производить информацию, которая будет произвольным сочетанием этих модальностей. Вот создание таких систем связано с некоторыми сложностями, но в целом инженеры сейчас активно движутся в этом направлении. А трендов в развитии больших языковых моделей моделях в свете, значит, перехода к интерактивному искусственному интеллекту, их довольно много, и про них можно говорить часами. Вот это просто слайд, на котором обозначены некоторые другие тренды в развитии больших языковых моделей. Ну и последнее, наверное, что хотелось бы сказать. Важно понимать, что именно сейчас технологии

### [38:01](https://www.youtube.com/watch?v=836GW_n5NOY&t=2281s) Как быстро меняются подходы в ИИ

искусственного интеллекта очень быстро эволюционируют и происходит, ну, такая довольно фундаментальная смена парадигм. Подходы меняются в пределах даже одного года. И меняются не только подходы, но и, например, нарративы, которые окружают область искусственного интеллекта. Если вы хотите о том, о чём я сегодня рассказывал, узнать более подробно, у меня есть для вас вот такая книжка, которую я писал в течение 6 лет. Вот в ней 450. 000 слов. Она чуть больше, чем Война и мир по размеру. В ней ээ больше 3. 000 ссылок на разные источники, да. То есть как бы читая эту книгу, вы можете получить ссылку на ещё более глубокое рассмотрение того вопроса. А электронная версия книги находится в свободном доступе. Вы можете совершенно спокойно её скачать, э, и пользоваться без каких-либо ограничений. А значит, спасибо большое за то, что вы меня послушали. У меня для вас маленький подарок в виде промокода на приобретение бумажной версии книжки. А вот, значит, здесь вот по вот этому QR-коду ссылочка внизу, сфотографируете слайд. Можно, соответственно, перейти на форуму, где можно заказать бумажную книгу, если вы предпочитаете читать это всё дело в бумаге. Вот, соответственно, промокод со скидкой на 200 руб. на приобретение бумажной версии книжки. Вот. Ну и, ээ, собственно, ссылка на электронную версию книги, мой сайт и мой канал в Телеграме. y

---
*Источник: https://ekstraktznaniy.ru/video/15563*