# Введение в ИИ: от LLM и MCP до ИИ-агентов

## Метаданные

- **Канал:** Слёрм
- **YouTube:** https://www.youtube.com/watch?v=VliMuL5X9LU
- **Дата:** 19.05.2026
- **Длительность:** 1:16:00
- **Просмотры:** 1,978

## Описание

Разберем:

🔸 как работает LLM;
🔸 полезные приемы написания запросов для ИИ на выполнение задачи (промптов);
🔸 как работать с внутренними данными с помощью ИИ-агентов;
🔸 что такое MCP и зачем это нужно;
🔸 как создать своего первого ИИ-агента.

А также проведем демо, как решить сертификацию CKAD (Certified Kubernetes Application Developer) буквально за пару минут с помощью ИИ.

Вебинар проводится в рамках курса «ИИ в работе DevOps-инженера»: 
https://to.slurm.io/g595Ng

примечания:
DevOps — методология разработки и эксплуатации в ИТ-отрасли.
LLM — большие языковые модели.
MCP — стандарты взаимодействия с внешними системами

Реклама ООО «Слёрм» ИНН 3652901451 Erid: 2Vtzqv3da72

## Содержание

### [0:00](https://www.youtube.com/watch?v=VliMuL5X9LU) Segment 1 (00:00 - 05:00)

Всем привет и привет, привет. И добро пожаловать на ээ наш вебинар. Ээ всем доброго вечера. Я бы очень хотел бы, чтобы вы написали, во-первых, как нас слышно, видно, видите ли вы нас, слышите ли вы нас, хорошо ли всё, э, и какую-то дать обратную связь, чтобы мы точно знали, что мы хорошо начали и наш вебинар точно хорошо начался. Я сегодня буду говорить масло масляное целый вечер. И на сегодня у нас заготовлено очень много интересного материала. Но по традиции, по традиции обязательно перед тем, как пойти нести пользу в этот мир, рассказывать про искусственный интеллект и про всякое такое, нужно, во-первых, сказать спасибо большое площадке Слёрма. А это, собственно, то, где будет сам курс организован. Слёрм уже более 6 лет на рынке, 53 курса, 55. 000 тысяч плюс студентов через меня прошли, наверное, всего сотня, если не меньше, а может и больше, не знаю. Ну вот, в общем, ребята очень классно делают классные, интересные курсы, продукты и в целом крайне рекомендую там обучаться. А, собственно, я для чего сказал, чтобы вы написали, слышно ли нас или не и видно ли нас. Это будет наш способ с вами коммуницировать, потому что у нас асинхронная связь. Я тут вещаю в куда-то в какую-то камеру, стоящую передо мной. Как этот замечательный молодой человек, тоже буду печатать что-то где-то в параллели, а вы будете ваши вопросы печатать и нам задавать. Э везде, где вам удобно. К нам

### [5:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=300s) Segment 2 (05:00 - 10:00)

будут их перекидывать. И мы будем стараться их отвечать асинхронно и, может быть, даже что-то где-то оставим и ответим в самом эфире. Поэтому все ваши замечательнейшие, лучшие, потрясающие вопросы пишите, пожалуйста. Не думайте, что вопрос какой-то странный или глупый. Самый глупый вопрос - это не заданный вопрос. Поэтому пишите, задавайте ваши вопросы, уточняющие комментарии и так далее. Будем очень рады на них ответить и подискутировать в чатике и не только, в том числе и на самом стриме. Собственно, про тот курс, который мы сегодня м точ так я не буду рассказывать про сам курс. Я сегодня буду стараться вам рассказать про Ии, но глубже, чтобы погрузиться в искусственный интеллект и как искусственный интеллект может вам помочь ускорить, а, улучшить вашу производительность. Вот на этот курс стартует у нас 22 июня. Буду очень рад всех видеть. А мы с Софией будем вам рассказывать очень много интересного, глубокого, разного. Сегодня, я бы сказал бы, у нас будет такая больше обзорная, а, в целом, о самом искусственном интеллекте, что вы можете сделать. А уже на самом курсе мы глубоко погружаемся, разбираем техники, подходы, а как и что вы можете сегодня уже у себя, скажем так, заимплементировать, сделать, чтобы, ээ, вы улучшили, ускорили вашу производительность. Я очень прошу прощения за мой фабрик и details, вот это вот, всякое такое. Очень много бывает английской коммуникации, поэтому иногда могу фабрики переходить, рассказывать всякие деils и всякое такое. Поэтому сразу прошу прощения за мой англизицизм и так далее. Собственно, кто я такой? Меня зовут Виктор. Я соци архитектор, помогаю разным клиентам. Я написал книжку по кубернетису, я ведущий подкастакс. Сейчас мой основной фокус, естественно, связан с яем. Куда же без него? Но Kubernetis остаётся всё ещё важным составляющим в этом мире, потому что я считаю, что Kubernetis - это новый Linux, и даже весь AI запускается по факту под кубернетисом. Ну, точнее, весь Infреence и так далее. Большие все вот эти вот игроки на рынке, они всё равно используют некие оркестраторы. И чаще всего это в том числе и тот же Кубернети, да, и тренинг тоже, ну, запускает бебернати. Это немножко было про меня. А я девопсом занимаюсь уже, тут написано 10 п. На самом деле, знаете, там 10 с хвостиком. И хвостик раскрывать не хочу, потому что кажется, что я уже слишком старый. И с нами сегодня ещё — Да, София, всем привет. После такого искомётного вступления от Виктора Даш как-то это планочка задралась, но постараюсь рассказать о себе и о происходящем не менее интересно. Более 5 лет я в разработке, три кода из которых держу руку на пульсе AI. работаю не только с большими языковыми моделями, но и с моделями, которые относятся к распознаванию и синтезу речи. Вот, в принципе, за всё вот это вот время моей работы в рамках домена я успела завершить успешно много разных проектов, даже таких очень сложных, которые относятся к медтеху или даже к юридической практике. Вот. Да, также, поскольку я работаю в компании партнёре Microsoft, а я также участвовала в проектах, которые относятся к мировым AI провайдерам, которых вы все знаете. Поэтому, скажем так, мои знания, моя экспертиза в том, как данные для обучения моделей собираются, как, в принципе, модели оцениваются и тестируются, надеюсь, будет вам также полезно. Вот свободное время пишу статейки. И если вам вдруг это важно, у меня мастер с дегри по компьютер science. Вот мало ли для кого-то это принципиально. Вот. А сегодня я буду большую часть времени модерировать чатики, отвечать на вопросы, а Виктор вам расскажет часть материала, который, скажем так, относится к вводным занятиям в рамках нашего курса. С моей стороны всё. Виктор, продолжай. Я тоже, между прочим, мастер дегри. Правда, это было так давно. И из приколов, из интересного то, что я, когда учился, у меня специальность называлась интеллектуальные системы, машины и производства, что-то такое. Я тогда думал, какой искусственный интеллект. Когда мне профессор приходил, что-то начал заливать, я такой думаю: "Да нет, это всё фигня какая-то". Сейчас думаю: "Господи, как тогда мой профессор всё видел в будущее? " Собственно, сегодня будем говорить про Ии. Я прошу прощения, если я буду говорить очень быстро, потому что на самом деле мы тут до нашего вебинара, что тележку у нас тут 857 слайдов. Их на самом деле очень много, потому что я постарался в одну презентацию запихнуть, знаете, такую базубазу. Но с другой стороны, с этими

### [10:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=600s) Segment 3 (10:00 - 15:00)

терминами вы сможете очень легко и быстро на кухне начать общаться про яишечку и когда будете смотреть какие-то видосики другие, будете уже понимать, иметь какой-то общий словарь. Поэтому моя задача за сегодняшний вот этот вебинар вам дать хороший такой словарь, чтобы вы понимали о том, что же что это же за такой зверь и который везде и повсюду и ну действительно правда везде и повсюду с разных сторон и так далее. А это моя основная задача на сегодняшний день. Так, я сейчас попытаюсь свою бесшумную клавиатуру включить. Сейчас ээ я понимаю, что я чуть-чуть не доготовился, но всегда бывают какие-то косячки. Так, опа, всё, определилась клавиатура мая. А, так, мы чуть-чуть убежали. Собственно, смотрите, когда мы говорим про искусственный интеллект, на самом деле, если кто-то вас про скажет: "Я знаю определение искусственного интеллекта", ну, честно, я не верю этому человеку. Скорее всего, он вам просто, э, ну, не то чтобы вас обманывает, но скорее всего, он просто сам не понимает. Дело в том, что когда мы говорим про Иича всего мы потём то, что мы имеем в виду просто модели, вот эти LLM большие языковые модели. Очень классная аббревиатура на русском языке звучит. по-английски всё-таки это как-то поинтереснее. Дело в том, что как бы вот это и есть по факту для многих из нас понимание искусственного интеллекта, что когда мы спрашиваем вот модели типа какая столица Казахстана, хлоп, и мы как бы получаем в результате ответ, что это у нас там отстана, например, да. Но по факту, если мы посмотрим чуть глубже, мы, во-первых, увидим то, что мы общаемся с моделью всё-таки не нашим языком. В смысле, мы общаемся с ней, я нашим языком. Но перед тем, как отправить что-то в модель, всегда перед моделью стоит такая штука, называется токинизатор. Эти токинизаторы, они совершенствуются, переписываются от модели к модели. Они разные. У каждого поставщика модели, они тоже будут свои разные, но смысл остаётся один и тот же. То, что в модель, когда мы что-то отправляем, вот эта вот такая столица Казахстана, она превращается в некие цифры. И можно зайти на разные ресурсы. Вот, например, вот это конкретно, это от Open AI такинизатор под GPT5 чего-то там. Э, и если перевести именно русский текст в токены, то мы увидим то, что вот, во-первых, увидим, сколько токенов используется вот в этих трёх словах. И по факту мы видим, что это у нас не три токена, а немножко больше. А, и мы увидим цифры. Цифры - это, собственно, то представление, где модель может найти корреляцию к этим входным данным. Данным, я имею в виду, нашим словам, которые мы задаём. Дело в том, что всё, что в модели находится, по факту это мы можем как бы, ну, дальше думать как о таком, знаете, большом пространстве многомерно, да, мы с вами живём всего лишь в трёхмерном пространстве, но в модели, особенно если мы говорим там про нахождение рядом стоящих слов, то это такое большое векторное пространство. И на суперпростом примере, если мы будем что-то передавать в модель, например, слово кофе и молоко, они будут немножко рядом находиться с точки зрения вот этого векторного пространства. А посередине что-то будет в виде там капучино. Ведь если сделать кофе, добавить немножко молока, спена там вот это всё, то можем получить какую-то капучиночку, да? А вот это вот всё представление как бы может быть представлено в неких векторах. Если очень супер упростить, что, ну, на самом деле неправда, неправда, но тем не менее, если супер упростить, то у нас получается такой знаете, математика, не знаю, какой класс, шестой, седьмой класс, у нас есть ось X Y, да, кофе у нас - это 3 123, капучин - это 3че, ну и так далее. И мы можем между ними находить корреляцию. То есть, а вот эти слова, они находятся достаточно рядом. Но в реальных моделях, в реальных, вот когда будем, например, говорить про рак и так далее, про это тоже расскажу, что это значит, мы будем находить вот это в меррных векторных представлениях и будем понимать о том, что вот эти слова цечно рядом а находятся. Поэтому, когда мы задаём вот это вот слово, какая столица, например, Казахстана, мы пок передаём туда какие-то циферки, и модель просто как бы генерирует а близлежащее, исходя из того запроса, который нам пришёл, близлежащие те же самые циферки, которые потом ретранслируются в наш нормально понятный человеческий язык. А модели бывают разного типа и сейчас очень многие модели, э, они мультимодальные. Что здесь подразумевается конкретно? Потому что мы можем в модель передавать не только текст, то есть не только спрашивать, какая страница Казахстана, но мы можем передавать, например, речь. Вот я сейчас с вами говорю вот тут вот своим каким-то языком, да? Э вы это можете затранскрибировать один способов, либо прямо в модель можно отправлять вот звуковые волны. Ну, чаще всего это отдельная специализирующиеся модели именно там под войс, то есть под вот взаимодействие с голосом. Но большинство моделей, когда я сказал, что они мультимодальные, я имел в виду то, что они взаимодействуют с текстом и с медиа. Медиа здесь чаще всего я подразумеваю, конечно, картинки, но бывает некоторые модели могут и запроцессить, обработать и видео в том числе. А, в общем, мультимодальные, те

### [15:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=900s) Segment 4 (15:00 - 20:00)

которые могут принимать нечтое множество разного контента на вход и точно также на выход выдавать. Не всегда, ну, такое бывает. Смотрите, ещё какая такая штука очень важная понимать, о том, что модель сама по себе, вот эта для нас как бы понимание искусственного интеллекта, она м statтless, когда мы говорим про какие-нибудь микросервисные приложения, что у нас там что-то отправляется, бла-бла-бла, вот это всё у нас там тоже есть такой statтless, stateful, то есть мы храним state или не храним. И почему вот это приложение, которое взорвало весь рынок Charge PT в 2023 году, когда она там вышла буквально там за пару недель, собрала 250 млн активных пользователей или чего-то там, дело в том, что оно как раз-таки называется словом чат. Чат - это добавление того стейта предыдущего. Потому что если я что-то спросил, какая столица Казахстана, то она как бы знает. Вот я вот сейчас это спросил, потом ещё раз что-то добавляю. Если я добавляю это в контекст, что счёт Узбекистана, ну как бы в ответ я получу, естественно, то, что стоит Узбекистана является там ташкент. Всё как бы классно, но для модели это по факту два вызова. А как бы что насчёт Узбекистана? Если второй раз отправлять модель, скорее всего ответит, что ну Узбекистан прекрасная страна, как бы что, ну что, что ты что ты от меня хочешь? Что насчёт Узбекистана? Непонятно из контекста. Поэтому вот эта вот составляющая о том, что мы обязательно должны что-то докидывать в контекст. И, собственно, это почему все, ну, приложение, которое стало суперпопулярным, оно как раз-таки и называется чат. Потому что всё, что мы сначала отправили, наш первый запрос, он зашёл в модель, мы добавили это как бы как в контекст, она что-то нам выпленнула, и мы потом вот это всё ещё раз добавляем. Поэтому то, что вы пишете, оно всё суммируется, а вы там пообщались, направили, например, 10 каких-то сообщений. Всё это потом идёт в таким достаточно большим слоем в модель. Вот. Вот там начинаются вот эти все вопросы про контекстную инженерию и так далее, но э про которые, кстати, мы очень хорошо и глубоко погружаемся, как с ней работать, какие есть тактики и приёмы тоже у нас на курсе. Про сегодня мы про это поговорить практически не будем, если я правильно помню. Поговорим немножко промты. Я всё ещё считаю, что даже в 2026 году, спустя столько много лет искусственного интеллекта проромт инженерии всё ещё пока остаётся актуальной. Хотя вы понимаете базовые подходы, а базовые техники. Ну, во-первых, что такое промт? Промт в какой-то степени можно воспринимать как-то всё, что вы отправляете в модель. Ну, по факту оно в какой-то степени так и есть. Но тут уже начинается более интересная штука в плане того, как конкретно вы взаимодействуете с моделью. То есть как вы формулируете свой запрос, как вы что вы конкретно отправляете. А потому что можно же отправить такую штуку, типа, что такое 10 + 10, да? Э, с одной стороны, как бы одному человеку, если спросить, он вам скажет: "Ну, типа, 20, ээ, ну, потому что, скорее всего, мы подразумевали сложение, а в другом случае может быть что-то другое. Ну, может быть, нам нужно перевести на какой-то другой язык, например, или ещё что-то". И тут вот как бы это непонятно. А, и ещё есть такая штука о том, что у моделей, м, у всех практически моделей, ну, че не у всех, не практически, а у всех, у всех есть такое понятие, как гниние а контекста. Вот про это контекст инженери, который я говорил. Дело в том, что чем больше вы отправляете в модель, как вы, да, формируете свой промт, чем больше вы отправляете, тем модель с большим контекстом начинает больше галлюционировать. Гальционировать - это особенность модели. Это что-то похоже, когда мы в пятницу вечерком по бокальчику, э, и так далее, э- чего-то там, чайку выпили, а утром всё забыли, да, и начинаем гаволюционировать, не помним, какой чай мы вчера с вами ээ пили. Вот, ну вот что-то в таком духе. Здесь что-то похожее, да? То есть чем больше мы в модель отправляем, чем больше чая мы выпиваем, тем, как бы, хуже мы начинаем типа всё помнить. Э какие приёмы, собственно, есть в промнженерии? Первый очень простой, он называется Zero Shot на английском. По факту это просто -э ну типа мы говорим, что модели нужно сделать, там типа закласифицируй мне как например позитивный, негативный, да? Деплой прошёл без единой ошибки. Ну как бы для нас, девопсов, как бы всё понятно. Тут всё позитивно, всё классно. А Zero Shot - это такой простой запрос, он работает для простых задач, где нет необходимости, например, дополнительных предпущений, когда нету узкоспециализированных каких-то доменов, когда задача достаточно простая и понятная. Это, собственно, то, как, наверное, я бы сказал бы 80 или если не больше процентов людей в реальной жизни взаимодействуют с моделями, да, задают какие-то вот простые такие запросы. Чаще всего они все используют, то есть Zero Shot Prompting подход. Просто они про это не знают. крутейшая техника, которая очень классно работает, и многие производители модели её внедряют прямо в

### [20:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=1200s) Segment 5 (20:00 - 25:00)

саму модель. Может быть, вы многие что-нибудь слышали из вас про рининг и так далее. По факту под капотом это вот этот вот chain of swords. Что здесь подразумевается? Мы говорим модели, что она должна думать пошагово. Это что-то похожее, как мы, как люди, точно так же будем действовать. Вот если меня дали бы мне такую задачку, там Денис принёс 18 яблок, отдал три яблока сюда, потом разделил сюда, сделал что-то вот это. Если я не буду писать себе на бумажке там типа сколько у Дениса было, сколько стало, что там у Марины, что там у Лёши и так далее, скорее всего, я и сам не смогу вот на такой запрос вот сразу бабах и ответить. Поэтому, когда мы просто добавим такую банальную в конце нашего запроса требования решай пошагово, мы значительно, прям значительно улучшим качество ответа. Модель будет думать, грубо говоря, вслух, а писать нам, что она думает. Вот это как раз-таки этот механизм есть вот этот рининга. Но даже безнинг модели мы можем включать вот этот типа, ну, типа reasoning, да, вот это Chain of S, чтобы она показывала цепочку. мыслей, рассуждений, что зачем и идёт. А с этой техникой реально достигается там 4070%, э, снижения ошибок в задачах. Ну, я бы сказал бы, в реальной жизни где-то процентов 30-40-100%. То есть действительно лучше становится а ответ, а можно прямо сразу вот так вот сказать. Zero shot chain of SS с объединению двух, да? А давайте подумаем шаг за шагом. Есть даже MCP сервер, который называется Sequн Sinking, типа думать последовательно. Сейчас он в связи с развитием новых моделей скорее становится не сильно актуальным. Но если у вас модели попроще или по с небольшим там ризингом и так далее, синкинг вот этим вот модам, то эта штука очень прямо может помочь. В общем, мы даём задачу и сразу говорим там типа давай думать шаг за шагом. То есть мы сразу все шаги видим. модель нам расписывает его в полный такой типа путь, а от начала до конца с от чего и к чему она приходит. Вот. Ну как вот здесь там было 15 мечей, потом ранили столько-то, поймали столько-то, жонглировали стоко-то, ответ у нас 14 мечей. Маленькая такая ещё ремарчка здесь. На слайдах этого нету, но модели оченьочень плохи с математикой. Прямо драматично плохи с математикой. Поэтому, когда вы делаете какие-то вещи, там, задачки, ещё что-то, и где нужно вычисление, именно вычисление, то крайне рекомендую для модели говорить не надо мне говорить, сколько будет 2 + 2, напиши питоновский скрипт и проверь всю математику через а, скажем так, более традиционные способы вычисления математических задач, чем отправлять и надеяться на том, что в векторном пространстве у модели 2 + 2 рядышком будет находиться число четыре. Вот поэтому такая вот тоже штука. Но Chaйв сот вот этот вот думай последовательно, шаг за шагом. Это максимально крутейшая техника. Смотрите, внутренние данные. А дело в том, что у каждой модели есть такая штука, как бы м вот когда модель закончила обучаться или точнее не так и для моделей нужно очень-очень много данных. Эти данные они типа публичные, да, то есть они там с интернета где-то там взяты и так далее. Некоторые даже поставщики покупают книжки, лицензируя типа их и дальше закидывают все знания в уже в саму модель. Это юридические там уже вопросы пошли. Но тем не менее, в общем, будем думать о том, что модели обычно на всех открытых источниках данных, а и они этими данными владеют. Но у данные постоянно дальше генерируются. И есть такой вот когда модель до обучали, вот катор, да, чуть побах, вот это отрезали, дальше модель ничего не знает. А новости какие-то выходят, новые, например, не знаю, релизы, ээ, новая версия кубернетиса. Мы хотим про это всё, естественно, знать. Поэтому нам нужно как-то добавлять какие-то свои внутренние данные. Плюс у нас, естественно, в каждой компании или даже у каждого человека есть свой какой-то набор данных там, э, ну, например, мой набор любимых рецептов там по курице, по блинам или ещё по чём-то. или как я предпочитаю deploy cubernetis, да, или как у меня настроена моя домашняя сеть с моим home ассистнтом и так далее. То есть этоти вещи, они как бы явно недоступны в модели, а я хотел бы, чтобы они, э, скажем так, то тоже могли добавляться как часть этого контекста. А здесь приходит на выручку нам так называемый рак retrievalment generation. Это такой механизм способа насыщения контекста перед тем, как мы что-то отправим в модель. Смотрите, вы задаёте какой-нибудь вопрос: "Расскажи мне про самый любимый, ээ, не знаю, или там какие последние ээ новые фичи в Кубернетисе 1. 35, допустим, да? А, ну или там в Питоне

### [25:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=1500s) Segment 6 (25:00 - 30:00)

3. 14, не знаю, там какой сейчас последний. А перед тем, как отправлять этот запрос в модель, мы проходим ещё через дополнительный слой дополнительного контекст, как он здесь называется. Это называется вот это как раз-таки подключение рага. А здесь чаще всего под капотом стоит у нас какая-то м векторная база данных. Это может быть на базе постгриса, это может быть ещё что-то. В общем, много всяких разных. Это может быть прямо готовое какое-то решение, например, типа там как квадранта, как рак предоставляющий функционала и так далее. Но смысл в чём? В том, что мы из нашего запроса говорим, что там в версии Kбернети 135. И у нас, например, есть лиц ноутсы. Мы делаем такой семантический поиск по нашей, грубо говоря, внутренней базе данных пробернетис, про наши любимые рецепты курицы. А находим их этот это всё у нас там получается так называемые чанки информации. И вот эти чанки информации, они добавляются в контекст. То есть мы в запросе, что нового в Кубернасе 135, пройдя через рак, с добавлением чанков в модель, будем отправлять уже наш изначальный запрос плюс то, что мы нашли вот в нашей рак системе. И толго в модель будет уходить запрос плюс, например, все релизноусы с Кубернеса 1. 35. А, и, естественно, в этой ситуации модель будет менее эволюционировать, потому что у неё будет условно там весь полностью контекст. А это всё приводит нас к тому, что теперь в целом можно дальше ещё пойти, например, расширить функционал не только насыщением контекста, но и получением какой-то внешней информации. И здесь, э, вот там внимательный зритель должен был увидеть о том, что я уже там начинаю как бы говорить про агенты. Дело в том, что, как, ну, я говорил, модель она имеет знание какое-то фиксированное, плюс у неё нету выхода в интернет, она ничего не знает. Какая сегодня погода в Бишке? Э какие, не знаю, ээ, когда был релиз Кубернатиса, запланирован релиз Кубернатиса 136 или ещё что-то, whatever, да? То есть она этого ничего не знает. Поэтому нам нужно некие инструменты. Здесь я это называю функцией, а мы можем подключать, то есть взаимодействовать с внешним миром, получать, например, погоду или там расписание поездов, самолётов, автобусов, что угодно, или, например, логов с нашего продакшена или метрик для того, чтобы провести правильный rootконализ, например, и так далее. А вот, э, и, мм, собственно, вот эта же все вещи, они позволяют нам расширить, в том числе тоже какое-то контекстное окно. Это придёт приведёт нас к какому-то агенту. Про агента мы поговорим чуть позже, но в целом вот эта обёртка нас превращает вот этого агента. Плюс в агенты, естественно, сейчас добавляются свои сервисы по памяти. Важно не путать. Ээ рак со своей сематическим поиском и векторной базой данных. Это не то же самое. У памяти бывают чаще всего две категории. Э память короткая, э, на английском это, э, shortterm память и longterm память. ээ, корот короткая, короткая и наша там длинная память, да. Э, что мы там запоминаем? Короткая - это чаще всего наше сессионная, то есть всё, что мы за записываем в сессии, это вот мы помним о том, о чём мы сейчас говорим. Длинная память - это что-то в какой-то степени, как у человека, да? Мы не помним, что было в 2025 году день к дню, но мы помним какими-то большими кусками. Ну, например, может быть, кто-то из вас ездил к бабушке в деревню или в прошлом году уронил продакшн. Это было, не знаю, в какой-то в пятницу вечер. А ещё сами деды заповещали не деплоить в пятницу вечер. Но вот вы почему-то решили свершить эту ошибку в прошлом году и вот хорошо помните. Ну или что-то похожее, или вот как вы там, не знаю, э катались на велосипеде. Вот эта такая память, она у вас откладывается. Это тоже точно так же и для агентов можно применять, формировать такую длинную память. Я это ещё называю ультрамеханизм архивирования данных из предыдущих всех сессий. То есть, э, через модель можно это пропускать, можно другими механизмами это делать, забирать сессионные данные и из этого вычерпывать только те основные факты, которые нам действительно нужны. Переходим к MCP. Дело в том, что когда мы говорим про агенты, мы не можем не сказать про, а, Model Context Protocol. Собственно, это протокол, который позволил расширять значительно взаимодействие с агентами. А, собственно, когда MCP появился в 2024 году и в 2025, это в прошлом году был просто бурнейший рост. Реально с каждого утяга. Все говорили про MCP, MCP

### [30:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=1800s) Segment 7 (30:00 - 35:00)

MCP. Казалось, что это вот просто всё, а, для всех и вся и нужно запихивать MCP везде и всюду. А, и действительно, MCP просто взрывал, э, гитхабы, скорость роста по количеству там звёздочек. Сейчас, конечно, это уже звучит как-нибудь немножко смешно. Там каких-то 40. 000 у того же Open Cla, 200-300. 000 уже звёздочек. Но в то время это было такое достаточно большой взрыв, а, с точки зрения именно такого как фреймворка для работы, подключения и расширения создавания своих агентов. Да, и в том числе и для подключения к своему так называемого agent harness, про который мы глубоко рассказываем и показываем в нашем курсе, как настроить, собственно, ваш собственный харнес. И почему, например, MCP в некоторых ситуациях это зло, а в некоторых ситуациях - это необходимость и действительно важное использование. А, собственно, экосистема MCP очень сильно быстро развилась. В прошлом году было даже несколько конференций, посвящённо исключительно MCP. И сейчас, когда мне говорят кто-то, что типа: "О, я хочу написать свой MCP-сервер", я такой: "Блин, да, ну не, ну серьёзно, смотрите, у нас есть ээ 21. 000 MCP серверов. Э, не рекомендую ставить их всех, рекомендую всё-таки использовать какие-то проверенных, авторизованных, ну, как бы провайдеров, которые вы действительно доверяете, потому что, скорее всего, из этого 21. 000, ну, наверное, 99,9 это будет какой-то там, э, уникальный кейс, когда этот MCP-сервер был нужен для человека в его конкретной ситуации. Может быть, для вашего там изолированного энромента, где у вас есть како-то свой кастомные приложение или взаимодействие, вам MCP-сервер действительно необходим написать. Но так в целом количество MCP серверов можно найти. Нужен для КубернеNтиса, пожалуйста. Но тут стоит вопрос, нужно ли для КубернеNтиса MCP или можно через сила использовать. Это такой депатный вопрос, на котором можно пообсуждать в комментариях. сказать, вот вы как считаете, лучше через C дать модели CCTL и чтобы на через CPCL всё дело или лучше контролировать всё через MCP, чтобы э что-то там выполняло? Мы, кстати, вот про MCP и Kubernis буквально, как только слайды закончим, посмотрим на демку, я покажу, как AI может практически там за 5 минут, ну, посмотрим, засечём заодно, решить весь экзамен для по кубернетису. А, в общем, почему MCP так важен и такой как бы внёс большую дилемму? Во-первых, до MCP, когда мы создавали свои собственные агенты, вот этот каждый инструмент, tools, так называемый, нужно было самостоятельно писать. И там была проблема, так называемая N к. А в чём смысл? о том, что если у вас есть какое-то количество, а, допустим, там каких-то агентов там, а, где вы что-то запускаете и у вас есть какой-то количество инструментов, то вам для каждого вот этой штуки нужно было, то есть, предположим, у вас есть, ну, допустим, два агента и у вас есть два тула, то вам для этого нужно написать две имплементации и для этого две имплементации. В общем, получается как бы проблема прямо проблемная. А с MCP у нас есть единый MCP сервер, а мы просто для всех э вот к нашему MCP серверу просто подключаем и все могут использоваться. То есть как бы здесь сложность имплементации становится достаточно такой, ну, точнее сложность уменьшается позволяя сделать достаточно быстро расширение, например, вашего агента. Э, собственно, как это выглядело. То есть до MTP у нас а свои кастомные интеграции, кастомные функции, кастомное взаимодействие. Допустим, вы хотите какой-то рак, и для одного агента вам нужно было бы писать множество разных таких вот решений. А с MCP у вас есть условно одна обёртка. Я в какой-то степени сравниваю MCP с рестом. То есть как только у нас появился RSTPI, все начали пользоваться везде буквально, скажем так, его интегрировать и так далее, что значительно усколило развитие самого интернета, в том числе. А MCP чаще всего взаимодействия бывают ээ локальными, то где вы несёте полностью ответственность и MCP сервера бывают удалённые, когда уже включается GSON RPC коммуникация, стримаable RTP, когда можно уже завтризоваться. Слава богу, в прошлом году антропики отдали аа MCP в Open source полноценно. То есть это сейчас под эгидой CNC находится. А, и, ну, как бы вот под этот umbrреella там всё сейчас управляется коммьюнити и так далее. То есть это уже не принадлежит какой-то одной компании и так далее. Это как бы уже полноценно коммьюнити решение. А, и благодаря этому, в том числе, ну, не только этому, естественно, первая версия протокола была крайне небезопасна. Потом её очень сильно улучшили, добавили мотификацию, авторизацию. И сейчас я крайне рекомендую, если вы что-то делаете, ставить ремоут на PCP сервера для того, чтобы, особенно внутри ваших организации, ремонт M PCP сервера с уаусом, для того чтобы контролировать, а какие инструменты и что было вообще вызвано, а что внутри самого MCP сервера

### [35:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=2100s) Segment 8 (35:00 - 40:00)

или вообще в какие компоненты туда входят. У нас тут получается три основных таких составляющих. Первое - это у нас MCP host. Это, например, может быть Open CД, Lot CД, ээ, это может быть, ну, что угодно, там Квен, Cлай какой-нибудь, в общем, что угодно, где вы это запускаете, например, или ваш, собственно, runнтайм для какого-то, а, агента. Естественно, нам обязательно нужна какая-то модель. Ну, как бы без модели тут вообще как бы нам это всё не нужно. И у нас есть MCP клиент. А вот сюда переходит уже как бы сам сервер. Внутри сервера у нас опять тоже три компонента. А они раскидываются на инструменты, то есть у нас есть так называемые тулы. И чаще всего вы видите только тулы, где очень важно дать хорошее описание, что конкретно делает этот инструмент. И это та проблема, которая есть с MCP, то, что все инструменты их описания загружаются в контекст, который приводит кнению контекста. Если используют очень много MCP серверов, то вы можете получить такую ситуацию о том, что у вас, э, ну, 80% контекста или там даже 20% контекста просто на описание ваших инструментов, которые вы даже не вызываете внутри вашей сессии. Есть ещё такое ресурсы. Важно понимание о том, что ресурсы не делают изменений. Они могут получить только что какой-то такую редонли информацию. Ну, например, какая версия у вашего там кубернетиса, да, или прочитать купконфиг ваш, допустим, да? То есть мы что-то можем всё ещё прочитать, но а мы точно не можем менять. Это философия самого MCP, то, что в тулы, функции, в инструменты мы должны человека где-то что-то спрашивать, естественно, если мы не запускаемся в каком-нибудь типа yellow моде. А, и также в MCP серверу ещё записаны промты, то есть, что конкретно нужно будет делать, если мы вызываем там какой-то инструмент, а, допустим, там какое-то действие или ещё что-то, в общем, какой-то флоу. Как это обрабатывать? Важно знать о том, что один клиент, один сервер. То есть, если у вас множество, там, в том числе, происходит типа TTP хендшейка, да, то есть когда мы подключаемся, акнольжимся, вот это всё, а типа как вот очень похоже в целом. А бывают локальные MCP сервера, бывают удалённые. Я уже про это сказал. Обратите внимание то, что особенно локальны MCP сера, даже если вы их ставите, просмотрите, пожалуйста, код. Не доверяйте полностью просто так, что есть, потому что даже там, может быть, зашиты какие-то, ну, скажем так, не очень желаемые действия внутри MCP сервера, поэтому проверяйте, что вы используете. То есть какой-то рандомный MTP сервер поставить, у которого, а, не знаю, вы нашли в интернете случайно по первой попавшейся ссылке, э, без проверки, там, не знаю, кто написал его, как написал, ну, я как бы не сильно рекомендую. И вот у нас получается вот такая штука о том, что если мы это всё соберём, что мы сейчас с вами разобрали, о том, что у нас есть модель, у нас есть MCP host, он может там ходить к разным клиентам, кстати, хотел ээ и получать, расширять наш контекст немножко в примере, как конкретно всё это происходит. То есть у нас MCP мы инициализируем какое-то взаимодействие, да, MCP host будет взаимодействовать с нашим там сервером, он получает так называемый список всех инструментов. И дальше, ну, модель как бы условно принимает решение о том, что мне нужно вызвать вот этот тул, потому что этот тул может дать мне погоду, например, в Бишкеке, да, у меня есть какой-нибуд сервер, там погода, допустим, и, собственно, как что будет происходить? У меня есть какой-то промт. Э задаю запрос в модель. Это уходит в наш хост. внутри хоста, поскольку я взаимодействую с моделью, я смотрю, что в том числе я передаю в контекст, что у меня какие есть уже тулы внутри моего хоста, которые перечислены через mcpр, а возвращается обратно, говорит: "Так, скорее всего, мне нужно вот вызвать такой-то тул". Вызываясь этот лol, MCP-сервер, скорее всего, ещё ходит в какой-нибудь ремоутный API call, делает для получения погоды, да, возвращает это обратно, процессит потенциально, возможно, удаляет какие-то лишние данные или ещё что-то сырые или переобразовывает их, и обратно это возвращает всё в клиента. И тут у нас уже получается как бы взаимодействие с внешним миром через MCP сервера. Ну и всё в результате в модель, точнее да, мы как бы в модель возвращаем уже с нашим промтом плюс с тем, что вернул наш инструмент в модель. А модель нам говорит о том, что в бешке на следующей неделе будет +25. Я не знаю, на самом деле. Ну я предполагаю, вроде как уже, а вторая половина мая. Я думаю, что там погода должна быть потрясающей. Вот. Но я уже говорю очень много всё про агенты какие-то. агенты, агенты. А, собственно, какие вот компоненты

### [40:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=2400s) Segment 9 (40:00 - 45:00)

кроме вот модели, MCP-сервера, что вообще входит вот как бы в состояние самого агента. Ну, естественно, в первую очередь, вот то, что мы уже с вами рассмотрели, это такое, знаете, наслаивание друг за другом. То есть без, например, модели, ну, как бы нам MCPCR по факту не надо, а, грубо говоря, без MCP и Акент нам, скорее всего, тоже не особо будет нужен. можно сделать какой-то, да, но если нам нужна какая-то расширяемость, взаимодействие с внешним миром, а, ну, скорее всего, нам тоже будет он необходим. Э, нам нужно добавлять обязательно контекст предыдущий, потому что мы общаемся здесь вот вот на этой фазе у нас формируются сами агенты. В том числе нам нужно обязательно ходить в нашу рак систему, там что-то получать. А вот это вот всё вот превращается вот в это вот вот эта как бы агентская такая система. Но проблема-то какая ещё? то, что таких агентов там нам, скорее всего, нужен не один, а множество, и их нужно как бы хорошо понимать, как их, э, создавать. А есть ещё, кстати, разные очень подходы в плане того, как с раз вот с агентами взаимодействовать, потому что сложность, ну, скажем так, написать один агент достаточно легко, а когда нужно, а, сделать какой-нибудь супервизор, да, который управляет множеством агентом. Вот тут уже начинается сложность. А если нужно передавать от агента в агента ещё сложности? Мы, кстати, это не в курсе дивобс. У нас есть отдельно, где мы достаточно глубоко погружаемся как раз-таки в, а, работу с агентами ээ и там разбираем, как, например, добавить человека посередине, да? То есть, ну, чтобы получить, например, какой-то опруф, как выстраивать вот эти вот сложные взаимодействия между агентами. Но как я всё веду? Вот, собственно, как создать своего агента, как с чего, собственно, всё будет строиться. Если всё очень-очень упростить, то мы приходим опять к трём основным компонентам. Первый компонент, который ээ даже вот по факту вот я бы сказал бы даже два надо, скорее всего, э- ну давайте сейчас попробуем вместе разобраться. Смотрите, обязательно нам нужна модель. Ну, как бы без модели мы никуда, нам это 100% надо. А промт тоже надо, очень будет важен для агента. Дело в том, что в промте ээ мы расписываем поведение, что будет этот агент делать. Дальше инструменты. А вот с инструментами я бы уже сказал бы вопрос. Наверное, наш локальный агент, который вы уже сегодня можете написать, если вы используете какие-нибудь CI харнесами, а любыми Open CД, что вы там предпочитаете, а, подключаете какой-нибудь модели, например, на Vlm Studдии или ещё что-то, можно сделать свой агент, который просто будет что-то делать с вашими, например, э уже существующими из коробки внутри ну вот, например, где вы запускаете, например, онкода или Клода. Там же ж есть уже какие-то готовые инструменты out of the box, так называемые, и с ними он будет взаимодействовать. Но здесь инструменты чаще всего подразумевается то, что вы пишете какие-то свои кастомы. Например, получаете MCP сервер. Ну и здесь как бы дальше там расписываем о том, что здесь мы можем подключаться, например, кеню, антропику, лами, MCP сервера. Имеем какие-то свои, э, там готовые уже функциональные инструменты. Либо подключаем MCP, либо вообще пишем какую-то свою кастомную. И здесь мы приходим к тому, что есть такое понятие, называется агентский цикл. А дело в том, что когда мы что-то отправляем, ну, когда мы создаём агенты, для чего вообще вот все эти нужны там SDке, фреймворки, особенно когда мы пишем свой агент уже такой, знаете, автономный, не тот, который работает у вас на хосте типа там под Open CД, а именно где-то работающий там, э, ну, вы запустили, и он автономно там работает, например, обрабатывает ваши алерты, да? Сейчас, мне кажется, каждый второй в компании создаёт, а, свой кастомный такой, ээ, триаш, э, алертов, автоматически агент, который делает rootкос-анализ на базе Нейтона или ещё чего-то или там более сложные фреймворки применяет. Всё это сходится так или иначе к одному, то, что у нас есть некий цикл агента, то есть у нас есть входящие событие или промт, как я это здесь назвал, да? То есть мы вызываем нашего агента. Агент - это наш, давайте, какой-то контейнер. Это то, где мы всё это запускаемся, где это мы всё живём. У нас обязательно есть модель, мы с ней взаимодействуем. В модели происходят мыслительные вот эти вот процессы. Ещё чаще всего все фреймворки имплементируют так называемый React

### [45:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=2700s) Segment 10 (45:00 - 50:00)

Loop. Он, собственно, вот здесь вот инрисован в какой-то степени, когда модель делает такие м, например, у нас сломался cбернетис, да, или там пода находится в пендинг состоянии постоянно. Что мы будем делать? Ну, наверное, нам нужно как-то что-то посмотреть шире, да, какой-то сделать. На английском это звучит observation. Ну, то есть на надо глянуть чуть шире, что происходит. Например, нам надо сделать быйп нашего пода. А может быть, нам нужно ивенты получить, что происходило, может, логи какие-то сделать, да? И вот модель здесь принимает это решение, исходя из того, например, какие инструменты у нас доступны. Помним там про MCP и так далее. А вызывает, что о'кей, мне нужно вызвать какой-то инструмент, допустим, купте или Scripe. Он вернул ответ. Это всё обратно передаётся в модель. Модель смотрит. Ага. Ну, а теперь я хочу пойти глубже. Давай посмотрим, где находится сам, допустим, э, контейнер, э- мне тут передают через, э, дополнительные коммуникационные каналы. Запись будет на канале, а вот презы не будет, если вы нас смотрите, преза будет. Э, да, в общем, сделали какой-то запуск, например, дальше нам нужно получить какие-то ещё логи или ещё что-то. делаем ещё один. Модель принимает решение о том, что теперь надо бы сделать, например, в логи или где сам имидж находился. Вызываем ещё раз, например, инструмент, обратно возвращаем. И вот этот вот цикл, вот этот вот, да, который вот здесь вот нарисован, там модель, инструменты, агент, всё находится на агенте. Модель просто возвращает, исходя из того контекста, с инструментами, которые мы получили, э, решение о том, что всё готово, возвращаем. То есть, например, м с тем же Кубернатичесом мы возвращаем, что почему в пендинге, да? Потому что, например, у нас закончились ресурсы, да, больше нет железа, на котором можно запустить данный контейнер. Или, ну, девелопер случайно указал вместо 1 Гб запроса на реквест, да, поставил, ошибся и сделал там, не знаю, 10 Гб, а у нас таких машин просто нету, которые готовы разместить под сюбми память, допустим. Ну, это всяко бывает в жизни. Вот. Э, можно следовать своих агентов, разные фреймворки делать по-разному. Здесь я пока конкретно показываю, например, на Strange Agence, аа это open sourсорский фрейвок. Там достаточно всё просто. Мы задаём в агента системный пром, так называемый. И чаще всего, когда вы работаете с какими-то инструментами, пусть это будет чатge GPT, ещё что-то, всегда внутри тоже зашито производителем системный промт. Всегда, всеесегда там что-то описано, не знаю, там из последних таких хи-хи-ха-ха штук было, например, что-то там Open, они там нафигачили с гоблинами. И было в системном промте там про гоблинов ничего не показывать, не отвечать, ну, что-то в таком духе. Я уже сейчас точно не помню, там это было буквально 2 недели назад или там 3 недели. Они прямо это в системный промт себе прошивали. Вот точно так же вы создаёте свой системный пром. как взаимодействовать, не знаю, например, отвечать очень там коротко, там не больше 100 символов, например, ответа там на запрос клиента или не думать больше, чем не вызывать больше, чем там трёх инструментов, потому что вы суперэкономите, или наоборот, например, не возвращать ответ клиенту, пока что-либо вы там не сделаете. Инструменты бывают из фреймворка готовые и доступные. То есть, например, какое-то получение времени, эти вот из своего такого, э, любительского, я бы так сказал бы, ну, ладно, полупрофессионального использования, профессионального использования с моделями, могу сказать о том, что модели очень крайне плохи в понимании, что такое сейчас, когда ты говоришь о модели сегодня, сейчас, на следующей неделе, чаще всего она супер-мегаллюционирует. И очень здорово, например, системный пром прошить, сказать, что каждый раз, когда пользователь говорит сейчас или что-то про время, всегда сделай просто команду дейкущую реальную дату, а не, предполагай, можно создавать свои инструменты кастомные, либо же, например, подключать через MCP сервера тоже, что вполне а возможно. Тут мы приходим к демке, что мы, собственно, будем демать. Э, так, посмотрю, что у нас там. Да, всё, мы к демке пришли. Смотрите, я хочу вам продемонстрировать, как, э, мы решим, как с помощью яя мы сейчас решим скат сертификацию. А если кто-то вдруг не знаком, угурнатиса есть ээ пять экзаменов только с три теоретических, ээ нет, два теоретических и три практических, да. Если поздаёте все, вы становите купстронавтом, как я, там летаете в космос в синей рубашке, пиджаке можете вот это всё. И чем практически экзамены от Кубернатиса были интересные и классны, тем, что там всё практика. Ну, то есть реально каждая задача - это как бы практика. Нужно что-то там сделать

### [50:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=3000s) Segment 11 (50:00 - 55:00)

там зафиксить реплику сету, например, или там задеплоить ээ создать какой-то деплоймент и так далее. Мне очень нравилась эта сертификация, наверное, такой небольшой дисклеймер до ИАя, потому что сейчас с Иемем ты такой думаешь: "Блин, вот это всё помнить, запоминать". Я, если честно, сейчас думаю, что он, а, возможно, мм, теоретическая сертификация становит переживает свой ренессанс. Собственно, я не зря показывал эту штуку. Есть очень мой хороший друг, товарищ Виктор, тоже зовут тёска. Он написал вот такой проект. А, ссылочка вот такая. Мм, можете ту там за заскринить и так далее. Вот, в общем, такая ссылочка. В чём смысл проекта? Он поднимает симулятор этого экзамена. Разное тут, по-моему, у него прямо очень много разных сертификаций. Можно это всё запустить, запускается там в контейнере, если это нужно ресурсы. К сожалению, запускается на Айбейсе у него конкретно, по-моему, на локаль здесь ничего нельзя запустить прямо, чтобы, ну, только ваша машина использовать. Но тем не менее, идея заключается в том, что вот есть такой гипотетически очень похожий сценарий, то, что на реальном экзамене. А я, как человек, который сдал все экзамены, могу подтвердить, да, действительно, очень похоже, то есть не один в один, ну, близко. Я уже развернул машинку где-то там удалённая. Вот она у меня уже запущена. И, как вы видите, у меня скат, сценарий развёрнут. У этого фреймворка у нас что можно сделать? В нём можно получить ээ результаты, да, то есть проверить, сколько задач выполнено, поскольку это такой типа внутри зашит просто логика выполнения. Э вы видите о том, что ну как бы 50 тестов, 48 faфейр, да, прикольно то, что два уже сразу хороши. То есть я ещё ничего не сделал, а уже два проходит. Ну да, в общем, как есть. И мы видим то, что уже 65 минут осталось. 54 я уже как бы типа время не потратил. Идея заключается в том, что вот ещё в этом симуляторе вы тоже как бы, поскольку на реальном экзамене у вас есть ограничение там 120 минут, то вы здесь у вас тоже типа условно 120 минут, через 120 минут таймер заканчивается. Всё, спасибо, до свидания. Здесь у меня установлен клод. Ээ, но перед тем, как мы побежим запускать там непосредственно сам клод, что я хочу сделать у клода? Ээ, вот есть очень важный файл, называется clд MD. И я сейчас нахожусь в папочке, в которой ничего нету. Давайте проверим, что действительно ничего нету. И я сейчас хочу создать clotд MD. Это такой agents MD ещё называю, да, у каждого протест они называются по-разному, но смысл всё сводится к одному и тому же. То есть это самый важный файл, в котором мы описываем максимально все инструкции, что нужно делать в какой-то степени, если запустить вот этот дальше клотом в, например, stateless режиме, то есть когда headless режиме, не statlesseless, headless, когда он запускается без интерактивного взаимодействия, это может быть нашим агентом. То есть мы его, в принципе, даже можно вот с такой конфигурацией запустить в каком-нибудь, э, CPй плане, нашем любимом Дженкинсе или ещё чего-то. Так, давайте я покрупнее сделаю, чтобы вы точно виде видели. Тут я подготовил достаточно такой проработанный по всем лучшим практикам промт для решения конкретно вот этой задачи. То есть я ему расписал о том, что он у нас, конечно же, эксперт. Мы решаем скат экзамены. Я нахожусь уже сразу на машине. Почему я здесь написал всё на английском? Смотрите, с точки зрения просто экономии по токенам. модели на сегодняшний день последние модели, они потрясающе работают с русским языком. Вообще никаких вопросов. Но если мы говорим про особенно агентские решения и в целом вот то, что как бы как модель сама задис, это вот вы помните, я показал там пример про какая столица Казахстана, да, мы явно видели, что там не три токена, хотя в английском, если бы написали бы, скорее всего, это было бы четыре токена, потому что знак вопросов был бы отдельно, а там у нас, я не помню, семь токенов было или восемь. То есть просто с точки зрения экономии по токенам модель в принципе достаточно хорошо бы поняла, если бы мы это всё написали бы на русском. Но я везде у себя вот эти все системные файлы и так далее, а я заставляю, чтобы модель всегда писал там на английском, чтобы экономить с точки зрения там токенов, лимитов и так далее. А смотрите, я ему расписываю, какие у нас есть инструменты о том, что у нас есть купль, helm, у нас есть MCP кубернатосовский, уже установлен, надеюсь, работает. Сейчас проверим. У нас есть GM MCP. Gin MCP - это просто вот поиск там по губернатиской документации. Я ему говорю о том, что, как и на реальном экзамене, что он через Джину может открывать вот эти файлы, то есть не файлы, сайтики, да, то есть это действительно прямо на экзамене можно открывать документацию, пользоваться, вообще вопросов нету. Просто вы очень много времени потратите на то, чтобы найти решение в документации, если не знаете, как это решать. И дальше там какие-то я прописываю правила, что всегда нужно делать, что нужно проверять свой шаг, читать аккуратно критерии. Что поды у нас, если вы помните, что это значит, что если я изменяю существующую поду, то она обязательно должна быть удалена и пересоздана. То есть я поэтому говорю, делаем экспорт delete поIT yam

### [55:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=3300s) Segment 12 (55:00 - 60:00)

apply, ну и так далее. То есть вот тут вот я это всё расписываю. Э что там делать с ошибками, если ты там завис три раза, что делать? и так далее. Какой workflлоow, как мы начинаем? Типа там запускай вот так-то, запускай time left перед тем, там посмотреть, сколько осталось. А поставь себе алиасы, чтобы, ну, я как человек условно, я бы реально сделал бы тоже вот эти вот алиасы все прямо must have для экзамена тоже. А на каждую задачу, что проделать периодически там проверять выполнение задач. В конце сделай вот это. Будь аккуратен там с неймспейсами. Если мспейса нету, там создай, ну и так далее, и так далее. Тут прямо очень много всего расписано. Hmman stall и так далее. А всё это сохраняю. То есть у нас теперь есть действительно вот этот файл, э, да. Ээ так у нас я не помню там left. Давайте чекрета. Давайте посмотрим, сколько у нас сейчас времени там осталось. И, кстати, вот сейчас, если у вас есть какие-то вопросы, будет супер круто, если вы их всё-таки вкинете, потому что сейчас вот оно будет что-то решать. и я смогу ответить на ваши вопросы в онлайне или София подключится, поможет ответить. Так, я с вашего позволения не буду ничего печатать, я просто вставлю ему Ой-ой-ой. Чёрт, чёрт, чёрт, чёрт, чёрт. Я ещё не зашёл в клод. Ээ, да, так, я захожу в клод на продакшене. Так, пожалуйста, не делайте. Я запускаю его так называемом л режиме. А так, да. Я принимаю. Так, всё хорошо. Вот он меня принял. Так, теперь я промт копирую. Мы его не видим сейчас, но вот сейчас вот увидим. Я ему говорю, реши все сказзадачи по ссылке, которую мы с вами уже видели. Она вот здесь вот. То есть он по факту должен получить вот этот MD файличик. Здесь написано всё, что нужно сделать. А и что ещё я ему сказал? И я ему сказал, что разбери каждую задачу, вес там процентом, бла-бла-бла, а составь себе туду в right, список, что сделать, задача по порядку и в общем, следуй правила из CLНД. Ну и там типа каждых 5 минут, а, проверяй свой своё состояние там, что чего, да, как. А, ну всё, таймер пошёл. Мм, наверное, даже можем как-то вывести. По-моему, у меня даже таймер есть здесь. Сейчас я подумаю, вспомню или нету. А тут нет, нету у меня здесь таймера, к сожалению. Ну, потом посмотрим. В общем, у нас сейчас 54 минуты. Я надеюсь, что он за пару минут нам всё достаточно быстро решит. А тем временем, если у вас есть какие-то вопросы по ИАюю, не только Иаю, буду рад на них ответить. ээ наших модераторов под капотом попрошу, если есть какие-то вопросы, может что-то вкинуть в чатик, я бы смог бы про что-то поговорить, пока тут происходит. Так, у нас, видите, 59 минут осталось. Э, я уже целый час с вами тренжу. И пришёл котик немножко помурчать вам в микрофон тоже. Надеюсь, никто не против котиков. Виктор, давай зачитаю пару вопросов из чата в Ютубе. Давай, давай. — Да, вопрос от канала The Wobs Kitchen Talks. Виктор, — ничего себе. — Да. Какие три рекомендации по запуску и агент в реальных продакшн-системах может всё дать? — А, интересный вопрос. Спасибо большое Диопский Чунтоксу за этот вопрос. Ну, во-первых, м, я бы сказал бы так. Смотрите, первое, э, есть очень много разных фреймворков. Я бы, э, давайте так, я бы разбил бы задачу, насколько что нужно делать в этой задачке, э, потому что может быть там, мм, сложные агенты, какой workкflow и так далее. А я бы в первую очередь бы протестировал бы сам идею через какой-нибудь фреймворк достаточно простой, тот же ней, у которого есть, например, э графический low код, no код подход, когда можно буквально, а, там, в пару кликов создать себе свой агент и посмотреть. Но дальше обязательно я бы запускал бы на каком-нибудь взрослом фреймворке. Взрослые фреймворки. Я здесь подразвиваю, например, тот же Stangers я показывал или LН chain братьграф. Вообще, мне кажется, нграф сейчас достаточно хорошим варианто, потому что он позволяет сделать очень много разной гибкости и позволяет там, ну, как бы хорошо смотреть, что происходит. А рекомендация номер два, самая большая сложность - это лшутинг и понимание, что делает конкретно агенты. Пишите логи. Каждый шаг должен быть авторизован. залогирован. А

### [1:00:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=3600s) Segment 13 (60:00 - 65:00)

Каждый шаг должен быть залогирован. А иначе вы не будете понимать, что вообще происходит. Вот. И третья рекомендация. Старайтесь не создавать глубоких зависимость зависимостей между агентами, потому что в с большой такой как бы с большим количеством сабагентов создаваемых, э сложность увеличивается просто в разы. Э, и старайтесь контролировать, э-э, ну, то есть вот я бы не делал бы больше, чем две вложенности. То есть у вас есть один агент, он вызывает ещё, допустим, какого-то одного агента, но не больше. А вот в результате получается вы как бы такой одна только вложенность, и вы упрощаете себе с точки зрения, если вдруг что-то сломается, э, траблшу, потому что агенты обладают недетерминированным состоянием. То есть это не то, что мы написали ямол ча манифест и неважно сколько раз и где мы будем запускать, в каком кубернетесе, оно будет всегда нам показывать одно и то же. А здесь оно немножко по-другому, поэтому могут быть непредсказуемые результаты. Вот вот такие бы три рекомендации я дал бы. Так, что-то очень медленновато работает наш API колы, но тем не менее третья задачка уже пошла секретами мы чего-то там выполняем. 4 с по минуты. Вчера я, когда запускал, всё отработало за 5 минут. Я думал, будет очень потрясающее, быстрое демо, но нужно чуть дольше. Видите, вот теперь скорость упирается исключительно только в скорость ответа от модели. — Да, видимо, это специально, чтобы мы смогли ответить на больше вопросов из чата. Э, был вопрос уже больше про инструменты. А можно ли считать, что ноутбук LM - это и есть своего рода рак? Такой интересный вопрос. — А-э, ну в целом, да, наверное, тут философский относительно вопрос. Ээ, можно считать, можно даже поставить к, например, в моей конфиге у меня есть силай ээ от ноутбука ЛМА. Внутри, когда я делаю какие-то ресрчи, оттуда получаю как бы информацию. Такой дополнительный способ делания de ресерчев и получения актуальной информации. В целом, да. Но тут возникает вопрос, если это просто актуальная паблик информация, например, какие-нибудь ютубчики загрузить хотите, те же релизноуты, наверное, да, но, э, это сложно назвать раксистемой для какого-нибудь, ну, действительно ваших данных, которые находятся только у вас. То есть, если вы готовы загружать на сервера ноутбук и ЛМА всё подряд, наверное, в целом в какой-то степени даже. И да, а если нет, то как бы тогда надо по-другому делать как-то. — Да, есть вопросик из чата. Чем системный промт отличается от пользовательского? — У системного промта чаще всего более высокий приоритет. Ээ, точнее, не так. Всегда у системного промта более высокий приоритет. Это прямо правило, правило. И, например, того же, мм, смотрите, вот у нас есть системный промт, да, ээ, и у нас есть, допустим, вот я сейчас написал там clot md, а в clotд md я расписал, что нужно будет делать, да, какие там инструкции и так далее, но системный промт, он имеет больше приоритет, то есть у него приоритет максимальный для модели. И, например, в том же клодкоде, в системном промте клода, а, расписано то, что он обязан читать клодм MD, но он может иногда игнорировать, там прямо так и написано, что он может игнорировать, что там написано, потому что бывают ситуации, когда клотм MD очень большой, то есть ваш пользовательский промт становится слишком большим. А происходит так называемое вот это гниение контекста, да? Мы тут умираем уже в какой-то степени, модели там не хватает, поэтому мы какие-то куски можем просто отсюда игнорировать. Почему такое может происходить? Да, банально, потому что, например, мы спрашивали что-нибудь про теформ, да, нам нужно подрутить вот этот блок. А вот этот блок про Kubernat, он как бы нам не нужен. А в системном промте мы скажем загрузить клод MD, но в пользовательском промте вот это всё здесь может быть, не знаю, там 5. 000 строк. Это как бы уже явно не лучшая практика. Тогда мы можем игнорировать какой-то кусочек. Ну, например, поскольку я сейчас рисую зелёным, мы игнорируем там про тероформ. Всё, что про тероформ, игнорируется и дальше идётся. Вот так. Пока шестая задача.

### [1:05:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=3900s) Segment 14 (65:00 - 70:00)

— В чатике есть ещё вопросы? — Давай. Как видишь изменения devops профессии в скобочках, которые не существует с приходом и который пишет инфручинит, деплот и так далее? Так, ну давайте м мы все умрём, я всех заменит, но это случится не в нашей жизни. Э ну я считаю, что девопс эволюционирует, да и в целом вся итишка сейчас будет переживать изменения. Мм. Сейчас мы ушли в такие как бы относительно философские вопросы. Сложно что-то предсказывать, но я бы сказал бы о том, что если вы сегодня не освоите, как ускорять вот этот ваш процесс трблшутинга, написание тех же манифестов, создание хелчартов, написание инфраструктуры, антиблов, питона, баша и так далее, с помощью искусственного интеллекта, то, скорее всего, ну, ваша производительность будет в разы ниже, чем те, кто это использует. Это цель нашего, на самом деле, курса, что мы делаем с Софией. То есть на этом курсе, э, проипс мы стараемся дать максимум а инструментов, максимум подходов, чтобы вы ээ завтра смогли это себя внедрить и стать так называемым 10X инженером. Ну, 10X вы не станете 100%. Э, ну, если только вы уже не были 10X инженером, тогда вы станете 100x инженером. Но чтобы вы как минимум там в два, в три раза ускорили. Из предыдущего, например, у нас один из студентов, ну, прямо настолько сильно подсел, там всё заавтоматизировал и так далее, что у него, ну, действительно, там, я считаю, что минимум в три или в четыре раза поразительность увеличилась. Вот. И Divс будет не умрёт однозначно, поскольку всё-таки взаимодействие с инфраструктурой - это достаточно критические взаимодействие. А мы знаем всякие разные потрясающие истории о том, что я изколлюционировал и там за 9 секунд удалил базу и потом также удалил бэкапы, а потом сказал: "Ну да, я знаю, но что поделать, извините". Вот. Э или там, не знаю, снёс что-то ещё, всякое такое бывает. Поэтому всё ещё контроль особенно таких вот важных кристических штук. Человек посередине контроль всё ещё будет оставаться 100%. Вот. А и просто мы будем эволюционировать с точки зрения знаний. Я это называю t-shap моделью. То есть мы станем ээ на английском это говорят m shape модель. Либо, как я это говорю, ша только перевёрнута, да? То есть наша буква Ша, только переворачиваем. То есть мы теперь должны вот эти палочки по знаниям у нас должно быть много из разных э ээ областей знаний. То есть не только бертис, но в том числе, не знаю, понимание, ну, как бы в целом это входит уже изначально тоже в сам devobs, но только теперь становится это ещё шире. То есть теперь devops реально может стать девопсом, которого не существует, писать и код, быть девелопером и операшнсом в одном лице. Так, ну что-то пошло не так. Но как всегда бывает, когда в реальной жизни показываешь, что-то очень медленно решаются наши задачки. Ээ, так, тут была заготовлена шутка о том, что, а, я инженер, поверьте мне, оно за 15 минут всё решает, но сегодня какие-то вопросы по доступности. Собственно, переходим к заключению. Э, ээ, я надеюсь, что для вас было полезен наш, э, вебинар, что вы сегодня что-то новое попробо узнали для себя, по крайней мере, какой-то вакубуляр точно для себя составили. Аа, и также хочу вот для вас пошарить дополнительно какие-то ресурсы, которые вы можете найти. И хочу ещё раз напомнить о том, что мы 22 июня стартуем. Будем разбирать в деталях. Эть, так, у меня тут код старается мне помочь, прошу прощения. Так, 22 июня мы стартуем, а на нём мы будем разбирать максимально глубоко, а разные техники подхода, как за автоматизировать, ускорить ваш, э, работу именно с точки зрения как бы ваши девопсовских задач. В конце вы будете создавать свой полноценный демо. Вот. Ну, как сегодня я

### [1:10:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=4200s) Segment 15 (70:00 - 75:00)

показал вам просто один системный промт и там запуск, который, к сожалению, ну, как обычно бывает, что-то пошло не так. Вот что-то там совсем зависло. Э после буду разбираться. Ээ, так вы покажете свой проект в конце. Мы будем разбирать и давать вам какие-то рекомендации, что можно было сделать лучше и так далее. Вот. Э-э, может быть, Софи, там ещё есть какие-то вопросы? Если нет, тогда в целом у меня всё. — Вопросы? Вопросы есть. Их здесь много разных. Во-первых, был вопрос, для чего мы советуем Нейтан, для каких задач? — Вот вроде бы мы об этом сегодня в рамках вебинара не говорили, но про нейт тоже есть материал в рамках курса. Вот будем разбираться, как работают ноды, как строить свои пайплайны и реализацию рак системы. Посмотрим как раз-таки, а как можно организовать на Нейтоне. Вот если отвечать коротко, я бы персонально от себя рекомендовала Nathan для прототипирования. Виктор, возможно, у тебя есть какое-то дополнение, расширение или альтернативное мнение? — Нет, прототипирование очень классное, и если у вас не какая-то сложная суперзадача, она это может очень хорошо решать. Он ставится локально. А если у вас есть доступ, э, по API какой-нибудь модели, локально те же уламу либо LM Studio, про которыю мы тоже, кстати, на курсе рассказываем. Э не знаю, хотите сделать какой-то свой бот, агрегатор по новостям, чтобы оставаться там в актуально в последние новости иметь, то вот на это потрясающе. Но, как я говорил, для prodдаction решений, ээ, например, свой какой-то типа devops агент или там мониторинг агент, ноs агент, без разницы какой агент, я бы, ну, честно, не очень рекомендовал бы запрототипировать, посмотреть, что, например, вот эта модель с таким-то подходом, с таким-то набором инструментов будет работать хорошо. Да, о'кей, но м для продакшн решения лучше использовать более взрослые фреймворки. — 100%. И был ещё вопрос про чанки, где, как посмотреть, как модель делит на чанки. Вот. Ну, чанки - это больше термин, который относится к раксистемам. Если хочется подробнее посмотреть на все детали рак системы, скажем так, под лупой в максимальном проближении, пригоняйте на курс и посмотрим медленно, не спеша, э, без суеты. И про щенкование, и про алгоритмы щнкования. Какие есть ещё компоненты в рамках раксистемы? Вот время у нас поджимает. Можно было бы об этом говорить прямо сейчас, но, скажем так, мы ограничены со времени. Ну, как-то так. Соответственно, больше информации по нашему материалу и будущему курсу можно узнать на сайте Слюрма. Вот. Участникам вебинара предоставляется скидка на любой из тарифов 20%. Поэтому записывайтесь, активируйте промокод и встретимся, получается, с вами на курсе. Будем разбирать, как работать с AI на сегодняшний день. — И да, мы ещё делаем ещё один курс Софией сейчас активно прорабатываем, чтобы дать максимально глубоко про именно работу агентов. Ээ, тоже думаю, что будет интересно. А, наверное, из таких важного понимания, что мы уже провели два запуска, получили потрясающую обратную связь, заоптимизировали, улучшили, убрали часть, ээ, информации, часть добавили. Вот как раз-таки про Natйon. Мы в первый ран, первый запуск достаточно так много его добавили, но потом нам всё-таки показалось, что есть смысл его убрать. А, вот во втором ране мы его больше убрали, в общем, переадаптировались. И со второго рана тоже получили очень хороший фидбэк, поэтому курс третий раз будет запускаться. То есть вы уже будете не первый проходцами, а явно э уже будете получать максимально качественную информацию. Ээ ну вроде как всё. Ээ да, тут ещё вот можно записаться ещё на один курс. У нас скидочка. И на этом, наверное, будем заканчивать. Спасибо большое. У меня тут всё ещё мой И решает. Ну, сегодня какие-то медленные респонсы. Вчера воскресенье всё было максимально быстро. Буквально за 5 минут всё решило. А, — спасибо большо спасибо большое, что Да, спасибо, что достались с нами до конца. И хорошего всем вечера. И, надеюсь, с кем-то увидимся уже. через, ну, чуть больше, чем через месяц. Всем пока-пока. — Всем удачи.

### [1:15:00](https://www.youtube.com/watch?v=VliMuL5X9LU&t=4500s) Segment 16 (75:00 - 76:00)

Run over. We don't need no miracle. condition just make I'll Am

---
*Источник: https://ekstraktznaniy.ru/video/51726*