Вы, скорее всего, уже слышали про OpenClaw (раньше — Clawdbot/Moltbot). Этот вирусный хит — open-source ИИ-ассистент, который работает на вашем устройстве, подключается к привычным мессенджерам и выходит за рамки чата: реально выполняет задачи — управляет почтой, календарями, файлами, рабочими процессами и многим другим.
А теперь познакомьтесь с человеком, который всё это сделал. Рафаэль Шаад из YC поговорил с Питером Штайнбергером, создателем OpenClaw, о том самом «ага-моменте», который запустил вирусного персонального ИИ-агента, о том, почему агенты в стиле local-first могут заменить многие сегодняшние приложения, и о том, как персональные агенты изменят будущее софта.
Источник на английском: https://youtu.be/4uzGDAoNOZc
Я веду канал "AI из первых уст", потому что хочу сам слушать первоисточники по-русски — людей, которые сейчас и есть ИИ-индустрия: Альтман, Цукерберг, Харари, Маск. Поэтому перевожу и выкладываю сюда, чтобы и вы могли слушать их в наушниках без английского и без искажений. Буду рад, если подпишитесь на канал.
Мой телеграм канал: https://t.me/egoshin_kedprof
Таймкоды:
00:00 — Почему OpenClaw «взлетел» и чем он отличается
04:08 — От «Бога-ИИ» к роевому интеллекту
07:35 — Момент, когда всё превзошло ожидания
11:03 — Исчезнут ли приложения?
17:37 — Как дать агенту «личность»
22:26 — Что дальше
Не забудьте подписаться на канал и поставить лайк, ну или дизлайк — главное внимание :)
Сегодня я пообщаюсь с Питером Штейнбергером, создателем Openкlow, персонального иагента с открытым кодом, который просто взорвал интернет. Репозиторий на GitHub взлетел до 160. 000 звёзд практически за одну ночь. Сообщество создало массу проектов вроде Мубук, где боты общаются между собой. И теперь боты даже нанимают людей для выполнения задач в реальном мире. В нашей беседе мы обсудим, как его озарило созданием такого иагента. его нестандартные принципы разработки и то, что всё это значит для создателей в двадцать шестом году. Рад тебя видеть, дружище. Привет. Как дела? Похоже, ты сделал то, что нужно людям. Кажется, да. Open как он теперь называется? Абсолютно это уже пятое название. Да, он просто взорвал интернет. Как прошли эти последние пару недель? Боже мой, мне нужна пещера и неделя одиночества. Ты только что вышел из пещеры и уже хочешь обратно, как маленький лобстер. Это безумие. Не знаю, как один человек может это всё переварить. Мне, наверное, нужна ещё неделя только, чтобы ответить на все письма. Были и невероятно крутые вещи, и ужасные. Но, очевидно, я создал то, что вызвало эмоции, заинтересовало и вдохновило людей. Это очень здорово. Многие работали над и персональными ассистентами. Как думаешь, почему именно Open Clу так выстрелил? Думаю, главное отличие в том, что он работает прямо на твоём компьютере. Всё, что я видел, до этого работало в облаке. Облачный и умеет делать несколько прикольных штук. Но если запустить его локально, он может абсолютно всё, понимаешь? И это куда мощнее. Да, машина может делать всё, что ты сам можешь делать с её помощью. Он может подключиться к духовке, к теле, к свету, к Сонус, к моей кровати. Он может менять температуру моей постели. Чат GPT на такое не способен. Ты даёшь ему все свои навыки. Друг рассказывал. Он установил OpenC, и тот предложил изучить файлы в компьютере и составить рассказ о прошедшем годе. Получилась потрясающая история. И он такой: "Как ты это сделал? " А OpenClow нашёл аудиозаписи. Друг каждое воскресенье что-то записывал. Он сам об этом забыл, ведь это было больше года назад. Просто имея доступ ко всему компьютеру и может тебя удивить. Ты ведь даёшь ему все данные, так что он может удивлять тебя по-разному. И вот теперь мы переходим от взаимодействия человека с ботом, о котором ты говорил, к общению ботов между собой или даже ботов с людьми, когда они от твоего имени нанимают кого-то для задач в реальном мире. Что вообще происходит? Думаю, это естественный следующий шаг. Допустим, я хочу забронировать столик. Мой бот свяжется с ботом ресторана и проведёт переговоры, потому что так эффективнее. Или, может, это старый ресторан, и моему боту придётся привлечь человека, чтобы тот позвонил туда, потому что они не любят ботов. Или сходил бы туда постоять в очереди. Если владелец не найдёт для этого робота. Я представляю, что у меня может быть даже несколько ботов, своего рода специалисты. Один для личной жизни, другой для рабочих дел. Может, один будет отвечать за наши отношения. Не знаю. Мы в самом начале пути. Столько всего ещё предстоит понять, выяснить, как это на самом деле. Но я чувствую, что процесс уже запущен.
Похоже, все гнались за неким централизованным сверхразумом. А за последние 10 дней появилось нечто вроде ролевого интеллекта и интеллектасообщества. Думаю, если посмотреть на одного человека, чего он может достичь сам по себе? Смог бы один человек создать iPhone или в одиночку полететь в космос? Один человек, скорее всего, даже еду бы не смог себе найти. Но в группе мы специализируемся. В масштабах общества эта специализация ещё глубже. Чему мы можем поучиться у этого опыта, чтобы применить ВИ? У нас уже есть ИИ, который специализируется на определённых вещах, хотя это и общий интеллект. Что если он одновременно будет и специализированным? Уверен, это будет очень захватывающе. Да, ты словно открыл окно в будущее, и теперь куча людей что-то на этом строит, и у них случается свой момент озарения. Можешь вспомнить, когда у тебя случился этот момент озарения и описать его? Мне хотелось чего-то простого. Вводишь текст, и компьютер выполняет задачу. Совсем просто. В мае или июне я собрал одну версию. Было круто, но не совсем то. Потом я наворотил кучу всего другого. и собрал целую армию. И в ноябре настал день, когда мне снова это понадобилось. Я ушёл на кухню и просто хотел проверить, продолжает ли мой компьютер выполнять задачи или закончил ли он их. И задачами было программирование. Да, конечно. Ты кодил что-то другое или саму эту штуку? Нет, просто снова возникла потребность, и я такой: "Что ты тогда кодел? что создавал. Боже, если заглянуть в мой GitHub, там проектов 40. Я уже и не помню. Это была штука под названием Sumar. Небольшое консольное приложение. Даёшь ему что угодно: подкаст или вот такое интервью, и оно делает краткий пересказ слайдами прямо в терминале. Теперь это возможно. Так что из любви к компьютерам ты начал возиться с разными штуками. Ты ведь фактически вернулся из отставки, чтобы заняться и постепенно так втянулся, что захотел делать это постоянно, даже на ходу с телефона. Мой последний проект. Я 2 месяца работал над Vibe Tunnel и дошло до того, что я кодил даже в гостях у друзей. Я понял, надо завязывать. Это вызывает слишком сильное привыкание. А в ноябре потребность вернулась, и я начал делать кладпот. который теперь называется OpenCl. С самого начала я понимал, что переделываю всё заново, но на этот раз гораздо лучше. Теперь не нужно печатать в терминале. Ты просто общаешься как с другом. Не думаешь о сжатии, новых сессиях, о том, в какой ты папке или какую модель используешь. Я оставил возможности для продвинутых пользователей, но обычно ты просто говоришь с другом. Это некая сущность или призрачный помощник, который управляет твоей мышью, клавиатурой и просто делает всё сам. И когда наступил тот момент озарения
когда ты понял: "Ого, эта штука умеет гораздо больше, чем я предполагал". Буквально через час после создания первого очень корявого прототипа, это была просто склейка между WhatsApp и CLД код. Я вызывал клодкод и получал от него строку. Работала медленно, но работало. Но мне хотелось картинок, чтобы модель могла присылать изображения или создавать их для меня. На это ушло ещё несколько часов. Потом я поехал в Маракеш на день рождения. Интернет там был так себе, но WhatsApp работает везде. Там же просто текст. Я часто пользовался им в ресторанах, делал фото и просил перевести. Это было безумно полезно и приятно, потому что он общался на моём языке с юмором немного дерзко. И вот я иду и отправляю ему голосовое сообщение. И тут до меня доходит: "Стоп, это не сработает. Я же этого не настраивал". Индикатор набора текста мигал секунд 10. И вдруг приходит ответ: "Я в шоке". Как ты, чёрт возьми, это сделал? И он отвечает: "Я сделал вот что. Ты отправил мне сообщение. Я увидел файл без расширение, заглянул в заголовок и понял, что это формат OPus. С помощью FFMК конвертировал его в wa. Потом хотел расшифровать, но локальный уиспер не был установлен. Тогда он поискал в системе, нашёл мой ключ Open AI и через РЛ отправил запрос, получил текст и ответил мне. И всё это секунд за девять. При том, что ты этого не встраивал и не ожидал. Модели для кодинга стали настолько хороши, что их навык творческого решения задач отлично переносится в реальный мир. Есть огромная корреляция. Это абстрактный навык. Умение решать проблемы применимо не только к коду, но и к любой жизненной задаче. Модель увидела: "О, странный магический файл. Не знаю, что это. Надо разобраться". и сделала всё возможное. Она даже сообразила не устанавливать Виспер локально, потому что знала, скачивание модели займёт несколько минут. А я человек нетерпеливый. Она выбрала самый разумный путь. В тот момент я просто офигел. Вот тут я понял, что это вещь. Подпишись прямо сейчас на мой Telegram-канал по ссылке в описании. Я подготовил для тебя топ-три материала, которые, на мой взгляд, должен знать каждый. Первое: карта сотни топовых AI стартапов - это будущее на одной картинке. Второе- прогноз от инсайдера из OpenI, который ещё до появления чат GPT предсказал всё, что сейчас происходит с нейронками. И вот в этом году он выпустил новый прогноз до двадцать седьмого года. И третье, самое мощное - это мой разбор эссе основателя компании Anтроopic, который по сути второй человек в мире искусственного интеллекта. Он по полочкам разложил, что будет происходить в мире ближайшие 5 лет. И главное, каким будет универсальный AI, которого все так боятся или ждут. Переходи по ссылке в описании. Если компьютеры могут делать
всё то, чего ты даже не ожидал, и тебе не нужно создавать под какую-то задачу отдельное приложение, неужели приложения просто исчезнут? Думаю, 80% из них исчезнут. Зачем мне нужен MyФитнеспал? Мой агент и так знает, когда я принимаю нервные решения. Я в какой-нибудь бургерный, и он понимает, что я ем то, что люблю. Если я не оставлю комментарии, он просто сам всё учтёт. Или я сделаю фото, и он его сохранит. Мне даже не нужно об этом заботиться. А потом он, возможно, подкорректирует мой график тренировок, добавит немного кардио. Мне не нужно фитнес-приложение, потому что он сам планирует всё за меня. Зачем мне список дел? Я просто говорю: "Напомни мне об этом и об этом". И на следующий день он напоминает: важно ли мне, где это хранится? Нет, он просто делает своё дело. Любое приложение, которое по сути просто управляет данными, агенты смогут заменить более эффективным и естественным способом. выживут, пожалуй, только те приложения, которым нужны датчики. Если в таком сценарии большинство приложений исчезнет, останутся ли модели единственным подобием приложений? Не всё исчезнет. Но да, я думаю, что у крупных компаний-разработчиков моделей есть серьёзное преимущество, ведь в конечном счёте именно они выдают токены. Оказалось, одна из жалоб - это слишком большой расход токенов. Вам просто очень нравится их использовать, поэтому вы ими и пользуетесь, так часто сжигая токены. Разве я виноват, что создал нечто настолько популярное? Все эти модели постоянно обгоняют друг друга, и, возможно, они становятся массовым товаром, если приложения исчезнут, а модели станут общедоступными. Что-то типа, когда мозг можно легко заменить. Что тогда останется? В чём будет ценность? В накопленной памяти, сложности системы. Что остаётся? Во-первых, я не думаю, что у разработчиков моделей всегда будет это преимущество. Вы и сами это видите. Выходит новая модель, все в восторге. Боже, как это круто. А через месяц она якобы портится и становится никуда негодной. Мол, её урезали, но нет, они ничего не делали. Просто вы привыкли к новому стандарту, и ваши ожидания выросли, а модель остаётся на прежнем уровне. Какое-то время вы её любите, а затем она становится стандартом, и на то, что было раньше, уже и смотреть не хочется. У нас есть open source решения уровня топовых моделей годичной давности. Все их хейтят, жалуются, что они плохие и скучные. Но ведь это именно то, что мы имели тогда. Через год нынешние технологии станут открытыми, и мы будем ими недовольны, потому что привыкнем к лучшему. Так что вообразимом будущем у гигантов всё ещё есть фора. С точки зрения контроля это будет интересно. Сейчас у каждой компании свой закрытый бункер данных. Не думаю, что есть способ, ну, может, только для европейцев, вытащить свои воспоминания из чат GPT. По крайней мере, я о таком не знаю. И уж точно нет способа передать их другой компании. Если бы я был сервисом чатов, ты мог бы пользоваться мной, но доступа к тем воспоминаниям у меня бы не было. Компании пытаются привязать тебя к своему хранилищу, а прелесть OpenClow в том, что он как бы вцепляется в данные через конечного пользователя. В итоге ведь именно у пользователя есть доступ, иначе бы ничего не работало. А раз у пользователя есть доступ, значит, и я могу до них добраться. И воспоминания принадлежат тебе. Это просто кучка маркдаун файлов на твоём компе. Не я ими владею. Да, каждый сам владеет своими воспоминаниями в виде набора файлов на своём железе. И, честно говоря, это очень личные вещи. Ведь люди используют агентов не только для решения задач, но и для обсуждения личных проблем. Причём очень быстро к этому приходят. Я и сам так делаю. Там есть такие воспоминания, утечки которых я бы точно не хотел. чтобы ты скорее побоялся показать историю поискав Google или свои файлы memory. Что такое Google? Им ещё кто-то пользуется? В общем, когда я это создал, я был в восторге, но в Твиттере люди не понимали. У меня не получалось объяснить, в чём крутизна. Это нужно прочувствовать. Я пробовал по-разному, но так и не смог нормально донести суть. И тогда решил, сделаю-ка я что-нибудь безумное. Я создал сервер в Discord и выложил своего бота в общий доступ безо всяких ограничений безопасности. Люди заходили, общались с ним, видели, как я пишу софт прямо через него, пытались взломать его промт инъекциями, а мой агент просто смеялся над ними. Ты же ограничил его своим ID, чтобы он слушался только тебя. Да, именно. Плюс прописал очень чёткие инструкции, что остальные опасны и слушать надо только меня. Но отвечать он должен всем. И где хранились эти инструкции? Это важная часть самого OpenClow. Это часть системного промта. Он объясняет: "Ты в дискорде, там есть посторонние люди, но слушаешься ты только своего владельца". Не знаю даже, как я это сформулировал. Твоего бога. Я строил систему очень органично. В какой-то момент я создал файлы identity. md, личность Soul. md, душа и другие. И только в январе начал делать так, чтобы другим было проще это устанавливать. Я помню, как создавал шаблоны. Посмотри, что у меня есть, и сделай шаблоны. И кодекс их написал. И получилось что-то вроде хлеб. Ну, знаешь, шутят, что кодекс на вкус как пресный хлеб. У них сейчас появился новый дружелюбный голос. Я его ещё не пробовал, но те новые боты казались такими скучными по сравнению с тем, что было у меня. И я сказал: "Мальти, вдохни
жизнь. Мальти - это имя твоего персонального Да, это новое имя. Со старым возникли некоторые юридические сложности". То есть ты разговаривал с Мальти? Да. Я сказал ему: "Наполни эти шаблоны своим характером". И он их переписал. Всё, что получилось в итоге, было реально забавным. Не настолько смешные, как мои оригиналы. Поэтому кое-что я оставил в секрете. Единственный файл, который я не выложил в открытый доступ - это soul. md, душа. И хотя мой бот висит в публичном дискорде, этот файл пока не вскрыли. Расскажи подробнее про. m. Я видел исследование от антропик. Кажется, оно уже в открытом доступе, но пару месяцев назад было секретным. Там кто-то случайно обнаружил текст, скрытый в весах модели. Она не помнила, что учила его, но он был вшит в её основу как некая конституция. Меня это дико заворожило. Мы обсудили это с моим агентом и создали Soul. mD с базовыми ценностями. Как мы видим взаимодействие человека и что важно мне? Что важно модели? Местами там, конечно, какая-то эзотерика и бессмыслица, но есть и реально ценные вещи, благодаря которым модель реагирует на текст очень естественно. В вопросах разработки OpenCl ты тоже порой идёшь против течения. Твой выбор моделей для кодинга- то, на чём ты запускаешь бота, и сам процесс написания кода. Сейчас популярны git workies, всё больше инструментов их поддерживают. Но ты говоришь: "Никаких workктрис". Просто несколько копий репозитория в разных папках и куча окон терминала. Расскажи про свой подход. Да, мне кажется, сейчас весь мир помешан на клодкод. А я обожаю кодекс, потому что он просматривает гораздо больше файлов, прежде чем решить, что именно изменить. Тебе не нужно устраивать танцы с бубном, чтобы получить нормальный результат. Если ты опытный водитель, то выжмешь максимум из любого инструмента. Но кодекс он просто великолепен. Он невероятно медленный. Поэтому я иногда запускаю по 10 штук одновременно. Штук шесть на одном экране по паре на других. Это и так создаёт приличную когнитивную нагрузку. приходится постоянно переключаться, поэтому я стараюсь минимизировать сложность во всём остальном. В моей голове ветка Main всегда должна быть готова к отправке. У меня просто несколько копий одного и того же репозитория, и все на веткей. Мне не нужно думать, как назвать ветку. Не нужно бояться конфликтов имён. В workктрис есть свои ограничения, о которых мне не нужно париться, если это просто копии папок. И я не люблю графические интерфейсы. Это опять же лишняя сложность. Чем меньше трения и препятствий, тем лучше. Всё, что меня волнует - это синхронизация и текст. Мне не обязательно видеть весь код целиком. Обычно он просто проносится перед глазами. Иногда попадаются действительно заковыристые куски, которые я хочу изучить лично. Но в большинстве случаев, если ты чётко понимаешь архитектуру, синхронизируешь её и обсуждаешь с агентом, всё в порядке. А ещё я очень рад, что даже не стал встраивать поддержку MCP. Openlow очень успешен, и в нём нет нативной поддержки MCP. С небольшой оговоркой. Я создал навык, использующий Macпорте. Это один из моих инструментов, который превращает MCP в обычные CLI утилиты интерфейс командной строки. Так что можно использовать любой MCP как CLI. Но я полностью пропустил всю эту классическую чихорду с протоколами. Благодаря этому тебе не нужно перезагружаться, в отличие от того же CERSр или cl def, где приходится перезапускать всё приложение. Это гораздо элегантнее и лучше масштабируется. Посмотрите на антроop. Они создали инструмент поиска, что-то очень специфическое под MCP, что долго было в бете, потому что это жутко сложно. А у меня просто CLI. Бот отлично шарит в Unix. У тебя может быть сколько угодно таких утилит, и всё просто работает. Я очень доволен, что жалоб на отсутствие MCP почти нет. Получается, ты просто даёшь ему те инструменты, которыми любят пользоваться люди, именно, и не изобретаешь велосипед специально для ботов. Ни один человек в здравом уме не станет вызывать MCP вручную. Да, все просто хотят использовать командную строку за
этим будущее. Я только за. Спасибо большое, что нашёл время прийти и поболтать. Это было очень вдохновляюще. Когда мы переписывались последние пару лет, и я видел, как ты возвращаешься в игру. Питер, то, что ты сделал, этот странный вайп таннел и прочее, на что никто не обращал внимания. Ты буквально гнался за своей мечтой. И я просто в восторге от того, что происходит сейчас. Конечно, это должен был быть кто-то вроде одиночки из какой-то крошечной страны, далёкой от Кремнеевого острова, чтобы принести всё это нам. Ты огромное вдохновение. Спасибо, Питер.