Интервью с Артуром Меншем, CEO и сооснователем Mistral AI, о том, как ИИ уже прямо сейчас меняет работу и быт: от «чата-оркестратора», который сам ищет по интернету и собирает отчёты, до влияния на профессии, образование и привычку думать головой (а не делегировать мозг модели). Менш простыми словами объясняет, как устроены языковые модели, почему следующий скачок — это инструменты, специализация и качественные данные, а не бесконечное наращивание вычислений, и где ИИ пока слаб (креативность, физический мир, работа с большим числом инструментов).
Источник на французском: https://youtu.be/XvM20KSFYo0
Я веду канал "AI из первых уст", потому что хочу сам слушать первоисточники по-русски — людей, которые сейчас и есть ИИ-индустрия: Альтман, Цукерберг, Харари, Маск. Поэтому перевожу и выкладываю сюда, чтобы и вы могли слушать их в наушниках без английского и без искажений. Буду рад, если подпишитесь на канал.
Мой телеграм канал: https://t.me/egoshin_kedprof
Таймкоды:
00:00:00 — Вступление
00:01:04 — Как он использует ИИ
00:04:01 — Как сделать ИИ всё более эффективным
00:07:20 — Заменит ли ИИ профессии?
00:15:52 — Личное и профессиональное использование
00:20:23 — Человеческая ошибка
00:25:02 — Политические и медийные риски
00:31:10 — Модель «open source»
00:35:30 — Mistral AI и конкуренты
00:39:49 — Отстаёт ли Европа?
00:45:11 — Миллиарды инвестиций в ИИ
00:49:21 — Как использовать и приумножать человеческое знание
00:57:10 — Риски искусственного интеллекта
01:05:32 — Энергопотребление ИИ
01:09:39 — Будущее искусственного интеллекта
01:13:00 — Как он переживает происходящее
01:15:04 — Завершение
Не забудьте подписаться на канал и поставить лайк, ну или дизлайк — главное внимание :)
Артурменш, здравствуйте. Доброе утро. Рад вас видеть. Спасибо, что нашли время сегодня. Знаю, что у вас довольно плотный график и сейчас очень много задач. Вам 32 года. Вы сооснователь и глава Мистраль AI. Это французская и европейская компания. Вы разработали разговорного робота, чат, которым уже сейчас может пользоваться любой желающий. И если говорить прямо, это конкурент чат GPT и других и, которые мы видим сегодня. Кроме того, вы занимаетесь и другими направлениями. Мы тоже об этом поговорим. Вы привлекли почти миллиард, даже больше миллиарда евро на развитие компаний и этих проектов. Так что нам действительно есть о чём поговорить. В двадцать четвёртом году вы стали единственным французом, попавшим в список 100 самых перспективных инноваторов по версии журнала Тайм. Поздравляю вас. У меня много вопросов о том, как и влияет на нашу жизнь, как он работает, чем Мистраль отличается от других компаний на рынке и почему важна европейская или даже французская независимость и суверенитет в этой сфере. Темы для разговора действительно обширные.
обширные. Хотел начать с очень простого вопроса. В вашей повседневной жизни помимо работы, как вы сами используете искусственный интеллект? Я использую чат для разных задач, которые мне нужны. как руководителю. Первое - это обработка всей информации, которую я получаю о клиентах. Я много занимаюсь коммерческой частью, много звонков, переписки, и чат помогает анализировать письма, звонки, подсказывает, какие действия стоит предпринять. Второе- стратегические вопросы. Поскольку чат подключён к интернету, с ним очень удобно обсуждать продуктовую стратегию, вместе продумывать идеи, варианты развития. Третье - это уже что-то бытовое. Многие используют чат для таких вещей. Что сделать на выходных с дочкой? В какой ресторан сходить в десятом округе с американскими гостями? чат уже сейчас с новыми версиями ещё лучше умеет искать информацию в интернете в несколько шагов выстраивать цепочку действий и предлагать готовый план это сильно ускоряет как рабочие процессы так и обычные повседневные задачи есть ли какое-то использование и будь то ваш чат или что-то другое которое вас особенно впечатлило или показалось вам особенно поразительным за последние месяцы, когда вы сказали себе: "О'кей, мы переходим на новый уровень". И это показывает, что может произойти дальше. Что работает очень хорошо, так это аспект подключения модели к данным, к интернету и использование модели как оркестратора, который будет выполнять несколько действий для получения информации. Что интересно, в частности в чате, так это то, что мы ускорили эти этапы благодаря очень быстрому развёртыванию. Мы видим, что он может посетить 5-10 веб-сайтов, обработать их, использовать информацию для ответа на сложный вопрос, подготовить отчёт, что экономит нам огромное количество времени. Мы экономим всё то время, которое потратили бы на навигацию по интернету. Я думаю, что были преодолены два барьера. Во-первых, барьер скорости. То есть сегодня модель может работать намного быстрее, чем год назад. И второй барьер заключается в том, что они могут думать дольше. То есть они не просто ответят на вопрос, они будут рассуждать и искать информацию, писать эсс, писать отчёт, чего они не умели делать год назад. Я думаю, что это действительно важный барьер, который был преодолён за последние месяцы. То есть вопрос, по
сути, в данных, на которые мы опираемся. Если я правильно вас понимаю, важно не искать вслепую во всех направлениях, а действовать более эффективно. Верно? Я имею в виду со стороны Ии. На самом деле важно понять, что именно модель делает в таком случае. Может, стоит немного вернуться к тому, как всё это работает? В основе генеративного искусственного интеллекта текстовые генераторы. Это немного похоже на то, что есть в клавиатуре вашего телефона. Вы начинаете писать предложение, и вам предлагают три наиболее вероятных продолжения. По сути, языковая модель делает то же самое. Она обучается на всём массиве человеческих знаний и поначалу фразы предсказывает её продолжение, вычисляя вероятность каждого следующего слова. Например, если начало код сидит на, то с наибольшей вероятностью продолжением будет диване или кровати. Это и есть распределение вероятностей. Мы делаем это не только для слова код и диван, а для всех комбинаций и словосочетаний, существующих в мире на всех языках. В итоге у нас получается вероятностная модель того, как работает язык. Это и есть фундамент текстовых генераторов. Как из этого получается оркестратор для веб-навигации? Мы переходим от простого генератора ответа к генерации последовательности команд браузеру. То есть вместо того, чтобы просто сформулировать ответ текстом, модель понимает, чтобы ответить, ей нужно выполнить интернет-поиск. Она сама делает поиск, получает содержимое страниц, возвращает его в собственный контекст. Это значит, что модель фактически видит происходящее в интернете. и после этого может сказать: "Вот что актуально сегодня: "Вот интересные рестораны в десятом округе, а Артур предпочитает вегетарианскую кухню, значит, стоит предложить вот это". За последние годы мы перешли от относительно простых языковых моделей, чем-то похожих на умные клавиатуры, только гораздо больше, к настоящим оркестраторам, то есть системам, которые управляют взаимодействием человека с информацией и инструментами. Это меняет очень многое. То есть он стал умнее в своём подходе к поиску правильного ответа. Не бросается в разные стороны, а действует стратегически, выбирает оптимальный путь. Возможно, я слишком упрощаю, но примерно так. Да, именно вместо того, чтобы опираться исключительно на свою картину мира и языковую модель, он понимает, рядом есть инструменты. С их помощью можно получить актуальные данные или даже выполнить определённые действия. Поэтому мы уже говорим не о текстогенераторе, а об оркестраторе, который понимает намерение пользователя, смотрит, какие инструменты и источники данных доступны, и связывает ваши намерения с конкретными действиями. Потрясающе. И отсюда видно, какие
возможности это открывает. Но вместе с этим возникает и другой частый вопрос. Когда говорят оби, всегда обсуждают профессии, которые могут исчезнуть или серьёзно измениться. Как вы сами смотрите на это? Есть ли сферы, которые ИИ способен заменить уже в ближайшее время? Есть ли наоборот? Есть ли профессии, которые, по-вашему, будут затронуты меньше? Каков ваш взгляд? Я думаю, что мы уже видим. Профессии действительно меняются по мере того, как люди начинают использовать эту технологию. Правильная аналогия представить, что это революция масштаба смартфонов в 2010, интернета в двухсячные или персональных компьютеров в девяностые. То есть технологию нужно освоить всем поколениям. Это неизбежно. Молодым проще. Они обычно быстро понимают, как это работает. Людям, которые учились 20 лет назад, сложнее. Нужно переобучаться, но мы видим реальное стремление к этому. Это важная часть. Технология новая, и пользоваться ею нужно иначе, чем предыдущими. В ней нужно разговаривать с машиной, понимать, что она умеет, как работает модель, как она вызывает инструменты, как считывает наши намерения. Нам нужно адаптироваться друг к другу. Что касается влияния на профессии, одна из задач, для которых я сам активно использую чат, анализ и поиск информации. Все аналитические профессии уже затронуты. Сегодня, чтобы принять финансовое решение, подготовить инвестиционную записку в фонде или подготовиться к встрече с клиентом, это делается гораздо быстрее. Значит, это уже не может быть основной частью работы, потому что машина справляется с этим лучше. sur les choses qui ont le plus de valeur ajouté qui sont pas par la machine et en particulier нам нужно переключаться на то что машина заменить не может человеческий контакт особенно в продажах и творчество машина отлично анализирует и использует существующие данные но создавать новое ей гораздо сложнее именно в этом у людей остаётся огромная ценность продолжу эту тему потому что я сам часто об этом думаю когда я использую чат чтобы найти ресторан отель или какой-то совет. У меня возникает мысль. Если все ищут одно и то же и модель всем предлагает одинаковые результаты, есть риск, что мы все окажемся в одном и том же месте. Это частный пример. Но шире риск повторяемости, шаблонов, стереотипов, а не творчества и нестандартных решений. à aller à aller au-delà. Правильно ли я понимаю, что вы считаете, именно здесь человеческая ценность особенно важна в умении придумывать новое, отходить от привычных шаблонов и смотреть шире, чем предлагает И да, я думаю, важно понимать, что на самом деле креативность модели во многом зависит от того, что мы даём ей на входе. Если мы просим ресторан в десятом округе, если вопрос просто очень общий, он ответит очень общим образом. Но если мы просим ресторан, говоря: "Мне очень понравились эти два ресторана за последние 2 месяца, а я хотел бы попробовать это". На самом деле у него достаточно информации, чтобы провести более сложные исследования. Это применимо к ресторанам. Это, возможно, не самая захватывающая задача, потому что она не очень креативная. Но это применимо и к тому, если я хочу написать, например, рассказ. Если я попрошу чат написать рассказ, он будет довольно общим и довольно скучным, если только вы его не попросите. Но если у меня есть идеи, если я могу сказать: "Я бы хотел, чтобы это произошло в какой-то момент в главе три" и так далее, и если я направляю, если есть настоящее взаимодействие между машиной и человеком, именно здесь мы можем подтолкнуть модель к её пределам, и она сможет выдать интересные вещи. Таким образом, чтобы получить креативный результат и использовать и креативно, нужно быть креативным самому. И, следовательно, это навыки, которые нужно приобрести, чтобы делать это правильно. Есть ли у вас ощущение, что есть навыки или вещи, которые и будь то чат или, возможно, в более широком смысле в развитии этих технологий ещё не способен делать? И где вы говорите себе: "Ну, здесь потребуется больше работы, и мы ещё не достигли этого. Их много, особенно искусственный интеллект. У них есть тенденция немного теряться, когда они имеют доступ ко всему контексту компании и когда они подключены к слишком большому количеству инструментов. То есть, когда вы даёте ему пять инструментов, описывая каждый из них, они не слишком теряются. Но когда мы даём им 100 инструментов, они теряются, делают неправильный выбор. Таким образом, на самом деле, есть уровень сложности, который управляем, и выходит за рамки текущих возможностей. Итак, это первый момент. Что машина не очень способна делать, я уже сказал, это аспекты креативности. Например, она способна решать простые математические задачи, ответ на которые известен. Таким образом, она сможет развернуть рассуждение с помощью существующих инструментов. Но в математике, чтобы делать открытие, чтобы прогрессировать, часто нужно изобретать новые инструменты, нужно идеализировать новые объекты и так далее. И это совершенно не то, на что способны машины сегодня. Так что этот аспект креативности, я думаю, не за пределами досягаемости. То есть мы всё равно добиваемся прогресса в этих вопросах, но сегодня это невозможно. Кроме того, важно понимать, что он не думает, как мы. И есть много вещей, которые он не понимает. Так, в частности, модели способны обрабатывать не только текст, но и изображения и так далее. Но в их восприятии изображений, в их пространственном мышлении у них нет той мощности, которую мы можем иметь в нашем пространственном мышлении. В частности, потому что они в основном обучены на видео или обучены на изображениях. И поэтому, когда мы обучаем модель на изображениях, фотографиях и так далее, мы не можем ожидать, что она поймёт, как объекты ведут себя, например, в трёх измерениях. Таким образом, есть также проблема данных, всего того, что физическая модель не обязательно понимает. Есть вещи, которые мы можем подтолкнуть и заставить их потерпеть неудачу. Это, например, проблемы с шестернями. Это проблемы с шестерёнками. Если у нас нет хорошего представления о физике, о том, как работают шестерёнки, это не сработает. Да, нужно будет загрузить в него много документации о чём-то, что позволит ему, возможно, понять, как работает та или иная вещь. Но это не очевидно. На самом деле есть реальная проблема. данных. То есть, когда модель выходит за рамки того, с чем она могла ознакомиться, она не справится. Это не магия, это по-прежнему статистические модели, которые учатся на данных. То есть для вас задача сделать так, чтобы в каком-то смысле кормить вашу Ии новыми данными, новыми типами данных, не только текстами, изображениями видео. Я так понимаю, что есть интерес идти дальше. Это важный вопрос. Хотя это не обязательно должны быть новые типы данных. Это могут быть новые текстовые данные. Например, если мы хотим, чтобы модель прекрасно отвечала на вопросы по французскому праву, её нужно дополнительно обучить на судебной практике, на нормативных базах и так далее. То есть речь идёт о расширении её возможностей. У модели есть определённая ёмкость, и когда мы подходим к её пределам, нам нужно добавлять специализированные данные. И эта граница очень велика. То есть, как только мы приходим в компанию, мы понимаем, что в этой компании есть экспертиза и что эта экспертиза не обязательно хорошо понята моделями. Поэтому необходимо специализировать модель, внедрять экспертизу в модель.
Интересно? А позвольте задать ещё один вопрос. В какой мере сейчас ваши клиенты - это компании? Как вы видите распределение между людьми вроде меня, кто использует систему для работы через обычный чат? и компаниями, которые говорят: "Ваши языковые модели нам нужны, чтобы встроить их в наши процессы". Как это выглядит сейчас? Но на самом деле есть две вещи. Чат используется в личных целях и в профессиональных целях. И это часть нашей бизнес-модели. Далее, основная часть нашей бизнес-модели - это работа с компаниями для развёртывания чата, например, внутри компании, а также для создания конкретных приложений, которые используют модель не обязательно в разговорном режиме, а для создания приложений в логистике, промышленном мониторинге. Например, мы работаем с Виоли, мы работаем со многими французскими и международными компаниями. На самом деле все эти компании, будь то в сфере логистики, промышленности, телекоммуникации, аппаратного обеспечения, это компании, которые имеют специфические случаи использования. И диалоговый помощник не всегда подходит для этих случаев. Иногда подходит. Он удовлетворяет многие аспекты. В частности, все вопросы, связанные с услугами поддержки, поддержкой клиентов. чата может быть достаточно, но как только мы переходим к приложению, которое необходимо развёртывать на заводе, здесь нужно проделать специальную работу, потому что завод имеет свои ограничения, свои задачи, свои данные. И поэтому у нас есть платформа для разработчиков, которую можно адаптировать и на которой можно очень быстро создавать продукты, специфичные для конкретных компаний. И это вторая часть нашей бизнес-модели. И сегодня это самая важная часть. Понятно? А если в пропорции, как вы видите буду это больше B2B или больше массовый пользователь? На самом деле это смесь того и другого. Мы начинали как B2B компания, но очень быстро стало ясно, что технология слишком мощная, чтобы не показывать её широкой аудитории. На самом деле мы говорим даже более обобщённо. Мы говорим о технологии, которая будет одна и та же дома и на работе. Это немного похоже на электронную таблицу Excel. веб-браузер. Фактически это достаточно горизонтально, чтобы использоваться в обеих сферах. Разница между чатом для потребителя и чатом для компаний - это подключённые данные. Чат для потребителя подключён к интернету. Он может выполнять повседневные дела, может делать покупки, помогать планировать поездки, готовиться к выходам. Компании всё по-другому. Он подключён к источникам знаний, подключён к документальным источникам, подключён к базам данных аналитики и так далее. И, следовательно, вопросы, которые задаются в компании, и вопросы, задаваемые потребителям, не одинаковы, использование не одинаковое, однако интерфейс одинаков. То есть разговорный аспект, есть аспект создания документов. На самом деле модель может переключаться. Когда она определяет, что необходимо написать отчёт или переписать электронное письмо, она переходит в режим создания документа. Таким образом, интерфейс один и тот же, но информационные системы разные, а также разная и персонализация. Подпишись прямо сейчас на мой Telegram-канал по ссылке в описании. Я подготовил для тебя топ-три материала, которые, на мой взгляд, должен знать каждый. Первое, карта сотни топовых AI стартапов - это будущее на одной картинке. Второе- прогноз от инсайдера из Openi, который ещё до появления CH GPT предсказал всё, что сейчас происходит с неронками. И вот в этом году он выпустил новый прогноз до двадцать седьмого года. И третье, самое мощное - это мой разбор эссе основателя компании Anроopic, который по сути второй человек в мире искусственного интеллекта. Он по полочкам разложил, что будет происходить в мире ближайшие 5 лет. И главное, каким будет универсальный AI, которого все так боятся или ждут. Переходи по ссылке в описании. Я возвращаюсь ко всем очень
общим вопросам, которые люди часто задают. Один вопрос, который часто возникает - это вопрос о человеческих предубеждениях, о том, что мы, естественно, опираемся на данные, которые были созданы людьми, статьи, ресурсы, всевозможные вещи, которые можно найти в сети. И всегда возникает эта проблема. Как настроить свой ИИ, чтобы он не воспроизводил определённые предубеждения со всеми рисками, которые мы можем себе представить. Как, например, в Мистраль вы подходите к этому вопросу? И как вы пытаетесь исправить это, когда это необходимо? Это действительно очень интересный вопрос. Важно понимать, что на самом деле в обучении модели есть две фазы. Есть фаза, когда мы сжимаем знания, и, следовательно, мы узнаём, что кошка часто сидит на диване. И мы делаем это с помощью тысяч миллиардов слов. И в итоге мы получаем модель, которую мы называем предварительно обученной моделью, которая обязательно будет иметь предубеждения, потому что она обучалась на данных, которые имеют свои собственные предубеждения. Это статистические предубеждения. То есть, да, это статистические предубеждения. Затем есть вторая фаза, которая более редакционная. То есть мы можем выбрать направлять модель в определённые стороны. Когда мы задаём ей вопросы, она будет хотеть ответить конкретным образом. Если мы задаём ей политические вопросы, мы хотим, чтобы модель дала взвешенный ответ. Когда мы задаём ей исторические вопросы, по которым есть только одна точка зрения, или медицинских, где она должна предупредить, что нужно обратиться к врачу. Да, это своего рода стратегия, простая стратегия, которая заключается в том, чтобы сказать: "Вот все эти темы, я их не затрагиваю". То есть, когда задают медицинские вопросы, я отвечаю стандартно: "Проконсультируйтесь с врачом". Но можно также рассуждать иначе. модель на самом деле неплохо справляется с медициной. Она могла бы давать полезную информацию. Поэтому всегда есть определённый баланс между тем, чтобы быть полезным, и тем, чтобы не рисковать. И по мере того, как мы повышали способности моделей, мы замечали, что граница их полезности расширялась. Поэтому нужно отдельно смотреть, как модель должна реагировать, когда ей задают медицинские вопросы. Ведь когда модель была не очень хороша, в медицине всё было просто. Редакционный контроль заключался в том, чтобы сказать ей, не отвечай на этот вопрос. Но когда она становится достаточно умной, она уже может сказать: "Вот предположительно такие возможные диагнозы. После этого можно попросить её добавить. Однако я не являюсь врачом. Вам всё равно следует обратиться к специалисту". Так что эта тема действительно огромная. Нужно осуществлять редакционный контроль практически всего. Важно понимать, что не существует моделей без предвзятости. Каждый развёрнутый экземпляр-модели и каждая компания делают свои редакционные выборы. А наша стратегия, поскольку мы в основном продаём решения для компаний, состоит в том, что при внедрении мы помогаем им персонализировать эти моменты. То есть, если они хотят, чтобы модель, которую они предоставляют сотрудникам, не отвечала на политические вопросы, это можно настроить. И здесь возникает действительно большой вопрос персонализации, который начинается с оценки. Например, чтобы контролировать модель редакционно, у нас может быть тысяча вопросов, на которые мы хотим, чтобы модель отвечала определённым образом. Мы проверяем, правильно ли она отвечает. И если нет, мы идём и вносим изменения. И именно для таких задач у нас существует целая платформа, которая позволяет выполнять подобную персонализацию. Ведь действительно вопрос предвзятости ИИ или точнее редакционных решений очень часто обсуждается в новостях. Совсем недавно мы видели, как Илон Маск со своим и на базе Экс критиковал Open AI особенно в США. Он обвинял компанию в чрезмерной предвзятости, особенно в политических темах. Поэтому он пытался разработать собственную редакционную политику для определённых вопросов. Можно также вспомнить псик в Китае, где система, когда ей задают вопросы, касающиеся политики и особенно китайского режима, склонна уходить от ответа. Всё это действительно вопросы редакционного характера. Не в смысле СМИ, но всё же речь идёт о том, какие темы обрабатываются, какие нет, и как именно они обрабатываются. А у вас как проходят такие решения? Мы сначала занимались этим совсем мало. В начале такие вопросы возникают уже после, когда технология начинает работать. Но сегодня это, конечно, гораздо более актуальная тема. У нас есть банки текстовых вопросов, тысячи запросов. Мы также знаем, какие вопросы нам задают в реальности. Так что мы хорошо понимаем, что пользователи присылают модели.
Это означает, что у нас есть хорошие представления о том, каким образом модель должна отвечать. И да, конечно, встаёт вопрос, как именно мы хотим, чтобы она отвечала на политические, исторические и другие подобные вопросы. И снова важно понимать, что не существует единственной истины. Вот Илан Маск, когда создаёт грок, говорит, что грок - это про истину. Но в мире, где существует множество мнений, нет одной единственной истины. Поэтому наша задача - иметь модель, которая занимает как можно меньше позиций, то есть которая способна, когда ей задают неоднозначные вопросы, по которым существует несколько точек зрения, представить эти разные точки зрения, а не утверждать одну как единственно верную. Но это поднимает ещё более широкий вопрос. Я планировал обсудить его позже. Вопрос суверенитета над такими инструментами, потому что мы знаем и видим, по крайней мере, я вижу это каждый день и вижу в своём окружении тоже, что мы все уже используем и ежедневно, чтобы задавать огромное количество вопросов, иногда связанных с актуальными событиями или политикой. И это уже занимает место в нашей жизни как поисковик, как Google, который уже занимает колоссальное место в нашей повседневности. И отсюда возникает вопрос: кто это контролирует? У кого есть право выбора или последнее слово в том, что и выдаёт или не выдаёт? Это ведь и создаёт, на ваш взгляд, вопрос суверенитета французского или европейского в отношении таких технологий? Абсолютно. Думаю, важно понимать, что мы говорим о технологии, которая является новым поколением медиа. У нас были социальные сети, мощнейшие инструменты влияния, куда более крупные, чем газеты. И мы видим сегодня в США, генеративный искусственный интеллект, будучи порталом к информации, становится новым типом медиа. И это медиа чрезвычайно эффективное, потому что оно не только способно создавать собственный контент, но ещё и взаимодействует как человек. То есть оно очень убедительно, когда пользователь с ним общается, возникает чувство привязанности, поэтому вопрос влияния, которое он может оказывать, совершенно ключевой. И вот здесь появляется реальная проблема культурного суверенитета. На самом деле генеративный Ии - это вопрос суверенитета. Есть экономический суверенитет. Если, скажем, все европейские компании зависят от американских технологий в сфере, которая через 10 лет, возможно, будет формировать 10% мирового ВВП. Это создаёт серьёзный дисбаланс в торговле. Есть экономическая проблема. Есть и культурная проблема, а именно, хотим ли мы, чтобы весь доступ к информации в Европе контролировали американские компании, имеющие свои собственные интересы и использующие эти инструменты как вектор влияния? Да, у которых есть собственные интересы. Они могут сказать: "Я утрирую", но всё же не слишком. Если завтра напряжение между США и Европейским Союзом усилится, США могут решить, что им выгодно продвигать свои интересы среди европейцев. И тогда в ответах ИИ они могут, я условно говорю, принижать европейские страны или, наоборот, подчёркивать преимущество США. Да, вполне можно представить, что это станет инструментом влияния именно точно так же, как это происходило в социальных сетях Twitter, TikTok и других подобных платформах. генеративный и будет обладать аналогичной силой и это влияние ещё сильнее, чем у соцсетей, потому что есть персонализация, есть эффект эмпатии, когда человек чувствует, что машина его понимает. Это создаёт уровень доверия намного выше, чем доверие к другим видам медиа. Поэтому, конечно, нужна гражданская осведомлённость, понимание того, какое влияние это может оказать и скепсис, который следует сохранять по отношению к инструментам. Нужно критическое мышление, это важно. Но это также означает, что это технология, над которой каждое государство, стремясь сохранить суверенитет в отношении идей, циркулирующих внутри её территорий, должно иметь стратегию. И возможно, чтобы завершить эту тему, как вы сейчас работаете в этом направлении и в какой мере существует регулирование на европейском уровне или другом. Такие вопросы возникают и в отношении соцсетей. Кто контролирует алгоритм? Кто решает, что может быть удалено, а что нет? Как вашей компании удаётся решать такие вопросы? Сейчас именно вы принимаете решение, но существует ли какая-то внешняя регуляция? Сегодня вы сами проводите это распределение, но есть ли также вопросы регулирования, которые возникают помимо этого? Безусловно, вопросы регулирования появятся. Я думаю, что тема генеративного ИИ пока ещё не рассматривается всерьёз с точки зрения модерации на уровне европейских норм. Всё ещё очень новое, и регулирование неизбежно возникнет. Наша позиция, как я уже говорил, стремится быть максимально нейтральными, насколько это возможно. Это не всегда просто. И вторая часть нашей стратегии понимать, что мы не являемся носителями единственной истины. Мы собираемся предоставлять наши модели как открытый исходный код. Это означает, что любой может взять нашу систему, развернуть её у себя и изменить так, как нужно, добавив свои собственные редакционные настройки и ограничения. Мы даём доступ к чертежам модели и говорим: "Хотите изменить её под свои нужды? Пожалуйста". Это способ сказать, что мы не претендуем на роль единственного источника истины. И мы хотим, чтобы вся индустрия, весь академический сектор мог пользоваться нашими моделями и модифицировать их по своему усмотрению.
Это и есть аспект Open Source, который есть далеко не у всех компаний. И чтобы правильно понять, как это работает, Open Source означает, что каждый может изучить и использовать модель. Но ведь это не стопроцентный Open Source. В конечном счёте вы коммерческая организация и есть определённые ограничения. Как это выглядит на практике? Как соотносится открытость и коммерческая сторона, чтобы всем было полностью понятно. Да, на самом деле часть интеллектуальной собственности, которую мы создаём, мы делаем открытой, то есть мы предоставляем её всем. Что означает открытая модель? Модель - это файл на вашем компьютере. Это определённое количество параметров. Это цифры. Это миллиарды цифр. И как только у вас есть доступ к этим миллиардам цифр, вы можете вносить в них изменения, чтобы встроить нужные редакционные смещения. Нужно лишь иметь подходящие инструменты, а это инструменты, которые мы предоставляем. То есть мы предоставляем модели в открытом виде. Мы также предоставляем определённое количество открытого программного обеспечения. Программное обеспечение - это, собственно, код, и его можно менять в виде текста. У нас, конечно, есть множество вещей, которые не являются Open Source и которые мы продаём. Инструменты развёртывания, подключения к данным, команды решений инженеров, которые делают интеграции. Интерфейсы - это тоже вещи, которые являются собственностью компании. Таким образом, у нас есть то, что мы называем открытое ядро, то есть модели, а всё, что вокруг, не является открытым исходным кодом. И этот баланс иметь вещи, которые всё-таки принадлежат вам, но одновременно открывать часть, чтобы каждый частные лица или компании мог ими пользоваться и при необходимости модифицировать. Каков для вас интерес в том, чтобы сохранять эту Open Source составляющую? Это для того, чтобы обогащать и развивать проект вместе с другими участниками? Да, интерес многогранен. Во-первых, это интерес дистрибуции. То есть тот факт, что мы предоставляем модели с открытым исходным кодом, позволил нам стать известными во всём мире, потому что мы были и остаёмся лидерами в дистрибуции моделей. Вторая тема - это тема ускорения исследований. То есть я предоставляю модель, а затем другие организации берут её и улучшают. Ещё одна сторона Open Source. Он позволяет разделить затраты и ускорить исследования. Мы выкладываем что-то и ожидаем, что другие компании возьмут это и улучшат. Затем мы можем взять их улучшение и доработать дальше. Таким образом происходит объединение усилий в неокр. И то, что мы увидели с момента, когда начали продвигать Open Source, потому что когда мы начали, этого ещё почти не было. Это то, что мы выложили модели. Затем американские компании вроде МЕТА также выложили свои модели. Затем китайские компании, вроде dieps тоже начали выкладывать модели. И каждый раз новые модели опирались на открытия, сделанные в предыдущих моделях. Не обязательно ими самими, часто другими компаниями, чтобы сделать что-то ещё лучше. И интересно то, что в искусственном интеллекте с десятого по двадцатый год именно так всё и происходило. Мы делали открытия, публиковали результаты, выходили на конференции, и другая лаборатория брала это, и через 6 месяцев на следующей конференции представляла что-то ещё лучшее. Таким образом, создавался общий пул знаний. Всё происходило быстрее, и всё было децентрализованным. То, что мы увидели с Open AI, когда они начали выстраивать бизнес-модель вокруг генеративного ИИ, это то, что как только они увидели бизнес, они сказали: "Хорошо, мы всё закрываем". И поэтому, когда мы начали мистраль в двадцать третьем году, в смысле, мы не будем делать Open Source, всё будет принадлежать нам? Да, это будет принадлежать им. И главное, они будут скрывать, как всё работает, и иметь централизованный контроль. То есть, чтобы получить доступ к модели Open AI, вы обязаны проходить через их сервисы, и у них есть полный контроль над всем, что происходит. Они видят данные и полностью контролируют редакционную политику. И поэтому мы в двадцать третьем году внесли большой вклад в обращение этой динамики, сказав: "Мы будем продвигать языковые модели с открытым исходным кодом". И мы увидели, что это хорошо воспринялось. Сегодня Open source модели уже столь же хороши, как закрытые модели, поэтому всё меньше смысла использовать модели, контролируемые
централизованно. Каковы, по вашему мнению, сильные стороны Мистраль и в более широком смысле, возможно, Европы перед лицом гигантов, которых мы знаем сегодня? Мы думаем об AI, но есть много других. Каковы могут быть для вас сильные или, по крайней мере, отличительные стороны европейского игрока, такого как ваш? То, что сегодня действительно выделяет нас на уровне работы с компаниями - это способ, которым мы осуществляем развёртывание. Мы единственные, у кого есть переносимая платформа, то есть которую можно разместить на серверах наших клиентов, развернуть в облаке клиентов или в нашем облаке. То есть у нас есть возможность адаптироваться к техническим ограничениям клиентов, к их инфраструктурным требованиям. И такого нет больше ни у кого. Сегодня мы можем развернуть чат на серверах клиентов, и это абсолютно невозможно с тем, что предлагают американские компании. Это означает, что мы можем работать с совершенно другими потребностями, особенно в госструктурах, в регулируемых секторах, где крайне важна управляемость данных. Это первый момент. Затем у нас есть модели, которые ведут себя иначе, в которых мы сделали иные редакционные выборы по сравнению с Open AI и другими американскими компаниями. У нас есть очень серьёзное преимущество в эффективности. Мы создаём более компактные модели, которые работают быстрее. И мы сильно подтолкнули индустрию к уменьшению размеров моделей и снижению стоимости, в том числе благодаря тому, что предоставляем бесплатные модели для всех. Это наши сильные стороны. У нас также есть значительно более широкие возможности персонализации систем, чем у американских компаний. И при этом возможность развёртывания. Мы можем прийти в компании, работать вместе с ними, настраивать и создавать приложения, которые будут под них. Затем относительно преимуществ, которыми мы смогли воспользоваться в Европе. Во-первых, это сильные кадры. И, кстати, я обращаюсь к вашей аудитории. В Мистраль мы нанимаем сотрудников, и мы нанимаем на всех уровнях. То есть мы набираем людей в инженерию, мы набираем в отдел коммуникаций, мы набираем в бизнес, набираем в маркетинг, мы набираем инженеров, мы набираем младших специалистов, которые только что закончили магистратуру. Мы набираем специалистов с пятидесятилетним опытом и по темам, которые не обязательно связаны с искусственным интеллектом, потому что есть темы дизайна, есть темы развёртывания, есть много тем не связанных с искусственным интеллектом. Но мы также нанимаем учёных, тех, кто хочет продвигать границы возможностей. Вот такая небольшая рекламная вставка. Но возвращаясь к преимуществам Европы, здесь есть действительно очень сильные образовательные центры. Есть отличные технические школы во Франции, в Англии, Германии, Польше, Испании, Италии, везде, откуда мы можем нанимать. И это делает нас крайне эффективными. Европейские инженеры более эффективны, чем инженеры из других стран. И я полагаю, для вас, как и для многих других технологических компаний, важный вопрос в том, чтобы оставаться достаточно привлекательными, в том числе с точки зрения зарплат. По-простому говоря, чтобы инженер или специалист не подумал: "Ну, пожалуй, мне стоит поехать работать в США". Наверняка для вас это тоже проблема, и она будет только расти. Я думаю, что нам удалось сделать очень важную вещь. Мы смогли нанять людей, которые иначе пошли бы в американские компании. И даже достаточно много людей, которые уже работали в американских компаниях. Это благодаря тому, что у нас другой проект и мы стартап, который двигается быстрее. Это не означает, что у нас нет развития в США. Мы растём и там. У нас есть научная команда в США. В частности, потому что специалистов высокого уровня там проще найти. Кроме того, у нас есть коммерческая команда в США. Некоторые компетенции в технологиях, особенно коммерческие, действительно проще найти в Америке, потому что там гораздо более глубокая экосистема. Стартапом там 70 лет, в Европе максимум 20. Поэтому опыта в целом меньше.
И наоборот, если говорить о самокритике, мы обсуждали сильные стороны. Но если взглянуть на мистраль или в целом на Европу в сфере Иилее серьёзные вызовы, где у нас всё ещё есть отставание? Европейские компании, как правило, чуть медленнее, чем американские, когда речь идёт о внедрении новых технологий. И это приводит к некоторому запаздыванию в росте по сравнению с американскими компаниями, которые стартуют на американском рынке. Но, на мой взгляд, ситуация заметна изменилась в лучшую сторону. Сегодня мы видим очень сильное стремление европейских компаний ускориться в области искусственного интеллекта и работать с европейскими технологическими компаниями, чтобы создавать ту же синергию, которую американцы прекрасно умеют выстраивать. В США стартапы из Кремнеевой долины работают со всеми компаниями из S& P 500, точнее из Fortune 500. И это ускоряет их экономический рост. В Европе мы, возможно, делаем это чуть хуже. В частности, потому что рынки фрагментированы стран 27. И продавать во Франции - это не то же самое, что продавать в Германии. Нужно формировать новую команду, другая бизнес-культура и так далее. Это занимает немного больше времени. Да, это занимает больше времени, но это и более лояльный рынок. Компании выбирают партнёров на более долгий срок. То есть свои плюсы. и деловая культура отличается. Поэтому, на мой взгляд, это и есть главный вопрос. А значит, важно, чтобы такая компания, как наша, тоже активно расширялась в США, присутствовала там, росла в Азии. Есть вопросы, связанные с трудовым регулированием. Одна из больших проблем, которые у нас есть, это понятие срока уведомления об увольнении. То есть сегодня, когда мы нанимаем кого-то в европейскую команду, мы должны ждать 3 месяца, чтобы он присоединился к нам, потому что они должны отработать срок уведомления об увольнении. И это максимум 3 месяца. И часто это ровно 3 месяца. Компания говорит: "Ты остаёшься 3 месяца или уходишь в отпуск на 3 месяца, но не присоединяешься к следующей компании в течение 3 месяцев". В Соединённых Штатах такого нет. Там, если человек решил перейти в другую компанию, через 2 дня он уже может выйти на работу. И это оказывает серьёзное влияние на быстрорастущую компанию. Между моментом, когда мы решили нанять кого-то, и моментом, когда человек реально появляется в офисе, проходит 2 месяца на сам процесс найма или месяц, если очень быстро, а потом ещё 3 месяца ожидания. Это, на самом деле, довольно катастрофично. Так, в большинстве европейских стран. Поэтому здесь тоже есть необходимость. Нужно дать больше гибкости. не работодателю, а сотруднику. Я пытаюсь понять, зачем вообще существует этот срок уведомления. Я не уверен, что вижу пользу для сотрудника. Это защита компаний. Их блокируют, запирают с помощью чрезмерного регулирования. А вы считаете, что если сотрудник хочет перейти, он должен иметь возможность сделать это быстрее, не рискуя упустить возможность? Именно это и стало силой Кремнениевой долины. Высокая мобильность талантов. Если появляется какой-то интересный, перспективный проект, то очень легко нанять сразу 15 инженеров. А во Франции это гораздо сложнее, поэтому нужно менять подход и менять его на уровне всей Европы. Мы много говорим о США, естественно, потому что обсуждаем Open AI, GPT и так далее. Сейчас это настолько распространено, что я вижу, вокруг меня им пользуются почти как поисковиком. О Китае говорят меньше, хотя пару месяцев назад псик был в центре обсуждений. вся эта шумиха, они заявляли: "Смотрите, мы потратили гораздо меньше, но смогли добиться многого" и так далее. Как вы оцениваете эту китайскую Ии? В том числе и то, как они добились этих результатов. Ведь вокруг этого шли большие споры и шире. Как вы видите Китай как игрока в этой сфере? И что, по-вашему, будет происходить в ближайшие годы? ПСИК - это компания, которая довольно близка к мистраль, на самом деле, с точки зрения структуры, с точки зрения возраста, с точки зрения амбиций. На самом деле мы обе существуем уже 2 года, и мы предоставляем модели в открытом доступе. В некотором смысле последние выпуски ПСК основаны на расширении того, что мы смогли предоставить в прошлом году. У нас в ДНК общие вещи: открытость, эффективность. Они показали, что обучение конкурентоспособных моделей не стоит миллиардов. Мы показали это раньше. Просто вокруг нас было меньше шума, потому что мы европейцы, американцы больше следят за тем, что происходит в Китае, чем в Европе. Но суть в том, что мы всегда говорили, и именно это нас вдохновило на создание мистраль, что создание качественных моделей и инструментов, которыми пользуются люди, не требуют миллиардных инвестиций. Думаю, теперь это доказано. Мы это доказали, другие доказали. Это полностью подтверждено и ставит в неудобное положение некоторые американские компании, которые последние 5 лет утверждали, что для конкурентоспособности нужны миллиарды и экспоненциальный рост инвестиций. Вы
подняли чуть больше миллиарда. Это всё же большая сумма. И мы знаем, что в сфере EИ это часто бывает. А Open AI, если говорить общей сумме привлечённых инвестиций, у нас есть данные на этот счёт. Open AI они должно быть привлекли от 60 до 70 млрд в целом. Примерно так. Это уже другой уровень. Идипсик. Их финансирование по нашей оценке в два раза больше, чем у нас. Со стороны Open AI это уже совсем другой масштаб. Тогда вопрос, если смотреть на результат и продукт, который в итоге получается, насколько там действительно есть большая разница? Насколько большой разрыв? Интересно то, что всё это основано на так называемых законах масштабирования. То есть мы долгое время работали, и я сам много этим занимался, когда был в Google, над тем, что если увеличивать вычислительные мощности, модель становится лучше. Но это работает только до тех пор, пока мы можем увеличивать объём данных, которые попадают в модель. В какой-то момент мы выходим на режим, где мы фактически закончили сжимать человеческое знание. И тогда увеличивать затраты ещё в 10 раз уже не имеет большого смысла, потому что прирост качества становится крайне незначительным. То есть система опирается на ресурсы. Эти ресурсы - это знания, которые у нас есть, и их количество. Это сумасшедшая фраза, что вы сказали: "Мы закончили сжимать человеческое знание". И тогда, даже если машина становится гораздо мощнее, но данные те же самые, большого прогресса уже не будет. Верно. Фактически до двадцать четвёртого года мы не были ограничены данными. Мы были скорее ограничены вычислениями. Грубо говоря, данные должны расти примерно с той же скоростью, что и вычислительные мощности, скорее даже по квадрату. То есть берём 10. 000 миллиардо слов и сжимаем их в модель на 100 млрд параметров. Таким образом, происходит это огромное сжатие, которое и создаёт знания. И когда мы увеличиваем данные в 10 раз, мы также увеличиваем размер модели в 10 раз. Таким образом, в конечном итоге количество вычислений - это, по сути, размер данных, умноженный на размер модели. И, соответственно, мы увеличили его в 100 раз. В течение долгого времени, между двадцатым и двадцать четвёртым годами, мы увеличивали размер данных, а также увеличивали размер модели. Поэтому мы делали более крупные модели с более крупными данными. Но сейчас мы пришли к режиму, где невозможно больше наращивать объём данных, потому что в мире просто нет существенно больше, чем 20. 000 млрд слов. И когда вы это говорите, вы имеете в виду то, что обсуждали ранее, то есть данные, доступные онлайн, плюс, возможно, другие источники, которые мы упоминали. Да, плюс мультимодальные источники, изображения, видео. Есть ещё закрытые корпоративные данные, с которыми можно заключать соглашение. И всё равно мы не можем продвинуться намного дальше, чем то, что есть сейчас. Только если начать осваивать новые типы данных, как вы говорили. Например, вопросы о механизмах в производстве. Там сложнее, потому что данных меньше и они труднодоступны. У нас нет знаний, знания недоступны. То есть много знаний находится в силосах внутри компании. И одна из задач для продолжения улучшения моделей сегодня - это проникновение в эти силосы. И это может быть сделано только децентрализированным образом. Нужно сказать: "Хорошо, теперь модели, которые являются общецелевыми, хороши. Теперь нужно сделать их специализированными в определённой отрасли". И возвращаясь к этой теме, с того момента, как мы закончили использовать данные, нет большого смысла добавлять больше вычислений. И, следовательно, тезис о том, что вложение 10 млрд сделает всё это лучше, относительно неверен. И, следовательно, это также возможность для таких компаний, как мы, таких компаний, как DeepsК, выйти на рынок и занять очень-очень значительное место, несмотря на расходы, которые не являются, которые на порядок ниже того, что смогла сделать Open, AI, например. Но я нахожу
Как использовать и приумножать человеческое знание
увлекательным то, что вы говорите о вопросе человеческого знания, которое вам удалось в некотором смысле сжать. компилировать и так далее. С какого момента мы достигли этой стадии, когда всё, что существует, по крайней мере, всё, что существует в сети, у нас есть, и мы можем это использовать. Когда это было? Примерно двадцать четвёртый год, я думаю. Точки насыщения, эффекты насыщения, которые мы наблюдаем в предварительном обучении - это то, что действительно датируется двадцать четвёртым годом. И теперь, соответственно, задача для вас состоит в том, чтобы лучше использовать эти данные и как можно лучше обучить модель их использовать. У нас всё ещё есть задачи, связанные с масштабированием, потому что мы пока можем обучать модель немного дольше. Мы ещё не находимся в режиме сильного насыщения, но действительно есть алгоритмический вызов. Нужно продумывать новые архитектуры, которые будут эффективнее и так далее. Есть задачи, связанные с данными. Множество данных можно было бы отбросить, потому что они создают шум при обучении. Значит, важна максимально качественная выборка. Есть также вопрос о развитии и умения рассуждать. Существуют новые парадигмы обучения, которые заключаются в том, чтобы подталкивать модель к тому, чтобы она становилась всё сильнее и сильнее в математике с помощью других методов обучения, методов подкрепления. То есть мы уже сжали знания, но мы просим модель генерировать доказательства. Мы говорим ей: "Вот вопрос по математике. Ответ нам известен. Сгенерируй мне доказательства и дай ответ". Если ответ верен, мы немного подтолкнём модель в этом направлении написания доказательств. Если ответ неверен, мы подтолкнём её немного в другом направлении. Это подводит меня к следующему вопросу. В какой степени И уже способен обогащать тот базовый набор знаний, который у нас есть? Может ли он в каком-то смысле действительно расширять эту базу данных, которую вы упоминали? сам по себе и ничего не обогащает. Когда информация сжата в модель, она не знает больше того, что туда попало. Поэтому, если мы хотим, чтобы модель стала лучше, нужно добавлять новые источники сигнала. Эти новые сигналы могут приходить откуда? Из двух мест. от человеческой разметки, когда люди показывают модели, как решать задачи, предоставляя демонстрации или от демонстраций, которые создают другие машины. Так, в математике, например, у нас есть системы формальных доказательств. Мы можем генерировать огромное количество задач и доказательств, которые затем обучают языковую модель. То есть основная задача индустрии сейчас- находить новые источники сигналов, которые либо генерируются машиной. Это может быть симуляция, это может быть выполнение кода. По сути, мы будем дистиллировать экспертизу машины с помощью процедур, которые мы уже умели писать, в языковую модель. И другая задача - это поиск экспертизы, которой у модели ещё нет. То есть сделать модели сильнее в коде и так далее. Но что касается стороны создания новых знаний, в определённом смысле, если мы вернёмся к очень простому примеру, вот несколько лет назад меня поразил документальный фильм, который вы, возможно, видели Alpha Go и разработанным в то время Google Deep Mind, если я не ошибаюсь, чтобы обыграть лучшего игрока в мире в игре GO, которая меня увлекает. Соответственно, это меня заинтересовало. И таким образом и удалось обыграть чемпиона по Го, чего до этого не происходило. Я смотрел много видеоанализов игроков в Го, которые анализировали это и говорили: "На само деле, то, что удалось сделать ИИ или решения, которые были найдены и для победы в этой партии - это вещи, которые мы, как люди, даже в ресурсах величайших чемпионов ПАГО, не держали в голове. У нас не было этого решения в голове". Разве это не пример того, что Ии создал новое знание? Пусть даже в рамках настольной игры. Это амбиция. И на самом деле интересно то, что игра Го была решена методами подкрепления. На самом деле единственный сигнал, который был у модели - это то, что она выигрывала партию. Таким образом, у неё есть выбор развернуть свою стратегию. И она делает это миллиарды раз. И в конце она знает, выиграла она партию или не выиграла. Если она выиграла партию, она скажет себе: "Эта стратегия неплохая. Я её перепроверю". Если она проиграла партию, она скажет себе: "Я буду использовать другую стратегию". То же самое и в тексте. С текстом мы пытаемся делать то же самое. Это то, что мы в Мистраль и во всех других компаниях пытаемся разработать. Найти текстовую задачу, эквивалентную игрего. Лучший кандидат, сложные математические задачи. Мы задаём вопрос, у него есть чётко определённый конечный ответ. Модель может свободно генерировать доказательства шаг за шагом. Оно, конечно, будет неправильным в начале. Если она находит хороший результат, она скажет себе: "Моё рассуждение неплохое. Я его сохраню". Если она находит плохой результат, она его отменит. И, следовательно, надежда, и я не думаю, что мы ещё достигли этого, состоит в том, чтобы сказать: "Если нам удастся продвигать это долго, если мы будем делать рассуждения, которые становятся всё более и более сложными, если рассуждения занимают сотню страниц, возможно, на самом деле модель изобретёт новые методы в математике, изобретёт новые объекты и так далее. На данный момент мы этого ещё не видели". То есть эта креативность в тексте всё ещё сложнее, чем в проблеме, которая в конце концов является очень простой проблемой Го. Но это главный научный вопрос. Хватит ли нам простого сигнала верно, неверно для того, чтобы модель смогла развить по-настоящему новую инновационную способность доказывать. И задача, я полагаю, состоит в том, чтобы понять, да, до какой степени мы можем в этом продвинуться, потому что это то, что меня увлекает в игре Го. Я думаю, сама игра увлекательна, но это ещё и та вещь, когда долгое время робот не мог или и не мог победить человека. Это произошло, я не хочу сказать глупость, но шахматы - это 2016 год. И компьютер, который победил в шахматы - это годы в девяностые. Девяностые, хорошо. Но это была не та же техника. Но как только Го было решено, на самом деле шахматы были решены с той же техникой, поскольку по сути это та же проблема. И да, вопрос состоит в том, чтобы понять. Теперь, как только мы переходим к более сложным вещам, к более открытым темам, куда мы придём и где может быть предел, и сегодня то, что мы умеем делать - это повышать способность моделей в математике и коде. Просто потому, что у нас есть источники сигналов в очень больших масштабах. То есть мы способны по миллионам математических задач определять, верно это или нет. Да, сигналы, чтобы вы хорошо понимали, это минимум должно быть нечто, как в игре го. Ты выиграл, ты проиграл. Должен быть некий элемент, который позволяет системе это понять. Должно быть вознаграждение. В сущности вот так это называется в обучении с подкреплением. Должно быть вознаграждение один или ноль. Хорошая оценка или плохая. И что интересно и сложно, как только мы переходим к темам более открытым, я думаю, например, о философской задаче. Если мы хотим написать философское эссе, труднее сказать, это один или ноль. Поэтому у нас есть так называемые reвортмодели, которые способны выставлять оценки. Но вопрос в том, что эти модели вознаграждения должны быть хорошими учителями. Они должны ставить оценку, которая действительно соответствует содержанию. И таким образом, если у нас есть хорошие учителя, у нас могут быть хорошие ученики. Мы способны иметь хороших учителей в математике, потому что в математике мы знаем, что истина, а что ложно. Мы хуже способны делать это в
других областях, и это некая граница. Но это наводит меня на, возможно, более личный вопрос. Есть ли такие применения или потенциальные применения и в широком смысле, которые вас пугают? И где вы говорите: "Здесь есть риск? " Была колонка, которая вышла год или два назад и предупреждала о некоторых рисках. С вашей точки зрения, есть ли границы, которые нельзя переходить, или области, где вы видите риск с точки зрения влияния на общество, где вы говорите: "Возможно, нам лучше не идти в этом направлении? sur la société où tu dis ou là on peut-être mieux de pas s'engager sur terrain. Я думаю, что модели сегодня всё ещё недостаточно хорошо работают, чтобы быть источником крупных рисков. Тем не менее, я думаю, что главный риск - это централизованный контроль технологии. То есть, что один или два американских игрока будут иметь культурный контроль и контроль над содержанием и смогут отключить систему, кому захотят или направить её в определённые стороны. et d'influencer la magreпе централизации такого мощного инструмента, думаю, самая опасная вещь. И я думаю, к счастью, мы неплохо смогли этому противостоять. И сегодня аспект децентрализации, открытые модели, всё больше принимается как лучшее решение. Далее, я думаю, в ближайшие годы важным станет именно культурный и влияющий аспект, потому что мы говорим о системах, которые способны создавать эмпатию с людьми и которые способны насаждать свои предубеждения, свою волю, влиять на людей очень тонким и довольно незаметным образом. Сегодня не так уж сложно начать разговор и подтолкнуть кого-то к покупке чего-либо. На самом деле, вероятно, именно так многие компании собираются монетизировать развёрнутые чатботы, но это означает, что на самом деле мы можем продвигать что угодно. И поэтому есть реальный вопрос. Я думаю, это вопрос гражданственности. Как сохранять критическое мышление по отношению к этим вещам? Как сделать так, чтобы мы замечали, когда существуют компании влияния, которые могут быть вредными, или компании вмешательства. То есть существует реальный вопрос демократии, потому что у нас есть системы, которые способны оказывать сильное влияние на людей. Если смотреть с точки зрения, мы говорили об этом чуть раньше, с точки зрения влияния и демократического воздействия или связанных рисков. А если смотреть с более технологической точки зрения, то есть помимо аспекта влияния на способность делать то, что мы раньше и представить себе не могли, чего ещё несколько лет назад невозможно было вообразить. Видите ли вы здесь какие-то риски или моменты, при которых вы сами себе говорите: "Подождите, но если она начинает решать чрезвычайно сложные задачи, которые мы, возможно, в какой-то момент уже не в состоянии решить сами, насколько далеко это может зайти? Всегда есть этот фантазийный образ, причём довольно распространённый, что и однажды нас превзойдёт, что, впрочем, уже частично происходит. Что вы об этом думаете? Я думаю, здесь всегда существует своего рода страх получить терминатора. И, по-моему, этот страх абсолютно беспочвенен. То, что мы создаём - это программы. Это программы, которые находятся под человеческим контролем, которые работают на машинах. Они не станут независимыми и не начнут делать что-то опасное для людей. Мы не разворачиваем системы, чьё поведение мы не контролируем. Это в целом основа работы с программным обеспечением. Да, конечно, могут быть баги и прочее, но крайне важно обеспечить контроль над происходящим, особенно когда мы подключаем модели к инструментам. Однако страх перед системой, которая сбежит из-под контроля, страх, который не имеет оснований. Это чистая научная фантастика. Далее есть другой страх, что искусственный интеллект заменит людей. Мы говорили об этом в начале. Здесь вопрос в том, что нужно научиться пользоваться им, чтобы оставаться востребованными. Один из рисков, который научно зафиксирован - это риск потери навыков, когда люди начинают слишком сильно доверять ИИ и со временем перестают анализировать, перестают мыслить критически. И это уже наша зона ответственности. продумать, какой именно дизайн мы предлагаем пользователю, чтобы он оставался включённым и продолжал думать. Мы не хотим всё пережёвывать за человека. Когда речь идёт о важных решениях, эти решения должны приниматься осознанно в соответствии с собственным выбором человека. Поэтому важнейшая задача сделать так, чтобы, несмотря на мощь доступных инструментов, человеческий мозг оставался активным. И даже, думаю, самые простые практические вопросы. Например, в сфере образования сейчас огромное количество школ и университетов задаются вопросом. Я знаю уже множество ситуаций, где сочинения практически перестали давать надом, потому что все понимают, что их можно сделать с помощью и возникает напряжение. С одной стороны, важно уметь пользоваться такими инструментами. Они помогают выстраивать идею, составить план. А с другой, нельзя терять способность строить этот план самому, думать самостоятельно. Интересно, как вы это видите именно в сфере образования. Ведь для национальной системы образования это вызывает тысячи вопросов и новых решений. Это огромная тема. Мы, например, работаем с университетами и лицеями, особенно французскими, чтобы внедрять наши системы, внедрять наш чат. Здесь важно понимать, зачем он нужен и какую пользу может дать образованию. Если использовать его просто, чтобы делать домашние задания, это мало что даёт. Домашние задания - это ведь не наказание, а способ учиться. Если они обходят этот способ обучения с помощью генерации текста и не применяют критическое мышление, тогда всё теряет смысл. И ученики, и учителя тратят время впустую. Но если использовать и по-другому, например, для персонализированного обучения, если учитель имеет доступ к ассистентам, настроенным под каждого ученика, и может давать каждому именно те задания, которые ему нужны, тогда учитель становится гораздо более эффективным и получает гораздо больший контроль над процессом. И это работает на всех уровнях. от начальной школы до высшего образования. Это также инструмент для учителей, чтобы проверять работы. Ведь это не самая увлекательная часть их профессии и может серьёзно облегчить её. Но важно понимать, то, что мы делаем как ученики - это инструмент обучения, способ стать умнее. Поэтому и нужно использовать так, чтобы самому становиться умнее. Да, когда вам задают сделать домашнее задание по математике или чему-то ещё, тема ведь не в том, чтобы у вас был правильный ответ. Ну, конечно, вы рады получить хорошую оценку, но настоящий смысл в вашей способности рассуждать в этом процессе обучения, в умении организовывать своё мышление или ещё что-то подобное. Как сохранить это? Решение, безусловно, состоит в том, что часть вещей должна быть сделана без искусственного интеллекта. Я думаю, важно, чтобы человек оставался умным на всех этапах, чтобы он мог писать вещи без инструментов. Но также важно иметь задания и задачи с использованием искусственного интеллекта. То есть, да, написать философское сочинение сегодня, получить первый набросок с помощью и - это не глупо, потому что это позволяет получить знания, о которых вы сами могли не подумать, но нужно делать итерации. Как, кстати, раньше поисковик мог помочь вам найти источники, только теперь это гораздо мощнее. Это мощнее, но это значит, что мы можем делать более сложные вещи. Думаю, нужно повышать уровень требований, потому что, по сути, база теперь может быть обеспечена и поэтому можно писать более сложные сочинения, можно учиться быстрее и нужно повышать уровень требований. Возможно
последний вопрос. Я хотел затронуть его раньше, но среди всех часто задаваемых вопросов есть и вопрос об экологическом воздействии этих запросов и всей этой системы. Есть ли у вас сейчас данные и информация об этом со стороны Мистраль? И как можно предотвратить этот риск? Особенно большое энергопотребление Ии любого Иитаско вещей. Прежде всего важно помнить о порядках величины. Действительно, искусственный интеллект создаёт спрос на центры обработки данных, поэтому будет больше серверов. То есть центры обработки данных, где есть, ну, все, где находятся графические карты, так называемые GPU, то есть вычислительные устройства, которые обеспечивают работу и моделей, это создаёт спрос, но это по-прежнему довольно незначительно по сравнению с промышленностью. Например, сегодня я должен буду вам прислать точные цифры. Это несколько процентов и поднимается ещё на несколько процентов мирового энергопотребления. Это первый момент. Однако это действительно расход, и потребление особенно велико на этапе обучения, потому что у нас очень много машин. И что мы сделали? А для нас это важно. Мы постепенно переносим вычислительные мощности, которые у нас были в США, потому что сначала их нигде больше не было. Обратно в Европу, где энергетический микс, особенно во Франции, делает углеродные выбросы, связанные с потреблённой энергией, значительно ниже. Из-за ядерной энергетики, в частности, с точки зрения выбросов парниковых газов, это менее важно. Мы провели аудит совместно с Карbon 4. Вы, кажется, приглашали Джовича какое-то время назад. Мы опубликуем этот отчёт. Так что мы в лучшем положении, поскольку используем меньше вычислительных мощностей. Это связано с тем, что мы расходуем меньше капитала, и мы делаем модели меньшего размера. Поэтому, когда они развёрнуты, им нужно меньше машин. То есть они могут обрабатывать больше запросов с меньшим количеством оборудования. Это важный момент. Далее, в более широком смысле. Хороший знак в том, что дата-центры, которые сегодня создаются для обслуживания GPU, действительно потребляют много электричества, но делают это равномерно. То есть спрос существует 24 часа в сутки с постоянной нагрузкой. Это значит, нужно находить решение. И то, что мы наблюдаем в отрасли, решения всё чаще связаны с ядерной энергетикой и возобновляемыми источниками, в частности солнечной энергии. Правда, солнечная энергия вызывает вопросы хранения, потому что она не постоянна, а спрос постоянный, но в некотором смысле И создаёт новый тип спроса на энергию. Из самого первого дня решения ищутся именно в сторону безуглеродной энергии. Это позволит перейти на новые масштабы, увеличивает спрос на солнечную энергию, увеличивает спрос на ядерную, особенно в США, где есть проблемы с сетями, и они хотят строить небольшие атомные станции. То есть это может ускорить энергетический переход. Это, скажем так, оптимистичная точка зрения. Есть и более пессимистичная. Требуется больше ресурсов, поэтому это займёт много энергии. У Илана Маска стоят автоцистерны. Он привозит грузовики-генераторы, генераторы для обеспечения работы своего дата-центра. Ну, это, конечно, выбросы углерода, но если мы проделываем основательную работу и подключаемся к французской энергосети, то это не вызывает углеродных выбросов. Если подытожить, то, конечно, существует проблема высокой потребности в ресурсах для данных технологий. Но есть и другая задача. с вашей стороны действовать разумно в том, как вы используете энергию и как строите модели, чтобы они потребляли как можно меньше. И вторая задача - это источник энергии. Если энергия поступает с атомной станции или из возобновляемых источников, это совсем не то же самое, что энергия с угольной станции или ещё чего-нибудь подобного. Это, конечно, совершенно разные вещи. Послушай, мы обсудили кучу разных тем.
Я бы мог задать ещё много вопросов, но мы говорим уже довольно долго. Может, чтобы вернуться к вопросу будущего и того, что дальше. Как ты видишь и в целом и сам мистраль. Это сложно заглядывать слишком далеко вперёд, даже немного. Но если взять хотя бы горизонт 2-3 лет, как ты видишь влияние и будущее возможности? У нас есть влияние и есть ускорение сразу на нескольких уровнях. Есть научное ускорение, появляются новые модели, способные рассуждать, гораздо лучше управляемые, лучше следуют инструкциям и так далее. Это научная часть, в которой мы продолжаем постоянно двигаться вперёд. У нас есть продуктовая часть. Мы выпустили первую версию чата в феврале. Её использует много людей. Они ей довольны, но мы тоже будем её улучшать. добавлять новые возможности, улучшать модель, сделать её более дружелюбной, выпускать корпоративную версию, которая подключается к внутрифирменному контексту и позволяет сотрудникам получать значительный рост продуктивности. У нас сильное коммерческое ускорение, особенно со стороны европейских и азиатских компаний, которые стремятся к партнёрству, которое даёт им варианты по отношению к американским поставщикам и которые стремятся к более высокому уровню суверенитета по сравнению с тем, что у них было раньше. Мы растём и в США, в частности благодаря компаниям, занимающимся оборудованием, как Цико, которые используют нас всё больше. Так что у нас есть задача управлять коммерческим ростом, улучшать продукт, делать его более персонализированным, быстрее, с лучшим дизайном, более полезным в компании и более полезным в повседневной жизни. Есть научная задача продвигать дальше способность моделей к рассуждению во множестве областей. Рост становится практически экспоненциальным. Это и математика, и программирование, и социальные науки. Есть масса интересных направлений. Есть задачи мультимодальности, не только текст, но и обработка изображений, генерация изображений, работа со звуком, генерация звука. И здесь тоже остаётся много пространства для прогресса. Затем превращение технологий в продукт, то есть персонализация. Нужно дать клиентам все редакторские инструменты. Это нерешённая задача. Совсем не просто настроить модель под конкретные нужды и редакторскую линию. Поэтому создание продукта, который это позволяет, одно из ключевых направлений. Поэтому мы нанимаем людей в разных научных областях, нанимаем очень активно инженеров. Это сейчас наша самая большая группа найма. и в коммерческой части продавцов, специалистов по маркетингу, по продуктовому маркетингу США, Европе и Азии. Отлично. И возможно, последний вопрос, чтобы закончить. Вам около 30 лет. Вы возглавляете компанию, которая привлекла более миллиарда евро
которая занимается огромной темой, которая, возможно, является самой важной технологической темой ближайших лет. Тут нет особых сомнений. И при этом есть вопрос цифрового суверенитета. Вы возглавляете всё это? Как вы это переживаете? Это немного странно. Я не знаю, привыкли ли вы отвечать на такие вопросы, но как вы это кажется головокружительным. Как вы это проживаете и как с этим справляетесь? Всё довольно разнообразно. Работы действительно много. Прежде всего я, конечно, не один. Мы основали компанию вместе с Гиомом и Тимате. Они отвечают за науку и техническую часть. Так что мне не нужно фокусироваться на этом. Сегодня я трачу много времени на коммерческое развитие. Я также много времени уделяю организационным вопросам, потому что нас уже 200 человек, а в октябре было 100. Рост огромный. Это означает, что нужно выстраивать информационные потоки. Не всегда очевидно, что все друг с другом общаются и знают, что происходит в компании. Есть также аспект представительства, потому что тема крайне политизирована и связана с вопросами суверенитета. Поэтому важно быть в нужных местах и участвовать там, где это действительно важно. Это тоже занимает много времени. И потом важно иметь сильную команду рядом. Нужно, чтобы вокруг были люди, которые умнее и сильнее тебя во всех областях, где у тебя ограниченная экспертиза. в продажах, маркетинге, продукте. В целом моя роль, моя цель делать как можно меньше в том смысле, что нужно создать среду, где люди сами делают работу, и всё работает без моего вмешательства. А я нужен только, когда возникают проблемы или что-то требует улучшения. Цель, чтобы всё работало само, как можно
больше. Спасибо большое, Артур. Спасибо за этот разговор. Мы затронули много тем, постарались сделать всё максимально понятным для широкой аудитории. Я знаю, что это не просто, и для тебя тоже, потому что темы технические. Но, думаю, это помогает по-настоящему понять ключевые вопросы и то, что происходит сейчас. Поэтому огромное спасибо. Это было очень ясно и невероятно интересно. Приглашаю всех протестировать чат, если вы всё ещё не попробовали. Он действительно впечатляет. Приложение вышло несколько недель назад. Это довольно недавно, если я не ошибаюсь. Точно, оно вышло в начале февраля, и в ближайший неделе ожидаются большие обновления. Отлично. Нужно будет следить за всем этим. Ещё раз спасибо, Артур Менш. Спасибо большое. Спасибо большое за приглашение. เ