🤖 Ссылка на сервис (Телеграм Бот): https://bit.ly/syntxairu
🖥 Ссылка на сайт SYNTX AI: https://syntx.ai/
🚀 Ссылка на блог SYNTX FAMILY: https://bit.ly/SyntxFamily
💥 Ссылка на Инстаграм SYNTX: https://www.instagram.com/syntx_ai/
Как создать хороший LoRA и не сломать нейросеть?
В этом видео — подробный гайд по созданию ЛОРов: от подготовки датасета и настройки параметров до тестирования результата. Разбираем, какие изображения подходят, как настраивать веса и когда ваша модель действительно обучается, а не просто повторяет рандом. Без воды, с примерами и советами от практиков.
Таймкоды:
00:00 — Вступление
00:14 — Что такое LoRA и зачем оно нужно
01:09 — Как выбрать и собрать правильный датасет?
20:30 — Как работает эта ваша тренировка?
22:44 — Настройка параметров обучения
26:59 — Почему появляется азиатская внешность?
29:05 — Тестирование и использование LoRA
32:20 — Использование других моделей из CivitAI
37:57 — Завершение
🤖 SYNTX – персональный ИИ помощник!
▫️GPT-4o, Claude, Gemini, Grok, Perplexity и GPT Store
▫️Создание изображений, видео и музыки в самых популярных нейросетях
▫️Более 90 «ИИ инструментов» в Вашем кармане
#LoRA #ИИ #SYNTX #AIграфика #StableDiffusion #Нейросети #ИИинструменты #ГенерацияИзображений #ТворчествоСИИ #AIArt #SyntxAI
Всем привет. Сегодня я украл место у Паши, и мы с вами поговорим про тренировку LРА FLК. Давно пора было это сделать, но пришло время только сейчас. Это будет короткий урок, почти как мастер-класс, только в формате записи. Ну что ж, наверное, приступим. Давайте
начнём с того, что посмотрим, что такое Лора и вообще узнаем, что это, как это и зачем это. Лoraра по-правильному называется low rank adaptation. Это низкоуровневая адаптация. Ара позволяет добавить какой-то контекст, не переучивая основную модель. То бишь это как флешка в вашем компьютере. Вы, у вас у компьютера есть 1 ТБ памяти, и вы хотите добавить ещё что-то. Вы просто втыкаете флешку и оно работает. У вас появляется дополнительное место и какие-то дополнительные файлы. То же самое с моделью, с флаксом, с ламой и любой другой. Это что-то, что добавляется сверху и объясняет какую-то одну вещь. В данном случае у нас это флакс, и это человек, предмет, поза, стиль, ну и так далее. Простор для фантазий, в принципе, бескограничный. Вот. Ну, тут уже вы можете видеть, я уже и текст вам подготовил, но, в принципе, я всё рассказал, так что даже и не надо.
Объяснили, что такое Лора. Давайте мы с вами сейчас попробуем создать Лору на примере нашей прекрасной Кристины, королева Инстаграма. Она нам благородно скинула 50 фотографий. Я их, честно, до сих пор не смотрел. То есть у нас будет очень честный урок сейчас с вами, и мы будем делать с нуля на персонажа. Вот. И первым делом нам нужно как бы собрать датасет. Что такое датасет? Это калита фотографий, которые у вас есть, будь то предмет, человек или стиль. Ну, в общем, фотографии того, что вы хотите. Чем больше, тем лучше. Сейчас объясню, почему. Потому что нам нужно, э, отобрать наиболее лучшие варианты. Если у вас 100 фотографий, и в итоге у вас будет их 25, но при этом эти будут 25 просто идеальных фотографий, которые лучше всего подойдут для нашего с вами для нашей с вами цели, для нашего урока. Соответственно, лучше иметь больше фотографий и ужать их максимально плотно, чем иметь много фотографий, но м они вот все вот такие будут. Вот. Ну, давайте приступим, будем смотреть на фотографии нашей Кристины. Я буду смотреть фотографию и говорить про каждую фотографию, подходит она или нет, и объяснять параллельно. Вот, давайте приступим. А, наша прекрасная Кристина стоит в зеркале и смотрит. А первая вещь, которую сразу замечаю - это фотография в зеркале. Фотографии в зеркале не являются чем-то плохим для создания лоры, но если их в файле, в вашем датасете становится больше нескольких штук, могут с этим быть проблемы, потому что Лора, она запомнит вот этут позу, концепт того, что человек стоит с чем-то со смартфоном и позирует в зеркале. Поэтому с этим надо быть осторожным. То есть в общем и целом это неплохо, и этим можно пользоваться, но главное не делать этого больше. Чем меньше у вас в итоге фотографий, тем сильнее становится сила. каждой фотографии. Соответственно, если у вас 20 фотографий и две или три из них с в зеркале, это нехорошо. Оставьте одну, и будет хорошо. Давайте пойдём следующую. Здесь она свисает с машины. Здесь нет ничего страшного. Всё хорошо. Мы эту фотографию возьмём с вами. Вот. А здесь просто селфи. Ну, нормальное селфи. Ничего не сказать. Здесь тоже фотография в зеркале. А, посмотрим, если у нас будет больше фотографий в зеркале, мы возьмём. Если нет, не возьмём. Но тоже хорошая фотография. Самое главное всегда это смотреть, чтобы было хорошее лицо на этой фотографии. Если оно какое-то плохое или отличается, ну тогда не стоит брать эти фотографии. Идём дальше. Здесь она на фоне ночного города. И здесь, скорее всего, мы эту фотографию не возьмём. Мы её откинем просто потому, что её лицо находится у нас в тени. А здесь очень сложный пейзаж, и сам человек не выделен на фоне. Лора модель может запутаться, и она может не понять, что от неё хотят, и она может натренировать себе лишнего. Поэтому мы откажемся от этой фотографии. Здесь вот хороший пример. Эта фотография отличная от той фотографии, которая была у нас а до этого, но а модель её, скорее всего, восприметчно так же. Почему так происходит? Потому что во время обучения создаётся промт по фотографии. То есть модель, грубо говоря, фотографирует глазами то, что происходит, то, что она видит, и пишет поэтому промпт. И, соответственно, что на предыдущей фотографии, что на этой фотографии, будет примерно одинаковый промпт. Девушка стоит на фоне ночного пейзажа. Вот эти фотографии очень похожи между собой. Они, конечно же, разные, но из-за этого может получиться так, что одна и та же фотография у вас во время тренировки будет проходить дважды, потому что для модели, потому что у неё есть промт, это будет происходить как будто бы один раз. Поэтому мы не хотим создавать таких а сложностей для обучения и мы не берём вот по подобного примера фотографий. В дальнейшем тоже будут отка буду отказываться от таких вот дупликатов. Это плохая практика, так делать нам не стоит. Идём следующее. Ну, здесь, ну, эту фотографию мы берём. Здесь даже сказал взять нечего. Это хорошая фотография. Улыбается, стоит на снегу, простенький пейзаж. Если сейчас следующая будет точно такая же, мы её не возьмём. А нет, мы эту тоже возьмём, потому что, ну, тоже хорошая фотография. Хотя меня терзают смутные сомнения насчёт её головного убора. Всё-таки оно закрывает достаточную часть лица. Может быть, её можно чуть-чуть подредактировать, но этим мы сегодня заниматься не будем. Если честно, немножко лениво. Вот. Но всегда можно её немножко обрезать и, например, сделать вот так. И будет хорошо. Пойдём следующий. Ну, здесь тоже неплохая фотография, её можно взять. И вот эту фотографию тоже не стоит брать, просто потому что Кристина у нас очень-очень маленькая на счё на фоне а всего остального пейзажа. Если мы хотим взять эту фотографию, нам надо сделать что-то такое, то есть её как-то подрезать, и тогда будет хорошо. Но опять-таки здесь меня смущает одна вещь - это её ноги. Это снято на камеру телефона. У телефонов есть тенденция, что у них широкий объектив и по краям они портят геометрию. Это не очень хорошо, когда дело касается человека, правильных пропорций и так далее. Если это какая-то творческая цель, то да, тогда да, конечно. Но если вы хотите не получить неправильную пропорцию тела, лица и так далее, избегайте фотографии на широкоугольные объективы. Они дают ощутимые искажения. А здесь фотография. А, хорошая фотография, но меня терзают смутные сомнения насчёт того, что будем ли мы её брать или нет, потому что если вы посмотрите на монитор, она очень маленькая. Э, давайте мы сейчас с вами убедимся, мы начнём свойства у этого кадра. И, а, наши свойства нам говорят, что 284 на 284. Мы эту фотографию не берём, она очень маленькая. Вот. А здесь, да, классная фотография. А мы её возьмём обязательно, потому что тут чёрный фон, ничего нету, ничего не мешает. Она сидит, показывает палец вверх. Меросеть это, в принципе, скушает и даже не обидится. А давайте пойдём. Ту-ту-ту-ту-ту. Уже тут много пролистали. Здесь просто хороший селфик. Он идёт, хорошо показывает. Мы её берём и даже не смущаемся. И здесь тоже самое. Хороший селфик, другой фон, другой ракурс. А, поэтому эту фотографию мы обязательно с вами возьмём. А здесь то же самое. Неплохой селфик, другой ракурс, другой другая одежда, другое всё. Нейросеть это хорошо поймёт и тоже будет хорошая фотография для тренировки. Нейросети. Важно, чтобы даже если у вас там селфи или какие-то очень похожие фотографии с вашим лицом, где у вас, ну, примерно одно и то же выражение лица, чтобы основной элемент, который был идентичен на всех фотографиях - это были вы, ваше лицо. То есть другая одежда, другоя локация, другой фон, может быть, там пасмурно, солнечно-кирпичная стена на фоне или там просто обои. Но главное, чтобы на всех фотографиях максимально главный объект был - это вы, не какая-то красная одежда и так далее. То есть надо вот, чтобы именно были вы главным объектом. Вот. Пойдём к следующей фотографии. Это тоже хорошая фотография, достаточно простая. Простой фон. А лицо видно. Будем брать. А вот эту мы уже не возьмём, потому что что, как я говорил ранее, эта фотография сделана в одной и той же локации, примерно в одной и той же позе. То есть мы можем взять одну из этих двух фотографий, но не обязательно две, точнее, даже вообще никак две. То есть их нельзя брать. А следующая фотография, мы её тоже не возьмём, она слишком тёмная, она не подойдёт, может создать проблем, а мы не хотим проблем, поэтому мы откажемся от этого. Вот. А тут фотография. Ну она как-то смазанная, лицо непонятно, не видно. Скорее всего, мы её тоже не возьмём. Ну что ж поделать. Здесь тоже эту фотографию я бы не стал брать, просто потому что она в общем не человек не выделяется на фоне пейзажа. Могут быть проблемы с этим. Либо тут, опять-таки надо подрезать, либо, ну, я не знаю, что надо тут сделать. Вот следующее. Здесь тоже можно взять. Тут хоть и темно, но при этом а фон достаточно простой. Человек здесь виден и он весь в белом. Это тоже очень хорошо. Ну, здесь мы тоже возьмём фотографию. Это просто селфик на фоне чего-то. Этого фона у нас не было. Он у нас не повторялся, соответственно, мы Ну, почему бы и нет? А эту фотографию тоже можно взять, но меня здесь смущает одна вещь, что здесь нету кожи человека. Здесь есть как бы свет розовый. И если таких фотографий у вас будет много, могут опять-таки начаться проблемы. Здесь мы будем аккуратничать. Если нам надо будет какая-то дополнительная фотография, мы её обязательно возьмём. Если нет, мы её брать не будем. И здесь опять-таки то же самое. Мы не будем брать эту фотографию, потому что она точно такая же на одном и том же фоне. В общем, всё, что я говорил, не знаю, минуту назад. Вот. А здесь вообще идеальная фотография. Просто Кристина на белом фоне. Ну, перфект. И здесь тоже мы не возьмём эту фотографию. Слишком большой пейзаж, слишком маленький человек. Опять-таки он внизу кадра где-то. это будет плохо видно. И лучше это просто не брать, а не брать, потому что лучше мы не возьмём что-то, что может у нас вызвать какие-то подозрения, чем мы возьмём что-то, и оно потом надо ставит каких-то хлопот. А если честно, даже мне нечего сказать. Ну просто фотография, фотография. Но у Кристины здесь закрыты глаза, поэтому её мы брать не будем. Глаза закрыты. Ну зачем нам тренировать Лору на лице с закрытыми глазами? Это звучит как-то немножко странно. Вот. А так фотография хорошая. Были бы открыты глаза, будет хорошо. Если следующая будет с открытыми, мы её обязательно возьмём. А, нет, мы её не возьмём. Тут уже она слишком далеко отошла на пару шагов от кадра, поэтому нет, мы не возьмём эти зимние фотографии. Хотя фотки класс. А здесь, ну, можно взять как бы в полный рост человек. Нету вот этого сильного искривления. Нога, в принципе, ровно стоит. То есть пропорции никуда не поплывут, мы не можем, нету никаких рисков. В принципе, эту фотографию можно взять и для того, чтобы обучить Лору вообще тому, чтобы она понимала, как Кристина выглядит не только лицом, но и как бы телом. Тоже неплохое подспорье. У нас это хорошая фотография, мы её обязательно возьмём, потому что тут и лицо хорошо, и фон какой-то разнообразный, и одежда другая от тех, которые уже были похожие до этого на природе. Поэтому эту фотографию мы возьмём в наше обучение. И эту фотографию мы возьмём в наше обучение. Здесь видно человека, лицо. В принципе, всё идёт хорошо. А вот эту мы не возьмём. Она снята снизу вверх, опять-таки, на телефон. Хотя фотография хорошая, казалось бы, ничего не предвещало беды. Но моя чуйка мне подсказывает и опыт, что эта фотография может стать камнем преткновения и у нас может здесь не пойти и поплывут определённые пропорции, как и в целом то, что вот так такого рода фотографий лучше не брать много. То есть можно взять одну-две, если надо там докинуть, но не стоит их брать. То есть лучше взять одну какую-то вот ровную, где даже если человек немножко издали, то он получится хорошо. Это хорошая фотография. А я бы её чуть-чуть обрезал, чтобы она у нас пошла более близким форматом, да? То есть не страшно, что там какой-то пропорции немного другие будут, но здесь как бы слишком много воздуха сверху. Это не очень хорошо для модели. Она будет учить сакуру, а не как бы лицо нашей Кристины. Но фотография хорошая. И здесь то же самое. Ну вот мне придётся выбирать какую-то из двух. Я, скорее всего, выберу именно вот эту фотографию. А просто потому что здесь лицо как бы oneфа, не в профиль, а на лицах Oneфа как был тренируется гораздо лучше. А здесь я не возьму эту фотографию, потому что она опять-таки на широкоугольный объектив. Поплывёт определённая перспектива. И Кристину, во-первых, закты глаза. Плюс она тут стоит почти 3/4. Это не есть хорошо для обучения Лоры. Плюс она ночная. У нас и так уже достаточно фотографий, которые уже в темноте. Вот. А это хорошая фотография, мы её возьмём. Человек виден хорошо, почему бы и нет. Ага. Так, эту мы возьмём, но это профессиональная фотография. Тут как бы вообще слова нет. К слову о профессиональных фотографиях хотелось бы сказать. Очень многие грузят фотографии с одной какой-то съёмки и э получают неудовлетворимый результат. Почему так происходит? Это происходит как раз-таки потому, что загружаются фотографии, которые по своей сути очень похожи друг на друга для нейросети. Мы-то видим, что они разные, но нейросеть их воспринимает примерно одинаково, потому что на профессиональной съёмке вы, скорее всего, делаете это в студии в каких-то двух-трёх разных углах и не более. Но у вас получается каким-то образом 30 фотографий в одинаковой одежде, в одинаковом месте и в одинаковой локации. Нейросеть, к сожалению, не может описать такие подробные детали разности пост, там, как у вас волосы лежат или просто эмоцию. Соответственно, Неросеть это пишет более просто, и для неё это вот вы там в красном платье на фоне студии и вот там у вас 10 фотографий. И вот эти все 10 фотографий у вас будут примерно с одинаковым промтом описанный нейросетью. Это нехорошо. Так делать нам не стоит. Опять-таки фотографии студии, в них нет ничего плохого, но есть плохо то, что вы загружаете очень много почти одинаковых фотографий. Так делать нельзя. 1Дтри, это супер, если у вас есть множество фотографий из студии, из разных студий, это тоже очень классно, если вы можете сделать Лору полностью из своих профессиональных фотографий, это вообще супер превосходно. Но всегда обращайте внимание на вашу одежду, на фон и позы и лицо. Ну, в принципе, всё, что я до этого говорил, тоже применимо, но просто качество фотографий будет в разы лучше. И это прекрасно. И эту фотографию мы тоже возьмём. Хорошее, это хорошее настроение. Надеюсь, она пьёт что-то безалкогольное. В принципе, супер. Или вот эту возьмём. Я уже, если честно, не знаю. В принципе, над подобной фотографией нейросеть, а, даже, скорее всего, напишет что-то разное, потому что, если мы посмотрим предыдущую, у неё рубашечка голубая, здесь она уже, как бы, ей хорошо, она сняла эту рубашку, и у неё чёрный топик остался. Но, наверное, вот эту просто потому что здесь лицо лучше видно и она улыбается. И эту фотографию возьмём. Селфик такой монументальный. Ну почему нет? И ещё в очках, как бы модель разнообразит свою тренировку. Кристина любит пить всякое и фотографироваться. Тут она пьёт колу. И эту фотографию тоже, в принципе, можно взять. Но опять-таки, если мы возьмём слишком много фотографий, где она пьёт что-то держит в руках и что-то из этого пьёт, э вы можете получиться на лоре, что вы просто что-то пьёте и ничего более. Поэтому давайте выбирать аккуратно. И, скорее всего, я просто заверну эту фотографию. Просто потому что у нас уже есть какая-то похожая фотография, где она держит уже бокал. Но нейросети немножко всё равно, что там кола, бокал или что-то такое. Поэтому лучше, наверное, будем избегать вот подобного уже раз мы уже выбрали одну фотографию до этого. И это тоже неплохой селфик. Мы его обязательно тоже возьмём. Он как бы достаточно тёмный, но при этом не тёмный, то есть фон другой. И в принципе, да, эту фотографию мы точно возьмём. И эту фотографию тоже возьмём. А, а почему нет? Hello Kitty я люблю. Вот. Да, и сама Кристина здесь тоже по-другому выглядит, по-другому. Это, то есть, это неплохой материал для того, чтобы взять эту фотографию для обучения трениров Лоры. И эту фотографию вот тоже мы можем взять. Тут всё другое, всё по-разному. Видно хорошо лицо. Почему бы и нет? Эту фотографию мы не возьмём. Тут она изображена немного загагулена, так, для нейросети. Поэтому для избежания дополнительных каких-то рисков мы откажемся от именно вот этой фотографии. Просто потому что поза для нейросети может быть странной. Мы тренируем не позу всё-таки, а лицо человека. И эту фотографию тоже я заверну, просто потому что человек слишком маленький, то есть можно как бы обрезать, если у вас совсем нету фотографии, да? То есть вот так сделать и будет хорошо. Но у нас уже, по-моему, добралось достаточно фотографий, просто поэтому мы не будем брать всё, что там более-менее может подойти. У нас всего 50 фотографий, хочу напомнить. Эту фотографию тоже не возьмём. Здесь закрыты глаза. Опять-таки поза немного странная для нейросети. Нейросеть может не понять эту фотографию, и могут возникнуть проблемы. Мы этого не хотим. Здесь тоже а можно взять эту фотографию, но я бы её тоже, конечно, обрезал. Но опять-таки она держит волосы, это сложный элемент. И вообще, руки - это камень прикновения для множества ниросетевых моделей. И буквально недавно научились делать более-менее и то, не без ошибок. Поэтому, если вам очень хочется, мы можем взять, конечно, эту фотографию. Но так как нам не сильно хочется, нам не сильно надо, мы, а, возьмём всё-таки другие какие-нибудь фотографии. Вот, давайте тыкнем здесь. И вот эту фотографию можно взять. Даже можно чуть-чуть её обрезать. Она у нас получится. Ну вот как-то так. Прекрасная фотография. Хорошо видно лицо. даже какой-то мейкап. Если у вас есть фотографии с разными мейкапами, это тоже, в принципе, нормально. Но тогда не бойтесь, что Лора вас будет учить и рисовать потом всё время с мейкапом, потому что это буквально то, на чём вы её научили. Если у вас одна, две-три фотографии из множества других разных фотографий, это неплохо. Лора понимает, что ага, тут, в принципе, можно и нарисовать мейкап, поэтому это не является чем-то плохим. И здесь то же самая фотография. Здесь, в принципе, они почти одинаковые, поэтому, в принципе, разницы никакой нет. Можно выбирать по настроению или эту, или эту. Но опять-таки главное, они очень похожи. Соответственно, лучше нам взять какую-то одну. Нам надо выбрать, но не переусердце. Вот. И мы отобрали фотографии. А я удалил лишнее по памяти. Что-то может быть я удалил ещё раз. Всегда проверяйте. Вообще мой совет - это 5 минут подождать, 10, пойти там чай попить и вернуться со свежим взглядом, потому что за время, когда вы отсматриваете и проверяете фотографии, у вас взгляд замыливается. Вот я сейчас обратил внимание, что я одну фотографию таки упустил, и она у меня получилась. Ну, она пошла сразу же в корзину. Зачем она нам здесь? Вот. А сейчас мы за кадром, скорее всего, просто подрежем некоторые фотографии, чтобы вот, например, вот эту, чтобы человек был больше виден. А насчёт вот просто кропнуть, то есть не обязательно там сильно кропать, чтобы только лицо, но когда у вас очень много где-то воздуха, вот давайте, есть у нас пример один хороший, вот этот вот здесь очень много воздуха, очень много деревья на фоне. Вот оно нам не надо, нам надо вот э так, то есть вот так и всё. И хорошо. И вот будет хорошо. То есть нам не надо воздуха сосредо старайтесь, чтобы главный объект в кадре всегда это был человек, а не какое-то дерево. и будет всё супер. Я это сделаю, когда будем загружать фотографии в Telegram или нет, не знаю. Ну, в общем, учтите это, когда вы загружаете свои собственные фотографии. Вот. Теперь
хочется перейти к суммаризировать все полученные знания и переданные знания, и, соответственно, покажем вам второй слайд из нашей презентации маленькой. Вот. А как работает эта ваша тренировка? Ну, загружается с фотографии. По этой фотографии создаётся впромт. То есть модель, она как бы глазами фотографирует и говорит, что происходит. Вот ваши фото потом запоминаются а процессом. Они запоминаются какое-то количество раз на одну фотографию. То есть, допустим, у нас 10 фотографий и, а, 1.000 шагов, то это будет 100 шагов на каждую фотографию, то бишь тотальные шаги делятся на ваше количество фотографий. И так получается вот этот параметр, э, шаги на фотографию. Вот. И здесь у нас есть памятка, что важно не допускать дупликатов фотографий, отталкиваясь именно с точки зрения вот этого процесса построения промта. Э нам может казаться, и мы видим, что это всё-таки разные фотографии, но и нейросеть не такая умная и продвинутая, как мы пока что, слава богу. И, соответственно, она будет писать, а, примерно одинаковые вещи даже вот на такие фотографии. Здесь у нас есть хороший пример, а, тоже с нашей прекрасной Кристиной. А у неё есть, как бы, это две разные фотографии, как мы можем видеть, но нейросеть их воспримет, что женщина стоит на деревянном полу рядом с деревом. Это как бы хороший прот, нормально, но проблема в том, что он у неё повторяется два раза на две фотографии. Соответственно, это всё превращается в одну, и сила одной фотографии у вас получится больше, чем нужно. Надо, чтобы всё-таки в процессе вот этого обучения и построения промтаное, что у нас было одинаковое - это woman или man или какой-либо ваш там предмет. А, но вот это главная заповедь. То есть всегда должно быть что-то одно, что вот располняется. Всё остальное должно быть максимально разнообразным. Это ключевое вообще для успешной Лоры. Вот. А, ну что ж, пойдём тренировать.
Вот мы и оказались в нашем прекрасном Telegram-боте Synx. А, и давайте приступать. Первым делом, что мы делаем, это обязательно, конечно же, заходим в раздел с тренировкой design и FLX. И у нас есть обучить Flx One, создать Lora. Именно туда нам и надо. Здесь у нас открывается с вами всплывающее окно. Здесь мы выбираем, а версия обучения новая, потому что это же она лучше. А она у нас получилась немножко капризной в плане к качеству фотографий, но при этом позволяет добываться максимально качественных результатов за максимально малое количество времени. А это хорошо. Мы её очень сильно оптимизировали. Я её очень много оптимизировал, потратил много бессонных ночей. И, если честно, даже немножко горжусь тем, что у нас получается. И самое главное, у нас нету никаких проблем, когда мы совмещаем, например, стиль со стилем. Вот. Ну и давайте начинать заполнять нашу лору. У нас есть название, мы её пишем, а, Кристина, потому что, ну, очевидно, что мы взяли Кристинину фотографии. Мы делаем Лору для Кристины. Она, кстати, по-моему, будет очень-очень рада. Она меня очень просила давно сделать ей Лору. Вот именно от меня. Вот. А, и назначение для персонажей. установить шаги для обучения самостоятельно. Мы сейчас это с вами обсудим. И давайте мы выберем с вами файлы, которые мы загрузим в наш Telegram, чтобы уже, наконец-то, начать процесс тренировки. Вот мы нашли нашу папку и выбираем все наши фотографии. Давайте сейчас я сделаю, чтобы это было максимально быстро и удобно. Мы взяли вот так. Вот так и нажали открыть. И всё. Проверяем. То есть на данный момент мы выбрали 21 фотографию для обучения. Этого более чем достаточно. Ещё раз перепроверяем. То есть семь раз отмерь, один раз отрежь. В нашем случае это вот хорошая практика. И проверяем фотографии, которые загрузились. Хорошая, хорошая, хорошая. Ну и в целом, да. Вот. Ну а теперь давайте, а обсудим с вами установить шаги самостоятельно, только для профессионалов. Так как я являюсь самым главным профессионалом всех самых главных профессионалов, я могу об этом авторитетно заявлять. Вот. А, ну что ж, а у нас стоит автоматическая система, которая определяет количество шагов от количества фотографии. А, но существуют ситуации, в которых иногда лучше немножко не доделать лору или передержать лору. В каких случаях, как, что использовать, это происходит исключительно по наитию, по опыту и так далее. Я, если честно, уже даже не думаю, что, э, у меня есть достаточно экспертиза. По-моему, у нас есть люди в пользователи, которые делают лоры, ну, просто идеально. И вот мне очень интересно послушать их опыт, в том числе. Но давайте от меня какие-то главные рекомендации, что мы делаем чуть-чуть больше шагов, чем предлагает нам система. Исключительно лишь в том случае, если у вас а много-много фотографий, которые максимально разнообразны. Вы можете поиграться с этим параметром только лишь для того, что, э, чтобы достичь супедеального результата. То есть система, понятно, что она работает, автоматика никогда не будет работать лучше, чем человек. И для такого нам лучше увеличить количество шагов, чтобы вот, ну, идеально было. Но опять-таки, если вы делаете одну лору и вы хотите сделать её хорошо, я рекомендую вам не лезть в этот параметр вообще никогда. Вот. А в случае, если у вас мало фотографий и у вас есть сомнение, что некоторые фотографии могут быть похожи и неправильно поняты системой, я рекомендую вам чуть-чуть, совсем чуть-чуть. То есть вот, например, сейчас он нам посоветовал 840, и если у нас там 10-15 фотографий, я бы вам посоветовал вот там 540 он предлагает, ну вот сделать 520, 500, ну, максимум. То есть не убирать там сотнями шаги, а в районе нескольких десятков. Просто потому, что чем меньше фотография, тем становится сильнее влияние каждой фотографии на за вот этот тренировочный проход. Ну и давайте приступать. Нажмём заветную кнопку начать обучение. Всё. Мы получим уведомление, как только наша Лора будет завершена. Идём пить чай. Так, вот нам пришло
уведомление, что закончили тренировку. Лора готова. Но перед этим хочется всё-таки обратить внимание на одну вещь, которую мы поговорим. Это слайд у нас называется "Почему я китаец". И здесь важно обратить внимание на примере с нашим Павлом, что мы загрузили 25 фотографий и в руками выбрали 1.000 1.500 шагов и сохраняли каждые 50 шагов Лору. Это я делал в рамках экспериментов и вообще, когда мы всё это прорабатывали. И здесь мы можем увидеть, что 100 шагов у нас азиат. 250 уже больше похож на нашего Пашу. 500 шагов у нас уже прямо наш Паша. 1.000 шагов - это уже что-то дальше. И у нас тоже уходит дальше от нужного значения. Что влияет на эту вещь? Влияет на это две вещи. Это опять-таки количество шагов, выбранное во время тренировки. Вы, скорее всего, не сможе вам система никогда не предложит на 25 фотографий сделать 1.00 шагов. Это мы сделали руками, а, специально как бы экстраполировали и вот сделали неправильно. А что на это влияет? На это влияют две вещи. А, во-первых, когда мы улыбаемся, мм, у нас, э, мышцы сокращаются, глаза становятся чуть-чуть поуже. И если вы загрузите туда очень-очень много фотографий, где вы улыбаетесь, причём, ну, хорошо улыбаетесь, широко улыбаетесь, а наш Паша очень любит улыбаться даже на фотографиях, а может получиться так, что нейросеть запомнит вас именно таким улыбающимся, и вам даже будет не только тяжело как бы убрать азиатский фейс, но ещё и улыбку. Вот. И также на это влияют, конечно же, параметры тренировки. Количество шагов это тоже влияет. Чем больше шагов, чем сильнее запоминает модель и тем сильнее влияние лоры на основ основную модель флакс у нас происходит. Вот поэтому очень хотелось обратить внимание на этот нюанс. Всё, с этим покончено. Давайте приступать к
тестированию. А здесь мы с вами пойдём назад. Флакс зайдём. А так где у нас настройки? А вот настройки модели. Выбираем FL Opt. А количество одновременной генерации? Давайте мы выберем три сид мы выберем специально сейчас случайный. Соотношение сторон давайте мы выберем 3 на Нет, 2 натри. А креативность мы оставим как есть. Шаги мы повысим на 28. И мы добавим нашу прекрасную Лору, которая вот наша Кристина. Давайте я начну сейчас с силы Лоры один, потому что вот мне так хочется. А лучше мы сейчас увидим результат с силой Лоры один, и потом мы можем, если надо, увеличить эту силу и или если надо, мы можем её чуть-чуть ухудшить. А в любом случае всегда лучше усиливать сигнал, чем его принижать. То есть всегда постарайтесь начинать проверку с силы Лоры 1. Ээ и теперь приступим к проверке модели. Что я подразумеваю под этим? Нам надо сейчас генерировать несколько фотографий с одинаковым промтом, но они должны быть разнообразными. И сейчас мы проверим, справилась ли наша Лора с поставленной ей задачей. И мы пишем, а так у нас не русский выбран. Женщина в клетчатой рубашке и нажимаем отправить. Сейчас модель должна справиться с поставленной ей задачей нарисовать Кристину три раза в максимально разнообразных параметрах. Вот давайте смотреть, справились ли мы с этим или нет. А хочу также обратить внимание, что мы всегда пишем женщина, не девушка, ничего такого, потому что наша аа нейрона сеть и так как мы пишем на русском, она всё-таки переводится. И переводчик иногда воспринимает девушку как girlл. И если мы напишем girlл, неросеть этого может воспринять как кто-то, кто сильно помладше, потому что, ну, в английском языке сложно подобрать слово девушки. Вот. Ну, нету, есть либо girl, либо woman. А поэтому мы всегда пишем на русском woman. Вот. И давайте проверять. А, получилось похоже. По-моему, вышло неплохо и хорошо. И здесь, смотрите, мы проверяем. То есть мы сделали сейчас три абсолютно одинаковые генерации, с которыми у нас получилось максимально разнообразно. То есть первая, она у нас где-то стоит в офисе, в одной клетчатой рубашке. Здесь она стоит на фоне белой стены и она тоже в клетчатой рубашке. И здесь она тоже стоит на фоне пустыни и в клетчатой рубашке. Соответственно, что мы можем из этого вынести? Какие у нас итоги? что модель у нас достаточно гибкая. Она не делает примерно похожие ситуации, она не воспринила, что там мы делаем селфи или делаем это селфи в зеркало. Соответственно, она проявляет какую-то гибкость. То есть у неё есть креативность в зависимости от седа. То есть у нас на один и тот же промт три раза выдало абсолютно разный результат. Это хорошо. Это то, к чему мы стремимся.
Теперь давайте мы с вами проверим на каком-то более изощрённом и тяжёлом промте. Я зайду сейчас на самый главный сайт по нейросетям. Это Civit AI. Здесь есть у нас какие-то модели, которые у нас есть, внешние, у нас есть какие-то сторонние и так далее. Вот у нас есть какая-то красивая фотография. И у нас уже сразу же есть здесь а промт. Я не буду его сильно изучать, париться и так далее. Просто посмотрим, получится ли у нас получить нечто похожее с Лорой нашей прекрасной Кристины. И давайте мы сейчас это вобьём. Ну, я вот здесь вижу только что вот какой-то тег у нас есть лоры, мы в этом можем спокойно убрать. Огромный промт. Не разбираюсь, ничего не пробую. Вот всё как есть, прям наживую. Вот ждём генерацию. Пошла у нас генерация. А здесь, скорее всего, в промте у нас указано, что, да, чёрные волосы, красный маг, а какой-то мейкап. То есть всегда смотрите на пром плане, э, на соответствие, потому что если в промте написано, что у девушки там каре чёрная, то он сделает каре. Это качество хорошей лоры, что она воспринимает и позволяет трансформировать. Если у вас человек, даже несмотря на промпт, лезет а обычной внешности, то это не будет очень хорошо. Вот также здесь мы хотим обратить внимание, здесь околоазиатская внешность выбрана. Вот, то есть, что здесь запрос. И у нас получился вот такой результат с Лорой нашей Кристины. Вот. По-моему, вышло очень неплохо. Давайте проверим и убедимся, что это, ну, не просто удачное совпадение. И давайте остановимся на вот этой фотографии. Но мы тут, конечно, немножко поменяем промт, потому что он тут всё-таки не очень подходит нашей Кристине. Вот здесь мы видим Бастиure Woman. У нас Кристина ни в коем случае не Басти и ни в коем случае чер, а Young. Всё, посмотрели промт. Давайте ещё раз прогоним какой-то другой промпт. Здесь уже у нас нет никаких тегов, ничего. Просто какой-то околореалистичный промт, который у нас соответствует. Вот. Ждём генерации изображения. Первое у нас пошло. Кристина наша осталась, хотя промт, конечно же, её переобразовал. То есть она вообще у нас не капельки, не блонда, а Флакс у нас её сделал блондой. Вот она немножко стала постарше, потому что, скорее всего, в промте это тоже указано, но Да, вот, ну, как бы получается, работает. Ну, а теперь давайте мы добавим ещё одну лору вместе к нашей уже существующей лоры модели. Для этого мы снова пойдём на CVTI. И я люблю такого художника, иллюстратора, цифрового художника, как Сэм Янг. И мы сейчас а пойдём искать его лору, а на опять-таки небезызвестный сайт CVIT AI. Мы выбираем Flx 1D, Flx 1s ищем его. Ага, тут у нас какая-то есть одна, но это не та, которую я хотел. Давайте посмотрим его по его творческому псевдониму. Сэм его. И вот он. А некто пользователь суджиков сделал. Я её уже, честно признаюсь, трогал до этого. Мне она очень понравилась. И как мы добавляем лору? Мы жмём, а, по кнопке, правой кнопкой мыши. И здесь мы жмём скопировать ссылку. Потом мы заходим в наш Telegramбот в настройки модели и мотаем в самый низ. И у нас есть выбор до трёх лора. И жмём добавить lлор. Здесь у нас есть выбор лоры, и мы выбираем внешнюю по URL. И здесь мы вставляем эту l. Важно, чтобы это было ссылка на скачивание модели в safe tenser. Это важно, иначе у вас лора просто не загрузится. И давайте мы здесь тоже сделаем силу лоры один или даже вот 09. Мы попробуем. Мы хотим всё-таки сохранить черты лица человека и добавить к нему стиль. Сохранить и вернуться. Вот. И давайте выберем какой-то промт просто из карточки моделей, чтобы, ну, вот убедиться, что она работает. А, оп. Вот надо кого-то выбрать, кто похож на нашу Кристину. Вот. Да. Нет, мне не нравится. Не люблю мотоциклы. Вот, давайте с котиком. Котиков мы любим. И тут ещё есть текст Хатолик. Давайте проверим и убедимся, что у нас ложа действительно работает и сможет даже отобразить текст на рубашке. Вставляем промт и просим сгенерировать нам опять-таки три разных генерации. И, пожалуйста, мы сделали нашу Кристину в стиле Sam does Arts, Сэма Янга, цифрового художника. А вот все три кадра, которые сделала нам Лора. Если мы посмотрим, то с текстом она, к сожалению, не справилась. Надо немножко поднастроить модель, убавить или, может быть, добавить немножко силу Лоры. Но при этом наша Кристина получилась хорошо, и мы действительно можем видеть, что это, ну, наша Кристина всё-таки это она в стиле с лоры. Так, таким образом вы можете комбинировать несколько ЛОР одновременно. Ну вот и всё. Наш урок
подошёл к концу. По итогу мы сделали прекрасную лору нашей прекрасной Кристины. Надеюсь, это было для вас полезно и вы узнали для себя что-то новенькое. Если у вас есть вопросы, обязательно задавайте их в комментариях. И надеюсь, мы будем видеться с вами почаще. Всем пока и удачных генераций.