Я сделал Telegram-бота, который «видит» фото для незрячих людей
1:20

Я сделал Telegram-бота, который «видит» фото для незрячих людей

Галера Морева 28.12.2025 1 029 просмотров 18 лайков

Machine-readable: Markdown · JSON API · Site index

Поделиться Telegram VK Бот
Транскрипт Скачать .md
Анализ с AI
Описание видео
Сделал экспериментальный Telegram-бот для незрячего друга. Бот принимает фотографию и детально описывает всё, что на ней происходит. Как это работает под капотом: — фото приходит в Telegram — конвертация и отправка на локальный сервер — модель Gemma 27B с поддержкой vision — подробное текстовое описание сцены, поз, объектов Все крутится локально на RTX 3090. Бот открыт для всех — есть бесплатные генерации. #нейросети #ai #telegramбот #computervision #rtx3090 #искусственныйинтеллект #доступность #assistivetech #localai

Оглавление (1 сегментов)

Segment 1 (00:00 - 01:00)

Я сделал бота для своего незрячего друга, который детально ему описывает содержимое на фотографии. У меня на канале даже есть видео, где я брал интервью у моего друга, слепого юриста, как он вообще живёт, не имея возможности видеть. И я решил в формате эксперимента ему сделать Telegramбота, куда он кидает фотографию и дальше под капотом нейросети распознаёт, что на эта фотографии находится и детально ему эту информацию всю описывает. Помогает мне в этом вопросе видеокарта RTX 3090, которую мы недавно купили на компанию, поставили сервер. И механизм работает примерно следующим образом. Значит, как только в Telegram бот приходит любая фотография, он получает эту фотографию, конвертирует в PS64 и дальше отправляет в Allлаama, которая находится у нас на сервере, которая обрабатывает всякие запросы по текстовым неро сетям. И дальше там запущена модель GEM 3 с 27 млрдми параметров, которые умеет как раз-таки видеть. То есть ей можно передавать фотографию, и она обычно понимает, что на эта фотография происходит. Дальше по заранее заготовленному промту просим её представить то, что она классный помощник, который интерпретирует информацию, которая пришла ему на фотографиях, пытается выявить, что на них происходит там с детализации, если там написан текст, то пиши текст. Если там человек в какой-то позе, то пиши позу. Ну на экране пром вы сейчас можете увидеть просто, чтобы было понимание, как это работает. Дальше уже Неросети даёт текст обратно в систему и этот текст переходит дальше в Telegram бота. Попробовать ботом может любой желающий. Я его выложил в паблик. В описании ссылка есть. Переходите, смотрите. Каждому человеку доступно три бесплатных генерации.

Другие видео автора — Галера Морева

Ctrl+V

Экстракт Знаний в Telegram

Экстракты и дистилляты из лучших YouTube-каналов — сразу после публикации.

Подписаться

Дайджест Экстрактов

Лучшие методички за неделю — каждый понедельник