Проверяет состав продуктов, помогая следить за качеством питания и облегчая процесс соблюдения диеты.
Telegram-бот для распознавания входящих в продукт ингредиентов по фотографии состава с целью обнаружения нежелательных пищевых добавок*. Пользователь может составить собственный стоп-лист для контроля за употреблением определенных ингредиентов, например, по причине аллергии или соблюдения диеты. Бот проверит не только добавленный ингредиент, но и его производные ("молоко" -> "молочная", "молокосодержащий").
Над проектом работали: @Rushaniia Ishkulova, @Tatiana Maslennikova, @Alexandr Kozhevnikov.
*Перечень нежелательных пищевых добавок Е составлен по материалам Центра независимой экологической экспертизы "КЕДР", а также по данным INFO Минздрав.
-
- Парсинг составов продуктов с сайта магазина "Перекресток" с помощью библиотеки BeautifulSoup.
- Предобработка спарсенных данных для дальнейшего создания словаря, на основании которого генерировался текст в синтетическом датасете, а также позже осуществлялась корректировка распознанных слов.
- Создание синтетического датасета для обучения модели распознавания при помощи SynthText.
- Дообучение модели распознавания PaddleOCR на сгенерированном русскоязычном датасете.
- Для того, чтобы в дальнейшем распознанные слова можно было сравнить с личным стоп-листом пользователя и списком нежелательных пищевых добавок, воспользовались библиотекой нечеткого сравнения слов FuzzyWuzzy.
- Через библиотеку aiogram создали Telegram Bot.