Основная задача - обучение модели для трансформации изображений в стилизованные стикеры и добавление к ним анимаций.
-
Общий датасет объектов (Ссылка на Kaggle)
- Исходные изображения различных объектов без лиц.
- Пары изображений: оригинал и его стилизованная версия в виде стикера.
- Работа с датасетом велась в течение 1.5-2 месяцев.
- Превью небольшой части датасета
-
Датасет лиц
- Содержит пары изображений: фотографии лиц и соответствующие стикеры.
- Разработка и очистка датасета заняли около 2 недель.
- Превью небольшой части датасета
objects-data-collection/prompt-collecting-with-api.ipynb
- сбор промптов через API ChatGPT.objects-data-collection/prompt-collecting.ipynb
- сбор промптов через парсинг диалогов с ChatGPT.objects-data-collection/prompt-filtration.ipynb
- фильтрация промптов, удаление дубликатов.objects-data-collection/synthetic-dataset-generation.ipynb
- генерация датасета с использованием базы данных Firebase.objects-data-collection/calc_metrics.ipynb
- очистка датасета и расчет метрик.
faces-data-collection/generate-faces.ipynb
- генерация стикеров из фотографий лиц.faces-data-collection/drop-similar.ipynb
- удаление похожих фотографий лиц.faces-data-collection/faces-clean-notebook.ipynb
- очистка датасета и расчет метрик.
model-training/train_pix2pix.ipynb
- обучение модели pix2pix для трансформации лиц в стикеры.- Процесс дообучения стилей, интеграция существующих стилей в базовую модель.
utils/improved_inference.ipynb
- улучшения инференса модели.animations/animate.ipynb
- создание анимаций стикеров.
Попробуйте нашего бота в Telegram для демонстрации возможностей генерации стикеров: Telegram Bot