Участникам хакатона на основе методов искусственного интеллекта, а также считая метрикой качества построенной модели MAE (mean absolute error), предстоит предсказать уровень заражения вирусом в условиях пандемии на примере COVID-19 в городах России.
Вирус COVID-19 начал распространяться внутри России в 2020 году. Вирусы подобного типа по словам ученых рискуют стать частыми из-за глобального распространения авиации и других быстрых способов перемещения людей по планете. Для наиболее полного анализа распространения вируса правильно рассмотреть случаи заражения по каждому отдельному городу. Необходимо предсказать уровень заражения вирусом в городах, считая метрикой качества построенной модели MAE (mean absolute error).
Разработанное участниками решение поможет решить проблему распространения вируса COVID-19 и подобных типов вирусов, последствиями которых в некоторых случаях является смерть пациента, своевременно выявить случаи заражения, которые будут способствовать сокращению смертности зараженных людей, снижению нагрузки на систему здравоохранения и уменьшению расходов государства на лечение тяжелобольных пациентов. Кроме того, выявление случаев заражения вирусом на раннем этапе повысит психическое и физическое состояние общества в долгосрочном периоде.
Решение:
Решается задача предсказания частоты заражения коронавирусом в городах России.
Произведён отбор признаков: зависимые исключены на основании анализа матрицы корреляций Спирмена, важные оставлены с учётом анализа научных статей, в частности,
- Environmental factors influencing the transmission of the coronavirus 2019: a review. Environmental Chemistry Letters, 2022.
- Important factors affecting COVID-19 transmission and fatality in metropolises. Public Health, 2021. Основой решения является алгоритм CatBoost, который показал наилучший результат по сравнению с другими алгоритмами.
Для удобства использования модели предоставляется графический интерфейс, в который можно загрузить данные по конкретному городу, получить предсказание частоты заражения и сравнить её с другими городами.
Технические особенности:
Python, Scikit-learn, CatBoost, Keras, PyQt5, CSS.
Уникальность решения:
Отбор и генерация признаков, настройка модели под задачу, пользовательский интерфейс.