Здесь собраны модели классического ML, реализованные на Python с использованием библиотек NumPy и pandas.
Цель данного проекта — не наибольшая алгоритмическая эффективность, но отработка и закрепление знаний c помощью аккуратной реализации основного функционала моделей. Рассмотрены задачи регрессии, бинарной классификации, снижения размерности и кластеризации данных.
Модели определены в виде классов Python и хранятся в файлах model_name.py.
Список моделей:
- Кластеризация:
- Метод K-средних
- Иерархическая агломеративная кластеризация
- DBSCAN
- Снижение размерности:
- PCA
- Ансамбли моделей:
- Бэггинг
- Случайный лес
- Градиентный бустинг на деревьях
- Базовые модели для задач бинарной классификации и регрессии:
- Линейная / Логистическая регрессия
- KNN
- Дерево решений