Парсер информации из https://docs.python.org/3/ и https://peps.python.org/
Python 3.9
beautifulsoup4 4.9
prettytable 2.1
requests-cache 1.0
-
Склонируйте репозиторий на локальную машину:
git clone [email protected]:Timik2t/bs4_parser_pep.git
-
Создайте и активируйте виртуальное окружение:
python -m venv venv
Активация окружения
# Windows source venv/Scripts/activate
# Linux source venv/bin/activate
-
Установите зависимости:
pip install -r requirements.txt
-
Смените директорию на src/
cd src/
-
Запустите файл main.py выбрав необходимый парсер и аргументы(приведены ниже)
python main.py [вариант парсера] [аргументы]
-
whats-new Парсер выводящий спсок изменений в python.
python main.py whats-new
-
latest_versions Парсер выводящий список версий python и ссылки на их документацию.
python main.py latest-versions
-
download Парсер скачивающий архив с документацией python в pdf формате.
python main.py download
-
pep Парсер выводящий список статусов документов PEP, количество документов в каждом статусе и общее количество.
python main.py pep [аргументы]
-
-h, --help Общая информация о командах.
python main.py -h
-
-c, --clear-cache Очистка кеша перед выполнением парсинга.
python main.py [вариант парсера] -c
-
-o {pretty,file}, --output {pretty,file} Дополнительные способы вывода данных pretty - выводит данные в таблице file - сохраняет информацию в формате csv в папке results/
python main.py [вариант парсера] -o file
-
При выводе информации в файл (-o file) он сохраняется в папке src/results/
-
Скачанная документация Python сохраняется в папке src/downloads/
-
Логи работы парсера расположены в папке src/logs/