Projeto de Atividade Complementar da Disciplina EAD: fundamentos e praticas - ECOMP - UEFS que tem como objetivo a construção de um Web Crawling. Ele possui scripts para extrair informações dos sites Kabum, Amazon e Magazine Luiza.
Para a devida construção e execução do projeto, é necessária a instalação dos seguintes recursos:
- Python 3.10+
- pip
-
beautifulsoup4
-
datetime
-
dnspython
-
gdown
-
os
-
pymongo
-
python-dotenv
-
requests
-
schedule
-
time
-
tweepy
As bibliotecas e suas dependências podem ser instaladas da seguinte maneira:
pip install -r requirements.txt
-
Instale os pré-requisitos
-
Clone o repositório
git clone https://github.com/LuisBaiano/Web-Crawler-e-Bot-com-Python.git
-
Instale as bibliotecas e suas dependências
-
Crie um arquivo .env igual ao .env.example preechido com as chaves de acesso da sua API do Twitter/X e com o link de acesso para o seu banco de dados do MongoDB
-
Entre na pasta src com cd Web-Crawler-e-Bot-com-Python\src
-
Execute o arquivo Crawler.py