bufige / mercado-livre Goto Github PK
View Code? Open in Web Editor NEWWeb Scraping para pegar dados do mercado livre. É bem simples e direto, fácil de modificar para coletar mais dados.
Web Scraping para pegar dados do mercado livre. É bem simples e direto, fácil de modificar para coletar mais dados.
Alguns produtos tem variações de preço/dados conforme o tamanho ou cor/modelo. E como essas variações são acessadas através de botões na pagina do produto, se eu quiser saber o preço/dados de cada uma delas, meu script precisa fazer um loop nesses botões, pegar o href deles, acessar a pagina dos botoes, e ai sim, pegar os dados da pagina, como preço, quantidade vendida, etc.
O problema :
Existem dois tipo de botoes - o de tamanho e o de modelo/cor. E cada combinação de tamanho+modelo vai gerar dados diferentes. O tamanho 33 de cor branca, vai ter vendido menos que o tamanho 33 de cor vermelha, por exemplo. Então preciso fazer um loop nos tamanhos, e um segundo loop nos modelos, pra acessar cada item especifico e pegar os dados.
For href in modelos:
for href2 in tamanhos :
get_data !
Até ai tudo bem
MAS, os botoes de tamanho e modelo são indistinguiveis entre si. Assim como são indistinguiveis de qualquer outro botão da pagina. Então ... Como fazer um loop num conjunto que não consigo delimitar ?
Problema numero 2 : As paginas que apresentam essas variacoes de dados entre modelos e tamanhos, as vezes apresentam os tamanhos em botoens em um drpdown menu, Diferente dos botoens normais, esses eu não consigo achar o href.
Páginas exemplo :
Pagina com botoes infistinguiveis
Outra página com botoes indistinguiveis
Página com dropdown menu
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.