Coder Social home page Coder Social logo

ceneoscrappern11's Introduction

CeneoScrapperN11

Etap 1 - Pobranie składowej pojedyńczej opinii z serwisu [Ceneo.pl] (https://www.ceneo.pl/)

  1. Pobranie kodu pojedyńczej strony z opiniami o produkcie
  2. Analiza struktóry kodu pojedyńczej opinii
Składowa Selektor CSS Nazwa zmiennej Typ danych
Opinia div.js_product-review review dict
Identyfikator opinii ["data-entry-id"] review_id str
Autor opinii span.user-post__author-name author str
Rekomendacja span.user-post__author-recomendation recommendation bool
Liczba gwiazdek span.user-post__score-count stars float
Treść Opinii div.user-post__text content str
Lista zalet iv.review-feature__col:has(> div[class*="positives"]) > div.review-feature__item
div.review-feature__col:has(> div.review-feature__title--positives) > div.review-feature__item
div.review-feature__title--positives ~ div.review-feature__item
pros [str]
Lista wad iv.review-feature__col:has(> div[class*="negatives"]) > div.review-feature__item
Dla ile osób przydatna span[id^="votes-yes"]
button.vote-yes["data-total-vote"]
button.vote-yes > span
useful int
Dla ilu osób nieprzydatnych span[id^="votes-no"]
button.vote-no["data-total-vote"]
button.vote-no > span
useless int
Czy Potwierdzona zakupem div.review-pz purchased bool
Data wystawienia opinii span.user-post__publish > time:nth-child(1)["datetime"] review_date str
Data zakupu produktu span.user-post__published > time:nth-child(2)["datetime"] purchase_date str

3.Pobieranie składowych opinii do pojedyńczych zmiennych

Etap 2 - pobranie wszystkich opinii z pojedynczej strony

  1. Zdezdefiniowanie s łownika do przechwywania skladowych pojedyncej opinii
  2. Zdefinowwanie listy do przechowanyania słowników z opniiamii
  3. Dodanie petli wykonującej operację ekstracji na wszystkich opiniach z pojedynczej strony

Etap 3- Pobranie wszystkich opinii o produkcie

  1. Dodanie petli wykonującej operacje ekstrakcji z wszytkich stron z opiniami dla daego produktu
  2. Dodanie kodu produktu z standardowego wejscia
  3. Parametryzacja adresy strony z opniiamii
  4. Eksport opinii o produkcie do pliku .json

Etap 3 - Analiza Opinii

ceneoscrappern11's People

Contributors

s193470 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.