Coder Social home page Coder Social logo

genie_crawler's Introduction

⚙️ Enviroment setting

cd genie_crawler
conda init
(base) . ~/.bashrc
(base) conda create -n crawling python=3.10 -y
(base) conda activate crawling
(crawling) pip install -r requirements.txt

🔨 How to set pre-commit config

pip install pre-commit
# Used in case of locale related errors
# apt install locales locales-all 
pre-commit install

💡 How to run

python main.py

genie_crawler's People

Contributors

2jun0 avatar dyeonpark avatar juhyein avatar kcmi113 avatar

Stargazers

 avatar  avatar

Watchers

 avatar  avatar

Forkers

juhyein 2jun0

genie_crawler's Issues

[BUG] list index out of range : Error is occured at id {id_number}

Background

-플레이리스트는 존재하지만 그 안에 속한 노래나 정보는 없어 크롤러가 중간에 멈추는 현상이 발생합니다.
스크린샷 2023-06-23 오전 1 02 02

To Do

  • error가 발생하는 index 저장
  • error가 발생해도 다음 index로 넘어갈 수 있도록 변경

[CHORE] 프로젝트 초기 환경 설정

Background

  • 프로젝트를 위한 초기 환경을 설정합니다.

To Do

  • Issue templates
  • PR template
  • pre-commit
  • requirements
  • 레포 생성 이전에 작성한 코드 업로드

[BUG] 앨범 이미지 재수집 코드 추가

Background

  • 플레이리스트에 수록된 곡을 수집하는 단계에서 앨범 이미지가 누락된 경우가 있었습니다
  • 앨범 이미지가 누락된 곡에 대해서만 앨범 이미지를 다시 수집할 필요가 있어보입니다.

To Do

  • 앨범 이미지가 정상적으로 수집되지 않은 경우에 대해 이미지를 다시 수집하는 코드 추가

[DOCS+CHORE] Add Chrome and Chrome driver instruction

Background

  • 본 코드에는 크롬과 드라이버에 대한 설치방법이 적혀있지 않아 추가하고자 합니다.

To Do

  • 크롬과 드라이버 설치 방법 README에 추가
  • no-gui 환경에서 돌아갈 수 있게 sandbox 제거 옵션 추가

[FEAT] CSV 파일 생성 기능 추가

Background

  • 프로젝트를 위해 크롤링한 데이터를 csv 형태로 저장하는 코드를 추가해야 합니다.

To Do

  • playlist csv 생성
  • playlist-song interaction csv 생성
  • song csv 생성

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.