Coder Social home page Coder Social logo

trellixvulnteam / python_v8ub Goto Github PK

View Code? Open in Web Editor NEW

This project forked from lilanqi/python

0.0 0.0 0.0 60.39 MB

Shell 0.01% C++ 0.01% Python 97.84% C 1.37% Fortran 0.01% Assembly 0.01% PowerShell 0.04% XSLT 0.17% CSS 0.01% GAP 0.02% HTML 0.24% Smarty 0.01% PLSQL 0.03% DTrace 0.01% Batchfile 0.01% Roff 0.02% VBScript 0.01% Cython 0.23%

python_v8ub's Introduction

Python学习

day01

  • python基础语法学习
  • pycharm的安装、环境变量配置以及使用
  • 了解如何安装第三方库 ```pip intsall``

day02

  • 了解并学习使用火车头软件爬取数据

  • requests库以及BeautifulSoup库的了解,爬取简单静态网页以及理解其过程

  • 了解xpath内部参数的意思```c_data.xpath('//*[@id="root"]/div/div')``

  • 复习html相关知识

  • 使用lxml库爬取简单静态页面

day03

day04

  • 了解并学习解析网页三大方式

    1. 使用正则表达式解析网页

    2. 使用BeautifulSoup解析网页

      ​ + 了解文档树

    3. 使用lxml解析网页

      ​ + 了解Xpath的选取

  • 爬取房屋价格数据

  • 学习python文件输入输出,将数据存储至.csv

  • 复习mysql数据库,结合MySQLdb第三方库将数据存储进mysql数据库

  • 学习yiled关键字的作用

day05

  • 了解反爬虫以及如何解决反爬虫
    1. 修改爬虫间隔时间 2. 修改请求头 3. 获取真实地址(数据存储在json文件中,或者使用ajax载入的时候有真实地址,地址有规律,亦或者使用ajax的时候找到的其所有真实地址都是同一个,每次刷新这个地址都会得到不同的值)

  • 解决中文乱码

  • 登录与简单数字验证码的处理
    1. 使用post提交数据 2. 处理cookies 3. 人工方法处理简单数字验证码

  • 使用百度API获取数据

  • 了解scrapy框架

day06

  • 简单学习scrapy框架使用,学习其API文档中
  • 学习selectorLib插件的使用,提取页面所需要的内容至.YML文件中
  • 结合scrapy以及selectorLib爬取页面商品数据http://scrapeme.live/shop/
  • 结合scrapy以及selectorLib爬取阿里巴巴商品数据,并且存储至.csv文件中
  • 爬取阿里耳机商品数据,解决图片无法获取以及链接问题

day07

  • 了解git并上传代码至github
  • 学习使用markdown语言
  • 阅读squareup API文档
  • 往网页中插入商品数据

day08

  • socket安装以及下载splash

  • splash+scrapy爬取阿里动态页面失败

  • beautifulSoup爬取阿里图片失败

  • 爬取dropshipping商品数据,图片爬取失败

java学习

  • 使用url调用接口功能
  • 实现图片上传、商品上传功能,并且提供接口
  • SpringBoot学习
  • Swagger学习
  • Redis学习
  • lombok插件学习
  • 改进商品上传功能
  • 解决项目部署过程中的各种bug问题
  • postman了解及其使用
  • 图解http学习

python_v8ub's People

Contributors

lilanqi avatar trellixvulnteam avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.