Coder Social home page Coder Social logo

datascience's Introduction

数据科学基础大作业

4-30 目前完成了数据下载脚本的编写,位于download/目录下。

4-30 完成了对压缩文件的处理,现在可以从做题记录文件中提取出有用的提交代码替换原来的整个压缩文件

5-13 对下载模块继续优化:增加新功能,可以只下载最后一次提交的代码;将题目信息下载和用户代码下载分离,避免冗余地下载题目信息。

5-15下载器新增功能!

  • 可以指定下载文件目录结构组织
  • 可以方便的定制代码过滤器,定制文件目录结构
  • 对原有多线程下载方法进行改良,下载速度显著提高
  • 开始运行的时候可以打印一个帅气的banner!qwq

7-21 功能更新

  1. 分析代码

在check包的check包下:

  • main.py,程序入口;

  • ifEles.py,检查代码的“if-else”语句偏移情况;

  • checkByIO.py,检查代码的输出异常情况;

  • countlines.py,检查代码语句数量偏移情况;

  • check.py,连接器,综合三分指标并得出一个怀疑等级。

  1. 作图模块

    在check包的draw包下:

    draw模块(draw.py, draw_multi.py)使用 Python3 第三方开源库 pygal 对处理过的数据进行可视化处理,绘制的图表包括:

    • 单个题目满分代码中被怀疑代码占总数的比例的饼图(Pie)

      读入单个题目的一份字典(key为文件名,value为怀疑程度的度量),用pygal创建一个新的Pie对象,键入标题、数据(被怀疑文件数以及总被分析代码文件数),在项目根目录下pics目录中自动生成可互动式的.svg可缩放矢量图形。

    • 单个题目满分代码被怀疑程度的降序排列的直方图(Bar)

      读入单个题目的一份字典(key为文件名,value为怀疑程度的度量),用pygal创建一个新的Bar对象,键入标题、数据(所有的文件名以及怀疑程度),在项目根目录下pics目录中自动生成可互动式的.svg可缩放矢量图形。

    • 多个题目并列对比的怀疑代码占比半饼图(Gauge)

      读入包含多个题目的一份字典(key为题目编号,value为字典2(key2为文件名,value2为怀疑程度的度量)),用pygal创建一个新的Gauge对象,键入标题、数据(各个题目的被怀疑文件数以及总被分析代码文件数),在项目根目录下pics目录中自动生成可互动式的.svg可缩放矢量图形。

    • 多个题目并列对比的怀疑程度分布情况的金字塔(Pyramid)

      读入包含多个题目的一份字典(key为题目编号,value为字典2(key2为文件名,value2为怀疑程度的度量)),用pygal创建一个新的Pyramid对象,键入标题、数据(各个题目的怀疑程度在每个值处的分布数量),在项目根目录下pics目录中自动生成可互动式的.svg可缩放矢量图形。

    单个题目的分析图会放在项目根目录的pics目录里的题号目录里

    pics目录以及题号子目录会自动创建(如果没有)

datascience's People

Contributors

ddchlsq avatar jingjiecb avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.