Coder Social home page Coder Social logo

tianyicup-education's Introduction

tianyicup-education

“添翼杯”人工智能创新应用大赛-智慧教育赛道 TOP3
油菜花一朵:@LogicJake @whoami-zy @油菜花

赛题背景

随着人工智能(AI)的发展,“AI+教育”“智慧课堂”等名词逐渐出现在大众视野,越来越多的学校将人工智能助手融入课堂,当下**正逐步进入“智慧教育”时代。在传统课堂中,由于时间和精力的限制,老师和家长无法兼顾学生的学习状态和学业进展,不会关注大量对于学生能反应其真实问题和情况的数据。

智慧教育通过将传统教育行业的场景和当下最新的人工智能算法紧密结合,深度挖掘学生在各个知识点上的历史答题表现数据,最终预测学生在考试中的分数表现。

赛题描述

请参赛选手,利用比赛对应训练集提供的学生信息、考试知识点信息、考试总得分信息等建立模型,预测测试集中学生在指定考试中的成绩总分,预测目标如下:

  • 初赛:利用初中最后一年的相关考试和考点信息,预测初中最后一学期倒数第二、第三次考试的成绩。
  • 复赛:利用初中 4 年中的相关考试和考点信息,预测初中最后一学期最后一次考试的的成绩。

数据下载

初赛数据下载(右键保存下载)

特征工程

基本特征

学生特征:

  • 性别

课程特征:

  • 课程类别

考试特征:

  • 考试次序
  • 考试知识点数量
  • 考试知识点跨度
  • 考试知识点所属段落数量
  • 考试知识点所属段落跨度
  • 考试知识点所属类目数量
  • 考试知识点所属类目数量
  • 考试总体难度(知识点占比×知识点难度)
  • 考试知识点各难度占比
  • 考试的知识点占比(pca降维到60维)
  • 考试的知识点种类和段落占比(pca降维到60维)
  • 知识点个数和考试难度拼接

相似考试得分

分别根据知识点占比,知识点种类占比,知识点段落占比,为每个考试找出最相似的3场考试。根据学生在这三场考试上的成绩,根据相似度加权平均求得这次考试的成绩。

基于分数的统计特征

分数是标签信息,直接利用全局信息统计会出现数据泄露,造成线上线下模型效果不一致。所以采用五折交叉统计,将历史考试成绩数据分为五折,每次用4折构造特征,给训练集中的另外1折。
将构造过程分为对象和统计方法两部分:
对象:

  • 学生所有考试成绩
  • 学生所有考试排名
  • 学生考试成绩 / 本次考试平均分
  • 学生在所有考试上表现出来的抗压能力
  • 学生在某门课考试上表现出来的抗压能力
  • 某门课程的所有考试成绩
  • 学生在某门课程上的考试成绩
  • 学生在某门课程上某次考试成绩 / 某次考试平均成绩
  • 某性别学生在某门课程上所有考试成绩

统计方法:

  • 最大值(max)
  • 最小值(min)
  • 平均值(mean)
  • 标准差(std)
  • 中值(median)
  • 变异系数(cv)

时序特征

  • 最近三次考试成绩 mean std
  • 最近三次考试排名 mean std
  • 最近三次考试成绩差值的平均
  • 对最近三次考试成绩平均分做窗口为8的平均
  • 对最近三次考试成绩平均分差值做窗口为3的平均
  • 最近三次考试成绩

"嫁接"学习

利用前三年数据构造部分特征,预测最后一年的考试成绩。利用全量数据构造的特征加上预测的最后一年的考试成绩预测最后一次考试成绩。

模型

五折交叉验证,lightgbm和xgboost各5个模型融合。

模型 Public分数
xgboost 7.289815178
lightgbm 7.288464145
融合 7.286831301

tianyicup-education's People

Contributors

logicjake avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.