Coder Social home page Coder Social logo

songxxiao / m5_compete Goto Github PK

View Code? Open in Web Editor NEW
37.0 2.0 10.0 43 KB

Sliver Solution (Top 2%) for Kaggle M5 Forecasting competition / Kaggle M5沃尔玛销量时间序列预测竞赛 银牌方案(Top 2%)

License: MIT License

Jupyter Notebook 100.00%
timeseries kaggle kaggle-competition machinelearning-python kaggle-m5

m5_compete's Introduction

It's Xiao Song's github.

m5_compete's People

Contributors

songxxiao avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar

m5_compete's Issues

竞赛描述(中文)

https://www.kaggle.com/c/m5-forecasting-accuracy/overview/description

一家商店一年中每月会卖出多少件露营装备?对于初学者来说,在此级别上计算销售额似乎与预测天气一样困难。两种类型的预测都依赖于科学和历史数据。错误的天气预报可能会导致您在晴天携带雨伞,而错误的业务预测可能会导致实际或机会损失。在这场比赛中,除了传统的预测方法外,您还面临使用机器学习提高预测准确性的挑战。

尼科西亚大学的Makridakis开放预测中心(MOFC)进行前沿的预测研究,并提供业务预测培训。它可以帮助公司实现准确的预测,估计不确定性水平,避免代价高昂的错误以及应用最佳预测实践。 MOFC因其Makridakis比赛而闻名,第一场比赛于1980年代举行。

在本次竞赛的第五次迭代中,您将使用全球最大公司沃尔玛的分层销售数据,以预测未来28天的日销售量。该数据涵盖了美国三个州(加利福尼亚州,德克萨斯州和威斯康星州)的商店,并且包括商品层面,部门,产品类别和商店详细信息。此外,它还具有解释性变量,例如价格,促销,星期几和特殊事件。这些强大的数据集可以一起用于提高预测准确性。

如果成功,您的工作将继续推动预测的理论和实践。所使用的方法可以应用于各种业务领域,例如设置适当的库存或服务级别。通过其业务支持和培训,MOFC将帮助分发工具和知识,以便其他人可以获得更准确和更好的校准预测,减少浪费并能够理解不确定性及其风险隐患。感谢其他合作伙伴组织和奖项赞助商,雅典国立技术大学(NTUA),INSEAD,Google,Uber和IIF。

Accuracy

在挑战中,您要预测两个28天时间段内各个位置商店的商品销售。 有关数据的信息可在 M5参与者指南中找到。

档案

  • calendar.csv-包含有关产品销售日期的信息。
  • sales_train_validation.csv-包含每个产品和商店的历史每日单位销售数据[d_1-d_1913]
  • sample_submission.csv-提交的正确格式。 请参考评估选项卡以获取更多信息。
  • sell_prices.csv-包含有关每个商店和日期出售产品的价格的信息。
  • sales_train_evaluation.csv-包括销售[d_1-d_1941](用于公共排行榜的标签)

Uncertainty

在挑战中,您要预测在两个28天的时间段内,在不同位置的商店中有9个四分位数的商品销售。 有关数据的信息可在《 M5参与者指南》中找到。

档案

  • calendar.csv-包含有关产品销售日期的信息。
  • sales_train_validation.csv-包含每个产品和商店的历史每日单位销售数据[d_1-d_1913]
  • sample_submission.csv-提交的正确格式。 请参考评估选项卡以获取更多信息。
  • sell_prices.csv-包含有关每个商店和日期出售产品的价格的信息。
  • sales_train_evaluation.csv-包括销售[d_1-d_1941](用于公共排行榜的标签)

关于损失函数的问题

想问一下,Poisson损失函数和tweedie损失函数有什么区别,你是怎么想出自定义损失函数,自定义损失函数为什么要这么设计

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.