-
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
-
著:石原 祥太郎 著:村田 秀樹
-
定価 : 本体2,000円(税別)
-
シリーズの第2弾は、初学者向けのKaggle入門書の決定版!
-
★「Kaggleで勝つ」準備をしよう!★
-
初学者が「Kaggleに何となく興味ある」状態から「実際のコンペに参加できる」状態になれるような内容を目指しました。
-
・サンプルコードの詳細な解説があるから、しっかり身につく!
-
・優勝チームと専業Kagglerのコンビによる、安定のわかりやすさ!
-
・充実の本音対談で、やさしくサポート!
-
・初学者や手探りでやっているが体系的な知識を得たい人に最適。
-
【本書のサポートページ】
-
【実践Data Scienceシリーズ】
-
【主な内容】
-
第1章 Kaggleを知る
-
1.1 Kaggleとは
-
1.2 Kaggleで用いる機械学習
-
1.3 Kaggleのアカウントの作成
-
1.4 Competitionsページの概要
-
1.5 環境構築不要な「Notebooks」の使い方
-
第2章 Titanicに取り組む
-
2.1 まずはsubmit! 順位表に載ってみよう
-
2.2 全体像を把握! submitまでの処理の流れを見てみよう
-
2.3 次の一手を見い出す! 探索的データ分析をしてみよう
-
2.4 ここで差がつく! 仮説に基づいて新しい特徴量を作ってみよう
-
2.5 勾配ブースティングが最強?! いろいろな機械学習アルゴリズムを使ってみよう
-
2.6 機械学習アルゴリズムのお気持ち?! ハイパーパラメータを調整してみよう
-
2.7 submitのその前に! 「Cross Validation」の大切さを知ろう
-
2.8 三人寄れば文殊の知恵! アンサンブルを体験しよう.
-
第3章 Titanicの先に行く
-
3.1 複数テーブルを扱う
-
3.2 画像データを扱う
-
3.3 テキストデータを扱う
-
第4章 さらなる学びのために
-
4.1 参加するコンペの選び方
-
4.2 初学者にお勧めの戦い方
-
4.3 分析環境の選択肢
-
4.4 お勧めの資料・文献・リンク
-
付録A サンプルコード詳細解説
-
A.1 第2章 Titanicに取り組む
-
A.2 第3章 Titanicの先に行く
- 『PythonではじめるKaggleスタートブック』のサンプルコードです。
- 書籍内の脚注はこちらにまとめています。
- 正誤表はこちらです。
- ご感想・ご質問は、issueにてお願いします。よくある質問(FAQ)は、下記にまとめています。
ディレクトリ | 内容 |
---|---|
input | 入力ファイル |
ch02 | 第2章のサンプルコード |
ch03 | 第3章のサンプルコード |
- ch02_01.ipynb
- ch02_02.ipynb
- ch02_03.ipynb
- ch02_04.ipynb
- ch02_05.ipynb
- ch02_06.ipynb
- ch02_07.ipynb
- ch02_08.ipynb
- ch03_01.ipynb
- ch03_02.ipynb
- ch03_03.ipynb
過去の全質問・やり取りはこちらで公開しています。
電子版については、kindle版やkobo版などリフロー型を5月26日から配信します。オンライン書店にてご確認ください。
Kaggle Notebookのデザインは随時更新されています。2020年8月時点のCommit方法は、動画で解説しています。