Coder Social home page Coder Social logo

kaggle-siim-covid19-detection's Introduction

はじめに

kaggleを始めた理由

  • 楽しみながら機械学習のスキルを向上させたい
  • 建設的な趣味が欲しい

kaggle日記を書く理由

  • モチベーション維持
  • 学んだことの整理(ラベリングとストック)

参考:https://zenn.dev/fkubota/articles/3d8afb0e919b555ef068

kaggle-SIIM-covid19-Detection

B0DD58C1-2752-4E7F-85CB-A59A1A3A90CE

gantt
  title timeline
  dateFormat YYYY-MM-DD
  section Official
  Competetion: a1, 2021-05-18, 2021-08-10
  Entry deadline: a3, 
  Team Merger deadline: a4, 
  Final submission deadline: a2, 

  section Score
  Join!:2021-06-15, 2020-06-16
Loading

↑ガントチャートをマークダウンで書きたいマン

Dataset

210630

  • 日記初めてみた
  • couseraのpytorchを使った画像分類チュートリアルを完了
    • 基本的な流れは理解(なんとなく)
      • Dataset classの作成→画像処理クラスの作成 →データの読み込み→ →model classの作成 → train classの作成(optimaizer 何使うかとか決める) → modelに食わせる
    • Resnet18,,,? よくわからん状態,,,画像処理への理解が浅い、なんかで補強しなければ
    • てかこれBoxDetectionやないよね?
    • pytorchでBoxDetection実装している人がいたので、とりあえず一発実装してみる(土曜中に終わらせたい、、)
    • pytorch は直感的、カスタマイズ性が良い等評判が良いので、メインで学習したい
  • 気になっていること
    •  コンペのDiscussion見ると、VOLO法のvote数が多い。pytorch で実践できるかな、、
  • 学んだこと
    • 最適化メソッド←神記事
    • ミニバッチ学習←学習の停滞が起こりづらい、と聞いて理解。データ数が少ないと、コスト関数の平面がより凸凹して落ち着きづらいイメージかな
  • その他

210701

  • 昨日のpytorchのbox Detectionは、そもそも今回の学習に使用できるか不明なので、このお方のnotebookを参照してみる
    • dicomモジュールでデータ読み込み
    • 8bit イメージデータに変換
    • model class( EfficientNet model)の定義×2、Trainer classの定義、main functionで回す - EfficeintNet modelについて、このサイトが詳しそう、明日勉強する - 素朴な疑問 - notebookを量産するのは良いが、管理がめんどくさそうだ、、、 - 自分の作ったnotebookを見返さないので、内容を忘れがち→fkubotaさんみたいに、githubで一元管理した方が良さそう? - notebookの立ち上げ→データセットの読み込み の手順が毎回めんどくさい - 実験計画をどう効率的に、戦略的に行うか考える必要がありそう。pipe lineってのがヒントっぽい。fkubotaさんのリポジトリ漁ってみる 今日は残業おじさんだったのでここまで、、、 した内容

210702

  • fkubotaさんのリポジトリ漁った
    • EDAからスタートしてて、全ての特徴量についてコメントして記録に残している。最初に作ったノートブックで一通り理解したつもりになっていた。もう一度最初からやろう。
    • 写経したnotebookにコメント残して資料化している。同じ事やって学習ログを残す。
  • 気づいた事
    • Readmeここで編集するのめんどい。ローカルリポジトリ上のファイルを好きなmarkdownエディタで編集して、git pushで更新するスタイルにしよう。
    • notebookのショートカットは覚えるべき
    • 写経が終わったら、最初に作ったdata preparationのノートブックをメンテして、EDA、読み込み、等に分けて、深堀する
    • その後ゼロつくのCNNの章に挑戦する。 どうてもいいけど今日コロナワクチン受けた、、、腕痛い あと、notion使い始めた クロームのタブ開きすぎ問題を解決したい。毎日閉じるようにしようかな。

210703

  • gitのお勉強した
  • ステージとローカル、リモートリポジトリの関係等抑えてれば使えそう

210704

  • gitで勉強した内容をnotionにまとめた
  • notionおしゃん。kaggleの情報もここに整理しよう

210705

  • この日は特に進捗なし

210706

  • 公開notebookのEDAを自分なりにまとめようとする
    • dicomのヘッダ情報など、よく理解できていない 残業ありすぎる
  • kaggleの環境をlocalに再現して実験を高速で回したい
    • dockerを半日で習得する

210707

210708

  • 残業地獄でキレそう
  • 前に一通り回したnotebook見返した。
    • 画像の読み込みからEDAまで一通りやっている。とりあえず資料として残す。

210709

  • 何もしてない!

210710

  • ゼロつくを読み込んだ(作ってない)
  • CNN大体理解

210711

  • ゼロつくを元にCNN実装してみた
  • 調整すべきパラメータはわかった
  • torchでは畳み込み層、pooling層がクラスとして用意されており、これらを組み合わせてモデルを作成する
  • ゼロつくでやった内容とかなり近い
  • torchの力を借りて自力実装する
  • あとGPUの偉大さを知った、、、GPUなしじゃ到底回せん。kaggleかgoogle colabを利用する。

Dataset

kaggle-siim-covid19-detection's People

Contributors

gonzo3832 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.