Coder Social home page Coder Social logo

learn_dl_together's Introduction

learn_DL_together 個人ノート

JTPA みんなでやろうDL オンライン勉強会 https://github.com/JTPA/learn_DL_together

Nocnoc: https://nocnoc.ooo/event/A1B6CDAC-637F-4455-9582-D086AC289268

何か自分でまとめないと学習しないのでGithubに載せてみました。まだ初心者の練習レベルなのでこのページ自体はシェアはしないで下さい。(以下に引用したリンクはご自由にシェアして下さい。)

オーディオ認識

もともと画像認識の方が興味があるのですが、写真技術のチュートリアルビデオ(MLとは関係なし)を見ていたら、シャッターの音がする度に講師が撮影した写真が画面に出るというビデオがあって、シャッター音を認識して画像フレームをセーブできないかというところからオーディオ認識の勉強を始めました。シャッター音のタイムスタンプがわかれば、そこの画像フレームをビデオから抽出するのは簡単です。

音声のスペクトル (MFCC) を取って画像のようにCNNをかければいいみたいです。以下のサイトはスピーチ音声等の認識ですが、シャッター音検出のために他にもっと良い方法があれば教えて下さい。

見つけたサイト

Colabに持ってきて実行 https://colab.research.google.com/drive/1WEFVUwM76hgqMMvHFDU_73hlWjQP3RQG?usp=sharing

画像認識

(https://github.com/JTPA/learn_DL_together のREADME.mdの中にリンクあり)

My copy: https://colab.research.google.com/drive/1O9zETdRbCL-HlfwHtSrRl7QotiBqMPI-#scrollTo=fHU46tfckaZo

inference.pyの最後の関数inferenceに犬とかバイク・車の絵をモデルに喰わせると、Bounding Boxやラベルの配列を返してくれる模様。 utils.pyのget_feat_sizesやanchors.pyのコードで、元画像から色々な大きさの部分画像を色々な位置から抽出して、それをモデルが犬、車、バイクと判断するかどうか見ている?

2020-07-01 DL/機械学習 オンライン勉強会 「みんなでやろうDL」 Day 4.6 もくもく会

https://www.meetup.com/JTPA-Japanese-Technology-Professionals-Association/events/271555823/

https://nocnoc.ooo/app#/chat/A1B6CDAC-637F-4455-9582-D086AC289268

(敬称略)

https://www.vox.com/recode/2020/6/29/21303588/deepfakes-anonymous-artificial-intelligence-welcome-to-chechnya How deepfakes could actually do some good from Komei

https://kantocv.connpass.com/event/178126/ 第三回 全日本コンピュータビジョン勉強会(前編) from Jin

2020-07-15 DL/機械学習 オンライン勉強会 「みんなでやろうDL」 Day 5 もくもく会

https://www.meetup.com/JTPA-Japanese-Technology-Professionals-Association/events/271892957/

https://nocnoc.ooo/app#/chat/A1B6CDAC-637F-4455-9582-D086AC289268

https://en.wikipedia.org/wiki/Elo_rating_system Elo rating system from Komei

https://medium.com/@gtnjuvin/my-journey-into-deep-q-learning-with-keras-and-gym-3e779cc12762 https://colab.sandbox.google.com/drive/13nOusO6ecKdql0dhNcuQ65jxcPNdNkDr https://github.com/GaetanJUVIN/Deep_QLearning_CartPole from Jin Copied to https://colab.research.google.com/drive/147br3HYVRgJYBGl0o2zhZ4tALUluhpkb#scrollTo=TUYqaYnvjkDN

learn_dl_together's People

Contributors

komeiharada avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.