Coder Social home page Coder Social logo

exsim's People

Watchers

 avatar

exsim's Issues

w2vの学習の実装の修正

WHY

学習の方法間違っていたっぽい?

data = word2vec.Text8Corpus('../../data/docs/0918/reviews.txt')

Text8Corpusを使うべきではない?

WHAT

  • 実際のところどうなのか調査
  • word2vec.LineSentence()とか使う?

ある語に対してその周辺語を獲得できるようにする

word2vecにおいて文書を学習する際に,ある語の周辺語を取得できるようにする.

WHY

  • 「ちょっと飲む」の近くに「カウンター」や「バー」といった語は現れているのか?
  • 周辺語によって行動を特徴づける
  • 周辺語が似ていれば行動も似ていると言えるかも
  • そのような文書をどうすれば取ってこられるのかを知りたい

WHAT

  • 文書クラスを作成する
  • ある語を引数として周辺語を返すメソッドを作成する
  • windowサイズも指定
    • 周辺語の頻度
    • 指定した語からの距離によって重み付けは必要?
    • とりあえず周辺語からの距離は考えず同等とみなす

W2V学習の工夫

重み付けの方法が残念過ぎるので改変

とりあえず,文書を直接いじる方向で考える.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.