Coder Social home page Coder Social logo

spell-collect's Introduction

Spell-Collect スペル修正プログラム

現在開発中です。spell_j.pyは正常動作していません。

original/spell.py:
PeterNorvigの書いたスペル修正プログラムに、勉強の為にコメントを書いたもの。オリジナル。

original/big.txt:
PeterNorvigがスペル修正プログラムのP©の部分。100万語からなる大きなテキストファイル。

spell_j.py:
日本語対応版、まだ未完成です(正常に動作していません)。

big_j.txt:
P©の部分。今は青空文庫からドグラ・マグラのみを使用。big.txtや他の小説やテキストをもっと入れる。

Purpose(目的):

PeterNorvigのスペル修正プログラムを元に、日本語対応版の開発をします。

Requirements:

Python2.7
MeCab, MeCab IPA辞書
mecab-python

How to Use(使い方):

Idea Behind This(考え方):

References:

スペル修正プログラムはどう書くか
スペルミス修正プログラムを作ろう
MeCab品詞ID一覧

spell-collect's People

Contributors

iori avatar

Stargazers

 avatar

Watchers

 avatar James Cloos avatar

spell-collect's Issues

Nグラムインデックスを用いて、修正候補を絞り込む

PeterNorvigのスペル修正プログラムではアルファベット前提で作られている。
edits1の削除と転位は日本語でも出来るが、置換と挿入はひらがな・カタカナ・漢字には対応出来ない。

この代わりに、Nグラムインデックスを用いて修正候補を絞込み、修正距離を計算する様にする。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.