Coder Social home page Coder Social logo

ita-corpus's People

Contributors

darashi avatar hiroshiba avatar mmorise avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

ita-corpus's Issues

https://zunko.jp/multimodal_dev/twdashbord.php file can't download

Trailing `。` mismatch in 2 examples

In these examples, the pronunciation contains a trailing but the text does not:

RECITATION324_089:仏教はインド由来の宗教です,ブッキョーワインドユライノシュウキョーデス。
RECITATION324_140:ハサミでプツッと切った切れ端をペットにあげた,ハサミデプツットキッタキレハシヲペットニアゲタ。

recitationの55番と283番の文ついて、pdfとtxtで相違があります

こんにちは、素晴らしいコーパスの公開ありがとうございます。
2点、pdfとtxtファイルで相違がある文を見つけましたので、報告させていただきます。

■1点目
recitationの55番
「、」がある/ないで相違があります。

pdf:ヌルシアのベネディクトゥスはアポロン神殿を壊し、ベネディクト会の修道院を建てた。
txt:ヌルシアのベネディクトゥスはアポロン神殿を壊しベネディクト会の修道院を建てた。
https://github.com/mmorise/ita-corpus/blob/main/recitation_transcript_utf8.txt#L55

■2点目
recitationの283番
「併せて」「合わせて」で相違があります。

pdf:インスティテュートで、リデュースの話と併せて、ルデュックの話も聞いた。
txt:インスティテュートで、リデュースの話と合わせて、ルデュックの話も聞いた。
https://github.com/mmorise/ita-corpus/blob/main/recitation_transcript_utf8.txt#L283

以上です。よろしくお願いいたします。

疑問符の表記について

こんにちは。
.txtファイル内のカナ表記部分に関して、EMOTIONとRECITATIONで疑問符の扱いが違うのは仕様でしょうか。

状況

EMOTION100_XXX:~~~ですか?,~~~デスカ。
RECITATION324_XXX:~~~ですか?,~~~デスカ?

該当箇所
EMOTION100 28番、40番、57番
RECITATION324 31番、60番、229番

もしかしたら余計なお世話かなとも思いましたが、念のため確認させていただきました。ご確認いただけますと幸いです。

朗読者向けファイルのEMOTION100_014で「私」にルビがない

emotion_朗読者用(docx, pdfともに)のEMOTION100_014「スミスさん、ピエール・デュボワをご紹介しますわ。私の親友なの。」の「私」にルビがありません。

emotion_transcript_ruby_utf8.txt で「わたし」だと確認できますが、収録時の利便性のために追加してもらえると嬉しいです

テキストと読みの不一致

テキストと読みの不一致を見つけたので報告します。

テキスト:ギャロウェイさん
読み:ギャローェイサン

RECITATION324_142:プレゼントをギャロウェイさんに渡してください。,プレゼントヲギャローェイサンニワタシテクダサイ。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.