Coder Social home page Coder Social logo

blackthunder's Introduction

aozorahack slack

aozorahack全般に関するissue/wiki用リポジトリです(いわゆるメタリポジトリ)。

「Code for 青空文庫」アイデアソン #1 (https://atnd.org/events/66230 ) の開催をきっかけとしてaozorahackというgithub organizationを作成しました。青空文庫とその周辺に関する技術的な情報や、コード・ドキュメント置き場として活用できればと思っています。

このリポジトリ、aozorahack/aozorahackは、aozorahackに関する情報や意見質問の集約用のリポジトリです。お気軽にご利用ください(ただ、意見や質問をいただいても返答がないこともあります。ご了承ください)。

Issues

slack

https://aozorahack.slack.com/ を作成しました。メインのやりとりはgithubで実施しますが、ブレストや雑談はslackでもできればと思っています。参加希望者は https://aozoraslackin.herokuapp.com/ からJoinしてください。

Projects

新しくプロジェクトを作りたい人は、新規プロジェクト(リポジトリ)を作るにはをご覧ください。

現在活動中のプロジェクトは以下になります。

アイデアソンで提案された「オープンソースの文書入力・校正システムを作る件について」のプロジェクトです。

  • aozoraflow - 作品をgitで管理する際の運用規約とサポートツール
  • aozora-parser.js - 青空文庫テキストのパーサ
  • hinagata - 作品パッケージの雛形
  • aozora.json - 作品メタデータのフォーマット

青空文庫の技術的な「仕様」をまとめて文書化するためのレポジトリ。今後作るものの仕様ではなく、既存の青空文庫がどうなっているかが中心です。

アイデアソンの資料置き場です。

Resources

blackthunder's People

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar

blackthunder's Issues

1ページごとの XHTML or PDF レンダリング

ページごとのビュー画面をつくるための準備。
ページごとのビュー画面で閲覧→不満があれば編集画面に移動→入力が終わったら戻って閲覧を続ける
という流れ。

PDF出力の縦書き対応

Re:VIEW の設定を Webインターフェース で指定できるようにするのが必要。TeXで対応? 8月中をめどに作りたい

Gitのアカウントの管理

どの時点で clone/push するか?

  • 自分のローカルでrailsのWEBrickを動かせる環境の人はclone → rail server 起動して作業 → 終わったらサーバ停止してpush でもいい。
  • それができない人(大多数)は公開サーバで動いているBlackThunderを使う
  • 公開サーバにログオンする時点でgitアカウントを入力させる?

縦書き書籍のスキャンイメージビューの対応

入力システムのイメージペインと入力ペイン。
横書き書籍だと上下に分割だが縦書き書籍だと左右分割にしないといけない?
実際にはスキャンイメージを90°回転させて上下分割のほうが実用的ではないか?

Commitボタン

書誌レポジトリにCommitコメントを書くWebインターフェース

書誌レポジトリの取り込み

現在はローカルに「解析概論」のデータを保持していますが、これを別の書誌レポジトリを参照して動くようにしていきたい。

  • スキャンデータは重いのでテキストデータのみ持ってくる?
  • 書誌レポジトリ構造(システム構成図から)

書誌キー名 ex,) KaisekiGairon 書籍名とは必ずしも一緒ではない。UTF-8。
ページ番号 ・・スキャンファイルNoであり、元書誌にふられたページ番号とは異なる。遊び紙などにもNoが振られ、適宜削除するので連番保証は無い。 
ページ番号1 ページ番号を4桁ゼロパティング処理
書誌フォルダ名:(書誌キー名)
書誌データフォルダ名:(書誌キー名)

(書誌フォルダ名)
  +/(書誌データフォルダ名)
+/ocr
+/large_jpg
+/review

画像ファイル名: (章No)/(ページ番号1).jpg
OCRテキスト: (章No)/(ページ番号1).txt
Markdown原稿:( ページ番号1).md
pdf: (書誌キー名).pdf

章割のファイル構成の検討

現在は書誌データレポジトリ内では

before...表紙、まえがき、目次など
1...第1章
2...第2章
3...第三章
...
というディレクトリになっているがこれを1ディレクトリにまとめたほうがいいのではないか?

章によってレポジトリを分けるのはRe:VIEWからの流儀だが、これを管理するにはRe:VIEWの
catalog.yml を読み込んで処理する必要がある。それをした方がいい?

「生成」ボタン

今はダミーの pdf / epub / xhtml 生成ボタン。以下を実装。

どれを作るかを選択

ボタン押すと生成

生成ファイルへのリンクを生成日付と共に表示

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.