Coder Social home page Coder Social logo

trufanov-nok / djvudict Goto Github PK

View Code? Open in Web Editor NEW
1.0 3.0 1.0 83 KB

Tool (Minidjvu-based) to dump Djbz and Sjbz content of DjVu documents to BMP images as well as gather statistics of dictionaries usage. Allows to investigate and compare the quality of different DjVu encoders (in scope of JB2 images)

License: GNU General Public License v3.0

C++ 99.81% C 0.19%
djvu djbz minidjvu scanning

djvudict's People

Contributors

trufanov-nok avatar

Stargazers

 avatar

Watchers

 avatar  avatar  avatar

Forkers

rmast

djvudict's Issues

JB2 Image requires 0 images from shared library

On another document your programs works, so I assume it has been build correctly (Debian buster).
For the document created with didjvu using "-p 26" parameter I get:
JB2 Image requires 0 images from shared library which wasn't providedReading page Info: w:3292 h:5471 ver:0.24 dpi:600
and the enclosed statistics
stats.log

заменить глифы по эталону

Скажите, не смогли бы вы допилить ваш djvudict на такую фичу:
сравнивать получающийся shape с "эталонным" из отдельной папки и заменять его. Я бы заранее нашел и сделал bmp-шки основных алфавитов и кеглей книги, и программа определяла новый шейп - с устанавливаемым уровнем/коэффициентом совпадения - и заменяла старый на новый. И в словаре и в чанке sjbz. Для начала можно попробовать даже refinement-шейпы не трогать. Которые как отклонения записаны.
Вариативности и произвольности не предполагаю, выискивать "инь-эффект" чтоб ошибочные "н" заменить на "и" не нужно. Хочу получить "улучшалку" плохобинаризованных книг, когда книга в целом читаема, но после бинаризации буквы не очень красивые. Хотя возможен вариант что если буква разорвана на куски, то и шейп у нее будет не один, а несколько. Тогда я приплыл.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.