Tool (Minidjvu-based) to dump Djbz and Sjbz content of DjVu documents to BMP images as well as gather statistics of dictionaries usage. Allows to investigate and compare the quality of different DjVu encoders (in scope of JB2 images)
On another document your programs works, so I assume it has been build correctly (Debian buster).
For the document created with didjvu using "-p 26" parameter I get:
JB2 Image requires 0 images from shared library which wasn't providedReading page Info: w:3292 h:5471 ver:0.24 dpi:600
and the enclosed statistics stats.log
Скажите, не смогли бы вы допилить ваш djvudict на такую фичу:
сравнивать получающийся shape с "эталонным" из отдельной папки и заменять его. Я бы заранее нашел и сделал bmp-шки основных алфавитов и кеглей книги, и программа определяла новый шейп - с устанавливаемым уровнем/коэффициентом совпадения - и заменяла старый на новый. И в словаре и в чанке sjbz. Для начала можно попробовать даже refinement-шейпы не трогать. Которые как отклонения записаны.
Вариативности и произвольности не предполагаю, выискивать "инь-эффект" чтоб ошибочные "н" заменить на "и" не нужно. Хочу получить "улучшалку" плохобинаризованных книг, когда книга в целом читаема, но после бинаризации буквы не очень красивые. Хотя возможен вариант что если буква разорвана на куски, то и шейп у нее будет не один, а несколько. Тогда я приплыл.