6
2
2013
9

转换文本照片为 DjVu 格式

前几天听群里的网友聊起 DjVu 文档格式对扫描文本的压缩率很不错,又忆起自己手头有本书的照片版,不光近百兆占地方,而且一堆 JPEG 图片也不方便阅读,于是想着把它转成 DjVu 格式试试。

Google 了一下,发现有 DjVuLibre 这么套工具。用法没能指望上 Google,还是老老实实地看 man 文档的。

首先,把一张张的 JPEG 图片转成一个个单页的 DjVu 文档。命令名字很奇怪,叫c44(我还一不小心打成了c99囧)。转换比较费 CPU,所以用parallel来利用多核:

parallel c44 ::: *.JPG

然后当前目录下就出现了一堆与 JPEG 图片同名的.djvu文件。

接下来,把这些文档合并起来。命令叫djvmm想来指的是多页(multi-page)。

djvm -c doc.djvu *.djvu

这样就好啦。页面顺序是按照在命令行上给出的顺序。这里是按文件名排序的。看了看生成的doc.djvu,只有 15M 耶。我对比了下 DjVu 文档和原图片的质量,在放大的时候还是能看到差了一些的,不过文本清晰得足够阅读就好啦。

Category: Linux | Tags: DjVu

Mastodon | Theme: Aeros 2.0 by TheBuckmaker.com