前几天听群里的网友聊起 DjVu 文档格式对扫描文本的压缩率很不错,又忆起自己手头有本书的照片版,不光近百兆占地方,而且一堆 JPEG 图片也不方便阅读,于是想着把它转成 DjVu 格式试试。
Google 了一下,发现有 DjVuLibre 这么套工具。用法没能指望上 Google,还是老老实实地看 man 文档的。
首先,把一张张的 JPEG 图片转成一个个单页的 DjVu 文档。命令名字很奇怪,叫c44
(我还一不小心打成了c99
囧)。转换比较费 CPU,所以用parallel
来利用多核:
parallel c44 ::: *.JPG
然后当前目录下就出现了一堆与 JPEG 图片同名的.djvu
文件。
接下来,把这些文档合并起来。命令叫djvm
,m
想来指的是多页(multi-page)。
djvm -c doc.djvu *.djvu
这样就好啦。页面顺序是按照在命令行上给出的顺序。这里是按文件名排序的。看了看生成的doc.djvu
,只有 15M 耶。我对比了下 DjVu 文档和原图片的质量,在放大的时候还是能看到差了一些的,不过文本清晰得足够阅读就好啦。