Djvu (Déjà Vu, do francês) é um formato para distribuição de documentos
com foco na web. Pode substituir com vantagens formatos como PDF, PS, TIFF,
etc para a distribuição de documentos scaneados, documentos digitais ou
imagens de alta resolução.
Originalmente desenvolvido nos Bell Labs da AT&T, a partir de 1995, o formato
hoje está sendo comercialmente explorado pela empresa Lizardtech e ao mesmo
tempo sendo desenvolvido, como software aberto, pelo projeto DjVuLibre,
conduzido pelos próprios inventores da tecnologia.
Um arquivo digitalizado, em formato PDF, ocupa 20MB, já o mesmo arquivo, no
formato djvu ocupa apenas 4MB, um quinto do total. Outra grande vantagem em
relação à outros formatos, o download não é feito do documento inteiro, mas
de suas partes. No caso do PDF você só consegue ver o documento após o
download dos 40MB. Já com o djvu as páginas são carregadas individualmente, o
que gera um tempo de espera equivalente à carga de uma página html normal,
talvez um pouco mais.
Outra coisa interessante, acoplando-se o djvu a um software de reconhecimento
de caracteres, é possível fazer busca textual. O software de OCR empregado, o
Clara OCR, que embora ainda não faça um reconhecimento 100% dos caracteres,
certamente contribui para exibir inequivocamente a eficácia de tal solução.
O software Clara OCR, desenvolvido por Ricardo Ueda
(
http://www.ime.usp.br/~ueda/), é
licenciado sob a GPL e pode ser baixado no endereço
http://www.claraocr.org.
Como o PDF, o DjVu exige um visualizador para a sua leitura. O visualizador
é gratuito e pode ser instalado como um plugin nos browsers mais comuns.
Visualizadores para Windows, Mac e
Linux encontram-se no site da LizardTech,
Inc. Downloads em:
Para sistemas Unix, o projeto DjVuLibre disponibiliza visualizadores com o
programa fonte. Existem ainda pacotes binários para as principais distribuições
do Linux. Alguns deles são:
Utilitários sofisticados para criar e manipular arquivos DjVu estão
comercialmente disponíveis. Estão disponíveis também excelentes
utilitários com código aberto no
projeto DjVuLibre. Estes utilitários incluem programas para manipulação das imagens
e dos textos, implementando, inclusive, algumas interfaces em XML. Um
pacote Debian com binários de alguns dos programas de desenvolvimento é o
djvulibre-dev.
Segue abaixo um tutorial para criação de documento .djvu: