Panorâmica
O FineReader OCR é um componente de processamento que pode fazer o reconhecimento de caráter óptico nos arquivos de imagem escaneados. O uso primário deste componente é criar arquivos de dados pesquisáveis em um dos muitos formatos disponíveis. Isso dá uma qualidade mais precisa de OCR quando a variação de fonte entre os documentos escaneados é uma preocupação.
Você pode usar vários parâmetros de formatação e detecção para otimizar o FineReader OCR para as suas necessidades específicas. Este componenste suporta o uso de dicionários customizados e padrões do usuário para obter um melhor resultado do reconhecimento e OCR dividido em zonas para estender a funcionalidade do componente.
Use o FineReader OCR quando seu processamento requerer um OCR adaptativo independente de fontes com uma alta taxa de precisão. Este componente também pode produzir um arquivo de PDF buscável usando as definições de arquivo PDF padrão.
Para permitir o processamento de grandes quantidades de páginas, os processos do OCR podem juntar até 8 CPUs. Isso permite que se processe quantidades enormes de documentos em um só servidor. Além do mais, o motor oferece uma larga gama de funções como processamento de imagem integrado, dicionários do usuário e reconhecimento de zonas das imagens escaneadas.
Características
Formatos para salvar arquivos:
- Microsoft PowerPoint 2OO3/XP
- Rich Text Format
- Text; Unicode Text
- HTML; Unicode HTML
- DBF; CSV; Unicode CSV
- PDF (texto e fotos somente, somente imagem da página, texto sobre a imagem da página, texto de baixo da imagem da página.)
Funções de Processamento
- Suporta mais de 100 línguas.
- Suporta uma grande gama de dicionários.
- Faça um output dos resultados do OCR como um RRT (para fazer um mapa do texto reconhecido em um campo de base de dados)
- Reconhecimento de zonas nas páginas definidas, para extrair por exemplo: datas, números de faturas, etc.
- Larga gama de possibilidade de influenciar a formatação dos formatos de output, exemplo: influenciar a qualidade das imagens nas imagens de output, manter quebras de linha ou marcar campos PDF.
- Características de gerenciamento de imagens como tirar a distorção, tirar manchas, conversão de imagem ou rotação definida.
- Definição de dicionários específicos, exemplos: legal, médico, farmacêutico.
- Definição para o padrão do usuário para conseguir melhores resultados em imagens de baixa qualidade.