Documentum y ocr de pdf-imagen, tiff, jpg

  • Iniciador del tema Anonymous
  • Fecha de inicio
A

Anonymous

Guest
Hola,

Soy responsable de Gestión Documental en una empresa mediana que usa Documentum.

Tenemos la necesidad de incorporar una gran cantidad de documentos escaneados como imágenes en pdf y tiff , pero queremos hacer búsquedas a texto completo (incluyendo nombres propios, marcas, códigos...) usando el propio motor de indexación de Documentum, por lo que deberíamos convertir dichos documentos a un fomento indexable (pdf texto?) y vincularlos al original.

¿Cual podría ser el mejor sistema para, en adelante, escanear dichos documentos de forma que pueda tener una "fotocopia" del original y, además, su contenido en formato modificable ?

Gracias
 

mmonreal

Curioso
Primero checa la versión de documentum que tienes.
La última versión como motor de búsqueda trae una herramienta llamada Fast la cual conozco poco.
Si es alguna versión anterior de documentum seguramente trae como motor de búsqueda Verity K2 en cuyo caso trae un filtro para pdf que se puede utilizar fácilmente.
Lo que yo he hecho es digitalizar todo en pdf. Estos pdfs que contienen los documentos digitalizados se componene por decirlo de alguna forma de 2 partes, la primera y la que ve el usuario es la imagen del documento y la segunda parte es todo el texto en ocr pero oculto en el mismo pdf.
De esta forma cuando buscas algo el motor de búsqueda es capaz de encontrar el texto ya que el pdf lo contiene y cuando visualizas un documento lo que vez es la imagen y dependiendo de como lo configures es capaz de resaltar el texto en la propia imagen

Salu2 y espero te sirva
 
A

Anonymous

Guest
Holas, nosotros tenemos Documentum 5.3 , el software de captiva y un scanner super poderoso, al scanear el archivo .pdf se va a una carpeta dentro del cabinet del ususario sin ningun problema
 

DCB

Curioso
Hola buenos días,

Mi nombre es Diego Cuevas Account Manager de EMC|Captiva, y actualmente dentro del grupo EMC incluimos tecnologías de captura y reconocimiento, de documentos, imágenes etc. Documentum y las aplicaciones de Captiva se integran por completo y responderíamos de manera muy eficiente a la necesidad que estáis planteando.

Adjunto mis datos de contacto para que te pongas en contacto conmigo y poder ampliarte información.

cuevas_diego@emc.com
618 54 81 80

Saludos.

Diego Cuevas.
 

VM

Curioso
Que tal, estoy en una empresa donde quieren adquirir documentum. ¿A que empresa vieron ustedes para que les desarrollara la aplicación?

GRACIAS
haasha":1xjwgxce dijo:
Hola,

Soy responsable de Gestión Documental en una empresa mediana que usa Documentum.

Tenemos la necesidad de incorporar una gran cantidad de documentos escaneados como imágenes en pdf y tiff , pero queremos hacer búsquedas a texto completo (incluyendo nombres propios, marcas, códigos...) usando el propio motor de indexación de Documentum, por lo que deberíamos convertir dichos documentos a un fomento indexable (pdf texto?) y vincularlos al original.

¿Cual podría ser el mejor sistema para, en adelante, escanear dichos documentos de forma que pueda tener una "fotocopia" del original y, además, su contenido en formato modificable ?

Gracias
 
Arriba