pdf indexado

  • Iniciador del tema Anonymous
  • Fecha de inicio
A

Anonymous

Guest
hola como estan?
Necsito saber que es un pdf indexado, y como puedo crear uno, si alguien me puede ayudar escribanme un correo a melirb@gmail.com.

Gracias
 
A

Anonymous

Guest
no se trata de ningún nuevo formato de pdf, un pdf indexado se refiere a un pdf que ha sido indexado/guardado/almacenado en un sistema de búsqueda como Autonomy o Ultraseek, si luego en un buscador bajo el sistema que tuvieses buscases ese documento como si una busqueda en google se tratase, encontrarás ese pdf, dándote la url hacia el. Es un tema engorroso pero espero que te haya quedado algo más claro.
O igual te están pidiendo que le metas metadatos al pdf para luego indexarlo/indizarlo y buscarlo más facilmente...???
 

jsanca

Curioso
No se si viene mucho al caso, pero yo indexo los PDF con PDFBox y Lucene gestor del Indice, solucion 100% java.

Esta indexacion no se da por metas, si no se indexa el texto completo (bueno menos palabras de parada e insignificantes).
 

fbonillo

Curioso
Un PDF indexado, realmente no es nada, sino que cuando tu integras un documentos PDF dentro de un gestor documental tal como Alfresco, este gestor busca los metadatos de este documento, y a través de estos datos es cuando crea la indexación, para poder localizar ese documento.
Cuando tu haces una busqueda en el gestor, sobre cualquier texto que aparece dentro del PDF, este te devuelve el documento.
 
Arriba