Indexando PDF en SharePoint 2010
abr.
17
Escrito el:
17/04/2012
Funcionamiento en Sharepoint 2010
Hay varias configuraciones a mantener dentro de Sharepoint 2010:
Comparativa de IFilter
Según he podido ver en algunas comparativas, parece ser que el FoxIT es muchísimo más rápido que el de Adobe. De todos modos, uno de los motivos es porque el IFilter de Adobe no es multithreaded (en realidad, no es reentrante), por lo que usaremos un solo núcleo de nuestra CPU.
Por otra parte, el Plugin de Adobe es gratuito. Por lo tanto, esta decisión dependerá en gran medida del volumen de documentos que tengamos en las colecciones de sitios a indexar.
Podemos ver una gran comparativa de rendimiento entre los tres principales IFilter para PDF, aquí:
http://blogs.msdn.com/b/opal/archive/2010/02/09/pdf-ifilter-test-with-sharepoint-2010.aspx
¿Qué ocurre con PDF escaneados?
Para este tema, os recomiendo leer mi otra entrada: ¿Cómo indexar contenido de PDF escaneados en Sharepoint?
Referencias
Podemos descargar el Plugin de FoxIT (recordemos que es de pago para utilizarlo en servidores) aquí:
http://www.foxitsoftware.com/pdf/ifilter/
El IFilter de Adobe de 64 bits (imprescindible, puesto que Sharepoint 2010 corre todo en 64 bits):
http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025