Un iFilter es una interfaz de componentes COM que permite a cualquier desarrollador de software construir un interfaz que permite que los servicios de indexación de Windows (Windows Vista, Windows 7, Sharepoint, etc), acceder al contenido de un documento para poder indexar correctamente sus contenidos en texto plano.
Si habéis leído mi post sobre cómo indexar PDF en Sharepoint, probablemente os surja una segunda cuestión. ¿Qué ocurre si los PDF que estamos indexando contienen simplemente imágenes escaneadas?
En este caso, tenemos un requisito: generar dentro del archivo PDF una “Text Layer” que incluya el texto pasado por OCR. Esto permitiría leer al PDF IFilter el contenido y por tanto, indexar correctamente el contenido.