Para especificar el idioma de contenido, lo que se tiene que hacer con los documentos rechazados y una etiqueta de rastreador:
En Idioma de contenido, en la lista desplegable, elija el idioma en que está escrito la mayor parte del contenido que desea importar.
En Documentos rechazados especifique lo que hará con los documentos que no se clasifiquen correctamente en una carpeta:
Para importar estos documentos de todos modos,
elija Importar en la carpeta Documentos
sin clasificar.
Nota: la carpeta Documentos sin clasificar está a disposición
de los usuarios con acceso
a documentos sin clasificar. Para acceder a los documentos sin clasificar,
en el menú Directorio, haga clic en Editar
directorio y abra la carpeta Documentos
sin clasificar. También puede hacer clic en Administración
| Seleccionar utilidades
| Acceso a documentos sin clasificar.
Para impedir la importación de estos documentos, elija No importar.
Si está editando un rastreador existente, aparecerá la sección Importando documentos. En Importando documentos, especifique si sólo se importarán documentos nuevos. De forma predeterminada, este rastreador intenta importar únicamente los documentos nuevos (los que no ha importado anteriormente este rastreador u otros rastreadores que acceden a esta misma fuente de contenido). Puede cambiar la configuración de rastreador para importar varias copias de cada documento, lo que puede resultar útil mientras se prueban los rastreadores.
Para importar sólo documentos nuevos, seleccione Importar sólo vínculos nuevos y aparecerán nuevas opciones; de lo contrario, vaya al paso 4.
Para especificar lo que significa vínculos nuevos:
Para importar sólo los documentos que este rastreador no ha importado anteriormente, elija por este rastreador.
Para importar sólo los documentos que no se han importado de la fuente de contenido de este rastreador (por este rastreador, otro rastreador o manualmente por un usuario), elija de esta fuente de contenido.
Nota: la opción que elija aquí afecta a las acciones de los pasos 3f y 4.
Para actualizar los documentos importados anteriormente según lo especificado en la página Configuración de documento, seleccione actualizarlos. Por lo general, la actualización de documentos es tarea del agente de actualización de documentos; la actualización de documentos ralentiza al rastreador. Sin embargo, si ha cambiado la configuración de documento para este rastreador o ha cambiado las asignaciones de propiedad en los tipos de contenido asociados, al actualizar los documentos se actualiza esta configuración para los documentos importados anteriormente.
Si ha creado carpetas adicionales o ha aplicado
filtros distintos a las carpetas de destino, seleccione intentar
ordenarlos en carpetas adicionales para clasificar los documentos
importados anteriormente en nuevas carpetas del directorio de conocimientos.
Otro rastreador puede haber importado documentos de la misma fuente
de datos pero en carpetas distintas de las de destino especificadas para
este rastreador. Asegúrese de que realmente desea volver a clasificar
estos documentos en las carpetas de destino especificadas para este rastreador.
Para volver a importar los documentos que se han eliminado anteriormente (manualmente, porque han caducado o porque faltan documentos fuente), seleccione regenerar vínculos eliminados. De este modo se pueden volver a importar documentos que en otro momento no parecían adecuados para el portal.
Si es absolutamente necesario, puede eliminar el registro de los documentos que se han eliminado del portal. El “historial” se define por lo especificado como documentos nuevos en el paso 3b:
Si ha elegido “por este rastreador”, el historial incluye todos los documentos importados por este rastreador que se han eliminado.
Si ha elegido “de esta fuente de contenido”, el historial incluye todos los documentos importados de esta fuente de contenido que se han eliminado. Por lo tanto, fundamentalmente está eliminando el historial de todos los rastreadores que importan documentos de esta fuente de contenido.
Si aún está seguro de que debe eliminar el registro de los documentos eliminados del portal, active Borrar historial de eliminaciones.
Si está editando un rastreador existente, aparecerán opciones adicionales en Documentos rechazados. En Documentos rechazados, especifique lo que sucederá cuando este rastreador encuentre un documento rechazado anteriormente. De nuevo, la definición de “rechazado anteriormente” depende de la opción que haya elegido en el paso 3b:
Si ha elegido “por este rastreador”, los documentos rechazados anteriormente incluirán todos los documentos rechazados por este rastreador.
Si ha elegido “de esta fuente de contenido”, los documentos rechazados anteriormente incluirán todos los documentos rechazados de esta fuente de contenido.
Para que este rastreador intente volver a importar los documentos rechazados, active Volver a importar.
Para eliminar el historial de rechazos, haga clic en Borrar historial de rechazos. Recuerde que si ha elegido “de esta fuente de contenido” en el paso 3b, fundamentalmente está eliminando el historial de rechazos de todos los rastreadores que importan documentos de esta fuente de contenido.
Nota: si un documento no se clasifica en ninguna carpeta, pero se coloca en la carpeta Documentos sin clasificar, no cuenta como rechazado. Los documentos rechazados son los que no se han colocado en ninguna carpeta.
Para marcar los documentos importados con una etiqueta de rastreador, escriba una etiqueta en el cuadro Marcar los documentos importados con la siguiente etiqueta de rastreador. Esta etiqueta se utiliza para diferenciar los documentos importados por este rastreador de los importados por otro.
En Configuración del tiempo de ejecución, establezca lo siguiente:
Subprocesos máximos de búsqueda de documentos: determina el número máximo de subprocesos simultáneos que buscan contenido de la fuente de contenido.
Subprocesos máximos de indización de tarjetas: determina el número máximo de subprocesos simultáneos que se utilizan en el procesamiento del contenido una vez se ha rastreado en el portal.
Los intervalos permitidos para estos campos se establecen en el archivo portalconfig.xml. Los valores establecidos aquí también están limitados por el máximo de subprocesos permitidos en el Automation Service utilizado por este trabajo de rastreador.
Para mostrar la página asociada a este tema de ayuda: