要指定內容語言、對被拒絕文件執行的操作以及 crawler 標籤﹕
在「內容語言」下面的下拉清單中,選擇您要匯入的大部份內容所使用的語言。
在「被拒絕的文件」下,指定對未成功歸類到資料夾中的文件執行的操作﹕
要匯入這些文件,請選擇匯入至未分類文件資料夾。
注﹕具有未分類文件存取權限的使用者可以使用「未分類文件」資料夾。要存取未分類文件,請在「目錄」功能表中按一下編輯目錄,並開啟未分類文件資料夾。您還可以按一下系統管理 | 選擇實用程式 | 存取未分類文件。
要避免匯入這些文件,請選擇不匯入。
如果是編輯現有的 crawler,您將看到「匯入文件」區段。在「匯入文件」下,指定是否僅匯入新文件。預設情況下,此 crawler 將會嘗試僅匯入新文件(即此 crawler 或其他存取同一內容來源的 crawler 先前尚未匯入的文件)。您可以變更 crawler 設定以匯入每個文件的多個複本,這在測試 crawler 時很有用。
要僅匯入新文件,請選擇僅匯入新連結,此時將會顯示新選項﹔否則請跳至步驟 4。
要指定新連結的含義﹕
要僅匯入此 Crawler 先前尚未匯入的文件,請選擇已由 Crawler 匯入的文件。
要僅匯入未從此 crawler 內容來源匯入的文件(由此 crawler、其他 crawler 或使用者手動匯入),請選擇由此內容來源匯入的文件。
注﹕此處選擇的選項會影響步驟 3f 和步驟 4 中的操作。
要根據文件設定頁面中指定的設定重新整理先前匯入的文件,請選擇重新整理它們。通常,重新整理文件是「文件重新整理代理程式」的作業﹔重新整理文件會降低 crawler 的速度。但是,如果變更了此 crawler 的文件設定或變更了所關聯內容類型中的屬性對應,則重新整理文件將更新先前已匯入文件的這些設定。
如果建立了其他資料夾或者對目的地資料夾套用不同篩選器,請選擇嘗試將它們歸類至其他資料夾,以將先前匯入的文件歸類至新的知識目錄資料夾。
其他 crawler 可能已從同一個資料源匯入文件,但匯入的目的地資料夾與此 crawler 所指定的不同。請確保您確實要將這些文件重新歸類至此 crawler 所指定的目的地資料夾中。
要重新匯入先前已刪除(手動刪除、由於過期或遺失來源文件而刪除)的文件,請選擇重新生成已刪除的連結。這可能會重新匯入曾被認為不適於入口網站的文件。
如果確有必要,您可以刪除已從入口網站中刪除的文件的記錄。「歷史記錄」由您在步驟 3b 中指定的新文件標準而確定﹕
如果您選擇「已由 Crawler 匯入的文件」,則歷史記錄將包括由此 crawler 匯入並已刪除的所有文件。
如果您選擇「由此內容來源匯入的文件」,則歷史記錄將包括由此內容來源匯入並已刪除的所有文件。因此,您實質上是在刪除從此內容來源匯入文件的所有 crawler 的歷史記錄。
如果您仍確信必須刪除已從入口網站中刪除的文件的記錄,請按一下清除刪除歷史記錄。
如果是編輯現有的 crawler,您將在「被拒絕的文件」下看到其他選項。在「被拒絕的文件」下,指定當此 crawler 找到先前被拒絕的文件時應執行的操作。「先前被拒絕」的定義也依賴於您在步驟 3b 中選擇的選項﹕
如果您選擇「已由 Crawler 匯入的文件」,則先前被拒絕的文件包括由此 crawler 匯入而被拒絕的所有文件。
如果您選擇「由此內容來源匯入的文件」,則先前被拒絕的文件包括由此資料源匯入而被拒絕的所有文件。
要使此 crawler 匯入先前被拒絕的文件,請選擇重新匯入。
要刪除拒絕歷史記錄,請按一下清除拒絕歷史記錄。請記住,如果您在步驟 3b 中選擇了「由此資料源匯入的文件」,則您實質上是在刪除從此內容來源匯入文件的所有 crawler 的拒絕歷史記錄。
注﹕如果文件未歸類到任何資料夾中,但已放入「未分類文件」資料夾中,則該文件不計為被拒絕的文件。被拒絕的文件是指未放入任何資料夾中的文件。
要使用 crawler 標記對匯入的文件加標記,請在使用下列 Crawler 標籤對匯入的文件進行標記文字方塊中鍵入標記。此標記用於區分由此 crawler 匯入的文件及由其他 crawler 匯入的文件。
在「執行時設定」下,請作如下設定﹕
最大文件提取引線 - 確定用於同時從內容來源中提取內容的最大引線數。
最大資料卡索引編排引線 - 確定在將內容搜尋到入口網站之後,用於同時處理內容的最大引線數。
這些欄位所允許的範圍可在 portalconfig.xml 檔案中設定。此處的設定值還會受到此 crawler 作業 Automation Server 中的最大允許引線的限制。
要顯示與此說明主題相關的頁面﹕