進階設定 (Crawler)

要指定內容語言、對被拒絕文件執行的操作以及 crawler 標籤﹕

  1. 在「內容語言」下面的下拉清單中,選擇您要匯入的大部份內容所使用的語言。

  2. 在「被拒絕的文件」下,指定對未成功歸類到資料夾中的文件執行的操作﹕

  3. 如果是編輯現有的 crawler,您將看到「匯入文件」區段。在「匯入文件」下,指定是否僅匯入新文件。預設情況下,此 crawler 將會嘗試僅匯入新文件(即此 crawler 或其他存取同一內容來源的 crawler 先前尚未匯入的文件)。您可以變更 crawler 設定以匯入每個文件的多個複本,這在測試 crawler 時很有用。

    1. 要僅匯入新文件,請選擇僅匯入新連結,此時將會顯示新選項﹔否則請跳至步驟 4。

    2. 要指定新連結的含義﹕

    3. 注﹕此處選擇的選項會影響步驟 3f 和步驟 4 中的操作。

    4. 要根據文件設定頁面中指定的設定重新整理先前匯入的文件,請選擇重新整理它們。通常,重新整理文件是「文件重新整理代理程式」的作業﹔重新整理文件會降低 crawler 的速度。但是,如果變更了此 crawler 的文件設定或變更了所關聯內容類型中的屬性對應,則重新整理文件將更新先前已匯入文件的這些設定。

    5. 如果建立了其他資料夾或者對目的地資料夾套用不同篩選器,請選擇嘗試將它們歸類至其他資料夾,以將先前匯入的文件歸類至新的知識目錄資料夾。

      其他 crawler 可能已從同一個資料源匯入文件,但匯入的目的地資料夾與此 crawler 所指定的不同。請確保您確實要將這些文件重新歸類至此 crawler 所指定的目的地資料夾中。

    6. 要重新匯入先前已刪除(手動刪除、由於過期或遺失來源文件而刪除)的文件,請選擇重新生成已刪除的連結。這可能會重新匯入曾被認為不適於入口網站的文件。

    7. 如果確有必要,您可以刪除已從入口網站中刪除的文件的記錄。「歷史記錄」由您在步驟 3b 中指定的新文件標準而確定﹕

    8. 如果您仍確信必須刪除已從入口網站中刪除的文件的記錄,請按一下清除刪除歷史記錄

  4. 如果是編輯現有的 crawler,您將在「被拒絕的文件」下看到其他選項。在「被拒絕的文件」下,指定當此 crawler 找到先前被拒絕的文件時應執行的操作。「先前被拒絕」的定義也依賴於您在步驟 3b 中選擇的選項﹕

    1. 要使此 crawler 匯入先前被拒絕的文件,請選擇重新匯入

    2. 要刪除拒絕歷史記錄,請按一下清除拒絕歷史記錄。請記住,如果您在步驟 3b 中選擇了「由此資料源匯入的文件」,則您實質上是在刪除從此內容來源匯入文件的所有 crawler 的拒絕歷史記錄。

    注﹕如果文件未歸類到任何資料夾中,但已放入「未分類文件」資料夾中,則該文件不計為被拒絕的文件。被拒絕的文件是指未放入任何資料夾中的文件。

  5. 要使用 crawler 標記對匯入的文件加標記,請在使用下列 Crawler 標籤對匯入的文件進行標記文字方塊中鍵入標記。此標記用於區分由此 crawler 匯入的文件及由其他 crawler 匯入的文件。

  6. 在「執行時設定」下,請作如下設定﹕

這些欄位所允許的範圍可在 portalconfig.xml 檔案中設定。此處的設定值還會受到此 crawler 作業 Automation Server 中的最大允許引線的限制。


  1. 按一下系統管理
  2. 開啟 Crawler 編輯器﹕
  3. 在左邊的「編輯物件設定」下,按一下進階設定