主要設定 (Web 內容 Crawler)

要瞭解 crawler 和內容 Web 服務,請按一下此處

要指定要爬行的位置以及此 crawler 匯入文件的目的地資料夾和安全性﹕

  1. 要爬行的 URL 方塊中,鍵入要從中匯入內容的網站 URL。

  2. 爬行範圍下拉清單中,指定離您要爬行的目標頁面的最大連結數。例如,如果選擇 1,此 crawler 將嘗試匯入直接連結至目標頁面的每個頁面﹔如果選擇 2,此 crawler 將嘗試匯入直接連結至目標頁面的每個頁面,以及直接連結至這些連結頁面的每個頁面。

  3. 預設情況下,此 crawler 將建立在步驟 1 中所輸入頁面的連結。如果不想建立此頁面的連結,請清除匯入目標頁面核取方塊。例如,如果爬過搜尋結果,您可能不想匯入目標頁面(搜尋結果頁面),而要匯入每個連結頁面(每個結果)。

  4. 指定要將內容匯入到哪些資料夾。對於找到的每個文件的連結,crawler 嘗試將其匯入至目的地資料夾內允許傳遞該連結的最底層子資料夾。按一下此處可獲取顯示 crawler 如何確定將內容匯入哪些資料夾的流程圖。

  5. 為要求文件在匯入至目的地資料夾前通過這些資料夾的篩選器,請選擇套用目的地資料夾篩選器。預設情況下,文件無需通過目的地資料夾篩選器,因此所有文件都將匯入至所有目的地資料夾。

  6. 要將所有匯入的文件接受到入口網站中並立即供使用者使用,請選擇自動核准匯入的文件。預設情況下,文件需要經過核准。這表示在匯入文件的連結可供使用者使用前,它必須由至少對目的地資料夾具有編輯權限的入口網站管理員進行核准。

  7. 在「文件存取權限」下,您可以執行以下操作,以向使用者和使用者群組授與對此 Crawler 所匯入內容的存取權。


  1. 按一下系統管理
  2. 開啟 Web Crawler 編輯器﹕