關於內容 Crawler

建立 crawler 可以從外部內容存放庫將內容匯入至您的入口網站。 您必須執行與 crawler 關聯的作業,以定期搜尋外部存放庫並尋找和匯入內容。 有關作業的詳細資訊,請參閱關於作業

注: Crawler 基於內容來源。 有關內容來源的資訊,請參閱關於內容來源

此主題討論以下資訊﹕

要瞭解如何建立或編輯系統管理物件(包括 crawler),請按一下此處

Web Crawler

Web crawler 允許使用者從 Web 將內容匯入至入口網站。

要瞭解 Web Crawler 編輯器,請按一下以下編輯器頁面之一﹕

遠端 Crawler

遠端 crawler 允許使用者將內容從外部內容存放庫匯入至入口網站。

一些爬行提供程式可隨入口網站一起安裝,並且可隨時供入口網站使用者使用,但其他提供程式則需要您手動安裝和設定。 例如,Plumtree 提供以下爬行提供程式﹕

注: 注﹕有關獲取爬行提供程式的資訊,請連絡客戶支援 有關安裝爬行提供程式的資訊,請參閱 Installation Guide for Plumtree Corporate Portal 或爬行提供程式隨附的文件,或者連絡您的入口網站管理員。

要建立遠端 crawler﹕

  1. 在入口網站電腦或其他電腦上安裝爬行提供程式。
  2. 建立遠端伺服器
  3. 建立內容 Crawler Web 服務(稍後討論)。
  4. 建立遠端內容來源
  5. 建立遠端 crawler。

要瞭解遠端 Crawler 編輯器,請按一下以下編輯器頁之一﹕

如果安裝了以下爬行提供程式,每個提供程式都至少包含一個遠端 Crawler 編輯器的附加頁面。

內容 Crawler Web 服務

內容 Crawler Web 服務允許您指定遠端內容存放庫的一般設定,而將目標安全性設定留在關聯的遠端內容來源和遠端 crawler 中進行設定。 這使您可以爬過同一內容存放庫的多個位置時不必重複指定所有設定。

注: 您可以建立作為遠端內容來源基礎的內容 Crawler Web 服務。 有關內容來源的資訊,請參閱關於內容來源

要瞭解內容 Crawler Web 服務編輯器,請按一下以下編輯器頁面之一﹕

匯入文件安全性

使用者可以自動獲得對某些遠端 crawler 所匯入內容的存取權。 全域 ACL 同步化對應確定了這些 Crawler 如何匯入源文件安全性。

有關如何匯入安全性的示例,請按一下匯入安全性示例

對爬行結果進行疑難排解

如果 crawler 未匯入預期內容,您應該檢查以下幾個方面﹕