建立 crawler 可以從外部內容存放庫將內容匯入至您的入口網站。 您必須執行與 crawler 關聯的作業,以定期搜尋外部存放庫並尋找和匯入內容。 有關作業的詳細資訊,請參閱關於作業。
注: Crawler 基於內容來源。 有關內容來源的資訊,請參閱關於內容來源。
此主題討論以下資訊﹕
要瞭解如何建立或編輯系統管理物件(包括 crawler),請按一下此處。
Web crawler 允許使用者從 Web 將內容匯入至入口網站。
要瞭解 Web Crawler 編輯器,請按一下以下編輯器頁面之一﹕
遠端 crawler 允許使用者將內容從外部內容存放庫匯入至入口網站。
一些爬行提供程式可隨入口網站一起安裝,並且可隨時供入口網站使用者使用,但其他提供程式則需要您手動安裝和設定。 例如,Plumtree 提供以下爬行提供程式﹕
注: 注﹕有關獲取爬行提供程式的資訊,請連絡客戶支援。 有關安裝爬行提供程式的資訊,請參閱 Installation Guide for Plumtree Corporate Portal 或爬行提供程式隨附的文件,或者連絡您的入口網站管理員。
要建立遠端 crawler﹕
要瞭解遠端 Crawler 編輯器,請按一下以下編輯器頁之一﹕
如果安裝了以下爬行提供程式,每個提供程式都至少包含一個遠端 Crawler 編輯器的附加頁面。
Windows NT File(包括在入口網站軟體中)
內容 Crawler Web 服務允許您指定遠端內容存放庫的一般設定,而將目標和安全性設定留在關聯的遠端內容來源和遠端 crawler 中進行設定。 這使您可以爬過同一內容存放庫的多個位置時不必重複指定所有設定。
注: 您可以建立作為遠端內容來源基礎的內容 Crawler Web 服務。 有關內容來源的資訊,請參閱關於內容來源。
要瞭解內容 Crawler Web 服務編輯器,請按一下以下編輯器頁面之一﹕
使用者可以自動獲得對某些遠端 crawler 所匯入內容的存取權。 全域 ACL 同步化對應確定了這些 Crawler 如何匯入源文件安全性。
有關如何匯入安全性的示例,請按一下匯入安全性示例。
如果 crawler 未匯入預期內容,您應該檢查以下幾個方面﹕
確保資料夾篩選器能夠正確篩選內容。 要瞭解篩選器測試,請參閱「主要設定(篩選器)」頁面上的測試篩選器。
確保 crawler 未將不需要的內容放入目標資料夾。 如果文件未被篩選至任何子資料夾,則 crawler 可能會將該文件放入目標資料夾。 這取決於資料夾編輯器主要設定頁面中的一項設定。
確保 crawler 未將內容放入「未分類文件」資料夾。 如果無法將某文件放入任何目標資料夾或子資料夾,則 crawler 可能會將該文件放入「未分類文件」資料夾。 這取決於 Crawler 編輯器進階設定頁面中的一項設定。 如果您權限正確,則可在編輯「知識目錄」時檢視「未分類文件」資料夾,或透過按一下系統管理 | 選擇實用程式|存取未分類文件檢視。
確保您對目標資料夾至少具有編輯權限。
對於 Web crawler,確保自動排除協定以及任何排除或包含操作不會妨礙 crawler 匯入預期內容。 這取決於 Crawler 編輯器「網頁排除」頁面中的一項設定。
確保關聯內容來源中指定的驗證資訊允許入口網站存取內容。
更多相關資訊,請檢視作業歷史記錄。