如果需要采集的內容不都在詳情頁,部分在詳情頁的分頁或下級頁面(跳轉子頁面)中,例如內容分頁,下載頁,多選項卡頁等,可使用簡數采集器的分頁采集功能來解決,具體使用方法如下:
簡數采集器實現內容分頁采集,只需簡單幾步配置采集分頁區域即可,操作步驟如下:
1)在詳情頁提取器,先完成正文內容(content字段)的基礎采集配置;
2)勾選content字段的【該字段內容有多分頁】選項;
3)啟用【分頁點選開關】 (顯示 √ 標志),然后點選分頁所在區域,保存完成配置;
當采集內容在詳情頁內的鏈接指向頁面時(即下級頁面,例如下載頁、多選項卡頁等),可按以下操作獲取:
在詳情頁提取器中,勾選對應字段的【該字段內容有多分頁】選項 -》啟用【分頁點選開關】 (顯示 √ 標志),然后選擇包含下級頁面跳轉鏈接的區域。
比如下圖,課程介紹是詳情頁,還需要采集章節目錄頁里的內容,對應字段分頁區域則應選擇包含章節目錄跳轉鏈接的區域。
在瀏覽器訪問跳轉頁面鏈接(如章節目錄頁面),獲取要采集的目錄內容區域的xpath值:
//*[@class="chapter-ul"]
備注:如何獲取xpath值可查看《Xpath常見語法使用詳細教程》。
在簡數采集器詳情頁提取器對應字段的當前字段Xpath處,填寫下級頁面內容的xpath值://*[@class="chapter-ul"],保存后測試采集,檢查效果。