本文的description和keywords字段內容是指網頁<meta name="description">和<meta name="keywords">標簽的content屬性內容,它們無法通過可視化窗口點選采集;
可通過以下方法配置解決(使用其中一個即可):
在簡數采集器的控制臺點擊 “+創建采集任務” 按鈕創建任務,按智能向導模式操作,詳情頁規則器的description和keywords字段系統會自動配置好。
2. 在詳情提取器,左側“字段定義”-》“添加”,從下拉字段中選擇description或keywords即可。
若使用 “+創建任務(高級)” 創建的任務,詳情頁規則器中無配置好的字段,需要用戶自定義配置;
或者用戶之前刪除了description和keywords字段,現需加回來;
這些場景可使用 “Xpath + 字段數據處理” 方法來解決:
點擊添加字段,并分別命名為description和keywords;
description字段的當前字段Xpath填上 //meta[@name="description"] (固定值,網頁通用);
keywords字段的當前字段Xpath填上 //meta[@name="keywords"] (固定值,網頁通用);
注意:填寫后記得點擊 “保存Xpath” 按鈕;
分別在description和keywords字段的字段數據處理 “高級配置” 選項卡中==》“提取值類型” 中選擇 “節點屬性(需填寫屬性名)”==》“屬性名” 中填寫content ;
注意:完成后記得點擊 “保存” 按鈕;