簡數采集器列表頁提取器的默認配置規則:獲取a標簽的href屬性值作為采集的鏈接網址,對于大部分網站都是適用的;
但有些網站不使用a標簽作為鏈接跳轉,而用javascript的onclick事件替代,那列表頁提取器的默認規則將無法獲取到鏈接網址。
先按常規配置,獲取鏈接跳轉的元素內容,再點擊url字段的設置進入字段數據處理界面;
選擇 “高級配置” 選項卡 ==》把 “只獲取網址” 勾去不選擇 ==》提取值類型選擇 “節點屬性” ==》屬性名填寫 onclick ==》保存
選擇 “日期等正則提取” 選項卡 ==》正則捕獲組處填寫 openW\('(.*)'\) ==》測試 ==》沒問題,保存。
如果是另一種 javascript:location.href 的常見方式,正則捕獲組處填寫href='(.+?)'