朋友,你在用火车头吗?
下面我们来谈谈火车头分页采集规则的设置,一看就会,其实一点也不难。
首先,内容标签的规则要填写好,确保能采集到每页的内容,否则分页规则填写再好,也是采集不到内容的,主要是开始字符串和结束字符串需要填写正确。
然后,分页区域设置需要填写正确,“全部列出模式”和“上下页/上n页上n页模式”这2种模式可任选一种测试一下,
“从”:(这里填写源代码中分页区的开始字符串,通常是<P align="center">或<div>)
“到”:(这里填写源代码中分页区的结束字符串,通常是</P>或</div>)
最后点选“自动识别分页”(或点选手动填写分页连接规则),
“分页内容合并连接代码”可以填写“<br><br>”。点选“测试”即可。
点选手动填写分页连接规则时:
分页连接式样:(填写分页网址的样例,通常是相对网址,变量用[参数]替换,例如/meinv/2/168.html就填写/meinv/2/[参数].html)
分页网址:(填写上面分页连接式样网址的实际网址,是绝对网址,变量用[参数1]替换,例如http://www.yahoo.com/meinv/2/168.html就填写http://www.yahoo.com/meinv/2/[参数1].html)
点选“测试”即可。