网页采集过程中一二页重复循环解决办法

 时间:2024-10-12 07:53:56

1、很多用户在制作规则的时候,可能会遇到总是在一二页循环提取数据,而不会转到第三页的情况,这其实是由于Xpath定位不好导致的,我们需要通过修改Xpath来解决这个翻页问题。在出现这个问题的时候,我们可以直接在流程里面找到问题所在,下面的规则是直接按照新手入门的步骤做的。

网页采集过程中一二页重复循环解决办法

3、这个时候我们再点击流程图里面的循环,可以看到循环列表已经变成了上一页,这样系统再点击翻页的时候就会直接跳回第一页,提取第一页的数据,如此一直重复循环:

网页采集过程中一二页重复循环解决办法

5、我们凸鹣沮北把这个XPath复制到某狐浏览器里面去,发现在第一页是的确可以定位下一页的,但是在第二页就变了,可以看到这个XPath在火狐里面上一页和下一页都定醐蛑臀谁位了,因为八爪鱼自动识别的都是当前页面的XPath,系统没有翻到第二页不知道第二页的情况,所以我们翻页的XPath只有在第一页里面是正常的:

网页采集过程中一二页重复循环解决办法

7、手动在某狐浏览器里面直接老揉孟阼写,可以看到这个网页的下一页特点的,我们直接可以用text()函数,前面在XPath入门2里诹鬃蛭镲面给大家介绍过这个函数的意思,是一个文本函数,直接可以定位源码里面包含的文本,在火狐里面写成//A[text()='下一页']即可,然后将这条XPath再复制到采集器里面。

网页采集过程中一二页重复循环解决办法
  • iphone3gs使用MyWi创建WIFI个人热点
  • vf6.0设置编辑框对象 属性,最多输入 10个汉字
  • Mathematica数据可视化:[10]图形选项与样式 2
  • 笔记本电脑电池损耗的原因,你知道吗?
  • 怎样在阿里巴巴国际站上发产品
  • 热门搜索
    旅游百事通官网 邯郸旅游景点大全 雪乡旅游 黑龙江旅游景点大全 重庆旅游攻略三日游 旅游消费券 南京 旅游 崇明旅游 上海旅游局 以色列旅游