1、步骤1:创建新浪新闻采集任务1)进入主界面,选择“自定义采集”

3、步骤2:创建列表循环1)打开网页之后,鼠标选中第一个新闻列表的标题,系统会自动识别出其他相似的链接,然后在右面的提示框中选择“选中全部”

5、然后选择“点击该链接”。

7、之后选择“采集以下元素文本”

9、3)选中提取数据的步骤,鼠标点击“自定义数据字段”

11、勾选第二个选项,同一字段合并为同一行

13、2)在火狐浏览器中打开要采集的网页并观察源码。观察网页源码,修改此条Xpath为:“//p”, 将修改后的Xpath,复制粘贴到八爪鱼中所示位置,然后点击“确定”。

15、步骤5:新浪新闻数据采集及导出1)点击左上角的“保存”,然后点击“开始采集”,选择“启动本地采集”
