【流程图模式】如何利用依次点击采集详情页。
摘要:本文将简单说明如何使用后羿采集器的流程图模式通过设置依次点击来采集详情页的数据。 免费下载软件
本文将简单说明如何使用后羿采集器的流程图模式通过设置依次点击来采集详情页的数据。
1.复制目标网站链接。
2.创建流程图模式任务。
3.使用流程图模式的操作提示识别列表和翻页按钮。
4.点选网页中带有链接的数据(一般是商品的商品名,文章的标题等),操作提示中选择“依次点击全部同类元素”。
5.软件会自动生成一个点击组件,选中该组件,右侧组件设置“点击后打开新标签”中选择“否”。
6.右下角保存任务设置。
7.“保存成功”后关闭任务编辑界面。
8.任务列表中双击重新打开任务进入编辑界面。此时能看到组件在自动运行过后,详情页能正常打开了。
9.利用操作提示识别提取详情页数据。
10.启动任务开始采集。
至此,利用依次点击来采集详情页数据的操作已经全部介绍完毕。接下来介绍一种特殊情况:采集时软件未能从详情页正常返回至列表页,导致只能采集到第一个详情页的数据。针对这种情况有两种方法可以解决。
方法一:如果详情页本身有关闭按钮/返回按钮,建议在详情页的提取数据组件之后添加一个点击组件,识别详情页的关闭按钮/返回按钮。这样软件在运行完详情页的数据提取之后就会将该详情页关闭,然后采集下一个详情页。
方法二:如果详情页本身没有关闭按钮/返回按钮,可以手动拖拽添加一个后退组件在详情页的提取数据组件之后。这样软件在运行完详情页的数据提取之后就会自动返回列表页,然后采集下一个详情页。