5
新手入门 功能点介绍

【流程图模式】如何设置分页

2019-12-25 17:21:19
浏览 86 次

摘要:本教程为大家介绍如何在流程图模式中设置页面类型。 免费下载软件

在设置采集任务的过程中,用户会遇到多种多样的网页,一般可以分为三种:一种是直接有分页按钮的网页,一种是瀑布流类型的网页,还有一种是分页+瀑布流类型的网页。

1. 页面中有可点击的分页按钮(例如“下一页”或“点击加载更多”)

这种网页是最常见的一种分页类型,在提取列表元素后,软件会提示是否需要自动翻页采集。如果用户只采集单页数据,则不需要设置分页循环。

在点击需要设置分页循环之后,软件会提示所识别到的分页是否正确,如果点击正确按钮,软件会配置好循环组件。

具体如下动图所示:

如果软件识别的分页按钮不够准确,用户可以点击“不正确,重新设置分页”按钮,跳转到新的操作框选择“分页按钮”,然后手动点选页面上的分页按钮完成手动设置。

如果手动点选分页按钮还是无法识别到准确的分页xpath,用户可以在翻页循环中手动修改分页xpath。

2. 页面中没有可点击的分页按钮(滚动页面即可加载)

在瀑布流的网页,提取列表数据之后,由于页面上没有分页按钮,此时操作提示框会提示未识别到分页。

此时用户可以点击“设置分页”按钮,跳转到新的操作框点击“瀑布流分页(滚动加载)”按钮,软件会自动设置瀑布流类型的翻页循环。

3. 需要滚动网页才能出现分页按钮的网页(瀑布流+分页)

1)分页按钮需要滚动才会出现的网页

有些网页的分页按钮不会直接出现在第一屏的界面上,需要滚动页面才会出现分页按钮,我们提取数据并确定需要设置分页循环之后,此时操作提示框会提示未识别到列表。

此时用户可以点击“设置分页”按钮,跳转到新的操作框点击“滚动加载+分页按钮”按钮,软件会跳转到新的操作提示框。

如果按照上述设置无法识别到准确的分页xpath,用户可以在翻页循环中手动修改分页xpath。

2)分页按钮能直接识别到但需要加滚动条才能采集数据

有些网页能够直接识别出分页列表,但是需要添加滚动条之后才能采集数据,在我们提取数据列表识别到分页之后,设置“不正确,重新设置分页”。

在跳转到新的操作框上点击“滚动加载+分页按钮”按钮,接着软件会跳转到新的操作提示框。

具体如下动图所示:

如果按照上述设置无法识别到准确的分页xpath,用户可以在翻页循环中手动修改分页xpath。

分享到:
php爬虫 正则匹配邮箱 网页内容关键字提取 批量生成网址 数据自动整理成excel 批量下载图片 python数据采集 网页下载成word python爬虫 批量下载视频
关闭