5
新手入门 功能点介绍

【智能模式】如何采集列表页+详情页类型的网页

2019-12-24 18:58:29
浏览 2459 次

摘要:本教程主要给大家介绍如何使用后羿采集器的智能模式采集列表页+详情页的数据。 免费下载软件

后羿采集器的智能模式的强大之处在于它不仅可以采集单页类型和列表类型的网页,还能够支持采集列表页+详情页的网页类型。

下面我们来详细介绍一下如何采集采集列表页+详情页内容。

第一步:采集列表页内容

更多详情内容,请参考以下教程:

如何采集列表类型的网页

第二步:深入采集

在第一步中,软件会识别出列表内容中的链接,用户也可以通过手动设置提取到链接,在此基础上,我们如果需要采集到链接对应的详情页的内容,需要用到深入采集功能。

更多详情内容,请参考以下教程:

如何设置深入采集

第三步:设置详情页数据

详情页的采集和单页类型的采集方式是一样的。

更多详情内容,请参考以下教程:

如何采集单页类型的网页

第四步:启动采集任务

字段设置完毕后便可以开始进行采集任务的设置和启动。

更多详情内容,请参考以下教程:

如何配置采集任务

详情页中设置的采集字段会自动添加到列表页上设置的字段之后。

分享到:
php爬虫 批量生成网址 网页内容关键字提取 批量下载图片 正则匹配邮箱 数据自动整理成excel 网页下载成word python爬虫 批量下载视频 python数据采集
关闭