5
新手入门 功能点介绍

采集到的数据重复怎么办?

2022-12-28 09:17:47
浏览 1861 次

摘要:关于“采集到的数据重复怎么办?”问题的回答。 免费下载软件

问题:

采集到的数据重复怎么办?

回答:

1. 请确认你已经看过视频教程,你的采集任务没有页面类型的设置问题,即错把单页类型设置为列表类型,或是你错误地理解了循环采集的使用方法。

2. 软件本身也有数据去重的功能。可以启动该功能之后看看情况是否有好转。

关于数据去重的设置请参考教程:

如何设置数据去重

3. 请确定你是多次反复采集数据出现重复还是某一次单独采集出现了重复数据。

在未修改采集任务时,每一次运行采集任务都是从头开始采集,所以每一次采集的数据都是重复的,这是正常的。

如果是在单次采集时出现了重复数据,请确认是否满足以下情况:

第一种:重复数据均为最后一页的数据,这种有可能是翻到最后一页未能停止翻页,请尝试修改采集范围,然后看是否还会出现重复数据的情况。

第二种:重复数据为中间页的数据,这种情况无法直接得出结论。

以上两种情况下,都请上传你的采集任务到帮助中心,我们的客服会帮您进行测试分析。

分享到:
php爬虫 批量下载视频 网页下载成word 批量生成网址 批量下载图片 数据自动整理成excel python数据采集 正则匹配邮箱 python爬虫 网页内容关键字提取
关闭