一、淘宝新店采集是什么?
淘宝新店采集是指,使用由淘宝提供的云服务集群进行数据采集。淘宝新店采集拥有5000+云服务器,7*24小时不间断运行。
我们在本地电脑上将任务配置完成,测试没有问题以后,可启动云采集,将任务交给淘宝新店采集的云服务集群去采集。
注意,旗舰版以上用户才有云采集功能。什么是旗舰版?点击查看 版本套餐 。
二、淘宝新店采集采集优势
与【本地采集】相比,【云采集】具有以下优势:
1、提高采集速度。云集群采用分布式部署方式,多节点同时采集,有效提高采集速度。
2、实现无人值守。可关闭电脑、软件进行数据采集,真正实现无人值守。
3、定时采集。云采集集群是7*24小时工作,可设置任务的定时采集。
4、数据自动入库。
5、通过数据导出API接口,实现秒级导出,无缝对接内部系统。
三、如何启动云采集
任务配置完成以后,有多种方式启动云采集。
1、在任务配置界面,点击【采集】,选择【启动云采集】。与本地采集不同,云采集的采集界面无法看到。
在【启动云采集】后,在【我的任务】中,找到此目标任务,可以看到,此任务正在运行云采集。
点击【详情】,可查看云采集采集过程,具体请看 云采集实况教程 。点击
按钮,可结束本次云采集。
云采集采集到的数据,会实时更新显示在图中所示位置。本示例【已采集到80条数据】。鼠标移动到【已采集到80条数据】上并点击,可查看数据详情。采集完成后,可以需要的形式导出。
2、也可直接在【我的任务】中,找到目标任务,点击
按钮,启动云采集。
四、设置定时云采集
可通过设置定时云采集,实时采集各网站更新的数据。
1、对单个任务设置定时云采集
找到目标任务,点击【更多操作】的
按钮,选择【云采集】-【设置定时】,会弹出一个【定时云采集】设置的弹窗。
支持多种定时方式:【只采集一次】【选择星期】【每月采集】【间隔时间采集】。请根据需求,选择定时方式。
本示例选择【间隔时间采集】,设置间隔时间为30分钟。
点击【保存并启动】,此任务将每间隔30分钟,自动启动一次云采集。
点击【保存】,将保存此任务的定时设置,但不会启动。需通过 【云采集】-【启动定时】手动启动。
2、对任务组设置定时云采集
通过【我的任务】进入任务列表,并以【任务组】形式展现任务。然后将鼠标移动到任务组名字上,会出现4个图标。点击
图标,为任务组设置定时。
接下来的操作,与对单个任务设置定时云采集相同,不再赘述。
来源:大数据淘金人
声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!