Gooseeker软件使用教程

因为课程需要使用到Gooseeker软件,写个使用教程防止以后忘记

  1. 安装好gooseeker软件,下图为安装好的界面:
    Gooseeker软件使用教程
  2. 在左上方的网址栏输入想要爬取的网站,我这里输入天气网站(http://tianqi.2345.com/wea_history/57516.htm),并在工作台里面创建任务,进行命名和查重,直到可以使用:
    Gooseeker软件使用教程
  3. 点击“抓取内容”中自己的命名的一栏,选中点击右键,选择“添加”,选择“包容”:
    Gooseeker软件使用教程
  4. 在“浏览器”窗口中点击你想要获取的内容,比如现在要获取“日期”,就在“日期”那个区域进行鼠标点击,这时候MS谋数台会自动定位“日期”,即在HTML中结点的DIV结点位置。展开结点,找到text结点,右击鼠标,选择内容映射,然后选择你想要映射至的抓取内容:
    Gooseeker软件使用教程
  5. 创建爬虫路线,点击工作台标题栏中的“爬虫路线”,点击“新建”:
    Gooseeker软件使用教程
  6. 创建记号定位编号,在游览器中点击上一月,在网页标签里会自动该文本定位的结点,打开该结点,可以看到text属性,右击text(此处只能右击text,不能右击结点),选择 “翻页映射”,“ 作为翻页记号”:
    Gooseeker软件使用教程
  7. 分别找到该页面想要爬取的第一条数据的日期栏和第二条数据对应的日期栏的节点,右击第一条数据的日期栏对应的结点,选择“样例复制映射”,“第一个”,右击第二条数据的日期栏对应的结点,选择“样例复制映射”,“第二个”:
    Gooseeker软件使用教程
  8. 点击工作台左方的测试,对当前的规则进行测试:
    Gooseeker软件使用教程
  9. 打开“DS打数机”,“DS打数机”在Gooseeker浏览器中的右上方,打开“DS打数机”,点击“文件”,“存储路径”,“ 自定义数据的存储路径”:
    Gooseeker软件使用教程
    Gooseeker软件使用教程
    Gooseeker软件使用教程
  10. 用EXCEL打开其中一个文件,可以看到爬取的数据集,数据爬取完成:
    Gooseeker软件使用教程

来源:番茄不是嘻嘻嘻红柿

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年10月6日
下一篇 2019年10月6日

相关推荐