爬取众工业平台数据

爬取众工业平台数据

案例说明

本案例利用SYSWARE.IDE封装一个爬取众工业平台数据的APP,众工业网址为
http://www.indapps.com.cn/#
/emarket/technologyApp/index,网页截图如下图所示:

爬取众工业平台数据

众工业平台

用户只需要在模板界面输入众工业平台APP的类别,即可快速获取该类别下,所有APP的名字,价格,浏览量,产品ID以及购买次数等信息,同时本APP可以将爬取的信息数据自动保存到EXCEL文件中,如下图所示,表格数据为一键爬取的行业-制导武器类型的所有工业APP信息。

爬取众工业平台数据

爬取的数据

应用价值

爬虫的价值不言而喻,网络爬虫(web crawler)就是按照一定规则从互联网上抓取信息的程序,爬虫与用户正常访问信息的区别就在于:用户是缓慢、少量的获取信息,而爬虫是大量的获取信息。爬虫作为数据的来源,后面还有很多方向可以发展,比如可以往大数据分析、数据展示、机器学习等方面,如果利用SYSWARE.IDE将网站爬取程序封装起来,就可以让企业内部不精通编程的人才直接使用,从而避免大量重复劳动。

实施路径

1界面设计

本模板在界面设计时有3个重要技巧

技巧一:如何条件隐藏或显示界面中的控件

动图展示效果

爬取众工业平台数据

实现目标:要求选中专业时,仅显示专业选择下拉列表列;选中产品时,仅显示产品下拉列表选择列;选中行业时,仅显示行业选择下拉列表列。

实现方法:

以专业为例,产品,行业的实现方法相同。

设置专业控件的选中属性,添加专业下拉列表可见属性为True,行业布尔属性为选中为False,产品布尔属性选中我False,如下图所示:

爬取众工业平台数据

设置专业控件的未选中属性,添加专业下拉列表的可见属性为False,如下图所示:

爬取众工业平台数据

技巧二:如何条件选中或者取消选中

动图展示效果

爬取众工业平台数据

实现目标:要求全部,免费以及收费三个控件仅有一个为选中状态。

实现方法:

以全部控件为例,收费与免费控件的属性设置方法相同。

设置全部控件的选中事件,收费选中属性为False,免费选中属性为False.

爬取众工业平台数据

技巧三:如何动态生成列表集合

动图展示效果

爬取众工业平台数据

实现目标:要求,点击下拉列表时,能自动实时爬取网站平台的所有分类标签,爬取对象如下图所示:

爬取众工业平台数据

爬取对象

实现方法:

以行业为例,专业与产品的动态获取分类标签方法相同。

首先创建一个数组类型参数,用于存放爬取到的分类标签集合;

爬取众工业平台数据

其次,利用Python组件,编写一个自动从网页获取标签名的代码,将爬取到的标签名集合industry_list传递给行业结合,这样就可以实现动态爬取。

爬取众工业平台数据

2程序设计

流程包括控制流程和数据流程创建,如下图所示:

爬取众工业平台数据

控制流程图

3参数设计

爬取众工业平台数据

参数设计表

产品展望

本案例介绍了SYSWARE.IDE在人工智能方面的一个简单应用, 说明IDE平台不仅仅可以封装工程应用软件,也可以封装AI领域的APP,当然这离不开Python组件的支持。

来源:工业技术软件化

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年5月26日
下一篇 2019年5月26日

相关推荐