Maxcompute让骑时更轻松

点击有惊喜

2017云栖大会dataworks专场,数加平台&DataWorks研发负责人王贲带来dataworks的演讲。主要讲了dataworks缘起何处,进而讲解了数据集成和数据研发,着重介绍了数据治理,最后作了简要总结。
以下是精彩内容整理:

缘起

阿里巴巴从2009年开始从hadoop搭建数据平台体系,数据工场与以前体系一脉相承,有了数据工场后,大家不用再自建数据工场,数据平台会建立一个云服务。
从自建水电煤厂->水电煤成为基础设施服务;从自建IT数据中心->使用云计算服务,云计算本质上解决了运维问题;从自建大数据平台->使用云数据平台服务;数据工场(DataWorks),你值得拥有!

2


图中列出了阿里大数据平台涉及的所有领域,做到:
存:数据大集中,MaxCompute统一存储和计算;
通:统一规范,打通各个业务部门,推动数据开放和交换;
用:数据化运营,运营数据;

数据工场(DataWorks)产品架构

4


DataWorks-八大模块-数据资源平台如图,底部为阿里主打的几个计算平台,数据汇聚即数据集成,比如阿里内部每天吞吐量为几百T数据,数据产品的数据开发、监控运维、资产管理质量安全等,平台管理采用多租户模型、账号权限体系,以及计量计费。
1)与其他BU合作方合作方式。说明:有开放合作方式且可行。
2)与其他产品也有重合。A:规划中的与已有产品有重合的点。B:可差异化合作的点,突出对方现在有两个差异化点,再造全部的轮子。

数据集成

6


阿里调度有数百万规模,位居全国第一。数据同步sql、mr、shell和机器学习,我们把机器学习和大数据开发任务做成一个有向无环图进行任务调度。

8


元数据中心分为离线和实时统一,有了统一的元数据中心才能从智能监控告警到数据治理到数据血缘探查,包括数据地图和元数据服务。

10


图为云上数据流转全链路保护方案。我们是个开放的体系,数据安全要求很高,因此有数据安全保护伞这样一个单独模块,这个模块是可以集成在dataworks里面整合一起使用。

点击有惊喜

Maxcompute让骑时更轻松

来源:weixin_40674835

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年1月9日
下一篇 2018年1月9日

相关推荐