本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

点击左上方蓝字关注我们

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

最近,一个名为 Depix 的 GitHub 项目爆火,上线三天 star 量已经高达 6.9k。项目作者 Sipke Mellema 是一名信息安全顾问。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

使用 Depix 从像素化图像截图中恢复文字密码,操作也比较简单:

  • 从截图中分割出矩形像素化 block;

  • 在具有相同字体设置(包括文本大小、字体、颜色、hsl)的编辑器中,粘贴待处理字符的德布鲁因(De Bruijn sequence)。

  • 给该序列截图,尽可能使用和像素化图像相同的截图工具。

  • 执行命令:

Depix 算法利用线性方框滤波器单独处理每一个 block 这一事实。它对搜索图像中的每一个 block 执行像素化以寻找直接匹配。

对于大部分像素化图像,Depix 尽量寻找单匹配结果,并假设这些匹配是正确的。至于周围多匹配 block 的结果被看作像素化图像中相同的几何距离,并认为这些匹配也是正确的。该过程重复多次。

在正确的 block 没有更多几何匹配后,Depix 将直接输出所有正确的 block。对于多匹配 block,Depix 将输出所有匹配的平均值。像素化常使用线性方框滤波器实现。线性方框滤波器的实现很简单,速度很快,可以并行处理多个 block。

由于线性方框滤波器是一种确定性算法,对同样的值执行像素化通常会产生同样的像素化 block。使用同样位置的 block 对相同文本执行像素化,会得到同样的 block 值。我们可以尝试像素化文本来找出匹配的模式。幸运的是,这对于秘密值的一部分同样奏效。我们可以把每个 block 或 block 组合看作一个子问题。

项目作者没有选择创建潜在字体的查找表。该算法要求在相同背景上具备相同的文本大小和颜色。现代文本编辑器还会添加色调、饱和度和亮度,也就是说存在海量潜在字体。

项目作者给出的解决方案也很简单:使用待处理字符的德布鲁因序列,将其粘贴到相同的编辑器中,然后截图。该截图可以用作相似 block 的查找图像,例如:

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

创建字母的德布鲁因序列时加上空格显然会带来同样的问题:算法无法找到后续字母的恰当 block。有空格又有字母的图像需要更长的搜索时间,但结果也更好。

对于大部分像素化图像而言,Depix 似乎能够找到 block 的单匹配结果,并假设这是正确的。然后将其周围多匹配 block 的匹配结果看作在像素化图像中处于相同的几何距离,并假设这些匹配也是正确的。

在正确的 block 没有更多几何匹配后,Depix 直接输出所有正确的 block。对于多匹配 block,Depix 将输出所有匹配的平均值。虽然 Depix 的输出并不完美,但已经算不错了。下图展示了包含随机字符的测试图像的去像素化结果,大部分字符被正确读取:

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

最近,在GitHub Universe上,一款「暗黑」模式被推了出来。官方自称:「2020年宇宙新功能」。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!        

设置黑暗模式的地址如下:

https://github.com/settings/appearance

        

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!       

Dark Mode 一经宣布,就在reddit上面获得了4k的高赞,网友也纷纷:这是有史以来最好的体验!

        

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!       

此外,Github还发布了非常多的新特性,感兴趣的童鞋可以戳下方链接观看:

https://www.youtube.com/watch=AiWjanAdD3s&t=13m22s

信息来源:新智元

03

与AI一起书写未来,百度吴甜入选中国最具影响力的商界女性未来榜

 

12月1日,财富中文网公布了“2020年中国最具影响力的商界女性(未来榜)”榜单。该榜单由全球知名财经杂志《财富》中文版评选,上榜者代表了中国商界崛起的年轻一代女性领导者,她们在各自的机构、商界、社会扮演重要角色,并有潜力在未来产生更大的影响。凭借在人工智能领域的多年深耕及持续创新突破,百度集团副总裁吴甜荣耀上榜。这是对她在人工智能领域贡献的肯定,也是对其未来在AI领域创造更大成就的潜力的认证和激励。

“中国最具影响力的商界女性”自2004年评选至今,已经引起了社会广泛关注,格力电器董事长兼总裁董明珠、长城汽车公司总裁王凤英等均上榜。而此次是《财富》首次评选“中国最具影响力的商界女性(未来榜)”,除吴甜外,登上此榜单的还包括微软公司 SharePoint及Teams中国区总经理梁戈碧,InMobi公司高级副总裁、大中华区总经理杨娟等人。

吴甜作为百度集团副总裁,截至2020年已加入百度近15年。这期间,吴甜从百度知道研发起步到今年升任百度集团副总裁,经历了从PC互联网时代,到移动互联网时代,再到今天AI时代的发展,参与了AI创新建设的各个阶段,带领团队在人工智能重要方向上取得了大量业界领先的技术成果,并广泛应用于百度重要业务和产品。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

这个壮举同时宣告了两件事:困扰生物界50年的蛋白质折叠难题被破解了;生物制药或将成为AI最新的疆域。

近期,一家AI制药公司再度「破圈」走进大众视野:AccutarBio宣布完成近亿美金的新一轮融资,由依图科技、春华资本、鼎晖投资、IDG资本联合投资。

作为AccutarBio的A轮领投方,IDG资本合伙人周全对AccutarBio的评价说:「AccutarBio公司拥有着业界最强的AI+制药的综合团队,开发了业内领先的全套临床前AI解决方案,并有多个药物开发管线将于明年进入临床试验,成功地打通了从人工智能药物设计到临床候选分子的全路径。」

与AlphaFold类似,AccutarBio也是一个关键比赛的冠军缔造者——激酶抑制剂类药物亲和力预测挑战赛(DREAM Challenge),这是生物医药领域最具影响力的开放数据建模旗舰竞赛,对药物研发更具直接指导意义。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

而谷歌自然也不落后,在今年年初谷歌公布的一项研究结果显示「人工智能在乳腺癌检测方面的准确率做的比人类医生更高」。

在实践中,谷歌的研究发现,与人类医生相比,人工智能不仅准确率更高,而所需的信息也更少——有时仅依靠X射线图,就可以完成诊断。

在一个可期的未来中,全球数百万的患有乳腺癌的女性都能及时地发现乳腺癌并提早治疗。

除了互联网软件公司,各大硬件厂商也纷纷加入这一技术应用的大潮流,如「英伟达」和「英特尔」等公司。

英伟达作为全球第一的GPU厂商,也拿出了自己的看家本领,在图像识别上下足了功夫。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

kaggle 历时一个月,完成了此项调查报告

目前,最近调查报告已出炉。从这个报告中,我们可一览当前机器学习与数据科学从业者的全貌,以及相关企业在这方面的人员雇佣、资金投入状况等,一窥该行业最新发展趋势。

报告精炼版:数据科学er的群体画像

 性别、年龄与学历分布 

  • 该领域从业人员男多女少,男女比例约为 5:1

  • 35 岁是个分水岭,大部分受访者小于 35 岁

  • 一半以上的受访者拥有研究生学位

 教育背景和工作经验 

  • 大多数数据科学家走出校门后,仍坚持学习新技术

  • 大多数数据科学家编程时间少于 10 年

  • 一半以上的数据科学家,拥有机器学习的经验不足三年

  • 居住美国的数据科学家的工作薪水,明显比其他国家同行更多

 技术相关调查 

  • 相比 2019 年,使用云计算的数据科学家更多了

  • Scikit-Learn 是使用最多的机器学习工具,有 4/5 的数据科学家在用

  • Tableau 和 PowerBI 是最流行的商业智能工具

数据科学家从业者仍然存在巨大的性别比例失衡,超过八成都是男性。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

 

在参与此次 Kaggle 年度调查的数据科学家中,印度的数据科学家占 22%,而美国的占 14.5%,两者远远超过第三位的巴西(低于 5%)。

报告因为各项因素,并未将中国明确列入,但排名第三的 Other 的数量不低,也许是为纳入有效统计结果的中国用户。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

数据科学和机器学习正在迅速改变,所以受访者中,超九成仍会继续保持学习。其中,大约 30% 的人选择了传统的高等教育课程,更多的人则通过在线资源学习。

在本次调查中,Coursera、Udemy 和 Kaggle Learn 是最常见的学习平台。

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

编程经验对于数据科学家来说较为重要

kaggle 报告:

https://storage.googleapis.com/kaggle-media/surveys/Kaggle%20State%20of%20Machine%20Learning%20and%20Data%20Science%202020.pdf

信息来源:HyperAI超神经

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END

本周AI热点回顾:AI消除马赛克神器公布;Github黑暗模式正式发布;「中国AlphaFold」创生!

来源:飞桨PaddlePaddle

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年11月11日
下一篇 2020年11月11日

相关推荐