青春有你,成长同行——2022《大数据实践课》成果展示

9d10d9831f6c2526e8cf611bec0c4589.png

图1.经典机器学习方法分类结果

43e4fd926cb10d5177875908c4a62c52.png

图2.ResNet+时频图分类混淆矩阵

391c5e3d4e502896afca16abab6fe27b.png

图3.ResNet+时频图类别激活映射图

同学们的收获

?高祥:对于工科学生而言,大数据实践课给我提供了一个将自身专业知识与智能化大数据方法相互结合的契机。风力发电机的故障诊断自带大量真实情况下的样本数据,这在工业应用场景中非常难得。能够在大体量的真实工业数据上应用新方法,有种酣畅淋漓的感觉。

?范祥祺:大数据实践课提供了一个很好的平台,一方面使我能够在短短的两个月内对机器学习和深度学习的一些典型方法有了一个初步的了解,另一方面各个小组一起汇报答辩的过程中,我对大数据现阶段在实际生产生活中的广泛应用有了更具体生动的认识。

?李艳文:大数据实践课给我们提供了一个很好的机会——熟悉大数据在实际工业场景中的应用。通过应用,我对之前所学习的模式识别、深度学习知识有了更深入的理解,更有信心在之后的研究中,将我的博士课题与机器学习、深度学习等知识相结合。

企业导师——苏宝定点评

本次暑期实践项目总体上完成了基于机器学习的风电机组传动链故障诊断技术探索,取得了较好效果。通过本次暑期实践项目,对相关技术的探索,初步筛选和对比了各种振动特征和机器学习方法的精度和可行性,对后续确定算法研究的重点方向提供了相应的技术基础支撑。

2

实践单位:全一医疗

项目名称:基于图片的眼底照片搜索系统

小组成员:

王  凯 软件学院(组长)

何海燕 生命学院

郝宇飞 工业工程

刘浚源 教研院

李雨浛 新闻学院

研究目标:通过对其他人工智能眼底病诊疗应用等竞品的分析,我们旨在通过建立一个以图搜图的眼图搜索系统,将深度学习与图像信息提取技术相结合,解决在过去的应用开发中出现的病灶模态多、标注成本高和准确率低等问题。本项目将在基础的相似眼图搜索目标上进行优化,增加相似度打分、截取眼图元素、显示相关病历、在检索图基础上进一步展开相似图检索等功能,以满足用户在糖尿病视网膜病变诊断上的需要。

实践课的成果:建立了完整的图像搜索系统,在模型选择上选择了EfficientNet b0和ConvNeXt-T,这两个模型都相对较小、泛化性能经过多人验证较好;进行了不同模型、不同框架融合的很多尝试,比如支持pytorch、mmlab、根据名称自动加载模型、统一提取图片特征接口等。在数据增强部分,除了针对眼底特性的基础技巧,还引入了随机组合增强,比较均衡的选择增强方式。平台和工具部分,比较特定使用的一些比如主要做向量索引的Faiss、主要用来做模型的可解释性的Grad-CAM、为方便搭建不同模型不同配置的MMLab。针对性能优化和度量,除了准确率、查全率、F1,增加了针对医疗图像多级分类数据的二次加权kappa系数。

部分成果展示

f5269c4747431c0912ae6c37581f6d68.jpeg 

78094ec4182dd2ba3fecfc243041eb17.jpeg 

f28ffe1d360f84979d6f2b55435f64e2.png

图1.江苏省7月2日PM2.5浓度空间分布图(左图为实测值,右图为预测值)

82db4a26083ebfd02d7813f9ee62ac35.jpeg 

c5719cb0b37de66a5c860770f3cd630b.png

图1.任务一:定位异常识别结果

7fae3d4470f4771c39c5b2c94b40ae53.jpeg 

ab2e3ef2c0054fcb13360e086a90afd3.png

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34282 人正在系统学习中

来源:数据派THU

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年8月8日
下一篇 2022年8月8日

相关推荐