研0研究方向提纲

part 1 研究方向

1.我对老师研究方向的了解
从研究主题来看,老师的研究领域涉及机器学习和数据表示的多个子领域:半监督学习 图机器学习 高维数据(比如高光谱数据)分析与建模 深度学习
我觉得研究的核心是降维,减少冗余,来提高识别精度,提高模型的运行效率和可解释性
这也从老师的论文高频词中得到体现:比如降维里的PCA,稀疏编码,字典学习,非负矩阵分解等算法和聚类里的谱聚类。

2.个人兴趣
知识+数据+工程

感兴趣的内容是面向人,研究和人的行为有关的领域,涉及规则的表示与推理。
从研究主题来看,比如和老师研究主题有交集的社区检测,大到商业数据,工业检测,小到智能家居,智能生活。
从研究方向来看,比如场景有关的数据表示,人类语言学有关的nlp,认知有关的类脑智能。
抽象一下,其实就是研究流动性高的事物,一些规则潜藏其中,对这种信息的快速了解可以形成局部信息差,由此具有价值。

短期的一个合适方向可能是稀疏编码。

以商业数据中的购物为例,应用场景就是人使用手机,推荐商品涉及机器学习的推荐系统。
数据获取:人的需求产生业务,业务产生数据。
数据分析与处理:机器学习方法与模型处理数据,识别特征
模型应用:推荐算法广泛应用于商品推荐
以知识+数据+工程来看待该问题就是:
从知识角度(需要大量规则与范式):
a)场景多元,数据多元。比如这样的购买模式:我想购买10种商品,这些商品有可能分散在3家点或4家店等,而不同店商品价格不同,运费不同。我的目标是让商品价格+运费总和最小化。
b)引入人的先验知识,类似贝叶斯对先验知识的推理。比如根据用户个人信息关联知识图谱,一个年轻用户会受到年轻人热点的影响,学生群体的倾向也是先验的。
c)引入外部知识。比如购物的行为学知识等。

大量的知识与数据必然带来传输、处理与存储的难题,这需要数据和工程两方面进行协同优化。
从数据角度(注意数据的社会属性与概念推理):
a)多模态数据的融合。(可分为结构化数据与非结构化数据,结构化数据根据人的行为分为显性数据与隐性数据,比如人的一次购物行为就是显性数据,而隐性数据可以是人购物所花的时长偏差程度,浏览某个商品的时长偏差程度)
b)多任务协同。
c)高效数据表示。

从工程角度(核心是优化,兼顾精度与速度):
a)分布式。
b)边缘智能。比如雨天场景推荐雨伞(这种推荐应由设备自身完成计算,若传输至服务器代价太大)

part 2 学习路线图

1.近期学习的目标的想法(近6个月)
聚焦比赛+科研+基础,追求广度。
比赛:数据比赛和项目学习的门槛相对科研较低,在大四来进行过渡。
科研:熟练使用Pytorch框架,论文代码复现(多读论文,多看代码,多写代码)。
基础:也需要数学和英语方面的提高,理论方面比如《西瓜书》《机器学习实战》等,Stanford cs229等课程,产出是实现手推公式。

2.学习内容的想法

对于知识+数据+工程,一条路是加深对数据的理解,处理与应用:
注重知识,基于应用场景的知识对数据进行理解,由此高效表示数据,借助一个好的开始让数据分析与处理兼具精度与效率(从源头数据下功夫,不只是调参)。
注重优化,优化贯穿始终,比如用降维优化数据表示,用某些算法优化数据分析与处理,最终是进行性能优化,希望可以在端实现高效部署,让应用落地。

Q:有哪些通用性比较高的学习内容如编程方面web开发,安卓开发,应用开发,前端,爬虫有哪些使用频率比较高的br> Q:有哪些常用编程框架,比如Pytorch,tensorflow吗br> Q:有哪些常用的IDE,比如Vitual Stdio,pycharm吗br> Q:有哪些重要的数学知识储备,比如最优化方法吗/p>

3.职业规划的想法
短板:要数学原理讲不明白,要创新又说是研究员的事
-》预计也将是我的短板
短板:不懂场景
-》注重场景的知识,培养数据的敏感性,了解业务和产品
短板:要算法算法不行,要性能不懂c++,要落地落地慢,
-》注重数据表示+模型融合+部署优化(多模态的数据爆炸以及数据提取的特征工程降低数据获取的重复,提高模型的泛化能力,边缘智能)

想法:工程领域懂场景知识的,开发领域懂业务、产品的,算法领域懂底层、模型融合的。

part 3 科研流程
Q:目前我对科研的理解是提想法,看论文,再做实验,那么请问什么是科研呢,比如一个科研项目的流程,它的知识积累与输出、人员组织、进度管理、时间周期是如何的/p>

part 4 科研规范
Q:写论文用的都是latex吗,文献管理用什么软件br> Q:阅读文献、找文献的主要网站,dblp吗
Q:英语哪些部分比较刚需(写作,需要日常练习吗,还是说通过读论文积累br> Q:我之前的英文写作比较依赖谷歌翻译,写作提升的合适方法是什么br> Q:画图常用python吗/p>

part 5 科研要求
Q:短期的具体要求,我目前大四上空余时间较多,老师如果有安排的话,我可以实地去学校或者线上保持联系。
Q:研究生的要求,比如实验室打卡吗,每天的工作制度如何,组会的时间安排和时长安排。
Q:毕业的要求,比如毕业要求什么层次的论文
Q:想认识一下同组同学,比如我的师兄师姐以及和我同届的人
Q:之后保持联系是每周语音联系吗体的时间/p>

part 6 风险管控与预期管控
1.交流前有材料,交流后有反馈:就是每周都会将过去一周的学习过程在csdn上记录,再给你一个链接,方便老师利用空闲时间对我的动向进行把控,会议时会根据学习记录进行汇报,总结过去一周,安排接下来一周工作。
注:之前几周链接:https://blog.csdn.net/qq_21524797/article/details/120100004
2.平均每天投入时间5—6小时。

来源:晶化机

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年8月20日
下一篇 2021年8月20日

相关推荐