以下内容是个人的随手记录,就是介绍了下简单的使用;
欢迎大家吐槽,接下来就是激情的时刻,准备好啤酒饮料矿泉水,开整!!!
统计学分类:
一、 描述统计学
1. 反映客观现象的数据
2. 处理并使用图标显示
3. 分析概括规律性的数量特征
二、推断统计学
1. 根据样本数据推断总体特征
2. 推断统计学在描述统计学基础之上
3. 分析概括规律性数量的特征
泛化误差公式:
描述:
符号 | 含义 |
测试样本 | |
数据集 | |
在数据集中的标记 | |
的真实标记 | |
训练集 学得的模型 | |
由训练集 学得的模型 对 的预测输出 | |
模型 对 的 期望预测 输出 |
方差公式:
描述:度量了同样大小的训练集变动导致学习性能的变化,描述了数据扰动对统计(机器学习)所造成的影响
偏差公式:
描述:度量了期望预测与真是结果的偏离程度,描述了算法本身的拟合能力
噪声公式:
描述: 噪声真实标记与数据集中的实际标记间的偏差,算法能达到的期望泛化误差的下界,描述了学习问题本身的难度
泛化误差分解公式:
既: Err(x) = 方差值 + 偏差值 + 噪声值
欠拟合: 偏差大、方差小
造成原因: 所选特征不够,所选模型不符合
解决方案:加特征、换模型
过拟合:偏差小、方差大
造成原因:所选模型太拟合真实数据
解决方案:增加训练数据、降低维度、增加混合项
极差公式:max([1,2,3,4,5]) – min([1,2,3,4,5])
描述:同一组数据中的最大值 – 同一组数据中的最小值
离散程度–>方差公式:
描述:
表示数据集的均值离散成都求方差应用举例:
A: [1, 2, 5, 8, 9] B:[3, 4, 5, 6, 7]
偏态在统计软件中使用的公式:
描述: 数据分布的不对称性称之为偏态, s是标准差
左偏分布:sk < 0
对称分布:sk=0
右偏分布:sk>0
峰度公式:
描述: 数据分布的扁平或尖峰程度
扁平分布:k<0
尖峰分布:k>0
扁平分布与正太分布区别:扁平分布扁平、瘦尾、肩部较胖
尖峰分布与正太分布区别:尖峰分布尖峰、肥尾、肩部较瘦
注意:以上内容是个人使用的随手记录, 就是介绍了下简单的使用
欢迎大家来吐槽,准备好瓜子饮料矿泉水,开整!!!
—————————————————————————————
搞笑一则:能动手尽量别吵吵
文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34222 人正在系统学习中
来源:庆 、
声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!