机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

以下内容是个人的随手记录,就是介绍了下简单的使用;

欢迎大家吐槽,接下来就是激情的时刻,准备好啤酒饮料矿泉水,开整!!!

 

统计学分类:

一、 描述统计学

1. 反映客观现象的数据

2. 处理并使用图标显示

3. 分析概括规律性的数量特征

二、推断统计学

1. 根据样本数据推断总体特征

2. 推断统计学在描述统计学基础之上

3. 分析概括规律性数量的特征

 

泛化误差公式: 

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述:

符号 含义
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 测试样本
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 数据集
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 在数据集中的标记
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 的真实标记
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 训练集  机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 学得的模型
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 由训练集  机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 学得的模型  机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 对  机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 的预测输出
机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 模型 机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状对  机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 的 期望预测 输出

 

方差公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述:度量了同样大小的训练集变动导致学习性能的变化,描述了数据扰动对统计(机器学习)所造成的影响

 

偏差公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述:度量了期望预测与真是结果的偏离程度,描述了算法本身的拟合能力

 

噪声公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述: 噪声真实标记与数据集中的实际标记间的偏差,算法能达到的期望泛化误差的下界,描述了学习问题本身的难度

 

泛化误差分解公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

既: Err(x) = 方差值 + 偏差值 + 噪声值

 

欠拟合: 偏差大、方差小

造成原因: 所选特征不够,所选模型不符合

解决方案:加特征、换模型

 

过拟合:偏差小、方差大

造成原因:所选模型太拟合真实数据

解决方案:增加训练数据、降低维度、增加混合项

 

极差公式:max([1,2,3,4,5]) – min([1,2,3,4,5])

描述:同一组数据中的最大值 – 同一组数据中的最小值

 

离散程度–>方差公式:  

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状 表示数据集的均值

离散成都求方差应用举例:

A: [1, 2, 5, 8, 9]      B:[3, 4, 5, 6, 7]

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

 

偏态在统计软件中使用的公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述: 数据分布的不对称性称之为偏态, s是标准差

左偏分布:sk < 0

对称分布:sk=0

右偏分布:sk>0

 

峰度公式:

机器学习之统计学基础、泛化误差、方差、偏差、噪声、极差、离散程度、分布形状

描述: 数据分布的扁平或尖峰程度

扁平分布:k<0

尖峰分布:k>0

扁平分布与正太分布区别:扁平分布扁平、瘦尾、肩部较胖

尖峰分布与正太分布区别:尖峰分布尖峰、肥尾、肩部较瘦

 

注意:以上内容是个人使用的随手记录, 就是介绍了下简单的使用

欢迎大家来吐槽,准备好瓜子饮料矿泉水,开整!!!

—————————————————————————————

搞笑一则:能动手尽量别吵吵

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34222 人正在系统学习中

来源:庆 、

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年11月24日
下一篇 2018年11月24日

相关推荐