统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) –Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)

统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)

正式开始

z 分数

数是将个体分数,个体所在样本或总体的平均值和标准差串在一起的一个概念,它是对普通数据进行转换的结果,可以更好地描述数据在分布中的位置,进而得出原始分数在数据集合中的百分等级,这样便能让一个统计学外行人也能完全听懂;计算公式为 Z = (X – M)/SD,用来描述某分数在其分布中高于(或低于,如果它为负)平均数的标准差数目;总的来说,可以确定该分数所在的位置(“段位”)

统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)
求解 z 分数
统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)
通过上表不难看出,石军的 z_score 为 -0.63,根据正态曲线的 z 分数表可以找出精确的百分比为 0.735(三位小数),即 73.5%,因为其 z 分数为负,所以我们可以这样说:石军同学的强硬指数低于 73.5% 的同学。

源代码

粗略估计法则则可参照下图的范围区间(该图非常常用,需要牢记)

统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)
  • 正态分布(刚好处于一半的那个位置):一般自然界自然生长/自然而成的东西的分布情况如人的身高 – 受到了多方面的影响,很难考量单一因素等。
  • 对数正态分布:收入是对数正态。最高的蓝线,最往右边偏的。几种分布中:其中对数正态分布在统计分析中运用最为广泛,顾名思义,这种类型的分布在取对数之后服从正态分布。因为其具有这样的良好属性,在精确度要求并不严格的统计分析中。描述性统计分析 – 直接正态分布描述就可以了;建模的时候才取对数。
  • 泊松分布:网页点击量、队伍长度 等符合泊松分布
  • 伽马分布:灾难给我们带来的经济损失,一旦到了理赔的方面,伽马分布就最常见了

注意:数据分析中,一般情况下,右偏不严重的 – 当正态分布用;右偏严重的 – 当对数正态用;做描述性统计分析的时候,中心水平通常用均值或者中位数来表示。如何在两者中抉择呢度一般:均值;偏度比较大时,使用中位数。为什么不一直使用中位数老百姓来说不好理解

说服者态度强硬指数的分布情况

统计学(一): Z 分数 & 正态分布 (附 Python 实现代码) --Z 检验先修; Z 分数与正态分布两者关系; Z 分数与百分位数的异同;面试要点(以心理学实验为舟)

如何一步到位的画出复杂精美的图片可以参考这篇博文

Python 数据可视化:seaborn displot 正态分布曲线拟合图代码注释超详解(放入自写库,一行代码搞定复杂细节绘图)


模拟问答

  1. 谈谈你对平均数,方差和标准差的理解吧,他们之间的关系

  2. z 分数是什么,计算公式什么意义/strong>

  3. z 分数与百分位数有什么异同算公式与 numpy 中的 percentile 函数可当成是一体吗
    percentile(百分位数)更接近顺序变量,Z-score(标准分数)是连续变量。分布正态时两者无差别,偏态时用百分位数更好,不过还是要看具体情况。

总而言之,了解 Z 分数,是入门统计学的开始,加油!


后记

数据分析,商业实践,数据可视化,网络爬虫,统计学,Excel,Word, 社会心理学,认知心理学,行为科学,民族意志学 各种专栏后续疯狂补充

欢迎评论与私信交流!

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览208523 人正在系统学习中

来源:萝 卜

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年1月16日
下一篇 2020年1月16日

相关推荐