机器学习入门与Python实战(六):朴素贝叶斯 Bayes

目录

现实问题思考:为什么赌博总是“输多赢少”/p>

概率(Probability)

机器学习中的概率

条件概率

全概率公式

知识巩固

贝叶斯公式

朴素贝叶斯用于机器学习

知识巩固

优缺点

Python实战:朴素贝叶斯预测学生录取及奖学金情况

拓展学习


现实问题思考:为什么赌博总是“输多赢少”/strong>

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

骰宝是赌场里最简单的游戏之一,俗称押大小。三个骰子加起来的点数小于等于10为小,大于等于11为大。看似有50%胜率的游戏,游戏还有一条额外的规则,叫围骰(三个骰一样的点数,比如36),这个时候不管玩家押大押小,都算玩家输,赌场赢。

实际上玩家胜率只有48.61%

概率(Probability)

概率是一个在01之间的实数,是对随机事件发生可能性的度量,反映某种情况出现的可能性(likelihood)大小。

机器学习入门与Python实战(六):朴素贝叶斯 Bayes 机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习中的概率

分类任务中,逻辑回归模型直接预测的结果是某种情况对应的概率。

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

市场交易预测中,操作建议 基于 股票价格的涨、跌的概率。

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

参考链接: https://blog.csdn.net/dfly_zx/article/details/104461097

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

条件概率

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

全概率公式

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

知识巩固

问题:有三个盒子甲乙丙,甲装了两个红球,乙装了一红一蓝两个球,丙装了两个蓝球。随机取一个盒子,从该盒子中随机取一个球,计算是红球的概率。如果第一个球确实是红球,求该盒子中另一个球也是红球的概率/span>

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

贝叶斯公式

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

朴素贝叶斯用于机器学习

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

小结

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

知识巩固

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

优缺点

优点:

  • 源于古典数学理论,分类逻辑清晰
  • 可清晰查看各个类别对应概率,观察数据改变的概率变化,帮助理解预测过程

缺点:

  • 在属性个数比较多或者属性之间相关性较大时,分类效果不好
  • 对先验概率依赖度高,样本类别分布不均匀时,容易影响模型表现

适用场景:

数据不同维度之间相关性较小

Python实战:朴素贝叶斯预测学生录取及奖学金情况

基础环境: Python语言;安装核心工具包numpy、pandas、sklearn、matplotlib;环境管理软件Anaconda;Jupyter notebook

环境配置参考:机器学习入门与Python实战核心工具篇:pip源、python、anaconda、工具包(完整版)https://blog.csdn.net/dfly_zx/article/details/110188923

任务:基于task2 _data数据,建立朴素贝叶斯模型预测学生申请结果。

1、计算模型对训练数据各样本预测各类别的概率及输出类别结果、计算模型准确率;

2、观察测试样本数据并主观预测每个样本的结果,然后结合模型计算对应类别概率、与结果,将两个结果进行对比

3、将测试样本数据、预测概率、结果以csv格式存储到本地

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

属性数值意义:

成绩

0:不及格; 1:及格; 2:优秀

学校
0:普通; 1:重点

获奖

0:无; 1:有

性别

0:女; 1:男

英语

0:普通; 1:优异

Y结果

0:未录取; 1:录取; 2:带奖学金录取

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

机器学习入门与Python实战(六):朴素贝叶斯 Bayes

朴素贝叶斯预测学生录取及奖学金情况实战summary:

1、通过建立朴素贝叶斯模型,实现了预测申请者是否能拿到录取及获得奖学金,模型准确率0.68;
2、通过输出个样本不同结果的概率,为主观预测结果提供了依据,实现了申请者条件变化时结果变化的量化分析;
3、掌握了结果存储方法,方便未来进行结果分析

核心算法参考链接:https://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.CategoricalNB.html


拓展学习

来源:flare zhao

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年10月24日
下一篇 2020年10月24日

相关推荐