java开发爱恩斯坦棋,爱恩斯坦棋计算机博弈关键技术研究

爱恩斯坦棋计算机博弈关键技术研究

【摘要】:计算机博弈是人工智能领域的重要研究方向之一,被誉为人工智能学科的“果蝇”。爱恩斯坦棋属于完备信息博弈棋种,是一种棋局信息完全透明的博弈类型,即博弈双方在任何时候都能完全掌握当前的棋局信息。然而,它不同于其它的完备信息博弈棋种,在双方行棋过程中需通过投掷骰子来确定可走的棋子,具有随机性,这使博弈系统对棋盘局势的分析和决策带来一定的挑战。自2012年爱恩斯坦棋被列为中国大学生计算机博弈大赛项目之后,国内越来越多的人专注于研究针对爱恩斯坦棋的博弈技术。现有估值函数的研究往往是从进攻、防守和概率三个因素分析局势的优劣,将这些因素以不同权重线性相加来组成估值函数。通过这种方式构造的估值函数一般会受到设计者自身博弈水平的限制,而且很难得到一个最优的权重。此外,搜索算法的研究大多是针对Alpha-Beta搜索算法和期望极大极小搜索算法的改进,但是这些搜索算法过于依赖估值函数,估值函数的好坏决定了整个博弈系统的水平。本文以爱恩斯坦棋为研究对象,研究爱恩斯坦棋计算机博弈的关键技术。在搜索算法方面,本文引入蒙特卡洛树搜索(Monte-Carlo tree search,MCTS)算法,提出了概率启发的并行MCTS算法,用概率节点表示投骰子事件,以多对多的方式连接其子节点,并对概率节点进行并行效率优化。在估值方面,本文设计爱恩斯坦棋特征向量的表示方法,使用基于多层感知机的价值网络进行估值,并在训练过程中将价值网络与概率启发的MCTS算法结合,提高样本质量和棋力。在博弈系统方面,设计并实现了爱恩斯坦棋博弈系统,具有人机交互、自动化对弈、棋谱存取以及训练网络等功能,建立了计算机博弈算法设计与分析的验证工具。本文的主要创新点如下:(1)在博弈树搜索方面,设计了用于表示随机事件的数据结构,并提出了概率启发的并行蒙特卡洛树搜索算法。一方面,在博弈树中使用概率节点来表示掷骰子事件,使用多对多的形式连接概率节点和最大值或最小值节点;另一方面,将蒙特卡洛树搜索算法用于上述博弈树中,并对该算法的并行化方法做优化。通过实验分析和实践证明,概率启发的并行蒙特卡洛树搜索算法具有较高的搜索效率和智能水平,并在2018年中国大学生计算机博弈大赛荣获亚军(一等奖);(2)在估值方法方面,本文研究并设计了基于多层感知机的价值网络,以评估棋盘对当前行棋方的价值。首先,本文从棋盘盘面中提取48维的特征向量,设计价值网络模型,并与概率启发的并行蒙特卡洛树搜索算法结合。其次,从AlphaGo Zero程序中得到启发,设计了样本采集、网络训练和棋力评估三个阶段的价值网络的训练过程。通过实验分析,本文提出的价值网络模型经过训练后有较高的智能水平,并且结合价值网络的概率启发并行蒙特卡洛树搜索算法以55.3%的胜率战胜未结合价值网络的算法;(3)在博弈系统方面,本文设计并实现了爱恩斯坦棋博弈系统,包括训练子系统和对弈交互子系统。训练子系统用于执行和管理价值网络的训练进程,根据用户输入的相关参数训练神经网络,查看和保存训练过程中的误差和胜率变化,存取训练完成的网络模型;对弈交互子系统提供用户与系统中的算法进行对弈的功能,用户可选择系统中已有策略,手动设置策略参数,实现人-人、人-机和机-机自动对弈,将对弈过程可视化,并存储对弈棋谱。综上所述,本文在搜索、估值与系统三个方面进行爱恩斯坦棋计算机博弈技术的研究。首先,针对随机性的问题对蒙特卡洛树搜索算法进行了修正和并行优化,提升算法的搜索效率和智能水平;其次,设计了基于多层感知机的价值网络模型及其训练方法,进一步提升棋力;最后,实现了爱恩斯坦棋博弈系统,建立计算机博弈算法设计与分析的验证工具。

【相似文献】

中国期刊全文数据库

前18条

1

梅险;侯利元;谢文;高旭;孙伟;李冬平;;计算机博弈创新教育的研究与实践[J];黑龙江教育(理论与实践);2017年12期

2

关宁;;基于java的五子棋游戏设计[J];青春岁月;2016年21期

3

;《名手软件》[J];棋艺(象棋版);2017年08期

5

汤云雄;董从民;;计算机博弈系统在中国象棋教学中的应用[J];科技信息;2011年19期

6

;全国计算机博弈锦标赛落幕[J];棋艺(象棋);2010年01期

7

蒋泽文;;博弈名谱(66)[J];棋艺(象棋版);2015年12期

8

傅瑶;;计算机博弈平台搭建技术策略[J];电脑迷;2017年11期

9

北方好汉;;博弈名谱(50)[J];棋艺(象棋);2014年05期

10

杨昌杰;陈柯成;刘跃元;王京;;爱恩斯坦棋计算机博弈算法研究与改进[J];无线互联科技;2018年15期

11

王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报;2005年10期

12

蒋泽文;;博弈名谱(76)[J];棋艺(象棋版);2016年10期

13

徐心和;王骄;;中国象棋计算机博弈关键技术分析[J];小型微型计算机系统;2006年06期

14

北方好汉;;博弈名谱[J];棋艺(象棋);2010年02期

15

蒋泽文;;博弈名谱(63)[J];棋艺(象棋版);2015年09期

16

蒋泽文;;博弈名谱(67)[J];棋艺(象棋版);2016年01期

17

周玮;王友政;马庆增;;利用局势变化攫取优势博弈[J];系统仿真学报;2008年17期

18

北方好汉;;博弈名谱(46)[J];棋艺(象棋版);2013年12期

中国重要会议论文全文数据库

前2条

1

冯闻捷;彭力;;牛角棋计算机博弈系统的实现[A];第二十七届中国控制会议论文集[C];2008年

2

徐心和;;计算机博弈是作战模拟的关键技术之一[A];新观点新学说学术沙龙文集37:仿真是基于模型的实验吗[C];2009年

中国博士学位论文全文数据库

前1条

中国硕士学位论文全文数据库

前10条

1

陆梦轩;爱恩斯坦棋计算机博弈关键技术研究[D];安徽大学;2019年

2

王宛宛;军棋机器人UCT算法及计算机博弈行为研究[D];重庆理工大学;2019年

3

李琴;爱恩斯坦棋计算机博弈算法的研究与实施[D];重庆理工大学;2018年

4

5

6

刘明慧;计算机博弈的估值方法研究[D];东北大学;2008年

7

李翠珠;六子棋计算机博弈系统的研究与实现[D];重庆理工大学;2010年

8

王杨;基于计算机博弈的五子棋算法研究[D];沈阳理工大学;2017年

9

闵文杰;六子棋计算机博弈关键技术研究[D];重庆交通大学;2010年

10

林菡;TAC-SCM计算机博弈系统的研究与实现[D];南京航空航天大学;2009年

中国重要报纸全文数据库

前6条

1

记者 陈钧;全国大学生计算机博弈大赛在渝举行[N];重庆日报;2017年

2

本报记者 陈钧;人工智能还可推演战争输赢[N];重庆日报;2017年

3

本报记者 瞿剑;计算机围棋战胜人类:20年还是100年[N];科技日报;2015年

4

本报记者 张蕾;向中国象棋冠军发起挑战[N];光明日报;2005年

5

记者 何鑫 通讯员 张燕霖;高交会“中国象棋人机大战”今开战[N];深圳商报;2009年

6

;中国版“深蓝人机大战”烽火点燃[N];人民邮电;2006年

文章知识点与官方知识档案匹配,可进一步学习相关知识Java技能树首页概览91738 人正在系统学习中 相关资源:翠雨方工作备忘录工具v2.31中文绿色版-其它代码类资源-CSDN文库

来源:weixin_39831705

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年2月10日
下一篇 2021年2月10日

相关推荐