人工智能五子棋(人工智能五子棋实验心得)

Mark wiens

发布时间：2022-09-06

五子棋是一种两人对弈的纯策略型棋类游戏，是起源于中国古代的传统黑白棋种之一。现代五子棋日文称之为连珠，英译为Renju，英文称之为Gobang或FIR（Five in a Row的缩写），亦有连五子、五子连、串珠、五目、五目碰等多种称谓[1]。因其规则简单，变化多端，容易上手，而广受大众喜爱。五子棋游戏不仅能增强思维能力，提高智力，而且富含哲理，有助于修身养性。

五子棋游戏规则比较简单，棋盘通常采用类似围棋盘的15路或19路的棋盘，两人分别执黑白两色棋子，轮流在棋盘上选择一个无子的交叉点落子，无子的交叉点又被称为空点或合法点，当黑白一方有五个棋子在横、竖或斜方向上连接成一线即为该方赢。

人工智能（Artificial Intelligence，AI），是计算机科学的一个分支，是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的综合性的技术科学。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等，而博弈是人工智能研究的一个重要分支。它不仅存在于游戏、下棋之中，也存在于政治、经济、军事和生物竞争中。与其他棋类游戏相比，五子棋游戏每一层棋局搜索节点数量庞大，规则简单，更便于深入研究博弈算法。本文以五子棋游戏为研究对象，采用Alpha-Beta剪枝和最大最小树原理，优化了博弈树搜索过程，通过控制搜索深度，实现了初级和高级的人机对弈。本文还对优化五子棋智能算法的思路做出了初步探讨。

一、五子棋传统算法

1.人机博弈传统算法。

解决博弈问题的传统算法是搜索树法，也叫博弈树法。以甲乙两人对弈五子棋为例，假定现在该甲走棋且甲有若干种走法，而对甲的任一走法，乙也可以有与之对应的不同的多种走法，然后又轮到甲走棋，而对乙的走法甲又有若干种方法应对，如此反复。显然，可以从当前棋局状态（根节点）出发，找出所有可能的乙的走法（子节点），再从每个子节点出发找出甲对应于每个乙的走法的所有应对（子子节点），直到出现一方赢局。由此构成的树，就称为博弈树。对于19*19的棋盘而言，显然这是一个典型的指数复杂度问题，其计算量之大是目前所有的计算机都无法承受的。因此，用搜索树法来解决人机博弈时，通常只能搜索到一个非常有限的深度，并根据此有限深度的形势来判断每种走法的优劣，从而选择较优位置下子。

2. 极小极大值算法（MinMax 算法）。

极小极大算法[3]是考虑双方对弈本文由论文联盟http://www.LWlm.cOm收集整理若干步之后，从可能的走法中选一步相对好的来走。若最大（MAX）节点为己方下的棋，此时选择估值最大的点走。最小（MIN）节点为对方下的棋，此时选择估值最小的点行走。因此MIN节点的父节点（MAX节点）所赋的倒推值等于端节点估值中的最大值。另一方面，MAX节点的父节点（MIN节点）所赋的倒推值等于端节点估值中的最小值。这样一级一级地计算倒推值，直至起始节点的后继节点也被赋以倒推值为止，即从下往上逐层交替使用极小极大的选值方法。但当搜索深度增加时，搜索节点快速大幅增加，时间和内存空间消耗太大，且利用先前信息的效率较低。于是人们在极小极大的基础上提出了α-β剪枝技术。

3. α-β剪枝算法。

α-β剪枝算法[2]是在极大极小算法的基础上，当甲向下搜索节点时发现走第一个子节点就可以赢了，则剩下的节点就不需要再搜索，甲的值就是第一个子节点的值。即可以将甲的其余后继节点抛弃，此过程称为剪枝。如果甲所在的层是MAX 节点的层，则称此剪枝为α剪枝，否则成为β剪枝。如图1左半部所示的一棵极大极小树的片断。其中节点下方数字为该节点的值，方形框节点代表计算机走，圆形框节点代表人走。A节点表示计算机走，由于A是极大值点，根据极小极大搜索原理它要从B和C当中选最大的值。假设目前已经通过估值得出B为18，当搜索C节点时，因为C是该人走，所以根据极小极大搜索原理要从D、E、F中选取最小的值。此时如果估出D为16，那么C的值必小于或等于16。又因为已经得出B的值为18，说明节点A的值为Max（B，C）=18，也就是说无须求出节点C的其他子节点如E、F的值就可以得出父节点A的值。这种将节点D 的后继兄弟节点剪去的方法称为Alpha剪枝。

互联网小常识：在一般规模的网络系统中，尤其是一期工程的建设中，人们经常采用多个并行的GE/10GE交换机堆叠的方式来扩展端口密度，由一台交换机通过光端口向上级联，将汇聚层与接入层合并成一层。

同理，在图1右半部一棵极大极小树的片段中，将节点D 的后继兄弟节点剪去称为Beta 剪枝。与极小极大算法相比，α-β剪枝需要遍历的节点远远减少，它能在较短的时间内找到最佳的走法节点。

二、五子棋智能算法实现及优化

1. 估值函数。

为使用极大极小算法，需要对一个估值函数Eval （p）对当前棋局进行估值，p是当前局面。即由这个估值函数确定哪个局面更好，如果Eval（p1）

2. 算法实现及优化

使用以上定义的估值函数和描述的算法，可以实现基本的人机对弈。但是在实现中，由于搜索深度增加后运算量呈指数级数增加，运算效率急剧下降。为提高搜索效率，增进用户体验，提出以下优化改进方法：

减少搜索范围。对于19*19的五子棋棋盘而言，传统算法中计算机每走一步都要遍历整个棋盘，对棋面上所有空位都进行试探性下子并估值，大大影响了算法的效率。本文采用在某个时只要考虑距以棋子为中心边长为4的正方形区域即可，这样便缩小了搜索空间，提高搜索效率。

减少计算量。为进一步减少计算量，提高计算机反应速度，通过以空间换时间的方法，在游戏过程中维持一个棋盘所有位置的估值信息的数组。每次对棋盘上的每个位置的当前估值进行计算后，存储在当前棋局信息中。当新的棋局产生时，只需更新计算新下子位置和相关位置的估值，而对其他可下子位置的估值只需查询上步棋局信息即可。这样保持的估值表虽然增大了空间需求，但可以大大减少搜索算法的估值计算时间，提高了算法执行效率。

互联网小常识： P2DR安全模型：策略（Policy）、防护（Protection）、检测（Detection）、响应（Response）。

传统五子棋人机对弈游戏的基本算法，描述了算法实现的MinMax算法和Alpha-Beta剪枝算法，并描述了算法实现的估值函数定义、数据结构等，并通过减少搜索范围、减少计算量和设置对弈等级的方法，对算法进行初步优化，提高了算法性能，增进了人机对弈的用户体验。下步工作主要是通过改进算法和增加搜索辅助手段的方式，探索分析优化搜索性能的方法。比如，结合使用启发式搜索，利用五子棋游戏开局阶段现成的棋谱，进行启发式搜索，或者加入自学习功能等。

在不久的将来，多智时代一定会彻底走入我们的生活，有兴趣入行未来前沿产业的朋友，可以收藏多智时代，及时获取人工智能、大数据、云计算和物联网的入门知识和资讯信息，让我们一起携手，引领人工智能的未来

互联网小常识：因为蓝牙技术可以方便地嵌入到单一的CMOS芯片中，因此它特别适用于小型的移动通信设备。

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186

Lily and people like this Comments

人工智能五子棋(人工智能五子棋实验心得)

Mark wiens

五年级每日一篇作文范文

相关信息

良性竞争？三星电子计划生产可折叠玻璃，与三..

苹果支付白帽黑客7.5万美元，奖励其发现苹..

瑞幸致歉：涉事高管已被停职，未来将强化内控..

LOL10.8更新计划：瑟提、赛娜、厄斐琉斯、滑..