游戏人工智能编程案例精粹(游戏人工智能编程案例精粹模糊逻辑源码)

智能出行来源：互联网

Mark wiens

发布时间：2022-09-02

作者 | luanhz

责编 | 郭芮

本文对MySQL中几种常用的模糊搜索方式进行了介绍，包括LIKE通配符、RegExp正则匹配、内置字符串函数以及全文索引，最后给出了性能对比。

引言

MySQL根据不同的应用场景，支持的模糊搜索方式有多种，例如应用最广泛的可能是Like匹配和RegExp正则匹配，二者虽然用法和原理都很相似，但实际上匹配原则却不尽相同，其中Like要求模式串与整个目标字段完全匹配才检索该记录，而RegExp则是要求目标字段包含模式串即可。

对于简单的判断模式串是否存在类型的模糊搜索，应用MySQL内置函数即可实现，例如Instr、Locate、Position等。

当然，提到MySQL查询性能就不得不提到索引，对于字段模糊查询需求，我们也可以考虑添加全文索引(Fulltext)。

注：本文所用MySQL版本8.0.19，可视化工具Navicat Primium。

4种模糊查询

为了便于描述和测试不同模糊查询方式结果，首先给出一个简单的测试用数据表tests如下：

其中，tests表仅含有一个名为words的字段，并对该字段添加全文索引。表中共有6条记录。

Like

Like算作MySQL中的谓词，其应用与is、=、>和<等符号用法类似。Like主要支持两种通配符，分别是"_"和"%"，其中前者代表匹配1个任意字符，常用于充当占位符；而后者代表匹配0个或多个任意字符。从某种意义上讲，Like可看作是一个精简的正则表达式功能。

例如，在如上表中查找所有以"hello"开头的记录，则其SQL语句为：

1SELECT words FROM tests WHERE words LIKEhello%;

查询结果：

如果想查找所有以"hello"开头且至少含有6个字符的记录，则可简单修改SQL语句如下：

1SELECT words FROM tests WHERE words LIKEhello_%;

查询结果：

另外：当在Like模式字段中，若不包含任何"_"和"%"通配符，则等价于"="，表示精确匹配，例如查询语句……Like "hello"，则仅返回hello一条记录；还可在Like前加限定词Not，表示结果取反。

RegExp

正则表达式具有庞大而丰富的语法，MySQL语法中支持绝大部分正则表达式功能，几乎可以满足所有需求。本文不过多展开正则表达式相关介绍，仅在Like的基础上，简单介绍其与Like模糊搜索方式的区别。

如前所述，Like匹配原则是要求模式串与整个目标字段匹配时，才返回该条记录；而RegExp中则是当目标字段包含模式串时即返回该条记录。例如如下SQL语句将返回所有包含"hello"的记录：

1SELECT words FROM tests WHERE words REGEXPhello;

而在Like中这样的写法仅返回记录="hello"的记录。为了限定正则表达式以某个模式串开头或者结尾，可以通过添加"^"和"$"标识符来限定，例如仍然搜索以"hello"开头的目标字段，则其SQL语句为：

1SELECT words FROM tests WHERE words REGEXP^hello;

内置函数

对于包含某些特定模式串的模糊搜索，可以通过MySQL内置函数实现。可以完成这一功能的函数包括Instr、Locate和Position等，其功能语法很相近，均是返回子串在字符串中的索引，且索引下标从1开始，当子串不存在是返回0。需要注意的是三个函数中子串和字符串的先后顺序是不一致的。例如以下语句均成功检索，且返回目标索引1

1SELECTINSTR("hello,world",hello);--12SELECTLOCATE(hello,"hello,world");--13SELECTPOSITION(helloin"hello, world"); --1

应用以上3个内置函数，搜索上述测试表中包含"hello"的记录，则相应SQL语句为：

1SELECT words FROM tests WHEREINSTR(words,hello);2SELECT words FROM tests WHERELOCATE(hello, words);3SELECT words FROM tests WHEREPOSITION(helloinwords);

全文索引

抛开索引谈查询性能，都是耍流氓！

全文索引是MySQL中索引的一种，曾经仅在引擎为MyISAM的表中支持，从5.6版本开始在InnoDB中也开始支持全文索引，支持的字段格式包括CHAR、VARCHAR和TEXT。在如上已经添加了全文索引的tests表中，仍然查询包含"hello"的记录，应用全文索引查询的SQL语句为：

1SELECTwordsFROMtestsWHEREMATCH(words)against(hello);

实际上，MATCH(words) against(hello)返回的是字段words对目标字符"hello"的匹配程度：当不存在任何匹配结果时，返回0；否则，根据匹配次数的多少和位置先后返回一个匹配度。例如，如下SQL语句返回表中每条记录对目标字段"hello"的匹配度：

1SELECTMATCH(words)against(hello)FROMtests;

返回结果如下：

查询性能对比

互联网小常识：RIP是一种分布式、基于距离向量的路由选择协议；一个计算题：路由信息协议的工作过程：初始化的路由器只包含所有与该路由器直接相连的网络的路由，其它均为0；更新和维护：路由表建立以后，各路由器会周期地向外广播其路由表的内容。当一个路由器收到路由表内容时就与在自己的路由表中寻找，如果没有就将该路由项加上与该路由器的跳数，加入自己的路由表中，如果有则比较，取较小者。

为了对比以上4种模糊搜索方式的性能，我们这里构建一个规模较大且更具一般性的数据表。本文选择采集若干条英文格言，用于创建目标数据库。

互联网小常识：CMIP 优点：每个变量不仅传递消息，而且还完成一定的网络管理任务，这样可减少管理者的负担并减少网络负载；安全性高，它拥有验证、访问控制和安全日志。缺点：占用资源多、MIB过于复杂,在CMIP之上缺少可一直使用的API以及相应的产品价格高。

创建数据表

为简单起见，仅创建一个名为says的字段，且对其添加全文索引。

1CREATE TABLE IF NOT EXISTSsayings(says TEXT, FULLTEXT (says));

英文格言信息获取

在网上找了个英文格言的网站，并写了一个python小爬虫爬取页面全部300条英文格言，爬虫源码如下（为了增加记录条数，将300条记录重写100词，即数据库中包含30000条记录）：

1frompyqueryimportPyQueryaspq2frompymysqlimportconnect34doc = pq(url=http://www.1juzi.com/new/43141.html, encoding =gb18030)5items=doc("div.content>p:nth-child(2n+1)").items6hots = [item.text()foriteminitems]7withconnect(host="localhost", user="root", password="123456", db=teststr, charset=utf8)ascur:8sql_insert =insert into sayings values (%s);9for_inrange(100):10cur.executemany(sql_insert, hots)

对爬取的英文短句写入创建的数据表中，结果如下：

既然是英文励志格言短句，那么我们就来查询其中包括"success"的记录。

首先查询语句中任意位置包含"success"的记录，4种方式SQL语句及执行时间为：

1--LIKE通配符2SELECTsaysFROMsayingsWHEREsaysLIKE%success%3>OK4>时间:0.036s56--REGEXP正则匹配7SELECTsaysFROMsayingsWHEREsaysREGEXPsuccess8>OK9>时间:0.053s1011--内置函数查找12SELECTsaysFROMsayingsWHEREINSTR(says,success)13>OK14>时间:0.045s1516SELECTsaysFROMsayingsWHERELOCATE(success,says)17>OK18>时间:0.044s1920SELECTsaysFROMsayingsWHEREPOSITION(successinsays)21>OK22>时间:0.047s2324--全文索引25SELECTsaysFROMsayingsWHEREMATCH(says)against(Success)26>OK27>时间:0.006s

可见，全文索引速度最宽，领先其他方式接近一个量级；Like通配符速度其次，但与其他几种查询方式效率相差不大。

通过Explain查询计划，我们可以发现全文索引方式由于应用了索引而无需全表查询，所以执行速度快，而其他三种模糊查询方式均为执行全表查询。

全文索引查询计划

Like通配符查询计划

实际上，对于添加索引的字段应用Like查询时，可以应用索引加速查询，为勒验证全文索引条件下是否仍然可以应用索引，我们进行第二组性能测试：

查询语句中以"success"开头的记录（全文索引方式不支持指定单词开头的查询任务），相应SQL语句即执行时间如下：

1SELECTsaysFROMsayingsWHEREsaysLIKEsuccess%2>OK3>时间:0.015s45SELECTsaysFROMsayingsWHEREsaysREGEXP^success6>OK7>时间:0.046s89SELECTsaysFROMsayingsWHEREINSTR(says,success)=110>OK11>时间:0.042s1213SELECTsaysFROMsayingsWHERELOCATE(success,says)=114>OK15>时间:0.051s1617SELECTsaysFROMsayingsWHEREPOSITION(successinsays)=118>OK19>时间:0.049s2021SELECTsaysFROMsayingsWHEREMATCH(says)against(Success)22>OK23>时间:0.007s

可以看到，修改后的Like查询效率提升明显，并大幅超过其他方式。但解释查询计划发现，虽然possible_key显示了索引字段，但实际仍然未应用任何索引（key为），即仍然进行全表查询（Type = All）。之所以带来速度上的大幅提升，仅仅是因为对success%要比%success%执行字符串匹配要快得多（后者要整列匹配，前者仅需匹配开头的单词即可），而与索引无关。

Likesuccess%仍然无法应用全文索引

所以，得到的结论是Like通配符无法有效利用全文索引加速查询，但在特定模式下的查询速度可快于通配符%模式下的查询。

总结

本文探讨了MySQL中4中模糊查询方式，包括：

Like通配符用于查询目标字段与模式串完全匹配的记录，且无法应用全文索引提高查询速度，但以特定字符开头的模糊查询比以"%"开头时速度提升明显；

RegExp正则表达式功能强大，可实现任意模式查询，但执行效率一般；

简单的子串有无查询还可应用MySQL内置函数，包括Instr、Locate和Position等，用法相近，但效率一般；

对于包含全文索引的目标字段查询，应用全文索引查询效率最高，但可定制性差，不支持任意匹配查询；

记录数目较少时，几种查询方式效率均可接受，可根据任务需求灵活选用。

声明：本文为作者投稿，版权归其所有。

今日福利

遇见大咖

由 CSDN 全新专为技术人打造的高端对话栏目《大咖来了》来啦！

CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛携手京东集团技术副总裁、IEEE Fellow、京东人工智能研究院常务副院长、深度学习及语音和语言实验室负责人何晓冬，来也科技 CTO 胡一川，共话中国 AI 应用元年来了，开发者及企业的路径及发展方向！

互联网小常识：将主机（A）资源记录手动添加到正向查找区域时，使用“创建相关的指针（PTR）记录”选项，可以将指针记录自动添加到反向查找区域中。

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186

Lily and people like this Comments

游戏人工智能编程案例精粹(游戏人工智能编程案例精粹模糊逻辑源码)

Mark wiens

2022年“机器人”概念龙头股名单尤其是第五只（建议收藏）

相关信息

疫情致西班牙3月汽车销量跌69% 众品牌纷..

国内车市迎利好政策；欧洲整车产量损失超百..

华为P40系列核心供应商名单曝光：绝大部分配..

“智能电视”那几点最关键？硬件、画质和摄像..

游戏人工智能编程案例精粹(游戏人工智能编程案例精粹 模糊逻辑源码)

Mark wiens

2022年“机器人”概念龙头股名单尤其是第五只（建议收藏）

相关信息

疫情致西班牙3月汽车销量跌69% 众品牌纷..

国内车市迎利好政策；欧洲整车产量损失超百..

游戏人工智能编程案例精粹(游戏人工智能编程案例精粹模糊逻辑源码)