人工智能语义分析(人工智能语义分析技术PPT)

Mark wiens

发布时间:2022-09-09

人工智能语义分析(人工智能语义分析技术PPT)

 

来源:中国青年网

近日,阿里安全宣布,面对多人运动王者五排等不断变异升级的黑话暗语,阿里AI鉴黄技术能力升级,可精准快速地进行识别拦截。这对人工智能技术的发展具有非常重要的意义,让AI引入知识后并不对原始语义产生曲解,正是训练智能AI模型需要重点解决的难题。

涉黄黑话变异升级难识别

在内容安全场景下,黑灰产通常会利用黑话来绕开检测引擎,比如会出现这种语句小哥哥,要不要来我们这里多人运动啊?大号玻璃过滤彩珠大水瓶 玻璃水壶全套配件到手即用。

这对人工智能技术带来了非常大的挑战。阿里安全高级算法专家开阳表示,目前谷歌发布的BERT自然语言处理模型已经在文本理解领域取得了突破性进展,但在识别上述黑话时仍难以发挥作用,尚不能撕掉黑话的伪装,辨别其指代色情、毒品的本来含义。

对此,开阳解释,技术和预训练语言模型有一定局限性,经过大量公开语料进行学习训练后,模型能理解字、词、句之间的语义关系,比如判断足球跟多人运动属于同类话题;水壶器皿和烧水属于同类话题。

互联网小常识:SNMP优点:简单,易于实现、支持广泛、操作原于简捷、性能高。缺点:SNMP建立在无连接的传输协议之上,另外它是非面向对象的,不支持分布式管理。

‘多人运动’等黑话通常背后由某个特定事件造成,这些事件比较随机,也无规律可循。开阳介绍称,这样的语料难以积累,加上占比极低,建立预训练模型变得不太容易。

互联网小常识:802.11:1Mbps,2Mbps;802.11b:1Mbps,2Mbps;5.5Mbps;11Mbps;802.11a:54Mbps.

AI技术升级可理解文字语义

那么,鉴黄机器人能否接收到多人运动黑话背后的事件信息,从而给出更精准的判断?

开阳称,阿里新一代安全架构核心AI技术可以做到这一点。他介绍,如果过去的鉴黄AI只停留在识别直观的图片、字符串、语音这些表层信息上,升级之后的鉴黄AI则可以理解字符串背后的深意。如果看到小哥哥,要不要来我们这里多人运动啊?这样的语句,AI经智能分析后可识别出这是一条色情信息。

升级后的AI鉴黄师增加了基于知识图谱的识别黑话的能力,将人工经验知识引入,让机器智能与人工经验更好地结合,大大提升了文本理解与语义识别的能力。开阳介绍,这也是技术升级后的最大亮点,只需要把新的黑话知识添加到知识图谱中就可生效,发现舆情事件导致的变异时间可能在小时级,但识别只需几十毫秒。

简单而言,就是以热点事件为中心,围绕事件本身,将相关联的人物、事件、特定的词语绘成一张关联图谱。以多人运动为例,将出轨事件新闻作为核心,关联该事件的男女主角、事件引发的热词多人运动王者五排群P等。

由于升级后的技术可识别更隐晦、内涵的风险内容,AI技术除在鉴黄领域大有可为外,还能大大提升与其他黑灰产变异升级的对抗能力。我们的模型能针对新事件快速感知,基于事件发掘新关联词,并构建知识,及时为新风险识别提供能力。开阳说。

互联网小常识:集线器是对“共享介质”的一种改革,并且没有破坏CSMA/CD方法。它仍工作在物理层,所有的结点都在一个冲突域中。从结点和集线器的无屏蔽双绞线的最大长度为100m。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186