人工智能原理(人工智能的基本理解是什么)

Mark wiens

发布时间:2022-09-03

人工智能原理(人工智能的基本理解是什么)

 

一、人工智能基本原理是通过深度学习推导特征函数

人工智能的本质是在推导输入与输出之间的函数。在二维象限上任何输入都会有对应的输出值,但是现实生活中很多输入输出之间的函数难以给出明确的表达方式,例如语音输入与相应文字的输出,通过对给定的输入(语音)与输出(文字)数据的训练,可以推导出一个能够很好的泛化到其他的输入值上,这一推导函数的过程就是通过机器学习来实现。

训练过程:通过神经网络对数据进行大样本量的训练,推导其特征函数。该过程需要不断优化模型,所以对于数据精度要求较高,通常是采用单精度(32bit),或是采用半精度(16bit)的浮点运算。不同的训练精度对于对于运算资源的需求程度也大不相同。

推断过程:是利用已经训练好的模型,对外部输入数据进行判断。由于不需调整参数,且考虑到延时以及带宽的限制和噪声对输入数据的影响,该过程对数据运算精度要求较低。在推断阶段采用8位甚至是4位的计算精度,对推断结果影微乎其微。

二、深度学习本质上是矩阵的加乘运算

互联网小常识:在Internet中对网络的攻击可以分为2种基本类型,即服务攻击(造成拒绝服务Dos,典型的是SYN)与非服务攻击(对网络层等底层协议进行攻击)。

以目前深度学习中普遍应用的卷积神经网络CNN为例,在运算的过程实际上就是许多卷积运算和矩阵运算的组合,而卷积运算通过一定的数学手段也可以通过矩阵运算完成,这些操作其实就可以理解成是简单的加乘运算。所以对于深度学习的芯片选择可以关注产品在不同运算精度下的算力。

互联网小常识:网络服务器的类型可以分为:文件服务器、数据库服务器、Internet通用服务器与应用服务器。应用服务器是基于B/S工作模式的。

神经网络计算结构:

深度学习的学名又叫深层神经网络,是从人工神经网络模型发展而来。我们以深度学习作为切入点来分析各个芯片的性能。上图是神经网络的基本计算结构,模型中每一层的大量计算是上一层的输出结果和其对应的权重值这两个矩阵的乘法运算,用来推导最佳模型。

芯片计算能力:

举例来说,英伟达新推出的基于Volet 架构的Tesla V100,其内部有5120个FP32核,该芯片的最高频率为1455MHz,在一个时间周期每个FP32的核处理器可以进行两次加乘运算。根据这些信息我们可以计算V100 的单精度计算能力峰值为:

5120* 1.455GHz*(32bit/32bit)*2 = 14899.2 G FLOPs/s

互联网小常识:交换机的配置方式主要有三种:通过控制(console)端口配置,通过telnet远程登录交换机,通过交换机发布Web服务配置。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186