发明内容
本发明要解决的技术问题在于,针对上述现有技术中研发成本、第三方应用及用户体验方面的问题,提供一种便携式人工智能装置及其配置方法。
本发明解决其技术问题所采用的技术方案是:
构造一种便携式人工智能装置的配置方法,包括:
将便携式人工智能装置连接至移动设备,并依据所述移动设备的类型安装客户端;
在所述移动设备中启动所述客户端,从而于所述客户端中创建或登录企业账户;
根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件;
藉由摄像头获取图像,并依据所加载的组件对所述图像进行本地化准在线式处理或本地化离线式处理。
在本发明所述的配置方法中,所述将便携式人工智能装置连接至移动设备,并依据所述移动设备的类型安装客户端,包括:
藉由所述便携式人工智能装置的USB接口连接至所述移动设备;
所述移动设备连接后从服务器下载与所述移动设备的类型匹配的客户端,并安装所述客户端。
在本发明所述的配置方法中,所述在所述移动设备中启动所述客户端,从而于所述客户端中创建或登录企业账户,包括:
在所述移动设备中启动所述客户端,创建或登录企业账户;
依据所述企业账户选取已定义的服务组件并加载所述服务组件,保存所述企业账户信息及其配置记录。
在本发明所述的配置方法中,所述根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件,包括:
获取行业信息并选取所需定义的服务组件并定义所述服务组件;
启用所加载的服务组件,从而建立所述便携式人工智能装置与所述移动设备之间的通信。
在本发明所述的配置方法中,所述藉由摄像头获取图像,并依据所加载的组件对所述图像进行本地化准在线式处理或本地化离线式处理,包括:
藉由所述便携式人工智能装置的摄像头和/或所述移动设备的摄像头获取图像;
依据所述企业账户及行业信息从云端数据库处下载特征库;
依据所述特征库对所述图像进行本地化准在线式处理或本地化离线式处理。
在本发明所述的配置方法中,所述本地化准在线式处理包括:在所述便携式人工智能装置处进行图像检测、矫正和本地数据存储管理,在云端处进行图像处理并进行深度学习,将识别及深度学习结果同步至所述便携式人工智能装置;
所述本地化离线式处理包括:在所述便携式人工智能装置处进行图像检测、图像处理并深度学习,并实时将结果返回至本地设备,同时在设定条件下将特征数据同步至所述云端备用。
在本发明所述的配置方法中,还包括:
当所述便携式人工智能装置通过所述移动设备连接上云端时,与云端同步数据,并依据所述云端的数据对所述便携式人工智能装置的特征库进行训练,并升级所述便携式人工智能装置的深度学习的逻辑参数。
另一方面,提供一种便携式人工智能装置,包括:
移动设备连接口,用于将便携式人工智能装置连接至移动设备;
主控芯片,通过设备驱动电路连接至所述移动设备连接口,用于依据所述移动设备的类型安装客户端,并在所述移动设备中启动所述客户端,从而于所述客户端中创建或登录企业账户,根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件;
摄像头,通过摄像驱动电路连接于所述主控芯片,用于获取图像,从而使所述主控芯片依据所加载的组件对所述图像进行本地化准在线式处理或本地化离线式处理。
在本发明所述的便携式人工智能装置中,移动设备连接口为USB接口。
在本发明所述的便携式人工智能装置中,还包括:
用于连接至显示设备的视频接口,所述视频接口为HDMI接口或WIDI接口,通过显示驱动电路连接于所述主控芯片;
用于与所述移动设备进行无线通信的无线模块,所述无线模块为WiFi模块或蓝牙模块,通过无线驱动电路与所述主控芯片连接;
用于接收语音的麦克风,通过语音识别电路与所述主控芯片连接。
上述公开的一种便携式人工智能装置及其配置方法具有以下有益效果:通过离线深度学习功能,不依赖网络的智能独立性(无网络覆盖区,如海底,地下等区域),也不需要庞大服务器的支持;通过与移动设备协同工作,具备提供精确服务的高智能性,而且可以即插即用,具有高扩展性。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供了一种便携式人工智能装置及其配置方法,其目的在于,在软件上提供服务定义模块,在硬件上提供嵌入式微型人工智能扩展模块,从而为移动设备实现完整的人工智能扩展。本申请的便携式人工智能装置的人工智能核心部分采用的是目前最先进的且原本需要大型服务器运行的“机器深度学习”算法,因此在移动设备智能化上意义重大,为小型移动设备的智能应用开发开启无限可能。而且通过离线深度学习功能,不依赖网络的智能独立性(无网络覆盖区,如海底,地下等区域),也不需要庞大服务器的支持;通过与移动设备协同工作,具备提供精确服务的高智能性,而且可以即插即用,具有高扩展性。本发明旨在研发人工智能本地化部署解决方案,帮助使用到AI服务的行业和企业在其产品中实现更灵活精确的AI植入更丰富的开发方式。特别针对视频信息识别服务的完全实时响应的需要,让服务设备具备不依赖网络的独立机器智能。
参见图1,图1为本发明一实施例提供的一种便携式人工智能装置的配置方法的流程图,该便携式人工智能装置包括移动设备连接口、主控芯片、摄像头、视频接口、无线模块及麦克风。
移动设备连接口用于将便携式人工智能装置连接至移动设备;移动设备连接口为USB接口。
主控芯片通过设备驱动电路连接至所述移动设备连接口,用于依据所述移动设备的类型安装客户端,并在所述移动设备中启动所述客户端,从而于所述客户端中创建或登录企业账户,根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件;
摄像头,通过摄像驱动电路连接于所述主控芯片,用于获取图像,从而使所述主控芯片依据所加载的组件对所述图像进行本地化准在线式处理或本地化离线式处理。
用于连接至显示设备的视频接口,所述视频接口为HDMI接口或WIDI接口,通过显示驱动电路连接于所述主控芯片;
用于与所述移动设备进行无线通信的无线模块,所述无线模块为WiFi模块或蓝牙模块,通过无线驱动电路与所述主控芯片连接;
用于接收语音的麦克风,通过语音识别电路与所述主控芯片连接。
例如,该便携式人工智能装置采用的开发环境及功能如下:
1、可内置安卓系统或Linux系统。
2、支持HDMI或WIDI连接显示设备从而单独使用,如:AIC-1s。
3、支持与安卓设备的USB或无线连接,自动安装客户端后,可对接口和服务内容进行个性化设置。
4、内置完整的“深度学习”人工智能框架,支持根据识别内容在线定制安装特征库。
5、支持30帧/秒动态视频识别,平均服务返回小于60毫秒。
6、允许使用AIC-1自带摄像头或已连接设备的摄像头。
Cylltech AIC-1的规格参数如下:
1、尺寸115×70×16mm。
2、采用256core GPU。
3、采用64-bitARM CPU。
4、采用4G DDR4memory/16G storage。
5、支持WiFi 802.11ac和蓝牙4.0。
6、配备独立摄像头及麦克风。
7、采用USB type-C,支持USB3.1(5Gbps)。
该便携式人工智能装置的配置方法包括步骤S1-S4:
S1、将便携式人工智能装置连接至移动设备,并依据所述移动设备的类型安装客户端;该步骤S1包括步骤S11-S12:
S11、藉由所述便携式人工智能装置的USB接口连接至所述移动设备;
S12、所述移动设备连接后从服务器下载与所述移动设备的类型匹配的客户端,并安装所述客户端。
S2、在所述移动设备中启动所述客户端,从而于所述客户端中创建或登录企业账户;步骤S2包括子步骤S21-S22:
S21、在所述移动设备中启动所述客户端,创建或登录企业账户;
S22、依据所述企业账户选取已定义的服务组件并加载所述服务组件,保存所述企业账户信息及其配置记录。
S3、根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件;步骤S3包括子步骤S31-S33:
S31、在本发明所述的配置方法中,所述根据所述企业账户获取行业信息,并依据所述行业信息加载对应的组件,包括:
S32、获取行业信息并选取所需定义的服务组件并定义所述服务组件;
S33、启用所加载的服务组件,从而建立所述便携式人工智能装置与所述移动设备之间的通信。
S4、藉由摄像头获取图像,并依据所加载的组件对所述图像进行本地化准在线式处理或本地化离线式处理。所述步骤S4包括子步骤S41-S42:
S41、藉由所述便携式人工智能装置的摄像头和/或所述移动设备的摄像头获取图像;
S42、依据所述企业账户及行业信息从云端数据库处下载特征库;
S43、依据所述特征库对所述图像进行本地化准在线式处理(准在线式构架)或本地化离线式(离线式构架)处理。
参见图2,图2为本发明一实施例提供的在线处理、本地化准在线式处理及本地化离线式处理的对比示意图。准在线式构架性能明显优于在线式,在线式和准在线式构架在人脸动态识别中都不能满足实时服务性能要求(1+秒的服务耗时,在实时场景中会经常遭遇识别完成时,测识别对象已不在视线中的尴尬。)AI服务完全本地化是满足实时AI服务的必要构架方式,也是实现不依赖网络的独立机器智能的唯一方式。
可见三者具有以下区别:
三者网络传输及服务耗时对比如下:
例如,通过摄像头获取人脸图像时,根据企业账户及行业信息对其进行相关的识别,如下:
采用人工智能,在网络大数据提供的海量人脸样本中进行数据挖掘、分析和分类。具体的技术实现是使用卷积神经网络(Convolutional Neural Network,CNN)技术,通过机器深度学习(Deep Learning),使系统基于样本的特征参数逐渐形成判断标准。卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。与其他深度学习结构相比,卷积神经网络在图像方面能够给出更优的结果。这一模型使用反向传播算法进行训练,相比较其他神经网络,卷积神经网络可以使用较少的参数,是一种高效准确深度学习结构。
在分析筛选特征的算法中,视觉图像信息被分解成许多子模式(特征),然后进入分层递阶式相连的特征平面进行处理,将视觉系统模型化,使其能够在即使物体有位移或轻微变形的时候,也能完成识别。多层卷积的采用为的是将单层卷积学提取的局部特征通过多层数后变得更全局化。
参见图3,以一个大小为5×5的图像,和一个3×3的卷积核为例,这里的卷积核共有9个参数,就记为Θ=[θij]3×3。这种情况下,卷积核实际上有9个神经元,他们的输出又组成一个3×3的矩阵,称为特征图。
假设有二维离散函数f(x,y),g(x,y)f(x,y),g(x,y),那么它们的卷积定义为:
因此,每个神经元的卷积运算为:
如果卷积层中的一个“神经中枢”连接到特征图X1,X2,...,Xi且这个卷积核的权重矩阵为Θj,那么这个神经中枢的输出为:
总之,客户端面部和场景的特征是由经过样本训练的深度网络萃取。深度网络的训练采用有监督训练的方式进行特征提取。在实际应用中,为了提高训练的效率和准确度,采用多卷积核(filter)进行多特征量提取。
卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。参见图4,图4为本发明一实施例提供的卷积神经网络的概念示意图,输入图像通过和三个可训练的滤波器和可加偏置进行卷积,滤波过程如图4,卷积后在C1层产生三个特征映射图,然后特征映射图中每组的四个像素再进行求和,加权值,加偏置,通过一个Sigmoid函数得到三个S2层的特征映射图。这些映射图再进过滤波得到C3层。这个层级结构再和S2一样产生S4。最终,这些像素值被光栅化,并连接成一个向量输入到传统的神经网络,得到输出。
一般地,C层为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;S层是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。
此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。卷积神经网络中的每一个特征提取层(C-层)都紧跟着一个用来求局部平均与二次提取的计算层(S-层),这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。
关于参数减少与权值共享,如果有1000×1000像素的图像,有1百万个隐层神经元,若这些神经元全部相互连接(每个隐层神经元都连接图像的每一个像素点),则有1000×1000×1000000=10^12个连接,即10^12个权值参数。由于图像的空间联系是局部的,每一个神经元都不需要对全局图像做感受,每个神经元只感受局部的图像区域,然后在更高层,将这些感受不同局部的神经元综合起来就可以得到全局的信息。这样就可以减少连接的数目,也就是减少神经网络需要训练的权值参数的个数了。假如局部感受野是10×10,隐层每个感受野只需要和这10×10的局部图像相连接,所以1百万个隐层神经元就只有一亿个连接,即10^8个参数。比原来减少了四个0(数量级),如此,训练的效率将得到极大的提升。
另外,隐含层的每一个神经元都连接10×10个图像区域,即每一个神经元存在10×10=100个连接权值参数。如果每个神经元这100个参数是相同的,也就是说每个神经元用的是同一个卷积核去卷积图像。不管隐层的神经元个数有多少,两层间的连接只有100个参数,这就是权值共享。假如一种滤波器,即一种卷积核就是提出图像的一种特征,例如某个方向的边缘。那么需要提取不同的特征,假设加到100种滤波器,每种滤波器的参数不一样,表示提出输入图像的不同特征,例如不同的边缘。这样每种滤波器去卷积图像就得到对图像的不同特征的放映,称之为Feature Map(特征标图)。所以100种卷积核就有100个Feature Map。这100个Feature Map就组成了一层神经元。这一层的参数个数为:100种卷积核×每种卷积核共享100个参数=100×100=10K,也就是1万个参数。
在上述三种服务提供方式(在线式、准在线式、离线式)的比较中,所述本地化准在线式处理包括:在所述便携式人工智能装置处进行图像检测、矫正和本地数据存储管理,在云端处进行图像识别并进行深度学习,将识别及深度学习结果返回至所述便携式人工智能装置;通过准在线式结构,可达到如下效果:客户端比较容易集成和调用;对客户端硬件性能要求较低;可提供明显由于在线式构架的服务性能。
所述本地化离线式处理包括:在所述便携式人工智能装置处进行图像检测、图像识别并深度学习,并实时将结果返回至本地设备。同时在设定条件下将特征数据同步至所述云端备用。通过离线式结构,可达到如下效果:客户端容易集成和调用;业务逻辑复杂程度相对较低;可以不依赖网络提供服务;没有明显时延;适合提供实时动态识别服务和更复杂的AI功能。
本发明所述的大数据信息,首先是通过根据企业账户及行业信息从云端获取订制相应的大数据信息,将这些大数据信息进行特征提取并生成特征矩阵安装至该便携式人工智能设备中,通过该便携式人工智能设备对所采集到的人脸图像进行本地化处理分析。
深度学习目前仍有大量工作需要研究。目前的关注点还是从机器学习的领域借鉴一些可以在深度学习使用的方法,进一步简化和加速模型性能。
在本方法中,为了使复杂的深度学习框架流畅的在移动级芯片上运行,并达到类似的性能,采用了降维和滤波器优化的方法。
降维:减少卷积神经网络的层数(深度),使其在移动级芯片上运行,可以达到同样的速度。
滤波器优化:针对特定的识别对象,优化滤波器参数,在维度降低的情况下能更快速准确的捕捉到特征,实现类似的识别性能。
优选的,所述配置方法还包括步骤S5:
S5、当所述便携式人工智能装置通过所述移动设备连接上云端时,与云端同步数据,并依据所述云端的数据对所述便携式人工智能装置的特征库进行训练,并升级所述便携式人工智能装置的深度学习的逻辑参数。
本发明提出的配置方法可达到如下效果:
1、研发业界首款人工智能“深度学习”本地化微型AI扩展模块;
2、优化“深度学习”软件框架使其适合植入和运行在移动终端级芯片上;
3、设计适合人工智能本地化的客户端服务逻辑和数据管理;
4、针对人脸识别应用,优化人工智能算法以满足视频流动态实时处理速度;
5、提供丰富灵活的SDK组件,使第三方智能服务开发可以快速准确的生成定制化智能应用。
综上所述,本便携式人工智能装置通过人工智能“深度学习”算法本地化微型化实现在移动端服务部署和服务逻辑(服务定义,服务复制),,可应用于动态监测,智能机器人,自动驾驶,自主智能(如战地、深海、地下、废墟等无网络环境),以及移动设备的AI化扩展。
本文提供了实施例的各种操作。在一个实施例中,所述的一个或操作可以构成一个或计算机可读介质上存储的计算机可读指令,其在被电子设备执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,本文所使用的词语“优选的”意指用作实例、示例或例证。奉文描述为“优选的”任意方面或设计不必被解释为比其他方面或设计更有利。相反,词语“优选的”的使用旨在以具体方式提出概念。如本申请中所使用的术语“或”旨在意指包含的“或”而非排除的“或”。即,除非另外指定或从上下文中清楚,“X使用A或B”意指自然包括排列的任意一个。即,如果X使用A;X使用B;或X使用A和B二者,则“X使用A或B”在前述任一示例中得到满足。
而且,尽管已经相对于一个或实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以多个或多个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的存储方法。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。