CN107194416B

CN107194416B - 对象识别方法及装置、终端、处理器、存储介质

Info

Publication number: CN107194416B
Application number: CN201710298481.2A
Authority: CN
Inventors: 熊楚渝
Original assignee: CHENGDU TIANYAO TECHNOLOGY CO LTD
Current assignee: CHENGDU TIANYAO TECHNOLOGY CO LTD
Priority date: 2017-04-28
Filing date: 2017-04-28
Publication date: 2021-06-08
Anticipated expiration: 2037-04-28
Also published as: CN113469213A; CN107194416A

Abstract

本发明公开了一种对象识别方法及装置、终端、处理器、存储介质。其中，该方法包括：接收待识别对象的原始特征数据；将所述原始特征数据输入至学习机中的表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括以下至少之一：逻辑门和变换函数；依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果。本发明解决了相关技术中学习机不具备支持通用的机械式学习的能力的技术问题。

Description

对象识别方法及装置、终端、处理器、存储介质

技术领域

本发明涉及机器学习领域，具体而言，涉及一种对象识别方法及装置、终端、处理器、存储介质。

背景技术

机器学习是计算技术发展的一个重要方向。众所周知，计算机需要人工编程开发软件来赋予其能力，然后计算机才能进行工作。但是机器学习发展出新的方向，即用数据来训练机器，使得机器可以通过学习来获得处理这一类数据的能力。应用机器学习技术，可以开发许多单靠编程不能实现的软件，例如图像识别，语言识别等等。目前机器学习是一个热门学科，各个方面都投入了巨大资源进行各种研究。因此，机器学习的各个方面都得到迅速进展。但是，机器学习仍然面临众多的问题和困境。其中的一个很重大的问题就是，事实上机器学习需要很多人工介入，不能做到通用的机械式学习，其中，“通用”，是指机器学习方案不仅适用于一种类型的情况，而且适用于任何类型下的情况；机械式学习的含义是:一个机器遵循自己的基本规则(亦称为元规则)，不需要人工的干预，就可以根据其环境和输入的数据来改进自己，从而进一步获取处理相关信息的能力，使得不需要人工编程就可以正常工作。但是，相关技术中的学习机并不具备实现通用的机械式学习的条件。

诸如中国专利文献CN101162480A中公开了一种工程图自动识别与理解的方法，为了识别和理解工程图，采用了对象识别器从函数库中调用指定函数，该对象识别器根据深度优先遍历EBNF_Tree过程中识别函数名，按照次序调用并执行相应函数，在所输入的工程中中进行按序、定向、整体化识别，然而，在该方案中，其知识处理器的知识图谱并不具有通用性，所述EBNF_Tree叶节点为一组相关的基本分析函数，非叶节点为不同层次的工程对象，其边表示两个节点之间的关系，也就是说，其对象识别并不具有通用性，相应的，具有这样的节点组成的表征空间的对象识别器或者学习机并不具备通用的机械式学习的条件。

日本富士通株式会社授权专利CN101964059B(公告日期2013.09.11)的权利要求8中记载了一种识别对象的方法，包括将待识别对象输入到级联分类器中，所述级联分类器对所述待识别对象的每一级节点进行分类，获取所述对象的与每一级节点分类器相对应的特征，将所述对象的与每一级节点分类器对应的特征输入到每一级节点分类器进行识别，如果所述对象在每一级节点分类器的识别分数小于与每一级节点分类器所对应的识别分数阈值并且每一级节点分类器不是最后一级节点分类器，则将所述对象输入到下一级节点分类器，否则将这一级节点分类器的识别结果确定为最终的识别结果。然而，在该对象识别方法中，其基于训练样本集来构建各级节点的分类器，通过判断上级节点分类器的样本识别分数Conf是否小于对应上级节点分类器的识别分数阈值来确定该样本是否为下级分类器的训练样本。虽然其对于汉字字符识别精度较高，但是其对于通用性对象识别则无能为力，这是由其样本集以及分类器样本识别局限性所致。

中国专利文献CN102883145A的权利要求1中公开了一种对象识别方法，该方法包括向K个分布式部署的计算节点分发n个视频文件以由所述k个计算节点对所述n个视频文件进行对象识别，接收所述k个计算节点返回的完成对象识别的n个视频文件，其能够实现非人工的方式对对象进行识别，然而，由于其计算节点在海量计算的时候需要分布式部署得足够多，这些节点对对象识别时进行并行处理，所以其处理对象单一，运行速度慢，需要优化的点很多，不推荐使用。

中国授权专利CN106326928B(公开日期2017.01.01)的权利要求1中公开了一种目标识别方法，包括将待识别的第一特征参数与存储的多个特征参数进行比较，获得多个相似度；其中每个相似度用于指示所述第一特征参数与存储的一个特征参数之间的相似程度；若所述多个相似度中最大的相似度小于预设的第一阈值，根据所述第一特征参数属于至少一个目标对象的至少一个条件概率及所述至少一个目标对象的先验概率，确定所述第一特征参数属于所述至少一个目标对象的至少一个实际概率；确定所述至少一个实际概率中最大的实际概率所对应的目标对象为所述第一特征参数所属的对象。该目标识别方法能够对所采集的数据表征对象属性进行有效识别，然而该对象识别方法和上文日本富士通公司一样，对相似度和阈值进行比较，虽然对于涉及的特征识别精度较高，但是待识别的特征参数需要与存储的特征参数具有较高的相似度，否则识别精度问题突出，也就是说，其仍然不是一种通用的对象识别方法。

另外，在如下的参考文献中也详细公开了深度学习技术的目标识别技术方案。(文献[1]:Discussion on Mechanical Learning and Learning Machine,arxiv.org,2016,http://arxiv.org/abs/1602.00198、文献[2]：Learning multiple layers ofrepresentation,Trandes in Cognitive sciences,.Vol 11,pp 428-434.)

由此可见，现有技术中，鲜有一种无需人工干预，能够根据自身运行环境和输入的数据来改进自己，从而进一步获取处理相关信息的能力，无需人工编程即可正常工作的对象识别技术。

发明内容

鉴于现有技术中存在的技术问题，本发明目的在于提供一种无需人工干预，能够根据自身运行环境和输入的数据来改进自己，从而进一步获取处理相关信息的能力，无需人工编程即可正常工作的、用于识别原始特征数据所对应的待识别对象的对象识别方法及装置、终端、处理器、存储介质。

根据本发明实施例的一个方面，提供了一种基于学习机实现机器学习的对象识别方法，该学习机的基本组成部分为输入空间，内部表征空间，预测函数，输出空间，以及学习方法，基本学习对象为目标图式，基本学习资料为取自于所述目标图式的抽样，其特征在于，包括：接收待识别对象的原始特征数据，其中，所述原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；将所述原始特征数据输入至所述学习机中的所述表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括逻辑门和/或变换函数；依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果。

可选地，所述变换函数包括：一组具有连接关系的节点。

可选地，将所述原始特征数据输入至学习机中的表征空间之后，所述方法还包括：依据所述中间数据对学习机的学习方法进行调整；以及依据调整后的所述学习方法对所述表征空间以及所述预测函数进行调整。

可选地，所述学习机将输出结果反馈至学习方法部分，依据调整后的所述学习方法对所述表征空间以及所述预测函数进行调整，包括：依据调整后的所述学习方法对所述表征空间中的以下至少之一元素进行调整：节点的增加和删除、节点的种类、所述逻辑连接的增加和删除、所述逻辑连接的种类、所述逻辑连接的可信度；以及依据所述学习方法对所述预测函数进行调整。

可选地，所述节点的状态包括连通状态和非连通状态，其中，所述连通状态是指所述节点的输入侧和输出侧均存在与除了所述节点之外的节点连接的所述逻辑连接，所述节点的状态为依据所有连接到该节点的上游节点的状态以及所述逻辑连接的状态确定的。

可选地，所述逻辑连接包括以下至少之一类型：前馈连接、禁止连接、强制前馈和禁止前馈，其中，所述前馈连接是指允许接收上一节点的数据并将所述数据输入到下一节点。

可选地，依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果，包括：确定所述表征空间中与所述预测函数对应的输出节点，确定所述输出节点的状态和所述输出节点的逻辑连接；依据所述输出节点的状态和所述逻辑连接的种类确定所述预测函数的输出值，并将所述输出作为所述识别结果。

根据本发明实施例的另一方面，还提供了一种基于学习机实现机器学习的对象识别装置，该学习机的基本组成部分为输入空间，内部表征空间，预测函数，输出空间，以及学习方法，基本学习对象为目标图式，基本学习资料为取自于所述目标图式的抽样，其特征在于，包括：接收模块，用于接收待识别对象的原始特征数据，其中，所述原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；处理模块，用于将所述原始特征数据输入至所述学习机中的所述表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括逻辑门和/或变换函数；识别模块，用于依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果。

根据本发明实施例的又一方面，还提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的对象识别方法。

根据本发明实施例的再一方面，还提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行以上所述的对象识别方法。

根据本发明实施例的再一方面，还提供了一种终端，所述终端包括所述处理器。

可选地，所述学习机还包括以下模块：学习模块，与所述表征空间连接，用于提供学习方法，以及依据所述中间数据对学习机的学习方法进行调整；以及依据调整后的所述学习方法对所述表征空间以及输出空间对应的预测函数进行调整；所述输出空间包括一个或多个输出节点组成，该输出节点为表达式，用于依据预测函数获取输出值，并将所述输出值反馈至所述学习模块，以调整所述学习方法。

根据本发明实施例的再一方面，还提供了一种终端，包括：第一装置，用于采集待识别对象的原始特征数据；第二装置，用于将所述原始特征数据输入至学习机中的表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括以下至少之一：逻辑门和变换函数；处理器，所述处理器运行程序，其中，所述程序运行时对于从所述第一装置、第二装置输出的数据执行如下处理步骤：依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果。

根据本发明实施例的再一方面，还提供了一种基于学习机实现机器学习的系统，其特征在于，包括由获得原始特征数据的对象识别装置、存储介质、处理器、终端电性连接支持的学习机结构，该学习机的基本学习对象为目标图式；基本学习资料为取自于目标图式的抽样；基本组成部分为：输入空间，内部表征空间，预测函数，输出空间，学习方法；所述的原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；所述的目标图式，即数据中的所隐含的图式而为学习机期望发现并掌握；形成对任何目标图式，通过学习即可获得对该目标图式做信息处理的能力的结构。

在本发明实施例中，利用学习机中的表征空间对待识别对象的原始特征数据进行处理，得到中间数据，由于上述表征空间是由逻辑门和/或变换函数组成的节点构成的，因此，可以对上述表征空间进行调整，例如依据学习方法对上述表征空间进行控制调整，从而为实现机械式学习提供了有力支撑，进而解决了相关技术中学习机不具备支持通用的机械式学习的能力的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种终端的结构框图；

图2是根据本发明实施例的一种对象识别方法的流程示意图；

图3是根据本发明实施例的一种可选的OSIPL学习机的结构示意图；

图4是根据本发明实施例的一种学习机的信息流的流向示意图；

图5是根据本发明实施例的一种表征空间的基本结构示意图；

图6为根据本发明实施例的一种表征空间中节点的示意图；

图7为根据本发明实施例的一种表征空间中的连接的示意图；

图8为根据本发明实施例的一种表征空间中变化函数的逻辑示意图；

图9为根据本发明实施例的一种表征空间中的表达式的示意图；

图10为根据本发明实施例的预测函数的实现原理示意图；

图11为根据相关技术的身份认证特征提取流程图；

图12为根据本发明实施例的使用学习机的身份认证特征提取流程图；

图13a为根据本发明实施例的学习机在物联网进行训练的示意图；

图13b为根据本发明实施例的学习机的物联网应用示意图；

图14是根据本发明实施例的一种对象识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例提供了一种终端，如图1所示，该终端包括：

第一装置10，用于采集待识别对象的原始特征数据；可选地，该第一装置可以表现为图像采集装置、声音采集装置等，具体可以根据实际情况灵活选择。例如，在需要对声音进行识别时，可以启动终端中设置的声音采集装置。

第二装置12，用于将上述原始特征数据输入至学习机中的表征空间中，并将上述原始特征数据经过上述表征空间中选中的节点，得到中间数据，其中，上述表征空间中的各个上述节点之间通过逻辑连接连接，上述节点包括以下至少之一：逻辑门和变换函数。可选地，该第二装置可以设置为主动地读取第一装置中的原始特征数据，也可以设置为在检测到触发条件时，去读取上述原始特征数据。

处理器14，上述处理器14运行程序，其中，上述程序运行时对于从上述第一装置、第二装置输出的数据执行如下处理步骤：依据选中的预测函数对上述中间数据进行识别，得到上述待识别对象的识别结果。

基于上述终端，本申请实施例提供了一种对象识别方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。该方法可以运行于图1所示终端提供的运行环境下，图2是根据本发明实施例的一种对象识别方法的流程示意图。如图2所示，该方法包括以下处理步骤：

步骤S202，接收待识别对象的原始特征数据；可选地，该原始特征数据可以为人体的生物特征数据(例如人的声音信息等)，例如，在身份识别过程中，可以利用采集的生物特征数据进行身份识别。

步骤S204，将上述原始特征数据输入至学习机中的表征空间中，并将上述原始特征数据经过上述表征空间中选中的节点，得到中间数据，其中，上述表征空间中的各个上述节点之间通过逻辑连接连接，上述节点包括以下至少之一：逻辑门和变换函数。上述变换函数包括：一组具有连接关系的节点。

需要说明的是，在一个可选实施例中，上述学习机可以为OSIPL学习机，其中，OSIPL表示：目标图式(Objective Patterns)，采样(Sampling)，内部表征空间(InternalRepresentation)，预测函数(Predicating functions)，学习方法(Learning Methods)，上述目标图式即为学习对象。为了使得学习机可以适用于任何学习任务而不需要人工的设定，内部表征空间为逻辑门和变换函数组成的表达式，这些表达式形成了表征空间中的节点(即变换函数和逻辑门)，基于该节点形成新的表征空间，因此，表征空间具备任何扩张和收缩的能力，可以在学习和使用中随意扩展，并且不需要预先人工设定一个结构(现有的所有机器学习全部都需要人工设定结构)，因此对任何学习对象，都可以形成不断完善的表达式。在这样的内部表征空间上，再配上适当的学习方法和先验知识，就可以满足各种机械式学习的需求。这样的表征空间，非常不同于现有的机器学习方法，这个表征空间，将不再是黑箱，完全可以做到对外部透明，此特点可以扩展学习机的应用领域。

步骤S206，依据选中的预测函数对上述中间数据进行识别，得到上述待识别对象的识别结果。

在一个可选实施例中，本实施例中所涉及的学习机不仅可以用于对待识别对象的识别，还可以将输出结果反馈至学习方法部分(L)，以对上述学习方法进行调整，具体地，在将上述原始特征数据输入至学习机中的表征空间之后，依据上述中间数据对学习机的学习方法进行调整；以及依据调整后的上述学习方法对上述表征空间以及上述预测函数进行调整。

这样，便可以根据输出结果对学习方法进行改进，进而对内部表征空间进行调整。

在一个可选实施例中，依据调整后的上述学习方法对上述表征空间中的以下至少之一元素进行调整：节点的增加和删除、节点的种类、节点的状态、上述逻辑连接的增加和删除、上述逻辑连接的种类、上述逻辑连接的可信度；以及依据上述学习方法对上述预测函数进行调整。其中，上述节点的种类包括：逻辑门和变换函数。上述节点的状态包括连通状态和非连通状态，其中，上述连通状态是指上述节点的输入侧和输出侧均存在与除了上述节点之外的节点连接的上述逻辑连接；

根据本申请的一个可选实施例，上述节点的状态为所述节点的状态为依据所有连接到该节点的上游节点的状态以及所述逻辑连接的状态确定的。

可选地，上述逻辑连接包括以下至少之一类型：前馈连接、禁止连接、强制前馈和禁止前馈，其中：

上述前馈连接，是指在当前节点的连通状态为连通时，确定下一节点的连通状态确定为连通，以及在当前节点的连通状态为非连通时，确定下一节点的连通状态为非连通；

上述禁止连接，是指在上述当前节点的状态为连通时，确定下一节点的连通状态为禁止连通，以及上述当前节点的状态为非连通时，确定下一节点的连通状态为非禁止连通；

上述强制前馈，是指在上述当前节点的状态为连通时，确定下一节点的连通状态为非连通，以及上述当前节点的状态为非连通时，确定下一节点的连通状态为连通；

上述强制禁止，是指在上述当前节点的状态为连通时，确定下一节点的连通状态为非禁止连通，以及上述当前节点的状态为非连通时，确定下一节点的连通状态为禁止连通。

可选地，上述逻辑连接具有以下属性：可信度，该可信度的取值为大于0且小于1之间的实数。该可信度用于帮助“学习方法”(可以认为是一个模块或流程节点)确定怎样学习，以及帮助确定是否连通当前的逻辑连接。

可选地，确定上述表征空间中与上述预测函数对应的输出节点，确定上述输出节点的状态和上述输出节点的逻辑连接；依据上述输出节点的状态和上述逻辑连接的种类确定上述预测函数的输出值，并将上述输出至作为上述识别结果。

OSIPL学习机将具备全部IPU所具备的，例如输入空间，输出空间等。但是，OSIPL学习机中具备的核心组成部分，则为一般的IP U所不具备。IPU的图解可以参见文献[l]中的图to学习机的目标很明确，就是从输入中获知如何改进自己，并进一步改进自己处理信息的能力(注意这里，对机器用了自己一词，是符合当前的学术界对机器认识水平的)。也就是说，输入中有若干图式(pattern，学习机可以通过感知这些图式，进而获知如何改进自己，并进一步改进自己处理这些图式的能力。几乎所有的机器学习都在做这个事情。在OSIPL学习机中，我们发明一种全新的技术方式来建立这种学习能力。

以下结合附图对本申请实施例中所涉及的学习机进行详细说明，需要说明的是，以下仅是示例性说明，并不构成对本发明保护范围的限定。

以下涉及的学习机为由O、S、I、P、L各个部分组成的学习机，以下称为OSIPL学习机或简称为学习机，上述各个组成部分是分别独立存在并且相互配合的，这样可以提供学习机的数据处理效率带来相当的效益提高。这和现有的各种机器学习系统，例如各种深度学习系统，是不同的。

OSIPL学习机首先是IPU，即信息处理机，具备信息处理能力。但是，不仅具备信息处理能力，而且具备学习能力，即可以从环境和输入数据中学习，进而改进自己的信息处理能力。进一步，OSIPL学习机还是一种通用学习机(通用学习机之定义，参见文献[l]>，即对任何目标图式(Objective patterns)，不需要用编程，通过学习就可以获得对该目标图式做信息处理的能力。

此处指出，内部表征空间I是OSIPL学习机的核心，处理信息以及学习都是围绕I展开的。OSIPL的表征空间与目前所有的机器学习方法完全不同。使用这个特殊设计的表征空间，将赋予OSIPL学习机很多能力。

图3是根据本发明实施例的一种可选的OSIPL学习机的结构示意图。如图3所示，学习机的基本组成部分为:1)目标图式(即O，学习对象)；2>抽样(即S，就是抽样过程及方法，学习对象，必须要经过抽样才能作用于输入空间)；3>输入空间；4)内部表征空间(即D，这是学习机的核心组成部分，机械式学习就是在这个空间中具体实现的；5>预测函数(即P，这是从内部表征空间映射到输出空间的函数)；6)输出空间；7>学习方法(即L，这是控制I的各种行为方式的集合)。注意S其实是O的一个子集。

在一个可选实施例中，OSIPL学习机的基本原理如下：当有基本图式(basepatttern，这是一个N维的二进制向量}进入输入内部表征空间后，表征空间就将作出处理信息和学习的行动，这些行动包括表征空间中产生或者修改图式表达式(即内部表征空间中的节点)，选择采用的预测函数，并且用预测函数产生输出值，输出值也是一个基本图式，是一个M维的二进制向量)，表征空间的行为将由L中的学习方法来加以控制，包括产生和修改表征空间中的表达式，以及决定预测函数，以及其他等等行为。在输出空间获得输出值后，有可能从环境中获得这个输出值的反馈，并且可以把反馈返回到学习机，L可以获取这个反馈，并且可以用这个反馈来进一步对表征空间进行修改。

图4是根据本发明实施例的一种学习机的信息流的流向示意图，如图4所示，OSIPL学习机中，有两个信息流，一个是信息处理，即对输入信息做处理，直到获得输出。另一个是从输入信息中，以及已有的I和L的各种状态，获知如何改进自己，并且进一步改进自己(这就是学习)。两个信息流并行不悖。由此可见，OSIPL学习机将不局限进行所谓的无监督学习或者监督学习，而是可以进行多种学习。因此获得的一个重要特征，就是OSIPL学习机可以进行在线学习，学习不必中断。当然，也允许中断学习。

通常情况是L(即学习方法)是不改变的。但是，一种高级情况是，L本身将嵌入另一个OSIPL学习机，那样的话，L本身也将进行学习。这样的OSIPL称为层次2的学习机，功能将极大提高。这是OSIPL学习机的重要特性，即将可能隐含的性能和功能更加明确。

更具体说，OSIPL学习机的信息处理能力体现在表征空间中的连接和节点，而学习体现在对这些连接和节点进行适当改变，但是这种改变不是通过外界的编程等来实现，而是通过外界数据的输入来实现。

图5是根据本发明实施例的一种表征空间的基本结构示意图。如图5所示，该表征空间的结构如下：OSIPL学习机中间的表征空间设计是本发明中最重要的组成部分。可以在这里回顾一下其他的机器学习方法所采用的表征空间。可以参见文献[2]。在那里，表征空间是由人工神经元组成网络，而每个人工神经元为一个线性组合再配上一个非线性的取值函数。而且，这个表征空间这工作是由人工设定基本结构，例如每一层有多少神经元等等。因此，表征空间就最终等同于一组参数空间(非常巨量的参数空间)。这样的表征空间将有这些重大局限:1)很难有明晰的表征，即大量的参数，究竟在表达什么，是非常不清楚的。不仅不能自然获得这些参数的意义，就是投入巨大的资源去探求，也未必可以搞清楚参数的意义。事实上，这已经成为现有的深度学习的重大障碍之一。2)在人工设定基本结构后，基本上不能再对基本结构做大的调整，因此，使得其不太可能适应完全不同的各种情况，即很难做成通用学习机。3)这样的人工神经元结构，决定了其学习方法需要沿用已有的数学方法，特别是反向传播方法，而不太可能采用更多更新的方法。4)这些的人工神经元结构，非常缺乏容纳多种学习方法的能力和空间，因此不能获得多种方法的益处。本发明实施例提供的学习机，将神经元认定是一些逻辑门。但是，相关技术中对于表征空间中的逻辑门和连接的设计尚无较为合适的方案。因此，在表征空间中采取独特的设计，使得表征空间中的节点是特殊设计的逻辑门或者是完成特殊功能的变换函数(特别是对几何对象的变换函数)，以及特殊设计的连接。

如图5所示，表征空间中的基本单元是节点，节点是逻辑门或者特殊功能的变换函数。节点之间用特殊设计的连接(如图7所示)相连。节点可以是逻辑门，也可以说由L控制的具备特殊功能的变换函数(见图8)。当节点连接起来后，就形成了表达式。每一个节点就是一个它向后连接的所有节点组成的表达式(见图9)表征空间由L控制，在S的刺激下，可以产生节点，产生连接，修改连接(包括连接的参数)，节点也可以消失，或者失去连接。在表征空间中增加节点和减少节点，等等，是学习机制的重要环节。

图6为根据本发明实施例的一种表征空间中节点的示意图。如图6所示，节点是OSIPL学习机处理信息的基本单元。参见图4，可以看到节点的细节。节点分成两类，一类是逻辑门，一类是L所拥有的变换函数。OSIPL学习机可以仅有逻辑门而没有变换函数，也可以两者皆有。事实上，变换函数是一组特殊已经预先安排好的逻辑门和连接，预先由L所掌握，不须学习就可以用，可以看作是OSIPL学习机的先验知识的的一部分。逻辑门和变换函数的更多细节见图6。其中，逻辑门或者变换函数进入的连接有4种：f、p、ff、fp，出去的连接有4种f、p、ff、fp，OSIPL的逻辑门的规则：逻辑门有两种状态，亮和黑(1和0)，连接(无论其种类)也是两种状态，亮和黑(1和0)如果逻辑门亮，出去的连接中f、p亮，ff、fp黑，如果逻辑门黑，出去的连接中f、p黑、ff、fp亮。OSIPL的变换函数的规则，完全由学习方法制定和规范，其实可以看作是一组逻辑门做特殊连接后得到的。

节点有两个状态，即亮和黑(1和0>。节点的状态由所有进来的连接决定。如果一处节点是逻辑门，决定该节点的逻辑流程可见图6。如果一处节点是变换函数，其逻辑流程是预先定制好的。

一个节点处可能有进来的连接，和出去的连接。节点不能控制进来的连接的状态，但是节点决定出去的连接的状态，具体的规则，详见图6。

节点可能既有进来的连接，也有出去的连接，这是通常情况。但是，节点也可以仅有进来的连接，而没有出去的连接。也可能节点仅有出去的连接，但是没有进来的连接，这样，该节点就用于处于黑的状态，出去的连接也都是黑的，因此这种情况事实上没有用处。节点也可以完全没有连接，但是如果这样，这个节点就处于消失状态了。

OSIPL学习机可以增加节点，也可以删除节点。增加和删除节点由L的方法来控制。这是学习机进行学习的基本机制之一。

图7为根据本发明实施例的一种表征空间中的连接的示意图。如图7所示，连接也是OSIPL学习机处理信息的基本单元，总共有四种连接:前馈连接，禁止连接，强制前馈，强制禁止，在图7中，分别为f,p,ff,fp。它们的性质如图7表示。这些连接是OSIPL学习机处理信息的基本机制。但是，任何一个连接除开具备连接的功能外，还具备对于该连接的可信度的记录。这个记录是一个0和1之间的实数。每个连接的可信度是由L的方法来加以控制和调整的，这是学习机制的重要环节。两个节点之间的连接，除开可信度是可以调整的之外，连接的种类也是可以调整的，例如从f变成P，或者从咬成印，等等。连接的种类的改变都是由L的方法来加以控制和调整的。这也是学习机制的重要环节。两个节点之间的连接，可以增加，也可以删除，甚至全部删除。连接的增加和删除都是由L的方法来加以控制和调整的。这也是学习机制的重要环节。

图9为根据本发明实施例的一种表征空间中的表达式的示意图。每个节点，和该节点下面的连接起来的所有节点和所有连接一起，组成表征空间中的一个表达式，参见图9。这个表达式，就是I一表征空间中的核心内容。这些表达式是信息处理的基础。所有的节点，都可以有出去的连接，这样，这个表达式就可以成为更高层次的表达式的一部分。如图9中的节点B，本身就是一个表达式，但是，又是更高层次的表达式的一部分。

需要特别说明，表征空间中的表达式，都是逻辑清晰的，完全可以由人容易地充分理解，因此，表达式对外部可以做到彻底透明。由于表征空间中是由各种表达式组成的，因而，表征空间也就对外部彻底透明。这个属性是现有的机器学习方法不具备的。在很多应用领域，对外部透明的表征空间，将是至关重要的。

图10为根据本发明实施例的预测函数的实现原理示意图。参见图10。预测函数是OSIPL学习机输出信息的环节。在表征空间中，已经积累了若干节点后，学习方法将选取其中的一个或者多个节点(例如图8中的输出节点1等)，然后选取连接到输出空间的单元上。输出空间是M维的二进制向量，因此需要M个预测函数分量(它们共同组成预测函数)。这样，预测函数的输出值，就由输出节点的状态和连接来共同决定。如果连接是f，那么输出节点的状态就等于预测函数的输出值。这是通常情况。因此，选取预测函数，基本上就等于选择输出节点。

需要注意的是，输出节点是某个表达式，因此选取预测函数，也就是相当于在选取某个表达式。这正是学习的目的。OSIPL学习机的学习的重要环节，就是形成表达式，并且选取合适的表达式。OSIPL学习机中的学习方法的基本内容OSIPL中的L是集合了学习方法的部分。L部分和其他部分分离，因此可以获得更大的灵活性和学习功能。这和目前的机器学习系统完全不同。在目前的机器学习系统中，并没有把表征空间，表达式，可信度(如果有的话)，和学习方法明晰分离，而是纠缠在一起，很难明晰处理，因此使得改进比较困难。采用本实施例提供的方案，使得学习方法和表征空间基本上完全分离。学习方法将具备这些基本功能:节点的增删，节点的种类的决定，连接的增删，连接的种类的改变，连接的可信度的调整，预测函数的选择，等。学习方法如何具体实现这些功能(例如说采取决定论性质的方法，还是采取概率论性质的方法，还是两者的混合，等等)，本发明并不特别强求。任何具备如上功能的学习方法，都可以被采用。当然，并非所有方法的效果都一样，而选取更有效的学习方法，就是进一步研究的目标了。

通常规定学习方法是不变动的。但是，高级方法也是可以变动的。例如，如果L本身内嵌一个OSIPL学习机，那么L本身就将随着学习而进化，那么这个学习机就成为第2层次的学习机。当OSIPL学习机配备了如上的表征空间，并且学习方法具备如上说的基本功能，就已经成为通用学习机。选用优秀的学习方法，将可以促进提高OSIPL的学习能力。

以下以身份认证为例进行说明

身份认证需要采用先进的信息处理技术。特别是结合了生物特征的身份认证，要求实时采样的数据，并且对这些数据进行深度加工处理，从中提取出可靠的特征，然后做出判断。参见图11，一个极端困扰的问题是，采用传统方式，这些工作都是人工编程的程序来做的。而要编程这样的程序，需要极大的人力投入，而且即使在投入巨大人力后，效果往往仍然非常不理想。这个困难一直都存在。现在各种机器学习方法有了很好的进展，例如围棋赛等。因此，希望采用机器学习的方法来克服这个困难，即，不是通过直接人工编程来赋予计算系统能力，而是通过这样的方法:首先在计算系统建立机器学习的能力，然后对系统做适当的数据输入，使得计算系统可以通过学习来获得能力。这是一个非常值得探索的方向。

但是，现在通行的机器学习方法，还很难用于身份认证领域。原因不止一种。但是仅看这些方法需要的计算资源，就可以看到其不可能性。例如，这些方法，动辄需要上百的GPU，需要大量的数据，训练上百小时。这对于身份认证领域，是不可设想的。因为，身份认证领域需要面对上亿的用户，不可能对每一个用户都分配这样数量的计算资源。参见图12，其中分成3个阶段：

第一阶段是通用训练阶段。这个阶段，将针对某个人群来提取数据，并且用这些数据做训练。举例来说，如果是做声纹特征，就可能选取四川人群的数据，或者山东人群的数据。这个阶段的训练，将使得OSIPL学习机具备处理这个人群的数据的能力。因为OSIPL学习机的所有学习成果，都反映在其表征空间中间，这个表征空间可以非常容易用做下一阶段的训练。这个阶段的数据量一定是比较大量的数据，训练时间也可能比较长。但是其结果，可以对某个人群通用。

第二阶段是个性训练阶段。这个阶段，将采取某一个人的数据，用做训练。但是，初始表征空间是第一阶段的训练成果，这样，就可以仅用量很小的数据(例如，20次指纹输入，等等)，因此，训练时间可以相当短。在这个阶段结束时，OSIPL学习机已经可以对某一个人的数据，有了很好的能力，具体讲，就是各种误差率低于一个很小的阈值。这样，这个阶段结束后，其表征空间，就可以用于使用阶段。需要特别指出，这个阶段需要的资源是很小的。完全可以用单个现在的通用CPU在很短时间内完成。这个对计算资源的要求，对是否可以实际运用是关键的。必须仅对计算资源的极低要求，才能用于身份认证领域。

第三阶段是实际使用阶段。这个阶段，表征空间上第二阶段的训练成果。这样，从一开始，就可以准确执行身份认证的计算任务。到了实际使用阶段，因为OSIPL学习机具备在线学习的功能，因此将继续在线学习。但是，学习的结果，即表征空间的演进必须在有控制的情况下稳步进行，这样就可以保证使用安全。在多数情况下，表征空间将保持很小变动或者不变动的。必须注意到，在第二阶段和第三阶段，都是针对每一个用户设置的OSIPL学习机。这就要求OSIPL学习机仅使用很小的计算资源，而且可以轻易部署使用。根据我们的理解，现有的机器学习方法，都无法做到此点。每一个用户配套一个独特的OSIPL学习机，具备非常优秀的安全性。这也是现有的一切计算方法都无法取得的安全性。因为表征空间，本质上是用户的身份特征的许多细节精粹而成的，本质上没有可能复制(除非经历完全相同的学习过程，但是这是完全不可能的)，

因此安全性比现有的方式(即把特征存在数据库中)提供很多。

OSIPL学习机也可以应用于其他应用场景：前面讨论了OSIPL学习机用于身份认证领域。虽然这仅是在一个领域内的应用，但是，相同的J思路，可以适用于很多不同的领域。举例来说，物联网中的智能节点，OSIPL学习机就可以良好适用。

参见图13a-13b，这是在一个物联网局部中大量使用智能节点的场景。因为物联网要求节点非常节能，能够在线学习，极低成本，其智能节点必需满足这些要求，才有可能获得应用。还有一个更重要的要求，即必须要尽量避免人工编程和大量人工管理。OSIPL学习机，按照如图13a-13b，将完全满足这些条件。图13b部图示智能节点的部署情况。这些节点在使用过程中，将接受大量信息，可以是来自于其他节点的信息，也可能是来自于服务器的信息，也可能是其他信息来源，在接受这些信息之后，需要做出智能判断和行动，包括向服务器报告等。如果这个节点的处理这些信息的能力来自于人工编程，就会使得管理很困难，因为节点的数目及其庞大，而且需要经常改变以应对快速变化的情况。举例来说，如果这个网络是检测车辆流动的物联网，有些节点，如图13a-13b中的节点3和节点M需要向服务器报告异常情况。如果这些节点的软件完全由人工编程开发的，将很难自适应迅速变化的情况，很难对异常情况作出准确的判断，因此需要非常巨大的人力来维护这些节点，但是那是非常困难的。因此，比较有利的办法应该是，这些节点具备从输入信息学习的能力，这样就可以极大减少管理的工作。图13a所示智能节点的能力获取的过程。这和前面的一样，都有通用训练，以及个体使用在线学习的两个部分。正是因为采用OSIPL学习机，以及这样的两个部分，才使得如图13b所示的部署成为可能。

图14是根据本发明实施例的一种对象识别装置的结构框图。如图14所示，该装置包括：接收模块140，用于接收待识别对象的原始特征数据；处理模块142，用于将所述原始特征数据输入至学习机中的表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括以下至少之一：逻辑门和变换函数；识别模块144，用于依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果。

需要说明的是，上述各个模块是可以通过软件或硬件形式来实现的，对于后者，可以通过以下方式实现，但不限于此：上述各个模块位于同一处理器中；或者，上述各个模块位于不同的处理器中。

本发明实施例提供了一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的对象识别方法。

本发明实施例提供了一种处理器，处理器用于运行程序，其中，所述程序运行时执行以上所述的对象识别方法。

本发明实施例，还提供了一种终端，该学习机具有表征空间，所述表征空间由节点组成，各个所述节点之间通过逻辑连接连接，所述节点包括以下至少之一：逻辑门和变换函数。

所述学习机还包括以下模块：学习模块，与所述表征空间连接，用于提供学习方法，以及依据所述中间数据对学习机的学习方法进行调整；以及依据调整后的所述学习方法对所述表征空间以及输出空间对应的预测函数进行调整；所述输出空间包括一个或多个输出节点组成，该输出节点为表达式，用于依据预测函数获取输出值，并将所述输出值反馈至所述学习模块，以调整所述学习方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于学习机实现机器学习的对象识别方法，该学习机的基本组成部分为输入空间，内部表征空间，预测函数，输出空间，以及学习方法，基本学习对象为目标图式，基本学习资料为取自于所述目标图式的抽样，其特征在于，包括：

接收待识别对象的原始特征数据，其中，所述原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；

将所述原始特征数据输入至所述学习机中的所述表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括逻辑门和/或变换函数,所述变换函数为预先安排好的逻辑门和连接，包括一组具有连接关系的节点，

依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果，其中，

在表征空间中，积累了若干节点后，学习方法将选取其中一个或多个节点，然后选取连接到输出空间的单元上，输出空间是M维的二进制向量,需要M个预测函数分量，M个预测函数分量共同组成预测函数，预测函数的输出值由输出节点的状态和连接共同决定，所述学习方法在进行身份认证时分成三个阶段，即第一阶段，是通用训练阶段，针对人群提取数据并用这些数据做训练，第二阶段，是个性训练阶段，是提取个人数据并用作训练，和第三阶段，实际使用阶段，以执行身份认证的计算任务。

2. 根据权利要求1所述的方法，其特征在于，将所述原始特征数据输入至学习机中的表征空间之后，所述方法还包括：

所述学习机将识别结果反馈至学习方法部分，依据所述中间数据对学习机的学习方法进行调整；以及

依据调整后的所述学习方法对所述表征空间以及所述预测函数进行调整。

3.根据权利要求2所述的方法，其特征在于，依据调整后的所述学习方法对所述表征空间以及所述预测函数进行调整，包括：

依据调整后的所述学习方法对所述表征空间中的以下至少之一元素进行调整：节点的增加和删除、节点的种类、节点的状态、所述逻辑连接的增加和删除、所述逻辑连接的种类、所述逻辑连接的可信度；以及依据所述学习方法对所述预测函数进行调整。

4. 根据权利要求1所述的方法，其特征在于，

所述节点的状态包括连通状态和非连通状态，其中，所述连通状态是指所述节点的输入侧和输出侧均存在与除了所述节点之外的节点连接的所述逻辑连接；和/或

所述节点的状态为依据所有连接到该节点的上游节点的状态以及所述逻辑连接的状态确定的。

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述逻辑连接包括以下至少之一类型：前馈连接、禁止连接、强制前馈和禁止前馈；

其中，所述前馈连接，是指在当前节点的连通状态为连通时，确定下一节点的连通状态确定为连通，以及在当前节点的连通状态为非连通时，确定下一节点的连通状态为非连通；

所述禁止连接，是指在所述当前节点的状态为连通时，确定下一节点的连通状态为禁止连通，以及所述当前节点的状态为非连通时，确定下一节点的连通状态为非禁止连通；

所述强制前馈，是指在所述当前节点的状态为连通时，确定下一节点的连通状态为非连通，以及所述当前节点的状态为非连通时，确定下一节点的连通状态为连通；

所述禁止前馈，是指在所述当前节点的状态为连通时，确定下一节点的连通状态为非禁止连通，以及所述当前节点的状态为非连通时，确定下一节点的连通状态为禁止连通。

6.根据权利要求5所述的方法，其特征在于，依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果，包括：

确定所述表征空间中与所述预测函数对应的输出节点，确定所述输出节点的状态和所述输出节点的逻辑连接；

依据所述输出节点的状态和所述逻辑连接的种类确定所述预测函数的输出值，并将所述输出作为所述识别结果。

7.根据权利要求1至4中任一项所述的方法，其特征在于，所述逻辑连接具有以下属性：可信度，该可信度的取值为大于0且小于1之间的实数。

8.一种基于学习机实现机器学习的对象识别装置，该学习机的基本组成部分为输入空间，内部表征空间，预测函数，输出空间，以及学习方法，基本学习对象为目标图式，基本学习资料为取自于所述目标图式的抽样，其特征在于，包括：

接收模块，用于接收待识别对象的原始特征数据，其中，所述原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；

处理模块，用于将所述原始特征数据输入至所述学习机中的所述表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括逻辑门和/或变换函数,所述变换函数为预先安排好的逻辑门和连接，包括一组具有连接关系的节点；

识别模块，用于依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果，其中，

9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的对象识别方法。

10.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的对象识别方法。

11.一种终端，包括如权利要求10所述的处理器。

12.根据权利要求11所述的终端，其特征在于，所述学习机还包括以下模块：

学习模块，与所述表征空间连接，用于提供学习方法，以及依据所述中间数据对学习机的学习方法进行调整；以及依据调整后的所述学习方法对所述表征空间对应的预测函数进行调整；

所述输出空间包括一个或多个输出节点组成，该输出节点为表达式，用于依据预测函数获取输出值，并将所述输出值反馈至所述学习模块，以调整所述学习方法。

13.一种终端，基于学习机实现机器学习的对象识别，该学习机的基本组成部分为输入空间，内部表征空间，预测函数，输出空间，以及学习方法，基本学习对象为目标图式，基本学习资料为取自于所述目标图式的抽样，其特征在于，包括：

第一装置，用于采集待识别对象的原始特征数据，其中，所述原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；

第二装置，用于将所述原始特征数据输入至所述学习机中的所述表征空间中，并将所述原始特征数据经过所述表征空间中选中的节点，得到中间数据，其中，所述表征空间中的各个所述节点之间通过逻辑连接连接，所述节点包括逻辑门和/或变换函数,所述变换函数为预先安排好的逻辑门和连接，包括一组具有连接关系的节点；

处理器，所述处理器运行程序，其中，所述程序运行时对于从所述第一装置、第二装置输出的数据执行如下处理步骤：依据选中的预测函数对所述中间数据进行识别，得到所述待识别对象的识别结果，其中，

14. 一种基于学习机实现机器学习的系统，其特征在于，包括由获得原始特征数据的对象识别装置、存储介质、处理器、终端电性连接支持的学习机结构，该学习机的基本学习对象为目标图式；基本学习资料为取自于目标图式的抽样；基本组成部分为：输入空间，内部表征空间，预测函数，输出空间，学习方法；

所述的原始特征数据为图像数据或声音数据，所述数据的子集即为所述抽样；

所述的目标图式，即数据中的所隐含的图式而为学习机期望发现并掌握；

形成对任何目标图式，通过学习即可获得对该目标图式做信息处理的能力的结构，其中，