CN106663221B

CN106663221B - 由知识图谱偏置的数据分类

Info

Publication number: CN106663221B
Application number: CN201580044015.0A
Authority: CN
Inventors: S·马宗达; R·B·托瓦; S·S·塔拉迪; D·J·朱利安; V·S·R·安纳普莱蒂
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-08-19
Filing date: 2015-07-28
Publication date: 2019-11-29
Anticipated expiration: 2035-07-28
Also published as: EP3183695A1; US10474949B2; CN106663221A; US20160055409A1; TW201626293A; JP2017531240A; WO2016028446A1; EP3937087A1; SG11201610934SA; KR20170044102A; BR112017003023A2

Abstract

一种用于分类对象的方法包括向多个对象应用多个置信度值。该方法还包括基于这多个置信度值来确定度量。该方法进一步包括在该度量高于阈值时，基于知识图谱来确定这多个对象中的第一对象的分类。

Description

由知识图谱偏置的数据分类

相关申请的交叉引用

本申请依据35U.S.C.§119(e)要求于2014年8月19日提交的题为“KNOWLEDGE-GRAPH BIASED CLASSIFICATION FOR DATA(由知识图谱偏置的数据分类)”的美国临时专利申请No.62/039,329的权益，其公开内容通过援引全部明确纳入于此。

背景

领域

本公开的某些方面一般涉及神经系统工程设计，且尤其涉及由知识图谱偏置的分类。

背景技术

可包括一群互连的人工神经元(即神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。人工神经网络可具有生物学神经网络中的对应的结构和/或功能。然而，人工神经网络可为其中传统计算技术是麻烦的、不切实际的、或不胜任的某些应用提供创新且有用的计算技术。由于人工神经网络能从观察中推断出功能，因此这样的网络在因任务或数据的复杂度使得通过常规技术来设计该功能较为麻烦的应用中是特别有用的。取决于数据和/或网络架构的复杂性，神经网络可能不使用模式共现性来进行对象识别。由此，期望提供基于知识图谱偏置来分类数据中的对象的神经元形态接收器。

概述

在本公开的一个方面，公开了一种用于分类对象的方法。该方法包括向多个对象应用多个置信度值。该方法还包括基于这多个置信度值来确定度量。该方法进一步包括在该度量高于阈值时，基于知识图谱来确定这多个对象中的第一对象的分类。

本公开的另一方面针对一种设备，其包括用于向多个对象应用多个置信度值的装置。该设备还包括用于基于这多个置信度值来确定度量的装置。该设备进一步包括用于在该度量高于阈值时，基于知识图谱来确定这多个对象中的第一对象的分类的装置。

在本公开的另一方面，公开了一种用于分类对象的计算机程序产品。该计算机程序产品具有其上记录有非瞬态程序代码的非瞬态计算机可读介质。该程序代码包括用于向多个对象应用多个置信度值的程序代码。该程序代码还包括用于基于这多个置信度值来确定度量的程序代码。该程序代码进一步包括用于在该度量高于阈值时，基于知识图谱来确定这多个对象中的第一对象的分类的程序代码。

本公开的另一方面针对一种用于分类对象的装置，该装置具有存储器和耦合至该存储器的一个或多个处理器。处理器被配置成向多个对象应用多个置信度值。处理器还被配置成基于这多个置信度值来确定度量。处理器被进一步配置成在该度量高于阈值时，基于知识图谱来确定这多个对象中的第一对象的分类。

本公开的附加特征和优点将在下文描述。本领域技术人员应该领会，本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到，这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而，要清楚理解的是，提供每一幅附图均仅用于解说和描述目的，且无意作为对本公开的限定的定义。

附图简述

在结合附图理解下面阐述的详细描述时，本公开的特征、本质和优点将变得更加明显，在附图中，相同附图标记始终作相应标识。

图1解说了根据本公开的某些方面的示例神经元网络。

图2解说了根据本公开的某些方面的计算网络(神经系统或神经网络)的处理单元(神经元)的示例。

图3解说了根据本公开的某些方面的尖峰定时依赖可塑性(STDP)曲线的示例。

图4解说了根据本公开的某些方面的用于定义神经元模型的行为的正态相和负态相的示例。

图5解说了被捕捉以供对象识别系统处理的图像的示例。

图6解说了根据本公开的一方面的知识图谱的示例。

图7解说了根据本公开的某些方面的使用通用处理器来设计神经网络的示例实现。

图8解说了根据本公开的某些方面的设计其中存储器可以与个体分布式处理单元对接的神经网络的示例实现。

图9解说了根据本公开的某些方面的基于分布式存储器和分布式处理单元来设计神经网络的示例实现。

图10解说了根据本公开的某些方面的神经网络的示例实现。

图11是解说根据本公开的一方面的用于分类对象的方法的流程图。

详细描述

以下结合附图阐述的详细描述旨在作为各种配置的描述，而无意表示可实践本文中所描述的概念的仅有的配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而，对于本领域技术人员将显而易见的是，没有这些具体细节也可实践这些概念。在一些实例中，以框图形式示出众所周知的结构和组件以避免湮没此类概念。

基于本教导，本领域技术人员应领会，本公开的范围旨在覆盖本公开的任何方面，不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如，可以使用所阐述的任何数目的方面来实现装置或实践方法。另外，本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解，所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。

措辞“示例性”在本文中用于表示“用作示例、实例或解说”。本文中描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。

尽管本文描述了特定方面，但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点，但本公开的范围并非旨在被限定于特定益处、用途或目标。相反，本公开的各方面旨在能宽泛地应用于不同的技术、系统配置、网络和协议，其中一些作为示例在附图以及以下对优选方面的描述中解说。详细描述和附图仅仅解说本公开而非限定本公开，本公开的范围由所附权利要求及其等效技术方案来定义。

示例神经系统、训练及操作

图1解说了根据本公开的某些方面的具有多级神经元的示例人工神经系统100。神经系统100可具有神经元级102，该神经元级102通过突触连接网络104(即，前馈连接)来连接到另一神经元级106。为简单起见，图1中仅解说了两级神经元，尽管神经系统中可存在更少或更多级神经元。应注意，一些神经元可通过侧向连接来连接至同层中的其他神经元。此外，一些神经元可通过反馈连接来后向连接至先前层中的神经元。

如图1所解说的，级102中的每一个神经元可以接收可由前级的神经元(未在图1中示出)生成的输入信号108。信号108可表示级102的神经元的输入电流。该电流可在神经元膜上累积以对膜电位进行充电。当膜电位达到其阈值时，该神经元可激发并生成输出尖峰，该输出尖峰将被传递到下一级神经元(例如，级106)。在一些建模办法中，神经元可以连续地向下一级神经元传递信号。该信号通常是膜电位的函数。此类行为可在硬件和/或软件(包括模拟和数字实现，诸如以下所述那些实现)中进行仿真或模拟。

在生物学神经元中，在神经元激发时生成的输出尖峰被称为动作电位。该电信号是相对迅速、瞬态的神经脉冲，其具有约为100mV的振幅和约为1ms的历时。在具有一系列连通的神经元(例如，尖峰从图1中的一级神经元传递至另一级神经元)的神经系统的特定实施例中，每个动作电位都具有基本上相同的振幅和历时，并且因此该信号中的信息可仅由尖峰的频率和数目、或尖峰的时间来表示，而不由振幅来表示。动作电位所携带的信息可由尖峰、发放了尖峰的神经元、以及该尖峰相对于一个或数个其他尖峰的时间来确定。尖峰的重要性可由向各神经元之间的连接所应用的权重来确定，如以下所解释的。

尖峰从一级神经元向另一级神经元的传递可通过突触连接(或简称“突触”)网络104来达成，如图1中所解说的。相对于突触104，级102的神经元可被视为突触前神经元，而级106的神经元可被视为突触后神经元。突触104可接收来自级102的神经元的输出信号(即，尖峰)，并根据可调节突触权重来按比例缩放那些信号，其中P是级102的神经元与级106的神经元之间的突触连接的总数，并且i是神经元级的指示符。在图1的示例中，i表示神经元级102并且i+1表示神经元级106。此外，经按比例缩放的信号可被组合以作为级106中每个神经元的输入信号。级106中的每个神经元可基于对应的组合输入信号来生成输出尖峰110。可使用另一突触连接网络(图1中未示出)将这些输出尖峰110传递到另一级神经元。

生物学突触可以仲裁突触后神经元中的兴奋性或抑制性(超级化)动作，并且还可用于放大神经元信号。兴奋性信号使膜电位去极化(即，相对于静息电位增大膜电位)。如果在某个时间段内接收到足够的兴奋性信号以使膜电位去极化到高于阈值，则在突触后神经元中发生动作电位。相反，抑制性信号一般使膜电位超极化(即，降低膜电位)。抑制性信号如果足够强则可抵消掉兴奋性信号之和并阻止膜电位到达阈值。除了抵消掉突触兴奋以外，突触抑制还可对自发活跃神经元施加强力的控制。自发活跃神经元是指在没有进一步输入的情况下(例如，由于其动态或反馈而)发放尖峰的神经元。通过压制这些神经元中的动作电位的自发生成，突触抑制可对神经元中的激发模式进行定形，这一般被称为雕刻。取决于期望的行为，各种突触104可充当兴奋性或抑制性突触的任何组合。

神经系统100可由通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件、由处理器执行的软件模块、或其任何组合来仿真。神经系统100可用在大范围的应用中，诸如图像和模式识别、机器学习、电机控制、及类似应用等。神经系统100中的每一神经元可被实现为神经元电路。被充电至发起输出尖峰的阈值的神经元膜可被实现为例如对流经其的电流进行积分的电容器。

在一方面，电容器作为神经元电路的电流积分器件可被除去，并且可使用较小的忆阻器元件来替代它。这种办法可应用于神经元电路中，以及其中大容量电容器被用作电流积分器的各种其他应用中。另外，每个突触104可基于忆阻器元件来实现，其中突触权重变化可与忆阻器电阻的变化有关。使用纳米特征尺寸的忆阻器，可显著地减小神经元电路和突触的面积，这可使得实现大规模神经系统硬件实现更为切实可行。

对神经系统100进行仿真的神经处理器的功能性可取决于突触连接的权重，这些权重可控制神经元之间的连接的强度。突触权重可存储在非易失性存储器中以在掉电之后保留该处理器的功能性。在一方面，突触权重存储器可实现在与主神经处理器芯片分开的外部芯片上。突触权重存储器可与神经处理器芯片分开地封装成可更换的存储卡。这可向神经处理器提供多种多样的功能性，其中特定功能性可基于当前附连至神经处理器的存储卡中所存储的突触权重。

图2解说了根据本公开的某些方面的计算网络(例如，神经系统或神经网络)的处理单元(例如，神经元或神经元电路)202的示例性示图200。例如，神经元202可对应于来自图1的级102和106的任何神经元。神经元202可接收多个输入信号204₁-204_N，这些输入信号可以是该神经系统外部的信号、或是由同一神经系统的其他神经元所生成的信号、或这两者。输入信号可以是电流、电导、电压、实数值的和/或复数值的。输入信号可包括具有定点或浮点表示的数值。可通过突触连接将这些输入信号递送到神经元202，突触连接根据可调节突触权重206₁-206_N(W_1-W_N)对这些信号进行按比例缩放，其中N可以是神经元202的输入连接总数。

神经元202可组合这些经按比例缩放的输入信号，并且使用组合的经按比例缩放的输入来生成输出信号208(即，信号Y)。输出信号208可以是电流、电导、电压、实数值的和/或复数值的。输出信号可以是具有定点或浮点表示的数值。随后该输出信号208可作为输入信号传递至同一神经系统的其他神经元、或作为输入信号传递至同一神经元202、或作为该神经系统的输出来传递。

处理单元(神经元)202可由电路来仿真，并且其输入和输出连接可由具有突触电路的电连接来仿真。处理单元202及其输入和输出连接也可由软件代码来仿真。处理单元202还可由电路来仿真，而其输入和输出连接可由软件代码来仿真。在一方面，计算网络中的处理单元202可以是模拟电路。在另一方面，处理单元202可以是数字电路。在又一方面，处理单元202可以是具有模拟和数字组件两者的混合信号电路。计算网络可包括任何前述形式的处理单元。使用这样的处理单元的计算网络(神经系统或神经网络)可用在大范围的应用中，诸如图像和模式识别、机器学习、电机控制、及类似应用等。

在神经网络的训练过程期间，突触权重(例如，来自图1的权重和/或来自图2的权重206₁-206_N)可用随机值来初始化并根据学习规则而被增大或减小。本领域技术人员将领会，学习规则的示例包括但不限于尖峰定时依赖可塑性(STDP)学习规则、Hebb规则、Oja规则、Bienenstock-Copper-Munro(BCM)规则等。在一些方面，这些权重可稳定或收敛至两个值(即，权重的双峰分布)之一。该效应可被用于减少每个突触权重的位数、提高从/向存储突触权重的存储器读取和写入的速度、以及降低突触存储器的功率和/或处理器消耗。

突触类型

在神经网络的硬件和软件模型中，突触相关功能的处理可基于突触类型。突触类型可以是非可塑突触(权重和延迟没有改变)、可塑突触(权重可改变)、结构化延迟可塑突触(权重和延迟可改变)、全可塑突触(权重、延迟和连通性可改变)、以及基于此的变型(例如，延迟可改变，但在权重或连通性方面没有改变)。多种类型的优点在于处理可以被细分。例如，非可塑突触不会使用待执行的可塑性功能(或等待此类功能完成)。类似地，延迟和权重可塑性可被细分成可一起或分开地、顺序地或并行地运作的操作。不同类型的突触对于适用的每一种不同的可塑性类型可具有不同的查找表或公式以及参数。因此，这些方法将针对该突触的类型来访问相关的表、公式或参数。

还进一步牵涉到以下事实：尖峰定时依赖型结构化可塑性可独立于突触可塑性地来执行。结构化可塑性即使在权重幅值没有改变的情况下(例如，如果权重已达最小或最大值、或者其由于某种其他原因而不被改变)也可被执行，因为结构化可塑性(即，延迟改变的量)可以是pre-post(前-后)尖峰时间差的直接函数。替换地，结构化可塑性可被设为权重变化量的函数或者可基于与权重或权重变化的界限有关的条件来设置。例如，突触延迟可仅在权重变化发生时或者在权重到达0的情况下才改变，但在这些权重为最大值时则不改变。然而，具有独立函数以使得这些过程能被并行化从而减少存储器访问的次数和交叠可能是有利的。

突触可塑性的确定

神经元可塑性(或简称“可塑性”)是大脑中的神经元和神经网络响应于新的信息、感官刺激、发展、损坏、或机能障碍而改变其突触连接和行为的能力。可塑性对于生物学中的学习和记忆、以及对于计算神经元科学和神经网络是重要的。已经研究了各种形式的可塑性，诸如突触可塑性(例如，根据Hebbian理论)、尖峰定时依赖可塑性(STDP)、非突触可塑性、活跃性依赖可塑性、结构化可塑性和自稳态可塑性。

STDP是调节神经元之间的突触连接的强度的学习过程。连接强度是基于特定神经元的输出与收到输入尖峰(即，动作电位)的相对定时来调节的。在STDP过程下，如果至某个神经元的输入尖峰平均而言倾向于紧挨在该神经元的输出尖峰之前发生，则可发生长期增强(LTP)。于是使得该特定输入在一定程度上更强。另一方面，如果输入尖峰平均而言倾向于紧接在输出尖峰之后发生，则可发生长期抑压(LTD)。于是使得该特定输入在一定程度上更弱，并由此得名“尖峰定时依赖可塑性”。因此，使得可能是突触后神经元兴奋原因的输入甚至在将来作出贡献的可能性更大，而使得不是突触后尖峰的原因的输入在将来作出贡献的可能性更小。该过程继续，直至初始连接集合的子集保留，而所有其他连接的影响减小至无关紧要的水平。

由于神经元一般在其许多输入都在一短时段内发生(即，累积性足以引起输出)时产生输出尖峰，因此通常保留下来的输入子集包括倾向于在时间上相关的那些输入。另外，由于在输出尖峰之前发生的输入被加强，因此提供对相关性的最早充分累积性指示的那些输入将最终变成至该神经元的最后输入。

STDP学习规则可因变于突触前神经元的尖峰时间t_pre与突触后神经元的尖峰时间t_post之间的时间差(即，t＝t_post-t_pre)来有效地适配将该突触前神经元连接到该突触后神经元的突触的突触权重。STDP的典型公式化是若该时间差为正(突触前神经元在突触后神经元之前激发)则增大突触权重(即，增强该突触)，以及若该时间差为负(突触后神经元在突触前神经元之前激发)则减小突触权重(即，抑压该突触)。

在STDP过程中，突触权重随时间推移的改变可通常使用指数式衰退来达成，如由下式给出的：

其中k₊和k_{_}τ_sign(Δt)分别是针对正和负时间差的时间常数，a₊和a_{_}是对应的比例缩放幅值，并且μ是可应用于正时间差和/或负时间差的偏移。

图3解说了根据STDP，突触权重作为突触前(presynaptic)和突触后(postsynaptic)尖峰的相对定时的函数而改变的示例性示图300。如果突触前神经元在突触后神经元之前激发，则对应的突触权重可被增大，如曲线图300的部分302中所解说的。该权重增大可被称为该突触的LTP。从曲线图部分302可观察到，LTP的量可因变于突触前和突触后尖峰时间之差而大致呈指数式地下降。相反的激发次序可减小突触权重，如曲线图300的部分304中所解说的，从而导致该突触的LTD。

如图3中的曲线图300中所解说的，可向STDP曲线图的LTP(因果性)部分302应用负偏移μ。x轴的交越点306(y＝0)可被配置成与最大时间滞后重合以考虑到来自层i-1的各因果性输入的相关性。在基于帧的输入(即，呈特定历时的包括尖峰或脉冲的帧的形式的输入)的情形中，可计算偏移值μ以反映帧边界。该帧中的第一输入尖峰(脉冲)可被视为要么如直接由突触后电位所建模地随时间衰退，要么在对神经状态的影响的意义上随时间衰退。如果该帧中的第二输入尖峰(脉冲)被视为与特定时间帧相关或有关，则该帧之前和之后的有关时间可通过使STDP曲线的一个或多个部分偏移以使得这些有关时间中的值可以不同(例如，对于大于一个帧为负，而对于小于一个帧为正)来在该时间帧边界处被分开并在可塑性意义上被不同地对待。例如，负偏移μ可被设为偏移LTP以使得曲线实际上在大于帧时间的pre-post时间处变得低于零并且它由此为LTD而非LTP的一部分。

神经元模型及操作

存在一些用于设计有用的尖峰发放神经元模型的一般原理。良好的神经元模型在以下两个计算态相(regime)方面可具有丰富的潜在行为：重合性检测和功能性计算。此外，良好的神经元模型应当具有允许时间编码的两个要素：输入的抵达时间影响输出时间，以及重合性检测能具有窄时间窗。最后，为了在计算上是有吸引力的，良好的神经元模型在连续时间上可具有闭合形式解，并且具有稳定的行为，包括在靠近吸引子和鞍点之处。换言之，有用的神经元模型是可实践且可被用于建模丰富的、现实的且生物学一致的行为并且可被用于对神经电路进行工程设计和反向工程两者的神经元模型。

神经元模型可取决于事件，诸如输入抵达、输出尖峰或其他事件，无论这些事件是内部的还是外部的。为了达成丰富的行为库，能展现复杂行为的状态机可能是期望的。如果事件本身的发生在撇开输入贡献(若有)的情况下能影响状态机并约束该事件之后的动态，则该系统的将来状态并非仅是状态和输入的函数，而是状态、事件和输入的函数。

在一方面，神经元n可被建模为尖峰带漏泄积分激发神经元，其膜电压v_n(t)由以下动态来支配：

其中α和β是参数，w_m,n是将突触前神经元m连接至突触后神经元n的突触的突触权重，以及y_m(t)是神经元m的尖峰发放输出，其可根据Δt_m,n被延迟达树突或轴突延迟才抵达神经元n的胞体。

应注意，从建立了对突触后神经元的充分输入的时间直至该突触后神经元实际上激发的时间存在延迟。在动态尖峰发放神经元模型(诸如Izhikevich简单模型)中，如果在去极化阈值v_t与峰值尖峰电压v_peak之间有差量，则可引发时间延迟。例如，在该简单模型中，神经元胞体动态可由关于电压和恢复的微分方程对来支配，即：

其中v是膜电位，u是膜恢复变量，k是描述膜电位v的时间尺度的参数，a是描述恢复变量u的时间尺度的参数，b是描述恢复变量u对膜电位v的阈下波动的敏感度的参数，v_r是膜静息电位，I是突触电流，以及C是膜的电容。根据该模型，神经元被定义为在v＞v_peak时发放尖峰。

Hunzinger Cold模型

Hunzinger Cold神经元模型是能再现丰富多样的各种神经行为的最小双态相尖峰发放线性动态模型。该模型的一维或二维线性动态可具有两个态相，其中时间常数(以及耦合)可取决于态相。在阈下态相中，时间常数(按照惯例为负)表示漏泄通道动态，其一般作用于以生物学一致的线性方式使细胞返回到静息。阈上态相中的时间常数(按照惯例为正)反映抗漏泄通道动态，其一般驱动细胞发放尖峰，而同时在尖峰生成中引发等待时间。

如图4中所解说的，该模型400的动态可被划分成两个(或更多个)态相。这些态相可被称为负态相402(也可互换地称为带漏泄积分激发(LIF)态相，勿与LIF神经元模型混淆)以及正态相404(也可互换地称为抗漏泄积分激发(ALIF)态相，勿与ALIF神经元模型混淆)。在负态相402中，状态在将来事件的时间趋向于静息(v_{_})。在该负态相中，该模型一般展现出时间输入检测性质及其他阈下行为。在正态相404中，状态趋向于尖峰发放事件(v_s)。在该正态相中，该模型展现出计算性质，诸如取决于后续输入事件而引发发放尖峰的等待时间。在事件方面对动态进行公式化以及将动态分成这两个态相是该模型的基础特性。

线性双态相二维动态(对于状态v和u)可按照惯例定义为：

其中q_ρ和r是用于耦合的线性变换变量。

符号ρ在本文中用于标示动态态相，在讨论或表达具体态相的关系时，按照惯例对于负态相和正态相分别用符号“-”或“+”来替换符号ρ。

模型状态通过膜电位(电压)v和恢复电流u来定义。在基本形式中，态相在本质上是由模型状态来决定的。该精确和通用的定义存在一些细微却重要的方面，但目前考虑该模型在电压v高于阈值(v₊)的情况下处于正态相404中，否则处于负态相402中。

态相依赖型时间常数包括负态相时间常数τ_和正态相时间常数τ₊。恢复电流时间常数τ_u通常是与态相无关的。出于方便起见，负态相时间常数τ_{_}通常被指定为反映衰退的负量，从而用于电压演变的相同表达式可用于正态相，在正态相中指数和τ₊将一般为正，正如τ_u那样。

这两个状态元素的动态可在发生事件之际通过使状态偏离其零倾线(null-cline)的变换来耦合，其中变换变量为：

q_ρ＝-τ_ρβu-v_ρ (7)

r＝δ(v+ε)， (8)

其中δ、ε、β和v_{_}、v₊是参数。v_ρ的两个值是这两个态相的参考电压的基数。参数v_{_}是负态相的基电压，并且膜电位在负态相中一般将朝向v_{_}衰退。参数v₊是正态相的基电压，并且膜电位在正态相中一般将趋向于背离v₊。

v和u的零倾线分别由变换变量q_ρ和r的负数给出。参数δ是控制u零倾线的斜率的比例缩放因子。参数ε通常被设为等于-v_{_}。参数β是控制这两个态相中的v零倾线的斜率的电阻值。τ_ρ时间常数参数不仅控制指数式衰退，还单独地控制每个态相中的零倾线斜率。

该模型可被定义为在电压v达到值v_S时发放尖峰。随后，状态可在发生复位事件(其可以与尖峰事件完全相同)之际被复位：

u＝u+Δu， (10)

其中和Δu是参数。复位电压通常被设为v_{_}。

依照瞬时耦合的原理，闭合形式解不仅对于状态是可能的(且具有单个指数项)，而且对于到达特定状态的时间也是可能的。闭合形式状态解为：

因此，模型状态可仅在发生事件之际被更新，诸如在输入(突触前尖峰)或输出(突触后尖峰)之际被更新。还可在任何特定时间(无论是否有输入或输出)执行操作。

而且，依照瞬时耦合原理，突触后尖峰的时间可被预计，因此到达特定状态的时间可提前被确定而无需迭代技术或数值方法(例如，欧拉数值方法)。给定了先前电压状态v₀，直至到达电压状态v_f之前的时间延迟由下式给出：

如果尖峰被定义为发生在电压状态v到达v_S的时间，则从电压处于给定状态v的时间起测量的直至发生尖峰前的时间量或即相对延迟的闭合形式解为：

其中通常被设为参数v₊，但其他变型可以是可能的。

模型动态的以上定义取决于该模型是在正态相还是负态相中。如所提及的，耦合和态相ρ可基于事件来计算。出于状态传播的目的，态相和耦合(变换)变量可基于在上一(先前)事件的时间的状态来定义。出于随后预计尖峰输出时间的目的，态相和耦合变量可基于在下一(当前)事件的时间的状态来定义。

存在对该Cold模型、以及在时间上执行模拟、仿真、或建模的若干可能实现。这包括例如事件-更新、步阶-事件更新、以及步阶-更新模式。事件更新是其中基于事件或“事件更新”(在特定时刻)来更新状态的更新。步阶更新是以间隔(例如，1ms)来更新模型的更新。这不一定利用迭代方法或数值方法。通过仅在事件发生于步阶处或步阶间的情况下才更新模型或即通过“步阶-事件”更新，基于事件的实现以有限的时间分辨率在基于步阶的模拟器中实现也是可能的。

针对严重有噪数据的稳健性而由知识图谱偏置的分类

常规的对象识别系统包括图像预处理阶段、特征提取阶段、以及分类阶段。具体地，在常规的对象识别系统中，图像预处理阶段被指定用于预处理图像和该图像内的片段特征。

在本申请中，分段是指确定图像中的对象周围的边界。例如，图像可包括椅子、桌子和灯。这些对象中的每一者可被分段。针对前述对象中的每一者的片段可以是例如包围属于该对象的所有像素的最小矩形。

在预处理该图像之后，特征提取阶段从经预处理的图像中提取特征。在本申请中，特征可被称为对象，诸如面部、监视器、键盘、和/或可被拍照的其他对象。此外，在提取特征之后，分类器可对所提取的特征进行分类。即，分类将一个或多个可能的类应用于每个所提取的对象。还应注意，在本申请中，类可被称为标记或类别。附加地或替换地，分类器被指定用于基于所提取的特征来分类整个图像或该图像的子集。例如，图像可被分类为日落。

图5解说了可经由对象识别系统来分类的图像500的示例。如图5中所示，图像500包括PC监视器506、键盘504和鼠标502。由此，基于常规的对象识别系统的各阶段，所提取的对象为PC监视器506、键盘504和鼠标502。作为示例，针对所提取的PC监视器对象的推断类可以是PC监视器、TV、和/或窗。作为另一示例，针对所提取的键盘对象的推断类可以是键盘、浅盘、和餐具垫。

此外，分类器针对从每个对象推断出的一个或多个类提供置信度量。置信度量可基于提供给网络的训练。在本申请中，置信度量可被称为置信度、置信度评分、和/或置信度值。在一个示例中，从特征提取器提取的对象可以是PC监视器，并且针对PC监视器的分类器输出可以是：PC监视器：50％，TV：40％，窗：10％。即，网络有50％的置信度相信该对象是PC监视器，有40％的置信度相信该对象是TV，而有10％的置信度相信该对象是窗。在该示例中，PC监视器、TV和窗是根据从图像中提取的对象来推断的类。

另外，在一种配置中，最高置信度与次最高置信度之间的差异可被用作混淆度量。具体地，在该配置中，混淆度量即混淆性与两个置信度量之间的差异反相关。即，两个置信度评分之间的低差异导致高混淆性。例如，在前面的示例中，针对PC监视器(50％)和TV(40％)的置信度量之间的差异小于针对PC监视器(50％)和窗(10％)的置信度量之间的差异。由此，在前面的示例中，相比于关于所提取的对象是PC监视器还是窗的混淆性，关于所提取的对象是PC监视器还是TV有较大混淆性。

在一种配置中，对于给定对象，针对每个所预测类的置信度对于k个预测按降序为P1、P2、…、Pk。附加地或替换地，混淆度量可如下确定：

分类器混淆值＝P₁-P₂ (15)

分类器混淆值＝(P₁-P₂)/(P₁+P₂) (16)

分类器混淆值＝P₁/中值(P₁,P₂,…,P_k) (17)

分类器混淆值＝P₁/均值(P₁,P₂,…,P_k) (18)

在式15-18中，分类器混淆值与混淆性反相关。即，较低的分类器混淆值可指示高混淆性。

如先前所讨论的，该度量可基于提供给网络的训练。由此，在一些情形中，如果网络尚未关于一对象被训练，则可向该对象赋予低置信度。附加地或替换地，错误类可能接收到最高置信度评分。在一些情形中，低图像质量、遮蔽、对象的不良分段、和/或其他因素可能导致高置信度量被不正确地指派给类。例如，如图5中所示，PC监视器的仅部分图像被捕捉到。由此，在图5的示例中，相比于指派给正确类(诸如PC监视器)的置信度，对象识别系统可能向错误类(诸如窗)指派较高置信度。

表1提供了向针对从图像中提取的对象所推断的类指派的置信度的示例。在该示例中，表1的置信度量可基于图5的示例，其中PC监视器506部分地显示在该图像中。如表1中所示，针对监视器的分类器输出为：窗：40％，监视器：35％，TV：25％。即，网络推断所提取的PC监视器对象要么是窗，要么是监视器，要么是TV。此外，网络有40％的置信度相信所提取的PC监视器对象是窗，有35％的置信度相信所提取的PC监视器对象是监视器，而有25％的置信度相信所提取的PC监视器对象是TV。

表1

真正对象	推断1	推断2	推断3
				监视器	窗–40％	监视器–35％	TV–25％
CPU	CPU–80％	盒子–15％	烤箱–5％
				鼠标	鼠标–90％	昆虫–10％
键盘	键盘–70％	浅盘–20％	餐具垫–10％

对于表1，当存在其他三个对象为CPU(图5中未示出)、鼠标和键盘的高置信度时，网络并未考虑所提取的PC监视器对象是PC监视器的概率。因此，在表1的示例中，相比于该对象是监视器的置信度，该对象是窗的置信度更大。

在大多数情形中，人类观察者可以基于图像中被遮挡的对象与未被遮挡的对象的关联来准确地确定图像中被遮挡的对象。例如，人类观察者可基于监视器与未被遮挡的对象(诸如CPU、鼠标、和/或键盘)的关联而识别出被遮挡的监视器。关联知识基于常常与其他对象一起出现的对象的关联性映射。

本公开的各方面针对生成指示环境中的不同对象的共存性概率的知识图谱。另外，本公开的各方面还针对基于知识图谱来偏置分类器的输出。此外，本公开的各方面进一步针对基于分类器的输出来更新现有知识图谱。

应注意，常规系统可构建贝叶斯信念网络。例如，可在从英语词汇词典导出的知识图谱上构建分层数据库。此外，其他常规系统随着延长的使用而改进分类结果。尽管如此，常规系统不使用在网络的训练期间动态地学习的基于知识图谱的分类系统。

本公开的各方面通过将分类器与并行轮询机制解耦来提供了灵活性。附加地或替换地，并行轮询机制被耦合至分类器以基于知识图谱输出来修改分类器权重。

在一种配置中，基于知识图谱的分类系统标记被遮蔽和/或背朝相机的人(或对象)。在一些情形中，用户可能倾向于与来自特定群(诸如朋友和/或家人)的一个或多个人一起拍照。随时间推移，知识图谱将该用户与特定个人相关联。即，知识图谱基于随时间推移拍摄的照片来偏置与特定个人的关联。因此，在一种配置中，基于该关联，根据针对群图像中的特定个人与该图像中的其他个人的关联的知识图谱偏置来标记该特定个人。更具体地，即使在该个人的图像被遮挡和/或有噪时，该个人也可被标记。

在另一配置中，基于知识图谱的分类系统标记经由图像捕捉设备(诸如头戴式显示器)捕捉的快速移动图像。由于一些图像捕捉设备(诸如头戴式显示器)的本质，一些所捕捉的图像可能部分地在相机的视野中和/或可能仅在相机的视野中达较小时间段。即，一些所捕捉的图像可能没有良好地成帧。

因此，在该配置中，通过知识图谱来获得部分地在图像捕捉设备的视野中和/或在图像捕捉设备的视野外的对象的可能标记。应注意，不在图像捕捉设备的视野中的对象可能在用户的相关环境中。可针对图像捕捉设备指定知识图谱以减少可能的对象类的搜索空间。本公开的各方面不限于头戴式显示器，并且也构想了用于其他图像捕捉设备。

在另一配置中，基于知识图谱的分类系统建议要包括在照片中的人。具体地，知识图谱可构建常常出现在所捕捉的图像中的人群的图谱。即，在一种配置中，在对群照片成帧时，知识图谱基于知识图谱信息来提供关于应被包括在该照片中的其他个人的上下文信息。

在一些情形中，某些类可不被分类器标识。因此，在一种配置中，基于知识图谱的分类系统在对象标记应用中呈现可能类的列表。即，知识图谱可辅助用户向所提取的对象应用正确的类。例如，在面部标记应用中，一个或多个面部可具有低置信度或者可能没有被分段。由此，在该示例中，知识图谱提供可能姓名的列表，用户可将可能姓名与特定个人相关联。此外，分类器可根据用户标记的图像被训练和/或知识图谱可基于用户标记的图像被更新。

图6解说了基于本公开的一方面的知识图谱的示例。如图6中所示，每个对象与另一对象相关联。在该示例中，如图6中所示，较粗的线表示较强的共存性概率。例如，如图6中所示，相比于与窗共存的概率，监视器具有与鼠标共存的较强概率。在另一示例中，如图6中所示，相比于与窗共存的概率，DVD具有与TV共存的较强概率。

在一种配置中，知识图谱被表示为成对出现概率的矩阵。例如，图6的知识图谱可被编码为表2的知识图谱矩阵(KGM)。

表2

	监视器	TV	窗	DVD	鼠标
						监视器	1	0	0.2	0.4	0.9
TV	0	1	0.6	0.9	0.7
						窗	0.2	0.6	1	0.6	0
DVD	0.4	0.9	0.6	1	0
						鼠标	0.9	0.7	0	0	1

如表2中所示，行和列的每个交叉点表示两个对象的出现概率。例如，如表2中所示，监视器具有与TV一起出现的概率0，与窗一起出现的概率0.2，与DVD一起出现的概率0.4，以及与鼠标一起出现的概率0.9。

以下提供的伪代码是用于在没有外部输入的情况下从初始数据库生成知识图谱的示例。即，知识图谱可基于所捕获的图像来训练。在本示例中，A_i是指图像，L₁…L_N是指类或对象，而F是指针对由(L_i,L_j)定义的给定矩阵位置的递增量。在一种配置中，F是恒定标量值。

初始化知识图谱矩阵(KGM)的所有元素

对于每个{数据库中的图像,A_i}

获取对象的标记索引：L₁,L₂,...,L_N

将矩阵条目(L_i,L_j),{0<i,j<＝N}递增F

在该配置中，假定每个图像在类方面被注释。此外，假定每个类具有唯一性索引。例如，一类(诸如汽车)具有索引7，而另一类(诸如交通信号灯)具有索引31。由此，针对这两个类的矩阵元素(7,31)和(31,7)包括这两个类(诸如汽车和交通信号灯)的共存性概率。共存性也可被称为共现性，反之亦然。

应注意，本公开的各方面采用非有向图，从而得到对称的知识图谱矩阵。尽管如此，还构想了本公开的各方面用于时间序列。即，在一些情形中，诸如具有n元组模型的语音/音频数据，出现次序被用于确定共存性概率。在另一配置中，知识图谱矩阵的维度大于2，从而这些维度捕捉一次两个以上对象的共现性统计和/或将其他环境元素(诸如GPS位置和/或时刻)与多个对象的共现性统计相关联。

基于前面的示例，矩阵元素(7,31)可指示在一个或多个图像(诸如视频)中，一个对象(诸如汽车)后跟随有另一对象(诸如交通信号灯)的概率。另外，矩阵元素(31,7)可指示在一个或多个图像(诸如视频)中，一个对象(诸如交通信号灯)后跟随有另一对象(诸如汽车)的概率。在有向图的本示例中，可添加第三维度以指示共现性之间的时间。例如，矩阵元素(7,31,10)可指示在视频片段中，汽车后面在彼此的10个时间单位内跟随有交通信号灯的概率。时间单位可以是秒、分钟、小时、或任何其他时间单位。

在本示例中，针对给定类指定并行评分系统。即，当向系统呈现对象时，为该对象指定前k个预测类的置信度量P₁、P₂、…P_k。例如，如先前所讨论的，在表1中，针对监视器对象的度量(诸如置信度量)可以是40％(P₁)、35％(P₂)、和25％(P₃)。

在一种配置中，该系统确定具有最大置信度量P₁的对象。例如，基于表1，鼠标具有最大置信度量(90％)。此外，对于图像中的每个对象(诸如鼠标、CPU、键盘和监视器)，该系统确定度量。在一种配置中，该系统基于各类的置信度的差异来确定混淆度量。混淆度量可基于下式：

分类器混淆值＝1/(P₁-P₂) (19)

如表1中所示，该系统有40％的置信度相信监视器是窗，而有35％的置信度相信监视器是监视器。因此，基于式15，混淆度量是20％。即，混淆度量是两个置信度量之间的差异除具有值1的分子所得的商。

在该配置中，高混淆度量指示关于真正对象是否为两个推断类之一存在混淆。由此，对于图像中的对象，如果混淆度量小于阈值，则推断类被接受作为正确类。此外，如果对象的混淆度量大于阈值，则系统确定将对象的预测类与具有最高置信度的类绑定的概率。

在本示例中，阈值可以是10％。因此，对于表1，由于监视器的分类器混淆性为20％，因此系统不会接受具有最高置信度值的预测类(诸如窗)作为正确类。由此，系统确定将对象(诸如监视器)的预测类与具有最高置信度P₁的对象(诸如鼠标)绑定的概率。

绑定可基于表2的知识图谱矩阵概率W₁、W₂、…W_k。在确定知识图谱矩阵概率之后，基于该对象的置信度量P₁、P₂、…P_k与知识图谱矩阵概率W₁、W₂、…W_k之积来确定加权置信度。最后，对象的各预测类的加权置信度量被用于选择具有最高加权置信度的预测类。

在本示例中，基于表2，当具有最高置信度的对象是鼠标时，针对窗的权重(W₁)为0，而针对监视器的权重(W₂)为0.9。来自表2的知识图谱矩阵确定针对监视器的类的加权置信度评分。例如，对于监视器，窗类的加权置信度为原始置信度P₁(40％)与权重W₁(0)之积。另外，监视器类的加权置信度为原始置信度P₂(35％)与权重W₂(0.9)之积。基于表1和表2的加权置信度在表3中示出。

表3

真正对象	推断1	推断2	推断3
				监视器	窗-0％	监视器–32％	TV–17％

在该示例中，针对窗、监视器和TV的置信度用将鼠标与窗、鼠标与监视器、以及鼠标与TV相链接的知识图谱矩阵概率来加权。基于新的置信度评分，监视器现在被认为是胜出的类，因为监视器具有最高加权置信度。

即，分类器的输出基于知识图谱矩阵中提供的权重而被偏置。例如，如表2中所示，鼠标更有可能与监视器共存，而非与TV或窗共存。因此，相比于鼠标/窗关系和鼠标/TV关系，鼠标/监视器关系被赋予较大权重。知识图谱矩阵中提供的权重可基于系统的训练。

在一种配置中，深度卷积网络(DCN)分类器的输出也扩增知识图谱矩阵。在该配置中，基于分类器的输出，系统选择混淆性小于阈值的所有对象并从所选对象构建知识图谱矩阵。

例如，表1指示CPU、鼠标和键盘具有低混淆度量。因此，这些条目(诸如CPU、鼠标和键盘)可通过以成对形式链接对象标记来递增知识图谱矩阵中的条目。递增量可以是固定的，或者可以是成对参与类标记的混淆量的函数。即，混淆性低于阈值的对象可更新知识图谱矩阵的权重。即，系统可通过更新知识图谱矩阵的权重来被训练。

替换地或附加地，在推断不正确时，用户可纠正指派给对象的类。在该配置中，正确类被指派置信度100％，且知识图谱矩阵中将经纠正对象的类链接到其他对象的相应条目被递增。在另一配置中，知识图谱矩阵用负相关(诸如带漏泄更新)来更新。

在考虑到随时间推移的相关性损耗的情况下，带漏泄更新指定知识图谱矩阵的每个元素随时间推移的衰退。例如，如果一人不与某个朋友群的成员相关联，则知识图谱矩阵将通过减小知识图谱矩阵中的相应条目来反映随时间推移的关联损耗。

如先前所讨论的，空间相关也可被用于多维知识图谱矩阵。在一个方面，另一维度(诸如第三或第四维度)可被指定用于指示对象的空间分隔。例如，元素(7,31,10)可指示汽车和交通信号灯在彼此的10个距离单位内的共现性的概率。距离单位可以是英尺、英寸、米、或任何其他测量单元。

由此，基于本公开的各方面，知识图谱矩阵使用初始数据集并且还基于不同对象类的共现性概率来适配于将来图像。在一种配置中，在针对置信度来标记对象时，考虑对象的空间和/或时间关系。此外，本公开的各方面还可应用于语音和/或视频。例如，视频帧可基于先前帧的内容被重新填充。

在一种配置中，特征提取被实现为深度卷积网络。在该配置中，通过将深度卷积网络的顶层中的所有节点与可塑突触相连接来指定整合的深度卷积网络知识图谱矩阵。即，每个节点表示一类，且该节点的激活是某个类的概率。当知识图谱被学习时，共现对象的节点之间的突触被加强，而非共现对象的节点之间的突触被减弱。侧向突触基于其他被激活的对象节点来向对象的节点添加输入。具体地，知识图谱矩阵经由深度卷积网络的输出层中的侧向连接来实现。突触的可塑性允许用户更新知识图谱矩阵或允许随时间推移学习新的对象共现性。在一种配置中，提供两个分开的突触集合，一个集合用于知识图谱矩阵，而一个集合用于分类器。

本公开的各方面在存在噪声的情况下改善了分类网络的性能，通过预取可能的输出类并减小搜索空间来减少了分类等待时间，并且实现了新颖的用户体验。

图7解说了根据本公开的某些方面的使用通用处理器702进行前述基于知识图谱关联的对象分类的示例实现700。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数，延迟，和频率槽信息可被存储在存储器块704中，而在通用处理器702处执行的指令可从程序存储器706中加载。在本公开的一方面，加载到通用处理器702中的指令可包括用于以下操作的代码：构建计算不同对象类的共现性的成对概率的知识图谱，在存在噪声的情况下使用该知识图谱来扩增对象分类系统的性能，和/或用来自分类器的输出或来自用户生成的标记的新数据来适配该知识图谱。

图8解说了根据本公开的某些方面的前述基于知识图谱关联的对象分类的示例实现800，其中存储器802可经由互连网络804与计算网络(神经网络)的个体(分布式)处理单元(神经处理器)808对接。与计算网络(神经网络)相关联的变量(神经信号)、突触权重、系统参数，延迟，频率槽信息，知识图谱关联可被存储在存储器802中，并且可从存储器802经由互连网络804的连接被加载到每个处理单元(神经处理器)808中。在本公开的一方面，处理单元808可被配置成：构建计算不同对象类的共现性的成对概率的知识图谱，在存在噪声的情况下使用该知识图谱来扩增对象分类系统的性能，和/或用来自分类器的输出或来自用户生成的标记的新数据来适配该知识图谱。

图9解说了前述基于知识图谱关联的对象分类的示例实现900。如图9中所解说的，一个存储器组902可与计算网络(神经网络)的一个处理单元904直接对接。每一个存储器组902可存储与对应的处理单元(神经处理器)904相关联的变量(神经信号)、突触权重、和/或系统参数，延迟，频率槽信息，以及知识图谱关联。在本公开的一方面，处理单元904可被配置成：构建计算不同对象类的共现性的成对概率的知识图谱，在存在噪声的情况下使用该知识图谱来扩增对象分类系统的性能，和/或用来自分类器的输出或来自用户生成的标记的新数据来适配该知识图谱。

图10解说了根据本公开的某些方面的神经网络1000的示例实现。如图10中所解说的，神经网络1000可具有多个局部处理单元1002，它们可执行上述方法的各种操作。每个局部处理单元1002可包括存储该神经网络的参数的局部状态存储器1004和局部参数存储器1006。另外，局部处理单元1002可具有用于存储局部模型程序的局部(神经元)模型程序(LMP)存储器1010、用于存储局部学习程序的局部学习程序(LLP)存储器1010、以及局部连接存储器1012。此外，如图10中所解说的，每个局部处理单元1002可与用于提供针对该局部处理单元的各局部存储器的配置的配置处理器单元1014对接，并且与提供各局部处理单元1002之间的路由的路由连接处理单元1016对接。

在一种配置中，神经元模型被配置成用于基于知识图谱关联来分类对象。神经元模型包括应用装置和确定装置。在一个方面，应用装置和/或确定装置可以是配置成执行所述功能的通用处理器702、程序存储器706、存储器块704、存储器802、互连网络804、处理单元808、处理单元904、局部处理单元1002、和/或路由连接处理单元1016。在另一配置中，前述装置可以是被配置成执行由前述装置所叙述的功能的任何模块或任何设备。

根据本公开的某些方面，每一个局部处理单元1002可被配置成基于神经网络的一个或多个期望功能性特征来确定神经网络的参数，以及随着所确定的参数被进一步适配、调谐和更新来使这一个或多个功能性特征朝着期望的功能性特征发展。

图11解说了用于分类对象的方法1100。在框1102，对象分类器向对象应用一个或多个置信度评分。即，每个对象与一个或多个置信度评分相关联。此外，在框1104，对象分类器基于置信度评分来确定度量。最后，在框1106，在该度量高于阈值时，对象分类器基于知识图谱来确定第一对象的分类。

以上所描述的方法的各种操作可由能够执行相应功能的任何合适的装置来执行。这些装置可包括各种硬件和/或软件组件和/或模块，包括但不限于电路、专用集成电路(ASIC)、或处理器。一般而言，在附图中有解说的操作的场合，那些操作可具有带相似编号的相应配对装置加功能组件。

如本文所使用的，术语“确定”涵盖各种各样的动作。例如，“确定”可包括演算、计算、处理、推导、研究、查找(例如，在表、数据库或其他数据结构中查找)、探知及诸如此类。另外，“确定”可包括接收(例如接收信息)、访问(例如访问存储器中的数据)、及类似动作。而且，“确定”可包括解析、选择、选取、确立及类似动作。

如本文中所使用的，引述一列项目中的“至少一个”的短语是指这些项目的任何组合，包括单个成员。作为示例，“a、b或c中的至少一者”旨在涵盖：a、b、c、a-b、a-c、b-c和a-b-c。

结合本公开所描述的各种解说性逻辑框、模块和电路可用设计成执行本文所描述功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其他可编程逻辑器件(PLD)、分立的门或晶体管逻辑、分立的硬件组件或其任何组合来实现或执行。通用处理器可以是微处理器，但在替换方案中，处理器可以是任何市售的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器、或任何其他此类配置。

结合本公开所描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在本领域所知的任何形式的存储介质中。可使用的存储介质的一些示例包括随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动盘、CD-ROM，等等。软件模块可包括单条指令、或许多条指令，且可分布在若干不同的代码段上，分布在不同的程序间以及跨多个存储介质分布。存储介质可被耦合到处理器以使得该处理器能从/向该存储介质读写信息。替换地，存储介质可以被整合到处理器。

本文所公开的方法包括用于实现所描述的方法的一个或多个步骤或动作。这些方法步骤和/或动作可以彼此互换而不会脱离权利要求的范围。换言之，除非指定了步骤或动作的特定次序，否则具体步骤和/或动作的次序和/或使用可以改动而不会脱离权利要求的范围。

所描述的功能可在硬件、软件、固件或其任何组合中实现。如果以硬件实现，则示例硬件配置可包括设备中的处理系统。处理系统可以用总线架构来实现。取决于处理系统的具体应用和整体设计约束，总线可包括任何数目的互连总线和桥接器。总线可将包括处理器、机器可读介质、以及总线接口的各种电路链接在一起。总线接口可用于尤其将网络适配器等经由总线连接至处理系统。网络适配器可用于实现信号处理功能。对于某些方面，用户接口(例如，按键板、显示器、鼠标、操纵杆，等等)也可以被连接到总线。总线还可以链接各种其他电路，诸如定时源、外围设备、稳压器、功率管理电路以及类似电路，它们在本领域中是众所周知的，因此将不再进一步描述。

处理器可负责管理总线和一般处理，包括执行存储在机器可读介质上的软件。处理器可用一个或多个通用和/或专用处理器来实现。示例包括微处理器、微控制器、DSP处理器、以及其他能执行软件的电路系统。软件应当被宽泛地解释成意指指令、数据、或其任何组合，无论是被称作软件、固件、中间件、微代码、硬件描述语言、或其他。作为示例，机器可读介质可包括随机存取存储器(RAM)、闪存、只读存储器(ROM)、可编程只读存储器(PROM)、可擦式可编程只读存储器(EPROM)、电可擦式可编程只读存储器(EEPROM)、寄存器、磁盘、光盘、硬驱动器、或者任何其他合适的存储介质、或其任何组合。机器可读介质可被实施在计算机程序产品中。该计算机程序产品可以包括包装材料。

在硬件实现中，机器可读介质可以是处理系统中与处理器分开的一部分。然而，如本领域技术人员将容易领会的，机器可读介质或其任何部分可在处理系统外部。作为示例，机器可读介质可包括传输线、由数据调制的载波、和/或与设备分开的计算机产品，所有这些都可由处理器通过总线接口来访问。替换地或补充地，机器可读介质或其任何部分可被集成到处理器中，诸如高速缓存和/或通用寄存器文件可能就是这种情形。虽然所讨论的各种组件可被描述为具有特定位置，诸如局部组件，但它们也可按各种方式来配置，诸如某些组件被配置成分布式计算系统的一部分。

处理系统可以被配置为通用处理系统，该通用处理系统具有一个或多个提供处理器功能性的微处理器、以及提供机器可读介质中的至少一部分的外部存储器，它们都通过外部总线架构与其他支持电路系统链接在一起。替换地，该处理系统可以包括一个或多个神经元形态处理器以用于实现本文所述的神经元模型和神经系统模型。作为另一替换方案，处理系统可以用带有集成在单块芯片中的处理器、总线接口、用户接口、支持电路系统、和至少一部分机器可读介质的专用集成电路(ASIC)来实现，或者用一个或多个现场可编程门阵列(FPGA)、可编程逻辑器件(PLD)、控制器、状态机、门控逻辑、分立硬件组件、或者任何其他合适的电路系统、或者能执行本公开通篇所描述的各种功能性的电路的任何组合来实现。取决于具体应用和加诸于整体系统上的总设计约束，本领域技术人员将认识到如何最佳地实现关于处理系统所描述的功能性。

机器可读介质可包括数个软件模块。这些软件模块包括当由处理器执行时使处理系统执行各种功能的指令。这些软件模块可包括传送模块和接收模块。每个软件模块可以驻留在单个存储设备中或者跨多个存储设备分布。作为示例，当触发事件发生时，可以从硬驱动器中将软件模块加载到RAM中。在软件模块执行期间，处理器可以将一些指令加载到高速缓存中以提高访问速度。随后可将一个或多个高速缓存行加载到通用寄存器文件中以供处理器执行。在以下述及软件模块的功能性时，将理解此类功能性是在处理器执行来自该软件模块的指令时由该处理器来实现的。

如果以软件实现，则各功能可作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者，这些介质包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定，这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能用于携带或存储指令或数据结构形式的期望程序代码且能被计算机访问的任何其它介质。另外，任何连接也被正当地称为计算机可读介质。例如，如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或无线技术(诸如红外(IR)、无线电、以及微波)从web网站、服务器、或其他远程源传送而来，则该同轴电缆、光纤电缆、双绞线、DSL或无线技术(诸如红外、无线电、以及微波)就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘、和蓝光碟，其中盘(disk)常常磁性地再现数据，而碟(disc)用激光来光学地再现数据。因此，在一些方面，计算机可读介质可包括非瞬态计算机可读介质(例如，有形介质)。另外，对于其他方面，计算机可读介质可包括瞬态计算机可读介质(例如，信号)。上述的组合应当也被包括在计算机可读介质的范围内。

因此，一些方面可包括用于执行本文中给出的操作的计算机程序产品。例如，此类计算机程序产品可包括其上存储(和/或编码)有指令的计算机可读介质，这些指令能由一个或多个处理器执行以执行本文中所描述的操作。对于一些方面，计算机程序产品可包括包装材料。

此外，应当领会，用于执行本文中所描述的方法和技术的模块和/或其它恰适装置能由用户终端和/或基站在适用的场合下载和/或以其他方式获得。例如，此类设备可被耦合至服务器以促成用于执行本文中所描述的方法的装置的转移。替换地，本文所述的各种方法可经由存储装置(例如，RAM、ROM、诸如压缩碟(CD)或软盘等物理存储介质等)来提供，以使得一旦将该存储装置耦合至或提供给用户终端和/或基站，该设备就能获得各种方法。此外，可利用适于向设备提供本文中所描述的方法和技术的任何其他合适的技术。

将理解，权利要求并不被限定于以上所解说的精确配置和组件。可在以上所描述的方法和设备的布局、操作和细节上作出各种改动、更换和变形而不会脱离权利要求的范围。

Claims

1.一种用于分类对象的由计算机实现的方法，所述方法包括：

通过传感器来捕捉图像、视频、音频、或其组合中的至少一者；

处理所述图像、视频、音频、或其组合中的至少一者来提取多个对象；

向所述多个对象中的第一对象的每个预测类应用置信度值；

至少部分地基于所述第一对象的第一预测类的第一置信度值与所述第一对象的第二预测类的第二置信度值之差来确定度量；

在所述度量高于阈值时，至少部分地基于知识图谱来确定所述第一对象的分类，所述知识图谱提供所述第一对象与所述多个对象中的至少第二对象之间的关联的概率；以及

使用所确定的分类来为所述第一对象生成标记。

2.如权利要求1所述的由计算机实现的方法，其特征在于，所述知识图谱包括至少部分地基于所述第一对象与至少第二对象相关联的概率来确定的权重。

3.如权利要求2所述的由计算机实现的方法，其特征在于，所述分类是至少部分地基于用所述知识图谱的所述权重来偏置针对所述第一对象的每个置信度值而确定的。

4.如权利要求2所述的由计算机实现的方法，其特征在于，进一步包括基于所述多个对象中具有最高置信度值的对象来选择将应用于每个置信度值的权重。

5.如权利要求2所述的由计算机实现的方法，其特征在于，所述知识图谱的所述权重至少部分地基于先前所学习的对象关系。

6.如权利要求5所述的由计算机实现的方法，其特征在于，进一步包括在学习所述多个对象中具有小于所述阈值的混淆值的对象之间的关系后更新所述知识图谱的所述权重。

7.如权利要求5所述的由计算机实现的方法，其特征在于，进一步包括至少部分地基于用户输入来更新所述知识图谱的所述权重。

8.如权利要求2所述的由计算机实现的方法，其特征在于，所述知识图谱的所述权重至少部分地基于所述第一对象相对于所述第二对象出现时的次序。

9.如权利要求1所述的由计算机实现的方法，其特征在于，所述知识图谱与深度卷积网络(DCN)相整合。

10.如权利要求1所述的由计算机实现的方法，其特征在于，所述度量是至少部分地基于针对每个预测类的置信度值的混淆度量。

11.一种用于分类对象的装置，所述装置包括：

传感器，所述传感器被配置成捕捉图像、视频、音频、或其组合中的至少一者；

存储器单元；以及

耦合至所述存储器单元的至少一个处理器，所述至少一个处理器被配置成：

向所述多个对象中的第一对象的每个预测类应用置信度值；

使用所确定的分类来为所述第一对象生成标记。

12.如权利要求11所述的装置，其特征在于，所述知识图谱包括至少部分地基于所述第一对象与至少第二对象相关联的概率来确定的权重。

13.如权利要求12所述的装置，其特征在于，所述至少一个处理器被进一步配置成至少部分地基于用所述知识图谱的所述权重来偏置针对所述第一对象的每个置信度值而确定所述分类。

14.如权利要求12所述的装置，其特征在于，所述至少一个处理器被进一步配置成基于所述多个对象中具有最高置信度值的对象来选择将应用于每个置信度值的权重。

15.如权利要求12所述的装置，其特征在于，所述知识图谱的所述权重至少部分地基于先前所学习的对象关系。

16.如权利要求15所述的装置，其特征在于，所述至少一个处理器被进一步配置成在学习所述多个对象中具有小于所述阈值的混淆值的对象之间的关系后更新所述知识图谱的所述权重。

17.如权利要求15所述的装置，其特征在于，所述至少一个处理器被进一步配置成至少部分地基于用户输入来更新所述知识图谱的所述权重。

18.如权利要求12所述的装置，其特征在于，所述知识图谱的所述权重至少部分地基于所述第一对象相对于所述第二对象出现时的次序。

19.如权利要求11所述的装置，其特征在于，所述知识图谱与深度卷积网络(DCN)相整合。

20.如权利要求11所述的装置，其特征在于，所述度量是至少部分地基于针对每个预测类的置信度值的混淆度量。

21.一种其上记录有用于分类对象的程序代码的非瞬态计算机可读介质，所述程序代码由处理器执行并且包括：

用于处理由传感器捕捉的图像、视频、音频、或其组合中的至少一者来提取多个对象的程序代码；

用于向所述多个对象中的第一对象的每个预测类应用置信度值的程序代码；

用于至少部分地基于所述第一对象的第一预测类的第一置信度值与所述第一对象的第二预测类的第二置信度值之差来确定度量的程序代码；

用于在所述度量高于阈值时，至少部分地基于知识图谱来确定所述第一对象的分类的程序代码，所述知识图谱提供所述第一对象与所述多个对象中的至少第二对象之间的关联的概率；以及

用于使用所确定的分类来为所述第一对象生成标记的程序代码。

22.一种用于分类对象的设备，所述设备包括：

用于处理由传感器捕捉的图像、视频、音频、或其组合中的至少一者来提取多个对象的装置；

用于向多个对象中的第一对象的每个预测类应用置信度值的装置；

用于至少部分地基于所述第一对象的第一预测类的第一置信度值与所述第一对象的第二预测类的第二置信度值之差来确定度量的装置；

用于在所述度量高于阈值时，至少部分地基于知识图谱来确定所述第一对象的分类的装置，所述知识图谱提供所述第一对象与所述多个对象中的至少第二对象之间的关联的概率；以及

用于使用所确定的分类来为所述第一对象生成标记的装置。