CN107995982B - 一种目标识别方法、装置和智能终端 - Google Patents

一种目标识别方法、装置和智能终端 Download PDF

Info

Publication number
CN107995982B
CN107995982B CN201780002292.4A CN201780002292A CN107995982B CN 107995982 B CN107995982 B CN 107995982B CN 201780002292 A CN201780002292 A CN 201780002292A CN 107995982 B CN107995982 B CN 107995982B
Authority
CN
China
Prior art keywords
target
result
detected
confidence
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780002292.4A
Other languages
English (en)
Other versions
CN107995982A (zh
Inventor
廉士国
刘兆祥
王宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
As Science And Technology (beijing) Co Ltd
Original Assignee
As Science And Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by As Science And Technology (beijing) Co Ltd filed Critical As Science And Technology (beijing) Co Ltd
Publication of CN107995982A publication Critical patent/CN107995982A/zh
Application granted granted Critical
Publication of CN107995982B publication Critical patent/CN107995982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种目标识别方法、装置和智能终端。其中,所述方法包括:采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高。通过上述技术方案,本发明实施例能够在不同的识别场景下,确保输出的识别结果的可靠性,同时,尽可能地输出更详细的识别结果,从而提升用户体验。

Description

一种目标识别方法、装置和智能终端
技术领域
本发明实施例涉及智能识别技术领域,尤其涉及一种目标识别方法、装置和智能终端。
背景技术
随着机器智能化进程的推进,人与智能终端之间的交互越来越频繁,人机交互的自然体验问题也随之变得越来越重要。其中,影响人机交互的自然体验的一个重要因素就是智能终端对待测目标的识别的详细程度和可靠性。
当前,大多数智能终端都被希望能够输出人名、车的型号(或者系列)、车牌号码、猫的品种等详细程度较高的目标识别结果,以提升人机交互体验。
然而,在实际场景中,环境是多变的,而智能终端的识别能力是有限的,在某些场景下智能终端有可能无法精确识别待测目标,比如,因为光线、角度或者遮挡等原因无法识别出这个人是谁,又如,因为距离和角度的原因不能确信车的品牌或型号。在这种情况下,如果强制要求智能终端输出详细程度较高的识别结果,有可能会因为识别错误而带来尴尬;或者,如果因为得不到详细程度高的识别结果而放弃输出结果,也不利于用户友好体验。
由此,如何在目标识别的可靠性与详细程度之间达到折中是现有的智能识别技术亟待解决的问题。
发明内容
本发明实施例提供一种目标识别方法、装置和智能终端,能够解决如何在目标识别的可靠性与详细程度之间达到折中的问题。
第一方面,本发明实施例提供了一种目标识别方法,应用于智能终端,包括:
采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;
基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高;
其中,优先级越高的属性类型对应的判断结果的详细程度越高。
第二方面,本发明实施例提供一种目标识别装置,包括:
信息采集单元,用于采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;
识别单元,用于基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高;
其中,优先级越高的属性类型对应的判断结果的详细程度越高。
第三方面,本发明实施例提供一种智能终端,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的目标识别方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使智能终端执行如上所述的目标识别方法。
第五方面,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被智能终端执行时,使所述智能终端执行如上所述的目标识别方法。
本发明实施例的有益效果在于:本发明实施例提供的目标识别方法、装置和智能终端通过根据对待测目标的描述的详细程度的不同为待测目标的属性划分多个具有优先级顺序的属性类型,并且在识别的过程中,获取每一属性类型下的判断结果的置信度,继而根据实际识别情况输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果,能够在不同的识别场景下,确保输出的识别结果的可靠性,同时,尽可能地输出更详细的识别结果,即,使得最终得到的识别结果能够在可靠性和详细程度之间达到折中,从而提升用户体验。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明实施例提供的一种目标识别方法的流程示意图;
图2是本发明实施例提供的另一种目标识别方法的流程示意图;
图3是本发明实施例提供的一种目标识别装置的结构示意图;
图4是本发明实施例提供的一种智能终端的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互结合,均在本发明的保护范围之内。另外,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
本发明实施例提供了一种目标识别方法、装置和智能终端,能够适用于任意与目标识别相关的应用领域,比如:智能导盲、迎宾机器人、服务机器人、入侵对象探测、语义识别等。
其中,本发明实施例提供的目标识别方法是一种基于待测目标的属性类型的“优先级”以及每一属性类型下的判断结果的“置信度”的智能优化识别方法,通过根据对待测目标的描述的详细程度的不同为待测目标的属性划分多个具有优先级顺序的属性类型(其中,优先级越高的属性类型对应的判断结果的详细程度越高),并且在识别的过程中,对每一属性类型下的判断结果设置用于评价该判断结果的可靠性的置信度,继而根据实际识别情况输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果,能够在不同的识别场景下,确保输出的识别结果的可靠性,同时,尽可能地输出更详细的识别结果,即,使得最终得到的识别结果能够在可靠性和详细程度之间达到折中,从而提升用户体验。
由此,采用本发明实施例提供的目标识别方法、装置和智能终端识别相同的人/物(待测目标)时,在不同识别环境下可能输出不同详细程度的识别结果。例如:以识别人为例,在光照好,距离近,并且被测人正对机器摄像头时,可以识别出被测人的“人名”;当被测人用手遮住半张脸,或侧对机器摄像头时,只能识别出被测人的“性别”;当被测人背对机器摄像头时,只能识别出是否是个“人”。
本发明实施例提供的目标识别方法和装置能够应用于任意类型的智能终端,比如:机器人、导盲眼镜、智能头盔、智能手机、平板电脑、服务器等。该智能终端可以包括任何合适类型的,用以存储数据的存储介质,例如磁碟、光盘(CD-ROM)、只读存储记忆体或随机存储记忆体等。该智能终端还可以包括一个或者多个逻辑运算模块,单线程或者多线程并行执行任何合适类型的功能或者操作,例如查看数据库、图像处理等。所述逻辑运算模块可以是任何合适类型的,能够执行逻辑运算操作的电子电路或者贴片式电子器件,例如:单核心处理器、多核心处理器、图形处理器(GPU)等。
具体地,下面结合附图,对本发明实施例作进一步阐述。
实施例一
图1是本发明实施例提供的一种目标识别方法的流程示意图,请参阅图1,该方法包括但不限于:
110、采集针对待测目标的信息。
在本实施例中,待测目标可以包括但不限于:人、动物、物体等。根据对待测目标的描述的详细程度的不同可以为待测目标划分至少两个不同层级的属性类型,并且,按照所对应的详细程度的高低,为这些属性类型设置优先级关系。其中,可以认为识别难度较大的属性类型对应的详细程度较高,而识别的难易程度可以依据不同属性类型的识别算法在相同条件下(例如输入相同的图片)的识别率来排序(例如,通常人名识别难于性别识别,性别识别难于人脸/人体识别);或者,也可以依据属性类型间的相互包含关系来排序(例如,要识别性别需先识别到人脸的存在)。
举例说明:假设待测目标为人,可以根据对待测目标的描述的详细程度的不同,设置人的属性类型包括:“人名”、“性别”以及“是否为人”,而根据识别的难易程度,可以设置这些属性类型的优先级顺序为:L1(人名)>L2(性别)>L3(是否为人)。又如,假设待测目标为车,则可以设置车的属性类型包括:“车牌”、“车的型号”、“车的颜色”以及“是否为车”,而根据识别的难易程度,可以设置这些属性类型的优先级顺序为:L1(车牌)>L2(车的型号)>L3(车的颜色)>L4(是否为车)。
此外,在本实施例中,所述“信息”可以是任意能够反映待测目标的属性的判断依据,该信息的类型可以包括但不限于:图像信息、声音信息、热红外画面、近红外画面、超声信号、电磁反射信号等。
在执行本步骤110时,可以通过一种或者多种传感器采集针对待测目标的信息,比如,通过摄像头采集针对待测目标的图像信息、通过麦克风采集针对待测目标的声音信息、通过热红外传感器采集针对待测目标的热红外画面等。
120、基于所述信息输出所述待测目标的识别结果。
在本实施例中,在基于采集到的信息识别待测目标的过程中,待测目标每一属性类型下对应有一个判断结果,而每一判断结果对应有一个用于表征该判断结果的可靠性(或,可信性)的置信度。比如:基于采集到的针对某人的图像信息,获取到待测目标的判断结果包括:“张三”(置信度为70%),“男性”(置信度为89%),“人”(置信度为100%),则,“张三”、“男性”和“人”即分别为该待测目标的属性类型“人名”、“性别”和“是否为人”对应的判断结果。其中,判断结果的置信度可以通过特征比对的相似程度来确定,相似程度越高,置信度越高。
特别地,在本实施例中,所输出的识别结果为待测目标其中一种属性类型对应的判断结果,该判断结果的置信度满足预设条件,并且,该识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高。
其中,所述“预设条件”可以根据实际应用场景而设置,用于鉴定某一判断结果的可靠程度。具体地,该预设条件可以是:判断结果的置信度大于或者等于与其对应的属性类型所对应的置信阈值。其中,每一属性类型对应的置信阈值可以是相同的,比如,与属性类型“人名”、“性别”和“是否为人”对应的置信阈值均为70%,若获取到待测目标的判断结果包括:“张三”(置信度为70%),“男性”(置信度为89%),“人”(置信度为100%),则,判断结果“张三”、“男性”和“人”的置信度均满足预设条件,此时,该待测目标的识别结果为这三者中优先级最高的属性类型“人名”对应的判断结果“张三”。或者,在另一些实施例中,每一属性类型对应的置信阈值也可以是不相同的,比如,可以预设与属性类型“人名”对应的置信阈值为75%,与属性类型“性别”对应的置信阈值为85%,与属性类型“是否为人”对应的置信阈值为95%,若获取到待测目标的判断结果同样是:“张三”(置信度为70%),“男性”(置信度为89%),“人”(置信度为100%),则,置信度满足预设条件的判断结果仅包括“男性”和“人”,此时,该待测目标的识别结果为这两者中优先级最高的属性类型“性别”对应的判断结果“男性”。
具体地,在本实施例中,基于采集到的信息输出待测目标的识别结果的具体实施方式可以包括但不限于以下两种实施方式:
在第一种实施方式中,可以首先基于采集到的信息获取待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;然后输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果。
其中,在该实施例方式中,基于采集到的信息获取待测目标每一属性类型对应的判断结果可以通过使用合适的算法(比如,神经网络)来实现。比如,假设待测目标为人,智能终端采集到的信息为该人的图像信息,则,智能终端可以从该图像中迭代式地计算出属性类型“是否为人”、“性别”和“人名”对应的判断结果,比如,首先通过神经网络的底层计算出用于判别“是否为人”的特征1,并根据特征1得到“是否为人”对应判断结果及该判断结果的置信度;然后,在神经网络的中间层基于特征1计算用于判别“性别”的特征2,并根据特征2得到“性别”对应的判断结果及该判断结果的置信度;最后,在神经网络的最上层基于特征2计算出用于判别“人名”的特征3,并根据特征3得到“人名”对应的判断结果及该判断结果的置信度。当获取到所有判断结果及其置信度之后,首先筛选出置信度满足预设要求的判断结果,然后选择对待测目标的描述的详细程度最高(即,所对应的属性类型优先级最高)的判断结果作为待测目标的识别结果。
在第二种实施方式中,可以基于采集到的信息,根据优先级从高到低的顺序逐级获取待测目标每一属性类型对应的判断结果以及每一判断结果的置信度,直至第一个置信度满足预设条件的判断结果出现时,输出该第一个置信度满足预设条件的判断结果作为所述待测目标的识别结果。即:当采集到针对待测目标的信息时,首先基于采集到的信息获取优先级最高的属性类型对应的一级判断结果以及一级判断结果的一级置信度,如果该一级置信度满足预设条件(比如,一级置信度大于或等于一级置信阈值),则直接输出该一级判断结果作为待测目标的识别结果,否则,基于采集到的信息获取下一级别的属性类型对应的二级判断结果以及二级判断结果的二级置信度;如果该二级置信度满足预设条件(比如,二级置信度大于或者等于二级置信阈值),则,输出该二级判断结果作为待测目标的识别结果,否则,继续基于采集到的信息获取再下一级别的属性类型对应的判断结果及其置信度,如此循环,直至获取到置信度满足预设条件的判断结果。
其中,在该实施方式中,可以从采集到的信息中提取出不同的特征用于不同级别的判断,例如,假设待测目标为车,采集到的信息为针对该车的图像信息,则,可以从该图像信息中提取出特征a用于识别图像中是否有车,提取出特征b用于识别图像中车的颜色,提取特征c用于识别车的类型(轿车、货车、公交车等)等。
在该实施方式中,通过根据优先级从高到低的顺序逐级获取待测目标每一属性类型对应的判断结果及其置信度,当出现第一个置信度满足预设条件的判断结果时,就直接输出该第一个置信度满足预设条件的判断结果,而不需要对每一个属性类型进行识别判断,能够减少数据处理量,在不影响详细程度和可靠性的前提下,提升识别效率。
此外,针对不同的应用场景以及应用需求,还可以在上述步骤110和120的基础上进行进一步的扩展。
比如,在一些可以进行人机交互的应用场景中,如,智能导盲、迎宾机器人、服务机器人等,该目标识别方法还可以包括:发送与所述识别结果对应的交互信号。
举例说明:如果步骤120输出的识别结果为“张三”,用于导盲的智能眼镜或者智能头盔可以向用户发出语音提示“前面是你的朋友张三”,用于迎宾或者提供服务的机器人可以对待测目标说“您好!VIP客户张三!”,和/或,调整出VIP客户专属的手势。又如,如果步骤120输出的识别结果为“男性”,用于导盲的智能眼镜或者智能头盔可以向用户发出语音提示“前面有位男士”,用于迎宾或者提供服务的机器人可以对待测目标说“您好!先生!”。
通过上述技术方案可知,本发明实施例的有益效果在于:本发明实施例提供的目标识别方法通过根据对待测目标的描述的详细程度为待测目标的属性划分多个具有优先级顺序的属性类型,并且在识别的过程中,获取每一属性类型下的判断结果的置信度,继而根据实际识别情况输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果,能够在不同的识别场景下,确保输出的识别结果的可靠性,同时,尽可能地输出更详细的识别结果,即,使得最终得到的识别结果能够在可靠性和详细程度之间达到折中,从而提升用户体验。
实施例二
进一步地,为了提升目标识别的效率以及详细程度,本发明第二实施例还提供了另一种目标识别方法,在本实施例中,采集到的信息包括至少两种信息源。
具体地,请参阅图2,该方法包括但不限于:
210、采集针对待测目标的至少两种信息源。
在本实施例中,所述“信息源”是指能够反映待测目标的属性的信息来源。所述“至少两种信息源”可以是至少两种不同类型的信息,比如,图像信息、声音信息、热红外画面、近红外画面、超声信号或电磁反射信号中的任意两种或者多种;或者,所述“至少两种信息源”也可以是从至少两个角度或者时刻采集到的某一类型的信息,比如,从多个角度采集待测目标的图像信息(或者声音信息),每一视角采集到的图像信息(或者声音信息)均可作为一种信息源。当然,可以理解的是,所述“至少两种信息源”也可以是上述两种形式的组合,比如,针对待测目标采集到的信息中包括从多个角度采集到的图像信息和从一个角度采集到的声音信息。
在本实施例中,采集每一信息源的具体实施方式可以参考上述实施例一中的步骤110,此处便不再详述。
220、基于所述至少两种信息源输出待测目标的识别结果。
在本实施例中,通过多信息融合的方式获取待测目标的识别结果。
具体地,在本实施例中,基于采集到的至少两种信息源输出待测目标的识别结果的具体实施方式可以包括但不限于以下三种实施方式:
在第一种实施方式中,可以采用“分模式融合”的方式识别待测目标,即:首先分别基于采集到的至少两种信息源获取该待测目标的子识别结果,然后根据这些子识别结果输出该待测目标的识别结果。其中,所述“子识别结果”是指仅基于一种信息源得到的识别结果,每一信息源对应一个子识别结果。由此,在该实施方式中,子识别结果也包括至少两个,每个子识别结果均有相应的置信度,用于评价该子识别结果的可靠性。
具体地,在该实施例方式中,可以首先通过实施例一提供的目标识别方法(如图1所示)分别获取每一信息源对应的子识别结果,然后,从这些子识别结果中筛选出最详细的子识别结果作为该待测目标的识别结果。其中,子识别结果的详细程度可以通过子识别结果对应的属性类型的优先级来判定,所对应的属性类型的优先级越高,详细程度越高,比如,假设获取到的子识别结果包括“人”和“女生”,其中,子识别结果“人”对应的属性类型为“是否为人”,子识别结果“女生”对应的属性类型为“性别”,而“性别”的优先级高于“是否为人”,则,子识别结果“女生”的详细程度高于子识别结果“人”,从而可以以子识别结果“女生”作为该待测目标的识别结果。
举例说明:假设采集到的信息包括图像信息和声音信息,则,可以基于采集到的图像信息执行上述实施例一中的步骤110~120;同时,基于采集到的声音信息执行上述实施例一中的步骤110~120。假设基于采集到的图像信息输出的子识别结果为“人”,而基于采集到的声音信息输出的子识别结果为“李四”,则,可以输出详细程度更高的子识别结果“李四”作为待测目标的识别结果。
此外,在实际的应用中,也有可能存在获取到的详细程度最高的子识别结果包括多个,并且多个子识别结果之间存有矛盾的情况,比如,获取到的详细程度最高的子识别结果包括“男生”和“女生”,子识别结果“男生”和“女生”对应的属性类型均为“性别”,但同一属性类型下只能输出一个识别结果。此时,可以从详细程度最高的子识别结果中选择置信度最高的子识别结果作为该待测目标的识别结果,比如,子识别结果“男生”的置信度为70%,而子识别结果“女生”的置信度为90%(>70%),从而可以选择子识别结果“女生”作为该待测目标的识别结果。
在该实施方式中,通过融合至少两种信息源得到的子识别结果来生成待测目标的识别结果,能够进一步提升目标识别的详细程度。
在第二种实施方式中,可以采用“分级决策融合”的方式识别待测目标,即:分别基于所述至少两种信息源,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的子判断结果以及每一子判断结果的子置信度,直至第一个子置信度满足预设条件的子判断结果出现时,输出所述第一个子置信度满足预设条件的子判断结果作为所述待测目标的识别结果。
其中,所述“子判断结果”是指仅基于一种信息源分析得到的针对该待测目标在某一属性类型下的判断结果,每一信息源在每一属性类型下对应一个子判断结果。所述“子置信度”是指该子判断结果的可信程度,用于表征该子判断结果的可靠性。
举例说明:假设待测目标为人,属性类型包括:“人名”、“性别”和“是否为人”,且,优先级关系为:L1(人名)>L2(性别)>L3(是否为人),采集到的信息包括图像信息和声音信息,则,首先分别基于该图像信息和声音信息获取“人名”对应的子判断结果及其置信度,假设基于图像信息获取到的子判断结果为“李四”并且“李四”的子置信度满足第一预设条件,而基于声音信息获取到的子判断结果为“张三”,但“张三”的子置信度不满足第二预设条件,说明基于声音信息无法识别出“人名”,此时,子判断结果“李四”是第一个子置信度满足预设条件(满足第一预设条件或第二预设条件)的子判断结果,从而,可以输出“李四”作为待测目标的识别结果。
此外,在一些实施例中,当同一时刻出现多个置信度满足预设条件,并且,不相同的子判断结果时,即,所述“第一个子置信度满足预设条件的子判断结果”包括多个时,可以选择这些子判断结果中置信度最高的子判断结果作为待测目标的识别结果。
在该实施方式中,通过分别基于至少两种信息源分级识别待测目标,只要其中一种信息源分析得到最优的识别结果(即,可靠且详细程度最高的识别结果),就可以直接输出该最优的识别结果,能够提升目标识别的效率。
在第三种实施方式中,可以采用“分级融合决策”的方式识别待测目标,即:根据优先级由高到低的顺序,逐级从所述至少两种信息源中提取出所述待测目标每一属性类型对应的特征,并根据每一属性类型对应的特征获取每一属性类型对应的判断结果以及所述判断结果的置信度;直至第一个置信度满足预设条件的判断结果出现时,输出这个第一个置信度满足预设条件的判断结果作为所述待测目标的识别结果。
举例说明:假设待测目标为人,属性类型包括:“人名”、“性别”和“是否为人”,且,优先级关系为:L1(人名)>L2(性别)>L3(是否为人),采集到的信息包括图像信息和声音信息,则,可以首先从采集到的图像信息中提取出用来识别“人名”的一级特征A1,以及,从声音信息中提取出用来识别“人名”的一级特征A2,然后将这两类一级特征A1和A2融合在一起(比如,通过融合两类特征的神经网络分离器将A1和A2拼接在一起)生成特征A,然后根据特征A识别“人名”的一级判断结果以及该一级判断结果的一级置信度,如果该一级置信度满足一级预设条件,则输出该一级判断结果;否则,从采集到的图像信息中提取出用来识别“性别”的二级特征B1,以及,从声音信息中提取出用来识别“性别”的二级特征B2,然后将这两类二级特征B1和B2融合在一起生成特征B,然后根据特征B识别“性别”的二级判断结果以及该二级判断结果的二级置信度,如果该二级置信度满足二级预设条件,则输出该二级判断结果;否则,继续获取再下一级别的属性类型对应的判断结果及其置信度,如此循环,直至获取到置信度满足预设条件的判断结果。
在该实施方式中,通过逐级融合采集到的至少两种信息源的特征,能够丰富目标识别的判定信息,不仅能够提升目标识别的详细程度,还可以提升目标识别的效率。
通过上述技术方案可知,本发明实施例的有益效果在于:本发明实施例提供的目标识别方法通过采集至少两种信息源,并根据该至少两种信息源输出待测目标的识别结果,能够提升目标识别的详细程度和效率。
实施例三
图3是本发明实施例提供的一种目标识别装置的结构示意图,请参阅图3,该目标识别装置3包括:
信息采集单元31,用于采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;以及,
识别单元32,用于基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高。
在本实施例中,当信息采集单元31采集到针对待测目标的信息时,通过识别单元32基于所述信息输出所述待测目标的识别结果。其中,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高。
其中,在一些实施例中,识别单元32具体用于:基于所述信息获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果。
其中,在一些实施例中,识别单元32包括分析模块321和输出模块322;其中,分析模块321用于基于采集到的针对待测目标的信息,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;输出模块322用于当第一个置信度满足预设条件的判断结果出现时,输出所述第一个置信度满足预设条件的判断结果作为所述待测目标的识别结果。进一步地,在另一些实施例中,若信息采集单元31采集到的信息包括至少两种信息源,此时,分析模块321具体用于:根据优先级由高到低的顺序,逐级从所述至少两种信息源中提取出所述待测目标每一属性类型对应的特征,并根据每一属性类型对应的特征获取每一属性类型对应的判断结果以及所述判断结果的置信度。
此外,在又一些实施例中,当信息采集单元31采集到的信息包括至少两种信息源时,识别单元32具体用于:分别基于所述至少两种信息源,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的子判断结果以及每一子判断结果的子置信度,直至第一个子置信度满足预设条件的子判断结果出现时,输出所述第一个子置信度满足预设条件的子判断结果作为所述待测目标的识别结果;或者,分别基于所述至少两种信息源获取所述待测目标的子识别结果,其中,每一信息源对应一个子识别结果;根据所述子识别结果输出所述待测目标的识别结果。
再者,在一些实施例中,该目标识别装置3还包括:
交互单元33,用于发送与所述识别结果对应的交互信号。
需要说明的是,由于所述目标识别装置与上述方法实施例中的目标识别方法基于相同的发明构思,因此,上述方法实施例的相应内容以及有益效果同样适用于本装置实施例,此处不再详述。
通过上述技术方案可知,本发明实施例的有益效果在于:本发明实施例提供的目标识别装置通过根据对待测目标的描述的详细程度为待测目标的属性划分多个具有优先级顺序的属性类型,并且在识别的过程中,由识别单元获取每一属性类型下的判断结果的置信度,继而根据实际识别情况输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果,能够在不同的识别场景下,确保输出的识别结果的可靠性,同时,尽可能地输出更详细的识别结果,即,使得最终得到的识别结果能够在可靠性和详细程度之间达到折中,从而提升用户体验。
实施例四
图4是本发明实施例提供的一种智能终端的硬件结构示意图,该智能终端400可以是任意类型的智能终端,如:机器人、导盲眼镜、智能头盔、智能手机、平板电脑、服务器等,能够执行上述方法实施例一和/或实施例二所提供的目标识别方法。
具体地,请参阅图4,该智能终端400包括:
一个或多个处理器401以及存储器402,图4中以一个处理器401为例。
处理器401和存储器402可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器402作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的目标识别方法对应的程序指令/模块(例如,附图3所示的信息采集单元31、识别单元32和交互单元33)。处理器401通过运行存储在存储器402中的非暂态软件程序、指令以及模块,从而执行目标识别装置的各种功能应用以及数据处理,即实现上述任一方法实施例的目标识别方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据目标识别装置的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至智能终端400。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器402中,当被所述一个或者多个处理器401执行时,执行上述任意方法实施例中的目标识别方法,例如,执行以上描述的图1中的方法步骤110至步骤120,图2中的方法步骤210至步骤220,实现图3中的单元31-33的功能。
实施例五
本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如被图4中的一个处理器401执行,可使得上述一个或多个处理器执行上述任意方法实施例中的目标识别方法,例如,执行以上描述的图1中的方法步骤110至步骤120,图2中的方法步骤210至步骤220,实现图3中的单元31-33的功能。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非暂态计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
上述产品可执行本发明实施例所提供的目标识别方法,具备执行目标识别方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的目标识别方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (16)

1.一种目标识别方法,应用于智能终端,其特征在于,包括:
采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;
基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高;
其中,优先级越高的属性类型对应的判断结果的详细程度越高。
2.根据权利要求1所述的目标识别方法,其特征在于,所述基于所述信息输出所述待测目标的识别结果,包括:
基于所述信息获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;
输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果。
3.根据权利要求1所述的目标识别方法,其特征在于,所述基于所述信息输出所述待测目标的识别结果,包括:
基于所述信息,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度,直至第一个置信度满足预设条件的判断结果出现时,输出所述第一个置信度满足预设条件的判断结果作为所述待测目标的识别结果。
4.根据权利要求3所述的目标识别方法,其特征在于,所述信息包括至少两种信息源,则,所述基于所述信息,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度,包括:
根据优先级由高到低的顺序,逐级从所述至少两种信息源中提取出所述待测目标每一属性类型对应的特征,并根据每一属性类型对应的特征获取每一属性类型对应的判断结果以及所述判断结果的置信度。
5.根据权利要求1所述的目标识别方法,其特征在于,所述信息包括至少两种信息源,则,所述基于所述信息输出所述待测目标的识别结果,包括:
分别基于所述至少两种信息源,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的子判断结果以及每一子判断结果的子置信度,直至第一个子置信度满足预设条件的子判断结果出现时,输出所述第一个子置信度满足预设条件的子判断结果作为所述待测目标的识别结果。
6.根据权利要求1所述的目标识别方法,其特征在于,所述信息包括至少两种信息源,则,所述基于所述信息输出所述待测目标的识别结果,包括:
分别基于所述至少两种信息源获取所述待测目标的子识别结果,其中,每一信息源对应一个子识别结果;
根据所述子识别结果输出所述待测目标的识别结果。
7.根据权利要求1-6任一项所述的目标识别方法,其特征在于,所述方法还包括:
发送与所述识别结果对应的交互信号。
8.一种目标识别装置,应用于智能终端,其特征在于,包括:
信息采集单元,用于采集针对待测目标的信息,所述待测目标包括至少两种属性类型,所述至少两种属性类型之间设置有优先级关系;
识别单元,用于基于所述信息输出所述待测目标的识别结果,所述识别结果为其中一种所述属性类型对应的判断结果,所述判断结果的置信度满足预设条件,并且,所述识别结果对应的属性类型在置信度满足所述预设条件的判断结果对应的属性类型中优先级最高;
其中,优先级越高的属性类型对应的判断结果的详细程度越高。
9.根据权利要求8所述的目标识别装置,其特征在于,所述识别单元具体用于:
基于所述信息获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;
输出置信度满足预设条件的判断结果中优先级最高的属性类型对应的判断结果作为所述待测目标的识别结果。
10.根据权利要求8所述的目标识别装置,其特征在于,所述识别单元包括:
分析模块,用于基于所述信息,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的判断结果以及每一判断结果的置信度;
输出模块,用于当第一个置信度满足预设条件的判断结果出现时,输出所述第一个置信度满足预设条件的判断结果作为所述待测目标的识别结果。
11.根据权利要求10所述的目标识别装置,其特征在于,所述信息包括至少两种信息源,则,所述分析模块具体用于:
根据优先级由高到低的顺序,逐级从所述至少两种信息源中提取出所述待测目标每一属性类型对应的特征,并根据每一属性类型对应的特征获取每一属性类型对应的判断结果以及所述判断结果的置信度。
12.根据权利要求8所述的目标识别装置,其特征在于,所述信息包括至少两种信息源,则,所述识别单元具体用于:
分别基于所述至少两种信息源,根据优先级从高到低的顺序逐级获取所述待测目标每一属性类型对应的子判断结果以及每一子判断结果的子置信度,直至第一个子置信度满足预设条件的子判断结果出现时,输出所述第一个子置信度满足预设条件的子判断结果作为所述待测目标的识别结果。
13.根据权利要求8所述的目标识别装置,其特征在于,所述信息包括至少两种信息源,则,所述识别单元具体用于:
分别基于所述至少两种信息源获取所述待测目标的子识别结果,其中,每一信息源对应一个子识别结果;
根据所述子识别结果输出所述待测目标的识别结果。
14.根据权利要求8-13任一项所述的目标识别装置,其特征在于,所述目标识别装置还包括:
交互单元,用于发送与所述识别结果对应的交互信号。
15.一种智能终端,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-7任一项所述的目标识别方法。
16.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使智能终端执行如权利要求1-7任一项所述的目标识别方法。
CN201780002292.4A 2017-09-15 2017-09-15 一种目标识别方法、装置和智能终端 Active CN107995982B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/101967 WO2019051814A1 (zh) 2017-09-15 2017-09-15 一种目标识别方法、装置和智能终端

Publications (2)

Publication Number Publication Date
CN107995982A CN107995982A (zh) 2018-05-04
CN107995982B true CN107995982B (zh) 2019-03-22

Family

ID=62039956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780002292.4A Active CN107995982B (zh) 2017-09-15 2017-09-15 一种目标识别方法、装置和智能终端

Country Status (2)

Country Link
CN (1) CN107995982B (zh)
WO (1) WO2019051814A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110894658B (zh) * 2018-08-23 2023-03-21 无锡小天鹅电器有限公司 洗涤控制方法、装置以及衣物处理装置
CN112118278B (zh) * 2019-06-04 2023-07-04 杭州海康威视系统技术有限公司 计算节点接入方法、装置、电子设备及机器可读存储介质
CN112071009B (zh) * 2019-06-11 2023-01-03 中国石油化工股份有限公司 光纤管道预警系统及其方法
CN110866466B (zh) * 2019-10-30 2023-12-26 平安科技(深圳)有限公司 一种人脸识别方法、装置、存储介质和服务器
CN111833298B (zh) * 2020-06-04 2022-08-19 石家庄喜高科技有限责任公司 骨骼发育等级检测方法及终端设备
CN112434795A (zh) * 2020-12-01 2021-03-02 中国科学院空天信息创新研究院 一种新型三维人工神经元装置及人工神经网络识别系统
CN112562221A (zh) * 2020-12-02 2021-03-26 支付宝(杭州)信息技术有限公司 一种支持人脸识别的终端以及方法
CN113704266A (zh) * 2021-08-31 2021-11-26 深信服科技股份有限公司 资产信息处理方法、装置、电子设备和存储介质
CN114359787A (zh) * 2021-12-08 2022-04-15 深圳云天励飞技术股份有限公司 目标属性识别方法、装置、计算机设备及存储介质
CN114627098A (zh) * 2022-03-28 2022-06-14 上海商汤智能科技有限公司 检测结果处理方法和装置、设备、介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4368336B2 (ja) * 2005-07-13 2009-11-18 富士通株式会社 カテゴリ設定支援方法及び装置
JP4462339B2 (ja) * 2007-12-07 2010-05-12 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
CN104143079B (zh) * 2013-05-10 2016-08-17 腾讯科技(深圳)有限公司 人脸属性识别的方法和系统
CN103914683A (zh) * 2013-12-31 2014-07-09 闻泰通讯股份有限公司 基于人脸图像的性别识别方法及系统
CN103824054B (zh) * 2014-02-17 2018-08-07 北京旷视科技有限公司 一种基于级联深度神经网络的人脸属性识别方法
US9319416B2 (en) * 2014-07-03 2016-04-19 Alcatel Lucent Priority based radius authentication
CN105844283B (zh) * 2015-01-16 2019-06-07 阿里巴巴集团控股有限公司 用于识别图像类目归属的方法、图像搜索方法及装置
CN106021060A (zh) * 2016-04-29 2016-10-12 乐视控股(北京)有限公司 一种用户行为消息的优先级确定方法和装置
CN106326928B (zh) * 2016-08-24 2020-01-07 四川九洲电器集团有限责任公司 一种目标识别方法及设备
CN106934817B (zh) * 2017-02-23 2020-11-10 中国科学院自动化研究所 基于多属性的多目标跟踪方法及装置
CN107145857B (zh) * 2017-04-29 2021-05-04 深圳市深网视界科技有限公司 人脸属性识别方法、装置和模型建立方法

Also Published As

Publication number Publication date
CN107995982A (zh) 2018-05-04
WO2019051814A1 (zh) 2019-03-21

Similar Documents

Publication Publication Date Title
CN107995982B (zh) 一种目标识别方法、装置和智能终端
US11379699B2 (en) Object detection method and apparatus for object detection
CN106952303B (zh) 车距检测方法、装置和系统
CN109255352B (zh) 目标检测方法、装置及系统
US20210133468A1 (en) Action Recognition Method, Electronic Device, and Storage Medium
CN108256404B (zh) 行人检测方法和装置
CN108064389B (zh) 一种目标识别方法、装置和智能终端
CN107820619B (zh) 一种分级交互决策方法、交互终端以及云端服务器
CN112381104B (zh) 一种图像识别方法、装置、计算机设备及存储介质
CN106648078B (zh) 应用于智能机器人的多模态交互方法及系统
WO2022041830A1 (zh) 行人重识别方法和装置
CN108229375B (zh) 用于检测人脸图像的方法和装置
CN113837257A (zh) 一种目标检测方法及装置
CN110084187B (zh) 基于计算机视觉的位置识别方法、装置、设备及存储介质
US9301722B1 (en) Guiding computational perception through a shared auditory space
CN113129249A (zh) 基于深度视频的空间平面检测方法及其系统和电子设备
CN113111692B (zh) 目标检测方法、装置、计算机可读存储介质及电子设备
CN114139630A (zh) 姿态识别方法、装置、存储介质和电子设备
CN112819953B (zh) 三维重建方法、网络模型训练方法、装置及电子设备
CN115862597A (zh) 人物类型的确定方法、装置、电子设备和存储介质
CN114743277A (zh) 活体检测方法、装置、电子设备、存储介质及程序产品
CN112989869B (zh) 人脸质量检测模型的优化方法、装置、设备及存储介质
KR20140134844A (ko) 객체 기반 사진 촬영 방법 및 장치
CN113591869A (zh) 点云实例分割方法和装置、电子设备和存储介质
CN112115740B (zh) 用于处理图像的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant