CN113128265A - 一种人物识别方法及装置 - Google Patents

一种人物识别方法及装置 Download PDF

Info

Publication number
CN113128265A
CN113128265A CN201911400680.5A CN201911400680A CN113128265A CN 113128265 A CN113128265 A CN 113128265A CN 201911400680 A CN201911400680 A CN 201911400680A CN 113128265 A CN113128265 A CN 113128265A
Authority
CN
China
Prior art keywords
clothing
person
clothing feature
preset
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911400680.5A
Other languages
English (en)
Inventor
申皓全
陈凯
王铭学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201911400680.5A priority Critical patent/CN113128265A/zh
Publication of CN113128265A publication Critical patent/CN113128265A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种人物识别方法及装置,涉及计算机视觉技术领域,解决了识别准确率低的问题。具体的,获取第一图片后,将第一图片输入到预先训练好的神经网络模型,得到第一衣着特征;在N个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征,N个预设的衣着特征组与N个不同的人物一一对应;确定第一衣着特征的权重,并根据第一衣着特征的权重以及确定出的所有匹配衣着特征,得到N个匹配度,N个匹配度与N个预设的衣着特征组一一对应;将N个匹配度中数值最高的匹配度确定为目标匹配度;将目标衣着特征组对应的人物确定为目标人物,目标衣着特征组为N个预设的衣着特征组中与目标匹配度对应的衣着特征组。

Description

一种人物识别方法及装置
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种人物识别方法及装置。
背景技术
现有技术中,当图像或者视频序列中的人脸模糊,不能单纯通过人脸识别出目标人物时,可以依据目标人物的衣着特征辅助识别,大大提高了识别的准确率和效率。
但是,当目标人物更换衣物后,识别的准确率就会急剧下降,无法准确地识别出目标人物。
发明内容
本申请提供了一种人物识别方法及装置,能够解决当目标人物更换衣物后,识别准确率低的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供了一种人物识别方法。具体的,在获取到第一图片后,人物识别装置将该第一图片输入到预先训练好的神经网络模型,得到第一衣着特征。之后,人物识别装置在N(N为大于或等于2的整数)个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征(当前预设的衣着特征组中与第一衣着特征之间的相似度最高的衣着特征)。本申请中每个预设的衣着特征组中的衣着特征包括一个人物在预设时间段内的衣着特征,N个预设的衣着特征组与N个不同的人物一一对应。在确定出匹配衣着特征后,人物识别装置确定第一衣着特征的权重(该权重用于表示第一衣着特征与其他衣着特征的区别程度,其中,区别程度越大,第一衣着特征的权重的数值越大),并根据第一衣着特征的权重以及确定出的所有匹配衣着特征,计算得到N个匹配度,N个匹配度与N个预设的衣着特征组一一对应。最后,人物识别装置将N个匹配度中数值最高的匹配度确定为目标匹配度,并将目标衣着特征组(目标衣着特征组为N个预设的衣着特征组中与目标匹配度对应的衣着特征组)所对应的人物确定为目标人物。
人物识别装置根据第一衣着特征的权重、第一衣着特征和N个预设的衣着特征组,确定目标匹配度,进而根据目标匹配度确定目标人物。N个预设的衣着特征组与N个不同的人物一一对应,因此,即使用户更换了衣物,人物识别装置也能准确地识别出人物。
在一种可能的设计方式中,上述第一图片为即时拍摄到的,或者为从已经存储的图片中选取的。
在实际应用中,人物识别装置获取第一图片的方式有多种,本申请对此不作限定。
在另一种可能的设计方式中,人物识别装置显示目标人物的信息。这里,目标人物的信息为目标人物的特征信息,该特征信息包括身份信息,或者包括身份信息和地理位置信息。或者目标人物的信息为第二图片,该第二图片包括目标匹配度所对应的匹配衣着特征。
在另一种可能的设计方式中,第一衣着特征包括:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
在另一种可能的设计方式中,人物识别装置还可以获取至少两张包括人物的图片,并将获取到的至少两张包括人物的图片输入到预先训练好的神经网络模型中,得到至少两张包括人物的图片中每张图片的衣着特征。之后,人物识别装置将得到的所有衣着特征,按照人物划分,得到N个预设的衣着特征组。
人物识别装置利用预先训练好的神经网络模型处理至少两张包括人物的图片,得到每张包括人物的图片中的衣着特征。在实际应用中,对于已经训练好的神经网络模型而言,该神经网络模型的功能较为稳定。因此,本申请中预先训练好的神经网络模型确定包括人物的图片中的衣着特征的准确度较高。人物识别装置以人物粒度划分获取到的衣着特征,得到N个预设的衣着特征组。这N个预设的衣着特征组为人物识别装置识别人脸模糊的图片提供依据。
在另一种可能的设计方式中,本申请中预先训练好的神经网络模型用于根据输入图片,获得输入图片中人物的衣着特征。
在另一种可能的设计方式中,本申请中预先训练好的神经网络模型还用于确定获得的衣着特征的权重。
在另一种可能的设计方式中,上述“人物识别装置确定第一衣着特征的权重”的方法包括:人物识别装置将第一图片输入到预先训练好的神经网络模型后,得到第一衣着特征的权重。
在另一种可能的设计方式中,人物识别装置获取用户输入的第一衣着特征的权重,这样,人物识别装置即可确定出第一衣着特征的权重。
第二方面,本申请提供一种人物识别装置。该人物识别装置包括存储单元、获取单元、处理单元、确定单元和计算单元。
具体的,上述存储单元,用于存储预先训练好的神经网络模型。上述获取单元,用于获取第一图片。上述处理单元,用于将上述获取单元获取到的第一图片输入到存储单元中存储的预先训练好的神经网络模型,得到第一衣着特征。上述确定单元,用于在N个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征;匹配衣着特征为当前预设的衣着特征组中与处理单元得到的第一衣着特征之间的相似度最高的衣着特征;每个预设的衣着特征组中的衣着特征包括一个人物在预设时间段内的衣着特征,N为大于或等于2的整数,N个预设的衣着特征组与N个不同的人物一一对应。上述确定单元,还用于确定第一衣着特征的权重,权重用于表示第一衣着特征与其他衣着特征的区别程度,该区别程度越大,第一衣着特征的权重的数值越大。上述计算单元,根据上述确定单元确定出的第一衣着特征的权重以及确定出的所有匹配衣着特征,计算得到N个匹配度,N个匹配度与N个预设的衣着特征组一一对应。上述确定单元,还用于将上述计算单元计算出的N个匹配度中数值最高的匹配度确定为目标匹配度,以及将目标衣着特征组所对应的人物确定为目标人物,该目标衣着特征组为N个预设的衣着特征组中与目标匹配度对应的衣着特征组。
可选的,上述第一图片为即时拍摄到的,或者,为从已经存储的图片中选取的。
可选的,第一衣着特征包括:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
可选的,上述获取单元,还用于获取至少两张包括人物的图片。上述处理单元,还用于将上述获取单元获取到的至少两张包括人物的图片输入到预先训练好的神经网络模型中,得到至少两张包括人物的图片中每张图片的衣着特征;以及用于将得到的所有衣着特征,按照人物划分,得到N个预设的衣着特征组。
可选的,预先训练好的神经网络模型用于根据输入图片,获得输入图片中人物的衣着特征。
可选的,预先训练好的神经网络模型还用于确定获得的衣着特征的权重。
可选的,上述确定单元具体用于:将第一图片输入到预先训练好的神经网络模型后,得到第一衣着特征的权重。
可选的,上述确定单元具体用于:确定用户输入的第一衣着特征的权重。
第三方面,本申请提供一种人物识别设备,该人物识别设备包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令。当处理器执行该计算机指令时,人物识别设备执行如第一方面及其任一种可能的设计方式所述的人物识别方法。
第四方面,本申请提供一种芯片系统,该芯片系统应用于电子设备;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器。所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当所述处理器执行所述计算机指令时,所述电子设备执行如第一方面及其任一种可能的设计方式所述的人物识别方法。
第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令,当所述计算机指令在人物识别装置上运行时,使得所述人物识别装置执行如第一方面及其任一种可能的设计方式所述的人物识别方法。
第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当所述计算机指令在人物识别装置上运行时,使得所述人物识别装置执行如第一方面及其任一种可能的设计方式所述的人物识别方法。
本申请中第二方面到第六方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述;并且,第二方面到第六方面及其各种实现方式的有益效果,可以参考第一方面及其各种实现方式中的有益效果分析,此处不再赘述。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例中手机的硬件结构示意图;
图2为本申请实施例中手机的软件结构示意图;
图3为本申请实施例中人物识别方法的流程示意图一;
图4为本申请实施例中神经网络模型的一种结构示意图;
图5为本申请实施例中神经网络模型处理图片的流程示意图;
图6为本申请实施例中神经网络模型的另一种结构示意图;
图7为本申请实施例中人物识别方法的流程示意图二;
图8为本申请实施例中人物识别方法的流程示意图三;
图9为本申请实施例中生成N个预设的衣着特征组的原理框架图一;
图10为本申请实施例中生成N个预设的衣着特征组的原理框架图二;
图11为本申请实施例提供的人物识别方法所适用的应用场景的结构示意图一;
图12为本申请实施例提供的人物识别方法所适用的应用场景的结构示意图二;
图13为本申请实施例提供的人物识别系统所适用的应用场景的结构示意图三;
图14为本申请实施例中人物识别装置的结构示意图;
图15为本申请实施例中芯片系统的结构示意图;
图16为本申请实施例中计算机程序产品的结构示意图。
具体实施方式
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
随着计算机技术的日益发展,人物检测在计算机视觉领域中已成为一个重要的热点问题。人物检测在辅助驾驶、远距离的身份识别、无人超市、目标人物追踪、犯罪预防、搜寻遗失老人及小孩、目标人物活动分析等领域都有着广泛的应用前景。
所谓人物检测是指判断图像或视频序列中是否有人物,如果有则准确定位出人物在视频图像中的位置及区域,更甚者,确定出该人物的身份信息。这里的人物可以指图像(可以为视频序列中的图像)中活动或静止的人。
一般的,人物识别(Person Re-Identification)装置采用人脸识别技术确定人物的身份信息。当图像或视频序列中的人脸模糊,不能单纯通过人脸识别出目标人物时,人物识别装置可以依据目标人物的衣着特征辅助识别,大大提高了识别的准确率和效率。但是,当目标人物更换衣物后,识别的准确率就会急剧下降,无法准确地识别出目标人物。
为此,本申请实施例提供一种人物识别方法及装置,可以应用于用户查询第一图片中人物的信息的过程中。具体可以应用于在获取到第一图片后,根据预设的多个衣着特征组,识别第一图片中的目标人物的过程中。
本申请实施例中预设的衣着特征组可以包括多个衣着特征,所述多个衣着特征为一个人物在预设时间段内的衣着特征。衣着特征表示人物穿戴的服饰,如:上衣、裤子、裙子、鞋子、袜子、包、帽子、围巾等。
本申请实施例中的人物识别装置可以是终端。具体的,该终端可以是手机、平板电脑、可穿戴电子设备等便携式设备,也可以是车载设备、智能机器人等设备,还可以是个人计算机(personal computer,PC)、个人数字助理(personal digital assistant,PDA)、上网本等设备。此外,本申请实施例中的人物识别装置还可以是服务器。
当上述人物识别装置为终端时,所述人物识别方法可以通过安装在终端上的用于识别人物的应用程序实现。
上述用于识别人物的应用程序可以是安装在终端中的嵌入式应用程序(即终端的系统应用)或者可下载应用程序。其中,嵌入式应用程序是作为终端(如手机)实现的一部分提供的应用程序。可下载应用程序是一个可以提供自己的因特网协议多媒体子系统(internet protocol multimedia subsystem,IMS)连接的应用程序,该可下载应用程序是可以预先安装在终端中的应用或可以由用户下载并安装在终端中的第三方应用。
请参考图1,以人物识别装置是手机为例,图1示出了手机的一种硬件结构。如图1所示,手机可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线 2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。
其中,传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对手机的具体限定。在本申请另一些实施例中,手机可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是手机的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110 中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S) 接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块 (subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。I2S接口可以用于音频通信。PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。MIPI 接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(display serialinterface,DSI) 等。GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为手机充电,也可以用于手机与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对手机的结构限定。在本申请另一些实施例中,手机也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。
手机的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。手机中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在手机上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150 的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。调制解调处理器可以包括调制器和解调器。
无线通信模块160可以提供应用在手机上的包括无线局域网(wireless localarea networks, WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),GNSS,调频(frequency modulation,FM),近距离无线通信技术(near fieldcommunication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110 接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
示例性的,本申请实施例中的GNSS可以包括:GPS,GLONASS,BDS,QZSS,SBAS,和/或GALILEO等。
手机通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。显示屏194用于显示图像,视频等。显示屏194包括显示面板。
手机可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。ISP用于处理摄像头193反馈的数据。摄像头193用于获取静态图像或视频。物体通过镜头生成光学图像投射到感光元件。数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。视频编解码器用于对数字视频压缩或解压缩。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现手机的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展手机的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行手机的各种功能应用以及数据处理。
手机可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。受话器 170B,也称“听筒”,用于将音频电信号转换成声音信号。麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.2mm的开放移动电子设备平台(open mobile terminalplatform, OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunicationsindustry association of the USA,CTIA)标准接口。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。手机可以接收按键输入,产生与手机的用户设置以及功能控制有关的键信号输入。马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和手机的接触和分离。手机可以支持1个或N个SIM卡接口,N为大于1 的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。
手机的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的安卓(Android)系统为例,示例性说明手机的软件结构。
图2是本申请实施例的手机的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为:应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层中的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。
应用程序框架层包括一些预先定义的函数。
如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供手机的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合捕获拍照场景,示例性说明手机软件以及硬件的工作流程。
当触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过摄像头 193捕获静态图像或视频。
下面结合附图对本申请实施例提供的人物识别方法进行描述。
图3示出了本申请实施例提供的人物识别方法的流程示意图。如图3所示,本申请实施例提供的人物识别方法包括:
S300、获取第一图片。
第一图片可以为摄像头即时拍摄得到的,也可以为从已经存储的图片中选取的。这里,已经存储的图片可以包括:从网络服务器下载得到的,接收其他设备传输得到的(如蓝牙传输),接收社交应用传输得到的,截图得到等,本申请实施例对此不作限定。
S301、将第一图片输入到预先训练好的神经网络模型,得到第一衣着特征。
预先训练好的神经网络模型用于根据输入图片,获得输入图片中人物的衣着特征。
本申请实施例中预先训练好的神经网络模型可以为深度神经网络。深度神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类。
深度神经网络一般包括多个网络层(如卷积层、全连接层等)。深度神经网络的多层结构能自动学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些局部区域的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象一些的特征。
示例性的,本申请实施例中预先训练好的神经网络模型可以为采用ResNet结构表示的卷积神经网络(convolutional neural network,CNN)模型,也可以为其他深度神经网络模型,本申请实施例对此不作限定。
在一个示例中,预先训练好的神经网络模型包括卷积模块、候选区域网络(regionproposal network,RPN)模块、位置确定模块、特征确定模块。卷积模块包括多个卷积层,较浅的卷积层感知域较小,能够学习到一些局部区域(与小目标(如10像素的对象~90像素的对象) 对应)的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象一些的区域(与大目标(如包括96像素的对象)对应)的特征。候选区域网络模块包括第一RPN和第二RPN,其中,第一RPN用于确定大目标的候选区域(region proposal),第二RPN用于确定小目标的候选区域。位置确定模块包括多个卷积层和全连接层,用于确定衣着特征在图片中的位置信息。特征确定模块包括多个卷积层和全连接层,用于确定图片中的衣着特征。衣着特征可以包括款式、花色、颜色等,本申请实施例对此不作限定。
在获取到第一图片后,将第一图片输入到预先训练好的神经网络模型中。从卷积模块的不同层获取多个特征图,并将多个特征图经由RPN模块处理,以得到第一候选区域和第二候选区域。其中,第一候选区域与第一图片中的大目标对应,第二候选区域与第一图片中的小目标对应。之后,将第一候选区域和第二候选区域经由位置确定模块处理,以确定衣着特征在第一图片中的位置信息,该位置信息可以采用矩形坐标框表示。接着,将确定出的位置信息经由特征确定模块处理,以确定第一衣着特征。可以理解的是,第一衣着特征为第一图片中的衣着特征。本申请实施例中的第一衣着特征包括:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
示例性的,图4示出了采用预先训练好的神经网络模型对第一图片进行图像检测,以确定第一衣着特征的流程。图4中的卷积模块包括第1卷积层、第2卷积层、第3卷积层、第4卷积层等。将第一图片输入到预先训练好的神经网络模型后,从第3卷积层获取小目标的特征图,从第4卷积层获取大目标的特征图。之后,大目标的特征图输入到第一RPN,得到第一候选区域和候选上下文区域,该第一候选区域为包括大目标的区域,候选上下文区域用于辅助确定包括小目标的区域;小目标的特征图和候选上下文区域输入到第二RPN,得到第二候选区域,该第二候选区域为包括小目标的区域。然后,将第一候选区域和第二候选区域经由位置确定模块的处理,得到表示衣着特征在第一图片中的位置信息(一般采用bounding box表示位置信息)。最后,将确定出的位置信息经由特征确定模块处理,以确定第一衣着特征。
结合上述图4,如图5所示,图5中的图片a为人物AA的照片。将图片a输入到预先训练好的神经网络模型后,得到“上衣”、“裙子、袜子”(人物的腿这一区域的衣着特征)、“鞋子”、以及“包”在图片a中的位置信息(图6中采用矩形框表示位置信息)。之后,将确定出的位置信息经由特征确定模块处理,以确定人物AA穿的上衣的特征,人物AA穿的裙子、袜子的特征,人物AA穿的鞋子的特征,以及人物AA背的包的特征。
S302、在N(N为大于或等于2的整数)个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征。
匹配衣着特征为当前预设的衣着特征组中与第一衣着特征之间的相似度最高的衣着特征。
本申请实施例中,每个预设的衣着特征组的衣着特征包括一个人物在预设时间段内的衣着特征,N个预设的衣着特征组与N个不同的人物一一对应。
具体的,对于当前预设的衣着特征组而言,计算该当前预设的衣着特征组中的每个衣着特征与第一衣着特征之间的相似度,并确定出相似度最高的衣着特征(该衣着特征即为当前预设的衣着特征组中的匹配衣着特征)。
上述相似度的计算可以通过计算衣着特征之间的海明距离、余弦距离、欧拉距离或非对称距离等方式实现,本申请实施例对此不作限定。
一般的,对于两个衣着特征而言,相似度的数值越高,说明这两个衣着特征所表示的内容越接近相同,或者说明这两个衣着特征之间的距离越小。因此可以认为:在某一预设的衣着特征组中,与第一衣着特征之间的相似度最高的衣着特征(即匹配衣着特征),与第一衣着特征之间的距离最小。
S303、确定第一衣着特征的权重。
本申请实施例中某一衣着特征的权重用于表示该衣着特征与其他衣着特征的区别程度。若区别程度越大,则该衣着特征的权重的数值越大。相应的,若区别程度越小,该衣着特征的权重的数值越小。
例如:对于花色、款式独特的上衣而言,该上衣与其他衣着的区别程度较大,因此,表示该上衣的衣着特征的权重的数值比较大。对于花色、款式比较大众的上衣而言,该上衣与其他衣着的区别程度较小,因此,表示该上衣的衣着特征的权重的数值比较小。由于荧光绿的鸭舌帽容易与其他帽子区分,因此,表示荧光绿的鸭舌帽的衣着特征的权重的数值比较大。
可以通过下述方式一或方式二确定第一衣着特征的权重。
方式一:采用预先训练好的神经网络模型,确定第一衣着特征的权重。
结合上述图4,如图6所示,除了上述卷积模块、RPN模块、位置确定模块以及特征确定模块之外,本申请实施例中预先训练好的神经网络模型还可以包括权重学习模块。该权重学习模块用于确定每一衣着特征的权重。
在确定出第一衣着特征之后,将第一衣着特征输入到权重学习模块,以确定第一衣着特征的权重。
方式二:获取用户输入的第一衣着特征的权重。
示例性的,公安人员输入了一张头戴荧光绿的鸭舌帽的人的图片,并输入了该鸭舌帽的权重,则可以根据公安人员的操作,确定表示鸭舌帽这一衣着特征的权重。
本申请实施例可以先执行S302,后执行S303;也可以先执行S303,后执行S302;还可以同时执行S302和S303,本申请实施例对此不作限定。
S304、根据第一衣着特征的权重以及确定出的所有匹配衣着特征,计算得到N个匹配度。
N个匹配度与N个预设的衣着特征组一一对应。
由于匹配衣着特征为当前预设的衣着特征组中与第一衣着特征之间的相似度最高的衣着特征。因此,在确定当前预设的衣着特征组中的匹配衣着特征时,可以确定出该匹配衣着特征和第一衣着特征之间的相似度。
后续,根据“当前预设的衣着特征组中的匹配衣着特征与第一衣着特征之间的相似度”,以及第一衣着特征的权重,计算当前预设的衣着特征组的匹配度。由于存在N个预设的衣着特征组,因此,能够确定出N个匹配度。
示例性的,若第一衣着特征包括衣着特征i和衣着特征j,且衣着特征i和衣着特征j不同。衣着特征i的权重为权重1,衣着特征j的权重为权重2。在预设的衣着特征组1中,与衣着特征i之间的相似度最高的衣着特征为衣着特征a,且二者之间的相似度为相似度1;与衣着特征j之间的相似度最高的衣着特征为衣着特征b,且二者之间的相似度为相似度2。可以采用公式:权重1*相似度1+权重2*相似度2,计算与该衣着特征组1对应的匹配度。当然,还可以采用其他公式计算匹配度,本申请实施例对此不作限定。
S305、将N个匹配度中数值最高的匹配度确定为目标匹配度。
S306、将目标衣着特征组所对应的人物确定为目标人物,目标衣着特征组为N个预设的衣着特征组中与目标匹配度对应的衣着特征组。
N个预设的衣着特征组与N个不同的人物一一对应。基于N个预设的衣着特征组确定第一图片中的目标人物,提高了人物识别的准确度。
由于N个衣着特征组为预设的,因此,本申请实施例提供的人物识别方法在S302之前还获取N个预设的衣着特征组。
结合上述图3,如图7所示,本申请实施例提供的人物识别方法在S302之前还包括S700。
S700、获取N个预设的衣着特征组。
本申请实施例可以先执行S300和S301,后执行S700;也可以先执行S700,后执行S300 和S301;还可以同时执行S300、S301和S700,本申请实施例对此不作限定。
一种实现方式中,获取N个预设的衣着特征组的方法为:接收来自其他设备发送的N个预设的衣着特征组,后续,存储所述N个预设的衣着特征组。这样,在需要确定第一图片中的目标人物时,直接从本地获取N个预设的衣着特征组。
另一种实现方式中,结合图7,如图8所示,S700可以包括S71~S73。
S71、获取至少两张包括人物的图片。
可选的,从图库中获取至少两张包括人物的图片。
示例性的,在刑侦场景中,图库包括公安机关重点关注的人物的图片。在商场管理的应用场景中,图库包括该商场中每个会员的图片。
图库可以包括具备清晰人脸的图片,也可以包括“属性信息中有人物的身份信息”的图片,本申请实施例对此不作限定。人物的身份信息用于标识一个人物。该身份信息可以包括但不限于样貌信息、标注信息、或者其他识别出来的特征信息。身份信息的表达形式可以包括文字、序号、人物编号或者其他与个体特征有关的信息。
对于属性信息中有人物的身份信息的图片而言,该人物的身份信息可以是用户手动添加的信息。
具体的,可以采用下述方式获取图库中包括人物的图片:
方式一:通过人脸识别技术,识别出包括人物的图片,并确定该图片中的人物。
可以理解的是,对于图库中具备清晰人脸的图片而言,采用方式一能够识别出图片中的人物。
方式二:根据图片的属性信息,识别出包括人物的图片,并确定该图片中的人物。
如果图片的属性信息包括人物的身份信息,可根据该属性信息确定该图片中的人物。
S72、将至少两张包括人物的图片输入到预先训练好的神经网络模型中,得到至少两张包括人物的图片中每张图片的衣着特征。
S72可以参考上述S301的描述,这里不再赘述。
S73、将得到的所有衣着特征,按照人物划分,得到N个预设的衣着特征组。
结合上面描述可知,在确定出某一图片中的衣着特征后,可以确定该衣着特征与该人物对应。
在执行S72之后,可以将确定出的衣着特征按照人物进行划分,以得到多个衣着特征组,并存储所述多个衣着特征组。可以看出,多个衣着特征组与多个不同的人物一一对应。
示例性的,得到N个衣着特征组,N个衣着特征组与N个不同的人物一一对应。
示例性的,如图9所示,确定出的衣着特征包括:衣着特征a、衣着特征b、衣着特征c、衣着特征d、衣着特征e以及衣着特征f。在获取衣着特征时,获取到每一衣着特征的属性信息。衣着特征a的属性信息包括人物1,衣着特征b的属性信息包括人物2,衣着特征c的属性信息包括人物1,衣着特征d的属性信息包括人物1,衣着特征e的属性信息包括人物2,衣着特征f的属性信息包括人物3。也就是说,衣着特征a、衣着特征c和衣着特征d均与人物1对应,衣着特征b和衣着特征e均与人物2对应,衣着特征f与人物3对应。这样,可以得到三个衣着特征组:衣着特征组1(与人物1对应)、衣着特征组2(与人物2对应)和衣着特征组3(与人物3对应)。衣着特征组1包括衣着特征a、衣着特征c和衣着特征d,由于这三个衣着特征均与人物1对应,因此,衣着特征组1的属性信息也可以包括人物1。衣着特征组2包括衣着特征b和衣着特征e,由于衣着特征b和衣着特征e的属性信息包括人物 2,因此,衣着特征组2的属性信息也可以包括人物2。衣着特征组3包括衣着特征f,由于衣着特征f的属性信息包括人物3,因此,衣着特征组3的属性信息也可以包括人物3。
进一步地可选的,还可以将N个衣着特征组进一步地根据不同的衣着特征进行划分。例如:结合上述图9,如图10所示,将衣着特征组中的衣着特征按照上衣、腿这一区域的衣着、鞋子划分为三个子衣着特征组。这样,存储的衣着特征组还包括多个子衣着特征组。
可选的,本申请实施例中每一衣着特征的属性信息还可以包括该衣着特征所示的衣着的穿戴时间,即该衣着特征所对应的图片的拍摄时间。后续,若用户请求查询第一图片中的人物在某一时间段内的图片时,可以结合每一衣着特征的属性信息,查找并确定结果。
进一步地,若在生成多个衣着特征组后,图库中新增了包括人物1的图片101,则执行 S72,以确定图片101中的衣着特征。之后,将确定出的衣着特征存储于与人物1对应的衣着特征组中,以实现N个衣着特征组的更新。
在实际应用中,用户可能会有:查询在某一天(或者某一时长)中穿戴第一图片中的衣着的人物的需求。这种情况下,除了获取第一图片外,还可以获取查询日期。相应的,本申请实施例提供的人物识别方法为:根据该查询日期和N个预设的衣着特征组,在每个预设的衣着特征组中确定匹配衣着特征。匹配衣着特征的属性信息中包括时间这一信息,所述时间处于用户输入的时长中。这样,最终确定出的人物满足在查询日期内穿戴第一图片中的衣着的条件。
此外,用户还可能会有:需要按照某一个(或者某些)衣着特征进行人物识别的需求。例如:办案人员需要查询头戴荧光绿的鸭舌帽的人物,对其他衣着特征不关注。这样,办案人员可以将用于表示荧光绿的鸭舌帽的衣着特征的权重设置为1,其他衣着特征的权重设置为0。
本申请实施例中的人物识别装置可以为终端。上述S300~S306具体可以是终端执行的, S71~S73也可以是终端执行的。
本申请实施例中的人物识别装置也可以为服务器。上述S300~S306具体可以是服务器执行的,S71~S73也可以是服务器执行的。
此外,本申请实施例提供的人物识别方法还可以是终端与服务器交互实现的。例如:上述S71~S73是服务器执行的,上述S300~S306是终端执行的。
下面结合具体场景对本申请实施例提供的人物识别方法进行描述。
在一种实现方式中,本申请实施例提供的人物识别方法适用于图11所示的应用场景。如图11所示,服务器A预先执行上述S71~S73,生成N个预设的衣着特征组。终端中安装有用于识别人物的客户端A,客户端A与服务器A通信。用户登陆客户端A的管理账户后,输入识别第一图片中目标人物的操作。响应于该操作,客户端A向服务器A发送第一图片(即图11示出的步骤a)。在接收到该第一图片(即获取到第一图片)后,服务器根据预先生成的 N个预设的衣着特征组,确定第一图片中的目标人物(即图11示出的步骤b),并向客户端A 发送该目标人物的信息(即图11示出的步骤c)。也就是说,服务器A执行上述S300~S306。这样,在图11示出的场景中,服务器A执行上述S71~S73,也执行上述S300~S306。服务器 A获取到的第一图片为客户端A发送的图片。
在另一种实现方式中,本申请实施例提供的人物识别方法适用于图12所示的应用场景。如图12所示,服务器A预先执行上述S71~S73,生成N个预设的衣着特征组。终端中安装有用于识别人物的客户端A。在安装客户端A的场景中,N个预设的衣着特征组随之从服务器A发送到终端,并存储在终端中(即终端获取到N个预设的衣着特征组)。在N个预设的衣着特征组中的衣着特征发生变化(如新增或删除)时,客户端A与服务器A通信,用于及时更新终端中存储的衣着特征组。用户在客户端A中输入识别第一图片中的目标人物的操作 (即图12示出的步骤a)后,客户端A根据存储的N个预设的衣着特征组,确定第一图片中的目标人物,并输出(如显示)该目标人物的信息(即图12示出的步骤b)。也就是说,终端执行上述S300~S306。这样,在图12示出的场景中,服务器A执行上述S71~S73,终端执行上述S300~S306。
在另一种实现方式中,本申请实施例提供的人物识别方法适用于图13所示的应用场景。如图13所示,服务器B预先执行上述S71~S73,生成N个预设的衣着特征组。管理人员在该服务器B中输入查询第一图片中的目标人物的信息的操作(即图13示出的步骤a)后,服务器B根据存储的N个预设的衣着特征组,确定第一图片中的目标人物,并输出(如显示) 该目标人物的信息(即图13示出的步骤b)。也就是说,服务器B执行上述S300~S306。这样,在图13示出的场景中,服务器B执行上述S71~S73,也执行上述S300~S306。服务器B 获取到的第一图片为管理人员输入/选择的图片。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对人物识别装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图14所示,为本申请实施例提供的一种人物识别装置的结构示意图。人物识别装置用于根据衣着特征识别第一图片中的人物,例如用于执行图3、图7或图8所示的方法。人物识别装置可以包括获取单元140、处理单元141、存储单元142、确定单元143和计算单元144。
存储单元142,用于存储预先训练好的神经网络模型。上述获取单元140,用于获取第一图片。上述处理单元141,用于将上述获取单元140获取到的第一图片输入到存储单元142 中存储的预先训练好的神经网络模型,得到第一衣着特征。上述确定单元143,用于在N个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征;匹配衣着特征为:当前预设的衣着特征组中与处理单元得到的第一衣着特征之间的相似度最高的衣着特征;每个预设的衣着特征组中的衣着特征包括一个人物在预设时间段内的衣着特征,N为大于或等于2的整数,N个预设的衣着特征组与N个不同的人物一一对应。上述确定单元143,还用于确定第一衣着特征的权重,权重用于表示第一衣着特征与其他衣着特征的区别程度,区别程度越大,第一衣着特征的权重的数值越大。上述计算单元144,根据上述确定单元143 确定出的第一衣着特征的权重以及每个预设的衣着特征组的所有匹配衣着特征,计算得到N 个匹配度,N个匹配度与N个预设的衣着特征组一一对应。上述确定单元143,还用于将上述计算单元144计算出的N个匹配度中数值最高的匹配度确定为目标匹配度,以及将目标衣着特征组所对应的人物确定为目标人物,目标衣着特征组为N个预设的衣着特征组中与目标匹配度对应的衣着特征组。
例如,结合图3,获取单元140可以用于执行S300,处理单元141可以用于执行S301,确定单元143可以用于执行S302、S303、S305、S306,存储单元142用于存储N个预设的衣着特征组。计算单元144用于执行S304。
可选的,上述第一图片为即时拍摄到的,或者,为从已经存储的图片中选取的。
可选的,第一衣着特征为:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
可选的,上述获取单元140,还用于获取至少两张包括人物的图片。上述处理单元141,还用于将上述获取单元140获取到的至少两张包括人物的图片输入到预先训练好的神经网络模型中,得到至少两张包括人物的图片中每张图片的衣着特征;以及用于将得到的所有衣着特征,按照人物划分,得到N个预设的衣着特征组。
例如,结合图8,获取单元140可以用于执行S71,处理单元141可以用于执行S72、S73。
可选的,预先训练好的神经网络模型用于根据输入图片,获得输入图片中人物的衣着特征。
可选的,预先训练好的神经网络模型还用于确定获得的衣着特征的权重。
可选的,上述确定单元143具体用于:将第一图片输入到预先训练好的神经网络模型后,得到第一衣着特征的权重。
作为一个示例,结合图1,人物识别装置中的获取单元140实现的功能与图1中的摄像 293、天线1或天线2的功能相同;处理单元141、确定单元144和计算单元144实现的功能与图1中的处理器214的功能相同;存储单元142实现的功能与图1中的内部存储器221的功能相同。
本实施例中相关内容的解释可参考上述方法实施例,此处不再赘述。
本申请实施例还提供一种芯片系统,如图15所示,该芯片系统包括至少一个处理器1501 和至少一个接口电路1502。处理器1501和接口电路1502可通过线路互联。例如,接口电路 1502可用于从其它装置(例如人物识别装置的存储器)接收信号。又例如,接口电路1502 可用于向其它装置(例如处理器1501)发送信号。示例性的,接口电路1502可读取存储器中存储的指令,并将该指令发送给处理器1501。当所述指令被处理器1501执行时,可使得人物识别装置执行上述实施例中的各个步骤。当然,该芯片系统还可以包含其他分立器件,本申请实施例对此不作具体限定。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在识别装置上运行时,该识别装置执行上述方法实施例所示的方法流程中识别装置执行的各个步骤。
在一些实施例中,所公开的方法可以实施为以机器可读格式被编码在计算机可读存储介质上的或者被编码在其它非瞬时性介质或者制品上的计算机程序指令。
图16示意性地示出本申请实施例提供的计算机程序产品的概念性局部视图,所述计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。
在一个实施例中,计算机程序产品是使用信号承载介质160来提供的。所述信号承载介质160可以包括一个或多个程序指令,其当被一个或多个处理器运行时可以提供以上针对图 3、图7或图8描述的功能或者部分功能。因此,例如,参考图8中S71~S73、S300~S306的一个或多个特征可以由与信号承载介质160相关联的一个或多个指令来承担。此外,图16中的程序指令也描述示例指令。
在一些示例中,信号承载介质160可以包含计算机可读介质161,诸如但不限于,硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等等。
在一些实施方式中,信号承载介质160可以包含计算机可记录介质162,诸如但不限于,存储器、读/写(R/W)CD、R/W DVD、等等。
在一些实施方式中,信号承载介质160可以包含通信介质163,诸如但不限于,数字和/ 或模拟通信介质(例如,光纤电缆、波导、有线通信链路、无线通信链路、等等)。
信号承载介质160可以由无线形式的通信介质163(例如,遵守IEEE 802.11标准或者其它传输协议的无线通信介质)来传达。一个或多个程序指令可以是,例如,计算机可执行指令或者逻辑实施指令。
在一些示例中,本申请实施例描述的人物识别装置可以被配置为,响应于通过计算机可读介质161、计算机可记录介质162、和/或通信介质163中的一个或多个程序指令,提供各种操作、功能、或者动作。
应该理解,这里描述的布置仅仅是用于示例的目的。因而,本领域技术人员将理解,其它布置和其它元素(例如,机器、接口、功能、顺序、和功能组等等)能够被取而代之地使用,并且一些元素可以根据所期望的结果而一并省略。另外,所描述的元素中的许多是可以被实现为离散的或者分布式的组件的、或者以任何适当的组合和位置来结合其它组件实施的功能实体。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line, DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (18)

1.一种人物识别方法,其特征在于,包括:
获取第一图片;
将所述第一图片输入到预先训练好的神经网络模型,得到第一衣着特征;
在N个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征;所述匹配衣着特征为当前预设的衣着特征组中与所述第一衣着特征之间的相似度最高的衣着特征;所述每个预设的衣着特征组的衣着特征包括一个人物在预设时间段内的衣着特征,N为大于或等于2的整数,所述N个预设的衣着特征组与N个不同的人物一一对应;
确定所述第一衣着特征的权重,所述权重用于表示所述第一衣着特征与其他衣着特征的区别程度,所述区别程度越大,所述第一衣着特征的权重的数值越大;
根据所述第一衣着特征的权重以及确定出的所有匹配衣着特征,计算得到N个匹配度,所述N个匹配度与所述N个预设的衣着特征组一一对应;
将所述N个匹配度中数值最高的匹配度确定为目标匹配度;
将目标衣着特征组所对应的人物确定为目标人物,所述目标衣着特征组为所述N个预设的衣着特征组中与所述目标匹配度对应的衣着特征组。
2.根据权利要求1所述的人物识别方法,其特征在于,
所述第一图片为即时拍摄到的,或者,为从已经存储的图片中选取的。
3.根据权利要求1或2所述的人物识别方法,其特征在于,
所述第一衣着特征包括:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
4.根据权利要求1-3中任意一项所述的人物识别方法,其特征在于,所述人物识别方法还包括:
获取至少两张包括人物的图片;
将所述至少两张包括人物的图片输入到所述预先训练好的神经网络模型中,得到所述至少两张包括人物的图片中每张图片的衣着特征;
将得到的所有衣着特征,按照人物划分,得到N个所述预设的衣着特征组。
5.根据权利要求1-4中任意一项所述的人物识别方法,其特征在于,
所述预先训练好的神经网络模型用于根据输入图片,获得所述输入图片中人物的衣着特征。
6.根据权利要求5所述的人物识别方法,其特征在于,
所述预先训练好的神经网络模型还用于确定获得的衣着特征的权重。
7.根据权利要求6所述的人物识别方法,其特征在于,所述确定所述第一衣着特征的权重,包括:
所述将所述第一图片输入到所述预先训练好的神经网络模型后,得到所述第一衣着特征的权重。
8.一种人物识别装置,其特征在于,包括:
获取单元,用于获取第一图片;
处理单元,用于将所述获取单元获取到的所述第一图片输入到存储单元中存储的预先训练好的神经网络模型,得到第一衣着特征;
确定单元,用于在N个预设的衣着特征组的每个预设的衣着特征组的衣着特征中,确定匹配衣着特征;所述匹配衣着特征为当前预设的衣着特征组中与所述处理单元得到的所述第一衣着特征之间的相似度最高的衣着特征;所述每个预设的衣着特征组的衣着特征包括一个人物在预设时间段内的衣着特征,N为大于或等于2的整数,所述N个预设的衣着特征组与N个不同的人物一一对应;
所述确定单元,还用于确定所述第一衣着特征的权重,所述权重用于表示所述第一衣着特征与其他衣着特征的区别程度,所述区别程度越大,所述第一衣着特征的权重的数值越大;
计算单元,根据所述确定单元确定出的所述第一衣着特征的权重以及确定出的所有匹配衣着特征,计算得到N个匹配度,所述N个匹配度与所述N个预设的衣着特征组一一对应;
所述确定单元,还用于将所述计算单元计算出的所述N个匹配度中数值最高的匹配度确定为目标匹配度,以及将目标衣着特征组所对应的人物确定为目标人物,所述目标衣着特征组为所述N个预设的衣着特征组中与所述目标匹配度对应的衣着特征组。
9.根据权利要求8所述的人物识别装置,其特征在于,
所述第一图片为即时拍摄到的,或者,为从已经存储的图片中选取的。
10.根据权利要求8或9所述的人物识别装置,其特征在于,
所述第一衣着特征包括:上衣、裤子、裙子、鞋子、袜子、包、帽子或围巾。
11.根据权利要求8-10中任意一项所述的人物识别装置,其特征在于,
所述获取单元,还用于获取至少两张包括人物的图片;
所述处理单元,还用于将所述获取单元获取到的所述至少两张包括人物的图片输入到所述预先训练好的神经网络模型中,得到所述至少两张包括人物的图片中每张图片的衣着特征;以及用于将得到的所有衣着特征,按照人物划分,得到N个所述预设的衣着特征组。
12.根据权利要求8-11中任意一项所述的人物识别装置,其特征在于,
所述预先训练好的神经网络模型用于根据输入图片,获得所述输入图片中人物的衣着特征。
13.根据权利要求12所述的人物识别装置,其特征在于,
所述预先训练好的神经网络模型还用于确定获得的衣着特征的权重。
14.根据权利要求13所述的人物识别装置,其特征在于,所述确定单元具体用于:
所述将所述第一图片输入到所述预先训练好的神经网络模型后,得到所述第一衣着特征的权重。
15.一种人物识别设备,其特征在于,所述人物识别设备包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;当所述处理器执行所述计算机指令时,所述人物识别设备执行如权利要求1-7中任意一项所述的人物识别方法。
16.一种芯片系统,其特征在于,所述芯片系统应用于电子设备;所述芯片系统包括一个或多个接口电路,以及一个或多个处理器;所述接口电路和所述处理器通过线路互联;所述接口电路用于从所述电子设备的存储器接收信号,并向所述处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令;当所述处理器执行所述计算机指令时,所述电子设备执行如权利要求1-7中任意一项所述的人物识别方法。
17.一种计算机可读存储介质,其特征在于,包括计算机指令,当所述计算机指令在人物识别装置上运行时,使得所述人物识别装置执行如权利要求1-7中任意一项所述的人物识别方法。
18.一种计算机程序产品,其特征在于,包括计算机指令,当所述计算机指令在人物识别装置上运行时,使得所述人物识别装置执行如权利要求1-7中任意一项所述的人物识别方法。
CN201911400680.5A 2019-12-30 2019-12-30 一种人物识别方法及装置 Pending CN113128265A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911400680.5A CN113128265A (zh) 2019-12-30 2019-12-30 一种人物识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911400680.5A CN113128265A (zh) 2019-12-30 2019-12-30 一种人物识别方法及装置

Publications (1)

Publication Number Publication Date
CN113128265A true CN113128265A (zh) 2021-07-16

Family

ID=76768182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911400680.5A Pending CN113128265A (zh) 2019-12-30 2019-12-30 一种人物识别方法及装置

Country Status (1)

Country Link
CN (1) CN113128265A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565894A (zh) * 2022-03-03 2022-05-31 成都佳华物链云科技有限公司 一种工作服装识别方法、装置、电子设备及存储介质
CN117746462A (zh) * 2023-12-19 2024-03-22 深圳职业技术大学 基于互补特征动态融合网络模型的行人重识别方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565894A (zh) * 2022-03-03 2022-05-31 成都佳华物链云科技有限公司 一种工作服装识别方法、装置、电子设备及存储介质
CN117746462A (zh) * 2023-12-19 2024-03-22 深圳职业技术大学 基于互补特征动态融合网络模型的行人重识别方法及装置

Similar Documents

Publication Publication Date Title
CN109814766B (zh) 一种应用显示方法及电子设备
WO2020211701A1 (zh) 模型训练方法、情绪识别方法及相关装置和设备
CN111443884A (zh) 投屏方法、装置和电子设备
CN111061912A (zh) 一种处理视频文件的方法及电子设备
CN111669515B (zh) 一种视频生成方法及相关装置
CN113254409A (zh) 文件共享方法、系统及相关设备
WO2022007707A1 (zh) 家居设备控制方法、终端设备及计算机可读存储介质
CN113971271A (zh) 一种指纹解锁的方法、装置、终端以及存储介质
EP4195073A1 (en) Content recommendation method, electronic device and server
CN113128265A (zh) 一种人物识别方法及装置
WO2020062014A1 (zh) 一种向输入框中输入信息的方法及电子设备
CN114697543B (zh) 一种图像重建方法、相关装置及系统
CN113742460B (zh) 生成虚拟角色的方法及装置
CN112416984B (zh) 一种数据处理方法及其装置
CN114745468A (zh) 电子设备及其主题设置方法和介质
CN113380240B (zh) 语音交互方法和电子设备
CN116527266A (zh) 数据归集方法及相关设备
CN117009005A (zh) 一种显示方法、汽车和电子设备
CN111339513B (zh) 数据分享的方法和装置
CN114971107A (zh) 一种隐私风险反馈方法、装置及第一终端设备
CN114812381A (zh) 电子设备的定位方法及电子设备
CN114093368A (zh) 跨设备声纹注册方法、电子设备及存储介质
CN113867851A (zh) 电子设备操作引导信息录制方法、获取方法和终端设备
CN115437601B (zh) 图像排序方法、电子设备、程序产品及介质
CN114513575B (zh) 一种收藏处理的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination