具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请实施例的用于处理图像的方法或用于处理图像的装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频播放类应用、图像处理类应用、浏览器应用、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持图像显示的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的图像提供支持的后台图像处理服务器。后台图像处理服务器可以对获取的图像(包括视频中的图像帧)进行分析等处理,并将处理结果(例如图像中的目标人物图像表征的人物的身份信息)输出。
需要说明的是,本申请实施例所提供的用于处理图像的方法可以由服务器105执行,也可以由终端设备101、102、103执行,相应地,用于处理图像的装置可以设置于服务器105中,也可以设置于终端设备101、102、103中。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。特别地,在目标图像不需要从远程获取的情况下,上述系统架构可以不包括网络,而只包括终端设备或服务器。
继续参考图2,示出了根据本申请的用于处理图像的方法的一个实施例的流程200。该用于处理图像的方法,包括以下步骤:
步骤201,获取目标图像。
在本实施例中,用于处理图像的方法的执行主体(例如图1所示的服务器或终端设备)可以通过有线连接方式或者无线连接方式从远程或从本地获取目标图像。其中,目标图像包括目标人物图像和场地图像。目标图像可以是预先设置的、待对其进行处理的图像。目标人物图像可以是目标图像中包括的至少一个人物图像中的、由技术人员指定或由上述执行主体选择的人物图像。目标图像可以是单张图像(例如照片),也可以是从视频中提取的、包括目标人物图像和场地图像的图像帧。
步骤202,对目标人物图像进行检测,得到目标人物图像的相关信息。
在本实施例中,基于步骤201中获取的目标图像,上述执行主体可以对目标人物图像进行检测,得到目标人物图像的相关信息。其中,相关信息可以包括但不限于以下至少一种:图像特征信息、位置信息。其中,图像特征信息用于表征目标人物图像指示的人物的外形特征(例如身材、肤色、衣着、头发颜色等特征),位置信息用于表征目标人物图像指示的人物在场地图像表征的场地上的位置(例如当场地为球场时,位置信息可以是在以球场的某角点为原点的坐标系下的坐标)。
具体地,上述执行主体可以采用各种方法检测目标人物图像,得到图像特征信息。例如,可以采用HOG(Histogram of Oriented Gradient,方向梯度直方图)特征提取方法、LBP(Local Binary Patterns,局部二值模式)特征提取方法、神经网络方法等方法对目标人物图像进行检测。
上述位置信息可以由上述执行主体基于目标人物图像在目标图像中的位置和场地图像中的参考位置(例如当场地为球场时,参考位置可以是球场的边线)进行分析得到。作为示例,假设场地图像表征的场地为足球场,上述执行主体可以确定目标人物图像在目标图像中的位置与场地图像包括的各个线条(例如边线、中圈线等)的距离,再根据场地图像的大小与实际场地的大小的比例,计算得到目标人物图像指示的人物在实际场地中的坐标(即位置信息)。
在本实施例的一些可选的实现方式中,上述执行主体可以对目标人物图像在目标图像中的位置进行坐标变换,得到目标人物图像指示的人物在场地图像表征的场地中的位置信息。实践中,通常可以采用透视变换的方法,将目标人物图像在目标图像中的位置映射到完整场地图像中。例如,上述执行主体可以对目标人物图像在目标图像中的位置进行透视变换,得到位置信息,该位置信息可以包括坐标值,坐标值是在完整场地图像上建立的坐标系中的坐标值。
步骤203,基于相关信息,确定目标人物图像的至少一个身份概率值。
在本实施例中,基于步骤202中得到的相关信息,上述执行主体可以确定目标人物图像的至少一个身份概率值。其中,身份概率值对应于人物身份信息。例如,人物身份信息为人物的标识,上述执行主体得到三个身份概率值P1、P2、P3,分别对应的人物身份信息为A、B、C,则P1为目标人物图像指示的人物为A身份的概率,P2为目标人物图像指示的人物为B身份的概率,P3为目标人物图像指示的人物为C身份的概率。
在本实施例中,上述执行主体可以基于上述相关信息,按照各种方式确定目标人物图像的身份概率值。作为示例,目标人物图像的图像特征信息可以是利用预先训练的卷积神经网络得到的特征向量,上述执行主体可以利用用于分类的模型(例如支持向量机、神经网络、逻辑回归模型等),识别该特征向量的类别,得到至少一个类别信息和每个类别信息对应的概率值,类别信息即为人物身份信息,类别信息对应的概率值即为身份概率值。
作为另一示例,上述执行主体可以将相关信息包括的位置信息与预设的位置信息进行比较,根据比较结果,确定目标人物图像的身份概率值。例如,预设的位置信息可以是各个人物身份信息分别表征的人物的初始位置信息,上述执行主体可以将相关信息包括的位置信息与每个初始位置信息进行比较,得到目标人物图像指示的人物的位置与每个初始位置信息指示的位置的距离,根据所得到的距离,确定目标人物图像的身份概率值(例如将距离的倒数确定为身份概率值)。
步骤204,从至少一个身份概率值中,确定最大值对应的人物身份信息作为目标人物图像指示的人物的身份信息。
在本实施例中,上述执行主体可以从步骤203中得到的至少一个身份概率值中,确定最大的身份概率值对应的人物身份信息作为目标人物图像指示的人物的身份信息。作为示例,假设上述执行主体得到三个身份概率值P1、P2、P3,分别对应的人物身份信息为A、B、C,其中P2最大,则目标人物图像指示的人物的身份信息为B。
可选地,上述执行主体可以按照各种方式将所确定的人物身份信息输出。例如,可以在目标图像中的目标人物图像的位置显示身份信息,或者,可以将所确定的身份信息以语音的形式输出。
继续参见图3,图3是根据本实施例的用于处理图像的方法的应用场景的一个示意图。在图3的应用场景中,计算机301首先从预先存储的足球比赛视频中获取包括球员图像和场地图像的某个图像帧作为目标图像302。然后,计算机301对目标图像302中的球员图像3021进行检测,得到球员图像3021的图像特征信息303(例如该图像特征信息表征球员图像3021表征的球员为光头)和的位置信息304(例如“30,45”,表征以足球场的某角点为原点建立的坐标系下的坐标,单位为米)。针对球员图像3021表征的球员所在的球队,预先设置有11个人物身份信息(例如球员编号),其中每个人物身份信息对应本场比赛的上场球员。再然后,计算机301分别基于图像特征信息303得到11个第一接近值305(A1、A2……A11,第一接近值表征球员图像3021与本队其他球员的图像之间的相似度),基于位置信息304,得到11个第二接近值306(B1、B2……B11,第二接近值表征位置信息304指示的位置与本场比赛初始阵型中的各个球员的初始位置的接近程度,例如第二接近值是位置信息304指示的位置与各个初始位置的距离的倒数)。对相同身份信息对应的第一接近值和第二接近值分别进行加权求和,基于加权求和结果,计算(例如将加权求和结果作为指数函数f(x)=e-x的自变量进行计算)得到11个身份概率值307(P1、P2……P11)。其中,每个身份概率值对应球员编号集合308中的一个球员编号。最后,计算机301从11个身份概率值中,确定最大值P1对应的编号“9”作为该球员图像指示的球员的编号,并将编号显示在该球员图像的上方。
本申请的上述实施例提供的方法,通过对获取的目标图像包括的目标人物图像进行检测,得到目标人物图像的特征信息、位置信息等相关信息,再基于相关信息,确定目标人物图像的至少一个身份概率值,最后从至少一个身份概率值中确定最大值,进而得到最大值对应的人物身份信息,从而提高了检测图像中的目标人物图像的准确性,以及丰富了图像处理的手段。
进一步参考图4,其示出了用于处理图像的方法的又一个实施例的流程400。该用于处理图像的方法的流程400,包括以下步骤:
步骤401,获取目标图像。
在本实施例中,步骤401与图2对应实施例中的步骤201基本一致,这里不再赘述。
步骤402,对目标人物图像进行检测,得到目标人物图像的相关信息。
在本实施例中,基于步骤401中获取的目标图像,用于处理图像的方法的执行主体(例如图1所示的服务器或终端设备)可以对目标人物图像进行检测,得到目标人物图像的相关信息。其中,相关信息可以包括但不限于以下至少一种:图像特征信息、位置信息。其中,图像特征信息用于表征目标人物图像指示的人物的外形特征(例如身材、肤色、衣着、头发颜色等特征),位置信息用于表征目标人物图像指示的人物在场地图像表征的场地上的位置(例如当场地为球场时,位置信息可以是在以球场的某角点为原点的坐标系下的坐标)。
步骤403,将目标人物图像的图像特征信息与预设的图像特征信息集合进行匹配,得到目标人物图像对应的至少一个第一接近度。
在本实施例中,上述执行主体可以将目标人物图像的图像特征信息与预设的图像特征信息集合进行匹配,得到目标人物图像对应的至少一个接近度。其中,第一接近度对应于人物身份信息。图像特征信息集合中的图像特征信息可以是预先存储的表征某些人物(例如某球队中的各个球员)的图像特征信息的集合。
在本实施例中,接近度可以用于表征实际数据与预设的参考数据之间的接近程度。上述执行主体可以确定目标人物图像的图像特征信息(即实际数据)和图像信息集合包括的每个图像特征信息(即参考数据)的相似度,将计算得到的相似度作为第一接近度。上述相似度的计算方法可以是现有的各种计算相似度的方法,例如直方图匹配方法、余弦相似度方法等。
在本实施例的一些可选的实现方式中,上述执行主体可以按照如下步骤确定目标人物图像对应的至少一个第一接近度:
首先,确定目标人物图像的图像特征信息与预设的图像特征信息集合中的图像特征信息的相似度,基于所确定的相似度,得到目标人物图像对应的至少一个待处理第一接近度。例如,图像特征信息集合中的图像特征信息是某球队参加比赛的球员的图像的特征信息的集合,则待处理第一接近度可以是目标人物图像的图像特征信息与图像特征信息集合中的其中一个图像特征信息的相似度。上述执行主体可以将所确定的相似度确定为待处理第一接近度;或者根据预设的、表征相似度和接近度第一接近度的对应关系的对应关系表或计算公式,确定目标人物图像对应的至少一个待处理第一接近度。其中的每个待处理第一接近度可以对应于一个人物身份信息。
然后,将所得到的各个待处理第一接近度分别乘以预设的权重值,得到至少一个第一接近度。其中,权重值可以是技术人员预先设置的,也可以是由上述执行主体利用预先训练的概率图模型(例如贝叶斯网络、条件随机场等)所确定的。通过设置权重值,可以调整第一接近度对计算最终的身份概率值的贡献程度,有助于提高计算身份概率值的准确性。
步骤404,获取目标人物图像的关联位置信息。
在本实施例中,上述执行主体可以获取目标人物图像的关联位置信息。其中,关联位置信息可以包括但不限于以下至少一种:预设的、用于指示场地图像表征的场地中的目标位置的目标位置信息,目标图像中的、除目标人物图像以外的其他人物图像的位置信息。
其中,目标位置信息可以是表征场地中的特定位置的信息。例如,假设场地为足球场,目标位置信息可以是上述目标人物图像表征的球员所属球队中的各个球员的初始位置信息,初始位置信息表征该球队的各个球员组成的初始阵型。或者,目标位置信息可以是上述目标人物图像表征的球员所属球队的对方球队中的各个球员的初始位置信息。实践中,上述目标位置信息可以是预先由技术人员设置的先验信息。需要说明的是,关联位置信息的种类不限于上述列举的两种,能够表征目标人物图像的位置与其他位置(例如当场地表征足球场时,其他位置可以是各个球员的跑动范围、球门区域等)的关系的信息,均为关联位置信息。
上述其他人物图像的位置信息的确定方法可以与上述相关信息包括位置信息的确定方法相同,这里不再赘述。
步骤405,确定目标人物图像的至少一个位置关系数据组,以及基于所确定的至少一个位置关系数据组,确定至少一个第二接近度。
在本实施例中,上述执行主体可以首先确定目标人物图像的至少一个位置关系数据组(即实际数据)。其中,位置关系数据用于表征目标人物图像的位置信息与所获取的关联位置信息之间的关系。通常,关联位置信息包括至少一种位置信息,例如步骤404中描述的目标位置信息和其他人物图像的位置信息。其中的每种位置信息对应一个位置关系数据组。一个位置关系数据组包括多个位置关系数据,每个位置关系数据表征上述相关信息包括的位置信息与一个关联位置信息之间的关系。位置关系数据可以是距离数据和/或角度数据。距离数据表征目标人物图像指示的人物的位置与相关位置信息指示的位置之间的距离,角度数据表征目标人物图像指示的人物的位置与相关位置信息指示的位置之间的连续与预设的直线的夹角。位置关系数据组的数量和种类在本申请实施例中不限定,根据现实需要,可以获得任意数量和种类的位置关系数据组。
作为示例,假设场地图像表征足球场,目标人物图像表征某球员,关联位置信息包括表征该球员所属球队中的各个球员的初始位置信息(这里称为第一位置信息),以及目标图像中的其他球员的图像的位置信息(这里称为第二位置信息)。该球员的位置信息指示的位置与各个初始位置信息指示的位置之间的距离可以确定为第一位置关系数据组,该球员的位置信息指示的位置与其他各个球员的位置信息指示的位置之间的距离可以确定为第二位置关系数据组。
然后,上述执行主体可以基于所确定的至少一个位置关系数据组,确定至少一个第二接近度。其中,第二接近度对应于人物身份信息。上述执行主体可以按照各种方法确定至少一个第二接近度。
继续上述足球场的举例,假设得到两个位置关系数据组:A组、B组。其中,A组中的位置关系数据表征某球员的位置信息指示的位置与各个初始位置信息指示的位置之间的距离。B组中的位置关系数据表征该球员的位置信息指示的位置与目标图像中的其他人物图像表征的球员的位置之间的距离。对于A组中的每个距离,可以计算该距离的倒数作为A组的第二接近度。对于B组中的每个距离,如果该距离指示的人物图像的身份信息(例如将该距离指示的人物图像的各个身份概率值中的最大值对应的人物身份信息确定为该距离指示的人物图像的身份信息)已知,可以基于预设的、表征人物身份信息之间的对应关系(如两队球员的盯防关系、本队球员之间的初始站位关系)的对应关系表,计算(例如计算该距离的倒数或根据预设的表征距离与概率值的公式对该距离进行计算得到的数值作为第二接近度,该第二接近度对应的人物身份信息是从对应关系表中确定的、与该距离指示的人物图像的身份信息对应的人物身份信息)得到该距离对应的第二接近度;如果该距离指示的人物图像的身份信息未知,可以设置该距离对应的第二接近度为零或其他预设数值。从A组的第二接近度和B组的第二接近度中,将相同的人物身份信息对应的第二接近度相加,得到目标人物图像的第二接近度。
在本实施例的一些可选的实现方式中,上述执行主体可以按照如下步骤确定目标图像的至少一个第二接近度:
步骤一,对于所确定的至少一个位置关系数据组中的位置关系数据组,基于预设的与该位置关系数据组对应的处理方式,对该位置关系数据组包括的位置关系数据进行处理,得到位置关系数据对应的概率值作为待处理第二接近度。其中,待处理第二接近度对应于人物身份信息。再基于预设的、位置关系数据组与权重值的对应关系,确定该位置关系数据组包括的位置关系数据对应的待处理第二接近度的权重值。
其中,每个位置关系数据组可以对应于一个处理方式,每个处理方式可以对应于一段程序,上述执行主体可以根据技术人员的指定执行相应的程序,或根据预设的、位置关系数据组的标识与各段程序的对应关系,自动选择执行相应的程序。
在本实施例的一些可选的实现方式中,位置关系数据组对应的处理方式可以包括但不限于以下至少一种:
方式一:当位置关系数据组中的位置关系数据表征目标人物图像的位置信息指示的位置与目标位置信息指示的位置之间的距离时,基于距离,确定至少一个第二接近度。通常,目标位置信息的数量可以是至少一个,则确定的第二接近度的数量也为至少一个(即每个距离对应一个第二接近度)。作为示例,上述执行主体可以将距离的倒数作为第二接近度,或根据预设的公式对距离进行计算得到的数值作为待处理第二接近度。例如,上述预设的公式为归一化公式:X=(X-Xmin)/(Xmax-Xmin),其中,X为第二接近度,Xmin为距离的最小值,Xmax为距离的最大值。
方式二,当位置关系数据组中的位置关系数据表征目标人物图像的位置信息指示的位置与目标图像中的、除目标人物图像以外的其他人物图像的位置信息指示的位置之间的距离时,对于各个距离中的距离,确定该距离对应的人物图像的人物身份信息是否已知。如果已知,基于该距离和预设的、人物身份信息之间的对应关系(例如,假设人物身份信息表征足球运动员的编号,对应关系可以是两队球员的盯防关系),计算得到该距离对应的第二接近度。作为示例,上述执行主体可以计算该距离的倒数作为第二接近度,或根据上述方式一中描述的公式对该距离进行计算得到的数值作为第二接近度,该第二接近度对应的人物身份信息是从对应关系表中确定的、与该距离对应的人物图像的人物身份信息对应的人物身份信息。如果该距离对应的人物图像的人物身份信息未知,设置该距离对应的第二接近度为零或其他预设数值。
作为示例,假设场地图像表征足球场,目标人物图像表征某球员,得到两个位置关系数据组,分别是A组和B组,其中,A组中的位置关系数据表征某球员的位置信息指示的位置与各个初始位置信息指示的位置(即每个人物身份信息对应的初始位置)之间的距离。B组中的位置关系数据表征该球员的位置信息指示的位置与目标图像中的其他人物图像表征的球员的位置之间距离。A组对应的处理方式是:将距离的倒数作为待处理第二接近度。B组对应的处理方式是:对于各个距离中的每个距离,如果该距离对应的人物图像的人物身份信息已知,可以基于预设的、表征场上两队球员的盯防关系的对应关系表,计算(例如计算该距离的倒数作为第二接近度,该第二接近度对应的人物身份信息是从对应关系表中确定的、与该距离对应的人物图像的身份信息对应的人物身份信息)得到该距离对应的第二接近度;如果该距离对应的人物图像的人物身份信息未知,可以设置该距离对应的第二接近度为零或其他预设数值。
步骤二,基于所确定的权重值,对相同的人物身份信息对应的待处理第二接近度进行加权求和,得到第二接近度。作为示例,假设上述A组对应权重值α1,B组对应权重值α2,则针对A组计算得到的各个待处理第二接近度均乘以α1,针对B组计算得到的各个待处理第二接近度均乘以α2,再将相同的人物身份信息对应的、乘以权重值后所得的结果相加,得到第二接近度。
通过设置权重值,可以调整不同的位置关系数据组对计算身份概率值的贡献程度,从而可以提高计算身份概率值的准确性。
需要说明的是,本实现方式和上述确定第一接近度的实现方式中的权重值可以是技术人员预先设置的,也可以是由上述执行主体利用预先训练的概率图模型(例如贝叶斯网络、条件随机场等)所确定的。其中,概率图模型(Probabilistic Graphical Model,PGM)是一类用图来表达变量相关关系的概率模型。概率图模型以图为表示工具,如一个结点表示一个或一组随机变量(例如一个结点表征一个人物图像),结点之间的边表示变量间的概率相关关系(例如根据一个人物图像的身份信息得到另一个人物图像的身份信息的概率),即变量关系图。概率图模型是目前广泛研究和应用的公知技术,在此不再赘述。
步骤406,基于所得到的第一接近度和第二接近度,计算得到目标人物图像的至少一个身份概率值。
在本实施例中,上述执行主体可以基于所得到的第一接近度和第二接近度,计算得到目标人物图像的至少一个身份概率值。作为示例,上述执行主体可以将相同的人物身份信息对应的第一接近度和第二接近度进行求和或加权求和,再将求和或加权求和所得到的结果作为预设的函数(例如指数函数f(x)=e-x)的自变量x,将指数函数的函数值作为身份概率值。
作为另一示例,上述执行主体可以利用预先训练的概率图模型(例如随机向量场),对第一接近度和第二接近度进行处理(例如将第一接近度和第二接近度作为条件随机场所用到的条件概率公式的输入),得到至少一个身份概率值。
步骤407,从至少一个身份概率值中,确定最大值对应的人物身份信息作为目标人物图像指示的人物的身份信息。
在本实施例中,步骤406与图2对应实施例中的步骤204基本一致,这里不再赘述。
从图4中可以看出,与图2对应的实施例相比,本实施例中的用于处理图像的方法的流程400突出了确定第一接近度和第二接近度,以及基于第一接近度和第二接近度得到身份概率值的步骤,从而有效地利用了与目标人物图像的位置信息相关的各种关联位置信息以确定目标人物图像的身份信息,进一步提高了确定身份信息的准确性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于处理图像的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于处理图像的装置500包括:获取单元501,被配置成获取目标图像,其中,目标图像包括目标人物图像和场地图像;检测单元502,被配置成对目标人物图像进行检测,得到目标人物图像的相关信息,其中,相关信息包括以下至少一种:图像特征信息、位置信息,图像特征信息用于表征目标人物图像指示的人物的外形特征,位置信息用于表征目标人物图像指示的人物在场地图像表征的场地上的位置;第一确定单元503,被配置成基于相关信息,确定目标人物图像的至少一个身份概率值,其中,身份概率值对应于人物身份信息;第二确定单元504,被配置成从至少一个身份概率值中,确定最大值对应的人物身份信息作为目标人物图像指示的人物的身份信息。
在本实施例中,获取单元501可以通过有线连接方式或者无线连接方式从远程或从本地获取目标图像。其中,目标图像包括目标人物图像和场地图像。目标图像可以是单张图像(例如照片),也可以是从视频中提取的、包括目标人物图像和场地图像的图像帧。
在本实施例中,基于获取单元501获取的目标图像,上述检测单元502可以对目标人物图像进行检测,得到目标人物图像的相关信息。其中,相关信息可以包括但不限于以下至少一种:图像特征信息、位置信息。其中,图像特征信息用于表征目标人物图像指示的人物的外形特征(例如身材、肤色、衣着、头发颜色等特征),位置信息用于表征目标人物图像指示的人物在场地图像表征的场地上的位置(例如当场地为球场时,位置信息可以是在以球场的某角点为原点的坐标系下的坐标)。
具体地,上述检测单元502可以采用各种方法检测目标人物图像,得到图像特征信息。例如,可以采用HOG(Histogram of Oriented Gradient,方向梯度直方图)特征提取方法、LBP(Local Binary Patterns,局部二值模式)特征提取方法、神经网络方法等方法对目标人物图像进行检测。
在本实施例中,基于检测单元502得到的相关信息,上述第一确定单元503可以确定目标人物图像的至少一个身份概率值。其中,身份概率值对应于人物身份信息。例如,人物身份信息为人物的标识,上述执行主体得到三个身份概率值P1、P2、P3,分别对应的人物身份信息为A、B、C,则P1为目标人物图像指示的人物为A的概率,P2为目标人物图像指示的人物为B的概率,P3为目标人物图像指示的人物为C的概率。
在本实施例中,上述第一确定单元503可以基于上述相关信息,按照各种方式确定目标人物图像的身份概率值。作为示例,目标人物图像的图像特征信息可以是利用预先训练的卷积神经网络得到的特征向量,上述第一确定单元503可以利用用于分类的模型(例如支持向量机、神经网络、逻辑回归模型等),识别该特征向量的类别,得到至少一个类别信息和每个类别信息对应的概率值作为身份概率值。
在本实施例中,第二确定单元504可以从至少一个身份概率值中,确定最大值对应的人物身份信息作为目标人物图像指示的人物的身份信息。作为示例,假设上述执行主体得到三个身份概率值P1、P2、P3,分别对应的人物身份信息为A、B、C,其中P2最大,则目标人物图像指示的人物的身份信息为B。可选地,上述第二确定单元504可以按照各种方式将所确定的人物身份信息输出。例如,可以在目标图像中的目标人物图像的位置显示身份信息,或者,可以将所确定的身份信息以语音的形式输出。
在本实施例的一些可选的实现方式中,检测单元502可以进一步被配置成:对目标人物图像在目标图像中的位置进行坐标变换,得到目标人物图像指示的人物在场地图像表征的场地中的位置信息。
在本实施例的一些可选的实现方式中,第一确定单元503可以包括:匹配模块(图中未示出),被配置成将目标人物图像的图像特征信息与预设的图像特征信息集合进行匹配,得到目标人物图像对应的至少一个第一接近度,其中,第一接近度对应于人物身份信息;获取模块(图中未示出),被配置成获取目标人物图像的关联位置信息,其中,关联位置信息包括以下至少一种:预设的、用于指示场地图像表征的场地中的目标位置的目标位置信息,目标图像中的、除目标人物图像以外的其他人物图像的位置信息;确定模块(图中未示出),被配置成确定目标人物图像的至少一个位置关系数据组,以及基于所确定的至少一个位置关系数据组,确定至少一个第二接近度,其中,位置关系数据用于表征目标人物图像的位置信息与所获取的关联位置信息之间的关系,第二接近度对应于人物身份信息;计算模块(图中未示出),被配置成基于所得到的第一接近度和第二接近度,计算得到目标人物图像的至少一个身份概率值。
在本实施例的一些可选的实现方式中,匹配模块可以包括:确定子模块(图中未示出),被配置成确定目标人物图像的图像特征信息与预设的图像特征信息集合中的图像特征信息的相似度,基于所确定的相似度,得到目标人物图像对应的至少一个概率值作为待处理第一接近度;第一计算子模块(图中未示出),被配置成将所得到的各个待处理第一接近度分别乘以预设的权重值,得到至少一个第一接近度。
在本实施例的一些可选的实现方式中,确定模块包括:处理子模块(图中未示出),被配置成对于所确定的至少一个位置关系数据组中的位置关系数据组,基于预设的与该位置关系数据组对应的处理方式,对该位置关系数据组包括的位置关系数据进行处理,得到位置关系数据对应的概率值作为待处理第二接近度,其中,待处理第二接近度对应于人物身份信息;基于预设的、位置关系数据组与权重值的对应关系,确定该位置关系数据组包括的位置关系数据对应的待处理第二接近度的权重值;第二计算子模块(图中未示出),被配置成基于所确定的权重值,对相同的人物身份信息对应的待处理第二接近度进行加权求和,得到第二接近度。
在本实施例的一些可选的实现方式中,位置关系数据组对应的处理方式可以包括但不限于以下至少一种:
方式一,当位置关系数据组中的位置关系数据表征目标人物图像的位置信息指示的位置与目标位置信息指示的位置之间的距离时,基于距离,确定至少一个第二接近度。
方式二,当位置关系数据组中的位置关系数据表征目标人物图像的位置信息指示的位置与目标图像中的、除目标人物图像以外的其他人物图像的位置信息指示的位置之间的距离时,对于各个距离中的距离,确定该距离对应的人物图像的人物身份信息是否已知;响应于确定已知,基于该距离和预设的、人物身份信息之间的对应关系,计算得到该距离对应的第二接近度;响应于确定未知,设置该距离对应的第二接近度预设数值。
本申请的上述实施例提供的装置,通过对获取的目标图像包括的目标人物图像进行检测,得到目标人物图像的特征信息、位置信息等相关信息,再基于相关信息,确定目标人物图像的至少一个身份概率值,最后从至少一个身份概率值中确定最大值,进而得到最大值对应的人物身份信息,从而提高了检测图像中的目标人物图像的准确性,以及丰富了图像处理的手段。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、检测单元、第一确定单元和第二确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标图像的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标图像,其中,目标图像包括目标人物图像和场地图像;对目标人物图像进行检测,得到目标人物图像的相关信息,其中,相关信息包括以下至少一种:图像特征信息、位置信息,图像特征信息用于表征目标人物图像指示的人物的外形特征,位置信息用于表征目标人物图像指示的人物在场地图像表征的场地上的位置;基于相关信息,确定目标人物图像的至少一个身份概率值,其中,身份概率值对应于人物身份信息;从至少一个身份概率值中,确定最大值对应的人物身份信息作为目标人物图像指示的人物的身份信息。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。