CN107463659A - 物体搜索方法及其装置 - Google Patents
物体搜索方法及其装置 Download PDFInfo
- Publication number
- CN107463659A CN107463659A CN201710640090.4A CN201710640090A CN107463659A CN 107463659 A CN107463659 A CN 107463659A CN 201710640090 A CN201710640090 A CN 201710640090A CN 107463659 A CN107463659 A CN 107463659A
- Authority
- CN
- China
- Prior art keywords
- scene
- search
- searched
- information
- models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Length Measuring Devices By Optical Means (AREA)
Abstract
本发明提出一种物体搜索方法及其装置,其中,方法包括:获取待搜索物体的搜索信息;通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型;对3D模型中的物体进行识别,得到每个物体的识别结果;将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示;其中,目标物体为待搜索物体。该方法,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
Description
技术领域
本发明涉及终端设备领域,尤其涉及一种物体搜索方法及其装置。
背景技术
目前,应用程序对物体进行搜索都是在二维图像上进行的,即预先获取待搜索物体的二维图片,基于二维图片与待搜索物体进行匹配,得到识别结果。这种方式下,物体识别的准确性较低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种物体搜索方法,以实现对3D物体的识别,使得识别结果更加精准,并且在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验,以解决现有应用程序对物体进行搜索都是在二维图像上进行的,即预先获取待搜索物体的二维图片,基于二维图片与待搜索物体进行匹配,得到识别结果,使得物体识别的准确性较低的问题。
本发明的第二个目的在于提出一种物体搜索装置。
本发明的第三个目的在于提出一种终端设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种物体搜索方法,包括:
获取待搜索物体的搜索信息;
通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
对所述3D模型中的物体进行识别,得到每个物体的识别结果;
将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
本发明实施例的物体搜索方法,通过获取待搜索物体的搜索信息,而后通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型,进而可以对3D模型中的物体进行识别,得到每个物体的识别结果,最后将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示。本实施例中,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
为达上述目的,本发明第一方面实施例提出了一种物体搜索装置,包括:
第一获取模块,用于获取待搜索物体的搜索信息;
第二获取模块,用于通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
第三获取模块,用于对所述3D模型中的物体进行识别,得到每个物体的识别结果;
第四获取模块,用于将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
本发明实施例的物体搜索装置,通过获取待搜索物体的搜索信息,而后通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型,进而可以对3D模型中的物体进行识别,得到每个物体的识别结果,最后将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示。本实施例中,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
为达上述目的,本发明第三方面实施例提出了一种终端设备,包括存储器及处理器,所述存储器中储存有计算机可读指令,所述指令被所述处理器执行时,使得所述处理器执行如本发明第一方面实施例所述的物体搜索方法。
为达上述目的,本发明第四方面实施例提出了一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行如第一方面实施例所述的物体搜索方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种物体搜索方法的流程示意图;
图2为本发明实施例提供的不同形式的结构光的示意图;
图3为本发明实施例中一个投射结构光的装置组合示意图;
图4为本发明实施例提供的另一种物体搜索方法的流程示意图;
图5为本发明实施例中非均匀的结构光的投影集合示意图;
图6为本发明实施例所提供的一种物体搜索装置的结构示意图;
图7为本发明实施例所提供的另一种物体搜索装置的结构示意图;
图8为一个实施例中图像处理电路的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面参考附图描述本发明实施例的物体搜索方法及其装置。
图1为本发明实施例提供的一种物体搜索方法的流程示意图。
如图1所示,该物体搜索方法包括以下步骤:
步骤101,获取待搜索物体的搜索信息。
本发明实施例中,待搜索物体为需要搜索的物体,搜索信息即为与待搜索物体相关的信息,例如可以为待搜索物体的名称、颜色和/或大小等。比如待搜索物体为钥匙时,搜索信息可以为黑色的方头钥匙。
本发明实施例的物体搜索方法,可以应用于终端设备上,该终端设备可以为智能手机、平板电脑、ipad等。终端设备上可以安装有应用程序,通过应用程序可以获取用户输入的待搜索物体的搜索信息。
具体地,应用程序的显示页面可以具有文本输入框,而后用户可以通过该文本框输入文本信息,该文本信息即为搜索信息。或者,应用程序的显示页面可以具有拾音装置,例如为麦克风,用户可以通过该拾音装置输入语音信息,该语音信息即为搜索信息。
步骤102,通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型。
结构光(Structured Light)为投射特定的光到物体表面,由于物体表面是凹凸不平的,物体表面的变化以及可能的间隙会对照射来的光进行调制,再将调制后的光发射出去。摄像头采集该物体表面所反射的光,采集的反射光在摄像头中成像,所成图像上会携带光的畸变信息。一般情况下,光的畸变程度与物体上各特征点的深度呈正比。进一步地,可以根据图像中携带的畸变信息计算出物体上各个特征点深度信息等,进而结合摄像头采集的颜色信息,能够完成对物体的三维空间的复原。
作为一种示例,生成结构光的设备可以是将光点、线、光栅、格网或斑纹投影到被测的物体表面上的投影设备或仪器,也可以是生成激光束的激光器。如图2所示,不同结构光的设备可以形成不同形式的结构光。
本发明实施例的物体搜索方法,可以应用于终端设备上,该终端设备可以为智能手机、平板电脑、ipad等。终端设备上可以安装有应用程序,通过应用程序可以调用生成结构光的设备,本发明实施例记为投射装置,然后由投射装置向待搜索物体所在的场景发出结构光。当结构光照射到待搜索物体所在的场景之后,由于场景中的各个物体的表面并不是平整的,所以场景中的各个物体在对结构光进行反射时,会造成结构光的畸变。进一步地,由终端设备上的摄像头采集反射的结构光,进而在摄像头中的图像传感器上形成携带有畸变信息的二维图像。由于所形成的图像中包括场景中各个物体上各特征点的深度信息,进而可以根据深度信息形成场景中各个物体的深度图像,根据场景中各个物体的深度图像重新建立场景的3D模型。
优选地,本发明实施例中的摄像头可以为终端的前置摄像头。由此,当用户拿起终端,并将终端面向场景时,可调用终端的投射装置和前置摄像头完成对该场景的3D模型的获取。
作为一种示例,图3为本发明实施例中一个投射结构光的装置组合示意图。图3中仅以结构光的投影集合为线的集合进行示例,对于投影集合为散斑图案的结构光的原理类似。如图3所示,该装置中可以包括光学投射器和摄像机,其中,光学投射器将一定模式的结构光投射于被测场景所处的空间内,在场景中各个物体的表面上形成由物体表面的形状所调制的光条的三维图像。该三维图像由处于另一位置的摄像机探测,从而获得畸变的光条二维图像。光条的畸变程度取决于光学投射器与摄像机之间的相对位置和各个物体表面的轮廓,直观上,沿光条显示出的位移(或偏移)与各个物体表面的高度成比例,扭曲表示了平面的变化,不连续显示了各个物体表面的物理间隙,当光学投射器与摄像机之间的相对位置一定时,由畸变的光条二维图像坐标即可重现场景中各个物体表面的三维轮廓,即获得场景的3D模型。
作为一种示例,可以采用公式(1)计算获得场景的3D模型,其中,公式(1)如下所示:
其中,(x,y,z)为获取的场景的3D模型的坐标,b为投射装置与摄像头之间的基线间距,F为摄像头的焦距,θ为投射装置向该场景所处的空间投射预设的结构光时的投影角度,(x',y')为带有结构光的场景的二维畸变图像的坐标。
步骤103,对3D模型中的物体进行识别,得到每个物体的识别结果。
其中,识别结果可以包括物体的名称、颜色、大小等信息。
由于每个物体均具有深度信息,因此,可以根据场景的3D模型中的每个物体的深度信息,对其进行识别,从而可以得到每个物体的识别结果。
具体实现时,本实施例可以通过预先采集各类物体的深度信息作为样本数据,而后利用所述样本数据训练得到用于对物体进行识别的识别模型。从而在确定各个物体的深度信息后,可以将各个物体的深度信息输入到识别模型中进行识别,得到每个物体的识别结果,易于实现且操作简单,能够有效提升物体识别的效率。
步骤104,将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示;其中,目标物体为待搜索物体。
具体实现时,可以将搜索信息进行分词处理,获取搜索信息的词法信息。同样,可以对各物体的识别结果进行分词处理,获取个物体的识别结果的词法信息。而后,将搜索信息的词法信息与各物体的识别结果的词法信息进行语义匹配,得到搜索信息与各物体的匹配度,进而可以将匹配度最高的物体作为目标物体,提升识别的精确度。
或者,可以将搜索信息的关键字与各物体的识别结果中的关键字进行匹配,得到搜索信息与各物体的匹配度,进而可以将匹配度最高的物体作为目标物体,提升识别的精确度。
在确定目标物体后,可以在目标物体所在的位置处,标记显示该目标物体,例如,可以将目标物体通过框图标记出来,或者将目标物体所在位置进行闪烁,从而能够便于用户查看匹配结果,使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
举例而言,用户在应用程序中输入的搜索信息可以为:矮方凳,识别结果可以为高方凳、矮方凳、矮长凳、茶几、液晶电视等。通过对搜索信息进行分词处理,可以得到搜索信息的词法信息为:<矮、方、凳>,对每个物体的识别结果进行分词处理,可以得到每个物体的识别结果的词法信息为:<高、方、凳>、<矮、长、凳>、<矮、圆、凳>等,将搜索信息的词法信息与各物体的识别结果的词法信息进行语义匹配,可以得到与搜索信息匹配度最高的物体为:矮方凳,则矮方凳即为目标物体,而后可以将其在场景的3D模型中标记显示,在3D模型中将矮方凳闪烁显示,使用户直观化获知待搜索物体的具体位置,提升用户体验。
本发明实施例的物体搜索方法,通过获取待搜索物体的搜索信息,而后通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型,进而可以对3D模型中的物体进行识别,得到每个物体的识别结果,最后将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示。本实施例中,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
为了更加清楚地说明本发明实施例中利用结构光获取场景中各物体的3D模型的具体实现过程,本发明实施例提出了另一种物体搜索方法的流程示意图,图4为本发明实施例提供的另一种物体搜索方法的流程示意图。
如图4所示,该物体搜索方法包括以下步骤:
步骤401,采集各类物体的深度信息作为样本数据。
步骤402,利用样本数据训练得到用于对物体进行识别的识别模型。
本实施例中,采集各类物体的深度信息作为样本数据,利用样本数据训练得到用于对物体进行识别的识别模型,能够提升该方法的适用性。
步骤403,获取待搜索物体的搜索信息。
步骤403的执行过程可以参见上述实施例,在此不再赘述。
步骤404,向场景发射结构光。
终端设备上可以安装有应用程序,通过应用程序可以调用生成结构光的设备,本发明实施例记为投射装置,然后由投射装置向场景发出结构光。
步骤405,采集结构光在场景中各个物体上的发射光,并形成场景的深度图像。
当向场景发射的结构光到达场景中的各个物体之后,由于各个物体的表面会对结构光造成阻碍,结构光会在各个物体处发生反射,此时,可以通过终端中设置的摄像头对结构光在各个物体上的反射光进行采集,通过采集到的反射光可以形成包括各个物体的场景的深度图像。
步骤406,基于各个物体的深度图像重构场景的3D模型。
具体的,包括各个物体的场景的深度图像中可能包括各个物体和背景,首先对深度图像进行去噪处理及平滑处理,来获取各个物体所在区域的图像,进而通过前后景分割等处理,将各个物体与背景图分割。
在将各个物体从深度图像中提取出来后,即可从各个物体的深度图像中提取密集点数据,进而根据提取的密集点数据,将这些密集点连接成网络。比如根据各个点在空间上的距离关系,将相同平面的点,或者距离在阈值范围内的点连接成三角形网络,进而将这些网络进行拼接,就可以生成只包括各个物体的场景的3D模型。
步骤407,从3D模型中提取各个物体的深度信息。
由步骤406可知,对场景的深度图像进行处理后,场景的深度图像中只包括各个物体的深度图像。进而可以根据3D模型中各个物体的轮廓,确定出每个物体对应的密集点数据,从而能够从场景的深度图像中提取每个物体的深度图像,获取各个物体的深度信息。
步骤408,将提取到的各个物体的深度信息输入到识别模型中进行识别,得到各个物体的识别概率。
可选地,将提取到的各个物体的深度信息输入到识别模型中进行识别,得到各个物体的识别概率,易于实现且操作简单,能够有效提升物体识别的效率。
步骤409,针对每个物体,将识别概率最高的识别结果作为物体的识别结果。
可选地,针对每个物体,将所述识别概率最高的识别结果作为所述物体的识别结果,能够有效提升识别结果的准确性。
步骤410,将场景下每个物体的识别结果显示给用户。
本步骤中,将场景下每个物体的识别结果显示给用户,能够便于用户查看识别结果,使得用户更加直观地了解场景下的每个物体,提升用户体验。
步骤411,将搜索信息的关键字与各物体识别结果中的关键字进行匹配,得到与各物体的匹配度。
具体实现时,可以利用现有技术提取搜索信息的关键字以及各物体识别结果中的关键字,进而将提取后的搜索信息的关键字与各物体识别结果中的关键字进行语义匹配,得到搜索信息与各物体的匹配度。
步骤412,将匹配度最高的第一物体作为目标物体。
可选地,将匹配度最高的第一物体作为目标物体,能够提升识别的精确度。
作为一种示例,可以通过另一个摄像头采集场景的色彩图像,然后根据该色彩图像为场景的3D模型填充颜色,进而获取到携带色彩信息的3D模型,从而能够从3D模型中获取到每个物体的颜色。
举例而言,用户在应用程序中输入的搜索信息可以为:白色矮方凳,识别结果可以为白色高方凳、白色矮方凳、黑色矮长凳、白色矮圆凳、黑色茶几、黑色液晶电视等。通过对搜索信息进行关键字提取,可以得到搜索信息的关键字为:<白色、矮、方、凳>,对每个物体的识别结果进行关键字提取,可以得到每个物体的识别结果的关键字为:<白色、高、方、凳>、<白色、矮、方、凳>、<黑色、矮、长、凳>、<白色、矮、圆、凳>等,将搜索信息的关键字与各物体的识别结果的关键字进行语义匹配,可以得到与搜索信息匹配度最高的物体为:白色矮方凳,则白色矮方凳即为目标物体,而后可以将其在场景的3D模型中标记显示,在3D模型中将白色矮方凳闪烁显示,使用户直观化获知待搜索物体的具体位置,提升用户体验。
步骤413,在目标物体所在位置处,标记显示目标物体。
在确定目标物体后,可以在目标物体所在的位置处,标记显示该目标物体,例如,可以将目标物体通过框图标记出来,或者将目标物体所在位置进行闪烁,从而能够便于用户查看匹配结果,使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
本实施例的物体搜索方法,通过获取待搜索物体的搜索信息,而后通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型,进而可以对3D模型中的物体进行识别,得到每个物体的识别结果,最后将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示。本实施例中,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
此处需要说明的是,作为一种示例,上述实施例中采用的结构光可以为非均匀的结构光,非均匀的结构光为多个光斑的集合构成的散斑图案或乱点图案。
图5为本发明实施例中非均匀的结构光的投影集合示意图。如图5所示,本发明实施例中采用的是非均匀的结构光,其中,非均匀的结构光为随机排列非均匀的散斑图案,也就是说,该非均匀的结构光为多个光斑的集合,且多个光斑之间采用不均匀的分散方式排布,进而构成一个散斑图案。由于散斑图案所占的存储空间较小,因而,投射装置运行时不会对终端的运行效率造成太大影响,能够节约终端的存储空间。
此外,本发明实施例中采用的散斑图案,相较于其他现有的结构光类型而言,散列排布能够降低能量消耗,节省电量,提高终端的续航能力。
在本发明实施例中,可以在电脑、手机、掌上电脑等终端中设置投射装置和摄像头。投射装置向场景发射非均匀的结构光即散斑图案。具体地,可以利用投射装置中的衍射光学元件形成散斑图案,其中,该衍射光学元件上设置有一定数量的浮雕,不规则的散斑图案就由衍射光学元件上不规则的浮雕产生。本发明实施例中,浮雕凹槽深度和数量可以通过算法设置。
其中,投射装置可以用于向待搜索物体所在的场景所处的空间投射一个预设的散斑图案。摄像头可以用于对已投射散斑图案的场景进行采集,以得到带有散斑图案的场景的二维畸变图像。
本发明实施例中,当终端的摄像头对准场景时,终端中的投射装置可以向场景所处的空间投射预设的散斑图案,该散斑图案中具有多个散斑点,当该散斑图案被投射到场景中各个物体的表面上时,该散斑图案中的好多散斑点会由于场景中各个物体的表面的各个突起的原因而发生偏移。通过终端的摄像头对场景中的各个物体进行采集,得到带有散斑图案的包括各个物体的场景的二维畸变图像。
进一步地,将采集到的场景的散斑图像与参考散斑图像按照预定算法进行图像数据计算,获取场景的散斑图像的各个散斑点相对于参考散斑点的移动距离。最后根据该移动距离、参考散斑图像与终端上摄像头的距离以及投射装置与摄像头之间的相对间隔值,利用三角法得到散斑红外图像的各个散斑点的深度值,并根据该深度值得到场景的深度图像,进而根据深度图像可获得场景的3D模型。
图6为本发明实施例所提供的一种物体搜索装置的结构示意图。
参见图6,该物体搜索装置包括:第一获取模块601、第二获取模块602、第三获取模块603,以及第四获取模块604。其中,
第一获取模块601,用于获取待搜索物体的搜索信息。
具体实现时,第一获取模块601,具体用于接收用户通过屏幕输入的搜索信息;或者,接收用户通过拾音装置输入的搜索信息。
第二获取模块602,用于通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型。
第三获取模块603,用于对3D模型中的物体进行识别,得到每个物体的识别结果。
第四获取模块604,用于将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示;其中,目标物体为待搜索物体。
进一步地,在本发明实施例的一种可能的实现方式中,在图6的基础上,参见图7,该物体搜索装置还进一步包括:
采集模块605,用于在获取待搜索物体的搜索信息之前,采集各类物体的深度信息作为样本数据。
训练模块606,用于利用样本数据训练得到用于对物体进行识别的识别模型。
作为本发明实施例的一种可能的实现方式,第三获取模块603,具体用于从3D模型中提取各个物体的深度信息;将提取到的各个物体的深度信息输入到识别模型中进行识别,得到各个物体的识别概率;针对每个物体,将识别概率最高的识别结果作为物体的识别结果。
显示模块607,用于将场景下每个物体的识别结果显示给用户。
作为本发明实施例的一种可能的实现方式,第四获取模块604,具体用于将搜索信息的关键字与各物体识别结果中的关键字进行匹配,得到与各物体的匹配度;将匹配度最高的第一物体作为目标物体;在目标物体所在位置处,标记显示目标物体。
具体实现时,第二获取模块602,具体用于向场景发射结构光;采集结构光在场景中各个物体上的发射光,并形成各个物体的深度图像;其中发射光中携带用于对场景进行3D重构的重构信息;基于重构信息重构场景的3D模型。
其中,结构光为非均匀的结构光,非均匀的结构光为多个光斑的集合构成的散斑图案或乱点图案,是由设置在终端上的投射装置中的衍射光学元件形成的,其中,衍射光学元件上设置有一定数量的浮雕,浮雕的凹槽深度不同。
需要说明的是,前述图1-图5实施例对物体搜索方法实施例的解释说明也适用于该实施例的物体搜索装置,此处不再赘述。
本实施例的物体搜索装置,通过获取待搜索物体的搜索信息,而后通过结构光对待搜索物体所在的场景进行扫描,获取场景的3D模型,进而可以对3D模型中的物体进行识别,得到每个物体的识别结果,最后将搜索信息与各物体的识别结果进行匹配,获取与搜索信息匹配的目标物体并标记显示。本实施例中,基于结构光获取场景中各物体的3D模型,从而可以实现对3D物体的识别,由于场景中各物体的3D模型中携带各个特征点的深度信息,从而可以根据深度信息识别各物体,使得识别结果更加精准。在识别目标物体后,标记显示该目标物体,能够使得用户更加直观地了解待搜索物体在场景中的具体位置,提升用户体验。
上述物体搜索装置中各个模块的划分仅用于举例说明,在其他实施例中,可将物体搜索调整装置按照需要划分为不同的模块,以完成上述物体搜索装置的全部或部分功能。
本发明实施例还提供了一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行以下步骤:
获取待搜索物体的搜索信息;
通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
对所述3D模型中的物体进行识别,得到每个物体的识别结果;
将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
本发明实施例还提供一种终端设备。上述终端设备中包括图像处理电路,图像处理电路可以利用硬件和/或软件组件实现,可包括定义ISP(Image Signal Processing,图像信号处理)管线的各种处理单元。图8为一个实施例中图像处理电路的示意图。如图8所示,为便于说明,仅示出与本发明实施例相关的图像处理技术的各个方面。
如图8所示,图像处理电路800包括成像设备810、ISP处理器830和控制逻辑器840。成像设备810可包括具有一个或多个透镜812、图像传感器814的照相机和结构光投射器816。结构光投射器816将结构光投影至被测物。其中,该结构光图案可为激光条纹、格雷码、正弦条纹、或者,随机排列的散斑图案等。图像传感器814捕捉投影至被测物形成的结构光图像,并将结构光图像发送至ISP处理器830,由ISP处理器830对结构光图像进行解调获取被测物的深度信息。同时,图像传感器814也可以捕捉被测物的色彩信息。当然,也可以由两个图像传感器814分别捕捉被测物的结构光图像和色彩信息。
其中,以散斑结构光为例,ISP处理器830对结构光图像进行解调,具体包括,从该结构光图像中采集被测物的散斑图像,将被测物的散斑图像与参考散斑图像按照预定算法进行图像数据计算,获取被测物上散斑图像的各个散斑点相对于参考散斑图像中的参考散斑点的移动距离。利用三角法转换计算得到散斑图像的各个散斑点的深度值,并根据该深度值得到被测物的深度信息。
当然,还可以通过双目视觉的方法或基于飞行时差TOF的方法来获取该深度图像信息等,在此不做限定,只要能够获取或通过计算得到被测物的深度信息的方法都属于本实施方式包含的范围。
在ISP处理器830接收到图像传感器814捕捉到的被测物的色彩信息之后,可被测物的色彩信息对应的图像数据进行处理。ISP处理器830对图像数据进行分析以获取可用于确定和/或成像设备810的一个或多个控制参数的图像统计信息。图像传感器814可包括色彩滤镜阵列(如Bayer滤镜),图像传感器814可获取用图像传感器814的每个成像像素捕捉的光强度和波长信息,并提供可由ISP处理器830处理的一组原始图像数据。
ISP处理器830按多种格式逐个像素地处理原始图像数据。例如,每个图像像素可具有8、10、12或14比特的位深度,ISP处理器830可对原始图像数据进行一个或多个图像处理操作、收集关于图像数据的图像统计信息。其中,图像处理操作可按相同或不同的位深度精度进行。
ISP处理器830还可从图像存储器820接收像素数据。图像存储器820可为存储器装置的一部分、存储设备、或电子设备内的独立的专用存储器,并可包括DMA(Direct MemoryAccess,直接直接存储器存取)特征。
当接收到原始图像数据时,ISP处理器830可进行一个或多个图像处理操作。
在ISP处理器830获取到被测物的色彩信息和深度信息后,可对其进行融合,得到三维图像。其中,可通过外观轮廓提取方法或轮廓特征提取方法中的至少一种提取相应的被测物的特征。例如通过主动形状模型法ASM、主动外观模型法AAM、主成分分析法PCA、离散余弦变换法DCT等方法,提取被测物的特征,在此不做限定。再将分别从深度信息中提取到被测物的特征以及从色彩信息中提取到被测物的特征进行配准和特征融合处理。这里指的融合处理可以是将深度信息以及色彩信息中提取出的特征直接组合,也可以是将不同图像中相同的特征进行权重设定后组合,也可以有其他融合方式,最终根据融合后的特征,生成三维图像。
三维图像的图像数据可发送给图像存储器820,以便在被显示之前进行另外的处理。ISP处理器830从图像存储器820接收处理数据,并对所述处理数据进行原始域中以及RGB和YCbCr颜色空间中的图像数据处理。三维图像的图像数据可输出给显示器860,以供用户观看和/或由图形引擎或GPU(Graphics Processing Unit,图形处理器)进一步处理。此外,ISP处理器830的输出还可发送给图像存储器820,且显示器860可从图像存储器820读取图像数据。在一个实施例中,图像存储器820可被配置为实现一个或多个帧缓冲器。此外,ISP处理器830的输出可发送给编码器/解码器850,以便编码/解码图像数据。编码的图像数据可被保存,并在显示于显示器860设备上之前解压缩。编码器/解码器850可由CPU或GPU或协处理器实现。
ISP处理器830确定的图像统计信息可发送给控制逻辑器840单元。控制逻辑器840可包括执行一个或多个例程(如固件)的处理器和/或微控制器,一个或多个例程可根据接收的图像统计信息,确定成像设备810的控制参数。
以下为运用图8中图像处理技术实现物体搜索方法的步骤:
获取待搜索物体的搜索信息;
通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
对所述3D模型中的物体进行识别,得到每个物体的识别结果;
将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (11)
1.一种物体搜索方法,其特征在于,包括:
获取待搜索物体的搜索信息;
通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
对所述3D模型中的物体进行识别,得到每个物体的识别结果;
将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
2.根据权利要求1所述的物体搜索方法,其特征在于,所述获取待搜索物体的搜索信息之前,还包括:
采集各类物体的深度信息作为样本数据;
利用所述样本数据训练得到用于对物体进行识别的识别模型。
3.根据权利要求2所述的物体搜索方法,其特征在于,所述对所述3D模型中的物体进行识别,包括:
从所述3D模型中提取各个物体的深度信息;
将提取到的各个物体的深度信息输入到识别模型中进行识别,得到各个物体的识别概率;
针对每个物体,将所述识别概率最高的识别结果作为所述物体的识别结果。
4.根据权利要求3所述的物体搜索方法,其特征在于,所述将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示,包括:
将所述搜索信息的关键字与各物体识别结果中的关键字进行匹配,得到与各物体的匹配度;
将匹配度最高的第一物体作为所述目标物体;
在所述目标物体所在位置处,标记显示所述目标物体。
5.根据权利要求1-4任一项所述的物体搜索方法,其特征在于,所述获取待搜索物体的搜索信息,包括:
接收用户通过屏幕输入的所述搜索信息;或者,
接收用户通过拾音装置输入的所述搜索信息。
6.根据权利要求1-4任一项所述的物体搜索方法,其特征在于,所述通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型,包括:
向所述场景发射结构光;
采集所述结构光在所述场景中各个物体上的发射光,并形成所述场景的深度图像;
基于所述深度图像重构所述场景的3D模型。
7.根据权利要求6所述的物体搜索方法,其特征在于,所述结构光为非均匀的结构光,所述非均匀的结构光为多个光斑的集合构成的散斑图案或乱点图案,是由设置在终端上的投射装置中的衍射光学元件形成的,其中,所述衍射光学元件上设置有一定数量的浮雕,所述浮雕的凹槽深度不同。
8.根据权利要求4所述的物体搜索方法,其特征在于,所述将所述识别概率最高的识别结果作为所述物体的识别结果之后,还包括:
将所述场景下每个物体的识别结果显示给所述用户。
9.一种物体搜索装置,其特征在于,包括:
第一获取模块,用于获取待搜索物体的搜索信息;
第二获取模块,用于通过结构光对所述待搜索物体所在的场景进行扫描,获取所述场景的3D模型;
第三获取模块,用于对所述3D模型中的物体进行识别,得到每个物体的识别结果;
第四获取模块,用于将所述搜索信息与各物体的识别结果进行匹配,获取与所述搜索信息匹配的目标物体并标记显示;其中,所述目标物体为所述待搜索物体。
10.一种终端设备,包括存储器及处理器,所述存储器中储存有计算机可读指令,所述指令被所述处理器执行时,使得所述处理器执行如权利要求1-8中任一所述的物体搜索方法。
11.一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行如权利要求1-8中任一所述的物体搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640090.4A CN107463659B (zh) | 2017-07-31 | 2017-07-31 | 物体搜索方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640090.4A CN107463659B (zh) | 2017-07-31 | 2017-07-31 | 物体搜索方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107463659A true CN107463659A (zh) | 2017-12-12 |
CN107463659B CN107463659B (zh) | 2020-07-17 |
Family
ID=60547155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710640090.4A Active CN107463659B (zh) | 2017-07-31 | 2017-07-31 | 物体搜索方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107463659B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109040461A (zh) * | 2018-08-29 | 2018-12-18 | 优视科技新加坡有限公司 | 一种基于对象识别的业务处理方法和装置 |
CN109299693A (zh) * | 2018-09-26 | 2019-02-01 | 维沃移动通信有限公司 | 一种显示控制方法及移动终端 |
CN109472825A (zh) * | 2018-10-16 | 2019-03-15 | 维沃移动通信有限公司 | 一种对象搜索方法及终端设备 |
CN109781012A (zh) * | 2019-02-02 | 2019-05-21 | 无锡汉塔科技有限公司 | 基于激光的果品参数测量方法 |
CN110161786A (zh) * | 2018-02-12 | 2019-08-23 | 深圳富泰宏精密工业有限公司 | 光投射模块、三维影像感测装置及其感测方法 |
CN111630368A (zh) * | 2018-05-18 | 2020-09-04 | 深圳配天智能技术研究院有限公司 | 物体识别方法、物体识别装置及具有存储功能的装置 |
CN112347882A (zh) * | 2020-10-27 | 2021-02-09 | 中德(珠海)人工智能研究院有限公司 | 一种智能分拣控制方法和智能分拣控制系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030071909A1 (en) * | 2001-10-11 | 2003-04-17 | Peters Geoffrey W. | Generating images of objects at different focal lengths |
CN103093191A (zh) * | 2012-12-28 | 2013-05-08 | 中电科信息产业有限公司 | 一种三维点云数据结合数字影像数据的物体识别方法 |
CN106371607A (zh) * | 2016-09-19 | 2017-02-01 | 深圳奥比中光科技有限公司 | 一种基于协同游戏的人机互动方法与系统 |
CN106540447A (zh) * | 2016-11-04 | 2017-03-29 | 宇龙计算机通信科技(深圳)有限公司 | Vr场景构建方法及系统、vr游戏搭建方法及系统、vr设备 |
US20170116496A1 (en) * | 2013-02-08 | 2017-04-27 | Chuck Fung | Method, system and processor for instantly recognizing and positioning an object |
CN106991716A (zh) * | 2016-08-08 | 2017-07-28 | 深圳市圆周率软件科技有限责任公司 | 一种全景三维建模装置、方法及系统 |
-
2017
- 2017-07-31 CN CN201710640090.4A patent/CN107463659B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030071909A1 (en) * | 2001-10-11 | 2003-04-17 | Peters Geoffrey W. | Generating images of objects at different focal lengths |
CN103093191A (zh) * | 2012-12-28 | 2013-05-08 | 中电科信息产业有限公司 | 一种三维点云数据结合数字影像数据的物体识别方法 |
US20170116496A1 (en) * | 2013-02-08 | 2017-04-27 | Chuck Fung | Method, system and processor for instantly recognizing and positioning an object |
CN106991716A (zh) * | 2016-08-08 | 2017-07-28 | 深圳市圆周率软件科技有限责任公司 | 一种全景三维建模装置、方法及系统 |
CN106371607A (zh) * | 2016-09-19 | 2017-02-01 | 深圳奥比中光科技有限公司 | 一种基于协同游戏的人机互动方法与系统 |
CN106540447A (zh) * | 2016-11-04 | 2017-03-29 | 宇龙计算机通信科技(深圳)有限公司 | Vr场景构建方法及系统、vr游戏搭建方法及系统、vr设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110161786A (zh) * | 2018-02-12 | 2019-08-23 | 深圳富泰宏精密工业有限公司 | 光投射模块、三维影像感测装置及其感测方法 |
CN111630368A (zh) * | 2018-05-18 | 2020-09-04 | 深圳配天智能技术研究院有限公司 | 物体识别方法、物体识别装置及具有存储功能的装置 |
CN111630368B (zh) * | 2018-05-18 | 2023-03-21 | 深圳配天智能技术研究院有限公司 | 物体识别方法、物体识别装置及具有存储功能的装置 |
CN109040461A (zh) * | 2018-08-29 | 2018-12-18 | 优视科技新加坡有限公司 | 一种基于对象识别的业务处理方法和装置 |
CN109299693A (zh) * | 2018-09-26 | 2019-02-01 | 维沃移动通信有限公司 | 一种显示控制方法及移动终端 |
CN109472825A (zh) * | 2018-10-16 | 2019-03-15 | 维沃移动通信有限公司 | 一种对象搜索方法及终端设备 |
CN109781012A (zh) * | 2019-02-02 | 2019-05-21 | 无锡汉塔科技有限公司 | 基于激光的果品参数测量方法 |
CN112347882A (zh) * | 2020-10-27 | 2021-02-09 | 中德(珠海)人工智能研究院有限公司 | 一种智能分拣控制方法和智能分拣控制系统 |
CN112347882B (zh) * | 2020-10-27 | 2024-03-22 | 中德(珠海)人工智能研究院有限公司 | 一种智能分拣控制方法和智能分拣控制系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107463659B (zh) | 2020-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107463659A (zh) | 物体搜索方法及其装置 | |
CN107480613A (zh) | 人脸识别方法、装置、移动终端和计算机可读存储介质 | |
CN107479801A (zh) | 基于用户表情的终端显示方法、装置及终端 | |
CN107465906B (zh) | 场景的全景拍摄方法、装置及终端设备 | |
CN107481317A (zh) | 人脸3d模型的面部调整方法及其装置 | |
CN107423716A (zh) | 人脸状态监控方法及装置 | |
CN107483845B (zh) | 拍照方法及其装置 | |
CN107370950B (zh) | 对焦处理方法、装置和移动终端 | |
CN107507269A (zh) | 个性化三维模型生成方法、装置和终端设备 | |
CN107481101A (zh) | 穿衣推荐方法及其装置 | |
CN107491744A (zh) | 人体身份识别方法、装置、移动终端和存储介质 | |
CN107509045A (zh) | 图像处理方法和装置、电子装置和计算机可读存储介质 | |
CN107452034A (zh) | 图像处理方法及其装置 | |
CN107707831A (zh) | 图像处理方法和装置、电子装置和计算机可读存储介质 | |
CN107610080A (zh) | 图像处理方法和装置、电子装置和计算机可读存储介质 | |
CN107895110A (zh) | 终端设备的解锁方法、装置及移动终端 | |
CN107610171A (zh) | 图像处理方法及其装置 | |
CN107517346A (zh) | 基于结构光的拍照方法、装置及移动设备 | |
CN107707838A (zh) | 图像处理方法和装置 | |
CN107491675A (zh) | 信息安全处理方法、装置和终端 | |
CN107480615A (zh) | 美颜处理方法、装置及移动设备 | |
CN107392874A (zh) | 美颜处理方法、装置及移动设备 | |
CN107644440A (zh) | 图像处理方法和装置、电子装置和计算机可读存储介质 | |
CN107610078A (zh) | 图像处理方法和装置 | |
CN107592491A (zh) | 视频通信背景显示方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant after: OPPO Guangdong Mobile Communications Co., Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant before: Guangdong Opel Mobile Communications Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |