CN113377983A - 三维图像的图像特征的提取方法、装置及电子设备 - Google Patents

三维图像的图像特征的提取方法、装置及电子设备 Download PDF

Info

Publication number
CN113377983A
CN113377983A CN202110777516.7A CN202110777516A CN113377983A CN 113377983 A CN113377983 A CN 113377983A CN 202110777516 A CN202110777516 A CN 202110777516A CN 113377983 A CN113377983 A CN 113377983A
Authority
CN
China
Prior art keywords
image
dimensional image
sampling
display information
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110777516.7A
Other languages
English (en)
Inventor
陈仕创
孙金虎
孙炼杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202110777516.7A priority Critical patent/CN113377983A/zh
Publication of CN113377983A publication Critical patent/CN113377983A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种三维图像的图像特征的提取方法、装置及电子设备,该方法包括:获取输入的第一三维图像;生成多个依序排列的用于展示第一三维图像的图像展示信息,其中图像展示信息是基于对第一三维图像的采样操作而生成;基于针对图像展示信息进行选取的第一操作指令,提取第一三维图像的图像特征,以使用图像特征对第二三维图像进行识别,其中,第二三维图像与第一三维图像相同或相似。该方法,能够将第一三维图像从不同的视角向用户进行适当的展示,从而基于用户选择的图像展示信息,准确的生成相应的图像特征,以使用户可以基于该图像特征对于第一三维图像相同或相似的第二三维图像进行准确的识别,有效降低识别错误。

Description

三维图像的图像特征的提取方法、装置及电子设备
技术领域
本申请涉及图像处理领域,特别涉及一种三维图像的图像特征的提取方法、装置及电子设备。
背景技术
目前在图像处理时,需要对三维图像进行图像特征的提取,从而能够使用该图像特征来实施其他操作,如对图像进行识别。但是在对三维图像进行图像特征的提取时使用的工具对于用户并不友好,如操作复杂,对用户的专业性要求高等缺陷。使用这些工具,用户并不能基于适当的采样角度和/或采样距离来提取三维图像的图像特征,从而获取的图像特征并不准确,进而不能有效的利用提取到的图像特征。
发明内容
本申请实施例的目的在于提供一种三维图像的图像特征的提取方法、装置及电子设备。
本实施例的三维图像的图像特征的提取方法,包括:
获取输入的第一三维图像;
生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
作为可选,所述图像展示信息具有排序展示的优先级,所述针对所述图像展示信息进行选取的第一操作指令,包括:
获取针对所述图像展示信息进行选择的用户选取指令,其中,多个所述图像展示信息基于所述优先级进行排列;
基于所述用户选取指令生成所述第一操作指令。
作为可选,所述提取所述第一三维图像的图像特征,具体包括:使用目标模型提取所述图像特征;
相应的,所述方法还包括:
获取基于所述用户选取指令生成的第一图像特征;
将所述第一图像特征作为正样本,对所述目标模型进行训练,以更新所述目标模型的目标参数。
作为可选,所述方法还包括:
基于完整采样视角和/或采样距离范围,对所述第一三维图像的外球面进行采样操作,其中,所述外球面基于所述第一三维图像的外部形态构建。
作为可选,所述外球面上均匀设置有多个采样点,不同的采样点对应有各自的采样角度和/或采样距离;所述基于完整采样视角和/或采样距离范围,对所述第一三维图像的外球面进行采样操作,包括:
对每个所述采样点分别进行采样操作,生成与所述采样点相对应的数据单元;
基于渲染后的所有的所述数据单元,生成采样数据,以使用所述采样数据生成所述图像展示信息。
作为可选,所述生成多个依序排列的用于展示所述第一三维图像的图像展示信息,包括:
分析所述采样数据,获取所述采样数据中符合第一条件的第一数据,其中所述第一条件基于经验数据构建;
至少基于所述第一数据,生成多个供选择的所述图像展示信息。
作为可选,所述图像展示信息具有排序展示的优先级;所述方法还包括:
在未获取到针对多个所述图像展示信息进行的选取操作的情况下,基于所述优先级确定所述第一操作指令。
作为可选,所述图像特征包括以下至少一个:灰度直方图,图像面积信息,最大外接矩形长宽比,最小内接矩形长宽比,轮廓复杂度,轮廓内最短距离以及轮廓内最长距离。
本申请实施例还提供了一种三维图像的图像特征的提取装置,包括:
获取模块,其配置为获取输入的第一三维图像;
展示模块,其配置为生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
提取模块,其配置为基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
获取输入的第一三维图像;
生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
本申请实施例的该三维图像的图像特征的提取方法,能够将第一三维图像从不同的视角向用户进行适当的展示,以使用户可以根据需要来进行选择,从而基于用户选择的图像展示信息,准确的生成相应的图像特征,以使用户可以基于该图像特征对于第一三维图像相同或相似的第二三维图像进行准确的识别,有效降低识别错误。
附图说明
图1为本申请实施例的三维图像的图像特征的提取方法的流程图;
图2为本申请实施例的图1中步骤S30的一个实施例的流程图;
图3为本申请实施例的提取方法的一个具体实施例的流程图;
图4为本申请实施例的图1中步骤S20的一个实施例的流程图;
图5为本申请实施例的基于第一三维图像生成图像展示信息的示意图;
图6为本申请实施例的对目标模型进行训练的一个实施例的流程图;
图7为本申请实施例的提取装置的结构框图;
图8为本申请实施例的电子设备的结构框图。
附图标识说明
1-第一三维图像;2-外球面;3-数据单元;4-目标模型;5-图像展示信息。
具体实施方式
此处参考附图描述本申请的各种方案以及特征。
应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本申请的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式。
当结合附图时,鉴于以下详细说明,本申请的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本申请的具体实施例;然而,应当理解,所申请的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本申请的相同或不同实施例中的一个或多个。
本申请实施例的一种三维图像的图像特征的提取方法,该方法应用在电子设备上,包括:获取输入的第一三维图像1。该第一三维图像1可以是用户输入而被电子设备获取,也可以是其他设备进行输入而被电子设备获取的。当然,该第一三维图像1也可以是电子设备主动从预设的存储设备中获取到的图像。电子设备基于获取到的第一三维图像1后,可以基于第一三维图像1生成多个依序排列的用于展示第一三维图像1的图像展示信息5,其中图像展示信息5是基于对第一三维图像1的采样操作而生成,该图像展示信息5可以是从不同的视角和/或视距进行展示。用户可以针对图像展示信息5进行选择形成第一操作指令,电子设备基于针对图像展示信息5进行选取的第一操作指令,提取第一三维图像1的图像特征,以使电子设备或者其他获取到该图像特征的设备可以使用图像特征对第二三维图像进行识别,其中,第二三维图像与第一三维图像1相同或相似。通过图像特征来对相同或相似的三维图像进行识别可以应用在智能识别,如物品的识别,自动驾驶的识别,摄像头识别物体等场景中,从而能够对图像和/或真实物品进行准确识别。
本实施例的该方法,能够将第一三维图像1从不同的视角向用户进行适当的展示,以使用户可以根据需要来进行选择,从而基于用户选择的图像展示信息5,准确的生成相应的图像特征,以使用户可以基于该图像特征对于第一三维图像1相同或相似的第二三维图像进行准确的识别,有效降低识别错误。
下面结合附图,对该三维图像的图像特征的提取方法进行详细的说明,该方法可以应用于电子设备,如图1所示并结合图5,其包括以下步骤:
S10,获取输入的第一三维图像1。
第一三维图像1为三维立体图像,可以是用户向电子设备输入从而由电子设备获取到,也可以是其他设备向电子设备进行输入而被获取到。第一三维图像1可以是基于CAD模型构建,能够基于不同的视角和/或视距来进行展示。
S20,生成多个依序排列的用于展示所述第一三维图像1的图像展示信息5,其中所述图像展示信息5是基于对所述第一三维图像1的采样操作而生成。
电子设备对获取到的第一三维图像1进行处理,以获取能够表征该第一三维图像1的形态的数据,具体的获取方式则可以通过对第一三维图像1进行采样操作,或者针对第一三维图像1中的重要数据进行特定数据的分析等方式来获取。而基于该数据来展示多个图像展示信息5时,则可以利用筛选算法以生成该图像展示信息5,而图像展示信息5的具体的表现形式可以是图像,数据等方式。例如,筛选算法可以根据经验数据来构建,从而使得电子设备可以基于经验数据来生成多个图像展示信息5,以供用户来选取。
进一步来说,每个图像展示信息5可以是从不同的视角和/或视距来表现该第一三维图像1。例如,第一图像展示信息为从第一三维图像1的第一侧面的视角来展示该第一三维图像1;而第二图像展示信息为从第一三维图像1的第二侧面的视角来展示该第一三维图像1;第三图像展示信息为从第一三维图像1的斜视的视角来展示该第一三维图像1。用户可以从展示出来的多个图像展示信息5来选择其所需要的。例如第一用户为专业用户,可以根据使用需要,以及应用场景来选择相适配的图像展示信息5,可能判断电子设备推荐的(如默认的)图像展示信息5并不合理,从而重新选取了其他的图像展示信息5。以便生成相应的图像特征;而第二用户为普通用户,其可以选择电子设备推荐的(如默认的)图像展示信息5,来生成相应的图像特征,而无需自身再对第一三维图像1进行分析和选择,提高了处理效率。
本实施例中,在对第一三维图像1的采样操作生成多个图像展示信息5时,一方面,可以对第一三维图像1的外表面进行采样,例如对外表面进行均匀采样,或者重点采样,从而生成多个图像展示信息5;另一方面,可以在第一三维图像1的外侧构建外球面2,该外球面2为球体形态,在从该外球面2上进行采样,进而生成多个图像展示信息5。
此外,多个图像展示信息5在展示时可以将其进行依序排列,如,根据图像展示信息5的优先级对其进行排列,优先级最高的排在第一位,其为电子设备推荐的(默认的)图像展示信息5,如果选择该图像展示信息5,生成的图像特征将有效提高准确度,或者获得的图像特征应用将更加广泛。
S30,基于针对所述图像展示信息5进行选取的第一操作指令,提取所述第一三维图像1的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像1相同或相似。
第一操作指令为对图像展示信息5进行选取的指令,如用户基于展示的图形展示信息进行选取,电子设备根据选取操作生成第一操作指令。也可以是其他设备将该第一操作指令发送给电子设备,电子设备接收该第一操作指令。
电子设备可以基于第一操作指令来提取第一三维图像1的图像特征。具体的,基于第一操作指令可以确定用户选择的(默认选择的)图像展示信息5,而该图像展示信息5对应有相应的图像特征,电子设备基于该选定的图像展示信息5则可以生成相应的图像特征。
如果是专业用户选择的图像展示信息5,可以将其记录,以便使用该记录的信息对随后的图像展示信息5的相关展示过程进行调整,例如调整图像展示信息5的具体展示内容和/或调整多个图像展示信息5的优先级等。从而得到优化图像展示信息5的展示过程,进而提高图像特征的提取准确度。
图像特征具体可以是描述该第一三维图像1的轮廓、边角点、凸起区域、凹陷区域等位置的数据。从而该图像特征能够准确表征该第一三维图像1的结构特点。在获取到该图像特征后,可以在多个不同场景中利用该图像特征。例如,一方面,在智能机器人识别物品的场景中,智能机器人能够利用该图像特征对与第一三维图像1相同或相似的第二三维图像(或真实的物体)进行准确的识别,以便基于第二三维图像(或真实的物体)来实施随后的工作。另一方面,在摄像头识别物体时以及在汽车自动驾驶场景中对物体进行识别时,也可以利用该图像特征来实现对相同或相似的图像或真实的物体进行准确的识别。
在本申请的一个实施例中,所述图像展示信息5具有排序展示的优先级,所述针对所述图像展示信息5进行选取的第一操作指令,如图2所示并结合图5,包括:
S310,获取针对所述图像展示信息5进行选择的用户选取指令,其中,多个所述图像展示信息5基于所述优先级进行排列。
图像展示信息5具有各自的优先级,该优先级表征了图像展示信息5在展示时的优先次序,优先级高的图像展示信息5可以优先展示。例如第一图像展示信息具有第一优先级,第二图像展示信息具有第二优先级,第三图像展示信息具有第三优先级。第一优先级高于第二优先级,第二优先级高于第三优先级。这使得在多个图像展示信息5进行展示时,第一图像展示信息可以展示在最重要的位置,如展示在第一位置,而第二图像展示信息可以展示在第二位置,第三图像展示信息可以展示在第三位置,其中第一位置的重要程度(显著程度)高于第二位置,第二位置的重要程度(显著程度)高于第三位置。
图像展示信息5可以是图像信息,文字信息等。多个图像展示信息5展示给用户后,用户可以对其进行选取,如点击操作,拖动操作等。基于用户的操作生成了相应的用户选取指令。
S320,基于所述用户选取指令生成所述第一操作指令。
用户选取指令表征了用户对图像展示信息5的选取结果,电子设备获取该用户选取指令后进行响应,基于该用户选取指令可以生成第一操作指令,第一操作指令用于对选定的图像展示信息5进行图像特征的提取操作。
在本申请的一个实施例中,所述提取所述第一三维图像1的图像特征,具体包括:使用目标模型4提取所述图像特征;
相应的,如图3所示并结合图6,所述方法还包括:
S40,获取基于所述用户选取指令生成的第一图像特征;
S50,将所述第一图像特征作为正样本,对所述目标模型4进行训练,以更新所述目标模型4的目标参数。
具体来说,目标模型4能够利用预设算法对采集的第一三维图像1的数据进行筛选,生成多个图像展示信息5后,目标模型4还可以根据用户的操作所确定的图像展示信息5,生成相应的图像特征。
在一个实施例中,预设算法为机器分类模型学习算法,其构造的目标函数为如下公式:
hθ(x)=g(θTx)
其中,x为抽象出的图像特征,如灰度直方图,图像面积信息,最大外接矩形长宽比,最小内接矩形长宽比,轮廓复杂度,轮廓内最短距离以及轮廓内最长距离等,θ为回归的参数模型。T表示以矩阵形式表达。
用户选取指令可以表征用户的主动操作意愿,特别是专业用户,其具有专业知识能够选取更加适当的图像展示信息5,而电子设备可以将该用户选取指令进行记录。本实施例中,根据用户选定的图像展示信息5生成相应的第一图像特征,第一图像特征对应了用户选取指令,能够间接表征用户的主动操作意愿。本实施例中,将第一图像特征作为正样本,对目标模型4进行训练,以更新目标模型4的目标参数。当然,也可以将用户没有选择的其他图像展示信息5对应的图像特征作为负样本,对目标模型4进行训练。从而完善目标模型4,使得在使用目标模型4时能够更加准确的得到图像特征。即通过训练完成的目标模型4对第二三维图像进行图像特征的提取,提取的图像特征会更加精确。
在本申请的一个实施例中,所述方法还包括:基于完整采样视角和/或采样距离范围,对所述第一三维图像1的外球面2进行采样操作,其中,所述外球面2基于所述第一三维图像1的外部形态构建。
具体的,第一三维图像1的外部是三维形态,可以在该外部形态外侧设置一外球面2,该外球面2将第一三维图像1罩在其内。在外球面2上进行采样操作,生成的采样数据可以与该第一三维图像1的外部形态相关联。包括外球面2的体积与第一三维图像1的外部形态相适配,从而能够准确的表征第一三维图像1的外部的三维特征。
对外球面2进行采样时,可以针对该外球面2进行完整采样,具体由于是在球形上采样,因此每次采样时可以按照不同的采样距离和采样视角进行采样。例如,在外球面2的不同位置的点进行采样,从而形成完整采样视角的采样操作。而如果在对不同位置的点进行采样时所实施的采样距离不同,则也可以在采样距离范围内,以不同的采样距离进行采样。当然,上述的基于完整采样视角,基于采样距离范围进行采样,可以分别进行,也可以相结合进行。
在本申请的一个实施例中,所述外球面2上均匀设置有多个采样点,不同的采样点对应有各自的采样角度和/或采样距离;所述基于完整采样视角和/或采样距离范围,对所述第一三维图像1的外球面2进行采样操作,包括:
对每个所述采样点分别进行采样操作,生成与所述采样点相对应的数据单元3;
基于渲染后的所有的所述数据单元3,生成采样数据,以使用所述采样数据生成所述图像展示信息5。
具体的,可以将该外球面2上均匀的划分为多个采样面,或者按照预设规则划分多个采样面,对每个采样面上的采样点进行采样。由于每个采样面对应的采样视角不同,采样距离也可以不同,其中采样距离处于预设的采样距离范围。这使得基于完整采样视角和/或采样距离范围在采样面上进行采样,则可以完成完整采样操作。
此外,在每个采样面上采样点的采集数据可以为一个数据单元3,基于所有的数据单元3生成采样数据。利用目标模型4生成图像特征时,可以利用各个数据单元3和/或整个采样数据,来对第一三维图像1进行图像特征的提取。在一个实施例中,可以对每个数据单元3进行渲染,而由于所有的数据单元3总体上对应了外球面2上所有的采样点,因此渲染后则能够实现对外球面2的全角度渲染,进而生成采样数据。使用采样数据生成图像展示信息5,为用户展示,以便用户可以对多个图像展示信息5进行选取。
在本申请的一个实施例中,所述生成多个依序排列的用于展示所述第一三维图像1的图像展示信息5,如图4所示,包括:
S210,分析所述采样数据,获取所述采样数据中符合第一条件的第一数据,其中所述第一条件基于经验数据构建。
具体的,第一条件基于经验数据构建,而该经验数据为用户在使用目标模型4对第一三维图像1进行图像特征的提取过程中形成的经验数据,包括对第一三维图形进行采样的经验,对采样数据进行处理的经验,以及生成图像展示信息5的经验等。
例如,当第一三维图像1为手持工具时,最佳的采样方式是对其的外球面2进行完全采样,生成的第一数据最佳为将手持工具的第一侧面,第二侧面以及第一斜视面作为目标数据进行筛选,进而便能够生成分别与第一侧面,第二侧面以及第一斜视面相对应的多个图像展示信息5。而第一条件则相应的为针对上述筛选过程设置的条件。当然该第一条件也可以根据用户在使用目标模型4来生成图像特征的长期过程中根据实际情况不断的进行调整。
S220,至少基于所述第一数据,生成多个供选择的所述图像展示信息5。
由于第一数据是基于经验数据构建,因此基于第一数据生成的多个图像展示信息5均为能够准确的生成图像特征的信息。其中,准确度可能不同,但彼此之间相差不大。这使得用户在选取图像展示信息5后,或者使用默认的图像展示信息5后可以更加准确的生成相应的图像特征。
在本申请的一个实施例中,所述图像展示信息5具有排序展示的优先级;所述方法还包括:
在未获取到针对多个所述图像展示信息5进行的选取操作的情况下,基于所述优先级确定所述第一操作指令。
具体来说,图像展示信息5具有排序展示的优先级,该优先级表征了图像展示信息5在进行展示的显著程度,优先级越高则展示的位置越明显。例如,最高的第一优先级的图像展示信息5可以展示在最为显著的展示队列中的首位置。而级别稍低的第二优先级的图像展示信息5则可以展示在展示队列的第二位置,其中第一优先级大于第二优先级。
当用户没有对展示的多个图像展示信息5进行选取时,则可以默认选取具有第一优先级的第一图像展示信息。即相对应的用户选取指令也表征选取了该第一图像展示信息。基于用户选取指令生成第一操作指令。例如,普通用户可能并不具有从多个图像展示信息5中选取适当的一个图像展示信息5的能力,此时如果没有侦测到用户的选取操作,则可以基于默认的图像展示信息5生成相应的用户选取指令。
在本申请的一个实施例中,所述图像特征包括以下至少一个:第一三维图像1的灰度直方图,图像面积信息,最大外接矩形长宽比,最小内接矩形长宽比,轮廓复杂度,轮廓内最短距离以及轮廓内最长距离。基于上述一个或多个特征能够有效而准确的对图像特征相对应的其他三维图像进行识别。特别是与第一三维图像1相同或相似的第二三维图像。
本申请实施例还提供了一种三维图像的图像特征的提取装置,如图7所示,包括:
获取模块,其配置为获取输入的第一三维图像1;
具体的,第一三维图像1为三维立体图像,可以是用户向电子设备输入从而由获取模块获取到,也可以是其他设备向电子设备进行输入而被获取模块获取到。第一三维图像1可以是基于CAD模型构建,能够基于不同的视角和/或视距来进行展示。
展示模块,其配置为生成多个依序排列的用于展示所述第一三维图像1的图像展示信息5,其中所述图像展示信息5是基于对所述第一三维图像1的采样操作而生成。
具体的,展示模块对获取到的第一三维图像1进行处理,以获取能够表征该第一三维图像1的形态的数据,具体的获取方式则可以通过对第一三维图像1进行采样操作,或者针对第一三维图像1中的重要数据进行特定数据的分析等方式来获取。而基于该数据来展示多个图像展示信息5时,则可以利用筛选算法以生成该图像展示信息5,而图像展示信息5的具体的表现形式可以是图像,数据等方式。例如,筛选算法可以根据经验数据来构建,从而使得展示模块可以基于经验数据来生成多个图像展示信息5,以供用户来选取。
进一步来说,每个图像展示信息5可以是从不同的视角和/或视距来表现该第一三维图像1。例如,第一图像展示信息为从第一三维图像1的第一侧面的视角来展示该第一三维图像1;而第二图像展示信息为从第一三维图像1的第二侧面的视角来展示该第一三维图像1;第三图像展示信息为从第一三维图像1的斜视的视角来展示该第一三维图像1。用户可以从展示出来的多个图像展示信息5来选择其所需要的。例如第一用户为专业用户,可以根据使用需要,以及应用场景来选择相适配的图像展示信息5,以便生成相应的图像特征;而第二用户为普通用户,其可以选择电子设备推荐的(如默认的)图像展示信息5,来生成相应的图像特征,而无需自身再对第一三维图像1进行分析和选择,提高了处理效率。
本实施例中,展示模块在对第一三维图像1的采样操作生成多个图像展示信息5时,一方面,可以对第一三维图像1的外表面进行采样,例如对外表面进行均匀采样,或者重点采样,从而生成多个图像展示信息5;另一方面,可以在第一三维图像1的外侧构建外球面2,该外球面2为球体形态,在从该外球面2上进行采样,进而生成多个图像展示信息5。
此外,多个图像展示信息5在展示时可以将其进行依序排列,如,展示模块根据图像展示信息5的优先级对其进行排列,优先级最高的排在第一位,其为电子设备推荐的(默认的)图像展示信息5,如果选择该图像展示信息5,生成的图像特征将有效提高准确度,或者获得的图像特征应用将更加广泛。
提取模块,其配置为基于针对所述图像展示信息5进行选取的第一操作指令,提取所述第一三维图像1的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像1相同或相似。
第一操作指令为对图像展示信息5进行选取的指令,如用户基于展示的图形展示信息进行选取,提取模块根据选取操作生成第一操作指令。也可以是其他设备将该第一操作指令发送给电子设备,电子设备接收该第一操作指令。
提取模块可以基于第一操作指令来提取第一三维图像1的图像特征。具体的,基于第一操作指令可以确定用户选择的(默认选择的)图像展示信息5,而该图像展示信息5对应有相应的图像特征,提取模块基于该选定的图像展示信息5则可以生成相应的图像特征。
如果是专业用户选择的图像展示信息5,提取模块可以将其记录,以便使用该记录的信息对随后的图像展示信息5的相关展示过程进行调整,例如调整图像展示信息5的具体展示内容和/或调整多个图像展示信息5的优先级等。从而得到优化图像展示信息5的展示过程,进而提高图像特征的提取准确度。
图像特征具体可以是描述该第一三维图像1的轮廓、边角点、凸起区域、凹陷区域等位置的数据。从而该图像特征能够准确表征该第一三维图像1的结构特点。在获取到该图像特征后,可以在多个不同场景中利用该图像特征。例如,一方面,在智能机器人识别物品的场景中,智能机器人能够利用该图像特征对与第一三维图像1相同或相似的第二三维图像(或真实的物体)进行准确的识别,以便基于第二三维图像(或真实的物体)来实施随后的工作。另一方面,在摄像头识别物体时以及在汽车自动驾驶场景中对物体进行识别时,也可以利用该图像特征来实现对相同或相似的图像或真实的物体进行准确的识别。
在本申请的一个实施例中,所述图像展示信息5具有排序展示的优先级,提取模块进一步配置为:
获取针对所述图像展示信息5进行选择的用户选取指令,其中,多个所述图像展示信息5基于所述优先级进行排列;
基于所述用户选取指令生成所述第一操作指令。
在本申请的一个实施例中,提取模块进一步配置为:使用目标模型4提取所述图像特征;
相应的,所述装置还包括训练模块,所述训练模块配置为:
获取基于所述用户选取指令生成的第一图像特征;
将所述第一图像特征作为正样本,对所述目标模型4进行训练,以更新所述目标模型4的目标参数。
在本申请的一个实施例中,所述装置还包括采样模块,所述采样模块配置为:
基于完整采样视角和/或采样距离范围,对所述第一三维图像1的外球面2进行采样操作,其中,所述外球面2基于所述第一三维图像1的外部形态构建。
在本申请的一个实施例中,所述外球面2上均匀设置有多个采样点,不同的采样点对应有各自的采样角度和/或采样距离;所述采样模块进一步配置为:
对每个所述采样点分别进行采样操作,生成与所述采样点相对应的数据单元3;
基于渲染后的所有的所述数据单元3,生成采样数据,以使用所述采样数据生成所述图像展示信息5。
在本申请的一个实施例中,展示模块进一步配置为:
分析所述采样数据,获取所述采样数据中符合第一条件的第一数据,其中所述第一条件基于经验数据构建;
至少基于所述第一数据,生成多个供选择的所述图像展示信息5。
在本申请的一个实施例中,所述图像展示信息5具有排序展示的优先级;提取模块进一步配置为:
在未获取到针对多个所述图像展示信息5进行的选取操作的情况下,基于所述优先级确定所述第一操作指令。
在本申请的一个实施例中,所述图像特征包括以下至少一个:灰度直方图,图像面积信息,最大外接矩形长宽比,最小内接矩形长宽比,轮廓复杂度,轮廓内最短距离以及轮廓内最长距离。
本申请实施例还提供了一种电子设备,如图8所示,包括存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
获取输入的第一三维图像1;
生成多个依序排列的用于展示所述第一三维图像1的图像展示信息5,其中所述图像展示信息5是基于对所述第一三维图像1的采样操作而生成;
基于针对所述图像展示信息5进行选取的第一操作指令,提取所述第一三维图像1的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像1相同或相似。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种三维图像的图像特征的提取方法,包括:
获取输入的第一三维图像;
生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
2.根据权利要求1所述的方法,所述图像展示信息具有排序展示的优先级,所述针对所述图像展示信息进行选取的第一操作指令,包括:
获取针对所述图像展示信息进行选择的用户选取指令,其中,多个所述图像展示信息基于所述优先级进行排列;
基于所述用户选取指令生成所述第一操作指令。
3.根据权利要求2所述的方法,所述提取所述第一三维图像的图像特征,具体包括:使用目标模型提取所述图像特征;
相应的,所述方法还包括:
获取基于所述用户选取指令生成的第一图像特征;
将所述第一图像特征作为正样本,对所述目标模型进行训练,以更新所述目标模型的目标参数。
4.根据权利要求1所述的方法,所述方法还包括:
基于完整采样视角和/或采样距离范围,对所述第一三维图像的外球面进行采样操作,其中,所述外球面基于所述第一三维图像的外部形态构建。
5.根据权利要求4所述的方法,所述外球面上均匀设置有多个采样点,不同的采样点对应有各自的采样角度和/或采样距离;所述基于完整采样视角和/或采样距离范围,对所述第一三维图像的外球面进行采样操作,包括:
对每个所述采样点分别进行采样操作,生成与所述采样点相对应的数据单元;
基于渲染后的所有的所述数据单元,生成采样数据,以使用所述采样数据生成所述图像展示信息。
6.根据权利要求5所述的方法,所述生成多个依序排列的用于展示所述第一三维图像的图像展示信息,包括:
分析所述采样数据,获取所述采样数据中符合第一条件的第一数据,其中所述第一条件基于经验数据构建;
至少基于所述第一数据,生成多个供选择的所述图像展示信息。
7.根据权利要求1所述的方法,所述图像展示信息具有排序展示的优先级;所述方法还包括:
在未获取到针对多个所述图像展示信息进行的选取操作的情况下,基于所述优先级确定所述第一操作指令。
8.根据权利要求1所述的方法,所述图像特征包括以下至少一个:灰度直方图,图像面积信息,最大外接矩形长宽比,最小内接矩形长宽比,轮廓复杂度,轮廓内最短距离以及轮廓内最长距离。
9.一种三维图像的图像特征的提取装置,包括:
获取模块,其配置为获取输入的第一三维图像;
展示模块,其配置为生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
提取模块,其配置为基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
10.一种电子设备,包括存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
获取输入的第一三维图像;
生成多个依序排列的用于展示所述第一三维图像的图像展示信息,其中所述图像展示信息是基于对所述第一三维图像的采样操作而生成;
基于针对所述图像展示信息进行选取的第一操作指令,提取所述第一三维图像的图像特征,以使用所述图像特征对第二三维图像进行识别,其中,所述第二三维图像与所述第一三维图像相同或相似。
CN202110777516.7A 2021-07-09 2021-07-09 三维图像的图像特征的提取方法、装置及电子设备 Pending CN113377983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110777516.7A CN113377983A (zh) 2021-07-09 2021-07-09 三维图像的图像特征的提取方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110777516.7A CN113377983A (zh) 2021-07-09 2021-07-09 三维图像的图像特征的提取方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN113377983A true CN113377983A (zh) 2021-09-10

Family

ID=77581450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110777516.7A Pending CN113377983A (zh) 2021-07-09 2021-07-09 三维图像的图像特征的提取方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113377983A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114619151A (zh) * 2022-01-20 2022-06-14 大族激光科技产业集团股份有限公司 激光加工控制方法及装置、可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295025A (zh) * 2013-05-03 2013-09-11 南京大学 一种三维模型最优视图的自动选择方法
CN104182765A (zh) * 2014-08-21 2014-12-03 南京大学 一种互联网图像驱动的三维模型最优视图自动选择方法
CN107038751A (zh) * 2015-12-07 2017-08-11 达索系统公司 从2d图像进行3d建模对象的识别
CN109886297A (zh) * 2019-01-16 2019-06-14 中德(珠海)人工智能研究院有限公司 一种用于从二维图像识别三维模型对象的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295025A (zh) * 2013-05-03 2013-09-11 南京大学 一种三维模型最优视图的自动选择方法
CN104182765A (zh) * 2014-08-21 2014-12-03 南京大学 一种互联网图像驱动的三维模型最优视图自动选择方法
CN107038751A (zh) * 2015-12-07 2017-08-11 达索系统公司 从2d图像进行3d建模对象的识别
CN109886297A (zh) * 2019-01-16 2019-06-14 中德(珠海)人工智能研究院有限公司 一种用于从二维图像识别三维模型对象的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114619151A (zh) * 2022-01-20 2022-06-14 大族激光科技产业集团股份有限公司 激光加工控制方法及装置、可读存储介质

Similar Documents

Publication Publication Date Title
JP7071054B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN109426835B (zh) 信息处理装置、信息处理装置的控制方法和存储介质
US10395091B2 (en) Image processing apparatus, image processing method, and storage medium identifying cell candidate area
JP2020103880A5 (zh)
TW201030630A (en) Hand gesture recognition system and method
CN104240180B (zh) 一种实现图像自动调整的方法及装置
JP2006155563A (ja) 動作分析装置
WO2022267300A1 (zh) 用于自动提取图像中目标区域的方法、系统及存储介质
CN113222913A (zh) 一种电路板缺陷检测定位方法、装置和存储介质
CN111814733A (zh) 基于头部姿态的专注度检测方法及装置
CN113377983A (zh) 三维图像的图像特征的提取方法、装置及电子设备
CN113116377A (zh) 超声成像导航方法、超声设备及存储介质
CN113177397B (zh) 表格的调整方法、装置、设备以及存储介质
CN111723688A (zh) 人体动作识别结果的评价方法、装置和电子设备
JP2021135977A (ja) 情報処理装置及び方法
CN109254663B (zh) 一种儿童图书辅助阅读机器人的使用方法
CN108805121B (zh) 一种车牌检测定位方法、装置、设备及计算机可读介质
CN112102502B (zh) 用于飞机驾驶舱功能试验的增强现实辅助方法
CN110728222B (zh) 一种用于机械臂抓取系统中目标物体的位姿估计方法
JP2005228150A (ja) 画像照合装置
CN111438437B (zh) 激光加工控制方法及装置、激光加工设备、可读存储介质
CN113657187A (zh) 一种脸部识别方法、设备和计算机可读存储介质
CN110472601B (zh) 一种遥感图像目标物体识别方法、装置和存储介质
JPWO2021229717A5 (zh)
CN112507999B (zh) 基于视觉特征的非侵入式用户界面输入项识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination