CN111382760A - 图片类别的识别方法、装置及计算机可读存储介质 - Google Patents

图片类别的识别方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111382760A
CN111382760A CN201811628314.0A CN201811628314A CN111382760A CN 111382760 A CN111382760 A CN 111382760A CN 201811628314 A CN201811628314 A CN 201811628314A CN 111382760 A CN111382760 A CN 111382760A
Authority
CN
China
Prior art keywords
picture
sample
target
node
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811628314.0A
Other languages
English (en)
Other versions
CN111382760B (zh
Inventor
邢连萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Research America Inc
Original Assignee
TCL Research America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Research America Inc filed Critical TCL Research America Inc
Priority to CN201811628314.0A priority Critical patent/CN111382760B/zh
Publication of CN111382760A publication Critical patent/CN111382760A/zh
Application granted granted Critical
Publication of CN111382760B publication Critical patent/CN111382760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明适用于人工智能技术领域,提供了图片类别的识别方法、装置及计算机可读存储介质,包括:通过获取一个以上的目标图片以及多个已知类别的样本图片;建立样本图片的分类树模型;根据分类树模型中各节点的分类规则,在分类树模型中确定目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;为每个目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;根据候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别,以提高图片类别的识别的并行性,避免重复冗余的识别计算。

Description

图片类别的识别方法、装置及计算机可读存储介质
技术领域
本发明属于人工智能技术领域,尤其涉及图片类别的识别方法、装置及计算机可读存储介质。
背景技术
在人们的日常生活以及商业活动中,经常需要识别一张图片的类别。一般的做法是:在获取到待识别的目标图片后,将该目标图片与数据库中存储的已知类别的图片进行比较分析,并根据与目标图片的特征信息相近的已知类别的图片,确定目标图片的类别。
然而,当前对于图片的类别进行识别往往是逐一分别进行的,但是由于不同的目标图片之间可能存在的相似性,使得现有技术在将目标图片与数据库中存储的已知类别的图片进行比较分析的过程中,存在大量冗余的重复运算。随着对于图片的类别进行识别的需求逐渐增大,这些冗余的重复运算会消耗大量的计算资源,并且造成识别时间的无谓延长。
发明内容
有鉴于此,本发明实施例提供了图片类别的识别方法、装置及计算机可读存储介质,以解决现有图片类别的识别方法存在的计算冗余度高且识别速度慢的问题。
本发明实施例的第一方面提供了一种图片类别的识别方法,包括:获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
本发明实施例的第二方面提供了一种图片类别的识别装置,包括:获取模块,用于获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;建立模块,用于建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;组合模块,用于根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;选取模块,用于为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;识别模块,用于根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
本发明实施例的第三方面提供了计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施例的第一方面提供的方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:通过获取一个以上的目标图片以及多个已知类别的样本图片;建立样本图片的分类树模型;根据分类树模型中各节点的分类规则,在分类树模型中确定目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;统一为属于同一目标图片集合的目标图片在分类树模型中选取一个以上的叶子节点作为其对应的被选节点,从而避免对互相类似的目标图片进行重复得路径搜索,并将被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;根据候选样本图片的类别确定目标图片对应的类别,以提高图片类别的识别的并行性,避免重复冗余的识别计算。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的图片类别的识别方法的实现流程图;
图2是本发明实施例一提供的分类树模型的生成示意图;
图3是本发明实施例一提供的图片类别的识别方法S104的具体实现流程图;
图4是本发明实施例一提供的图片类别的识别方法S105的具体实现流程图;
图5是本发明实施例一提供的图片类别的识别方法S102的具体实现流程图;
图6是本发明实施例提供的图片类别的识别装置的结构框图;
图7是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
图1示出了本发明实施例提供的图片类别的识别方法的实现流程,详述如下:
在S101中,获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别。
在本发明实施例中,样本图片的类别是已知的,而目标图片的类别是未知的,尤其是在目标图片为多张的情况下,本发明实施例根据样本图片的类别并行地识别多张目标图片的类别。
在S102中,建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片。
在本发明实施例中,由于每张样本图片都包含多个像素点,每个像素点都有其对应的特征信息,如:RGB值,所以在提取样本图片中各个像素点的特征信息后,可以建立出一个表征该样本图片的样本特征矩阵。由于根据图片的特征信息生成对应的特征矩阵的方法为现有技术,所以在此不进行详细介绍和限制。在后续的计算过程中,都是基于样本图片以及目标图片对应的特征矩阵进行计算的。
可以理解地,每个特征矩阵在超平面中实际都对应着一个坐标,本发明实施例基于特征矩阵在超平面中坐标的位置,通过预设的对各个样本特征矩阵进行多次分割,从而建立一个分类树模型。
示例性地,以每个样本特征矩阵中只包含两个元素为例,该样本特征矩阵会在二维坐标系中对应一个坐标点,图2是本发明实施例提供的分类树模型的生成示意图,其示出了样本特征矩阵基于3次分割生成分类树模型的过程。如图2所示,10个样本特征矩阵在二维坐标系中对应P1-P10这10个坐标点,即分类树模型的根节点包含这10个样本特征矩阵,第一次将该二维坐标系通过分割直线X=X1进行竖直分割,将对应的坐标点位于该分割直线左侧和右侧的样本特征矩阵分配至两个子节点,第二次将二维坐标系分别通过分割直线Y=Y1以及Y=Y2进行水平分割,第三次和第四次在之前分割的基础上进一步进行分割,当分类树模型最下层的孩子节点包含的样本特征矩阵的数量为1时,停止对该节点的继续分割。
在图2的示例中,分类树模型的根节点包含坐标点P1-P10对应的10个样本特征矩阵,第二层左侧的节点包含坐标点P1-P5对应的5个样本特征矩阵,第二层右侧的节点包含坐标点P6-P10对应的5个样本特征矩阵,其他的节点包含的样本特征矩阵以此类推。
值得注意地,如图2所示的每次分割时取得分割直线是可以根据用户预先的设定的分类规则进行的,在本发明实施例中,不对具体的分类规则进行限制。另外在图2中每个叶子节点只包含一个样本特征矩阵,然而在其他的执行过程中,每个叶子节点可以包含大于1且不大于预设数量的样本特征矩阵,即如果一个节点包含的样本特征矩阵大于预设数量,则还需要对该节点中包含的样本特征矩阵进行分割,如果一个节点包含的样本特征矩阵不大于预设数量,则将该节点作为叶子节点,不再对该节点包含的样本特征矩阵进行分割。
在S103中,根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合。
值得注意地,本发明实施例对现有技术的一个重要改进在于是集中对多个较为相似的目标图片进行识别计算。可以理解地,由于对一个目标图片的类别进行识别需要首先搜索与该目标图片近似的样本图片,然后才能根据这些被选取的样本图片的类别确定目标图片的类别。但是在搜索与目标图片近似的样本图片过程中,根据若干个彼此相似的目标图片,可能搜索出相同或相似的样本图片,且搜索的计算过程也类似,这时如果对近似的样本图片组合后并行地进行搜索,就会避免大量的重复计算过程。
可以理解地,在上文生成样本图片的分类树模型时,分类树模型中除叶子节点以外的各节点都对应一个分类规则,正是由于该分类规则,才将节点中包含的样本特征矩阵进一步地分配至下一层的子节点中。
在本发明实施例中,通过与上述的将样本图片转换为样本特征矩阵的相同的方法,将所述目标图片转换为目标特征矩阵。并根据样本图片的分类树模型中各节点的分类规则,判断目标特征矩阵对应的叶子节点。显然,对应同一个叶子节点的目标图片为彼此相似的目标图片,基于上文论述,这些彼此相似的目标图片可能搜索出相同或相似的样本图片,且搜索的计算过程也类似,所以在此将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合,并在后续的计算过程中,对目标图片集合中的目标图片进行并行地搜索计算。
在S104中,为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片。
可以理解地,基于上文的论述可知,一个目标图片集合中的目标图片彼此之间的相似度较高,所以本发明实施例将一个目标图片集合作为一个整体,去搜索与这个整体相似度较高的样本图片作为候选样本图片。
首先,可以肯定的是一个叶子节点对应的目标图片集合中的目标图片必然与该叶子节点包含的样本图片的相似度较高,因为他们都是基于同一套分类规则被分到分类树模型中的同一个叶子节点的。所以显然,一个目标图片集合对应的叶子节点一定是被选叶子节点。
其次,除了目标图片集合对应的叶子节点以外,可能还有其他叶子节点中的样本图片与目标图片集合中的目标图片的相似度较高。可选地,将与目标图片集合对应的叶子节点同属于一个父节点的叶子节点均作为该目标图片集合对应的被选叶子节点。
可选地,为了更精准地确定一个目标图片集合对应的被选叶子节点,可以首先为每个叶子节点确定一个用于表征它的表征数据,再基于该表征数据判断与目标图片集合对应的叶子节点较为接近的叶子节点作为被选叶子节点。作为本发明的一个实施例,如图3所示,上述S104包括:
S1041,根据所述叶子节点中包含的样本图片,计算用于表征所述叶子节点的节点特征矩阵。
可选地,由于每个叶子节点均包含样本图片,可以首先根据上文介绍的方法生成样本图片对应的样本特征矩阵,随后计算全部的样本特征矩阵的聚类中心矩阵,可以理解地,聚类中心矩阵中各个元素值为各个样本特征矩阵相同位置的元素值的平均值。将叶子节点包含的样本图片的聚类中心矩阵作为表征所述叶子节点的节点特征矩阵。
可选地,通过包围盒算法确定表征所述叶子节点的节点特征矩阵。具体地步骤包括:提取所述样本图片的特征信息,并建立样本图片的样本特征矩阵;根据所述叶子节点中包含的样本图片的样本特征矩阵,计算在超平面中包围所述叶子节点的全部所述样本特征矩阵的包围盒的顶点坐标;从所述包围盒的顶点坐标中选择一个顶点坐标作为用于表征所述叶子节点的节点特征矩阵。
可以理解地,由于每个样本特征矩阵在超平面中都对应一个坐标点,因此通过现有的包围盒算法可以计算出包围全部样本特征矩阵对应的坐标点的边框,进一步可以求出该包围盒的各个顶点坐标。由于包围盒算法为现有技术,所以顶点坐标的求解方法不在此详述。
可选地,在求解出一个叶子节点对应的包围盒的顶点坐标后,计算各个顶点坐标与全部样本图片的样本特征矩阵的聚类中心的距离,将一个与聚类中心的距离最远的顶点坐标作为该叶子节点的节点特征矩阵。
S1042,将所述目标图片集合对应的叶子节点作为目标叶子节点,并分别计算所述目标叶子节点的节点特征矩阵与其他的叶子节点的节点特征矩阵的距离。
可以理解地,通过上一步骤使得每个叶子节点都有了一个表征自己的节点特征矩阵,因此可以计算出目标图片集合本身对应的叶子节点即目标叶子节点与各个其他叶子节点的节点特征矩阵的距离。
S1043,将与所述目标叶子节点的节点特征矩阵的距离不大于第一距离阈值的叶子节点设定为被选叶子节点,将所述目标叶子节点也设定为被选叶子节点。
显然,一个节点的节点特征矩阵与目标叶子节点的节点特征矩阵越小,证明该节点中包含的样本图片与目标叶子节点中包含的样本图片的相似度可能越高。根据上文的论述可知,由于一个叶子节点对应的目标图片集合中的目标图片必然与该叶子节点(即目标叶子节点)包含的样本图片的相似度较高,所以在本发明实施例中目标叶子节点肯定要被设定为被选叶子节点。其次,与目标叶子节点的节点特征矩阵的距离不大于第一距离阈值的节点特征矩阵对应的叶子节点也会被设定为被选叶子节点,因为这些叶子节点中包含的样本图片由于与目标叶子节点中包含的样本图片的相似度较高,所以也很可能与目标图片集合中的目标图片相似。
本发明实施例,可以将各个被选节点中包含的样本图片作为目标图片集合对应的候选样本图片。并在后续的步骤中基于这些候选样本图片的类别,确定出目标图片集合中各个目标图片的类别。
S105,根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
在本发明实施例中,由于候选样本图片是根据上述步骤确定的可能与目标图片集合中各个目标图片想近似的图片,所以本发明实施例中,基于候选样本图片的类别确定各个目标图片的类别。
值得注意地,由于目标图片集合中包含多张目标图片,所以为了更精准的识别各个目标图片的类别,所以本发明实施例从本步骤开始对一个目标图片集合中的目标图片进行分别的识别,而在此之前,在步骤S103-S104中,为了避免对于相近似的目标图片的重复的计算步骤,都是对目标图片集合中的图片进行统一计算的。
作为本发明的一个实施例,如图4所示,上述S105包括:
S1051,提取所述候选样本图片以及所述目标图片的特征信息,并建立所述候选样本图片对应的候选特征矩阵以及所述目标图片对应的目标特征矩阵。
S1052,为各个所述目标图片选取与其对应的目标特征矩阵的距离不大于第二距离阈值的候选特征矩阵,作为所述目标图片的近邻特征矩阵,并将所述近邻特征矩阵对应的候选样本图片作为所述目标图片的近邻图片。
如上文所述,在本发明实施例中分别为各个目标图片选取与其对应的目标特征矩阵的距离不大于第二距离阈值的候选特征矩阵,作为近邻矩阵。
S1053,统计所述目标图片的全部近邻图片对应的类别的概率,将所述概率最大的类别作为所述目标图片对应的类别。
示例性地,假设一个目标图片有10个近邻图片,其中,有7个近邻图片的类别是类别1,有2个近邻图片的类别是类别2,有1个近邻图片的类别是类别3,则识别该目标图片的类别为类别1。
可以理解地,在本发明实施例中,通过获取一个以上的目标图片以及多个已知类别的样本图片;建立样本图片的分类树模型;根据分类树模型中各节点的分类规则,在分类树模型中确定目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;为每个目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;根据候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别,以提高图片类别的识别的并行性,避免重复冗余的识别计算。
实施例二
由于在很多实施场景下,用于识别目标图片的类别的样本图片的数量是十分巨大的,这时如果根据预设的分类规则,只建立一个包含全部样本图片的分类树模型,则该分类树模型的支路会非常多,分层也会非常多。这就会导致一个问题,即在上文实施例S103中搜索目标图片对应的叶子节点时,无论采用深度优先搜索或广度优先搜索,都会消耗很多搜索时间和计算资源。基于上述问题,所以本发明实施例二对建立样本图片的分类树模型的方法做了优化,如图5所示,上述S102还包括:
S1021,提取所述样本图片的特征信息,并建立所述样本图片对应的样本特征矩阵。
在本发明实施例中,由于每张样本图片都包含多个像素点,每个像素点都有其对应的特征信息,如:RGB值,所以在提取样本图片中各个像素点的特征信息后,可以建立出一个表征该样本图片的样本特征矩阵。由于根据图片的特征信息生成对应的特征矩阵的方法为现有技术,所以在此不进行详细介绍和限制。
S1022,对所述样本特征矩阵进行聚类,生成第一预设数量的聚类集合,所述聚类集合中包含多个样本特征矩阵。
可选地,通过K-means聚类算法计算全部的样本特征矩阵的K个聚类中心,即将全部的样本特征矩阵分为K个聚类集合。
S1023,根据各个聚类集合中包含的样本特征矩阵,分别建立各个聚类集合对应的分类树模型。
值得注意地,本发明实施例不只建立一个分类树模型,而是针对每一个聚类集合中的样本特征矩阵分别建立一个分类树模型。
具体地,将所述聚类集合中全部的样本特征矩阵作为所述分类树模型的根节点包含的样本特征矩阵;从所述根节点开始,每次通过一个预设的分类规则将所述分类树模型的节点包含的样本特征矩阵分配至多个子节点,直至所述分类树模型的叶子节点包含的样本特征矩阵的数量小于第二预设数量。
可以理解地,由于建立了多个分类树模型,所以在后续确定目标图片对应的叶子节点时,只需要选择其中一个分类树模型进行搜索即可,因此大大降低了计算量。
实施例三
基于实施例二针对各个聚类集合分别建立对应的分类树模型的基础上,实施例一中的步骤S103中:根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,具体实施方式如下:
本发明实施例提取所述目标图片的特征信息,并建立目标图片对应的目标特征矩阵;计算各个所述聚类集合的聚类中心与所述目标特征矩阵之间的距离,将与所述目标特征矩阵的距离最短的聚类中心对应的聚类集合作为被选聚类集合;从所述被选聚类集合对应的分类树模型的根节点开始,通过深度搜索方式,依次按照各节点的分类规则确定所述目标图片对应的叶子节点。
可以理解地,本发明实施例通过首先选取目标图片对应的分类树模型,再根据被选取的分类树模型中各节点的分类规则,判断目标特征矩阵对应的叶子节点,提升了选择目标图片对应的叶子节点的效率。
对应于上文实施例所述的应用升级方法,图6示出了本发明实施例提供的图片类别的识别装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图6,该装置包括:
获取模块601,用于获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;
建立模块602,用于建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;
组合模块603,用于根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;
选取模块604,用于为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;
识别模块605,用于根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
可选地,所述建立模块,包括:
提取子模块,用于提取所述样本图片的特征信息,并建立所述样本图片对应的样本特征矩阵;
聚类子模块,用于对所述样本特征矩阵进行聚类,生成第一预设数量的聚类集合,所述聚类集合中包含多个样本特征矩阵;
模型建立子模块,用于根据各个聚类集合中包含的样本特征矩阵,分别建立各个聚类集合对应的分类树模型。
可选地,所述模型建立子模块具体用于:将所述聚类集合中全部的样本特征矩阵作为所述分类树模型的根节点包含的样本特征矩阵;从所述根节点开始,每次通过一个预设的分类规则将所述分类树模型的节点包含的样本特征矩阵分配至多个子节点,直至所述分类树模型的叶子节点包含的样本特征矩阵的数量小于第二预设数量。
可选地,所述组合模块具体用于:提取所述目标图片的特征信息,并建立目标图片对应的目标特征矩阵;计算各个所述聚类集合的聚类中心与所述目标特征矩阵之间的距离,将与所述目标特征矩阵的距离最短的聚类中心对应的聚类集合作为被选聚类集合;从所述被选聚类集合对应的分类树模型的根节点开始,通过深度搜索方式,依次按照各节点的分类规则确定所述目标图片对应的叶子节点。
可选地,所述选取模块具体用于:
根据所述叶子节点中包含的样本图片,计算用于表征所述叶子节点的节点特征矩阵;将所述目标图片集合对应的叶子节点作为目标叶子节点,并分别计算所述目标叶子节点的节点特征矩阵与其他的叶子节点的节点特征矩阵的距离;将与所述目标叶子节点的节点特征矩阵的距离不大于第一距离阈值的叶子节点设定为被选叶子节点,将所述目标叶子节点也设定为被选叶子节点。
可选地,所述根据所述叶子节点中包含的样本图片,计算用于表征所述叶子节点的节点特征矩阵,包括:
提取所述样本图片的特征信息,并建立样本图片的样本特征矩阵;根据所述叶子节点中包含的样本图片的样本特征矩阵,计算在超平面中包围所述叶子节点的全部所述样本特征矩阵的包围盒的顶点坐标;从所述包围盒的顶点坐标中选择一个顶点坐标作为用于表征所述叶子节点的节点特征矩阵。
可选地,识别模块具体用于:
提取所述候选样本图片以及所述目标图片的特征信息,并建立所述候选样本图片对应的候选特征矩阵以及所述目标图片对应的目标特征矩阵;为各个所述目标图片选取与其对应的目标特征矩阵的距离不大于第二距离阈值的候选特征矩阵,作为所述目标图片的近邻特征矩阵,并将所述近邻特征矩阵对应的候选样本图片作为所述目标图片的近邻图片;统计所述目标图片的全部近邻图片对应的类别的概率,将所述概率最大的类别作为所述目标图片对应的类别。
在本发明实施例中,通过获取一个以上的目标图片以及多个已知类别的样本图片;建立样本图片的分类树模型;根据分类树模型中各节点的分类规则,在分类树模型中确定目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;为每个目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;根据候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别,以提高图片类别的识别的并行性,避免重复冗余的识别计算。
图7是本发明一实施例提供的终端设备的示意图。如图7所示,该实施例的终端设备包括:处理器70、存储器71以及存储在所述存储器71中并可在所述处理器70上运行的计算机程序72,例如图片类别的识别程序。所述处理器70执行所述计算机程序72时实现上述各个图片类别的识别方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,所述处理器70执行所述计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块601至605的功能。
所述终端设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是图片类别的识别装置7的示例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种图片类别的识别方法,其特征在于,包括:
获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;
建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;
根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;
为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;
根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
2.如权利要求1所述的图片类别的识别方法,其特征在于,所述建立所述样本图片的分类树模型,包括:
提取所述样本图片的特征信息,并建立所述样本图片对应的样本特征矩阵;
对所述样本特征矩阵进行聚类,生成第一预设数量的聚类集合,所述聚类集合中包含多个样本特征矩阵;
根据各个聚类集合中包含的样本特征矩阵,分别建立各个聚类集合对应的分类树模型。
3.如权利要求2所述的图片类别的识别方法,其特征在于,所述根据各个聚类集合中包含的样本特征矩阵,分别建立各个聚类集合对应的分类树模型,包括:
将所述聚类集合中全部的样本特征矩阵作为所述分类树模型的根节点包含的样本特征矩阵;
从所述根节点开始,每次通过一个预设的分类规则将所述分类树模型的节点包含的样本特征矩阵分配至多个子节点,直至所述分类树模型的叶子节点包含的样本特征矩阵的数量小于第二预设数量。
4.如权利要求2所述的图片类别的识别方法,其特征在于,所述根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,包括:
提取所述目标图片的特征信息,并建立目标图片对应的目标特征矩阵;
计算各个所述聚类集合的聚类中心与所述目标特征矩阵之间的距离,将与所述目标特征矩阵的距离最短的聚类中心对应的聚类集合作为被选聚类集合;
从所述被选聚类集合对应的分类树模型的根节点开始,通过深度搜索方式,依次按照各节点的分类规则确定所述目标图片对应的叶子节点。
5.如权利要求1所述的图片类别的识别方法,其特征在于,所述为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,包括:
根据所述叶子节点中包含的样本图片,计算用于表征所述叶子节点的节点特征矩阵;
将所述目标图片集合对应的叶子节点作为目标叶子节点,并分别计算所述目标叶子节点的节点特征矩阵与其他的叶子节点的节点特征矩阵的距离;
将与所述目标叶子节点的节点特征矩阵的距离不大于第一距离阈值的叶子节点设定为被选叶子节点,将所述目标叶子节点也设定为被选叶子节点。
6.如权利要求5所述的图片类别的识别方法,其特征在于,所述根据所述叶子节点中包含的样本图片,计算用于表征所述叶子节点的节点特征矩阵,包括:
提取所述样本图片的特征信息,并建立样本图片的样本特征矩阵;
根据所述叶子节点中包含的样本图片的样本特征矩阵,计算在超平面中包围所述叶子节点的全部所述样本特征矩阵的包围盒的顶点坐标;
从所述包围盒的顶点坐标中选择一个顶点坐标作为用于表征所述叶子节点的节点特征矩阵。
7.如权利要求1所述的图片类别的识别方法,其特征在于,所述根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别,包括:
提取所述候选样本图片以及所述目标图片的特征信息,并建立所述候选样本图片对应的候选特征矩阵以及所述目标图片对应的目标特征矩阵;
为各个所述目标图片选取与其对应的目标特征矩阵的距离不大于第二距离阈值的候选特征矩阵,作为所述目标图片的近邻特征矩阵,并将所述近邻特征矩阵对应的候选样本图片作为所述目标图片的近邻图片;
统计所述目标图片的全部近邻图片对应的类别的概率,将所述概率最大的类别作为所述目标图片对应的类别。
8.一种图片类别的识别装置,其特征在于,包括:
获取模块,用于获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;
建立模块,用于建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;
组合模块,用于根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;
选取模块,用于为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;
识别模块,用于根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
9.一种终端设备,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如下步骤:
获取一个以上的目标图片以及多个样本图片,其中,每个所述样本图片对应一个类别;
建立所述样本图片的分类树模型,所述分类树模型的每个节点均包含一个以上的样本图片;
根据所述分类树模型中各节点的分类规则,在所述分类树模型中确定所述目标图片对应的叶子节点,并将对应同一个叶子节点的目标图片组合成为该叶子节点对应的目标图片集合;
为每个所述目标图片集合在所述分类树模型中选取一个以上的叶子节点作为其对应的被选节点,并将所述被选节点中包含的样本图片作为目标图片集合对应的候选样本图片;
根据所述候选样本图片的类别确定所述目标图片集合中各个目标图片对应的类别。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的图片类别的识别方法的步骤。
CN201811628314.0A 2018-12-28 2018-12-28 图片类别的识别方法、装置及计算机可读存储介质 Active CN111382760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811628314.0A CN111382760B (zh) 2018-12-28 2018-12-28 图片类别的识别方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811628314.0A CN111382760B (zh) 2018-12-28 2018-12-28 图片类别的识别方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111382760A true CN111382760A (zh) 2020-07-07
CN111382760B CN111382760B (zh) 2023-08-25

Family

ID=71222965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811628314.0A Active CN111382760B (zh) 2018-12-28 2018-12-28 图片类别的识别方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111382760B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408670A (zh) * 2021-08-17 2021-09-17 深圳电通信息技术有限公司 图像分类方法和装置
CN114637873A (zh) * 2022-03-30 2022-06-17 徐州大工电子科技有限公司 基于图像相似性的门窗智能推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103618A1 (en) * 2011-10-24 2013-04-25 Oracle International Corporation Decision making with analytically combined split conditions
CN103559504A (zh) * 2013-11-04 2014-02-05 北京京东尚科信息技术有限公司 图像目标类别识别方法及装置
JP2014197412A (ja) * 2014-06-12 2014-10-16 トムソン ライセンシングThomson Licensing 画像の類似検索システム及び方法
CN107067020A (zh) * 2016-12-30 2017-08-18 腾讯科技(上海)有限公司 图片识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103618A1 (en) * 2011-10-24 2013-04-25 Oracle International Corporation Decision making with analytically combined split conditions
CN103559504A (zh) * 2013-11-04 2014-02-05 北京京东尚科信息技术有限公司 图像目标类别识别方法及装置
JP2014197412A (ja) * 2014-06-12 2014-10-16 トムソン ライセンシングThomson Licensing 画像の類似検索システム及び方法
CN107067020A (zh) * 2016-12-30 2017-08-18 腾讯科技(上海)有限公司 图片识别方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113408670A (zh) * 2021-08-17 2021-09-17 深圳电通信息技术有限公司 图像分类方法和装置
CN113408670B (zh) * 2021-08-17 2021-12-10 深圳电通信息技术有限公司 图像分类方法和装置
CN114637873A (zh) * 2022-03-30 2022-06-17 徐州大工电子科技有限公司 基于图像相似性的门窗智能推荐方法及系统
CN114637873B (zh) * 2022-03-30 2022-12-23 徐州大工电子科技有限公司 基于图像相似性的门窗智能推荐方法及系统

Also Published As

Publication number Publication date
CN111382760B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
US10013636B2 (en) Image object category recognition method and device
JP5916886B2 (ja) 画像特徴の類似性に基づく画像索引作成
WO2022042123A1 (zh) 图像识别模型生成方法、装置、计算机设备和存储介质
CN107679466B (zh) 信息输出方法和装置
US9626426B2 (en) Clustering using locality-sensitive hashing with improved cost model
CN110458078B (zh) 一种人脸图像数据聚类方法、系统及设备
JP2020038624A (ja) 車線処理方法及び装置
CN110399487B (zh) 一种文本分类方法、装置、电子设备及存储介质
CN111723815B (zh) 模型训练方法、图像处理方法、装置、计算机系统和介质
US20200279128A1 (en) Object Detection and Candidate Filtering System
CN114677565B (zh) 特征提取网络的训练方法和图像处理方法、装置
WO2020125100A1 (zh) 一种图像检索方法、装置以及设备
CN111639230B (zh) 一种相似视频的筛选方法、装置、设备和存储介质
CN110751191A (zh) 一种图像的分类方法及系统
CN112364916A (zh) 基于迁移学习的图像分类方法、相关设备及存储介质
CN113986674A (zh) 时序数据的异常检测方法、装置和电子设备
CN111382760B (zh) 图片类别的识别方法、装置及计算机可读存储介质
US20170293660A1 (en) Intent based clustering
CN112418256A (zh) 分类、模型训练、信息搜索方法、系统及设备
WO2022007596A1 (zh) 图像检索系统、方法和装置
CN114417095A (zh) 一种数据集划分方法及装置
CN116109907B (zh) 目标检测方法、装置、电子设备及存储介质
CN112560856A (zh) 车牌检测识别方法、装置、设备及存储介质
CN112131199A (zh) 一种日志处理方法、装置、设备及介质
CN111126501A (zh) 一种图像识别方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 516006 TCL science and technology building, No. 17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province

Applicant after: TCL Technology Group Co.,Ltd.

Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District

Applicant before: TCL Corp.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant