CN116824199A - 图像分类装置和方法 - Google Patents

图像分类装置和方法 Download PDF

Info

Publication number
CN116824199A
CN116824199A CN202210350403.3A CN202210350403A CN116824199A CN 116824199 A CN116824199 A CN 116824199A CN 202210350403 A CN202210350403 A CN 202210350403A CN 116824199 A CN116824199 A CN 116824199A
Authority
CN
China
Prior art keywords
image
estimation result
classification
circuit
target image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210350403.3A
Other languages
English (en)
Inventor
张嘉渊
郑楷儒
陈毓训
李浩平
许通明
丁敬原
陈少昂
陈冠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN116824199A publication Critical patent/CN116824199A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/84Arrangements for image or video recognition or understanding using pattern recognition or machine learning using probabilistic graphical models from image or video features, e.g. Markov models or Bayesian networks
    • G06V10/85Markov-related models; Markov random fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Holo Graphy (AREA)
  • Image Processing (AREA)
  • Sorting Of Articles (AREA)

Abstract

本发明提供了一图像分类装置和方法。图像分类装置包括存储装置、运算电路和分类电路。存储装置可存储多个图像类别对应的信息。运算电路耦接存储装置。运算电路可从图像提取装置取得目标图像,并取得目标图像对应的特征向量。此外,运算电路根据多个图像类别对应的信息和上述特征向量,取得对应目标图像的第一估计结果,以及根据参考图像,取得对应目标图像的第二估计结果,其中参考图像对应多个图像类别中的一个。分类电路耦接运算电路。分类电路可根据第一估计结果和第二估计结果,将目标图像加入多个图像类别中的一个。

Description

图像分类装置和方法
技术领域
本发明的实施例主要涉及一图像分类技术,特别涉及根据目标图像和多个分类图像相比所产生的一结果和藉由隐藏式马可夫模型(Hidden Markov Model,HMM)算法所产生的另一结果来进行图像分类的图像分类技术。
背景技术
随着科技的进步,图像分类的应用亦日益广泛。因此,如何产生更精确的图像分类结果将是个值得研究的课题。
发明内容
有鉴于上述现有技术的问题,本发明的实施例提供了一种图像分类装置和方法。
根据本发明的一实施例提供了一种图像分类装置。上述图像分类装置包括一存储装置、一运算电路和一分类电路。存储装置可用以存储多个图像类别对应的信息。运算电路耦接上述存储装置。运算电路可从一图像提取装置取得一目标图像,并取得上述目标图像对应的一特征向量。此外,运算电路可根据上述多个图像类别对应的上述信息和上述特征向量,取得对应上述目标图像的一第一估计结果,以及根据一参考图像,取得对应上述目标图像的一第二估计结果,其中参考图像对应上述多个图像类别中的一个。分类电路耦接上述运算电路。上述分类电路可根据上述第一估计结果和上述第二估计结果,将上述目标图像加入上述多个图像类别中的一个。
在一些实施例中,每一上述图像类别包括多个群图像。在一些实施例中,运算电路可根据上述特征向量和每一上述图像类别的每一群图像的群心,分别计算出上述特征向量对应上述每一上述图像类别的最短距离。当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值大于一临界值时,上述运算电路舍弃上述目标图像。当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值未大于一临界值时,上述运算电路根据上述特征向量对应上述每一上述图像类别的上述最短距离和一机率分布算法,计算出上述第一估计结果。
在一些实施例中,分类电路可将上述第一估计结果和上述第二估计结果相乘,以取得一第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
在一些实施例中,分类电路可将上述第一估计结果乘以一第一权重值,以产生一第一结果,且将上述第二估计结果乘以一第二权重值,以产生一第二结果,且上述分类电路将上述第一结果和上述第二结果相加,以产生一第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
在一些实施例中,分类电路可将上述目标图像加入上述多个图像类别中的一个后,更新加入上述目标图像的上述图像类别对应的上述信息。
根据本发明的一实施例提供了一种图像分类方法。上述图像分类方法适用一图像分类装置。上述图像分类方法的步骤包括:从一图像提取装置取得一目标图像;藉由上述图像分类装置的一运算电路取得上述目标图像对应的一特征向量;藉由上述运算电路根据上述多个图像类别对应的上述信息和上述特征向量,取得对应上述目标图像的一第一估计结果;藉由上述运算电路根据一参考图像,取得对应上述目标图像的一第二估计结果,其中参考图像对应上述多个图像类别中的一个;以及藉由上述图像分类装置之一分类电路根据上述第一估计结果和上述第二估计结果,将上述目标图像加入上述多个图像类别中的一个。
关于本发明其他附加的特征与优点,本领域技术人员在不脱离本发明的精神和范围内,当可根据本申请实施方法中所公开的图像分类装置和方法,做些许的更动与润饰而得到。
附图说明
图1是显示根据本发明的一实施例所述的一图像分类装置100的方块图。
图2是根据本发明的一实施例所述的图像分类方法的流程图。
【符号说明】
100:图像分类装置
110:存储装置
120:运算电路
130:分类电路
200:图像提取单元
S210~S250:步骤
具体实施方式
本章节所叙述的是实施本发明的较佳方式,目的在于说明本发明的精神而非用以限定本发明的保护范围,本发明的保护范围当视所附权利要求书界定范围为准。
图1是显示根据本发明的一实施例所述的一图像分类装置100的方块图。如图1所示,图像分类装置100可包括一存储装置110、一运算电路120以及一分类电路130。注意的是,在图1中所示的方块图,仅为了方便说明本发明的实施例,但本发明并不以图1为限。图像分类装置100中也可包含其他元件或其他连接方式。根据本发明一实施例,运算电路120和分类电路130可整合于一芯片中。甚至,存储装置110、运算电路120和分类电路130也可整合于一芯片中。
根据本发明的一实施例,存储装置110可是一易失性存储器(volatile memory)(例如:随机存取存储器(Random Access Memory,RAM)),或一非易失性存储器(Non-volatile memory)(例如:快闪存储器(flash memory)、只读存储器(Read Only Memory,ROM))、一硬盘或上述装置的组合。存储单元可用以存储要进行图像分类所需的文件和数据。
根据本发明的实施例,存储装置110可预先存储多个图像类别(class)的图像。根据本发明一实施例,每一图像类别可分别对应到一区域,例如:口腔中的不同区域,但本发明不以此为限。此外,根据本发明的实施例,每一图像类别所包含的图像可预先经由一分群算法分成多个群图像。
根据本发明一实施例,分群算法可是一k-平均(k-means)算法,但本发明不以此为限。在k-means算法中,使用者可预先决定要将一图像类别所包含的图像分成几个群(即预先决定每一图像类别所包含的群的个数)。此外,在k-means算法中,每一群会对应k-means算法中的一群心。也就是说,群心的数量会和群的数量相同。
根据本发明一实施例,图像分类装置100可从一图像提取装置200取得一目标图像(即目前时间点,图像提取装置200所提取到的图像),并将目标图像加入适当的图像类别中。在本发明的实施例中,在不同时间点,图像提取装置200可被移动到不同位置,以提取不同图像类别(区域)对应的图像。关于如何将目标图像加入适当的图像类别中底下会有更详细的描述。
根据本发明一实施例,当要将目标图像加入适当的图像类别中时,运算电路120会先提取目标图像的一特征向量。在一实施例中,运算电路120可将目标图像输入一深度学习算法模型,以取得目标图像对应的特征向量。在此实施例中,深度学习算法可是一卷积神经网络(Convolutional Neural Network,CNN)算法(例如:MobileNet、EfficiebtNet、ResNet等),但本发明不以此为限。
运算电路120取得目标图像对应的特征向量后,运算电路120会去计算目标图像对应的特征向量和每一图像类别的每一群的群心的距离,并取出目标图像对应的特征向量和每一图像类别所对应的一最短距离。举例来说,若存储装置110中存储了N个图像类别,且每一图像类别包含的图像被分成M群,目标图像对应的特征向量为v,则目标图像对应的特征向量v和每一图像类别所对应的最短距离可表示为:
Dv,n=min(dv,1,dv,2,…,dv,m),n∈{1,2,…,N},m∈{1,2,…,M},
其中Dv,n表示目标图像对应的特征向量v和第n个图像类别所对应的最短距离,dv,m表示目标图像对应的特征向量v和图像类别的每一群的群心的距离。
根据本发明一实施例,运算电路120会去判断目标图像对应的特征向量和每一图像类别所对应的最短距离的最小值是否大于一临界值。
根据本发明一实施例,临界值可是根据一四分位距(interquartile range,IQR)算法所计算出,但本发明不以此为限。具体来说,存储在存储装置110的所有图像和其所对应的群心间的距离可预先被计算出来。接着,再根据IQR算法,将所有图像和其所对应的群心间的距离进行统计,以求得IQR算法中的第一四分位数Q1、第二四分位数Q2和第三四分位数Q3,以及四分位距IQR(即IQR=Q3-Q1),并将临界值设定为(Q3+1.5IQR)。
若目标图像对应的特征向量和每一图像类别所对应的最短距离的最小值大于临界值(其意义表示目标图像和每一图像类别都不相似),运算电路120就会决定将此目标图像视为瑕疵图像,并舍弃此目标图像。以上面例子来说,若min(Dv,1,Dv,2,…,Dv,N)>临界值,运算电路120就会决定舍弃此目标图像。
若目标图像对应的特征向量和每一图像类别所对应的最短距离的最小值未大于临界值,运算电路120可藉由一机率分布算法将目标图像对应的特征向量和每一图像类别所对应的最短距离的倒数进行一机率分布运算,以取得目标图像对应每一类别的机率(即第一估计结果)。
根据本发明一实施例,机率分布算法可是一softmax算法,但本发明不以此为限。softmax算法可将多类别的数值转换为分布范围在[0,1]且总和为1的机率分布。以上面例子为例,目标图像对应每一类别的机率(即第一估计结果)可表示为:
其中{pi,1,pi,2,…,pi,N}表示目标图像i对应每一类别n(n∈{1,2,…,N})的机率。
根据本发明的实施例,运算电路120亦会根据一隐藏式马可夫模型(HiddenMarkov Model,HMM)算法和一参考图像,去计算目标图像对应每一类别的机率(即第二估计结果)。根据本发明一实施例,相较于目前时间点的目标图像,参考图像可是前一时间点的目标图像,且其所对应的图像类别是存储装置110所存储的多个图像类别中的一个。举例来说,参考图像可是时间点t-1的目标图像,且其对应的图像类别(或区域)为已知(已估计,参考上述说明)。因此,参考图像和其对应的图像类别将可用来估计目前时间点t的目标图像对应每一图像类别的机率(即估计图像提取装置200从时间点t-1(参考图像)到目前时间点t(目标图像),参考图像所对应的图像类别(区域)移动到每一图像类别(区域)的机率)。
根据本发明一实施例,存储装置110更会存储每一图像类别(区域)彼此对应的移动机率。具体来说,每一区域彼此对应的移动机率表示,当图像提取装置200在连续的时间点提取图像时,图像提取装置200从一区域移动到另一区域的机率。运算电路120可藉由HMM算法,根据每一区域彼此对应的移动机率和参考图像对应的图像类别(区域),取得目标图像对应每一图像类别的机率(即第二估计结果)。
根据本发明另一实施例,存储装置110更会存储每一图像类别(区域)彼此对应的距离信息。更明确地来说,每一图像类别(区域)彼此对应的距离Zi,j会被预先测量,并记录在存储装置110,其中Zi,j表示从区域i移动到区域j的距离。此外,在此实施例中,运算电路120可根据一第一算法取得目标图像和参考图像间的一位移信息。
在一实施例中,第一算法可是一图像比对算法(例如:特征点比对算法)。在此实施例中,运算电路120可比对目标图像和参考图像包含的特征点,并计算特征点移动了多少像素。运算电路120取得移动的像素后,由于像素与距离具有比例关系,即可推估参考图像和目标图像间的距离变化d(即位移信息)。
在另一实施例,第一算法可是一惯性测量单元(Inertial measurement unit,IMU)算法。在此实施例中,运算电路120可根据参考图像的惯性测量单元(IMU)信息和目标图像的惯性测量单元(IMU)信息,取得参考图像和目标图像加速度变化和时间变化,进而估计出参考图像和目标图像间的距离变化d(即位移信息)。
取得位移信息后,运算电路120可藉由HMM算法,根据每一图像类别(区域)彼此对应的距离信息(即距离Zi,j)、参考图像对应的图像类别(区域)(例如:区域i)和计算出的位移信息(即距离变化d),取得目标图像对应每一图像类别的机率(即第二估计结果)。具体来说,运算电路120可将距离变化d和距离Zi,j的差距(即|d-Zi,j|)带入一机率密度函数中,以产生一机率密度函数分布图(即第二估计结果)。举例来说,运算电路120会将距离变化d和距离Zi,j的差距(即|d-Zi,j|)带入一指数分布函数中:
其中运算电路120将距离变化d和距离Zi,j的差距(即|d-Zi,j|)作为指数分布函数的输入值x。在此实施例中,距离变化d和距离Zi,j的差距(即|d-Zi,j|)越小,表示从区域i(即参考图像对应的区域)移动到所对应到区域j(即目标图像可能对应到的区域)的机率值会越大。运算电路120可藉由该实施例估计目标图像对应每一图像类别的机率(即第二估计结果)。
根据本发明另一实施例,存储装置110更会存储每一图像类别(区域)彼此对应的角度信息。更明确地来说,每一图像类别(区域)此对应的角度ri,j会被预先测量,并记录在存储装置110,其中ri,j表示从区域i移动到区域j的角度。此外,在此实施例中,运算电路120根据一第二算法取得目标图像和参考图像间的一角度变化信息。
在一实施例,第二算法可是一惯性测量单元算法。在此实施例中运算电路120可根据参考图像的惯性测量单元(IMU)信息和目标图像的惯性测量单元(IMU)信息,取得参考图像和目标图像角速度变化和时间变化,估计出参考图像和目标图像间的转动角度变化c(即角度变化信息)。
取得角度变化信息后,运算电路120可藉由HMM算法,根据每一图像类别(区域)彼此对应的角度信息(即角度ri,j)、参考图像对应的图像类别(区域)(例如:区域i)和角度变化信息(即转动角度变化c),取得目标图像对应每一图像类别的机率(即第二估计结果)。具体来说,运算电路120可将转动角度变化c和角度ri,j的差距(即|c-ri,j|)带入一机率密度函数中,以产生一机率密度函数分布图(即第二位置估计结果)。举例来说,运算电路120会将转动角度变化c和角度ri,j的差距(即|c-ri,j|)带入一指数分布函数中:
其中运算电路120将转动角度变化c和角度ri,j的差距(即|c-ri,j|)作为指数分布函数的输入值x。在此实施例中,转动角度变化c和角度ri,j的差距(即|c-ri,j|)越小,表示从区域i(即参考图像对应的区域)移动到所对应到区域j(即目标图像可能对应到的区域)的机率值会越大。运算电路120可藉由该实施例估计目标图像对应每一图像类别的机率(即第二估计结果)。
根据本发明的一实施例,当运算电路120取得第一估计结果和第二估计结果后,分类电路130可将第一估计结果和第二估计结果相乘,以取得一第三估计结果。接着,分类电路130可根据第三估计结果中的最大值,将目标图像加入对应第三估计结果中的最大值的图像类别(即目标图像最有可能对应的图像类别)中。举例来说,若第一估计结果{pi,1,pi,2,…,pi,N}且第二估计结果{hi,1,hi,2,…,hi,N},第三估计结果和第三估计结果中的最大值可分别表示为:
Pi,n=pi,n×hi,n,n∈{1,2,…,N},
Ci=argmax(Pi,1,Pi,2,…,Pi,N)
其中Pi,n表示对应目标图像i的第三估计结果,Ci表示第三估计结果中的最大值。
根据本发明的另一实施例,当运算电路120取得第一估计结果和第二估计结果后,分类电路130可将第一估计结果乘以一第一权重值,以产生一第一结果,且将第二估计结果乘以一第二权重值,以产生一第二结果。接着,分类电路130可将第一结果和第二结果相加,以产生一第三估计结果。最后,分类电路130可根据第三估计结果中的最大值,将目标图像加入对应第三估计结果中的最大值的图像类别(即目标图像最有可能对应的图像类别)中。举例来说,若第一估计结果是{pi,1,pi,2,…,pi,N}且第二估计结果是{hi,1,hi,2,…,hi,N},第三估计结果和第三估计结果中的最大值可分别表示为:
Pi,n=w1×pi,n+w2×hi,n,n∈{1,2,…,N},
Ci=argmax(Pi,1,Pi,2,…,Pi,N)
其中Pi,n表示对应目标图像i的第三估计结果,w1表示第一权重值,w2表示第二权重值,Ci表示第三估计结果中的最大值。
根据本发明的一实施例,当分类电路130将目标图像加入对应第三估计结果中的最大值的图像类别中后,分类电路130可再藉由分群算法(例如:k-means算法),更新加入目标图像的图像类别对应的信息。举例来说,目标图像加入一图像类别后,该图像类别所包含的每一群的群心可能会发生改变,用以更加准确地判断下一时间点或下一张的目标图像所对应的图像类别。
图2是根据本发明的一实施例所述的一图像分类方法的流程图。图像分类方法可适用图像分类装置100。如图2所示,在步骤S210,图像分类装置100从一图像提取单元取得一目标图像。
在步骤S220,图像分类装置100的运算电路取得目标图像对应的一特征向量。
在步骤S230,图像分类装置100的运算电路根据多个图像类别对应的信息和目标图像对应的特征向量,取得对应目标图像的一第一估计结果。
在步骤S240,图像分类装置100的运算电路根据隐藏式马可夫模型(HiddenMarkov Model,HMM)算法和一参考图像,取得对应目标图像的一第二估计结果,其中参考图像对应上述多个图像类别中的一个。
在步骤S250,图像分类装置100的分类电路根据第一估计结果和第二估计结果,将目标图像加入多个图像类别中的一个。
根据本发明一实施例,在图像分类方法中,每一图像类别可包括多个群图像。
根据本发明一实施例,在图像分类方法的步骤430中,图像分类装置100的运算电路可根据目标图像对应的特征向量和每一图像类别的每一群图像的群心,分别计算出目标图像对应的特征向量对应每一图像类别的最短距离。
根据本发明一实施例,在图像分类方法中,当目标图像对应的特征向量对应每一图像类别的最短距离的最小值大于临界值时,图像分类装置100的运算电路可舍弃目标图像。当目标图像对应的特征向量对应每一图像类别的最短距离的最小值未大于临界值时,图像分类装置100的运算电路根据目标图像对应的特征向量对应每一上述图像类别的最短距离和一机率分布算法,计算出第一估计结果。
根据本发明一实施例,在图像分类方法的步骤450中,图像分类装置100的分类电路可将第一估计结果和第二估计结果相乘,以取得一第三估计结果,并根据第三估计结果将目标图像加入多个图像类别中的一个。
根据本发明另一实施例,在图像分类方法的步骤450中,图像分类装置100的分类电路可将第一估计结果乘以一第一权重值,以产生一第一结果,且将第二估计结果乘以一第二权重值,以产生一第二结果。接着,图像分类装置100的分类电路可将第一结果和第二结果相加,以产生一第三估计结果,并根据第三估计结果将目标图像加入多个图像类别中的一个。
根据本发明一实施例,在图像分类方法中,在将目标图像加入多个图像类别中的一个后,图像分类装置100的分类电路可更新加入目标图像的图像类别对应的信息。
根据本发明提出的图像分类方法,将可藉由图像分类装置更精确地取得目标图像所对应的图像类别。此外,根据本发明提出的图像分类方法,将可藉由图像分类装置持续地更新每一图像类别所对的信息,以增加后续图像分类的准确性。
本说明书中以及权利要求书中的序号,例如“第一”、“第二”等等,仅为了方便说明,彼此之间并没有顺序上的先后关系。
本发明的说明书所公开的方法和算法的步骤,可直接通过执行一处理器直接应用在硬件以及软件模块或两者的结合上。一软件模块(包括执行指令和相关数据)和其它数据可存储在数据存储器中,像是随机存取存储器(RAM)、快闪存储器(flash memory)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、电子可擦除可编程只读存储器(EEPROM)、暂存器、硬盘、便携式应碟、光盘只读存储器(CD-ROM)、DVD或在此领域已知技术中任何其它计算机可读的存储介质格式。一存储介质可耦接至一机器装置,举例来说,像是计算机/处理器(为了说明的方便,在本说明书以处理器来表示),上述处理器可通过来读取信息(像是程序代码),以及写入信息至存储介质。一存储介质可整合一处理器。一特殊应用集成电路(ASIC)包括处理器和存储介质。一用户设备则包括一特殊应用集成电路。换句话说,处理器和存储介质以不直接连接用户设备的方式,包含于用户设备中。此外,在一些实施例中,任何适合计算机程序的产品包括可读取的存储介质,其中可读的存储介质包括和一或多个所公开实施例相关的程序代码。在一些实施例中,计算机程序的产品可包括封装材料。
以上段落使用多种层面描述。显然的,本文的教示可以多种方式实现,而在范例中公开的任何特定架构或功能仅为一代表性的状况。根据本文的教示,本领域技术人员应理解在本文公开的各层面可独立实作或两种以上的层面可以合并实作。
虽然本公开已以实施例公开如上,然其并非用以限定本公开,任何本领域技术人员,在不脱离本公开的精神和范围内,当可作些许的更动与润饰,因此发明的保护范围当视所附权利要求书界定范围为准。

Claims (16)

1.一种图像分类装置,包括:
存储装置,存储多个图像类别对应的信息;以及
运算电路,耦接上述存储装置,从图像提取装置取得目标图像,并取得上述目标图像对应的特征向量,其中上述运算电路根据上述多个图像类别对应的上述信息和上述特征向量,取得对应上述目标图像的第一估计结果,且其中上述运算电路根据参考图像,取得对应上述目标图像的第二估计结果,其中上述参考图像对应上述多个图像类别中的一个;以及
分类电路,耦接上述运算电路,其中上述分类电路根据上述第一估计结果和上述第二估计结果,将上述目标图像加入上述多个图像类别中的一个。
2.如权利要求1所述的图像分类装置,其中上述每一上述图像类别包括多个群图像。
3.如权利要求2所述的图像分类装置,其中上述运算电路根据上述特征向量和每一上述图像类别的每一群图像的群心,分别计算出上述特征向量对应上述每一上述图像类别的最短距离。
4.如权利要求3所述的图像分类装置,其中当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值大于临界值时,上述运算电路舍弃上述目标图像。
5.如权利要求3所述的图像分类装置,其中当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值未大于临界值时,上述运算电路根据上述特征向量对应上述每一上述图像类别的上述最短距离和机率分布算法,计算出上述第一估计结果。
6.如权利要求1所述的图像分类装置,其中上述分类电路将上述第一估计结果和上述第二估计结果相乘,以取得第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
7.如权利要求1所述的图像分类装置,其中上述分类电路将上述第一估计结果乘以第一权重值,以产生第一结果,且将上述第二估计结果乘以第二权重值,以产生第二结果,且上述分类电路将上述第一结果和上述第二结果相加,以产生第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
8.如权利要求1所述的图像分类装置,其中上述分类电路将上述目标图像加入上述多个图像类别中的一个后,更新加入上述目标图像的上述图像类别对应的上述信息。
9.一种图像分类方法,适用图像分类装置,包括:
从图像提取装置取得目标图像;
藉由上述图像分类装置的运算电路取得上述目标图像对应的特征向量;
藉由上述运算电路根据上述多个图像类别对应的上述信息和上述特征向量,取得对应上述目标图像的第一估计结果;
藉由上述运算电路根据参考图像,取得对应上述目标图像的第二估计结果,其中上述参考图像对应上述多个图像类别中的一个;以及
藉由上述图像分类装置的分类电路根据上述第一估计结果和上述第二估计结果,将上述目标图像加入上述多个图像类别中的一个。
10.如权利要求9所述的图像分类方法,其中上述每一上述图像类别包括多个群图像。
11.如权利要求10所述的图像分类方法,还包括:
藉由上述运算电路根据上述特征向量和每一上述图像类别的每一群图像的群心,分别计算出上述特征向量对应上述每一上述图像类别的最短距离。
12.如权利要求11所述的图像分类方法,还包括:
当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值大于临界值时,藉由上述运算电路舍弃上述目标图像。
13.如权利要求11所述的图像分类方法,还包括:
当上述特征向量对应上述每一上述图像类别的上述最短距离的最小值未大于临界值时,藉由上述运算电路根据上述特征向量对应上述每一上述图像类别的上述最短距离和机率分布算法,计算出上述第一估计结果。
14.如权利要求9所述的图像分类方法,还包括:
藉由上述分类电路将上述第一估计结果和上述第二估计结果相乘,以取得第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
15.如权利要求9所述的图像分类方法,还包括:
藉由上述分类电路将上述第一估计结果乘以第一权重值,以产生第一结果,且将上述第二估计结果乘以第二权重值,以产生第二结果,且上述分类电路将上述第一结果和上述第二结果相加,以产生第三估计结果,并根据上述第三估计结果将上述目标图像加入上述多个图像类别中的一个。
16.如权利要求9所述的图像分类方法,还包括:
藉由上述分类电路将上述目标图像加入上述多个图像类别中的一个后,更新加入上述目标图像的上述图像类别对应的上述信息。
CN202210350403.3A 2022-03-18 2022-04-02 图像分类装置和方法 Pending CN116824199A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW111110045A TWI806500B (zh) 2022-03-18 2022-03-18 影像分類裝置和方法
TW111110045 2022-03-18

Publications (1)

Publication Number Publication Date
CN116824199A true CN116824199A (zh) 2023-09-29

Family

ID=82703037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210350403.3A Pending CN116824199A (zh) 2022-03-18 2022-04-02 图像分类装置和方法

Country Status (4)

Country Link
US (1) US20230298316A1 (zh)
EP (1) EP4246461A1 (zh)
CN (1) CN116824199A (zh)
TW (1) TWI806500B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI528197B (zh) * 2013-09-26 2016-04-01 財團法人資訊工業策進會 相片分群系統及相片分群方法與電腦可讀取記錄媒體
TWI622020B (zh) * 2016-09-26 2018-04-21 財團法人成大研究發展基金會 使用二階區域二元圖的分群方法及疊代影像測試系統
TWI721553B (zh) * 2019-09-06 2021-03-11 廣達電腦股份有限公司 牙區辨識系統
CN110837869A (zh) * 2019-11-11 2020-02-25 深圳市商汤科技有限公司 图像分类模型训练方法、图像处理方法及装置
CN112819019B (zh) * 2019-11-15 2023-06-20 财团法人资讯工业策进会 分类模型生成装置及其分类模型生成方法
JP2023528688A (ja) * 2020-05-22 2023-07-05 ニデック アドバンステクノロジー カナダ コーポレーション 自動欠陥分類検査装置を訓練する方法及びシステム
TWI744000B (zh) * 2020-09-21 2021-10-21 財團法人資訊工業策進會 影像標記裝置、方法及其電腦程式產品
TWI744083B (zh) * 2020-11-10 2021-10-21 廣達電腦股份有限公司 口腔區域定位裝置和方法

Also Published As

Publication number Publication date
TW202338728A (zh) 2023-10-01
EP4246461A1 (en) 2023-09-20
TWI806500B (zh) 2023-06-21
US20230298316A1 (en) 2023-09-21

Similar Documents

Publication Publication Date Title
CN110188223B (zh) 图像处理方法、装置及计算机设备
CN106897666B (zh) 一种室内场景识别的闭环检测方法
CN109002562B (zh) 一种仪器识别模型训练方法和装置及仪器识别方法和装置
JP4697670B2 (ja) 識別用データ学習システム、学習装置、識別装置及び学習方法
CN113674328A (zh) 一种多目标车辆跟踪方法
CN109978035B (zh) 基于改进的k-means和损失函数的行人检测方法
JP5806606B2 (ja) 情報処理装置、情報処理方法
EP1873687A2 (en) Parameter learning method, parameter learning apparatus, pattern classification method, and pattern classification apparatus
CN109492576B (zh) 图像识别方法、装置及电子设备
US20150161468A1 (en) Image processing apparatus, image processing method, and program
CN107240097B (zh) 基于mkl-svm-pso算法的肺结节图像处理方法
CN110363165B (zh) 基于tsk模糊系统的多目标跟踪方法、装置及存储介质
CN110716792B (zh) 一种目标检测器及其构建方法和应用
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN108198172B (zh) 图像显著性检测方法和装置
CN110689044A (zh) 一种结合目标间关系的目标检测方法及系统
Bhuyan et al. Trajectory guided recognition of hand gestures having only global motions
CN115409896A (zh) 位姿预测方法、装置、电子设备和介质
CN110490058B (zh) 行人检测模型的训练方法、装置、系统和计算机可读介质
CN109961103B (zh) 特征提取模型的训练方法、图像特征的提取方法及装置
JP5989576B2 (ja) パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法
Lee et al. Reinforced adaboost learning for object detection with local pattern representations
CN113406623A (zh) 基于雷达高分辨距离像的目标识别方法、装置及介质
CN107636678B (zh) 用于预测图像样本的属性的方法和设备
CN116824199A (zh) 图像分类装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination