具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行识别脊柱矢状位图像异常的方法200,程序数据124中就包含了用于执行上述各方法的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、图像输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中以编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在一些实施例中,计算机可读介质中存储一个或多个程序,这一个或多个程序中包括执行某些方法(如方法200)的指令。
计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。当然,计算设备100也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机,或者是具有上述配置的服务器。本发明的实施方式对此均不作限制。
图2示出了根据本发明一个实施例的识别脊柱矢状位图像异常的方法200的流程图。在脊柱矢状位图像中,完整的脊柱椎体按如下顺序自下而上依次排列:1块骶骨、5块腰椎、12块胸椎和7块颈椎。方法200通过对脊柱矢状位图像进行特征提取,将代表该脊柱矢状位图像的多个特征向量输入预设分类模型,通过预设分类模型将输入的特征向量分为正常和异常两类,以识别出该脊柱矢状位图像中是否存在异常、并定位到异常的具体部位(例如,哪一块图像区域包含的部位出现异常)。根据一种实现方式,脊柱矢状位图像的异常可能表现为成像模糊(如块效应)、椎间盘突出、椎体形状异常、椎管狭窄等等。
以下将结合图2,详细阐述根据本发明实施例的识别脊柱矢状位图像异常的方法200的流程。
如图2所示,方法200始于步骤S210,从脊柱矢状位图像中截取出每块椎骨的感兴趣区域,生成至少一个感兴趣区域图像。
根据本发明的实施方式,脊柱矢状位图像的异常主要针对于椎间盘突出,在本发明的实施例中,感兴趣区域选取包含间盘和骨髓交汇处的区域。在根据本发明的一个实施例中,先定位出脊柱矢状位图像中的每一块椎骨,可以通过常规的图像处理算法或者深度学习方法等定位出脊柱矢状位图像中的椎骨,当然也可以人工标注出各块椎骨,本发明对此不做限制。将定位到的椎骨通过矩形框标注出来,矩形框应当包含整块椎骨区域,那么,根据矩形框的四个顶点就可以确定出椎骨的中心点。接着,以相邻椎骨的中心点的连线为边生成对应的正方形,该正方形所包含的区域就是感兴趣区域。再从脊柱矢状位图像中截取出对应的每个正方形,并对其进行缩放处理,就生成了感兴趣区域图像。在根据本发明的实施例中,感兴趣区域图像的尺寸是固定的,均为60×60,但不受限于此。
如图3A,示出了根据本发明一个实施例的脊柱矢状位图像的示意图。图3A中示例性地示出了两个正方形区域(在图3A中以加粗的正方形框表示),其中每个正方形区域指向的就是图像中的一个感兴趣区域,截取出正方形区域并对其进行缩放处理,最终得到两个感兴趣区域图像,分别如图3B和图3C所示。其中,图3B示出的图像是一个正常的感兴趣区域图像,其所指示的椎间盘区域是健康的,而图3C示出的图像是一个异常的感兴趣区域图像,其所指示出的椎间盘区域是不健康的。
随后在步骤S220中,提取每个感兴趣区域图像的至少一个特征。一般地,图像的信息包括形状、纹理和颜色三大类,在根据本发明的实施方式中,所提取的感兴趣区域图像的特征应当尽可能包含图像的形状特征、纹理特征和颜色特征,由于脊柱矢状位图像一般是灰度图像,故颜色特征可以只提取亮度特征来表示。例如,在根据本发明的一个实施例中,所提取的至少一个特征包括:局部纹理特征、方向梯度的金字塔直方图特征、亮度直方图特征和胡矩特征。
以下给出了上述特征的计算过程。
局部纹理特征通过LBP(Local Binary Patten,局部二值模式)来描述。LBP算子通过对像素与其邻域内的像素的对比结果进行求和,来计算图像的局部纹理信息。具体来说,通过如下两步提取感兴趣区域图像的局部纹理特征:①首先,对感兴趣区域图像中的每个像素,通过判断以其为中心的邻域内各像素与其的大小关系,生成该像素的二进制值。在根据本发明一个实施例中,邻域采用圆形邻域,其中半径为5,且本发明的实施例对邻域半径及邻域内采样点个数不做限制。假设邻域内采样点个数为8,将邻域内这8个像素的灰度值与该中心像素的灰度值一一进行比较,若邻域内某个像素的灰度值大于中心像素的灰度值,则该像素的位置对应被标记为1,否则为0。这样,邻域内的8个像素经比较后可产生一个8位二进制数,如11010001,就是该中心像素的二进制值;②然后,利用直方图统计所有像素的二进制值,统计出每个二进制值出现的频率,根据统计所得的直方图输出一个1×L1大小的向量,其中L1是第一长度,该向量就代表了第一长度的局部纹理特征,例如可以表示为(lbp1,lbp2,lbp3,...,lbpL1)。在根据本发明的实施例中,第一长度为62。
方向梯度的金字塔直方图特征,即PHOG(Pyramid Histogram of OrientedGradients)特征,PHOG是一种描述空间形状的特征向量,概括来说,在感兴趣区域图像尺寸固定的情况下,计算不同尺度下的特征,最后将这些特征进行拼接就得到PHOG特征。根据本发明的一个实施例,提取方向梯度的金字塔直方图特征的步骤包括:①先根据不同的预定尺度将感兴趣区域图像分割成不同数量个子图像,在根据本发明的实施例中,按照3种预定尺度对感兴趣区域图像进行分割,在第一种预定尺度下,所有分割所得的子图像的尺寸为10×10,在第二种预定尺度下,所有分割所得的子图像的尺寸为15×15,在第三种预定尺度下,所有分割所得的子图像的尺寸为20×20;②在每种预定尺度下,计算每个子图像中各像素点的梯度方向和梯度幅值,根据各像素点的梯度方向和梯度幅值生成该预定尺度下感兴趣区域图像的方向梯度直方图特征,例如,将梯度方向的范围等分成若干个区间,将每个像素根据梯度方向划分到相应的区间并统计各区间内的像素的梯度幅值,得到一个直方图,根据该直方图生成一个向量,就是该预定尺度下的方向梯度直方图特征(也称作HOG);③拼接不同预定尺度下的方向梯度直方图特征,得到一个1×L2大小的向量,其中L2是第二长度,该向量就表示了感兴趣区域图像的第二长度的方向梯度的金字塔直方图特征,例如可以表示为(phog1,phog2,phog3,...,phogL2)。在根据本发明的实施例中,第二长度为560。
方向梯度直方图特征因其能很好地描述图像的形状信息而被常用于目标检测等应用。图4A和图4B分别示出了根据本发明一些实施例的感兴趣区域图像的PHOG特征图,其中,图4A是图3B的PHOG特征图,图4B是图3C的PHOG特征图,图4A和图4B中横纵坐标表示了图像中像素的坐标位置。在图4A和图4B中,矩形条指示了提取的梯度,比较图4A和图4B可得,图4A更为清晰,且人眼直观的感受是矩形条更亮,这表示图4A的梯度单一且梯度值较大;而图4B较为模糊,且人眼直观的感受是矩形条较暗,这表示图4B的梯度具有多个方向。图4A作为一个正常的感兴趣区域图像的PHOG特征图,其中梯度方向具有一定的规律并基本一致,而图4B作为一个存在异常的感兴趣区域图像的PHOG特征图,其中梯度较为杂乱,尤其是图4B中右侧部分,有明显的倾斜角度。通过图4A和图4B可见,利用PHOG特征能够很好地对比出正常和异常感兴趣区域图像的特征。
亮度直方图特征,即HPI(Histogram of Pixel Instensity)特征。在前期研究中发现,通常发生椎间盘突出或退化时,间盘-脊髓三角区会出现失水变性,表现在脊柱矢状位图像上就是图像中相应的区域会变暗。鉴于此,在根据本发明的实施方式中,通过统计亮度直方图特征来区分正常和异常的感兴趣区域图像。根据本发明的一个实施例,提取亮度直方图特征的步骤包括:①统计感兴趣区域图像中各亮度值的像素个数(在根据本发明的一个实施例中,亮度值的范围为[0,255],但本发明不受限于此);②计算各亮度值的像素个数占感兴趣区域图像像素总数的概率值,当然,也可以将亮度值范围划分为多个亮度区间,再统计各亮度区间内像素个数占像素总数的概率值(或者是直接统计各亮度值的像素个数,生成亮度直方图特征,本发明对此不作限制);③基于概率值生成一个1×L3大小的向量,其中L3表示第三长度,就是第三长度的亮度直方图特征,例如可以表示为(hpi1,hpi2,hpi3,...,hpiL3)。在根据本发明的实施例中,第三长度为256。
图5A和图5B分别示出了根据本发明一些实施例的感兴趣区域图像的亮度直方图,其中,横坐标表示亮度值,纵坐标表示像素个数,图5A是图3B的亮度直方图,图5B是图3C的的亮度直方图。比较图5A和图5B可见,图5B在低亮度值区域(如亮度值为1-50的区域)分布有更多的像素,图5A和图5B的亮度直方图特征有明显区别,也就是正常和异常感兴趣区域图像的亮度直方图特征具有明显区别。
胡矩,也称为几何不变矩,胡矩是一种全局图像的形状描述子,具有平移、旋转和尺度不变性。
设一个M×N大小的数字图像f(x,y),其p+q阶几何矩(标准矩)和中心矩分别用公式(1)和公式(2)表示:
式中,p为图像x方向的阶数,q为图像y方向的阶数,和是图像的重心,其计算公式表示为:
式中,m10、m01是图像的1阶几何矩,m00是图像的0阶几何矩。
通过对中心矩进行归一化来实现尺度不变性,归一化的中心矩用公式(5)表示为:
式中,ρ=(p+q)/2+1。
根据本发明的一个实施例,提取胡矩特征的步骤包括:①综合上述公式(1)-(5),计算出感兴趣区域图像的二阶和三阶归一化中心矩,包括:η30、η03、η20、η02、η21、η12、η11;②根据二阶和三阶归一化中心矩计算出7个不变矩,这7个不变矩表示如下:
M1=η20+η02,
M3=(η30-3η12)2+(3η21-η03)2,
M4=(η30+η12)2+(η21-η03)2,
M5=(η30-3η12)(η30+η12)[(η30+η12)2-(3η21+η03)2]+(3η21-η03)(η03+η21)[3(η30+η12)2-(η21+η03)2],M6=(η20-η02)2[(η30+η12)2-(η21+η03)2]+4η11(η30+η12)(η21+η03),
M7=(3η21-3η03)(η30+η12)[(η30+η12)2-3(η21+η03)2]+(3η12-η30)(η03+η21)[3(η30+η12)2-(η21+η03)2],③拼接上述7个不变矩得到初始胡矩特征,初始胡矩特征是一个1×7的向量;④对初始胡矩特征进行取对数运算,在根据本发明的实施例中,按如下公式对初始胡矩特征做log运算:Hu=-sign(hu)*log10(|hu|),式中,Hu表示取对数运算后的胡矩特征,hu是初始胡矩特征,sign()是符号函数,|hu|表示取hu的绝对值。根据本发明的一个实施例,为防止胡矩值过大,可以对初始胡矩特征中的7个元素分别取对数运算,再将结果拼接起来,得到第四长度的胡矩特征,例如可以表示为(hu1,hu2,hu3,...,huL4),L4表示第四长度,取值为7。
鉴于上述原因,在根据本发明的实施方式中选取了上述4组特征来描述感兴趣区域图像的内容,在计算出感兴趣区域图像的各个特征后,随后在步骤S230中,基于这至少一个特征生成每个感兴趣区域图像的特征向量。在根据本发明的实施例中,依次拼接第一长度的局部纹理特征、第二长度的方向梯度的金字塔直方图特征、第三长度的亮度直方图特征和第四长度的胡矩特征,就得到了感兴趣区域图像的特征向量,在根据本发明的一个实施例中,该特征向量的长度为885,即62+560+256+7=885。
随后在步骤S240中,将特征向量输入预设分类模型,以确定感兴趣区域图像的类别。
根据本发明的实现方式,方法200还包括步骤:预先利用训练图像训练生成预设分类模型。这样,在后续测试过程中,将感兴趣区域图像的特征向量直接输入生成的预设分类模型中,就可以确定出感兴趣区域图像的类别。根据本发明的一个实施例,训练生成预设分类模型的过程可以分成如下四个步骤。
第一步,收集脊柱矢状位图像来生成训练图像集合。先从收集的脊柱矢状位图像中截取出每块椎骨的感兴趣区域,对于感兴趣区域的定义同前文所述,感兴趣区域选取包含间盘和骨髓交汇处的区域。感兴趣区域按如下方式生成:以相邻椎骨的中心点的连线为边生成对应的正方形,其中该正方形所包含的区域就是感兴趣区域。这样,从脊柱矢状位图像中截取出所有的感兴趣区域,再将所截取的每个感兴趣区域缩放到预定尺寸(在根据本发明的实施例中,预定尺寸设为60×60),作为一个训练图像,所有脊柱矢状位图像的所有感兴趣区域图像就形成了一个训练图像集合。
第二步,提取训练图像的至少一个特征。根据本发明的实施例,提取的至少一个特征包括局部纹理特征、方向梯度的金字塔直方图特征、亮度直方图特征和胡矩特征。具体地特征提取算法及描述可参见前文关于步骤S220的描述,此处不再展开。
第三步,基于所提取的至少一个特征生成每个训练图像的特征向量。具体可参见前文关于步骤S230的描述,此处不再赘述。
第四步,将训练图像的特征向量及标签输入预训练的分类模型,基于决策函数生成预设分类模型。根据本发明的实施方式,分类模型采用SVM(Support vector machine,支持向量机)模型。SVM是机器学习技术的一种,是基于分类边界的方法。其中,每个训练图像用一个特征向量(feature vector)来表示。鉴于SVM是实际应用最多的分类器之一,其精确度较高,且训练和测试过程的计算复杂度都不算高,故在本发明的实施例中选用SVM模型对感兴趣区域图像进行分类。针对所有的训练图像,训练向量可以表示为其中,每一个x代表一个训练图像的特征向量,如前文所述,是一个长度为885的向量,所有训练图像生成一个标签向量y∈{1,-1}n,其中,y=1表示训练图像属于正常的感兴趣区域图像,y=-1表示训练图像属于异常的感兴趣区域图像。
将所有训练图像的特征向量和标签输入到预训练的SVM模型中,通过决策函数,求得最优超平面,使得两个分类中的“点集”到此平面的最小距离最大,就得到了预设分类模型。SVM属于本领域已知内容,此处不做进一步阐述,本发明的实施例对此亦不做限制。在根据本发明的实施例中,决策函数定义为:
如上文所述,式中,n表示训练图像的数量,xi表示输入的第i个训练图像的特征向量,yi表示输入的第i个特征向量的标签,K(xi,x)表示核函数,αi是第i个特征向量的系数,ρ是实数。在根据本发明的一个实施例中,核函数采用线性核函数,即K(xi,xj)=<xi,xj>,也就是向量的内积。
训练完成后,将感兴趣区域图像的特征向量输入训练好的预设分类模型中,计算出表征该感兴趣区域图像类别的值,在根据本发明的实施例中,感兴趣区域图像的类别值为0和1。
随后在步骤S250中,基于感兴趣区域图像的类别判断其对应的感兴趣区域是否异常。根据本发明的实施方式,当感兴趣区域图像的类别为0时,确定其对应的感兴趣区域正常;当感兴趣区域图像的类别为1时,确定其对应的感兴趣区域异常。
进一步地,若感兴趣区域图像正常,则可以据此预测该感兴趣区域图像所包含的椎间盘健康;若感兴趣区域图像异常,则可以据此预测该感兴趣区域图像所包含的椎间盘不健康。该预测结果可以作为参考,辅助专业医生完成对脊柱矢状位图像的诊断。
研究发现,在执行上述步骤S210时,有时会由于椎骨中心点的选取误差而导致截取出错误的感兴趣区域,进而生成错误的感兴趣区域图像。对椎骨中心点的选取误差可能来自定位算法的误差,也可能是人工标注的误差,总之,将错误的感兴趣区域图像输入预设分类模型,必然会影响识别结果,甚至会干扰到预测结果。尤其是在靠近骶骨的区域,更易产生这样的误差。如图6,示出了根据本发明一个实施例的脊柱矢状位图像的示意图,其中,用正方形框圈出的区域就是感兴趣区域,可以看出,图像最下方靠近骶骨处的感兴趣区域并不是包含间盘和骨髓交汇处的区域,它与其它几个感兴趣区域所包含的形状也不相同,因此可以推断,图像最下方的感兴趣区域是一个错误的感兴趣区域。
鉴于此,根据本发明的实现方式,在方法200中加入过滤感兴趣区域的步骤,以进一步保证识别结果的准确性。
根据一种实施方式,步骤S220,即,提取出每个感兴趣区域图像的至少一个特征的步骤,可以按如下方式执行。
首先,提取感兴趣区域图像的方向梯度的金字塔直方图特征,即PHOG特征。提取PHOG特征的步骤可以简单概括为,在感兴趣区域图像尺寸固定的情况下,计算不同尺度下的特征,再将这些不同尺度下的特征进行拼接就得到PHOG特征。关于PHOG特征的详细描述和计算过程可参考前文所述,此处不再赘述。
然后,计算当前感兴趣区域图像的方向梯度的金字塔直方图特征与预设方向梯度的金字塔直方图特征的余弦相似度。在根据本发明的实施例中,预设方向梯度的金字塔直方图特征根据所有训练图像的方向梯度的金字塔直方图特征确定。参见前文步骤S240的相关描述,在训练生成预设分类模型的过程中,提取了训练图像的PHOG特征,在根据本发明的一个实施例中,计算整个训练图像集合中所有训练图像的PHOG特征的平均值,作为预设PHOG特征,但本发明对此不作限制。根据本发明的实施例,感兴趣区域图像的PHOG特征与预设PHOG特征的余弦相似度cos(θ)通过如下公式进行计算:
其中,p表示感兴趣区域图像的方向梯度的金字塔直方图特征,表示预设方向梯度的金字塔直方图特征,||·||表示模长。
当然,本发明的实施例对计算当前感兴趣区域图像的PHOG特征与预设PHOG特征的相似度的方法不作限制,可以采用如上所述的余弦相似度进行计算,也可以采用欧氏距离等算法来计算,任何相似度度量算法均可以于本发明的实施例相结合,实现本发明的方法200。
最后,根据计算所得的余弦相似度判断是否要过滤掉该感兴趣区域图像。根据本发明的一个实施例,若算得的余弦相似度大于阈值(在根据本发明的实施例中,阈值取0.8,但不受限于此),则从至少一个感兴趣区域图像中过滤掉该感兴趣区域图像;若余弦相似度不大于阈值,则接着提取该感兴趣区域图像的其它特征,如局部纹理特征、亮度直方图特征和胡矩特征,并接着执行后续步骤S230等,以实现方法200。
图7示出了对图6中选取的8个感兴趣区域进行上述过滤处理后,得到的感兴趣区域。对比图6和图7可见,位于脊柱矢状位图像最下方的错误的感兴趣区域已被滤除,说明根据本发明的过滤感兴趣区域的方案是有效的。
综上,根据本发明的方案,通过预先训练生成预设分类模型,当从脊柱矢状位图像中选取出每块椎骨的感兴趣区域并生成感兴趣区域图像后,对感兴趣区域图像进行特征提取并生成特征向量,将其特征向量输入到预设分类模型,根据预设分类模型的输出来判定该感兴趣区域图像是否异常。若一张脊柱矢状位图像中的所有感兴趣区域图像均正常,则可预测该脊柱矢状位图像所包含的间盘区域健康;若不是,则可根据异常的感兴趣区域图像的位置,辅助专业医生进一步对其进行诊断。
进一步地,考虑到从脊柱矢状位图像中正确选取感兴趣区域,是本方案的一个关键点,在根据本发明的实施方式中,通过计算感兴趣区域图像特征,对比感兴趣区域图像的特征与预设特征的相似度,进而对感兴趣区域图像进行过滤选择。实验证明,根据本发明的过滤方案能够有效滤除错误的感兴趣区域图像,使得识别结果更加准确。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明一并公开了:
A8、如A4-7中任一项所述的方法,其中,提取局部纹理特征的步骤包括:对感兴趣区域图像中的每个像素,通过判断以其为中心的邻域内各像素与其的大小关系,生成像素的二进制值;以及利用直方图统计所有像素的二进制值,生成第一长度的局部纹理特征。
A9、如A4-8中任一项所述的方法,其中,提取方向梯度的金字塔直方图特征的步骤包括:根据不同的预定尺度将感兴趣区域图像分割成不同数量个子图像;在每种预定尺度下,计算每个子图像中各像素点的梯度方向和梯度幅值;根据各像素点的梯度方向和梯度幅值生成该预定尺度下感兴趣区域图像的方向梯度直方图特征;拼接不同预定尺度下的方向梯度直方图特征,生成感兴趣区域图像的第二长度的方向梯度的金字塔直方图特征。
A10、如A4-9中任一项所述的方法,其中,提取亮度直方图特征的步骤包括:统计感兴趣区域图像中各亮度值的像素个数;计算各亮度值的像素个数占感兴趣区域图像像素总数的概率值;以及基于概率值生成第三长度的亮度直方图特征。
A11、如A4-10中任一项所述的方法,其中,提取胡矩特征的步骤包括:计算感兴趣区域图像的二阶和三阶归一化中心矩;根据二阶和三阶归一化中心矩计算出7个不变矩;拼接7个不变矩得到初始胡矩特征;以及对初始胡矩特征进行取对数运算,生成第四长度的胡矩特征。
A12、如A4-11所述的方法,其中,基于至少一个特征生成特征向量的步骤包括:依次拼接第一长度的局部纹理特征、第二长度的方向梯度的金字塔直方图特征、第三长度的亮度直方图特征和第四长度的胡矩特征,生成特征向量。
A14、如A2-13中任一项所述的方法,其中,决策函数定义为:
其中,n表示训练图像的数量,xi表示输入的第i个训练图像的特征向量,yi表示输入的第i个特征向量的标签,K(xi,x)表示核函数,αi是第i个特征向量的系数,ρ是实数。
A15、如A5-14中任一项所述的方法,其中,余弦相似度定义为:
其中,p表示方向梯度的金字塔直方图特征,表示预设方向梯度的金字塔直方图特征,||·||表示模长。
A16、如A15所述的方法,其中核函数为线性核函数。
A17、如A5所述的方法,其中,阈值为0.8。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。