CN101189641B - 编码数字图像的像素或体素的方法及处理数字图像的方法 - Google Patents
编码数字图像的像素或体素的方法及处理数字图像的方法 Download PDFInfo
- Publication number
- CN101189641B CN101189641B CN2006800161897A CN200680016189A CN101189641B CN 101189641 B CN101189641 B CN 101189641B CN 2006800161897 A CN2006800161897 A CN 2006800161897A CN 200680016189 A CN200680016189 A CN 200680016189A CN 101189641 B CN101189641 B CN 101189641B
- Authority
- CN
- China
- Prior art keywords
- pixel
- voxel
- image
- window
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/20—Contour coding, e.g. using detection of edges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
Abstract
对数字或数字化的二维图像或三维图像的像素或体素进行编码的方法,其包括如下步骤:提供数字图像,其包括二维像素阵列或三维体素阵列,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度、饱和度和纯度)或RGB值来定义各个像素或体素;将所述图像的各个像素或体素作为目标像素或体素,并且,对于每个目标像素或体素,通过包含所述目标像素或体素以及周围的一些像素或体素的像素或体素窗口形成邻域;对于每个目标像素或体素,生成与所述目标像素或体素单义地相关的向量,生成的所述向量的分量是所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数。所述目标像素或体素的以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的数值矩阵的特征参数或所述数值矩阵的变换的特征参数。本发明还涉及图像处理方法,在其中利用例如人工神经网络的预测算法对根据以上方法编码的图像数据进行处理。
Description
技术领域
编码数字或数字化图像的像素或体素的方法以及处理数字或数字化图像的方法,具体地,识别应用所述编码像素或体素的方法的成像目标的特征。
本发明涉及一种对数字或数字化的二维或三维图像的像素或体素进行编码的方法,其包括如下步骤:
a)提供以二维像素阵列或三维体素阵列构成的数字图像,通过至少一个变量,如灰度图像中的亮度(intensity)或彩色图像中的HSV(色度、饱和度以及纯度)或RGB值来定义各个像素或体素;
b)将所述图像的各个像素或体素作为目标像素或体素,并且,对于每个目标像素或体素,通过包含所述目标像素或体素以及一定量的周围像素或体素的像素或体素窗口形成邻域(neighborhood);
c)对于每个目标像素或体素,生成与所述目标像素或体素单义(univocally)相关的向量,所述向量的分量被生成为所述目标像素或体素以及所述像素或体素窗口的每一个或一部分像素或体素的值的函数。
背景技术
数字或数字化图像是在显示器屏幕或打印拷贝上的具有一定外观(appearance)的小的二维或三维点的形式。
通过所述点的阵列形成各个数字或数字化图像,所述点在二维图像中称为像素,在三维图像中称为体素。
可以通过物理变量来描述各个像素或体素的外观,所述物理变量是在通过显示屏幕或者当印刷在纸上时的某一视觉效果中变换得到的值。
在黑白图像中,诸如灰度图像,不同灰度级单义地与由成像实体的一部分反射或生成的束的亮度值相关,其中对所述成像实体获取了数字或数字化图像的像素。各个不同灰度级的亮度单义地与由所述成像实体反射或发射的束的物理参数相关,特别地与其亮度有关。所述束的物理类型可以是任何种类,诸如任何光谱场中的电磁辐射或者可由成像材料生成或反射或散射的声辐射或其它类型的束。
在彩色图像中,通常使用三种不同的值单义地定义像素的外观。已知不同的系统,例如,所谓的HSV(色度、饱和度、纯度)或RGB(红、绿、蓝)系统。这些系统是等效的,并且能够被不同地用于通过值单义地描述所述像素或体素的外观。
因此,定义数字或数字化图像的像素或体素阵列能够通过单义地数值地表示所述图像的数值的二维或三维矩阵来表示。
以向量的形式对二维或三维图像的像素或体素进行编码的方法已为我们所熟知并且使用所述二维或三维数值表示。
文献EP 1,345,154公开了一种对数字或数字化图像的像素或体素进行编码的方法,其中所述图像利用表示所述数字或数字化图像的像素或体素的所述数值矩阵,生成用于表示所述图像的各个像素或体素的向量。
在该文献中,对于被当作将被编码的目标像素或体素的所述数字图像的每个像素或体素,定义所述目标像素或体素的某一周围环境,该环境包括了一定数量的像素或体素,其中包含所述目标像素或体素以及所述目标像素或体素周围的一些像素或体素。这个窗口是像素或体素的子阵列并且通过单义地表示所述数字图像的所述像素或体素的数值矩阵的对应子矩阵来表示。
所述向量包括作为其分量的描述所述窗口的目标像素或体素以及周围像素或体素的数值。
所以例如考虑灰度图像,其中表示图像的各个像素的值为其亮度并定义了与具有3×3像素的像素子阵列或具有3×3×3体素的体素子阵列相对应的窗口,所述向量分别包括9或27个分量。考虑彩色图像,所述向量至少具有三个用于描述每个像素或体素的值,于是所述向量的数值分量对于二维图像是3×3×3=27个分量而对于三维图像是3×3×3×3=81个分量。
当使用更大的像素或体素窗口时,所述分量的个数急剧地增加。
现在考虑固定的图像区域,所述数字图像的分辨率由每图像区域的像素或体素的数量给出。所以通过提高分辨率,某个图像包括更多的像素。
因而利用所述编码方法,例如数字化处理所述图像的编码方法,必须处理大量的数值数据,以致需要高计算能力以及长计算时间。
在任何情况下,所述已知方法都能够给出令人惊叹的结果,具体地,例如在图像增强或图像模式识别领域中。上述编码方法基于这样的思想,即,图像的各个像素或体素的含义,其关于由所述像素或体素表示的成像实体的一部分的特性或特征,主要取决于所述像素或体素的数值数据与周围像素或体素的数值数据之间的空间关系。
在数字图像处理领域中,该原理已经被用于获得几种不同的结果。
例如,我们已知,将表示包括了图像的目标像素或目标体素的目标像素或体素窗口的数值数据矩阵的特征值用于以某种方式表示所述目标像素或体素或所述目标像素或体素相对于所述窗口的其他像素或体素的某种关系。
此外,在所谓的图像模式识别方法中,一些图像处理器已经被开发用于识别数字图像中的边缘或角。
如以上所概括的,这些处理器典型地通过,将数字图像的各个像素或体素定义为目标像素或体素,进一步定义一般大小n×m(典型地n=m)的像素或体素窗口来工作,其中所述窗口包括所述目标像素或体素以及一些周围的像素或体素,以及通过应用表示各个像素或体素窗口的数值矩阵的某种变换来工作。
文献“Neural Network for robot image feature classification,Acomparative study”NEURAL NETWORK FOR SIGNAL PROCESSINGY1994 IV Proceedings of the 1994 IEEE Workshop Ermioni Greece 6-8sept.1994,New York,NY,USA,IEEE by Sharma V.R.Madiraju et al,公开了一种特征提取器,其被训练用于识别特征,诸如图像中的直线、曲线、连接点或其他的几何形状。
所述特征提取器以一定量的特征模型为基础,所述模型被这样生成以致包括了对于各种边缘类型的每一种的模型。这符合所述技术的目的,即必须使机器人能够识别形状和成像目标。
所述模型是以作为数字图像所关心的像素的中心像素为中心的3×3像素窗口。为了以旋转不变的方式描述所述特征,使用了这样的特征描述符,即与所述3×3像素窗口对应的协方差矩阵的特征空间。
正如其清楚地显示的,这种模型是一种滤波器,其目的在于通过确定图像的像素是否为存在于所述图像中的几何结构的一部分来识别该几何结构。被如此识别的几何结构可以被用于通过在所述图像中已识别的形状来识别所述成像目标。通过利用人工神经网络来作出像素是否为诸如边缘、角、曲线或类似的几何结构或形状的一部分的判定。受限于所述像素是边缘的一部分、角的或直线的或曲线的或其他几何结构的一部分的事实,由所述神经网络给出的结果仅仅是所述像素的所述特征。没有获得与由图像中的像素表示的真实成像目标的所述部分的特征或特性相关的信息。根据上述文献的处理受限于仅仅“图示的(pictorial)”特征。
所以,例如这些方法对于边缘检测的应用使用了在如下描述中的更详细地定义的所谓梯度矩阵。所述梯度矩阵的使用已有Introductorytechniques for 3-D Computer Vision,E.Trucco and A.Verri,Prentice Hall,1998的例子。
另一种被称为Hessian矩阵的处理器,其对应于描述所述像素或体素窗口的原始数值数据矩阵的二阶微分,通过其特征值描述,被用作例如增强图像细节的显著特征的图像处理器(Jirí Hladuvka,Andreas Knig,andEduard Grller.Exploiting Eigenvalues of the Hessian Matrix for VolumeDecimation.In Václav Skala,editor,9th International Conference inCentral Europe on Computer Graphics,Visualization,and ComputerVision(WSCG 2001),Pages 124-129,2001)。
在EP 1345154中公开的图像处理方法,由于对图像像素进行编码的特殊方式,能够提供由所述图像中的像素表示的成像目标的一部分的特征的分类,不同于这种方法,所述边缘检测方法,将其功能限制于与某几何结构有关的图像的像素的分类,其中在所述图像中所述像素属于该几何结构或者表示它。因而考虑所述边缘检测方法以及类似的方法,为了具有与由所述图像中的所述像素表示的成像真实目标的一部分的特性或特征相关的信息或预测,这些不能或不会专注于对图像像素进行分类。对于涉及窗口像素的参数的矩阵,其协方差矩阵的特征值或其他函数的其他参数的使用,仅描述了所述像素所属的几何结构的某种模型。考虑替代文献EP1345154中所公开的方法,清楚地显示了,目的在于,通过处理对表示真实目标的图像的像素的外观进行描述的参数,来获得关于所述真实目标的一部分的特性或特征的信息,其中该部分由所述真实目标图像中的某一像素表示。当前的边缘检测技术不解决该技术问题,这些方法所用的模型甚至也被怀疑能够帮助执行上述分类任务。
在可对角化(2D)矩阵的情况下,所述特征值是所述矩阵及其属性的代表(representative)。例如,秩,其作为(2D)矩阵最重要的属性之一,可以通过特征值来表征:事实上,对于可对角化(2D)矩阵,非零特征值的个数等于其秩。
梯度和Hessian矩阵,特别地,为可对角化(2D)矩阵,然后我们能够利用其特征值来描述其特征。
一般而言,这对于其他(2D)矩阵并不成立。通过本发明,我们能够通过考虑所述(2D)矩阵的奇异值来克服这个问题(D.Bini,M.Capovani,O.Menchi“Metodi numerici per l’algebra lineare”,Zanichelli)。事实上,奇异值是所述(2D)矩阵的代表,即使所述矩阵不是可对角化的。例如,对于每个(2D)矩阵,非零奇异值的个数等于秩。
对于3D矩阵,存在广义性:事实上,对于一般的M×N×K 3D矩阵,能够找到表征所述矩阵的N+M+K个广义奇异值(A multilinear singularvalue decomposition,Lieven De Lathauwer,Bart De Moor,JoosVandewalle,SIAM Journal on Matrix Analysis and Applications Volume21,Number 4 pp.1253-1278)。
其他处理方法被用于处理图像数据,其中,让我们回顾诸如小波变换,自相关变换以及共生矩阵变换的方法。
小波变换典型地被用于图像压缩。对于小波变换更精确的描述请参看附录1。
所述小波变换允许通过一组基函数来表示图像数据阵列。所述基函数的子集的使用使得能够减少与相关图像信息有关的参数。因而能够获得图像数据的压缩而没有显著特征的严重损失。
典型地在具有维度2^n×2^n的窗口上计算所述小波变换;能够以所述窗口边缘的信息损失为代价计算任意大小窗口的小波变换。为了通过小波变换表征单个像素,我们能够围绕所述目标像素构建4个窗口,这4个窗口分别在左下角、右下角、左上角、右上角具有所述目标像素,并且每个窗口具有维度2^n×2^n。因而我们能够利用这四个数值矩阵的小波变换的系数中的一个或多个来编码所述目标像素。
图像数据的自相关和共生变换提供了所述图像纹理信息的一组相当重要的参数。
然而,所有已知编码方法受限于如下事实,即,总是仅仅通过利用由包括将被编码的目标像素或体素的像素或体素窗口定义的邻域的像素或体素的数值对所述像素或体素编码。
发明内容
本发明致力于提供这样的方法,其根据上述步骤对数字或数字化的二维或三维图像的像素或体素进行编码并提供较少的单义地表示具体用于数字图像处理的目标像素或体素的数值数据,并且特别地,提供自动识别由所述目标像素或体素表示的成像目标的一部分的特性或特征的方法。
根据本发明,通过对数字或数字化的二维或三维图像的像素或体素进行编码的方法达到以上目的,其包括如下步骤:
a)提供以二维像素阵列或三维体素阵列构成的数字图像,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度、饱和度及纯度)或RGB值来定义各个像素或体素;
b)将所述图像的各个像素或体素作为目标像素或体素,并且,对于每个目标像素或体素,通过包含所述目标像素或体素以及一定数目的周围像素或体素的像素或体素窗口形成邻域;
c)对于每个目标像素或体素,生成与所述目标像素或体素单义相关的向量,所述向量的分量被生成为所述目标像素或体素以及所述像素或体素窗口的每一个或一部分像素或体素的值的函数;在开头已经描述了所述方法,并且在该方法中,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的数值矩阵或该数值矩阵的变换的特征参数。
如上所已经强调的,本方法不受限于或专注于,确定所述图像的像素是否属于在一系列预先配置的不同几何结构的模型之中的某种预定的几何结构,但其专注于,对于表示图像中的真实成像目标的至少一部分的像素,通过对描述其外观的参数进行处理,获得与所述真实成像目标的至少所述部分的某个特征或特性相关的信息。根据本发明,以更加广泛的方式通过所述处理方法分析图像像素之间的拓扑关系,并且,令人惊奇地,对于单义地定义了像素外观并且还考虑了一定周围的像素的关系的参数,其数值表示和拓扑信息能够提供起始数据,从该数据并非预测所述图像的特性或特征而是预测正被成像的真实目标的一部分的特性或特征。所述图像处理方法深深地不同于当前已知的图像处理方法,由于其目的在于利用图像中的真实世界的表示来对其进行说明,而不在于仅仅识别图像目标的形状。
在本说明书中以及在权利要求中,术语编码(coding或encoding)具有利用标量参数的n-维空间数值地表示图像中像素的外观的含义,通过所述标量参数单义地描述各个像素并与所述图像中的其他像素区分。
当参照一般的矩阵时,许多种特征参数能够被可选地或组合地使用。
第一组可能的参数由包括了所选窗口的像素或体素的图像数据的数值矩阵的奇异值形成。
可选地或组合地,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的所述数值矩阵的梯度矩阵的特征值。
可选地或组合地,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的所述数值矩阵的Hessian矩阵的特征值。
作为进一步的选项,能够可选地或组合地提供以上公开的选项,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的所述数值矩阵的小波变换的一个或多个系数。
在这种情况下,能够可选地或组合地选择使用几种小波基函数。
在附录1中给出了所述小波变换的更详细的描述。该附录包括可从因特网获得的并且由Duke大学的Brani Vidakovic和Peter Mueller所著的标题为“Wavelet for Kids,A tutorial introduction”的公开文献。在该文献中概括并讨论了小波的理论,并且公开了其对于图像处理的一些应用。如公开了图像处理中的小波这个章节所显示的,进行小波分解允许获得参数。对于所述分解的每一层级,小波变换生成一个表示平均的矩阵和三个表示所谓细节的矩阵。从上述矩阵中的一个或多个,通过例如但不仅仅对所述矩阵元素的取平均,或第二个举例即通过取得所述矩阵的奇异值,能够提取一些参数。所有这些参数或其中一些能够被用于形成向量的分量,所述向量用于按照目标像素或体素与被包括在所选窗口中的周围像素或体素的关系来表示各个像素或体素。
此外,可选地或组合地,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的所述数值矩阵的自相关变换的一个或多个系数。
图像处理中的自相关典型地被用作为表征图像纹理的工具并由两个图像的数学估计组成。能够在不同时刻获取所述两个图像,或能够通过在空间上移动第一个图像并将结果作为第二个图像来生成。所述自相关确定了这两个图像之间的关系。该数学估计提供了减少在编码所述目标像素或体素中应考虑的参数数目的可能性。
此外,可选地或组合地,所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的所述数值矩阵的共生矩阵(或其奇异值)。
对于由固定空间关系分离的一对像素,所述共生矩阵是灰度级的二维直方图。该矩阵近似于一对像素的联合概率分布。典型地将其用于计算纹理测度,比如对比度和熵。
在以上情况的任何一种中,如果考虑与上述已知编码方法具有相同数量的像素或体素的像素或体素窗口,则用于编码各个目标像素或目标体素的向量具有减少的分量个数,其中上述已知编码方法将描述被包括在所选窗口中的各个像素或体素的数值作为所述向量的参数。
在这种情况下,可能的并有利的是,通过表示窗口的像素或体素的数值的矩阵的特征值或奇异值,和/或表示所述窗口的像素或体素的所述数值矩阵的梯度矩阵或Hessian矩阵的特征值,和/或小波变换的一个或多个系数和/或自相关变换的一个或多个系数,和/或共生矩阵一个或多个表列值(entry)或奇异值的组合,对各个像素或体素编码。
通过由简单地表示各个像素或体素的外观的值组成的原始数值矩阵的所述不同变换的所述奇异值和/或特征值,和/或通过小波变换的一个或多个系数,和/或自相关变换的一个或多个系数,和/或共生矩阵的一个或多个表列值或奇异值,来概括描述各个目标像素或体素以及由选定的像素或体素窗口定义的所选邻域的像素或体素的数值之间的关系,并且在各个向量中,该关系由不同的数值所定义,其中所述数值特别适合于强调在所选窗口内的图像像素或体素之间的某种关系或对此关系敏感。
作为进一步的改进,表示所述图像的像素或体素的矩阵的数值数据在编码之前能够受到一个或多个预处理步骤的处理,在本说明书中能够将所述步骤定义为预处理(滤波)步骤。
例如,能够执行预处理步骤以增强对比度,或者其他已知的图像预处理步骤能够被可选地或组合地使用。
在进行根据本发明的编码之前,能够在数字图像上进行相对复杂或高度演化的预处理步骤。
这些预处理方法中的一个包括如US 5,140,670中所描述的图像处理以及利用所谓的CNN细胞神经网络。在文献WO2005/020132中描述了一种可选的预处理方法并将其称为ACM。
在这两种情况下,所述图像数据,即,代表所述图像的像素或体素阵列的每一个像素或体素外观的数值阵列,都被设置为相当于神经网络的结点,并且通过应用扫描所述神经网络的结点的算子或通过简单地让所述网络演化来处理所述图像数据。
在第一种情况下,典型地使用所谓的网络,并且定义了一个接一个扫描所述网络的单个结点的算子。
在第二种情况下,为所述网络定义了学习函数和/或启动函数,其改变所述结点的内部状态并因而改变其值或连接权重,并且所述结点的内部值或所述连接权重被用于修改所述图像数据。
为了设法对所述图像数据进行滤波,以诸如减少或抑制噪声影响的方式和/或增强对比度或图像数据的其他特征的方式进行这种预处理。
这种预处理还对所述图像的像素或体素外观进行监督的修改,并且在某种程度上增强像素或体素外观与由所述像素或体素表示的目标之间的某些关系。因而,在经过预处理的图像中表示相关特征或成像目标的图像的某些部分是更好识别的,从而使得,当与用于自动识别所述成像目标的特性(quality)的预测算法结合应用本编码方法时,其有助于所述图像数据的进一步的分类处理,其中在所述预测算法中输入数据包括根据本发明的方法编码的图像的像素或体素。
本发明还涉及处理数字或数字化图像的方法,其包括如下步骤:
a)提供已知目标的一组数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度,饱和度和纯度)或RGB值来定义各个像素或体素,所述数字图像的各个像素或体素是所述成像目标的对应区域或部分的表示,其中已知所述成像目标的所关心的特性或特征,并且所述已知特性或特征与所述数字图像的对应像素或体素单义地相关。
b)根据以上公开的本发明的方法的可能变型之一,对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,并且,将所述图像的像素或体素与其对应并且由向量表示其体素或像素的成像目标的区域或部分的已知的特性或特征与所述向量单义地相关。
c)提供一种诸如神经网络的预测算法;
d)通过将与已知目标的所述图像的各个像素或体素单义地相关的向量用作输入数据,并且通过将所述图像的像素或体素与其对应且所述向量的每一个与其单义地相关的成像目标的区域或部分的已知特性或特征用作输出数据,来进行所述预测算法的训练和测试;
e)提供目标的数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度、饱和度和纯度)或RGB值来定义各个像素或体素,所述数字图像的各个像素或体素是其特性或特征必须被确定的成像目标的对应区域或部分的表示;
f)根据以上公开的本发明的方法的可能变型之一,对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,对于每个已编码的像素或体素获得与所述像素或体素单义地相关的向量;
g)在所述预测算法已经被训练和测试之后,对于所述数字图像的每一个或部分像素或体素,将对应向量的分量用作为所述预测算法的输入数据;
h)通过所述预测算法的输出响应,确定与已经通过所述向量单义地编码的所述像素或体素单义地对应的成像实体的区域或部分的特性或特征,其中已经将所述向量的分量作为输入提供给所述预测算法(见图9)。
具体地,众所周知的人工神经网络是有效的算法。为了更深入的理解这些算法,可参见HAYKIN S.,“Neural Networks:A ComprehensiveFoundation,”Prentice Hall,Upper Saddle River,NJ,1999。能够可选地或组合地使用其他预测算法,并且与各个像素或体素对应的成像目标的区域或部分的特性或特征能够作为所述不同种类的预测算法的输出的结合来确定。
正如以上所清楚地显示的,根据本发明的编码方法提供更少的用于描述数字图像中的像素或体素外观的相关特征的相关数据。
如果考虑图像处理,这是巨大的优势,特别是在图像模式识别领域或在对成像实体的区域或部分的特性或特征进行自动识别的领域中。
在所谓的CAD(计算机辅助诊断)领域中这种图像处理是有重要意义的。在这种情况下,图像能够可以是任何一种诊断图像,例如核磁共振图像、超声波图像、X射线图像、CT图像等。
如果所述图像为模拟图像,则需要对所述图像进行数字采样的步骤,利用已知的方法和设备执行所述步骤是简单的。
在这种情况下,由所述诊断图像中的像素或体素表示的图像实体的区域或部分的特性或特征,能够包括像素所表示的,诸如例如健康组织,恶性肿瘤组织或良性肿瘤组织的组织种类。
连同处理所述图像数据所需的计算能力的降低与所需时间的缩短一起,本方法有助于以这样的方式对数字图像的各个像素或体素进行编码,即,在其中像素被编码的向量的分量不仅包括与在每个被处理的像素或体素的给定邻域中的像素或体素的不同亮度相关的信息,而且,取决于所使用的编码方法的变型,还包括不同种类的信息。所述像素邻域的图像数据的奇异值提供压缩形式的信息,其反映了在将被编码的每个目标像素或体素的邻域中的像素或体素的亮度值之间的关系。所述图像数据矩阵的梯度矩阵和Hessian矩阵的特征值,提供了概括的或压缩的信息,其与在所述邻域的像素或体素之间的关系的其他特征相关,例如所述邻域的像素或体素(即所选窗口内的像素或体素)之间的亮度变化的测度,以及在所述邻域内的亮度函数曲率。小波变换和自相关变换进一步提供与至少基于多样性原理的所述邻域的像素或体素的图像数据的关系相关的不同类型的信息,以确定形成所述向量的分量的参数,并因而在某种程度上提高了准确度。
本编码方法还提供至少相等的但通常是增强的预测准确度。这是重要的一项,由于当前影响计算机辅助诊断的一个大问题是假阳性的问题。当利用预测算法处理图像数据以确定恶性肿瘤组织的存在时,例如在阳性结果中,即在所述图像中已经被确定表示恶性肿瘤组织的像素或体素中,确定所述像素或体素中的一些实际上不对应于恶性肿瘤组织。在如果存在恶性肿瘤组织所述预测算法将识别它的意义下,已知的观点,预测算法在发现恶性肿瘤组织中具有高准确度。另一方面,在所述所谓的正确阳性之下,一些对应于健康组织的像素或体素被归类为恶性肿瘤组织。由于将用户的注意力吸引到健康区域,因此增加了评价的时间并可能引起所述用户对错误地突出显示的区域进行不必要的活组织检查,,这是一个缺陷。
由于其减少了多次活组织检查的需要以及诊断的时间,诊断图像的预测处理的准确度的提高是极为重要的。
以上公开的方法的进一步的改进可以包括这样的事实,即另一个包括时间的维度被加入到所述二维或三维图像中。
例如,代替仅处理目标的一个静态图像,考虑在预定时段内同一目标的一个图像序列。在这种情况下,所述序列可以包括在不同时刻t1,t2,...,tk获取的单个图像,其中k为整数。在这种情况下,通过以上公开的函数,如可选地或组合地通过所述图像的特征值和/或奇异值,和/或梯度和/或Hessian和/或共生矩阵,和/或小波变换参数,对每个图像编码。因此所述编码向量能够包括,这些函数的至少一个的在所述图像序列的对应图像的各个时刻的值,作为分量。
作为在大小N×M的相邻图像中对随时间的变化进行编码的第二方法,是如本文早前所描述的创建一个3D矩阵并对高于2D的维度利用所述奇异值的定义。
根据本发明的方法提供独有的优势,即利用一组非常有限的参数对随时间的变化进行编码,因此使得实时计算机辅助诊断成为可能。
附图说明
与根据现有技术水平的编码方法相比较,下面参照附图描述根据本发明的编码方法的简化的例子,其中:
图1是由10×10像素的阵列形成的数字或数字化图像的示意图;
图2是与图1的图像对应的图像数据阵列的示意图,其中在所述阵列中通过数值,例如在灰度数字图像中的像素的亮度,来描述各个像素的视觉外观;
图3示意性地示出了用于根据现有技术水平通过表示(在图2中所示的)所选窗口的像素的数值对目标像素进行编码的向量;
图4示意性地示出了根据现有技术水平的像素编码方法,其中以更一般化的方式表示所述向量的分量。
图5示出了以具有坐标m,n的目标像素为中心的一般的3×3窗口,一般梯度矩阵以及一种可能的计算数值偏导数的方法。我们还能够通过利用一些比如Sobel算子或Frei-Chen算子(Digital Image Processing,W.K.Pratt,John Wiley&Sons,Inc.New York,NY,USA,1991)的更复杂的算子来计算导数;
图6示出了一般的Hessian矩阵以及一种可能的计算数值二阶偏导数的方法;
图7示意性地示出了根据本发明的表示所述目标像素的向量;
图8和图9表示像素Pi,j的阵列形式的图像以及在神经网络中所述像素阵列的对应变换,在所述神经网络中每个结点Ki,j对应于所述图像的一个像素,同时结点Ki,j的内部值Ui,j对应于表示所述像素Pi,j的数值数据,其中与本发明的编码方法以及图像处理方法结合,将所述网络用于进行图像预处理;
图10示出了根据本发明的编码方法的一般性组合的流程图,所述编码方法具有预测算法,其用于对与所述图像的一个或多个像素或体素相对应的成像目标的所述部分的特性进行自动识别;
图11示出了一种自动预测的方法的进一步改进,所述自动预测方法与根据本发明的编码成像数据的方法结合,对与所述图像的一个或多个像素或体素相对应的成像目标的所述部分的特性进行自动预测;
图12示出了扫描仪的框图,其用于获取目标的图像,该扫描仪与用于自动预测与对应于所获取图像的一个或多个像素或体素的成像目标的所述部分的特性的手段相结合。
具体实施方式
数字或数字化图像由像素阵列P(n,m)形成,其中n,m=1,...,N。各个像素是在监视器或屏幕上或在打印纸上的具有某种外观的小点。所述点的外观能通过数值数据来表示。在所谓的灰度图像中,各个点具有与所述灰度中的某个灰度级对应的某个亮度。在彩色图像中,为了通过数值数据充分地描述所述像素的外观,更多的参数通常是必须的。已经定义了几种系统,用于单义地表示彩色图像中像素的外观。一种可能的系统是所谓的并众所周知的HVS(色度,纯度,饱和度)或所谓的RGB(红,绿,蓝)系统。由于对一般技术人员而言明显的是,如果处理彩色图像则必须用对应的数值数据替代这些值,在当前的简化例子中,只有亮度I(n,m)已经被指示。
所以,图2中所示的数值数据I(n,m)n,m=1,...,10的阵列对应于如图1的示意性像素阵列的包括像素P(n,m)n,m=1,...,10的图像,并且数值数据的阵列是矩阵。
各个像素P(n,m)与数值地描述其外观的数值数据I(n,m),例如灰度数字图像中的像素的灰度级,单义地相关。
根据现有技术水平,已知通过其分量还包含与图像的目标像素周围的像素有关的信息的向量,对所述目标像素进行编码。通常所述周围区域由具有维度(2S+1)×(2S+1)像素的以所述目标像素为中心的窗口构成,这里S是由用户任意地定义的整数(S=0,1,2,...,N)并在此被称为“步长”。
由周围的像素形成的窗口的以上定义等效于梯度x的周围像素的定义,其中x为整数并且该整数指示从目标像素到邻近像素的步长距离。将所述窗口中心的像素作为所述目标像素,包括梯度1的周围像素的窗口是直接相邻于所述目标像素的像素壳层(shell of pixel),梯度2的周围像素包括包围所述目标像素的两个最近像素壳层,其在形成所述图像的像素阵列的各个方向上,对应于距所述目标像素一个间隔步长以及距所述目标像素两个间隔步长。该定义还相应地应用于由体素阵列形成的3D图像。
最小尺寸的所述窗口由具有3×3维度并且其中心像素为所述目标像素、步长S等于1的像素阵列构成。也可以选择诸如例如5×5或7×7,步长分别为S=2和S=3的更大的窗口。为简单起见,在本例中,选择对应于以所述目标像素为中心的3×3像素阵列的窗口。
在图2中参照表示图像的像素的数值数据矩阵示出了该窗口。
窗口W包括9个像素,其中之一为目标像素。在图2中示出的所述窗口以目标像素P(2,2)为中心,并包括由对应数值,即所述像素的亮度值I(1,1),I(1,2),I(1,3),I(2,1),I(2,1),I(2,3),I(3,1),I(3,2),I(3,3),来表示的像素P(1,1),P(1,2),P(1,3),P(2,1),P(2,2),P(2,3),P(3,1),P(3,2),P(3,3)。
根据还利用与窗口W中的相邻像素有关的信息对目标像素P(2,2)编码的已知方法,与目标像素P(2,2)的亮度一起取所述像素的亮度作为向量的分量,所述向量用于表示所述目标像素P(2,2)以及如上所定义的周围像素的关系。
在图3中示意性地示出了所述向量。正如其可以清楚地显示的,表示目标像素的各个向量具有九个分量。
图4示意性地示出了根据现有技术水平对目标像素编码的所述向量的一般表达。在这种情况下,所述目标像素通过其亮度来表示并被定义为具有亮度I(n,m)的像素P(n,m)。
在图5中参照图4的向量示出了窗口W以及其在所谓的梯度矩阵中的变换。
对于一般技术人员可以清楚地显示,表示所述像素的数值阵列,以及在这种情况下的在窗口W内的像素的亮度数据I(m-1,n-1),I(m-1,n),I(m-1,n+1),I(m,n-1),I(m,n+1),I(m+1,n-1),I(m+1,n),I(m+1,n+1)的阵列为二维目标,从而能够定义两个方向并能对于所考虑的窗口中的每个像素估计在两个方向上的梯度。
在这种情况下,所述梯度矩阵是可对角化的,从而能够由它的特征值?p来表示,p=1,2。
能够进一步地处理所选窗口W的像素的亮度的原矩阵(originalmatrix)I,并且对于所述原矩阵能够计算所谓的Hessian矩阵。同样在这种情况下Hessian矩阵能够由其特征值?p来表示。
当考虑所选窗口的3×3亮度值矩阵I时,通常所述矩阵将不是可对角化的并且如上所述特征值将没有意义。所以考虑这种更一般的情况,如图5中所示的所选窗口W的像素的亮度的原矩阵I能够由所谓的奇异值σi来表示。
可选地或与对应于所述所选窗口的亮度矩阵的梯度矩阵和Hessian矩阵的特征值联合,利用对应于所选窗口的亮度矩阵的奇异值,能够生成用于对对应的目标像素单义地编码的向量。所述向量的分量构成于,与所选窗口的像素对应的亮度值矩阵的所述奇异值,以及通过处理与所选窗口的像素对应的亮度值的所述矩阵而获得的所述梯度矩阵和所述Hessian矩阵的特征值。
因此本发明的目的,在于使得,在所述编码向量中以非常压缩的形式表示所述目标像素相对于被包括在所选窗口中的其周围像素的关系,而没有在已提出方法的总预测函数中的性能损失。
当选择包括更高数量的周围像素的窗口时,该差异逐渐变得更大。
尽管所示举例受限于与所选窗口的像素相对应的亮度值的原矩阵的变换的特定选择,如以上已经被公开的,能够可选地或组合地应用进一步的变换。所以例如能够进行小波分解,并且平均或细节值能够被全部或至少一部分用作所述目标像素的编码向量的分量。
可选地或组合地,能够使用与所选窗口的像素相对应的亮度值的原矩阵的自相关变换,并且获得的参数能够全部或至少其中的一些被用作对所述目标像素编码的向量的分量。
小波变换还能被用作预处理步骤。所获得的数值数据的矩阵然后能够被利用对应的梯度矩阵和/或对应的Hessian矩阵进行处理,并且它们的奇异值和/或特征值能够被可选地或组合地确定。
根据又一个改进,所述数字图像能够首先受到利用所谓的细胞自动机的处理。文献US 5,140,670以及文献“Cellular Neural Networks:Application”by Leon O.Chua and Ling Yang,I.E.E.E.Trans.On Circuits&System vol.35(1998)Oct.,No.10,New York,NY,US公开了所谓的细胞自动机和神经网络的结合。这种新型信息处理系统是一种类似神经网络的大规模的非线性模拟电路,其中所述电路实时地处理信号。比如细胞自动机,它由有规则地隔开的被称为细胞的电路克隆(circuit clone)的巨大集合体组成,所述细胞只通过其最近的邻居直接互相通信。由于细胞神经网络的连续时间动态的传播效应,不直接连接到一起的细胞可以间接地互相影响。所述细胞神经网络能够进行反馈和前馈操作。细胞之间的连接是均匀的以及局部的。这意味着能够由细胞神经网络的反馈和前馈算子的模板来描述其特征。这些算子定义了所述细胞神经网络的动态行为。这些算子是系数的有限常量或方阵,所谓的克隆模板定义了所述细胞神经网络的动态规则。因而在细胞神经网络中,能够使用不同类型的算子,它们被预定义并且独立于将被处理的数据阵列的数据的具体值。为了从数据或数据之间的关系提取或突出特征而进行数据的特定操作,具体定义了各个算子。通常提供了这种算子模板的库,即所谓的基因,从其选择一个或多个算子模板并且将之用于进行所要的数据处理。所以例如当考虑二维图像时,算子或基因能够被提供用于检测并突出边缘,进一步的算子或基因能够被提供用于锐化等等。为了获得所述算子在输出图像上的效果的组合,所述算子随后能够被用于处理所述数据。
不同的方案还利用人工神经网络,该神经网络包括与其结点对应的细胞(Ki)的n-维阵列,各个细胞具有到形成细胞(Ki)的邻域的直接相邻细胞(Kj)的连接,参见图8和9。
各个细胞(Ki)具有对于到所述周围细胞的直接相邻细胞(Kj)的各个连接的输入。此外,各个细胞(Ki)具有对于到一个或多个直接相邻细胞(Kj)的连接的输出。在各个细胞(Ki)和所述直接相邻细胞之间的连接在神经网络中照例由权重(wij)来确定。通过被定义为细胞(Ki)的激活值(activation value)或函数(Ai)的内部值来进一步表征各个细胞,并且各个细胞(Ki)能够根据被称为传递函数的信号处理函数进行信号处理,以生成细胞输出信号(ui)。所述传递函数确定细胞(Ki)的输出信号(ui)为所述细胞(Ki)的所述激活值或函数(Ai)的函数,此传递函数还包括使细胞(Ki)的所述激活值或函数(Ai)的等于细胞(Ki)的输出信号(ui)的恒等函数。
提供输入数据记录(Pi)的n-维数据库,所述输入数据记录必须被提交给利用所述神经网络的计算,并且在所述n-维数据库中,当数据记录(Pi)被投影到对应的n-维空间中时,其相对位置是所述数据记录(Pi)的相关特征,能够由所述n-维空间中的点阵列表示所述数据库的数据记录(Pi),各个点具有在所述点阵中的已定义的位置并与所述数据库的数据记录(Pi)相关,所述数据库的各个数据记录(Pi)进一步包括其每一个具有某个值(Ui)的至少一个或多个变量。各个数据记录(Pi)与形成所述神经网络的n-维细胞阵列的细胞(Ki)相关,其中细胞(Ki)在n-维细胞阵列中具有与由所述n-维点阵列中的点表示的对应的数据记录(Pi)相同的位置(Ki)。被作为所述网络的初始化值的各个数据记录(Pi)的变量值(Ui)被取为相关细胞(Ki)的初始激活值(Ai)或初始输出值(ui)。各个细胞(Ki)的所述激活值(Ai)或所述输出值(ui)在经过所述神经网络的若干迭代处理步骤之后,被作为所述相关数据记录(Pi)的新值(Ui)。
根据该方案,对于所述若干迭代处理步骤的各处理步骤,定义各个细胞(Ki)和直接相邻细胞(Kj)之间的连接的权重(Wij)被确定为,与直接相邻于所述细胞(Ki)的细胞(Kj)相关的各个数据记录(Pj)的当前变量值(Uj)的函数,所述函数即所谓的学习函数或规则。被作为所述相关的数据记录(Pi)的当前新值(Ui)的在所述神经网络的处理步骤之后的各个细胞(Ki)的当前激活值(Ai)或输出值(ui),被确定为直接相邻细胞(Kj)的当前输出值(uj)的函数,其中所述直接相邻细胞(Kj)被通过对直接相邻细胞(Kj)与所述细胞(Ki)的连接进行定义的对应的权重(Wij)进行加权。
作为一种变型,通过将被作为所述相关数据记录(Pi)的当前新值(Ui)的在所述神经网络的处理步骤之后的各个细胞(Ki)的当前激活值(Ai)或输出值(ui)确定为定义所述直接相邻细胞(Kj)与所述细胞(Ki)的连接的权重(Wij)的函数,能够修改上述人工神经网络,所述函数即所谓的激活函数或规则。
被作为所述相关数据记录(Pi)的当前新值(Ui)的在所述神经网络的处理步骤之后的各个细胞(Ki)的当前激活值(Ai)或输出值(ui),能够被确定为所述直接相邻细胞(Kj)的当前输出值(uj)和对应的定义所述直接相邻细胞(Kj)与所述细胞(Ki)的连接的权重(Wij)的函数,所述函数即所谓的激活函数或规则。
此外,对于所述若干迭代处理步骤的各处理步骤,定义各个细胞(Ki)和直接相邻细胞(Kj)之间的连接的所述权重(Wij)被确定为,与直接相邻于所述细胞(Ki)的细胞(Kj)相关的每个数据记录(Pj)的当前变量值(Uj)以及与所述细胞(Ki)相关的数据记录(Pi)的当前变量值(Ui)的函数。
当数据库由二维图像的像素形成时,上述神经网络形成一种用于根据本发明的图像处理的机器。
所以,参照在所述原理图中示出的例子,如果考虑到所述神经网络的各个结点的初始内部值被设置为等于对应像素Pm,n的亮度值I(n,m),取决于所使用的激活函数或学习函数,各个结点的所述内部状态在每一处理步骤都将改变,并且这对应于所述对应像素的新亮度值。所述图像因此必须根据利用所述激活或学习函数来定义的某种规则改变其显示。
也能使用对所述图像数据进行预处理的进一步的方法或对应的算法,诸如利用聚类算法处理所述图像数据。
以上公开的预处理能够被解释为所述图像的滤波处理,其能够导致,对在所述图像中包含的一些信息的增强以及对与预测输出没有实质意义相关的其他信息的抑制,在这种情况下所述输出即所述成像目标的组织的特性或特征。
根据本发明对数字或数字化图像的像素编码的数值数据的精简对于减少所述图像的计算能力要求以及缩短其图像处理时间是非常有用的。一个具体的领域即所谓的CAD(计算机辅助诊断)。在该技术领域中,非常重要的一项包括从所述图像,典型的如灰度MRI图像或超声波或放射图像,自动识别与所述图像的一个或多个像素相对应的成像目标的所述部分的特性或特征。一种具体情况是专注于生物组织的特性或特征的自动分类,比如其属于健康或肿瘤组织。
将诸如人工神经网络的预测算法用于实现该自动分类。
人工神经网络是众所周知的,可参见例如Kashan Mehrotra,ChilukuriK.Mohan,Sanjay Ranka“Elements of Artificial Neural Network”ABradford Book,The MIT Press Cambridge,Massachusetts,1997。
根据现有技术水平,可参见例如文献WO03077182,为了进行生物目标的组织(健康的或肿瘤组织)的特性或特征的自动识别以形成诊断图像,所述图像的各像素或所述像素的一部分如图3和4中所描述的通过向量被编码,所述向量包括,对应于将被编码的像素的亮度的数值以及与将被编码的所述像素(目标像素)周围的像素的亮度相对应的数值作为其分量,其中所述周围的像素构成所选窗口的一部分,即所述将被编码的像素周围的像素的选择的子阵列。
提供了这样的人工神经网络,其具有对于各个向量分量的至少一个输入结点并具有对应于两个数值的输出结点,所述数值单义地与所述组织的特征相关,例如值(0,1)对应于健康组织而值(1,0)对应于肿瘤组织。提供了几个隐蔽层。通过利用已知生物目标的诊断图像的数据库训练所述神经网络并接着对其进行迭代测试,对应于所述图像的各个像素的所述成像目标的各个区域的特征(健康的或肿瘤的组织)是已知的并且与所对应的像素单义地相关。所述数据库的一部分(典型地1/2)数据被用于训练所述人工神经网络,而所述数据库的另一部分数据被用于测试所述预测算法。
能够与根据本发明的所述像素编码方法联合使用其他类型的预测算法。还能够结合两种或多种不同的预测算法的结果,或者例如在训练和测试集上根据不同的数据集或数据库的不同分配来训练并然后测试的两个或多个人工神经网络的结果。
图9示出了关于处理数字或数字化图像的方法的一般化的流程图。
第一阶段包括生成已知情形的数据库并包括训练和测试诸如人工神经网络的预测算法。该阶段包括如下步骤:
a)提供已知目标的一组数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度,饱和度和纯度)或RGB值来定义各个像素或体素,所述数字图像的各个像素或体素是所述成像目标的对应区域或部分的表示,对于所述成像目标已知感兴趣的特性或特征,并且所述已知特性或特征与所述数字图像的对应像素或体素单义地相关;
b)根据以上公开的本发明的方法的可能变型之一,对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,并且,将所述图像的像素或体素与其对应并且由各个向量表示其体素或像素的成像目标的所述区域或部分的已知的特性或特征与各个向量单义地相关;
c)提供诸如神经网络的预测算法;
d)通过将与所述已知目标的所述图像的各个像素或体素单义地相关的向量用作输入数据,并通过将所述图像的像素或体素与其对应且所述向量的每一个与其单义地相关的成像目标的所述区域或部分的已知特性或特征用作输出数据,来进行所述预测算法的训练和测试。
第二阶段包括获取数字图像或对图像进行数字化,并包括对所述图像的各个像素或体素或所述图像的部分像素或体素或所述图像的一部分进行编码,并且向所述经过训练和测试的预测算法提供所述已编码的像素或体素。该第二阶段包括如下步骤:
e)提供目标的数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量,如灰度图像中的亮度或彩色图像中的HSV(色度、饱和度、纯度)或RGB值来定义各个像素或体素,所述数字图像的各个像素或体素是特性或特征必须被确定的成像目标的对应区域或部分的表示;
f)根据以上公开的本发明的方法的可能变型之一,对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,对于每个已编码的像素或体素获得与所述像素或体素单义地相关的向量;
g)在所述预测算法经过训练和测试之后,对于所述数字图像的每一个或部分像素或体素,将对应的向量的分量用作所述预测算法的输入数据;
因而利用所述算法,最后的步骤在于:
h)对于与已经通过所述向量单义地编码的所述像素或体素单义地对应的所述成像实体的所述区域或部分,通过所述预测算法的输出响应,确定其特性或特征,其中已经将所述向量的分量作为输入提供给所述预测算法。
在一些实验中利用不同组织的数字化图像并通过预测算法对所述组织类型分类,已经测试了根据本发明的编码方法和处理这种已编码的图像数据的方法。已经将通过根据本发明的所述像素编码方法获得的结果与对于相同数字化图像通过利用以上公开的经典像素向量编码方法获得的结果相比较。所述比较已经证明根据本发明的所述编码像素具有更好的适应度和更高的计算速度。
处理数字或数字图像的方法的进一步的改进,具体而言,即为了所述成像目标的特征的识别而应用对像素或体素进行编码的所述方法,由本发明提供并在下面被公开。
参照图11,所述改进包括如下步骤:
定义用于进行所述像素或体素编码的第一窗口,所述窗口由将被编码的所述目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素的数量相关的第一维度;
进行所述像素或体素的编码;
提供经过训练的预测算法,并通过根据以上定义的第一窗口的所述已编码的像素或体素来进行图像的第一处理,因而确定所述图像中的各个像素或体素的特征或特性;
识别所述图像中具有某种特性的像素或体素以及它们在所述图像中的位置;
定义与其中存在有具有所述某种特性的像素或体素的原始图像的区域或部分相对应的像素或体素的子阵列;
定义用于进行所述像素或体素编码的第二窗口,所述窗口由将被编码的所述目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素的数量相关的第二维度,所述窗口的维度和像素数目大于所述第一窗口;
只对以上定义的像素或体素的子阵列的像素或体素进行像素或体素编码,所述像素或体素子的阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应;
利用所述经过训练和测试的算法,进行通过利用所述第二窗口来编码的所述已编码像素或体素的第二处理,以确定所述像素或体素子阵列的所述像素或体素的特征或特性,根据利用所述预测算法的第一处理步骤所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应;
进一步的步骤明显地能够被执行,通过:
根据利用预测算法的前述处理步骤识别所述图像中具有某种特性的像素或体素以及它们在所述图像中的位置;
定义像素或体素的子阵列,其与在其中存在具有所述某种特性的像素或体素的原始图像的区域或部分相对应;
定义用于进行所述像素或体素编码的新窗口;所述窗口由将被编码的目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素的数目相关的维度,并且所述窗口的维度和像素或体素的数目不同于在前述处理步骤中定义的窗口;
只对以上被定义的像素或体素子阵列的像素或体素进行像素或体素编码,所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应。
利用所述经过训练和测试的算法,进行对通过利用所述新窗口编码的已编码像素或体素的进一步的处理,以确定所述像素或体素子阵列的所述像素或体素的特征或特性,根据具有所述预测算法的前述处理步骤所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应。
对于具有所述预测算法的某个对应的处理步骤,用于对所述像素或体素编码的不同窗口也将被用于,对用于训练和测试所述预测算法的数据集的像素或体素编码,以致在用于对所述训练和测试数据集的图像的像素或体素进行编码的窗口与用于对必须被处理的图像的像素或体素进行编码的窗口之间,存在对应的关系。
根据能够与以上公开的改进可选地或组合地应用的另一个改进,对于将被处理的图像的像素或体素,或根据具有所述预测算法的前述处理步骤与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应的像素或体素,在它们的各个编码步骤中,通过对包括所述数值数据(即所述像素或体素子阵列的像素或体素的亮度值)的原始矩阵施加进一步的变换而获得的参数的全部或仅仅一部分能够被加入到所述像素或体素编码向量的分量中。
例如,对于第一预测处理步骤,利用所述亮度值的矩阵的奇异值,以及所选窗口的像素或体素的所述亮度矩阵的梯度矩阵的特征值和Hessian矩阵的特征值,对将被处理的所述像素或体素编码,而对于所述预测算法的随后的处理步骤,在其中只有一个或多个像素或体素子阵列的像素或体素被处理,在此所述子阵列根据具有所述预测算法的所述第一处理步骤与在其中存在具有某种特性的像素或体素的原始图像的区域或部分相对应,所述像素或体素由进一步的数值数据表示,所述数值数据对应于由所定义窗口的像素或体素的亮度矩阵的一个或多个进一步的变换所提供的参数的全部或一部分。所述亮度矩阵的这种进一步的变换例如自相关变换或小波变换。
这种变型能够被可选地应用于改变所述窗口的维度或与所述窗口的维度的变化联合使用。
与上述方法联合,当在所述第一步骤中对整个图像编码并利用预测算法对其进行处理,因而获得对具有所要的特性的成像目标的一部分进行表示的像素或体素时,一个或多个图像区域能够被定义为对应于能够被指示为全景图像的原始图像的仅仅一部分。在如上所公开的这种情况下,所述全景图像的所述部分或区域能够与所述全景图像具有相同的分辨率。可选地,能够利用更高的分辨率获取所述部分或区域的至少一个的新的图像或完全新的全景图像。由于这样的事实,即所述全景图像的所述部分或区域小于所述全景图像,也就是对应于更小的视图文件,即使所述分辨率已经被提高,与所述全景图像的所述区域或部分相关的图像数据的处理将不会导致将被处理的变量的数目过高。
对于定义各个目标像素的周围像素的窗口,通过减少或增加在对所述目标像素或体素编码中将考虑的周围像素的数量,还能够改变其维度。
图11给出了一个简化的例子以说明所述原理。利用根据本发明的编码像素或体素的方法以及图像处理的方法获取和处理第一全景图像。在这种情况下,窗口W已经被定义为3×3像素。所述图像的所述处理表明,在两个区域1和2中已经发现了所述成像对象的所要搜寻的特性。
根据以上公开的变型,两个图像能够被定义,其对于所述全景图像具有相对减小的维度,并完全或至少包括所述全景图像的区域1和区域2的部分。在图11中,这两个图像被表示为图像区域1和图像区域2。
在第一变型中,具有减小的维度并包括所述全景图像的两个区域1和2的两个图像被简单地裁剪出,并且所述两个图像具有与所述全景图像相同的分辨率。所述仅有的变型涉及这样的事实,即各个目标像素周围的像素的窗口已经被分别增加到以各目标像素为中心的5×5像素的维度以及9×9像素的维度。
在这种情况下,包围所述目标像素的像素窗口的维度已经被增加的事实,被作为所述全景图像的简单裁剪的各图像区域具有减少数量的像素这样的事实所平衡。
在图11中示出的可选方案进一步提供了提高所述两个图像区域的分辨率的事实,其与定义相比于在所述全景图像上执行的所述第一处理步骤中使用的窗口具有增大维度的周围像素的窗口联合应用。在这种情况下,所述增大的分辨率对于图像区域1和2两者是相同的,但这完全不是必须的并且所述图像区域1和2能够被选择以相对于所述全景图像具有不同的增大的分辨率。无论如何,还必须考虑到通常增大的分辨率被认为是所期望的,但由于图像区域1或2中的至少一个被选择以具有比所述全景图像低的分辨率也是可能的,不必认为所述公开的方法受此限制。
考虑如图像区域1和2在图2中所指示的图像的至少一个的新分辨率,则能够定义用于对所述图像区域的像素进行编码并用于处理所述图像的周围像素窗口,其与在处理所述全景图像中所用的窗口具有相同的维度。可选地,还能够与所述周围像素窗口的维度的变化相结合,提供相对于所述全景图像的图像区域1和2的分辨率的改变,其中对于各个图像区域,所述窗口的维度可以是相同或甚至不同的。
明显地,当对应于所述全景图像的裁剪部分的图像必须具有增大的分辨率时,对于与所述裁剪部分对应的将被成像的目标的各个区域,与其相关的视场相应减小,必须进行具有该相应减小的视场的新的数字化或新的图像获取。
图12示出了一种成像设备的框图,所述成像设备被提供有,处理所获取的图像以识别所述成像对象的特性的装置,并且利用其能够执行所公开的变型的任何一种中的上述方法步骤。
所述成像设备包括,通过例如所述成像实体的发射、反射或透射获取成像数据的扫描仪10,通过所述扫描仪接收到的信号被馈送给处理所述接收到的信号以获得能够由监视器12上的像素阵列表示的图像数据的图像处理器11。
进一步的单元13被提供,其用于处理参数形式的图像数据,所述参数用于通过根据本发明的编码图像像素的方法与根据前述变型的一个或多个识别由所述图像像素表示的目标区域的特性的方法这两者的组合的所述公开的变型的一个或多个,来确定所述图像像素的外观。通过将所述监视器上的像素的某些特定外观(aspect)单义地相关到某些特性或某种所要搜寻的特性,能够在所述监视器上显示图像中突出由所述图像的像素表示的目标的成像部分的特性。
于是用户能够定义包括了具有所述要搜寻的特性的可视图像的像素的可视图像的裁剪。通过定义用于编码各个像素的周围像素窗口的新的窗口维度,由装置13处理这个包括所述裁剪的较小的图像,或者扫描仪能够被设置为自动地通过将视野限制在每一个所述定义的裁剪的维度来仅获取所述裁剪的图像。对于将利用所述缩减的视野获取的所述新图像,还能定义新的分辨率。
考虑到用于从所述接收到的信号生成图像数据的图像处理器12经常由计算机形成,所述进一步的处理单元13,其用于对所述图像的所述像素编码并自动识别由各个像素表示的所述成像目标的所述部分的特性,能够成为通过所述计算机来执行的软件装置的形式。同样,装置14,其允许所述裁剪的定义和/或所述周围像素的窗口的新分辨率和/或新维度的设置并用于相应地调整所述扫描仪10的参数,能够由将通过所述计算机执行的软件装置构成。
在上述例子中,用于对所述图像的所述像素进行编码并对由各个像素表示的所述成像目标的所述部分进行特性识别的所述处理单元13,以及单元14,是所述成像设备的内部单元,所述成像设备可以包括电子单元和软件装置或当其包括计算机时只包括可执行的软件装置。可选地,所述单元13和14能够是外部图像处理系统的形式,所述系统包括计算机硬件以及可通过所述计算机硬件执行所述处理单元13和/或单元14的功能的可执行软件装置,并且该系统具有与所述成像设备的对应接口进行通信的接口。
尽管仅参照二维的情况已经实现本描述和所述举例,对于技术人员明显的是,以上步骤还能被应用于所述图像为三维体素阵列的情况。
根据编码图像的像素或体素的方法的进一步的变型,还能够定义向量的分量,其中该向量用于通过利用对被作为所述图像的两个、三个或更多滤波步骤的结果而获得的像素或体素的外观进行定义的参数的值来对所述像素或所述体素编码。
在这种情况下,两种、三种或更多的滤波算法被应用于所述图像数据,即应用于表示所述图像的所述像素或体素阵列并定义其外观的数据的阵列。
各种滤波算法对所述数据,即定义各个像素或体素的外观的参数值,进行变换。所以考虑在所述原始图像上执行的m种不同的滤波或预处理算法,同样在定义各个像素或体素的外观的所述参数的原始值上,进行m种变换f1,f2,...,fm。这样能够实现定义编码像素的修改的方式。考虑例如图像的一般的像素P(i,j),以及上述的m种变换f1,f2,...,fm,将通过在所述像素P(i,j)进行变换,来获得经过修改的,即经过滤波的用于表示所述像素的外观的参数值的对应的集合,其能够被定义为f1(P(i,j)),f2(P(i,j)),...,fm(P(i,j))。通过定义受限于经受所述变换的像素P(i,j)的像素窗口,应用根据本发明的方法,对于经过修改的定义所述像素的外观的参数值,其上述被定义的集合f1(P(i,j)),f2(P(i,j)),...,fm(P(i,j)),能够被用作编码所述像素P(i,j)的向量的分量。
重要的是应该考虑到,在利用这个变型时,由于例如在以上描述中描述或引用的方法的许多滤波方法,还使用了对经受变换或处理的各个目标像素的像素周围进行定义的窗口,所述目标像素与所述周围像素的关系不会损失。
大多数或通常所有的所述图像像素的滤波方法或预处理方法,利用包含所述目标像素和某个预定义数量的周围像素的窗口以处理各个像素,并因而如以上所述代替利用修改的描述所述目标像素的外观的参数的值,定义了对应于所述窗口的图像数据矩阵,作为编码所述目标像素的向量的分量,作为基于这样的事实的进一步的变型,对于被应用于与在所述滤波或预处理步骤中定义的窗口相对应的所述矩阵的、根据本发明的编码方法,其变换的任何一种或任何一种的组合,能够被使用。因而,代替将描述像素P(i,j)的外观的所述参数值用作对像素P(i,j)编码的向量的分量,如通过所述滤波或预处理算法进行修改,能够使用所述值或所述值的组合:
所述数值矩阵的奇异值,其中所述数值矩阵包括用于执行各滤波或预处理步骤的选择的窗口的像素或体素的图像数据;
所述数值矩阵的梯度矩阵的特征值,其中所述数值矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素;
所述数值矩阵的Hessian矩阵的特征值,其中所述数值矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素;
所述数值矩阵的小波变换的系数的一个或多个或其组合,其中所述数值矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素,能够可选地或组合地使用几种小波基函数;
所述矩阵的所谓共生变换,其中所述矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素;
所述数值矩阵的自相关变换的一个或多个系数,其中所述数值矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素;
所述数值的矩阵的特征值或奇异值,和/或所述数值矩阵的梯度矩阵的或Hessian矩阵的特征值,和/或所述小波变换的一个或多个系数,和/或所述自相关变换的一个或多个系数,和/或所述数值矩阵的共生矩阵的奇异值的组合,其中所述数值矩阵表示用于执行所述各滤波或预处理步骤的所述窗口的像素或体素。
同样地,对像素编码的方法的上述变型能够被应用于所述二维图像以及应用于三维图像。此外同样地,在这种情况下,能够以类似于所述主要实施例的方式考虑第四维,在此,第四维包括了时间并使得能够考虑所述图像在时间上的演化。
作为在已经对所述原始图像的各个像素或体素执行了不同滤波或处理算法之后的可选方案,以向量形式对所述原始图像的各个像素或体素编码,所述向量的分量都包含利用对应的滤波或处理算法获得的图像数据的矩阵的像素或体素窗口的奇异值。据此所述方法包括如下步骤:
提供一些不同的用于所述原始图像的像素或体素的滤波算法;
利用所述不同滤波算法的每一个处理所述原始图像的像素或体素,并存储得到的经过滤波的像素或体素的阵列;
定义以目标像素或体素为中心或包含所述目标像素或体素并具有包围所述目标像素或体素的一些像素或体素的窗口;
计算所述图像数据矩阵的奇异值,其中所述图像数据矩阵与每一个经过滤波的像素或体素的阵列的各个像素或体素的窗口相对应;
利用其分量对应于所述图像数据矩阵的奇异值的向量来对各像素或体素进行编码,其中所述图像数值矩阵与以在由所述各滤波算法获得的经过滤波的像素或体素的阵列的每一个的各个像素或体素为中心或者包含该像素或体素的窗口相对应。
参照先前的所述举例,在其中定义了受限于仅仅一个像素或体素,即所述目标像素或体素P(i,j)的窗口,在这种情况下,所述定义的窗口包含所述目标像素或体素周围的一些像素或体素,从而使得用于对所述目标像素进行编码的向量的分量不是其经过滤波的值,而是作为所述窗口一部分的像素或体素的值的矩阵的奇异值。
Claims (35)
1.一种对数字或数字化的二维或三维图像的像素或体素进行编码的方法,其包括如下步骤:
a)提供以二维像素阵列或三维体素阵列构成的数字图像,通过至少一个变量来定义各个像素或体素;
b)将所述图像的各个像素或体素作为目标像素或体素,并且,对于每个目标像素或体素,通过包含所述目标像素或体素以及一定数目的周围像素或体素的像素或体素窗口形成邻域;
c)对于每个目标像素或体素,生成与所述目标像素或体素单义地相关的向量,所述向量的分量被生成为所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数;
其特征在于,
所述目标像素或体素以及所述像素或体素窗口的各个像素或体素的值的函数,对应于表示所述窗口的像素或体素的数值矩阵的特征参数或该数值矩阵的变换的特征参数,通过表示窗口的像素或体素的数值的矩阵的特征值或奇异值、和/或表示所述窗口的像素或体素的所述数值矩阵的梯度矩阵或Hessian矩阵的特征值、和/或小波变换的一个或多个系数、和/或自相关变换的一个或多个系数、和/或表示所述窗口的像素或体素的所述数值矩阵的共生矩阵的奇异值的组合,来对各个像素或体素进行编码。
2.根据权利要求1所述的方法,其特征在于,所述二维或三维图像具有进一步的包括时间的维度。
3.根据权利要求1所述的方法,其特征在于,表示所述图像的像素或体素的所述矩阵的数值数据,在所述像素或体素的编码之前,经历一个或多个预处理步骤。
4.根据权利要求3所述的方法,其特征在于,所述预处理步骤为滤波步骤。
5.根据权利要求3所述的方法,其特征在于,能够可选地或组合地执行多于一个预处理步骤。
6.根据权利要求3所述的方法,其特征在于,通过利用细胞神经网络对表示所述数字或数字化图像的各个像素或体素的数值数据进行处理,来执行所述预处理步骤。
7.根据权利要求3所述的方法,其特征在于,所述预处理步骤包括:
提供人工神经网络,其包括与该神经网络的结点对应的细胞(Ki)的n-维阵列,各个细胞具有到形成该细胞(Ki)的所述邻域的直接相邻细胞(Kj)的连接;
各个细胞(Ki)具有对于到所述周围细胞的直接相邻细胞(Kj)的各个连接的输入;
各个细胞(Ki)具有对于到一个或多个所述直接相邻细胞(Kj)的连接的输出;
在各个细胞(Ki)和所述直接相邻细胞之间的所述连接由权重(wij)来确定;
通过被定义为所述细胞(Ki)的激活值或函数(Ai)的内部值来进一步表征所述细胞,并且各个细胞(Ki)能够根据被称为传递函数的信号处理函数进行信号处理,以生成细胞输出信号(ui);
所述传递函数将细胞(Ki)的输出信号(ui)确定为所述激活值的函数或所述细胞(Ki)的函数(Ai),在此所述传递函数还包括使所述细胞(Ki)的所述激活值或函数(Ai)等于细胞(Ki)的输出信号(ui)的恒等函数;
提供输入数据记录(Pi)的n-维数据库,所述输入数据记录必须被提交给利用所述神经网络的计算,并且在所述n-维数据库中,当所述数据记录(Pi)被投影到对应的n-维空间中时,其相对位置是所述数据记录(Pi)的相关特征,能够由所述n-维空间中的点的阵列表示所述数据库的数据记录(Pi),各个点具有在所述点阵列中的已定义的位置并与所述数据库的数据记录(Pi)相关,所述数据库的各个数据记录(Pi)进一步包括每一个具有某个值(Ui)的至少一个变量或多个变量;
各个数据记录(Pi)与形成所述神经网络的n-维细胞阵列的细胞(Ki)相关,其中细胞(Ki)在n-维细胞(Ki)阵列中具有与由所述n-维点阵列中的点表示的对应的数据记录(Pi)相同的位置;
被作为所述网络的初始化值的各个数据记录(Pi)的变量的值(Ui)被取为所述相关细胞(Ki)的初始激活值或函数(Ai)或初始输出值(ui);
各个细胞(Ki)的所述激活值或函数(Ai)或所述输出值(ui)在经过所述神经网络的一定数目的迭代处理步骤之后,被作为所述相关数据记录(Pi)的新值(Ui)。
8.根据权利要求7所述的方法,其特征在于,对于所述一定数目的迭代处理步骤的各处理步骤,定义各个细胞(Ki)和所述直接相邻细胞(Kj)之间的连接的权重(Wij)被确定为,与直接相邻于所述细胞(Ki)的细胞(Kj)相关的各个数据记录(Pj)的所述变量的当前值(Uj)的函数,所述函数即所谓的学习函数或规则。
9.根据权利要求7所述的方法,其特征在于,通过将被作为所述相关数据记录(Pi)的当前新值(Ui)的在所述神经网络的处理步骤之后的各个细胞(Ki)的当前激活值(Ai)或输出值(ui),确定为定义所述直接相邻细胞(Kj)与所述细胞(Ki)的连接的所述权重(Wij)的函数,来修改所述人工神经网络,所述函数即所谓的激活函数或规则。
10.根据权利要求9所述的方法,其特征在于,被作为所述相关数据记录(Pi)的当前新值(Ui)的在所述神经网络的处理步骤之后的各个细胞(Ki)的所述当前激活值(Ai)或输出值(ui),被确定为所述直接相邻细胞(Kj)的当前输出值(uj)以及定义所述直接相邻细胞(Kj)与所述细胞(Ki)的连接的对应的权重(Wij)的函数,所述函数即所谓的激活函数或规则。
11.根据权利要求7所述的方法,其特征在于,对于所述一定数目的迭代处理步骤的各处理步骤,定义各个细胞(Ki)和所述直接相邻细胞(Kj)之间的连接的所述权重(Wij)被确定为,与直接相邻于所述细胞(Ki)的细胞(Kj)相关的各个数据记录(Pj)的变量的当前值(Uj)以及与所述细胞(Ki)相关的数据记录(Pi)的变量的当前值(Ui)的函数。
12.根据权利要求3所述的方法,其特征在于,所述预处理步骤包括利用聚类算法对表示所述图像的像素或体素的数值数据的矩阵进行处理。
13.根据权利要求3所述的方法,其特征在于,执行基于两种、三种或更多的滤波算法的两个、三个或更多的滤波步骤;
各种滤波算法(A1,A2,...,Am)确定对所述图像的像素或体素的外观进行定义的参数的值的变换(f1,f2,...,fm);
对于形成所述二维或三维图像的各个像素(P(i,j))或各个体素,定义仅包括所述像素(P(i,j))或所述体素的窗口;
通过向量对所述图像的各个像素(P(i,j))或各个体素或者选定数目的像素(P(i,j))或体素进行编码,所述向量的分量被定义为,通过定义所述像素(P(i,j))或体素的所述参数的原始值的所述两种、三种或更多的变换(f1,f2,...,fm)来确定的各个像素或各个体素的参数的值。
14.根据权利要求13所述的方法,其特征在于,通过定义所述像素(P(i,j))或体素的参数的原始值的所述两种、三种或更多的变换(f1,f2,...,fm)确定的各个像素或各个体素的所述参数的值,被定义为,在描述所述二维或三维图像的像素或体素外观的参数阵列的坐标(i,j)或(i,j,z)处确定的所述像素或体素的值。
15.根据权利要求14所述的方法,其特征在于,对于形成所述二维或三维图像的各个像素(P(i,j))或各个体素,定义窗口,其包括所述像素(P(i,j))或所述体素以及一定数目的周围的像素或体素;
通过向量对所述图像的各个像素(P(i,j))或各个体素或者选定数目的像素或体素进行编码,所述向量的分量被定义为,在以上定义的窗口内的各个像素或各个体素的参数的矩阵的奇异值,并且通过定义所述像素(P(i,j))或体素的参数的原始值的所述两种、三种或更多的变换(f1,f2,...,fm)来确定。
16.一种处理数字或数字化图像的方法,其包括如下步骤:
a)提供已知目标的一组数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量来定义的各个像素或体素,所述数字图像的各个像素或体素是所述成像目标的对应区域或部分的表示,已知所述成像目标的所关心的特性或特征并且所述已知特性或特征与所述数字图像的对应像素或体素单义地相关;
b)根据前述权利要求1到15中的任一权利要求所述的对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,将所述图像的像素或体素与其对应并且由各个向量表示其像素或体素的成像目标的所述区域或部分的已知的特性或特征与各个向量单义地相关;
c)提供预测算法;
d)通过将与所述已知目标的所述图像的各个像素或体素单义地相关的向量用作输入数据,并通过将所述图像的像素或体素与其对应且所述向量的每一个与其单义地相关的成像目标的所述区域或部分的已知特性或特征用作输出数据,来进行所述预测算法的训练和测试;
e)提供目标的数字图像,所述数字图像包括二维像素阵列或三维体素阵列,通过至少一个变量来定义各个像素或体素,所述数字图像的各个像素或体素是其特性或特征必须被确定的成像目标的对应区域或部分的表示;
f)根据步骤b中使用的编码方法对所述数字图像的各个像素或体素或所述数字图像的像素或体素的子集的各个像素或体素进行编码,对于每个已编码的像素或体素获得与所述像素或体素单义地相关的向量;
g)对于所述数字图像的每一个或部分像素或体素,提供所述对应向量的分量作为所述经过训练和测试的预测算法的输入数据;
h)通过所述预测算法的输出数据,确定与通过所述向量单义地编码的所述像素或体素单义地对应的成像实体的所述区域或部分的特性或特征,其中已经将所述向量的分量作为输入数据提供给所述预测算法。
17.根据权利要求16所述的方法,其特征在于,所述预测算法为人工神经网络。
18.根据权利要求16所述的方法,其特征在于,提供两种或多于两种的不同预测算法,并利用所述两种或更多种预测算法的每一个处理所述已编码的像素或体素,所述输出数据被定义为所述两种或更多种预测算法的每一种的输出数据的组合。
19.根据权利要求16所述的方法,其特征在于,其包括如下的步骤:
定义用于进行所述像素或体素编码的第一窗口,所述窗口由将被编码的所述目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素或体素的数目相关的第一维度;
进行所述像素或体素的编码;
提供经过训练和测试的预测算法,并利用根据以上定义的第一窗口的所述已编码的像素或体素来进行图像的第一处理,因而确定所述图像中的各个像素或体素的特征或特性;
识别具有某种特性的在所述图像中的像素或体素以及它们在所述图像中的位置;
定义与其中存在有具有所述某种特性的像素或体素的原始图像的区域或部分相对应的像素或体素的子阵列;
定义用于进行所述像素或体素编码的第二窗口,所述窗口由将被编码的所述目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素或体素的数目相关的第二维度,所述窗口的维度和像素或体素的数目大于所述第一窗口的维度和像素或体素的数目;
只对以上定义的像素或体素的子阵列的像素或体素进行像素或体素编码,所述像素或体素的子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应;
利用所述经过训练和测试的算法,进行通过利用所述第二窗口来编码的所述已编码像素或体素的第二处理,以确定所述像素或体素子阵列的像素或体素的特征或特性,根据利用所述预测算法的第一处理步骤所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应;
根据利用预测算法的前述处理步骤识别具有某种特性或特征的在所述图像中的像素或体素以及识别它们在所述图像中的位置;
定义像素或体素的子阵列,其与在其中存在具有所述某种特性的像素或体素的原始图像的区域或部分相对应;
定义用于进行所述像素或体素编码的新窗口,所述窗口由将被编码的目标像素或体素周围的像素或体素的阵列形成,其具有与所述窗口的像素或体素的数目相关的维度,并且所述窗口的维度和像素或体素的数目不同于在前述处理步骤中定义的窗口的维度和像素或体素的数目;
只对以上定义的像素或体素子阵列的像素或体素进行像素或体素编码,所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应;
利用所述经过训练和测试的算法,进行对通过利用所述新窗口编码的所述已编码像素或体素的进一步处理,以确定所述像素或体素子阵列的所述像素或体素的特征或特性,根据具有所述预测算法的前述处理步骤所述像素或体素子阵列与在其中存在具有所述某种特性的像素或体素的所述原始图像的区域或部分相对应。
20.根据权利要求19所述的方法,其特征在于,对于具有所述预测算法的某个对应的处理步骤,用于对所述像素或体素编码的不同窗口也被用于,对用于训练和测试所述算法的数据集的像素或体素进行编码,从而使得在用于对所述训练和测试数据集的图像的像素或体素进行编码的窗口与必须被处理的图像的像素或体素之间,存在对应关系。
21.根据权利要求19所述的方法,其特征在于,对于将被处理的图像的像素或体素,或者根据具有所述预测算法的前述处理步骤与在其中存在具有所述某种特性或特征的像素或体素的所述原始图像的区域或部分相对应的像素或体素,在它们的各个编码步骤中,通过对包括所述像素或体素子阵列的像素或体素的亮度值的原始矩阵施加进一步的变换而获得的参数,其全部或仅仅一部分被加入到所述像素或体素编码向量的分量中。
22.根据权利要求19的所述的方法,其特征在于,对于第一预测处理步骤,利用亮度值的矩阵的奇异值,以及所选窗口的像素或体素的亮度的所述矩阵的梯度矩阵的特征值和Hessian矩阵的特征值,对将被处理的所述像素或体素进行编码,而对于所述预测算法的随后处理步骤,在其中只有一个或多个像素或体素子阵列的像素或体素被处理,所述子阵列根据具有所述预测算法的所述第一处理步骤与在其中存在具有所述某种特性的像素或体素的原始图像的区域或部分相对应,所述像素或体素由进一步的数值数据表示,所述数值数据与由所述定义的窗口的像素或体素的亮度的矩阵的一个或多个进一步的变换所提供的参数的全部或一部分相对应。
23.根据权利要求22所述的方法,其中所述亮度的矩阵的这种进一步的变换是自相关变换或小波变换。
24.根据权利要求19所述的方法,其特征在于,在各个处理步骤将被处理的图像的分辨率是变化的。
25.根据权利要求16所述的方法,其特征在于,所述图像为二维或三维的诊断图像。
26.根据权利要求25所述的方法,其中所述诊断图像是MRI、超声波、X射线或CT放射图像。
27.根据权利要求25所述的方法,其特征在于,由所述诊断图像中的像素或体素表示的图像实体的区域或部分的特性或特征包含在所述像素或体素所表示的组织种类中。
28.根据权利要求27所述的方法,其中所述组织种类是健康组织、恶性肿瘤组织或良性肿瘤组织。
29.根据权利要求16所述的方法,其特征在于,其是用于计算机辅助诊断的方法。
30.一种对数字或数字化的二维或三维图像的像素或体素进行编码的设备,包括用于执行如权利要求1至29中任一项权利要求所述的方法的相应步骤的装置。
31.根据权利要求30所述的设备,其特征在于,其能够与成像设备的接口进行通信,用于从所述成像设备接收图像数据,以及用于向所述成像设备发送与由所述图像数据表示的所述目标的所述部分的特性相关的信息以及用于改变所述成像设备的扫描仪的成像分辨率和/或视场的命令。
32.根据权利要求31所述的设备,其特征在于,其是与所述成像设备分离的装置。
33.根据权利要求31所述的设备,其特征在于,其是被包括在所述成像设备中的装置。
34.根据权利要求30所述的设备,其特征在于,,其包括:用于接收来自待成像的目标的信号的扫描单元(10),以及用于将通过所述扫描仪(10)接收到的信号变换成将被显示在监视器(12)上的数字图像的图像数据处理器(11),以及
用于通过图形手段来定义有限视场的图像,和/或改变所述扫描仪的分辨率,和/或改变围绕各个目标像素的周围像素的窗口的维度的装置。
35.根据权利要求34所述的设备,其特征在于,其是生态图形成像设备、MRI设备、放射设备。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05425316 | 2005-05-12 | ||
EP05425316.6 | 2005-05-12 | ||
PCT/EP2006/062168 WO2006120195A1 (en) | 2005-05-12 | 2006-05-09 | Method for coding pixels or voxels of a digital image and a method for processing digital images |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101189641A CN101189641A (zh) | 2008-05-28 |
CN101189641B true CN101189641B (zh) | 2012-05-02 |
Family
ID=34981419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800161897A Expired - Fee Related CN101189641B (zh) | 2005-05-12 | 2006-05-09 | 编码数字图像的像素或体素的方法及处理数字图像的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8150151B2 (zh) |
EP (1) | EP1880364A1 (zh) |
JP (1) | JP2008544766A (zh) |
CN (1) | CN101189641B (zh) |
WO (1) | WO2006120195A1 (zh) |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8355595B2 (en) * | 2007-05-15 | 2013-01-15 | Xerox Corporation | Contrast enhancement methods and apparatuses |
US8014030B2 (en) * | 2007-09-14 | 2011-09-06 | Kabushiki Kaisha Toshiba | Image processing and formation with line thininng by reducing intensity of target pixel based on extracted contour pixel and area connectedness information |
JP5002397B2 (ja) * | 2007-09-28 | 2012-08-15 | 株式会社東芝 | 超音波診断装置及びプログラム |
JP5680283B2 (ja) * | 2008-09-19 | 2015-03-04 | 株式会社Nttドコモ | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、及び動画像復号プログラム |
JP5310130B2 (ja) * | 2009-03-11 | 2013-10-09 | オムロン株式会社 | 3次元視覚センサによる認識結果の表示方法および3次元視覚センサ |
JP2010210585A (ja) * | 2009-03-12 | 2010-09-24 | Omron Corp | 3次元視覚センサにおけるモデル表示方法および3次元視覚センサ |
JP5316118B2 (ja) * | 2009-03-12 | 2013-10-16 | オムロン株式会社 | 3次元視覚センサ |
JP5714232B2 (ja) * | 2009-03-12 | 2015-05-07 | オムロン株式会社 | キャリブレーション装置および3次元計測のためのパラメータの精度の確認支援方法 |
JP5245938B2 (ja) | 2009-03-12 | 2013-07-24 | オムロン株式会社 | 3次元認識結果の表示方法および3次元視覚センサ |
JP5245937B2 (ja) * | 2009-03-12 | 2013-07-24 | オムロン株式会社 | 3次元計測処理のパラメータの導出方法および3次元視覚センサ |
JP5282614B2 (ja) * | 2009-03-13 | 2013-09-04 | オムロン株式会社 | 視覚認識処理用のモデルデータの登録方法および視覚センサ |
JP5337252B2 (ja) * | 2009-09-18 | 2013-11-06 | 株式会社東芝 | 特徴抽出装置 |
US9173629B2 (en) * | 2009-11-18 | 2015-11-03 | Kabushiki Kaisha Toshiba | Ultrasonic diagnostic apparatus and ultrasonic image processing apparatus |
KR20110103182A (ko) * | 2010-03-12 | 2011-09-20 | 삼성전자주식회사 | 입체 영상 표시 장치 |
TWI605706B (zh) | 2010-04-13 | 2017-11-11 | Ge影像壓縮有限公司 | 樣本區域合倂技術 |
EP2559240B1 (en) | 2010-04-13 | 2019-07-10 | GE Video Compression, LLC | Inter-plane prediction |
CN105933715B (zh) * | 2010-04-13 | 2019-04-12 | Ge视频压缩有限责任公司 | 跨平面预测 |
WO2011128269A1 (en) | 2010-04-13 | 2011-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Video coding using multi-tree sub - divisions of images |
CN106060561B (zh) | 2010-04-13 | 2019-06-28 | Ge视频压缩有限责任公司 | 解码器、重建数组的方法、编码器、编码方法及数据流 |
KR101335724B1 (ko) | 2010-08-09 | 2013-12-04 | 삼성전자주식회사 | 초음파 진단기 및 그 제어방법 |
CN102082895A (zh) * | 2010-10-26 | 2011-06-01 | 娄定风 | 一种远距离昆虫图像检测系统及其检测方法 |
CN103348675B (zh) * | 2011-01-28 | 2016-05-25 | 日本电气株式会社 | 二维信号编码设备和二维信号编码方法 |
CN102646187B (zh) * | 2011-02-20 | 2016-08-03 | 深圳市心艺来文化有限公司 | 彩色图形编码及识别方法 |
US9341729B2 (en) * | 2011-04-06 | 2016-05-17 | Schlumberger Technology Corporation | Amplitude contrast seismic attribute |
US9002080B2 (en) * | 2011-10-12 | 2015-04-07 | University Of Virginia Patent Foundation | Singular value filter for imaging or detection |
US9466007B2 (en) * | 2012-01-18 | 2016-10-11 | Agency For Science, Technology And Research | Method and device for image processing |
US10130326B2 (en) * | 2012-01-20 | 2018-11-20 | Ananth Annapragada | Methods and compositions for objectively characterizing medical images |
CN102750771B (zh) * | 2012-07-13 | 2014-10-01 | 中山大学 | 一种应用于智能手机的第五套人民币面额识别方法 |
EP2880625B1 (en) * | 2012-08-06 | 2019-12-11 | Koninklijke Philips N.V. | Image noise reduction and/or image resolution improvement |
US9141885B2 (en) * | 2013-07-29 | 2015-09-22 | Adobe Systems Incorporated | Visual pattern recognition in an image |
CN112950747A (zh) * | 2013-09-13 | 2021-06-11 | 斯特拉克斯私人有限公司 | 给图像分配颜色的方法和系统、计算机可读存储介质 |
US9569464B1 (en) * | 2014-05-28 | 2017-02-14 | Pivotal Software, Inc. | Element identification in database |
CN104101909B (zh) * | 2014-06-18 | 2018-03-09 | 公安部第一研究所 | 一种hsl彩色空间下双能x射线图像显示方法 |
US10471617B2 (en) | 2015-01-26 | 2019-11-12 | Crayola Llc | Pixel art crayon and marker photo array assembly and kit |
US10118436B2 (en) | 2015-01-26 | 2018-11-06 | Crayola, Llc | Pixel art crayon and marker photo array assembly and kit |
KR102517615B1 (ko) * | 2015-06-12 | 2023-04-04 | 파나소닉 아이피 매니지먼트 가부시키가이샤 | 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치 및 화상 복호 장치 |
CN106683160A (zh) * | 2015-11-06 | 2017-05-17 | 中国科学院深圳先进技术研究院 | 一种基于二维直方图的传递函数设计方法及装置 |
CN106372719B (zh) * | 2016-08-31 | 2018-10-23 | 浙江莱达信息技术有限公司 | 一种医学x光影像处理控制参量的智能优选方法 |
KR102590411B1 (ko) | 2016-09-15 | 2023-10-17 | 구글 엘엘씨 | 로봇 에이전트용 제어 정책 |
WO2019133052A1 (en) | 2017-12-28 | 2019-07-04 | Yang Shao Wen | Visual fog |
US10452955B2 (en) * | 2018-01-15 | 2019-10-22 | Gyrfalcon Technology Inc. | System and method for encoding data in an image/video recognition integrated circuit solution |
US20190220699A1 (en) * | 2018-01-15 | 2019-07-18 | Gyrfalcon Technology Inc. | System and method for encoding data in an image/video recognition integrated circuit solution |
IT201800001148A1 (it) * | 2018-01-17 | 2019-07-17 | Semeion Centro Ricerche | Metodo di elaborazione di immagini e sistema per l’elaborazione di immagini |
CN110135227B (zh) * | 2018-02-09 | 2022-06-03 | 电子科技大学 | 一种基于机器学习的激光点云室外场景自动分割方法 |
US10586129B2 (en) * | 2018-02-21 | 2020-03-10 | International Business Machines Corporation | Generating artificial images for use in neural networks |
WO2020107156A1 (zh) * | 2018-11-26 | 2020-06-04 | 深圳先进技术研究院 | 乳腺医学超声图像的自动化分类方法及装置 |
CN110645917B (zh) * | 2019-09-24 | 2021-03-09 | 东南大学 | 基于阵列式相机的高空间分辨率三维数字图像测量方法 |
KR20210073282A (ko) | 2019-12-10 | 2021-06-18 | 한국전자통신연구원 | 영상 처리 장치 및 이를 포함하는 석회화 분석 시스템 |
US11551116B2 (en) * | 2020-01-29 | 2023-01-10 | Rohde & Schwarz Gmbh & Co. Kg | Signal analysis method and signal analysis module |
US11436761B2 (en) | 2020-03-18 | 2022-09-06 | International Business Machines Corporation | Preventing feature loss when compressing images |
CN112750174B (zh) * | 2021-01-05 | 2023-09-22 | 东北大学 | 基于空间编码的目标智能感知及识别系统及方法 |
CN116778195B (zh) * | 2023-08-16 | 2023-11-24 | 北京华源技术有限公司 | 一种基于颜色码的设备识别方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1345154A1 (en) * | 2002-03-11 | 2003-09-17 | Bracco Imaging S.p.A. | A method for encoding image pixels and method for processing images aimed at qualitative recognition of the object reproduced by one more image pixels |
CN1490689A (zh) * | 2003-09-11 | 2004-04-21 | 中国科学技术大学 | 非线性时变自适应控制器及其控制方法 |
CN1490757A (zh) * | 2003-07-07 | 2004-04-21 | 西安理工大学 | 二维条码身份证件防伪系统自动识读方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346208B2 (en) * | 2003-10-25 | 2008-03-18 | Hewlett-Packard Development Company, L.P. | Image artifact reduction using a neural network |
-
2006
- 2006-05-09 EP EP06755108A patent/EP1880364A1/en not_active Withdrawn
- 2006-05-09 JP JP2008510570A patent/JP2008544766A/ja active Pending
- 2006-05-09 WO PCT/EP2006/062168 patent/WO2006120195A1/en active Application Filing
- 2006-05-09 CN CN2006800161897A patent/CN101189641B/zh not_active Expired - Fee Related
- 2006-05-09 US US11/913,554 patent/US8150151B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1345154A1 (en) * | 2002-03-11 | 2003-09-17 | Bracco Imaging S.p.A. | A method for encoding image pixels and method for processing images aimed at qualitative recognition of the object reproduced by one more image pixels |
CN1490757A (zh) * | 2003-07-07 | 2004-04-21 | 西安理工大学 | 二维条码身份证件防伪系统自动识读方法 |
CN1490689A (zh) * | 2003-09-11 | 2004-04-21 | 中国科学技术大学 | 非线性时变自适应控制器及其控制方法 |
Non-Patent Citations (2)
Title |
---|
MADIRAJU S V R ET AL.Neural networks for robust image feature classification:acomparative study.NEURAL NETWORKS FOR SIGNAL PROCESSING.1994,第425页倒数第3行-第426页第26行. * |
全文. |
Also Published As
Publication number | Publication date |
---|---|
US8150151B2 (en) | 2012-04-03 |
US20080212887A1 (en) | 2008-09-04 |
EP1880364A1 (en) | 2008-01-23 |
WO2006120195A1 (en) | 2006-11-16 |
JP2008544766A (ja) | 2008-12-11 |
CN101189641A (zh) | 2008-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101189641B (zh) | 编码数字图像的像素或体素的方法及处理数字图像的方法 | |
CN101443817B (zh) | 用于确定场景的三维重建时的对应关系的方法和装置 | |
Gong et al. | Data processing for real-time construction site spatial modeling | |
CN108564109A (zh) | 一种基于深度学习的遥感图像目标检测方法 | |
US7181056B2 (en) | Method, and corresponding apparatus, for automatic detection of regions of interest in digital images of biological tissue | |
CN111208509B (zh) | 一种超宽带雷达人体目标姿态可视化增强方法 | |
US20060280348A1 (en) | Method of screening cellular tissue | |
CN110399820B (zh) | 一种公路路边景物视觉识别分析方法 | |
CN106600597A (zh) | 一种基于局部二值模式的无参考彩色图像质量评价方法 | |
CN109272487A (zh) | 一种基于视频的公共区域内人群的数量统计方法 | |
CN108229551A (zh) | 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法 | |
Zhang et al. | Contrast preserving image decolorization combining global features and local semantic features | |
CN116091833A (zh) | 注意力与Transformer高光谱图像分类方法及系统 | |
CN116665148A (zh) | 基于合成孔径雷达数据的海上船舶检测方法 | |
Kazimi et al. | Semantic segmentation of manmade landscape structures in digital terrain models | |
CN114494594A (zh) | 基于深度学习的航天员操作设备状态识别方法 | |
CN112184731A (zh) | 一种基于对抗性训练的多视图立体深度估计方法 | |
CN116843906A (zh) | 基于拉普拉斯特征映射的目标多角度本征特征挖掘方法 | |
CN104732190A (zh) | 一种基于正交纹理相关分析的合成孔径声纳目标检测方法 | |
CN114241317A (zh) | 一种基于灯下相似害虫图像自适应特征融合检测方法 | |
Peters et al. | Anisotropic wavelet-based image nearness measure | |
CN112949380A (zh) | 一种基于激光雷达点云数据的智能水下目标识别系统 | |
CN104865572A (zh) | 一种基于感兴趣目标增强的极化合成方法 | |
CN115830461B (zh) | 基于深度序列卷积网络的高光谱图像识别方法 | |
Odat et al. | Deep Transfer Learning and Image Segmentation for Fruit Recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120502 Termination date: 20150509 |
|
EXPY | Termination of patent right or utility model |