CN102201038A - 脑瘤p53蛋白表达检测方法 - Google Patents
脑瘤p53蛋白表达检测方法 Download PDFInfo
- Publication number
- CN102201038A CN102201038A CN2011101066568A CN201110106656A CN102201038A CN 102201038 A CN102201038 A CN 102201038A CN 2011101066568 A CN2011101066568 A CN 2011101066568A CN 201110106656 A CN201110106656 A CN 201110106656A CN 102201038 A CN102201038 A CN 102201038A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- munderover
- sample set
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 61
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 36
- 208000003174 Brain Neoplasms Diseases 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 95
- 230000003902 lesion Effects 0.000 claims abstract description 87
- 238000012795 verification Methods 0.000 claims abstract description 47
- 238000010191 image analysis Methods 0.000 claims abstract description 9
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical group CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 claims description 25
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 abstract 1
- 239000012530 fluid Substances 0.000 abstract 1
- 238000002075 inversion recovery Methods 0.000 abstract 1
- 238000012706 support-vector machine Methods 0.000 description 46
- 239000011159 matrix material Substances 0.000 description 35
- 238000005457 optimization Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 14
- 230000009466 transformation Effects 0.000 description 12
- 206010018338 Glioma Diseases 0.000 description 11
- 208000032612 Glial tumor Diseases 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 6
- 201000007983 brain glioma Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004393 prognosis Methods 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000002055 immunohistochemical effect Effects 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000010827 pathological analysis Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000945496 Homo sapiens Proliferation marker protein Ki-67 Proteins 0.000 description 1
- 102100025825 Methylated-DNA-protein-cysteine methyltransferase Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108010051791 Nuclear Antigens Proteins 0.000 description 1
- 102000019040 Nuclear Antigens Human genes 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102100034836 Proliferation marker protein Ki-67 Human genes 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000029824 high grade glioma Diseases 0.000 description 1
- 201000011614 malignant glioma Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 108040008770 methylated-DNA-[protein]-cysteine S-methyltransferase activity proteins Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开一种基于磁共振图像分析的脑瘤P53蛋白表达检测方法,该方法包括:(1)采集脑瘤患者的包括T1加权序列、T1增强序列、FLAIR序列的磁共振图像;(2)在前述任一种序列中截取磁共振图像中的病变区域图像,由病变区域图像构成病变区域图像集,并将病变区域图像标记为P53蛋白表达阳性或阴性;(3)对病变区域图像集进行图像分析,提取病变区域图像中的图像特征,由图像特征构成病变区域样本集;(4)从病变区域样本集中任选一部分样本作为训练样本集,其他样本作为验证样本集,使用训练样本集训练分类器;(5)使用训练后的分类器对验证样本进行分类,获得验证样本的脑瘤P53蛋白表达状况。
Description
技术领域
本发明属于图像处理和模式识别技术领域,具体涉及一种通过磁共振图像分析进行脑瘤P53蛋白表达状况检测的方法。
背景技术
神经胶质瘤是中枢神经系统最常见的肿瘤,具有治疗周期长、易复发、致残率和死亡率高的特点,对患者的健康和生命威胁极大。目前,神经胶质瘤可以做到早期诊断,给予及时的手术、放疗和化疗,但是恶性胶质瘤患者的预后并没有明显改善。Afshar等(GolnarAfshar,Nannette Jelluma,Yang Xiaodong et al.Radiation-Induced Caspase-8Mediates p53-IndependentApoptosis in Glioma Cells.Cancer Research.2006,66(8):4223-4232)研究表明,成年胶质瘤患者的P53基因突变与预后的改善和放疗敏感性有关。临床通常检测phosphatase and tensinhomolog deleted on chromosome 10(PTEN)、epidermal growth factor receptor(EGFR)、theO6-methylguanine-DNA methyltransferase(MGMT)、tumor protein 53(P53)、monoclonal antibodyofcell proliferation associated nuclear antigen(MIB-1)等蛋白表达状况,并综合上述蛋白表达的信息来评价胶质瘤的恶性程度和患者的预后状况。因此,P53的表达状况作为一种中间结果信息,虽然不能直接评价胶质瘤的恶性程度和患者预后,但具有一定的指导意义。
当前临床使用最为广泛的P53蛋白的检测方法是免疫组织化学技术,该技术需要手术获得患者的胶质瘤病理切片后才能进行检测,因此无法指导制定术前治疗方案。同时,周晓军(周晓军.免疫组化在病理诊断中的正确应用.诊断病理学杂志.2003,10(4):232-235)研究表明,免疫组织化学技术在标准化和结果量化方面存在不足,检测结果容易受到检测人员的主观影响。目前尚没有基于图像处理和模式识别技术进行P53蛋白检测的方法。
发明内容
本发明的目的是提供一种基于图像处理和模式识别技术的脑瘤P53蛋白表达检测方法。
为实现上述目的,本发明所采取的技术方案是:该脑瘤P53蛋白表达检测方法包括以下步骤:
(1)采集脑瘤患者的磁共振图像,所述磁共振图像包括T1加权序列、T1增强序列、FLAIR序列中的任一种或任几种;
(2)在步骤(1)的任一种所述序列中截取所述磁共振图像中的病变区域图像,由所述病变区域图像构成病变区域图像集,并将病变区域图像标记为P53蛋白表达阳性或阴性;
(3)通过对所述病变区域图像集进行图像分析,提取所述病变区域图像中的图像特征,由所述图像特征构成病变区域样本集;
(5)将所述病变区域样本集中除所述训练样本集以外的其他样本作为验证样本集,使用所述训练后的分类器对所述验证样本集进行分类,获得各验证样本的脑瘤P53蛋白的表达状况。
与现有技术相比,本发明的有益效果是:
(1)现有技术只能在通过手术获得病理组织后检测P53蛋白表达状况;而本发明所需的脑瘤患者磁共振图像可以在手术前获得,因此本发明在手术前就能够获得P53蛋白表达状况的中间结果信息,具有快速及时的特点。(2)通过采集和分析脑瘤患者的T1加权序列、T1增强序列、FLAIR序列中的任一种序列的磁共振图像来检测P53蛋白的表达状况,可以在获得肿瘤组织切片前无创地获取关于脑瘤恶性程度和患者预后的中间结果信息。(3)通过对病变区域图像集进行图像分析,提取所述病变区域图像中的图像特征,对分类器进行训练和验证,使分类器客观地获得脑瘤P53蛋白的表达状况,避免了在免疫组织化学技术中引入检测者的主观影响,也避免了检测方法标准化不足的问题。(4)通过对训练样本集进行特征优化,可以有效降低特征集的复杂程度,进一步提高检测效率。(5)由于通过图像分析获得P53蛋白表达的状况,不需要消耗化学试剂等,所以具有成本低的特点。
附图说明
图1是本发明的一个实施例中由FLAIR序列的磁共振图像中截取的病变区域图像的示意图;
图2是本发明中对训练样本集进行特征优化后,使用优化后的训练样本集训练支持向量机,然后对新的验证样本集进行分类得到的ROC曲线。
具体实施方式
本发明的基于磁共振图像分析的脑瘤P53蛋白表达检测方法包括下列步骤:
(1)采集脑瘤患者的磁共振图像,其中,磁共振图像包括T1加权序列、T1增强序列、FLAIR序列中的任一种或任几种。具体的采集方法如下:
使用磁共振扫描仪(例如GE Healthcare,1.5T)采集脑胶质瘤患者的横断位、冠状位或矢状位的磁共振图像,该磁共振图像包括T1加权序列、T1增强序列和FLAIR序列。其中,T1加权序列的成像参数优选为Repetition Time=1966.1ms,Echo Time=21.088ms,Inversion Time=750ms;T1增强序列的成像参数优选为Repetition Time=1967.25ms,Echo Time=7.264ms,Inversion Time=750ms;FLAIR序列图像的成像参数优选为Repetition Time=8002ms,EchoTime=122.904ms,Inversion Time=2000ms。优选采集脑胶质瘤患者的横断位的磁共振图像。对患者进行扫描时,每个序列的磁共振图像的体数据分辨率均优选为512×512×16体素,即每个二维切面图像的分辨率为512×512像素,共有16个二维切面图像。磁共振图像的格式一般为DICOM。
(2)在T1加权序列、T1增强序列或FLAIR序列中截取步骤(1)所采集的磁共振图像中的病变区域图像,由截取得到的病变区域图像构成病变区域图像集。具体方法如下:
在T1加权序列、T1增强序列或FLAIR序列的横断位、冠状位或矢状位的磁共振图像的体数据中的每个二维切面图像上至多截取一个病变区域图像(即图1中的白色小方框内的区域)。病变区域图像优选为:尺寸为16×16像素、灰度级为256级、图像格式为tif。后将所截取的病变区域图像构成病变区域图像集。
在获得病变区域图像集后,使用免疫组织化学技术对P53蛋白表达进行检测,用检测结果将病变区域图像标记为P53蛋白表达阳性或阴性。例如,可临床采集22个胶质瘤患者的磁共振图像,其中包括T1加权序列、T1增强序列和FLAIR序列。使用免疫组织化学技术检测发现,22个胶质瘤患者中有10个患者的P53蛋白表达阴性,12个患者的P53蛋白表达阳性。
由于T1加权序列、T1增强序列和FLAIR序列中的部分序列上,磁共振图像的伪影比较严重,容易影响图像分析和分类的结果,因此不同序列的病变区域图像个数不尽相同。例如,在病变区域图像集中,T1加权序列上,P53蛋白表达阳性和阴性的病变区域图像个数均为66个;T1增强序列上,P53蛋白表达阳性和阴性的病变区域图像个数均为67个;FLAIR序列上,P53蛋白表达阳性和阴性的病变区域图像个数均为72个。
(3)通过对病变区域图像集进行图像分析,提取病变区域图像中的图像特征,并由图像特征构成病变区域样本集。以下优选分别对病变区域图像使用灰度共生矩阵提取13个图像特征、使用灰度-梯度共生矩阵提取15个图像特征、使用二维离散正交S变换提取34个图像特征进行进一步说明。
(a)对病变区域图像,使用灰度共生矩阵提取13个图像特征。病变区域图像通常为二维数字图像,以下以一幅二维数字图像为例进行进一步说明。此处以f(x,y)表示一幅二维数字图像,假设其大小为M×N,最高灰度级为第Ng级。在二维数字图像中,在某个方向上相隔一定距离的一对像素点的灰度出现的统计规律,从一定程度上可以反映这个二维数字图像的图像特征。这个统计规律可以用一个矩阵描述,即灰度共生矩阵。
在二维数字图像中,任意取一像素点(x,y)以及偏离它的另一像素点(x+a,y+b)形成一个点对。设该点对的灰度值为(i,j),即像素点(x,y)的灰度值为i,像素点(x+a,y+b)的灰度值为j。固定a和b,令像素点(x,y)在整幅二维数字图像上移动,则会得到各种(i,j)值。假如二维数字图像的灰度级别为Ng,则i与j的组合共有种。在整幅二维数字图像中,统计每一种组合出现的频率为P(i,j,d,θ),则构成大小为Ng×Ng的灰度共生矩阵,其中d是点对之间的距离θ为点对构成的向量与坐标横轴之间的夹角,即点对的方向。灰度共生矩阵本质上就是两个像素点的联合直方图,当a和b取不同的数值组合,都可以得到二维数字图像沿一定方向θ、相隔一定距离的灰度共生矩阵。灰度共生矩阵的数学表达式为:
P(i,j,d,θ)=#{(x,y),(x+a,y+b)∈M×N|f(x,y)=i,f(x+a,y+b)=j}
其中#{x}表示集合x中元素的个数。P为Ng×Ng的矩阵。若(x,y)与(x+a,y+b)之间距离为d,点对构成的向量与坐标横轴之间的夹角为θ,则可以得到各种间距及角度的灰度共生矩阵P(i,j,d,θ)。为表达简明起见,在下面的表述中略去d和θ,用P(i,j)表示灰度共生矩阵。
通常可以设置d=1,分别计算0°、45°、90°、135°四个方向的图像特征,对这四个方向的特征求取均值,得到与方向无关的特征。利用灰度共生矩阵提取的13个图像特征,包括角二阶矩、对比度、相关系数、方差、逆差矩、和平均、和方差、和熵、熵、差平均、惯性、差方差和差熵。在计算上述每个特征时,设置d=1,分别计算0°、45°、90°、135°四个方向的图像特征,对这四个方向的特征求取均值,得到与方向无关的特征,则每个特征公式如下所示:
1)角二阶矩:
2)对比度:
3)相关系数:
4)方差:
式中,μ是P(i,j)的均值。
5)逆差矩:
6)和平均:
其中,
7)和方差:
其中,
8)和熵:
其中,
9)熵:
10)差平均:
其中,
11)惯性:
12)差方差:
其中,
13)差熵:
其中,
(b)对病变区域图像,使用灰度-梯度共生矩阵提取15个图像特征。病变区域图像通常为二维数字图像,以下以一幅二维数字图像为例进行进一步说明,此处用f(x,y)表示一幅二维数字图像,假设其大小为M×N,对二维数字图像的灰度矩阵进行正规化变换:
F(x,y)=[f(x,y)×(Ng-1)/fmax]+1
式中,[x]表示x的整数部分,fmax为二维数字图像的最大灰度值,Ng是正规化变换后的灰度矩阵的最大值。
二维数字图像各像素的梯度计算使用Sobel算子,设二维数字图像的梯度矩阵为g(x,y),其中x=1,2,…,N,y=1,2,…,M。为了使g(x,y)梯度值分布在更大的离散间隔Ns个等级中,我们对二维数字图像的梯度矩阵进行正规化变换:
G(x,y)=[g(x,y)×(Ns-1)/gmax]+1
式中,[x]表示x的整数部分,gmax为二维数字图像的梯度矩阵的最大值,Ns是正规化变换后梯度矩阵的最大值。
通常,将正规化变换后的二维数字图像的灰度矩阵F(x,y)简称为正规化灰度矩阵,将正规化变换后的二维数字图像的梯度矩阵G(x,y)简称为正规化梯度矩阵,将正规化灰度矩阵和正规化梯度矩阵进行结合就可以得到灰度-梯度共生矩阵:
{H(i,j);i=1,2,…,Ng,j=1,2,…,Ns}
其中,(i,j)表示灰度-梯度共生矩阵的第i行第j列元素,H(i,j)表示正规化灰度矩阵中灰度值为i,并且正规化梯度矩阵中梯度值为j的像素点的个数。Ns是正规化梯度矩阵的最大值,Ng是正规化灰度矩阵的最大值。
将灰度-梯度共生矩阵H(i,j)进行正规化变换,得到:
p(i,j)=H(i,j)/(Ng×Ns),i=1,2,…,Ng,j=1,2,…,Ns
利用灰度-梯度共生矩阵提取的图像特征主要有15个,分别是灰度平均值、梯度平均值、灰度方差、梯度方差、小梯度优势、大梯度优势、灰度分布的不均匀性、梯度分布的不均匀性、能量、相关系数、灰度熵、梯度熵、混合熵、惯性、逆差矩。上述每个特征的公式如下所示:
1)灰度平均值:
2)梯度平均值:
3)灰度方差:
4)梯度方差:
5)小梯度优势: 其中
6)大梯度优势:
7)灰度分布的不均匀性:
8)梯度分布的不均匀性:
9)能量:
10)相关系数:
11)灰度熵:
12)梯度熵:
13)混合熵:
14)惯性:
15)逆差矩:
(c)对病变区域图像,使用二维离散正交S变换提取34个图像特征。病变区域图像通常为二维数字图像,以下以一幅二维数字图像为例进行进一步说明,用f(x,y)表示一幅二维数字图像,假设其大小为M×N。
首先,计算f(x,y)的二维离散傅立叶变换,表示为:
其中,u,v分别表示频域中的坐标变量,F(u,v)为二维数字图像的二维离散傅立叶频谱。二维离散傅立叶逆变换可以表示为:
其中,变换的结果f(x,y)是二维数字图像。对于大小为N×N的二维数字图像f′(x,y),其二维离散正交S变换可以通过计算其的二维离散傅立叶变换来求取,步骤如下:
1)计算二维数字图像f′(x,y)的二维离散傅立叶变换,结果为二维离散傅立叶频谱F;
2)对F进行频率子带划分,并且对频率子带进行圆周移位,得到新的频谱。设定频率阶数px,py∈[2,log2 N],且px,py都是正整数。计算频率子带的频率范围为 然后对频率子带进行圆周移位,表示如下:
3)在新的频谱中,对圆周移位后的每个频率子带进行二维离散傅立叶逆变换,得到二维离散正交S变换频谱,公式如下:
其中,x′,y′是二维离散正交S变换频谱的坐标变量,是二维离散正交S变换频谱。以二维离散正交S变换频谱的中心作为原点,将二维离散正交S变换频谱变换到极坐标系,对极坐标系下半径相等的二维离散正交S变换频谱的分量进行求和,得到二维离散正交S变换谱向量;对二维离散正交S变换谱向量进行以自然对数e为底数的对数变换,然后进行归一化变换,归一化变换表达式如下:
其中,Y是对二维离散正交S变换谱向量进行以自然对数e为底数的对数变换后的结果,MY为Y的平均值,SY为Y的标准差,z为对Y进行归一化变换后的结果。归一化变换后,得到新的谱向量。新的谱向量的每个分量就是使用二维离散正交S变换提取的二维数字图像的图像特征。
通过步骤(a)、(b)和(c),每个病变区域图像上可以提取图像特征有62个,其中包括使用灰度共生矩阵提取的图像特征13个,使用灰度-梯度共生矩阵提取的图像特征15个,使用二维离散正交S变换提取的图像特征34个。病变区域图像的图像特征的详见表1。对病变区域图像集中的每一个病变区域图像提取62个图像特征,并且将每一个病变区域图像的P53蛋白表达阳性或阴性标记进行量化,具体为:如果病变区域图像标记为P53蛋白表达阳性,则将该病变区域图像的类别标记为+1;如果病变区域图像标记为P53蛋白表达阴性,则将该病变区域图像的类别标记为-1。通过上述处理,所有病变区域图像的图像特征和类别标记结合,构成病变区域样本集。病变区域样本集可以表示为S={(fi,li)|i=1,2,…,n},其中fi是第i个病变区域图像的62个的图像特征,表示为fi=[fi1,fi2,…,fij,…,fi62],fij是第i个病变区域图像的第j个图像特征的特征值;li是第i个病变区域图像的类别标记;如果第i个病变区域图像标记为P53蛋白表达阳性,则li=+1;如果第i个病变区域图像标记为P53蛋白表达阴性,则li=-1;n是病变区域样本集的样本个数。
表1.病变区域图像的图像特征
以下具体举例说明:在病变区域样本集中,T1加权序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为66个;T1增强序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为67个;FLAIR序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为72个。那么从病变区域样本集中任选的样本构成训练样本集,训练样本集的样本个数优选如下:T1加权序列上,P53蛋白表达阳性和阴性的训练样本个数均为33个;T1增强序列上,P53蛋白表达阳性和阴性的训练样本个数均为34个;FLAIR序列上,P53蛋白表达阳性和阴性的训练样本个数均为36个。
选择支持向量机的参数,并且利用训练样本集训练支持向量机。支持向量机的核函数优选为径向基函数,惩罚因子C和核宽度σ两个参数采用网格搜索的方法进行选取。网格搜索的方法具体为,将惩罚因子C和核宽度σ分别取N个值和M个值,对N×M个C和σ的组合分别训练不同的支持向量机,采用交叉检验方法评估支持向量机的推广能力,选择最高分类准确率所对应的C和σ的组合,作为支持向量机的最优参数。其中,交叉检验方法,通常在样本个数较少的样本集进行分类时使用,以下以一个样本集为例进行进一步说明:交叉检验方法就是把样本集随机分成k个部分,选择一个部分作为验证样本,剩下的k-1个部分作为训练样本,重复使用训练样本训练支持向量机和对验证样本进行验证的过程,一直持续到每个部分都被当作一次验证样本;最后根据k个部分的每个样本的分类结果计算交叉检验方法得到的分类准确率,用于评估支持向量机的推广能力。需要注意的是,参数选择过程中仅使用训练样本集,本发明优选采用N=5,M=6,惩罚因子的取值范围优选为C∈{2-1,20,21,22,23},核宽度的取值范围优选为σ∈{2-4,2-3,2-2,2-1,20,21},交叉验证方法中k的取值优选为5。
然后,根据最优参数设定支持向量机的参数,使用T1加权序列、T1增强序列或FLAIR序列中任一种序列的训练样本集对支持向量机进行训练,得到训练后的支持向量机。
如果对训练样本集进行特征优化,则可以有效降低特征集的复杂程度,减小分类器的运算负担,提高检测的效率。在对训练样本集进行特征优化后,重新选择支持向量机的参数,并重新训练支持向量机。
对训练样本集进行特征优化时,训练样本集可以表示为Sm={(fi,li)|i=1,2,…,n},其中fi是第i个训练样本的m维的特征向量,表示为fi=[fi1,fi2,…,fij,…,fim],fij是第i个训练样本的第j个特征的特征值;li是第i个训练样本的类别标记;对于P53蛋白表达阳性的训练样本,li=1;对于P53蛋白表达阴性的训练样本,li=…1;n是训练样本数量。特征优化的步骤如下:
1)将待优化的训练样本集表示为训练样本集Sp,Sp中的特征有p维,令p=m;
2)从Sp中取出所有训练样本的第q维特征fiq,i=1,2,…,n,得到新的训练样本集令q在1,2,…,p中逐个取值,得到多个新的训练样本集使用k=1的最邻近法对新的训练样本集分别进行留一法分类,得到分类误差其中,最小分类误差所对应的新的训练样本集为p-1维训练样本集,即Sp-1。
3)判断训练样本集Sp-1的特征维数是否大于或等于2。如果是,则令p=p-1,将步骤2)得到的p-1维训练样本集作为待优化的训练样本集,重复步骤2);如果否,则进入步骤4);
4)经过上述步骤,得到训练样本集Sm,Sm-1,…,S2,S1。使用支持向量机分别对训练样本集Sm,Sm-1,…,S2,S1进行留一法分类,得到分类准确率Pm,Pm-1,…,P2,P1。
5)选取最高的分类准确率对应的训练样本集S,则S包括的特征为最优特征集。
在特征优化的步骤中,留一法,即留一交叉检验法(leave-one-out cross validation strategy,LOOCV),通常对样本个数较少的样本集进行分类时使用留一法,以下以一个样本集为例进行进一步说明。只使用样本集中的一个样本作为验证样本,而剩余样本作为训练样本,重复训练支持向量机和对验证样本进行验证的过程,一直持续到每个样本都被当作一次验证样本;根据每个样本的验证结果计算得到留一法的分类误差或者分类准确率。步骤4)中支持向量机的核函数优选为径向基函数,惩罚因子C和核宽度σ两个参数采用网格搜索的方法进行选取,惩罚因子的取值范围优选为C∈{2-1,20,21,22,23},核宽度的取值范围优选为σ∈{2-4,2-3,2-2,2-1,20,21},网格搜索中交叉检验方法的k取值优选为5。
通过对训练样本集进行特征优化,特征维数大幅下降,特征的复杂程度得到有效地降低。例如,本发明中T1加权序列、T1增强序列、FLAIR序列上的训练样本集的特征维数为62。经过特征优化,T1加权序列上优化后的训练样本集的特征维数为4,T1增强序列上优化后的训练样本集的特征维数为10,FLAIR序列上优化后的训练样本集的特征维数为14,特征优化大幅降低了特征的复杂程度。
特征优化后,使用优化后的训练样本集对支持向量机进行训练。首先,选择支持向量机的参数。支持向量机的核函数优选为径向基函数,惩罚因子C和核宽度σ两个参数采用网格搜索的方法进行选取。网格搜索的方法具体为,将惩罚因子C和核宽度σ分别取N个值和M个值,对N×M个C和σ的组合分别训练不同的支持向量机,采用交叉检验方法评估支持向量机的推广能力,选择最高分类准确率所对应的C和σ的组合,作为支持向量机的最优参数。需要注意的是,参数选择过程中仅使用优化后的训练样本集,本发明优选采用N=5,M=6,惩罚因子的取值范围优选为C∈{2-1,20,21,22,23},核宽度的取值范围优选为σ∈{2-4,2-3,2-2,2-1,20,21},交叉检验方法中k的取值优选为5。然后,根据最优参数,设定支持向量机的参数,使用T1加权序列、T1增强序列或FLAIR序列中任一种序列的优化后的训练样本集对支持向量机进行训练,得到优化训练后的支持向量机。
(5)将病变区域样本集中除所述训练样本集以外的其他样本作为验证样本集,使用训练后的分类器对所述验证样本集进行分类,获得各验证样本的脑瘤P53蛋白的表达状况。
以下具体举例说明:在病变区域样本集中,T1加权序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为66个,如果从中任选P53蛋白表达阳性和阴性的病变区域样本均为33个作为训练样本集,那么验证样本集中的P53蛋白表达阳性和阴性的样本个数均为33个;T1增强序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为67个,如果从中任选P53蛋白表达阳性和阴性的病变区域样本均为34个作为训练样本集,那么验证样本集中的P53蛋白表达阳性和阴性的样本个数均为33个;FLAIR序列上,P53蛋白表达阳性和阴性的病变区域样本个数均为72个,如果从中任选P53蛋白表达阳性和阴性的病变区域样本均为36个作为训练样本集,那么验证样本集中的P53蛋白表达阳性和阴性的样本个数均为36个。
如果未对训练样本集进行特征优化,则使用训练后的支持向量机对验证样本进行分类,可以获得各验证样本的脑胶质瘤P53蛋白表达状况。需要注意的是,若步骤(4)中训练支持向量机采用T1加权序列的训练样本,则验证样本必须取自T1加权序列;若步骤(4)中训练支持向量机采用T1增强序列的训练样本,则验证样本必须取自T1增强序列;若步骤(4)中训练支持向量机采用FLAIR序列的训练样本,则验证样本必须取自FLAIR序列。
如果在分类之前对训练样本集进行特征优化,则需要使用优化后的训练样本集对支持向量机进行训练,构成优化训练后的支持向量机。然后,根据优化后的训练样本集所保留的特征选取验证样本集的特征,构成新的验证样本集。最后,使用优化训练后的支持向量机对新的验证样本进行分类,获得每个新的验证样本的脑胶质瘤P53蛋白表达状况。需要注意的是,若步骤(4)中训练支持向量机采用T1加权序列的特征优化后的训练样本,则新的验证样本必须取自T1加权序列;若步骤(4)中训练支持向量机采用T1增强序列的特征优化后的训练样本,则新的验证样本必须取自T1增强序列;若步骤(4)中训练支持向量机采用FLAIR序列的特征优化后的训练样本,则新的验证样本必须取自FLAIR序列。
另外,如果未对训练样本集进行特征优化,则使用训练后的支持向量机对验证样本进行分类,仍然可以检测脑胶质瘤P53蛋白表达状况。由于未经特征优化的训练样本集给分类器带来了很大的计算负担。例如,T1加权序列上,验证样本集中的P53蛋白表达阳性和阴性的样本个数均为33个,那么使用训练后的支持向量机对验证样本进行分类,需要0.28秒,而使用优化训练后的支持向量机对新的验证样本进行分类,只需要0.14秒;T1增强序列上,验证样本集中的P53蛋白表达阳性和阴性的样本个数均为33个,那么使用训练后的支持向量机对验证样本进行分类,需要0.29秒,而使用优化训练后的支持向量机对新的验证样本进行分类,只需要0.14秒;FLAIR序列上,验证样本集中的P53蛋白表达阳性和阴性的样本个数均为36个,那么使用训练后的支持向量机对验证样本进行分类,需要0.30秒,而使用优化训练后的支持向量机对新的验证样本进行分类,只需要0.15秒。因此,为了提高方法的效率,本发明使用特征优化后的训练样本集对支持向量机进行训练,并使用优化训练后的支持向量机对新的验证样本进行分类。
最后,本发明可使用受试者工作特征(receiver operating characteristic,ROC)评价分类结果的准确性,使用ROC曲线下面积Az来反映分类的有效性。当Az取值等于0.5时,分类没有意义,相当于随机分类;当Az取值等于1是,分类完善,对所有样本都能准确分类。Az值越大,则分类效果越好。
经过计算得到,对来自T1加权序列的新的验证样本进行分类,Az达到0.7808;对来自T1增强序列的新的验证样本进行分类,Az达到0.8128;对来自FLAIR序列的新的验证样本进行分类,Az达到0.6997。
从图2可以看出,本发明中,支持向量机对新的验证样本都能做到准确的分类,尤其在T1增强序列上具有比较高的识别率。可见,本发明能够准确的识别脑胶质瘤P53蛋白表达状况。
Claims (1)
1.一种脑瘤P53蛋白表达检测方法,其特征在于,包括包括以下步骤:
(1)采集脑瘤患者的磁共振图像,所述磁共振图像包括T1加权序列、T1增强序列、FLAIR序列中的任一种或任几种;
(2)在步骤(1)的任一种所述序列中截取所述磁共振图像中的病变区域图像,由所述病变区域图像构成病变区域图像集,并将病变区域图像标记为P53蛋白表达阳性或阴性;
(3)通过对所述病变区域图像集进行图像分析,提取所述病变区域图像中的图像特征,由所述图像特征构成病变区域样本集;
(5)将所述病变区域样本集中除所述训练样本集以外的其他样本作为验证样本集,使用所述训练后的分类器对所述验证样本集进行分类,获得各验证样本的脑瘤P53蛋白的表达状况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110106656 CN102201038B (zh) | 2011-04-27 | 2011-04-27 | 脑瘤p53蛋白表达检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110106656 CN102201038B (zh) | 2011-04-27 | 2011-04-27 | 脑瘤p53蛋白表达检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102201038A true CN102201038A (zh) | 2011-09-28 |
CN102201038B CN102201038B (zh) | 2013-06-05 |
Family
ID=44661707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110106656 Expired - Fee Related CN102201038B (zh) | 2011-04-27 | 2011-04-27 | 脑瘤p53蛋白表达检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102201038B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509113A (zh) * | 2011-11-08 | 2012-06-20 | 浙江大学 | 一种脑瘤mib-1指数范围检测方法 |
CN104834943A (zh) * | 2015-05-25 | 2015-08-12 | 电子科技大学 | 一种基于深度学习的脑肿瘤分类方法 |
CN104867153A (zh) * | 2015-05-28 | 2015-08-26 | 重庆大学 | 基于脑磁共振影像中磷酸化tau蛋白含量信息的检测系统 |
US11320436B2 (en) | 2020-07-16 | 2022-05-03 | Immunovia Ab | Methods, arrays and uses thereof |
US11525832B2 (en) | 2007-03-27 | 2022-12-13 | Immunovia Ab | Protein signature/markers for the detection of adenocarcinoma |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002277744A (ja) * | 2001-03-21 | 2002-09-25 | Olympus Optical Co Ltd | 走査型光学顕微鏡 |
CN101061509A (zh) * | 2004-11-19 | 2007-10-24 | 皇家飞利浦电子股份有限公司 | 用于医疗成像数据内的肿瘤边界的自动检测和分割的系统和方法 |
CN101401730A (zh) * | 2008-11-14 | 2009-04-08 | 南京大学 | 一种基于分层结构的乳腺肿块可疑区域快速检测方法 |
-
2011
- 2011-04-27 CN CN 201110106656 patent/CN102201038B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002277744A (ja) * | 2001-03-21 | 2002-09-25 | Olympus Optical Co Ltd | 走査型光学顕微鏡 |
CN101061509A (zh) * | 2004-11-19 | 2007-10-24 | 皇家飞利浦电子股份有限公司 | 用于医疗成像数据内的肿瘤边界的自动检测和分割的系统和方法 |
CN101401730A (zh) * | 2008-11-14 | 2009-04-08 | 南京大学 | 一种基于分层结构的乳腺肿块可疑区域快速检测方法 |
Non-Patent Citations (1)
Title |
---|
孙彦辉 等: "MGMT在脑胶质瘤组织中的表达及其与患者生存期的关系", 《癌症》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11525832B2 (en) | 2007-03-27 | 2022-12-13 | Immunovia Ab | Protein signature/markers for the detection of adenocarcinoma |
CN102509113A (zh) * | 2011-11-08 | 2012-06-20 | 浙江大学 | 一种脑瘤mib-1指数范围检测方法 |
CN104834943A (zh) * | 2015-05-25 | 2015-08-12 | 电子科技大学 | 一种基于深度学习的脑肿瘤分类方法 |
CN104867153A (zh) * | 2015-05-28 | 2015-08-26 | 重庆大学 | 基于脑磁共振影像中磷酸化tau蛋白含量信息的检测系统 |
CN104867153B (zh) * | 2015-05-28 | 2017-10-20 | 重庆大学 | 基于脑磁共振影像中磷酸化tau蛋白含量信息的检测系统 |
US11320436B2 (en) | 2020-07-16 | 2022-05-03 | Immunovia Ab | Methods, arrays and uses thereof |
Also Published As
Publication number | Publication date |
---|---|
CN102201038B (zh) | 2013-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Toivonen et al. | Radiomics and machine learning of multisequence multiparametric prostate MRI: Towards improved non-invasive prostate cancer characterization | |
US11967072B2 (en) | Three-dimensional object segmentation of medical images localized with object detection | |
US10755406B2 (en) | Systems and methods for co-expression analysis in immunoscore computation | |
Tiwari et al. | Multi-kernel graph embedding for detection, Gleason grading of prostate cancer via MRI/MRS | |
CN102509113B (zh) | 一种脑瘤mib-1指数范围检测方法 | |
CN102388305B (zh) | 基于图像的风险分数-来自数字组织病理学的存活率和结果的预后预估 | |
US20140233826A1 (en) | Systems and methods for automated screening and prognosis of cancer from whole-slide biopsy images | |
JP7427080B2 (ja) | 細胞検出およびセグメンテーションのための弱教師ありマルチタスク学習 | |
CN102201038B (zh) | 脑瘤p53蛋白表达检测方法 | |
CN109124660B (zh) | 基于深度学习的胃肠间质瘤术后风险检测方法和系统 | |
Chaddad et al. | Improving of colon cancer cells detection based on Haralick's features on segmented histopathological images | |
Ström et al. | Pathologist-level grading of prostate biopsies with artificial intelligence | |
CN109191422A (zh) | 基于常规ct图像的缺血性脑卒中早期检测系统和方法 | |
Ezzat et al. | Optimized Bayesian convolutional neural networks for invasive breast cancer diagnosis system | |
US20240046473A1 (en) | Transformation of histochemically stained images into synthetic immunohistochemistry (ihc) images | |
CN116825372A (zh) | 一种乳癌患者淋巴结转移预测模型及其构建方法 | |
CN117152054A (zh) | 一种无需纳入临床病理特征的乳癌患者淋巴结转移预测模型 | |
Li et al. | Learning ADC maps from accelerated radial k‐space diffusion‐weighted MRI in mice using a deep CNN‐transformer model | |
Liu et al. | Towards MIB-1 and p53 detection in glioma magnetic resonance image: a novel computational image analysis method | |
Lan et al. | Value of radiomic analysis of data from magnetic resonance elastography for diagnosing fibrosis stages in patients with hepatitis B/C | |
Jia-Wei et al. | Effect of a novel segmentation algorithm on radiologists’ diagnosis of breast masses using ultrasound imaging | |
CN110930401B (zh) | 一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法 | |
Candito et al. | Automated tool to quantitatively assess bone disease on Whole-Body Diffusion Weighted Imaging for patients with Advanced Prostate Cancer | |
Chaphekarande et al. | Machine learning based brain mri estimation method | |
Andani et al. | Multi-V-Stain: Multiplexed Virtual Staining of Histopathology Whole-Slide Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130605 Termination date: 20200427 |