CN109409416A - 特征向量降维方法和医学图像识别方法、装置及存储介质 - Google Patents

特征向量降维方法和医学图像识别方法、装置及存储介质 Download PDF

Info

Publication number
CN109409416A
CN109409416A CN201811147961.XA CN201811147961A CN109409416A CN 109409416 A CN109409416 A CN 109409416A CN 201811147961 A CN201811147961 A CN 201811147961A CN 109409416 A CN109409416 A CN 109409416A
Authority
CN
China
Prior art keywords
matrix
feature vector
matrices
medical image
dimensionality reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811147961.XA
Other languages
English (en)
Other versions
CN109409416B (zh
Inventor
邢潇丹
石峰
詹翊强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai United Imaging Intelligent Healthcare Co Ltd
Original Assignee
Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai United Imaging Intelligent Healthcare Co Ltd filed Critical Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority to CN201811147961.XA priority Critical patent/CN109409416B/zh
Publication of CN109409416A publication Critical patent/CN109409416A/zh
Priority to US16/555,716 priority patent/US11210781B2/en
Application granted granted Critical
Publication of CN109409416B publication Critical patent/CN109409416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • A61B5/004Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room adapted for image acquisition of a particular organ or body part
    • A61B5/0042Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room adapted for image acquisition of a particular organ or body part for the brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • A61B5/7207Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal of noise induced by motion artifacts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Radiology & Medical Imaging (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Algebra (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Primary Health Care (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)

Abstract

本发明实施例公开了一种特征向量降维方法和医学图像识别方法、装置及存储介质。其中,特征向量降维方法包括:获取待处理的矩阵集合;将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。本发明实施例通过采用以黎曼测度核函数作为核函数的主成分分析法对多维矩阵数据进行降维,可以保留矩阵数据中的重要的结构信息,使非线性的数据样本特征也可以被分开,应用到图像处理中可以优化图像处理的结果。

Description

特征向量降维方法和医学图像识别方法、装置及存储介质
技术领域
本发明实施例涉及一种医学图像分析技术,尤其涉及一种特征向量降维方法和医学图像识别方法、装置及存储介质。
背景技术
在图像处理等需要处理大量多维度矩阵数据时,多采用主成分分析法也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。
但是,对于非线性的二维数据样本来说,采用常规的主成分分析法会忽略二维数据矩阵中存在的最重要的结构信息,无法使非线性的数据样本也可以被分开,影响图像处理的结果。
发明内容
本发明实施例提供一种特征向量降维方法和医学图像识别方法、装置及存储介质,以实现对非线性二维矩阵数据样本之间特征的区分,保留数据中的重要结构信息,优化数据处理的结果。
第一方面,本发明实施例提供了一种特征向量降维方法,该方法包括:
获取待处理的矩阵集合;
将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
进一步的,将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形,包括:
将所述矩阵集合转变为具有半正定特征的拉普拉斯矩阵Ls=Ds-Ws,其中,矩阵集合{Ws∈R(n×n),s=1…S,wij≥0},n为矩阵集合中矩阵维度,s为样本总数,D=diag(∑jwij);
通过公式将Ls转变为变为正定矩阵,其中γ为任意正整数。
进一步的,所述黎曼测度核函数为其中,s1和s2分别为计算内积的两个矩阵的标识。
第二方面,本发明实施例还提供了一种医学图像识别方法,该方法包括:
获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
采用本发明实施例中任一所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
可选的,所述方法还包括:
对所述特征分类模型进行训练,相应的,对所述特征分类模型进行训练过程包括:
获取异常样本图像数据和正常样本图像数据,并对所述异常样本图像数据和所述正常样本图像数据进行预处理得到各样本图像数据的功能连接矩阵;
利用所述特征向量降维方法将所述功能连接矩阵进行降维得到降维特征向量,并基于所述降维特征向量生成训练样本集;
将所述训练样本集中样本输入至待训练的特征分类模型中,得到与所述各样本对应的当前输出识别结果;
判断所述当前输出识别结果和期望输出识别结果之间的误差是否满足预设条件;若否,
调节所述特征分类模型的预判参数。
可选的,所述待训练的特征分类模型为基分类器,所述调节所述特征分类模型的预判参数,包括:
迭代所述基分类器得到多个弱分类器;
在迭代分类器的过程中,调节各分类器的参数;
将所述基分类器与所述多个弱分类器叠加融合得到强分类器作为所述特征分类模型。
可选的,所述待识别的医学图像包括待识别对象的功能性磁共振图像,相应的,对所述医学图像进行预处理得到功能连接矩阵包括:
对所述待识别医学图像依次进行时间配准、运动矫正、标准化和实空间滤波操作,得到第一图像数据;
将所述第一图像数据与功能分区模板进行配准并分割得到各功能分区数据;
计算所述各功能分区数据间的相关系数得到连接矩阵。
第三方面,本发明实施例还提供了一种特征向量降维装置,该装置包括:
矩阵获取模块,用于获取待处理的矩阵集合;
空间转换模块,用于将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
核函数获取模块,用于基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
降维模块,用于计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
进一步的,空间转换模块具体用于:
将所述矩阵集合转变为具有半正定特征的拉普拉斯矩阵Ls=Ds-Ws,其中,矩阵集合{Ws∈R(n×n),s=1…S,wij≥0},n为矩阵集合中矩阵维度,s为样本总数,D=diag(∑jwij);
通过公式将Ls转变为变为正定矩阵。
进一步的,所述黎曼测度核函数为其中,s1和s2分别为计算内积的两个矩阵的标识。
第四方面,本发明实施例还提供了一种医学图像识别装置,该装置包括:
图像预处理模块,用于获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
特征降维模块,用于利用本发明任一实施例所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
图像识别模块,用于将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
可选的,所述装置还包括:
模型训练模块,用于对所述特征分类模型进行训练;
具体的,所述模型训练模块包括:
数据预处理单元,用于异常样本图像数据和正常样本图像数据,并对所述异常样本图像数据和所述正常样本图像数据进行预处理得到各样本图像数据的功能连接矩阵;
样本生成单元,用于利用所述特征向量降维方法将所述功能连接矩阵进行降维得到降维特征向量,并基于所述降维特征向量生成训练样本集;
当前识别结果获取单元,用于将所述训练样本集中样本输入至待训练的特征分类模型中,得到与所述各训练样本对应的当前输出识别结果;
参数调节单元,用于判断所述当前输出识别结果和期望输出识别结果之间的误差是否满足预设条件;若否,调节所述特征分类模型的预判参数。
可选的,所述待训练的特征分类模型为基分类器,参数调节单元具体用于:
迭代所述基分类器得到多个弱分类器;
在迭代分类器的过程中,调节各分类器的参数;
将所述基分类器与所述多个弱分类器叠加融合得到强分类器作为所述特征分类模型。
可选的,所述待识别的医学图像包括待识别对象的功能性磁共振图像,相应的,图像预处理模块包括:
图像配准与去噪单元,用于对所述待识别医学图像依次进行时间配准、运动矫正、标准化和实空间滤波操作,得到第一图像数据;
图像分割单元,用于将所述第一图像数据与功能分区模板进行配准并分割得到各功能分区数据;
连接矩阵获取单元,用于计算所述各功能分区数据间的相关系数得到连接矩阵。
第五方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的特征向量降维方法。
第六方面,本发明实施例还提供了一种服务器,该服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的医学图像识别方法。
第七方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的特征向量降维方法。
第八方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的医学图像识别方法。
本发明实施例通过采用以黎曼测度核函数作为核函数的主成分分析法对多维矩阵数据进行降维,可以保留矩阵数据中的重要的结构信息,使非线性的数据样本特征也可以被分开,应用到图像处理中可以优化图像处理的结果。
附图说明
图1是本发明实施例一中的特征向量降维方法的流程图;
图2是本发明实施例二中的医学图像识别方法的流程图;
图2a本发明实施例二中强迫症患者脑部医学图像中重要性脑区连接的冠状面示意图;
图2b本发明实施例二中强迫症患者脑部医学图像中重要性脑区连接的横断面示意图;
图2c本发明实施例二中强迫症患者脑部医学图像中重要性脑区连接的矢状面示意图;
图2d本发明实施例二中强迫症患者脑部医学图像中重要性脑区连接的可视化示意图;
图3是本发明实施例三中的特征分类模型训练过程的流程图;
图3a是本发明实施例三中的XGBoosting算法中分类树的结构示意图;
图4是本发明实施例四中的特征向量降维装置的结构示意图;
图5是本发明实施例五中的医学图像识别装置的结构示意图;
图6是本发明实施例六中的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的特征向量降维方法的流程图,本实施例可适用于多维矩阵数据处理的情况,如图像处理,该方法可以由特征向量降维装置来执行,该装置例如可配置于服务器中。如图1所示,该方法具体包括:
S110、获取待处理的矩阵集合。
其中,矩阵集合可以是一些实验数据中的矩阵,也可以是图像中与像素点相对应的像素值矩阵数据,或是由上述矩阵数据经过数学变换而来的矩阵数据。示例性的,在磁共振图像或CT图像等医学图像中,图像数据就是由经过处理的各体素的像素值组成的二维矩阵数据。矩阵集合中的矩阵数据可以为非线性矩阵。
S120、将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形。
具体的,将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形,包括:
将所述矩阵集合转变为具有半正定特征的拉普拉斯矩阵Ls=Ds-Ws,其中,矩阵集合{Ws∈R(n×n),s=1…S,wij≥0},n为矩阵集合中矩阵维度,s为样本总数,D=diag(∑jwij);通过公式将Ls转变为变为正定矩阵,其中γ为任意正整数。
示例性的,假设矩阵集合为一个包含有100个100*100矩阵的矩阵集合,那么n的数值为100,s的值为100.
S130、基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵。
其中,黎曼测度核函数为其中,s1和s2分别为计算内积的两个矩阵的标识。
按照步骤S130中的假设,s1和s2则分别标识在100个矩阵中不同的两个矩阵。通过上述黎曼测度核函数公式计算100个100*100矩阵的内积,可以得到一个100*100的核函数矩阵K100*100
S140、计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
在该步骤中,则是进一步的将计算核函数矩阵K100×10的特征值[λ12,…,λ100]和对应的特征向量[α12,…,α100],这里的特征值是按从大到小次序排列的,其大小表示原始数据在该特征向量方向的信息量的大小。
然后,需要将原始数据降维至m维。取前m个信息量较大的特征向量方向[12,…,αm]作为主成分的方向,便将矩阵集合中的矩阵数据映射到这个m维的低维空间,得到映射之后的坐标即为降维后的数据,因此,每个样本的特征均降为m维。其中,m是根据经验值设定的,小于矩阵集合中矩阵维度的数值。
进一步的,使用以黎曼测度核函数为核函数的主成分分析法是对线性主成分分析法的改进,在这里使用了核技巧(kernel trick),使得非线性的数据样本也可以被分开,保留了原始数据的二维拓扑结构。
进一步的,基于上述特征降维方法的步骤,可以建立一个特征降维模型,在确定模型的参数后,对于任何一个矩阵数据可以直接将其输入至特征降维模型中进行降维。
本实施例的技术方案,通过采用以黎曼测度核函数作为核函数的主成分分析法对多维矩阵数据进行降维,可以保留矩阵数据中的重要的结构信息,使非线性的数据样本特征也可以被分开,应用到图像处理中可以优化图像处理的结果。
实施例二
图2为本发明实施例二提供的医学图像识别方法的流程图,本实施例二所提供的方法是在采用了实施例一所述的特征向量降维方法的基础上实现,通过为医学图像数据进行降维处理,提取出与某一疾病相关性较强的连接特征,识别出医学图像是否指示有所述疾病相关的指标。如图2所示,所述方法包括:
S210、获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵。
其中,待识别的医学图像可以是通过功能磁共振对目标扫描部位进行扫描获得的医学图像,如脑部功能性磁共振图像、心脏的功能性磁共振图像或是其他器官部位的功能性磁共振图像。
在本实施例中以脑功能性磁共振图像为例进行说明。
具体的,当获取到脑部的功能性磁共振图像之后,对大脑部的功能性磁共振图像数据依次进行时间配准、头动矫正、标准化和实空间滤波操作,以减少因为数据采集产生的运动伪影和生理学特征导致的误差。
在对脑部的功能性磁共振图像数据进行去噪和弥补误差处理之后,即可将经过处理的图像数据与各脑功能区进行匹配与分割。具体的,可直接将预处理后的脑部功能性磁共振图像数据与标准脑区(Anatomical Automatic Labeling,AAL)模板进行配准并分割得到各脑区数据。其中,AAL模板一共有116个区域,有90个区域属于大脑,26个区域属于小脑结构,每个脑区都有与其相对应的功能,各脑区之间也可以协同工作实现某个功能。
然后,以每个脑区的数据为单位,计算每个脑区中所有体素的基于血氧水平依赖(BOLD)信号的平均值,并计算每个脑区的时间序列信号与其他脑区的时间序列信号之间的相关系数,得到全脑116个脑区的功能连接图,即获得一个116*116的连接矩阵。每个脑区的时间序列信号是指在该脑区内不同时间点的所有体素的基于血氧水平依赖(BOLD)信号的平均值。
S220、采用特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量。
具体的,将连接矩阵按照实施例一所提供的特征向量降维方法进行降维,在不丢失图像信息的前提下,从连接矩阵中提取出与目标识别疾病相关性较强的特征向量。
S230、将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
其中,特征分类模型是基于大量的学习资料,经过机器学习过程之后而获得的一个模型。特征分类模型以经过特征向量降维方法得到的降维特征向量为输入数据,根据输入的降维特征向量输出对待识别医学图像数据的识别结果。具体的,学习资料是包括患有目标识别疾病的患者的医学图像数据经过特征向量降维处理的降维特征向量和未患有该目标识别疾病的正常人的医学图像数据经过特征向量降维处理的降维特征向量。
进一步的,分类结果出来之后,可将选择得到的特征反传,通过计算分类器中每一个特征的重要性得到原始特征的重要性,并通过可视化显示结果,有助于结果解释和病理理解。如在强迫症患者的脑部医学图像识别中,通过特征反转返回得到和强迫症相关的连接。可在医学图像上直接显示出影响决策树的前三十个脑区连接。通过对各脑区不同颜色的标识来表示各脑区连接程度的强弱,从而说明各脑区对强迫症这一疾病的影响程度。具体可参考图2a、图2b、图2c和图2d,分别为强迫症患者脑部医学图像中重要性脑区连接的冠状面示意图、横断面示意图、矢状面示意图和可视化示意图,在各图中,脑区之间连接线灰度值的大小表示脑区之间连接关系的强弱。在各图中,脑区之间连接线灰度值的大小与连接线的粗细程度相对应,连接线越粗,表示该脑功能区的连接对强迫症的影响较大,而连接线较细的脑功能区,则表示该脑功能区的连接对强迫症的影响较小。在实际应用中,可采用不同的颜色进行区分。
这里需要说明书的是,本实施例的医学图像识别结果仅辅助医生对临床疾病的诊断,提高诊断效率,自身并不会输出诊断结果。
本实施例的技术方案,通过采用特征向量降维方法对医学图像数据进行降维,利用黎曼测度核函数对映射到正定对称矩阵空间的连接矩阵先升维到更高维空间之后再降维至目标维度,得到降维后的特征向量,并将降维后的特征向量输入至预先训练好的特征分类模型中,从而获取到医学图像的识别结果,解决了现有技术中图像处理过程中丢失重要图像信息,且识别效率低的问题,实现了图像处理效果的优化,并缩短了图像处理的时间,提高了图像识别的准确率。
实施例三
图3为本发明实施例三提供的特征分类模型训练过程的流程图,本实施例三所提供的方法是在实施例二的基础上进一步的优化,以说明特征分类模型的建立过程。如图3所示,所述方法包括:
S310、获取异常样本图像数据和正常样本图像数据,并对所述异常样本图像数据和所述正常样图像数据进行预处理得到各样本图像数据的功能连接矩阵。
其中,根据特征分类模型的训练样本可根据该模型的应用对象进行选择,异常样本即为患有某一种疾病的患者的医学图像数据,正常样本即为未患有该疾病的正常人的医学图像数据。示例性的,若待识别的医学图像是为了根据识别结果诊断病人是否患有强迫症,那么异常样本图像数据则需要选择患有强迫症的患者的脑部功能性磁共振图像,正常样本图像数据为未患有强迫症的正常人的脑部功能性磁共振图像。此外,若是医学图像的作用是用于辅助诊断其他疾病,则需要选择患有其他疾病的患者的医学图像和未患有相应疾病的正常人的医学图像,如帕金森综合征等疾病。进一步的,异常样本与正常样本的数量可以是相同的数值,也可以是不同的数值,样本的数量越多,训练得到的模型识别的准确率相对越高。
对医学图像进行预处理得到功能连接矩阵的具体步骤可参考实施例二中的步骤。经过对上述医学图像的预处理,可得到一个连接矩阵集合,该集合中样本数量为第一预设数量与第二预设数量之和。根据AAL模板的脑功能分区,每一个连接矩阵都是一个116*116的二维矩阵。
S320、利用所述特征向量降维方法将所述功能连接矩阵进行降维得到降维特征向量,并基于所述降维特征向量生成训练样本集。
即利用本发明实施例一中所提供的特征向量降维方法对功能连接矩阵进行降维处理,得到降维特征向量。
假设异常样本图像数据的数量为61,正常样本图像数据的数量为68,那么连接矩阵集合中样本数量为129,使用黎曼测度核函数分别计算其内积在高维空间上的表示,得到核函数矩阵K129×129。进一步的,计算核函数矩阵K129×129的特征值[λ12,…,λ129]和对应的特征向量[α12,…,α129],这里的特征值是按从大到小次序排列的,其大小表示原始数据在该特征向量方向的信息量的大小。
然后,需要将原始数据降维至m维。取前m个信息量较大的特征向量方向[α12,…,αm]作为主成分的方向,便将训练样本集的数据映射到这个m维的低维空间,得到映射之后的坐标即为降维后的数据,因此,每个样本的特征均降为m维。其中,m是根据经验值设定的。
S330、将所述训练样本集中样本输入至待训练的特征分类模型中,得到与所述各样本对应的当前输出识别结果。
具体的,待训练特征分类模型为基分类器,是分类模型的基础分类器,可以选择如支持向量机、超限学习机、决策树、随机森林法、逻辑回归或岭回归等分类模型作为基分类器。
S340、判断所述当前输出识别结果和期望输出识别结果之间的误差是否满足预设条件。若否,则执行步骤S350。
S350、调节所述特征分类模型的预判参数。
具体的,每得到一份当前输出识别结果,即可得到一个弱分类器,使用基分类器不断地迭代构建一系列的弱分类器,将分类结果融合从而得到一个强分类器,使得结果更准确,一致性更好。当当前输出识别结果和期望输出识别结果之间的误差不满足预设条件时,则说明当前所迭代的分类器还不能作为最终的强分类器,还需要继续调整预判参数,进行分类器的迭代。
在一种实施方式中,使用回归决策树作为基分类器,即模型中不断地迭代生成回归决策树。我们约定h(x,Θm)为第m颗决策树,Θm表示决策树的参数,M为所有树的个数。强分类器FM(x)可以由多个弱分类器线性相加而成,β为线性相加的权重:
每次迭代生成的新决策树是根据前面的所有决策树的效果产生的,我们希望通过建立多个回归树,使得树群的预测值尽量接近真实值。我们迭代生成的每棵决策树是相关联的,下一个决策树的输入样本会与前面决策树的训练结果相关,关系如下:
1≤m≤M Fm+1(x)=Fm(x)+h(x)
我们的目的是使最终迭代得到的模型FM(β,x)接近真实结果y,为了达到这样的目的,我们可以写出损失函数,其中P指迭代过程中所有的参数:
迭代过程就是不断优化Φ(P)的过程。就这样,利用前一轮迭代的误差不断地迭代生成新的决策树并入树群,校正前一轮迭代被错误分类的样本,得到使得损失函数最小的参数P,直到训练集的预测准确率达到100%时停止迭代生成新的决策树,此时的模型具有非常强的分类能力。
Boosting方法是一种用来提高弱分类算法准确度的方法,XGBoosting(eXtremeGradient Boosting)算法是对Boosting算法的改进,以强迫症患者脑部医学图像和正常人脑部医学图像的识别为例,XGBoosting算法中的回归树模型如图3a所示。图3a仅作参考和解释原理使用,图中的数值,如S1=0.3等,不是实际模型中分类器的数值。矩形框即表示在该特征上进行分裂(作为一个分类器),一次分裂后,样本集根据该特征的大小,被分成了两部分经过一系列的迭代,并将每次迭代的结果相加,即可算出每个样本的得分总和,根据该得分总和判断该样本是否为强迫症患者的图像。假设强迫症病人得分为负值及正常人得分为正值,以图中样本C为例,其小脑与丘脑之间的连接小于0.5,故分数-1;前额皮质与海马体之间的连接>0.2,分数+1.3,最终得分为0.3>0,故样本C并未患有强迫症的正常人的医学图像,虚线椭圆中的样本D即为患有强迫症的患者的医学图像。样本A、B和C则在第一次迭代后被分类为未患有强迫症的正常人的医学图像。
可选的,在迭代分类器的过程中,采用网格搜索(Grid Search)方法调节分类器的超参数。
具体的,当回归决策树作为基分类器时,需要调节的超参数有学习率、最小叶子节点样本权重和、树的最大深度、每棵树权重改变的最大步长以及节点分割判断的阈值。
学习率为每次学习的步长,类似于梯度下降法中的学习率。最小叶子节点样本权重和定义的是观测样本生成的子节点的权重最小和,用于防止过拟合问题。节点分割判断的阈值指定了节点分裂所需的函数下降值,大于这个值节点进行分裂。
网格搜索方法本质上是一种遍历算法,对所有的超参进行遍历,最后得到表现最为优越的超参数组合。然而XGBoosting参数较多,且参数取值的典型范围较大,一次性对所有的超参数采用遍历法计算时间长,占用CPU资源多。调参时选用较高的学习率,由于最小叶子节点样本权重和和树的最大深度对最终模型的结果影响较大,优先通过网格搜索选择最小叶子节点样本权重和和树的最大深度这两个参数,先进行大范围的粗调,再进行小范围的微调。之后再进行节点分割判断的阈值参数的调优,最终再固定其他参数,调节学习率。
进一步的,当异常样本图像数据和正常样本图像数据的数量不同时,对特征分类模型的分类评估由敏感度、特异度和准确率给出,调节分类器超参数时也会综合考虑这三种评判标准。敏感度又称真阳性率,即异常样本图像数据被识别为异常的概率,此值越大,说明诊断器越灵敏;特异度又称真阴性率,即正常样本图像数据被识别为正常的概率,此值越大,说明诊断器越保守精确;准确率即为异常样本图像数据被识别为异常的数量与正常样本图像数据被识别为正常的数量与所有样本数量的比值。
在实际验证过程中,以对强迫症患者的脑图像识别为例,经过十折验证之后分类器的准确率为90%,且医学图像识别程序在计算机设备中的运行时间为20-30秒时间,从而可证明该医学图像识别方法准确率高,耗时较短。
进一步的,在分类器构建完成后,可以从分类器中直接提取出重要的特征。如果一个特征在做决策树做重要决定时被选用,那么该特征就具有更高的特征重要性。XGBoosting的特征重要性是通过判断在该特征上分裂是否会提高分类器表现来计算的。分类器的表现通常用基尼系数来衡量。基尼系数(又称为基尼不纯度)是表示根据某一特征进行分类后,分类后的样本子集中一个随机选中的样本被分错的可能性。对模型中的每一棵决策树,分类器首先贪婪地在所有的特征上进行分裂,分裂后样本被划分为两个子集。计算该次分裂的基尼系数,如果该次分裂使得基尼系数减小,那么则认为该特征是较好的分类条件。特征的重要性可以帮助我们找出对强迫正患者脑部图像识别的最关键的脑区连接。
本实施例的技术方案,在上述实施例的基础上,详细描述了特征分类模型训练的过程,通过将降维特征向量输入到基分类器,由基分类器不断迭代得到弱分类器,再融合各分类器得到强分类器,得到图像识别结果,解决了现有技术中用医学图像识别不准确,且识别效率低的问题,实现了实现对医学图像的包含预处理、网络生成、特征选择和自动分类步骤在内的自动处理,可对一些疾病患者医学图像全自动检测,耗时短,准确率高。
实施例四
图4是本发明实施例四中的特征向量降维装置的结构示意图。如图4所示,特征向量降维装置包括:矩阵获取模块410、空间转换模块420、核函数获取模块430和降维模块440。
其中,矩阵获取模块410,用于获取待处理的矩阵集合;空间转换模块420,用于将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;核函数获取模块430,用于基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;降维模块440,用于计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
本实施例的技术方案,通过采用以黎曼测度核函数作为核函数的主成分分析法对多维矩阵数据进行降维,可以保留矩阵数据中的重要的结构信息,使非线性的数据样本特征也可以被分开,应用到图像处理中可以优化图像处理的结果。
进一步的,空间转换模块420具体用于:
将所述矩阵集合转变为具有半正定特征的拉普拉斯矩阵Ls=Ds-Ws,其中,矩阵集合{Ws∈R(n×n),s=1…S,wij≥0},n为矩阵集合中矩阵维度,s为样本总数,D=diag(∑jwij);
通过公式将Ls转变为变为正定矩阵,其中γ为任意正整数。
进一步的,所述黎曼测度核函数为其中,s1和s2分别为计算内积的两个矩阵的标识。
本发明实施例所提供的特征向量降维装置可执行本发明任意实施例所提供的特征向量降维方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5是本发明实施例五中的医学图像识别装置的结构示意图。如图5所示,医学图像的识别装置包括:图像预处理模块510、特征降维模块520和图像识别模块530。
其中,图像预处理模块510,用于获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;特征降维模块520,用于调用本发明任一实施例所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;图像识别模块530,用于将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
本实施例的技术方案,通过采用特征向量降维方法对医学图像数据进行降维,利用黎曼测度核函数对映射到正定对称矩阵空间的连接矩阵先升维到更高维空间之后再降维至目标维度,得到降维后的特征向量,并将降维后的特征向量输入至预先训练好的特征分类模型中,从而获取到医学图像的识别结果,解决了现有技术中图像处理过程中丢失重要图像信息,且识别效率低的问题,实现了图像处理效果的优化,并缩短了图像处理的时间,提高了图像识别的准确率。
可选的,所述装置还包括:
模型训练模块,用于对所述特征分类模型进行训练;
具体的,所述模型训练模块包括:
数据预处理单元,用于获取异常样本图像数据和正常样本图像数据,并对所述异常样本图像数据和所述正常样本图像数据进行预处理得到各样本图像数据的功能连接矩阵;
样本生成单元,用于利用所述特征向量降维方法将所述功能连接矩阵进行降维得到降维特征向量,并基于所述降维特征向量生成训练样本集;
当前识别结果获取单元,用于将所述训练样本集中样本输入至待训练的特征分类模型中,得到与所述各样本对应的当前输出识别结果;
参数调节单元,用于判断所述当前输出识别结果和期望输出识别结果之间的误差是否满足预设条件;若否,
调节所述特征分类模型的预判参数。
可选的,所述待训练的特征分类模型为基分类器,参数调节单元具体用于:
迭代所述基分类器得到多个弱分类器;
在迭代分类器的过程中,调节各分类器的参数;
将所述基分类器与所述多个弱分类器叠加融合得到强分类器作为所述特征分类模型。
可选的,所述待识别的医学图像包括待识别对象的功能性磁共振图像,相应的,图像预处理模块510包括:
图像配准与去躁单元,用于对所述待识别医学图像依次进行时间配准、运动矫正、标准化和实空间滤波操作,得到第一图像数据;
图像分割单元,用于将所述第一图像数据与功能分区模板进行配准并分割得到各功能分区数据;
连接矩阵获取单元,用于计算所述各功能分区数据间的相关系数得到连接矩阵。
本发明实施例所提供的医学图像的识别装置可执行本发明任意实施例所提供的医学图像的识别方法,具备执行方法相应的功能模块和有益效果。
实施例六
图6是本发明实施例四中的服务器的结构示意图。图6示出了适于用来实现本发明实施方式的示例性服务器612的框图。图6显示的服务器612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,服务器612以通用计算设备的形式表现。服务器612的组件可以包括但不限于:一个或者多个处理器或者处理单元616,系统存储器628,连接不同系统组件(包括系统存储器628和处理单元616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。服务器612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储器628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块642的程序/实用工具640,可以存储在例如存储器628中,这样的程序模块642包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块642通常执行本发明所描述的实施例中的功能和/或方法。
服务器612也可以与一个或多个外部设备614(例如键盘、指向设备、显示器624等)通信,还可与一个或者多个使得用户能与该服务器612交互的设备通信,和/或与使得该服务器612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,服务器612还可以通过网络适配器620与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与服务器612的其它模块通信。应当明白,尽管图6中未示出,可以结合服务器612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元616通过运行存储在系统存储器628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的特征向量降维方法,该方法主要包括:
获取待处理的矩阵集合;
将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
在另外一个实施例中,也提供了一种服务器,该服务器的具体结构与上述服务器的结构相同,当处理单元通过运行存储在系统存储器中的程序,从而执行各种功能应用以及数据处理,可实现本发明实施例所提供的医学图像识别方法,该方法主要包括:
获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
采用本发明实施例中任一所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的特征向量降维方法,该方法主要包括:
获取待处理的矩阵集合;
将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”如”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)域连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在另外一个实施例中,也提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的医学图像识别方法,该方法主要包括:
获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
采用本发明实施例中任一所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
该计算机存储介质的具体描述同实施例六中内容所述,在此不再赘述。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种特征向量降维方法,其特征在于,包括:
获取待处理的矩阵集合;
将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
2.根据权利要求1所述的特征向量降维方法,其特征在于,将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形,包括:
将所述矩阵集合转变为具有半正定特征的拉普拉斯矩阵Ls=Ds-Ws,其中,矩阵集合{Ws∈R(n×n),s=1…S,wij≥0},n为矩阵集合中矩阵维度,s为样本总数,D=diag(∑jwij);
通过公式将Ls转变为变为正定矩阵,其中γ为任意正整数。
3.根据权利要求2所述的特征向量降维方法,其特征在于,所述黎曼测度核函数为其中,s1和s2分别为计算内积的两个矩阵的标识。
4.一种医学图像识别方法,其特征在于,包括:
获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
采用权利要求1-3中任一所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
5.根据权利要求4所述的医学图像识别方法,其特征在于,所述方法还包括:
对所述特征分类模型进行训练,相应的,对所述特征分类模型进行训练过程包括:
获取异常样本图像数据和正常样本图像数据,并对所述异常样本图像数据和所述正常样本图像数据进行预处理得到各样本图像数据的功能连接矩阵;
利用所述特征向量降维方法将所述功能连接矩阵进行降维得到降维特征向量,并基于所述降维特征向量生成训练样本集;
将所述训练样本集中样本输入至待训练的特征分类模型中,得到与所述各样本对应的当前输出识别结果;
判断所述当前输出识别结果和期望输出识别结果之间的误差是否满足预设条件;若否,
调节所述特征分类模型的预判参数。
6.根据权利要求5所述的医学图像识别方法,其特征在于,所述待训练的特征分类模型为基分类器,所述调节所述特征分类模型的预判参数,包括:
迭代所述基分类器得到多个弱分类器;
在迭代分类器的过程中,调节各分类器的参数;
将所述基分类器与所述多个弱分类器叠加融合得到强分类器作为所述特征分类模型。
7.根据权利要求4所述医学图像识别方法,其特征在于,所述待识别的医学图像包括待识别对象的功能性磁共振图像,相应的,对所述医学图像进行预处理得到功能连接矩阵包括:对所述待识别医学图像依次进行时间配准、运动矫正、标准化和实空间滤波操作,得到第一图像数据;
将所述第一图像数据与功能分区模板进行配准并分割得到各功能分区数据;
计算所述各功能分区数据间的相关系数得到连接矩阵。
8.一种特征向量降维装置,其特征在于,包括:
矩阵获取模块,用于获取待处理的矩阵集合;
空间转换模块,用于将所述矩阵集合映射到正定对称矩阵空间构成黎曼流形;
核函数获取模块,用于基于黎曼测度核函数,利用主成分分析法计算映射到正定对称矩阵空间的矩阵集合的内积得到核函数矩阵;
降维模块,用于计算所述核函数矩阵的特征值与特征向量,将所述特征向量降至预设维度,得到降维特征向量。
9.一种医学图像识别装置,其特征在于,包括:
图像预处理模块,用于获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
特征降维模块,用于利用权利要求8所述的特征向量降维装置对所述功能连接矩阵进行降维处理,得到降维特征向量;
图像识别模块,用于将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如下方法:
获取待识别的医学图像,并对所述医学图像进行预处理得到功能连接矩阵;
采用权利要求1-3中任一所述的特征向量降维方法对所述功能连接矩阵进行降维处理,得到降维特征向量;
将所述降维特征向量输入至预先训练完成的特征分类模型得到识别结果。
CN201811147961.XA 2018-09-29 2018-09-29 特征向量降维方法和医学图像识别方法、装置及存储介质 Active CN109409416B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811147961.XA CN109409416B (zh) 2018-09-29 2018-09-29 特征向量降维方法和医学图像识别方法、装置及存储介质
US16/555,716 US11210781B2 (en) 2018-09-29 2019-08-29 Methods and devices for reducing dimension of eigenvectors and diagnosing medical images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811147961.XA CN109409416B (zh) 2018-09-29 2018-09-29 特征向量降维方法和医学图像识别方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109409416A true CN109409416A (zh) 2019-03-01
CN109409416B CN109409416B (zh) 2021-06-18

Family

ID=65466547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811147961.XA Active CN109409416B (zh) 2018-09-29 2018-09-29 特征向量降维方法和医学图像识别方法、装置及存储介质

Country Status (2)

Country Link
US (1) US11210781B2 (zh)
CN (1) CN109409416B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163250A (zh) * 2019-04-10 2019-08-23 阿里巴巴集团控股有限公司 基于分布式调度的图像脱敏处理系统、方法以及装置
CN110517747A (zh) * 2019-08-30 2019-11-29 志诺维思(北京)基因科技有限公司 病理数据处理方法、装置及电子设备
CN111291793A (zh) * 2020-01-20 2020-06-16 北京大学口腔医学院 一种网格曲面的元素分类方法、装置及存储介质
CN111965632A (zh) * 2020-08-10 2020-11-20 中国人民解放军国防科技大学 一种基于黎曼流形降维的雷达目标检测方法
CN112308068A (zh) * 2020-10-28 2021-02-02 深圳大学 形状差异分析方法、装置、服务器及存储介质
CN112580436A (zh) * 2020-11-25 2021-03-30 重庆邮电大学 一种基于黎曼流形坐标对齐的脑电信号域适应方法
CN112733734A (zh) * 2021-01-13 2021-04-30 中南大学 一种基于黎曼流形特征和lstm网络相结合的交通异常事件检测方法
CN113159546A (zh) * 2021-04-12 2021-07-23 北京工商大学 无监督降维密度聚类的农作物供应链危害物风险判断方法及系统
CN113485798A (zh) * 2021-06-16 2021-10-08 曙光信息产业(北京)有限公司 核函数生成方法、装置、设备以及存储介质
CN114446467A (zh) * 2021-12-31 2022-05-06 华中科技大学同济医学院附属协和医院 一种基于结构化报告模板的肺功能定量分析方法
CN115274127A (zh) * 2022-09-27 2022-11-01 武汉大学人民医院(湖北省人民医院) 基于信息技术学与医学融合的医学信息管理方法、装置
CN115330825A (zh) * 2022-08-09 2022-11-11 苏州大学 一种折反射图像边缘检测方法、装置及可读存储介质
CN115982533A (zh) * 2023-01-09 2023-04-18 浙江中智达科技有限公司 一种工业控制器降维方法、装置、设备及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112819085B (zh) * 2021-02-10 2023-10-24 中国银联股份有限公司 基于机器学习的模型优化方法、装置及存储介质
CN113327238A (zh) * 2021-06-10 2021-08-31 紫东信息科技(苏州)有限公司 一种胃镜图像分类模型构建方法及胃镜图像分类方法
CN113902724B (zh) * 2021-10-18 2022-07-01 广州医科大学附属肿瘤医院 瘤细胞图像的分类方法及装置、设备、存储介质
CN114091029B (zh) * 2022-01-24 2022-06-21 深信服科技股份有限公司 恶意文件检测模型的训练系统、方法、设备、介质及平台
CN115293303B (zh) * 2022-10-10 2023-01-24 广东电网有限责任公司中山供电局 一种高压输电线网监测方法、系统、设备和介质
CN116230087B (zh) * 2022-12-02 2024-05-14 深圳太力生物技术有限责任公司 培养基成分优化的方法及装置
CN116308963B (zh) * 2023-05-19 2023-07-18 北京十环信息有限公司 一种政务数据分析方法及系统
CN116361668B (zh) * 2023-06-02 2023-08-11 北京安天网络安全技术有限公司 一种多个sdr设备的监控方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504723A (zh) * 2009-03-13 2009-08-12 清华大学 一种建立投影空间的方法和装置
CN104373338A (zh) * 2014-11-19 2015-02-25 北京航空航天大学 一种基于lmd-svd和ig-svm的液压泵故障诊断方法
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN108093406A (zh) * 2017-11-29 2018-05-29 重庆邮电大学 一种基于集成学习的无线传感网入侵检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202140B2 (en) * 2008-09-05 2015-12-01 Siemens Medical Solutions Usa, Inc. Quotient appearance manifold mapping for image classification
US9256966B2 (en) * 2011-02-17 2016-02-09 The Johns Hopkins University Multiparametric non-linear dimension reduction methods and systems related thereto

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101504723A (zh) * 2009-03-13 2009-08-12 清华大学 一种建立投影空间的方法和装置
CN104373338A (zh) * 2014-11-19 2015-02-25 北京航空航天大学 一种基于lmd-svd和ig-svm的液压泵故障诊断方法
CN105335753A (zh) * 2015-10-29 2016-02-17 小米科技有限责任公司 图像识别方法和装置
CN108093406A (zh) * 2017-11-29 2018-05-29 重庆邮电大学 一种基于集成学习的无线传感网入侵检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岳洪伟: "流形核与LPP相结合的毛杆折痕识别方法", 《光电工程》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163250A (zh) * 2019-04-10 2019-08-23 阿里巴巴集团控股有限公司 基于分布式调度的图像脱敏处理系统、方法以及装置
CN110163250B (zh) * 2019-04-10 2023-10-24 创新先进技术有限公司 基于分布式调度的图像脱敏处理系统、方法以及装置
CN110517747A (zh) * 2019-08-30 2019-11-29 志诺维思(北京)基因科技有限公司 病理数据处理方法、装置及电子设备
CN110517747B (zh) * 2019-08-30 2022-06-03 志诺维思(北京)基因科技有限公司 病理数据处理方法、装置及电子设备
CN111291793A (zh) * 2020-01-20 2020-06-16 北京大学口腔医学院 一种网格曲面的元素分类方法、装置及存储介质
CN111291793B (zh) * 2020-01-20 2023-11-14 北京大学口腔医学院 一种网格曲面的元素分类方法、装置及存储介质
CN111965632B (zh) * 2020-08-10 2022-06-17 中国人民解放军国防科技大学 一种基于黎曼流形降维的雷达目标检测方法
CN111965632A (zh) * 2020-08-10 2020-11-20 中国人民解放军国防科技大学 一种基于黎曼流形降维的雷达目标检测方法
CN112308068A (zh) * 2020-10-28 2021-02-02 深圳大学 形状差异分析方法、装置、服务器及存储介质
CN112308068B (zh) * 2020-10-28 2023-09-26 深圳大学 形状差异分析方法、装置、服务器及存储介质
CN112580436A (zh) * 2020-11-25 2021-03-30 重庆邮电大学 一种基于黎曼流形坐标对齐的脑电信号域适应方法
CN112580436B (zh) * 2020-11-25 2022-05-03 重庆邮电大学 一种基于黎曼流形坐标对齐的脑电信号域适应方法
CN112733734A (zh) * 2021-01-13 2021-04-30 中南大学 一种基于黎曼流形特征和lstm网络相结合的交通异常事件检测方法
CN112733734B (zh) * 2021-01-13 2023-04-21 中南大学 一种基于黎曼流形特征和lstm网络相结合的交通异常事件检测方法
CN113159546A (zh) * 2021-04-12 2021-07-23 北京工商大学 无监督降维密度聚类的农作物供应链危害物风险判断方法及系统
CN113159546B (zh) * 2021-04-12 2024-05-14 北京工商大学 无监督降维密度聚类的农作物供应链危害物风险判断方法及系统
CN113485798A (zh) * 2021-06-16 2021-10-08 曙光信息产业(北京)有限公司 核函数生成方法、装置、设备以及存储介质
CN113485798B (zh) * 2021-06-16 2023-10-31 曙光信息产业(北京)有限公司 核函数生成方法、装置、设备以及存储介质
CN114446467B (zh) * 2021-12-31 2023-09-12 华中科技大学同济医学院附属协和医院 一种基于结构化报告模板的肺功能定量分析方法
CN114446467A (zh) * 2021-12-31 2022-05-06 华中科技大学同济医学院附属协和医院 一种基于结构化报告模板的肺功能定量分析方法
CN115330825A (zh) * 2022-08-09 2022-11-11 苏州大学 一种折反射图像边缘检测方法、装置及可读存储介质
CN115330825B (zh) * 2022-08-09 2023-08-11 苏州大学 一种折反射图像边缘检测方法、装置及可读存储介质
CN115274127A (zh) * 2022-09-27 2022-11-01 武汉大学人民医院(湖北省人民医院) 基于信息技术学与医学融合的医学信息管理方法、装置
CN115982533A (zh) * 2023-01-09 2023-04-18 浙江中智达科技有限公司 一种工业控制器降维方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US20200104984A1 (en) 2020-04-02
CN109409416B (zh) 2021-06-18
US11210781B2 (en) 2021-12-28

Similar Documents

Publication Publication Date Title
CN109409416A (zh) 特征向量降维方法和医学图像识别方法、装置及存储介质
Frid-Adar et al. Synthetic data augmentation using GAN for improved liver lesion classification
Hussein et al. Lung and pancreatic tumor characterization in the deep learning era: novel supervised and unsupervised learning approaches
Xu et al. Efficient multiple organ localization in CT image using 3D region proposal network
Tschuchnig et al. Generative adversarial networks in digital pathology: a survey on trends and future potential
CN111524106B (zh) 颅骨骨折检测和模型训练方法、装置、设备和存储介质
CN110276745B (zh) 一种基于生成对抗网络的病理图像检测算法
Sinha et al. Efficient segmentation methods for tumor detection in MRI images
US10853409B2 (en) Systems and methods for image search
CN114581662B (zh) 一种脑肿瘤图像的分割方法、系统、装置及存储介质
CN107563434B (zh) 一种基于三维卷积神经网络的脑部mri图像分类方法、装置
CN107730542B (zh) 锥束计算机断层扫描图像对应与配准方法
CN111402198B (zh) 基于解剖地标和残差网络的阿尔兹海默症分类方法及系统
CN112163599B (zh) 一种基于多尺度多层次融合的图像分类方法
CN108960341B (zh) 一种面向脑网络的结构化特征选择方法
US20230005140A1 (en) Automated detection of tumors based on image processing
CN113096137B (zh) 一种oct视网膜图像领域适应分割方法及系统
Wang et al. Automatic real-time CNN-based neonatal brain ventricles segmentation
Song et al. Automatic lung nodule segmentation and intra-nodular heterogeneity image generation
Dimitrakopoulos et al. ISING-GAN: annotated data augmentation with a spatially constrained generative adversarial network
CN112489048B (zh) 一种基于深度网络的视神经自动分割方法
Shen et al. Multicontext multitask learning networks for mass detection in mammogram
CN116958705A (zh) 基于图神经网络的医学影像归类系统
CN114463320B (zh) 一种磁共振成像脑胶质瘤idh基因预测方法及系统
CN114399501B (zh) 基于深度学习卷积神经网络的自动分割前列腺全腺体方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant