CN117095817A - 一种基于特征以及基于ct图像的骨折风险预测方法 - Google Patents
一种基于特征以及基于ct图像的骨折风险预测方法 Download PDFInfo
- Publication number
- CN117095817A CN117095817A CN202311136016.0A CN202311136016A CN117095817A CN 117095817 A CN117095817 A CN 117095817A CN 202311136016 A CN202311136016 A CN 202311136016A CN 117095817 A CN117095817 A CN 117095817A
- Authority
- CN
- China
- Prior art keywords
- image
- fracture
- neural network
- training
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000010392 Bone Fractures Diseases 0.000 title claims abstract description 185
- 206010017076 Fracture Diseases 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000013528 artificial neural network Methods 0.000 claims abstract description 104
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 49
- 210000003205 muscle Anatomy 0.000 claims abstract description 41
- 208000001132 Osteoporosis Diseases 0.000 claims abstract description 32
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 106
- 238000012360 testing method Methods 0.000 claims description 55
- 239000000523 sample Substances 0.000 claims description 49
- 230000004913 activation Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 15
- 210000002569 neuron Anatomy 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 13
- 238000002790 cross-validation Methods 0.000 claims description 12
- 239000013610 patient sample Substances 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 9
- 208000018084 Bone neoplasm Diseases 0.000 claims description 6
- 208000025747 Rheumatic disease Diseases 0.000 claims description 6
- 201000002661 Spondylitis Diseases 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 208000026278 immune system disease Diseases 0.000 claims description 6
- 208000014674 injury Diseases 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 230000000552 rheumatic effect Effects 0.000 claims description 6
- 230000008733 trauma Effects 0.000 claims description 6
- 201000008827 tuberculosis Diseases 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 2
- 238000002591 computed tomography Methods 0.000 description 89
- 230000006870 function Effects 0.000 description 35
- 238000010801 machine learning Methods 0.000 description 28
- 238000004422 calculation algorithm Methods 0.000 description 16
- 201000010099 disease Diseases 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 238000011160 research Methods 0.000 description 15
- 238000013135 deep learning Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 230000037182 bone density Effects 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000032683 aging Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000013075 data extraction Methods 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 208000001164 Osteoporotic Fractures Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 208000001076 sarcopenia Diseases 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 101150082072 14 gene Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 206010051290 Central nervous system lesion Diseases 0.000 description 1
- 208000030808 Clear cell renal carcinoma Diseases 0.000 description 1
- 206010012688 Diabetic retinal oedema Diseases 0.000 description 1
- 208000012661 Dyskinesia Diseases 0.000 description 1
- 208000020358 Learning disease Diseases 0.000 description 1
- 208000029725 Metabolic bone disease Diseases 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 206010049088 Osteopenia Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 206010056342 Pulmonary mass Diseases 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002308 calcification Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011976 chest X-ray Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000011190 diabetic macular edema Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000005240 left ventricle Anatomy 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 210000005241 right ventricle Anatomy 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30008—Bone
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Image Analysis (AREA)
Abstract
一种基于特征以及基于CT图像的骨折风险预测方法,属于图像识别领域。目前基于临床数据的FRAX骨折预测方法无法利用海量的医疗数据,局限性强,准确率低。本发明采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;提取出骨量、骨横截面积、肌肉量、肌肉横截面积图像特征,并将患者分为高、中、低骨折风险人群三类,将患者的腰椎CT图像特征和年龄特征作为样本数据,将对应的分类作为样本标签;基于图像特征设计神经网络结构。本发明是全面考虑肌量和骨量对老年性骨折的影响,提高预测模型的准确性。
Description
技术领域
本发明涉及骨折风险预测方法,特别涉及一种基于特征以及基于CT图像的骨折风险预测方法。
背景技术
我国已成为全球老龄化程度最快的国家之一。预计80岁以上的老年人口2050年将增加四倍,老龄化水平超过30%(1)。随着老龄化加剧,增龄性疾病严重影响老年人健康生活。与增龄同步出现的肌量减少、骨量下降称为活动障碍综合征(2)。Binkley等在2009年提出“肌少-骨质疏松症”、“肌少-骨量减少症”两个概念,前者指存在骨质疏松症的临床或骨密度诊断且伴肌肉质量和(或)功能减退,后者指骨量减少且伴肌肉质量和(或)功能减退(3)。全球每年大约有超过2亿的骨质疏松患者,其中8900万的骨质疏松患者发生骨折(4)。目前我国骨质疏松患病率高达13%,每年由于骨质疏松导致骨折的花费高达10亿美金,预计2035年我国老年人群因骨质疏松性骨折的医疗费用会翻倍(5)。如何有效预测骨质疏松骨折的发生已成为目前研究的热点。有研究显示肌肉量减少导致骨质疏松发生(6),增加跌倒造成骨折风险(7)。目前老年人群中肌肉量和骨量减少造成骨折发生之间的关系尚不清楚。准确预测骨折风险,并及时给予干预,可有效降低骨折发生率,提高老年人健康水平,减少医疗支出。因此研究针对老年人的骨折风险预测方法具有重要科研意义及社会意义。
基于临床数据的骨折风险预测方法研究现状是:
目前临床骨折预测FRAX法主要基于双能X线骨密度仪(DAX)所测得的骨密度信息,但其测量值受到不同厂家选择的影响,另外老年人骨质增生和钙化会造成测量的骨密度值假性升高。例如约有1/3的老年骨折患者用DXA测量的T值没有达到-2.5SD,造成漏诊(8)。另一方面FRAX方法没有考虑老年骨折的另一重要因素:肌量下降。因为测量肌量方面DXA测量结果是平面投影图像,不能显示断面分布,故无法提供准确肌量信息。临床CT扫描骨骼基础上进行定量分析可以更有效的发现骨质疏松(9),同时通过对CT断面分析还能精确测量肌肉的面积和体积(10)。CT和磁共振MR都可以评价肌肉脂肪浸润的程度,但MR测量骨密度精确性有限。目前基于CT定量分析老年人肌肉和骨骼之间关系的方法未能充分利用海量医疗数据,并且无法对骨折风险作出预测(11)。
随着计算机和信息技术的不断发展,机器学习作为解决数据挖掘问题的主要方法之一,在许多领域得到广泛应用,尤其是在医疗领域。机器学习(Machine Learning,ML)是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,包括智慧医疗(12)。目前机器学习在肺结节(13)、肿瘤(14)和脑部病变(15)等研究领域有广泛应用。
基于机器学习的预测方法研究现状是:
一些研究工作采用传统的机器学习方法建立基于医疗数据的预测模型,对患者的身体状况进行预测。例如Kruse(16)等从丹麦4722名女性和717名男性的双能x射线数据中提取特征作为样本数据,并将五年内是否骨折的信息作为样本标签。将75%的样本作为训练集,使用24个传统机器学习算法分别对男性和女性训练集的数据和标签进行拟合训练,并将剩下25%的测试者样本作为测试集,对训练的模型进行测试,以寻找最佳的机器学习方法。Lundervold(17)等根据74名患者在六年内的三次脑部核磁共振图像计算了左右脑室体积随年龄变化轨迹的起点距基准线的距离以及平均斜率,将其作为样本数据,将第六年反应抑制测试结果作为样本标签,利用逻辑回归算法以及k-fold方法将74名测试者分为不同的训练集和测试集分别进行拟合训练和测试,并计算测试集的平均性能。Liao(15)等从137名多型性胶质母细胞瘤病人的核磁共振图像中提取出最重要的72个特征作为样本数据,并统计了这些病人的生存时间是否长于一年,作为样本标签。作者将这137名病人按照7:3的比例分为训练集和测试集,然后分别使用梯度提升树(GBDT)算法、逻辑回归算法、支持向量机和k近邻算法进行拟合训练和测试,结果显示,GBDT算法准确度为0.81,是准确率最高的算法。Huang(18)等采用支持向量机和随机森林算法从64名疑似肾透明细胞癌患者肿瘤组织的H&E染色切片中找到了9个可以较好预测无病生存时间长短的血管特征,然后将与该特征相关性最高的14个基因序列作为样本数据,将无病生存时间是否超过24个月作为样本标签,用具有弹性网络正则化的广义线性模型(GLMNET)对64名患者中符合条件的59人的数据和标签进行拟合训练,并使用训练的模型对其他252名患者的无病生存时间进行预测。这些预测研究均存在如下缺陷:它们都使用传统的机器学习方法,不能达到理想的拟合效果,会出现随着训练特征值增加测试性能下降的情况(16);注意,这些预测研究均存在如下缺陷:这些研究所使用的训练和测试样本数目均不够充足,测试结果不能使人信服,有的研究所使用的男性和女性样本的数量极度不平衡,导致在男性模型上的测试性能远差于女性模型(16);此外,这些预测研究采用的传统机器学习方法不能达到理想的拟合效果,会出现随着训练特征值增加测试性能下降的情况不同人种的预测模型可能有差异(16);另外,不同人种的预测模型可能有差异,目前尚无有效的针对中国老年人骨折风险的预测方法。因此在机器学习疾病预测方面需尝试新的算法。
基于机器学习的检测方法研究现状是:
一些研究工作将传统的机器学习算法以及深度学习方法应用到多种不同类型的疾病检测中。深度学习是当前最具前景的机器学习方法,避免了传统的机器学习对人工定义、提取特征的依赖,自动提取立体、抽象的深层特征,实现端到端的特征学习(21),目前也尝试在。Oliveira等(14)研究基于微波成像技术中后向散射信号的预处理技术对提升乳腺肿瘤组织提高准确性的方法,将信号形态和频率含量作为判断肿瘤是否存在的特征,采用随机森林算法学习如何根据特征对肿瘤进行判断。Hwang(19)等利用支持向量机算法来区分有无弥漫性骨髓浸润性血液病的患者,首先处理腰椎MRI图像通以补偿信号差异性,再将提取的骨髓原始像素连接成一维矢量作为支持向量机的输入,通过评估不同核函数和输入维度对性能的影响,选择性能最优的支持向量机分类器。Kermany(20)等提出了一种基于深度学习筛查常见可治性视网膜疾病的筛查方法。利用迁移学习方法大幅提升准确率,在区分增龄性黄斑变性和糖尿病性黄斑水肿方面达到与专家相近的准确度。采用该方法用于胸部X射线图像诊断儿科肺炎,证明了该方法的普适性。Pehrson(13)等对比了传统机器学习方法和深度学习方法在肺结节检测上的性能差异。传统机器学习算法需要从肺部CT图像手动提取特征并对特征进行训练;而深度学习方法会自动从肺部CT图像中学习特征并训练。对比不同算法的性能后发现,当前的基于特征的传统机器学习算法可以取得更高的性能,但深度学习算法可以随时间改善性能。这些疾病检测研究也存在着一些不足,传统的机器学习方法对疾病进行检测,需要从原始医疗数据中提取大量的特征,并进行人工的预处理,过程复杂,并且有可能出现偏差,影响检测结果;此外,这些研究的训练和测试样本数目不足,测试结果不能使人信服,Kermany(20)等利用迁移学习的方法来解决这个问题,但是缺乏理论分析,随机性太强,有研究中深度学习方法性能要弱于传统机器学习(13),可能是样本数过少导致可训练的模型过浅所致。深度学习对海量数据的处理能力以及对不同影响因素重要性给予分析为临床问题的研究提供了新的思路。
综上,目前基于临床数据的FRAX骨折预测方法无法利用海量的医疗数据,局限性强,准确率不高。影像学图片能更精确的判断骨量、肌量以及与骨折的关系,但海量图片的分析数据提取耗费大量的时间,几乎不可行,因此临床工作中需要通过新的辅助工具对图像进行分析并对疾病做出预测。计算机辅助机器学习已经用于临床图像的分析,但目前基于机器学习的疾病预测方法多基于传统的机器学习方法,不能达到理想的拟合效果;基于机器学习的疾病检测方法虽然有考虑深度学习,但是基于深度学习的疾病检测模型不能适用于疾病预测;此外,基于机器学习的疾病预测和检测方法样本都不够充足,结果不能使人信服。深度学习是机器学习研究中的一个新的领域,其动机在于建立神经网络对人脑的分析和学习过程进行模拟,它模仿人脑的机制来解释数据,例如图像,声音和文本,相比传统机器学习,深度学习更适合处理海量数据,并且具有更高的普适性和更强的拟合能力。因此,本项目拟采用深度学习的方法分别建立基于特征和基于CT图像的骨折风险预测模型,并对影响因素重要性进行分析。希望通过本发明建立的方法能更准确的预测骨折发生风险,从而帮助临床尽早做出诊断,给予治疗,降低骨折发生的风险,提高老年人的生活质量。
参考文献
1.Liu Z,et al.(2019)Are China's oldest-old living longer with lessdisability?A longitudinal modeling analysis of birth cohorts born 10yearsapart.BMC Med 17(1):23.
2.Binkley N,Krueger D,&Buehring B(2013)What's in a name revisited:should osteoporosis and sarcopenia be considered components of"dysmobilitysyndrome?".Osteoporos Int 24(12):2955-2959.
3.Binkley N&Buehring B(2009)Beyond FRAX:it's time to consider"sarco-osteopenia".J Clin Densitom12(4):413-416.
4.Pisani P,et al.(2016)Major osteoporotic fragility fractures:Riskfactor updates and societal impact.World J Orthop 7(3):171-181.
5.Si L,Winzenberg TM,Jiang Q,Chen M,&Palmer AJ(2015)Projection ofosteoporosis-related fractures and costs in China:2010-2050.Osteoporos Int 26(7):1929-1937.
6.Ferretti JL,Cointry GR,Capozza RF,&Frost HM(2003)Bone mass,bonestrength,muscle-bone interactions,osteopenias and osteoporoses.Mech AgeingDev 124(3):269-279.
7.Scott D,Daly RM,Sanders KM,&Ebeling PR(2015)Fall and Fracture Riskin Sarcopenia and Dynapenia With and Without Obesity:the Role of LifestyleInterventions.Curr Osteoporos Rep 13(4):235-244.8.Greenspan SL,von Stetten E,Emond SK,Jones L,&Parker RA(2001)Instant vertebral assessment:a noninvasivedual X-ray absorptiometry technique to avoid misclassification and clinicalmismanagement of osteoporosis.J Clin Densitom 4(4):373-380.
9.Lee SY,et al.(2015)Reliability and validity of lower extremitycomputed tomography as a screening tool for osteoporosis.Osteoporos Int 26(4):1387-1394.
10.Momose T,et al.(2017)CT-based analysis of muscle volume anddegeneration of gluteus medius in patients with unilateral hiposteoarthritis.BMC Musculoskelet Disord 18(1):457.
11.Johannesdottir F,et al.(2012)Mid-thigh cortical bone structuralparameters,muscle mass and strength,and association with lower limb fracturesin older men and women(AGES-Reykjavik Study).Calcif Tissue Int90(5):354-364.
12.Deo RC(2015)Machine Learning in Medicine.Circulation 132(20):1920-1930.
13.Pehrson LM,Nielsen MB,&Ammitzbol Lauridsen C(2019)AutomaticPulmonary Nodule Detection Applying Deep Learning or Machine LearningAlgorithms to the LIDC-IDRIDatabase:A Systematic Review.Diagnostics(Basel)9(1).
14.Oliveira BL,et al.(2018)Diagnosing Breast Cancer with MicrowaveTechnology:remaining challenges and potential solutions with machinelearning.Diagnostics(Basel)8(2).
15.Liao X,et al.(2019)Machine-learning based radiogenomics analysisof MRI features and metagenes in glioblastoma multiforme patients withdifferent survival time.J Cell Mol Med.
16.Kruse C,Eiken P,&Vestergaard P(2017)Machine Learning PrinciplesCan Improve Hip Fracture Prediction.Calcif Tissue Int 100(4):348-360.
17.Lundervold AJ,Vik A,&Lundervold A(2019)Lateral ventricle volumetrajectories predict response inhibition in older age-A longitudinal brainimaging and machine learning approach.PLoS One14(4):e0207967.
18.Ing N,et al.(2017)Anovel machine learning approach reveals latentvascular phenotypes predictive of renal cancer outcome.Sci Rep 7(1):13190.
19.Hwang EJ,Jung JY,Lee SK,Lee SE,&Jee WH(2019)Machine Learning forDiagnosis of Hematologic Diseases in Magnetic Resonance Imaging of LumbarSpines.Sci Rep 9(1):6046.
20.Kermany DS,et al.(2018)Identifying Medical Diagnoses and TreatableDiseases by Image-Based Deep Learning.Cell 172(5):1122-1131e1129.
21.Lee H,et al.(2017)Fully Automated Deep Learning System for BoneAge Assessment.J Digit Imaging30(4):427-441。
发明内容
本发明的目的是为了解决目前基于临床数据的FRAX骨折预测方法无法利用海量的医疗数据,局限性强,准确率低的问题,而提出一种基于特征以及基于CT图像的骨折风险预测方法。
上述目的通过以下的技术方案实现:
一种基于特征的骨折风险预测方法,所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、对患者腰椎CT图像和患者信息进行预处理,从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积图像特征,并按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像特征、年龄特征和受教育程度作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于图像特征设计用于骨折风险预测的神经网络结构,搭建神经网络先对图像特征进行平衡处理,再对平衡处理后的图像特征、年龄特征和受教育程度进行预处理;之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级;
步骤四、设计神经网络的训练方法,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同图像特征进行训练和图像遮挡测试,并根据测试结果得到不同图像特征的重要性级别。
进一步地,步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的对患者腰椎CT图像和患者信息进行预处理的过程,还包括对各特征赋予字母表示的过程,具体为:
所述的从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积图像特征的步骤中,对各特征赋予字母表示的过程是:按照一定顺序从每一名患者的所有CT图像中均匀采样出N张图像,并使用CT仪器从这N张CT图像上读出骨量、骨横截面积、肌肉量、肌肉横截面积四项特征;令分别表示这N张图像的骨量、骨横截面积、肌肉量和肌肉横截面积;令/>分别表示患者的年龄和受教育程度;将bm,bs,mm,ms,y,ye作为样本数据,用于之后的神经网络的训练和测试;
所述的按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类的步骤中,对各特征赋予字母表示的过程是:将已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型分别由p=(1,0,0)T,(0,1,0)T,(0,0,1)T表示,作为样本标签,用于之后的神经网络的训练和测试。
进一步地,步骤三所述的基于图像特征设计用于骨折风险预测的神经网络结构的过程,具体为:
神经网络以患者的N张CT图像特征以及年龄y和受教育年龄ye作为输入,预测患者所对应的骨折风险标签p;
第一,使用第一级网络对CT图像特征C进行处理,以平衡图像特征与年龄特征;其中,第一级网络包括两层卷积层,第一层卷积层选取32个通道数为1大小为5×2的卷积核,采用零填充结构维持输入矩阵的大小;第二层卷积层选取1个通道数为32大小为N×1的卷积核以获得向量形式的输出第一层卷积层与第二层卷积层采用线性整流单元作为激活函数以引入非线性;
第二,将通过第一级网络处理后的图像特征输出c与年龄特征y和受教育程度ye一起输入第二级网络,进行骨折风险标签的预测;其中,第二级网络包括三层全连接层,第一层全连接层和第二层全连接层为隐藏层,均具有10个神经元;第三层全连接层为输出层,具有3个神经元以输出预测标签第一层全连接层和第二层全连接层采用线性整流单元作为激活函数以引入非线性,第三层全连接层和第二层全连接层采用softmax作为激活函数以获得one-hot的预测标签。
进一步地,步骤三所述的确定神经网络类型、层数、神经元个数和激活函数的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用(C(j),y(j),ye (j),p(j))表示第j个训练样本;在训练时,向神经网络输入这J个样本的特征信息,通过两级网络学习p的预测,在输出端得到这J个样本对应的预测标签为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
得出,当所有样本的与p相同时,损失函数为零,当交叉验证集上的损失函数不再下降时,停止网络的训练。
进一步地,步骤四所述的设计神经网络的训练方法的过程,具体为:
使用所有患者样本的70%作为训练集,用J表示训练样本的个数,令x∈{bm,bs,mm,ms},并用表示第j个训练样本;在训练时,为了使神经网络预测标签与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
通过x选取不同的图像特征进行训练,得到4个基于不同特征输入的骨折风险预测神经网络;
之后,使用所有患者样本剩下的30%作为测试样本,用U表示测试样本的个数,并选取预测错误率作为骨折风险预测性能度量,对所训练的4个神经网络的预测性能进行测试,基于其中一种特征所训练的神经网络的预测错误率越高,则代表该项特征越重要,反之,则越不重要。
一种基于CT图像的骨折风险预测方法,所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、按照已骨折、骨质疏松未骨折、骨量减少或正常三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像、年龄特征和受教育程度特征作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于卷积神经网网络搭建用于预测骨折风险的神经网络结构;之后利用搭建神经网络对腰椎CT图像进行特征提取,之后对提取的腰椎CT图像特征、年龄特征受教育程度特征进行预处理,之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级;
步骤四、设计神经网络的训练方案,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别。
进一步地,步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的将腰椎CT图像、年龄特征和受教育程度特征作为样本数据的步骤中,还包括将腰椎CT图像、年龄特征和受教育程度特征各数值归一化的操作,用于输入到神经网络中。
进一步地,步骤三所述的基于卷积神经网网络设计用于预测骨折风险的神经网络结构的步骤,具体为:
所述的神经网络用于实现从输入数据到骨折风险标签p的映射;
神经网络的输入分为两部分,一部分是患者的N张CT图像,CT图像集合表示为另一部分是患者的年龄y和受教育程度ye;
利用三层卷积层处理每一张CT图像,每层的卷积核的大小均为3×3,每层卷积层之后均有池化层,并采用线性整流单元作为激活函数以引入非线性;其中,三层卷积层模块的参数设计为,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2;
每一张CT图像经过上述三层卷积层之后,被描述为其中,/>表示第i张图像的网络结构,βl是共享网络的参数,/>是第i张CT图像的特征,维数为d,i=1,…,N;之后,将所有的特征向量聚合成一个N×d维的特征矩阵F,如下式所示,其中,N为图像的个数,d为特征维数,即
假设处理路径的输出为N×d特征矩阵F,则注意力池层的输出计算如下:
其中,为加权特征矩阵,/>表示Hadamard积,w=[w1,w2,...wN]T是一个权重向量,1d∈Rd是所有1的d维向量,输出单元的数量等于数量N;通过权重模块获取权重w=[w1,w2,...wN]T;该权重模块由全连接层,ReLU层,全连接层和Sigmoid层构成;
将加权特征矩阵求平均值,得到最终的局部特征向量fl,如式所示,即:
之后,将年龄y和受教育程度ye与fl合并为新的向量D;最后,将D送入全连接输出层以输出预测标签输出层采用softmax作为激活函数以获得one-hot的预测标签。
进一步地,步骤四所述的设计神经网络的训练方案的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用表示第j个训练样本,(p(j))表示样本j对应的标签;在训练时,向神经网络输入这J个样本,学习由样本到标签p的映射,在输出端得到这J个样本对应的预测标签为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
当交叉验证集上的损失函数不再下降时,停止网络的训练。
进一步地,步骤五所述的利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别,具体为:
将测试集中被部分遮挡的图像作为输入,获得预测输出,并选取预测错误率作为骨折风险预测性能度量,被遮挡后所获得的神经网络的预测错误率越高,代表该区域越重要,反之,则越不重要。
本发明的有益效果为:
本发明是全面考虑了肌量和骨量对老年性骨折的影响,同时全面收集病人的基本信息,从而提高预测模型的预测准确性。
本发明是采用深度学习的方法建立疾病预测模型,较传统机器学习能获得更好的分析效果,同时可以分析海量的医学数据,使得结果准确度更高,为临床诊断提供了更准确的诊断依据。
本发明是在预测骨折风险的同时还能对影响骨折的影响因素重要性进行分析,从而获得图像中各区域代表的识别结果及重要性。能为临床提供新的研究思路和方向。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
本发明优选的实施例:
一种基于特征的骨折风险预测方法,其特征在于:所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松等患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、对患者腰椎CT图像和患者信息进行预处理,从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积等图像特征,并按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像特征、年龄特征和受教育程度作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于图像特征设计用于骨折风险预测的神经网络结构,搭建神经网络先对图像特征进行平衡处理,再对平衡处理后的CT图像特征、年龄特征和受教育程度进行预处理,其中,预处理包括特征的归一化和标准化、异常特征样本的清洗、样本数据不平衡问题的处理;之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级,实现预测骨折风险;
步骤四、设计神经网络的训练方法,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同图像特征进行训练和图像遮挡测试,并根据测试结果得到不同图像特征的重要性级别。
步骤一中是否骨质疏松的特征,目前临床基于骨质疏松的FRAX评估为标准化操作,腰椎CT图像的获取和分析均为日常临床分析所需,成熟可行,病人基本信息的获取和骨质疏松结果可通过医院电子病历进行收集,CT图像的数据提取可由影像科专业医生完成,减少操作误差。
具体实施方式二:
本实施方式的一种基于特征的骨折风险预测方法,与具体实施方式一不同的是,步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎等的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的对患者腰椎CT图像和患者信息进行预处理的过程,还包括对各特征赋予字母表示的过程,具体为:
所述的从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积等图像特征的步骤中,对各特征赋予字母表示的过程是:按照一定顺序从每一名患者的所有CT图像中均匀采样出N张图像,并使用CT仪器从这N张CT图像上读出骨量、骨横截面积、肌肉量、肌肉横截面积四项特征;令分别表示这N张图像的骨量、骨横截面积、肌肉量和肌肉横截面积;令/>分别表示患者的年龄和受教育程度;将bm,bs,mm,ms,y,ye作为样本数据,用于之后的神经网络的训练和测试;
所述的按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类的步骤中,对各特征赋予字母表示的过程是:将已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型分别由p=(1,0,0)T,(0,1,0)T,(0,0,1)T表示,作为样本标签,用于之后的神经网络的训练和测试。
具体实施方式三:
本实施方式的一种基于特征的骨折风险预测方法,与具体实施方式二不同的是,步骤三所述的基于图像特征设计用于骨折风险预测的神经网络结构的过程,具体为:
神经网络以患者的N张CT图像特征以及年龄y和受教育年龄ye作为输入,预测患者所对应的骨折风险标签p;综合预测性能与训练速度,并且考虑到CT图像特征与年龄特征极度不平衡的情况,拟采用两级网络对数据进行处理;
第一,使用第一级网络对CT图像特征C进行处理,以平衡图像特征与年龄特征;其中,第一级网络包括两层卷积层,第一层卷积层选取32个通道数为1大小为5×2的卷积核,采用零填充结构以维持输入矩阵的大小;第二层卷积层选取1个通道数为32大小为N×1的卷积核以获得向量形式的输出第一层卷积层与第二层卷积层采用线性整流单元(RELU)作为激活函数以引入非线性;
第二,将通过第一级网络处理后的图像特征输出c与年龄特征y和受教育程度ye一起输入第二级网络,进行骨折风险标签的预测;其中,第二级网络包括三层全连接层,第一层全连接层和第二层全连接层为隐藏层,均具有10个神经元;第三层全连接层为输出层,具有3个神经元以输出预测标签第一层全连接层和第二层全连接层采用线性整流单元(RELU)作为激活函数以引入非线性,第三层全连接层和第二层全连接层采用softmax作为激活函数以获得one-hot的预测标签。
具体实施方式四:
本实施方式的一种基于特征的骨折风险预测方法,与具体实施方式三不同的是,步骤三所述的确定神经网络类型、层数、神经元个数和激活函数的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用(C(j),y(j),ye (j),p(j))表示第j个训练样本;在训练时,向神经网络输入这J个样本的特征信息,通过两级网络学习p的预测过程,在输出端得到这J个样本对应的预测标签为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
得出,当所有样本的与p相同时,损失函数为零,为防止过拟合,当交叉验证集上的损失函数不再下降时,停止网络的训练。
具体实施方式五:
本实施方式的一种基于特征的骨折风险预测方法,与具体实施方式四不同的是,步骤四所述的设计神经网络的训练方法的过程,具体为:
使用所有患者样本的70%作为训练集,用J表示训练样本的个数,令x∈{bm,bs,mm,ms},并用表示第j个训练样本;在训练时,为了使神经网络预测标签与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
通过x选取不同的图像特征进行训练,得到4个基于不同特征输入的骨折风险预测神经网络;
之后,进行特征重要性测试的设计方案。使用所有患者样本剩下的30%作为测试样本,用U表示测试样本的个数,并选取预测错误率作为骨折风险预测性能度量,对所训练的4个神经网络的预测性能进行测试,基于其中一种特征所训练的神经网络的预测错误率越高,则代表该项特征越重要,反之,则越不重要。
本实施方式的一种基于CT图像的骨折风险预测方法,所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松等患者信息;由于已经骨折的患者所拍摄的CT图像中存在明显的骨裂缝等异常区域,若直接将此类图像作为神经网络的输入样本,则训练完成的神经网络可能会将骨裂缝作为预测患者是否容易骨折的特征,这与想让通过神经网络学习到骨骼与肌肉等特征对骨折风险的影响的目的不符合。因此,并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、按照已骨折、骨质疏松未骨折、骨量减少或正常三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像、年龄特征和受教育程度特征作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于卷积神经网网络搭建用于预测骨折风险的神经网络结构;之后利用搭建神经网络对腰椎CT图像进行特征提取,之后对提取的腰椎CT图像特征、年龄特征受教育程度特征进行预处理,之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级,实现预测骨折风险;
步骤四、设计神经网络的训练方案,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别,从而能为临床提供新的研究思路和方向。
步骤一中是否骨质疏松的特征,目前临床基于骨质疏松的FRAX评估为标准化操作,腰椎CT图像的获取和分析均为日常临床分析所需,成熟可行,病人基本信息的获取和骨质疏松结果可通过医院电子病历进行收集,CT图像的数据提取可由影像科专业医生完成,减少操作误差。
具体实施方式七:
本实施方式的一种基于CT图像的骨折风险预测方法,与具体实施方式六不同的是,步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎等的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的将腰椎CT图像、年龄特征和受教育程度特征作为样本数据的步骤中,由于腰椎CT图像、年龄特征和受教育程度特征数据值差异巨大,所以,还包括将腰椎CT图像、年龄特征和受教育程度特征各数值归一化的操作,之后再用于输入到神经网络中。
具体实施方式八:
本实施方式的一种基于CT图像的骨折风险预测方法,与具体实施方式七不同的是,步骤三所述的基于卷积神经网网络设计用于预测骨折风险的神经网络结构的步骤,具体为:
所述的神经网络用于实现从输入数据到骨折风险标签p的映射;
神经网络的输入分为两部分,一部分是患者的N张CT图像,CT图像集合表示为另一部分是患者的年龄y和受教育程度ye;
利用三层卷积层处理每一张CT图像,每层的卷积核的大小均为3×3,每层卷积层之后均有池化层以降低中间层特征的维度,并采用线性整流单元(RELU)作为激活函数以引入非线性;其中,三层卷积层模块的参数设计为,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2;
每一张CT图像经过上述三层卷积层之后,被描述为其中,/>表示第i张图像的网络结构,βl是共享网络的参数,/>是第i张CT图像的特征,维数为d,i=1,…,N;之后,将所有的特征向量聚合成一个N×d维的特征矩阵F,如下式所示,其中,N为图像的个数,d为特征维数,即
假设处理路径的输出为N×d特征矩阵F,则注意力池层的输出计算如下:
其中,为加权特征矩阵,/>表示Hadamard积,w=[w1,w2,...wN]T是一个权重向量,
1d∈Rd是所有1的d维向量,输出单元的数量等于数量N;通过权重模块获取权重w=[w1,w2,...wN]T;该权重模块由全连接层,ReLU层,全连接层和Sigmoid层构成;
将加权特征矩阵求平均值,得到最终的局部特征向量fl,如式所示,即:
之后,将年龄y和受教育程度ye与fl合并为新的向量D;最后,将D送入全连接输出层以输出预测标签输出层采用softmax作为激活函数以获得one-hot的预测标签。
具体实施方式九:
本实施方式的一种基于CT图像的骨折风险预测方法,与具体实施方式八不同的是,步骤四所述的设计神经网络的训练方案的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用表示第j个训练样本,(p(j))表示样本j对应的标签;在训练时,向神经网络输入这J个样本,学习由样本到标签p的映射,在输出端得到这J个样本对应的预测标签为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
为防止过拟合,当交叉验证集上的损失函数不再下降时,停止网络的训练。
具体实施方式十:
本实施方式的一种基于CT图像的骨折风险预测方法,与具体实施方式九不同的是,步骤五所述的利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别,具体为:
将测试集中被部分遮挡的图像作为输入,获得预测输出,并选取预测错误率作为骨折风险预测性能度量,被遮挡后所获得的神经网络的预测错误率越高,代表该区域越重要,反之,则越不重要。
本发明的实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。
Claims (10)
1.一种基于特征的骨折风险预测方法,其特征在于:所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、对患者腰椎CT图像和患者信息进行预处理,从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积图像特征,并按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像特征、年龄特征和受教育程度作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于图像特征设计用于骨折风险预测的神经网络结构,搭建神经网络先对图像特征进行平衡处理,再对平衡处理后的图像特征、年龄特征和受教育程度进行预处理;之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级;
步骤四、设计神经网络的训练方法,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同图像特征进行训练和图像遮挡测试,并根据测试结果得到不同图像特征的重要性级别。
2.根据权利要求1所述的一种基于特征的骨折风险预测方法,其特征在于:步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的对患者腰椎CT图像和患者信息进行预处理的过程,还包括对各特征赋予字母表示的过程,具体为:
所述的从预处理后的腰椎CT图像中提取出骨量、骨横截面积、肌肉量、肌肉横截面积图像特征的步骤中,对各特征赋予字母表示的过程是:按照一定顺序从每一名患者的所有CT图像中均匀采样出N张图像,并使用CT仪器从这N张CT图像上读出骨量、骨横截面积、肌肉量、肌肉横截面积四项特征;令分别表示这N张图像的骨量、骨横截面积、肌肉量和肌肉横截面积;令/>分别表示患者的年龄和受教育程度;将bm,bs,mm,ms,y,ye作为样本数据,用于之后的神经网络的训练和测试;
所述的按照已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类的步骤中,对各特征赋予字母表示的过程是:将已骨折、骨质疏松未骨折、骨量正常或轻度减少三种类型分别由p=(1,0,0)T,(0,1,0)T,(0,0,1)t表示,作为样本标签,用于之后的神经网络的训练和测试。
3.根据权利要求2所述的一种基于特征的骨折风险预测方法,其特征在于:步骤三所述的基于图像特征设计用于骨折风险预测的神经网络结构的过程,具体为:
神经网络以患者的N张CT图像特征以及年龄y和受教育年龄ye作为输入,预测患者所对应的骨折风险标签p;
第一,使用第一级网络对CT图像特征C进行处理,以平衡图像特征与年龄特征;其中,第一级网络包括两层卷积层,第一层卷积层选取32个通道数为1大小为5×2的卷积核,采用零填充结构维持输入矩阵的大小;第二层卷积层选取1个通道数为32大小为N×1的卷积核以获得向量形式的输出第一层卷积层与第二层卷积层采用线性整流单元作为激活函数以引入非线性;
第二,将通过第一级网络处理后的图像特征输出c与年龄特征y和受教育程度ye一起输入第二级网络,进行骨折风险标签的预测;其中,第二级网络包括三层全连接层,第一层全连接层和第二层全连接层为隐藏层,均具有10个神经元;第三层全连接层为输出层,具有3个神经元以输出预测标签第一层全连接层和第二层全连接层采用线性整流单元作为激活函数以引入非线性,第三层全连接层和第二层全连接层采用softmax作为激活函数以获得one-hot的预测标签。
4.根据权利要求3所述的一种基于特征的骨折风险预测方法,其特征在于:步骤三所述的确定神经网络类型、层数、神经元个数和激活函数的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用(C(j),y(j),ye (j),p(j))表示第j个训练样本;在训练时,向神经网络输入这J个样本的特征信息,通过两级网络学习p的预测,在输出端得到这J个样本对应的预测标签为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
得出,当所有样本的与p相同时,损失函数为零,当交叉验证集上的损失函数不再下降时,停止网络的训练。
5.根据权利要求4所述的一种基于特征的骨折风险预测方法,其特征在于:步骤四所述的设计神经网络的训练方法的过程,具体为:
使用所有患者样本的70%作为训练集,用J表示训练样本的个数,令x∈{bm,bs,mm,ms},并用表示第j个训练样本;在训练时,为了使神经网络预测标签与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
通过x选取不同的图像特征进行训练,得到4个基于不同特征输入的骨折风险预测神经网络;
之后,使用所有患者样本剩下的30%作为测试样本,用U表示测试样本的个数,并选取预测错误率作为骨折风险预测性能度量,对所训练的4个神经网络的预测性能进行测试,基于其中一种特征所训练的神经网络的预测错误率越高,则代表该项特征越重要,反之,则越不重要。
6.一种基于CT图像的骨折风险预测方法,其特征在于:所述方法通过以下步骤实现:
步骤一、采集患者的腰椎CT图像、年龄、受教育程度、是否骨折、是否骨质疏松患者信息;并使用图像复原技术对采集的患者腰椎CT图像中存在骨折情况的腰椎CT图像进行骨裂缝复原以实现预处理;
步骤二、按照已骨折、骨质疏松未骨折、骨量减少或正常三种类型将患者分为高骨折风险人群、中骨折风险人群、低骨折风险人群三类,将患者的腰椎CT图像、年龄特征和受教育程度特征作为样本数据,将对应的分类作为样本标签,用于对神经网络进行训练和测试;
步骤三、基于卷积神经网网络搭建用于预测骨折风险的神经网络结构;之后利用搭建神经网络对腰椎CT图像进行特征提取,之后对提取的腰椎CT图像特征、年龄特征受教育程度特征进行预处理,之后确定神经网络类型、层数、神经元个数和激活函数,之后预测骨折风险等级;
步骤四、设计神经网络的训练方案,选取样本数据中的一部分作为训练集,并选择合适的损失函数来表征骨折风险预测性能;
步骤五、利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别。
7.根据权利要求6所述的一种基于CT图像的骨折风险预测方法,其特征在于:步骤一所述的采集患者的腰椎CT图像的过程中,是采集60-90岁患者腰椎CT图像,并去除骨肿瘤、外伤、结核、强制性脊柱炎的风湿免疫疾病,其中,每名患者约有90-110张腰椎CT图像;
步骤二所述的将腰椎CT图像、年龄特征和受教育程度特征作为样本数据的步骤中,还包括将腰椎CT图像、年龄特征和受教育程度特征各数值归一化的操作,用于输入到神经网络中。
8.根据权利要求7所述的一种基于CT图像的骨折风险预测方法,其特征在于:步骤三所述的基于卷积神经网网络设计用于预测骨折风险的神经网络结构的步骤,具体为:
所述的神经网络用于实现从输入数据到骨折风险标签p的映射;
神经网络的输入分为两部分,一部分是患者的N张CT图像,CT图像集合表示为另一部分是患者的年龄y和受教育程度ye;
利用三层卷积层处理每一张CT图像,每层的卷积核的大小均为3×3,每层卷积层之后均有池化层,并采用线性整流单元作为激活函数以引入非线性;其中,三层卷积层模块的参数设计为,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2,卷积层卷积核大小为3×3,步长为1,池化层卷积核大小为2×2,步长为2;
每一张CT图像经过上述三层卷积层之后,被描述为其中,/>表示第i张图像的网络结构,βl是共享网络的参数,/>是第i张CT图像的特征,维数为d,i=1,…,N;之后,将所有的特征向量聚合成一个N×d维的特征矩阵F,如下式所示,其中,N为图像的个数,d为特征维数,即
假设处理路径的输出为N×d特征矩阵F,则注意力池层的输出计算如下:
其中,为加权特征矩阵,/>表示Hadamard积,w=[w1,w2,...wN]T是一个权重向量,
1d∈Rd是所有1的d维向量,输出单元的数量等于数量N;通过权重模块获取权重w=[w1,w2,...wN]T;该权重模块由全连接层,ReLU层,全连接层和Sigmoid层构成;
将加权特征矩阵求平均值,得到最终的局部特征向量fl,如式所示,即:
之后,将年龄y和受教育程度ye与fl合并为新的向量D;最后,将D送入全连接输出层以输出预测标签输出层采用softmax作为激活函数以获得one-hot的预测标签。
9.根据权利要求8所述的一种基于CT图像的骨折风险预测方法,其特征在于:步骤四所述的设计神经网络的训练方案的过程,具体为:
使用所有患者样本的60%作为训练集,20%作为交叉验证集;用J表示训练样本的个数,用表示第j个训练样本,(p(j))表示样本j对应的标签;在训练时,向神经网络输入这J个样本,学习由样本到标签p的映射,在输出端得到这J个样本对应的预测标签/>为了使神经网络预测标签/>与真实骨折风险标签(p(j))j=1…J尽可能相同,选取两者的交叉熵为训练的损失函数,即:
当交叉验证集上的损失函数不再下降时,停止网络的训练。
10.根据权利要求9所述的一种基于CT图像的骨折风险预测方法,其特征在于:步骤五所述的利用步骤四训练后的神经网络对具有不同遮挡区域的图像进行训练和图像遮挡测试,并根据测试结果得到图像各区域的重要性级别,具体为:
将测试集中被部分遮挡的图像作为输入,获得预测输出,并选取预测错误率作为骨折风险预测性能度量,被遮挡后所获得的神经网络的预测错误率越高,代表该区域越重要,反之,则越不重要。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311136016.0A CN117095817A (zh) | 2023-09-05 | 2023-09-05 | 一种基于特征以及基于ct图像的骨折风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311136016.0A CN117095817A (zh) | 2023-09-05 | 2023-09-05 | 一种基于特征以及基于ct图像的骨折风险预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117095817A true CN117095817A (zh) | 2023-11-21 |
Family
ID=88771493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311136016.0A Pending CN117095817A (zh) | 2023-09-05 | 2023-09-05 | 一种基于特征以及基于ct图像的骨折风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117095817A (zh) |
-
2023
- 2023-09-05 CN CN202311136016.0A patent/CN117095817A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108364006B (zh) | 基于多模式深度学习的医学图像分类装置及其构建方法 | |
Dabiri et al. | Muscle segmentation in axial computed tomography (CT) images at the lumbar (L3) and thoracic (T4) levels for body composition analysis | |
Štern et al. | Automatic age estimation and majority age classification from multi-factorial MRI data | |
Houam et al. | One dimensional local binary pattern for bone texture characterization | |
Gull et al. | Artificial intelligence in brain tumor detection through MRI scans: advancements and challenges | |
Barnard et al. | Machine learning for automatic paraspinous muscle area and attenuation measures on low-dose chest CT scans | |
Jiang et al. | Deep learning for COVID-19 chest CT (computed tomography) image analysis: A lesson from lung cancer | |
Balasooriya et al. | Intelligent brain hemorrhage diagnosis using artificial neural networks | |
CN109036547A (zh) | 一种基于聚类分析的肺部ct图像计算机辅助系统及方法 | |
CN108511056A (zh) | 基于脑卒中患者相似性分析的治疗方案推荐方法及系统 | |
CN113177943B (zh) | 一种脑卒中ct影像分割方法 | |
CN109147940A (zh) | 从患者的医学图像自动预测生理状况的装置和系统 | |
Razmjoo et al. | T2 analysis of the entire osteoarthritis initiative dataset | |
Grainger et al. | Deep learning-based quantification of abdominal subcutaneous and visceral fat volume on CT images | |
Hussain et al. | Deep learning-based diagnosis of disc degenerative diseases using MRI: a comprehensive review | |
CN111063442A (zh) | 基于弱监督多任务矩阵补全的脑疾病进程预测方法及系统 | |
JP6914233B2 (ja) | 類似度決定装置、方法およびプログラム | |
Huang et al. | DADP: dynamic abnormality detection and progression for longitudinal knee magnetic resonance images from the osteoarthritis initiative | |
Peña-Solórzano et al. | Findings from machine learning in clinical medical imaging applications–Lessons for translation to the forensic setting | |
More et al. | A generalized deep learning framework for automatic rheumatoid arthritis severity grading | |
Ramos et al. | Fast and smart segmentation of paraspinal muscles in magnetic resonance imaging with CleverSeg | |
Lu et al. | Data enhancement and deep learning for bone age assessment using the standards of skeletal maturity of hand and wrist for chinese | |
CN112690815A (zh) | 基于肺部图像报告辅助诊断病变等级的系统和方法 | |
CN117095817A (zh) | 一种基于特征以及基于ct图像的骨折风险预测方法 | |
Duryea et al. | Neural network based automated algorithm to identify joint locations on hand/wrist radiographs for arthritis assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |