CN116452559A - 基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 - Google Patents
基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 Download PDFInfo
- Publication number
- CN116452559A CN116452559A CN202310441315.9A CN202310441315A CN116452559A CN 116452559 A CN116452559 A CN 116452559A CN 202310441315 A CN202310441315 A CN 202310441315A CN 116452559 A CN116452559 A CN 116452559A
- Authority
- CN
- China
- Prior art keywords
- feature
- tumor
- features
- attribute
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 229
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013467 fragmentation Methods 0.000 title claims abstract description 31
- 238000006062 fragmentation reaction Methods 0.000 title claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 97
- 230000004927 fusion Effects 0.000 claims abstract description 73
- 238000013145 classification model Methods 0.000 claims abstract description 68
- 238000012795 verification Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 27
- 201000011510 cancer Diseases 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 46
- 239000013598 vector Substances 0.000 claims description 45
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 230000003902 lesion Effects 0.000 claims description 25
- 230000004807 localization Effects 0.000 claims description 12
- 238000011478 gradient descent method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000000973 chemotherapeutic effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001959 radiotherapy Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009261 endocrine therapy Methods 0.000 description 1
- 229940034984 endocrine therapy antineoplastic and immunomodulating agent Drugs 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002962 histologic effect Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 206010024627 liposarcoma Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000011476 stem cell transplantation Methods 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Genetics & Genomics (AREA)
- Radiology & Medical Imaging (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明涉及人工智能技术领域,揭露了一种基于ctDNA片段化模式的肿瘤病灶的定位方法和装置,该方法包括:根据历史肿瘤图像的图像特征和背景数据生成历史肿瘤图像的融合特征,对融合特征进行特征分类和回归验证,得到标准特征;根据预设的变量权重生成对标准特征的特征矩阵;利用特征矩阵对构建的初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;获取目标肿瘤的目标数据,利用训练完成的癌症风险模型和目标数据生成目标肿瘤的肿瘤权值,根据预设的状态阈值和肿瘤权值确定目标肿瘤的肿瘤类别。本发明还提出一种基于ctDNA片段化模式的肿瘤病灶的定位装置。本发明可以提高基于ctDNA片段化模式的肿瘤病灶的定位的准确性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于ctDNA片段化模式的肿瘤病灶的定位方法及装置。
背景技术
随着深入推进健康中国的行动,我国深化了医疗卫生体制的改革,同期数字技术也为医疗带来了深刻的变革。大数据算法技术在医院中持续积累、自学习及改进,在医疗安全、科研、临床、精细化管理等方向提供了最优的管理策略,成为新一代智慧医院的“数字大脑”。
在肿瘤诊断方面,以往的肿瘤判断都是专业人士按照经验进行的,当面对大量的待确认的肿瘤图像时,仅仅依照人力对肿瘤的病灶进行判断,会因为疲劳导致肿瘤病灶识别的准确性降低,而且,人为的进行肿瘤病灶的定位具有局限性和主观性,因此,如何提升肿瘤病灶定位时准确性,成为了亟待解决的问题。
发明内容
本发明提供一种基于ctDNA片段化模式的肿瘤病灶的定位方法及装置,其主要目的在于解决基于ctDNA片段化模式的肿瘤病灶的定位时准确性较低的问题。
为实现上述目的,本发明提供的一种基于ctDNA片段化模式的肿瘤病灶的定位方法,包括:
获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征;
获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征;
对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵;
根据预设的回归方程构建初始肿瘤分类模型,其中,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项;
利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;
获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
可选地,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
按照预设的属性数据生成所述融合特征的聚类中心;
根据欧氏距离算法和所述聚类中心对所述融合特征进行数据分类,得到所述融合特征的属性特征,其中,所述欧氏距离算法为:
其中,d表示所述融合特征对应的数据向量与所述聚类中心的欧氏距离,w1j表示所述融合特征对应的数据向量,w2j表示所述聚类中心,j是所述数据向量的标识,sqrt(*)是平方根函数,n是所述数据向量的总数。
可选地,所述根据欧氏距离算法和所述聚类中心对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
对所述融合特征进行向量化转化,得到所述融合特征的特征向量;
根据欧氏距离算法逐个计算所述特征向量与所述聚类中心的欧氏距离,根据所述欧氏距离确定所述特征向量的向量属性;
根据所述向量属性和所述聚类中心生成所述融合特征的属性特征。
可选地,所述对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,包括:
对所述属性特征进行线性验证,得到所述属性特征的一级特征;
对所述一级特征进行正态验证,得到所述一级特征的二级特征;
对所述二级特征进行独立验证,得到所述二级特征的三级特征;
对所述三级特征进行齐性验证,得到所述三级特征的四级特征,确定所述四级特征为所述属性特征的标准特征。
可选地,所述对所述一级特征进行正态验证,得到所述一级特征的二级特征,包括:
利用如下正态检验算法所述对所述一级特征进行正态验证,得到所述一级特征的二级特征:
其中,R是所述一级特征的正态系数,bi是所述一级特征中的第i个特征的正态评分,yi是所述一级特征中的第i个特征,是所述一级特征的均值,m是所述一级特征中的特征的总数,i是所述一级特征中的特征的标识。
可选地,所述对所述二级特征进行独立验证,得到所述二级特征的三级特征,包括:
利用如下卡方算法对所述二级特征进行独立验证,得到所述二级特征的三级特征:
其中,X是所述二级特征的卡方统计量,op是所述二级特征的观察值,ep是所述二级特征的期望值,k是所述二级特征的观察值的总数,p是所述二级特征的观察值的标识。
可选地,所述根据预设的变量权重生成对所述标准特征的特征矩阵,包括:
根据所述标准特征的属性类别确定所述标准特征的特征重要性,利用预设的变量权重和所述特征重要性计算所述属性特征的特征权重;
利用所述特征权重和所述标准特征生成所述标准特征的特征矩阵。
可选地,所述利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型,包括:
根据所述特征矩阵生成所述初始肿瘤分类模型的损失函数,其中,所述损失函数为:
其中,L(w)是所述初始肿瘤分类模型的损失值,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项;
利用梯度下降法生成所述损失函数的函数最小值,根据所述函数最小值对所述初始肿瘤分类模型进行参数修正,得到训练完成的肿瘤分类模型。
可选地,所述利用梯度下降法生成所述损失函数的函数最小值,包括:
根据所述损失函数生成所述初始肿瘤分类模型的目标函数,利用预设的梯度下降算法生成所述目标函数的最终训练值,其中,所述预设的梯度下降算法为:
其中,wl+1是初始肿瘤分类模型的第l+1个模型参数,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项,α是学习率;
确定所述最终训练值为所述损失函数的函数最小值。
为了解决上述问题,本发明还提供一种基于ctDNA片段化模式的肿瘤病灶的定位装置,所述装置包括:
特征提取模块,用于获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征;
融合特征模块,用于获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征;
回归验证模块,用于对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵;
构建模型模块,用于根据预设的回归方程构建初始肿瘤分类模型,其中,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项;
模型训练模块,用于利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;
病灶定位模块,用于获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
本发明实施例通过历史肿瘤图像的图像特征和背景数据生成历史肿瘤图像的融合特征,并对融合特征进行特征分类和回归验证,确保了进行模型训练的数据的可靠性,对构建的初始肿瘤分类模型进行模型训练,建立了输入数据与输出数据的定量关系,提高了模型进行分类的准确性,因此本发明提出基于ctDNA片段化模式的肿瘤病灶的定位方法及装置,可以解决肿瘤病灶的定位时准确性较低的问题。
附图说明
图1为本发明一实施例提供的基于ctDNA片段化模式的肿瘤病灶的定位方法的流程示意图;
图2为本发明一实施例提供的融合特征的特征分类的流程示意图;
图3为本发明一实施例提供的属性特征的回归验证的流程示意图;
图4为本发明一实施例提供的基于ctDNA片段化模式的肿瘤病灶的定位装置的功能模块图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于ctDNA片段化模式的肿瘤病灶的定位方法。所述基于ctDNA片段化模式的肿瘤病灶的定位方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于ctDNA片段化模式的肿瘤病灶的定位方法可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于ctDNA片段化模式的肿瘤病灶的定位方法的流程示意图。在本实施例中,所述基于ctDNA片段化模式的肿瘤病灶的定位方法包括:
S1、获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征。
在本发明实施例中,所述历史肿瘤图像是指已经确定了肿瘤病灶的图像,所述历史肿瘤图像存在可以进行肿瘤病灶研究的特征。
详细地,所述对所述历史肿瘤图像进行特征提取可以利用方向梯度直方图方法,所述方向梯度直方图的步骤为:对所述历史肿瘤图像进行区域分割,得到所述历史肿瘤图像的分割图像;对所述分割图像进行灰度化处理后,再采用Gamma校正法对灰度化处理后的分割图像进行颜色空间的标准化,目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;再计算图像每个像素的梯度(包括大小和方向),主要是为了捕获轮廓信息,同时进一步弱化光照的干扰;将图像划分成小单元,统计每个单元的梯度直方图(不同梯度的个数),即可形成每个单元的描述符号;将每几个单元组成一个区块,一个区块内所有单元的特征描述符号串联起来便得到该区块的特征描述符号;将图像内的所有区块的特征描述符号串联起来就可以得到该历史肿瘤图像的特征描述符号了,这个就是最终的所述历史肿瘤图像的图像特征了。
S2、获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征。
在本发明实施例中,所述历史肿瘤图像的背景数据包括但不限于:患者的性别、年龄、法国国家联邦癌症中心组织学分级、化疗状态、原发状态、放疗状态、ctDNA片段含量和手术状态等信息。
详细地,所述根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征是先利用卷积神经网络对所述背景数据进行特征提取,得到背景数据的背景特征,再利用向量拼接的方式将所述背景特征和所述图像特征对应融合,得到所述历史肿瘤图像的融合特征。
在本发明实施例中,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
按照预设的属性数据生成所述融合特征的聚类中心;
根据欧氏距离算法和所述聚类中心对所述融合特征进行数据分类,得到所述融合特征的属性特征,其中,所述欧氏距离算法为:
其中,d表示所述融合特征对应的数据向量与所述聚类中心的欧氏距离,w1j表示所述融合特征对应的数据向量,w2j表示所述聚类中心,j是所述数据向量的标识,sqrt(*)是平方根函数,n是所述数据向量的总数。
详细地,所述预设的属性类别包括但不限于:性别、年龄组、化疗状态、治疗手段、肿瘤类别、ctDNA比例等,其中,性别分为男性和女性,年龄组分为少儿组、青年组、壮年组和老年组,化疗状态分为已化疗和未化疗,治疗手段分为手术、放疗、化疗、免疫疗法、靶向治疗、内分泌治疗、干细胞移植和DNA精准治疗,肿瘤类别包括但不限于:肺癌、乳腺癌、食管癌、胃癌、宫颈癌、结肠癌、横纹肌肉瘤,脂肪肉瘤,骨肉瘤等。
详细地,所述按照预设的属性数据生成所述融合特征的聚类中心是指将所述预设的属性数据进行向量化转化,得到所述预设的属性数据的数据向量,所述属性数据的数据向量就是所述聚类中心的向量表示。
详细地,所述欧氏距离算法也称欧几里得距离,是最常见的距离度量,衡量的是多维空间中两个点之间的绝对距离,利用绝对距离来确定所述融合特征的所属类别。
详细地,参图2所示,所述根据欧氏距离算法和所述聚类中心对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
S21、对所述融合特征进行向量化转化,得到所述融合特征的特征向量;
S22、根据欧氏距离算法逐个计算所述特征向量与所述聚类中心的欧氏距离,根据所述欧氏距离确定所述特征向量的向量属性;
S23、根据所述向量属性和所述聚类中心生成所述融合特征的属性特征。
详细地,所述向量化转化可以利用词袋模型、独热编码、bert模型等,所述融合特征的特征向量是利用向量或者矩阵对所述融合特征进行标识,亦即,所述特征向量是用向量表现所述融合特征。
进一步地,根据所述欧氏距离确定所述特征向量的向量属性是根据所述欧氏距离的大小决定的,假设,特征向量距离A聚类中心的欧氏距离大于B聚类中心的欧氏距离,那么特征向量属于A聚类中心的可能性大于B聚类中心,亦即,所述特征向量的向量属性是A聚类中心所代表的属性特征。
详细地,所述根据所述向量属性和所述聚类中心生成所述融合特征的属性特征是指根据所述向量属性和聚类中心确定所述融合特征的类别标签,利用所述类别标签对所述融合特征进行类别标识,得到所述融合特征的属性特征。
S3、对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵。
在本发明实施例中,所述回归验证是因为不是所有的特征都适用于回归模型训练的,能进行回归模型训练的特征必须满足:线性、等方差齐性、正态分布、相互独立等特点。
在本发明实施例中,参图3所示,所述对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,包括:
S31、对所述属性特征进行线性验证,得到所述属性特征的一级特征;
S32、对所述一级特征进行正态验证,得到所述一级特征的二级特征;
S33、对所述二级特征进行独立验证,得到所述二级特征的三级特征;
S34、对所述三级特征进行齐性验证,得到所述三级特征的四级特征,确定所述四级特征为所述属性特征的标准特征。
详细地,所述对所述属性特征进行线性验证是指所述属性特征中的因变量与自变量呈线性关系,即因变量与自变量在散点图上应大致呈一直线趋势。这一条件可通过绘制散点图来观察。如果这一条件不满足,不应盲目套用线性回归,可选择其他更为合适的模型,如非参数回归等。
详细地,所述对所述一级特征进行正态验证是指由所述一级特征生成地残差是应该符合正态分布的。
详细地,所述对所述三级特征进行齐性验证是指所述三级特征的等方差性,所述等方差性是指在自变量取值范围内,对于任意自变量取值,因变量都有相同的方差。
详细地,所述对所述一级特征进行正态验证,得到所述一级特征的二级特征,包括:
利用如下正态检验算法所述对所述一级特征进行正态验证,得到所述一级特征的二级特征:
其中,R是所述一级特征的正态系数,bi是所述一级特征中的第i个特征的正态评分,yi是所述一级特征中的第i个特征,是所述一级特征的均值,m是所述一级特征中的特征的总数,i是所述一级特征中的特征的标识。
详细地,所述正态检验算法是指Ryan-Joiner检验,其中,Ryan-Joiner检验通过计算所述一级特征与所述一级特征的正态分值之间的相关性来评估正态性。
进一步地,如果所述一级特征的正态系数接近1,则总体就很有可能呈正态分布,Ryan-Joiner统计量可以评估这种相关性的强度;如果它未达到适当的临界值,将否定总体呈正态分布的原假设。
详细地,所述对所述二级特征进行独立验证是指验证所述二级特征之间是否相互独立。
详细地,所述对所述二级特征进行独立验证,得到所述二级特征的三级特征,包括:
利用如下卡方算法对所述二级特征进行独立验证,得到所述二级特征的三级特征:
其中,X是所述二级特征的卡方统计量,op是所述二级特征的观察值,ep是所述二级特征的期望值,k是所述二级特征的观察值的总数,p是所述二级特征的观察值的标识。
在本发明实施例中,所述预设的变量权重是根据变量的重要性确定的,其中,所述变量包括:肿瘤形貌、肿瘤颜色、肿瘤大小、ctDNA片段含量,假定,ctDNA片段含量的权重值大于肿瘤大小、肿瘤大小的权重值大于肿瘤形貌,肿瘤形貌的权重值大于肿瘤颜色。
在本发明实施例中,所述根据预设的变量权重生成对所述标准特征的特征矩阵,包括:
根据所述标准特征的属性类别确定所述标准特征的特征重要性,利用预设的变量权重和所述特征重要性计算所述属性特征的特征权重;
利用所述特征权重和所述标准特征生成所述标准特征的特征矩阵。
详细地,所述标准特征的属性类别可以是标准特征属于C聚类中心,C聚类中心代表着肿瘤的形貌良好,当然,所述标准特征的属性类别也可以是标准特征属于D聚类中心,D聚类中心代表着肿瘤的大小异常。
详细地,根据所述属性类别确定所述标准特征的特征重要性,假设肿瘤形貌的重要性小于肿瘤大小,其中,肿瘤形貌对应的权重值为0.3,肿瘤大小对应的权重值为0.5,那么,属性特征中某一特征的特征权重为0.3,某一特征的特征权重为0.5。
详细地,所述根据预设的变量权重生成对所述标准特征的特征矩阵是指根据所述标准特征和所述标准特征对应的变量权重生成特征矩阵,所述特征矩阵是根据逐个生成标准特征的加权向量,再对所述加权向量进行向量拼接得到所述标准特征的特征矩阵。
S4、根据预设的回归方程构建初始肿瘤分类模型。
在本发明实施例中,所述初始肿瘤分类模型可以建立输入特征与输出特征的关系。
详细地,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项。
详细地,所述预设的回归方程使得所述初始肿瘤分类模型具有广泛的预测效果,只要有现实存在的观测特征,就可以在现实特征的基础上对模型参数进行估计,从而得出针对某一特征,预测未来可能发生的概率。
详细地,所述偏置项用来调整丢弃的局部信息的比例或者能量,没有这个参数,对信息的抛弃率的调整的灵活性就欠缺,使得所述初始肿瘤分类模型的拟合程度更好。
S5、利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型。
在本发明实施例中,所述利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型,包括:
根据所述特征矩阵生成所述初始肿瘤分类模型的损失函数,其中,所述损失函数为:
其中,L(w)是所述初始肿瘤分类模型的损失值,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项;
利用梯度下降法生成所述损失函数的函数最小值,根据所述函数最小值对所述初始肿瘤分类模型进行参数修正,得到训练完成的肿瘤分类模型。
详细地,所述梯度下降法是迭代法的一种,可以用于求解最小二乘问题,在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值,亦即,梯度下降法的计算过程就是沿梯度下降的方向求解极小值。
详细地,所述利用梯度下降法生成所述损失函数的函数最小值,包括:
根据所述损失函数生成所述初始肿瘤分类模型的目标函数,利用预设的梯度下降算法生成所述目标函数的最终训练值,其中,所述预设的梯度下降算法为:
其中,wl+1是初始肿瘤分类模型的第l+1个模型参数,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项,α是学习率;
确定所述最终训练值为所述损失函数的函数最小值。
详细地,所述根据所述函数最小值对所述初始肿瘤分类模型进行参数修正是指利用梯度下降法生成的模型参数对所述初始肿瘤分类模型中的参数进行修改。
S6、获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
在本发明实施例中,所述目标肿瘤的目标数据包括但不限于目标肿瘤的目标肿瘤图像和所述目标肿瘤图像所对应的背景数据等。
详细地,肿瘤权值是对所述目标肿瘤的状态的体现,是所述目标肿瘤中的ctDNA片段的表征,假定,所述预设的状态阈值是50,那么,当所述肿瘤的ctDNA片段对应某一区域的权值大于或者等于50时,所述目标肿瘤的某一区域产生了恶性病变,可以确定此区域是目标肿瘤的病灶;当所述肿瘤的ctDNA片段对应某一区域的权值小于50时,所述目标肿瘤未产生了恶性病变,说明所述目标肿瘤的此区域没有病灶。
本发明实施例通过历史肿瘤图像的图像特征和背景数据生成历史肿瘤图像的融合特征,并对融合特征进行特征分类和回归验证,确保了进行模型训练的数据的可靠性,对构建的初始肿瘤分类模型进行模型训练,建立了输入数据与输出数据的定量关系,提高了模型进行分类的准确性,因此本发明提出基于ctDNA片段化模式的肿瘤病灶的定位装置,可以解决肿瘤病灶的定位时准确性较低的问题。
如图4所示,是本发明一实施例提供的基于ctDNA片段化模式的肿瘤病灶的定位装置的功能模块图。
本发明所述基于ctDNA片段化模式的肿瘤病灶的定位装置100可以安装于电子设备中。根据实现的功能,所述基于ctDNA片段化模式的肿瘤病灶的定位装置100可以包括特征提取模块101、融合特征模块102、回归验证模块103、构建模型模块104、模型训练模块105及病灶定位模块106。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述特征提取模块101,用于获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征;
所述融合特征模块102,用于获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征;
所述回归验证模块103,用于对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵;
所述构建模型模块104,用于根据预设的回归方程构建初始肿瘤分类模型,其中,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项;
所述模型训练模块105,用于利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;
所述病灶定位模块106,用于获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用装置。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述方法包括:
获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征;
获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征;
对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵;
根据预设的回归方程构建初始肿瘤分类模型,其中,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项;
利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;
获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
2.如权利要求1所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
按照预设的属性数据生成所述融合特征的聚类中心;
根据欧氏距离算法和所述聚类中心对所述融合特征进行数据分类,得到所述融合特征的属性特征,其中,所述欧氏距离算法为:
其中,d表示所述融合特征对应的数据向量与所述聚类中心的欧氏距离,w1j表示所述融合特征对应的数据向量,w2j表示所述聚类中心,j是所述数据向量的标识,sqrt(*)是平方根函数,n是所述数据向量的总数。
3.如权利要求2所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述根据欧氏距离算法和所述聚类中心对所述融合特征进行特征分类,得到所述融合特征的属性特征,包括:
对所述融合特征进行向量化转化,得到所述融合特征的特征向量;
根据欧氏距离算法逐个计算所述特征向量与所述聚类中心的欧氏距离,根据所述欧氏距离确定所述特征向量的向量属性;
根据所述向量属性和所述聚类中心生成所述融合特征的属性特征。
4.如权利要求1所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,包括:
对所述属性特征进行线性验证,得到所述属性特征的一级特征;
对所述一级特征进行正态验证,得到所述一级特征的二级特征;
对所述二级特征进行独立验证,得到所述二级特征的三级特征;
对所述三级特征进行齐性验证,得到所述三级特征的四级特征,确定所述四级特征为所述属性特征的标准特征。
5.如权利要求4所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述对所述一级特征进行正态验证,得到所述一级特征的二级特征,包括:
利用如下正态检验算法所述对所述一级特征进行正态验证,得到所述一级特征的二级特征:
其中,R是所述一级特征的正态系数,bi是所述一级特征中的第i个特征的正态评分,yi是所述一级特征中的第i个特征,是所述一级特征的均值,m是所述一级特征中的特征的总数,i是所述一级特征中的特征的标识。
6.如权利要求4所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述对所述二级特征进行独立验证,得到所述二级特征的三级特征,包括:
利用如下卡方算法对所述二级特征进行独立验证,得到所述二级特征的三级特征:
其中,X是所述二级特征的卡方统计量,op是所述二级特征的观察值,ep是所述二级特征的期望值,k是所述二级特征的观察值的总数,p是所述二级特征的观察值的标识。
7.如权利要求1所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述根据预设的变量权重生成对所述标准特征的特征矩阵,包括:
根据所述标准特征的属性类别确定所述标准特征的特征重要性,利用预设的变量权重和所述特征重要性计算所述属性特征的特征权重;
利用所述特征权重和所述标准特征生成所述标准特征的特征矩阵。
8.如权利要求1所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型,包括:
根据所述特征矩阵生成所述初始肿瘤分类模型的损失函数,其中,所述损失函数为:
其中,L(w)是所述初始肿瘤分类模型的损失值,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项;
利用梯度下降法生成所述损失函数的函数最小值,根据所述函数最小值对所述初始肿瘤分类模型进行参数修正,得到训练完成的肿瘤分类模型。
9.如权利要求8所述的基于ctDNA片段化模式的肿瘤病灶的定位方法,其特征在于,所述利用梯度下降法生成所述损失函数的函数最小值,包括:
根据所述损失函数生成所述初始肿瘤分类模型的目标函数,利用预设的梯度下降算法生成所述目标函数的最终训练值,其中,所述预设的梯度下降算法为:
其中,wl+1是初始肿瘤分类模型的第l+1个模型参数,h是所述特征矩阵的矩阵总数,H是所述特征矩阵的矩阵标识,y(h)是第h个所述特征矩阵对应的模型真实值,L是所述特征矩阵中的元素的总数,l是所述特征矩阵中的元素的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个元素,b是偏置项,α是学习率;
确定所述最终训练值为所述损失函数的函数最小值。
10.一种基于ctDNA片段化模式的肿瘤病灶的定位装置,其特征在于,所述装置包括:
特征提取模块,用于获取历史肿瘤图像,对所述历史肿瘤图像进行特征提取,得到所述历史肿瘤图像的图像特征;
融合特征模块,用于获取所述历史肿瘤图像的背景数据,根据所述图像特征和所述背景数据生成所述历史肿瘤图像的融合特征,根据预设的属性类别对所述融合特征进行特征分类,得到所述融合特征的属性特征;
回归验证模块,用于对所述属性特征进行回归验证,确定通过所述回归验证的属性特征的标准特征,根据预设的变量权重生成对所述标准特征的特征矩阵;
构建模型模块,用于根据预设的回归方程构建初始肿瘤分类模型,其中,所述预设的回归方程为:
其中,y是所述初始肿瘤分类模型的输出值,L是所述特征矩阵中的矩阵的总数,l是所述特征矩阵中的矩阵的标识,wl是初始肿瘤分类模型的第l个模型参数,xl是所述特征矩阵中的第l个矩阵,b是偏置项;
模型训练模块,用于利用所述特征矩阵对所述初始肿瘤分类模型进行模型训练,得到训练完成的肿瘤分类模型;
病灶定位模块,用于获取目标肿瘤的目标数据,利用所述训练完成的癌症风险模型和所述目标数据生成所述目标肿瘤的肿瘤权值,根据预设的状态阈值和所述肿瘤权值对所述目标肿瘤进行病灶定位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310441315.9A CN116452559B (zh) | 2023-04-19 | 2023-04-19 | 基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310441315.9A CN116452559B (zh) | 2023-04-19 | 2023-04-19 | 基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116452559A true CN116452559A (zh) | 2023-07-18 |
CN116452559B CN116452559B (zh) | 2024-02-20 |
Family
ID=87121823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310441315.9A Active CN116452559B (zh) | 2023-04-19 | 2023-04-19 | 基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116452559B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930163A (zh) * | 2012-11-01 | 2013-02-13 | 北京理工大学 | 一种2型糖尿病风险状态判定方法 |
US20160217253A1 (en) * | 2015-01-22 | 2016-07-28 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and Systems for Determining Proportions of Distinct Cell Subsets |
WO2017062453A1 (en) * | 2015-10-05 | 2017-04-13 | The University Of North Carolina At Chapel Hill | Image segmentation of organs depicted in computed tomography images |
CN110188757A (zh) * | 2019-06-03 | 2019-08-30 | 济南浪潮高新科技投资发展有限公司 | 基于重要性加权的肿瘤检测模型构建方法及构建系统 |
CN111178449A (zh) * | 2019-12-31 | 2020-05-19 | 浙江大学 | 结合计算机视觉特征和影像组学特征的肝癌图像分类方法和装置 |
CN111489324A (zh) * | 2020-06-05 | 2020-08-04 | 华侨大学 | 一种融合多模态先验病理深度特征的宫颈癌病变诊断方法 |
CN112086129A (zh) * | 2020-09-23 | 2020-12-15 | 深圳吉因加医学检验实验室 | 预测肿瘤组织cfDNA的方法及系统 |
US20210100455A1 (en) * | 2018-04-13 | 2021-04-08 | Vita-Course Technologies Co., Ltd. | Systems and methods for determining blood pressure of subject |
CN112835570A (zh) * | 2021-03-15 | 2021-05-25 | 深圳中科西力数字科技有限公司 | 一种基于机器学习的可视化数学建模方法和系统 |
CN112965971A (zh) * | 2021-04-12 | 2021-06-15 | 北京果壳生物科技有限公司 | 一种对特征丰度数据和样本表型数据进行关联分析的方法 |
CN113362329A (zh) * | 2021-08-11 | 2021-09-07 | 北京航空航天大学杭州创新研究院 | 病灶检测模型的训练方法及识别图像中的病灶的方法 |
CN113689954A (zh) * | 2021-08-24 | 2021-11-23 | 平安科技(深圳)有限公司 | 高血压风险预测方法、装置、设备及介质 |
CN113782183A (zh) * | 2021-07-29 | 2021-12-10 | 甘肃省人民医院 | 一种基于多算法融合的压力性损伤风险预测装置及方法 |
WO2022109176A1 (en) * | 2020-11-22 | 2022-05-27 | Intuitive Surgical Operations, Inc. | Systems and methods for surgical data censorship |
CN114821137A (zh) * | 2022-04-12 | 2022-07-29 | 中国科学院深圳先进技术研究院 | 一种多模态肿瘤数据融合方法和装置 |
CN115100103A (zh) * | 2022-05-11 | 2022-09-23 | 中南大学湘雅医院 | 基于细菌数据的肿瘤预测方法及装置 |
CN115457361A (zh) * | 2022-09-19 | 2022-12-09 | 京东方科技集团股份有限公司 | 分类模型获取方法、表达类别确定方法、装置、设备及介质 |
CN115684116A (zh) * | 2022-11-08 | 2023-02-03 | 深圳市睿法生物科技有限公司 | 一种用于肿瘤筛查的ctDNA多维表观遗传标志物差异识别方法 |
-
2023
- 2023-04-19 CN CN202310441315.9A patent/CN116452559B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930163A (zh) * | 2012-11-01 | 2013-02-13 | 北京理工大学 | 一种2型糖尿病风险状态判定方法 |
US20160217253A1 (en) * | 2015-01-22 | 2016-07-28 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and Systems for Determining Proportions of Distinct Cell Subsets |
WO2017062453A1 (en) * | 2015-10-05 | 2017-04-13 | The University Of North Carolina At Chapel Hill | Image segmentation of organs depicted in computed tomography images |
US20210100455A1 (en) * | 2018-04-13 | 2021-04-08 | Vita-Course Technologies Co., Ltd. | Systems and methods for determining blood pressure of subject |
CN110188757A (zh) * | 2019-06-03 | 2019-08-30 | 济南浪潮高新科技投资发展有限公司 | 基于重要性加权的肿瘤检测模型构建方法及构建系统 |
CN111178449A (zh) * | 2019-12-31 | 2020-05-19 | 浙江大学 | 结合计算机视觉特征和影像组学特征的肝癌图像分类方法和装置 |
CN111489324A (zh) * | 2020-06-05 | 2020-08-04 | 华侨大学 | 一种融合多模态先验病理深度特征的宫颈癌病变诊断方法 |
CN112086129A (zh) * | 2020-09-23 | 2020-12-15 | 深圳吉因加医学检验实验室 | 预测肿瘤组织cfDNA的方法及系统 |
WO2022109176A1 (en) * | 2020-11-22 | 2022-05-27 | Intuitive Surgical Operations, Inc. | Systems and methods for surgical data censorship |
CN112835570A (zh) * | 2021-03-15 | 2021-05-25 | 深圳中科西力数字科技有限公司 | 一种基于机器学习的可视化数学建模方法和系统 |
CN112965971A (zh) * | 2021-04-12 | 2021-06-15 | 北京果壳生物科技有限公司 | 一种对特征丰度数据和样本表型数据进行关联分析的方法 |
CN113782183A (zh) * | 2021-07-29 | 2021-12-10 | 甘肃省人民医院 | 一种基于多算法融合的压力性损伤风险预测装置及方法 |
CN113362329A (zh) * | 2021-08-11 | 2021-09-07 | 北京航空航天大学杭州创新研究院 | 病灶检测模型的训练方法及识别图像中的病灶的方法 |
CN113689954A (zh) * | 2021-08-24 | 2021-11-23 | 平安科技(深圳)有限公司 | 高血压风险预测方法、装置、设备及介质 |
CN114821137A (zh) * | 2022-04-12 | 2022-07-29 | 中国科学院深圳先进技术研究院 | 一种多模态肿瘤数据融合方法和装置 |
CN115100103A (zh) * | 2022-05-11 | 2022-09-23 | 中南大学湘雅医院 | 基于细菌数据的肿瘤预测方法及装置 |
CN115457361A (zh) * | 2022-09-19 | 2022-12-09 | 京东方科技集团股份有限公司 | 分类模型获取方法、表达类别确定方法、装置、设备及介质 |
CN115684116A (zh) * | 2022-11-08 | 2023-02-03 | 深圳市睿法生物科技有限公司 | 一种用于肿瘤筛查的ctDNA多维表观遗传标志物差异识别方法 |
Non-Patent Citations (5)
Title |
---|
HUIYAN LUO等: ""Circulating tumor DNA methylation profiles enable early diagnosis, prognosis prediction, and screening for colorectal cancer"", 《SCI. TRANSL. MED》, vol. 12, no. 524, pages 7533 * |
T. A. SOOMRO 等: ""Image Segmentation for MR Brain Tumor Detection Using Machine Learning: A Review"", 《IEEE REVIEWS IN BIOMEDICAL ENGINEERING》, vol. 16, pages 70 - 90, XP011931774, DOI: 10.1109/RBME.2022.3185292 * |
刘博: ""乳腺超声图像中的肿瘤区域定位与肿瘤分类技术研究"", 《中国博士学位论文全文数据库 信息科技辑》, no. 4, pages 138 - 50 * |
张萌等: ""基于深度主动学习的甲状腺癌病理图像分类方法"", 《南京大学学报(自然科学)》, vol. 57, no. 1, pages 21 - 28 * |
赵旭: ""基于医学先验的多尺度乳腺超声肿瘤实例分割方法"", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, no. 2, pages 060 - 84 * |
Also Published As
Publication number | Publication date |
---|---|
CN116452559B (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Deep feature learning for medical image analysis with convolutional autoencoder neural network | |
CN108898160B (zh) | 基于cnn和影像组学特征融合的乳腺癌组织病理学分级方法 | |
CN109272048B (zh) | 一种基于深度卷积神经网络的模式识别方法 | |
CN110992351B (zh) | 基于多输入卷积神经网络的sMRI图像分类方法和装置 | |
CN110555836A (zh) | 一种超声图像中胎儿标准切面的自动识别方法和系统 | |
CN110717518B (zh) | 基于3d卷积神经网络的持续性肺结节识别方法及装置 | |
CN114582470A (zh) | 一种模型的训练方法、训练装置及医学影像报告标注方法 | |
CN110309853A (zh) | 基于变分自编码器的医学图像聚类方法 | |
WO2022178946A1 (zh) | 黑色素瘤图像识别方法、装置、计算机设备及存储介质 | |
Kabir | Automatic brain tumor detection and feature extraction from mriimage | |
CN110569965A (zh) | 一种基于ThLU函数的神经网络模型优化方法及系统 | |
CN111932541A (zh) | 一种用于预测新冠肺炎预后的ct影像图像处理方法 | |
Shan et al. | Lung cancer diagnosis based on an ann optimized by improved teo algorithm | |
CN116452559B (zh) | 基于ctDNA片段化模式的肿瘤病灶的定位方法及装置 | |
CN111275059B (zh) | 一种图像处理方法、装置和计算机可读存储介质 | |
CN110427804B (zh) | 一种基于二次迁移学习的虹膜身份验证方法 | |
CN116433679A (zh) | 一种基于空间位置结构先验的内耳迷路多级标注伪标签生成与分割方法 | |
Sun et al. | Automatic symmetry-integrated brain injury detection in MRI sequences | |
WO2022127500A1 (zh) | 基于多个神经网络的mri图像分割方法、装置及设备 | |
CN113435488B (zh) | 一种图像采样概率提升方法及其应用 | |
CN112785559B (zh) | 基于深度学习的多个异构模型相互组合的骨龄预测方法 | |
CN114882296A (zh) | 基于神经网络的在体epid剂量验证误差分类和分级算法 | |
CN111598144B (zh) | 图像识别模型的训练方法和装置 | |
CN114331996A (zh) | 基于自编码解码器的医学影像分型方法及系统 | |
Wei et al. | An improved image segmentation algorithm ct superpixel grid using active contour |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |