CN115691813A - 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 - Google Patents
基于基因组学和微生物组学的遗传性胃癌评估方法及系统 Download PDFInfo
- Publication number
- CN115691813A CN115691813A CN202211720285.7A CN202211720285A CN115691813A CN 115691813 A CN115691813 A CN 115691813A CN 202211720285 A CN202211720285 A CN 202211720285A CN 115691813 A CN115691813 A CN 115691813A
- Authority
- CN
- China
- Prior art keywords
- training
- gastric cancer
- prediction model
- hereditary
- genomics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 208000005718 Stomach Neoplasms Diseases 0.000 title claims abstract description 19
- 206010017758 gastric cancer Diseases 0.000 title claims abstract description 18
- 201000011549 stomach cancer Diseases 0.000 title claims abstract description 18
- 230000002068 genetic effect Effects 0.000 title claims description 10
- 238000012549 training Methods 0.000 claims abstract description 95
- 208000011657 Hereditary gastric cancer Diseases 0.000 claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 34
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 201000011510 cancer Diseases 0.000 claims abstract description 16
- 235000006694 eating habits Nutrition 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000009826 distribution Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 10
- 201000010099 disease Diseases 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 208000015181 infectious disease Diseases 0.000 claims description 5
- 241000203069 Archaea Species 0.000 claims description 4
- 241000894006 Bacteria Species 0.000 claims description 4
- 230000007067 DNA methylation Effects 0.000 claims description 4
- 241000233866 Fungi Species 0.000 claims description 4
- 108010033040 Histones Proteins 0.000 claims description 4
- 206010061218 Inflammation Diseases 0.000 claims description 4
- 108010047956 Nucleosomes Proteins 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 4
- 230000029087 digestion Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000004054 inflammatory process Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 210000001623 nucleosome Anatomy 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000000869 mutational effect Effects 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 abstract 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 3
- 208000018522 Gastrointestinal disease Diseases 0.000 description 2
- 241000590002 Helicobacter pylori Species 0.000 description 2
- 108010047320 Pepsinogen A Proteins 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 208000007882 Gastritis Diseases 0.000 description 1
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 208000024558 digestive system cancer Diseases 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 201000010231 gastrointestinal system cancer Diseases 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 244000005709 gut microbiome Species 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 244000005706 microflora Species 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及基因分析技术领域,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,本发明方法包括:获取遗传性胃癌患者的数据,遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将遗传性胃癌患者的数据分为训练集和测试集并进行预处理,构建基于AdaBoost算法优化的BP神经网络的预测模型,通过训练集对预测模型进行训练,通过测试集对预测模型进行验证,通过预测模型对人患胃癌进行评估;本发明通过患者的基因组学和微生物组学数据,构建基于AdaBoost算法优化的BP神经网络的预测模型,实现对患胃癌的准确预测。
Description
技术领域
本发明涉及基因分析技术领域,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统。
背景技术
由于传统饮食起居文化,患者往往无法正确区分胃肠道疾病和障碍(GI Diseasesand Disorders)如消化不良胃炎和感染和胃癌和结肠癌,往往未有及时就诊或误诊;对于医生,仍依靠传统的临床学形态和影像学为主要方法,无法及时准确致病性肠道微生物群落种类和患者体细胞和生殖细胞基因变异,虽然上述临床表型未有明显变化,而在癌症前期和早期癌症和有关微生物(细胞和分子水平上)的往往具有明显变化;由于对患者无法分层,严重影像治疗方案和有效性。从1964年和1999年日本和韩国,通过血清胃蛋白酶原(pepsinogen,PG)与幽门螺杆菌(Helicobacterpylori,HP)抗体联合法(即“ABC法”)分别启动国家胃癌筛查计划;2019年,美国对45~75岁的人群开展通过高灵敏的粪便检测结合结直肠镜的筛查。2018年,我国“消化道肿瘤筛查及早诊早治项目”启动,在2030年实现胃肠道早期癌症诊断率提高到20%,胃肠道癌5年生存率提高至50%的目标。及时早期高效地发现肿瘤早期病灶和癌前病变,是改变我国消化道肿瘤防治严峻形势的可行且高效的途径。
发明内容
针对上述现有技术的不足,本发明旨在提供一种基于基因组学和微生物组学的遗传性胃癌评估方法和系统,以实现对患遗传性胃癌的评估。
为了解决上述问题,本发明采用了如下的技术方案:
一方面,本发明提供一种基于基因组学和微生物组学的遗传性胃癌评估系统,包括数据获取模块、预测模型构建模块和预测模块;
所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。
进一步,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
进一步,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
进一步,所述预测误差Ei通过下式进行计算:
所述相对误差eti通过下式计算:
所述计算误差率通过下式进行计算:
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1:
进一步,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
另一方面,本发明提供一种基于基因组学和微生物组学的遗传性胃癌评估方法,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
本发明的有益效果在于:本发明提供的一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,通过基因组学、微生物组学数据对遗传性胃癌进行预测,结合AdaBoost算法对BP神经网络进行优化,构建得到预测模型,使得对患遗传性胃癌的预测更为准确。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明实施例一种基于基因组学和微生物组学的遗传性胃癌评估系统示意图。
图2为本发明实施例一种基于基因组学和微生物组学的遗传性胃癌评估方法流程图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细说明。
需要说明的是,这些实施例仅用于说明本发明,而不是对本发明的限制,在本发明的构思前提下本方法的简单改进,都属于本发明要求保护的范围。
AdaBoost算法是根据多个不同权重分布的训练集训练多个具有相同参数的弱预测器,得到多个预测能力彼此不相同的弱预测器,然后针对同一个测试集产生多个不同的弱预测结果,最后通过加权投票的方式将多个弱预测的结果组成一个强预测结果。AdaBoost算法允许一个个相同的弱预测器不断地加入进来,一直到最终误差达到所期望的范围之内。从理论上证明,只要弱预测器的预测结果优于随机预测的结果,在弱预测器的数量足够多时,构成的强预测器的预测结果正确率趋向于100%。在AdaBoost算法中每一次迭代运算中,针对不同的训练集是通过不断地调整训练集各个样本的权重分布来达到其目的。在开始阶段,训练集中各个样本所带有的权重分布是相等的,针对此分布状态的训练集训练出一个预测能力一般的弱预测器。在此轮训练中,训练失败的样本在下一轮的训练中增加其分布权重,训练成功的样本降低其分布权重。这样就重点突出了上一轮训练中训练失败的样本,更加关注了训练失败的样本,得到了一个新的样本分布的训练集。同时,根据训练的成败情况,赋予弱预测器一个相应的权重,预测正确率高的预测器,给予较大的权重值,这些权重分布表示了弱预测器的重要程度。若训练失败的样本数越多,则弱预测器对应的权重越小;相反,若训练成功的样本数越多,则弱预测器对应的权重越大。以此进行类推,不断地进行一次又一次的迭代训练,经过T轮的训练轮数,也就是总共有T次迭代运算,组成了T个弱预测器,得到了T个弱预测结果,也相应地得到了T个弱预测结果对应的权重分布,最终把T个弱预测器的预测结果按照对应的权重分布累加起来,得到强预测器的预测结果。
参见图1,为本发明提供一种基于基因组学和微生物组学的胃癌评估系统,包括数据获取模块100、预测模型构建模块200和预测模块300;
所述数据获取模块100,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块200,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块300,用于通过所述预测模型对人患胃癌进行评估。
作为一种可实施方式,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。利用新宏基因组(微生物群落和血液:短读长和长读长测序以及(Hi-C)最新的表观基因组学技术(EPINUC)技术对血液样本和粪便样本得出上述数据。
作为一种可实施方式,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
作为一种可实施方式,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
作为一种可实施方式,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
作为一种可实施方式,所述预测误差Ei通过下式进行计算:
所述相对误差eti通过下式计算:
所述计算误差率通过下式进行计算:
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1:
作为一种可实施方式,所述用于通过所述预测模型对人患胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
参见图2,为一种基于基因组学和微生物组学的遗传性胃癌评估方法,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
作为一种可实施方式,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
作为一种可实施方式,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
作为一种可实施方式,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
作为一种可实施方式,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
作为一种可实施方式,所述预测误差Ei通过下式进行计算:
所述相对误差eti通过下式计算:
所述计算误差率通过下式进行计算:
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1:
作为一种可实施方式,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。
Claims (10)
1.一种基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,包括数据获取模块、预测模型构建模块和预测模块;
所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。
2.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
3.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
5.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
7.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
8.一种基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
9.根据权利要求8所述基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
10.根据权利要求8所述基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720285.7A CN115691813A (zh) | 2022-12-30 | 2022-12-30 | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211720285.7A CN115691813A (zh) | 2022-12-30 | 2022-12-30 | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115691813A true CN115691813A (zh) | 2023-02-03 |
Family
ID=85057175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211720285.7A Pending CN115691813A (zh) | 2022-12-30 | 2022-12-30 | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115691813A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116245563A (zh) * | 2023-05-11 | 2023-06-09 | 中国石油大学(华东) | 基于AdaBoost算法构建的商品销量融合预测模型 |
CN116417070A (zh) * | 2023-04-17 | 2023-07-11 | 齐鲁工业大学(山东省科学院) | 一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107849616A (zh) * | 2015-04-13 | 2018-03-27 | 优比欧迈公司 | 用于功能特征相关的状况的微生物组来源的表征、诊断和治疗的方法及系统 |
WO2019084559A1 (en) * | 2017-10-27 | 2019-05-02 | Apostle, Inc. | SOMATIC MUTATION CANCER PATHOGENIC IMPACT PREDICTION USING DEEP LEARNING BASED METHODS |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
CN112086129A (zh) * | 2020-09-23 | 2020-12-15 | 深圳吉因加医学检验实验室 | 预测肿瘤组织cfDNA的方法及系统 |
CN113362888A (zh) * | 2021-06-02 | 2021-09-07 | 齐鲁工业大学 | 一种基于随机森林的深度特征选择算法提高胃癌预后预测精度系统、方法、设备及介质 |
CN114283890A (zh) * | 2021-12-15 | 2022-04-05 | 南京医科大学 | 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置 |
CN114300126A (zh) * | 2021-12-30 | 2022-04-08 | 济南大学 | 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统 |
WO2022161824A1 (en) * | 2021-01-29 | 2022-08-04 | Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft | Method for analysis of omics data |
EP4064294A1 (en) * | 2021-03-25 | 2022-09-28 | Keyzell Holding S.L. | Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments |
-
2022
- 2022-12-30 CN CN202211720285.7A patent/CN115691813A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107849616A (zh) * | 2015-04-13 | 2018-03-27 | 优比欧迈公司 | 用于功能特征相关的状况的微生物组来源的表征、诊断和治疗的方法及系统 |
WO2019084559A1 (en) * | 2017-10-27 | 2019-05-02 | Apostle, Inc. | SOMATIC MUTATION CANCER PATHOGENIC IMPACT PREDICTION USING DEEP LEARNING BASED METHODS |
CN111739641A (zh) * | 2020-06-23 | 2020-10-02 | 杭州和壹医学检验所有限公司 | 一种胃癌风险预测方法、系统、计算机设备及可读存储介质 |
CN112086129A (zh) * | 2020-09-23 | 2020-12-15 | 深圳吉因加医学检验实验室 | 预测肿瘤组织cfDNA的方法及系统 |
WO2022161824A1 (en) * | 2021-01-29 | 2022-08-04 | Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft | Method for analysis of omics data |
EP4064294A1 (en) * | 2021-03-25 | 2022-09-28 | Keyzell Holding S.L. | Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments |
CN113362888A (zh) * | 2021-06-02 | 2021-09-07 | 齐鲁工业大学 | 一种基于随机森林的深度特征选择算法提高胃癌预后预测精度系统、方法、设备及介质 |
CN114283890A (zh) * | 2021-12-15 | 2022-04-05 | 南京医科大学 | 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置 |
CN114300126A (zh) * | 2021-12-30 | 2022-04-08 | 济南大学 | 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统 |
Non-Patent Citations (3)
Title |
---|
刘雷;: "中国精准医学的发展" * |
张利红;程静静;夏和先;许华斌;: "幽门螺杆菌感染与慢性胃炎和胃癌的致病机制研究进展" * |
薛佳殷;何帅;李苹;安书仪;唐明生;王慧;黄水平;: "应用人工神经网络筛查胃癌高危人群的研究" * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116417070A (zh) * | 2023-04-17 | 2023-07-11 | 齐鲁工业大学(山东省科学院) | 一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法 |
CN116245563A (zh) * | 2023-05-11 | 2023-06-09 | 中国石油大学(华东) | 基于AdaBoost算法构建的商品销量融合预测模型 |
CN116245563B (zh) * | 2023-05-11 | 2023-10-27 | 中国石油大学(华东) | 基于AdaBoost算法构建的商品销量融合预测模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783915B2 (en) | Convolutional neural network systems and methods for data classification | |
CN109943636B (zh) | 一种结直肠癌微生物标志物及其应用 | |
CN115691813A (zh) | 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 | |
Klein et al. | A genomic classifier improves prediction of metastatic disease within 5 years after surgery in node-negative high-risk prostate cancer patients managed by radical prostatectomy without adjuvant therapy | |
CN110958853B (zh) | 用于鉴定或监测肺病的方法和系统 | |
CN112601826A (zh) | 通过全基因组整合进行循环肿瘤dna的超灵敏检测 | |
CN112086129B (zh) | 预测肿瘤组织cfDNA的方法及系统 | |
CN107075446B (zh) | 用于肥胖症相关疾病的生物标记物 | |
CN114283890B (zh) | 一种基于瘤胃球菌微生物群的疾病风险预测装置 | |
CN113421609A (zh) | 一种基于lncRNA对的结肠癌预后预测模型及其构建方法 | |
Jin et al. | Gut microbiota in patients after surgical treatment for colorectal cancer | |
CN113066585A (zh) | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 | |
Yanke et al. | African‐American race is a predictor of prostate cancer detection: incorporation into a pre‐biopsy nomogram | |
CN115295074A (zh) | 基因标志物在恶性肺结节筛查中的应用、筛查模型的构建方法和检测装置 | |
CN115153445A (zh) | 腹腔镜肝切除治疗肝内胆管癌的远期预后的动态列线图模型构建方法、系统及应用 | |
Cotton et al. | A model using clinical and endoscopic characteristics identifies patients at risk for eosinophilic esophagitis according to updated diagnostic guidelines | |
CN113380396A (zh) | 一种基于粪便微生物标志物和人dna含量的多种肠道疾病风险评估的方法及应用 | |
CN114283885A (zh) | 一种前列腺癌的诊断模型构建方法 | |
CN112037863B (zh) | 一种早期nsclc预后预测系统 | |
WO2017156739A1 (zh) | 分离的核酸及应用 | |
CN112687329B (zh) | 一种基于非癌组织突变信息的癌症预测系统及其构建方法 | |
CN111748634A (zh) | 一种特征lincRNA表达谱组合及结肠癌的早期预测方法 | |
CN116364179A (zh) | 结直肠癌预后标志物筛选系统及方法、结直肠癌预后风险评估系统 | |
CN115873956A (zh) | 用于预测受试者患有结直肠癌风险的试剂盒、系统、应用和预测模型的建模方法 | |
CN116403701A (zh) | 一种非小细胞肺癌患者tmb水平的预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230203 |
|
RJ01 | Rejection of invention patent application after publication |