CN115691813A - 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 - Google Patents

基于基因组学和微生物组学的遗传性胃癌评估方法及系统 Download PDF

Info

Publication number
CN115691813A
CN115691813A CN202211720285.7A CN202211720285A CN115691813A CN 115691813 A CN115691813 A CN 115691813A CN 202211720285 A CN202211720285 A CN 202211720285A CN 115691813 A CN115691813 A CN 115691813A
Authority
CN
China
Prior art keywords
training
gastric cancer
prediction model
hereditary
genomics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211720285.7A
Other languages
English (en)
Inventor
沈成国
许峥
许娟
史文钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202211720285.7A priority Critical patent/CN115691813A/zh
Publication of CN115691813A publication Critical patent/CN115691813A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及基因分析技术领域,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,本发明方法包括:获取遗传性胃癌患者的数据,遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将遗传性胃癌患者的数据分为训练集和测试集并进行预处理,构建基于AdaBoost算法优化的BP神经网络的预测模型,通过训练集对预测模型进行训练,通过测试集对预测模型进行验证,通过预测模型对人患胃癌进行评估;本发明通过患者的基因组学和微生物组学数据,构建基于AdaBoost算法优化的BP神经网络的预测模型,实现对患胃癌的准确预测。

Description

基于基因组学和微生物组学的遗传性胃癌评估方法及系统
技术领域
本发明涉及基因分析技术领域,具体为一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统。
背景技术
由于传统饮食起居文化,患者往往无法正确区分胃肠道疾病和障碍(GI Diseasesand Disorders)如消化不良胃炎和感染和胃癌和结肠癌,往往未有及时就诊或误诊;对于医生,仍依靠传统的临床学形态和影像学为主要方法,无法及时准确致病性肠道微生物群落种类和患者体细胞和生殖细胞基因变异,虽然上述临床表型未有明显变化,而在癌症前期和早期癌症和有关微生物(细胞和分子水平上)的往往具有明显变化;由于对患者无法分层,严重影像治疗方案和有效性。从1964年和1999年日本和韩国,通过血清胃蛋白酶原(pepsinogen,PG)与幽门螺杆菌(Helicobacterpylori,HP)抗体联合法(即“ABC法”)分别启动国家胃癌筛查计划;2019年,美国对45~75岁的人群开展通过高灵敏的粪便检测结合结直肠镜的筛查。2018年,我国“消化道肿瘤筛查及早诊早治项目”启动,在2030年实现胃肠道早期癌症诊断率提高到20%,胃肠道癌5年生存率提高至50%的目标。及时早期高效地发现肿瘤早期病灶和癌前病变,是改变我国消化道肿瘤防治严峻形势的可行且高效的途径。
发明内容
针对上述现有技术的不足,本发明旨在提供一种基于基因组学和微生物组学的遗传性胃癌评估方法和系统,以实现对患遗传性胃癌的评估。
为了解决上述问题,本发明采用了如下的技术方案:
一方面,本发明提供一种基于基因组学和微生物组学的遗传性胃癌评估系统,包括数据获取模块、预测模型构建模块和预测模块;
所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。
进一步,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
进一步,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
Figure DEST_PATH_IMAGE001
其中,
Figure 274480DEST_PATH_IMAGE002
是原始数据集中的最小值,
Figure DEST_PATH_IMAGE003
是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。
进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
进一步,所述预测误差Ei通过下式进行计算:
Figure 810635DEST_PATH_IMAGE004
其中,
Figure DEST_PATH_IMAGE005
为BP神经网络,
Figure 562690DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
为训练样本;
所述相对误差eti通过下式计算:
Figure 608923DEST_PATH_IMAGE008
所述计算误差率通过下式进行计算:
Figure DEST_PATH_IMAGE009
其中,m为迭代次数,
Figure 141535DEST_PATH_IMAGE010
为权重;
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
Figure DEST_PATH_IMAGE011
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1
Figure 543698DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
进一步,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
另一方面,本发明提供一种基于基因组学和微生物组学的遗传性胃癌评估方法,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
进一步,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
进一步,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
本发明的有益效果在于:本发明提供的一种基于基因组学和微生物组学的遗传性胃癌评估方法及系统,通过基因组学、微生物组学数据对遗传性胃癌进行预测,结合AdaBoost算法对BP神经网络进行优化,构建得到预测模型,使得对患遗传性胃癌的预测更为准确。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1为本发明实施例一种基于基因组学和微生物组学的遗传性胃癌评估系统示意图。
图2为本发明实施例一种基于基因组学和微生物组学的遗传性胃癌评估方法流程图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细说明。
需要说明的是,这些实施例仅用于说明本发明,而不是对本发明的限制,在本发明的构思前提下本方法的简单改进,都属于本发明要求保护的范围。
AdaBoost算法是根据多个不同权重分布的训练集训练多个具有相同参数的弱预测器,得到多个预测能力彼此不相同的弱预测器,然后针对同一个测试集产生多个不同的弱预测结果,最后通过加权投票的方式将多个弱预测的结果组成一个强预测结果。AdaBoost算法允许一个个相同的弱预测器不断地加入进来,一直到最终误差达到所期望的范围之内。从理论上证明,只要弱预测器的预测结果优于随机预测的结果,在弱预测器的数量足够多时,构成的强预测器的预测结果正确率趋向于100%。在AdaBoost算法中每一次迭代运算中,针对不同的训练集是通过不断地调整训练集各个样本的权重分布来达到其目的。在开始阶段,训练集中各个样本所带有的权重分布是相等的,针对此分布状态的训练集训练出一个预测能力一般的弱预测器。在此轮训练中,训练失败的样本在下一轮的训练中增加其分布权重,训练成功的样本降低其分布权重。这样就重点突出了上一轮训练中训练失败的样本,更加关注了训练失败的样本,得到了一个新的样本分布的训练集。同时,根据训练的成败情况,赋予弱预测器一个相应的权重,预测正确率高的预测器,给予较大的权重值,这些权重分布表示了弱预测器的重要程度。若训练失败的样本数越多,则弱预测器对应的权重越小;相反,若训练成功的样本数越多,则弱预测器对应的权重越大。以此进行类推,不断地进行一次又一次的迭代训练,经过T轮的训练轮数,也就是总共有T次迭代运算,组成了T个弱预测器,得到了T个弱预测结果,也相应地得到了T个弱预测结果对应的权重分布,最终把T个弱预测器的预测结果按照对应的权重分布累加起来,得到强预测器的预测结果。
参见图1,为本发明提供一种基于基因组学和微生物组学的胃癌评估系统,包括数据获取模块100、预测模型构建模块200和预测模块300;
所述数据获取模块100,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块200,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块300,用于通过所述预测模型对人患胃癌进行评估。
作为一种可实施方式,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。利用新宏基因组(微生物群落和血液:短读长和长读长测序以及(Hi-C)最新的表观基因组学技术(EPINUC)技术对血液样本和粪便样本得出上述数据。
作为一种可实施方式,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
作为一种可实施方式,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
Figure 353522DEST_PATH_IMAGE001
其中,
Figure 878044DEST_PATH_IMAGE014
是原始数据集中的最小值,
Figure 304478DEST_PATH_IMAGE003
是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。
作为一种可实施方式,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
作为一种可实施方式,所述预测误差Ei通过下式进行计算:
Figure 572648DEST_PATH_IMAGE004
其中,
Figure 830454DEST_PATH_IMAGE005
为BP神经网络,
Figure 666823DEST_PATH_IMAGE006
Figure 705186DEST_PATH_IMAGE007
为训练样本;
所述相对误差eti通过下式计算:
Figure 386834DEST_PATH_IMAGE008
所述计算误差率通过下式进行计算:
Figure 561464DEST_PATH_IMAGE009
其中,m为迭代次数,
Figure 631051DEST_PATH_IMAGE010
为权重;
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
Figure 766497DEST_PATH_IMAGE011
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1
Figure 642049DEST_PATH_IMAGE012
其中,
Figure 546551DEST_PATH_IMAGE013
作为一种可实施方式,所述用于通过所述预测模型对人患胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
参见图2,为一种基于基因组学和微生物组学的遗传性胃癌评估方法,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
作为一种可实施方式,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
作为一种可实施方式,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
作为一种可实施方式,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
作为一种可实施方式,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
Figure 52619DEST_PATH_IMAGE001
其中,
Figure 534416DEST_PATH_IMAGE016
是原始数据集中的最小值,
Figure 86095DEST_PATH_IMAGE003
是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。
作为一种可实施方式,所述预测误差Ei通过下式进行计算:
Figure 969738DEST_PATH_IMAGE004
其中,
Figure 646707DEST_PATH_IMAGE005
为BP神经网络,
Figure 491166DEST_PATH_IMAGE006
Figure 442941DEST_PATH_IMAGE007
为训练样本;
所述相对误差eti通过下式计算:
Figure 587615DEST_PATH_IMAGE008
所述计算误差率通过下式进行计算:
Figure 232223DEST_PATH_IMAGE009
其中,m为迭代次数,
Figure 891874DEST_PATH_IMAGE010
为权重;
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
Figure 522707DEST_PATH_IMAGE011
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1
Figure 380942DEST_PATH_IMAGE012
其中,
Figure 71817DEST_PATH_IMAGE013
作为一种可实施方式,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

Claims (10)

1.一种基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,包括数据获取模块、预测模型构建模块和预测模块;
所述数据获取模块,用于获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
所述预测模型构建模块,用于构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
所述预测模块,用于通过所述预测模型对人患遗传性胃癌进行评估。
2.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述微生物组学包括是否存在细菌、真菌、病毒和古菌;所述基因组学包括是否存在SNP、CNV和SV,以及突变特征;所述表观基因组学为DNA甲基化、组蛋白修辞和核小体状况;所述临床表现型为消化、感染和炎症;所述癌症类型为弥散性和遗传性;所述综合评分为患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别所得出的综合评分。
3.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
4.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述预处理包括对所述训练集和测试集通过下式进行归一化处理,
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
是原始数据集中的最小值,
Figure DEST_PATH_IMAGE006
是原始数据集中的最大值,x是原始数据,y是归一化之后的数据。
5.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
6.根据权利要求5所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,
所述预测误差Ei通过下式进行计算:
Figure DEST_PATH_IMAGE008
其中,
Figure DEST_PATH_IMAGE010
为BP神经网络,
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
为训练样本;
所述相对误差eti通过下式计算:
Figure DEST_PATH_IMAGE016
所述计算误差率通过下式进行计算:
Figure DEST_PATH_IMAGE018
其中,m为迭代次数,
Figure DEST_PATH_IMAGE020
为权重;
所述计算所述基学习器在最终强学习器中所占的权重at,通过下式进行计算:
Figure DEST_PATH_IMAGE022
所述根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布,通过下式得出权值Dt+1
Figure DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE026
7.根据权利要求1所述基于基因组学和微生物组学的遗传性胃癌评估系统,其特征在于,所述用于通过所述预测模型对人患遗传性胃癌进行评估,包括:
所述预测模型得出预测评分,再通过PRScsx方法得出患病几率,将所述预测评分与所述患病几率相乘得评估评分。
8.一种基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,包括:
获取遗传性胃癌患者的数据,所述遗传性胃癌患者的数据包括患者的微生物组学、基因组学、表观基因组学、代谢组学、临床表现型、癌症类型、饮食习惯、年纪、性别和综合评分,将所述遗传性胃癌患者的数据分为训练集和测试集并进行预处理;
构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,通过所述测试集对所述预测模型进行验证;
通过所述预测模型对人患遗传性胃癌进行评估。
9.根据权利要求8所述基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,所述BP神经网络包括:输入层、隐含层和输出层;在输入层输入训练数据;初始化权值和阈值;计算隐含层的输出值;在计算输出层的输出值;计算输出值和期待训练输出之间的误差;若满足设定的误差或达到最大的迭代次数则训练结束;反之则根据误差调整隐含层和输出层之间的连接权值,根据误差调整输入层和隐含层之间的连接权值,以及调整隐含层的阈值,返回至所述计算隐含层的输出值。
10.根据权利要求8所述基于基因组学和微生物组学的遗传性胃癌评估方法,其特征在于,所述构建基于AdaBoost算法优化的BP神经网络的预测模型,通过所述训练集对所述预测模型进行训练,包括:
赋予训练集中每一个样本一个相同的权值,将训练样本输入BP神经网络,计算每个样本的预测误差,得出每个样本的相对误差,计算误差率,选择当前误差率最小的弱学习器作为下一轮迭代过程中使用的基学习器,计算所述基学习器在最终强学习器中所占的权重;根据所述基学习器在最终强学习器中所占的权重更新训练数据集样本的权值分布;进行迭代,得出不同的基学习器及权重;将不同的基学习器及其权值相加得到最终强学习器,将所述强学习器作为所述预测模型。
CN202211720285.7A 2022-12-30 2022-12-30 基于基因组学和微生物组学的遗传性胃癌评估方法及系统 Pending CN115691813A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211720285.7A CN115691813A (zh) 2022-12-30 2022-12-30 基于基因组学和微生物组学的遗传性胃癌评估方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211720285.7A CN115691813A (zh) 2022-12-30 2022-12-30 基于基因组学和微生物组学的遗传性胃癌评估方法及系统

Publications (1)

Publication Number Publication Date
CN115691813A true CN115691813A (zh) 2023-02-03

Family

ID=85057175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211720285.7A Pending CN115691813A (zh) 2022-12-30 2022-12-30 基于基因组学和微生物组学的遗传性胃癌评估方法及系统

Country Status (1)

Country Link
CN (1) CN115691813A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116245563A (zh) * 2023-05-11 2023-06-09 中国石油大学(华东) 基于AdaBoost算法构建的商品销量融合预测模型
CN116417070A (zh) * 2023-04-17 2023-07-11 齐鲁工业大学(山东省科学院) 一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107849616A (zh) * 2015-04-13 2018-03-27 优比欧迈公司 用于功能特征相关的状况的微生物组来源的表征、诊断和治疗的方法及系统
WO2019084559A1 (en) * 2017-10-27 2019-05-02 Apostle, Inc. SOMATIC MUTATION CANCER PATHOGENIC IMPACT PREDICTION USING DEEP LEARNING BASED METHODS
CN111739641A (zh) * 2020-06-23 2020-10-02 杭州和壹医学检验所有限公司 一种胃癌风险预测方法、系统、计算机设备及可读存储介质
CN112086129A (zh) * 2020-09-23 2020-12-15 深圳吉因加医学检验实验室 预测肿瘤组织cfDNA的方法及系统
CN113362888A (zh) * 2021-06-02 2021-09-07 齐鲁工业大学 一种基于随机森林的深度特征选择算法提高胃癌预后预测精度系统、方法、设备及介质
CN114283890A (zh) * 2021-12-15 2022-04-05 南京医科大学 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置
CN114300126A (zh) * 2021-12-30 2022-04-08 济南大学 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统
WO2022161824A1 (en) * 2021-01-29 2022-08-04 Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft Method for analysis of omics data
EP4064294A1 (en) * 2021-03-25 2022-09-28 Keyzell Holding S.L. Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107849616A (zh) * 2015-04-13 2018-03-27 优比欧迈公司 用于功能特征相关的状况的微生物组来源的表征、诊断和治疗的方法及系统
WO2019084559A1 (en) * 2017-10-27 2019-05-02 Apostle, Inc. SOMATIC MUTATION CANCER PATHOGENIC IMPACT PREDICTION USING DEEP LEARNING BASED METHODS
CN111739641A (zh) * 2020-06-23 2020-10-02 杭州和壹医学检验所有限公司 一种胃癌风险预测方法、系统、计算机设备及可读存储介质
CN112086129A (zh) * 2020-09-23 2020-12-15 深圳吉因加医学检验实验室 预测肿瘤组织cfDNA的方法及系统
WO2022161824A1 (en) * 2021-01-29 2022-08-04 Max-Delbrück-Centrum Für Molekulare Medizin In Der Helmholtz-Gemeinschaft Method for analysis of omics data
EP4064294A1 (en) * 2021-03-25 2022-09-28 Keyzell Holding S.L. Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments
CN113362888A (zh) * 2021-06-02 2021-09-07 齐鲁工业大学 一种基于随机森林的深度特征选择算法提高胃癌预后预测精度系统、方法、设备及介质
CN114283890A (zh) * 2021-12-15 2022-04-05 南京医科大学 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置
CN114300126A (zh) * 2021-12-30 2022-04-08 济南大学 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘雷;: "中国精准医学的发展" *
张利红;程静静;夏和先;许华斌;: "幽门螺杆菌感染与慢性胃炎和胃癌的致病机制研究进展" *
薛佳殷;何帅;李苹;安书仪;唐明生;王慧;黄水平;: "应用人工神经网络筛查胃癌高危人群的研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116417070A (zh) * 2023-04-17 2023-07-11 齐鲁工业大学(山东省科学院) 一种基于梯度提升深度特征选择算法提高胃癌分型预后预测精度的方法
CN116245563A (zh) * 2023-05-11 2023-06-09 中国石油大学(华东) 基于AdaBoost算法构建的商品销量融合预测模型
CN116245563B (zh) * 2023-05-11 2023-10-27 中国石油大学(华东) 基于AdaBoost算法构建的商品销量融合预测模型

Similar Documents

Publication Publication Date Title
US11783915B2 (en) Convolutional neural network systems and methods for data classification
CN109943636B (zh) 一种结直肠癌微生物标志物及其应用
CN115691813A (zh) 基于基因组学和微生物组学的遗传性胃癌评估方法及系统
Klein et al. A genomic classifier improves prediction of metastatic disease within 5 years after surgery in node-negative high-risk prostate cancer patients managed by radical prostatectomy without adjuvant therapy
CN110958853B (zh) 用于鉴定或监测肺病的方法和系统
CN112601826A (zh) 通过全基因组整合进行循环肿瘤dna的超灵敏检测
CN112086129B (zh) 预测肿瘤组织cfDNA的方法及系统
CN107075446B (zh) 用于肥胖症相关疾病的生物标记物
CN114283890B (zh) 一种基于瘤胃球菌微生物群的疾病风险预测装置
CN113421609A (zh) 一种基于lncRNA对的结肠癌预后预测模型及其构建方法
Jin et al. Gut microbiota in patients after surgical treatment for colorectal cancer
CN113066585A (zh) 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法
Yanke et al. African‐American race is a predictor of prostate cancer detection: incorporation into a pre‐biopsy nomogram
CN115295074A (zh) 基因标志物在恶性肺结节筛查中的应用、筛查模型的构建方法和检测装置
CN115153445A (zh) 腹腔镜肝切除治疗肝内胆管癌的远期预后的动态列线图模型构建方法、系统及应用
Cotton et al. A model using clinical and endoscopic characteristics identifies patients at risk for eosinophilic esophagitis according to updated diagnostic guidelines
CN113380396A (zh) 一种基于粪便微生物标志物和人dna含量的多种肠道疾病风险评估的方法及应用
CN114283885A (zh) 一种前列腺癌的诊断模型构建方法
CN112037863B (zh) 一种早期nsclc预后预测系统
WO2017156739A1 (zh) 分离的核酸及应用
CN112687329B (zh) 一种基于非癌组织突变信息的癌症预测系统及其构建方法
CN111748634A (zh) 一种特征lincRNA表达谱组合及结肠癌的早期预测方法
CN116364179A (zh) 结直肠癌预后标志物筛选系统及方法、结直肠癌预后风险评估系统
CN115873956A (zh) 用于预测受试者患有结直肠癌风险的试剂盒、系统、应用和预测模型的建模方法
CN116403701A (zh) 一种非小细胞肺癌患者tmb水平的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230203

RJ01 Rejection of invention patent application after publication