CN111816303A - 一种基于机器学习的难治性精神分裂症风险的预测方法 - Google Patents

一种基于机器学习的难治性精神分裂症风险的预测方法 Download PDF

Info

Publication number
CN111816303A
CN111816303A CN202010652270.6A CN202010652270A CN111816303A CN 111816303 A CN111816303 A CN 111816303A CN 202010652270 A CN202010652270 A CN 202010652270A CN 111816303 A CN111816303 A CN 111816303A
Authority
CN
China
Prior art keywords
person
schizophrenia
refractory
refractory schizophrenia
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010652270.6A
Other languages
English (en)
Other versions
CN111816303B (zh
Inventor
余卓
向伦平
张晓芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Chi Biotech Co ltd
Original Assignee
Shenzhen Chi Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Chi Biotech Co ltd filed Critical Shenzhen Chi Biotech Co ltd
Priority to CN202010652270.6A priority Critical patent/CN111816303B/zh
Publication of CN111816303A publication Critical patent/CN111816303A/zh
Application granted granted Critical
Publication of CN111816303B publication Critical patent/CN111816303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种基于机器学习的难治性精神分裂症风险的预测方法,包括获取非难治性和难治性精神分裂症患者的病理特征指标数据,所述的病理特征指标数据包括SNPs位点分型结果;根据非难治性和难治性精神分裂症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;获取待测人员的病理特征指标数据,输入到待测人员健康状况的特征评估模型

Description

一种基于机器学习的难治性精神分裂症风险的预测方法
技术领域
本发明属于难治性精神分裂症临床诊疗领域,具体涉及一种基于机器学习的难治性精神分裂症风险的预测方法。
背景技术
难治性精神分裂症是一种慢性复杂性精神分裂症,约占精神分类症患者的30%左右。目前难治性精神分裂症定义不明确,国内外临床实践多依据病程、疗效等指标诊断。排除用药依从性差、治疗方案不当等假性发病因素,难治性精神分裂症的病因及发病机制复杂,多与遗传因素相关。
传统的诊疗思路会使难治性精神分裂症患者延误治疗时机,造成患者及家属的心理困扰,亦增加社会负担。因此,早期识别诊断难治性精神分裂症,及时使用合适方案治疗,控制病情,可获得较大的临床收益和社会收益。有效识别诊断难治性精神分裂症亦可推动合理选择氯氮平治疗,减少相关临床诊疗不良事件的发生率。随着个体化医疗工作的推进,精神分裂症的治疗急需一种精准的预测体系,对患者进行遗传风险分层,辅助诊断识别难治性人群,及早有效应用氯氮平,提高治疗有效率,减少不良反应/事件发生。
因此,有必要提供改进的技术方案以克服现有技术中存在的技术问题。
发明内容
为解决现有技术存在的问题,本发明提供一种基于机器学习的难治性精神分裂症风险的预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
本发明第一方面提供一种基于机器学习的难治性精神分裂症风险的预测方法,包括以下步骤:
步骤S1、取非难治性和难治性精神分裂症患者的病理特征指标数据,所述的病理特征指标数据包括SNPs位点分型结果;
步骤S2、根据非难治性和难治性精神分裂症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;
步骤S3、获取待测人员的病理特征指标数据,所述待测人员的病理特征指标数据包括SNPs位点分型结果,输入到待测人员健康状况的特征评估模型
Figure BDA0002575411060000011
Figure BDA0002575411060000012
得到难治性难治性精神分裂症风险的预测结果;其中,B为待测人员的深度学习模型的评估值、C为待测人员的SNPs位点分型特征的量化值,J为待测人员的逻辑回归模型的量化值,b、c、d取值为-3~3之间,ln()为以e为底数的对数函数;获取待测人员的难治性精神分裂症风险预测结果;其中,所述的待测人员的病理特征指标数据包括待测人员的深度学习模型的评估值、待测人员的SNPs位点分型特征的量化值和待测人员的逻辑回归模型的量化值。
通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神分裂症的客观及时的辅助手段,通过基于机器学习的难治性精神分裂症风险预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
优选地,所述的难治性精神分裂症风险的预测方法,步骤S2所述的深度学习模型包括卷积神经网络模型和循环神经网络中的一种或两种。通过上述技术方案,通过深度学习模型中卷积神经网络和循环神经网络的优势,构建中国人群的难治性精神分裂症遗传风险评估体系,可综合评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
优选地,所述的难治性精神分裂症风险的预测方法,所述的的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、和/或池化层、和/或全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。通过上述技术方案,通过卷积神经网络的参数,构建中国人群的难治性精神分裂症遗传风险评估体系,快速地输出受检者难治性精神分裂症的遗传易感风险的有关信息,减少人工计算的时间和成本。
优选地,所述的难治性精神分裂症风险的预测方法,步骤S2所述的循环神经网络模型包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数。通过上述技术方案,通过设置调整循环神经网络的参数,构建中国人群的难治性精神分裂症遗传风险评估体系,快速地输出受检者难治性精神分裂症的遗传易感风险的有关信息,减少人工计算的时间和成本。
优选地,所述的难治性精神分裂症风险的预测方法,所述的待测人员的SNPs位点分型特征的量化值,是通过对待测人员的SNPs位点分型数据进行RBF神经网络的模型构建后获得。通过上述技术方案,通过设置RBF神经网络模型的搭建,放大待测人员的SNPs位点分型的数据特征,充分有效地输出受检者难治性精神分裂症的遗传易感风险的有关信息,减少人工计算的时间和成本。
本发明第二方面提供一种人体疾病的检测产品,所述检测产品使用了前述的难治性精神分裂症风险预测方法。通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神分裂症的客观及时的辅助手段,通过基于机器学习的难治性精神分裂症风险预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
本发明第三方面提供一种存储介质,其中存储有计算机程序,所述计算机程序被处理器加载执行时,实现如前述的难治性精神分裂症风险预测方法。通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神分裂症的客观及时的辅助手段,通过基于机器学习的难治性精神分裂症风险预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
本发明第四方面提供一种电子设备,包括:处理器、及存储器;其中,所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如前所述的难治性精神分裂症风险的预测方法。
本发明第五方面提供一种基于机器学习的人体健康状况检测装置,所述装置包括:
信号采集模块,用于采集用户的SNPs位点分型结果;
第一确定模块,用于确定所述信号采集模块采集SNPs位点分型结果对应的特征向量;
第二确定模块,用通过所述第一确定模块确定的所述的SNPs位点分型结果对应的特征向量与权利要求1至5中任一权项所述的预测方法确定所述SNPs位点分型结果对应的健康状况信息。
通过上述技术方案,可克服目前临床实践中缺少诊断难治性精神分裂症的客观及时的辅助手段,通过基于机器学习的难治性精神分裂症风险预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
本发明创造的有益效果:
目前临床实践中缺少诊断难治性精神分裂症的客观及时的辅助手段,本申请通过一种基于机器学习的难治性精神分裂症风险的预测方法,构建中国人群的难治性精神分裂症遗传风险评估体系,评估受检者难治性精神分裂症的遗传易感风险,辅助临床及时有效诊疗难治性精神分裂症。
具体实施方式
下列实施例中未注明具体条件的实验方法,通常按照国家标准测定。若没有相应的国家标准,则按照通用的国际标准、常规条件、或按照制造厂商所建议的条件进行。
可对本发明提到的特征或实施例提到的特征进行组合。本说明书所揭示的所有特征可与任何组合物形式并用,说明书中所揭示的各个特征,可以任何可提供相同、均等或相似目的的替代性特征取代。因此除有特别说明,所揭示的特征仅为均等或相似特征的一般性例子。
在本发明中,如果没有特别的说明,本文所提到的所有技术特征以及优选特征可以相互组合形成新的技术方案。
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明,但本发明包括但不限于这些实施例。
精神分裂症患者的SNPs(Single nucleotide polymorphism)位点数据的获取方法为:根据Schizophrenia Working Group of the Psychiatric Genomics Consortium(Nature.2014Jul 24;511(7510):421-7.doi:10.1038/nature13595.Epub 2014Jul 22.)等的研究数据,建立候选SNPs位点数据库(位点信息见表1所示),用于评估受检者的精神分裂症遗传特征,得到SNPs位点分型结果。
表1.位点信息
Figure BDA0002575411060000041
Figure BDA0002575411060000051
Figure BDA0002575411060000061
Figure BDA0002575411060000071
Figure BDA0002575411060000081
入组研究对象:本专利以难治性精神分裂症患者的模拟数据和非难治性精神分裂症患者对照模拟数据为研究对象。所有研究对象自愿签订伦理委员会批准的知情同意书。精神分裂症诊断标准:①国际疾病分类标准第10版:精神分裂诊断标准(ICD-10);②《中国精神病分类与诊断标准》(第2版)修订本精神分裂症标准(CCMD-2-R);③所有病例均符合上述两个诊断标准,才能入组;④精神病状态量表PANSS评分≥60分。难治性精神分裂症诊断标准:①符合精神分裂症诊断保准;②过去5年经过至少2种抗精神病药足量(300~600mg/dCPZ等效剂量)治疗4~6周后,未获临床改善(BPRS总分≥45分,CGI-S≥4分,或者4项阳性症状中,至少2项≥4分)的患者。
样本和临床资料采集:取外周静脉血5ml,-20度保存。收集精神分裂症患者年龄、性别、家族史等一般资料、首次入院和确诊时间、临床症状、认知功能等和用药史相关的资料。
所收集样本全部使用全外显子测序技术(illumina测序平台)进行基因分型检测,根据结果整理数据库位点的基因分型及其得分数据,作为受检者的遗传特诊指标数据。
实施例1.一种难治性精神分裂症的深度学习模型的构建方法
本实施例主要描述一种难治性精神分裂症的深度学习模型的构建方法。所述的的深度学习模型的构建方法包括SNPs位点分型结果的卷积神经网络模型和循环神经网络的构建两个部分。
SNPs位点分型结果的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、和/或池化层、和/或全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。
SNPs位点分型结果的深度卷积神经网络识别模型的具体设置参数如下:
a.输入卷积层:输入数据为SNPs位点分型结果,卷积层有3个,第一卷积层的卷积核有3个,卷积核的尺寸是2,卷积层的步长是1。池化层采用的是最大池化法,池化层的步长是2。第二卷积层的卷积核12个,卷积核的尺寸是2。池化层采用的是最大池化法,卷积层的步长是1。第三卷积层的卷积核有3个,卷积核的尺寸是2,卷积层的步长是1。池化层采用的是最大池化法,池化层的步长是2。
b.激活层:设置激活函数为Relu激活函数。
c.Dropout:在每次训练时都断开一定百分比数值的神经元用于防止数据过拟合,提高泛化能力。
d.全连接层:全连接层有1个。
SNPs位点分型结果的循环神经网络的构建
SNPs位点分型结果的循环神经网络包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数;其它的参数和通用的LSTM模型的参数相同。循环神经网络的输出结果采用softmax函数得到预测结果。softmax函数的预测结果和实际的SNPs位点分型结果的难治性精神分裂症标签进行分析,用交叉熵函数得到损失函数。用优化器不断地减小损失,得到最终的预测模型。
为了综合评价深度学习分类模型的性能,本实施例采用难治性精神分裂症检测的准确度、灵敏度和特异度指标来衡量获取的训练优化后的深度学习模型,在训练优化后的深度学习模型中,输入大量已知标签的样本数据,输出相关的判定结果。根据深度学习模型输出的判定结果,来检测深度学习模型的准确度、灵敏度和特异度的情况;对难治性精神分裂症的深度学习模型的应用性能和不足进行综合评判和优化,完成对难治性精神分裂症的深度学习模型的建立。
深度学习模型的检测结果的准确度、灵敏度和特异度的定义具体如下:
准确度=(真阳性样本数+真阴性样本数)/(真阳性样本数+假阳性样本数+真阴性样本数+假阴性样本数);
灵敏度=真阳性样本数/(真阳性样本数+假阴性样本数);
特异度=真阴性样本数/(真阴性样本数+假阳性样本数);
其中,真阳性样本数表示实际患难治性精神分裂症并被检测为患难治性精神分裂症的样本数;假阳性样本数表示实际未患难治性精神分裂症而被检测为患难治性精神分裂症的样本数;真阴性样本数表示实际未患难治性精神分裂症并被检测为未患难治性精神分裂症的样本数;假阴性样本数表示实际患难治性精神分裂症而被检测为未患难治性精神分裂症的样本数;对于难治性精神分裂症深度学习模型,三个指标越高,代表该模型对于难治性精神分裂症预测性能越好,模型效果越优。
通过以上方式,获得优化后的深度学习分类模型,发明人选用了1000个样本模拟数据,对构建的难治性精神分裂症深度学习模型进行评价,获得SNPs位点分型结果的难治性精神分裂症深度学习模型的实验数据,具体如表1所示;实验结果表明,SNPs位点分型结果的难治性精神分裂症深度学习模型的准确度为93.1%,敏感度为98.4%,特异度为97.8%;是性能出色的深度学习判定模型。
表2.难治性精神分裂症深度学习模型的性能评价
Figure BDA0002575411060000101
分别采集非难治性和难治性精神分裂症病人的深度学习判定模型的输出结果,获取特定人体疾病检测阈值。对不同的深度学习判定模型的输出结果赋以不同的量化值0~10,用以反映疾病的严重程度:0为非难治性精神分裂症患者,10为难治性精神分裂症患者。
实施例2.一种人体脑电动力学数据的功率谱特征的提取方法
本实施例主要构建一种人体脑电动力学数据的功率谱特征的提取方法,所述的提取方法为:
通过功率谱分析方法提取人体脑电动力学数据的功率谱特征,具体通过以下步骤进行:
步骤0:获取样本人群的脑电数据[ei(t),t=1,2,…T],并将脑电数据[ei(t),t=1,2,…T]转化为脑电向量数据[vi(t),vi∈R3,t=1,2,…T]。然后,将脑电向量数据进行RBF神经网络的模型构建:采用动态RBF神经网络辨识器
Figure BDA0002575411060000102
对脑电向量数据的内在系统动态进行局部准确神经网络逼近;得到脑电动力学数据[xi(t),xi∈R3,t=1,2,…T],具体为:
Figure BDA0002575411060000103
其中,S(X(t))、S(Y(t))和S(Z(t))都是高斯径向基函数;
Figure BDA0002575411060000104
Figure BDA0002575411060000105
是通过常值神经网络的权重向量。
步骤1:通过既定的公认有效的快速傅里叶变换方法分别将每一维度的人体脑电动力学数据xi(t),xi(t)∈R1,t=1,2,…,T,i=1,2,3转化成频域信息fi(n),f∈R3,n=1,2,…,N,i=1,2,3,N为采样频率;
步骤2:将步骤1获取的fi(n)进行功率谱分析:
步骤3:分别采集非难治性和难治性精神分裂症病人的功率谱特征获取特定人体疾病检测阈值。
步骤4:对不同的功率谱图赋以不同的量化值0~10,用以反映疾病的严重程度:0为健康人,10为特定疾病重度患者。
实施例3.一种难治性精神分裂症风险评估逻辑回归模型的构建方法
本实施例提供一种难治性精神分裂症风险评估逻辑回归模型的构建方法,具体为:获取非难治性和难治性精神分裂症人的数据特征的临界诊断值,通过以下方法获得:纳入N个临床已知健康个体(N>5000)以及M个临床已知难治性精神分裂症个体(M>5000)作为测试样本人群,采集测试样本人群的脑电数据,获得脑电动力学数据。通过实施例3所述的的功率谱特征的提取方法提取脑电动力学数据的数据特征;然后获取所有个体的脑电动力学数据的数据特征值,进行基于概率的统计学分类(何贤英,赵志,温兴煊,等.Logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定.中国卫生统计,2015,32(2):275-277.),得到预设的难治性精神分裂症风险评估逻辑回归模型。对逻辑回归模型的输出结果,以不同的量化值0~10,用以反映疾病的严重程度:0为健康人,10为特定疾病重度患者。
实施例4.一种难治性精神分裂症风险评估逻辑回归模型的构建方法
本实施例提供一种难治性精神分裂症风险评估逻辑回归模型的构建方法,具体为:获取非难治性和难治性精神分裂症人的SNPs位点分型结果的临界诊断值,通过以下方法获得:纳入N个临床已知健康个体(N>5000)以及M个临床已知难治性精神分裂症个体(M>5000)作为测试样本人群,采集测试样本人群的SNPs位点分型结果,获得测试样本的数据特征,进行基于概率的统计学分类(何贤英,赵志,温兴煊,等.Logistic回归中连续型自变量离散化为二分类变量时适宜分界点的确定.中国卫生统计,2015,32(2):275-277.),得到预设的难治性精神分裂症风险评估逻辑回归模型。
实施例5.一种难治性精神分裂症风险的判别方法
本实施例主要解决如何对难治性精神分裂症风险进行判定识别的问题。本实施例提供一种难治性精神分裂症风险的判别方法,具体为:
采集200例待测人员(100例难治性精神分裂症患者和100例非难治性精神分裂症患者)的健康状况数据,计算待测人员健康状况的特征评估值H=(B+c×C)÷(d×ln(j)),B为深度学习模型的评估值(通过实施例1计算获得)、C为脑电动力学特征的量化值(通过实施例2计算获得),J为逻辑回归模型的量化值(通过实施例3、和/或实施例4计算获得),b、c、d取值为-3~3之间,ln()为以e为底数的对数函数;最终,经实验将参数进行赋值:b赋值为1,c赋值为-1,d赋值为0.5,得到100例难治性精神分裂症患者的健康状况的特征评估值接近1.18,100例健康人的健康状况的特征评估值接近7.09,将待测人员的健康状况的特征评估值输入到预设的难治性精神分裂症风险评估逻辑回归模型中进行阈值判定,得到100例难治性精神分裂症患者的评估结果为难治性精神分裂症,100例健康人的评估结果为非难治性精神分裂症患者。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (9)

1.一种基于机器学习的难治性精神分裂症风险的预测方法,其特征在于,包括以下步骤:
步骤S1、获取非难治性和难治性精神分裂症患者的病理特征指标数据,所述病理特征指标数据包括SNPs位点分型结果;
步骤S2、根据非难治性和难治性精神分裂症患者的病理特征指标数据,训练深度学习模型和逻辑回归模型;
步骤S3、获取待测人员的病理特征指标数据,所述待测人员的病理特征指标数据包括SNPs位点分型结果,输入到待测人员健康状况的特征评估模型
Figure FDA0002575411050000011
Figure FDA0002575411050000012
得到难治性难治性精神分裂症风险的预测结果;其中,B为待测人员的深度学习模型的评估值、C为待测人员的SNPs位点分型结果的量化值,J为待测人员的逻辑回归模型的量化值,b、c、d取值为-3~3之间,ln()为以e为底数的对数函数;获取待测人员的难治性精神分裂症风险预测结果;其中,所述待测人员的病理特征指标数据包待测人员的深度学习模型的评估值、待测人员的SNPs位点分型特征的量化值和待测人员的逻辑回归模型的量化值。
2.根据权利要求1所述预测方法,其特征在于,步骤S2所述深度学习模型为卷积神经网络模型和循环神经网络。
3.根据权利要求2所述预测方法,其特征在于所述的卷积神经网络模型包括:一个输入层、多个隐含层和一个输出层,所述隐含层包括卷积层、池化层和全连接层;所述卷积层的输入数据为SNPs位点分型结果,卷积层至少为1个,每一卷积层的卷积核至少为2个,卷积核的尺寸是至少为2、或2×2、或2×2×2,卷积层的步长是至少为1;池化层的步长是至少为1。
4.根据权利要求2所述预测方法,其特征在于,步骤S2所述循环神经网络模型包括三层:输入层、隐藏层和输出层,输入层接收SNPs位点分型结果的卷积神经网络输出结果作为输入数据,采用的循环神经网络是LSTM模型;添加到遗忘门中的偏置是1,激活函数是Tanh函数。
5.根据权利要求2所述预测方法,其特征在于,所述待测人员的SNPs位点分型特征的量化值,是通过对待测人员的脑电向量数据进行RBF神经网络的模型构建后获得。
6.一种人体疾病的检测产品,其特征在于,所述检测产品使用了权利要求1-5任一权项所述预测方法。
7.一种存储介质,其中存储有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,执行如权利要求1至5中任一权项所述预测方法。
8.一种电子设备,其特征在于,包括:处理器、及存储器;其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如权利要求1至5中任一权项所述预测方法。
其中,所述处理器用于通过传感器采集用户的SNPs位点分型结果,接着通过权利要求1至5中任一权项所述预测方法确定采集用户的健康状况。
9.一种基于机器学习的人体健康状况检测装置,其特征在于,所述装置包括:
信号采集模块,用于采集用户的SNPs位点分型结果;
第一确定模块,用于确定所述信号采集模块采集SNPs位点分型结果对应的特征向量;
第二确定模块,用通过所述第一模块确定的所述SNPs位点分型结果对应的特征向量与权利要求1至5中任一权项所述预测方法确定所述SNPs位点分型结果对应的健康状况信息。
CN202010652270.6A 2020-07-08 2020-07-08 一种基于机器学习的难治性精神分裂症风险的预测方法 Active CN111816303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010652270.6A CN111816303B (zh) 2020-07-08 2020-07-08 一种基于机器学习的难治性精神分裂症风险的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010652270.6A CN111816303B (zh) 2020-07-08 2020-07-08 一种基于机器学习的难治性精神分裂症风险的预测方法

Publications (2)

Publication Number Publication Date
CN111816303A true CN111816303A (zh) 2020-10-23
CN111816303B CN111816303B (zh) 2024-03-29

Family

ID=72842957

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010652270.6A Active CN111816303B (zh) 2020-07-08 2020-07-08 一种基于机器学习的难治性精神分裂症风险的预测方法

Country Status (1)

Country Link
CN (1) CN111816303B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113930538A (zh) * 2021-11-02 2022-01-14 华南农业大学 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建
CN114708965A (zh) * 2022-06-06 2022-07-05 安徽讯飞医疗股份有限公司 诊断推荐方法及装置、电子设备和存储介质
RU2819816C1 (ru) * 2022-12-29 2024-05-24 Федеральное государственное бюджетное научное учреждение "Томский национальный исследовательский медицинский центр Российской академии наук" Мультиплексный набор маркеров как инструмент для разработки генетического тестирования подверженности к шизофрении, алкоголизму и связи с особенностями личности в молодом и умственными способностями в пожилом возрасте

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077756A1 (en) * 1999-11-29 2002-06-20 Scott Arouh Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation
US20100285455A1 (en) * 2007-06-15 2010-11-11 The Feinstein Institute Medical Research Prediction of schizophrenia risk using homozygous genetic markers
WO2011076783A2 (en) * 2009-12-22 2011-06-30 Integragen A method for evaluating a risk for a transmissible neuropsychiatric disorder
CN102137938A (zh) * 2008-07-04 2011-07-27 解码遗传学私营有限责任公司 预测精神分裂症的风险的拷贝数变异
CN104866732A (zh) * 2014-02-21 2015-08-26 北京协力润华科技有限责任公司 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法
CN108172296A (zh) * 2018-01-23 2018-06-15 上海其明信息技术有限公司 一种数据库的建立方法和遗传疾病的风险预测方法
CN110111848A (zh) * 2019-05-08 2019-08-09 南京鼓楼医院 一种基于rnn-cnn神经网络融合算法的人体周期表达基因识别方法
CN110363177A (zh) * 2019-07-23 2019-10-22 上海图灵医疗科技有限公司 一种人体生物电信号混沌特征的提取方法
CN110444270A (zh) * 2019-08-01 2019-11-12 重庆邮电大学 一种基于rbf神经网络的闭环dbs控制方法
CN111128298A (zh) * 2019-12-24 2020-05-08 大连海事大学 一种基于深度学习模型获取多基因风险评分的方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020077756A1 (en) * 1999-11-29 2002-06-20 Scott Arouh Neural-network-based identification, and application, of genomic information practically relevant to diverse biological and sociological problems, including drug dosage estimation
US20100285455A1 (en) * 2007-06-15 2010-11-11 The Feinstein Institute Medical Research Prediction of schizophrenia risk using homozygous genetic markers
CN102137938A (zh) * 2008-07-04 2011-07-27 解码遗传学私营有限责任公司 预测精神分裂症的风险的拷贝数变异
WO2011076783A2 (en) * 2009-12-22 2011-06-30 Integragen A method for evaluating a risk for a transmissible neuropsychiatric disorder
CN104866732A (zh) * 2014-02-21 2015-08-26 北京协力润华科技有限责任公司 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法
CN108172296A (zh) * 2018-01-23 2018-06-15 上海其明信息技术有限公司 一种数据库的建立方法和遗传疾病的风险预测方法
CN110111848A (zh) * 2019-05-08 2019-08-09 南京鼓楼医院 一种基于rnn-cnn神经网络融合算法的人体周期表达基因识别方法
CN110363177A (zh) * 2019-07-23 2019-10-22 上海图灵医疗科技有限公司 一种人体生物电信号混沌特征的提取方法
CN110444270A (zh) * 2019-08-01 2019-11-12 重庆邮电大学 一种基于rbf神经网络的闭环dbs控制方法
CN111128298A (zh) * 2019-12-24 2020-05-08 大连海事大学 一种基于深度学习模型获取多基因风险评分的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岳伟华;康国莲;张瀚迪;汤富磊;曲梅;韩永华;闫俊;阮燕;卢天兰;张岱;: "精神分裂症与神经调节素1、G72及G-蛋白信号转导调节子4基因的关联研究", 中国行为医学科学, no. 05, pages 39 - 41 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113930538A (zh) * 2021-11-02 2022-01-14 华南农业大学 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建
CN113930538B (zh) * 2021-11-02 2024-01-23 华南农业大学 一种用于鉴定水稻适种区域的试剂盒及其预测方法和预测模型的构建
CN114708965A (zh) * 2022-06-06 2022-07-05 安徽讯飞医疗股份有限公司 诊断推荐方法及装置、电子设备和存储介质
CN114708965B (zh) * 2022-06-06 2023-03-28 安徽讯飞医疗股份有限公司 诊断推荐方法及装置、电子设备和存储介质
RU2819816C1 (ru) * 2022-12-29 2024-05-24 Федеральное государственное бюджетное научное учреждение "Томский национальный исследовательский медицинский центр Российской академии наук" Мультиплексный набор маркеров как инструмент для разработки генетического тестирования подверженности к шизофрении, алкоголизму и связи с особенностями личности в молодом и умственными способностями в пожилом возрасте

Also Published As

Publication number Publication date
CN111816303B (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
Brady et al. The HEART score: A guide to its application in the emergency department
Zhao et al. Dual channel LSTM based multi-feature extraction in gait for diagnosis of Neurodegenerative diseases
CN111524602A (zh) 一种老年人记忆及认知功能评估筛查预警系统
TWI701681B (zh) 心房顫動預測模型及其預測系統
CN111816303B (zh) 一种基于机器学习的难治性精神分裂症风险的预测方法
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
WO2019178271A1 (en) Systems and methods for neuro-behavioral relationships in dimensional geometric embedding (n-bridge)
Coutts et al. Psychotic disorders as a framework for precision psychiatry
CN113593708A (zh) 基于集成学习算法的脓毒症预后预测方法
Brunner et al. Toward the development of criteria for global flares in juvenile systemic lupus erythematosus
Maulana et al. Performance analysis and feature extraction for classifying the severity of atopic dermatitis diseases
CN112331340B (zh) 育龄夫妇妊娠概率的智能预测方法及系统
Vukadinovic et al. Deep learning-enabled analysis of medical images identifies cardiac sphericity as an early marker of cardiomyopathy and related outcomes
Li et al. The use of fuzzy backpropagation neural networks for the early diagnosis of hypoxic ischemic encephalopathy in newborns
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统
Dehkordi et al. Artificial intelligence in diagnosis of long QT syndrome: a review of current state, challenges, and future perspectives
ALOTAIBI et al. EARLY PREDICTION OF GESTATIONAL DIABETES USING MACHINE LEARNING TECHNIQUES
CN114864086A (zh) 一种基于肺功能报告模板的疾病预测方法
CN115188475A (zh) 一种狼疮肾炎患者风险预测方法
Piñeros-Fernández Artificial intelligence applications in the diagnosis of neuromuscular diseases: a narrative review
US20220262516A1 (en) Atrial Fibrillation Prediction Model And Prediction System Thereof
TWI641963B (zh) Method for screening coronary heart disease by cardiovascular marker and mechanical learning algorithm
WO2021256784A1 (ko) 환자의 성별에 따른 치매 위험 인자를 이용한 치매 예측 방법 및 장치
CN114250288B (zh) Dna甲基化特征和前脉冲抑制特征在精神分裂症诊断中的应用
JP7333549B2 (ja) 疾病リスク評価方法、疾病リスク評価システム、及び健康情報処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant