CN112017732B - 一种终端设备、装置、疾病分类方法及可读存储介质 - Google Patents

一种终端设备、装置、疾病分类方法及可读存储介质 Download PDF

Info

Publication number
CN112017732B
CN112017732B CN202011144331.4A CN202011144331A CN112017732B CN 112017732 B CN112017732 B CN 112017732B CN 202011144331 A CN202011144331 A CN 202011144331A CN 112017732 B CN112017732 B CN 112017732B
Authority
CN
China
Prior art keywords
gene
target
data
genes
target disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011144331.4A
Other languages
English (en)
Other versions
CN112017732A (zh
Inventor
刘小双
徐啸
徐衔
孙瑜尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011144331.4A priority Critical patent/CN112017732B/zh
Publication of CN112017732A publication Critical patent/CN112017732A/zh
Application granted granted Critical
Publication of CN112017732B publication Critical patent/CN112017732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本申请实施例提供了一种终端设备、装置、疾病分类方法及可读存储介质,应用于医疗科技领域,其中,该终端设备包括:通信接口、处理器和存储器,处理器被配置调用存储器中的程序指令用于:通过通信接口接收携带有目标用户的身份信息的疾病分类请求;基于身份信息从存储器中获取目标用户的基因数据,基因数据包括基因集合以及基因集合中各基因的表达量数据;调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析;确定所目标用户所属的目标疾病分型,能够较为准确地确定该目标用户所属的疾病分型,本申请涉及区块链技术,如可将目标用户的基因数据写入区块链中,以用于对该目标用户所属的目标疾病分型等场景。

Description

一种终端设备、装置、疾病分类方法及可读存储介质
技术领域
本申请涉及智能决策领域,具体应用于医疗科技领域,尤其涉及一种终端设备、装置、疾病分类方法及可读存储介质。
背景技术
目前,随着医疗科技的发展,针对某种疾病进行分型的方法越来多,例如,针对该癌症进行分型(理解为癌症的分类)存在两种常见方式,第一种方式是融合多组学数据进行特征筛选,构建机器学习模型,如支持向量机,决策树等,通过单个基因实现对该癌症分型。第二种方式则是根据某些基因之间的关系,建立基因之间调控网络的部分调控信息,从而实现该癌症分型,但是上述两种方式都无法保证能够较为准确的判断出某个患者所属的疾病分型。
发明内容
本申请实施例提供了一种终端设备、装置、疾病分类方法及可读存储介质,可以较为准确地确定出目标用户所属疾病分型。
本申请实施例第一方面提供了一种终端设备,包括通信接口、处理器和存储器,其中:
所述存储器用于存储计算机程序,所述计算机程序包括程序指令;
所述处理器被配置调用所述程序指令,用于通过所述通信接口接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;基于所述身份信息从存储器中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;根据数据分析结果确定所述目标用户所属的目标疾病分型。
本申请实施例第二方面提供了一种疾病分类装置,所述装置部署于终端设备,包括:
接收模块,用于接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
获取模块,用于基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用模块,用于调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
确定模块,用于根据数据分析结果确定所述目标用户所属的目标疾病分型。
本申请实施例第三方面提供了一种疾病分类方法,所述疾病分类方法应用于终端设备,包括:
接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
根据数据分析结果确定所述目标用户所属的目标疾病分型。
本申请实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第三方面的方法。
在本申请实施例中,终端设备接收携带有目标用户的身份信息的疾病分类请求,该疾病分类请求用于指示确定该目标用户所属的目标疾病分型,并基于身份信息从预设存储区域中获取目标用户的基因数据,该基因数据包括基因集合以及基因集合中各基因的表达量数据,任一基因的表达量数据为基因集合中与任一基因的基因类型相同的基因的数量,进一步地,调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析,并根据数据分析结果确定目标用户所属的目标疾病分型,由于目标疾病分型的基因的表达量数据不同,因此根据基因的表达量数据可以最大程度进行区分目标疾病的分型,通过调用目标疾病分类模型对将该目标用户的所有基因的表达量数据进行数据分析,从而能够较为准确地确定该目标用户所属的疾病分型。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种疾病分类系统的结构示意图;
图2是本申请实施例提供的一种疾病分类方法的流程示意图;
图3是本申请实施例提供的另一种疾病分类方法的流程示意图;
图4a是本申请实施例提供的目标疾病的基因调控网络的示意图;
图4b是本申请实施例提供的一种子基因调控网络的示意图;
图5是本申请实施例提供的一种疾病分类装置的结构示意图;
图6是本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,图1为本申请实施例提供的一种疾病分类系统的结构示意图。该疾病分类系统包括终端设备101和疾病分类平台102,该疾病分类平台102可以是部署在终端设备101中,也可以部署在其他终端设备,其中:
用户可以终端设备101登录疾病分类平台102,当终端设备101在接收到用户的登录请求后,获取用户的权限信息,其中该权限信息可以是指该用户的身份信息,如该用户的账号信息等,当终端设备101对用户的权限验证成功后,用户可以登录该疾病分类平台102,当用户想要获取该目标用户所属的目标疾病分型,可以向该疾病分类平台102提交该携带有用户的身份信息的疾病分类其中,终端设备101具体可以是智能手机、平板电脑、笔记本电脑、台式电脑、车载智能终端等,该疾病分类平台可以用于医疗研究的平台,本申请实施例不做限定。
疾病分类平台102中存储有经过训练得到不同的疾病分类模型,例如癌症分类模型、肺炎分类模型等等。
在一种可行的实施例中,疾病分类平台102在接收携带有目标用户的身份信息的疾病分类请求后,可以基于身份信息从预设存储区域中获取目标用户的基因数据,其中,基因数据包括基因集合以及基因集合中各基因的表达量数据,任一基因的表达量数据为基因集合中与任一基因的基因类型相同的基因的数量,并调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析,根据数据分析结果确定目标用户所属的目标疾病分型,可以较为准确地确定出目标用户所属疾病分型。
在一种可行的实施例中,在疾病分类平台102根据数据分析结果确定所述目标用户所属的目标疾病分型后,该疾病分类平台102可以将目标用户所属的目标疾病分型通过终端设备101展示给目标用户,以使得该目标用户了解自身的情况。
请参阅图2,图2为本申请实施例提供的一种疾病分类方法的流程示意图。本实施例中所描述的疾病分类方法应用于终端设备,包括以下步骤:
201、接收携带有目标用户的身份信息的疾病分类请求。
其中,疾病分类请求用于指示确定目标用户所属的目标疾病分型,目标疾病分型是指该目标疾病的类型,例如目标疾病为癌症,则该癌症的类型可以包括胃癌、肝癌等等,例如,更为具体的,该目标疾病可以是胃癌,该胃癌的类型可以包括胃癌一级、胃癌二级等等,该目标用户可以是指患目标疾病的用户,该身份信息可以包括该目标用户的用户标识、姓名信息等等。
202、基于身份信息从预设存储区域中获取目标用户的基因数据,该基因数据包括基因集合以及基因集合中各基因的表达量数据。
其中,该基因集合包括转录因子(Transcription factors ,TF)、信使核糖核酸(messenger ribonucleic acid,mRNA)、小分子核糖核酸(micro ribonucleic acid,miRNA)。该预设存储区域可以是区块链网络中某个节点、该终端设备的存储区域或者样本数据库,该样本数据库可以是指存储所有患者的数据库。任一基因的表达量数据为基因集合中与任一基因的基因类型相同的基因的数量,例如,该基因集合包括mRNA和TF,该相同的mRNA的数量为5,则相同的mRNA中的任一mRNA的表达量数据为5,可选地,该表达量数据还可以用基因丰度进行表示。
在一种可行的实施例中,该身份信息包括目标用户的用户标签,终端设备根据目标用户的用户标签从预设存储区域中获取目标用户的基因数据。
在一种可行的实施例中,该疾病分类请求还可以包括目标疾病标签,终端设备在调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析之前,终端设备根据目标疾病标签确定出目标用户所属的目标疾病,并根据目标疾病从多个训练后的疾病分类模型中确定出目标疾病分类模型。在具体实现中,该终端设备存储有多个训练后的疾病分类模型,终端设备需要先根据该目标疾病标签确定出该目标用户所属的目标疾病,并根据该目标疾病从多个训练后的疾病分类模型中确定出目标疾病分类模型,在终端设备根据该目标疾病标签从多个疾病分类模型中确定出目标疾病分类模型之后,终端设备执行步骤203。
203、调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析。
具体的,在调用训练后的目标疾病分类模型之前,终端设备需要获取大量目标疾病的用户数据,将该大量目标疾病的用户数据放入预先设置的目标疾病分类模型中进行训练,从而得到训练后的目标疾病分类模型,以用于后续调用该训练后的目标疾病分类模型进行数据处理。
204、根据数据分析结果确定目标用户所属的目标疾病分型。
具体的,终端设备可以根据该数据分析结果中的数据标签确定该目标用户所属的目标疾病分型,其中,该数据标签用于指示该目标用户所属的目标疾病分型。
在一种可行的实施例中,终端设备在根据数据分析结果确定目标用户所属的目标疾病分型之后,可以发送提示信息给目标用户,该提示信息包括该目标用户所属的目标疾病分型,以使得用户能够获取该目标用户所属的目标疾病分型。
在一种可行的实施例中,终端设备还可以将该目标用户所属的目标疾病分型以及该目标用户的身份信息等上传区块链网络,从而保证该该目标用户所属的目标疾病分型以及该目标用户的身份信息的有效性和真实性。
在本申请实施例中,终端设备接收携带有目标用户的身份信息的疾病分类请求,该疾病分类请求用于指示确定该目标用户所属的目标疾病分型,并基于身份信息从预设存储区域中获取目标用户的基因数据,该基因数据包括基因集合以及基因集合中各基因的表达量数据,任一基因的表达量数据为基因集合中与任一基因的基因类型相同的基因的数量,进一步地,终端设备调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析,并根据数据分析结果确定目标用户所属的目标疾病分型,由于目标疾病分型的基因的表达量数据不同,从而能够较为准确地得到该目标用户所属的疾病分型。
请参阅图3,图3为本申请实施例提供的另一种疾病分类方法的流程示意图。本实施例中所描述的疾病分类方法应用于终端设备,该疾病分类方法包括:
301、接收携带有目标用户的身份信息的疾病分类请求。
302、基于身份信息从预设存储区域中获取目标用户的基因数据,该基因数据包括基因集合以及基因集合中各基因的表达量数据。
303、获取目标疾病的不同类型基因之间的调控信息,并根据不同类型基因之间的调控信息确定目标疾病对应的基因调控网络。
具体的,终端设备可以从预设存储空间获取目标疾病的不同类型基因之间的调控信息,并根据该不同类型基因之间的调控信息生成目标疾病对应的基因调控网络。其中,该预设存储空间可以区块链网络或者基因数据库。
在一种可行的实施例中,终端设备可以获取患有目标疾病的用户,并对该患有目标疾病的用户进行基因测序,从而得到目标疾病的不同类型基因之间的调控信息。
在一种可行的实施例中,不同类型基因之间的调控信息可以包括转录因子与信使核糖核酸之间的调控信息、转录因子与小分子核糖核酸的之间调控信息、小分子核糖核酸与信使核糖核酸之间的调控信息、以及不同信使核糖核酸之间的调控信息。其中,该调控信息用于指示基因之间的调控关系。不同类型之间的调控信息存在双向调控和单向调控,例如小分子核糖核酸可以对信使核糖核酸进行调控,但信使核糖核酸无法调控小分子核糖核酸。
在一种可行的实施例中,终端设备获取目标疾病的不同类型基因之间的调控信息和多组学数据,根据该多组学数据和不同类型基因之间的调控信息建立目标疾病对应的基因调控网络。如图4a所示,图4a为目标疾病对应的基因调控网络,可以从该基因调控网络中看出各不同类型基因之间的调控关系。例如,该转录因子可以调控信使核糖核酸,不同信使核糖核酸可以相互调控,在图4a中,箭头方向可以调控箭头指向的一方(即有向边),无箭头的可以相互进行调控。其中,多组学数据可以是基因组学、转录组学等等,根据该多组学数据可以确定基因之间的调控信息,因此根据该多组学数据和不同类型基因之间的调控信息建立目标疾病对应的基因调控网络,可以保证该基因调控网络的完整性和准确性。
304、根据不同类型基因之间的调控信息和基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络。
具体的,由于该基因调控网络包括基因之间的调控关系,因此疾病评估平台将基因调控网络按照不同类型基因之间的调控信息进行拆分,得到不同类型基因之间的调控信息对应的子基因调控网络。在具体实现中,将不同基因之间相互调控的分成两种调控信息,例如,mRNA1与mRNA2可以相互调控,则将mRNA1和mRNA2分成mRNA1调控mRNA2, mRNA2调控mRNA1。可以理解的是根据不同类型的基因之间的调控信息可以拆成以下子基因调控网络:miRNA调控mRNA为一个子基因调控网络,TF调控mRNA为一个子基因调控网络,mRNA调控mRNA为一个子基因调控网络,miRNA调控TF为一个子基因调控网络,TF调控TF为一个子基因调控网络等等。
305、获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签。
其中,该数据标签用于指示各患者所属的目标疾病分型。
具体的,终端设备可以获取多个患者,该多个患者中的每个患者都包括对应的基因对应的表达量数据以及数据标签。这里的多个患者可以理解为大量患者,以使得后续根据该各患者对应的基因的表达量数据和各患者的数据标签对预设目标分类模型进行训练。
在一种可行的实施例中,终端设备可以从数据库中获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签。
306、根据每个子基因调控网络、各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型。
在一种可行的实施例中,终端设备可以将每个子基因调控网络通过图注意力神经网络,确定出基因调控网络中每个节点的表征向量,该表征向量用于表征节点对应的基因,并根据各患者对应的基因的表达量数据和每个节点对应的表征向量,得到各患者对应的基因调控网络的表征向量,根据各患者对应的基因调控网络的表征向量和数据标签对预设目标疾病模型进行训练。其中,可以理解的是,该基因网络中的每个节点代表一个基因,该子基因网络中的每个节点代表一个基因,各患者对应的基因调控网络。具体实现中,终端设备可以将每个子基因调控网络通过图注意力神经网络,确定出基因调控网络中每个节点的表征向量,该表征向量用于表征节点对应的基因,并将各患者对应的基因的表达量数据和每个节点对应的表征向量进行相乘,得到各患者对应的所有节点的表征向量,并将各患者对应的所有节点的表征向量进行平均处理,得到各患者对应的基因调控网络的表征向量,根据各患者对应的基因调控网络的表征向量和数据标签对预设目标疾病模型进行训练。
实例性的患者A包括基因A(对应基因调控网络中的节点A)和基因B(对应基因调控网络中的节点B),将节点A的表征向量乘以患者A中基因A对应表达量数据,以及将节点B的表征向量乘以基因B对应表达量数据,得到患者A对应的所有节点的表征向量,并对该患者A对应的所有节点的表征向量进行平均处理,从而得到该样本A的基因调控网络的表征向量,根据患者A对应的基因调控网络的表征向量和患者A对应的数据标签对预设目标疾病模型进行训练。
需要说明的是,上述仅仅以一个患者A进行举例说明,在对预设目标疾病分类模型进行训练时,需要大量的患者作为训练数据,该大量的患者的数据处理可参照患者A进行。
在一种可行的实施例中,终端设备确定出基因调控网络中每个节点的表征向量的具体实现方式为针对各子基因调控网络中的目标节点,确定出与目标节点相邻的节点的表征向量以及,目标节点与相邻节点之间的权重,并根据与目标节点相邻的节点的表征向量,以及所目标节点与相邻节点之间的权重,确定各子基因调控网络中目标节点对应的新表征向量,将各子基因调控网络中的目标节点对应的新表征向量进行均值处理,得到所基因调控网络中目标节点的表征向量,其中,该目标节点为每个子基因调控网络中的任意一个。其中,该目标节点与相邻节点之间的权重在生成子基因调控网络的时候终端设备就从数据库中获取得到。
示例性的,参见图4b,图4b为转录因子与mRNA的子基因调控网络,获取TF节点(目标节点)相邻的mRNA节点,以及TF节点与mRNA节点之间的权重;根据该TF节点的相邻mRNA节点以及TF节点与mRNA节点之间的权重进行加权求和,可以得到该子基因调控网络中TF节点的新的表征向量。具体的,将mRN1节点的表征向量与TF与mRNA1之间的权重相乘,将mRN2节点的表征向量与TF与mRNA2之间的权重相乘,将mRN3节点的表征向量与TF与mRNA3之间的权重相乘,并将这三者进行求和,从而得到节点TF新的表征向量。同理,其他节点可以按照该上述方法进行计算的该节点的新的表征向量。
进一步地,可以根据上述方法,将各子基因调控网络中的同一TF节点的新的特征向量进行求和平均,得到基因调控网络中的同一TF的表征向量。可以理解的是,其他节点可以按照该方法进行计算得到基因调控网络中该节点的表征向量。
需要说明的是,确定基因调控网络中每个节点的表征向量实际上是对每个子图中的相应节点进行计算,并将所有子图中相同节点的表征向量进行求和平均。
307、调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析。
308、根据数据分析结果确定目标用户所属的目标疾病分型。
其中,步骤307-308的具体实现方式可参照上述实施例图2中203-204。
在一种可行的实施例中,终端设备在根据每个子基因调控网络、各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练过程中,终端设备根据得到的各患者的基因调控网络的表征向量利用反向传播技术还原出各患者的基因的表达量数据,并将各患者的基因的表达量数据与在预设存储空间的整体的基因表达量数据进行误差对比,并采取梯度下降的方式不断优化预设目标疾病分类模型中的参数,从而降低误差,得到一个较为准确的目标疾病分类模型。
在一种可行的实施例中,终端设备可以获取目标疾病对应的患者的多组学数据,根据该多组学数据构建整体的基因表达信息,其中,该基因表达信息包括每个基因的表达量数据,并将该基因的表达数据利用矩阵进行存储。
在本申请实施例中,终端设备接收携带有目标用户的身份信息的疾病分类请求,并基于身份信息从预设存储区域中获取目标用户的基因数据,该基因数据包括基因集合以及基因集合中各基因的表达量数据,进一步地,获取目标疾病的不同类型基因之间的调控信息,并根据不同类型基因之间的调控信息确定目标疾病对应的基因调控网络,根据不同类型基因之间的调控信息和基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络,获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,并根据每个子基因调控网络、各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型,进一步地,终端设备调用训练后的目标疾病分类模型对基因集合中各基因的表达量数据进行数据分析,并根据数据分析结果确定目标用户所属的目标疾病分型,由于经过大量数据对该预设目标疾病分类模型进行训练,因此通过训练后的目标疾病分类模型能够较为准确地进行目标疾病分类,从而能够较为准确地确定该目标用户所属的疾病分型。
请参见图5,图5为本申请实施例提供的一种疾病分类装置的结构示意图。本实施例中所描述的疾病分类装置,所述疾病分类装置配置于终端设备,包括:
接收模块501,用于接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
获取模块502,用于基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用模块503,用于调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
确定模块504,用于根据数据分析结果确定所述目标用户所属的目标疾病分型。
在一种可行的实施例中,所述调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析之前,所述获取模块502,还用于获取目标疾病的不同类型基因之间的调控信息;
所述确定模块504,还用于根据所述不同类型基因之间的调控信息确定所述目标疾病对应的基因调控网络;
所述确定模块504,还用于根据所述不同类型基因之间的调控信息和所述基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络;
所述获取模块502,还用于获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,所述数据标签用于指示所述各患者所属的目标疾病分型;
所述确定模块504,还用于根据所述每个子基因调控网络、所述各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型。
在一种可行的实施例中,所述装置还包括:训练模块505,其中:
所述确定模块504,还用于将所述每个子基因调控网络通过图注意力神经网络,确定所述基因调控网络中每个节点的表征向量,所述表征向量用于表征所述节点对应的基因;
所述确定模块504,还用于根据所述各患者对应的基因的表达量数据和所述每个节点对应的表征向量,得到所述各患者对应的基因调控网络的表征向量;
所述训练模块505,用于根据所述各患者对应的基因调控网络的表征向量和数据标签对预设目标疾病模型进行训练。
在一种可行的实施例中,所述不同类型基因之间的调控信息包括转录因子与信使核糖核酸之间的调控信息、所述转录因子与小分子核糖核酸的之间调控信息、所述小分子核糖核酸与所述信使核糖核酸之间的调控信息、以及不同信使核糖核酸之间的调控信息。
在一种可行的实施例中,所述确定模块504,具体用于:
针对所述各子基因调控网络中的目标节点,确定出与目标节点相邻的节点的表征向量以及,所述目标节点与所述相邻节点之间的权重;
根据所述与目标节点相邻的节点的表征向量,以及所述目标节点与所述相邻节点之间的权重,确定所述各子基因调控网络中目标节点对应的新表征向量;
将所述各子基因调控网络中的目标节点对应的新表征向量进行均值处理,得到所述基因调控网络中目标节点的表征向量,其中,所述目标节点为所述每个子基因调控网络中的任意一个。
在一种可行的实施例中,所述获取模块502,具体用于:
从基因库中获取目标疾病的不同类型基因之间的调控信息,或者通过对患目标疾病的用户进行基因测序获取目标疾病的不同类型基因之间的调控信息。
在一种可行的实施例中,所述疾病分类请求包括目标疾病标签,所述调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析之前,所述确定模块504,还用于:
根据所述目标疾病标签确定出所述目标用户所属的目标疾病;
根据所述目标疾病从多个训练后的疾病分类模型中确定出目标疾病分类模型。
可以理解的是,本实施例的疾病分类装置的各功能模块可根据上述方法实施例图2或者图3中的方法具体实现,其具体实现过程可以参照上述方法实施例图2或者图3的相关描述,此处不再赘述。
请参阅图6,图6为本申请实施例提供的一种终端设备的结构示意图。该终端设备可以包括:一个或多个处理器601;通信接口602和存储器603。上述处理器601、通信接口602和存储器603通过总线604连接。存储器603用于存储计算机程序,所述计算机程序包括程序指令,处理器601用于执行存储器603存储的程序指令,执行以下操作:通过所述通信接口602接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;根据数据分析结果确定所述目标用户所属的目标疾病分型。具体实现中,本申请实施例中所描述的处理器601、通信接口602和存储器603可执行本申请实施例提供的疾病分类方法图2或者图3所描述的实现方式,也可执行本申请实施例所描述的疾病分类装置图5的实现方式,在此不再赘述。
在一种可行的实施例中,所述调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析之前,所述处理器601还用于:
获取目标疾病的不同类型基因之间的调控信息,并根据所述不同类型基因之间的调控信息确定所述目标疾病对应的基因调控网络;
根据所述不同类型基因之间的调控信息和所述基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络;
获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,所述数据标签用于指示所述各患者所属的目标疾病分型;
根据所述每个子基因调控网络、所述各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤303-306所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器601,具体用于:
将所述每个子基因调控网络通过图注意力神经网络,确定所述基因调控网络中每个节点的表征向量,所述表征向量用于表征所述节点对应的基因;
根据所述各患者对应的基因的表达量数据和所述每个节点对应的表征向量,得到所述各患者对应的基因调控网络的表征向量;
根据所述各患者对应的基因调控网络的表征向量和数据标签对预设目标疾病模型进行训练。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤306所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述不同类型基因之间的调控信息包括转录因子与信使核糖核酸之间的调控信息、所述转录因子与小分子核糖核酸的之间调控信息、所述小分子核糖核酸与所述信使核糖核酸之间的调控信息、以及不同信使核糖核酸之间的调控信息。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤303所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器601,具体用于:
针对所述各子基因调控网络中的目标节点,确定出与目标节点相邻的节点的表征向量以及,所述目标节点与所述相邻节点之间的权重;
根据所述与目标节点相邻的节点的表征向量,以及所述目标节点与所述相邻节点之间的权重,确定所述各子基因调控网络中目标节点对应的新表征向量;
将所述各子基因调控网络中的目标节点对应的新表征向量进行均值处理,得到所述基因调控网络中目标节点的表征向量,其中,所述目标节点为所述每个子基因调控网络中的任意一个。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤306所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述处理器601,具体用于:
从基因库中获取目标疾病的不同类型基因之间的调控信息,或者通过对患目标疾病的用户进行基因测序获取目标疾病的不同类型基因之间的调控信息。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤303所描述的相关实现方式,此处不再赘述。
在一种可行的实施例中,所述疾病分类请求包括目标疾病标签,所述处理器601调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析之前,还用于:
根据所述目标疾病标签确定出所述目标用户所属的目标疾病;
根据所述目标疾病从多个训练后的疾病分类模型中确定出目标疾病分类模型。具体实现中,本申请实施例中所描述的处理器601的具体实现方式可执行前述实施例步骤202所描述的相关实现方式,此处不再赘述。
应当理解,在本申请实施例中,所称处理器601可以是中央处理单元(CentralProcessing Unit,CPU),该处理器601还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器603可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。存储器603的一部分还可以包括非易失性随机存取存储器。
本申请实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,可执行上述疾病分类方法实施例中所执行的步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述疾病分类方法实施例中所执行的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所揭露的仅为本申请一种较佳实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (9)

1.一种终端设备,其特征在于,包括通信接口、处理器和存储器,其中:
所述存储器用于存储计算机程序,所述计算机程序包括程序指令;
所述处理器被配置调用所述程序指令,用于获取目标疾病的不同类型基因之间的调控信息,并根据所述不同类型基因之间的调控信息确定所述目标疾病对应的基因调控网络;
根据所述不同类型基因之间的调控信息和所述基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络;
获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,所述数据标签用于指示所述各患者所属的目标疾病分型;
根据每个子基因调控网络、所述各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型;
通过所述通信接口接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
基于所述身份信息从存储器中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用所述训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
根据数据分析结果确定所述目标用户所属的目标疾病分型。
2.根据权利要求1所述的终端设备,其特征在于,所述处理器,具体用于:
将所述每个子基因调控网络通过图注意力神经网络,确定所述基因调控网络中每个节点的表征向量,所述表征向量用于表征所述节点对应的基因;
根据所述各患者对应的基因的表达量数据和所述每个节点对应的表征向量,得到所述各患者对应的基因调控网络的表征向量;
根据所述各患者对应的基因调控网络的表征向量和数据标签对预设目标疾病模型进行训练。
3.根据权利要求1所述的终端设备,其特征在于,所述不同类型基因之间的调控信息包括转录因子与信使核糖核酸之间的调控信息、所述转录因子与小分子核糖核酸之间的调控信息、所述小分子核糖核酸与所述信使核糖核酸之间的调控信息、以及不同信使核糖核酸之间的调控信息。
4.根据权利要求2所述的终端设备,其特征在于,所述处理器,具体用于:
针对所述各子基因调控网络中的目标节点,确定出与目标节点相邻的节点的表征向量,以及所述目标节点与所述相邻节点之间的权重;
根据所述与目标节点相邻的节点的表征向量,以及所述目标节点与所述相邻节点之间的权重,确定所述各子基因调控网络中目标节点对应的新表征向量;
将所述各子基因调控网络中的目标节点对应的新表征向量进行均值处理,得到所述基因调控网络中目标节点的表征向量,其中,所述目标节点为所述每个子基因调控网络中的任意一个。
5.根据权利要求1所述的终端设备,其特征在于,所述处理器,具体用于:
从基因库中获取目标疾病的不同类型基因之间的调控信息,或者通过对患目标疾病的用户进行基因测序获取目标疾病的不同类型基因之间的调控信息。
6.根据权利要求1所述的终端设备,其特征在于,所述疾病分类请求包括目标疾病标签,所述处理器,还用于:
根据所述目标疾病标签确定出所述目标用户所属的目标疾病;
根据所述目标疾病从多个训练后的疾病分类模型中确定出目标疾病分类模型。
7.一种疾病分类装置,其特征在于,所述装置部署于终端设备,包括:
接收模块,用于接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
获取模块,用于基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用模块,用于调用训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
确定模块,用于根据数据分析结果确定所述目标用户所属的目标疾病分型;
所述获取模块,还用于获取目标疾病的不同类型基因之间的调控信息;
所述确定模块,还用于根据所述不同类型基因之间的调控信息确定所述目标疾病对应的基因调控网络,根据所述不同类型基因之间的调控信息和所述基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络;
所述获取模块,还用于获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,所述数据标签用于指示所述各患者所属的目标疾病分型;
所述确定模块,还用于根据每个子基因调控网络、所述各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到所述训练后的目标疾病分类模型。
8.一种疾病分类方法,其特征在于,所述疾病分类方法应用于终端设备,包括:
获取目标疾病的不同类型基因之间的调控信息,并根据所述不同类型基因之间的调控信息确定所述目标疾病对应的基因调控网络;
根据所述不同类型基因之间的调控信息和所述基因调控网络,确定不同类型基因之间的调控信息对应的子基因调控网络;
获取多个患者中各患者对应的基因的表达量数据和各患者的数据标签,所述数据标签用于指示所述各患者所属的目标疾病分型;
根据每个子基因调控网络、所述各患者对应的基因的表达量数据和数据标签对预设目标疾病分类模型进行训练,得到训练后的目标疾病分类模型;
接收携带有目标用户的身份信息的疾病分类请求,所述疾病分类请求用于指示确定所述目标用户所属的目标疾病分型;
基于所述身份信息从预设存储区域中获取所述目标用户的基因数据,所述基因数据包括基因集合以及所述基因集合中各基因的表达量数据,任一基因的表达量数据为所述基因集合中与所述任一基因的基因类型相同的基因的数量;
调用所述训练后的目标疾病分类模型对所述基因集合中各基因的表达量数据进行数据分析;
根据数据分析结果确定所述目标用户所属的目标疾病分型。
9.一种计算机可读存储介质,其特征在于,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求8所述的方法。
CN202011144331.4A 2020-10-23 2020-10-23 一种终端设备、装置、疾病分类方法及可读存储介质 Active CN112017732B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011144331.4A CN112017732B (zh) 2020-10-23 2020-10-23 一种终端设备、装置、疾病分类方法及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011144331.4A CN112017732B (zh) 2020-10-23 2020-10-23 一种终端设备、装置、疾病分类方法及可读存储介质

Publications (2)

Publication Number Publication Date
CN112017732A CN112017732A (zh) 2020-12-01
CN112017732B true CN112017732B (zh) 2021-02-05

Family

ID=73528008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011144331.4A Active CN112017732B (zh) 2020-10-23 2020-10-23 一种终端设备、装置、疾病分类方法及可读存储介质

Country Status (1)

Country Link
CN (1) CN112017732B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112530585A (zh) * 2020-12-16 2021-03-19 平安国际智慧城市科技股份有限公司 基于医疗机构的数据处理方法、装置、计算机设备及介质
CN113838527B (zh) * 2021-09-26 2023-09-01 平安科技(深圳)有限公司 一种靶基因预测模型的生成方法及装置、存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416190A (zh) * 2018-02-11 2018-08-17 广州市碳码科技有限责任公司 基于深度学习的肿瘤早期筛查方法、装置、设备及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5503942B2 (ja) * 2009-10-30 2014-05-28 シスメックス株式会社 疾患の罹患の判定方法
CN106709267A (zh) * 2017-01-25 2017-05-24 武汉贝纳科技服务有限公司 数据获取方法及装置
CN111742370A (zh) * 2017-05-12 2020-10-02 密歇根大学董事会 个体和队列药理学表型预测平台
CN107358062B (zh) * 2017-06-02 2020-05-22 西安电子科技大学 一种双层基因调控网络的构建方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416190A (zh) * 2018-02-11 2018-08-17 广州市碳码科技有限责任公司 基于深度学习的肿瘤早期筛查方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112017732A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
Hoang et al. UFBoot2: improving the ultrafast bootstrap approximation
Sun et al. Large-scale multiple testing under dependence
Tamada et al. Estimating gene networks from gene expression data by combining Bayesian network model with promoter element detection
CN112017732B (zh) 一种终端设备、装置、疾病分类方法及可读存储介质
Grafahrend-Belau et al. Modularization of biochemical networks based on classification of Petri net t-invariants
CN111949890B (zh) 基于医学领域的数据推荐方法、设备、服务器及存储介质
US20170277826A1 (en) System, method and software for robust transcriptomic data analysis
Johnston et al. PEMapper and PECaller provide a simplified approach to whole-genome sequencing
US20190206512A1 (en) Genomic services platform supporting multiple application providers
CN111401700A (zh) 一种数据分析方法、装置、计算机系统及可读存储介质
CN110827924B (zh) 基因表达数据的聚类方法、装置、计算机设备及存储介质
Wang et al. High-dimensional Bayesian network inference from systems genetics data using genetic node ordering
Darby et al. Vargas: heuristic-free alignment for assessing linear and graph read aligners
CN112579462A (zh) 测试用例获取方法、系统、设备及计算机可读存储介质
US20200082910A1 (en) Systems and Methods for Determining Effects of Genetic Variation of Splice Site Selection
CN112259161B (zh) 一种疾病风险评估系统、方法、装置及存储介质
Santiago et al. Estimation of the contemporary effective population size from SNP data while accounting for mating structure
CN112214402B (zh) 一种代码验证算法的选择方法、装置及存储介质
CN112148880A (zh) 一种客服对话语料聚类方法、系统、设备及存储介质
CN112801145A (zh) 安全监测方法、装置、计算机设备及存储介质
Mitchell et al. Parallel classification and feature selection in microarray data using SPRINT
CN113891323B (zh) 一种基于WiFi的用户标签获取系统
Mohammadi et al. Machine learning assisted stochastic unit commitment: A feasibility study
WO2021174881A1 (zh) 多维度信息的组合预测方法、装置、计算机设备及介质
Dursun et al. PhenoGeneRanker: Gene and phenotype prioritization using multiplex heterogeneous networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant