CN115458188B - 药物高效应答候选标记的挖掘方法及系统 - Google Patents

药物高效应答候选标记的挖掘方法及系统 Download PDF

Info

Publication number
CN115458188B
CN115458188B CN202211408979.7A CN202211408979A CN115458188B CN 115458188 B CN115458188 B CN 115458188B CN 202211408979 A CN202211408979 A CN 202211408979A CN 115458188 B CN115458188 B CN 115458188B
Authority
CN
China
Prior art keywords
drug
gene
response
drugs
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211408979.7A
Other languages
English (en)
Other versions
CN115458188A (zh
Inventor
安琪儿
赵再戌
闵浩巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Health China Technologies Co Ltd
Original Assignee
Digital Health China Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Health China Technologies Co Ltd filed Critical Digital Health China Technologies Co Ltd
Priority to CN202211408979.7A priority Critical patent/CN115458188B/zh
Publication of CN115458188A publication Critical patent/CN115458188A/zh
Application granted granted Critical
Publication of CN115458188B publication Critical patent/CN115458188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基因分析技术领域,具体涉及一种药物高效应答候选标记的挖掘方法及系统,本方法包括根据癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,得出药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理,计算同一类别药物中相关性靠前基因,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析,并确定药物疗效反应的分子标记,基于分子标记,确定用药;实现基于现有数据库数据,挖掘药物高效应答候选标记。

Description

药物高效应答候选标记的挖掘方法及系统
技术领域
本发明涉及基因分析技术领域,具体涉及一种药物高效应答候选标记的挖掘方法及系统。
背景技术
转录组学和蛋白组学是研究系统的生理化学状态的有用工具,是研究细胞功能的一个重要手段。虽然转录组和蛋白质组在实验方法上差异很大,但由于这两种方法的首要目的都是获得基因的表达情况,其间存在着某种共同之处。从生物学角度上看,mRNA水平代表了基因表达的中间状态,能代表着潜在的蛋白质表达情况。转录组能在较低消耗下实现较高的通量,并能在某种程度上提供较详细的信息。然而蛋白质是直接的功能执行体,因而,对蛋白质表达水平的度量有着不可取代的优势。问题的核心,不是用工具找出mRNA和蛋白质之间一对一的相互关系,而是要用它们区别出真阳性和假阳性,即区别出真正的mRNA-蛋白质一致性或者是不一致性。没有这些整体分析,就无法观察到真正的mRNA-蛋白质关联性。而目前没有一种工具可以为系统提供完全的覆盖范围及相应的精确度,进行基于基因及转录组和蛋白质组的分析而得出效应答候选标记。
发明内容
针对上述现有技术的不足,本发明旨在提供一种药物高效应答候选标记的挖掘方法及系统,以解决目前现有技术中缺乏对现有数据库中基因及转录组和蛋白质组的分析,而得出有效应答候选标记的问题。
为了解决上述问题,本发明采用了如下的技术方案:
一方面,本发明提供一种药物高效应答候选标记的挖掘方法,包括:
S1、根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;
S2、基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
S3、计算同一类别药物中相关性靠前基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;
S4、分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;
S5、基于所述分子标记,确定用药。
作为一种可实施方式,所述步骤S1中根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
作为一种可实施方式,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
作为一种可实施方式,所述步骤S1中通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分较高的基因及药物作为药物高效应答的候选基因及对应的药物。
作为一种可实施方式,所述步骤S2中基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;包括:
将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵,输入所述权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理。
作为一种可实施方式,所述步骤S3中计算同一类别药物中相关性靠前基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;包括:
将所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物种所述药物高效应答的候选基因的相关性,基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
作为一种可实施方式,所述步骤S4中分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;包括:
基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;并结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
作为一种可实施方式,所述步骤S5中基于所述分子标记,确定用药;包括:
基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释,根据所述临床注释确定用药。
作为一种可实施方式,所述步骤S1与所述步骤S2之间还包括:
将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
若所述权重评估模型不准确,则返回所述步骤S1;反之则进行所述步骤S2。
作为一种可实施方式,所述权重评估模型为MERGE。
另一方面,本发明提供一种药物高效应答候选标记的挖掘系统,包括药物高效应答的候选基因及对应的药物分析模块、不同类别药物筛选模块、每一种药物的相关性分析模块、分子标记确定模块和用药分析模块;
所述药物高效应答的候选基因及对应的药物分析模块,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,分析得出药物高效应答的候选基因及对应的药物;
所述不同类别药物筛选模块,用于基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
所述每一种药物的相关性分析模块,用于计算同一类别药物中相关性靠前基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;
所述分子标记确定模块,用于分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;
所述用药分析模块,用于基于所述分子标记,确定用药。
作为一种可实施方式,所述药物高效应答的候选基因及对应的药物分析模块包括权重分析模型构建单元;
所述权重分析模型构建单元,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
作为一种可实施方式,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
作为一种可实施方式,药物高效应答的候选基因及对应的药物分析模块还包括候选基因及对应的药物分析单元;
所述候选基因及对应的药物分析单元,用于通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分较高的基因及药物作为药物高效应答的候选基因及对应的药物。
作为一种可实施方式,所述不同类别药物筛选模块包括对应的药物应答反应数据矩阵构建单元和不同类别药物聚类单元;
所述对应的药物应答反应数据矩阵构建单元,用于将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵;
所述不同类别药物聚类单元,用于将所述对应的药物应答反应数据矩阵输入所述权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理。
作为一种可实施方式,每一种药物的相关性分析模块包括药物高效应答的候选基因表达量矩阵构建单元、药物高效应答的候选基因相关性分析单元、药物类别特性高相关基因组合筛选单元和每一种药物相关性分析单元;
所述药物高效应答的候选基因表达量矩阵构建单元,用于将所述所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵;
所述药物高效应答的候选基因相关性分析单元,用于将所述药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物中所述药物高效应答的候选基因的相关性;
所述药物类别特性高相关基因组合筛选单元,用于基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;
所述每一种药物相关性分析单元,用于构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
作为一种可实施方式,所述分子标记确定模块包括验证单元和分子标记确定单元;
所述验证单元,用于基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;
所述分子标记确定单元,用于结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
作为一种可实施方式,所述用药分析模块包括临床注释查找单元和用药确定单元;
所述临床注释查找单元,用于基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释;
所述用药确定单元,用于根据所述临床注释确定用药。
作为一种可实施方式,所述药物高效应答的候选基因及对应的药物分析模块和不同类别药物筛选模块之间还包括权重评估模型的准确性验证模块;所述权重评估模型的准确性验证模块用于验证所述权重评估模型的准确性;所述权重评估模型的准确性验证模块包括高相关性的表达关键基因筛选单元、权重评估模型的准确性判断单元和分析操作单元;
所述高相关性的表达关键基因筛选单元,用于将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
所述权重评估模型的准确性判断单元,用于以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
所述分析操作单元,用于若所述权重评估模型不准确,则返回所述药物高效应答的候选基因及对应的药物分析模块;反之则转入所述不同类别药物筛选模块。
作为一种可实施方式,所述权重评估模型为MERGE。
本发明的有益效果在于:本发明提供的药物高效应答候选标记的挖掘方法及系统,通过构建权重评估模型,实现对基因组层面驱动因子数据如调理因子、突变位点
信息、拷贝数变化信息进行的加权组合分析,可得出候选基因和相关药物,并对相关药物进行聚类,分析每类药物与基因的相关性,进而分析每种药物与基因的相关性,从而基于药物作用通路确定分子标记,进而确定最佳用药。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
图1:本发明实施例一种药物高效应答候选标记的挖掘方法流程示意图。
图2:本发明实施例一种药物高效应答候选标记的挖掘系统示意图。
具体实施方式
下面结合具体实施例对本发明作进一步的详细说明。
需要说明的是,这些实施例仅用于说明本发明,而不是对本发明的限制,在本发明的构思前提下本方法的简单改进,都属于本发明要求保护的范围。
参见图1,为一种药物高效应答候选标记的挖掘方法,包括:
S1、根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物。
具体的,所述根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
进一步,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
作为一种可实施方式,所述通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分较高的基因及药物作为药物高效应答的候选基因及对应的药物。
S2、基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理。
作为一种可实施方式,步骤S2包括:
将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵,输入所述权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理。
S3、计算同一类别药物中相关性靠前基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析。
作为一种可实施方式,步骤S3包括:
将所述所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物种所述药物高效应答的候选基因的相关性,基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
S4、分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记。
作为一种可实施方式,步骤S4包括:
基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;并结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
S5、基于所述分子标记,确定用药。
作为一种可实施方式,步骤S5包括:
基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释,根据所述临床注释确定用药。
作为一种优化的实施方式,所述步骤S1与所述步骤S2之间还包括:
将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
若所述权重评估模型不准确,则返回所述步骤S1;反之则进行所述步骤S2。
更优的,所述权重评估模型为MERGE。
参见图2,为一种药物高效应答候选标记的挖掘系统,包括药物高效应答的候选基因及对应的药物分析模块10、不同类别药物筛选模块20、每一种药物的相关性分析模块30、分子标记确定模块40和用药分析模块50;
药物高效应答的候选基因及对应的药物分析模块10,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,分析得出药物高效应答的候选基因及对应的药物;
不同类别药物筛选模块20,用于基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
每一种药物的相关性分析模块30,用于计算同一类别药物中相关性靠前基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;
分子标记确定模块40,用于分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;
用药分析模块50,用于基于所述分子标记,确定用药。
作为一种可实施方式,所述药物高效应答的候选基因及对应的药物分析模块10包括权重分析模型构建单元11;
所述权重分析模型构建单元11,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
作为一种可实施方式,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
作为一种可实施方式,药物高效应答的候选基因及对应的药物分析模块10还包括候选基因及对应的药物分析单元12;
所述候选基因及对应的药物分析单元12,用于通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分较高的基因及药物作为药物高效应答的候选基因及对应的药物。
作为一种可实施方式,所述不同类别药物筛选模块20包括对应的药物应答反应数据矩阵构建单元21和不同类别药物聚类单元22;
所述对应的药物应答反应数据矩阵构建单21,用于将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵;
所述不同类别药物聚类单元22,用于将所述对应的药物应答反应数据矩阵输入所述权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理。
作为一种可实施方式,每一种药物的相关性分析模块30包括药物高效应答的候选基因表达量矩阵构建单元31、药物高效应答的候选基因相关性分析单元32、药物类别特性高相关基因组合筛选单元33和每一种药物相关性分析单元34;
所述药物高效应答的候选基因表达量矩阵构建单元31,用于将所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵;
所述药物高效应答的候选基因相关性分析单元32,用于将所述药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物中所述药物高效应答的候选基因的相关性;
所述药物类别特性高相关基因组合筛选单元33,用于基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;
所述每一种药物相关性分析单元34,用于构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
作为一种可实施方式,所述分子标记确定模块40包括验证单元41和分子标记确定单元42;
所述验证单元41,用于基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;
所述分子标记确定单元42,用于结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
作为一种可实施方式,所述用药分析模块50包括临床注释查找单元51和用药确定单元52;
所述临床注释查找单元51,用于基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释;
所述用药确定单元52,用于根据所述临床注释确定用药。
作为一种可实施方式,所述药物高效应答的候选基因及对应的药物分析模块10和不同类别药物筛选模块20之间还包括权重评估模型的准确性验证模块60;所述权重评估模型的准确性验证模块60用于验证所述权重评估模型的准确性;所述权重评估模型的准确性验证模块60包括高相关性的表达关键基因筛选单元61、权重评估模型的准确性判断单元62和分析操作单元63;
所述高相关性的表达关键基因筛选单元61,用于将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
所述权重评估模型的准确性判断单元62,用于以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
所述析操作单元63,用于若所述权重评估模型不准确,则返回所述药物高效应答的候选基因及对应的药物分析模块10;反之则转入所述不同类别药物筛选模块20。
作为一种可实施方式,所述权重评估模型为MERGE。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管通过参照本发明的优选实施例已经对本发明进行了描述,但本领域的普通技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离所附权利要求书所限定的本发明的精神和范围。

Claims (16)

1.一种药物高效应答候选标记的挖掘方法,其特征在于,包括
S1、根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;
S2、基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
S3、计算同一类别药物中相关性靠前的基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;
S4、分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;
S5、基于所述分子标记,确定用药;
所述步骤S2中基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;包括:
将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵,输入权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
所述步骤S4中分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;包括:
基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;并结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
2.根据权利要求1所述的药物高效应答候选标记的挖掘方法,其特征在于,所述步骤S1中根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
3.根据权利要求1或2所述的药物高效应答候选标记的挖掘方法,其特征在于,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
4.根据权利要求2所述的药物高效应答候选标记的挖掘方法,其特征在于,所述步骤S1中通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分高的基因及药物作为药物高效应答的候选基因及对应的药物。
5.根据权利要求1所述的药物高效应答候选标记的挖掘方法,其特征在于,所述步骤S3中计算同一类别药物中相关性靠前的基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;包括:
将所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物中所述药物高效应答的候选基因的相关性,基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
6.根据权利要求1所述的药物高效应答候选标记的挖掘方法,其特征在于,所述步骤S5中基于所述分子标记,确定用药;包括:
基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释,根据所述临床注释确定用药。
7.根据权利要求2所述的药物高效应答候选标记的挖掘方法,其特征在于,所述步骤S1与所述步骤S2之间还包括:
将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
若所述权重评估模型不准确,则返回所述步骤S1;反之则进行所述步骤S2。
8.根据权利要求1所述的药物高效应答候选标记的挖掘方法,其特征在于,所述权重评估模型为MERGE。
9.一种药物高效应答候选标记的挖掘系统,其特征在于,包括药物高效应答的候选基因及对应的药物分析模块、不同类别药物筛选模块、每一种药物的相关性分析模块、分子标记确定模块和用药分析模块;
所述药物高效应答的候选基因及对应的药物分析模块,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,分析得出药物高效应答的候选基因及对应的药物;
所述不同类别药物筛选模块,用于基于所述药物高效应答的候选基因及对应的药物,根据相似疗效反应模式将所述对应的药物进行聚类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
所述每一种药物的相关性分析模块,用于计算同一类别药物中相关性靠前的基因中的任意一个,基于不同类别的药物,形成药物类别特性高相关的基因组合,并针对所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性进行分析;
所述分子标记确定模块,用于分析所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,确定通路与药物之间的关系,并确定药物疗效反应的分子标记;
所述用药分析模块,用于基于所述分子标记,确定用药;
所述不同类别药物筛选模块包括对应的药物应答反应数据矩阵构建单元和不同类别药物聚类单元;
所述对应的药物应答反应数据矩阵构建单元,用于将所述药物高效应答的候选基因及对应的药物,基于所述对应的药物疗效敏感性数据构建对应的药物应答反应数据矩阵;
所述不同类别药物聚类单元,用于将所述对应的药物应答反应数据矩阵输入权重评估模型,进行层次聚类,计算不同药物的AUC值,将具有相似疗效反应模式的药物聚为一类,得到不同类别的药物,分析同一类别的药物之间的作用机理;
所述分子标记确定模块包括验证单元和分子标记确定单元;
所述验证单元,用于基于所述药物类别特性高相关的基因与所述对应的所有药物中每一种药物,基于临床样本的预后及生存资料数据,进行SCNV验证;
所述分子标记确定单元,用于结合现有药物作用机制通路信息,得出某一作用机制中的分子标记。
10.根据权利要求9所述的药物高效应答候选标记的挖掘系统,其特征在于,所述药物高效应答的候选基因及对应的药物分析模块包括权重分析模型构建单元;
所述权重分析模型构建单元,用于根据相同病理条件下某一确定的癌种群体样本的基因数据、对应的药物疗效敏感性数据以及对应的基因表达量数据,建立权重分析模型,包括:
通过所述对应的药物疗效敏感性数据构建药物应答反应数据矩阵;
通过所述对应的基因表达量数据构建基因表达量矩阵;
通过所述基因数据作为权重构建基因驱动特征矩阵。
11.根据权利要求9或10所述的药物高效应答候选标记的挖掘系统,其特征在于,所述基因数据包括基因的SNP维度数据、表达关键基因维度数据、互作调控因子维度数据、基因组CNV维度数据及甲基化程度维度数据。
12.根据权利要求10所述的药物高效应答候选标记的挖掘系统,其特征在于,所述药物高效应答的候选基因及对应的药物分析模块还包括候选基因及对应的药物分析单元;
所述候选基因及对应的药物分析单元,用于通过所述权重分析模型分析得出药物高效应答的候选基因及对应的药物;包括:
将所述药物应答反应数据矩阵、基因表达量矩阵和基因驱动特征矩阵作为输入,通过权重评估模型计算评分高的基因及药物作为药物高效应答的候选基因及对应的药物。
13.根据权利要求9所述的药物高效应答候选标记的挖掘系统,其特征在于,每一种药物的相关性分析模块包括药物高效应答的候选基因表达量矩阵构建单元、药物高效应答的候选基因相关性分析单元、药物类别特性高相关基因组合筛选单元和每一种药物相关性分析单元;
所述药物高效应答的候选基因表达量矩阵构建单元,用于将所述药物高效应答的候选基因及对应的药物,基于所述对应的基因表达量数据,构建药物高效应答的候选基因表达量矩阵;
所述药物高效应答的候选基因相关性分析单元,用于将所述药物高效应答的候选基因表达量矩阵,输入所述权重评估模型,计算得到所有不同类别药物中同一类别药物中所述药物高效应答的候选基因的相关性;
所述药物类别特性高相关基因组合筛选单元,用于基于所述相关性,挑选所述相关性前三中任一所对应的所述药物高效应答的候选基因作为药物类别特性高相关的基因组合;
所述每一种药物相关性分析单元,用于构建所述药物类别特性高相关的基因组合与对应的所有药物之间的相关性热图,分析所述药物类别特性高相关的基因组合与所述对应的所有药物中每一种药物的相关性。
14.根据权利要求9所述的药物高效应答候选标记的挖掘系统,其特征在于,所述用药分析模块包括临床注释查找单元和用药确定单元;
所述临床注释查找单元,用于基于所述分子标记,链接ICMDB数据库,查找所述分子标记的临床注释;
所述用药确定单元,用于根据所述临床注释确定用药。
15.根据权利要求10所述的药物高效应答候选标记的挖掘系统,其特征在于,所述药物高效应答的候选基因及对应的药物分析模块和不同类别药物筛选模块之间还包括权重评估模型的准确性验证模块;所述权重评估模型的准确性验证模块用于验证所述权重评估模型的准确性;所述权重评估模型的准确性验证模块包括高相关性的表达关键基因筛选单元、权重评估模型的准确性判断单元和分析操作单元;
所述高相关性的表达关键基因筛选单元,用于将所述药物应答反应数据矩阵和所述基因表达量矩阵输入所述权重分析模型,得出高相关性的表达关键基因;
所述权重评估模型的准确性判断单元,用于以所述高相关性的表达关键基因为核心,计算所述相同病理条件下某一确定的癌种群体样本的基因DCS评分,并对所述相同病理条件下某一确定的癌种群体样本的基因DCS评分进行拟合,构建QQ-PLOT,验证所述权重评估模型的准确性;
所述分析操作单元,用于若所述权重评估模型不准确,则返回所述药物高效应答的候选基因及对应的药物分析模块;反之则转入所述不同类别药物筛选模块。
16.根据权利要求9所述的药物高效应答候选标记的挖掘系统,其特征在于,所述权重评估模型为MERGE。
CN202211408979.7A 2022-11-11 2022-11-11 药物高效应答候选标记的挖掘方法及系统 Active CN115458188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211408979.7A CN115458188B (zh) 2022-11-11 2022-11-11 药物高效应答候选标记的挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211408979.7A CN115458188B (zh) 2022-11-11 2022-11-11 药物高效应答候选标记的挖掘方法及系统

Publications (2)

Publication Number Publication Date
CN115458188A CN115458188A (zh) 2022-12-09
CN115458188B true CN115458188B (zh) 2023-03-14

Family

ID=84295744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211408979.7A Active CN115458188B (zh) 2022-11-11 2022-11-11 药物高效应答候选标记的挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN115458188B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101603088A (zh) * 2009-07-16 2009-12-16 张俊 评估基因序列与药物药理反应的相关性的方法及系统
CN110021360A (zh) * 2017-09-30 2019-07-16 山西医科大学 基于组学数据挖掘的疾病—药物关联平台
CN112951327A (zh) * 2021-02-09 2021-06-11 清华大学深圳国际研究生院 药物敏感预测方法、电子设备及计算机可读存储介质
CN114913927A (zh) * 2021-02-08 2022-08-16 欧阳德方 一种药物组合物开发及预测评估的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059024A (ja) * 2006-08-29 2008-03-13 Univ Of Tokyo 薬剤の感受性予測に有用な遺伝子座の同定方法
CN106815486B (zh) * 2017-01-22 2021-06-04 华中农业大学 一种个性化用药的系统药理学方法
CN112599207A (zh) * 2020-12-23 2021-04-02 上海海洋大学 基于通路活性及弹性网的癌症药物敏感性预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101603088A (zh) * 2009-07-16 2009-12-16 张俊 评估基因序列与药物药理反应的相关性的方法及系统
CN110021360A (zh) * 2017-09-30 2019-07-16 山西医科大学 基于组学数据挖掘的疾病—药物关联平台
CN114913927A (zh) * 2021-02-08 2022-08-16 欧阳德方 一种药物组合物开发及预测评估的方法
CN112951327A (zh) * 2021-02-09 2021-06-11 清华大学深圳国际研究生院 药物敏感预测方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN115458188A (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
Lowe et al. tRNAscan-SE On-line: integrating search and context for analysis of transfer RNA genes
Aniba et al. Issues in bioinformatics benchmarking: the case study of multiple sequence alignment
Espadaler et al. Prediction of protein–protein interactions using distant conservation of sequence patterns and structure relationships
Bader et al. Functional genomics and proteomics: charting a multidimensional map of the yeast cell
Jenkins et al. In silico target fishing: Predicting biological targets from chemical structure
US20080059513A1 (en) Method of generating molecule-function network
US20030033126A1 (en) Modeling biological systems
US20050149269A1 (en) Browsable database for biological use
Li et al. TransportTP: a two-phase classification approach for membrane transporter prediction and characterization
Jessulat et al. Recent advances in protein–protein interaction prediction: experimental and computational methods
CN113096723A (zh) 小分子药物筛选通用分子库构建平台
Hamdalla et al. Metabolic pathway predictions for metabolomics: a molecular structure matching approach
De Las Rivas et al. Interactome data and databases: different types of protein interaction
Bian et al. MCANet: shared-weight-based MultiheadCrossAttention network for drug–target interaction prediction
CN113223609B (zh) 基于异质信息网络的药物靶标相互作用预测方法
Shen et al. 'Unite and conquer': enhanced prediction of protein subcellular localization by integrating multiple specialized tools
Yeung et al. Phenomics approaches to understand genetic networks and gene function in yeast
CN115458188B (zh) 药物高效应答候选标记的挖掘方法及系统
Dietmann et al. Automated detection of remote homology
Heger et al. The global trace graph, a novel paradigm for searching protein sequence databases
Baltoumas et al. NMPFamsDB: a database of novel protein families from microbial metagenomes and metatranscriptomes
Garrels Yeast genomic databases and the challenge of the post-genomic era
US20020091490A1 (en) System and method for representing and manipulating biological data using a biological object model
Pouliot et al. DIAN: a novel algorithm for genome ontological classification
Karopka et al. Automatic construction of gene relation networks using text mining and gene expression data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant