CN109637588A - 一种基于全转录组高通量测序构建基因调控网络的方法 - Google Patents

一种基于全转录组高通量测序构建基因调控网络的方法 Download PDF

Info

Publication number
CN109637588A
CN109637588A CN201811641406.2A CN201811641406A CN109637588A CN 109637588 A CN109637588 A CN 109637588A CN 201811641406 A CN201811641406 A CN 201811641406A CN 109637588 A CN109637588 A CN 109637588A
Authority
CN
China
Prior art keywords
gene
relationship
mirna
lncrna
circrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811641406.2A
Other languages
English (en)
Other versions
CN109637588B (zh
Inventor
郑洪坤
温颜华
聂佩瑶
黎松
林海军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Original Assignee
BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BIOMARKER TECHNOLOGIES Co Ltd filed Critical BEIJING BIOMARKER TECHNOLOGIES Co Ltd
Priority to CN201811641406.2A priority Critical patent/CN109637588B/zh
Publication of CN109637588A publication Critical patent/CN109637588A/zh
Application granted granted Critical
Publication of CN109637588B publication Critical patent/CN109637588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及生物医学技术领域,具体涉及一种基于全转录组高通量测序构建基因调控网络的方法。在全转录组高通量测序数据的基础上,通过对差异表达的基因、lncRNA、circRNA及miRNA的筛选,以及基因、lncRNA与circRNA的共表达分析和miRNA结合靶点预测,构建疾病相关的竞争性内源RNA调控网络,根据随机游走算法筛选出调控网络中的关键基因,并通过通路富集分析确定关键基因显著富集的通路,结合通路的基因调控关系,分析关键基因在调控疾病过程中的生物学机理。本发明提供的疾病相关关键基因的鉴定及其调控网络的构建方法,为研究复杂疾病的发生发展机制提供了新的思路。

Description

一种基于全转录组高通量测序构建基因调控网络的方法
技术领域
本发明涉及生物医学技术领域,具体涉及一种通过全转录组高通量测序数据的联合分析构建疾病相关关键基因调控网络的方法。
背景技术
人类常见病(包括恶性肿瘤、心脑血管病、代谢系统疾病、神经系统疾病等)绝大多数都是复杂疾病。复杂疾病,又称多基因病,是多基因遗传和环境等因素相互作用的结果,其不符合孟德尔定律,发生发展涉及多种基因和蛋白调控的复杂的生物学过程。虽然目前基因组等大数据研究取得了大量研究成果,但人类对于疾病本质的认知还远远不够。多组学研究为研究人员从分子水平研究复杂疾病提供了有力的条件,为复杂疾病的诊断、治疗及预防奠定了夯实的理论基础。随着高通量测序技术的迅速发展,测序成本的快速下降,二代测序的低成本、高通量、高准确性的特点已经带领基因组学研究进入崭新的领域,也给复杂疾病的基因诊断和治疗带来新的曙光。
近来,越来越多的研究表明非编码RNA(ncRNA),包括microRNA(miRNA),长非编码RNA(lncRNA),环状RNA(circRNA),在复杂疾病的形成过程中起到重要的作用,并且能够在转录、RNA加工和翻译过程中调控基因表达。miRNA是一类具有18-25核苷酸的小分子非编码RNA,在细胞内具有多种重要的调节机制,不但能在转录后水平调控基因表达,也能在转录水平发挥抑制作用。lncRNA是一类长度大于200个核苷酸的不具有编码潜能的RNA,大量研究已经证实lncRNA能够参与细胞增殖、分化、迁移和凋亡,并在基因表达和疾病过程中发挥重要作用。此外,circRNA作为一类新发现的非编码RNA,由于其对外切核酸酶具有抗性,在细胞中是一类稳定的分子,使得它可以成为临床样品的生物标记物。circRNA和lncRNA能够行使miRNA海绵功能,即与miRNA结合影响miRNA的生物学通路,进而影响miRNA的功能。lncRNA和circRNA也可起到竞争性内源RNA(competing endogenous RNAs,ceRNA)的功能,通过竞争性结合相同的miRNA应答元件(MRE)来调控彼此。
然而,单独研究某一种RNA不足以全面的阐释复杂疾病的生物学过程,且分析多种RNA时简单的结果罗列也不易挖掘深层次的调控机制。因此,开发通过分析全转录组的高通量数据来挖掘关键基因及其关系网络,进而阐述复杂疾病的病理学过程,已成为目前亟需解决的问题。
发明内容
为解决现有技术中的技术问题,本发明的目的在于提供一种基于全转录组高通量测序构建关键基因调控网络的方法。
为实现上述目的,本发明的技术方案如下:本发明在对大量全转录组高通量测序数据的分析及其与疾病发生发展的关系的研究基础上,开发了一种通过分析全转录组高通量测序数据构建疾病相关关键基因的调控网络的方法。
本发明提供一种基于全转录组测序构建基因调控网络的方法,其包括如下步骤:
(1)获取正常样本和异常样本的全转录组测序数据,得到基因、lncRNA、circRNA和miRNA的表达水平数据;
(2)根据表达水平数据筛选获得正常样本和异常样本中差异表达的基因、lncRNA、circRNA和miRNA,以及基因、lncRNA和circRNA的共表达关系对;
(3)根据所述基因、lncRNA、circRNA和miRNA的序列预测miRNA结合位点;
(4)根据所述共表达关系对和所述miRNA结合位点的信息,筛选竞争性内源RNA调控关系对;
(5)根据竞争性内源RNA调控关系对和所述差异表达的信息,构建异常样本相关的竞争性内源RNA调控关系网络;根据所述竞争性内源RNA调控关系网络筛选与异常样本异常相关的关键基因;
(6)对所述竞争性内源RNA调控关系网络中的关键基因进行通路富集分析,筛选得到显著通路,根据所述显著通路中基因的调控关系构建所述异常相关的关键基因的调控网络。
上述步骤(1)中所述基因、lncRNA、circRNA和miRNA的表达水平数据包括已知的和预测的基因、lncRNA、circRNA和miRNA的表达水平数据。
其中,所述正常样本可以来源于疾病患者的正常组织;所述异常样本可以来源于疾病患者的病灶组织。
所述获取正常样本和异常样本的全转录组测序数据可以采用本领域任意常用的高通量测序方法进行。
上述步骤(2)中所述筛选获得正常样本和异常样本中差异表达的基因、lncRNA、circRNA和miRNA的筛选参数为选自差异倍数FC(fold change)、显著性pvalue和错误发现率FDR(false discovery rate)中的一种或多种。
具体地,所述筛选获得正常样本和异常样本中差异表达的基因、lncRNA、circRNA和miRNA,为将正常样本中基因、lncRNA、circRNA和miRNA任意一种RNA的表达水平与异常样本中对应的RNA的表达水平进行差异显著性分析,获得所述筛选参数的值。
所述差异显著性分析可以采用DEseq、DEseq2、edgeR、EBseq等软件进行。
优选地,当以FC为筛选参数时,差异表达的筛选标准为如下任意一种:FC≥2、FC≥1.5或FC≥1.2;当以pvalue为筛选参数时,差异表达的筛选标准为如下任意一种:pvalue<0.01、pvalue<0.05;当以FDR为筛选参数时,差异表达的筛选标准为如下任意一种:FDR<0.01、FDR<0.05或FDR<0.1。
上述筛选参数的阈值可以根据疾病的种类以及对于调控网络分析的要求和目的不同进行调整。
作为本发明的一种实施方式,在用于乳腺癌和肝癌时,发明人在对大量复杂疾病的转录组数据的分析基础上,发现确定如下筛选阈值能够提高最终获得的调控网络的准确性:
当以FC为筛选参数时,差异表达的筛选标准为FC≥2;当以pvalue为筛选参数时,差异表达的筛选标准为pvalue<0.01;当以FDR为筛选参数时,差异表达的筛选标准为FDR<0.01。
上述步骤(2)中所述筛选获得的基因、lncRNA和circRNA的共表达关系对为采用皮尔森相关系性分析,获得基因、lncRNA和circRNA表达水平之间的相关性值和显著性值,根据所述相关性值和显著性值进行筛选。
具体地,将基因、lncRNA和circRNA两两之间进行皮尔森相关性分析,分别获得每个基因与每个lncRNA、每个基因与每个circRNA、每个lncRNA与每个circRNA表达水平之间的相关性值和显著性值;所述皮尔森相关性分析可以采用R软件的cor.test函数等进行。
优选地,所述筛选的标准为如下任意一种:
(1)当所述关系对的相关性值的绝对值>0.9且显著性值<0.01时,所述关系对为共表达关系对;
(2)当所述关系对的相关性值的绝对值>0.8且显著性值<0.01时,所述关系对为共表达关系对;
(3)当所述关系对的相关性值的绝对值>0.7且显著性值<0.01时,所述关系对为共表达关系对;
(4)当所述关系对的相关性值的绝对值>0.9且显著性值<0.05时,所述关系对为共表达关系对;
(5)当所述关系对的相关性值的绝对值>0.8且显著性值<0.05时,所述关系对为共表达关系对;
(6)当所述关系对的相关性值的绝对值>0.7且显著性值<0.05时,所述关系对为共表达关系对。
所述相关性值和显著性值的筛选阈值可以根据疾病的种类不同、对于调控网络分析的要求和目的不同进行调整。
作为本发明的一种实施方式,在用于乳腺癌和肝癌时,发明人在对大量复杂疾病的转录组数据的分析基础上,发现确定如下筛选标准能够更准确地获得共表达关系对,进而提高最终获得的调控网络的准确性:当RNA关系对的相关性值的绝对值>0.9且显著性值<0.01时,所述RNA关系对为共表达关系对。
上述步骤(3)中所述预测miRNA结合位点为采用至少两种miRNA结合位点预测软件,分别获得每种预测软件预测得到的miRNA的结合位点,分析预测结果,得到miRNA的调控靶点。
所述miRNA结合位点预测软件包括但不限于miranda、targetscan等。
具体地,为利用miRNA结合位点预测软件分析miRNA是否能够与基因、lncRNA和circRNA结合。
优选地,所述分析预测结果的判断标准为当所述基因、lncRNA或circRNA被所述采用的预测软件中的至少两种预测为miRNA的结合靶标时,所述基因、lncRNA或circRNA为所述miRNA的调控靶标。
更优选地,所述预测软件包括RNAhybrid、miranda、targetscan。
上述步骤(4)中所述筛选获得竞争性内源RNA调控关系对的筛选参数包括:
(1)lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对之间共同结合的miRNA的数量;
(2)lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对之间进行超几何分布检验校正后的FDR值;
(3)所述lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对属于所述共表达关系对中的一种。
优选地,所述筛选参数的筛选标准选自如下任意一种:
(1)所述共同结合的miRNA的数量≥3且所述FDR值<0.01;
(2)所述共同结合的miRNA的数量≥5且所述FDR值<0.01;
(3)所述共同结合的miRNA的数量≥10且所述FDR值<0.01;
(4)所述共同结合的miRNA的数量≥3且所述FDR值<0.05;
(5)所述共同结合的miRNA的数量≥5且所述FDR值<0.05;
(6)所述共同结合的miRNA的数量≥10且所述FDR值<0.05。
上述竞争性内源RNA调控关系对的筛选参数的阈值可以根据疾病种类、对于调控网络分析的要求和目的不同进行调整。
作为本发明的一种实施方式,在用于乳腺癌和肝癌时,发明人在对大量复杂疾病的转录组数据的分析基础上,发现确定如下筛选标准能够更准确地获得竞争性内源RNA调控关系对,进而提高最终获得的调控网络的准确性:即当所述关系对满足(1)所述共同结合的miRNA的数量≥5、(2)所述FDR值<0.01时和(3)所述RNA关系对属于所述共表达关系对中的一种时,所述关系对确定为竞争性内源RNA调控关系对。
上述步骤(5)中所述构建异常样本相关的竞争性内源RNA调控关系网络为根据所述正常样本和异常样本的基因、lncRNA、circRNA、miRNA的差异表达情况,在所述竞争性内源RNA调控关系对中筛选得到与所述异常样本相关的RNA调控关系对。
优选地,所述异常样本相关的RNA调控关系对中至少一个RNA或基因是在所述正常样本和所述异常样本中差异表达,且与所述异常样本相关的RNA调控关系对结合的miRNA中至少一个miRNA是在所述正常样本和所述异常样本中差异表达。
上述步骤(5)中所述筛选与异常样本异常相关的关键基因为采用随机游走算法在异常样本相关的竞争性内源RNA调控关系网络中鉴定所述关键基因。
优选地,通过对所述调控关系网络中的每个节点进行重要性打分,将排在所有节点重要性打分的前5%或前10%的的节点定义为关键节点;若所述关键节点为基因则该基因鉴定为关键基因,若所述关键节点为lncRNA或者circRNA则将其靶基因鉴定为关键基因。
上述步骤(6)中所述筛选得到显著通路为筛选所述关键基因富集最显著的前5个或前10个通路。
在上述构建基因调控网络的方法的基础上,本发明还提供所述的构建基因调控网络的方法在分析基因相互作用关系、鉴定疾病相关关键基因或构建疾病相关关键基因调控网络中的应用。
本发明的有益效果在于,本发明提供的基于全转录组高通量测序构建关键基因调控网络的方法,在全转录组高通量测序数据的基础上,通过对差异表达的基因、lncRNA、circRNA及miRNA的筛选,基因、lncRNA与circRNA的共表达分析,miRNA结合靶点预测,构建疾病相关的竞争性内源RNA调控网络,根据随机游走算法筛选出调控网络中的关键基因,并通过通路富集分析确定关键基因显著富集的通路,结合通路的基因调控关系,分析关键基因在调控疾病过程中的生物学机理。本发明提供的复杂疾病相关关键基因的鉴定和调控网络的构建方法,为研究复杂疾病的发生发展机制提供了有力的工具。
附图说明
图1为本发明实施例1中基于全转录组高通量测序构建基因调控网络的方法的流程示意图。
图2为本发明实施例1中构建的疾病相关的关键基因调控网络示意图。
具体实施方式
下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
以下实施例中构建疾病相关关键基因的调控网络的方法的流程图如图1所示,具体包括如下步骤:
S101:对实验组和对照组样本进行全转录组高通量测序,获取实验组和对照组样本的全转录组数据,将正常样本作为对照组,将异常样本作为实验组;所述异常样本可以为复杂疾病样本。
S102:根据高通量测序数据获取已知的和预测的基因、lncRNA、circRNA及miRNA的表达水平,筛选在正常样本和异常样本中差异表达的RNA;分析RNA的表达相关性,筛选共表达关系对。
S103:获取每个已知的和预测的基因、lncRNA、circRNA及miRNA的序列信息,进行miRNA的lncRNA、circRNA、基因结合靶点预测;
S104:根据S102中筛选得到的共表达关系对和S103中miRNA结合的基因、lncRNA及circRNA的信息,筛选竞争性内源RNA调控关系对;
S105:根据S104获得的竞争性内源RNA调控关系对及S102获得的差异表达RNA的信息,筛选疾病相关的竞争性内源RNA调控网络中的关键基因;
S106:根据S105获得的疾病相关关键基因构建关键基因调控网络,分析关键基因调控复杂疾病的生物学机理。
实施例1全转录组测序数据联合分析构建疾病相关关键基因调控网络
本实施例采用6组人的全转录组测序数据进行本发明提供的疾病相关关键基因调控网络构建方法的验证。上述6组测序数据分别为3个乳腺癌患者的肿瘤组织和正常组织的测序数据。每组测序数据包括lncRNA测序数据和miRNA测序数据。其中,从lncRNA测序数据中可以获取样品的lncRNA,circRNA及基因的序列及表达量信息;从miRNA测序数据中可以获取样品的miRNA序列及表达量信息。
采用edgeR软件对疾病组和正常组的3个样品的lncRNA,circRNA、基因以及miRNA分别进行差异表达分析,以FC>2且FDR<0.05为筛选标准,共获得1403个差异表达基因,253个差异表达lncRNA,163个差异表达circRNA,96个差异表达的miRNA。
将lncRNA、circRNA和基因的表达水平进行皮尔森相关性分析,筛选相关性值的绝对值大于0.9且显著性值小于0.01的RNA关系对,共获得3,863,213个基因-lncRNA共表达关系对,1,840,568个基因-circRNA共表达关系对和3,414,332个circRNA-lncRNA共表达关系对。
根据miRNA与lncRNA、circRNA和基因mRNA的序列进行miRNA的结合位点预测,采用miranda和targetscan两款软件预测miRNA的结合位点,保留被两款软件同时预测具有结合位点的miRNA与circRNA、lncRNA或基因的关系对。共获得1,806,295个miRNA与基因关系对,408,797个miRNA与lncRNA关系对,447,193个miRNA与circRNA关系对。
在上述筛选得到的共表达关系对中进一步选择满足如下条件的关系对作为竞争性内源RNA(ceRNA)调控关系对:
(1)共表达关系对之间具有的共同结合的miRNA的数量≥5;
(2)共表达关系对之间进行超几何检验的FDR值小于0.01。
在上述得到的竞争性内源RNA调控关系对中筛选与疾病相关的ceRNA调控关系对,筛选标准为疾病相关的ceRNA调控关系对中至少一个是在疾病患者样本和非患病个体样本中差异表达,且与疾病相关的ceRNA调控关系对结合的miRNA中至少一个miRNA在非患病个体样本和疾病患者样本中差异表达。经筛选得到40,113个与疾病相关的竞争性内源RNA调控关系对,将其构建疾病相关的竞争性内源RNA调控关系网络,得到疾病相关的竞争性内源RNA调控关系网络共包含40,113个关系对,其中包括1726个基因、325个lncRNA和63个circRNA。
对上述构建的疾病相关的竞争性内源RNA调控关系网络进行随机游走,对调控关系网络中的每个节点进行重要性打分,将排在所有节点重要性打分的前5%的节点定义为关键节点,将关键节点中的基因及关键节点中lncRNA、circRNA的靶基因鉴定为关键基因,共获取调控网络中的关键基因524个,对这些基因进行功能注释和富集分析,发现这些基因主要注释在细胞循环等基本的生物学过程中。
对上述获得的关键基因进行通路富集分析,选择最显著的前5个通路(非小细胞肺癌,子宫内膜癌,p53信号通路,糖酵解/糖异生,肌醇磷酸代谢),整合通路中基因和基因的调控关系采用R软件的iGraph包或Cytoscape软件绘制疾病相关的关键基因调控网络(如图2所示),发现关键基因CCND1,FOXO3等都参与多个通路且影响多个基因,暗示了这些基因的表达水平改变可能影响疾病发生发展,在此基础上对关键基因的致病机理进行分析。
虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种基于全转录组测序构建基因调控网络的方法,其特征在于,包括如下步骤:
(1)获取正常样本和异常样本的全转录组测序数据,得到基因、lncRNA、circRNA和miRNA的表达水平数据;
(2)根据表达水平数据筛选获得正常样本和异常样本中差异表达的基因、lncRNA、circRNA和miRNA,以及基因、lncRNA和circRNA的共表达关系对;
(3)根据所述基因、lncRNA、circRNA和miRNA的序列预测miRNA结合位点;
(4)根据所述共表达关系对和所述miRNA结合位点的信息,筛选竞争性内源RNA调控关系对;
(5)根据竞争性内源RNA调控关系对和所述差异表达的信息,构建异常样本相关的竞争性内源RNA调控关系网络;根据所述竞争性内源RNA调控关系网络筛选与异常样本异常相关的关键基因;
(6)对所述竞争性内源RNA调控关系网络中的关键基因进行通路富集分析,筛选得到显著通路,根据所述显著通路中基因的调控关系构建所述异常相关的关键基因的调控网络。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中所述基因、lncRNA、circRNA和miRNA的表达水平数据包括已知的和预测的基因、lncRNA、circRNA和miRNA的表达水平数据。
3.根据权利要求1或2所述的方法,其特征在于,步骤(2)中所述筛选获得正常样本和异常样本中差异表达的基因、lncRNA、circRNA和miRNA的筛选参数为选自差异倍数FC、显著性pvalue和错误发现率FDR中的一种或多种;
优选地,当以FC为筛选参数时,差异表达的筛选标准为如下任意一种:FC≥2、FC≥1.5或FC≥1.2;当以pvalue为筛选参数时,差异表达的筛选标准为如下任意一种:pvalue<0.01、pvalue<0.05;当以FDR为筛选参数时,差异表达的筛选标准为如下任意一种:FDR<0.01、FDR<0.05或FDR<0.1。
4.根据权利要求1~3任一项所述的方法,其特征在于,步骤(2)中所述筛选获得基因、lncRNA和circRNA的共表达关系对为采用皮尔森相关系性分析,获得基因、lncRNA和circRNA表达水平之间的相关性值和显著性值,根据所述相关性值和显著性值进行筛选;
优选地,所述筛选的标准为如下任意一种:
(1)当所述关系对的相关性值的绝对值>0.9且显著性值<0.01时,所述关系对为共表达关系对;
(2)当所述关系对的相关性值的绝对值>0.8且显著性值<0.01时,所述关系对为共表达关系对;
(3)当所述关系对的相关性值的绝对值>0.7且显著性值<0.01时,所述关系对为共表达关系对;
(4)当所述关系对的相关性值的绝对值>0.9且显著性值<0.05时,所述关系对为共表达关系对;
(5)当所述关系对的相关性值的绝对值>0.8且显著性值<0.05时,所述关系对为共表达关系对;
(6)当所述关系对的相关性值的绝对值>0.7且显著性值<0.05时,所述关系对为共表达关系对。
5.根据权利要求1~4任一项所述的方法,其特征在于,步骤(3)中所述预测miRNA结合位点为采用至少两种miRNA结合位点预测软件,分别获得每种预测软件预测的miRNA的结合位点,分析预测结果,得到miRNA的调控靶点;
优选地,所述分析预测结果的判断标准为当所述基因、lncRNA或circRNA被所述采用的预测软件中的至少两种预测为miRNA的结合靶标时,所述基因、lncRNA或circRNA为所述miRNA的调控靶标;
更优选地,所述预测软件包括RNAhybrid、miranda、targetscan。
6.根据权利要求1~5任一项所述的方法,其特征在于,步骤(4)中所述筛选获得竞争性内源RNA调控关系对的筛选参数包括:
(1)lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对之间共同结合的miRNA的数量;
(2)lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对之间进行超几何分布检验校正后的FDR值;
(3)所述lncRNA-基因、circRNA-基因或lncRNA-circRNA组成的ceRNA调控关系对属于所述共表达关系对中的一种;
优选地,所述筛选参数的筛选标准选自如下任意一种:
(1)所述共同结合的miRNA的数量≥3且所述FDR值<0.01;
(2)所述共同结合的miRNA的数量≥5且所述FDR值<0.01;
(3)所述共同结合的miRNA的数量≥10且所述FDR值<0.01;
(4)所述共同结合的miRNA的数量≥3且所述FDR值<0.05;
(5)所述共同结合的miRNA的数量≥5且所述FDR值<0.05;
(6)所述共同结合的miRNA的数量≥10且所述FDR值<0.05。
7.根据权利要求1~6任一项所述的方法,其特征在于,步骤(5)中所述构建异常样本相关的竞争性内源RNA调控关系网络为根据所述正常样本和异常样本的基因、lncRNA、circRNA、miRNA的差异表达情况,在所述竞争性内源RNA调控关系对中筛选得到与所述异常样本相关的RNA调控关系对;
优选地,所述异常样本相关的RNA调控关系对中至少一个RNA或基因是在所述正常样本和所述异常样本中差异表达,且与所述异常样本相关的RNA调控关系对结合的miRNA中至少一个miRNA是在所述正常样本和所述异常样本中差异表达。
8.根据权利要求7所述的方法,其特征在于,步骤(5)中所述筛选与异常样本异常相关的关键基因为采用随机游走算法在异常样本相关的竞争性内源RNA调控关系网络中鉴定所述关键基因;
优选地,通过对所述调控关系网络中的每个节点进行重要性打分,将排在所有节点重要性打分的前5%或前10%的节点定义为关键节点;若所述关键节点为基因则该基因鉴定为关键基因,若所述关键节点为lncRNA或者circRNA则将其靶基因鉴定为关键基因。
9.根据权利要求8所述的方法,其特征在于,步骤(6)中所述筛选得到显著通路为筛选所述关键基因富集最显著的前5个或前10个通路。
10.权利要求1~9任一项所述的构建基因调控网络的方法在分析基因相互作用关系、鉴定疾病相关关键基因或构建疾病相关关键基因调控网络中的应用。
CN201811641406.2A 2018-12-29 2018-12-29 一种基于全转录组高通量测序构建基因调控网络的方法 Active CN109637588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811641406.2A CN109637588B (zh) 2018-12-29 2018-12-29 一种基于全转录组高通量测序构建基因调控网络的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811641406.2A CN109637588B (zh) 2018-12-29 2018-12-29 一种基于全转录组高通量测序构建基因调控网络的方法

Publications (2)

Publication Number Publication Date
CN109637588A true CN109637588A (zh) 2019-04-16
CN109637588B CN109637588B (zh) 2022-07-15

Family

ID=66054869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811641406.2A Active CN109637588B (zh) 2018-12-29 2018-12-29 一种基于全转录组高通量测序构建基因调控网络的方法

Country Status (1)

Country Link
CN (1) CN109637588B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428867A (zh) * 2019-07-30 2019-11-08 中国科学院心理研究所 一种人类大脑基因时空表达模式在线分析系统及其方法
CN110706748A (zh) * 2019-09-27 2020-01-17 广州基迪奥科技服务有限公司 一种竞争性内源rna网络调控分析系统和方法
CN110910958A (zh) * 2019-10-15 2020-03-24 平安科技(深圳)有限公司 基因定位方法、装置、计算机设备及存储介质
CN110993020A (zh) * 2019-11-01 2020-04-10 电子科技大学 一种miRNA海绵互作对的识别方法
CN111128299A (zh) * 2019-12-16 2020-05-08 南京邮电大学 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN111304293A (zh) * 2019-11-20 2020-06-19 广东医科大学附属医院 一种活化的嗜碱性粒细胞的表达谱及其构建方法和应用
CN111613268A (zh) * 2020-05-27 2020-09-01 中山大学 基于单细胞转录组数据的基因表达调控机制的确定方法
CN111816247A (zh) * 2020-07-19 2020-10-23 西北工业大学 一种基于双向校正的差异表达基因识别方法
CN111899788A (zh) * 2020-07-06 2020-11-06 李霞 一种非编码rna调控疾病风险靶通路的识别方法及系统
CN112201303A (zh) * 2019-07-08 2021-01-08 广州基迪奥科技服务有限公司 一种miRNA数据与转录组数据贯穿分析的方法及系统
CN112309496A (zh) * 2020-11-10 2021-02-02 西北工业大学 一种基于rna表达值和二级结构的相关性融合方法
CN113257354A (zh) * 2021-05-12 2021-08-13 广州万德基因医学科技有限公司 基于高通量实验数据挖掘进行关键rna功能挖掘的方法
CN113667769A (zh) * 2021-08-13 2021-11-19 河南农业大学 一种泡桐丛枝病相关基因网络分析方法
CN113921084A (zh) * 2021-12-13 2022-01-11 山东大学齐鲁医院 疾病相关非编码rna调控轴多维靶向预测方法及系统
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN115223657A (zh) * 2022-09-20 2022-10-21 吉林农业大学 一种药用植物转录调控图谱预测方法
CN115547417A (zh) * 2022-10-18 2022-12-30 南方医科大学南方医院 一种疾病lncRNA-转录因子-靶基因层级调控网络的构建方法和应用
CN117457068A (zh) * 2023-06-30 2024-01-26 上海睿璟生物科技有限公司 基于多组学的功能性生物标记物筛选方法、系统、终端及介质
CN117637031A (zh) * 2023-11-28 2024-03-01 北京泱深生物信息技术有限公司 一种基因调控网络重建方法、系统及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104032016A (zh) * 2014-06-12 2014-09-10 山东农业大学 一种鸡肠炎沙门氏菌感染相关microRNA的检测方法
CN105861716A (zh) * 2016-05-24 2016-08-17 张理义 一种用于抑郁症诊断的circRNA标志物、试剂盒及基因芯片
CN106202990A (zh) * 2016-07-11 2016-12-07 东南大学 一种环状rna的高通量芯片数据处理及分析流程控制方法
CN106367527A (zh) * 2016-11-17 2017-02-01 苏州大学附属第二医院 直肠癌放化疗疗效相关靶基因的鉴定
CN107516021A (zh) * 2017-08-03 2017-12-26 北京百迈客生物科技有限公司 一种基于高通量测序的数据分析方法
CN107937516A (zh) * 2017-12-18 2018-04-20 首都医科大学附属北京朝阳医院 一种环状rna标志物及其应用
CN108893539A (zh) * 2018-06-08 2018-11-27 中国农业科学院北京畜牧兽医研究所 猪肉质性状相关的circRNA及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104032016A (zh) * 2014-06-12 2014-09-10 山东农业大学 一种鸡肠炎沙门氏菌感染相关microRNA的检测方法
CN105861716A (zh) * 2016-05-24 2016-08-17 张理义 一种用于抑郁症诊断的circRNA标志物、试剂盒及基因芯片
CN106202990A (zh) * 2016-07-11 2016-12-07 东南大学 一种环状rna的高通量芯片数据处理及分析流程控制方法
CN106367527A (zh) * 2016-11-17 2017-02-01 苏州大学附属第二医院 直肠癌放化疗疗效相关靶基因的鉴定
CN107516021A (zh) * 2017-08-03 2017-12-26 北京百迈客生物科技有限公司 一种基于高通量测序的数据分析方法
CN107937516A (zh) * 2017-12-18 2018-04-20 首都医科大学附属北京朝阳医院 一种环状rna标志物及其应用
CN108893539A (zh) * 2018-06-08 2018-11-27 中国农业科学院北京畜牧兽医研究所 猪肉质性状相关的circRNA及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
何江洋等: ""胰腺癌特异性差异表达 lncRNA 相关的 ceRNA 调控网络的构建"", 《郑州大学学报(医学版)》 *
侯敏等: ""乳腺癌相关lncRNA-miRNA-mRNA 共表达及关键基因网络构建预测"", 《中华肿瘤防治杂志》 *
刘洋: ""人表皮干细胞 lncRNA 与 mRNA 差异表达相关性及其作为 ceRNA 的作用分析"", 《中国优秀博硕士学位论文全文数据库(硕士)医药卫生科技辑》 *
杨杰等: ""随机游走算法在疾病相关关系预测中的应用"", 《西南民族大学学报( 自然科学版)》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112201303A (zh) * 2019-07-08 2021-01-08 广州基迪奥科技服务有限公司 一种miRNA数据与转录组数据贯穿分析的方法及系统
CN110428867A (zh) * 2019-07-30 2019-11-08 中国科学院心理研究所 一种人类大脑基因时空表达模式在线分析系统及其方法
CN110428867B (zh) * 2019-07-30 2021-09-17 中国科学院心理研究所 一种人类大脑基因时空表达模式在线分析系统及其方法
CN110706748A (zh) * 2019-09-27 2020-01-17 广州基迪奥科技服务有限公司 一种竞争性内源rna网络调控分析系统和方法
CN110706748B (zh) * 2019-09-27 2022-05-17 广州基迪奥科技服务有限公司 一种竞争性内源rna网络调控分析系统和方法
CN110910958A (zh) * 2019-10-15 2020-03-24 平安科技(深圳)有限公司 基因定位方法、装置、计算机设备及存储介质
CN110910958B (zh) * 2019-10-15 2024-08-09 平安科技(深圳)有限公司 基因定位方法、装置、计算机设备及存储介质
CN110993020A (zh) * 2019-11-01 2020-04-10 电子科技大学 一种miRNA海绵互作对的识别方法
CN111304293A (zh) * 2019-11-20 2020-06-19 广东医科大学附属医院 一种活化的嗜碱性粒细胞的表达谱及其构建方法和应用
CN111128299A (zh) * 2019-12-16 2020-05-08 南京邮电大学 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN111613268A (zh) * 2020-05-27 2020-09-01 中山大学 基于单细胞转录组数据的基因表达调控机制的确定方法
CN111613268B (zh) * 2020-05-27 2023-02-24 中山大学 基于单细胞转录组数据的基因表达调控机制的确定方法
CN111899788A (zh) * 2020-07-06 2020-11-06 李霞 一种非编码rna调控疾病风险靶通路的识别方法及系统
CN111899788B (zh) * 2020-07-06 2023-08-18 李霞 一种非编码rna调控疾病风险靶通路的识别方法及系统
CN111816247A (zh) * 2020-07-19 2020-10-23 西北工业大学 一种基于双向校正的差异表达基因识别方法
CN112309496B (zh) * 2020-11-10 2021-11-23 西北工业大学 一种基于rna表达值和二级结构的相关性融合方法
CN112309496A (zh) * 2020-11-10 2021-02-02 西北工业大学 一种基于rna表达值和二级结构的相关性融合方法
CN113257354A (zh) * 2021-05-12 2021-08-13 广州万德基因医学科技有限公司 基于高通量实验数据挖掘进行关键rna功能挖掘的方法
CN113667769A (zh) * 2021-08-13 2021-11-19 河南农业大学 一种泡桐丛枝病相关基因网络分析方法
CN113921084A (zh) * 2021-12-13 2022-01-11 山东大学齐鲁医院 疾病相关非编码rna调控轴多维靶向预测方法及系统
CN114373502A (zh) * 2022-01-07 2022-04-19 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN114373502B (zh) * 2022-01-07 2022-12-06 吉林大学第一医院 一种基于甲基化的肿瘤数据分析系统
CN115223657A (zh) * 2022-09-20 2022-10-21 吉林农业大学 一种药用植物转录调控图谱预测方法
CN115547417A (zh) * 2022-10-18 2022-12-30 南方医科大学南方医院 一种疾病lncRNA-转录因子-靶基因层级调控网络的构建方法和应用
CN117457068A (zh) * 2023-06-30 2024-01-26 上海睿璟生物科技有限公司 基于多组学的功能性生物标记物筛选方法、系统、终端及介质
CN117457068B (zh) * 2023-06-30 2024-05-24 上海睿璟生物科技有限公司 基于多组学的功能性生物标记物筛选方法、系统、终端及介质
CN117637031A (zh) * 2023-11-28 2024-03-01 北京泱深生物信息技术有限公司 一种基因调控网络重建方法、系统及设备
CN117637031B (zh) * 2023-11-28 2024-06-04 北京泱深生物信息技术有限公司 一种基因调控网络重建方法、系统及设备

Also Published As

Publication number Publication date
CN109637588B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN109637588A (zh) 一种基于全转录组高通量测序构建基因调控网络的方法
Mu et al. Deciphering brain complexity using single-cell sequencing
Borisov et al. Quantitation of molecular pathway activation using RNA sequencing data
CN107516021B (zh) 一种基于高通量测序的数据分析方法
CN109536611A (zh) 基于核酸质谱技术检测人类肺癌相关基因突变的引物组、试剂盒及使用方法
CN109971862A (zh) C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法
Buzdin et al. Bioinformatics meets biomedicine: OncoFinder, a quantitative approach for interrogating molecular pathways using gene expression data
Jiang et al. Bioinformatics analysis discovers microtubular tubulin beta 6 class V (TUBB6) as a potential therapeutic target in glioblastoma
Chen et al. Specific glioma prognostic subtype distinctions based on DNA methylation patterns
Cheng et al. A signature of nine lncRNA methylated genes predicts survival in patients with glioma
Hu et al. Microarray meta-analysis identifies acute lung injury biomarkers in donor lungs that predict development of primary graft failure in recipients
Luo et al. Comprehensive analysis of LncRNA-mRNA expression profiles and the ceRNA network associated with pyroptosis in LPS-induced acute lung injury
Kayvanpour et al. microRNA neural networks improve diagnosis of acute coronary syndrome (ACS)
Covell et al. Bioinformatic analysis of patient-derived ASPS gene expressions and ASPL-TFE3 fusion transcript levels identify potential therapeutic targets
CN110004229A (zh) 多基因作为egfr单克隆抗体类药物耐药标志物的应用
Liu et al. ITLNI identified by comprehensive bioinformatic analysis as a hub candidate biological target in human epithelial ovarian cancer
Bi et al. Bioinformatics analysis of key genes and miRNAs associated with Stanford type A aortic dissection
CN112375832A (zh) 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法
Wu et al. Exploration of potential novel drug targets and biomarkers for small cell lung cancer by plasma proteome screening
Li et al. Application of computational biology to decode brain transcriptomes
CN111793692A (zh) 一种特征miRNA表达谱组合及肺鳞癌早期预测方法
Bian et al. Construction of survival-related co-expression modules and identification of potential prognostic biomarkers of osteosarcoma using WGCNA
Soler et al. Single-cell RNA profiling of glomerular cells in diabetic kidney: a step forward for understanding diabetic nephropathy
CN108779494B (zh) 选择由活性化合物诱导的特定效应的基于rna编辑的算法和体外方法
Huang et al. Identification of drug resistance associated ncRNAs based on comprehensive heterogeneous network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant