CN103150487B - 一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 - Google Patents
一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 Download PDFInfo
- Publication number
- CN103150487B CN103150487B CN201210497419.3A CN201210497419A CN103150487B CN 103150487 B CN103150487 B CN 103150487B CN 201210497419 A CN201210497419 A CN 201210497419A CN 103150487 B CN103150487 B CN 103150487B
- Authority
- CN
- China
- Prior art keywords
- gene
- network
- regulation
- inosinicacid
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于动物育种学、发育生物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。该方法首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。本发明本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质—IMP合成关键酶在转录水平上的表达差异。为“优质鸡”的培育和产业发展提供理论依据。
Description
技术领域
本发明属于动物育种学、发育生物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。
背景技术
涉及肌苷酸(IMP)合成通路中分子调控机理方面,一般而言,在整个IMP合成通路中,特别是第一阶段形成咪唑五元环和第二阶段的形成嘧啶六元环的过程中,关键酶的调控是导致表达水平差异的主要原因。然而,在IMP合成途径的关键酶方面研究较少,通过地方鸡种肌苷酸含量相关候选基因SNP(singlenucleotidepolymorphism)筛查,发现腺苷琥珀酸裂解酶基因1(ADSL)位点可以作为肌肉IMP含量的辅助选择标记,甘氨酰胺核苷酸合成酶(GARS)、5-氨基咪唑核苷酸合成酶(AIRS)和甘氨酰胺核苷酸转甲基酶(GART)基因(GARS-AIRS-GART)合并基因型对鸡的肉质风味性状可进行标记辅助选择。并发现在白耳鸡的不同生长阶段(3,6,9,12和15周龄)不同组织中ADSL和GARS-AIRS-GARTmRNA都被检测到,并且在所有组织中表达量的变化趋势基本一致。ADSL在肝脏中的表达量最高,在大肠中表达量最低。GARS-AIRS-GART在肾脏中的表达量最高,在腿肌,心脏,大肠,小肠中的表达量也较高,在胸肌中表达量最低。另外,除ADSL,GARS-AIRS-GART外,PPAT、PAICS(AIRC)和AMPD也被证实在IMP表达水平差异方面起着调控作用。
综上,在IMP的表达差异方面,关键酶起着决定性作用,但由于IMP的合成涉及到多个关键酶及相应的纤连蛋白、粘附分子与细胞因子等,而且每个关键酶的调控存在互作关联,所以有必要对整个关键酶的调控体系和相互作用网络进行研究,即对DNA-蛋白质信息贮存与表达调控模式进行探讨。在此网络中,转录水平的基因表达调控网络由于目标明确,分析模式清晰,效果准确等优势,更能直接地反映遗传性状表达调控网络的效应,更好地帮助我们理解复杂的分子或细胞过程机理,倍受青睐,正逐渐成为国际热点研究课题。
就调控网络的构建问题,国内外学者均已经开展了大量相关研究工作。现有调控网络的实验资料主要来源于对大肠杆菌、酿酒酵母和线虫的调控网络的研究。有学者基于实验的基因组定位分析方法,构建了转录因子启动子结合网络,以此推导出调控网络。然而,定位分析实验方法只适用于特定的实验条件,在其它实验条件下,该方法可能失效。迄今为止,各种统计数据挖掘工具已经用于发现基因表达调控网络。其中普遍使用的有代表性的模型包括:①基于相关系数的网络模型。②基于条件概率的网络模型。它是一个用来描述一系列随机变量之间的条件独立性的一种方向性模型。③基于时间序列的网络模型。它是针对很多时间序列的基因芯片数据而开发的,包括动态贝叶斯网络模型和事件模型,需要设置很多参数。④根据基因扰动(GenePerturbation)数据来推导基因调控关系。为了避免计算复杂性问题,把基因表达数据、DNA序列和功能注释整合成一个可以理解的模型,以构建基因表达转录调控网络。此外,利用基因表达数据、启动子序列和转录因子结合位点数据来构建转录调控网络。这种方法需要假设数据满足正态分布,而这种假设还没有得到证实,导致所得结果的可信度不高。因此,针对具体的生物学事件,发展更加适用的基因调控网络构建方法是一项十分重要的研究工作。
本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针(公知),在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质—IMP合成关键酶在转录水平上的表达差异,意义在于:①探明IMP合成途径中关键酶之间的相互作用机理,明确调控网络模型(立体式网络或级联式网络);②通过不同模式网络的筛选,建立RNA介导的IMP的不同时空表达的网络调控模型,从分子水平上认识细胞、组织的功能;③我国具有丰富鸡品种遗传资源,这些资源是我国养鸡业可持续发展的基石,尤其是地方鸡种良好的肉品质、独特的风味将会成为未来市场竞争中新的支撑点。阐明适合我国地方鸡种主要风味物质-IMP的种间和时空表达差异的分子机理,为“优质鸡”的培育和产业发展提供理论依据。
发明内容
本发明的目的是构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型。
本发明是在如皋黄鸡基因芯片(本实验所用表达谱芯片是根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案和注释信息可在安捷伦公司的官方网站上中查询)数据的基础上,运用Perl语言和皮尔森系数方程求解相关基因间线性关系,结合Cytoscape和GO将影响肌肉组织中肌苷酸关键酶相关基因的网络调控图进行了分析,构建了影响IMP合成途径中关键酶基因网络调控图,以期探明肌肉组织中IMP合成途径中关键酶之间的相互作用机理。
本发明一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
本发明方法的具体步骤如下:
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片(本实验所用表达谱芯片是根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案和注释信息可在安捷伦公司的官方网站上中查询)中获得8个肌苷酸关键酶基因(公知)在6个时间点的表达数据,构成一个8*6的基因表达矩阵;
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵;
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向;
zk取-1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。
n个基因m个时间点的基因表达构成一个n×m的矩阵A=(xij)n×m,xij为第i个基因在时刻j的表达水平;
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s=(xi1,xi2,….,xim)、t=(xk1,xk2,…,kkm)的相关系数模型:
(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图;
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
其中,步骤(5)求解,构建网络图是:
1)、从原始的芯片数据中挑选有效基因数据;
2)、将有效数据上传至服务器运行计算;
3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90;
4)、构建genelist文件选择肌苷酸相关基因;
5)、导入Cytoscape生成调控网络图。
附图说明
图1:挑选有效基因的Perl语言
图2:将有效数据上传至服务器的Perl语言
图3:生成源文件的的Perl语言
图4a:肌苷酸关键酶相关基因的网络图,图中黄色点即代表肌苷酸关键酶相关基因
4b:肌苷酸关键酶相关基因的网络图,图中字母数字即代表探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一个基因
图5:相关系数大于等于0.75的肌苷酸基因及其相关基因的网络图
图6:相关系数大于等于0.80的肌苷酸基因及其相关基因的网络图
图7:相关系数大于等于0.85的肌苷酸基因及其相关基因的网络图
图8:相关系数大于等于0.90的肌苷酸基因及其相关基因的网络调控图
图9:基于基因芯片肌苷酸关键酶相关基因网络调控图
图10:基于KEGG肌苷酸关键酶相关基因网络调控图
图11:GO功能分类,图中不同颜色代表不同的生物功能过程
具体实施方式
1材料与方法
1.1材料
1.1.试验动物
实验鸡群的组建:全同胞如皋黄鸡家系,来自中国农业科学院家禽研究所国家地方禽种资源基因库保种群中,分别于2、4、6、8、10、12周龄时采取肌肉组织样2g左右,每周龄各6只(3♂,3♀),液氮中速冻,-70℃保存备用。
1.2基因芯片实验
将提出的肌肉RNA,利用Agilent表达谱芯片技术进行实验,以QuantArray3.0软件进行分析样点信噪比(signalnoiseratio,SNR)。用数据分析程序统计分析杂交后的每一关键酶基因、空白对照点平均SNR(mSNR),判定杂交信号的强弱。同时对原始荧光数据进行数据过滤,分别取基因表达荧光强度的log值,作为筛选差异表达基因的标准,按照标准化方程,对数据进行标准化。
1.3相关系数模型构建肌苷酸相关基因的网络调控图
基因调控网络模型筛选:运用基于相关系数的网络模型、基于条件概率的网络模型、基于时间序列的网络模型和基于基因扰动数据模型等模型的特点和适用范围,筛选出适合本研究的最佳模型。本研究利用熵对各基因赋权,在此基础之上建立整数非线性规划(integernonlinearprogramming,IN-LP)模型,辅以相关系数加以筛选判别,最终构建肌苷酸相关关键酶基因表达调控网络。
具体步骤:
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得8个肌苷酸关键酶基因(IMP合成参与的基因中有报道8个基因,是实验关注的中心,围绕这个8个基因展开分析,这个8个基因是:ADSL,GARS,AIRS,GART,GARS-AIRS-GART,PPAT,PAICS,AMPD)在6个时间点的表达数据,构成一个8*6的基因表达矩阵
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵。
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向。
zk取-1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。
n个基因m个时间点的基因表达构成一个n×m的矩阵A=(xij)n×m,xij为第i个基因在时刻j的表达水平。
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基
因的表达向量s=(xi1,xi2,….,xim)、t=(xk1,xk2,…,kkm)的相关系数模型:
(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图。具体步骤简单如下:1)、从原始的芯片数据中挑选有效基因数据,见图1;2)、将有效数据上传至服务器运行计算(time:2d),见图2;3)、将生成的源文件通过计算机语言寻找基因间的线性相关(相关系数分别设0.75、0.80、0.85、0.90),见图3;4)、构建genelist文件(选择肌苷酸相关基因),见表5;5)、导入Cytoscape生成调控网络图,见图4a、图4b)。
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
2结果
2.1相关系数求解基因线性相关及其网络图分析
运用Perl语言和皮尔森相关系数方程求解相关基因线性相关,我们分别得到相关系数大于等于0.75、0.80、0.85和0.90的相关基因列表,分别见表1,2,3,4。将相关基因列表导入Cytoscape软件,结合肌苷酸基因探针列表(表5),分别作出肌苷酸基因及其相关基因的网络图,详见图5、6、7、8。
表1相关系数大于等于0.75的部分基因
注:前两列为探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一基因名称。
表2相关系数大于等于0.80的部分基因
注:前两列为探针号,一个探针号代表一基因名称。
表3相关系数大于等于0.85的部分基因
注:前两列为探针号,一个探针号代表一基因名称。
表4相关系数大于等于0.90的部分基因
注:前两列为探针号,一个探针号代表一基因名称。
表5探针号和及其标注的肌苷酸关键酶基因
2.2肌苷酸相关基因网络调控的构建
在基因相关线性关系网络图的基础上,结合建立整数非线性规划模型,并分别基于芯片数据和KEGG数据库构建肌苷酸相关基因网络调控图,见图9(Genespring软件中生成),10。
(1)KEGGPathway分析:对于合并数据集网络,为了分析鸡肌肉肌苷酸关键酶相关基因的网络调控关系,我们运用KEGG中“PathwayMap”工具,结合KEGG数据库所做的分析显示两条途径分别是:(1)
(2)
(2)GO功能分类分析:GO构建了3个相对独立的本体论,其中,生物过程(biologicalprocess)、分子功能(molecularfunction)和细胞成分(cellularcomponent)是所有基因和基因产物的共有属性,本研究运用基因本体论对相互作用网络的拓扑结构进行了分析。Cytoscape-BINGO是应用于在生物过程中检测显著差异基因所占比例过。结合Cytoscape和GO将肌苷酸关键酶相关基因的网络调控图进行了功能分类,见图11,由于鸡肌肉生长发育往往由多基因控制,涉及到一系列基因的差异表达。
Claims (2)
1.一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于具体步骤如下:
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得8个肌苷酸关键酶基因在6个时间点的表达数据,构成一个8*6的基因表达矩阵;
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵;
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向;
st
k≠izk∈{-1,0,1}
zk取-1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用;
n个基因m个时间点的基因表达构成一个n×m的矩阵A=(xij)n×m,xij为第i个基因在时刻j的表达水平;
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s=(xi1,xi2,….,xim)、t=(xk1,xk2,…,xkm)的相关系数模型:
(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法建立肌苷酸关键酶相关基因的网络调控图;
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
2.根据权利要求1所述构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于步骤(5)求解,构建网络图的是:
1)、从原始的芯片数据中挑选有效基因数据;
2)、将有效数据上传至服务器运行计算;
3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90;
4)、构建genelist文件选择肌苷酸相关基因;
5)、导入Cytoscape生成调控网络图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210497419.3A CN103150487B (zh) | 2012-11-29 | 2012-11-29 | 一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210497419.3A CN103150487B (zh) | 2012-11-29 | 2012-11-29 | 一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103150487A CN103150487A (zh) | 2013-06-12 |
CN103150487B true CN103150487B (zh) | 2016-05-11 |
Family
ID=48548561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210497419.3A Active CN103150487B (zh) | 2012-11-29 | 2012-11-29 | 一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103150487B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893731A (zh) * | 2015-01-19 | 2016-08-24 | 大道安康(北京)科技发展有限公司 | 一种基因健康网络表达测定体系的构建方法 |
CN105740651B (zh) * | 2016-03-07 | 2018-05-22 | 吉林大学 | 一种特定癌症差异表达基因调控网络的构建方法 |
CN113257363B (zh) * | 2021-05-31 | 2023-12-08 | 福建傲农生物科技集团股份有限公司 | 一种系谱的校正方法及装置 |
CN113889180B (zh) * | 2021-09-30 | 2024-05-24 | 山东大学 | 一种基于动态网络熵的生物标记物识别方法与系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101583709A (zh) * | 2007-01-15 | 2009-11-18 | Cj第一制糖株式会社 | 产生肌苷的微生物以及使用其生产肌苷的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2422510C2 (ru) * | 2008-09-30 | 2011-06-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) | Способ получения пуриновых рибонуклеозидов и рибонуклеотидов |
-
2012
- 2012-11-29 CN CN201210497419.3A patent/CN103150487B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101583709A (zh) * | 2007-01-15 | 2009-11-18 | Cj第一制糖株式会社 | 产生肌苷的微生物以及使用其生产肌苷的方法 |
Non-Patent Citations (1)
Title |
---|
鸡肉IMP含量相关候选基因SNP筛查及其用于地方鸡种群体遗传结构分析的研究;季从亮;《中国优秀博硕士学位论文全文数据库(博士)农业科学辑》;20050915(第5期);第2页第2.1节第1行-第3页倒数第5行,第8页第2.5节第1行-第10页倒数第1行,第25页第1节第1行-第7行 * |
Also Published As
Publication number | Publication date |
---|---|
CN103150487A (zh) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qin et al. | The road to specialization in agricultural production: Evidence from rural China | |
Díaz-Gimeno et al. | Window of implantation transcriptomic stratification reveals different endometrial subsignatures associated with live birth and biochemical pregnancy | |
Marcano-Cedeño et al. | Feature selection using sequential forward selection and classification applying artificial metaplasticity neural network | |
EP3534281A1 (en) | Disease development determination device, disease development determination method, and disease development determination program | |
CN110957002B (zh) | 一种基于协同矩阵分解的药物靶点相互作用关系预测方法 | |
CN103150487B (zh) | 一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 | |
CN112820361B (zh) | 一种基于对抗模仿学习的药物分子生成方法 | |
CN108647489A (zh) | 一种筛选疾病药物靶标和靶标组合的方法及系统 | |
CN104156634B (zh) | 基于亚细胞定位特异性的关键蛋白质识别方法 | |
CN106055922A (zh) | 一种基于基因表达数据的混合网络基因筛选方法 | |
CN114927162A (zh) | 基于超图表征与狄利克雷分布的多组学关联表型预测方法 | |
CN110459264A (zh) | 基于梯度增强决策树预测环状rna与疾病相关性的方法 | |
Sinigaglia et al. | Distinct gene expression dynamics in developing and regenerating crustacean limbs | |
CN106874704A (zh) | 一种基于线性模型的基因共调控网络中关键调控子识别方法 | |
CN110428899A (zh) | 基于双随机游走重启动的多数据整合环状rna与疾病相关性预测方法 | |
Feng et al. | scTIM: seeking cell-type-indicative marker from single cell RNA-seq data by consensus optimization | |
Dimitrijević et al. | Rural tourism as a driver of the economic and rural development in the Republic of Serbia | |
Wu et al. | Bayesian binomial mixture models for estimating abundance in ecological monitoring studies | |
CN110400605A (zh) | 一种gpcr药物靶标的配体生物活性预测方法及其应用 | |
CN116313147A (zh) | 一种基于知识图注意力网络的抗癌药物协同预测方法 | |
CN105279388A (zh) | 多层云计算框架协同的孕龄新生儿脑病历集成约简方法 | |
CN107644678A (zh) | 一种基于网络推断算法预测微生物和疾病关系的方法 | |
Arandia et al. | Incorporating social and environmental indicators in technical and economic advisory programmes in livestock farming | |
Köhn | A review of multiobjective programming and its application in quantitative psychology | |
CN117408642B (zh) | 基于人工智能的乡村数字服务管理平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |