CN107918724A - 一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 - Google Patents
一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 Download PDFInfo
- Publication number
- CN107918724A CN107918724A CN201711168734.0A CN201711168734A CN107918724A CN 107918724 A CN107918724 A CN 107918724A CN 201711168734 A CN201711168734 A CN 201711168734A CN 107918724 A CN107918724 A CN 107918724A
- Authority
- CN
- China
- Prior art keywords
- analysis
- new
- liver cancer
- gene
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法,①基本分析:Intersize长度检验,比对信息统计,随机性实验检验图,数据的覆盖度、深度统计,②高级分析:基因优化,新的外显子,3'、5'UTR区识别,可变剪接,保留的内含子,跳过的外显子,可变第一外显子、可变最后外显子,可变剪接第一外显子、可变剪接最后外显子,互斥外显子,新基因或新转录本,预测新转录本的注释,进行表达量分析,差异表达分析,差异表达聚类分析,差异表达基因的功能注释分析GO功能注释富集分析,本发明采用临床样本对其进行定位定量的表达验证,寻找其与临床相关性的证据,评价临床价值,为肝癌发病学和肝癌机制研究提供新的线索。
Description
技术领域
本发明涉及基因转录组学和蛋白质组学领域,尤其是一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法。
背景技术
在生物学及医学研究中,很重要的一个领域是对生物系统和生命进程的结构、功能及调控的观察。但在过去的几百年间,生物学家一直关注于单个基因或蛋白质在生物系统内的表达变化和功能,而不能从全局的、整体的角度来研究生命体系的变化。随着医学的进步,人们发现很多疾病,特别是癌症的发生往往是多因素、多基因、多途径协同作用导致的。这就需要一个可以全面的、动态的、系统的研究生命体系的技术和手段,于是“组学”概念应运而生[3]。但随着人类基因组计划的完成,人们发现于仅仅从基因组学的角度无法完全正确预测基因转录过程中发生的剪切、拼接以及在翻译时开放阅读框架密码子的起始、终止位置和翻译后的各种修饰情况。
在基因表达研究中,广泛的基因分析可以对生理状态或者是一个细胞表型有关的基因进行系统监测,可以利用高通量分析在数据输出和获取数据快捷两方面的优势,对疾病过程中的功能候选基因进行鉴定。微阵列技术的成熟,使研究人员通过转录组测序研究,寻找感兴趣的标记基因。正如肿瘤基因表达对各种来源的组织和患者存活结果的相关性分析例子一样,通过微阵列技术进行的基因表达分析研究将在生物标记发现过程中继续扮演重要作用。
尽管微阵列的分析能力很强大,转录组学研究平台只包括那些适应生长条件变化细胞的转录物。大多数细胞内和细胞间的生物化学过程都会受到蛋白质-蛋白质或者其他蛋白质-底物相互作用的影响。蛋白质组水平的基因表达分析提供了一个快速的可控制生物合成的过程,其中大部分是由转录组学平台调控的。同时,转录组本身通过表达的蛋白质或者是细胞生化状态下其他的变化,进行反馈控制。
换句话说,基因表达不仅仅是从转录组到蛋白质组的单向流动,而是两者的相互连接。对这种功能调控的了解通常只限于特殊的信号途径,或者是新陈代谢途径。要了解转录组和蛋白质组之间的相互调控作用,需要对RNA和蛋白质的表达进行整体同步监测。
转录组学、蛋白质组学和生物信息学研究技术的进步为研究复杂生物系统开辟了崭新的途径,将三者连接到一起的整合研究可以揭示疾病发生时从基因携带的遗传信息转变为可辨别表型的整个过程中的异常,其采集的海量信息涵盖了疾病发病学和疾病机制中的关键功能节点,可用来鉴定肿瘤相关基因及其表达的蛋白质,使得数以千计的基因和蛋白质的分析成为可能,为探索早期发现、分类、评价预后的肿瘤标志物,以及选择更加有效、准确的肿瘤治疗靶位提供了可靠的保证。
新一代Ion proton测序仪采用半导体芯片技术,测序速度快,且具有极高的扩展性,通过专有的大规模并行半导体感应器,对DNA复制时产生的离子流实现直接和实时的检测。当试剂通过集成的流体通路进入芯片中,密布于芯片上的反应孔立即成为上百万个微反应体系。这种独特的流体体系、微体系机械设计和半导体的技术组合,使研究人员能够在2小时内获取从10Mb到1Gb以上的高精确度序列。此外,Ion Proton测序仪和Ion Reporter分析软件可在一台独立的服务器完成单个基因组的分析,打破了目前的数据分析瓶颈,大大降低了研究成本,提高了检测的速度和准确性,在科研和临床上均有很好的应用;到目前为止,在已发表的整合分析文章中,大多数LC-MS分析是与稳定同位素标记联合使用的,尤其是iTRAQ试剂。即便采用的技术不同,迄今为止公开发表的整合分析都指出了转录组学和蛋白组学的重要性。转录组学或蛋白组学通常只考虑调节系统和分解作用平衡态的净效应,实际上,出现的不一致性只是合成与降解两种替换过程中的一种反映,研究者对变化过程中的机制更感兴趣;此外,转录组学和蛋白组学分析要想整合成功,需要有效和精确的相互参考。研究人员需要灵活的定义自己的基因图谱,但也可能需要选择采用预定义的针对蛋白质的目标图,当新的基因组、转录组和蛋白组序列出现,研究人员需要及时注册更新,并且删除错误的信息。 生物信息学技术的发展使得肿瘤生物学过程中的基因转录、表达整个过程中的异常得以揭示,为肿瘤机制研究提供了线索。
本研究拟利用Ion Proton转录组测序和LC-MALDI差异蛋白组分析平台,开展肝癌生物学过程中的转录组和蛋白组学分析。通过构建肝癌大鼠模型,比较正常和肝癌组织中的基因转录和蛋白表达差异,对肝癌中转录组和蛋白组都出现异常的分子进行基因优化、可变剪接分析、新基因或新转录本筛选、表达量分析、差异表达分析、差异表达聚类分析和功能注释等生物信息学分析处理,筛选肝癌关键功能节点和肿瘤分子,并对其进行临床验证和临床价值评估。本研究将为肝癌发病学和肝癌机制研究提供新的线索。
肝癌生物学过程中转录组和蛋白组学的生物信息分析方法是该项研究中不可或缺的构成部分,本发明一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法的技术方案,经检索国内同行业未见相同。
发明内容
本发明的目的是提供一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法。
这种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法,
由以下步骤组成:
①基本分析:
a)Intersize长度检验;
b)比对信息统计;
c)随机性实验检验图;
d)数据的覆盖度、深度统计;
②高级分析:
a)基因优化;
. 新的外显子;
. 3'、5'UTR区识别;
b)可变剪接;
. 保留的内含子;
. 跳过的外显子;
. 可变第一外显子、可变最后外显子;
. 可变剪接第一外显子、可变剪接最后外显子;
. 互斥外显子;
c)新基因或新转录本;
d)预测新转录本的注释;
e)进行表达量分析;
f)差异表达分析;
g)差异表达聚类分析;
h)差异表达基因的功能注释分析(两个或以上样品):GO功能注释富集分析;KeggPathway功能富集分析,NR、swissprot、COG功能注释分析。
发明有益效果:
本发明采用临床样本对其进行定位定量的表达验证,寻找其与临床相关性的证据,评价临床价值,为肝癌发病学和肝癌机制研究提供新的线索。课题筛选的肝癌关键分子将为探索与早期发现、分类、评价预后相关的肝癌标志物,以及选择更加有效、准确的肝癌治疗靶位奠定研究基础。
具体实施方式
实施例:
由以下步骤组成:
①基本分析:
e)Intersize长度检验;
f)比对信息统计;
g)随机性实验检验图;
h)数据的覆盖度、深度统计;
②高级分析:
i)基因优化;
. 新的外显子;
. 3'、5'UTR区识别;
j)可变剪接;
. 保留的内含子;
. 跳过的外显子;
. 可变第一外显子、可变最后外显子;
. 可变剪接第一外显子、可变剪接最后外显子;
. 互斥外显子;
k)新基因或新转录本;
l)预测新转录本的注释;
m)进行表达量分析;
n)差异表达分析;
o)差异表达聚类分析;
p)差异表达基因的功能注释分析(两个或以上样品):GO功能注释富集分析;KeggPathway功能富集分析,NR、swissprot、COG功能注释分析。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (1)
1.一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法,其特征在于:由以下步骤组成:
①基本分析:
Intersize长度检验;
比对信息统计;
随机性实验检验图;
数据的覆盖度、深度统计;
②高级分析:
基因优化;
. 新的外显子;
. 3'、5'UTR区识别;
可变剪接;
. 保留的内含子;
. 跳过的外显子;
. 可变第一外显子、可变最后外显子;
. 可变剪接第一外显子、可变剪接最后外显子;
. 互斥外显子;
新基因或新转录本;
预测新转录本的注释;
进行表达量分析;
差异表达分析;
差异表达聚类分析;
差异表达基因的功能注释分析(两个或以上样品):GO功能注释富集分析;KeggPathway功能富集分析,NR、swissprot、COG功能注释分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711168734.0A CN107918724A (zh) | 2017-11-22 | 2017-11-22 | 一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711168734.0A CN107918724A (zh) | 2017-11-22 | 2017-11-22 | 一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107918724A true CN107918724A (zh) | 2018-04-17 |
Family
ID=61897594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711168734.0A Withdrawn CN107918724A (zh) | 2017-11-22 | 2017-11-22 | 一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107918724A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109949864A (zh) * | 2019-03-08 | 2019-06-28 | 广州基迪奥生物科技有限公司 | 一种转录组测序和蛋白组学测序数据的贯穿分析方法及系统 |
CN111690646A (zh) * | 2020-05-25 | 2020-09-22 | 北京合生基因科技有限公司 | 特异性启动子调控序列及其获得方法 |
CN112912961A (zh) * | 2018-05-23 | 2021-06-04 | 恩维萨基因学公司 | 用于分析可变剪接的系统和方法 |
CN113345526A (zh) * | 2021-03-22 | 2021-09-03 | 中山大学 | 肿瘤转录组多模式信息分析平台PipeOne及其构建方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105112569A (zh) * | 2015-09-14 | 2015-12-02 | 中国医学科学院病原生物学研究所 | 基于宏基因组学的病毒感染检测及鉴定方法 |
US20160370354A1 (en) * | 2011-03-25 | 2016-12-22 | Institute For Systems Biology | Cellular response assay for biofluid biomarker discovery and detection |
CN107058550A (zh) * | 2017-05-04 | 2017-08-18 | 上海东方肝胆外科医院 | 基于转录组测序技术用于早期肝癌诊断和预后评估的基因群及其应用 |
CN107103205A (zh) * | 2017-05-27 | 2017-08-29 | 湖北普罗金科技有限公司 | 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法 |
-
2017
- 2017-11-22 CN CN201711168734.0A patent/CN107918724A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160370354A1 (en) * | 2011-03-25 | 2016-12-22 | Institute For Systems Biology | Cellular response assay for biofluid biomarker discovery and detection |
CN105112569A (zh) * | 2015-09-14 | 2015-12-02 | 中国医学科学院病原生物学研究所 | 基于宏基因组学的病毒感染检测及鉴定方法 |
CN107058550A (zh) * | 2017-05-04 | 2017-08-18 | 上海东方肝胆外科医院 | 基于转录组测序技术用于早期肝癌诊断和预后评估的基因群及其应用 |
CN107103205A (zh) * | 2017-05-27 | 2017-08-29 | 湖北普罗金科技有限公司 | 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法 |
Non-Patent Citations (3)
Title |
---|
周冬虎 等: "组学时代的可变剪接研究进展", 《中国科学》 * |
王泳超: "γ-氨基丁酸(GABA)调控盐胁迫下玉米种子萌发和幼苗生长的机制", 《中国博士学位论文全文数据库 农业科技辑》 * |
莫金钢: "大豆抗旱突变体耐旱机理研究", 《中国博士学位论文全文数据库 农业科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112912961A (zh) * | 2018-05-23 | 2021-06-04 | 恩维萨基因学公司 | 用于分析可变剪接的系统和方法 |
CN109949864A (zh) * | 2019-03-08 | 2019-06-28 | 广州基迪奥生物科技有限公司 | 一种转录组测序和蛋白组学测序数据的贯穿分析方法及系统 |
CN111690646A (zh) * | 2020-05-25 | 2020-09-22 | 北京合生基因科技有限公司 | 特异性启动子调控序列及其获得方法 |
CN113345526A (zh) * | 2021-03-22 | 2021-09-03 | 中山大学 | 肿瘤转录组多模式信息分析平台PipeOne及其构建方法 |
CN113345526B (zh) * | 2021-03-22 | 2023-10-17 | 中山大学 | 肿瘤转录组多模式信息分析平台PipeOne及其构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12106826B2 (en) | Methods and systems for detecting sequence variants | |
Baxi et al. | Answer ALS, a large-scale resource for sporadic and familial ALS combining clinical and multi-omics data from induced pluripotent cell lines | |
EP3680347B1 (en) | Methods and systems for identifying disease-induced mutations | |
CN107828857A (zh) | 一种转录组测序及RNAseq数据分析方法 | |
US10600503B2 (en) | Systems medicine platform for personalized oncology | |
CN107918724A (zh) | 一种肝癌生物学过程中转录组和蛋白组学的生物信息分析方法 | |
CN106778073B (zh) | 一种评估肿瘤负荷变化的方法和系统 | |
Kumar et al. | Biomarkers of diseases in medicine | |
Wagner | How to translate DNA methylation biomarkers into clinical practice | |
Feltes et al. | Multi-approach bioinformatics analysis of curated omics data provides a gene expression panorama for multiple cancer types | |
CN107942073A (zh) | 一种转录组测序和基于iTRAQ联合LC‑MALDI的差异蛋白组学分析方法 | |
CN107832585A (zh) | 一种RNAseq数据分析方法 | |
CN107885974A (zh) | 一种肝癌生物学过程中的转录组和蛋白组学分析方法 | |
Hasmats et al. | Identification of candidate SNPs for drug induced toxicity from differentially expressed genes in associated tissues | |
Liu et al. | ITLNI identified by comprehensive bioinformatic analysis as a hub candidate biological target in human epithelial ovarian cancer | |
Vermeersch et al. | Single-cell RNA sequencing in yeast using the 10× Genomics chromium device | |
CN107831308A (zh) | 一种肝癌生物学过程中转录组和蛋白组学的免疫组化方法 | |
CN107904308A (zh) | 一种肝癌生物学过程中转录组和蛋白组学的rt‑pcr方法 | |
CN107860852A (zh) | 一种基于iTRAQ联合LC、MALDI的差异蛋白组学 | |
CN107875159A (zh) | 一种肝癌大鼠模型的建立方法 | |
CN107723355A (zh) | 一种转录组测序 | |
WO2023091316A1 (en) | Methods and systems for accurate genotyping of repeat polymorphisms | |
CN107904295A (zh) | 一种肝癌关键因子的临床验证和临床价值评估方法 | |
CN107942055A (zh) | 一种肝癌生物学过程中转录组和蛋白组学的elisa方法 | |
Emmert-Streib | Statistical diagnostics for cancer: analyzing high-dimensional data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180417 |
|
WW01 | Invention patent application withdrawn after publication |