CN113429464A - 一种基于泛癌表达谱筛选出的新型微肽及其应用 - Google Patents
一种基于泛癌表达谱筛选出的新型微肽及其应用 Download PDFInfo
- Publication number
- CN113429464A CN113429464A CN202110693039.6A CN202110693039A CN113429464A CN 113429464 A CN113429464 A CN 113429464A CN 202110693039 A CN202110693039 A CN 202110693039A CN 113429464 A CN113429464 A CN 113429464A
- Authority
- CN
- China
- Prior art keywords
- screening
- peptide
- micro
- cancer
- pan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 62
- 230000014509 gene expression Effects 0.000 title claims abstract description 49
- 201000011510 cancer Diseases 0.000 title claims abstract description 40
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 claims abstract description 102
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 55
- 229960003180 glutathione Drugs 0.000 claims abstract description 51
- 108010024636 Glutathione Proteins 0.000 claims abstract description 50
- 238000012216 screening Methods 0.000 claims abstract description 38
- 108020005198 Long Noncoding RNA Proteins 0.000 claims abstract description 31
- 201000007270 liver cancer Diseases 0.000 claims abstract description 26
- 208000014018 liver neoplasm Diseases 0.000 claims abstract description 26
- 230000004083 survival effect Effects 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000004393 prognosis Methods 0.000 claims abstract description 10
- 108010038807 Oligopeptides Proteins 0.000 claims abstract description 9
- 102000015636 Oligopeptides Human genes 0.000 claims abstract description 9
- 239000003814 drug Substances 0.000 claims abstract description 8
- 230000002401 inhibitory effect Effects 0.000 claims abstract description 6
- 238000010201 enrichment analysis Methods 0.000 claims description 12
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 12
- 210000001519 tissue Anatomy 0.000 claims description 12
- 238000011160 research Methods 0.000 claims description 9
- 108091026815 Competing endogenous RNA (CeRNA) Proteins 0.000 claims description 8
- 210000000349 chromosome Anatomy 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 5
- 210000003917 human chromosome Anatomy 0.000 claims description 5
- 230000037361 pathway Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 206010018338 Glioma Diseases 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000006916 protein interaction Effects 0.000 claims description 3
- 229940079593 drug Drugs 0.000 abstract description 3
- 230000004060 metabolic process Effects 0.000 description 11
- 230000007246 mechanism Effects 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108091070492 Homo sapiens miR-23a stem-loop Proteins 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 238000010837 poor prognosis Methods 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000010001 cellular homeostasis Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 108091007428 primary miRNA Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medicinal Chemistry (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Databases & Information Systems (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Gastroenterology & Hepatology (AREA)
- Software Systems (AREA)
- Biochemistry (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种基于泛癌表达谱筛选出的新型微肽、筛选方法及其在抑制肝癌药物中的应用。一种微肽AC078846‑aa的筛选方法,包括如下筛选步骤:S1、使用生物信息学数据库对谷光甘肽基因集的筛选;S2、对S1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的GLS;S3、肝癌中GLS的验证及ceRNA预测,筛选得到lncRNA AC078846并进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况;S4、对lncRNA AC078846编码得到微肽AC078846‑aa进行鉴定及功能分析。本发明为肝癌治疗提供了新的靶点。
Description
技术领域
本发明涉及生物医药技术领域,具体是一种基于泛癌表达谱筛选出的新型微肽、筛选方法及其在抑制肝癌药物中的应用。
背景技术
癌症研究的科学进展是以患者为中心的[Salamone JM,Lucas W,Brundage SB,Holloway JN,Stahl SM,Carbine NE,London M,Greenwood N,Goyes R,Chisholm DC.Promoting Scientist–Advocate Collaborations in Cancer Research:Why andHow.Cancer research 2018,78(20):5723-5728.]。在过去的十年,全基因组泛癌分析呈增长趋势。越来越多的科学家致力于研究癌症的机制,希望通过更新诊断和治疗方法来延长癌症患者的生存期。
泛癌研究日益被认为是全球范围内严重的公共卫生问题。癌症是由基因变化驱动的,大规模并行测序已在整个基因组范围内系统地记录了这种变异[Paczkowska M,Barenboim J,Sintupisut N,Fox NS,Zhu H,Abd-Rabbo D,Mee MW,Boutros PC,ReimandJ. Integrative pathway enrichment analysis of multivariate omics data.Naturecommunications 2020,11(1):1-16.]。
谷光甘肽基因集还可能对多种癌症形式的治疗耐药性相关。尽管对谷光甘肽家族在癌症中的研究非常广泛,但很难解释其在肿瘤中的双重功能。现有研究缺乏对泛癌中谷光甘肽基因集的系统研究,也缺乏对谷光甘肽基因集作为治疗潜在生物标志物的敏感性的研究。
微肽(micropeptide)是小的开放阅读框编码的小多肽[Vitorino R,Guedes S,Amado F,Santos M,Akimitsu N.The role ofmicropeptides in biology.Cellular andMolecular Life Sciences 2021:1-14.],长度小于100-150个氨基酸(amino acids,AA),也被称为微蛋白(microproteins)或小开放阅读框编码肽(short open reading frames,sORF-encoded peptides),也可用其基因组位置命名,其被证实可作用于维持细胞稳态[Sousa ME, Farkas MH.Micropeptide.PLoS Genetics 2018,14(12):e1007764.]。非编码RNA (circRNA、lncRNA和pri-miRNA)具有潜在的短开放阅读框,可以编码微肽,非编码RNA编码的短肽与肿瘤密切相关,可作为肿瘤的潜在预后标志物和治疗靶点。
基因集是指具有遗传特性的基因编码的集合,GSH是指谷胱甘肽的简称,lncRNA是长链非编码RNA的简称;ceRNA机制是指一种RNA间相互作用的新机制;GLS是谷光甘肽代谢基因的简称,谷光甘肽代谢基因GLS在肝癌中相对高表达会导致高风险; LIHC是肝癌的简称;GEPIA2是一个在线TCGA基因表达和生存分析的工具; smORFunction是一款预测小型开放阅读框架和微蛋白质功能的工具。MiPepid是一种通过机器学习的方法预测微肽的工具(MiPepid:MicroPeptide identification tool using machine learning。)
发明内容
发明目的:本发明提供一种基于泛癌表达谱筛选出的新型微肽、筛选方法及其在抑制肝癌药物中的应用,
技术方案:
一种基于泛癌表达谱筛选出的新型微肽,所述微肽由lncRNA AC078846编码得到的 AC078846-aa。
一种基于泛癌表达谱筛选出的微肽AC078846-aa在抑制肝癌药物中的应用。
一种微肽AC078846-aa的筛选方法,包括如下筛选步骤:
S1、使用生物信息学数据库对谷光甘肽基因集的筛选;
S2、对S1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的GLS;
S3、肝癌中GLS的验证及ceRNA预测,筛选得到lncRNA AC078846并进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况;
S4、对lncRNA AC078846编码得到微肽AC078846-aa进行鉴定及功能分析。
进一步的,所述S1包括如下步骤:
步骤1、结合MSigDB和WikiGene数据库对人源谷光甘肽基因集进行筛选;
步骤2、搜索pubmed数据库,收集谷光甘肽基因集在肿瘤及胶质瘤中的研究进展;
步骤3、使用STRING在线平台对谷光甘肽基因集进行PPI网络构建,获取蛋白互作信息,且结合功能富集分析。
进一步的,所述步骤3中功能富集分析采用KEGG/Reactome pathway和GO注释。
进一步的,所述S2包括如下步骤:
步骤A、下载TCGA数据库中泛癌的表达与临床数据,GEO数据库与GTEx数据库中正常组织的表达谱数据,分别提取每种肿瘤与正常组织的数据,处理并去除批次效应,计算每种肿瘤的显著差异表达基因,并提取谷光甘肽基因集在泛癌中的显著差异表达情况;
步骤B、用TCGA泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期;
步骤C、绘制Sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的GLS;
步骤D、筛选出在肝癌中既显著高表达又高风险预后不良的GLS。
进一步的,所述步骤A中计算每种肿瘤的显著差异表达基因中设置的计算条件为|logFC|>1,adjustedp-value<0.05;
所述步骤B中用TCGA泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期采用cox算法。
进一步的,所述S3包括如下步骤:
步骤a、联合lnCeVar分析器和multiMiR数据库进行GLS相关ceRNA的预测,筛选出关键lncRNA,所述关键lncRNA包括lncRNA AC078846;
步骤b、使用GEPIA2/EMBL-EBI/GEO对GLS和lncRNA AC078846进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况。
进一步的,所述S4包括如下步骤:
步骤Ⅰ、采用MiPepid进行lncRNA AC078846编码对微肽预测,得到微肽 AC078846-aa;
步骤Ⅱ、将预测的微肽AC078846-aa定位到人类染色体中,对与AC078846同染色体的微肽进行分析;
步骤Ⅲ、使用smORFunction对预测到的微肽AC078846-aa进行鉴定与功能富集分析。
有益效果:
1)本发明从泛癌角度鉴定谷光甘肽基因集在癌症中的作用,并为个性化癌症治疗提供新的靶点。
2)本发明通过生物信息学结合数据库分析,筛选鉴定了lncRNA编码的微肽AC078846-aa靶向肝癌中的谷光甘肽代谢基因GLS,阻断lncRNA AC078846/ hsa-miR-23a-3p/GLS的ceRNA机制,进而抑制肿瘤的发生发展,对肝癌具有临床药用价值。
附图说明
图1A是肿瘤中部分谷光甘肽代谢相关基因的Sankey图。
图1B是验证的ceRNA展示图。
图2是谷光甘肽代谢相关基因功能富集分析。
图3是lncRNAAC078846及其编码的微肽AC078846-aa和GLS的染色体定位图。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于实施例。
一种基于泛癌表达谱筛选出的新型微肽,所述微肽为由lncRNAAC078846编码得到的AC078846-aa。
一种基于泛癌表达谱筛选出的微肽AC078846-aa在抑制肝癌药物中的应用。
一种微肽AC078846-aa的筛选方法,包括如下筛选步骤:
S1、使用生物信息学数据库对谷光甘肽基因集的筛选;
S2、对S1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的GLS;
S3、肝癌中GLS的验证及ceRNA预测,筛选得到lncRNA AC078846并进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况;
S4、对lncRNA AC078846编码得到微肽AC078846-aa进行鉴定及功能分析。
所述S1包括如下步骤:
步骤1、结合MSigDB和WikiGene数据库对人源谷光甘肽基因集进行筛选;
步骤2、搜索pubmed数据库,收集谷光甘肽基因集在肿瘤及胶质瘤中的研究进展;
步骤3、使用STRING在线平台对谷光甘肽基因集进行PPI网络构建,获取蛋白互作信息,且结合功能富集分析,所述步骤3中功能富集分析采用KEGG/Reactome pathway 和GO注释。
所述S2包括如下步骤:
步骤A、下载TCGA数据库中泛癌的表达与临床数据,GEO数据库与GTEx数据库中正常组织的表达谱数据,分别提取每种肿瘤与正常组织的数据,处理并去除批次效应,计算每种肿瘤的显著差异表达基因,设置的计算条件为|logFC|>1,adjustedp-value <0.05;并提取谷光甘肽基因集在泛癌中的显著差异表达情况;
步骤B、用TCGA泛癌表达谱数据采用cox算法计算谷光甘肽基因集相关的患者总生存期;
步骤C、绘制Sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的GLS;
步骤D、筛选出在肝癌中既显著高表达又高风险预后不良的GLS。
所述S3包括如下步骤:
步骤a、联合lnCeVar分析器和multiMiR数据库进行GLS相关ceRNA的预测,筛选出关键lncRNA,所述关键lncRNA包括lncRNA AC078846;
步骤b、使用GEPIA2/EMBL-EBI/GEO对GLS和lncRNA AC078846进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况。
所述S4包括如下步骤:
步骤Ⅰ、采用MiPepid进行lncRNA AC078846编码对微肽预测,预测准确率probability>0.99,得到微肽AC078846-aa;
步骤Ⅱ、将预测的微肽AC078846-aa定位到人类染色体中,对与AC078846同染色体的微肽进行分析;
步骤Ⅲ、使用smORFunction对预测到的微肽AC078846-aa进行鉴定与功能富集分析。
图1A是肿瘤中部分谷光甘肽代谢相关基因的Sankey图,up&risky指显著上调且预后不良的谷光甘肽代谢基因,GLS在肝癌中显著高表达且预后不良。
图1B是验证的ceRNA展示图。图1B说明了经multiMiR包得到的已经实验验证过的ceRNA信息。lncRNAAC078846.1/hsa-miR-23a-3p/GLS的ceRNA机制如图所示。
图2是谷光甘肽代谢相关基因功能富集分析。图2说明了谷光甘肽代谢基因主要与哪些功能、通路密切相关,其中最显著相关的是代谢。
图3是lncRNAAC078846及其编码的微肽AC078846-aa和GLS的染色体定位图。图3中micropeptide AC078846.1是指微肽AC078846-aa。图3说明了lncRNA AC078846和微肽AC078846-aa及其预测的功能微肽均位于人类第七号染色体。
用TCGA泛癌表达谱数据采用cox算法计算谷光甘肽基因集相关的患者总生存期;绘制Sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的GLS;筛选出在肝癌中既显著高表达又高风险预后不良的GLS,如图1A所示。联合lnCeVar分析器和multiMiR数据库进行GLS 相关ceRNA的预测,筛选出关键lncRNA,所述关键lncRNA包括lncRNA AC078846 如图1B所示。采用MiPepid进行lncRNA AC078846编码对微肽预测,预测准确率 probability>0.99,得到微肽AC078846-aa;将预测的微肽AC078846-aa定位到人类染色体中,对与AC078846同染色体的微肽进行分析;使用smORFunction对预测到的微肽AC078846-aa进行鉴定与功能富集分析如图3所示。体现了微肽AC078846-aa靶向肝癌中的谷光甘肽代谢基因GLS,阻断lncRNAAC078846/hsa-miR-23a-3p/GLS的 ceRNA机制,进而抑制肿瘤的发生发展,说明了微肽AC078846-aa可以用于治疗肝癌药物。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
Claims (9)
1.一种基于泛癌表达谱筛选出的新型微肽,其特征在于,所述微肽由lncRNA AC078846编码得到的AC078846-aa。
2.一种基于泛癌表达谱筛选出的微肽AC078846-aa在抑制肝癌药物中的应用。
3.一种微肽AC078846-aa的筛选方法,其特征在于,包括如下筛选步骤:
S1、使用生物信息学数据库对谷光甘肽基因集的筛选;
S2、对S1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的GLS;
S3、肝癌中GLS的验证及ceRNA预测,筛选得到lncRNA AC078846并进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况;
S4、对lncRNA AC078846编码得到微肽AC078846-aa进行鉴定及功能分析。
4.如权利要求3所述的微肽AC078846-aa的筛选方法,其特征在于,所述S1包括如下步骤:
步骤1、结合MSigDB和WikiGene数据库对人源谷光甘肽基因集进行筛选;
步骤2、搜索pubmed数据库,收集谷光甘肽基因集在肿瘤及胶质瘤中的研究进展;
步骤3、使用STRING在线平台对谷光甘肽基因集进行PPI网络构建,获取蛋白互作信息,且结合功能富集分析。
5.如权利要求4所述的微肽AC078846-aa的筛选方法,其特征在于,所述步骤3中功能富集分析采用KEGG/Reactome pathway和GO注释。
6.如权利要求3所述的微肽AC078846-aa的筛选方法,其特征在于,所述S2包括如下步骤:
步骤A、下载TCGA数据库中泛癌的表达与临床数据,GEO数据库与GTEx数据库中正常组织的表达谱数据,分别提取每种肿瘤与正常组织的数据,处理并去除批次效应,计算每种肿瘤的显著差异表达基因,并提取谷光甘肽基因集在泛癌中的显著差异表达情况;
步骤B、用TCGA泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期;
步骤C、绘制Sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的GLS;
步骤D、筛选出在肝癌中既显著高表达又高风险预后不良的GLS。
7.如权利要求6所述的微肽AC078846-aa的筛选方法,其特征在于,所述步骤A中计算每种肿瘤的显著差异表达基因中设置的计算条件为|logFC|>1,adjustedp-value<0.05;
所述步骤B中用TCGA泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期采用cox算法。
8.如权利要求3所述的微肽AC078846-aa的筛选方法,其特征在于,所述S3包括如下步骤:
步骤a、联合lnCeVar分析器和multiMiR数据库进行GLS相关ceRNA的预测,筛选出关键lncRNA,所述关键lncRNA包括lncRNA AC078846;
步骤b、使用GEPIA2/EMBL-EBI/GEO对GLS和lncRNA AC078846进行验证,验证多数据库中LIHC与正常组织对比的显著差异表达情况。
9.如权利要求3所述的微肽AC078846-aa的筛选方法,其特征在于,所述S4包括如下步骤:
步骤Ⅰ、采用MiPepid进行lncRNA AC078846编码对微肽预测,得到微肽AC078846-aa;
步骤Ⅱ、将预测的微肽AC078846-aa定位到人类染色体中,对与AC078846同染色体的微肽进行分析;
步骤Ⅲ、使用smORFunction对预测到的微肽AC078846-aa进行鉴定与功能富集分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693039.6A CN113429464B (zh) | 2021-06-22 | 2021-06-22 | 一种基于泛癌表达谱筛选出的新型微肽及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693039.6A CN113429464B (zh) | 2021-06-22 | 2021-06-22 | 一种基于泛癌表达谱筛选出的新型微肽及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113429464A true CN113429464A (zh) | 2021-09-24 |
CN113429464B CN113429464B (zh) | 2022-02-18 |
Family
ID=77757162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110693039.6A Expired - Fee Related CN113429464B (zh) | 2021-06-22 | 2021-06-22 | 一种基于泛癌表达谱筛选出的新型微肽及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113429464B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114420200A (zh) * | 2022-01-19 | 2022-04-29 | 时代生物科技(深圳)有限公司 | 一种功能性肽的筛选方法 |
CN114550815A (zh) * | 2022-03-16 | 2022-05-27 | 皖南医学院第一附属医院(皖南医学院弋矶山医院) | 一种胶质母细胞瘤lncRNA编码微肽的功能预测与筛选方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109971862A (zh) * | 2019-02-14 | 2019-07-05 | 辽宁省肿瘤医院 | C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法 |
CN111128299A (zh) * | 2019-12-16 | 2020-05-08 | 南京邮电大学 | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 |
CN111748632A (zh) * | 2020-08-04 | 2020-10-09 | 广东省第二人民医院(广东省卫生应急医院) | 一种特征lincRNA表达谱组合及肝癌早期预测方法 |
CN112359110A (zh) * | 2020-10-29 | 2021-02-12 | 温州医科大学 | 一种胆管癌预后测定标志物、检测引物、试剂盒及应用 |
-
2021
- 2021-06-22 CN CN202110693039.6A patent/CN113429464B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109971862A (zh) * | 2019-02-14 | 2019-07-05 | 辽宁省肿瘤医院 | C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法 |
CN111128299A (zh) * | 2019-12-16 | 2020-05-08 | 南京邮电大学 | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 |
CN111748632A (zh) * | 2020-08-04 | 2020-10-09 | 广东省第二人民医院(广东省卫生应急医院) | 一种特征lincRNA表达谱组合及肝癌早期预测方法 |
CN112359110A (zh) * | 2020-10-29 | 2021-02-12 | 温州医科大学 | 一种胆管癌预后测定标志物、检测引物、试剂盒及应用 |
Non-Patent Citations (2)
Title |
---|
KUO-HAO HO,等: "Glycolysis-associated lncRNAs identify a subgroup of cancer patients with poor prognoses and a high-infiltration immune microenvironment", 《BMC MEDICINE》 * |
高健: "基于TCGA数据库的肝癌基因表达ARHGEF39在肝癌中表达模式及机制的研究", 《中国优秀博硕士学位论文全文数据库(博士)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114420200A (zh) * | 2022-01-19 | 2022-04-29 | 时代生物科技(深圳)有限公司 | 一种功能性肽的筛选方法 |
CN114550815A (zh) * | 2022-03-16 | 2022-05-27 | 皖南医学院第一附属医院(皖南医学院弋矶山医院) | 一种胶质母细胞瘤lncRNA编码微肽的功能预测与筛选方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113429464B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190164632A1 (en) | Drug indication and response prediction systems and method using ai deep learning based on convergence of different category data | |
CN113429464B (zh) | 一种基于泛癌表达谱筛选出的新型微肽及其应用 | |
US20140229495A1 (en) | Method for processing genomic data | |
US20170011168A1 (en) | Ancestral-specific reference genomes and uses in sequencing | |
CN116640847A (zh) | 癌症进化检测和诊断 | |
JP2014508994A5 (zh) | ||
WO2003009210A1 (en) | Methods of providing customized gene annotation reports | |
Chang | Clinical bioinformatics | |
Jain et al. | Artificial intelligence for precision medicine and better healthcare | |
Brusic et al. | Proteome informatics for cancer research: from molecules to clinic | |
Ahmad et al. | A review of genetic variant databases and machine learning tools for predicting the pathogenicity of breast cancer | |
Jain et al. | Basic aspects | |
CN115954045A (zh) | 一种肠癌个性化治疗决策方法、系统及含其的存储介质 | |
Ramesh et al. | Computer-aided drug designing–modality of diagnostic system | |
Shea et al. | Predicting mutational function using machine learning | |
Viveka et al. | Introduction to Bioinformatics | |
Sajjad et al. | Proteogenomics: new emerging technology | |
CN113053460A (zh) | 用于基因组和基因分析的系统和方法 | |
LaBaer | Genomics, proteomics, and the new paradigm in biomedical research | |
Lin et al. | Multi-tissue proteogenomic analysis for mechanistic toxicology studies in non-model species | |
Chuang et al. | A Novel Genome Optimization Tool for Chromosome-Level Assembly across Diverse Sequencing Techniques | |
CN113257354B (zh) | 基于高通量实验数据挖掘进行关键rna功能挖掘的方法 | |
Mahesh et al. | Bioinformatics for Oral Cancer: Current Insights and Advances | |
Pollock et al. | Bioinformatics in the drug discovery process | |
Sharma et al. | Protein sequence analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220218 |