CN113096729B - 一种基于circRNA位置信息预测RNA结合蛋白的方法 - Google Patents

一种基于circRNA位置信息预测RNA结合蛋白的方法 Download PDF

Info

Publication number
CN113096729B
CN113096729B CN202110333465.9A CN202110333465A CN113096729B CN 113096729 B CN113096729 B CN 113096729B CN 202110333465 A CN202110333465 A CN 202110333465A CN 113096729 B CN113096729 B CN 113096729B
Authority
CN
China
Prior art keywords
circrna
file
sequence
bed
binding protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110333465.9A
Other languages
English (en)
Other versions
CN113096729A (zh
Inventor
洪林君
吴珍芳
蔡更元
臧旭鹏
刘德武
李紫聪
顾婷
徐铮
黄思秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN202110333465.9A priority Critical patent/CN113096729B/zh
Publication of CN113096729A publication Critical patent/CN113096729A/zh
Application granted granted Critical
Publication of CN113096729B publication Critical patent/CN113096729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。本发明基于circRNA染色体位置信息,得到circRNA同方向起始位置前100个碱基的染色体位置信息,然后在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,并进一步得到circRNA同方向前侧位置序列的motif;从已知数据库中下载已知蛋白质的motif的meme格式文件,将其与circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RNA结合蛋白。该方法能够批量预测circRNA的RBP,不受数量和物种的限制。

Description

一种基于circRNA位置信息预测RNA结合蛋白的方法
技术领域
本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。
背景技术
Circular RNA,简称为circRNA,被称作环状RNA,是具有共价闭环结构、既没有5’至3’极性、也没有聚腺苷酸化尾巴的非编码RNA,由前体mRNA反向剪接产生,需要典型的剪接体机制,且互补序列和特异性蛋白因子均可促进这种剪接。研究表明,circRNA普遍存在于各种组织和器官的发育中,参与一些特定生物学过程,包括转录调控、细胞之间的信息传递等,且在人类疾病的发生和发展中发挥重要作用。
RNA结合蛋白(RNA binding protein),简称为RBP,在RNA的转录后调控中起关键作用,可以通过与特定的顺式调控元件相互作用,组装核糖核蛋白复合物以结合RNA序列,影响靶标RNA的表达和功能。研究表明,在circRNA生命周期的各个阶段,包括circRNA的生成、转录后调控、功能执行、特定修饰和潜在的细胞外转运途径等生物学过程中都有RBP的参与,RBP可以通过与circRNA剪接起始侧翼序列相结合,从而调控circRNA的生成。
目前已知公开数据库中,只有circinteractome数据库能够预测circRNA的RBP,但由于其数据库的限制,一次最多只能输入20条circRNA,且只能预测具有公共circRNA ID的人类circRNA,这就对研究其他物种,例如猪、牛、羊等的科研工作者造成了极大的约束。随着高通量测序技术的不断进步,越来越多物种不同状态下的组织被测序处理,大量的circRNA被发现,由于这些新发现的circRNA没有公共的ID信息,且不属于人,只有基于测序获得的染色体位置信息,想要通过现有的数据库来预测获得这些circRNA的RBP几乎不可能。
发明内容
为了克服现有技术的不足和缺点,本发明的目的在于提供一种基于circRNA位置信息预测RNA结合蛋白的方法。
本发明的目的通过下述技术方案实现:
一种基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取待测样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息;基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件,命名为circRNA_location.bed;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件;该bed文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif(基序);
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件,然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RBP(RNA结合蛋白);
步骤(1)中所述的待测样本为组织、细胞或血液等样本;
步骤(1)中所述的提取待测样本总RNA优选使用TRIzol试剂或RNA提取试剂盒提取总RNA;
步骤(1)中所述的bed文件包含以下信息:
chrom、start、end、name、score、strand,其中,chrom代表circRNA所属染色体,start代表circRNA起始位置坐标,end代表circRNA终止位置坐标,name代表circRNA测序获得ID,score默认为0,strand代表circRNA在染色体上的方向,其中,+代表正链,-代表反链;
步骤(2)中所述的location_change.py文件的运行代码如下:
Figure BDA0002996387040000021
Figure BDA0002996387040000031
步骤(3)中所述的生物信息学软件bedtools的运行代码如下:
bedtools getfasta -fi X_genomic.fna -bed circRNA_flank_location.bed -s -name-fo circRNA_flank_sequence.fa
其中,X_genomic.fna:待测样本对应物种的参考基因组核苷酸序列文件,例如:可以为GCF_001704415.1_ARS1_genomic.fna(山羊参考基因组);
circRNA_flank_location.bed:circRNA同方向起始位置前100个碱基的位置信息文件;
-s:软件参数,考虑circRNA的方向性,即步骤(1)中bed文件中的第6列信息;
-name:使用bed文件中第4列name作为name;
circRNA_flank_sequence.fa:输出的序列文件名称;
步骤(4)中所述的生物信息学软件dreme的运行代码如下:
dreme -p circRNA_flank_sequence.fa -oc dreme_outDir -dna -eps
其中,circRNA_flank_sequence.fa:circRNA同方向前侧位置序列文件;
dreme_outDir:结果输出文件夹;
步骤(4)中所述的生物信息学软件dreme运行后,会得到一个文件夹,文件夹中包括一个网页文件,网页文件内可以很直观地展示预测得到的motif及这些motif的序列logo图;该软件还可以对获得的motif进行可靠性的评定,可根据p-value或e-value进行筛选得到需要的motif(例如:p值越小就越可靠,一般来说p<0.05即可认定为可靠的);
步骤(5)中所述的生物信息学软件tomtom的运行代码如下:
tomtom-oc tomtom_outDir./dreme_outDir/dreme.txt X1.meme
其中,tomtom_outDir:结果输出文件夹;
./dreme_outDir/dreme.txt:步骤(4)中获得的circRNA同方向前侧位置序列的motif信息文件;
X1.meme:数据库中下载已知蛋白质的motif的meme格式文件,例如可以为:JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme;
步骤(5)中所述的数据库可以为TRANSFAC数据库或JASPAR数据库(http://jaspar.genereg.net/),其中,JASPAR数据库包含9个不同的子库,可供查找的物种有脊椎动物、线虫、昆虫、真菌和植物等,其中的JASPAR CORE包含的信息源于已经实验证实的真核生物蛋白结合位点;
步骤(5)采用生物信息学软件tomtom进行比对、匹配后会得到一个文件夹,文件夹中包括一个网页文件,该网页文件可以很直观地看到预测的蛋白及其motif,同样可以根据p_value,e_value或q_value来筛选这些蛋白,该蛋白即为预测得到的circRNA的RBP;
本发明相对于现有技术具有如下的优点及效果:
(1)本发明提供了一种基于高通量测序得到circRNA位置信息并预测包括人在内各物种circRNA RBP的方法,该方法能够批量预测circRNA的RBP,不受数量的限制。
(2)本发明能够预测各个物种circRNA的RBP,不受物种的限制。
(3)本发明方法流程清晰,操作方便快捷。
附图说明
图1是本发明的流程图。
图2是circRNA位置坐标信息.bed文件示例图。
图3是location_change.py文件示例图。
图4是circRNA同方向起始位置前100个碱基位置信息.bed文件示例图。
图5是circRNA同方向起始位置前100个碱基信息.fa文件示例图。
图6是dreme获得的网页文件示例图。
图7是tomtom获得的网页文件示例图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
参见图1,本实施例提供了基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取组织、细胞或血液等样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息,基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件(如图2所示),命名为circRNA_location.bed。该文件共有6列,分别为chrom:circRNA所属染色体,start:circRNA起始位置坐标,end:circRNA终止位置坐标,name:circRNA测序获得ID,score:默认为0,strand:circRNA在染色体上的方向,其中,+代表正链,-代表反链;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件(如图4所示);该文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;其中,location_change.py文件的运行代码(图3)如下:
Figure BDA0002996387040000051
Figure BDA0002996387040000061
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件(如图5所示);其中,生物信息学软件bedtools的运行代码如下:
bedtools getfasta-fi GCF_001704415.1_ARS1_genomic.fna-bedcircRNA_flank_location.bed-s-name-fo circRNA_flank_sequence.fa
其中,GCF_001704415.1_ARS1_genomic.fna:待测样本对应物种的参考基因组核苷酸序列文件,本实施例以山羊参考基因组为例;
circRNA_flank_location.bed:circRNA同方向起始位置前100个碱基的位置信息文件;
-s:软件参数,考虑circRNA的方向性,即步骤(1)中bed文件中的第6列信息;
-name:使用bed文件中第4列name作为name;
circRNA_flank_sequence.fa:输出的序列文件名称;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif(基序),其中,该步骤会得到一个文件夹,文件夹中包括一个网页文件(如图6所示),该软件还可以对获得的motif进行可靠性的评定,可根据p-value或e-value进行筛选得到需要的motif(例如:p值越小就越可靠,一般来说p<0.05即可认定为可靠的),生物信息学软件dreme的运行代码如下:
dreme-p circRNA_flank_sequence.fa-oc dreme_outDir-dna-eps
其中,circRNA_flank_sequence.fa:circRNA同方向前侧位置序列文件;
dreme_outDir:结果输出文件夹;
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件(例如被熟知的JASPAR数据库(http://jaspar.genereg.net/),该数据库包含9个不同的子库,可供查找的物种有脊椎动物、线虫、昆虫、真菌和植物等,其中的JASPAR CORE包含的信息源于已经实验证实的真核生物蛋白结合位点),然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RBP(RNA结合蛋白);该步骤同样会得到一个文件夹,文件夹中包括一个网页文件(如图7所示),该网页文件可以很直观地看到预测的蛋白及其motif,同样可以进一步根据p_value、e_value或q_value来筛选这些蛋白质,筛选得到的蛋白即为预测得到的circRNA的RBP;其中,生物信息学软件tomtom的运行代码如下:
tomtom-oc tomtom_outDir./dreme_outDir/dreme.txtJASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme
其中,tomtom_outDir:结果输出文件夹;./dreme_outDir/dreme.txt:步骤(4)中获得的circRNA同方向前侧位置序列的motif信息文件;JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme:JASPAR CORE数据库下载的蛋白的motif文件,实例为JASPAR数据库中脊椎动物的蛋白motif文件。
实施例2
本实施例提供了以川中黑山羊为例,基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取川中黑山羊子宫内膜样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息,其他操作同实施例1步骤(1);
(2)同实施例1步骤(2);
(3)从NCBI上下载山羊参考基因组核苷酸序列文件(GCF_001704415.1_ARS1_genomic.fna),其他操作同实施例1步骤(3);
(4)具体操作同实施例1步骤(4),其中,经p-value筛选共获得15个motif;
(5)从JASPAR CORE数据库中下载已知蛋白质的motif的meme格式文件JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme,其他操作同实施例1步骤(5),经p-value筛选共获得140个RBP(包括RBP USF1等);
(6)为了验证本实施例中预测得到的山羊circRNA RBP的准确性,我们随机挑选预测得到的RBP USF1,并对已发表文献进行检索,发现USF1可以和HAS2-AS1的启动子区域(CTCAGGTGAT)结合来激活HAS2-AS1的转录,从而增强神经胶质瘤细胞的侵袭和迁移(WangJ,Gu J,You A et al.The transcription factor USF1 promotes glioma cellinvasion and migration by activating lncRNA HAS2-AS1.Biosci Rep.2020Aug 28;40(8):BSR20200487),侧面验证了本实施例中预测的RBP是可以和RNA结合以发挥特定功能的,也进一步证明了本发明提供的方法是可行的。
表1实施例2预测得到的140个RBP
名称 名称 名称 名称 名称 名称 名称
Ahr::Arnt Arnt ARNT::HIF1A ARNT2 Arntl Ascl2 Atf1
ATF6 ATOH1(var.2) BHLHA15(var.2) BHLHE22(var.2) BHLHE40 BHLHE41 CLOCK
CREB3 CREB3L1 Creb3l2 CREB3L4 E2F6 EGR1 EGR2
EGR3 EGR4 ETV1 ETV4 FERD3L FIGLA GABPA
GLI2 GLI3 GLIS1 GLIS2 GLIS3 GMEB2 GRHL2
HAND2 HES1 HES2 HES5 HES6 HES7 HEY1
HEY2 HIF1A IKZF1 INSM1 Klf1 KLF10 KLF11
Klf12 KLF14 KLF15 KLF16 KLF17 KLF2 KLF3
KLF4 KLF5 KLF6 KLF9 MAX MAX::MYC MAZ
MEIS2 MLX Mlxip MLXIPL MNT MSC MXI1
MYB MYC MYCN MYF5 MYF6 MYOD1 MYOG
MZF1 NEUROD1 NEUROG2(var.2) NHLH1 Npas2 OSR1 OSR2
PKNOX2 Plagl1 PRDM1 Ptf1a Ptf1a(var.2) Ptf1a(var.3) Rbpjl
RREB1 SCRT1 SCRT2 SNAI1 SNAI2 SNAI3 SOHLH2
Sox11 SP1 SP2 SP3 SP4 SP8 SP9
SREBF2(var.2) STAT1::STAT2 TBX15 Tcf12 Tcf21 TCF4 TFAP4
TFE3 TFEB TFEC TGIF1 TGIF2 USF1 USF2
VEZF1 Wt1 XBP1 ZBTB32 ZEB1 ZIC1 Zic1::Zic2
Zic2 ZIC5 ZNF148 ZNF263 Znf281 ZNF317 ZNF341
ZNF354C ZNF449 ZNF460 ZNF684 ZNF740 ZNF75D ZSCAN4
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (6)

1.一种基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于包含如下步骤:
(1)提取待测样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息;基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件,命名为circRNA_location.bed;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件;该bed文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件 circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif;
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件,然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RNA结合蛋白。
2.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的待测样本为组织、细胞或血液样本。
3.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的提取待测样本总RNA包括:使用TRIzol试剂或RNA提取试剂盒提取总RNA。
4.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的bed文件包含以下信息:
chrom、start、end、name、score、strand,其中,chrom代表circRNA所属染色体,start代表circRNA起始位置坐标,end代表circRNA终止位置坐标,name代表circRNA测序获得ID,score默认为0,strand代表circRNA在染色体上的方向,其中,+代表正链,-代表反链。
5.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(4)中所述的生物信息学软件dreme运行后,会得到一个文件夹,文件夹中包括一个网页文件;该软件对获得的motif进行可靠性的评定,根据p-value或e-value进行筛选得到需要的motif。
6.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(5)中所述的数据库包括:TRANSFAC数据库或JASPAR数据库。
CN202110333465.9A 2021-03-29 2021-03-29 一种基于circRNA位置信息预测RNA结合蛋白的方法 Active CN113096729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110333465.9A CN113096729B (zh) 2021-03-29 2021-03-29 一种基于circRNA位置信息预测RNA结合蛋白的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110333465.9A CN113096729B (zh) 2021-03-29 2021-03-29 一种基于circRNA位置信息预测RNA结合蛋白的方法

Publications (2)

Publication Number Publication Date
CN113096729A CN113096729A (zh) 2021-07-09
CN113096729B true CN113096729B (zh) 2022-03-18

Family

ID=76670411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110333465.9A Active CN113096729B (zh) 2021-03-29 2021-03-29 一种基于circRNA位置信息预测RNA结合蛋白的方法

Country Status (1)

Country Link
CN (1) CN113096729B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114550817B (zh) * 2022-01-25 2022-12-23 云南大学 基于多特征的ctcf介导染色质环预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2238656A1 (en) * 1998-05-22 1999-11-22 Universite De Montreal Mammalian staufen and use thereof
KR20160057003A (ko) * 2014-11-12 2016-05-23 인하대학교 산학협력단 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법
CN108319818A (zh) * 2018-02-07 2018-07-24 中国科学院生物物理研究所 一种预测影响长非编码rna生物学功能的snp位点的方法
CN111798921A (zh) * 2020-06-22 2020-10-20 武汉大学 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2166105A3 (en) * 2004-08-16 2010-04-14 CropDesign N.V. Plants having improved growth characteristics and method for making the same
WO2010109463A2 (en) * 2009-03-24 2010-09-30 Yeda Research And Development Co. Ltd. Methods of predicting pairability and secondary structures of rna molecules

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2238656A1 (en) * 1998-05-22 1999-11-22 Universite De Montreal Mammalian staufen and use thereof
KR20160057003A (ko) * 2014-11-12 2016-05-23 인하대학교 산학협력단 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법
CN108319818A (zh) * 2018-02-07 2018-07-24 中国科学院生物物理研究所 一种预测影响长非编码rna生物学功能的snp位点的方法
CN111798921A (zh) * 2020-06-22 2020-10-20 武汉大学 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
急性脑梗死合并2型糖尿病患者血清脂肪酸结合蛋白4的表达与临床预后的相关性研究;王全奎,蒋子贺,徐铮,尹昌浩,关利新;《世界复合医学》;20190831;第5卷(第8期);第13-17页 *
长链非编码RNA lnc-DC的生物信息学分析与验证;胡雪停,吴晓凤,徐祥;《基础医学与临床》;20201005(第10期);第24-30页 *

Also Published As

Publication number Publication date
CN113096729A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
Middleton et al. IRFinder: assessing the impact of intron retention on mammalian gene expression
Fizames et al. The Arabidopsis root transcriptome by serial analysis of gene expression. Gene identification using the genome sequence
Hoffmann et al. A multi-split mapping algorithm for circular RNA, splicing, trans-splicing and fusion detection
Bogu et al. Chromatin and RNA maps reveal regulatory long noncoding RNAs in mouse
Lin et al. Analysis of soybean long non-coding RNAs reveals a subset of small peptide-coding transcripts
Hudson et al. Identification of promoter motifs involved in the network of phytochrome A-regulated gene expression by combined analysis of genomic sequence and microarray data
Polyak et al. Gene discovery using the serial analysis of gene expression technique: implications for cancer research
US20170002319A1 (en) Master Transcription Factors Identification and Use Thereof
Gerbasi et al. The Myotonic Dystrophy Type 2 Protein ZNF9 Is Part of an ITAF Complex That Promotes Cap-independent Translation* S
Chen et al. A dynamic Bayesian network for identifying protein-binding footprints from single molecule-based sequencing data
Kim et al. Peeling back the evolutionary layers of molecular mechanisms responsive to exercise-stress in the skeletal muscle of the racing horse
Ross et al. Uncovering deeply conserved motif combinations in rapidly evolving noncoding sequences
CN113096729B (zh) 一种基于circRNA位置信息预测RNA结合蛋白的方法
Sætrom et al. Predicting non-coding RNA genes in Escherichia coli with boosted genetic programming
Prensner et al. Transcriptome sequencing identifies PCAT-1, a novel lincRNA implicated in prostate cancer progression
Kikuchi et al. Bayesian identification of candidate transcription factors for the regulation of Aqp2 gene expression
Szcześniak et al. Towards a deeper annotation of human lncRNAs
Choi et al. mirRICH, a simple method to enrich the small RNA fraction from over-dried RNA pellets
Sharma et al. Methods for annotation and validation of circular RNAs from RNAseq data
Gomes et al. Novel transcription factors in human CD34 antigen–positive hematopoietic cells
Schmitz et al. Web resources for microRNA research
Saha et al. Site-specific phosphorylation of histone H1. 4 is associated with transcription activation
Herman et al. Research resource: A genome-wide study identifies potential new target genes for POU1F1
Islakoğlu et al. hsa-miR-301a-and SOX10-dependent miRNA-TF-mRNA regulatory circuits inbreast cancer
Ahmed et al. Functional role of hub molecules in miRNA and transcription factor mediated gene regulatory network of colorectal and lung cancer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant