CN113096729B - 一种基于circRNA位置信息预测RNA结合蛋白的方法 - Google Patents
一种基于circRNA位置信息预测RNA结合蛋白的方法 Download PDFInfo
- Publication number
- CN113096729B CN113096729B CN202110333465.9A CN202110333465A CN113096729B CN 113096729 B CN113096729 B CN 113096729B CN 202110333465 A CN202110333465 A CN 202110333465A CN 113096729 B CN113096729 B CN 113096729B
- Authority
- CN
- China
- Prior art keywords
- circrna
- file
- sequence
- bed
- binding protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。本发明基于circRNA染色体位置信息,得到circRNA同方向起始位置前100个碱基的染色体位置信息,然后在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,并进一步得到circRNA同方向前侧位置序列的motif;从已知数据库中下载已知蛋白质的motif的meme格式文件,将其与circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RNA结合蛋白。该方法能够批量预测circRNA的RBP,不受数量和物种的限制。
Description
技术领域
本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。
背景技术
Circular RNA,简称为circRNA,被称作环状RNA,是具有共价闭环结构、既没有5’至3’极性、也没有聚腺苷酸化尾巴的非编码RNA,由前体mRNA反向剪接产生,需要典型的剪接体机制,且互补序列和特异性蛋白因子均可促进这种剪接。研究表明,circRNA普遍存在于各种组织和器官的发育中,参与一些特定生物学过程,包括转录调控、细胞之间的信息传递等,且在人类疾病的发生和发展中发挥重要作用。
RNA结合蛋白(RNA binding protein),简称为RBP,在RNA的转录后调控中起关键作用,可以通过与特定的顺式调控元件相互作用,组装核糖核蛋白复合物以结合RNA序列,影响靶标RNA的表达和功能。研究表明,在circRNA生命周期的各个阶段,包括circRNA的生成、转录后调控、功能执行、特定修饰和潜在的细胞外转运途径等生物学过程中都有RBP的参与,RBP可以通过与circRNA剪接起始侧翼序列相结合,从而调控circRNA的生成。
目前已知公开数据库中,只有circinteractome数据库能够预测circRNA的RBP,但由于其数据库的限制,一次最多只能输入20条circRNA,且只能预测具有公共circRNA ID的人类circRNA,这就对研究其他物种,例如猪、牛、羊等的科研工作者造成了极大的约束。随着高通量测序技术的不断进步,越来越多物种不同状态下的组织被测序处理,大量的circRNA被发现,由于这些新发现的circRNA没有公共的ID信息,且不属于人,只有基于测序获得的染色体位置信息,想要通过现有的数据库来预测获得这些circRNA的RBP几乎不可能。
发明内容
为了克服现有技术的不足和缺点,本发明的目的在于提供一种基于circRNA位置信息预测RNA结合蛋白的方法。
本发明的目的通过下述技术方案实现:
一种基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取待测样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息;基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件,命名为circRNA_location.bed;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件;该bed文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif(基序);
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件,然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RBP(RNA结合蛋白);
步骤(1)中所述的待测样本为组织、细胞或血液等样本;
步骤(1)中所述的提取待测样本总RNA优选使用TRIzol试剂或RNA提取试剂盒提取总RNA;
步骤(1)中所述的bed文件包含以下信息:
chrom、start、end、name、score、strand,其中,chrom代表circRNA所属染色体,start代表circRNA起始位置坐标,end代表circRNA终止位置坐标,name代表circRNA测序获得ID,score默认为0,strand代表circRNA在染色体上的方向,其中,+代表正链,-代表反链;
步骤(2)中所述的location_change.py文件的运行代码如下:
步骤(3)中所述的生物信息学软件bedtools的运行代码如下:
bedtools getfasta -fi X_genomic.fna -bed circRNA_flank_location.bed -s -name-fo circRNA_flank_sequence.fa
其中,X_genomic.fna:待测样本对应物种的参考基因组核苷酸序列文件,例如:可以为GCF_001704415.1_ARS1_genomic.fna(山羊参考基因组);
circRNA_flank_location.bed:circRNA同方向起始位置前100个碱基的位置信息文件;
-s:软件参数,考虑circRNA的方向性,即步骤(1)中bed文件中的第6列信息;
-name:使用bed文件中第4列name作为name;
circRNA_flank_sequence.fa:输出的序列文件名称;
步骤(4)中所述的生物信息学软件dreme的运行代码如下:
dreme -p circRNA_flank_sequence.fa -oc dreme_outDir -dna -eps
其中,circRNA_flank_sequence.fa:circRNA同方向前侧位置序列文件;
dreme_outDir:结果输出文件夹;
步骤(4)中所述的生物信息学软件dreme运行后,会得到一个文件夹,文件夹中包括一个网页文件,网页文件内可以很直观地展示预测得到的motif及这些motif的序列logo图;该软件还可以对获得的motif进行可靠性的评定,可根据p-value或e-value进行筛选得到需要的motif(例如:p值越小就越可靠,一般来说p<0.05即可认定为可靠的);
步骤(5)中所述的生物信息学软件tomtom的运行代码如下:
tomtom-oc tomtom_outDir./dreme_outDir/dreme.txt X1.meme
其中,tomtom_outDir:结果输出文件夹;
./dreme_outDir/dreme.txt:步骤(4)中获得的circRNA同方向前侧位置序列的motif信息文件;
X1.meme:数据库中下载已知蛋白质的motif的meme格式文件,例如可以为:JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme;
步骤(5)中所述的数据库可以为TRANSFAC数据库或JASPAR数据库(http://jaspar.genereg.net/),其中,JASPAR数据库包含9个不同的子库,可供查找的物种有脊椎动物、线虫、昆虫、真菌和植物等,其中的JASPAR CORE包含的信息源于已经实验证实的真核生物蛋白结合位点;
步骤(5)采用生物信息学软件tomtom进行比对、匹配后会得到一个文件夹,文件夹中包括一个网页文件,该网页文件可以很直观地看到预测的蛋白及其motif,同样可以根据p_value,e_value或q_value来筛选这些蛋白,该蛋白即为预测得到的circRNA的RBP;
本发明相对于现有技术具有如下的优点及效果:
(1)本发明提供了一种基于高通量测序得到circRNA位置信息并预测包括人在内各物种circRNA RBP的方法,该方法能够批量预测circRNA的RBP,不受数量的限制。
(2)本发明能够预测各个物种circRNA的RBP,不受物种的限制。
(3)本发明方法流程清晰,操作方便快捷。
附图说明
图1是本发明的流程图。
图2是circRNA位置坐标信息.bed文件示例图。
图3是location_change.py文件示例图。
图4是circRNA同方向起始位置前100个碱基位置信息.bed文件示例图。
图5是circRNA同方向起始位置前100个碱基信息.fa文件示例图。
图6是dreme获得的网页文件示例图。
图7是tomtom获得的网页文件示例图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
参见图1,本实施例提供了基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取组织、细胞或血液等样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息,基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件(如图2所示),命名为circRNA_location.bed。该文件共有6列,分别为chrom:circRNA所属染色体,start:circRNA起始位置坐标,end:circRNA终止位置坐标,name:circRNA测序获得ID,score:默认为0,strand:circRNA在染色体上的方向,其中,+代表正链,-代表反链;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件(如图4所示);该文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;其中,location_change.py文件的运行代码(图3)如下:
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件(如图5所示);其中,生物信息学软件bedtools的运行代码如下:
bedtools getfasta-fi GCF_001704415.1_ARS1_genomic.fna-bedcircRNA_flank_location.bed-s-name-fo circRNA_flank_sequence.fa
其中,GCF_001704415.1_ARS1_genomic.fna:待测样本对应物种的参考基因组核苷酸序列文件,本实施例以山羊参考基因组为例;
circRNA_flank_location.bed:circRNA同方向起始位置前100个碱基的位置信息文件;
-s:软件参数,考虑circRNA的方向性,即步骤(1)中bed文件中的第6列信息;
-name:使用bed文件中第4列name作为name;
circRNA_flank_sequence.fa:输出的序列文件名称;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif(基序),其中,该步骤会得到一个文件夹,文件夹中包括一个网页文件(如图6所示),该软件还可以对获得的motif进行可靠性的评定,可根据p-value或e-value进行筛选得到需要的motif(例如:p值越小就越可靠,一般来说p<0.05即可认定为可靠的),生物信息学软件dreme的运行代码如下:
dreme-p circRNA_flank_sequence.fa-oc dreme_outDir-dna-eps
其中,circRNA_flank_sequence.fa:circRNA同方向前侧位置序列文件;
dreme_outDir:结果输出文件夹;
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件(例如被熟知的JASPAR数据库(http://jaspar.genereg.net/),该数据库包含9个不同的子库,可供查找的物种有脊椎动物、线虫、昆虫、真菌和植物等,其中的JASPAR CORE包含的信息源于已经实验证实的真核生物蛋白结合位点),然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RBP(RNA结合蛋白);该步骤同样会得到一个文件夹,文件夹中包括一个网页文件(如图7所示),该网页文件可以很直观地看到预测的蛋白及其motif,同样可以进一步根据p_value、e_value或q_value来筛选这些蛋白质,筛选得到的蛋白即为预测得到的circRNA的RBP;其中,生物信息学软件tomtom的运行代码如下:
tomtom-oc tomtom_outDir./dreme_outDir/dreme.txtJASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme
其中,tomtom_outDir:结果输出文件夹;./dreme_outDir/dreme.txt:步骤(4)中获得的circRNA同方向前侧位置序列的motif信息文件;JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme:JASPAR CORE数据库下载的蛋白的motif文件,实例为JASPAR数据库中脊椎动物的蛋白motif文件。
实施例2
本实施例提供了以川中黑山羊为例,基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取川中黑山羊子宫内膜样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息,其他操作同实施例1步骤(1);
(2)同实施例1步骤(2);
(3)从NCBI上下载山羊参考基因组核苷酸序列文件(GCF_001704415.1_ARS1_genomic.fna),其他操作同实施例1步骤(3);
(4)具体操作同实施例1步骤(4),其中,经p-value筛选共获得15个motif;
(5)从JASPAR CORE数据库中下载已知蛋白质的motif的meme格式文件JASPAR2020_CORE_Vertebrates_non-redundant_pfms.meme,其他操作同实施例1步骤(5),经p-value筛选共获得140个RBP(包括RBP USF1等);
(6)为了验证本实施例中预测得到的山羊circRNA RBP的准确性,我们随机挑选预测得到的RBP USF1,并对已发表文献进行检索,发现USF1可以和HAS2-AS1的启动子区域(CTCAGGTGAT)结合来激活HAS2-AS1的转录,从而增强神经胶质瘤细胞的侵袭和迁移(WangJ,Gu J,You A et al.The transcription factor USF1 promotes glioma cellinvasion and migration by activating lncRNA HAS2-AS1.Biosci Rep.2020Aug 28;40(8):BSR20200487),侧面验证了本实施例中预测的RBP是可以和RNA结合以发挥特定功能的,也进一步证明了本发明提供的方法是可行的。
表1实施例2预测得到的140个RBP
名称 | 名称 | 名称 | 名称 | 名称 | 名称 | 名称 |
Ahr::Arnt | Arnt | ARNT::HIF1A | ARNT2 | Arntl | Ascl2 | Atf1 |
ATF6 | ATOH1(var.2) | BHLHA15(var.2) | BHLHE22(var.2) | BHLHE40 | BHLHE41 | CLOCK |
CREB3 | CREB3L1 | Creb3l2 | CREB3L4 | E2F6 | EGR1 | EGR2 |
EGR3 | EGR4 | ETV1 | ETV4 | FERD3L | FIGLA | GABPA |
GLI2 | GLI3 | GLIS1 | GLIS2 | GLIS3 | GMEB2 | GRHL2 |
HAND2 | HES1 | HES2 | HES5 | HES6 | HES7 | HEY1 |
HEY2 | HIF1A | IKZF1 | INSM1 | Klf1 | KLF10 | KLF11 |
Klf12 | KLF14 | KLF15 | KLF16 | KLF17 | KLF2 | KLF3 |
KLF4 | KLF5 | KLF6 | KLF9 | MAX | MAX::MYC | MAZ |
MEIS2 | MLX | Mlxip | MLXIPL | MNT | MSC | MXI1 |
MYB | MYC | MYCN | MYF5 | MYF6 | MYOD1 | MYOG |
MZF1 | NEUROD1 | NEUROG2(var.2) | NHLH1 | Npas2 | OSR1 | OSR2 |
PKNOX2 | Plagl1 | PRDM1 | Ptf1a | Ptf1a(var.2) | Ptf1a(var.3) | Rbpjl |
RREB1 | SCRT1 | SCRT2 | SNAI1 | SNAI2 | SNAI3 | SOHLH2 |
Sox11 | SP1 | SP2 | SP3 | SP4 | SP8 | SP9 |
SREBF2(var.2) | STAT1::STAT2 | TBX15 | Tcf12 | Tcf21 | TCF4 | TFAP4 |
TFE3 | TFEB | TFEC | TGIF1 | TGIF2 | USF1 | USF2 |
VEZF1 | Wt1 | XBP1 | ZBTB32 | ZEB1 | ZIC1 | Zic1::Zic2 |
Zic2 | ZIC5 | ZNF148 | ZNF263 | Znf281 | ZNF317 | ZNF341 |
ZNF354C | ZNF449 | ZNF460 | ZNF684 | ZNF740 | ZNF75D | ZSCAN4 |
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于包含如下步骤:
(1)提取待测样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息;基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件,命名为circRNA_location.bed;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件;该bed文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件 circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件;
(4)基于步骤(3)得到的circRNA同方向前侧位置序列文件circRNA_flank_sequence.fa,使用生物信息学软件dreme,得到circRNA同方向前侧位置序列的motif;
(5)从已知数据库中下载已知蛋白质的motif的meme格式文件,然后,采用生物信息学软件tomtom,将其与步骤(4)得到的circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RNA结合蛋白。
2.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的待测样本为组织、细胞或血液样本。
3.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的提取待测样本总RNA包括:使用TRIzol试剂或RNA提取试剂盒提取总RNA。
4.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(1)中所述的bed文件包含以下信息:
chrom、start、end、name、score、strand,其中,chrom代表circRNA所属染色体,start代表circRNA起始位置坐标,end代表circRNA终止位置坐标,name代表circRNA测序获得ID,score默认为0,strand代表circRNA在染色体上的方向,其中,+代表正链,-代表反链。
5.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(4)中所述的生物信息学软件dreme运行后,会得到一个文件夹,文件夹中包括一个网页文件;该软件对获得的motif进行可靠性的评定,根据p-value或e-value进行筛选得到需要的motif。
6.根据权利要求1所述的基于circRNA位置信息预测RNA结合蛋白的方法,其特征在于:
步骤(5)中所述的数据库包括:TRANSFAC数据库或JASPAR数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110333465.9A CN113096729B (zh) | 2021-03-29 | 2021-03-29 | 一种基于circRNA位置信息预测RNA结合蛋白的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110333465.9A CN113096729B (zh) | 2021-03-29 | 2021-03-29 | 一种基于circRNA位置信息预测RNA结合蛋白的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113096729A CN113096729A (zh) | 2021-07-09 |
CN113096729B true CN113096729B (zh) | 2022-03-18 |
Family
ID=76670411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110333465.9A Active CN113096729B (zh) | 2021-03-29 | 2021-03-29 | 一种基于circRNA位置信息预测RNA结合蛋白的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113096729B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114550817B (zh) * | 2022-01-25 | 2022-12-23 | 云南大学 | 基于多特征的ctcf介导染色质环预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2238656A1 (en) * | 1998-05-22 | 1999-11-22 | Universite De Montreal | Mammalian staufen and use thereof |
KR20160057003A (ko) * | 2014-11-12 | 2016-05-23 | 인하대학교 산학협력단 | 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법 |
CN108319818A (zh) * | 2018-02-07 | 2018-07-24 | 中国科学院生物物理研究所 | 一种预测影响长非编码rna生物学功能的snp位点的方法 |
CN111798921A (zh) * | 2020-06-22 | 2020-10-20 | 武汉大学 | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2166105A3 (en) * | 2004-08-16 | 2010-04-14 | CropDesign N.V. | Plants having improved growth characteristics and method for making the same |
WO2010109463A2 (en) * | 2009-03-24 | 2010-09-30 | Yeda Research And Development Co. Ltd. | Methods of predicting pairability and secondary structures of rna molecules |
-
2021
- 2021-03-29 CN CN202110333465.9A patent/CN113096729B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2238656A1 (en) * | 1998-05-22 | 1999-11-22 | Universite De Montreal | Mammalian staufen and use thereof |
KR20160057003A (ko) * | 2014-11-12 | 2016-05-23 | 인하대학교 산학협력단 | 결합 상대방을 고려하여 rna 서열에서 단백질과 결합하는 부위를 예측하는 방법 |
CN108319818A (zh) * | 2018-02-07 | 2018-07-24 | 中国科学院生物物理研究所 | 一种预测影响长非编码rna生物学功能的snp位点的方法 |
CN111798921A (zh) * | 2020-06-22 | 2020-10-20 | 武汉大学 | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 |
Non-Patent Citations (2)
Title |
---|
急性脑梗死合并2型糖尿病患者血清脂肪酸结合蛋白4的表达与临床预后的相关性研究;王全奎,蒋子贺,徐铮,尹昌浩,关利新;《世界复合医学》;20190831;第5卷(第8期);第13-17页 * |
长链非编码RNA lnc-DC的生物信息学分析与验证;胡雪停,吴晓凤,徐祥;《基础医学与临床》;20201005(第10期);第24-30页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113096729A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Middleton et al. | IRFinder: assessing the impact of intron retention on mammalian gene expression | |
Fizames et al. | The Arabidopsis root transcriptome by serial analysis of gene expression. Gene identification using the genome sequence | |
Hoffmann et al. | A multi-split mapping algorithm for circular RNA, splicing, trans-splicing and fusion detection | |
Bogu et al. | Chromatin and RNA maps reveal regulatory long noncoding RNAs in mouse | |
Lin et al. | Analysis of soybean long non-coding RNAs reveals a subset of small peptide-coding transcripts | |
Hudson et al. | Identification of promoter motifs involved in the network of phytochrome A-regulated gene expression by combined analysis of genomic sequence and microarray data | |
Polyak et al. | Gene discovery using the serial analysis of gene expression technique: implications for cancer research | |
US20170002319A1 (en) | Master Transcription Factors Identification and Use Thereof | |
Gerbasi et al. | The Myotonic Dystrophy Type 2 Protein ZNF9 Is Part of an ITAF Complex That Promotes Cap-independent Translation* S | |
Chen et al. | A dynamic Bayesian network for identifying protein-binding footprints from single molecule-based sequencing data | |
Kim et al. | Peeling back the evolutionary layers of molecular mechanisms responsive to exercise-stress in the skeletal muscle of the racing horse | |
Ross et al. | Uncovering deeply conserved motif combinations in rapidly evolving noncoding sequences | |
CN113096729B (zh) | 一种基于circRNA位置信息预测RNA结合蛋白的方法 | |
Sætrom et al. | Predicting non-coding RNA genes in Escherichia coli with boosted genetic programming | |
Prensner et al. | Transcriptome sequencing identifies PCAT-1, a novel lincRNA implicated in prostate cancer progression | |
Kikuchi et al. | Bayesian identification of candidate transcription factors for the regulation of Aqp2 gene expression | |
Szcześniak et al. | Towards a deeper annotation of human lncRNAs | |
Choi et al. | mirRICH, a simple method to enrich the small RNA fraction from over-dried RNA pellets | |
Sharma et al. | Methods for annotation and validation of circular RNAs from RNAseq data | |
Gomes et al. | Novel transcription factors in human CD34 antigen–positive hematopoietic cells | |
Schmitz et al. | Web resources for microRNA research | |
Saha et al. | Site-specific phosphorylation of histone H1. 4 is associated with transcription activation | |
Herman et al. | Research resource: A genome-wide study identifies potential new target genes for POU1F1 | |
Islakoğlu et al. | hsa-miR-301a-and SOX10-dependent miRNA-TF-mRNA regulatory circuits inbreast cancer | |
Ahmed et al. | Functional role of hub molecules in miRNA and transcription factor mediated gene regulatory network of colorectal and lung cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |