CN108090327A - 包含三维自由能的外源性miRNA调控靶基因预测方法 - Google Patents

包含三维自由能的外源性miRNA调控靶基因预测方法 Download PDF

Info

Publication number
CN108090327A
CN108090327A CN201711380586.9A CN201711380586A CN108090327A CN 108090327 A CN108090327 A CN 108090327A CN 201711380586 A CN201711380586 A CN 201711380586A CN 108090327 A CN108090327 A CN 108090327A
Authority
CN
China
Prior art keywords
unit
sequence
target
candidate targets
mirna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711380586.9A
Other languages
English (en)
Other versions
CN108090327B (zh
Inventor
刘元宁
王林宇
徐瑞
张�浩
赵奇
段云娜
刘海明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201711380586.9A priority Critical patent/CN108090327B/zh
Publication of CN108090327A publication Critical patent/CN108090327A/zh
Application granted granted Critical
Publication of CN108090327B publication Critical patent/CN108090327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明公开一种包含三维自由能的外源性miRNA调控的靶基因预测方法,改进传统序列匹配特征,新提出了种子区域的三维能量统计特征及结合位点的空配惩罚函数统计特征,种子区域结合位点特征表示了结合位点的具体配对信息,使得构建的特征输入向量更为精确,而且更加贴合实际,因此提高了miRNA靶点预测的准确度。

Description

包含三维自由能的外源性miRNA调控靶基因预测方法
技术领域
本发明公开一种包含三维自由能的外源性miRNA调控的靶基因预测方法及装置,属于生物信息学miRNA靶基因预测领域。
本发明涉及改进传统特征,引入三维自由能特征以及基于位置和空位大小的惩罚函数特征的miRNA靶基因预测方法,并提供了适用于该方法的装置。
背景技术
一直以来,科学界一致认为,食物中的任何核酸、蛋白质,在消化系统中都会被完全消化并被吸收到体内,然后按照自身需求重新“组装”。但是2011年南京大学张辰宇教授的课题组在《Cell research》发表一篇文章中,提出了一项重大发现——植物miRNAs可以通过日常食物摄取的方式进入人体血液和组织器官,并且一旦进入体内,它们将通过调控人体内靶基因表达的方式影响人体的生理功能,进而发挥生物学应用。
miRNA是一类约有22核苷酸长度的,属于非编码和内源性的小RNA 分子片段,它们在很多如发育、细胞凋亡的生命进程中起到的重要作用,引起了研究人员的广泛关注并为很多生命科学研究带来了进展。值得一提的是miRNAs建立细胞体系的强大作用,它们靶向一个或者多个信使RNA(即mRNAs),指导RNA诱导沉默复合体,通过降解mRNA或翻译抑制下调基因表达。
miRNA通过结合到相应的mRNA上影响基因表达,从而导致其失活。目前由miRTarBase最新公布,通过手动考察相关文献,miRNA-靶基因相互作用(MTI)已经累计有3576个经过实验验证的MTIs,这些MTIs属于17个物种,涉及657个miRNAs和2297个靶基因。因此,关于miRNA的靶基因预测对研究具有重要意义。
通过传统生物实验手段发现miRNA靶位点是一个即昂贵又费时的过程。从现有的资料来看,利用传统的方法寻找miRNA的靶基因比较艰难,其原因是目标不明确,效率较低。因此利用生物信息学的方法对miRNA靶基因预测能极大地帮助研究人员缩小了潜在靶基因的范围,并作为miRNA靶基因预测的实验指导支持miRNA和mRNA/蛋白质表达水平间的研究。
miRNA靶基因预测算法很多,主要的特征包括:作为靶基因识别最重要特征的种子位点的miRNA-mRNA配对特征,位点位置特征,保守性特征,用于评估位点可结合性的最小自由能特征,以及表示靶点间最优距离的复合位点等特征。但是能够合并所有已知的特征并结合三维自由能使其作为参数进行调节的方法还没有。
改进基于生物意义的传统特征,包括连续碱基配对个数特征,各元素含量特征,及基于配对值的种子区域结合位点特征。新提出了结合位点的空配惩罚函数统计特征。通过神经网络模型预训练对候选靶基因进行二次筛选并提高了准确性。
在miRNA靶基因预测中,对输入的miRNA和靶序列进行基本格式处理后,动态规划及序列比对是基础;将模式匹配后的数据进行规格化处理为一组向量,使其作为神经网络模型的输入向量进行训练。当序列间的高度相似区域以相同顺序或方向出现时,需要使用全局比对算法。这类方法试图在序列间找到一个“全局图”,并在此过程中不允许重叠比对或交叉。两个序列的比对是基于一个比对矩阵计算的,行列数分别由两条序列长度决定,计算方法基于一个置换矩阵和一个空配惩罚函数,这样将得到两条序列的最优匹配。
发明内容
本发明提供一种包含三维自由能的外源性miRNA调控的靶基因预测方法,能够平衡敏感度和特异性,并且对于长度较大的基因序列,本发明仍能有效的对miRNA的靶基因靶点进行预测。
本发明还提供了实现该方法的装置,该装置通过软件和硬件的结合,大大解决了通过实验手段发现miRNA靶位点的成本高、周期长的弊端。
本发明有基于ARM11微处理器01的miRNA靶基因预测装置与上位机02进行连接,形成整个系统从而完成工作,采用的ARM11微处理器01适用于普通嵌入式的应用,用于协调和管理各模块统一工作。
本发明公开的一种包含三维自由能的外源性miRNA调控的靶基因预测方法,具体步骤如下:
1)通过上位机的输入单元输入外源性miRNA序列和靶基因序列,并通过以太网接口传至miRNA调控的靶基因预测装置的内存储单元,并进一步将数据读到缓存单元中;
2)序列预处理单元从缓存单元中读出miRNA序列、靶基因序列,对输入的序列格式进行判断:
数据中miRNA或靶基因序列中含非ATUGC的字母,则立即发出一个高优先级的错误信号通过缓存单元传到内存储单元,再通过以太网接口传回到上位机的显示单元上输出错误信息;通过了序列格式判断后,以miRNA的长度构建滑动窗口;
3)序列比对单元利用上述构建的滑动窗口以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合:
当序列间的高度相似区域以相同顺序或方向出现时,需要使用全局比对算法,两个序列的比对基于一个比对矩阵计算的,行列数分别由两条序列长度决定,计算方法基于一个置换矩阵和一个空位惩罚函数,将得到两条序列的最优匹配;
计算公式如下:
Mi,j = max{Mi,j-1– Pgap , Mi-1,j - Pgap , Mi-1,j-1 + W(si,tj)} ;
式中,为置换矩阵;
Mi,j-1,Mi-1,j-1为原矩阵;
W(si,tj)为权重;
为空位惩罚函数;
si组成的第一条序列S中元素;
tj组成的第二条序列T中元素;
利用置换矩阵搜索两个序列中具有高度相似性的区域,找到序列间较短共同区域扩展匹配区域作为候选靶点集合;
4)特征提取单元对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵,作为神经网络训练单元的输入;
5)神经网络训练单元对所有候选靶点结果进行训练,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将结果暂存于内存储单元;
6)通过最优匹配靶点筛选单元,利用初始设定的参数及部分特征和三维自由能阈值对上述候选靶点集合进行筛选,不满足条件的靶点将会被筛选掉;将筛选后满足条件的靶点集合存于外存储单元;
计算公式如下:
筛选公式:
式中;
Target为符合要求的靶点;
Sequence为候选靶点集合;
E(seq, Ψ)为候选靶点集匹配域三维自由能计算公式;
seq为候选靶点集合中的候选靶点;
Ψ为初始参数及部分特征;
Ê为三维自由能阈值;
7)将上述外存储单元中的存储结果以太网接口传回上位机的显示单元输出显示。
本发明所述的一种基于多特征融合的外源性miRNA调控的靶基因预测的装置,其特征在于:
ARM11微处理器(01)由接口部分(011)、存储单元(012)、处理单元(013)组成:
1、接口部分(011)包括:USB接口(0111)、以太网接口(0112);USB接口(0111)与外置存储器连接,将miRNA靶基因预测得到的结果数据的转存,实现存储单元的扩增;以太网接口(0112)与上位机(02)的以太网接口(0203)连接,实现 ARM11微处理器(01)与上位机(02)的互通信;
2、存储单元(012)包括:内存储单元(0121)、缓存单元(0123)及外存储单元(0122);内存储单元(0121)与缓存单元(0123)进行连接,完成 RNA 二级结构识别的初始数据及中间数据的存储;缓存单元(0123)与内存储单元(0121)及序列预处理单元(0131)连接,实现miRNA靶基因预测的初始数据的存储;外存储单元(0122)与候选靶点筛选单元(0135)连接,实现miRNA靶基因预测的结果数据的存储;
3、处理单元(013)包括:序列预处理单元(0131)、序列比对单元(0132)、特征提取单元(0133)、神经网络训练单元(0134)及候选靶点筛选单元(0135);
序列预处理单元(0131)与缓存单元(0123)连接,获取缓存单元(0123)中读取到的输入序列,并对其格式进行判断:
序列比对单元(0132)与序列预处理单元(0131)连接,获取序列预处理数据,以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合;
特征提取单元(0133)与序列比对单元(0132)连接,获取序列比对数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
神经网络训练单元(0134)与特征提取单元(0133)连接,获取特征提取数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
候选靶点筛选单元(0135)与神经网络训练数据,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将排序后的结果存于内存储单元(0121)中;
4、上位机(02)由输入单元(0201),接口部分(021)的USB接口(0202)、以太网接口(0203),显示单元(0204)共同构成来完成与ARM11微处理器(01)的协调工作;其中输入单元(0201)与接口部分(021)连接,完成 miRNA 序列以及靶基因序列的输入;接口部分(021)与ARM11微处理器(01)进行连接通信;显示单元(0204)与接口部分(021)连接,负责完成miRNA靶基因靶点结果的输出显示。
本发明的明显效果在于:改进传统序列匹配特征,新提出了种子区域的三维能量统计特征及结合位点的空配惩罚函数统计特征,种子区域结合位点特征表示了结合位点的具体配对信息,使得构建的特征输入向量更为精确,而且更加贴合实际,因此提高了miRNA靶点预测的准确度。
附图说明
图1为本发明的结构原理图;
图2为本发明结构的电路原理图;
图3为本发明逻辑功能图;
图4为本发明的ACC(准确性)和MCC(马修斯相关系数)的表现。
具体实施方式
通过以下实施例进一步举例描述本发明,并不以任何方式限制本发明,在不背离本发明的技术解决方案的前提下,对本发明所作的本领域普通技术人员容易实现的任何改动或改变都将落入本发明的权利要求范围之内。
实施例1
如图1 所示,本发明包括ARM11微处理器01、上位机02 ;
在本发明的实施例中,通常利用一台通用的PC计算机作为上位机02,该上位机可通过以太网接口和基于三星公司生产的 32 位的S3C6410 核的微处理器的RNA 二级结构识别装置进行连接,共同作用以完成RNA 二级结构的识别;
上位机02的输入单元0201 及显示单元0204 均采用PC 计算机的输入及输出设备来实现其功能。
本发明中可通过上位机01 的以太网接口0203 及ARM11 微处理器02 的以太网接口0204 实现上位机01 与ARM9 微处理器02 的互通信,以太网接口采用DM9000 完全综合的、成本较低的单一快速以太网控制器芯片。
本发明中,USB 接口采用的是USB3.0 接口,为了实现存储单元的扩增,可以将RNA二级结构识别结果数据通过上位机02 的USB 接口0202 或ARM11微处理器01 的USB 接口0102 转存到U 盘。
ARM11 微处理器01系统程序存储单元012 选用的是32M Hynix 公司的HY57V561620CT SDRAM 作为内存储单元0121,64M SAMSUNG 公司的K9F1208UOM NandFlash作为缓存单元0123,及1G 的硬盘作为扩展外存储单元0122。
ARM11 微处理器01 的处理单元013 中所包含的各单元均是固化在ARM11 微处理器上的miRNA靶基因预测算法,并且在运算时使用32 位运算部件。
如图2 所示,是miRNA靶基因预测装置电路原理图,其连接关系如下:USB 接口0111、以太网接口0112的数据输入口Vin 分别与ARM11 微处理器01 的数据输出引脚Vout1[0..7] 相连,其GND 分别与ARM11微处理器01 的GND 相连。
内存储单元0121 的数据输入口Vin 与ARM11 微处理器01 的数据输出引脚Vout1[0..7] 相连,其数据输出口Vout 与缓存单元0123 的数据输入口Vin 相连,其GND 与ARM11 微处理器01 的GND 相连。缓存单元0123 的数据输入口Vin 与内存储单元0121 的数据输出口Vout 相连,其数据输出口Vout 与局部组件处理单元的数据输入口Vin 相连,其GND 与ARM11 微处理器01 的GND 相连。外存储单元0122 的数据输入口Vin 与最优结构获取单元0135 的数据输出口Vout 相连,其数据输出口Vout 与ARM11 微处理器01 的数据输入引脚Vin1[0..7] 相连,其GND 与ARM11 微处理器01 的GND 相连。
序列预处理单元0131 的数据输入口Vin 与缓存单元0123 的数据输出口Vout相连,其数据输出口Vout 与分别与ARM11 微处理器01 的数据输入引脚Vin1[0..7] 及序列比对单元0132 的数据输入口Vin 相连,VCC 和GND 分别与ARM11 微处理器01 的VCC 和GND相连。序列比对单元0132 的数据输入口Vin 与序列预处理单元0131 的数据输出口Vout 相连,其数据输出口Vout 与分别与ARM11 微处理器01 的数据输入引脚Vin1[0..7]及特征提取单元0133 的数据输入口Vin 相连,其GND 与ARM11 微处理器01 的GND 相连。
特征提取单元0133 的数据输入口Vin 与序列比对单元0132 的数据输出口Vout相连,其数据输出口Vout 分别与ARM11 微处理器01 的数据输入引脚Vin1[0..7] 及神经网路训练单元0134 的数据输入口Vin 相连,其GND 与ARM11 微处理器01 的GND 相连。神经网络训练单元0134 的数据输入口Vin 与特征提取单元0133 的数据输出口Vout相连,其数据输出口Vout 与ARM11 微处理器01 的数据输入引脚Vin1[0..7] 相连,其GND 与ARM11微处理器01 的GND 相连。候选靶点筛选单元0135 的数据输入口Vin 与ARM11 微处理器01的数据输出引脚Vout1[0..7] 相连,其数据输出口Vout 与外存储单元0122 的数据输入口Vin 相连,GND 与ARM11 微处理器01 的GND 相连。
实施例2
如图3所示为本发明逻辑功能图。用户使用该装置进行miRNA靶基因预测的步骤如下:
1)通过上位机的输入单元0201输入miRNA序列和靶序列,并通过以太网接口0203传至内存储单元0121,进一步将数据读到缓存单元0123中;
2)序列预处理单元0131从缓存单元0123中读出miRNA序列、靶序列,对输入的序列格式进行判断,如果数据不满足规范,则立即发出一个高优先级的错误信号通过缓存单元0123传到内存储单元0121,再通过以太网接口0203传回到上位机的显示单元0204上输出错误信息;如果通过了序列格式判断后,则以miRNA的长度构建滑动窗口。
3)利用上述构建的滑窗,序列比对单元0132以靶序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合;
以由s1s2s3...sn组成的第一条序列S及由t1t2t3...tm组成的第二条序列T为例;
Mi,j是置换矩阵;
Mi,j-1,Mi-1,j-1为原矩阵;
W(si,tj+)是权重(包括错配与匹配两种情况);
Pgap是空位惩罚函数;
计算公式为:Mi,j=max{Mi,j-1-Pgap ,Mi-1,j-Pgap ,Mi-1,j-1+W(si ,tj)}。
4)特征提取单元0133对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵,作为神经网络训练单元的输入。我们发现连续10nt的序列模式比7、8或9nt序列模式更频繁。因此本平台对传统结合位点的种子区域特征改进,定义种子区域为从5’端开始连续的10nt序列。模式匹配后的miRNA序列特征是指用4个布尔类型向量代表每一位序列,根据A、C、G、U(T)的顺序,将4位向量的对应位置置1,其余位置均为0。因此,每个碱基位均由四维向量组成,而基于本系统设定的10nt长的种子序列被编码为40维向量。
5)神经网络训练单元0134对所有候选靶点结果进行训练,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将结果暂存于内存储单元0121。
6)通过最优匹配靶点筛选单元0135,利用该器件中初始设定的参数及部分特征和三维自由能阈值对上述候选靶点集合进行筛选,不满足条件的靶点将会被筛选掉。将筛选后满足条件的靶点集合存于外存储单元0122。
筛选公式:
式中;
利用参数Ψ与筛选单元seq计算出候选靶点的三维自由能E(seq, Ψ),然后与三维自由能阈值Ê进行比较选出符合要求的候选靶点。
7)最后,将上述外存储单元0122中的存储结果通过以太网接口0112传回上位机的显示单元0204输出显示,结果显示本发明预测结果的参数ACC(准确性)和MCC(马修斯相关系数)远远超过其他方法。
实施例3
通过上位机02输入hsa-let-7b的miRNA序列:TGAGGTAGTAGGTTGTGTGGTT,再输入gi|332384207|gb|JF915190.1| Influenza A virus (A/California/04/2009(H1N1)) PB2的基因序列。
计算后得到三个预测靶点:
No.:1 score:1.02 position:767-783;
No.:2 score:1.0 position:767-784;
No.:3 score:0.97 position:767-785。
本发明采用经典的双荧光素酶验证法:
1、选择Marc-145细胞系作为宿主细胞,选择psi-CHECK2质粒作为载体构建的基础。
2、扩增GFP(绿色荧光蛋白)基因的DNA片段,靶标基因的DNA片段及YMP基因(黄色荧光蛋白)的DNA片段。
3、载体构建:
1、酶切后将GFP基因片段与靶基因片段连接为GFP-靶标基因。
2、将GFP-靶标基因片段,YMP基因DNA片段以及质粒进行酶切。
3、回收酶切片段,连接成新的质粒。
4、使用电击转化法将构建好的质粒导入细胞,筛选培养获得转入成功的转化子。
5、培养转化子并分为两组,一组转化子导入miRNA另外一组作为对照。
6、培养一段时间进行荧光检测,导入miRNA组转化子的绿色荧光强度明显低于对照组的荧光强度。
经过以上验证试验证明,本发明可以精确的预测外源miRNA调控的靶基因。

Claims (2)

1.一种包含三维自由能的外源性miRNA调控靶基因预测方法,包括以下步骤:
1)通过上位机的输入单元输入外源性miRNA序列和靶基因序列,并通过以太网接口传至miRNA调控的靶基因预测装置的内存储单元,并进一步将数据读到缓存单元中;
2)序列预处理单元从缓存单元中读出miRNA序列、靶基因序列,对输入的序列格式进行判断:
数据中miRNA或靶基因序列中含非ATUGC的字母,则立即发出一个高优先级的错误信号通过缓存单元传到内存储单元,再通过以太网接口传回到上位机的显示单元上输出错误信息;通过了序列格式判断后,以miRNA的长度构建滑动窗口;
3)序列比对单元利用上述构建的滑动窗口以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合:
当序列间的高度相似区域以相同顺序或方向出现时,需要使用全局比对算法,两个序列的比对基于一个比对矩阵计算的,行列数分别由两条序列长度决定,计算方法基于一个置换矩阵和一个空位惩罚函数,将得到两条序列的最优匹配;
计算公式如下:
Mi,j = max{Mi,j-1– Pgap , Mi-1,j - Pgap , Mi-1,j-1 + W(si,tj)} ;
式中,为置换矩阵;
Mi,j-1,Mi-1,j-1为原矩阵;
W(si,tj)为权重;
为空位惩罚函数;
si组成的第一条序列S中元素;
tj组成的第二条序列T中元素;
利用置换矩阵搜索两个序列中具有高度相似性的区域,找到序列间较短共同区域扩展匹配区域作为候选靶点集合;
4)特征提取单元对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵,作为神经网络训练单元的输入;
5)神经网络训练单元对所有候选靶点结果进行训练,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将结果暂存于内存储单元;
6)通过最优匹配靶点筛选单元,利用初始设定的参数及部分特征和三维自由能阈值对上述候选靶点集合进行筛选,不满足条件的靶点将会被筛选掉;将筛选后满足条件的靶点集合存于外存储单元;
筛选公式:
式中;
Target为符合要求的靶点;
Sequence为候选靶点集合;
E(seq, µ(Ψ))为候选靶点集匹配域三维自由能计算公式;
seq为候选靶点集合中的候选靶点;
Ψ为初始参数及部分特征;
Ê为三维自由能阈值;
7)将上述外存储单元中的存储结果以太网接口传回上位机的显示单元输出显示。
2.一种基于多特征融合的外源性miRNA调控的靶基因预测的装置,其特征在于:
ARM11微处理器(01)由接口部分(011)、存储单元(012)、处理单元(013)组成:
1)接口部分(011)包括:USB接口(0111)、以太网接口(0112);USB接口(0111)与外置存储器连接,将miRNA靶基因预测得到的结果数据的转存,实现存储单元的扩增;以太网接口(0112)与上位机(02)的以太网接口(0203)连接,实现 ARM11微处理器(01)与上位机(02)的互通信;
2)存储单元(012)包括:内存储单元(0121)、缓存单元(0123)及外存储单元(0122);内存储单元(0121)与缓存单元(0123)进行连接,完成 RNA 二级结构识别的初始数据及中间数据的存储;缓存单元(0123)与内存储单元(0121)及序列预处理单元(0131)连接,实现miRNA靶基因预测的初始数据的存储;外存储单元(0122)与候选靶点筛选单元(0135)连接,实现miRNA靶基因预测的结果数据的存储;
3)处理单元(013)包括:序列预处理单元(0131)、序列比对单元(0132)、特征提取单元(0133)、神经网络训练单元(0134)及候选靶点筛选单元(0135);
序列预处理单元(0131)与缓存单元(0123)连接,获取缓存单元(0123)中读取到的输入序列,并对其格式进行判断:
序列比对单元(0132)与序列预处理单元(0131)连接,获取序列预处理数据,以靶基因序列为模本进行数据的模式匹配,通过填表、回溯找到所有候选靶点集合;
特征提取单元(0133)与序列比对单元(0132)连接,获取序列比对数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
神经网络训练单元(0134)与特征提取单元(0133)连接,获取特征提取数据,对候选靶点集合中所有的匹配序列提取特征向量,建立候选靶点序列的特征矩阵;
候选靶点筛选单元(0135)与神经网络训练数据,计算出所有候选靶点的预测值打分,并且对所有靶点以预测值打分高低进行排序,将排序后的结果存于内存储单元(0121)中;
4)上位机(02)由输入单元(0201),接口部分(021)的USB接口(0202)、以太网接口(0203),显示单元(0204)共同构成来完成与ARM11微处理器(01)的协调工作;其中输入单元(0201)与接口部分(021)连接,完成 miRNA 序列以及靶基因序列的输入;接口部分(021)与ARM11微处理器(01)进行连接通信;显示单元(0204)与接口部分(021)连接,负责完成miRNA靶基因靶点结果的输出显示。
CN201711380586.9A 2017-12-20 2017-12-20 包含三维自由能的外源性miRNA调控靶基因预测方法 Active CN108090327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711380586.9A CN108090327B (zh) 2017-12-20 2017-12-20 包含三维自由能的外源性miRNA调控靶基因预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711380586.9A CN108090327B (zh) 2017-12-20 2017-12-20 包含三维自由能的外源性miRNA调控靶基因预测方法

Publications (2)

Publication Number Publication Date
CN108090327A true CN108090327A (zh) 2018-05-29
CN108090327B CN108090327B (zh) 2022-03-29

Family

ID=62176108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711380586.9A Active CN108090327B (zh) 2017-12-20 2017-12-20 包含三维自由能的外源性miRNA调控靶基因预测方法

Country Status (1)

Country Link
CN (1) CN108090327B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859798A (zh) * 2019-01-21 2019-06-07 桂林电子科技大学 一种细菌中sRNA与其靶标mRNA相互作用的预测方法
CN109920477A (zh) * 2019-02-26 2019-06-21 哈尔滨工业大学 基于Adaboost与BP神经网络融合的多物种Pre-microRNA识别方法
CN110021365A (zh) * 2018-06-22 2019-07-16 深圳市达仁基因科技有限公司 确定检测靶点的方法、装置、计算机设备和存储介质
CN110021340A (zh) * 2018-07-30 2019-07-16 吉林大学 一种基于卷积神经网络和规划动态算法的rna二级结构生成器及其预测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1904900A (zh) * 2005-07-28 2007-01-31 中国科学院生物物理研究所 人类的内源性siRNA序列及其应用和筛选方法
CN101363057A (zh) * 2008-09-09 2009-02-11 浙江理工大学 一种生物样本中miRNA绝对表达量的检测方法
CN101710362A (zh) * 2009-12-10 2010-05-19 浙江大学 一种基于支持向量机的microRNA靶位点预测的方法
US20120015351A1 (en) * 2010-02-19 2012-01-19 The Regents Of The University Of Michigan miRNA Target Prediction
CN104293889A (zh) * 2013-07-16 2015-01-21 北京林业大学 雌雄异株植物中雌雄花器官差异表达的microRNA的筛选方法
CN106202993A (zh) * 2016-07-12 2016-12-07 王亚帝 利用mRNA表达谱与竞争性内源RNA表达谱联合筛选蒽环类药物心脏毒性基因的方法
WO2017009718A1 (en) * 2015-07-14 2017-01-19 Exiqon A/S Automatic processing selection based on tagged genomic sequences
CN106599615A (zh) * 2016-11-30 2017-04-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种预测miRNA靶基因的序列特征分析方法
CN106845104A (zh) * 2017-01-19 2017-06-13 东南大学 利用TCGA数据库资源发现直肠癌相关microRNA分子标志物的方法及系统和应用

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1904900A (zh) * 2005-07-28 2007-01-31 中国科学院生物物理研究所 人类的内源性siRNA序列及其应用和筛选方法
CN101363057A (zh) * 2008-09-09 2009-02-11 浙江理工大学 一种生物样本中miRNA绝对表达量的检测方法
CN101710362A (zh) * 2009-12-10 2010-05-19 浙江大学 一种基于支持向量机的microRNA靶位点预测的方法
US20120015351A1 (en) * 2010-02-19 2012-01-19 The Regents Of The University Of Michigan miRNA Target Prediction
CN104293889A (zh) * 2013-07-16 2015-01-21 北京林业大学 雌雄异株植物中雌雄花器官差异表达的microRNA的筛选方法
WO2017009718A1 (en) * 2015-07-14 2017-01-19 Exiqon A/S Automatic processing selection based on tagged genomic sequences
CN106202993A (zh) * 2016-07-12 2016-12-07 王亚帝 利用mRNA表达谱与竞争性内源RNA表达谱联合筛选蒽环类药物心脏毒性基因的方法
CN106599615A (zh) * 2016-11-30 2017-04-26 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种预测miRNA靶基因的序列特征分析方法
CN106845104A (zh) * 2017-01-19 2017-06-13 东南大学 利用TCGA数据库资源发现直肠癌相关microRNA分子标志物的方法及系统和应用

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110021365A (zh) * 2018-06-22 2019-07-16 深圳市达仁基因科技有限公司 确定检测靶点的方法、装置、计算机设备和存储介质
CN110021365B (zh) * 2018-06-22 2021-01-22 深圳市达仁基因科技有限公司 确定检测靶点的方法、装置、计算机设备和存储介质
CN110021340A (zh) * 2018-07-30 2019-07-16 吉林大学 一种基于卷积神经网络和规划动态算法的rna二级结构生成器及其预测方法
CN110021340B (zh) * 2018-07-30 2021-04-02 吉林大学 一种基于卷积神经网络和规划动态算法的rna二级结构生成器及其预测方法
CN109859798A (zh) * 2019-01-21 2019-06-07 桂林电子科技大学 一种细菌中sRNA与其靶标mRNA相互作用的预测方法
CN109920477A (zh) * 2019-02-26 2019-06-21 哈尔滨工业大学 基于Adaboost与BP神经网络融合的多物种Pre-microRNA识别方法

Also Published As

Publication number Publication date
CN108090327B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN108090327A (zh) 包含三维自由能的外源性miRNA调控靶基因预测方法
US10540591B2 (en) Deep learning-based techniques for pre-training deep convolutional neural networks
Evers et al. miRA: adaptable novel miRNA identification in plants using small RNA sequencing data
AU2019272062B2 (en) Deep learning-based techniques for pre-training deep convolutional neural networks
CN109637588B (zh) 一种基于全转录组高通量测序构建基因调控网络的方法
Kang et al. Global identification and analysis of long non-coding RNAs in diploid strawberry Fragaria vesca during flower and fruit development
Capra et al. Many human accelerated regions are developmental enhancers
Ohler et al. Identification and analysis of eukaryotic promoters: recent computational approaches
Kanke et al. miRquant 2.0: an expanded tool for accurate annotation and quantification of microRNAs and their isomiRs from small RNA-sequencing data
CN103955629A (zh) 基于模糊k均值的宏基因组片段聚类方法
Yu et al. Bioinformatics resources for deciphering the biogenesis and action pathways of plant small RNAs
Shujaat et al. Cr-prom: A convolutional neural network-based model for the prediction of rice promoters
Faiza et al. Comprehensive overview and assessment of microRNA target prediction tools in Homo sapiens and Drosophila melanogaster
CN104962643A (zh) 白背飞虱不同组织部位稳定表达的内参基因、其筛选方法及应用
Theis et al. RNA 3D modules in genome-wide predictions of RNA 2D structure
Li et al. FUNMarker: Fusion network-based method to identify prognostic and heterogeneous breast cancer biomarkers
Wu et al. Genome-wide characterization of intergenic polyadenylation sites redefines gene spaces in Arabidopsis thaliana
CN103348350B (zh) 核酸信息处理装置及其处理方法
Nachtigall et al. Computational detection of microRNA targets
CN103339632B (zh) 核酸信息处理装置及其处理方法
CA3064223A1 (en) Deep learning-based techniques for pre-training deep convolutional neural networks
CN105243300A (zh) 基于近似化的谱聚类算法预测癌症转移复发的方法
Gelfand et al. Recognition of genes in human DNA sequences
Zhao et al. ReCirc: prediction of circRNA expression and function through probe reannotation of non-circRNA microarrays
Ivashchenko et al. A method for clustering of miRNA sequences using fragmented programming

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant