CN113077849B - 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法 - Google Patents

一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法 Download PDF

Info

Publication number
CN113077849B
CN113077849B CN202110284392.9A CN202110284392A CN113077849B CN 113077849 B CN113077849 B CN 113077849B CN 202110284392 A CN202110284392 A CN 202110284392A CN 113077849 B CN113077849 B CN 113077849B
Authority
CN
China
Prior art keywords
hmm
algorithm
training
ann
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110284392.9A
Other languages
English (en)
Other versions
CN113077849A (zh
Inventor
方畅
吴名柔
林思展
廖晓萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN202110284392.9A priority Critical patent/CN113077849B/zh
Publication of CN113077849A publication Critical patent/CN113077849A/zh
Application granted granted Critical
Publication of CN113077849B publication Critical patent/CN113077849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种大肠杆菌β‑内酰胺类获得性耐药表型预测复合方法,解决了现有预测耐药表型的工具一般通过对氨基酸序列进行一系列计算,而且计算需要多软件、多系统平台进行,用户友好度不佳,对于非生物学或非信息学的研究人员来说,现有的方法具有很强的技术壁垒的问题,其包括预处理和预测与识别,所述预处理包括步骤:提取目标耐药基因构件训练集;去除非获得性耐药相关基因;随机过程切割数据;预加重和平稳性控制;LPCC特征系数/灰度关联;本发明结构新颖,构思巧妙,模型构建于R包和JavaWeb网页中,并加入数据库更新策略,提高效用价值。

Description

一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法
技术领域
本发明涉及公共卫生和医疗健康领域,具体为一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法。
背景技术
来自人类和食品类动物的细菌抗生素耐药性(AMR)对人类健康造成了巨大的威胁,耐药基因在环境中的传播具有很大的复杂性。鉴定对某些抗生素耐药或敏感的菌株对于耐药病原体至关重要。通常,实验室通过纸片扩散法或最小抑菌浓度(MIC)法测定药物敏感性,而通过聚合酶链式反应(PCR)或微阵列杂交(DNAMicroarrayHybridization)鉴定耐药特异性标记不仅可以体现表型结果,由于通常有多个不同的基因可能可以赋予对同个或多个特定抗菌剂的耐药性,因此对于流行病学研究也很有较大的帮助。随着DNA测序产量长度、深度的增加和成本的降低,全基因组测序(WGS)可能成为常规监测耐药谱和识别新出现耐药的替代方法。
当前细菌耐药表型的进化和演变不断加快,一定尺度下区域未来的耐药性发展态势将对公共卫生政策和抗生素治疗方案带来持续的影响,因此预测耐药表型、提早做出预判已经迫在眉睫,现有预测耐药表型的工具一般通过对氨基酸序列进行一系列计算,而且计算需要多软件、多系统平台进行,用户友好度不佳,对于非生物学或非信息学的研究人员来说,现有的方法具有很强的技术壁垒。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,有效的解决了现有预测耐药表型的工具一般通过对氨基酸序列进行一系列计算,而且计算需要多软件、多系统平台进行,用户友好度不佳,对于非生物学或非信息学的研究人员来说,现有的方法具有很强的技术壁垒的问题。
为实现上述目的,本发明提供如下技术方案:本发明包括预处理和预测与识别,所述预处理包括步骤:1)提取目标耐药基因构件训练集;
2)去除非获得性耐药相关基因;
3)随机过程切割数据;
4)预加重和平稳性控制;
5)LPCC特征系数/灰度关联;
所述预测与识别包括如下步骤:1)采用ANN算法、HMM算法或ANN-HMM混合算法进行计算;
2)综合评估与比较;
3)输出模型。
根据上述技术方案:所述ANN算法为:搭建的基本网络结构是带有一个隐层的全连接多层感知器,输入窗口长为奇数个核苷酸,采用正交编码的形式,字符集大小为63,对应60个普通密码子和1个终止子;输入层有3个sigmoidal类型的煎,其正交编码分别针对ESBLs酶、AmpC酶和碳青霉烯酶;不同的输出表示在窗口中间位置上对应残基的不同归类,类别的归属是由输出最大的输出节点按照“赢家通吃”原则(thewinner-take-allprinciple)决定;该原则的采用,为输入和最终输出之间的关系增加了额外的非线性特征;网络初始化时,权重初值为在区间[-0.5,0.5]上均匀分布的随机变量,然后使用基于LMS误差函数的反向传播算法训练网络;在训练的过程中,获得低分类误差的更为有效的方法是采用自适应的训练集,依据样本是否被现有神经网络正确分类这一标准来决定是否保留这些训练样本,这一方法必然会在学习过程中引入更多噪声从而避免局部最小;通常在每个样本训练结束而不是在整个训练周期结束时更新网络参数,就可以在训练过程中引入合适的噪声;下一步就是在每一训练周期中,颠倒训练样本的次序;获得低分类误差的训练过程概括如下:1.初始化训练样本集的第一部分和第二部分;2.从样本集中随机选择一个样本,将其输入到神经网络中;3.使用反向传播算法训练神经网络;4.若分类正确,则返回第2步;5.若分类错误,则将其放入样本集的第二部分,并随机替换其中的一个样本;6.重复该过程,直到收敛。
根据上述技术方案:所述HMM算法包括Baum-Welch算法和Viterbi算法。
根据上述技术方案:所述Viterbi算法为:定义变量,
Figure GDA0004073824140000031
其中πi(t)为生成Xi至Xt并结束于状态i的前缀路径;因此δi(t)是与最可能路径相关的概率,该路径产生结束于状态i的序列O的前t个字符;这些变量可用类似于前向算法的传播机制进行更新计算;与前向算法相比,其收敛性更显而易见,处于删除状态的循环回路不可能进入最佳路径,因为它将降低总概率而没有生成任何字符;为了恢复最佳路径,每个时刻都保存能够回溯前一时刻最佳状态的数据;Viterbi算法获得的路径。
根据上述技术方案:所述Baum-Welch算法为:定义变量
Figure GDA0004073824140000032
和/>
Figure GDA0004073824140000033
其中,/>
Figure GDA0004073824140000034
是在状态i观察到的X的次数的期望除以系统到达状态i的次数的期望;/>
Figure GDA0004073824140000035
则是从状态i到j转移的期望除以所有从状态i出发的转移的次数的期望;这些迭代公式与令拉格朗日算子的导数为0的结果一致。
根据上述技术方案:所述ANN-HMM混合算法为:ANN-HMM混合算法构筑的模型包括4个部分,分别是输入层、隐层、输出层、连接;在输入层中,每个节点对应每个状态i,在每个时刻,除了赋值为1的节点外,所有节点赋值都为0;如果节点赋值为1,则网络计算eiX,即状态i的生成分布;在隐层中,H个下标为h的隐节点,每一个节点的激活函数为fh,缺省值为布尔变量,偏倚为bh;在输入层中,A个softmax型节点或归一化指数节点,带有下标和偏倚参数;在连接中,输入点i到隐节点h的连接以及隐节点h到输出节点X的连接作为不同的锚定关系,与HMM的前向或后向变量不会发生混淆;在ANN-HMM混合模型中,考虑模型M,此模型是n个简单的隐马尔科夫模型M1到Mn的混合分布;对于任意的序列O,可以得到
Figure GDA0004073824140000041
其中混合系数λi始终不小于0且λi总和为1;在生成模式中,序列通过每一个独立的HMM独立产生,选中不同HMM模型对应的概率为λi;这样一种系统可以看做一个较大的单HMM,他的起始状态与HMM中的每个模型以转移概率λi进行连接;每个子模型的各个参数可以通过神经网络计算得到一个ANN-HMM混合结构;此时的状态已经被复制和分群。
有益效果:本发明使用ANN与HMM构建的独立或混合模型,提高预测的性能,实现了以生物学意义为主导的深度学习应用。模型整体准确率达到90%以上,处于国际领先水平,ROC达到0.95,而国际上同类软件模型介于0.81-0.92之间,说明本软件依赖的模型较其他软件更佳,基于ANN和HMM的算法,适用于序列碱基变化的数理特性,相比其他类型的机器学习算法,该算法更符合遗传和发育生物学的要求。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明系统框图。
具体实施方式
下面结合附图1对本发明的具体实施方式做进一步详细说明。
实施例,由图1给出,本发明提供一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,包括预处理和预测与识别,所述预处理包括步骤:1)提取目标耐药基因构件训练集;
2)去除非获得性耐药相关基因;
3)随机过程切割数据;
4)预加重和平稳性控制
5)LPCC特征系数/灰度关联;
所述预测与识别包括如下步骤:1)采用ANN算法、HMM算法或ANN-HMM混合算法进行计算;
2)综合评估与比较;
3)输出模型。
所述ANN算法为:搭建的基本网络结构是带有一个隐层的全连接多层感知器,输入窗口长为奇数个核苷酸,采用正交编码的形式,字符集大小为63,对应60个普通密码子和1个终止子;输入层有3个sigmoidal类型的煎,其正交编码分别针对ESBLs酶、AmpC酶和碳青霉烯酶;不同的输出表示在窗口中间位置上对应残基的不同归类,类别的归属是由输出最大的输出节点按照“赢家通吃”原则(thewinner-take-allprinciple)决定;该原则的采用,为输入和最终输出之间的关系增加了额外的非线性特征;网络初始化时,权重初值为在区间[-0.5,0.5]上均匀分布的随机变量,然后使用基于LMS误差函数的反向传播算法训练网络;在训练的过程中,获得低分类误差的更为有效的方法是采用自适应的训练集,依据样本是否被现有神经网络正确分类这一标准来决定是否保留这些训练样本,这一方法必然会在学习过程中引入更多噪声从而避免局部最小;通常在每个样本训练结束而不是在整个训练周期结束时更新网络参数,就可以在训练过程中引入合适的噪声;下一步就是在每一训练周期中,颠倒训练样本的次序;获得低分类误差的训练过程概括如下:1.初始化训练样本集的第一部分和第二部分;2.从样本集中随机选择一个样本,将其输入到神经网络中;3.使用反向传播算法训练神经网络;4.若分类正确,则返回第2步;5.若分类错误,则将其放入样本集的第二部分,并随机替换其中的一个样本;6.重复该过程,直到收敛。
所述HMM算法包括Baum-Welch算法和Viterbi算法。
所述Viterbi算法为:定义变量,
Figure GDA0004073824140000061
其中πi(t)为生成Xi至Xt并结束于状态i的前缀路径;因此δi(t)是与最可能路径相关的概率,该路径产生结束于状态i的序列O的前t个字符;这些变量可用类似于前向算法的传播机制进行更新计算;与前向算法相比,其收敛性更显而易见,处于删除状态的循环回路不可能进入最佳路径,因为它将降低总概率而没有生成任何字符;为了恢复最佳路径,每个时刻都保存能够回溯前一时刻最佳状态的数据;Viterbi算法获得的路径。
所述Baum-Welch算法为:定义变量
Figure GDA0004073824140000062
Figure GDA0004073824140000063
其中,/>
Figure GDA0004073824140000064
是在状态i观察到的X的次数的期望除以系统到达状态i的次数的期望;/>
Figure GDA0004073824140000065
则是从状态i到j转移的期望除以所有从状态i出发的转移的次数的期望;这些迭代公式与令拉格朗日算子的导数为0的结果一致。
所述ANN-HMM混合算法为:ANN-HMM混合算法构筑的模型包括4个部分,分别是输入层、隐层、输出层、连接;在输入层中,每个节点对应每个状态i,在每个时刻,除了赋值为1的节点外,所有节点赋值都为0;如果节点赋值为1,则网络计算eiX,即状态i的生成分布;在隐层中,H个下标为h的隐节点,每一个节点的激活函数为fh,缺省值为布尔变量,偏倚为bh;在输入层中,A个softmax型节点或归一化指数节点,带有下标和偏倚参数;在连接中,输入点i到隐节点h的连接以及隐节点h到输出节点X的连接作为不同的锚定关系,与HMM的前向或后向变量不会发生混淆;在ANN-HMM混合模型中,考虑模型M,此模型是n个简单的隐马尔科夫模型M1到Mn的混合分布;对于任意的序列O,可以得到
Figure GDA0004073824140000071
其中混合系数λi始终不小于0且λi总和为1;在生成模式中,序列通过每一个独立的HMM独立产生,选中不同HMM模型对应的概率为λi;这样一种系统可以看做一个较大的单HMM,他的起始状态与HMM中的每个模型以转移概率λi进行连接;每个子模型的各个参数可以通过神经网络计算得到一个ANN-HMM混合结构;此时的状态已经被复制和分群。
有益效果:本发明使用ANN与HMM构建的独立或混合模型,提高预测的性能,实现了以生物学意义为主导的深度学习应用。模型整体准确率达到90%以上,处于国际领先水平,ROC达到0.95,而国际上同类软件模型介于0.81-0.92之间,说明本软件依赖的模型较其他软件更佳,基于ANN和HMM的算法,适用于序列碱基变化的数理特性,相比其他类型的机器学习算法,该算法更符合遗传和发育生物学的要求。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,包括预处理和预测与识别,其特征在于:所述预处理包括步骤:1)提取目标耐药基因构件训练集;
2)去除非获得性耐药相关基因;
3)随机过程切割数据;
4)预加重和平稳性控制;
5)利用LPCC特征系数进行灰度关联分析;
所述预测与识别包括如下步骤:1)采用ANN算法进行计算;
2)综合评估与比较;
3)输出模型;
所述ANN算法为:搭建的基本网络结构是带有一个隐层的全连接多层感知器,输入窗口长为奇数个核苷酸,采用正交编码的形式,字符集大小为63,对应60个普通密码子和1个终止子;输入层有3个sigmoidal类型的节点,其正交编码分别针对ESBLs酶、AmpC酶和碳青霉烯酶;不同的输出表示在窗口中间位置上对应残基的不同归类,类别的归属是由输出最大的输出节点按照“赢家通吃”原则决定;该原则的采用,为输入和最终输出之间的关系增加了额外的非线性特征;网络初始化时,权重初值为在区间[-0.5,0.5]上均匀分布的随机变量,然后使用基于LMS误差函数的反向传播算法训练网络;在训练的过程中,获得低分类误差的方法是采用自适应的训练集,依据样本是否被现有神经网络正确分类这一标准来决定是否保留这些训练样本,在学习过程中引入更多噪声;在每个样本训练结束时更新网络参数,在训练过程中引入合适的噪声;在每一训练周期中,颠倒训练样本的次序;获得低分类误差的训练过程概括如下:1.初始化训练样本集的第一部分和第二部分;2.从样本集中随机选择一个样本,将其输入到神经网络中;3.使用反向传播算法训练神经网络;4.若分类正确,则返回第2步;5.若分类错误,则将其放入样本集的第二部分,并随机替换其中的一个样本;6.重复该过程,直到收敛。
2.根据权利要求1所述的一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,其特征在于,所述预测与识别还包括采用HMM算法进行计算,HMM算法包括Baum-Welch算法和Viterbi算法。
3.根据权利要求2所述的一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,其特征在于,所述Viterbi算法为:定义变量,
Figure FDA0004073824130000021
其中πi(t)为生成Xi至Xt并结束于状态i的前缀路径;因此δi(t)是与最可能路径相关的概率,该路径产生结束于状态i的序列O的前t个字符;这些变量可进行更新计算。
4.根据权利要求1所述的一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法,其特征在于,所述预测与识别还包括采用ANN-HMM混合算法进行计算,所述ANN-HMM混合算法为:ANN-HMM混合算法构筑的模型包括4个部分,分别是输入层、隐层、输出层、连接层;在输入层中,每个节点对应每个状态i,在每个时刻,除了赋值为1的节点外,所有节点赋值都为0;如果节点赋值为1,则网络计算eiX,即状态i的生成分布;在隐层中,H个下标为h的隐节点,每一个节点的激活函数为fh,缺省值为布尔变量,偏倚为bh;在输入层中,A个softmax型节点或归一化指数节点,带有下标和偏倚参数;在连接层中,输入点i到隐节点h的连接以及隐节点h到输出节点X的连接作为不同的锚定关系,与HMM的前向或后向变量不会发生混淆;在ANN-HMM混合模型中,模型M是n个简单的隐马尔科夫模型M1到Mn的混合分布;对于任意的序列O,
Figure FDA0004073824130000022
其中,i=1,…n,混合系数λi始终不小于0且λ1+…+λi+…+λn的和为1;在生成模式中,序列通过每一个独立的HMM独立产生,选中不同HMM模型对应的概率为λi;HMM的起始状态与HMM中的每个模型以转移概率λi进行连接;每个子模型的各个参数通过神经网络计算得到一个ANN-HMM混合结构。/>
CN202110284392.9A 2021-03-16 2021-03-16 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法 Active CN113077849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110284392.9A CN113077849B (zh) 2021-03-16 2021-03-16 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110284392.9A CN113077849B (zh) 2021-03-16 2021-03-16 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法

Publications (2)

Publication Number Publication Date
CN113077849A CN113077849A (zh) 2021-07-06
CN113077849B true CN113077849B (zh) 2023-03-31

Family

ID=76612591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110284392.9A Active CN113077849B (zh) 2021-03-16 2021-03-16 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法

Country Status (1)

Country Link
CN (1) CN113077849B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643758B (zh) * 2021-09-22 2023-04-07 华南农业大学 面向肠杆科细菌获得抗β-内酰胺类耐药性基因的预测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4726177B2 (ja) * 2000-06-08 2011-07-20 ビルコ・ビーブイビーエイ ニューラルネットワークを使用して治療薬耐性を予測し、そして薬剤耐性の遺伝的基礎を定めるための方法およびシステム
WO2003048345A1 (en) * 2001-12-07 2003-06-12 Toolgen, Inc. Phenotypic screen of chimeric proteins
JP2008146538A (ja) * 2006-12-13 2008-06-26 Intec Web & Genome Informatics Corp マイクロrna検出装置、方法およびプログラム
US20140039803A1 (en) * 2011-03-04 2014-02-06 The Rockefeller University Method for Rapid Identification of Drug Targets and Drug Mechanisms of Action in Human Cells
EP3622423A1 (en) * 2017-05-12 2020-03-18 The Regents of The University of Michigan Individual and cohort pharmacological phenotype prediction platform
CN107604084A (zh) * 2017-10-30 2018-01-19 深圳市第三人民医院 细菌耐药性快速预测系统及其预测方法

Also Published As

Publication number Publication date
CN113077849A (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN109241313B (zh) 一种基于高阶深度哈希学习的图像检索方法
EP2430441B1 (en) Method and system for calling variations in a sample polynucleotide sequence with respect to a reference polynucleotide sequence
IL299565A (en) Classifies pathogenic variants using a recurrent neural network
CN110993113B (zh) 基于MF-SDAE的lncRNA-疾病关系预测方法及系统
CN111276187B (zh) 一种基于自编码器的基因表达谱特征学习方法
CN113077849B (zh) 一种大肠杆菌β-内酰胺类获得性耐药表型预测复合方法
CN102521654B (zh) Rna遗传算法的超临界水氧化反应动力学模型参数估计方法
CN115906638A (zh) 建立火控系统故障预测模型、故障预测方法及相关装置
CN110890127A (zh) 酿酒酵母dna复制起始区域识别方法
CN107577918A (zh) 基于遗传算法和隐马尔可夫模型的CpG岛识别方法、装置
CN116959585B (zh) 基于深度学习的全基因组预测方法
CN114093419A (zh) 一种基于多任务深度学习的rbp结合位点预测方法
CN110705704A (zh) 一种基于相关性分析的神经网络自组织遗传进化算法
CN115019876A (zh) 一种基因表达预测方法及装置
KR20230043071A (ko) 변이체 병원성 채점 및 분류 그리고 이의 사용
Parbhane et al. Optimum DNA curvature using a hybrid approach involving an artificial neural network and genetic algorithm
WO2004068398A1 (ja) Dnaコンピュータ及びそれを用いた計算方法
Mazidi et al. PSPGA: A New Method for Protein Structure Prediction based on Genetic Algorithm
Baten et al. Biological sequence data preprocessing for classification: A case study in splice site identification
CN116959561B (zh) 一种基于神经网络模型的基因相互作用预测方法和装置
CN117235508B (zh) 一种基于大数据的车辆油耗预测方法及系统
Volkert Investigating ea based training of hmm using a sequential parameter optimization approach
CN115759437B (zh) 基于hgs的bp神经网络污水指标预测方法
Johansen et al. Splice site prediction using artificial neural networks
Kristensen et al. Classification of eukaryotic and prokaryotic cells by a backpropagation network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant