CN114446391A - 一种基于量子退火的蛋白质折叠方法 - Google Patents

一种基于量子退火的蛋白质折叠方法 Download PDF

Info

Publication number
CN114446391A
CN114446391A CN202210116503.XA CN202210116503A CN114446391A CN 114446391 A CN114446391 A CN 114446391A CN 202210116503 A CN202210116503 A CN 202210116503A CN 114446391 A CN114446391 A CN 114446391A
Authority
CN
China
Prior art keywords
amino acid
expression
follows
lattice point
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210116503.XA
Other languages
English (en)
Inventor
钱龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Turing Intelligent Computing Quantum Technology Co Ltd
Original Assignee
Shanghai Turing Intelligent Computing Quantum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Turing Intelligent Computing Quantum Technology Co Ltd filed Critical Shanghai Turing Intelligent Computing Quantum Technology Co Ltd
Priority to CN202210116503.XA priority Critical patent/CN114446391A/zh
Publication of CN114446391A publication Critical patent/CN114446391A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Geometry (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Computer Graphics (AREA)
  • Analytical Chemistry (AREA)
  • Computer Hardware Design (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Data Mining & Analysis (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供一种基于量子退火的蛋白质折叠方法,属于量子计算技术领域。因为该方法将蛋白质折叠问题编码为可计算的优化问题(QUBO形式),具体采用正四面体格点模型模拟氨基酸多肽链分子在三维空间中的构成,并定义编码后的二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离,通过添加约束条件构建对应的伊辛哈密顿量,最后利用量子退火演化伊辛哈密顿量并得到最终的演化结果,即演化得到的能量最优解即为蛋白质对应的最稳定构像。因此该方法利用量子退火中的量子隧穿效应来解决上述蛋白质问题,可以大大压缩空间和时间复杂度,耗时少,具有广泛的应用前景。

Description

一种基于量子退火的蛋白质折叠方法
技术领域
本发明涉及量子计算技术领域,具体涉及一种基于量子退火的蛋白质折叠方法。
背景技术
蛋白质折叠(Protein folding)是蛋白质获得其功能性结构和构象的过程。通过这一物理过程,蛋白质从无规则卷曲折叠成特定的功能性三维结构。而“蛋白质折叠”的主要研究目的是依据蛋白质具体的氨基酸序列,对应预测蛋白质折叠的选取路径并确定其三维最终结构。
现有技术中提出的蛋白质随机构象在搜寻研究中具有一系列各种亚稳定中间态的假设来解决折叠时间的莱氏悖论–蛋白质折叠问题,如果通过遍历搜寻自由能最小的构象,利用现有技术提出的方法,需要耗费接随序列指数倍增长的时间。
量子退火算法(Quantum annealing algorithm)是根据经典的模拟退火算法改进的一类新的量子优化算法。不同于经典模拟退火算法利用热波动来搜寻问题的最优解,量子退火算法利用量子波动产生的量子隧穿效应来使算法摆脱局部最优,而实现全局优化。通常来说,量子退火能够自然地返回低能量解决方案,即应用在优化问题,寻找问题的低能态;或者提供良好的低能量样本(概率抽样问题),因此本发明提出一种基于量子退火的蛋白质折叠方法。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种基于量子退火的蛋白质折叠方法。
本发明提供了一种基于量子退火的蛋白质折叠方法,具有这样的特征,包括:将待处理氨基酸序列中的每一个氨基酸映射到正四面体格点模型的每一个格点上;根据正四面体格点模型的预定结构将待处理氨基酸序列编码为对应的二进制氨基酸序列;定义二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离;基于二进制氨基酸序列构建伊辛哈密顿量;利用量子退火机对伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。
在本发明提供的方法中,还具有这样的特征:其中,正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,一个第一类格点A分别指向四个第二类格点B,并将该指向的方向采用预定的方式进行编码。
在本发明提供的方法中,还具有这样的特征,还包括:其中,正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,四个第一类格点A分别指向一个第二类格点B,并将该指向的方向采用预定的方式进行编码。
在本发明提供的方法中,还具有这样的特征:其中,二进制氨基酸序列包括:
q=11 00 q1 q2 q3 q4 …q(2N-7)q(2N-6)
1100为待处理氨基酸序列中前三个氨基酸的编码方式。
在本发明提供的方法中,还具有这样的特征:任一氨基酸在预定方向上的步长的表达式如下:
Figure BDA0003496662040000031
Figure BDA0003496662040000032
Figure BDA0003496662040000033
Figure BDA0003496662040000034
其中,
Figure BDA0003496662040000035
所述
Figure BDA0003496662040000036
所述
Figure BDA0003496662040000037
及所述
Figure BDA0003496662040000038
分别表示氨基酸j在预定方向a、b、c、d上的步长。
在本发明提供的方法中,还具有这样的特征:基于任一氨基酸在预定方向上的步长任一氨基酸在预定方向上的坐标的表达式示如下:
其中,氨基酸j在预定方向a的坐标aj的表达式如下:
Figure BDA0003496662040000039
氨基酸j在预定方向b的坐标bj的表达式如下:
Figure BDA0003496662040000041
氨基酸j在预定方向c的坐标cj的表达式如下:
Figure BDA0003496662040000042
氨基酸j在预定方向d的坐标dj的表达式如下:
Figure BDA0003496662040000043
在本发明提供的方法中,还具有这样的特征:其中,任意两个氨基酸之间的距离表示为氨基酸j与氨基酸k之间的距离Djk,该Djk的表达式及范围分别如下:
Djk=(aj-ak)2+(bj-bk)2+(cj-ck)2+(dj-dk)2
Figure BDA0003496662040000044
在本发明提供的方法中,还具有这样的特征:伊辛哈密顿量H0(q)的表达式如下:
H0(q)=Hback(q)+Holap(q)+Hpair(q)
其中,q为二进制氨基酸序列,Hback(q)用于惩罚氨基酸折返,Holap(q)用于惩罚氨基酸重叠,Hpair(q)表示对应晶格上相邻的非键合氨基酸之间的相互作用。
在本发明提供的方法中,还具有这样的特征:其中,基于步长的表达式,Hback(q)的表达式如下:
Figure BDA0003496662040000051
λback为常数,
Holap(q)的表达式如下:
Figure BDA0003496662040000052
g(k,j)表示是否引入松弛项,表达式如下:
Figure BDA0003496662040000053
γjk=λolap[2μjk-Djkjk]2,γjk表示修改后的松弛项为了避免松弛变量αjk为负值,λolap为常数,αjk表示氨基酸j与氨基酸k的松弛变量,该松弛变量的范围为0≤αjk≤(j-k)2-1,μjk为每个松弛变量需要编码的量子比特数,并且该量子比特数μjk的表达式如下:μjk=[2log2(k-j)]g(k,j)。
在本发明提供的方法中,还具有这样的特征:其中,Hpair(q)的表达式如下:
Figure BDA0003496662040000061
Pjk为第j个氨基酸与第k个氨基酸之间的非键和相互作用,
ωjk代表是否引入非键合相互作用,该ωjk的表达式如下:
Figure BDA0003496662040000062
发明的作用与效果
根据本发明所涉及的基于量子退火的蛋白质折叠方法,因为该方法将蛋白质折叠问题编码为可计算的优化问题(QUBO形式),具体采用正四面体格点模型模拟氨基酸多肽链分子在三维空间中的构成,并定义编码后的二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离,通过添加约束条件构建对应的伊辛哈密顿量,最后利用量子退火演化伊辛哈密顿量并得到最终的演化结果,即演化得到的能量最优解即为蛋白质对应的最稳定构像。因此该方法利用量子退火中的量子隧穿效应来解决上述蛋白质问题,可以大大压缩空间和时间复杂度,耗时少,具有广泛的应用前景。
附图说明
图1是本发明实施例中基于量子退火的蛋白质折叠方法的总流程图。
图2是本发明实施例中对应的正四面体格点模型的整体结构示意图。
图3是本发明实施例中对应的正四面体格点模型的两种编码方式的结构示意图。
图4是本发明的实施例中基于量子退火的蛋白质折叠装置的结构示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明基于量子退火的蛋白质折叠方法作具体阐述。
<实施例>
图1是本发明实施例中基于量子退火的蛋白质折叠方法的总流程图。
如图1所示,本发明实施例中基于量子退火的蛋白质折叠方法包括如下步骤:
步骤S1,将待处理氨基酸序列中的每一个氨基酸对应到正四面体格点模型的每一个格点上。
本实施例中,采用正四面体格点模型编码三维蛋白质结构,具体将正四面体格点模型的每一个格点对应到蛋白质结构的每一个氨基酸上,并假设任意两个相邻的氨基酸之间的距离相等,把肽链中的氨基酸按照0,1,2,···,N-1的顺序进行排列。
图2是本发明实施例中对应的正四面体格点模型的整体结构示意图。
如图2所示,在本发明实施例提供的正四面体格点模型中,正四面体格点模型中所有晶格包括第一类格点A与第二类格点B。图2中颜色较深的为第一类格点A,颜色较浅的为第二类格点B,并且任意一个第一类格点A或第二类格点B分别与之不同类别的四个格点相连接。
步骤S2,根据正四面体格点模型的预定结构将待处理氨基酸序列编码为对应的二进制氨基酸序列
图3是本发明实施例中对应的正四面体格点模型的两种编码方式的结构示意图,图3a为正四面体格点模型中第一种编码方式的结构示意图,图3b为正四面体格点模型中第二种编码方式的结构示意图。
如图3a所示,一个第一类格点A分别指向四个第二类格点B并分别对应氨基酸上的五个氨基酸,本实施例中,规定待处理氨基酸序列(共N个氨基酸)中前三个氨基酸编码为1100,剩余氨基酸采用01或10进行编码。具体地,第j+2个氨基酸与第j+3个氨基酸之间的二进制编码为:q2j-3q2j-2(j=2,3……N-2),因此,含有N个氨基酸肽链的二进制编码为:
q=11 00 q1 q2 q3 q4 …q(2N-7)q(2N-6)
并依次将11对应第一个氨基酸与第二个氨基酸转变为0,00对应第二个氨基酸与第三个氨基酸转变为1,q1q2对应第三个氨基酸与第四个氨基酸转变为2,按照同样的方式将含有N个氨基酸的肽链进行二进制编码,则q(2N-7)q(2N-6)对应第(N-1)个氨基酸与第N个氨基酸转变为N-2即得到编码后的二进制氨基酸序列。
如图3b所示,四个第一类格点A分别指向一个第二类格点B,并将该指向的方向采用预定的方式进行编码。本实施例中,第二种编码方式和第一种编码方式一样,在此不再赘述。
步骤S3,定义二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离。
本实施例中,定义第j个氨基酸在预定方向(即a、b、c即d四个方向)上的步长包括:
Figure BDA0003496662040000091
Figure BDA0003496662040000092
Figure BDA0003496662040000093
Figure BDA0003496662040000094
本实施例中,在定义好的第j个氨基酸的步长的加上正负号即可表示具体方向。
本实施例中,基于定义的第j个氨基酸在预定方向(即a、b、c及d四个方向)上的步长,定义第j个氨基酸分别在a、b、c及d四个方向的坐标。
其中,氨基酸j在预定方向a的坐标aj的表达式如下:
Figure BDA0003496662040000101
氨基酸j在预定方向b的坐标bj的表达式如下:
Figure BDA0003496662040000102
氨基酸j在预定方向c的坐标cj的表达式如下:
Figure BDA0003496662040000103
氨基酸j在预定方向d的坐标dj的表达式如下:
Figure BDA0003496662040000104
本实施例中,基于上述定义的第j个氨基酸在预定方向的坐标aj、bj、cj、及dj,则任意两个氨基酸(第j个氨基酸与第k个氨基酸)之间的距离为:
Djk=(aj-ak)2+(bj-bk)2+(cj-ck)2+(dj-dk)2
并且Djk的取值范围如下:
Figure BDA0003496662040000111
本实施例中,在金刚石的晶格结构中的晶格沿同一方向步行两次之间必须有一次指向别的方向(即无法连续向同一个方向步行两次)。
步骤S4,基于二进制氨基酸序列构建伊辛哈密顿量。
本实施例中,基于步骤S2编码得到的二进制氨基酸序列,构建总的伊辛哈密顿量,且总的伊辛哈密顿量H0(q)的表达式如下:
H0(q)=Hback(q)+Holap(q)+Hpair(q)
其中,q为二进制氨基酸序列,Hback(q)用于惩罚氨基酸折返,Holap(q)用于惩罚氨基酸重叠,Hpair(q)表示对应晶格上相邻的非键合氨基酸之间的相互作用。
具体地,当肽链的二进制编码中出现两个连续相同编码的氨基酸时,通过构建Hback(q)惩罚氨基酸折返,具体表达式如下:
Figure BDA0003496662040000112
其中,λback为已知的常数,可根据具体情况进行调解。
Figure BDA0003496662040000113
为第1个氨基酸在a方向上的步长,
Figure BDA0003496662040000114
为第i个氨基酸在a方向上的步长,
Figure BDA0003496662040000115
为第i+1个氨基酸在a方向上的步长。
具体地,当肽链经历多个步长后与前面的氨基酸重叠时,则构建用于惩罚氨基酸重叠的伊辛哈密顿量Holap(q)的表达式如下:
Figure BDA0003496662040000121
其中g(k,j)表示是否引入松弛项,该表达式如下:
Figure BDA0003496662040000122
其中,γjk=λolap[2μjk-Djkjk]2,γjk表示修改后的松弛项为了避免松弛变量αjk为负值,λolap为常数,αjk表示氨基酸j与氨基酸k的松弛变量,该松弛变量αjk的范围为0≤αjk≤(j-k)2-1,μjk为每个松弛变量需要编码的量子比特数,并且该量子比特数μjk的表达式如下:μjk=[2log2(k-j)]g(k,j)。
本实施例中构建的晶格上相邻的非键合氨基酸之间的相互作用的伊辛哈密顿量Hpair(q)的表达式如下:
Figure BDA0003496662040000123
其中,Pjk为第j个氨基酸与第k个氨基酸之间的非键和相互作用,ωjk代表是否引入非键合相互作用,并且该ωjk的表达式如下:
Figure BDA0003496662040000124
步骤S5,利用量子退火机对上述构建好的伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。
图4是本发明实施例中基于量子退火的蛋白质折叠装置的结构示意图。
如图4所示,发明实施例中基于量子退火的蛋白质折叠装置100包括待处理氨基酸序列映射模块101、二进制氨基酸序列编码模块102、二进制氨基酸序列条件约束模块103、伊辛哈密顿量构建模块104以及蛋白质对应的最稳定构像获取模块105。
待处理氨基酸序列映射模块101采用步骤S1的方法将待处理氨基酸序列中的每一个氨基酸映射到正四面体格点模型的每一个格点上。
二进制氨基酸序列编码模块102采用步骤S2的方法根据正四面体格点模型的预定结构将待处理氨基酸序列编码为对应的二进制氨基酸序列。
二进制氨基酸序列条件约束模块103采用步骤S3的方法定义二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离。
伊辛哈密顿量构建模块104采用步骤S4的方法基于二进制氨基酸序列构建伊辛哈密顿量。
蛋白质对应的最稳定构像获取模块105采用步骤S5的方法利用量子退火机对伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。
实施例的作用与效果
根据本实施例所涉及的基于量子退火的蛋白质折叠方法,因为该方法将蛋白质折叠问题编码为可计算的优化问题(QUBO形式),具体采用正四面体格点模型模拟氨基酸多肽链分子在三维空间中的构成,并定义编码后的二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离,通过添加约束条件构建对应的伊辛哈密顿量,最后利用量子退火演化伊辛哈密顿量并得到最终的演化结果,即演化得到的能量最优解即为蛋白质对应的最稳定构像。因此该方法利用量子退火中的量子隧穿效应来解决上述蛋白质问题,可以大大压缩空间和时间复杂度,耗时少,具有广泛的应用前景。
进一步地,对于存储有计算机程序的存储介质,该计算机程序可以被设置为运行时执行本实施例提供的基于量子退火的蛋白质折叠方法。
进一步地,对于包含存储器和处理器的电子产品,该存储器中存储有计算机程序,并且该处理器被设置为运行其存储的计算机程序以执行本实施例提供的基于量子退火的蛋白质折叠方法。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。

Claims (10)

1.一种基于量子退火的蛋白质折叠方法,其特征在于,包括:
将待处理氨基酸序列中的每一个氨基酸映射到正四面体格点模型的每一个格点上;
根据所述正四面体格点模型的预定结构将所述待处理氨基酸序列编码为对应的二进制氨基酸序列;
定义所述二进制氨基酸序列中任一氨基酸在预定方向上的步长、坐标及任意两个氨基酸之间的距离;
基于所述二进制氨基酸序列构建伊辛哈密顿量;
利用量子退火机对所述伊辛哈密顿量进行演化,演化得到的能量最优解即为蛋白质对应的最稳定构像。
2.根据权利要求1所述的方法,其特征在于:
其中,所述正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,
一个所述第一类格点A分别指向四个所述第二类格点B,并将该指向的方向采用预定的方式进行编码。
3.根据权利要求1所述的方法,其特征在于,还包括:
其中,所述正四面体格点模型中所有晶格包括第一类格点A与第二类格点B,
四个所述第一类格点A分别指向一个所述第二类格点B,并将该指向的方向采用预定的方式进行编码。
4.根据权利要求1所述的方法,其特征在于:
其中,所述二进制氨基酸序列包括:
q=11 00 q1 q2 q3 q4…q(2N-7)q(2N-6)
所述1100为所述待处理氨基酸序列中前三个氨基酸的编码方式。
5.根据权利要求1所述的方法,其特征在于:
所述任一氨基酸在预定方向上的步长的表达式如下:
Figure FDA0003496662030000021
Figure FDA0003496662030000022
Figure FDA0003496662030000023
Figure FDA0003496662030000024
其中,所述
Figure FDA0003496662030000025
所述
Figure FDA0003496662030000026
所述
Figure FDA0003496662030000027
及所述
Figure FDA0003496662030000028
分别表示氨基酸j在预定方向a、b、c、d上的步长。
6.根据权利要求5所述的方法,其特征在于:
基于所述任一氨基酸在预定方向上的步长所述任一氨基酸在预定方向上的所述坐标的表达式示如下:
其中,氨基酸j在预定方向a的坐标aj的表达式如下:
Figure FDA0003496662030000031
氨基酸j在预定方向b的坐标bj的表达式如下:
Figure FDA0003496662030000032
氨基酸j在预定方向c的坐标cj的表达式如下:
Figure FDA0003496662030000033
氨基酸j在预定方向d的坐标dj的表达式如下:
Figure FDA0003496662030000034
7.根据权利要求1所述的方法,其特征在于:
其中,所述任意两个氨基酸之间的距离表示为氨基酸j与氨基酸k之间的距离Djk,该Djk的表达式及范围分别如下:
Djk=(aj-ak)2+(bj-bk)2+(cj-ck)2+(dj-dk)2
Figure FDA0003496662030000041
8.根据权利要求1或4所述的方法,其特征在于:
所述伊辛哈密顿量H0(q)的表达式如下:
H0(q)=Hback(q)+Holap(q)+Hpair(q)
其中,q为所述二进制氨基酸序列,Hback(q)用于惩罚氨基酸折返,Holap(q)用于惩罚氨基酸重叠,Hpair(q)表示对应晶格上相邻的非键合氨基酸之间的相互作用。
9.根据权利要求8所述的方法,其特征在于:
其中,基于所述步长的表达式,所述Hback(q)的表达式如下:
Figure FDA0003496662030000042
λback为常数,
所述Holap(q)的表达式如下:
Figure FDA0003496662030000043
g(k,j)表示是否引入松弛项,表达式如下:
Figure FDA0003496662030000044
Figure FDA0003496662030000051
γjk=λolap[2μjk-Djkjk]2
γjk表示修改后的松弛项为了避免松弛变量αjk为负值,λolap为常数,αjk表示氨基酸j与氨基酸k的松弛变量,该松弛变量的范围为0≤αjk≤(j-k)2-1,
所述μjk为每个所述松弛变量需要编码的量子比特数,并且该量子比特数μjk的表达式如下:μjk=[2log2(k-j)]g(k,j)。
10.根据权利要求8所述的方法,其特征在于:
其中,所述Hpair(q)的表达式如下:
Figure FDA0003496662030000052
Pjk为第j个氨基酸与第k个氨基酸之间的非键和相互作用,
ωjk代表是否引入非键合相互作用,该ωjk的表达式如下:
Figure FDA0003496662030000053
CN202210116503.XA 2022-02-07 2022-02-07 一种基于量子退火的蛋白质折叠方法 Pending CN114446391A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210116503.XA CN114446391A (zh) 2022-02-07 2022-02-07 一种基于量子退火的蛋白质折叠方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210116503.XA CN114446391A (zh) 2022-02-07 2022-02-07 一种基于量子退火的蛋白质折叠方法

Publications (1)

Publication Number Publication Date
CN114446391A true CN114446391A (zh) 2022-05-06

Family

ID=81370989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210116503.XA Pending CN114446391A (zh) 2022-02-07 2022-02-07 一种基于量子退火的蛋白质折叠方法

Country Status (1)

Country Link
CN (1) CN114446391A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116052802A (zh) * 2023-03-31 2023-05-02 北京玻色量子科技有限公司 一种相干伊辛机、基于其的多肽设计方法和装置
WO2023226310A1 (zh) * 2022-05-23 2023-11-30 华为云计算技术有限公司 一种分子优化方法以及装置
CN117497092A (zh) * 2024-01-02 2024-02-02 合肥微观纪元数字科技有限公司 基于动态规划和量子退火的rna结构预测方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226310A1 (zh) * 2022-05-23 2023-11-30 华为云计算技术有限公司 一种分子优化方法以及装置
CN116052802A (zh) * 2023-03-31 2023-05-02 北京玻色量子科技有限公司 一种相干伊辛机、基于其的多肽设计方法和装置
CN117497092A (zh) * 2024-01-02 2024-02-02 合肥微观纪元数字科技有限公司 基于动态规划和量子退火的rna结构预测方法及系统
CN117497092B (zh) * 2024-01-02 2024-05-14 微观纪元(合肥)量子科技有限公司 基于动态规划和量子退火的rna结构预测方法及系统

Similar Documents

Publication Publication Date Title
CN114446391A (zh) 一种基于量子退火的蛋白质折叠方法
CN101183873B (zh) 一种基于bp神经网络的嵌入式系统数据压缩解压缩方法
JP2021060992A (ja) マシンラーニングシステム及び方法
CN114724012A (zh) 基于时空跨尺度注意力融合热带不稳定波预警方法及装置
Yin et al. Pseudo inverse versus iterated projection: Novel learning approach and its application on broad learning system
Binder et al. Symmetric minimally entangled typical thermal states for canonical and grand-canonical ensembles
Li et al. Optimizing lossy compression with adjacent snapshots for n-body simulation data
Son et al. SAUM: Symmetry-aware upsampling module for consistent point cloud completion
Cao et al. UTrans-Net: A model for short-term precipitation prediction
CN110263917A (zh) 一种神经网络压缩方法及装置
Coello Evolutionary multiobjective optimization: current and future challenges
Coleman et al. Unified Embedding: Battle-tested feature representations for web-scale ML systems
Kieffer et al. Structural complexity of random binary trees
Yang et al. RETRACTED: Distilled and filtered deep neural networks for real-time object detection in edge computing
Wolff Concepts, states, and systems
Han et al. Density matrix reconstruction using non-negative matrix product states
CN115952915A (zh) 一种使用模糊熵分类的能耗预测优化方法
Eckhardt et al. On-the-fly memory compression for multibody algorithms
Hong et al. Faster capacitated arc routing: A sequence-to-sequence approach
Lv et al. Parking space prediction algorithm based on recurrent neural network and ensemble learning algorithm
CN113077843A (zh) 分布式列子集选择方法、系统及白血病基因信息挖掘方法
Radiuk Application of a genetic algorithm to search for the optimal convolutional neural network architecture with weight distribution
Yeramian Complexity and tractability. Statistical mechanics of helix-coil transitions in circular DNA as a model-problem
Yang et al. Application of BP neural network in image compression under the matlab
Datta et al. A real-integer-discrete-coded differential evolution algorithm: A preliminary study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination