CN116052802A - 一种相干伊辛机、基于其的多肽设计方法和装置 - Google Patents
一种相干伊辛机、基于其的多肽设计方法和装置 Download PDFInfo
- Publication number
- CN116052802A CN116052802A CN202310330775.4A CN202310330775A CN116052802A CN 116052802 A CN116052802 A CN 116052802A CN 202310330775 A CN202310330775 A CN 202310330775A CN 116052802 A CN116052802 A CN 116052802A
- Authority
- CN
- China
- Prior art keywords
- energy
- xin
- amino acid
- polypeptide
- coherent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 77
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 77
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000001427 coherent effect Effects 0.000 title claims abstract description 45
- 238000013461 design Methods 0.000 title claims abstract description 25
- 150000001413 amino acids Chemical class 0.000 claims abstract description 138
- 239000000178 monomer Substances 0.000 claims abstract description 48
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 35
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 35
- 230000003993 interaction Effects 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 18
- 210000004896 polypeptide structure Anatomy 0.000 claims abstract description 14
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 230000003287 optical effect Effects 0.000 claims description 23
- 239000002253 acid Substances 0.000 claims description 20
- 239000013307 optical fiber Substances 0.000 claims description 18
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 18
- -1 isooctyl Chemical group 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 7
- 230000010355 oscillation Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 4
- 239000003054 catalyst Substances 0.000 claims description 3
- 239000000835 fiber Substances 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 7
- 238000009510 drug design Methods 0.000 abstract description 2
- 239000000243 solution Substances 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 8
- 230000006872 improvement Effects 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 5
- 230000005366 Ising model Effects 0.000 description 4
- 238000002922 simulated annealing Methods 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- NHTMVDHEPJAVLT-UHFFFAOYSA-N Isooctane Chemical compound CC(C)CC(C)(C)C NHTMVDHEPJAVLT-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- JVSWJIKNEAIKJW-UHFFFAOYSA-N dimethyl-hexane Natural products CCCCCC(C)C JVSWJIKNEAIKJW-UHFFFAOYSA-N 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 239000012086 standard solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及一种相干伊辛机、基于其的多肽设计方法和装置,属于药物设计技术领域,解决启发式算法需要大量的时间来进行迭代进而无法求出最优解的问题。方法包括:从PDB数据库中获取蛋白质文件;基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。快速的完成蛋白质骨架固定下的序列优化过程。
Description
技术领域
本发明涉及药物设计技术领域,尤其涉及一种相干伊辛机、基于其的多肽设计方法和装置。
背景技术
Rosetta软件套件是蛋白质设计和结构预测的优秀软件之一, 该软件使用基于模拟退火的启发式算法能够实现蛋白质设计任务。
Rosetta的设计过程主要是基于启发式,称为Packer ,使用基于模拟退火来搜索rotamers(称为构象 )空间解决序列设计问题,虽然不能保证收敛到全局最优,但往往会很快找到接近最优的高质量解决方案。但是,随着用于设计位置的数量(N)的增加和每个位置的rotamers可能性数量(D)生长,rotamers的空间对于模拟退火方法来说增长太快。大型传统蛋白质设计任务或具有多种化学构建块选择的非标准设计任务可能会很快变得棘手。Packer中所用的模拟退火方法对energy landscape的描述也非常敏感,有时无法找到解决方案,陷入了局部最小值。但是当使用其他方法,如死端消除算法(dead-end elimination)或分支定界(branch-and-bound )搜索时,对于大多数设计任务来说,速度无法满足要求。
在蛋白质领域的传统模型的筛选方式大多数采用启发式算法,耗时长,且可能无法计算出最优解,随着设计复杂度的增加,即便是超级计算机也无法应对。
因此,现有技术存在以下缺点:使用启发式算法:需要大量的时间来进行迭代,有可能无法求出最优解,计算量大;以及传统模型需要大量的采样才可以拿到一个能量较低的构象,且此构象有可能并非全局最优解。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种相干伊辛机、基于其的多肽设计方法和装置,用以解决启发式算法需要大量的时间来进行迭代,可能无法求出最优解并且传统模型需要大量的采样才可以拿到一个能量较低的构象问题。
一方面,本发明实施例提供了基于相干伊辛机的多肽设计方法,包括:从PDB数据库中获取蛋白质文件;基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成所述伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
上述技术方案的有益效果如下:使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph(称为相互作用图),通过数学建模使用伊辛模型来实现对多肽的结构以及序列进行优化,与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
基于上述方法的进一步改进,计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
基于上述方法的进一步改进,根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型包括:
其中,O(S i )表示rotamerS i 处的单体能量,T(S j ,S k )代表了rotamerS j 和rotamerS k 的二体作用能;
其中,为氨基酸单体能量,两个氨基酸之间的二体能量,为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j,表示种类为j的氨基酸的单体能量,表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
基于上述方法的进一步改进,所述约束项包括:约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
基于上述方法的进一步改进,通过将约束项添加至所述伊辛模型中来限制解的数目包括:
其中,第三项为所述约束项,P为0至+∞之间的调节参数。
另一方面,本发明实施例提供了一种基于相干伊辛机的多肽设计装置,包括:获取模块,用于从PDB数据库中获取蛋白质文件;相互作用图生成模块,用于基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;伊辛模型生成模块,用于根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及优化模块,用于使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
基于上述装置的进一步改进,所述相互作用图生成模块,用于将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
其中,为氨基酸单体能量,两个氨基酸之间的二体能量,为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j,表示种类为j的氨基酸的单体能量,表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
基于上述装置的进一步改进,添加约束项的伊辛模型包括:
其中,第三项为所述约束项,P为0至+∞之间的调节参数,
所述约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
又一方面,本发明实施例提供了一种相干伊辛机,包括:激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;二次谐波装置,将所述两束光中的a光束进行倍频过程;光纤环路,将倍频后的a光束注入所述光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,所述光脉冲在所述光纤环路中循环;第二耦合器,将所述两束光中的b光束顺序经过强度调制器和相位调制器的调制后,经由所述第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;第三耦合器,在所述第三耦合器端,输出所述光纤环路中的一部分光;光学探测器,对从所述光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将所述光脉冲的压缩相位信息提供给FPGA;以及所述FPGA,将需要计算的数据同时作为编程数据输入所述FPGA,所述FPGA输出调制信号给所述强度调制器和所述相位调制器。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模使用伊辛模型来实现对多肽的结构以及序列进行优化,与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
2、通过添加约束项,使得解的数目等于序列长度并且同一个rotamer只能有一个解。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件;
图1为根据本发明实施例的基于相干伊辛机的多肽设计方法的流程图;
图2为根据本发明实施例的蛋白质结构图;
图3为根据本发明实施例的单个氨基酸的rotamer的示图;
图4A和图4B分别为优化前的蛋白质结构图和优化后的蛋白质结构图;
图5为根据本发明实施例的相互作用图,其中,基于蛋白质单体能量和二体能量生成相互作用图;
图6为根据本发明实施例的基于相干伊辛机的多肽设计装置的框图;
图7为根据本发明实施例的包括用户端和服务器端的多肽设计系统的框图;以及
图8为根据本发明实施例的相干伊辛机的框图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
参考图1,本发明的一个具体实施例,公开了一种基于相干伊辛机的多肽设计方法,包括:在步骤S101中,从PDB数据库中获取蛋白质文件;在步骤S102中,基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;在步骤S103中,根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及在步骤S104中,使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
与现有技术相比,本实施例提供的基于相干伊辛机的多肽设计方法中,使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模转化为伊辛模型,利用伊辛机计算来实现对多肽的结构以及序列进行优化(伊辛机计算出更稳定的多肽序列以达到优化效果),与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
下文中,参考图1,对根据本发明实施例的基于相干伊辛机的多肽设计方法的各个步骤进行详细描述。
在步骤S101中,从PDB数据库中获取蛋白质文件。
在步骤S102中,基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图。计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:将每个氨基酸的单体能量储存在能量图中;以及将两个不同位置氨基酸之间的二体能量储存在能量图中以生成相互作用图。
在步骤S103中,根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体。根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型包括:
其中,O(S i )表示rotamerS i 处的单体能量,T(S j ,S k )代表了rotamerS j 和rotamerS k 的二体作用能;
具体地,为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。表示种类为j的氨基酸的单体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;表示遍历氨基酸序列每两位相邻的氨基酸残基i和i+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
在步骤S104中,使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。通过将约束项添加至伊辛模型中来限制解的数目包括:
其中,第三项为约束项,P为0至+∞之间的调节参数。
约束项包括:约束项为q i,1+…+q i,m =1,与约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。考虑区分一下种类和构象,这个约束含义是链的残基长度固定,重新定义一个多加一个下标区分构象和残基点位。
参考图6,本发明的另一个具体实施例,公开了一种基于相干伊辛机的多肽设计装置,包括:获取模块602,用于从PDB数据库中获取蛋白质文件;相互作用图生成模块604,用于基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;伊辛模型生成模块606,用于根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及优化模块608,用于使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
相互作用图生成模块604,用于将每个氨基酸的单体能量储存在能量图中;以及将两个不同位置氨基酸之间的二体能量储存在能量图中以生成相互作用图。
伊辛模型606包括:
具体地,为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。表示种类为j的氨基酸的单体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;表示遍历氨基酸序列每两位相邻的氨基酸残基i和i+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
添加约束项的伊辛模型包括:
其中,第三项为所述约束项,P为0至+∞之间的调节参数,约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
在可选实施例中,添加约束项的伊辛模型包括:
其中,第三项为第一约束项的展开项,第四项为第二约束项的展开项,以及P1和P2均为0至+∞之间的调节参数,所述第一约束项为q 1+…+q n =m,与所述第一约束项相对应的第一惩罚项为P1[q 1+…+q n +(-m)]2,使得解的数目等于序列长度;以及所述第二约束项为q 1+…+q j =1,与所述第二约束项相对应的第二惩罚项为P2[q 1+…+q j +(-1)]2,使得同一个旋转异构体只有一个解。
参考图8,本发明的又一个具体实施例,公开了一种相干伊辛机,包括:激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;二次谐波装置,将两束光中的一束光(即,a光束)进行倍频过程;光纤环路,将倍频后的光注入光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,光脉冲在光纤环路中循环;第二耦合器,将两束光中的另一束光(即,b光束)顺序经过强度调制器和相位调制器的调制后,经由第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;第三耦合器,在第三耦合器端,输出光纤环路中的一部分光;光学探测器,对从光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将光脉冲的压缩相位信息提供给FPGA;以及FPGA,将需要计算的数据同时作为编程数据输入FPGA,FPGA输出调制信号给强度调制器和相位调制器。
求解的计算主要分为两部分,FPGA计算是其中一部分:
一:FPGA计算当前解向量与伊辛矩阵的乘法,得到新的向量,然后控制强度调制器和相位调制器将第一耦合器分出来的光束调制成新的向量的光脉冲表达形式。新的向量与原向量(光脉冲形式)在第二耦合器对齐并叠加,产生干涉脉冲。
二:步骤一产生的干涉脉冲重新进入激发光学参量振荡器,产生新的真空压缩光脉冲,新的真空压缩光脉冲对应的解向量能量进一步降低。这一步是利用量子物理特性进行的计算。
经过有限次迭代之后,解向量会稳定在一个值。
下文中,参考图2至图5,以及图7和图8,以具体实例的方式,对根据本发明实施例的基于相干伊辛机的多肽设计方法进行详细说明。
用于蛋白质药物研发的基于量子计算机的多肽设计方法。可以高通量的优化多肽药物的结构以及序列,使用者输入多肽结构,服务器便可以计算其低能构象以及对其序列进行优化,返回给使用者,加速多肽药物研发过程。本文使用相干伊辛机(CoherentIsingMachine, CIM)将多肽设计问题转化为Ising模型。
使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模使用Ising模型(称为伊辛模型)来实现对多肽的结构(参考图4A)以及序列进行优化(参考图4B),与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。使用者可以上传多肽结构,后段服务器会对其进行转化,并通过相干伊辛机给出最优计算结果,展示三维模型给使用者。对于多肽设计问题,与传统计算机相比,相干伊辛机会更加快速准确。
1、获取蛋白质文件
从PDB数据库(https://www.rcsb.org)中或者在本地构建蛋白质结构,拿到pdb格式的蛋白质结构文件。
2、获取InteractionGraph
One-body energies(单体能量):氨基酸内能,储存在能量图中,如图5所示,能量图是上文中所有氨基酸的单体能量,或者每两个氨基酸之间的二体能量的查询表。Two-body energies(二体能量):两个氨基酸之间的能量,储存在能量图中。
3、转化为Ising Model
则我们可以使用一组向量来表示解:
则其解的总能量可以表示为下侧,符合Ising model(伊辛模型),可以使用量子计算机进行加速。在下述等式中,代表了rotamer处的one-body能量,代表了rotamer和的two-body 作用能。
具体地,为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。表示种类为j的氨基酸的单体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;表示遍历氨基酸序列每两位相邻的氨基酸残基i和i+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
4、增加约束项
在SDK求解之后,需要控制解的形式严格为一个位置出现一个rotamer(旋转异构体)。
即为,当我们求解50个氨基酸的多肽时。QUBO矩阵元素为1的数目应该为50个并且列坐标各不相同。增加约束项,限制解的数目。
表1:约束项
公式中的第三项为约束项,其中,q代表在某位置是否选择某种氨基酸。
5、多肽设计的计算装置
如图7所示,在用户使用时,只需要输入筛选的多肽结构文件,在用户端会展示其初始结构以及相关的序列信息,Chi角信息。便于用户进行可视化的三维操作,随后将数据传输回服务器,后台使用PyRosetta构建InteractionGraph,并转化为QUBO模型传输给相干伊辛机,计算出最优解,整个过程在使用量子计算机情况下,时间消耗大大减少,并且用户可以在使用界面看到筛选出的结构模型以及打分。随后使用这些多肽结构进行下一步理论验证或者实验验证。
根据本发明实施例的用于多肽设计的计算装置,并使用量子计算机进行加速,可以快速的计算多肽的低能构象,帮助研究人员优化蛋白质结构,助力药物研发过程。
本模型与传统的蛋白质侧链优化模型相比,解决了启发式算法可能消耗长时间但无法得出标准解的问题,本文使用的伊辛模型求解多肽设计问题的方法更为快速和准确。本文利用量子计算机的纠缠态和重叠态以及全联接的特性,提出了一个更为优秀的求解分子结合模式的模型,并将其放置于web端以进行展示,供给用户使用。
与现有技术相比,本发明的优点在于可以更为快速的获取低能多肽构象,优化多肽结构。
6、相干伊辛机CIM的工作原理
激光器(laser)作为泵浦光源,通过第一耦合器分为两束,一束光经过SHG(二次谐波装置)晶体进行倍频过程,另外一路光作为注入光。
倍频后的光注入光纤环路,同时激发OPO(光学参量振荡器)进行光学参量震荡过程,产生真空压缩光脉冲,这些光脉冲在光纤环路中循环。
在第三耦合器端,一部分光分出进行零差频探测,获得光脉冲的压缩相位信息,并作为部分输入提供给FPGA。
需要计算的数据(J ij ),该数据是增加约束项,该步骤的公式提取的伊辛矩阵,同时作为编程数据输入FPGA,该计算单元输出调制信号给强度调制器和相位调制器。
第一耦合器的一路光经过IM(强度调制)和PM(相位调制)的调制,经过第二耦合器重新输入到光纤环路中,实现脉冲注入。
计算开始后,泵浦激光的功率逐渐增加,根据最小增益原则,相互左右的脉冲信号会经历相变,出现相位的塌缩,经过PD探测器(光学探测器)的测量,可以得到在满足输入J ij 设计的情况下,组合优化的计算结果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于相干伊辛机的多肽设计方法,其特征在于,包括:
从PDB数据库中获取蛋白质文件;
基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;
根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及
使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
2.根据权利要求1所述的基于相干伊辛机的多肽设计方法,其特征在于,计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:
将所述每个氨基酸的单体能量储存在能量图中;以及
将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
4.根据权利要求3所述的基于相干伊辛机的多肽设计方法,其特征在于,所述约束项包括:
约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
6.一种基于相干伊辛机的多肽设计装置,其特征在于,包括:
获取模块,用于从PDB数据库中获取蛋白质文件;
相互作用图生成模块,用于基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;
伊辛模型生成模块,用于根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及
优化模块,用于使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
7.根据权利要求6所述的基于相干伊辛机的多肽设计装置,其特征在于,所述相互作用图生成模块,用于将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
10.一种相干伊辛机,其特征在于,包括:
激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;
二次谐波装置,将所述两束光中a光束进行倍频过程;
光纤环路,将倍频后的a光束注入所述光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,所述光脉冲在所述光纤环路中循环;
第二耦合器,将所述两束光中的b光束顺序经过强度调制器和相位调制器的调制后,经由所述第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;
第三耦合器,在所述第三耦合器端,输出所述光纤环路中的一部分光;
光学探测器,对从所述光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将所述光脉冲的压缩相位信息提供给FPGA;
FPGA,将需要计算的数据同时作为编程数据输入所述FPGA,所述FPGA输出调制信号给所述强度调制器和所述相位调制器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310330775.4A CN116052802B (zh) | 2023-03-31 | 2023-03-31 | 一种相干伊辛机、基于其的多肽设计方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310330775.4A CN116052802B (zh) | 2023-03-31 | 2023-03-31 | 一种相干伊辛机、基于其的多肽设计方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116052802A true CN116052802A (zh) | 2023-05-02 |
CN116052802B CN116052802B (zh) | 2023-07-07 |
Family
ID=86125870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310330775.4A Active CN116052802B (zh) | 2023-03-31 | 2023-03-31 | 一种相干伊辛机、基于其的多肽设计方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116052802B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116597917A (zh) * | 2023-07-19 | 2023-08-15 | 北京玻色量子科技有限公司 | 一种基于光量子计算机的分子对接方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130304432A1 (en) * | 2012-05-09 | 2013-11-14 | Memorial Sloan-Kettering Cancer Center | Methods and apparatus for predicting protein structure |
CN113178775A (zh) * | 2021-04-25 | 2021-07-27 | 北京玻色量子科技有限公司 | 一种基于片上回音壁模式光学微腔的相干伊辛机 |
CN114446391A (zh) * | 2022-02-07 | 2022-05-06 | 上海图灵智算量子科技有限公司 | 一种基于量子退火的蛋白质折叠方法 |
CN114496065A (zh) * | 2022-02-07 | 2022-05-13 | 上海图灵智算量子科技有限公司 | 蛋白质侧链结构预测装置、方法以及计算机可读介质 |
CN114512178A (zh) * | 2022-02-02 | 2022-05-17 | 上海图灵智算量子科技有限公司 | 基于伊辛机量子退火的密码子优化方法 |
WO2022123494A1 (en) * | 2020-12-10 | 2022-06-16 | 1Qb Information Technologies Inc. | Methods and systems for solving a weighted maximum clique problem |
CN114882940A (zh) * | 2022-03-28 | 2022-08-09 | 北京玻色量子科技有限公司 | 一种基于相干伊辛机的分子对接方法和装置 |
-
2023
- 2023-03-31 CN CN202310330775.4A patent/CN116052802B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130304432A1 (en) * | 2012-05-09 | 2013-11-14 | Memorial Sloan-Kettering Cancer Center | Methods and apparatus for predicting protein structure |
WO2022123494A1 (en) * | 2020-12-10 | 2022-06-16 | 1Qb Information Technologies Inc. | Methods and systems for solving a weighted maximum clique problem |
CN113178775A (zh) * | 2021-04-25 | 2021-07-27 | 北京玻色量子科技有限公司 | 一种基于片上回音壁模式光学微腔的相干伊辛机 |
CN114512178A (zh) * | 2022-02-02 | 2022-05-17 | 上海图灵智算量子科技有限公司 | 基于伊辛机量子退火的密码子优化方法 |
CN114446391A (zh) * | 2022-02-07 | 2022-05-06 | 上海图灵智算量子科技有限公司 | 一种基于量子退火的蛋白质折叠方法 |
CN114496065A (zh) * | 2022-02-07 | 2022-05-13 | 上海图灵智算量子科技有限公司 | 蛋白质侧链结构预测装置、方法以及计算机可读介质 |
CN114882940A (zh) * | 2022-03-28 | 2022-08-09 | 北京玻色量子科技有限公司 | 一种基于相干伊辛机的分子对接方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116597917A (zh) * | 2023-07-19 | 2023-08-15 | 北京玻色量子科技有限公司 | 一种基于光量子计算机的分子对接方法和装置 |
CN116597917B (zh) * | 2023-07-19 | 2023-10-20 | 北京玻色量子科技有限公司 | 一种基于光量子计算机的分子对接方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116052802B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116052802B (zh) | 一种相干伊辛机、基于其的多肽设计方法和装置 | |
Sonmez et al. | BIM integrated smart contract for construction project progress payment administration | |
Campanelli et al. | Second order gauge invariant gravitational perturbations of a Kerr black hole | |
WO2023185658A1 (zh) | 一种基于相干伊辛机的分子对接方法和装置 | |
Kira et al. | Cluster-expansion representation in quantum optics | |
CN114444016A (zh) | 实现伊辛模型的方法 | |
US12067458B2 (en) | Parameter initialization on quantum computers through domain decomposition | |
US20200176074A1 (en) | Method and device for searching structure of cyclic molecule, and non-transitory recording medium | |
Kiesewetter et al. | Coherent ising machine with quantum feedback: The total and conditional master equation methods | |
Hillmann et al. | Designing Kerr interactions for quantum information processing via counterrotating terms of asymmetric Josephson-junction loops | |
Pizzimenti et al. | Non-Gaussian photonic state engineering with the quantum frequency processor | |
Rodriguez-Fernandez et al. | Enhancing predictive capabilities in fusion burning plasmas through surrogate-based optimization in core transport solvers | |
Olama et al. | Distributed primal outer approximation algorithm for sparse convex programming with separable structures | |
Yuwono et al. | Time-dependent equation-of-motion coupled-cluster simulations with a defective Hamiltonian | |
Lautenbacher et al. | Planning support for enterprise changes | |
Patel et al. | Laser-atom interaction simulator derived from quantum electrodynamics | |
Ledet et al. | Toward model-driven engineering principles and practices for model replicability and experiment reproducibility | |
Mohanasubha et al. | A method of identifying integrability quantifiers from an obvious λ-symmetry in second-order nonlinear ordinary differential equations | |
Clarisó et al. | Incremental Verification of UML/OCL Models. | |
Bocanegra-Garay et al. | Exploring supersymmetry: Interchangeability between Jaynes-Cummings and anti-Jaynes-Cummings models | |
Uysal | Toward a Method Engineering Framework for Project Management and Machine Learning | |
Ortuno Gonzalez | Fermions in cavity QED | |
Colin et al. | A numerical model for light interaction with a two-level atom medium | |
Silega et al. | Applying and MDD-Based Approach to Automatically Generate System Models to Develop Systems Involving Users | |
Fux et al. | OQuPy: A Python package to efficiently simulate non-Markovian open quantum systems with process tensors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |