CN116052802A - 一种相干伊辛机、基于其的多肽设计方法和装置 - Google Patents

一种相干伊辛机、基于其的多肽设计方法和装置 Download PDF

Info

Publication number
CN116052802A
CN116052802A CN202310330775.4A CN202310330775A CN116052802A CN 116052802 A CN116052802 A CN 116052802A CN 202310330775 A CN202310330775 A CN 202310330775A CN 116052802 A CN116052802 A CN 116052802A
Authority
CN
China
Prior art keywords
energy
xin
amino acid
polypeptide
coherent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310330775.4A
Other languages
English (en)
Other versions
CN116052802B (zh
Inventor
文凯
马寅
曹崇育
刘若辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Bose Quantum Technology Co ltd
Original Assignee
Beijing Bose Quantum Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bose Quantum Technology Co ltd filed Critical Beijing Bose Quantum Technology Co ltd
Priority to CN202310330775.4A priority Critical patent/CN116052802B/zh
Publication of CN116052802A publication Critical patent/CN116052802A/zh
Application granted granted Critical
Publication of CN116052802B publication Critical patent/CN116052802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种相干伊辛机、基于其的多肽设计方法和装置,属于药物设计技术领域,解决启发式算法需要大量的时间来进行迭代进而无法求出最优解的问题。方法包括:从PDB数据库中获取蛋白质文件;基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。快速的完成蛋白质骨架固定下的序列优化过程。

Description

一种相干伊辛机、基于其的多肽设计方法和装置
技术领域
本发明涉及药物设计技术领域,尤其涉及一种相干伊辛机、基于其的多肽设计方法和装置。
背景技术
Rosetta软件套件是蛋白质设计和结构预测的优秀软件之一, 该软件使用基于模拟退火的启发式算法能够实现蛋白质设计任务。
Rosetta的设计过程主要是基于启发式,称为Packer ,使用基于模拟退火来搜索rotamers(称为构象 )空间解决序列设计问题,虽然不能保证收敛到全局最优,但往往会很快找到接近最优的高质量解决方案。但是,随着用于设计位置的数量(N)的增加和每个位置的rotamers可能性数量(D)生长,rotamers的空间对于模拟退火方法来说增长太快。大型传统蛋白质设计任务或具有多种化学构建块选择的非标准设计任务可能会很快变得棘手。Packer中所用的模拟退火方法对energy landscape的描述也非常敏感,有时无法找到解决方案,陷入了局部最小值。但是当使用其他方法,如死端消除算法(dead-end elimination)或分支定界(branch-and-bound )搜索时,对于大多数设计任务来说,速度无法满足要求。
在蛋白质领域的传统模型的筛选方式大多数采用启发式算法,耗时长,且可能无法计算出最优解,随着设计复杂度的增加,即便是超级计算机也无法应对。
因此,现有技术存在以下缺点:使用启发式算法:需要大量的时间来进行迭代,有可能无法求出最优解,计算量大;以及传统模型需要大量的采样才可以拿到一个能量较低的构象,且此构象有可能并非全局最优解。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种相干伊辛机、基于其的多肽设计方法和装置,用以解决启发式算法需要大量的时间来进行迭代,可能无法求出最优解并且传统模型需要大量的采样才可以拿到一个能量较低的构象问题。
一方面,本发明实施例提供了基于相干伊辛机的多肽设计方法,包括:从PDB数据库中获取蛋白质文件;基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成所述伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
上述技术方案的有益效果如下:使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph(称为相互作用图),通过数学建模使用伊辛模型来实现对多肽的结构以及序列进行优化,与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
基于上述方法的进一步改进,计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
基于上述方法的进一步改进,根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型包括:
Figure SMS_1
其中,O(S i )表示rotamerS i 处的单体能量,T(S j ,S k )代表了rotamerS j 和rotamerS k 的二体作用能;
Figure SMS_2
其中,
Figure SMS_3
为氨基酸单体能量,
Figure SMS_4
两个氨基酸之间的二体能量,
Figure SMS_5
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j
Figure SMS_6
表示种类为j的氨基酸的单体能量,
Figure SMS_7
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
基于上述方法的进一步改进,所述约束项包括:约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
基于上述方法的进一步改进,通过将约束项添加至所述伊辛模型中来限制解的数目包括:
Figure SMS_8
其中,第三项为所述约束项,P为0至+∞之间的调节参数。
另一方面,本发明实施例提供了一种基于相干伊辛机的多肽设计装置,包括:获取模块,用于从PDB数据库中获取蛋白质文件;相互作用图生成模块,用于基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;伊辛模型生成模块,用于根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及优化模块,用于使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
基于上述装置的进一步改进,所述相互作用图生成模块,用于将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
基于上述装置的进一步改进,所述伊辛模型包括:
Figure SMS_9
其中,
Figure SMS_10
表示rotamer
Figure SMS_11
处的单体能量,
Figure SMS_12
代表了rotamer
Figure SMS_13
和rotamer
Figure SMS_14
的二体作用能;
Figure SMS_15
其中,
Figure SMS_16
为氨基酸单体能量,
Figure SMS_17
两个氨基酸之间的二体能量,
Figure SMS_18
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j
Figure SMS_19
表示种类为j的氨基酸的单体能量,
Figure SMS_20
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
基于上述装置的进一步改进,添加约束项的伊辛模型包括:
Figure SMS_21
其中,第三项为所述约束项,P为0至+∞之间的调节参数,
所述约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
又一方面,本发明实施例提供了一种相干伊辛机,包括:激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;二次谐波装置,将所述两束光中的a光束进行倍频过程;光纤环路,将倍频后的a光束注入所述光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,所述光脉冲在所述光纤环路中循环;第二耦合器,将所述两束光中的b光束顺序经过强度调制器和相位调制器的调制后,经由所述第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;第三耦合器,在所述第三耦合器端,输出所述光纤环路中的一部分光;光学探测器,对从所述光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将所述光脉冲的压缩相位信息提供给FPGA;以及所述FPGA,将需要计算的数据同时作为编程数据输入所述FPGA,所述FPGA输出调制信号给所述强度调制器和所述相位调制器。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模使用伊辛模型来实现对多肽的结构以及序列进行优化,与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
2、通过添加约束项,使得解的数目等于序列长度并且同一个rotamer只能有一个解。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件;
图1为根据本发明实施例的基于相干伊辛机的多肽设计方法的流程图;
图2为根据本发明实施例的蛋白质结构图;
图3为根据本发明实施例的单个氨基酸的rotamer的示图;
图4A和图4B分别为优化前的蛋白质结构图和优化后的蛋白质结构图;
图5为根据本发明实施例的相互作用图,其中,基于蛋白质单体能量和二体能量生成相互作用图;
图6为根据本发明实施例的基于相干伊辛机的多肽设计装置的框图;
图7为根据本发明实施例的包括用户端和服务器端的多肽设计系统的框图;以及
图8为根据本发明实施例的相干伊辛机的框图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
参考图1,本发明的一个具体实施例,公开了一种基于相干伊辛机的多肽设计方法,包括:在步骤S101中,从PDB数据库中获取蛋白质文件;在步骤S102中,基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;在步骤S103中,根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及在步骤S104中,使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
与现有技术相比,本实施例提供的基于相干伊辛机的多肽设计方法中,使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模转化为伊辛模型,利用伊辛机计算来实现对多肽的结构以及序列进行优化(伊辛机计算出更稳定的多肽序列以达到优化效果),与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。
下文中,参考图1,对根据本发明实施例的基于相干伊辛机的多肽设计方法的各个步骤进行详细描述。
在步骤S101中,从PDB数据库中获取蛋白质文件。
在步骤S102中,基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图。计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:将每个氨基酸的单体能量储存在能量图中;以及将两个不同位置氨基酸之间的二体能量储存在能量图中以生成相互作用图。
在步骤S103中,根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体。根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型包括:
Figure SMS_22
其中,O(S i )表示rotamerS i 处的单体能量,T(S j ,S k )代表了rotamerS j 和rotamerS k 的二体作用能;
Figure SMS_23
其中,
Figure SMS_24
为氨基酸单体能量,
Figure SMS_25
两个氨基酸之间的二体能量。
具体地,
Figure SMS_26
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。
Figure SMS_27
表示种类为j的氨基酸的单体能量;
Figure SMS_28
表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及
Figure SMS_29
表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
Figure SMS_30
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;
Figure SMS_31
表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;
Figure SMS_32
表示遍历氨基酸序列每两位相邻的氨基酸残基ii+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
在步骤S104中,使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。通过将约束项添加至伊辛模型中来限制解的数目包括:
Figure SMS_33
其中,第三项为约束项,P为0至+∞之间的调节参数。
约束项包括:约束项为q i,1+…+q i,m =1,与约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。考虑区分一下种类和构象,这个约束含义是链的残基长度固定,重新定义一个多加一个下标区分构象和残基点位。
参考图6,本发明的另一个具体实施例,公开了一种基于相干伊辛机的多肽设计装置,包括:获取模块602,用于从PDB数据库中获取蛋白质文件;相互作用图生成模块604,用于基于蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;伊辛模型生成模块606,用于根据每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及优化模块608,用于使用相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
相互作用图生成模块604,用于将每个氨基酸的单体能量储存在能量图中;以及将两个不同位置氨基酸之间的二体能量储存在能量图中以生成相互作用图。
伊辛模型606包括:
Figure SMS_34
其中,
Figure SMS_35
表示rotamer
Figure SMS_36
处的单体能量,
Figure SMS_37
代表了rotamer
Figure SMS_38
和rotamer
Figure SMS_39
的二体作用能;
Figure SMS_40
其中,
Figure SMS_41
为氨基酸单体能量,
Figure SMS_42
两个氨基酸之间的二体能量。
具体地,
Figure SMS_43
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。
Figure SMS_44
表示种类为j的氨基酸的单体能量;
Figure SMS_45
表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及
Figure SMS_46
表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
Figure SMS_47
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;
Figure SMS_48
表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;
Figure SMS_49
表示遍历氨基酸序列每两位相邻的氨基酸残基ii+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
添加约束项的伊辛模型包括:
Figure SMS_50
其中,第三项为所述约束项,P为0至+∞之间的调节参数,约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
在可选实施例中,添加约束项的伊辛模型包括:
Figure SMS_51
Figure SMS_52
其中,第三项为第一约束项的展开项,第四项为第二约束项的展开项,以及P1和P2均为0至+∞之间的调节参数,所述第一约束项为q 1+…+q n =m,与所述第一约束项相对应的第一惩罚项为P1[q 1+…+q n +(-m)]2,使得解的数目等于序列长度;以及所述第二约束项为q 1+…+q j =1,与所述第二约束项相对应的第二惩罚项为P2[q 1+…+q j +(-1)]2,使得同一个旋转异构体只有一个解。
参考图8,本发明的又一个具体实施例,公开了一种相干伊辛机,包括:激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;二次谐波装置,将两束光中的一束光(即,a光束)进行倍频过程;光纤环路,将倍频后的光注入光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,光脉冲在光纤环路中循环;第二耦合器,将两束光中的另一束光(即,b光束)顺序经过强度调制器和相位调制器的调制后,经由第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;第三耦合器,在第三耦合器端,输出光纤环路中的一部分光;光学探测器,对从光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将光脉冲的压缩相位信息提供给FPGA;以及FPGA,将需要计算的数据同时作为编程数据输入FPGA,FPGA输出调制信号给强度调制器和相位调制器。
求解的计算主要分为两部分,FPGA计算是其中一部分:
一:FPGA计算当前解向量与伊辛矩阵的乘法,得到新的向量,然后控制强度调制器和相位调制器将第一耦合器分出来的光束调制成新的向量的光脉冲表达形式。新的向量与原向量(光脉冲形式)在第二耦合器对齐并叠加,产生干涉脉冲。
二:步骤一产生的干涉脉冲重新进入激发光学参量振荡器,产生新的真空压缩光脉冲,新的真空压缩光脉冲对应的解向量能量进一步降低。这一步是利用量子物理特性进行的计算。
经过有限次迭代之后,解向量会稳定在一个值。
下文中,参考图2至图5,以及图7和图8,以具体实例的方式,对根据本发明实施例的基于相干伊辛机的多肽设计方法进行详细说明。
用于蛋白质药物研发的基于量子计算机的多肽设计方法。可以高通量的优化多肽药物的结构以及序列,使用者输入多肽结构,服务器便可以计算其低能构象以及对其序列进行优化,返回给使用者,加速多肽药物研发过程。本文使用相干伊辛机(CoherentIsingMachine, CIM)将多肽设计问题转化为Ising模型。
使用者可以计算多肽链上的氨基酸的单体能量以及其二体能量,随后产生interaction graph,通过数学建模使用Ising模型(称为伊辛模型)来实现对多肽的结构(参考图4A)以及序列进行优化(参考图4B),与传统计算相比较而言,更为快速,准确率更高,可以快速的完成蛋白质骨架固定下的序列优化过程。使用者可以上传多肽结构,后段服务器会对其进行转化,并通过相干伊辛机给出最优计算结果,展示三维模型给使用者。对于多肽设计问题,与传统计算机相比,相干伊辛机会更加快速准确。
1、获取蛋白质文件
从PDB数据库(https://www.rcsb.org)中或者在本地构建蛋白质结构,拿到pdb格式的蛋白质结构文件。
2、获取InteractionGraph
参考图5,使用PyRosetta计算多肽链(参考图2)上的每个氨基酸的单体能量
Figure SMS_53
以及两个不同位置氨基酸之间的二体能量
Figure SMS_54
,获取Interaction Graph(相互作用图)。
One-body energies(单体能量):氨基酸内能,储存在能量图中,如图5所示,能量图是上文中所有氨基酸的单体能量,或者每两个氨基酸之间的二体能量的查询表。Two-body energies(二体能量):两个氨基酸之间的能量,储存在能量图中。
3、转化为Ising Model
则我们可以使用一组向量来表示解:
Figure SMS_55
在此其中
Figure SMS_56
Figure SMS_57
表示在序列中的每个位置被选择的rotamer(参考图3),其中,S1、S2、…、Sn是数学意义上的量子比特。
则其解的总能量可以表示为下侧,符合Ising model(伊辛模型),可以使用量子计算机进行加速。在下述等式中,
Figure SMS_58
代表了rotamer
Figure SMS_59
处的one-body能量,
Figure SMS_60
代表了rotamer
Figure SMS_61
Figure SMS_62
的two-body 作用能。
Figure SMS_63
其中,
Figure SMS_64
为氨基酸单体能量,
Figure SMS_65
两个氨基酸之间的二体能量,q代表在某位置是否选择某种氨基酸。
Figure SMS_66
具体地,
Figure SMS_67
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j氨基酸种类一共有m种,多肽序列长度为n位氨基酸残基。
Figure SMS_68
表示种类为j的氨基酸的单体能量;
Figure SMS_69
表示多肽序列的第i位残基的氨基酸种类为氨基酸j的情况下这个位置的氨基酸的单体能量;以及
Figure SMS_70
表示遍历氨基酸序列每一位的所有氨基酸种类的可能,然后计算相应的单体能量。
Figure SMS_71
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量;
Figure SMS_72
表示多肽序列的第i位残基的氨基酸种类为氨基酸j且相邻的第i+1位残基的氨基酸种类为氨基酸k的情况下,这两个相邻氨基酸的二体能量;
Figure SMS_73
表示遍历氨基酸序列每两位相邻的氨基酸残基ii+1,考虑这两位上所有氨基酸种类的可能,然后计算相应的二体能量。
4、增加约束项
在SDK求解之后,需要控制解的形式严格为一个位置出现一个rotamer(旋转异构体)。
即为,当我们求解50个氨基酸的多肽时。QUBO矩阵元素为1的数目应该为50个并且列坐标各不相同。增加约束项,限制解的数目。
公式为修改为:
Figure SMS_74
表1:约束项
Figure SMS_75
公式中的第三项为约束项,其中,q代表在某位置是否选择某种氨基酸。
5、多肽设计的计算装置
如图7所示,在用户使用时,只需要输入筛选的多肽结构文件,在用户端会展示其初始结构以及相关的序列信息,Chi角信息。便于用户进行可视化的三维操作,随后将数据传输回服务器,后台使用PyRosetta构建InteractionGraph,并转化为QUBO模型传输给相干伊辛机,计算出最优解,整个过程在使用量子计算机情况下,时间消耗大大减少,并且用户可以在使用界面看到筛选出的结构模型以及打分。随后使用这些多肽结构进行下一步理论验证或者实验验证。
根据本发明实施例的用于多肽设计的计算装置,并使用量子计算机进行加速,可以快速的计算多肽的低能构象,帮助研究人员优化蛋白质结构,助力药物研发过程。
本模型与传统的蛋白质侧链优化模型相比,解决了启发式算法可能消耗长时间但无法得出标准解的问题,本文使用的伊辛模型求解多肽设计问题的方法更为快速和准确。本文利用量子计算机的纠缠态和重叠态以及全联接的特性,提出了一个更为优秀的求解分子结合模式的模型,并将其放置于web端以进行展示,供给用户使用。
与现有技术相比,本发明的优点在于可以更为快速的获取低能多肽构象,优化多肽结构。
6、相干伊辛机CIM的工作原理
激光器(laser)作为泵浦光源,通过第一耦合器分为两束,一束光经过SHG(二次谐波装置)晶体进行倍频过程,另外一路光作为注入光。
倍频后的光注入光纤环路,同时激发OPO(光学参量振荡器)进行光学参量震荡过程,产生真空压缩光脉冲,这些光脉冲在光纤环路中循环。
在第三耦合器端,一部分光分出进行零差频探测,获得光脉冲的压缩相位信息,并作为部分输入提供给FPGA。
需要计算的数据(J ij ),该数据是增加约束项,该步骤的公式提取的伊辛矩阵,同时作为编程数据输入FPGA,该计算单元输出调制信号给强度调制器和相位调制器。
第一耦合器的一路光经过IM(强度调制)和PM(相位调制)的调制,经过第二耦合器重新输入到光纤环路中,实现脉冲注入。
计算开始后,泵浦激光的功率逐渐增加,根据最小增益原则,相互左右的脉冲信号会经历相变,出现相位的塌缩,经过PD探测器(光学探测器)的测量,可以得到在满足输入J ij 设计的情况下,组合优化的计算结果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于相干伊辛机的多肽设计方法,其特征在于,包括:
从PDB数据库中获取蛋白质文件;
基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;
根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及
使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
2.根据权利要求1所述的基于相干伊辛机的多肽设计方法,其特征在于,计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获得相互作用图包括:
将所述每个氨基酸的单体能量储存在能量图中;以及
将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
3.根据权利要求2所述的基于相干伊辛机的多肽设计方法,其特征在于,根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型包括:
Figure QLYQS_1
其中,O(S i )表示rotamerS i 处的单体能量,T(S j ,S k )代表了rotamerS j 和rotamerS k 的二体作用能;
Figure QLYQS_2
其中,
Figure QLYQS_3
为氨基酸单体能量,
Figure QLYQS_4
两个氨基酸之间的二体能量,
Figure QLYQS_5
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j
Figure QLYQS_6
表示种类为j的氨基酸的单体能量,
Figure QLYQS_7
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
4.根据权利要求3所述的基于相干伊辛机的多肽设计方法,其特征在于,所述约束项包括:
约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
5.根据权利要求4所述的基于相干伊辛机的多肽设计方法,其特征在于,通过将约束项添加至所述伊辛模型中来限制解的数目包括:
Figure QLYQS_8
其中,第三项为所述约束项,P为0至+∞之间的调节参数。
6.一种基于相干伊辛机的多肽设计装置,其特征在于,包括:
获取模块,用于从PDB数据库中获取蛋白质文件;
相互作用图生成模块,用于基于所述蛋白质文件计算多肽链上的每个氨基酸的单体能量和两个不同位置氨基酸之间的二体能量以获取相互作用图;
伊辛模型生成模块,用于根据所述每个氨基酸的单体能量和所述两个不同位置氨基酸之间的二体能量生成伊辛模型,其中,通过将约束项添加至所述伊辛模型来限制解的数目,使得一个位置出现一个旋转异构体;以及
优化模块,用于使用所述相干伊辛机对添加约束项的伊辛模型进行求解以获得优化之后的多肽结构和序列。
7.根据权利要求6所述的基于相干伊辛机的多肽设计装置,其特征在于,所述相互作用图生成模块,用于将所述每个氨基酸的单体能量储存在能量图中;以及将所述两个不同位置氨基酸之间的二体能量储存在能量图中以生成所述相互作用图。
8.根据权利要求7所述的基于相干伊辛机的多肽设计装置,其特征在于,所述伊辛模型包括:
Figure QLYQS_9
其中,
Figure QLYQS_10
表示rotamer
Figure QLYQS_11
处的单体能量,
Figure QLYQS_12
代表了rotamer
Figure QLYQS_13
和rotamer
Figure QLYQS_14
的二体作用能;
Figure QLYQS_15
其中,
Figure QLYQS_16
为氨基酸单体能量,
Figure QLYQS_17
两个氨基酸之间的二体能量,
Figure QLYQS_18
为二值决策变量,表示多肽序列的第i位残基的氨基酸种类为氨基酸j
Figure QLYQS_19
表示种类为j的氨基酸的单体能量,
Figure QLYQS_20
表示种类为j的氨基酸与种类为k的氨基酸在多肽序列上相邻时的二体能量。
9.根据权利要求8所述的基于相干伊辛机的多肽设计装置,其特征在于,添加约束项的伊辛模型包括:
Figure QLYQS_21
其中,第三项为所述约束项,P为0至+∞之间的调节参数,
所述约束项为q i,1+…+q i,m =1,与所述约束项相对应的第一惩罚项为P[q i,1+…+q i,m +(-1)]2,使得在任意一个位置有且只有一个旋转异构体。
10.一种相干伊辛机,其特征在于,包括:
激光源,生成激光并通过第一耦合器分为两束光,分别记为a和b;
二次谐波装置,将所述两束光中a光束进行倍频过程;
光纤环路,将倍频后的a光束注入所述光纤环路,同时激发光学参量振荡器进行光学参量振荡过程,产生真空压缩光脉冲,所述光脉冲在所述光纤环路中循环;
第二耦合器,将所述两束光中的b光束顺序经过强度调制器和相位调制器的调制后,经由所述第二耦合器重新输入到光纤环路中,与所述光脉冲对齐并叠加干涉,产生相干光脉冲,在下一个循环激发光学参量振荡器进行光学参量振荡过程,产生新的真空压缩光脉冲;
第三耦合器,在所述第三耦合器端,输出所述光纤环路中的一部分光;
光学探测器,对从所述光纤环路输出的一部分光进行零差频探测以获得光脉冲的压缩相位信息并将所述光脉冲的压缩相位信息提供给FPGA;
FPGA,将需要计算的数据同时作为编程数据输入所述FPGA,所述FPGA输出调制信号给所述强度调制器和所述相位调制器。
CN202310330775.4A 2023-03-31 2023-03-31 一种相干伊辛机、基于其的多肽设计方法和装置 Active CN116052802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310330775.4A CN116052802B (zh) 2023-03-31 2023-03-31 一种相干伊辛机、基于其的多肽设计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310330775.4A CN116052802B (zh) 2023-03-31 2023-03-31 一种相干伊辛机、基于其的多肽设计方法和装置

Publications (2)

Publication Number Publication Date
CN116052802A true CN116052802A (zh) 2023-05-02
CN116052802B CN116052802B (zh) 2023-07-07

Family

ID=86125870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310330775.4A Active CN116052802B (zh) 2023-03-31 2023-03-31 一种相干伊辛机、基于其的多肽设计方法和装置

Country Status (1)

Country Link
CN (1) CN116052802B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116597917A (zh) * 2023-07-19 2023-08-15 北京玻色量子科技有限公司 一种基于光量子计算机的分子对接方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304432A1 (en) * 2012-05-09 2013-11-14 Memorial Sloan-Kettering Cancer Center Methods and apparatus for predicting protein structure
CN113178775A (zh) * 2021-04-25 2021-07-27 北京玻色量子科技有限公司 一种基于片上回音壁模式光学微腔的相干伊辛机
CN114446391A (zh) * 2022-02-07 2022-05-06 上海图灵智算量子科技有限公司 一种基于量子退火的蛋白质折叠方法
CN114496065A (zh) * 2022-02-07 2022-05-13 上海图灵智算量子科技有限公司 蛋白质侧链结构预测装置、方法以及计算机可读介质
CN114512178A (zh) * 2022-02-02 2022-05-17 上海图灵智算量子科技有限公司 基于伊辛机量子退火的密码子优化方法
WO2022123494A1 (en) * 2020-12-10 2022-06-16 1Qb Information Technologies Inc. Methods and systems for solving a weighted maximum clique problem
CN114882940A (zh) * 2022-03-28 2022-08-09 北京玻色量子科技有限公司 一种基于相干伊辛机的分子对接方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130304432A1 (en) * 2012-05-09 2013-11-14 Memorial Sloan-Kettering Cancer Center Methods and apparatus for predicting protein structure
WO2022123494A1 (en) * 2020-12-10 2022-06-16 1Qb Information Technologies Inc. Methods and systems for solving a weighted maximum clique problem
CN113178775A (zh) * 2021-04-25 2021-07-27 北京玻色量子科技有限公司 一种基于片上回音壁模式光学微腔的相干伊辛机
CN114512178A (zh) * 2022-02-02 2022-05-17 上海图灵智算量子科技有限公司 基于伊辛机量子退火的密码子优化方法
CN114446391A (zh) * 2022-02-07 2022-05-06 上海图灵智算量子科技有限公司 一种基于量子退火的蛋白质折叠方法
CN114496065A (zh) * 2022-02-07 2022-05-13 上海图灵智算量子科技有限公司 蛋白质侧链结构预测装置、方法以及计算机可读介质
CN114882940A (zh) * 2022-03-28 2022-08-09 北京玻色量子科技有限公司 一种基于相干伊辛机的分子对接方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116597917A (zh) * 2023-07-19 2023-08-15 北京玻色量子科技有限公司 一种基于光量子计算机的分子对接方法和装置
CN116597917B (zh) * 2023-07-19 2023-10-20 北京玻色量子科技有限公司 一种基于光量子计算机的分子对接方法和装置

Also Published As

Publication number Publication date
CN116052802B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN116052802B (zh) 一种相干伊辛机、基于其的多肽设计方法和装置
Sonmez et al. BIM integrated smart contract for construction project progress payment administration
Campanelli et al. Second order gauge invariant gravitational perturbations of a Kerr black hole
WO2023185658A1 (zh) 一种基于相干伊辛机的分子对接方法和装置
Kira et al. Cluster-expansion representation in quantum optics
CN114444016A (zh) 实现伊辛模型的方法
US12067458B2 (en) Parameter initialization on quantum computers through domain decomposition
US20200176074A1 (en) Method and device for searching structure of cyclic molecule, and non-transitory recording medium
Kiesewetter et al. Coherent ising machine with quantum feedback: The total and conditional master equation methods
Hillmann et al. Designing Kerr interactions for quantum information processing via counterrotating terms of asymmetric Josephson-junction loops
Pizzimenti et al. Non-Gaussian photonic state engineering with the quantum frequency processor
Rodriguez-Fernandez et al. Enhancing predictive capabilities in fusion burning plasmas through surrogate-based optimization in core transport solvers
Olama et al. Distributed primal outer approximation algorithm for sparse convex programming with separable structures
Yuwono et al. Time-dependent equation-of-motion coupled-cluster simulations with a defective Hamiltonian
Lautenbacher et al. Planning support for enterprise changes
Patel et al. Laser-atom interaction simulator derived from quantum electrodynamics
Ledet et al. Toward model-driven engineering principles and practices for model replicability and experiment reproducibility
Mohanasubha et al. A method of identifying integrability quantifiers from an obvious λ-symmetry in second-order nonlinear ordinary differential equations
Clarisó et al. Incremental Verification of UML/OCL Models.
Bocanegra-Garay et al. Exploring supersymmetry: Interchangeability between Jaynes-Cummings and anti-Jaynes-Cummings models
Uysal Toward a Method Engineering Framework for Project Management and Machine Learning
Ortuno Gonzalez Fermions in cavity QED
Colin et al. A numerical model for light interaction with a two-level atom medium
Silega et al. Applying and MDD-Based Approach to Automatically Generate System Models to Develop Systems Involving Users
Fux et al. OQuPy: A Python package to efficiently simulate non-Markovian open quantum systems with process tensors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant