CN116403657A - 一种药物反应预测方法、装置、存储介质及电子装置 - Google Patents
一种药物反应预测方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN116403657A CN116403657A CN202310282357.2A CN202310282357A CN116403657A CN 116403657 A CN116403657 A CN 116403657A CN 202310282357 A CN202310282357 A CN 202310282357A CN 116403657 A CN116403657 A CN 116403657A
- Authority
- CN
- China
- Prior art keywords
- drug
- quantum
- feature extraction
- layer
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 151
- 229940079593 drug Drugs 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000004044 response Effects 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 89
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 80
- 238000000605 extraction Methods 0.000 claims abstract description 69
- 238000010586 diagram Methods 0.000 claims abstract description 32
- 239000000126 substance Chemical group 0.000 claims abstract description 11
- 230000035772 mutation Effects 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 14
- 239000002096 quantum dot Substances 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 7
- 238000010801 machine learning Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000008826 genomic mutation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000005610 quantum mechanics Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
- G06N10/20—Models of quantum computing, e.g. quantum circuits or universal quantum computers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
- G06N10/40—Physical realisations or architectures of quantum processors or components for manipulating qubits, e.g. qubit coupling or qubit control
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种药物反应预测方法、装置、存储介质及电子装置,涉及量子计算技术领域,该方法包括:获取编码基因数据和药物分子图数据;其中,编码基因数据用于表示细胞系基因组的突变情况,药物分子图数据的节点和边分别表示药物分子的原子和化学键;基于第一特征提取网络对编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对药物分子图数据进行特征提取,得到药物特征向量;将基因特征向量和药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。可提高药物反应预测结果的准确度。
Description
技术领域
本申请属于量子计算技术领域,特别是涉及一种药物反应预测方法、装置、存储介质及电子装置。
背景技术
量子计算机是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。当某个装置处理和计算的是量子信息,运行的是量子算法时,它就是量子计算机。量子计算机因其具有相对普通计算机更高效的处理数学问题的能力,例如,能将破解RSA密钥的时间从数百年加速到数小时,故成为一种正在研究中的关键技术。
随着人工智能技术的发展,机器学习在生物医学上的应用越来越广泛,目前机器学习模型已能够基于基因组特征和药物分子数据进行药物反应预测,但目前的机器学习模型参数众多,且药物分子数据复杂度高,所以现有的机器学习模型在进行药物反应预测时,预测准确度低。
发明内容
本申请的目的是提供一种药物反应预测方法、装置、存储介质及电子装置,旨在提升药物反应预测准确度。
为了实现上述目的,本申请实施例的第一方面,提供一种药物反应预测方法,所述方法包括:
获取编码基因数据和药物分子图数据;其中,所述编码基因数据用于表示细胞系基因组的突变情况,所述药物分子图数据的节点和边分别表示药物分子的原子和化学键;
基于第一特征提取网络对所述编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对所述药物分子图数据进行特征提取,得到药物特征向量;
将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
可选的,所述量子线路包括编码层、含参变分层和测量层;所述将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果,包括:
基于编码层将所述基因特征向量和所述药物特征向量拼接后的特征向量编码至预设数量个量子比特,利用含参变分层对编码后的量子比特进行量子态演化,使用测量层测量演化后的任一量子比特的量子态,得到所述药物反应预测结果。
可选的,所述第一特征提取网络包括多层卷积层、多层池化层以及全连接层。
可选的,所述第二特征提取网络包括多层图卷积层和全连接层。
可选的,所述获取编码基因数据和药物分子图数据,包括:
对细胞系基因数据进行一位有效one-hot编码,得到编码基因数据;
获取药物分子的简化分子线性输入规范SMILES格式数据,将SMILES格式数据转换为所述药物分子图数据。
可选的,所述第一特征提取网络、所述第二特征提取网络和所述量子线路由VQNet框架构建得到。
可选的,所述编码层包括RX门和RY门,含参变分层包括CNOT门和单量子逻辑门U;
U的矩阵形式为:
其中,Φ、λ、θ为可训练参数。
本申请实施例的第二方面,提供一种药物反应预测装置,所述装置包括:
获取模块,用于获取编码基因数据和药物分子图数据;其中,所述编码基因数据用于表示细胞系基因组的突变情况,所述药物分子图数据的节点和边分别表示药物分子的原子和化学键;
特征提取模块,用于基于第一特征提取网络对所述编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对所述药物分子图数据进行特征提取,得到药物特征向量;
预测模块,用于将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
可选的,所述量子线路包括编码层、含参变分层和测量层;所述预测模块,具体用于:
基于编码层将所述基因特征向量和所述药物特征向量拼接后的特征向量编码至预设数量个量子比特,利用含参变分层对编码后的量子比特进行量子态演化,使用测量层测量演化后的任一量子比特的量子态,得到所述药物反应预测结果。
可选的,所述第一特征提取网络包括多层卷积层、多层池化层以及全连接层。
可选的,所述第二特征提取网络包括多层图卷积层和全连接层。
可选的,所述获取模块,具体用于:
对细胞系基因数据进行一位有效one-hot编码,得到编码基因数据;
获取药物分子的简化分子线性输入规范SMILES格式数据,将SMILES格式数据转换为所述药物分子图数据。
可选的,所述第一特征提取网络、所述第二特征提取网络和所述量子线路由VQNet框架构建得到。
可选的,所述编码层包括RX门和RY门,含参变分层包括CNOT门和单量子逻辑门U;
U的矩阵形式为:
其中,Φ、λ、θ为可训练参数。
本申请实施例的第三方面,提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述第一方面中任一项所述方法的步骤。
本申请实施例的第四方面,提供一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述第一方面中任一项所述方法的步骤。
基于上述技术方案,通过获取编码基因数据和药物分子图数据,利用第一特征提取网络和第二特征提取网络分别对编码基因数据和药物分子图数据进行特征提取,得到基因特征向量和药物特征向量,将基因特征向量和药物特征向量进行拼接,并输入量子线路进行药物反应预测,利用量子线路代替传统机器学习模型中的参数复杂的预测模块,减少了模型参数,降低了模型复杂度,借助于量子线路纠缠特性,可以更准确的提取复杂的药物特征向量和基因特征向量之间的关联特征,提高了药物反应预测的准确性。
附图说明
图1是根据一示例性实施例示出的一种药物反应预测方法的计算机终端的硬件结构框图;
图2是根据一示例性实施例示出的一种药物反应预测方法的流程图;
图3是根据一示例性实施例示出的第一特征提取网络的示意图;
图4是根据一示例性实施例示出的第二特征提取网络的示意图;
图5是根据一示例性实施例示出的另一种药物反应预测方法的流程图;
图6是根据一示例性实施例示出的量子线路的示意图;
图7是根据一示例性实施例示出的一种药物反应预测装置的框图。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本申请实施例首先提供了一种药物反应预测方法,该方法可以应用于电子设备,如计算机终端,具体如普通电脑、量子计算机等。
下面以运行在计算机终端上为例对其进行详细说明。图1是根据一示例性实施例示出的一种药物反应预测方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储基于量子线路的药物反应预测方法的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输装置106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的药物反应预测方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
需要说明的是,真正的量子计算机是混合结构的,它包含两大部分:一部分是经典计算机,负责执行经典计算与控制;另一部分是量子设备,负责运行量子程序进而实现量子计算。而量子程序是由量子语言如QRunes语言编写的一串能够在量子计算机上运行的指令序列,实现了对量子逻辑门操作的支持,并最终实现量子计算。具体的说,量子程序就是一系列按照一定时序操作量子逻辑门的指令序列。
在实际应用中,因受限于量子设备硬件的发展,通常需要进行量子计算模拟以验证量子算法、量子应用等等。量子计算模拟即借助普通计算机的资源搭建的虚拟架构(即量子虚拟机)实现特定问题对应的量子程序的模拟运行的过程。通常,需要构建特定问题对应的量子程序。本申请实施例所指量子程序,即是经典语言编写的表征量子比特及其演化的程序,其中与量子计算相关的量子比特、量子逻辑门等等均有相应的经典代码表示。
量子线路作为量子程序的一种体现方式,也称量子逻辑电路,是最常用的通用量子计算模型,表示在抽象概念下对于量子比特进行操作的线路,其组成包括量子比特、线路(时间线)、以及各种量子逻辑门,最后常需要通过量子测量操作将结果读取出来。
不同于传统电路是用金属线所连接以传递电压信号或电流信号,在量子线路中,线路可看成是由时间所连接,亦即量子比特的状态随着时间自然演化,在这过程中按照哈密顿运算符的指示,一直到遇上逻辑门而被操作。
一个量子程序整体上对应有一条总的量子线路,本申请所述量子程序即指该条总的量子线路,其中,该总的量子线路中的量子比特总数与量子程序的量子比特总数相同。可以理解为:一个量子程序可以由量子线路、针对量子线路中量子比特的测量操作、保存测量结果的寄存器及控制流节点(跳转指令)组成,一条量子线路可以包含几十上百个甚至成千上万个量子逻辑门操作。量子程序的执行过程,就是对所有的量子逻辑门按照一定时序执行的过程。需要说明的是,时序即单个量子逻辑门被执行的时间顺序。
需要说明的是,经典计算中,最基本的单元是比特,而最基本的控制模式是逻辑门,可以通过逻辑门的组合来达到控制电路的目的。类似地,处理量子比特的方式就是量子逻辑门。使用量子逻辑门,能够使量子态发生演化,量子逻辑门是构成量子线路的基础,量子逻辑门包括单比特量子逻辑门,如Hadamard门(H门,阿达马门)、泡利-X门(X门,泡利X门)、泡利-Y门(Y门,泡利Y门)、泡利-Z门(Z门,泡利Z门)、RX门(RX旋转门)、RY门(RY旋转门)、RZ门(RZ旋转门)等等;多比特量子逻辑门,如CNOT门、CR门、iSWAP门、Toffoli门等等。量子逻辑门一般使用酉矩阵表示,而酉矩阵不仅是矩阵形式,也是一种操作和变换。一般量子逻辑门在量子态上的作用是通过酉矩阵左乘以量子态右矢对应的向量进行计算。例如,量子态右矢|0>对应的向量可以为量子态右矢|1>对应的向量可以为/>
参见图2,图2是根据一示例性实施例示出的一种药物反应预测方法的流程图。本实施例提供一种药物反应预测方法,该方法包括:
S201、获取编码基因数据和药物分子图数据。
其中,编码基因数据用于表示细胞系基因组的突变情况,药物分子图数据的节点和边分别表示药物分子的原子和化学键。
具体的,可以对细胞系基因数据进行一位有效(one-hot)编码,得到编码基因数据。
获取药物分子的简化分子线性输入规范(Simplified Molecular Input LineEntry System,SMILES)格式数据,将药物分子的SMILES格式数据转换为药物分子图数据。
对于细胞系基因数据,在进行one hot编码之后,1表示存在基因组突变,0表示不存在突变。
对于药物分子数据,可以先获取药物分子的SMILES格式数据,在这种格式的数据中,药物分子式被表示在一行中,根据SMILES格式数据可以获取药物分子图数据,药物分子图数据的每一节点包含药物分子的化学式表示的信息,包括原子类型、化学键、分子的分支、结构和同位素。其中,原子类型可以用特殊符号表示,分子的分支可以用括号描述,同位素用等于原子符号前面的整数同位素质量的数字表示。
一种实现方式中,可以使用RDKit软件或者开放图形基准(Open GraphBenchmark,OGB)软件将药物分子的SMILES格式数据转换为药物分子图数据。其中,RDKit软件是一个用于化学信息学的开源工具包。
S202、基于第一特征提取网络对编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对药物分子图数据进行特征提取,得到药物特征向量。
其中,上述第一特征提取网络包括多层卷积层、多层池化层以及全连接层,第二特征提取网络包括多层图卷积层和全连接层。
如图3所示,图3为本申请实施例提供的第一特征提取网络的示例性示意图,图3所示的第一特征提取网络可以包括3层一维卷积层、3层一维最大池化层以及全连接层,一维卷积层和一维池化层依次交替连接,编码基因数据经过3层一维卷积层、3层一维最大池化层以及全连接层,可以得到基因特征向量。
如图4所示,图4为本申请实施例提供的第二特征提取网络的示例性示意图,图4所示的第二特征提取网络可以包括3层图卷积层和全连接层,每一层图卷积层均包括激活函数,药物分子图数据依次经过三层图卷积层进行卷积操作,将卷积结果输入全连接层,得到药物特征向量。
S203、将基因特征向量和药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
其中,药物反应预测结果可以为药物的半抑制浓度(IC50值)。
在本申请实施例中,上述第一特征提取网络、第二特征提取网络和量子线路均由VQNet框架实现,使用VQNet框架下的均方误差(Mean Square Error,MSE)损失函数计算损失,利用自适应力矩估计(Adaptive Moment Estimation,Adam)算法优化梯度函数,优化调整第一特征提取网络、第二特征提取网络和量子线路中的参数。VQNet框架是一种量子机器学习计算框架,它可以用于构建、运行和优化量子算法,相比于基于Pytorch和pennylane框架实现的特征提取网络和量子线路,使用VQNet框架可以减少模型参数,提升模型运行效率。
采用本申请实施例,通过获取编码基因数据和药物分子图数据,利用第一特征提取网络和第二特征提取网络分别对编码基因数据和药物分子图数据进行特征提取,得到基因特征向量和药物特征向量,将基因特征向量和药物特征向量进行拼接,并输入量子线路进行药物反应预测,利用量子线路代替传统机器学习模型中的参数复杂的预测模块,减少了模型参数,降低了模型复杂度,借助于量子线路纠缠特性,可以更准确的提取复杂的药物特征向量和基因特征向量之间的关联特征,提高了药物反应预测的准确性。
此外,量子线路还具有并行计算优势,相比于经典神经网络可以提高药物反应的预测速度。
在本申请另一实施例中,在上述实施例的基础上,量子线路包括编码层、含参变分层和测量层;如图5所示,S203、将基因特征向量和药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果,具体可以实现为:
S2031、基于编码层将基因特征向量和药物特征向量拼接后的特征向量编码至预设数量个量子比特。
S2032、利用含参变分层对编码后的量子比特进行量子态演化。
S2033、使用测量层测量演化后的任一量子比特的量子态,得到药物反应预测结果。
其中,预设数量个量子比特可以根据实际应用场景进行设置,例如,可以设置为4个量子比特。
如图6所示,图6为本申请实施例提供的量子线路的结构示意图,图6所示的量子线路包括q0至q3四个量子比特,该量子线路的编码层包括RX门和RY门,含参变分层包括CNOT门和单量子逻辑门U,RX门和RY门通过旋转角度编码的方式将基因特征向量和药物特征向量拼接后的特征向量编码至四个量子比特,CNOT门作用于相邻量子比特以及第一个和最后一个量子比特,CNOT门的主要作用是实现量子纠缠,可以使得量子比特之间的信息进行交换和传递,此外,含参边分层还包括单量子比特逻辑门U,U的矩阵形式为:
其中,Φ、λ、θ为可训练参数,通过不断迭代优化参数Φ、λ、θ,可以实现对量子线路的优化。
测量层为量子线路的最后一层,其作用是使量子比特退相干,实现量子数据到经典数据的转化,图6中的量子线路包括4个量子比特,测量层可以测量任一量子比特的量子态,得到药物反应预测结果,图6中的测量层可以对q0、q1、q2和q3任一量子比特进行量子态测量,得到药物反应预测结果,图6以对第一个量子比特q0进行测量为例进行说明。
采用本申请实施例,通过量子线路包括的编码层将基因特征向量和药物特征向量拼接后的特征向量编码至预设数量个量子比特,通过含参变分层对编码后的量子比特进行量子态演化,利用测量层对演化后的任一量子比特进行量子态测量,得到药物反应预测结果,利用量子线路的纠缠特性,实现了对复杂药物特征向量和基因特征向量之间关联特征的提取,相比于经典机器学习模型的预测网络预测准确度大大提升。
此外,含参变分层中的CNOT门可以对量子比特进行纠缠,使得量子比特之间的信息能够充分交换和传递,单量子比特逻辑门U包括3个可训练参数,通过多次训练可以得到最优参数,实现对量子线路的优化,进行一步提升了药物反应预测的准确度。
基于相同的发明构思,本申请实施例还提供了一种药物反应预测装置,如图7所示,该装置包括:
获取模块701,用于获取编码基因数据和药物分子图数据;其中,编码基因数据用于表示细胞系基因组的突变情况,药物分子图数据的节点和边分别表示药物分子的原子和化学键;
特征提取模块702,用于基于第一特征提取网络对编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对药物分子图数据进行特征提取,得到药物特征向量;
预测模块703,用于将基因特征向量和药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
可选的,量子线路包括编码层、含参变分层和测量层;预测模块703,具体用于:
基于编码层将基因特征向量和药物特征向量拼接后的特征向量编码至预设数量个量子比特,利用含参变分层对编码后的量子比特进行量子态演化,使用测量层测量演化后的任一量子比特的量子态,得到药物反应预测结果。
可选的,第一特征提取网络包括多层卷积层、多层池化层以及全连接层。
可选的,第二特征提取网络包括多层图卷积层和全连接层。
可选的,获取模块701,具体用于:
对细胞系基因数据进行一位有效one-hot编码,得到编码基因数据;
获取药物分子的简化分子线性输入规范SMILES格式数据,将SMILES格式数据转换为药物分子图数据。
可选的,第一特征提取网络、第二特征提取网络和量子线路由VQNet框架构建得到。
可选的,编码层包括RX门和RY门,含参变分层包括CNOT门和单量子逻辑门U;
U的矩阵形式为:
其中,Φ、λ、θ为可训练参数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请的再一实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述药物反应预测方法实施例中的步骤。
具体的,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的再一实施例还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述药物反应预测方法实施例中的步骤。
具体的,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
具体的,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
步骤一、获取编码基因数据和药物分子图数据;其中,所述编码基因数据用于表示细胞系基因组的突变情况,所述药物分子图数据的节点和边分别表示药物分子的原子和化学键。
步骤二、基于第一特征提取网络对所述编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对所述药物分子图数据进行特征提取,得到药物特征向量。
步骤三、将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
以上依据图式所示的实施例详细说明了本申请的构造、特征及作用效果,以上所述仅为本申请的较佳实施例,但本申请不以图面所示限定实施范围,凡是依照本申请的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本申请的保护范围内。
Claims (10)
1.一种药物反应预测方法,其特征在于,所述方法包括:
获取编码基因数据和药物分子图数据;其中,所述编码基因数据用于表示细胞系基因组的突变情况,所述药物分子图数据的节点和边分别表示药物分子的原子和化学键;
基于第一特征提取网络对所述编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对所述药物分子图数据进行特征提取,得到药物特征向量;
将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
2.根据权利要求1所述的方法,其特征在于,所述量子线路包括编码层、含参变分层和测量层;所述将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果,包括:
基于编码层将所述基因特征向量和所述药物特征向量拼接后的特征向量编码至预设数量个量子比特,利用含参变分层对编码后的量子比特进行量子态演化,使用测量层测量演化后的任一量子比特的量子态,得到所述药物反应预测结果。
3.根据权利要求1或2所述的方法,其特征在于,所述第一特征提取网络包括多层卷积层、多层池化层以及全连接层。
4.根据权利要求1或2所述的方法,其特征在于,所述第二特征提取网络包括多层图卷积层和全连接层。
5.根据权利要求1所述的方法,其特征在于,所述获取编码基因数据和药物分子图数据,包括:
对细胞系基因数据进行一位有效one-hot编码,得到编码基因数据;
获取药物分子的简化分子线性输入规范SMILES格式数据,将SMILES格式数据转换为所述药物分子图数据。
6.根据权利要求1所述的方法,其特征在于,所述第一特征提取网络、所述第二特征提取网络和所述量子线路由VQNet框架构建得到。
8.一种药物反应预测装置,其特征在于,所述装置包括:
获取模块,用于获取编码基因数据和药物分子图数据;其中,所述编码基因数据用于表示细胞系基因组的突变情况,所述药物分子图数据的节点和边分别表示药物分子的原子和化学键;
特征提取模块,用于基于第一特征提取网络对所述编码基因数据进行特征提取,得到基因特征向量;基于第二特征提取网络对所述药物分子图数据进行特征提取,得到药物特征向量;
预测模块,用于将所述基因特征向量和所述药物特征向量拼接后输入量子线路进行预测,得到药物反应预测结果。
9.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310282357.2A CN116403657A (zh) | 2023-03-20 | 2023-03-20 | 一种药物反应预测方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310282357.2A CN116403657A (zh) | 2023-03-20 | 2023-03-20 | 一种药物反应预测方法、装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116403657A true CN116403657A (zh) | 2023-07-07 |
Family
ID=87008350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310282357.2A Pending CN116403657A (zh) | 2023-03-20 | 2023-03-20 | 一种药物反应预测方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116403657A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117437494A (zh) * | 2023-12-20 | 2024-01-23 | 量子科技长三角产业创新中心 | 一种图像分类方法、系统、电子设备及存储介质 |
-
2023
- 2023-03-20 CN CN202310282357.2A patent/CN116403657A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117437494A (zh) * | 2023-12-20 | 2024-01-23 | 量子科技长三角产业创新中心 | 一种图像分类方法、系统、电子设备及存储介质 |
CN117437494B (zh) * | 2023-12-20 | 2024-04-16 | 量子科技长三角产业创新中心 | 一种图像分类方法、系统、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112633508B (zh) | 一种量子线路的生成方法、装置、存储介质及电子装置 | |
CN114792378B (zh) | 一种量子图像识别方法及装置 | |
CN113222155B (zh) | 一种量子线路的构建方法、装置、电子装置和存储介质 | |
CN116187548A (zh) | 一种光伏发电功率预测方法、装置、存储介质及电子装置 | |
CN114511094B (zh) | 一种量子算法的优化方法、装置、存储介质与电子装置 | |
CN114358317B (zh) | 基于机器学习框架的数据分类方法及相关设备 | |
CN114358216B (zh) | 基于机器学习框架的量子聚类方法及相关装置 | |
CN116403657A (zh) | 一种药物反应预测方法、装置、存储介质及电子装置 | |
CN115293254A (zh) | 基于量子多层感知器的分类方法及相关设备 | |
CN114819168B (zh) | 一种矩阵特征值的量子比较方法及装置 | |
CN113222151B (zh) | 一种量子态的变换方法及装置 | |
CN114764619B (zh) | 一种基于量子线路的卷积操作方法及装置 | |
CN114819163B (zh) | 量子生成对抗网络的训练方法、装置、介质及电子装置 | |
CN114519429B (zh) | 获取目标体系的可观测量的方法、装置及介质 | |
CN116011681A (zh) | 一种气象数据预测方法、装置、存储介质及电子装置 | |
CN116011682A (zh) | 一种气象数据预测方法、装置、存储介质及电子装置 | |
CN114764620B (zh) | 一种量子卷积操作器 | |
CN117035105A (zh) | 数据预测方法及相关设备 | |
CN114819169B (zh) | 一种矩阵条件数的量子估计方法及装置 | |
CN116306952A (zh) | 一种分子性质预测方法、装置、存储介质及电子装置 | |
CN114819171B (zh) | 一种量子卷积操作的实现方法及装置 | |
CN116167407A (zh) | 一种基于量子循环神经网络的数据预测方法及相关设备 | |
CN117744818A (zh) | 基于量子傅里叶变换的常数加法器、运算方法及相关装置 | |
CN114692879B (zh) | 一种基于稀疏线性系统的量子预处理方法及装置 | |
CN117350394A (zh) | 业务数据预测方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |