CN112331279A - 信息处理方法及装置、电子设备和存储介质 - Google Patents
信息处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112331279A CN112331279A CN202011358130.4A CN202011358130A CN112331279A CN 112331279 A CN112331279 A CN 112331279A CN 202011358130 A CN202011358130 A CN 202011358130A CN 112331279 A CN112331279 A CN 112331279A
- Authority
- CN
- China
- Prior art keywords
- information
- interaction
- target
- class
- targets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 16
- 230000003993 interaction Effects 0.000 claims abstract description 242
- 238000000034 method Methods 0.000 claims abstract description 44
- 239000003814 drug Substances 0.000 claims description 100
- 229940079593 drug Drugs 0.000 claims description 98
- 201000010099 disease Diseases 0.000 claims description 36
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 36
- 230000000694 effects Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 230000004927 fusion Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- 108090000623 proteins and genes Proteins 0.000 description 18
- 239000000126 substance Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000013507 mapping Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000857 drug effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本公开涉及一种信息处理方法及装置、电子设备和存储介质,其中,所述方法包括:获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于第一类别的目标,所述第二目标包括属于第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。本公开可以提高相互作用的预测结果的准确性。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种信息处理方法及装置、电子设备和存储介质。
背景技术
在一些专业领域中,通常需要确定两种物质之间的相互作用,例如,在医学领域中,可以确定药物和靶标的相互作用,药物-靶标相互作用(DTI)可以理解为药物大分子通过作用于生物体内靶蛋白进而产生药效的过程,从而判断药物与是否存在关联,辅助药物研发。
目前,通过确定两种物质之间的相互作用的方法,通常难以保证相互作用的准确性。
发明内容
本公开提出了一种信息处理技术方案。
根据本公开的一方面,提供了一种信息处理方法,包括:
获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;所述多个目标分别属于多个类别,所述多个类别包括第一类别、第二类别以及第三类别,所述第三类别与所述第一类别和所述第二类别中至少一个类别相关联;分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于所述第一类别的目标,所述第二目标包括属于所述第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。
在一些实现方式中,所述获取多个第一关联信息,包括:基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息。
在一些实现方式中,所述基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息,包括:针对所述多个目标中不同的两个目标,根据所述两个目标中每个目标对应的目标信息,确定所述两个目标之间的相互作用,其中,所述两个目标属于不同类别或同一类别。
在一些实现方式中,所述目标信息包括结构信息;所述基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息,包括:针对所述多个类别中的同一类别的两个目标,根据所述两个目标中每个目标的结构信息,确定所述两个目标之间的相似度。
在一些实现方式中,所述基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,包括:将所述多个目标特征和所述多个关联特征进行特征融合,得到融合特征;根据所述融合特征确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,包括:基于所述多个目标特征和所述多个关联特征,利用已训练的相互作用预测模型确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述相互作用预测模型的训练过程包括:基于多个样本信息以及多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,其中,所述多个样本信息分别对应多个样本,所述多个样本属于所述多个类别,所述第二关联信息用于表示不同两个样本之间的相互作用和相似度中的至少一个。
在一些实现方式中,所述基于多个样本信息以及所述多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,包括:在所述多个第二关联信息中获取第一样本与第二样本之间的相互作用作为标签信息,其中,所述第一样本属于所述第一类别,所述第二样本属于所述第二类别;将所述多个样本信息和所述多个第二关联信息中除所述标签信息以外的第二关联信息输入所述相互作用预测模型,得到所述第一样本与所述第二样本之间相互作用的预测结果;基于所述第一样本与所述第二样本之间相互作用的预测结果和所述标签信息的比对结果,对所述相互作用预测模型的网络权重进行调整,得到已训练的相互作用预测模型。
在一些实现方式中,所述第一类别包括药物类和靶标类中的一个类别,所述第二类别包括药物类和靶标类中的另一个类别,所述第三类别包括疾病类和副作用类中的至少一个类别。
在一些实现方式中,关联信息包括所述第一关联信息和所述第二关联信息,所述关联信息包括以下至少一项:
药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。
根据本公开的一方面,提供了一种信息处理装置,包括:
在一些实现方式中,获取模块,用于获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;多个目标分别属于多个类别,所述多个类别包括第一类别、第二类别以及第三类别,所述第三类别与所述第一类别和所述第二类别中至少一个类别相关联;
提取模块,用于分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;
确定模块,用于基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于所述第一类别的目标,所述第二目标包括属于所述第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。
在一些实现方式中,所述获取模块,用于基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息。
在一些实现方式中,所述获取模块,用于针对所述多个目标中不同的两个目标,根据所述两个目标中每个目标对应的目标信息,确定所述两个目标之间的相互作用,其中,所述两个目标属于不同类别或同一类别。
在一些实现方式中,所述目标信息包括结构信息;所述获取模块,用于针对所述多个类别中的同一类别的两个目标,根据所述两个目标中每个目标的结构信息,确定所述两个目标之间的相似度。
在一些实现方式中,所述确定模块,用于将所述多个目标特征和所述多个关联特征进行特征融合,得到融合特征;根据所述融合特征确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述确定模块,用于基于所述多个目标特征和所述多个关联特征,利用已训练的相互作用预测模型确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述装置还包括:训练模块,用于基于多个样本信息以及多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,其中,所述多个样本信息分别对应多个样本,所述多个样本属于所述多个类别,所述第二关联信息用于表示不同两个样本之间的相互作用和相似度中的至少一个。
在一些实现方式中,所述训练模块,用于在所述多个第二关联信息中获取第一样本与第二样本之间的相互作用作为标签信息,其中,所述第一样本属于所述第一类别,所述第二样本属于所述第二类别;将所述多个样本信息和所述多个第二关联信息中除所述标签信息以外的第二关联信息输入所述相互作用预测模型,得到所述第一样本与所述第二样本之间相互作用的预测结果;基于所述第一样本与所述第二样本之间相互作用的预测结果和所述标签信息的比对结果,对所述相互作用预测模型的网络权重进行调整,得到已训练的相互作用预测模型。
在一些实现方式中,所述第一类别包括药物类和靶标类中的一个类别,所述第二类别包括药物类和靶标类中的另一个类别,所述第三类别包括疾病类和副作用类中的至少一个类别。
在一些实现方式中,关联信息包括所述第一关联信息和所述第二关联信息,所述关联信息包括以下至少一项:药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。
根据本公开的一方面,提供了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行上述信息处理方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述信息处理方法。
在本公开实施例中,可以获取多个目标信息以及多个第一关联信息,再基于多个目标信息的多个目标特征以及多个第一关联信息的多个关联特征,确定第一类别中的第一目标与第二类别中的第二目标之间相互作用的预测结果,其中,多个目标信息分别对应多个目标,第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个。这样,可以整合不同信息来源的多种信息,并通过提取多种信息的特征对第一目标与第二目标之间的相互作用进行预测,可以进一步提高相互作用的预测结果的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开实施例的一种信息处理方法的流程图。
图2示出根据本公开实施例的一种信息处理方法一示例的框图。
图3示出根据本公开实施例的一种信息处理装置的框图。
图4示出根据本公开实施例的一种电子设备示例的框图。
图5示出根据本公开实施例的一种电子设备示例的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
本公开实施例提供的信息处理方案,可以获取多个目标信息以及多个第一关联信息,其中,多个目标信息分别对应多个目标,第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个,从而可以对多种不同信息来源的信息进行整合,并通过提取这些信息的特征,对第一类别的第一目标与第二类别的第二目标之间的相互作用进行预测,从而可以在预测两个不同类别目标的相互作用的过程中,考虑多种信息之间的关联性,尽可能多地综合各种信息源的信息,提高相互作用的预测结果的准确性。举例来说,在医学领域中,可以获取一些药物、靶标以及与药物相关联的疾病、副作用等目标的目标信息,并获取这些药物、靶标、疾病、副作用等目标之间的第一关联信息,从而通过提取这些信息的特征,可以对某些药物与靶标之间的相互作用进行预测。药物与靶标之间的相互作用可以体现药物分子作用于生物体内的靶标产生药效的过程,从而通过得到的药物与靶标之间相互作用的预测结果,可以辅助药物研发,减少开发新药物的成本和时间。
在相关技术方案中,在确定两个目标之间的相互作用时,例如,确定某种药物与某种靶标之间的相互作用时,通常需要获取该靶标的三维结构以及该药物的化学结构,但是对于一些结构未知的蛋白质,或者,目标配体库中未标明化学结构的化合物,则无法对该药物与该靶标之间的相互作用进行预测。本公开实施例提供的信息处理方案,即使对于一些结构未知的蛋白质,或者,目标配体库中未标明化学结构的化合物,也可以综合其他已知目标之间的相互作用,对一些结构未知的蛋白质或者未标明化学结构的药物间的相互作用进行预测,从而提高确定相互作用的效率,节省人力成本。
本公开实施例提供的技术方案可以应用于多种领域中不同目标之间的相互作用、相关性以及相关扩展等等,本公开实施例对此不做限定。例如,在医学领域中,可以确定药物与靶蛋白之间的相互作用,从而可以辅助新药物的研发。再例如,在物理学领域中,不同物体之间可能存在多种力的作用,可以确定两种物体之间力的相互作用,使物体按照需求运动。
图1示出根据本公开实施例的信息处理方法的流程图。该信息处理方法可以由终端设备、服务器或其它类型的电子设备执行,其中,终端设备可以为用户设备(UserEquipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(PersonalDigital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该信息处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
步骤S11,获取多个目标信息以及多个第一关联信息。
在本公开实施例中,目标信息可以是目标的标识信息、类别信息、结构信息等与目标相关的信息。多个目标信息可以分别对应多个目标,目标可以是实体对象或非实体对象。例如,目标可以是药物、靶标、疾病以及副作用等,相应地,目标信息可以包括药物、靶标、疾病以及副作用的标识信息、类别信息、结构信息等。多个目标可以分别属于多个类别,多个类别可以包括第一类别、第二类别以及与第二类别和/或第二类别相关联的至少一个第三类别。举例来说,第一类别可以为药物类,第二类别可以为靶标类,第三类别可以为与药物类、靶标类相关的疾病类或副作用类。多个类别可以各不相同,每个类别中可以包括一个或多个目标,如,药物类可以包括多种药物,每种药物可以作为一个目标。多个目标之间可以具有第一关联信息。第一关联信息可以用于表示不同的两个目标之间的相互作用和相似度中的至少一个,相同类别中不同的两个目标之间可以具有第一关联信息,分别属于不同类别中的两个目标之间也可以具有第一关联信息。这里,相互作用可以表示两个目标之间的相互作用,例如,药物与靶标之间的相互作用可以表示药物作用于生物体内的靶蛋白产生药效的现象,药物与疾病之间的相互作用可以表示某个药物可以针对某种疾病进行治疗的现象。相似度可以表示两个目标之间的相似程度,例如,一种药物和另一种药物之间的相似度可以表示这两种药物在结构上、药性上的相似程度。
在一些实现方式中,第一类别可以包括药物类和靶标类中的一个类别,第二类别可以包括药物类和靶标类中的另一个类别,第三类别包括疾病类和副作用类中的至少一个类别。举例来说,第一类别可以是药物类,第二类别可以是靶标类,第三类别可以是与药物类别和/或靶标类别相关联的疾病类、副作用类等类别。这样,可以将本公开提供的信息处理方案应用在医学领域中,从而可以利用获取的目标信息和第一关联信息,确定药物和靶标之间的相互作用,进而辅助药物等相关医学方便的研究和开发。
相应地,在获取多个目标信息的情况下,可以获取一个或多个药物的标识、分子指纹、化学结构等多个目标信息,获取一个或多个靶标的标识、蛋白质序列、化学结构等多个目标信息,获取疾病、副作用等目标的标识、相关的药物或/靶标的标识、生效剂量等多个目标信息。
在一些实现方式中,第一关联信息包括以下至少一项:药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。由于第一关联信息包括不同的两个目标之间的相互作用和/或相似度,从而可以为预测不同两个目标之间未知的相互作用提供尽可能全面的信息,从而使相互作用的预测结果更加准确。
这里,电子设备可以在本地存储中获取多个目标信息以及多个第一关联信息,或者,电子设备可以从其他设备处获取多个目标信息以及多个第一关联信息,例如,从一个或多个云端服务器、网络数据库处获取多个目标信息以及多个第一关联信息。一些实现方式中,也可以利用获取的多个目标信息得到一个或多个第一关联信息,本公开不对具体的获取第一关联信息的方式进行限制。
步骤S12,分别提取所述多个目标信息的目标特征以及所述多个第一关联信息的关联特征。
在本公开实施例中,在获取多个目标信息以及多个第一关联信息之后,可以分别提取各个目标信息的目标特征,以及,提取各个第一关联信息的关联特征,从而可以将获取的多个目标信息和多个第一关联信息的多种不同类型的信息通过特征的方式进行表示,可以更加准确地对多个类别的目标进行描述。
一些实现方式中,可以利用神经网络提取目标特征和关联特征,例如,将获取的多个目标信息和多个第一关联信息输入已训练的相互作用预设模型,利用已训练的相互作用预设模型提取多个目标信息的目标特征和多个第一关联信息的关联特征。相互作用预设模型可以是神经网络模型,例如,相互作用预设模型可以包括卷积层、池化层、残差网络层等多种特征提取层。
在提取多个目标信息的多个目标特征的情况下,可以先将多个目标信息进行结构化,得到结构化信息。即可以理解为,将目标信息转变为一定数据格式和一定数据长度的信息,得到便于目标信息进行存储和管理的结构化信息。然后再对结构化信息进行表征化,即对结构化信息进行特征提取,例如,对结构化信息进行嵌入、线性映射等操作,可以得到目标信息的目标特征。
在提取多个第一关联信息的关联特征的情况下,可以基于目标信息的目标特征,提取第一关联信息的关联特征。这里,步骤S11中获取的多个信息中存在信息结构不同的信息,多个信息包括多个目标信息和多个第一关联信息。信息结构不同可以理解为信息中每个元素表示的含义不用,以及,多个元素的排列方式、次序等不同,多个信息的信息结构不同,可以认为多个信息是异构信息。例如,不同类别目标的目标信息由于信息来源不同,目标信息中每个元素表示的含义、多个元素的排列方式、次序等往往不同,从而在分别针对多个目标信息和多个第一关联信息提取特征之后,得到的多个目标特征和多个关联特征可能难以进行比较或运算,从而可以利用目标信息的目标特征,提取第一关联信息的关联特征。例如,可以基于目标特征的表征表示方式,对第一关联信息进行非线性映射,如利用神经网络的特征提取层或者激活函数对第一关联信息进行非线性映射,然后在对非线性映射后的第一关联信息进行提取表征化,可以得到第一关联信息的关联特征。多个关联特征与多个目标特征可以在同一个特征空间中,即,多个关联特征可以与多个目标特征进行比较或运算。这里,多个关联特征可以与多个目标特征进行比较或运算可以理解为,多个关联特征之间可以进行比较或运算,多个目标特征之间可以进行比较或运算,以及,关联特征和目标特征之间可以进行比较或运算。
步骤S13,基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果。
在本公开实施例中,可以综合提取的多个目标特征和多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,例如,可以利用上述相互作用预测模型对多个目标特征和多个关联特征进行特征整合,输出第一目标和第二目标之间相互作用的预测结果。预测结果可以指示两个不同目标之间的相互作用,从而通过相互作用的预测结果可以对一些目标之间未知的相互作用进行预测,或者,通过相互作用的预测结果可以对一些目标之间已知的相互作用进行验证。
这里,第一目标可以包括属于第一类别的目标,第二目标可以包括属于第二类别的目标,即第一目标和第二目标可以分别属于不同类别。一些实现方式中,第一目标可以包括多个目标,第二目标也可以包括多个目标,从而本公开不仅可以得到两个不同目标之间的相互作用的预测结果,还可以得到多对目标之间的相互作用的预测结果。进一步地,第一目标与第二目标之间不具有第一关联信息,即可以理解为,获取的多个第一关联信息中不包括第一目标与第二目标之间的相互作用,故可以利用本公开提供的方案对第一目标与第二目标之间的相互作用进行预测。
本公开实施例可以通过整合多种信息对不同的两个目标之间的相互作用进行预测,从而可以综合各种可能影响相互作用的因素,使得到的第一目标和第二目标之间的相互作用的预测结果更加准确。
在本公开实施例中,可以获取多个第一关联信息,从而可以为两个目标之间的相互作用预测提供全面的信息。在一些实现方式中,可以基于多个目标信息,确定多个第一关联信息中的至少一个第一关联信息,从而可以通过对多个目标信息进行整合,确定多个目标中至少两个目标之间的关联,得到至少一个第一关联信息,例如,可以利用一些医学方面的算法、模型,通过多个目标信息得到一些目标之间的第一关联信息,如,可以根据不同药物的酶的抑制或诱导信息,确定不同药物之间的相互作用,或者,可以根据不同靶蛋白(靶标)的化学元素组成,确定不同靶标之间的相互作用。这样,在一些目标之间的第一关联信息无法直接获取的情况下,也可以通过多个目标信息确定不同目标之间的第一关联信息,从而使第一关联信息更加全面。
这里,由于目标信息可能源于不同类型的目标,不同目标信息的表示方式或信息结构可以不同。相应地,第一关联信息可以表示部分目标中不同的两个目标之间的相互作用和/或相似度,从而第一关联信息与目标信息的表示方式或信息结构也可以不同。
在本实现方式的一个示例中,针对多个目标中不同的两个目标,可以根据两个目标中每个目标对应的目标信息,确定两个目标之间的相互作用,这两个目标可以属于不同类别或同一类别。例如,可以根据药物的化学结构以及靶标的核苷酸信息,判断某种药物的化学基团是否可以与靶标的核苷酸形成化学键,从而确定药物与靶标之间的相互作用。这样可以针对不同类别的两个目标,通过这两个目标的目标信息确定两个目标之间的相互作用,从而可以间接建立同一类别或不同类别中的两个目标之间的关联,使第一关联信息更加全面。
在本实现方式的另一个示例中,目标信息可以包括结构信息,结构信息可以包括分子结构信息和化学结构信息中的一种或多种。相应地,在基于多个目标信息,确定多个第一关联信息中的至少一个第一关联信息的情况下,针对多个类别中的同一类别的两个目标,根据这两个目标中每个目标的结构信息,确定这两个目标的相似度,例如,可以根据每个药物的化学结构信息,确定不同的两个药物在化学结构上的相似度,再例如,可以根据每个蛋白质分子的一级序列结构信息,确定不同的两个蛋白质分子在一级序列结构上的相似度。这里,如果同一类别的两个不同的目标在结构信息上相似,可以认为这两个目标的表现行为比较相似,从而可以通过同一类别中目标的结构信息,确定同一类别中的两个目标之间的相似度,进一步丰富目标之间的第一关联信息。
在上述步骤S13中,可以基于多个目标特征和多个关联特征确定第一目标与第二目标之间相互作用的预测结果,从而为第一目标与第二目标之间的相互作用进行预测。在一些实现方式中,可以将多个目标特征和多个关联特征进行特征融合,得到融合特征,再根据融合特征确定第一目标与第二目标之间相互作用的预测结果。
在本实现方式中,可以利用上述相互作用预测模型对多个目标特征和多个关联特征进行特征融合,例如,可以将多个目标特征和多个关联特征进行横向或纵向拼接,得到融合特征。进一步可以对融合特征进行卷积操作、池化操作、采样操作、全连接操作等,可以得到第一目标与第二目标之间的相互作用的预测结果。通过将多个目标特征和多个关联特征进行特征融合,可以使目标信息和第一关联信息更好地结合在一起,从而基于融合特征得到的相互作用的预测结果可以更加准确。
在本公开实施例中,可以基于多个目标特征和多个关联特征,利用已训练的相互作用预测模型确定第一目标与第二目标之间相互作用的预测结果。相互作用预测模型可以是神经网络,下面对相互作用预测模型的训练过程进行说明。
在一些实现方式中,可以基于多个样本信息以及多个第二关联信息,对相互作用预测模型进行训练,得到已训练的相互作用预测模型。其中,多个样本信息分别对应多个样本,多个样本属于所述多个类别,第二关联信息用于表示不同两个样本之间的相互作用和相似度中的至少一个。
在本实现方式中,样本信息可以是用于相互作用预测模型训练的与样本相关的信息,例如,样本的标识信息、类别信息、结构信息等。多个样本信息可以分别对应多个样本,样本可以是实体对象或非实体对象。例如,样本可以是药物、靶标、疾病以及副作用等,相应地,样本信息可以包括药物、靶标、疾病以及副作用的标识信息、类别信息、结构信息等。多个样本可以分别属于多个类别,多个类别可以包括上述的第一类别、第二类别以及与第一类别和/或第二类别相关联的至少一个第三类别。多个样本之间的第二关联信息用于表示不同的两个样本之间的相互作用和相似度中的至少一个。这里,可以获取多个样本的样本信息以及多个样本之间的第二关联信息。在对相互作用预测模型进行训练的情况下,可以将多个样本信息和多个第二关联信息输入相互作用预测模型中,得到第一样本与第二样本之间相互作用的预测结果,然后可以判断第一样本与第二样本之间相互作用的预测结果是否符合预设需求。在第一样本与第二样本之间相互作用的预测结果不符合预设需求的情况下,可以不断对相互作用预测模型进行调整,直到第一样本与第二样本之间相互作用的预测结果符合预设需求,从而实现相互作用预测模型的训练。其中,第一样本可以属于第一类别,第二样本可以属于第二类别。
这里,可以在本地存储中获取多个样本信息以及多个样本之间的第二关联信息,或者,可以从其他设备处获取多个样本信息以及多个样本之间的第二关联信息,例如,从一个或多个云端服务器、网络数据库处获取多个样本信息以及多个第二关联信息。一些实现方式中,也可以利用多个样本信息得到多个第二关联信息中的至少一个第二关联信息。
这里,第二关联信息可以包括以下至少一项:药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。
在一些实现方式中,在对相互作用预测模型进行训练的情况下,可以在多个第二关联信息中获取第一类别的第一样本与第二类别的第二样本之间的相互作用,并将第一样本与第二样本之间的相互作用作为标签信息,例如,可以将某个药物与某个靶标之间的相互作用作为标签信息。进而可以将多个样本信息和多个第二关联信息中除标签信息以外的多个第二关联信息输入相互作用预测模型,得到第一样本与第二样本之间的相互作用的预测结果。进一步可以将第一样本与第二样本之间相互作用的预测结果与标签信息进行比对,得到比对结果,例如,可以利用一些损失函数确定第一样本与第二样本之间相互作用的预测结果与标签信息的比对结果。进一步基于第一样本与第二样本之间相互作用的预测结果和标签信息的比对结果,可以对相互作用预测模型的网络权重进行调整,直到第一样本与第二样本之间相互作用的预测结果和标签信息的比对结果小于预设值,或者,直到训练次数达到预设次数,可以认为第一样本与第二样本的相互作用的预测结果符合上述预设需求,得到已训练的相互作用预测模型。
这里,第一样本与第二样本之间可以具有第二关联信息中的相互作用。为了使已训练的相互作用预测模型可以对不同类型中的两个目标之间的相互作用进行预测,可以将第二关联信息中第一样本与第二样本之间的相互作用作为标签信息,实现对相互作用预测模型输出的相互作用的预测结果进行监督。第一样本可以包括属于第一类别的至少一个样本,第二样本可以包括属于第二类别的至少一个样本,从而可以利用已知的标签信息对相互作用预测模型输出的至少一个预测结果进行监督。
需要说明的是,多个样本中可以包括上述目标,即,多个样本中一些样本可以与目标相同,相应地,目标信息可以与样本信息相同,第一关联信息可以与第二关联信息相同。对于第一类别中的样本和第二类别中的样本而言,一些第一类别中的样本和第二类别中的样本可能具有相互作用,从而可以利用这些样本已知的相互作用对相互作用预测模型进行训练。一些第一类别中的样本和第二类别中的样本之间的相互作用未知,从而可以利用已训练的相互作用预测模型对这些样本(此时的这些样本可以为目标)之间的相互作用进行预测。可以理解的是,在对相互作用预测模型训练完成后,即可以得到第一目标与第二目标之间相互作用的预测结果。这里,可以将多个目标的目标信息作为部分或全部样本信息,将多个目标之间的第一关联信息可以作为部分或全部的样本之间的第二关联信息,通过将这些信息一次性输入相互作用预测模型中,可以实现相作用预测模型的训练,并在相作用预测模型训练完成时,可以得到第一目标与第二目标之间相互作用的预测结果,这样可以提高相互作用预测的效率。
下面结合附图2对本公开实施例提供的信息处理方案进行举例说明。图2示出根据本公开实施例的信息处理方法一示例的框图。
在一个示例中,第一类别可以是药物类,第二类别可以是靶标类,第三类别可以包括疾病类和副作用类。
在第一个流程中,可以根据实际需求,确定相互作用预测模型可能会涉及的节点。在本示例中,可以包括药物类、靶标(蛋白质)类、疾病类、副作用类的多个样本的多个节点。根据多个样本信息,即根据药物信息(药物的样本信息)、蛋白质信息(蛋白质的样本信息)、疾病信息(疾病的样本信息)以及副作用信息(副作用的样本信息),可以确定多个样本中不同两个样本之间的关联信息(第二关联信息),例如,可以通过无向图的方式建立样本之间的联系,得到不同两个样本之间的关联信息。关联信息可以包括药物和靶标之间的相互作用(标签信息)、药物和药物之间的相互作用、药物和药物之间的相似性、药物和疾病之间的相互作用、药物和副作用之间的相互作用、靶标和靶标之间的相互作用、蛋白质和蛋白质之间的相似性、蛋白质和疾病之间的相互作用。
总而言之,通过第一个流程,可以获得任务相关节点的信息以及这些节点之间的交互网络(即关联信息)。
在第二个流程中,可以将第一个流程中的多个样本的样本信息和除标签信息之外的关联信息输入相互作用预测模型,利用相互作用预测模型提取样本信息的样本特征和关联信息的关联特征。其中,对于样本信息而言,可以先对样本信息进行结构化,例如,可以分别对药物、靶标等药学方面相关的样本信息进行结构化,对疾病、副作用等医学方面相关的样本信息进行结构化,然后对结构化的样本信息进行表征化,得到样本信息的样本特征。对于不同两个样本之间的关联信息而言,可以先将关联信息以及与关联信息相关的样本特征进行非线性映射,然后再进行表征化,从而可以使多源的信息得到融合,确定关联信息的关联特征。进一步可以对样本特征和关联特征进行特征融合,可以得到药物与靶标(如某治病蛋白质)之间的相关作用结果。
总而言之,通过第二个流程,可以根据第一个流程的输出(即,所有样本信息和除作为标签信息之外的关联信息),得到相互作用预测模型预测的药物与靶标之间相互作用的预测结果。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。
此外,本公开还提供了装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种信息处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
图3示出根据本公开实施例的信息处理装置的框图,如图3所示,所述装置包括:
获取模块31,用于获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;所述多个目标分别属于多个类别,所述多个类别包括第一类别、第二类别以及第三类别,所述第三类别与所述第一类别和所述第二类别中至少一个类别相关联;
提取模块32,用于分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;
确定模块33,用于基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于所述第一类别的目标,所述第二目标包括属于所述第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。
在一些实现方式中,所述获取模块31,用于基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息。
在一些实现方式中,所述获取模块31,用于针对所述多个目标中不同的两个目标,根据所述两个目标中每个目标对应的目标信息,确定所述两个目标之间的相互作用,其中,所述两个目标属于不同类别或同一类别。
在一些实现方式中,所述目标信息包括结构信息;所述获取模块31,用于针对所述多个类别中的同一类别的两个目标,根据所述两个目标中每个目标的结构信息,确定所述两个目标之间的相似度。
在一些实现方式中,所述确定模块32,用于将所述多个目标特征和所述多个关联特征进行特征融合,得到融合特征;根据所述融合特征确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述确定模块32,用于基于所述多个目标特征和所述多个关联特征,利用已训练的相互作用预测模型确定所述第一目标与第二目标之间相互作用的预测结果。
在一些实现方式中,所述装置还包括:训练模块,用于基于多个样本信息以及多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,其中,所述多个样本信息分别对应多个样本,所述多个样本属于所述多个类别,所述第二关联信息用于表示不同两个样本之间的相互作用和相似度中的至少一个。
在一些实现方式中,所述训练模块,用于在所述多个第二关联信息中获取第一样本与第二样本之间的相互作用作为标签信息,其中,所述第一样本属于所述第一类别,所述第二样本属于所述第二类别;将所述多个样本信息和所述多个第二关联信息中除所述标签信息以外的第二关联信息输入所述相互作用预测模型,得到所述第一样本与所述第二样本之间相互作用的预测结果;基于所述第一样本与所述第二样本之间相互作用的预测结果和所述标签信息的比对结果,对所述相互作用预测模型的网络权重进行调整,得到已训练的相互作用预测模型。
在一些实现方式中,所述第一类别包括药物类和靶标类中的一个类别,所述第二类别包括药物类和靶标类中的另一个类别,所述第三类别包括疾病类和副作用类中的至少一个类别。
在一些实现方式中,关联信息包括所述第一关联信息和所述第二关联信息,所述关联信息包括以下至少一项:
药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,当计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任一实施例提供的同行识别方法的指令。
本公开实施例还提供了另一种计算机程序产品,用于存储计算机可读指令,指令被执行时使得计算机执行上述任一实施例提供的信息处理方法的操作。
电子设备可以被提供为终端、服务器或其它形态的设备。
图4示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图4,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如互补金属氧化物半导体(CMOS)或电荷耦合装置(CCD)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如无线网络(WiFi),第二代移动通信技术(2G)或第三代移动通信技术(3G),或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图5示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图5,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OSXTM),多用户多进程的计算机操作系统(UnixTM),自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (13)
1.一种信息处理方法,其特征在于,包括:
获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;所述多个目标分别属于多个类别,所述多个类别包括第一类别、第二类别以及第三类别,所述第三类别与所述第一类别和所述第二类别中至少一个类别相关联;
分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;
基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于所述第一类别的目标,所述第二目标包括属于所述第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。
2.根据权利要求1所述的方法,其特征在于,所述获取多个第一关联信息,包括:
基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息,包括:
针对所述多个目标中不同的两个目标,根据所述两个目标中每个目标对应的目标信息,确定所述两个目标之间的相互作用,其中,所述两个目标属于不同类别或同一类别。
4.根据权利要求2所述的方法,其特征在于,所述目标信息包括结构信息;所述基于所述多个目标信息,确定所述多个第一关联信息中的至少一个第一关联信息,包括:
针对所述多个类别中的同一类别的两个目标,根据所述两个目标中每个目标的结构信息,确定所述两个目标之间的相似度。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,包括:
将所述多个目标特征和所述多个关联特征进行特征融合,得到融合特征;
根据所述融合特征确定所述第一目标与第二目标之间相互作用的预测结果。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,包括:
基于所述多个目标特征和所述多个关联特征,利用已训练的相互作用预测模型确定所述第一目标与第二目标之间相互作用的预测结果。
7.根据权利要求6所述的方法,其特征在于,所述相互作用预测模型的训练过程包括:
基于多个样本信息以及多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,其中,所述多个样本信息分别对应多个样本,所述多个样本属于所述多个类别,所述第二关联信息用于表示不同两个样本之间的相互作用和相似度中的至少一个。
8.根据权利要求7所述的方法,其特征在于,所述基于多个样本信息以及所述多个第二关联信息,对所述相互作用预测模型进行训练,得到已训练的相互作用预测模型,包括:
在所述多个第二关联信息中获取第一样本与第二样本之间的相互作用作为标签信息,其中,所述第一样本属于所述第一类别,所述第二样本属于所述第二类别;
将所述多个样本信息和所述多个第二关联信息中除所述标签信息以外的第二关联信息输入所述相互作用预测模型,得到所述第一样本与所述第二样本之间相互作用的预测结果;
基于所述第一样本与所述第二样本之间相互作用的预测结果和所述标签信息的比对结果,对所述相互作用预测模型的网络权重进行调整,得到已训练的相互作用预测模型。
9.根据权利要求1至8任意一项所述的方法,其特征在于,所述第一类别包括药物类和靶标类中的一个类别,所述第二类别包括药物类和靶标类中的另一个类别,所述第三类别包括疾病类和副作用类中的至少一个类别。
10.根据权利要求1至9任意一项所述的方法,其特征在于,关联信息包括所述第一关联信息和所述第二关联信息,所述关联信息包括以下至少一项:
药物和靶标之间的相互作用、不同药物之间的相互作用、不同药物之间的相似度、药物和疾病之间相互作用、药物和副作用之间的相互作用、不同靶标之间的相互作用、不同靶标之间的相似度、靶标和疾病之间的相互作用。
11.一种信息处理装置,其特征在于,包括:
获取模块,用于获取多个目标信息以及多个第一关联信息,其中,所述多个目标信息分别对应多个目标,所述第一关联信息用于表示不同两个目标之间的相互作用和相似度中的至少一个;多个目标分别属于多个类别,所述多个类别包括第一类别、第二类别以及第三类别,所述第三类别与所述第一类别和所述第二类别中至少一个类别相关联;
提取模块,用于分别提取所述多个目标信息的多个目标特征以及所述多个第一关联信息的多个关联特征;
确定模块,用于基于所述多个目标特征和所述多个关联特征,确定第一目标与第二目标之间相互作用的预测结果,其中,所述第一目标包括属于所述第一类别的目标,所述第二目标包括属于所述第二类别的目标,所述第一目标与所述第二目标之间不具有第一关联信息。
12.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至10中任意一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至10中任意一项所述的方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011358130.4A CN112331279A (zh) | 2020-11-27 | 2020-11-27 | 信息处理方法及装置、电子设备和存储介质 |
JP2021576591A JP2023507697A (ja) | 2020-11-27 | 2020-12-21 | 情報処理方法及び装置、電子デバイス並びにコンピュータ可読記憶媒体 |
KR1020227001099A KR20220012405A (ko) | 2020-11-27 | 2020-12-21 | 정보 처리 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능 저장 매체 |
PCT/CN2020/138137 WO2022110411A1 (zh) | 2020-11-27 | 2020-12-21 | 信息处理方法及装置、电子设备和计算机可读存储介质 |
TW110116122A TWI786623B (zh) | 2020-11-27 | 2021-05-04 | 資訊處理方法、電子設備和電腦可讀儲存介質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011358130.4A CN112331279A (zh) | 2020-11-27 | 2020-11-27 | 信息处理方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112331279A true CN112331279A (zh) | 2021-02-05 |
Family
ID=74308491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011358130.4A Withdrawn CN112331279A (zh) | 2020-11-27 | 2020-11-27 | 信息处理方法及装置、电子设备和存储介质 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN112331279A (zh) |
TW (1) | TWI786623B (zh) |
WO (1) | WO2022110411A1 (zh) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11074495B2 (en) * | 2013-02-28 | 2021-07-27 | Z Advanced Computing, Inc. (Zac) | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
WO2018057888A1 (en) * | 2016-09-23 | 2018-03-29 | Driver, Inc. | Integrated systems and methods for automated processing and analysis of biological samples, clinical information processing and clinical trial matching |
CN107038348B (zh) * | 2017-05-04 | 2020-03-10 | 四川大学 | 基于蛋白-配体相互作用指纹图谱的药物靶标预测方法 |
CN108615237B (zh) * | 2018-05-08 | 2021-09-07 | 上海商汤智能科技有限公司 | 一种肺部图像处理方法及图像处理设备 |
CN109712678B (zh) * | 2018-12-12 | 2020-03-06 | 中国人民解放军军事科学院军事医学研究院 | 关系预测方法、装置及电子设备 |
EP3739589A1 (en) * | 2019-05-17 | 2020-11-18 | NEC OncoImmunity AS | Method and system for binding affinity prediction and method of generating a candidate protein-binding peptide |
CN110443366B (zh) * | 2019-07-30 | 2022-08-30 | 上海商汤智能科技有限公司 | 神经网络的优化方法及装置、目标检测方法及装置 |
CN110415763B (zh) * | 2019-08-06 | 2023-05-23 | 腾讯科技(深圳)有限公司 | 药物与靶标的相互作用预测方法、装置、设备及存储介质 |
CN111613291B (zh) * | 2020-05-28 | 2021-06-01 | 浙江大学医学院附属第一医院 | 一种药物管理、分类、医护人员与患者关联系统 |
CN111785320B (zh) * | 2020-06-28 | 2024-02-06 | 西安电子科技大学 | 基于多层网络表示学习的药物靶标相互作用预测方法 |
CN112270950B (zh) * | 2020-11-04 | 2023-06-23 | 中山大学 | 一种基于网络增强和图正则的融合网络药物靶标关系预测方法 |
-
2020
- 2020-11-27 CN CN202011358130.4A patent/CN112331279A/zh not_active Withdrawn
- 2020-12-21 WO PCT/CN2020/138137 patent/WO2022110411A1/zh unknown
-
2021
- 2021-05-04 TW TW110116122A patent/TWI786623B/zh active
Also Published As
Publication number | Publication date |
---|---|
TW202221721A (zh) | 2022-06-01 |
TWI786623B (zh) | 2022-12-11 |
WO2022110411A1 (zh) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569777B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109543537B (zh) | 重识别模型增量训练方法及装置、电子设备和存储介质 | |
WO2021098256A1 (zh) | 一种预测方法及装置、电子设备和存储介质 | |
CN114240882A (zh) | 缺陷检测方法及装置、电子设备和存储介质 | |
CN114613427A (zh) | 蛋白质三维结构预测方法及装置、电子设备和存储介质 | |
CN114338083A (zh) | 控制器局域网络总线异常检测方法、装置和电子设备 | |
CN111539410A (zh) | 字符识别方法及装置、电子设备和存储介质 | |
CN109685041B (zh) | 图像分析方法及装置、电子设备和存储介质 | |
CN112016443B (zh) | 同行识别方法及装置、电子设备和存储介质 | |
CN111259967A (zh) | 图像分类及神经网络训练方法、装置、设备及存储介质 | |
CN111582383A (zh) | 属性识别方法及装置、电子设备和存储介质 | |
CN113139471A (zh) | 目标检测方法及装置、电子设备和存储介质 | |
CN113807253A (zh) | 人脸识别方法及装置、电子设备和存储介质 | |
CN113052874A (zh) | 目标跟踪方法及装置、电子设备和存储介质 | |
CN115035947B (zh) | 蛋白质结构建模方法及装置、电子设备和存储介质 | |
CN112102300A (zh) | 计数方法及装置、电子设备和存储介质 | |
WO2022110801A1 (zh) | 数据处理方法及装置、电子设备和存储介质 | |
CN112331279A (zh) | 信息处理方法及装置、电子设备和存储介质 | |
CN114648649A (zh) | 人脸匹配方法及装置、电子设备和存储介质 | |
CN113470735A (zh) | 预测方法及装置、电子设备和存储介质 | |
CN114020264A (zh) | 算子处理方法及装置、电子设备和存储介质 | |
CN114153540A (zh) | 预训练模型发布方法及装置、电子设备和存储介质 | |
CN113470736A (zh) | 预测方法及装置、电子设备和存储介质 | |
CN112800954A (zh) | 文本检测方法及装置、电子设备和存储介质 | |
CN111582265A (zh) | 一种文本检测方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40036434 Country of ref document: HK |
|
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210205 |