CN116705189B - 检索化学物的方法、装置以及存储介质 - Google Patents

检索化学物的方法、装置以及存储介质 Download PDF

Info

Publication number
CN116705189B
CN116705189B CN202310993794.5A CN202310993794A CN116705189B CN 116705189 B CN116705189 B CN 116705189B CN 202310993794 A CN202310993794 A CN 202310993794A CN 116705189 B CN116705189 B CN 116705189B
Authority
CN
China
Prior art keywords
structural formula
dimensional structural
chemical
character expression
target chemical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310993794.5A
Other languages
English (en)
Other versions
CN116705189A (zh
Inventor
黄岐丽
王天也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huicaitong Technology Co ltd
Original Assignee
Beijing Huicaitong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huicaitong Technology Co ltd filed Critical Beijing Huicaitong Technology Co ltd
Priority to CN202310993794.5A priority Critical patent/CN116705189B/zh
Publication of CN116705189A publication Critical patent/CN116705189A/zh
Application granted granted Critical
Publication of CN116705189B publication Critical patent/CN116705189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种检索化学物的方法、装置以及存储介质,包括:接收与待检索的目标化学物对应的第一二维结构式;根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式;将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。

Description

检索化学物的方法、装置以及存储介质
技术领域
本申请涉及化学物检索领域,特别是涉及一种检索化学物的方法、装置以及存储介质。
背景技术
随着科学技术的不断发展,针对于具有确定结构的物质,技术人员通常利用结构式检索的方式在数据库中进行检索,从而得到精确的检索结果。
现有的结构式检索技术,多数是基于国外的开源技术所构建,但是在一些安全性要求高的环境中,开源技术无法安装和使用。例如,Open Babel是化学领域常用的一个文件格式转换工具,它可以支持zxy的坐标格式、SMILES表达式和InChl表达式等格式之间的互相转化。Open Babel的使用原理:Open Babel针对于用户输入的化学物结构式,并基于算法,将化学物结构式中的每个元素和化学键转化为由32个、64个或者更多的数字组成的数字组。然后,Open Babel将转化后的数字组与预先存储在数据库中的数据信息进行匹配,从而达到检索的目的。但是由于化学物结构式具备复杂性和多样性的性质,因此可能导致数据库存储量大以及检索效率低。
此外,还可以基于SMILES(即简化分子线性输入规范,Simplified molecularinput line entry system)将二维结构的化学物结构式转换为通过ASCII字符串描述的SMILES线性结构式。从而,通过SMILES线性结构式比对的检索方式,实现结构式检索。不可否认,基于SMILES检索化学物结构式的方式具有一定的用处,但是如果通过SMILES直接检索,则化学物的结构式越复杂,SMILES的写法也就越多(即,一个化学物的二维结构式对应多种SMILES写法),且可能呈翻倍式增长,从而可能会使得数据库存储的数据量无限增大。
公开号为CN102436447A,名称为化学物质的信息的处理和匹配方法、系统及存储系统。化学物质的信息的处理方法包括:获得化学物质的化学结构式的子结构;从所获得的子结构中确定化学物质的特征子结构;以及存储化学物质的特征子结构。
公开号为CN103678462A,名称为一种用于获得与产品有关的信息表的方法。该方法包括以下操作:产生一个或多个QR码,每一个QR码关联于与产品有关的信息表;将每一个QR码应用于产品;布置中央服务器,其可经由互联网被访问且包括文件,该文件包含与产生的QR码相关联的信息表;并且其中以这样的方式经由读取装置来预见QR码的读取:读取的QR码的解码经由互联网与中央服务器产生连接,并经由互联网发送相应的信息表。
针对上述的现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种检索化学物的方法、装置以及存储介质,以至少解决现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
根据本公开实施例的一个方面,提供了一种检索化学物的方法,包括:接收与待检索的目标化学物对应的第一二维结构式;根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式;将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种检索化学物的装置,包括:输入模块,用于接收与待检索的目标化学物对应的第一二维结构式;第一SMILES线性结构式确定模块,用于根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式;第一字符表达式确定模块,用于将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及第二二维结构式确定模块,用于基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
根据本公开实施例的另一个方面,还提供了一种检索化学物的装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收与待检索的目标化学物对应的第一二维结构式;根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式;将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
本申请公开了一种检索化学物的方法。首先,输入模块接收待检索的与目标化学物对应的第一二维结构式。然后,第二处理模块根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式。进一步地,第二处理模块将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,生成与目标化学物对应的第一字符表达式。最后,检索模块基于第一字符表达式,在数据库中检索,并确定与第一二维结构式相匹配的第二二维结构式。
由于本申请实施例首先是将与待检索的目标化学物对应的第一二维结构式转化为与目标化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符忽略掉,并对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式,因此尽管与目标化学物的第一二维结构式对应有多个SMILES线性结构式,但是最终经过转化后的第一字符表达式是唯一确定的,从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。进而解决了现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是根据本申请实施例1的第一个方面所述的计算设备的硬件结构框图;
图2是根据本申请实施例1的第一个方面所述的化学物检索系统的模块化示意图;
图3是根据本申请实施例1的第一个方面所述的检索化学物的方法流程示意图;
图4是根据本申请实施例1的第一个方面所述的三溴苯的二维结构式的示意图;
图5是根据本申请实施例1的第一个方面所述的化学物检索系统检索得到三溴苯的二维结构式的示意图;
图6是根据本申请实施例1的第一个方面所述的萘硫醇的二维结构式的示意图;
图7是根据本申请实施例2的第一个方面所述的检索化学物的装置示意图;以及
图8是根据本公开实施例3的第一个方面所述的检索化学物的装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种检索化学物的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的计算设备中执行。图1示出了一种用于实现检索化学物的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、用于通信功能的传输装置以及输入/输出接口。其中存储器、传输装置以及输入/输出接口通过总线与处理器连接。除此以外,还可以包括:与输入/输出接口连接的显示器、键盘以及光标控制设备。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的检索化学物的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的检索化学物的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2是根据本申请实施例所述的化学物检索系统100的模块化示意图。参考图2所示,化学物检索系统100包括录入模块110、第一处理模块120、存储模块130、数据库140、输入模块150、第二处理模块160、检索模块170以及输出模块180。
录入模块110用于录入化学物的第三二维结构式,并将各个化学物的第三二维结构式发送至第一处理模块120。第一处理模块120在接收到各个化学物的第三二维结构式后,将各个化学物的第三二维结构式转化为SMILES线性结构式,并将SMILES线性结构式中的公共字符替换为空字符,从而得到剩余字符,按照ASCII码对剩余字符进行排序,从而得到唯一确定的第二字符表达式。此外,第一处理模块120还用于确定与各个化学物的第三二维结构式对应的第三分子量。存储模块130用于将与各个化学物对应的第三二维结构式、与各个化学物对应的第二字符表达式和与各个化学物对应的第三二维结构式的第三分子量,存储至数据库140。
输入模块150用于接收由用户输入的待检索的目标化学物的第一二维结构式,并将目标化学物的第一二维结构式发送至第二处理模块160。第二处理模块160在接收到目标化学物的第一二维结构式后,将目标化学物的第一二维结构式转化为SMILES线性结构式,并将SMILES线性结构式中的公共字符替换为空字符,从而得到剩余字符,按照ASCII码对剩余字符进行排序,从而得到唯一确定的第一字符表达式。此外,第二处理模块160还用于确定与目标化学物对应的第一二维结构式的第一分子量。检索模块170用于根据与目标化学物对应的第一字符表达式和与第一二维结构式对应的第一分子量,在数据库140中进行检索,从而将检索得到的结果发送至输出模块180。输出模块180用于将结果显示给用户。
在上述运行环境下,根据本实施例的第一个方面,提供了一种检索化学物的方法,该方法由图2中所示的化学物检索系统100实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:
S302:接收与待检索的目标化学物对应的第一二维结构式;
S304:根据与目标化学物对应的第一二维结构式,确定与目标化学物对应的SMILES线性结构式;
S306:将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及
S308:基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
具体地,参考图2所示,首先,化学物检索系统100中的输入模块150接收到由用户输入的待检索的与目标化学物对应的第一二维结构式(S302)。例如,目标化学物为三溴苯,用户通过输入模块150将三溴苯的第一二维结构式输入至化学物检索系统100中。
然后,输入模块150将目标化学物的第一二维结构式发送至第二处理模块160。
进一步地,第二处理模块160在接收到由输入模块150发送的与目标化学物对应的第一二维结构式后,确定与目标化学物的第一二维结构式对应的SMILES线性结构式(S304)。例如,第二处理模块160接收到三溴苯的第一二维结构式后,能够根据三溴苯的第一二维结构式转化得到SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br。
然后,第二处理模块160将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并按照ASCII码对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式(S306)。其中,公共字符指的各个化学物的SMILES线性结构式中共有的字符。例如,字符“H”、“O”、“(”、“)”和“C”等。再例如,第二处理模块160根据三溴苯的第一二维结构式,确定了与三溴苯对应的SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br。然后,第二处理模块160将与三溴苯对应的SMILES线性结构式中的公共字符(即,“H”、“O”和“C”)替换为空字符,从而得到的与SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br对应的剩余字符为=1BrBr==1Br。然后,第二处理模块160将与SMILES线性结构式对应的剩余字符按照ASCII码排列,从而得到与三溴苯对应的第一字符表达式11===BrBrBr。
最后,第二处理模块160基于第一字符表达式,在数据库140中检索,确定与第一二维结构式匹配的第二二维结构式(S308)。其中,第二二维结构式用于指示相应的化学物。其中,第二二维结构式可以为一个也可以为多个,且第二二维结构式可以与第一二维结构式相同,也可以与第一二维结构式不同。
图5是根据本申请实施例所述的化学物检索系统100检索得到三溴苯的二维结构式的示意图。参考图5所示,用户在将三溴苯的第一二维结构式输入至化学物检索系统100中后,第二处理模块160根据三溴苯的第一二维结构式,确定与三溴苯对应的SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br。然后,第二处理模块160根据与三溴苯对应的SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br,确定与三溴苯对应的第一字符表达式11===BrBrBr。进一步地,检索模块170根据与三溴苯对应的第一字符表达式11===BrBrBr,在数据库140中进行检索,并确定与第一二维结构式相匹配第二二维结构式。其中,第二二维结构式例如可以是图5显示的1469个二维结构式,因此由上述可知,第二二维结构式可以与第一二维结构式相同,也可以与第一二维结构式不同。
正如背景技术中所述,可以基于SMILES(即简化分子线性输入规范,Simplifiedmolecular input line entry system)将二维结构的化学物结构式转换为通过ASCII字符串描述的SMILES线性结构式。从而,通过SMILES线性结构式比对的检索方式,实现结构式检索。不可否认,基于SMILES检索化学物结构式的方式具有一定的用处,但是如果通过SMILES直接检索,则化学物的结构式越复杂,SMILES的写法也就越多(即,一个化学物的二维结构式对应多种SMILES的写法),且可能呈翻倍式增长,从而可能会使得数据库存储的数据量无限增大。
进一步地,由于写法不同,经过第一处理模块120处理后所得到的SMILES线性结构式也可能不同。例如,第一处理模块120接收到三溴苯的第三二维结构式后,可能根据三溴苯的第三二维结构式转换得到SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br、可能根据三溴苯的第三二维结构式转换得到SMILES线性结构式C1=C(Br)C=C(Br)C=C1Br、还可能根据三溴苯的第三二维结构式转换得到SMILES线性结构式C1=C(C=C(C=C1Br)Br)Br)。
因此如果将上述所有可能与三溴苯的第三二维结构式对应的SMILES线性结构式录入至数据库140,则数据库140的数据存储量会大大增加。
有鉴于此,本申请实施例首先是将与各个化学物的第三二维结构式转化为与各个化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符替换为空字符,并按照ASCII码对剩余字符进行排序,从而生成与各个化学物的第三二维结构式对应的第二字符表达式,因此尽管与各个化学物对应的第三二维结构式对应多种SMILES线性结构式的写法,但是最终经过转化后的第二字符表达式是唯一确定的,从而在建立数据库140时,能够大大减少数据库140的数据存储量。
因此当化学物检索系统100接收到与待检索的三溴苯对应的第一二维结构式时,虽然第二处理模块160可能根据三溴苯的第一二维结构式转换得到SMILES线性结构式C(C(=CC1Br)Br)=C(C=1)Br、可能根据三溴苯的第一二维结构式转换得到SMILES线性结构式C1=C(Br)C=C(Br)C=C1Br、还可能根据三溴苯的第一二维结构式转换得到SMILES线性结构式C1=C(C=C(C=C1Br)Br)Br)。但无论第二处理模块160根据三溴苯的第一二维结构式转换后,得到上述哪种SMILES线性结构式,第二处理模块160在将与三溴苯对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符排序后所得到的第一字符表达式都是相同的,即,第一字符表达式11===BrBrBr。从而,检索模块170只需要将三溴苯的第一字符表达式11===BrBrBr,与数据库140中存储的与各个化学物对应的第二字符表达式进行匹配,就能够确定与第一二维结构式相匹配的第二二维结构式。
综上,虽然与化学物对应的第三二维结构式和与化学物对应的SMILES线性结构式是一对多的关系,但是由于与化学物对应的SMILES线性结构式和与化学物对应的第二字符表达式是多对一的关系,因此实际上与化学物对应的第三二维结构式和与化学物对应的第二字符表达式是一对一的关系,从而数据库的数据存储量会大大减少。
再例如,图6是根据本申请实施例所述的萘硫醇的二维结构式的示意图。参考图6所示,用户通过输入模块150将萘硫醇的第一二维结构式输入至化学物检索系统100后,化学物检索系统100中的第二处理模块160将萘硫醇的第一二维结构式转化成SMILES线性结构式C(C=CC1)=C(C=1C=C2S)C=C2。
进一步地,第二处理模块160将萘硫醇的SMILES线性结构式中的公共字符替换为空字符,并得到剩余字符。即,与SMILES线性结构式C(C=CC1)=C(C=1C=C2S)C=C2对应的剩余字符为=1==1=2S=。
然后,第二处理模块160按照ASCII码对剩余字符=1==1=2S=进行排序,从而得到与萘硫醇对应的唯一确定的第一字符表达式1122=====S。
最后,检索模块170根据与萘硫醇对应的第一字符表达式,在数据库140中进行检索,从而确定相匹配的第二二维结构式。
基于此,虽然第二处理模块160还可能根据萘硫醇的第一二维结构式,确定与萘硫醇对应的SMILES线性结构式C1=CC=C(S)C2=CC=CC=C12或与萘硫醇对应的SMILES线性结构式C1=CC=C2C(=C1)C=CC=C2S。但是,由于第二处理器模块160将萘硫醇的SMILES线性结构式中的公共字符替换为空字符,并按照ASCII码对剩余字符进行排序后,所得到的第一字符表达式均为1122=====S,因此存储有与化学物对应的第二字符表达式的数据库140的数据量会大大减少。
可选地,基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式的操作,包括:将目标化学物的第一字符表达式与数据库中存储的第二字符表达式进行比对,确定与第一字符表达式匹配的第三字符表达式;以及确定与第三字符表达式对应的第二二维结构式。
具体地,第二处理模块160在将与目标化学物对应的第一二维结构式转换为第一字符表达式后,将与目标化学物对应的第一字符表达式发送至检索模块170。
而又由于数据库140中存储有与多种化学物对应的第二字符表达式,因此检索模块170能够将目标化学物的第一字符表达式与数据库140中与各个化学物对应的第二字符表达式进行匹配,从而筛选出与第三字符表达式对应的第二二维结构式。
参考图5所示,例如,用户将三溴苯的第一二维结构式输入至化学物检索系统100,并点击“搜索”后,化学物检索系统100中的第二处理模块160将三溴苯的第一二维结构式转换为线性结构式C(C(=CC1Br)Br)=C(C=1)Br,并将公共字符替换为空字符,从而得到剩余字符=1BrBr==1Br。
进一步地,第二处理模块160按照ASCII码顺序将剩余字符=1BrBr==1Br进行排序,从而得到与三溴苯对应的第一字符表达式11===BrBrBr,并将与三溴苯对应的第一字符表达式11===BrBrBr发送至检索模块170。
然后,检索模块170将与三溴苯对应的第一字符表达式11===BrBrBr与数据库140中存储的第二字符表达式进行匹配,确定与第一字符表达式11===BrBrBr对应的第三字符表达式,从而确定与第三字符表达式对应的1469条二维结构式信息。
可选地,第二二维结构式为多个第二二维结构式,并且方法还包括:确定目标化学物的第一分子量;计算目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中第二分子量为各个第二二维结构式对应的化学物的分子量;以及确定与最小的差值绝对值对应的第二二维结构式。
具体地,首先,检索模块170根据与目标化学物对应的第一字符表达式,在数据库140中进行检索匹配,确定与第一字符表达式匹配的第三字符表达式,并确定与第三字符表达式对应的第二二维结构式。例如,参考图4所示,检索模块170根据与三溴苯对应的第一字符表达式,在数据库140中检索,确定与三溴苯的第一字符表达式匹配的第三字符表达式,从而确定与第三字符表达式对应的1469条第二二维结构式信息。
但是由于与第三字符表达式对应的1469条第二二维结构式信息中仅有一条为与三溴苯对应的第一二维结构式信息,因此最终需要在1469条第二二维结构式信息中确定与三溴苯对应的第一二维结构式信息。
由于第二处理模块160已经预先确定了目标化学物的第一分子量,因此检索模块170在接收到与目标化学物对应的第一分子量大小后,将与目标化学物对应的第一分子量,和与1469条第二二维结构式信息对应的化学物的第二分子量做差,并按照差值绝对值的大小进行排序,从而确定与最小的差值绝对值对应的第二二维结构式信息为与目标化学物对应的第一二维结构式信息。例如,检索模块170将与三溴苯对应的第一分子量,和与1469条第二二维结构式信息对应的第二分子量做差,并得到最小的差值绝对值为0。则与差值绝对值为0对应的第二二维结构式信息是三溴苯的第一二维结构式信息。
从而,通过确定目标化学物的第一分子量与多个第二二维结构式的第二分子量的差值绝对值,并将与最小的差值绝对值对应的第二二维结构式,确定为与目标化学物对应的第一二维结构式的操作,达到了能够精确的确定与目标化学物对应的第一二维结构式的技术效果。
可选地,还包括:接收与录入的化学物对应的第三二维结构式;以及根据所录入的第三二维结构式,建立数据库。进一步可选地,根据所录入的第三二维结构式,建立数据库的操作,包括:根据第三二维结构式,确定与所录入的化学物对应的SMILES线性结构式;将与所录入的化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,生成与所录入的化学物对应的第二字符表达式;以及将第三二维结构式与相应的第二字符表达式存储至数据库。进一步可选地,还包括:将与第三二维结构式对应的第三分子量存储至数据库。
具体地,参考图2所示,在检索模块170基于数据库140检索目标化学物的第一二维结构式之前,需要先建立存储有与各个化学物对应的第三二维线性结构式、与各个化学物对应的第二字符表达式和与各个化学物对应的第三分子量的数据库140。
首先,用户通过录入模块110将与多个化学物对应的第三二维结构式发送至第一处理模块120。
然后,第一处理模块120根据与各个化学物对应的第三二维结构式,确定与各个化学物对应的SMILES线性结构式。
进一步地,第一处理模块120将与各个化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,从而得到与各个化学物对应的第二字符表达式。
然后,第一处理模块120确定与各个化学物对应的第三分子量,并将与各个化学物对应的第二字符表达式和第三分子量发送至存储模块130。存储模块130将与各个化学物对应的第二字符表达式和第三分子量存储至数据库140。从而,建立包含有与多个化学物对应的第三二维线性结构式、与各个第三二维线性结构式对应的第二字符表达式和与各个第三二维线性结构式对应的第三分子量的数据库140。
从而,通过建立包含有与多个样本化学物对应的第二字符表达式和第三分子量的数据库的操作,达到了为检索与目标化学物的第一二维结构式相匹配的第二二维结构式提供必要基础的技术效果。
从而根据本实施例的第一个方面,由于本申请实施例首先是将与待检索的目标化学物对应的第一二维结构式转化为与目标化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符忽略掉,并对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式,因此尽管与目标化学物的第一二维结构式对应有多个SMILES线性结构式,但是最终经过转化后的第一字符表达式是唯一确定的,从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。进而解决了现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
从而根据本实施例,由于本申请实施例首先是将与待检索的目标化学物对应的第一二维结构式转化为与目标化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符忽略掉,并对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式,因此尽管与目标化学物的第一二维结构式对应有多个SMILES线性结构式,但是最终经过转化后的第一字符表达式是唯一确定的,从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。进而解决了现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图7示出了根据本实施例的第一个方面所述的检索化学物的装置700,该装置700与根据实施例1的第一个方面所述的方法相对应。参考图7所示,该装置700包括:输入模块710,用于接收与待检索的目标化学物对应的第一二维结构式;第一SMILES线性结构式确定模块720,用于根据与目标化学物对应的二维结构式,确定与目标化学物对应的SMILES线性结构式;第一字符表达式确定模块730,用于将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及第二二维结构式确定模块740,用于基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
可选地,第二二维结构式模块740,包括:比对模块,用于将目标化学物的第一字符表达式与数据库中存储的第二字符表达式进行比对,确定与第一字符表达式匹配的第三字符表达式;以及第一确定模块,用于确定与第三字符表达式对应的第二二维结构式。
可选地,第二二维结构式为多个第二二维结构式,装置700还包括:第一分子量确定模块,用于确定目标化学物的第一分子量;绝对值差值计算模块,用于计算目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中第二分子量为各个第二二维结构式对应的化学物的分子量;第二确定模块,用于确定与最小的差值绝对值对应的第二二维结构式。
可选地,装置700还包括:二维结构式接收模块,用于接收与录入的化学物对应的第三二维结构式;以及数据库建立模块,用于根据所录入的第三二维结构式,建立数据库。
可选地,数据库建立模块,包括:第二SMILES线性结构式确定模块,用于根据第三二维结构式,确定与所录入的化学物对应的SMILES线性结构式;第二字符表达式确定模块,用于将与所录入的化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,生成与所录入的化学物对应的第二字符表达式;以及第一存储模块,用于将第三二维结构式与相应的第二字符表达式存储至数据库。
可选地,装置700还包括:第二存储模块,用于将与第三二维结构式对应的第三分子量存储至数据库。
从而根据本实施例,由于本申请实施例首先是将与待检索的目标化学物对应的第一二维结构式转化为与目标化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符忽略掉,并对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式,因此尽管与目标化学物的第一二维结构式对应有多个SMILES线性结构式,但是最终经过转化后的第一字符表达式是唯一确定的,从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。进而解决了现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
实施例3
图8示出了根据本实施例的第一个方面所述的检索化学物的装置800,该装置800与根据实施例1的第一个方面所述的方法相对应。参考图8所示,该装置800包括:处理器810;以及存储器820,与处理器810连接,用于为处理器810提供处理以下处理步骤的指令:接收与待检索的目标化学物对应的第一二维结构式;根据与目标化学物对应的二维结构式,确定与目标化学物对应的SMILES线性结构式;将与目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与目标化学物对应的第一字符表达式;以及基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式,其中第二二维结构式用于指示相应的化学物。
可选地,基于第一字符表达式,在数据库中检索,确定与第一二维结构式匹配的第二二维结构式的操作,包括:将目标化学物的第一字符表达式与数据库中存储的第二字符表达式进行比对,确定与第一字符表达式匹配的第三字符表达式;以及确定与第三字符表达式对应的第二二维结构式。
可选地,第二二维结构式为多个第二二维结构式,并且方法还包括:确定目标化学物的第一分子量;计算目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中第二分子量为各个第二二维结构式对应的化学物的分子量;以及确定与最小的差值绝对值对应的第二二维结构式。
可选地,还包括:接收与录入的化学物对应的第三二维结构式;以及根据所录入的第三二维结构式,建立数据库。
可选地,根据所录入的第三二维结构式,建立数据库的操作,包括:根据第三二维结构式,确定与所录入的化学物对应的SMILES线性结构式;将与所录入的化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,生成与所录入的化学物对应的第二字符表达式;以及将第三二维结构式与相应的第二字符表达式存储至数据库。
可选地,还包括:将与第三二维结构式对应的第三分子量存储至数据库。
从而根据本实施例,由于本申请实施例首先是将与待检索的目标化学物对应的第一二维结构式转化为与目标化学物对应的SMILES线性结构式,然后将SMILES线性结构式中的公共字符忽略掉,并对剩余字符进行排序,从而生成与目标化学物对应的第一字符表达式,因此尽管与目标化学物的第一二维结构式对应有多个SMILES线性结构式,但是最终经过转化后的第一字符表达式是唯一确定的,从而在建立数据库时,能够大大减少数据库的数据存储量并提升检索效率。进而解决了现有技术中存在的由于与化学物对应的SMILES线性结构式的多样性和复杂性,因此利用与化学物对应的SMILES线性结构式直接进行检索,可能导致数据库存储的数据量增大且检索效率低下的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种检索化学物的方法,其特征在于,包括:
接收与待检索的目标化学物对应的第一二维结构式;
根据与所述目标化学物对应的第一二维结构式,确定与所述目标化学物对应的SMILES线性结构式;
将与所述目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与所述目标化学物对应的第一字符表达式;
基于所述第一字符表达式,在数据库中检索,确定与所述第一二维结构式匹配的第二二维结构式,其中所述第二二维结构式用于指示相应的化学物,其中
基于所述第一字符表达式,在数据库中检索,确定与所述第一二维结构式匹配的第二二维结构式的操作,包括:
将所述目标化学物的第一字符表达式与所述数据库中存储的第二字符表达式进行比对,确定与所述第一字符表达式匹配的第三字符表达式;
确定与所述第三字符表达式对应的所述第二二维结构式;
确定所述目标化学物的第一分子量;
计算所述目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中所述第二分子量为各个第二二维结构式对应的化学物的分子量;以及
确定与最小的差值绝对值对应的第二二维结构式。
2.根据权利要求1所述的方法,其特征在于,还包括:
接收与录入的化学物对应的第三二维结构式;以及
根据所录入的第三二维结构式,建立所述数据库。
3.根据权利要求2所述的方法,其特征在于,根据所录入的第三二维结构式,建立所述数据库的操作,包括:
根据所述第三二维结构式,确定与所录入的化学物对应的SMILES线性结构式;
将与所录入的化学物对应的SMILES线性结构式中的公共字符替换为空字符,并对剩余字符进行排序,生成与所录入的化学物对应的第二字符表达式;以及
将所述第三二维结构式与相应的第二字符表达式存储至所述数据库。
4.根据权利要求3所述的方法,其特征在于,还包括:将与所述第三二维结构式对应的第三分子量存储至所述数据库。
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至4中任意一项所述的方法。
6.一种检索化学物的装置,其特征在于,包括:
输入模块,用于接收与待检索的目标化学物对应的第一二维结构式;
第一SMILES线性结构式确定模块,用于根据与所述目标化学物对应的第一二维结构式,确定与所述目标化学物对应的SMILES线性结构式;
第一字符表达式确定模块,用于将与所述目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与所述目标化学物对应的第一字符表达式;
第二二维结构式确定模块,用于基于所述第一字符表达式,在数据库中检索,确定与所述第一二维结构式匹配的第二二维结构式,其中所述第二二维结构式用于指示相应的化学物,其中
第二二维结构式确定模块,包括:
比对模块,用于将所述目标化学物的第一字符表达式与所述数据库中存储的第二字符表达式进行比对,确定与所述第一字符表达式匹配的第三字符表达式;
第二二维结构式确定子模块,用于确定与所述第三字符表达式对应的所述第二二维结构式;
第一分子量确定模块,用于确定所述目标化学物的第一分子量;
绝对值差值计算模块,用于计算所述目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中所述第二分子量为各个第二二维结构式对应的化学物的分子量;以及
第二确定模块,用于确定与最小的差值绝对值对应的第二二维结构式。
7.一种检索化学物的装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
接收与待检索的目标化学物对应的第一二维结构式;
根据与所述目标化学物对应的第一二维结构式,确定与所述目标化学物对应的SMILES线性结构式;
将与所述目标化学物对应的SMILES线性结构式中的公共字符替换为空字符,并将剩余字符进行排序,生成与所述目标化学物对应的第一字符表达式;
基于所述第一字符表达式,在数据库中检索,确定与所述第一二维结构式匹配的第二二维结构式,其中所述第二二维结构式用于指示相应的化学物,其中
基于所述第一字符表达式,在数据库中检索,确定与所述第一二维结构式匹配的第二二维结构式的操作,包括:
将所述目标化学物的第一字符表达式与所述数据库中存储的第二字符表达式进行比对,确定与所述第一字符表达式匹配的第三字符表达式;
确定与所述第三字符表达式对应的所述第二二维结构式;
确定所述目标化学物的第一分子量;
计算所述目标化学物的第一分子量与各个第二分子量之间的差值绝对值,其中所述第二分子量为各个第二二维结构式对应的化学物的分子量;以及
确定与最小的差值绝对值对应的第二二维结构式。
CN202310993794.5A 2023-08-09 2023-08-09 检索化学物的方法、装置以及存储介质 Active CN116705189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310993794.5A CN116705189B (zh) 2023-08-09 2023-08-09 检索化学物的方法、装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310993794.5A CN116705189B (zh) 2023-08-09 2023-08-09 检索化学物的方法、装置以及存储介质

Publications (2)

Publication Number Publication Date
CN116705189A CN116705189A (zh) 2023-09-05
CN116705189B true CN116705189B (zh) 2023-10-10

Family

ID=87829793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310993794.5A Active CN116705189B (zh) 2023-08-09 2023-08-09 检索化学物的方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN116705189B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413740A (zh) * 2019-08-06 2019-11-05 百度在线网络技术(北京)有限公司 化学表达式的查询方法、装置、电子设备及存储介质
JP2020035115A (ja) * 2018-08-28 2020-03-05 国立大学法人茨城大学 検索システム、検索方法、及び検索プログラム
CN114078570A (zh) * 2020-08-10 2022-02-22 重庆康洲大数据有限公司 一种化学分子结构检索系统
CN114375448A (zh) * 2019-06-07 2022-04-19 徕卡显微系统Cms有限公司 用于处理生物学相关数据的系统和方法、用于控制显微镜的系统和方法及显微镜
CN115185980A (zh) * 2022-09-07 2022-10-14 武汉星雪数据科技有限公司 医院病案数据检索方法、装置、设备及存储介质
CN115617965A (zh) * 2022-09-23 2023-01-17 北京语言大学 一种语言结构大数据的快速检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020035115A (ja) * 2018-08-28 2020-03-05 国立大学法人茨城大学 検索システム、検索方法、及び検索プログラム
CN114375448A (zh) * 2019-06-07 2022-04-19 徕卡显微系统Cms有限公司 用于处理生物学相关数据的系统和方法、用于控制显微镜的系统和方法及显微镜
CN110413740A (zh) * 2019-08-06 2019-11-05 百度在线网络技术(北京)有限公司 化学表达式的查询方法、装置、电子设备及存储介质
CN114078570A (zh) * 2020-08-10 2022-02-22 重庆康洲大数据有限公司 一种化学分子结构检索系统
CN115185980A (zh) * 2022-09-07 2022-10-14 武汉星雪数据科技有限公司 医院病案数据检索方法、装置、设备及存储介质
CN115617965A (zh) * 2022-09-23 2023-01-17 北京语言大学 一种语言结构大数据的快速检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏振强,廖晨钟,谢爱华,鲁先平,石乐明.基于甲骨文数据库管理系统的化学结构检索数据库的设计与实现.计算机与应用化学.2003,(05),全文. *

Also Published As

Publication number Publication date
CN116705189A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN112035453A (zh) 基于gbdt高阶特征组合的推荐方法、装置及存储介质
CN108108436B (zh) 数据存储方法、装置、存储介质及电子设备
CN105409252A (zh) 用于标识和传送位置的方法和装置
CN102713813A (zh) 用于从有序列表进行快速选择的方法和装置
CN113204621B (zh) 文档入库、文档检索方法,装置,设备以及存储介质
CN105608180A (zh) 一种用于应用程序的推荐方法及系统
CN112632402A (zh) 聊天群组创建方法、装置、设备及存储介质
US9977669B2 (en) Online computing system
CN116705189B (zh) 检索化学物的方法、装置以及存储介质
CN111930897B (zh) 专利检索方法、装置、电子设备及计算机可读存储介质
CN106557178B (zh) 用于更新输入法词条的方法及装置
CN112633988A (zh) 用户产品推荐方法、装置、电子设备及可读存储介质
CN107643906A (zh) 数据处理方法及装置
Torrente et al. A new algorithm for comparing and visualizing relationships between hierarchical and flat gene expression data clusterings
CN111177236B (zh) 基于医养照护场景的量表生成方法、系统、设备及介质
CN114282121A (zh) 业务节点推荐方法、系统、设备及存储介质
CN111538914B (zh) 地址信息的处理方法和装置
Maharaj et al. BLANT—fast graphlet sampling tool
CN103678397A (zh) 应用搜索装置、应用搜索方法以及电子设备
CN103793440A (zh) 信息显示方法和装置
CN110928667B (zh) 一种任务调度方法、装置、电子设备及存储介质
CN116049293B (zh) 基于数据库配置实现解析csv文件方法、装置、设备及介质
CN113704616B (zh) 信息推送方法、装置、电子设备及可读存储介质
KR102282126B1 (ko) 상수분해를 통한 인수분해 방법 및 이를 지원하는 디바이스
CN117194408A (zh) 一种索引方案的选择方法和存储设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant