CN106021474B - 一种确定smiles表达式之间是否具有子结构关系的方法 - Google Patents

一种确定smiles表达式之间是否具有子结构关系的方法 Download PDF

Info

Publication number
CN106021474B
CN106021474B CN201610330605.6A CN201610330605A CN106021474B CN 106021474 B CN106021474 B CN 106021474B CN 201610330605 A CN201610330605 A CN 201610330605A CN 106021474 B CN106021474 B CN 106021474B
Authority
CN
China
Prior art keywords
atom
expression formula
character
smiles
ring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610330605.6A
Other languages
English (en)
Other versions
CN106021474A (zh
Inventor
顾进广
彭彬
黄智生
范玉玲
杨毅融
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XIAMEN ZHONGKUN CHEMICAL CO Ltd
Wuhan University of Science and Engineering WUSE
Original Assignee
XIAMEN ZHONGKUN CHEMICAL CO Ltd
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XIAMEN ZHONGKUN CHEMICAL CO Ltd, Wuhan University of Science and Engineering WUSE filed Critical XIAMEN ZHONGKUN CHEMICAL CO Ltd
Priority to CN201610330605.6A priority Critical patent/CN106021474B/zh
Publication of CN106021474A publication Critical patent/CN106021474A/zh
Application granted granted Critical
Publication of CN106021474B publication Critical patent/CN106021474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种确定smiles表达式之间是否具有子结构关系的方法,包括:定义并存储常见原子、化学键和支链关系;定义切片最小粒度:相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;定义起始原子和终止原子,其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系。本发明方法可用于化学式部分结构检索,方法简单,执行效率高。

Description

一种确定smiles表达式之间是否具有子结构关系的方法
技术领域
本发明属于化学技术领域,涉及一种确定smiles表达式之间是否具有子结构关系的方法,具体涉及一种通过分析化学式的smiles结构,去判断此化学式与其他化学式是否具有子结构匹配关系的方法;应用于化合物子结构查询。
背景技术
化合物子结构查询在化学的许多领域中都有应用,如QSAR中对意义片段(子结构)的抽取,分子设计中对单元片段(子结构)的建模,合成设计中对合成子(子结构)的分割,以及光谱解析中对发色团(子结构)的组合等等都离不开结构匹配,而结构匹配又是进行结构性质研究的前提,也就是子结构查询的前提。
Smiles是一种线性码,即是一种用ASCII字符串明确描述分子结构的规范。线性码的实质是将分子中原子、键以及其它信息通过一定的命名规则进行符号化,然后按一定顺序进行排列而成的线性符号(一般为英文字符和ASCH码符号)序列。线性码具有命名的唯一性和单一性,且具有存储空间要求低的特点,能够满足子结构查询的基本要求。是一种比较理想的计算机内表示化学结构的方法。
化学式结构匹配中。如今常用的方法是采用对smiles编码改进后的smarts编码进行化学式结构匹配。Smarts是一种扩展形式,专门用于化学数据子结构查询的一种化学描述编码。而如今很多软件只是支持smiles来表达化学式信息,且smiles可很方便与分子式文件进行转换。而如何通过只分析smiles来判断化学结构子结构关系至今还没有较好的方式。
发明内容
为了解决上述技术问题,本发明提供了一种通过分析化学式的smiles结构,去判断此化学式与其他化学式是否具有子结构匹配关系的方法。
本发明所采用的技术方案是:1.一种确定smiles表达式之间是否具有子结构关系的方法,其特征在于,包括以下步骤:
步骤1:定义并存储常见原子、常见化学键和常见支链关系;
步骤2:定义切片最小粒度;相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;
步骤3:定义起始原子和终止原子;其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;
步骤4:基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;其中所述原子对根据相邻原子与之间的化学键关系与主支链关系确定;
步骤5:对化学式切片结果,根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系。
作为优选,步骤1中所述常见原子包括:H、C、N、O、S、F、Cl、Br、[N+]、[N-]、[O+]、[O-];所述常见化学键包括:单键、双键、三键、楔型向上键、楔形向下键、离域键、顺反不确定键、空心键、不确定键;所述常见支链包括:一个原子上包含一个支链、一个原子上包含二个支链。
作为优选,步骤4中所述将smiles表达式切割成一个个原子对,具体实现包括以下子步骤:
步骤4.1、首先对那些存储异构smiles的字符串剔除异构字符;
步骤4.2、统计环的个数与环边拆分位置的原子对;
步骤4.3、对经过预处理与去环结构后的smiles字符串进行循环遍历,判断ch[stop]的值情况,其中ch[stop]代表遍历字符串时,下标所处位置对应的字符值;
若为“=”,则化学键=“=”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
若为“#”,则化学键=“#”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
若为“(”,该位置前的第一个原子也就是起始原子与左括号内的内容,组成新的字符串,设置为str1;起始原子与对应右括号后的内容,组成新的字符串,设置为str2;将str1,str2作为新的smiles表达式进行切片流程处理;
若为“)”,位置指针向左寻找,找到与该括号匹配的左括号位置,并将左括号左边的第一个原子作为起始原子,位置为起始位置;
若为其他字符,则化学键=“”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
步骤4.4、根据公式:原子对=起始原子+化学键+终止原子。得到原子对,并存储到哈希表map中;
步骤4.5、将此次切片结果存储到哈希表map中,key值为片段名,value存储为该片段的个数;切片结果展示的是smiles结构式切成片段的种类与个数。
作为优选,步骤4.2中所述统计环的个数,其具体实现包括以下子步骤:
步骤4.2.1A:遍历smiles表达式每一个字符,观察是否有数字字符;
步骤4.2.2A:若包含数字,记住该数字的位置,从该位置后继续遍历直到找到包含同样数字字符,环的个数加1;过滤掉这两个位置的数字,组成新的字符串;
步骤4.2.3A:对新组成的字符串进行遍历,寻找新的数字字符;
步骤4.2.4A:当新组成的字符串无数字符,存储环的个数,则环的个数统计结束。
作为优选,步骤4.2中所述统计环边拆分位置的原子对,其具体实现包括以下子步骤:
步骤4.2.1B:遍历smiles表达式,统计环边拆分位置的原子对及对应原子对种类数量加1;
步骤4.2.2B:对剔除数字后的smiles表达式遍历,统计表达式存在原子对与对应原子对数量。
作为优选,步骤4.3中获取起始原子的具体实现包括以下子步骤:
步骤4.3.1A:定义常见的双原子列表,目前有常见的Br,Cl原子,将该列表存入配置文件中;
步骤4.3.2A:判断是否为双原子;列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则起始原子=ch1+ch2+“”;若第二个原子不是,则起始原子=ch1+“”;
步骤4.3.3A:判断是否为括号;若为括号,起始位置加1,继续对新的字符判断;
步骤4.3.4A:判断是否存在离子;若存在“[”字符,则继续寻找直到遇到“]”字符;则“[”与“]”之间组成的字符串即为起始原子,起始原子=“[”+ch1+ch2+……+chn+”]”。
作为优选,步骤4.3中获取终止原子的具体实现包括以下子步骤:
步骤4.3.1B:定义常见的双原子列表,目前有常见的Br,Cl原子,将该列表存入配置文件中;
步骤4.3.2B:判断是否为双原子;列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则终止原子=ch1+ch2+“”;若第二个原子不是,则终止原子=ch1+“”;
步骤4.3.3B:判断是否为括号;若为括号,起始位置加1,继续对新的字符判断;
步骤4.3.4B:判断是否存在离子;若存在“[”字符,则继续寻找直到遇到“]”字符;则“[”与“]”之间组成的字符串即为终止原子,终止原子=“[”+ch1+ch2+……+chn+“]”。
作为优选,步骤5的具体实现包括以下子步骤:
步骤5.1:将两个待匹配的smiles表达式进行切片处理,待匹配的smiles表达式切片结果记为A,被匹配的smiles表达式结果切片结果记为B;
步骤5.2:判断,A环的个数是否大于B环的个数;
若是,则不具有子结构关系,本流程结束;
若否,则继续执行下述步骤5.3;
步骤5.3:判断,A的种类是否大于B的种类;
若是,则不具有子结构关系,本流程结束;
若否,则继续执行下述步骤5.4;
步骤5.4:判断,A每种种类的个数是否大于B对应种类的个数;
若是,则不具有子结构关系,本流程结束;
若否,则具有子结构关系,本流程结束。
使用本方法可用于判断两个化学结构式之间是否一个结构式是另一个结构式的部分结构,也可用于化学结构式检索;方法简单,执行效率高。
附图说明
图1为本发明实施例的切片整体流程图;
图2为本发明实施例的获取起始原子流程图;
图3为本发明实施例的获取终止原子流程图;
图4为本发明实施例的匹配流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供的一种确定smiles表达式之间是否具有子结构关系的方法,包括以下步骤:
1.确定常见原子,化学键,支链关系。常见的原子(Atom):H,C,N,O,S,F,Cl,Br,[N+],[N-],[O+],[O-]。常见的化学键(Bond):单键,双键,三键,楔型向上键,楔形向下键,离域键,顺反不确定键,空心键,不确定键。
2.分析smiles表达式包含的信息。smiles存储的信息主要包含,原子种类,化学键,支链关系。
3.定义切片最小粒度:相邻原子与之间的化学键关系与主支链关系作为最小粒度单位。决定化学式分子式结构的主要因素有,原子的种类个数,原子之间的化学键,支链。
4.定义起始原子和终止原子,其中起始原子为所述最小粒度为应的第一个原子;终止原子为所述最小粒度对应的第二个原子。
5.将匹配的smiles表达式与待匹配的smiles通过切片算法处理,将smiles表达式切割成一个个原子对。统计原子对的种类,个数,并存储到哈希表中。
6.对化学式切片结果通过匹配算法判断是否具有部分结构关系。
接下来详细讲解切片算法与匹配算法。
本算法会设置常用五个变量,起始原子,终止原子,化学键值,起始原子位置,终止原子位置。附图上分别以startAtom,stopAtom,bond,start,stop命名。
一、切片流程图参照附图1,切片算法描述如下:
Step1:预处理。此次匹配流程是不考虑异构smiles情况,所以首先会对那些存储异构smiles的字符串剔除异构字符。如“/”,“\”。
Step2:统计环的个数与环边拆分位置的原子对。
其详细过程如下:
(1)遍历smiles表达式每一个字符,观察是否有数字字符;
(2)若包含数字,记住该数字的位置,从该位置后继续遍历直到找到包含同样数字字符。环的个数加1。存储环边拆分位置的原子对。过滤掉这两个位置的数字,组成新的字符串;
(3)对新组成的字符串进行遍历,寻找新的数字字符;
(4)当新组成的字符串无数字符,存储环的个数。则环的个数统计结束;
Step3:对经过预处理与去环结构后的smiles字符串进行循环遍历,判断ch[stop]的值情况。
Step4:若为“=”,则化学键=“=”。起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子。
Step5:若为“#”,则化学键=“#”。起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子。
Step6:若为“(”,该位置前的第一个原子也就是起始原子与左括号内的内容,组成新的字符串,设置为str1;起始原子与对应右括号后的内容,组成str2;将str1,str2作为新的smiles表达式进行切片流程处理。此方式运用的迭代算法。
Step7:若为“)”,位置指针向左寻找,找到与该括号匹配的左括号位置,并将左括号左边的第一个原子作为起始原子,位置为起始位置。
Step8:若为其他字符,则化学键=“”。起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子。
Step9:根据原子对=起始原子+化学键+终止原子。得到原子对,并存储到哈希表map中。
Step10:此次切片结果存储到哈希表map中,key值为片段名,value存储为该片段的个数。切片结果展示的是smiles结构式切成片段的种类与个数。
二、其中起始原子的getStartAtom()方法为获取起始原子,获取流程图参照附图2,获取起始原子流程说明如下:
Step1:从起始位置对应的字符进行判断,会将常用的双原子列表存入配置文件中;
Step2:判断是否为双原子。列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则起始原子=ch1+ch2+“”。若第二个原子不是,则起始原子=ch1+“”;
Step3:判断是否为括号。若为括号,起始位置加1,继续对新的字符判断;
Step4:判断是否存在离子。若存在“[”字符,则继续寻找直到遇到“]”字符。则“[”与“]”之间组成的字符串即为起始原子,起始原子=“[”+ch1+ch2+……+chn+”]”;
三、获取getStopAtom()终止原子的流程图参照附图3,获取终止原子流程说明如下:
Step1:从终止位置对应的字符进行判断,会将常用的双原子列表存入配置文件中;
Step2:判断是否为双原子。列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则终止原子=ch1+ch2+“”。若第二个原子不是,则终止原子=ch1+“”;
Step3:判断是否为括号。若为括号,起始位置加1,继续对新的字符判断;
Step4:判断是否存在离子。若存在“[”字符,则继续寻找直到遇到“]”字符。则“[”与“]”之间组成的字符串即为终止原子,终止原子=“[”+ch1+ch2+……+chn+“]”;
四、以上为切片算法描述。获取切片结果集后,需要根据切片结果集进行,匹配检测。匹配流程图参照附图4。匹配算法描述如下:
将两个待匹配的smiles表达式进行切片处理,待匹配的smiles表达式切片结果记为A,被匹配的smiles表达式结果记为B。对A跟B的结果进行比较:
Step1:若A的环的个数大于B的环的个数,则匹配不成功,不具有子结构关系
Step2:若A的种类大于B的种类,则匹配不成功,不具有子结构关系;
Step3:若A每种种类的个数大于B对应种类的个数,则匹配不成功,不具有子结构关系;
Step4:在不满足上述三个条件时,匹配成功,具有子结构关系。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (6)

1.一种确定smiles表达式之间是否具有子结构关系的方法,其特征在于,包括以下步骤:
步骤1:定义并存储常见原子、常见化学键和常见支链关系;
步骤2:定义切片最小粒度;相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;
步骤3:定义起始原子和终止原子;其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;
步骤4:基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;其中所述原子对根据相邻原子与之间的化学键关系与主支链关系确定;
所述将smiles表达式切割成一个个原子对,具体实现包括以下子步骤:
步骤4.1、首先对那些存储异构smiles的字符串剔除异构字符;
步骤4.2、统计环的个数与环边拆分位置的原子对;
步骤4.3、对经过预处理与去环结构后的smiles字符串进行循环遍历,判断ch[stop]的值情况,其中ch[stop]代表遍历字符串时,下标所处位置对应的字符值;
若为“=”,则化学键=“=”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
若为“#”,则化学键=“#”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
若为“(”,该位置前的第一个原子也就是起始原子与左括号内的内容,组成新的字符串,设置为str1;起始原子与对应右括号后的内容,组成新的字符串,设置为str2;将str1,str2作为新的smiles表达式进行切片流程处理;
若为“)”, 位置指针向左寻找,找到与该括号匹配的左括号位置,并将左括号左边的第一个原子作为起始原子,位置为起始位置;
若为其他字符,则化学键=“”;起始原子为紧靠该位置前的第一个原子,终止原子为该位置后的第一个原子;
步骤4.4、根据公式:原子对=起始原子+化学键+终止原子;得到原子对,并存储到哈希表map中;
步骤4.5、将此次切片结果存储到哈希表map中,key值为片段名,value存储为该片段的个数;切片结果展示的是smiles结构式切成片段的种类与个数;
步骤5:对化学式切片结果,根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系;
具体实现包括以下子步骤:
步骤5.1:将两个待匹配的smiles表达式进行切片处理,待匹配的smiles表达式切片结果记为A,被匹配的smiles表达式结果切片结果记为B;
步骤5.2:判断,A环的个数是否大于B环的个数;
若是,则不具有子结构关系,本流程结束;
若否,则继续执行下述步骤5.3;
步骤5.3:判断,A的种类是否大于B的种类;
若是,则不具有子结构关系,本流程结束;
若否,则继续执行下述步骤5.4;
步骤5.4:判断,A每种种类的个数是否大于B对应种类的个数;
若是,则不具有子结构关系,本流程结束;
若否,则具有子结构关系,本流程结束。
2.根据权利要求1所述的确定smiles表达式之间是否具有子结构关系的方法,其特征在于:步骤1中所述常见原子包括:H、C、N、O、S、F、Cl、Br、[N+]、[N-]、[O+]、[O-];所述常见化学键包括:单键、双键、三键、楔型向上键、楔形向下键、离域键、顺反不确定键、空心键、不确定键;所述常见支链包括:一个原子上包含一个支链、一个原子上包含二个支链。
3.根据权利要求1所述的确定smiles表达式之间是否具有子结构关系的方法,其特征在于,步骤4.2中所述统计环的个数,其具体实现包括以下子步骤:
步骤4.2.1A:遍历smiles表达式每一个字符,观察是否有数字字符;
步骤4.2.2A:若包含数字,记住该数字的位置,从该位置后继续遍历直到找到包含同样数字字符,环的个数加1;过滤掉这两个位置的数字,组成新的字符串;
步骤4.2.3A:对新组成的字符串进行遍历,寻找新的数字字符;
步骤4.2.4A:当新组成的字符串无数字符,存储环的个数,则环的个数统计结束。
4.根据权利要求1所述的确定smiles表达式之间是否具有子结构关系的方法,其特征在于:步骤4.2中所述统计环边拆分位置的原子对,其具体实现包括以下子步骤:
步骤4.2.1B:遍历smiles表达式,统计环边拆分位置的原子对及对应原子对种类数量加1;
步骤4.2.2B:对剔除数字后的smiles表达式遍历,统计表达式存在原子对与对应原子对数量。
5.根据权利要求1所述的确定smiles表达式之间是否具有子结构关系的方法,其特征在于,步骤4.3中获取起始原子的具体实现包括以下子步骤:
步骤4.3.1A:定义常见的双原子列表,将该列表存入配置文件中;所述双原子包括Br,Cl原子;
步骤4.3.2A:判断是否为双原子;列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则起始原子= ch1+ch2+“”;若第二个原子不是,则起始原子= ch1+“”;
步骤4.3.3A:判断是否为括号;若为括号,起始位置加1,继续对新的字符判断;
步骤4.3.4A:判断是否存在离子;若存在“[”字符,则继续寻找直到遇到“]”字符;则“[”与“]”之间组成的字符串即为起始原子,起始原子=“[”+ch1+ch2+……+chn+”]”。
6.根据权利要求1所述的确定smiles表达式之间是否具有子结构关系的方法,其特征在于,步骤4.3中获取终止原子的具体实现包括以下子步骤:
步骤4.3.1B:定义常见的双原子列表,将该列表存入配置文件中;所述双原子包括Br,Cl原子;
步骤4.3.2B:判断是否为双原子;列表中存在的第一个字符,设置为ch1,若是的话,继续判断第二个字符ch2,若第二个原子也是,则终止原子= ch1+ch2+“”;若第二个原子不是,则终止原子= ch1+“”;
步骤4.3.3B:判断是否为括号;若为括号,起始位置加1,继续对新的字符判断;
步骤4.3.4B:判断是否存在离子;若存在“[”字符,则继续寻找直到遇到“]”字符;则“[”与“]”之间组成的字符串即为终止原子,终止原子=“[”+ch1+ch2+……+chn+“]”。
CN201610330605.6A 2016-05-18 2016-05-18 一种确定smiles表达式之间是否具有子结构关系的方法 Active CN106021474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610330605.6A CN106021474B (zh) 2016-05-18 2016-05-18 一种确定smiles表达式之间是否具有子结构关系的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610330605.6A CN106021474B (zh) 2016-05-18 2016-05-18 一种确定smiles表达式之间是否具有子结构关系的方法

Publications (2)

Publication Number Publication Date
CN106021474A CN106021474A (zh) 2016-10-12
CN106021474B true CN106021474B (zh) 2019-06-25

Family

ID=57098539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610330605.6A Active CN106021474B (zh) 2016-05-18 2016-05-18 一种确定smiles表达式之间是否具有子结构关系的方法

Country Status (1)

Country Link
CN (1) CN106021474B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830030B (zh) * 2018-05-04 2021-08-06 深圳晶泰科技有限公司 原子类型定义系统及其原子类型匹配方法
CN109255010A (zh) * 2018-09-05 2019-01-22 明涛(保定)信息技术服务有限公司 一种区块链专利整理流程
CN111613277A (zh) * 2020-05-22 2020-09-01 重庆大学 一种危险化学品领域的知识表示方法
CN113903410B (zh) * 2021-12-08 2022-03-11 成都健数科技有限公司 一种化合物检索方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101503827A (zh) * 2009-03-19 2009-08-12 西安近代化学研究所 基于smile化学表达式生成含能化合物分子组合库的方法
CN103700084A (zh) * 2012-09-28 2014-04-02 淮海工学院 基于区域尺寸和弯曲度的化学分子结构图分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101503827A (zh) * 2009-03-19 2009-08-12 西安近代化学研究所 基于smile化学表达式生成含能化合物分子组合库的方法
CN103700084A (zh) * 2012-09-28 2014-04-02 淮海工学院 基于区域尺寸和弯曲度的化学分子结构图分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ChemDataBase数据库中化学分子子结构检索方法的设计与实现;潘凯;《中国优秀硕士学位论文全文数据库》;20100115;全文
Comparison of SMILES and molecular graphs as the representation of the molecular;A.A. Toropov等;《Chemometrics and Intelligent Laboratory Systems》;20111115;全文
mol2chemfig, a tool for rendering chemical structures from molfile or SMILES format to LATE X code;Eric K 等;《Cheminformatics》;20121002;全文
VF算法在化学结构检索中的应用;李琰等;《计算机与应用化学》;20020928;全文

Also Published As

Publication number Publication date
CN106021474A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106021474B (zh) 一种确定smiles表达式之间是否具有子结构关系的方法
US11372851B2 (en) Systems and methods for rapid data analysis
WO2021135105A1 (zh) 基于大数据的对象识别方法、装置、设备及存储介质
EP3133511A1 (en) Systems and methods for automatic clustering and canonical designation of related data in various data structures
CN106649831B (zh) 一种数据过滤方法及装置
CN110473594A (zh) 病原微生物基因组数据库及其建立方法
EP2963575B1 (en) Data analysis device and method therefor
CN103810200B (zh) 开放式蛋白质鉴定的数据库搜索方法及其系统
CN102801709A (zh) 一种钓鱼网站识别系统及方法
CN109842588B (zh) 网络数据检测方法及相关设备
CN107145779B (zh) 一种离线恶意软件日志的识别方法和装置
US20170154056A1 (en) Matching image searching method, image searching method and devices
CN109684374B (zh) 一种时间序列数据的键值对的提取方法及装置
CN109598334B (zh) 一种样本生成方法及装置
CN105917221A (zh) 串联质谱分析数据处理装置
CN104392171B (zh) 一种基于数据关联的自动内存证据分析方法
JP2010231560A (ja) 地図データ誤り修正装置
WO2010056131A1 (en) A method and system for analysing data sequences
CN106940711B (zh) 一种url检测方法及检测装置
CN106033501B (zh) 一种交联二肽快速鉴定方法
CN103324888A (zh) 基于家族样本的病毒特征自动提取方法及系统
CN113098989B (zh) 字典生成方法、域名检测方法、装置、设备及介质
US11386340B2 (en) Method and apparatus for performing block retrieval on block to be processed of urine sediment image
CN115438340A (zh) 一种基于词素特征的挖矿行为识别方法及系统
CN104602206A (zh) 一种垃圾短信识别方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20161012

Assignee: Wuhan Bilin Software Co.,Ltd.

Assignor: WUHAN University OF SCIENCE AND TECHNOLOGY

Contract record no.: X2022420000026

Denomination of invention: A method to determine whether there is a substructure relationship between smiles expressions

Granted publication date: 20190625

License type: Common License

Record date: 20220330

Application publication date: 20161012

Assignee: Wuhan Chutianyun Technology Co.,Ltd.

Assignor: WUHAN University OF SCIENCE AND TECHNOLOGY

Contract record no.: X2022420000027

Denomination of invention: A method to determine whether there is a substructure relationship between smiles expressions

Granted publication date: 20190625

License type: Common License

Record date: 20220330

EE01 Entry into force of recordation of patent licensing contract