CN102663136A - 一种用于天然产物化合物波谱数据解析的方法 - Google Patents

一种用于天然产物化合物波谱数据解析的方法 Download PDF

Info

Publication number
CN102663136A
CN102663136A CN2012101352475A CN201210135247A CN102663136A CN 102663136 A CN102663136 A CN 102663136A CN 2012101352475 A CN2012101352475 A CN 2012101352475A CN 201210135247 A CN201210135247 A CN 201210135247A CN 102663136 A CN102663136 A CN 102663136A
Authority
CN
China
Prior art keywords
retrieval
subsystem
data
compound
typing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101352475A
Other languages
English (en)
Inventor
阿吉艾克拜尔·艾萨
林健博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjiang Technical Institute of Physics and Chemistry of CAS
Original Assignee
Xinjiang Technical Institute of Physics and Chemistry of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjiang Technical Institute of Physics and Chemistry of CAS filed Critical Xinjiang Technical Institute of Physics and Chemistry of CAS
Priority to CN2012101352475A priority Critical patent/CN102663136A/zh
Publication of CN102663136A publication Critical patent/CN102663136A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于天然产物化合物波谱数据解析的方法,该方法用于未知天然产物化合物核磁共振、质谱、红外和理化数据分析处理的方法。该方法涉及化合物波谱解析的计算机系统,是由录入子系统,储存子系统和检索子系统组成,将未知化合物的波谱数据与数据库中的已有数据进行比对得出未知化合物的分子结构,生成未知化合物结构波谱数据分析报告,辅助用户对未知化合物进行结构解析。

Description

一种用于天然产物化合物波谱数据解析的方法
技术领域
本发明涉及一种用于天然产物化合物波谱数据解析的方法,该方法采用计算机系统对化合物结构式和波谱数据录入,存储,检索并生成检索报告的系统。
技术背景
对于天然产物化学研究领域,分离得到的未知化合物的结构解析,一直以来都是依靠个人经验进行多种谱图的综合解析。由于个人经验的培养,需要长时间的训练才可以完成,且有一定的主观性和局限性。另外,天然产物化合物种类繁多,结构复杂,在一些情况下,即使对于解谱经验丰富的专家,解析已知化合物的难度,也不亚于解析新化合物。
本发明提供一种用于天然产物化合物波谱数据解析的方法,该方法采用了计算机系统很好的解决了这个问题,通过检索结果和系统生成的检索报告,为天然产物化学的科研工作者解析未知化合物结构提供有价值的参考。
发明内容
本发明的目的在于提供一种用于天然产物化合物波谱数据解析的方法,该方法涉及化合物波谱解析的计算机系统,是由录入子系统,储存子系统和检索子系统组成,将未知化合物的波谱数据与数据库中的已有数据进行比对得出未知化合物的分子结构,生成未知化合物结构波谱数据分析报告,辅助用户对未知化合物进行结构解析。
本发明所述的一种用于天然产物化合物波谱数据解析的方法,该方法涉及化合物波谱解析的计算机系统,是由录入子系统,储存子系统和检索子系统组成,具体操作按下列步骤进行:
a、在检索子系统的图形界面,用户分别将化合物的波谱数据、CAS编号、分子量、植物来源或熔点,通过检索子系统的图形界面录入检索子系统中,再由检索子系统根据内置的参数进行修正处理;
b、检索子系统将数据进行处理后,检索子系统再调用存储子系统中存储的化合物数据与处理过的数据进行比对分析,得出检索结果,将检索结果通过检索子系统的图形界面显示给用户,如果是多个化合物,将按与用户录入数据的相似度由高到低进行排序,同时给出碳谱和氢谱数据与各原子的归属关系;
c、再由检索子系统将所有分析结果导入检索子系统的分析报告,再用pdf或txt格式的文件导出,用户即可根据报告解析未知化合物结构。
步骤a中所述的波谱数据为碳谱数据、氢谱数据、质谱数据、红外谱数据或紫外谱数据。
步骤b中的检索结果为符合条件的化合物名称、结构式、波谱数据、理化性质、植物来源、模拟碳谱和氢谱信息,并提供化合物名称和结构式列表。
所述方法中涉及化合物波谱解析的计算机系统中的检索子系统是由数据处理模块和数据比对模块组成,录入子系统是由分子结构绘制模块和文本数据录入模块组成,录入子系统为后台维护系统,将实验得到的化合物波谱数据、结构式、理化性质,以及这些数据之间的对应关系,通过分子结构绘制模块和文本数据录入模块录入到录入子系统中,录入子系统将这些数据编码后,存储进入存储子系统中。
所述方法中涉及化合物波谱解析的计算机系统中的存储子系统中的数据库的数据集是建立数据库的基本单元。
所述方法中涉及化合物波谱解析的计算机系统中的检索子系统,是将未知化合物的波谱数据或理化性质录入检索子系统的图形界面,检索子系统根据用户选择的检索方式和检索子系统内置的修正参数进行数据处理,将数据处理所得数据与存储子系统内的数据库进行比对,再将比对结果通过检索子系统的用户图形界面显示,用户通过检索子系统将分析报告下载到本地计算机硬盘即可。
所述方法中涉及化合物波谱解析的计算机系统中的检索子系统的检索方式为智能检索,模糊检索,精确检索,分子量检索,分子式检索,CAS号检索。
本发明所述的一种用于天然产物化合物波谱数据解析的方法,该方法中涉及的计算机系统面向两类使用者,一类是系统维护者,主要通过录入子系统对存放在存储子系统中的数据库进行升级和更新,并且录入子系统只对系统维护者开放,系统维护者将实验得到的化合物波谱数据、结构式、理化性质,以及这些数据之间的对应关系,通过分子结构绘制模块和文本数据录入模块录入录入子系统,录入子系统将这些数据编码后,存储进存储子系统,存储子系统中的数据集是建立数据库的基本单元,数据库存在于存储子系统中。系统维护者通过录入子系统系,为系统录入大量化合物的数据,化合物数据内容包括化合物的结构式,熔点、颜色、晶型等理化性质,核磁共振碳谱和氢谱,质谱,红外谱,紫外谱等各种数据,以及化合物中各原子与对应核磁共振碳谱和氢谱数据的关联数据,每个化合物要单独录入,完成后,再录入下一个化合物,如此循环直至结束。另外,数据可以由多个维护者分别通过录入子系统录入,再通过录入子系统将各部分汇总并导入存储子系统。
存储子系统负责存储从录入子系统录入的数据,并建立这些数据的索引为检索子系统进行检索提供基础分析数据。
另一类是用户,检索子系统是面向大量外部用户的子系统,每个用户都可以通过检索子系统的独立图形界面,将未知化合物的波谱数据和理化性质中的一项或多项提交给检索子系统。检索子系统可以为用户提供多种检索方式,包括智能检索,模糊检索,精确检索,分子量检索,分子式检索,CAS号检索等方式,检索系统子根据用户提交的数据,按用户选择检索模式不同采用不同参数进行处理后,检索子系统将计算所得数据与存储子系统内的数据库进行比对,再将比对结果在检索子系统的用户图形界面显示,比对结果经检索子系统进行文本输出即为分析报告,用户可以通过检索子系统将此分析报告下载到本地计算机硬盘。简言之,用户将未知化合物的波谱数据输入系统,进行检索,进而获得化合物的可能结构。
所述方法中涉及的碳谱数据与各原子的归属关系,是指化合物碳谱数据与化合物结构式中各原子的一一对映关系,这种归属关系通过检索子系统的图形化界面显示,当鼠标指针停留在化合物结构式的不同原子上时,这些原子在模拟碳谱(氢谱)图中对应的峰会突出显示,反之,如果鼠标指针停留在模拟碳谱(氢谱)某个峰上时与之对应的结构式上的原子也会突出显示。
所述方法中涉及的模拟碳谱和氢谱,该模拟碳谱是检索子系统根据存储子系统中数据库中化合物的碳谱数据自动生成,并与化合物结构式上的原子建立映射关系,氢谱同理。
附图说明
图1为本发明化合物波谱数据智能解析系统图
具体实施方式
以下,将就本发明的几种具体实现方式进行描述,但本发明可有多种方法实现,比如检索方式可以有不同的组合,分析报告也可以是pdf、txt等多种文本形式。
本发明所述方法中涉及化合物波谱解析的计算机系统中的检索子系统是由数据处理模块和数据比对模块组成,录入子系统是由分子结构绘制模块和文本数据录入模块组成,录入子系统为后台维护系统,将实验得到的化合物波谱数据、结构式、理化性质,以及这些数据之间的对应关系,通过分子结构绘制模块和文本数据录入模块录入到录入子系统中,录入子系统将这些数据编码后,存储进入存储子系统中;存储子系统中的数据库的数据集是建立数据库的基本单元;检索子系统,是将未知化合物的波谱数据或理化性质录入检索子系统的图形界面,检索子系统根据用户选择的检索方式和检索子系统内置的修正参数进行数据处理,将数据处理所得数据与存储子系统内的数据库进行比对,再将比对结果通过检索子系统的用户图形界面显示,用户通过检索子系统将分析报告下载到本地计算机硬盘即可。检索子系统的检索方式为智能检索,模糊检索,精确检索,分子量检索,分子式检索,CAS号检索。
实施例1(同时使用碳谱数据和质谱数据检索)
在检索子系统的图形界面,用户使用智能检索模式将一化合物的碳谱数据:56、34、33、79,质谱数据57、114,通过检索子系统的图形界面录入检索子系统中,再由检索子系统根据系统内置的智能检索模式的碳谱和质谱修正参数对数据进行处理;
检索子系统将处理后的数据与化合物库中化合物的碳谱和质谱数据进行比对,所有符合条件的化合物依据化合物名称和结构式列表,并按相似度由高到低排序,同时给出列表中每种化合物所对应的结构式和波谱数据及碳谱和氢谱数据与各原子的归属关系;
再由检索子系统将所有分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。
实施例2(仅使用质谱数据)
在检索子系统的图形界面,用户使用质谱检索模式将一化合物的质谱数据57、114,通过检索子系统的图形界面导入检索子系统中;
检索子系统根据内置的质谱检索模式的修正参数对数据进行处理,并与存储子系统中化合物库中数据进行比对,所有符合条件的化合物依据化合物名称和结构式列表,并按相似度由高到低排序,在检索子系统的图形界面同时显示每种化合物所对应的结构式,波谱数据,碳谱和氢谱数据与各原子的归属关系;
再由检索子系统将所有分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。
实施例3(CAS编号)
在检索子系统的图形界面,用户使用CAS检索模式将一化合物的CAS编号109431-87-0,通过检索子系统的图形界面录入检索子系统中;
检索子系统将此编号与存储子系统化合物库中化合物的CAS号进行比对,直接找出此CAS编号对映化合物的所有数据信息,包括结构式、波谱数据和理化性质;
再由检索子系统将分析结果导入分析报告,再用pdf格式的文件导出,用户即可了解该化合物的详细信息。
实施例4(分子量)
在检索子系统的图形界面,用户按分子量检索方式提交:290-300,通过检索子系统的图形界面录入检索子系统中;
检索子系统将直接根据此数据范围,检索存储子系统化合物库中所有分子量符合此要求的化合物,所有符合条件的化合物依据化合物名称和结构式列表,并按分子量由低到高排序,在检索子系统的图形界面同时显示每种化合物所对应的结构式,波谱数据,碳谱和氢谱数据与各原子的归属关系;如果检索结果大于100个,则只显示前100个。
再由检索子系统将分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。
实施例5(植物来源)
在检索子系统的图形界面,用户按植物来源检索方式提交:Euphorbia,通过检索子系统的图形界面录入检索子系统中;
检索子系统将直接根据此单词,检索存储子系统化合物库中所有植物来源名称中包含此单词的化合物,所有符合条件的化合物依据化合物名称和结构式列表,并按化合物编号排序,在检索子系统的图形界面同时显示每种化合物所对应的结构式,波谱数据,碳谱和氢谱数据与各原子的归属关系。
再由检索子系统将所有分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。
实施例6(熔点)
在检索子系统的图形界面,用户按熔点检索方式提交:200-210,通过检索子系统的图形界面录入检索子系统中;
检索子系统将直接根据此数据范围,检索存储子系统化合物库中所有熔点符合此要求的化合物,所有符合条件的化合物依据化合物名称和结构式列表,并按熔点由低到高排序,在检索子系统的图形界面同时显示每种化合物所对应的结构式,波谱数据,碳谱和氢谱数据与各原子的归属关系;如果检索结果大于100个,则只显示前100个。
再由检索子系统将分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。
实施例7(熔点)
在检索子系统的图形界面,用户按熔点检索方式提交:205,通过检索子系统的图形界面录入检索子系统中;
检索子系统根据内置的熔点检索模式的修正参数对数据进行处理,并与存储子系统中化合物库中数据进行比对,所有符合条件的化合物依据化合物名称和结构式列表,并按相似度由高到低排序,在检索子系统的图形界面同时显示每种化合物所对应的结构式,波谱数据,碳谱和氢谱数据与各原子的归属关系;
再由检索子系统将所有分析结果导入分析报告,再用pdf格式的文件导出,用户即可解析未知化合物结构。

Claims (7)

1.一种用于天然产物化合物波谱数据解析的方法,其特征在于该方法涉及化合物波谱解析的计算机系统,是由录入子系统,储存子系统和检索子系统组成,具体操作按下列步骤进行:
a、在检索子系统的图形界面,用户分别将化合物的波谱数据、CAS编号、分子量、植物来源或熔点,通过检索子系统的图形界面录入检索子系统中,再由检索子系统根据内置的参数进行修正处理;
b、检索子系统将数据进行处理后,检索子系统再调用存储子系统中存储的化合物数据与处理过的数据进行比对分析,得出检索结果,将检索结果通过检索子系统的图形界面显示给用户,如果是多个化合物,将按与用户录入数据的相似度由高到低进行排序,同时给出碳谱和氢谱数据与各原子的归属关系;
c、再由检索子系统将所有分析结果导入检索子系统的分析报告,再用pdf或txt格式的文件导出,用户即可根据报告解析未知化合物结构。
2.根据权利要求1所述的方法,其特征在于步骤a中所述的波谱数据为碳谱数据、氢谱数据、质谱数据、红外谱数据或紫外谱数据。
3.根据权利要求1所述的方法,其特征在于步骤b中的检索结果为符合条件的化合物名称、结构式、波谱数据、理化性质、植物来源、模拟碳谱和氢谱信息,并提供化合物名称和结构式列表。
4.根据权利要求1所述的方法,其特征在于该方法涉及化合物波谱解析的计算机系统中的检索子系统是由数据处理模块和数据比对模块组成,录入子系统是由分子结构绘制模块和文本数据录入模块组成,录入子系统为后台维护系统,将实验得到的化合物波谱数据、结构式、理化性质,以及这些数据之间的对应关系,通过分子结构绘制模块和文本数据录入模块录入到录入子系统中,录入子系统将这些数据编码后,存储进入存储子系统中。
5.根据权利要求1所述的方法,其特征在于该方法涉及化合物波谱解析的计算机系统中的存储子系统中的数据库的数据集是建立数据库的基本单元。
6.根据权利要求1所述的方法,其特征在于该方法涉及化合物波谱解析的计算机系统中的检索子系统,是将未知化合物的波谱数据或理化性质录入检索子系统的图形界面,检索子系统根据用户选择的检索方式和检索子系统内置的修正参数进行数据处理,将数据处理所得数据与存储子系统内的数据库进行比对,再将比对结果通过检索子系统的用户图形界面显示,用户通过检索子系统将分析报告下载到本地计算机硬盘即可。
7.根据权利要求6所述的方法,其特征在于该方法涉及化合物波谱解析的计算机系统中的检索子系统的检索方式为智能检索,模糊检索,精确检索,分子量检索,分子式检索,CAS号检索。
CN2012101352475A 2012-05-04 2012-05-04 一种用于天然产物化合物波谱数据解析的方法 Pending CN102663136A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101352475A CN102663136A (zh) 2012-05-04 2012-05-04 一种用于天然产物化合物波谱数据解析的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101352475A CN102663136A (zh) 2012-05-04 2012-05-04 一种用于天然产物化合物波谱数据解析的方法

Publications (1)

Publication Number Publication Date
CN102663136A true CN102663136A (zh) 2012-09-12

Family

ID=46772627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101352475A Pending CN102663136A (zh) 2012-05-04 2012-05-04 一种用于天然产物化合物波谱数据解析的方法

Country Status (1)

Country Link
CN (1) CN102663136A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678947A (zh) * 2014-01-06 2014-03-26 上海微谱信息技术有限公司 利用碳谱数据确定长链有机化合物结构的方法及系统
CN103728330A (zh) * 2014-01-09 2014-04-16 上海微谱信息技术有限公司 利用核磁共振碳谱数据确定有机化合物结构的方法及系统
CN108009740A (zh) * 2017-12-14 2018-05-08 四川大学 一种烟用香精香料智能化精细识别系统及方法
CN110415771A (zh) * 2019-07-16 2019-11-05 江苏省食品药品监督检验研究院 一种基于r语言的化合物质谱信息批量检索方法
CN117219193A (zh) * 2023-09-22 2023-12-12 宁波甬恒瑶瑶智能科技有限公司 一种超分子数据库检索方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277198A1 (en) * 2005-06-03 2006-12-07 Error Brett M One-click segmentation definition
CN101499162A (zh) * 2009-03-05 2009-08-05 唐文超 医学科研数据管理系统及其方法
CN101971019A (zh) * 2008-01-16 2011-02-09 梅塔博隆有限公司 用于确定复杂混合物中的化学成分的组成的系统、方法和计算机可读介质
CN102043864A (zh) * 2010-12-30 2011-05-04 中山大学 中药心血管毒性分析的计算机操作方法及其系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060277198A1 (en) * 2005-06-03 2006-12-07 Error Brett M One-click segmentation definition
CN101971019A (zh) * 2008-01-16 2011-02-09 梅塔博隆有限公司 用于确定复杂混合物中的化学成分的组成的系统、方法和计算机可读介质
CN101499162A (zh) * 2009-03-05 2009-08-05 唐文超 医学科研数据管理系统及其方法
CN102043864A (zh) * 2010-12-30 2011-05-04 中山大学 中药心血管毒性分析的计算机操作方法及其系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678947A (zh) * 2014-01-06 2014-03-26 上海微谱信息技术有限公司 利用碳谱数据确定长链有机化合物结构的方法及系统
CN103678947B (zh) * 2014-01-06 2017-02-22 上海微谱信息技术有限公司 利用碳谱数据确定长链有机化合物结构的方法及系统
CN103728330A (zh) * 2014-01-09 2014-04-16 上海微谱信息技术有限公司 利用核磁共振碳谱数据确定有机化合物结构的方法及系统
CN108009740A (zh) * 2017-12-14 2018-05-08 四川大学 一种烟用香精香料智能化精细识别系统及方法
CN108009740B (zh) * 2017-12-14 2020-03-24 四川大学 一种烟用香精香料智能化精细识别系统及方法
CN110415771A (zh) * 2019-07-16 2019-11-05 江苏省食品药品监督检验研究院 一种基于r语言的化合物质谱信息批量检索方法
CN110415771B (zh) * 2019-07-16 2022-11-29 江苏省食品药品监督检验研究院 一种基于r语言的化合物质谱信息批量检索方法
CN117219193A (zh) * 2023-09-22 2023-12-12 宁波甬恒瑶瑶智能科技有限公司 一种超分子数据库检索方法及系统
CN117219193B (zh) * 2023-09-22 2024-07-16 宁波甬恒瑶瑶智能科技有限公司 一种超分子数据库检索方法及系统

Similar Documents

Publication Publication Date Title
US11995073B2 (en) One-shot learning for text-to-SQL
US10095735B2 (en) System for exploring data in a database
US20240012810A1 (en) Clause-wise text-to-sql generation
CN112035653A (zh) 一种政策关键信息提取方法和装置、存储介质、电子设备
US20150026556A1 (en) Systems and Methods for Extracting Table Information from Documents
CN100447779C (zh) 文档信息处理设备及文档信息处理方法
CN112579155B (zh) 代码相似性检测方法、装置以及存储介质
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN109902302B (zh) 一种适用于文本分析或数据挖掘的主题图谱生成方法、装置、设备以及计算机存储介质
US20130006976A1 (en) Search tool that utilizes scientific metadata matched against user-entered parameters
CN102023989A (zh) 一种信息检索方法及其系统
CN105868177A (zh) 一种通用公式搜索方法
CN102663136A (zh) 一种用于天然产物化合物波谱数据解析的方法
KR102345410B1 (ko) 빅데이터 지능형 수집 방법 및 장치
CN106708929A (zh) 视频节目的搜索方法和装置
CN103869999A (zh) 对输入法所产生的候选项进行排序的方法及装置
Spasić et al. MeMo: a hybrid SQL/XML approach to metabolomic data management for functional genomics
CN112328738A (zh) 语音检索方法、终端设备及可读存储介质
CN110275938B (zh) 基于非结构化文档的知识提取方法及系统
CN112181490A (zh) 功能点评估法中功能类别的识别方法、装置、设备及介质
CN112687403B (zh) 药品词典的生成及药品搜索方法及装置
CN114207598A (zh) 电子表单表转换
CN111984673B (zh) 一种电网电能量计量系统树形结构模糊检索方法和装置
CN110874366A (zh) 数据处理、查询方法和装置
CN114385794A (zh) 企业知识图谱的生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20120912

RJ01 Rejection of invention patent application after publication