CN112037864A - 微生物菌株信息的标准化处理方法、装置及电子设备 - Google Patents
微生物菌株信息的标准化处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112037864A CN112037864A CN202010813030.XA CN202010813030A CN112037864A CN 112037864 A CN112037864 A CN 112037864A CN 202010813030 A CN202010813030 A CN 202010813030A CN 112037864 A CN112037864 A CN 112037864A
- Authority
- CN
- China
- Prior art keywords
- strain
- microbial
- name
- species
- standardized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000813 microbial effect Effects 0.000 title claims abstract description 305
- 238000000034 method Methods 0.000 title claims abstract description 61
- 244000005700 microbiome Species 0.000 claims abstract description 92
- 241000894007 species Species 0.000 claims description 196
- 230000004044 response Effects 0.000 claims description 31
- 108020004465 16S ribosomal RNA Proteins 0.000 claims description 24
- 238000004321 preservation Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 abstract description 4
- 230000001737 promoting effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 241000589220 Acetobacter Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000219173 Carica Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 241000377574 Paenibacillus quercus Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本公开提供了微生物菌株信息的标准化处理方法、装置及电子设备。该方法的一具体实施方式包括:获取微生物菌株的原始信息;对微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号;对微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称;用标准化菌株编号和标准化菌种名称生成微生物菌株的标准化信息。该实施方式实现了微生物菌株信息的标准化,保证了微生物菌株信息的统一,能够对微生物的研究分析工作起到推动作用。
Description
技术领域
本公开涉及微生物技术领域,具体涉及微生物菌株信息的标准化处理方法、装置、电子设备及存储介质。
背景技术
微生物菌株可以表示同种微生物不同来源的纯种培养,从自然界中分离得到的每一个微生物纯培养都可称一个菌株。
为了推动微生物的研究工作,通常由特定机构对微生物菌株的信息进行记录和公开。但是,由于保藏中心编号规则变化、保藏机构变迁、物种研究结果更新等多方面的原因,现有的微生物菌株信息出现了不统一的现象。例如,同一菌株编号会对应不同的菌种名称,或者,不同的菌株编号会对应同一名称。上述微生物菌株信息的不统一现象会对微生物的研究和分析工作带来不利影响。
因此,有必要提出一种新的对微生物菌株信息进行处理的技术方案。
发明内容
本公开提出了微生物菌株信息的标准化处理方法、装置、电子设备及存储介质。
第一方面,本公开提供了一种微生物菌株信息的标准化处理方法,包括:
获取微生物菌株的原始信息,上述微生物菌株的原始信息包括上述微生物菌株的菌株编号和上述微生物菌株的菌种名称;
对上述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,上述标准化菌株编号为上述微生物菌株在预设编号规则下的保藏中心编号或者上述微生物菌株的对应唯一菌种的非保藏中心编号;
对上述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,上述标准化菌种名称为上述微生物菌株的菌种名称对应的物种科学名称;
用上述标准化菌株编号和上述标准化菌种名称生成上述微生物菌株的标准化信息。
在一些可选的实施方式中,上述对上述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,包括:
确定上述微生物菌株的菌株编号是否为保藏中心编号;
响应于确定是,根据上述微生物菌株的菌株编号确定上述微生物菌株所属的保藏中心,以及按照上述微生物菌株所属保藏中心的最新编号规则对上述微生物菌株的菌株编号进行处理,得到上述微生物菌株的标准化菌株编号。
在一些可选的实施方式中,在上述确定上述微生物菌株的菌株编号是否为保藏中心编号后,上述方法还包括:
响应于确定否,获取上述微生物菌株的16s rRNA编号;
基于上述微生物菌株的16s rRNA编号,确定上述微生物菌株的菌株编号是否对应唯一菌种;
响应于确定上述微生物菌株的菌株编号对应唯一菌种,将上述微生物菌株的菌株编号确定为上述微生物菌株的标准化菌株编号。
在一些可选的实施方式中,上述对上述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,包括:
基于预设的微生物菌株原始信息数据库,确定上述微生物菌株的菌种名称是否为上述微生物菌株的菌株编号唯一对应的菌种名称;
响应于确定是,基于预设的物种分类数据库,确定上述微生物菌株的菌种名称对应的物种科学名称;
将上述微生物菌株的菌种名称对应的物种科学名称确定为上述微生物菌株对应的标准化菌种名称。
在一些可选的实施方式中,上述基于预设的物种分类数据库,确定上述微生物菌株的菌种名称对应的物种科学名称,包括:
在上述物种分类数据库中查询与上述微生物菌株的菌种名称匹配的物种科学名称;
响应于查询到,将所查询到的物种科学名称确定为上述微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,在上述物种分类数据库中查询与上述微生物菌株的菌种名称匹配的物种科学名称后,上述方法还包括:
响应于未查询到,基于预设的菌株保藏信息数据库,确定上述微生物菌株的其他菌种名称;
在上述物种分类数据库中查询与上述微生物菌株的其他菌种名称匹配的物种科学名称;
响应于查询到,将所查找到的物种科学名称确定为上述微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,上述基于预设的菌株保藏信息数据库,确定上述微生物菌株的其他菌种名称,包括:
在菌株保藏信息数据库中查询与上述微生物菌株的菌株编号一致的菌株对应的菌种名称;
确定所查询到的菌种名称与上述微生物菌株的菌种名称是否一致;
响应于确定不一致,将所查询到的菌种名称确定为上述微生物菌株的其他菌种名称。
在一些可选的实施方式中,上述方法还包括:获取所查询到的物种科学名称的物种分类号;以及
上述用上述标准化菌株编号和上述标准化菌种名称生成上述微生物菌株的标准化信息,包括:
用上述标准化菌株编号、上述标准化菌种名称和上述物种分类号生成上述微生物菌株的标准化信息。
第二方面,本公开提供了一种微生物菌株信息的标准化处理装置,包括:
获取模块,被配置为获取微生物菌株的原始信息,上述微生物菌株的原始信息包括上述微生物菌株的菌株编号和上述微生物菌株的菌种名称;
第一处理模块,被配置为对上述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,上述标准化菌株编号为上述微生物菌株在预设编号规则下的保藏中心编号或者上述微生物菌株的对应唯一菌种的非保藏中心编号;
第二处理模块,被配置为对上述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,上述标准化菌种名称为上述微生物菌株的菌种名称对应的物种科学名称;
生成模块,被配置为用上述标准化菌株编号和上述标准化菌种名称生成上述微生物菌株的标准化信息。
在一些可选的实施方式中,上述第一处理模块进一步包括第一确定单元和第一处理单元:
上述第一确定单元被配置为确定上述微生物菌株的菌株编号是否为保藏中心编号;
上述第一处理单元被配置为响应于确定是,根据上述微生物菌株的菌株编号确定上述微生物菌株所属的保藏中心,以及按照上述微生物菌株所属保藏中心的最新编号规则对上述微生物菌株的菌株编号进行处理,得到上述微生物菌株的标准化菌株编号。
在一些可选的实施方式中,上述第一处理单元进一步被配置为:
响应于确定否,获取上述微生物菌株的16s rRNA编号;
基于上述微生物菌株的16s rRNA编号,确定上述微生物菌株的菌株编号是否对应唯一菌种;
响应于确定上述微生物菌株的菌株编号对应唯一菌种,将上述微生物菌株的菌株编号确定为上述微生物菌株的标准化菌株编号。
在一些可选的实施方式中,上述第二处理模块进一步包括第二确定单元和第二处理单元:
上述第二确定单元被配置为基于预设的微生物菌株原始信息数据库,确定上述微生物菌株的菌种名称是否为上述微生物菌株的菌株编号唯一对应的菌种名称;
上述第二处理单元被配置为响应于确定是,基于预设的物种分类数据库,确定上述微生物菌株的菌种名称对应的物种科学名称,以及将上述微生物菌株的菌种名称对应的物种科学名称确定为上述微生物菌株对应的标准化菌种名称。
在一些可选的实施方式中,上述第二处理单元进一步被配置为:
在上述物种分类数据库中查询与上述微生物菌株的菌种名称匹配的物种科学名称;
响应于查询到,将所查询到的物种科学名称确定为上述微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,上述第二处理单元进一步被配置为:
响应于未查询到,基于预设的菌株保藏信息数据库,确定上述微生物菌株的其他菌种名称;
在上述物种分类数据库中查询与上述微生物菌株的其他菌种名称匹配的物种科学名称;
响应于查询到,将所查找到的物种科学名称确定为上述微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,上述第二处理单元进一步被配置为:
在菌株保藏信息数据库中查询与上述微生物菌株的菌株编号一致的菌株对应的菌种名称;
确定所查询到的菌种名称与上述微生物菌株的菌种名称是否一致;
响应于确定不一致,将所查询到的菌种名称确定为上述微生物菌株的其他菌种名称。
在一些可选的实施方式中,上述获取模块进一步被配置为:获取所查询到的物种科学名称的物种分类号;以及
上述生成模块进一步被配置为:用上述标准化菌株编号、上述标准化菌种名称和上述物种分类号生成上述微生物菌株的标准化信息。
第三方面,本公开提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开第一方面任一实施方式描述的方法。
第四方面,本公开提供了一种计算机可读介质,其上存储有计算机程序,其中,上述程序被处理器执行时实现如本公开第一方面任一实施方式描述的方法。
本实施例中的微生物菌株信息的标准化处理方法、装置、电子设备及计算机可读介质,通过对微生物菌株原始信息中的菌株编号和菌种名称分别进行标准化处理,将微生物菌株在预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号确定为微生物菌株的标准化菌株编号,将微生物菌株的菌种名称对应的物种科学名称确定为微生物菌株对应的标准化菌株名称,实现了微生物菌株信息的标准化,保证了微生物菌株信息的统一,能够对微生物的研究分析工作起到推动作用。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2A是根据本公开的微生物菌株信息的标准化处理方法的一个实施例的流程图;
图2B是根据本公开的步骤202的一个实施例的分解流程图;
图2C是根据本公开的步骤203的一个实施例的分解流程图;
图2D是根据本公开的步骤2032的一个实施例的分解流程图;
图3是根据本公开的微生物菌株信息的标准化处理装置的一个实施例的结构示意图;
图4是适于用来实现本公开的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的微生物菌株信息的标准化处理方法或微生物菌株信息的标准化处理装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、网络102和服务器103。网络102用以在终端设备101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101通过网络102与服务器103交互,以接收或发送消息等。终端设备101上可以安装有各种通讯客户端应用,例如微生物菌株信息记录类应用、微生物菌株信息标准化处理类应用、网页浏览器应用等。
终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是具有显示屏并且支持文本输入的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供微生物菌株信息的标准化处理服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器103可以是提供各种服务的服务器,例如对终端设备101发送的微生物菌株信息提供标准化处理服务的后台服务器。后台服务器可以对接收到的微生物菌株信息进行标准化处理等操作,并将操作结果(例如微生物菌株的标准化信息)反馈给终端设备。
在一些情况下,本公开所提供的微生物菌株信息的标准化处理方法可以由终端设备101和服务器103共同执行,例如,“获取微生物菌株的原始信息”的步骤可以由终端设备101执行,其余步骤可以由服务器103执行。本公开对此不做限定。相应地,微生物菌株信息的标准化处理装置也可以分别设置于终端设备101和服务器103中。
在一些情况下,本公开所提供的微生物菌株信息的标准化处理方法可以由服务器103执行,相应地,微生物菌株信息的标准化处理装置也可以设置于服务器103中,这时,系统架构100也可以不包括终端设备101。
在一些情况下,本公开所提供的微生物菌株信息的标准化处理方法可以由终端设备101执行,相应地,微生物菌株信息的标准化处理装置也可以设置于终端设备101中,这时,系统架构100也可以不包括服务器103。
需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供微生物菌株信息的标准化处理服务),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2A,其示出了根据本公开的微生物菌株信息的标准化处理方法的一个实施例的流程200。该微生物菌株信息的标准化处理方法,包括以下步骤:
步骤201,获取微生物菌株的原始信息。
在本实施例中,微生物菌株信息的标准化处理方法的执行主体(例如,图1所示的服务器103)可以从与上述执行主体网络连接的、预设的微生物菌株信息数据库获取微生物菌株的原始信息。例如,可以从LPSN(List of Prokaryotic names with Standing inNomenclature,原核生物命名列表)网站的上抓取微生物菌株的相关数据,从而得到微生物菌株的原始信息。
在本实施例中,微生物菌株的原始信息可以包括微生物菌株的菌株编号和微生物菌株的菌种名称。上述菌株编号可以是人为赋予菌株的、起到标识作用的编号,可以是字母、数字、字符或者其组合等。上述微生物菌株的菌种名称可用于标识微生物菌株所属的菌种,可以是菌种的科学名称、常用名称等。
步骤202,对微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号。
在本实施例中,标准化菌株编号可以是微生物菌株在预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号。
本实施例中,微生物菌株的菌株编号可以是保藏中心编号,还可以是非保藏中心编号(例如原始编号)。
通常来说,寄存人向保藏中心提交某个菌株后,保藏中心可以按照自身的菌株编号规则为该菌株分配编号,例如,中国普通微生物菌种保藏管理中心(China GeneralMicrobiological Culture Collection Center,CGMCC)可以按照“CGMCC+空格+数字编号”的编号规则为菌株分配编号。上述由保藏中心分配的编号即为菌株的保藏中心编号。
通常来说,菌株的培养人在培养菌株时,为了实现区分目的可以自行对菌株进行编号,例如将菌株编号为“1-25”、“TOM-23”等。上述由培养人自行定义的编号即为菌株的原始编号。
图2B是根据本公开的步骤202的一个实施例的分解流程图。在一些可选的实施方式中,如图2B所示,步骤202可以进一步包括以下步骤:
步骤2021,确定微生物菌株的菌株编号是否为保藏中心编号。
在该实施方式中,首先可以预先获取各个保藏中心的编号规则,例如A保藏中心的编号规则可以是“A+空格+数字编号”,B保藏中心的编号规则可以是“B+空格+数字编号”。之后,可以确定微生物菌株的菌株编号是否与某个保藏中心的编号规则进行匹配。如果是,则可以确定微生物菌株的菌株编号为保藏中心编号,并转到步骤2022执行。如果否,则可以确定微生物菌株的菌株编号为非保藏中心编号。例如,对于微生物菌株的菌株编号“A 123”,可以确定该菌株编号与A保藏中心的编号规则匹配,进而确定该菌株编号为保藏中心编号。又例如,对于微生物菌株的菌株编号“TOM 123”,可以确定该菌株编号不与任何保藏中心的编号规则匹配,进而可以确定该菌株编号为非保藏中心编号。
需要说明的是,如何确定微生物菌株的菌株编号是否与某个保藏中心的编号规则匹配是本领域广泛研究和应用的现有技术,在此不再赘述。例如,可以为某个保藏中心的编号规则制定相应的正则表达式,再确定微生物菌株的菌株编号是否与该保藏中心的编号规则对应的正则表达式匹配即可。
步骤2022,根据微生物菌株的菌株编号确定微生物菌株所属的保藏中心。
在该实施方式中,上述执行主体可以在步骤2021中确定微生物菌株的菌株编号为保藏中心编号的情况下,可以提取微生物菌株的菌株编号中的保藏中心标识,进而确定微生物菌株所属的保藏中心。例如,在前文描述的例子中,可以从微生物菌株的菌株编号“A123”提取出保藏中心标识“A”,进而确定微生物菌株所属的保藏中心为A保藏中心。执行完步骤2022后转到步骤2023执行。
需要说明的是,如何提取菌株编号中的保藏中心标识是本领域广泛研究和应用的现有技术,在此不再赘述。例如,可以为某个保藏中心的编号规则制定相应的正则表达式,再用与该保藏中心的编号规则对应的正则表达式提取微生物菌株的菌株编号中的保藏中心标识即可。
步骤2023,按照微生物菌株所属保藏中心的最新编号规则对微生物菌株的菌株编号进行处理,得到微生物菌株的标准化菌株编号。
通常来说,由于保藏中心名称变更等原因,保藏中心的编号规则会发生变化。例如,原名为C′的保藏中心更名为了C,相应的编号规则由“C′+空格+数字编号”变为了“C+空格+数字编号”。
在该实施方式中,在确定微生物菌株所属的保藏中心后,可以按照该保藏中心的最新编号规则对菌株编号进行处理。例如,在前文描述的例子中,对于“C′123”这一菌株编号,可以按照C保藏中心的最新编号规则“C+空格+数字编号”对其进行处理,得到相应的标准化菌株编号“C 123”。
在一些可选的实施方式中,如图2B所示,上述执行主体还可以在步骤2021中确定微生物菌株的菌株编号为非保藏中心编号的情况下执行以下步骤2024:
步骤2024,获取微生物菌株的16s rRNA编号。
通常来说,16s rRNA基因是细菌上编码rRNA相对应的DNA序列,存在于所有细菌的基因组中。16S rRNA基因可以作为鉴别菌种的依据。16S rRNA基因的相关信息可收录在专门的DNA序列数据库(例如GenBank,由美国国家生物技术信息中心建立的DNA序列数据库)中。每个菌种的16S rRNA基因在DNA序列数据库具有相应的收录编号,即为该菌种的16srRNA编号。
在该实施方式中,可以从预设的微生物菌株信息数据库中获取微生物菌株的16srRNA编号。例如,可以LPSN网站的上抓取微生物菌株的相关数据,从而得到微生物菌株的16s rRNA编号。在一个具体例子中,可以从LPSN网站上查询到名为“Absicoccus porci”的菌种的16s rRNA编号为“MG931004”。
执行完步骤2024后可以转到步骤2025执行。
步骤2025,基于微生物菌株的16s rRNA编号,确定微生物菌株的菌株编号是否对应唯一菌种。
通常来说,由于非保藏中心编号(例如原始编号)的编号规则具有不规范性,因此在微生物菌株的菌株编号为非保藏中心编号的情况下,可能出现同一菌株编号对应不同菌种的情况。例如,根据LPSN网站中的某一条记录可知,菌株编号为“1-25”的微生物菌株对应的菌种为“Acetobacter papaya”。同时,根据LPSN网站中的另外一条记录可知,菌株编号为“1-25”的微生物菌株对应的菌种为“Paenibacillus quercus”,而“Acetobacter papaya”和“Paenibacillus quercus”对应不同的16s rRNA编号,因此是两个不同菌种。由此可见,同一个非保藏中心编号可能对应两个以上的菌种。
在该实施方式中,在微生物菌株的菌株编号为非保藏中心编号的情况下,可以根据微生物菌株的菌株编号是否对应唯一的16s rRNA编号,确定微生物菌株的菌株编号是否对应唯一菌种。例如可以在预设的微生物菌株信息数据库中查询与微生物菌株的菌株编号一致的菌株的16s rRNA编号,并判断查询到的16s rRNA编号是否唯一,如果是则可以确定该微生物菌株的菌株编号对应唯一菌种。
执行完步骤2025后可以转到步骤2026执行。
步骤2026,响应于确定微生物菌株的菌株编号对应唯一菌种,将微生物菌株的菌株编号确定为微生物菌株的标准化菌株编号。
在该实施方式中,可以将对应唯一菌种的菌株编号确定为微生物菌株的标准化菌株编号。
通过上文描述的步骤2021到步骤2026,可获得预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号,即得到了微生物菌株的标准化菌株编号。
步骤203,对微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称。
在本实施例中,标准化菌种名称可以是微生物菌株的菌种名称对应的物种科学名称。
通常来书,物种科学名称可以是依照生物学上对生物种类的命名规则对物种进行命名所得到的名称。例如,按照双命名法,每个物种的科学名称可以由两部分组成,第一部分是属名,第二部分是种加词,种加词后面还应有命名者的姓名,有时命名者的姓名可以省略。
图2C是根据本公开的步骤203的一个实施例的分解流程图。在一些可选的实施方式中,如图2C所示,步骤203可以进一步包括以下步骤:
步骤2031,基于预设的微生物菌株原始信息数据库,确定微生物菌株的菌种名称是否为微生物菌株的菌株编号唯一对应的菌种名称。
通常来说,随着国际微生物系统分类学技术水平的不断提高,一些微生物菌种的分类学地位发生了变迁,名称也随之发生变化。因此,会出现同一个微生物菌株的菌株编号对应两种以上的菌种名称(例如同一个微生物菌株的菌株编号分别对应现行名称和旧版名称)的情况。
在该实施方式中,可以在预设的微生物菌株原始信息数据库中查询与微生物菌株的菌株编号一致的菌株所对应的菌种名称。如果所查询到的菌种名称唯一并且与微生物菌株的菌种名称相同,则可以确定微生物菌株的菌种名称为微生物菌株的菌株编号唯一对应的菌种名称。这样,可以保证菌株编号所对应的菌种名称的唯一性,有利于实现菌种名称的标准化处理。
在确定微生物菌株的菌种名称为微生物菌株的菌株编号唯一对应的菌种名称的情况下,可以转到步骤2032执行。
步骤2032,基于预设的物种分类数据库,确定微生物菌株的菌种名称对应的物种科学名称。
通常来说,物种分类数据库中记录有各类生物的物种分类地位和名称等信息。其中,物种分类数据库中记录的物种名称可以包括物种科学名称、曾用名、常用写法、错误写法、基因名写法等。上述物种分类数据库例如可以是Taxonomy物种分类数据库(即美国国家生物信息中心生物分类数据库)。
在该实施方式中,上述方法的执行主体可以在预设的物种分类数据库中查询与微生物菌株的菌种名称匹配的物种科学名称。上述与微生物菌株的菌种名称匹配的物种科学名可以满足以下至少一种情形:该物种科学名称与微生物菌株的菌种名称一致,或者该物种科学名称对应的曾用名、常用写法或者错误写法等与微生物菌株的菌种名称一致。
图2D是根据本公开的步骤2032的一个实施例的分解流程图。在一些可选的实施方式中,如图2D所示,步骤2032可以进一步包括以下步骤:
步骤2032a,在物种分类数据库中查询与微生物菌株的菌种名称匹配的物种科学名称。
例如,可以将微生物菌株的菌种名称作为检索词,按照模糊匹配方式在物种分类数据库中进行检索,再根据检索结果确定物种分类数据库中是否存在与微生物菌株的菌种名称一致的物种科学名,或者相应的曾用名、常用写法或者错误写法等与微生物菌株的菌种名称一致的物种科学名。
如果查询到,可以转到步骤2032b执行。
步骤2032b,将所查询到的物种科学名称确定为微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,如图2D所示,在步骤2032a的执行结果为未查询到的情况下,可以转到步骤2032c执行。
步骤2032c,基于预设的菌株保藏信息数据库,确定微生物菌株的其他菌种名称。
在该实施方式中,菌株保藏信息数据库可以是存储有菌株保藏信息(例如保藏中心所保藏菌株的菌株编号、菌种名称等)的数据库,例如可以是GCM(Global Catalogue ofMicroorganisms,全球微生物资源目录)数据库、各个保藏中心的资源目录数据库等。
上述方法的执行主体可以基于预设的菌株保藏信息数据库,获取微生物菌株对应的、前述微生物菌株的菌种名称之外的其他名称,即微生物菌株的其他菌种名称。
在一些可选的实施方式中,步骤2032c可以按如下方式执行:首先,在菌株保藏信息数据库中查询与微生物菌株的菌株编号一致的菌株对应的菌种名称。其次,确定所查询到的菌种名称与微生物菌株的菌种名称是否一致。最后,响应于确定不一致,将所查询到的菌种名称确定为微生物菌株的其他菌种名称。
通过步骤2032c确定微生物菌株的其他菌种名称后,可以转到步骤2032d执行。
步骤2032d,在物种分类数据库中查询与微生物菌株的其他菌种名称匹配的物种科学名称。
步骤2032d的执行方式可参见前文关于步骤2032a的描述,此处不再赘述。
在步骤2032d的执行结果为查询到的情况下,可以转到步骤2032e执行。
步骤2032e,将所查找到的物种科学名称确定为微生物菌株的菌种名称对应的物种科学名称。
通过上文描述的步骤2032a-2032e,可获得微生物菌株的菌种名称对应的物种科学名称。
在其他实施方式中,如果通过2032a-2032e步骤没有获得微生物菌株的菌种名称对应的物种科学名称,还可以通过人工处理方式确定微生物菌株的菌种名称对应的物种科学名称。
步骤2033,将微生物菌株的菌种名称对应的物种科学名称确定为微生物菌株对应的标准化菌种名称。
通过上文描述的步骤2031-2033,可以获得微生物菌株对应的标准化菌种名称,从而完成了对菌种名称的标准化处理。
步骤204,用标准化菌株编号和标准化菌种名称生成微生物菌株的标准化信息。
在本实施例中,微生物菌株的标准化信息可以包括微生物菌株的标准化菌株编号和微生物菌株对应的标准化菌种名称。在一个例子中,假设微生物菌株的标准化菌株编号为“X 123”,微生物菌株对应的标准化菌种名称为“Y”,则该微生物菌株的标准化信息包括了上述标准化菌株编号为“X 123”和标准化菌种名称“Y”。
在一些可选的实施方式中,在从物种分类数据库中查询到与微生物菌株的菌种名称或者其他名称匹配的物种科学名称的情况下,微生物菌株信息的标准化处理方法还可以包括:获取所查询到的物种科学名称的物种分类号。上述物种分类号可以是微生物菌种所属物种在物种分类数据库中的ID(Identity document,标识号)。
在该实施方式中,步骤204可以按照如下方式执行:用标准化菌株编号、标准化菌种名称和物种分类号生成微生物菌株的标准化信息。即,该实施方式中微生物菌株的标准化信息包括微生物菌株的标准化菌株编号、微生物菌株对应的标准化菌种名称和微生物菌种所属物种的物种分类号。通过上述方式,可以便于在物种分类数据库中定位微生物菌株。
本实施例中的微生物菌株信息的标准化处理方法,通过对微生物菌株原始信息中的菌株编号和菌种名称分别进行标准化处理,将微生物菌株在预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号确定为微生物菌株的标准化菌株编号,将微生物菌株的菌种名称对应的物种科学名称确定为微生物菌株对应的标准化菌株名称,实现了微生物菌株信息的标准化,保证了微生物菌株信息的统一,能够对微生物的研究分析工作起到推动作用。
进一步参考图3,作为对上述各图所示方法的实现,本公开提供了一种微生物菌株信息的标准化处理装置的一个实施例,该装置实施例与图2A所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图3所示,本实施例的微生物菌株信息的标准化处理装置300可以包括:获取模块301、第一处理模块302、第二处理模块303和生成模块304。其中,获取模块301可以被配置为获取微生物菌株的原始信息,微生物菌株的原始信息包括微生物菌株的菌株编号和微生物菌株的菌种名称;第一处理模块302可以被配置为对微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,标准化菌株编号为微生物菌株在预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号;第二处理模块303可以被配置为对微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,标准化菌种名称为微生物菌株的菌种名称对应的物种科学名称;生成模块304可以被配置为用标准化菌株编号和标准化菌种名称生成微生物菌株的标准化信息。
在本实施例中,微生物菌株信息的标准化处理装置300的获取模块301、第一处理模块302、第二处理模块303和生成模块304的具体处理及其所带来的技术效果可分别参考图2A对应实施例中步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。
在一些可选的实施方式中,第一处理模块可以进一步包括第一确定单元和第一处理单元(图3中未示出)。第一确定单元可以被配置为确定微生物菌株的菌株编号是否为保藏中心编号;第一处理单元可以被配置为响应于确定是,根据微生物菌株的菌株编号确定微生物菌株所属的保藏中心,以及按照微生物菌株所属保藏中心的最新编号规则对微生物菌株的菌株编号进行处理,得到微生物菌株的标准化菌株编号。
在一些可选的实施方式中,第一处理单元可以进一步被配置为:响应于确定否,获取微生物菌株的16s rRNA编号;基于微生物菌株的16s rRNA编号,确定微生物菌株的菌株编号是否对应唯一菌种;响应于确定微生物菌株的菌株编号对应唯一菌种,将微生物菌株的菌株编号确定为微生物菌株的标准化菌株编号。
在一些可选的实施方式中,第二处理模块303可以进一步包括第二确定单元和第二处理单元(图3中未示出)。第二确定单元可以被配置为基于预设的微生物菌株原始信息数据库,确定微生物菌株的菌种名称是否为微生物菌株的菌株编号唯一对应的菌种名称;第二处理单元可以被配置为响应于确定是,基于预设的物种分类数据库,确定微生物菌株的菌种名称对应的物种科学名称,以及将微生物菌株的菌种名称对应的物种科学名称确定为微生物菌株对应的标准化菌种名称。
在一些可选的实施方式中,第二处理单元可以进一步被配置为:在物种分类数据库中查询与微生物菌株的菌种名称匹配的物种科学名称;响应于查询到,将所查询到的物种科学名称确定为微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,第二处理单元可以进一步被配置为:响应于未查询到,基于预设的菌株保藏信息数据库,确定微生物菌株的其他菌种名称;在物种分类数据库中查询与微生物菌株的其他菌种名称匹配的物种科学名称;响应于查询到,将所查找到的物种科学名称确定为微生物菌株的菌种名称对应的物种科学名称。
在一些可选的实施方式中,第二处理单元可以进一步被配置为:在菌株保藏信息数据库中查询与微生物菌株的菌株编号一致的菌株对应的菌种名称;确定所查询到的菌种名称与微生物菌株的菌种名称是否一致;响应于确定不一致,将所查询到的菌种名称确定为微生物菌株的其他菌种名称。
在一些可选的实施方式中,获取模块301可以进一步被配置为:获取所查询到的物种科学名称的物种分类号。生成模块304可以进一步被配置为:用标准化菌株编号、标准化菌种名称和物种分类号生成微生物菌株的标准化信息。
需要说明的是,本公开提供的微生物菌株信息的标准化处理装置中各模块的实现细节和技术效果可以参考本公开中其它实施例的说明,在此不再赘述。
下面参考图4,其示出了适于用来实现本公开的电子设备的计算机系统400的结构示意图。图4示出的电子设备仅仅是一个示例,不应对本公开的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU,Central Processing Unit)401,其可以根据存储在只读存储器(ROM,Read Only Memory)402中的程序或者从存储部分408加载到随机访问存储器(RAM,Random Access Memory)403中的程序而执行各种适当的动作和处理。在RAM403中,还存储有系统400操作所需的各种程序和数据。CPU401、ROM402以及RAM403通过总线404彼此相连。输入/输出(I/O,Input/Output)接口405也连接至总线404。
以下部件连接至I/O接口405:包括触控屏、手写板、键盘或鼠标等的输入部分406;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid CrystalDisplay)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN(局域网,Local Area Network)卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本公开的方法中限定的上述功能。需要说明的是,本公开的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++、Python,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、第一处理模块、第二处理模块和生成模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取微生物菌株的原始信息的模块”。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的,也可以是单独存在而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取微生物菌株的原始信息,微生物菌株的原始信息包括微生物菌株的菌株编号和微生物菌株的菌种名称;对微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,标准化菌株编号为微生物菌株在预设编号规则下的保藏中心编号或者微生物菌株的对应唯一菌种的非保藏中心编号;对微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,标准化菌种名称为微生物菌株的菌种名称对应的物种科学名称;用标准化菌株编号和标准化菌种名称生成微生物菌株的标准化信息。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种微生物菌株信息的标准化处理方法,包括:
获取微生物菌株的原始信息,所述微生物菌株的原始信息包括所述微生物菌株的菌株编号和所述微生物菌株的菌种名称;
对所述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,所述标准化菌株编号为所述微生物菌株在预设编号规则下的保藏中心编号或者所述微生物菌株的对应唯一菌种的非保藏中心编号;
对所述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,所述标准化菌种名称为所述微生物菌株的菌种名称对应的物种科学名称;
用所述标准化菌株编号和所述标准化菌种名称生成所述微生物菌株的标准化信息。
2.根据权利要求1所述的方法,其中,所述对所述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,包括:
确定所述微生物菌株的菌株编号是否为保藏中心编号;
响应于确定是,根据所述微生物菌株的菌株编号确定所述微生物菌株所属的保藏中心,以及按照所述微生物菌株所属保藏中心的最新编号规则对所述微生物菌株的菌株编号进行处理,得到所述微生物菌株的标准化菌株编号。
3.根据权利要求2所述的方法,其中,在所述确定所述微生物菌株的菌株编号是否为保藏中心编号后,所述方法还包括:
响应于确定否,获取所述微生物菌株的16s rRNA编号;
基于所述微生物菌株的16s rRNA编号,确定所述微生物菌株的菌株编号是否对应唯一菌种;
响应于确定所述微生物菌株的菌株编号对应唯一菌种,将所述微生物菌株的菌株编号确定为所述微生物菌株的标准化菌株编号。
4.根据权利要求1所述的方法,其中,所述对所述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,包括:
基于预设的微生物菌株原始信息数据库,确定所述微生物菌株的菌种名称是否为所述微生物菌株的菌株编号唯一对应的菌种名称;
响应于确定是,基于预设的物种分类数据库,确定所述微生物菌株的菌种名称对应的物种科学名称;
将所述微生物菌株的菌种名称对应的物种科学名称确定为所述微生物菌株对应的标准化菌种名称。
5.根据权利要求4所述的方法,其中,所述基于预设的物种分类数据库,确定所述微生物菌株的菌种名称对应的物种科学名称,包括:
在所述物种分类数据库中查询与所述微生物菌株的菌种名称匹配的物种科学名称;
响应于查询到,将所查询到的物种科学名称确定为所述微生物菌株的菌种名称对应的物种科学名称。
6.根据权利要求5所述的方法,其中,在所述物种分类数据库中查询与所述微生物菌株的菌种名称匹配的物种科学名称后,所述方法还包括:
响应于未查询到,基于预设的菌株保藏信息数据库,确定所述微生物菌株的其他菌种名称;
在所述物种分类数据库中查询与所述微生物菌株的其他菌种名称匹配的物种科学名称;
响应于查询到,将所查找到的物种科学名称确定为所述微生物菌株的菌种名称对应的物种科学名称。
7.根据权利要求6所述的方法,其中,所述基于预设的菌株保藏信息数据库,确定所述微生物菌株的其他菌种名称,包括:
在所述菌株保藏信息数据库中查询与所述微生物菌株的菌株编号一致的菌株对应的菌种名称;
确定所查询到的菌种名称与所述微生物菌株的菌种名称是否一致;
响应于确定不一致,将所查询到的菌种名称确定为所述微生物菌株的其他菌种名称;
优选地,所述方法还包括:
获取所查询到的物种科学名称的物种分类号;以及
所述用所述标准化菌株编号和所述标准化菌种名称生成所述微生物菌株的标准化信息,包括:
用所述标准化菌株编号、所述标准化菌种名称和所述物种分类号生成所述微生物菌株的标准化信息。
8.一种微生物菌株信息的标准化处理装置,包括:
获取模块,被配置为获取微生物菌株的原始信息,所述微生物菌株的原始信息包括所述微生物菌株的菌株编号和所述微生物菌株的菌种名称;
第一处理模块,被配置为对所述微生物菌株的菌株编号进行处理,得到相应的标准化菌株编号,其中,所述标准化菌株编号为所述微生物菌株在预设编号规则下的保藏中心编号或者所述微生物菌株的对应唯一菌种的非保藏中心编号;
第二处理模块,被配置为对所述微生物菌株的菌种名称进行处理,得到相应的标准化菌种名称,其中,所述标准化菌种名称为所述微生物菌株的菌种名称对应的物种科学名称;
生成模块,被配置为用所述标准化菌株编号和所述标准化菌种名称生成所述微生物菌株的标准化信息;
优选地,所述第一处理模块进一步包括第一确定单元和第一处理单元:
所述第一确定单元被配置为确定所述微生物菌株的菌株编号是否为保藏中心编号;
所述第一处理单元被配置为响应于确定是,根据所述微生物菌株的菌株编号确定所述微生物菌株所属的保藏中心,以及按照所述微生物菌株所属保藏中心的最新编号规则对所述微生物菌株的菌株编号进行处理,得到所述微生物菌株的标准化菌株编号;
优选地,所述第一处理单元进一步被配置为:
响应于确定否,获取所述微生物菌株的16s rRNA编号;
基于所述微生物菌株的16s rRNA编号,确定所述微生物菌株的菌株编号是否对应唯一菌种;
响应于确定所述微生物菌株的菌株编号对应唯一菌种,将所述微生物菌株的菌株编号确定为所述微生物菌株的标准化菌株编号;
优选地,所述第二处理模块进一步包括第二确定单元和第二处理单元:
所述第二确定单元被配置为基于预设的微生物菌株原始信息数据库,确定所述微生物菌株的菌种名称是否为所述微生物菌株的菌株编号唯一对应的菌种名称;
所述第二处理单元被配置为响应于确定是,基于预设的物种分类数据库,确定所述微生物菌株的菌种名称对应的物种科学名称,以及将所述微生物菌株的菌种名称对应的物种科学名称确定为所述微生物菌株对应的标准化菌种名称;
优选地,所述第二处理单元进一步被配置为:
在所述物种分类数据库中查询与所述微生物菌株的菌种名称匹配的物种科学名称;
响应于查询到,将所查询到的物种科学名称确定为所述微生物菌株的菌种名称对应的物种科学名称;
优选地,所述第二处理单元进一步被配置为:
响应于未查询到,基于预设的菌株保藏信息数据库,确定所述微生物菌株的其他菌种名称;
在所述物种分类数据库中查询与所述微生物菌株的其他菌种名称匹配的物种科学名称;
响应于查询到,将所查找到的物种科学名称确定为所述微生物菌株的菌种名称对应的物种科学名称;
优选地,所述第二处理单元进一步被配置为:
在菌株保藏信息数据库中查询与所述微生物菌株的菌株编号一致的菌株对应的菌种名称;
确定所查询到的菌种名称与所述微生物菌株的菌种名称是否一致;
响应于确定不一致,将所查询到的菌种名称确定为所述微生物菌株的其他菌种名称;
优选地,所述获取模块进一步被配置为:
获取所查询到的物种科学名称的物种分类号;以及
所述生成模块进一步被配置为:
用所述标准化菌株编号、所述标准化菌种名称和所述物种分类号生成所述微生物菌株的标准化信息。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813030.XA CN112037864B (zh) | 2020-08-13 | 2020-08-13 | 微生物菌株信息的标准化处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813030.XA CN112037864B (zh) | 2020-08-13 | 2020-08-13 | 微生物菌株信息的标准化处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112037864A true CN112037864A (zh) | 2020-12-04 |
CN112037864B CN112037864B (zh) | 2024-03-26 |
Family
ID=73578418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010813030.XA Active CN112037864B (zh) | 2020-08-13 | 2020-08-13 | 微生物菌株信息的标准化处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037864B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113611365A (zh) * | 2021-06-29 | 2021-11-05 | 中国科学院微生物研究所 | 冠状病毒信息数据的处理方法、装置、电子设备及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030167283A1 (en) * | 2002-03-01 | 2003-09-04 | Marine Biological Laboratory | Managing taxonomic information |
US20050160059A1 (en) * | 2004-01-16 | 2005-07-21 | George Garrity | Systems and methods for resolving ambiguity between names and entities |
US20060046246A1 (en) * | 2003-04-24 | 2006-03-02 | Qiandong Zeng | Genus, group, species and/or strain specific 16S rDNA sequences |
US20070175278A1 (en) * | 2003-05-12 | 2007-08-02 | Erasums University Medical Center Rotterdam (Erasumus Mc ) | Automated characterization and classification of microorganisms |
KR20180071888A (ko) * | 2016-12-20 | 2018-06-28 | 주식회사 천랩 | 16S rRNA 서열 기반 세균 동정 및 관리 장치, 그리고 이의 동작 방법 |
CN108884485A (zh) * | 2016-03-31 | 2018-11-23 | 株式会社岛津制作所 | 微生物的识别方法 |
CN109273053A (zh) * | 2018-09-27 | 2019-01-25 | 华中科技大学鄂州工业技术研究院 | 一种高通量测序的微生物数据处理方法 |
US20190179888A1 (en) * | 2017-12-12 | 2019-06-13 | International Business Machines Corporation | Data standardization rules generation |
CN110444256A (zh) * | 2019-07-31 | 2019-11-12 | 刘玲 | 一种病原微生物菌毒种信息管理系统 |
CN110991170A (zh) * | 2019-12-05 | 2020-04-10 | 清华大学 | 基于电子病历信息的中文疾病名称智能标准化方法与系统 |
-
2020
- 2020-08-13 CN CN202010813030.XA patent/CN112037864B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030167283A1 (en) * | 2002-03-01 | 2003-09-04 | Marine Biological Laboratory | Managing taxonomic information |
US20060046246A1 (en) * | 2003-04-24 | 2006-03-02 | Qiandong Zeng | Genus, group, species and/or strain specific 16S rDNA sequences |
US20070175278A1 (en) * | 2003-05-12 | 2007-08-02 | Erasums University Medical Center Rotterdam (Erasumus Mc ) | Automated characterization and classification of microorganisms |
US20050160059A1 (en) * | 2004-01-16 | 2005-07-21 | George Garrity | Systems and methods for resolving ambiguity between names and entities |
CN108884485A (zh) * | 2016-03-31 | 2018-11-23 | 株式会社岛津制作所 | 微生物的识别方法 |
KR20180071888A (ko) * | 2016-12-20 | 2018-06-28 | 주식회사 천랩 | 16S rRNA 서열 기반 세균 동정 및 관리 장치, 그리고 이의 동작 방법 |
US20190179888A1 (en) * | 2017-12-12 | 2019-06-13 | International Business Machines Corporation | Data standardization rules generation |
CN109273053A (zh) * | 2018-09-27 | 2019-01-25 | 华中科技大学鄂州工业技术研究院 | 一种高通量测序的微生物数据处理方法 |
CN110444256A (zh) * | 2019-07-31 | 2019-11-12 | 刘玲 | 一种病原微生物菌毒种信息管理系统 |
CN110991170A (zh) * | 2019-12-05 | 2020-04-10 | 清华大学 | 基于电子病历信息的中文疾病名称智能标准化方法与系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113611365A (zh) * | 2021-06-29 | 2021-11-05 | 中国科学院微生物研究所 | 冠状病毒信息数据的处理方法、装置、电子设备及介质 |
CN113611365B (zh) * | 2021-06-29 | 2024-03-26 | 中国科学院微生物研究所 | 冠状病毒信息数据的处理方法、装置、电子设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112037864B (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977110B (zh) | 数据清洗方法、装置及设备 | |
Pavlopoulos et al. | Unraveling the functional dark matter through global metagenomics | |
CN103620601B (zh) | 在映射缩减过程中汇合表 | |
WO2018013358A1 (en) | System and method for selecting data sample groups for machine learning of context of data fields for various document types and/or for test data generation for quality assurance systems | |
CN109359194B (zh) | 用于预测信息类别的方法和装置 | |
CN111459985A (zh) | 标识信息处理方法及装置 | |
CN110737824B (zh) | 内容查询方法和装置 | |
CN111177719A (zh) | 地址类别判定方法、装置、计算机可读存储介质及设备 | |
Ferrés et al. | An object-oriented framework for evolutionary pangenome analysis | |
CN112037865B (zh) | 物种科学名称确定方法、装置、电子设备及存储介质 | |
CN112037864B (zh) | 微生物菌株信息的标准化处理方法、装置及电子设备 | |
CN110895587B (zh) | 用于确定目标用户的方法和装置 | |
CN112818026A (zh) | 数据整合方法和装置 | |
CN110704481B (zh) | 展示数据的方法和装置 | |
CN113590756A (zh) | 信息序列生成方法、装置、终端设备和计算机可读介质 | |
CN113094415B (zh) | 数据抽取方法、装置、计算机可读介质及电子设备 | |
CN112579673A (zh) | 一种多源数据处理方法及装置 | |
CN109086438B (zh) | 用于查询信息的方法和装置 | |
CN109740130B (zh) | 用于生成文件的方法和装置 | |
CN116702752A (zh) | 文件数据处理方法、装置、设备及存储介质 | |
CN111723274B (zh) | 用于处理信息的方法和装置 | |
Imker et al. | A machine learning-enabled open biodata resource inventory from the scientific literature | |
CN110647623B (zh) | 用于更新信息的方法及装置 | |
CN113704483B (zh) | 冠状病毒知识图谱生成方法、装置、电子设备及介质 | |
CN111400623A (zh) | 用于搜索信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |