CN114270450A - 文献信息提供方法以及程序 - Google Patents

文献信息提供方法以及程序 Download PDF

Info

Publication number
CN114270450A
CN114270450A CN202080042588.0A CN202080042588A CN114270450A CN 114270450 A CN114270450 A CN 114270450A CN 202080042588 A CN202080042588 A CN 202080042588A CN 114270450 A CN114270450 A CN 114270450A
Authority
CN
China
Prior art keywords
enzyme
document
information
character string
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080042588.0A
Other languages
English (en)
Inventor
山田洋平
川崎浩子
细山哲
宫泽正生
白井智量
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NAT INST OF TECHNOLOGY AND EVA
Shimadzu Corp
RIKEN Institute of Physical and Chemical Research
Original Assignee
NAT INST OF TECHNOLOGY AND EVA
Shimadzu Corp
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NAT INST OF TECHNOLOGY AND EVA, Shimadzu Corp, RIKEN Institute of Physical and Chemical Research filed Critical NAT INST OF TECHNOLOGY AND EVA
Publication of CN114270450A publication Critical patent/CN114270450A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种文献信息提供方法,该方法使用单一的计算机或经由网络互相连接的多个计算机,且具备:将第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在多个数据库中对第1字符串的检索而得到的多个数据;从这些多个数据中提取示出关于酶的信息的多个第2字符串;使用所提取的多个第2字符串中的至少一个字符串,生成检索式;获取通过使用了该检索式的对文献数据库的检索而得到的检索结果数据。

Description

文献信息提供方法以及程序
技术领域
本发明涉及文献信息提供方法以及程序。
背景技术
在利用文献数据库的检索来获取专利文献或论文等非专利文献的情况下,该检索使用包含单词或语句的检索式来进行。然而,在各文献中,由于对相同的含义使用不同的用语、表达方式等理由,有时无法提取不含检索式所包含的单词以及语句的关联文献,而发生检索遗漏。在专利文献1中提出有一种方法,该方法对第一检索处理的结果的文献组所包含的、专利信息的分类代码进行统计,基于统计的分类代码,进行检索包含该分类代码的文献的第二检索处理。
现有技术文献
专利文献
专利文献1:日本特开第2013-41385号公报
发明内容
发明要解决的技术问题
由于用多个不同的名称来称呼一种酶或与酶对应的基因等情况并不少见,因此在与酶相关联的文献的检索中容易发生检索遗漏。
用于解决上述技术问题的方案
本发明的第1方案涉及一种文献信息提供方法,使用了单一的计算机或经由网络互相连接的多个计算机,具备:获取基于来自用户的第1输入的第1字符串;将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对所述第1字符串的检索而得到的多个数据;从所述多个数据中提取示出关于所述酶的信息的多个第2字符串;使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式;获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据;输出基于所述检索结果数据的信息。
本发明的第2方案涉及一种程序,用于使处理装置进行以下处理:第1字符串获取处理,获取基于来自用户的输入的第1字符串;数据通信处理,将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对所述第1字符串的检索而分别得到的多个数据;第2字符串提取处理,从所述多个数据中提取示出关于所述酶的信息的多个第2字符串;检索式生成处理,使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式;检索结果数据获取处理,获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据。
发明效果
根据本发明,降低了在与酶相关联的文献的检索中的检索遗漏。
附图说明
图1是示出一实施方式的文献信息提供系统的构成的概念图。
图2的(A)是示出一实施方式的终端装置的构成的概念图,图2的(B)是示出文献信息提供服务器的构成的概念图。
图3是示出提取字符串显示画面的概念图。
图4是示出文献信息显示画面的概念图。
图5是示出一实施方式的文献信息提供方法的流程的流程图。
图6的(A)以及图6的(B)是示出一实施方式的文献信息提供方法的流程的流程图。
图7是示出变形例的文献信息提供系统的构成的概念图。
图8是用于对程序的提供进行说明的概念图。
具体实施方式
以下,参照附图对用于实施本发明的方式进行说明。
-第1实施方式-
在第1实施方式中对以下的文献信息提供方法进行说明:基于通过对包含关于酶的信息的多个数据库的检索而得到的多个数据,生成检索式,使用该检索式从文献数据库中检索文献。此外,在以下的实施方式中,将“数据库”适当简写为“DB”。
图1是示出本实施方式的文献信息提供系统1的构成的概念图。文献信息提供系统1具备文献信息提供侧系统10、酶信息数据库侧系统(酶信息DB侧系统)20以及文献数据库侧系统(文献DB侧系统)30。文献信息提供侧系统10与酶信息DB侧系统20之间、以及文献信息提供侧系统10与文献DB侧系统30之间经由网络9连接。
网络9只要是可使至少包含字符串的信息进行通信的网络,则没有特别限定。在网络9中,例如利用HTTP(Hypertext Transfer Protocol:超文本传输协议)等在互联网中使用的通信协议进行通信。
文献信息提供侧系统10具备作为计算机的文献信息提供服务器11与作为计算机的终端装置15。在图1中,示出3个终端装置15a、15b以及15c,但终端装置15的数量没有特别限定。
文献信息提供服务器11与终端装置15之间经由网络9连接。因此,文献信息提供服务器11以及终端装置15能够配置在物理上分离的位置。
另外,文献信息提供服务器11以及至少一部分终端装置15也可以通过LAN(LocalArea Network:局域网)等本地网络互相连接。此外,也可以由单一的计算机构成文献信息提供侧系统10。
文献信息提供服务器11经由终端装置15获取由文献信息提供系统1的用户(以下,简称为“用户”)输入的字符串。将该输入的字符串称为输入字符串。文献信息提供服务器11与酶信息DB服务器21以及文献DB服务器31进行通信,处理通过该通信而得到的数据,将关于在文献DB32中检索到的文献的信息输出至终端装置15。
终端装置15作为进行来自用户的输入以及向用户的输出的接口而发挥功能。关于文献信息提供服务器11与终端设备15将在后面详细描述。
酶信息DB侧系统20具备酶信息数据库服务器(酶信息DB服务器)21。酶信息DB服务器21具备酶信息数据库(酶信息DB)22,且以可检索酶信息DB22的方式与该DB连接。在图1中,示出了3个酶信息DB服务器21a、21b以及21c,但酶信息DB服务器21的数量没有特别限定。此外,与酶信息DB服务器21a、21b以及21c对应地分别配置有酶信息DB22a、22b以及22c,但与各酶信息DB服务器21对应地配置的酶信息DB22的数量只要为1个以上,则没有特别限定。酶信息DB侧系统20优选具备多个酶信息DB22。
酶信息DB服务器21从文献信息提供服务器11接收由用户输入的输入字符串。酶信息DB服务器21通过输入字符串检索酶信息DB22,提取包含该输入字符串的数据。酶信息DB服务器21将所提取的数据作为酶信息检索结果数据发送至文献信息提供服务器11。
另外,酶信息DB服务器21与文献信息提供服务器11之间的通信也可以经由其他的服务器进行。此外,文献信息提供服务器11与至少一部分的酶信息DB服务器21之间可以通过LAN等本地网络互相连接。此外,文献信息提供服务器11上可以存在检索至少一部分的酶信息DB服务器21或酶信息DB22的系统,文献信息提供系统1可以根据这些来获得酶信息检索结果数据。
酶信息DB22是包含关于酶的信息的DB。关于酶的信息是示出酶的名称、酶的分类、与酶对应的基因的名称或酶所参与的代谢途径(以下,在简记为代谢途径时,是指酶所参与的代谢途径)的信息。作为酶的名称、与酶对应的基因的名称以及酶所参与的代谢途径,除了由特定的组织等推荐的名称(以下,称为推荐名称)以外,还能够包含由一部分的本领域技术人员使用的别称(以下,简称为别称)。作为这样的组织的一例,可例举由国际生物化学与分子生物学联盟(IUBMB)的酶学委员会、国际纯粹与应用化学联合会(IUPAC)的生物化学命名审议会所构成的共同委员会。酶的分类优选为基于酶所催化的酶反应的反应特异性或底物特异性的分类。上述共同委员会所设定的酶编号(Enzyme Commission numbers(酶学委员会编号);EC编号)就是这样的分类的一例。酶编号是用于根据由酶所催化的反应的种类来分类的编号,由4组数字表示。酶信息DB22只要能够包含关于酶的信息,则其方式没有特别限定。
另外,酶信息DB22只要能够包含关于酶的信息,则无需是以酶为主要对象的DB。酶信息DB22例如能够设为针对全部蛋白质、全部核酸的DB。此外,酶信息DB22也可以是整合了多个DB而得到的DB。
酶信息DB22例如由与多个分子分别对应的分子信息构成。分子信息构成为与某个分子关联从而可参照与该分子有关的信息。分子信息包含与序列有关的分子信息、与结构的有关的分子信息或与功能有关的分子信息等。作为与序列有关的分子信息,包含蛋白质等的肽的氨基酸序列、或者DNA或RNA的碱基序列等。作为与结构有关的分子信息,包含蛋白质的高级结构等的关于分子中的立体的原子配置的信息。与功能有关的分子信息包含分子参与的化学反应或代谢途径、与其它分子的相互作用等信息。
下文对酶信息DB22作为储存与多个分子分别对应的分子信息的DB进行说明。此时,在某个分子的分子信息的任一项目中包含输入字符串的情况下,酶信息DB服务器21提取该分子信息。酶信息DB服务器21能够将包含提取的与1个以上的分子对应的分子信息的数据作为酶信息检索结果数据,发送至文献信息提供服务器11。
作为酶信息DB22的具体例,包含BRENDA(BRaunschweig Enzyme DAtabase:布伦瑞克酶数据库)、UniProt(Universal Protein Resource:全球蛋白质资源)、KEGG(KyotoEncyclopedia of Genes and Genomes:京都基因与基因组百科全书)、ExPASy-ENZYME(Expert Protein Analysis System-Enzyme nomenclature database:蛋白质分析专家系统-酶命名数据库)、IUBMB Enzyme Nomenclature(International Union ofBiochemistry and Molecular Biology:国际生物化学与分子生物学联合会)以及ExplorEnz等可供检索的数据库(DB)。
文献DB侧系统30具备1个以上的文献数据库服务器(文献DB服务器)31。文献DB服务器31分别具备文献数据库(文献DB)32,且以可检索文献DB32的方式与该DB连接。在图1中,示出了3个文献DB服务器31a、31b以及31c,但文献DB服务器31的数量没有特别限定。此外,与各文献DB服务器31a、31b以及31c对应地分别示出有文献DB32a、32b以及32c,但与各文献DB服务器31对应配置的文献DB32的数量只要是1以上,则没有特别限定。
文献DB服务器31从文献信息提供服务器11接收后述的检索式生成部126生成的检索式。将该检索式称为文献DB检索式。文献DB服务器31根据文献DB检索式检索文献DB32,提取符合该检索式的条件的文献。文献DB服务器31将书目信息的数据等、包含示出所提取的文献的信息的数据作为文献检索结果数据,发送至文献信息提供服务器11。
另外,文献DB服务器31与文献信息提供服务器11之间的通信也可以经由其它的服务器进行。此外,文献信息提供服务器11以及至少一部分的文献DB服务器31也可以通过LAN等本地网络互相连接。此外,文献信息提供服务器11上可以存在检索至少一部分的文献DB服务器31或文献DB32的系统,文献信息提供系统1也可以根据这些获得文献检索结果数据。
文献DB32只要是包含专利文献以及论文等非专利文献的至少任意一种的数据库,则没有特别限定。作为文献DB32的具体例,包含PubMed。
图2的(A)是示出终端装置15的构成的概念图。终端设备15具备终端侧通信部151、输入部152与显示部153。终端装置15只要能够包含图2的(A)所示的构成,则其方式没有特别限定,除了智能手机等便携终端或电子计算机等的信息处理装置以外,还能够由进行输入输出与通信的任意的装置构成。
终端侧通信部151包含通信装置而构成,所述通信装置与用于互联网的协议等任意的通信协议对应的、无线或有线的连接进行通信。终端侧通信部151与文献信息提供服务器11的服务器侧通信部111进行通信,发送与接收需要的数据。
输入部152包含鼠标、键盘、各种按钮或触摸面板等输入装置而构成。输入部152检测来自用户的输入。
显示部153包含液晶监视器等显示装置而构成,显示输入画面、还有根据酶信息DB22以及文献DB32的检索结果而得到的信息。
图2的(B)是示出文献信息提供服务器11的构成的概念图。文献信息提供服务器11具备服务器侧通信部111、存储部112与控制部120。控制部120具备输入字符串获取部121、第1通信控制部122、字符串提取部123、第1输出控制部124、字符串选择部125、检索式生成部126、第2通信控制部127、检索结果数据获取部128、第2输出控制部129。
服务器侧通信部111包含通信装置而构成,所述通信装置可通过与用于互联网的协议等通信协议对应的、无线或有线的连接进行通信。服务器侧通信部111与终端装置15、酶信息DB服务器21以及文献DB服务器31进行通信,发送与接收需要的数据。
存储部112具备非易失性存储介质。存储部112存储控制部120的处理所需要的数据以及通过控制部120的处理而得到的数据、还有控制部120用于执行处理的程序等。
控制部120包含CPU等处理器而构成,作为控制文献信息提供服务器11的动作的主体发挥功能。控制部50通过执行存储在存储部112等中的程序来进行各种处理。
控制部120的输入字符串获取部121获取用户输入的输入字符串。输入字符串优选为与酶的名称或酶的分类对应的字符串,在输入字符串为酶的分类的情况下,该分类更优选为基于上述酶编号等的酶所催化的酶反应的反应特异性或底物特异性的分类。
对由用户进行的输入字符串的输入方法没有特别限定。例如,能够通过以下方式进行输入:用户使用键盘在显示在终端装置15的显示部153上的输入画面的文本框中键入输入字符串,使用鼠标点击发送按钮等。或者,也可以构成为,将包含输入字符串的文档文件从终端装置15向文献信息提供服务器11发送等,在文献信息提供服务器11中储存包含输入字符串的文档文件,输入字符串获取部121通过用户的输入从该文档文件中读取输入字符串。
输入字符串获取部121将基于用户输入的输入字符串存储在存储部112或控制部120的存储器中,使其为能够通过来自控制部120的参照命令来参照的状态(以下,也记载为“可参照地存储在存储部112等”)。
第1通信控制部122控制服务器侧通信部111来进行与酶信息DB服务器21的通信。第1通信控制部122向酶信息DB服务器21发送输入字符串。第1通信控制部122从酶信息DB服务器21接收基于发送的输入字符串进行的检索的结果所得到的酶信息检索结果数据。
字符串提取部123从酶信息检索结果数据中提取字符串。将字符串提取部123提取的字符串称为提取字符串。提取字符串是与关于上述酶的信息对应的字符串。字符串提取部123参照酶信息检索结果数据中的示出酶的名称、酶的分类或与酶对应的基因的名称等项目,提取与它们对应的字符串。字符串提取部123也可以根据前缀或后缀等的特征来提取与它们对应的字符串。例如,由于酶编号具有在“EC”之后接有数字的特征,因此也可以基于这样的特征来提取提取字符串。
另外,字符串提取部123也可以参照示出酶的代谢途径的项目,提取与它们对应的字符串。
字符串提取部123将提取字符串可参照地存储在存储部112等。在提取字符串彼此关联的情况下,字符串提取部123将关联的信息(以下,称为关联信息)存储在存储部112等中。字符串提取部123将示出成为提取了提取字符串的数据的信息源的DB的信息可参照地存储在存储部112等中。
字符串提取部123基于关联信息,根据需要将提取字符串重新排序,生成用于构建提取字符串的列表的数据(以下,称为列表数据)。在列表数据中,根据关联信息,将作为提取字符串的各酶编号(EC编号)等的分类与作为提取字符串的酶的名称以及基因名等相联系。酶的名称以及基因名能够包含同义词或简称等的表示同一酶的各种不同的名称。字符串提取部123在创建列表数据时,适当进行以下处理:基于预先存储的数据区分后述的推荐的名称与别称、或者在存在多个相同的提取字符串的情况下保留一个而进行删除、或者按预先设定的顺序重新排序等。在列表数据中,使酶的名称以及基因名与示出成为提取这些的信息源的DB的信息相联系。字符串提取部123将列表数据可参照地存储在存储部112等。
另外,在将酶的代谢途径作为提取字符串而提取的情况下,字符串提取部123能够基于关联信息,将代谢途径的提取字符串也与酶编号或示出成为信息源的DB的信息等相联系。这样,在代谢途径作为提取字符串而被提取的情况下,能够与以下记载的对酶的名称等的处理同样地将代谢途径作为提取字符串进行处理。
第1输出控制部124进行输出提取字符串的控制。第1输出控制部124根据列表数据生成用于显示列表的数据(以下,称为列表显示数据)。列表显示数据的形式只要能够在终端装置15中显示列表的图像、且能够进行用于由后述的字符串选择部125选择字符串的用户的输入,则没有特别限定。在网络9与HTTP的通信协议对应的情况下,能够构成为,列表显示数据通过HTML文件或XML文件等实现,列表的图像通过Web浏览器由终端装置15的显示部153显示。
图3是示出通过第1输出控制部124的控制而显示在终端装置15上的提取字符串列表显示画面的一例的概念图。图3示出将“(dehydr ogenase A)”作为输入字符串的例。
提取字符串列表显示画面D1具备输入字符串项目名要素60、酶信息项目名要素600、输入字符串显示要素70、分类显示要素71、名称显示要素72、别称显示要素73、基因名显示要素74、切换要素80、DB显示要素90。酶信息项目名要素600具备分类项目名要素61、名称项目名要素62、别称项目名要素63、基因名项目名要素64。
输入字符串项目名要素60通过“关键词(Key)”一词来表示与该要素关联地显示的信息是输入字符串。酶信息项目名要素600表示与该要素关联地显示的信息是关于酶的信息。分类项目名要素61通过“ec”一词来表示与该要素关联地显示的要素是酶的分类(在此为酶编号)。名称项目名要素62通过“名称(name)”一词来表示与该要素关联地显示的要素是酶的推荐的名称。在此,推荐的名称例如能够为由IUBMB/IUPAC共同委员会等特定的组织等推荐的名称。别称项目名要素63通过“别称(alterna)”(alternative name的缩写)一词来表示与该要素相关联地显示的信息是酶的推荐名称以外的别称。基因名项目名要素64通过“基因(gene)”一词来表示与该要素关联地显示的信息是与酶对应的基因名。
另外,名称项目名要素62能够不表示推荐名称,而表示各酶信息DB22的检索结果等的最初显示的名称等、可代表性地使用的任意的名称。这样的名称可以是上述IUBMB/IUPAC共同委员会推荐的名称等限定为一个的名称,也可以是可代表性地使用的多个名称。
输入字符串显示要素70与输入字符串项目名要素60关联地显示在相同的行,并显示输入字符串。在图3的例中,作为输入字符串,显示作为酶的名称的“dehydrogenaseA”。分类显示要素71与分类项目名要素61关联地显示在相同的行,显示作为提取字符串的酶的分类。在图3的例中,作为酶的分类,显示与输入字符串关联地提取出的酶编号的1.x.xx.xxx(x、xx以及xxx为数値)。
名称显示要素72与名称项目名要素62关联地显示在相同的行,显示作为提取字符串的酶的推荐名称。在图3的例中,作为酶的推荐名称,显示与分类显示要素71所示的酶编号关联地提取出的酶名。别称显示要素73与别称项目名要素63关联地显示在相同的行,显示作为提取字符串的酶的别称。在图3的例中,显示与分类显示要素71所示的酶编号关联地提取的、与推荐名称不同的酶名作为酶的别称。基因名显示要素74与基因名项目名要素64关联地显示在相同的行,显示与作为提取字符串的酶对应的基因名。在图3的例中,显示与分类显示要素71所示的酶编号关联地提取的基因名作为酶的基因名。
切换要素80是与各提取字符串关联地配置在相同的行,用于在生成后述的文献DB检索式时切换是否使用该提取字符串的图标。在图3的例中,切换要素80由复选框构成。切换要素80构成为,在选中复选框的情况下(参照切换要素80a),使用该提取字符串生成文献DB检索式(称为ON的情况),在未选中的情况下(参照切换要素80b),不使用该提取字符串地生成文献DB检索式(称为OFF的情况)。用户通过操作鼠标等来点击复选框,从而能够进行切换要素80的切换。
另外,切换要素80只要能够在生成文献DB检索式时供用户切换是否使用该提取字符串,则其方式没有特别限定。
例如若在提取字符串的列表中存在用户认为与输入字符串对应的酶关联性较低的字符串,则用户能够使用切换要素80将其从文献DB检索式中排除,避免提取不需要的文献。
在图3中,在切换要素80为ON的情况下的别称项目名显示要素73a由实线包围显示,在切换要素80为OFF的情况下的别称项目名显示要素73b由虚线包围显示。这样,能够根据在生成文献DB检索式时是否使用提取字符串,使该提取字符串的显示的方式不同。
DB显示要素90与各提取字符串关联地显示在相同的行,示出成为该提取字符串的信息源的DB。在图3的例中,成为信息源的DB的名称由“DB1”、“DB2”、“DB3”等示出。在从多个DB中提取1个提取字符串的情况下,也可以使多个DB显示要素90a、90b与1个提取字符串关联地进行显示。
另外,对于代谢途径,也能够与其它的提取字符串同样地进行显示,此外,还能够与切换要素80、DB显示要素90关联地进行显示。
在提取字符串列表显示画面D1中,关于各提取字符串的信息通过显示在相同的行来进行关联。此外,与某个酶编号关联的多个提取字符串通过集中显示在示出该酶编号的分类显示要素71的下方而与该提取字符串关联。这样,优选基于酶编号等酶的分类,重新排序各提取字符串来进行显示,但重新排序的方法没有特别限定。只要用户能够掌握提取字符串显示画面D1上的各要素的关联关系,则各要素的形状、位置没有特别限定。
字符串选择部125基于用户的输入,选择提取字符串中的至少一个字符串作为用于生成文献DB检索式的字符串。将由字符串选择部125选择的字符串称为选择字符串。用户操作终端装置15的输入部152,对提取字符串列表显示画面D1上的未图示的发送按钮进行点击等,从而终端侧通信部151将关于切换要素80针对各提取字符串的切换有关的信息(以下,称为切换信息)发送至文献信息提供服务器11。
另外,在包含代谢途径作为提取字符串的情况下,也能够将代谢途径设为选择字符串。
字符串选择部125基于服务器侧通信部111接收到的切换信息,选择选择字符串。字符串选择部125将选择字符串可参照地存储在存储部112等。
检索式生成部126生成作为用于根据选择字符串来检索文献DB32的检索式的文献DB检索式。只要使用选择字符串生成检索式,则文献DB检索式的生成方法没有特别限定。但是,从防止检索遗漏的观点出发,能够在酶的名称、酶的分类以及基因名的各个类别内取各选择字符串的逻辑和(OR)。
另外,在选择字符串中包含代谢途径的情况下,检索式生成部126能够同样地在代谢途径的类别内取选择字符串的逻辑和。以下的文献DB检索式的生成处理也同样适用于代谢途径。
例如,酶的名称选择A1以及A2作为选择字符串,酶的分类选择B1、B2以及B3作为选择字符串,基因名选择C1、C2、C3以及C4作为选择字符串,代谢途径选择D1以及D2作为选择字符串。在该情况下,作为一例,检索式生成部126能够生成“(A1 OR A2)AND(B1 OR B2 ORB3)AND(C1 OR C2 OR C3 OR C4)AND(D1 OR D2)”这样的文献DB检索式。也可以不将各类别的选择字符串之间设为AND,而是设为OR来检索更广的范围。
另外,检索式生成部126也可以经由终端装置15获取由用户输入的字符串(以下,称为追加字符串),进一步基于该追加字符串生成检索式。例如,检索式生成部126能够将该追加字符串通过包含AND或OR等的任意的逻辑运算式与上述文献DB检索式结合。此外,追加字符串也可以由多个字符串构成。
此外,在生成文献DB检索式时,可以在先创建某个文献DB检索式后,接受用户的指示再创建检索更窄或更广的范围的检索式,也可以预先创建并存储检索各种范围的检索式。
第2通信控制部127控制服务器侧通信部111来进行与文献DB服务器31的通信。第2通信控制部127将文献DB检索式发送至文献DB服务器31。在此,也可以将文献DB检索式与各文献DB服务器31的标准进行匹配,以不改变结果的方式进行编辑。第2通信控制部127接收基于发送的文献DB检索式进行的检索的结果所得到的文献检索结果数据。
检索结果数据获取部128将文献检索结果数据可参照地存储在存储部112等。
第2输出控制部129控制基于文献DB检索式进行的检索的结果所得到的文献的信息的输出。第2输出控制部129根据文献检索结果数据,生成用于显示检索到的文献的数据(以下,称为文献显示数据)。文献显示数据的形式只要能够在终端装置15中显示检索到的文献的书目事项等,则没有特别限定。在网络9与HTTP的通信协议对应的情况下,能够构成为,文献显示数据通过HTML文件、XML文件等实现,示出文献的书目事项等的图像通过Web浏览器由终端装置15的显示部153显示。
图4是示出通过第2输出控制部129的控制而显示在终端装置15上的文献信息显示画面的一例的概念图。文献信息显示画面D2具备表T与提取范围切换图标301以及302。
另外,只要基于选择字符串来创建文献DB检索式,进行文献DB的检索,则也可以构成为不切换提取范围。例如,也可以是,构成为由用户指定提取范围,基于所指定的提取范围来创建文献DB检索式,进行文献检索,并显示命中的文献,从而在切换提取范围时重新由用户指定提取范围并重复该流程。此外,也可以不显示提取范围切换图标301以及302,而利用来自键盘等的输入进行切换等,以其它的方法实现提取范围切换图标301以及302的功能。
文献信息显示画面D2的表T具备选择字符串项目201、标题项目202、摘要项目203、刊物名项目204、卷-号项目205、页项目206、发行年项目207。
另外,文献信息显示画面D2所包含的信息只要能够特定检索到的文献,则没有特别限定。此外,在图4的例中,构成为显示论文等的非专利文献的书目事项,但也可以显示专利文献。进而,只要是将刊物名项目204、卷-号项目205、页项目206与题目同列显示等的能够特定检索到的文献,则对其显示方式没有特别限定。
选择字符串项目201是示出检索到的文献与文献DB检索式的哪个选择字符串关联从而提取的项目。在图4的例中,检索到的文献与“dehydrogenase C”以及“GEN1”这两个选择字符串关联地提取。在此,“与选择字符串关联地提取”是指在文献DB32的检索中的检索范围内包含该选择字符串。该检索范围可根据标题、摘要以及全文等的范围适当设定。这样,在文献信息显示画面D2中,基于文献检索结果数据,与作为选择字符串的关于酶的信息关联地显示关于检索到的文献的信息。
标题项目202是示出检索到的文献的标题的项目。摘要项目203是示出检索到的文献的摘要的项目。刊物名项目204是示出收录有检索到的文献的刊物名的项目。卷-号项目205是示出收录有检索到的文献的刊物的卷以及号的项目。页项目206是示出检索到的文献在刊物中所收录的页的项目。发行年项目207是示出收录有检索到的文献的刊物的发行年、在线公开的年的项目。
提取范围切换图标301以及302是用于基于文献DB检索式,根据文献检索结果数据,切换显示在文献信息显示画面D2的文献的提取范围的图标。提取范围切换图标301显示基于与比提取范围切换图标302更广的提取范围对应的检索式的文献检索结果。
例如,酶的名称选择A1以及A2作为选择字符串,酶的分类选择B1、B2以及B3作为选择字符串,基因名选择C1、C2、C3以及C4作为选择字符串,代谢途径选择D1以及D2作为选择字符串。在该情况下,作为一例,在用户点击了提取范围切换图标301的情况下,能够显示“(A1OR A2)OR(B1 OR B2 OR B3)OR(C1 OR C2 OR C3 OR C4)OR(D1 OR D2)”这样的基于文献DB检索式的文献检索结果。然后,在用户点击了提取范围切换图标301的情况下,能够显示“(A1 OR A2)AND(B1 OR B2 OR B3)AND(C1 OR C2 OR C3 OR C4)AND(D1 OR D2)”这样的基于文献DB检索式的文献检索结果。
为了获取基于不同的多个文献DB检索式的文献检索结果,能够将各个检索式作为文献DB检索式并通过通信来获取文献DB32的检索结果。或者,也可以基于与之前获取的文献检索结果数据的各文献关联的选择字符串,由文献信息提供服务器11生成与不同的提取范围对应的检索式的检索结果的数据。换言之,文献信息提供服务器11也可以构成为,记录创建的文献DB检索式以及文献检索结果(关联有选择字符串),在进行新的文献检索时对该过去数据进行加工而利用。
图5、图6的(A)以及图6的(B)是示出本实施方式的文献信息提供方法的流程的流程图。在图5中,示出文献信息提供侧系统10进行的处理。在步骤S1001中,输入字符串获取部121获取输入字符串。步骤S1001结束后,开始步骤S1003。在步骤S1003中,第1通信控制部122控制服务器侧通信部111,将输入字符串发送至多个酶信息DB服务器21。步骤S1003结束后,开始步骤S2001。
图6的(A)示出酶信息DB侧系统20进行的处理。在步骤S2001中,酶信息DB服务器21使用输入字符串来检索酶信息DB22。步骤S2001结束后,开始步骤S2003。在步骤S2003中,酶信息DB服务器21向文献信息提供服务器11发送酶信息检索结果数据。步骤S2003结束后,开始步骤S1005。
在步骤S1005(图5)中,第1通信控制部122控制服务器侧通信部111,接收多个酶信息检索结果数据。步骤S1005结束后,开始步骤S1007。在步骤S1007中,字符串提取部123从多个酶信息检索结果数据中提取多个提取字符串,创建列表数据。步骤S1007结束后,开始步骤S1009。
在步骤S1009中,第1输出控制部124将示出多个提取字符串与信息源DB的信息的数据输出至终端装置15,在显示部153上显示提取字符串列表显示画面D1。步骤S1009结束后,开始步骤S1011。在步骤S1011中,字符串选择部125基于来自用户的输入,选择多个提取字符串中的至少一部分。步骤S1011结束后,开始步骤S1013。
在步骤S1013中,检索式生成部126使用所选择的提取字符串,生成文献DB检索式。步骤S1013结束后,开始步骤S1015。在步骤S1015中,第2通信控制部127控制服务器侧通信部111,将文献DB检索式发送至文献DB31。步骤S1015结束后,开始步骤S3001。
图6的(B)示出文献DB侧系统30进行的处理。在步骤S3001中,文献DB服务器31使用文献DB检索式来检索文献DB32。步骤S3001结束后,开始步骤S3003。在步骤S3003中,文献DB服务器31向文献信息提供服务器11发送文献检索结果数据。步骤S3003结束后,开始步骤S1017。
在步骤S1017(图5)中,第2通信控制部127控制服务器侧通信部111,接收文献检索结果数据。步骤S1017结束后,开始步骤S1019。在步骤S1019中,第2输出控制部129输出基于文献检索结果数据的信息,在显示部153上显示该信息。步骤S1019结束后,处理结束。
以下的变形也在本发明的范围内,且可与上述的实施方式组合。在以下的变形例中,关于示出与上述的实施方式相同的结构、功能的部位等,参照同一附图标记并适当省略说明。
(变形例1)
在上述的实施方式中,酶信息DB服务器21设为可检索过去的时刻的酶信息DB22,或可获取关于酶信息DB22的数据变更历史记录的信息。在该情况下,文献信息提供服务器11也可以获取通过输入字符串检索过去的时刻的酶信息DB22而得到的酶信息检索结果数据、基于该数据变更历史记录的酶信息检索结果数据。由此,能够也包罗过去的酶信息DB22的内容,降低关于酶的文献的检索遗漏。
在本变形例中,第1通信控制部122在将输入字符串发送至酶信息DB服务器21时,还适当发送关于检索范围的条件的信息,从而还可得到对于过去时刻的酶信息DB22的检索结果。
(变形例2)
在上述的实施方式中,文献信息提供侧系统10设为由文献信息提供服务器11与终端装置15构成。但是,文献信息提供侧系统也可以由信息处理装置、包含信息处理装置的分析装置构成。
图7是示出本变形例的文献信息提供系统2的构成的概念图。文献信息提供系统2具备文献信息提供侧系统10a、酶信息DB侧系统20与文献DB侧系统30。
文献信息提供侧系统10a具备分析装置40,分析装置40具备测量部41与数据解析装置42。分析装置40的种类没有特别限定,但能够包含分离分析装置而构成。作为分离分析装置没有特别限定,但能够包含色谱仪以及质量分析仪的至少一个。
测量部41对试样进行物理或化学分析并获取测量数据。数据解析装置42包含电子计算机等信息处理装置而构成,进行测量数据的解析,并且构成作为本变形例的文献信息提供方法的主体的文献信息提供装置12。
数据解析装置42具备与服务器侧通信部111的酶信息DB服务器21以及文献DB服务器31的通信功能,还有具备存储部112、输入部152、显示部153以及控制部120。
另外,文献信息提供装置12无需是分析装置40的一部分,而能够构成为作为与测量部41分离的电子计算机或便携终端等信息处理装置。
(变形例3)
也可以将用于实现文献信息提供服务器11或文献信息提供装置12的信息处理功能的程序记录在计算机可读记录介质中,使计算机系统读取并执行被记录在该记录介质的、与上述控制部120的处理以及其关联的控制相关的程序。另外,在此所称的“计算机系统”是指包含OS(Operating System:操作系统)、周边设备的硬件。此外,“计算机可读记录介质”是指,软盘、磁光盘、光盘、存储卡等便携式记录介质、内置于计算机系统的硬盘等存储装置。此外,“计算机可读记录介质”是指,也可以包含如经由互联网等网络或电话线路等通信线路发送程序的情况下的通信线那样,在短时间内动态地保存程序的介质、如该情况下的成为服务器或客户端的计算机系统内部的易失性存储器那样保存一定时间的程序的介质。此外,上述的程序也可以是用于实现一部分上述功能的程序,还可以是通过与已经记录在计算机系统中的程序组合来实现上述功能的程序。
此外,在应用于个人计算机(以下,记载为PC)等的情况下,与上述控制相关的程序能够通过CD-ROM、DVD-ROM等记录介质、互联网等的数据信号来提供。图8是示出其样式的图。PC950经由CD-ROM953接收程序的提供。此外,PC950具有与通信线路951连接的功能。计算机952是提供上述程序的服务器计算机,将程序储存在硬盘等记录介质中。通信线路951为互联网、个人计算机通信等的通信线路或者专用通信线路等。计算机952使用硬盘读出程序,经由通信线路951将程序发送至PC950。即,将程序作为数据信号通过载波输送,并经由通信线路951发送。这样,程序能够作为记录介质、载波等各种方式的计算机可读取的计算机程序产品而供给。
(变形例4)
在上述实施方式中,第1通信控制部122、字符串提取部123、第1输出控制部124、字符串选择部125、检索式生成部126、第2通信控制部127以及检索结果数据获取部128的处理等的由控制部120进行的处理可以通过具有处理装置的PC等信息处理装置或配置在由该信息处理装置构成的终端装置15上的控制部进行。在该情况下,也对终端装置15提供用于与上述变形例3同样地进行这些处理的程序。
根据上述的实施方式或变形例,可得到以下的作用效果。
(1)在第1方案的实施方式中,文献信息提供方法是使用单一的计算机或经由网络互相连接的多个计算机的文献信息提供方法,具备:获取基于来自用户的第1输入的第1字符串;将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对第1字符串的检索而得到的多个数据;从所述多个数据中提取示出关于所述酶的信息的多个第2字符串;使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式;获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据;输出基于所述检索结果数据的信息。由此,能够降低在与酶相关联的文献的检索中的检索遗漏。
(2)在第2方案的实施方式中,第1方案的文献信息提供方法进一步具备以下处理作为计算机的处理:在提取所述多个第2字符串之后,显示所提取的所述多个第2字符串;检测来自所述用户的针对所述多个第2字符串的第2输入;使用所提取的所述多个第2字符串中的基于所述第2输入的至少一个字符串,生成所述检索式。由此,基于用户的输入来选择用于检索文献的检索式的字符串,因此能够得到更高精度的检索结果。
(3)在第3方案的实施方式中,第1或第2方案的任一项方案的文献信息提供方法进一步具备以下处理作为计算机的处理:将成为信息源的所述第1服务器或所述数据库的信息与所提取的所述多个第2字符串分别关联。由此,能够将用于检索文献的检索式的字符串与成为信息源的DB的信息一起提供给用户。
(4)在第4方案的实施方式中,在第1~第3方案的任一方案的文献信息提供方法中,通过计算机的处理,基于所述检索结果数据,与关于所述酶的信息进行关联,输出针对检索到的文献的信息。由此,能够清楚地显示文献与哪些关于酶的信息存在关联,例如酶或对应的基因的名称等。
(5)在第5方案的实施方式中,在第1~第4方案的任一方案的文献信息提供方法中,所述第1字符串是与酶的名称或酶的分类对应的字符串。虽然以不同的多个名称来称呼同一酶或与其对应的基因等的情况并不少见,但通过该构成能够得到包罗了这些名称的检索结果。
(6)在第6方案的实施方式中,在第1~第5方案的任一方案的文献信息提供方法中,关于所述酶的信息是酶的名称、酶的分类、基因的名称以及代谢途径中的至少一个。由此,能够降低与酶的名称、酶的分类、基因的名称以及代谢途径存在关联的文献的检索遗漏。
(7)在第7方案的实施方式中,在第1~6方案的任一方案的文献信息提供方法中,所述酶的分类是基于反应特异性以及底物特异性的分类。由此,能够针对酶反应的反应特异性以及底物特异性,降低上述那样的存在关联的文献的检索遗漏。
(8)在第8方案的实施方式中,程序是用于使处理装置进行以下处理的程序:第1字符串获取处理,获取基于来自用户的输入的第1字符串(对应图5的流程图的步骤S1001);数据通信处理,将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对所述第1字符串的检索分别得到的多个数据(对应步骤S1003以及S1005);第2字符串提取处理,从所述多个数据中提取示出关于所述酶的信息的多个第2字符串(对应步骤S1007);检索式生成处理,使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式(对应步骤S1013);检索结果数据获取处理,获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据(对应步骤S1017)。由此,能够降低在与酶相关联的文献的检索中的检索遗漏。
本发明不被上述实施方式的内容限定。在本发明的技术性思想的范围内所能想到的其他方案也包含在本发明的范围内。
以下的优先权基础申请的公开内容作为引用文而加入本说明书中。
日本专利申请2019-108170号(2019年6月10日提出申请)
附图标记说明
1、2 文献信息提供系统
9 网络
10、10a 文献信息提供侧系统
11 文献信息提供服务器
12 文献信息提供装置
15、15a、15b、15c 终端装置
20 酶信息DB侧系统
21、21a、21b、21c 酶信息DB服务器
22、22a、22b、22c 酶信息DB
30 文献DB侧系统
31、31a、31b、31c 文献DB服务器
32、32a、32b、32c 文献DB
40 分析装置
42 数据解析装置
60 输入字符串项目名要素
61 分类项目名要素
62 名称项目名要素
63 别称项目名要素
64 基因名项目名要素
70 输入字符串显示要素
71 分类显示要素
72 名称显示要素
73 别称显示要素
74 基因名显示要素
80、80a、80b 切换要素
90、90a、90b DB显示要素
121 输入字符串获取部
122 第1通信控制部
123 字符串提取部
124 第1输出控制部
125 字符串选择部
126 检索式生成部
127 第2通信控制部
128 检索结果数据获取部
129 第2输出控制部
D1 提取字符串列表显示画面
D2 文献信息显示画面。

Claims (8)

1.一种文献信息提供方法,使用单一的计算机或经由网络互相连接的多个计算机,其特征在于,具备:
获取基于来自用户的第1输入的第1字符串;
将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对所述第1字符串的检索得到的多个数据;
从所述多个数据中提取示出关于所述酶的信息的多个第2字符串;
使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式;
获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据;
输出基于所述检索结果数据的信息。
2.如权利要求1所述的文献信息提供方法,其特征在于,具备:
在提取所述多个第2字符串之后,显示所提取的所述多个第2字符串;
检测来自所述用户的针对所述多个第2字符串的第2输入;
使用所提取的所述多个第2字符串中的基于所述第2输入的至少一个字符串,生成所述检索式。
3.如权利要求1所述的文献信息提供方法,其特征在于,具备:
将成为信息源的所述第1服务器或所述数据库的信息与所提取的所述多个第2字符串分别关联。
4.如权利要求1所述的文献信息提供方法,其特征在于,
基于所述检索结果数据,与关于所述酶的信息进行关联,输出针对检索到的文献的信息。
5.如权利要求1~4的任一项所述的文献信息提供方法,其特征在于,所述第1字符串是与酶的名称或酶的分类对应的字符串。
6.如权利要求1~4的任一项所述的文献信息提供方法,其特征在于,
关于所述酶的信息是酶的名称、酶的分类、基因的名称以及所述酶参与的代谢途径中的至少一个。
7.如权利要求1~4的任一项所述的文献信息提供方法,其特征在于,所述酶的分类是基于反应特异性以及底物特异性的分类。
8.一种程序,其特征在于,用于使处理装置进行以下处理:
第1字符串获取处理,获取基于来自用户的输入的第1字符串;
数据通信处理,将所述第1字符串发送至与包含关于酶的信息的多个数据库分别连接的多个第1服务器,接收在所述多个数据库中对所述第1字符串的检索而分别得到的多个数据;
第2字符串提取处理,从所述多个数据中提取示出关于所述酶的信息的多个第2字符串;
检索式生成处理,使用所提取的所述多个第2字符串中的至少一个字符串,生成检索式;
检索结果数据获取处理,获取通过使用了所述检索式的对文献数据库的检索而得到的检索结果数据。
CN202080042588.0A 2019-06-10 2020-06-04 文献信息提供方法以及程序 Pending CN114270450A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019108170 2019-06-10
JP2019-108170 2019-06-10
PCT/JP2020/022206 WO2020250812A1 (ja) 2019-06-10 2020-06-04 文献情報提供方法およびプログラム

Publications (1)

Publication Number Publication Date
CN114270450A true CN114270450A (zh) 2022-04-01

Family

ID=73780967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080042588.0A Pending CN114270450A (zh) 2019-06-10 2020-06-04 文献信息提供方法以及程序

Country Status (4)

Country Link
US (1) US20220335092A1 (zh)
JP (1) JPWO2020250812A1 (zh)
CN (1) CN114270450A (zh)
WO (1) WO2020250812A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110406A (ja) * 1997-10-06 1999-04-23 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
US7225183B2 (en) * 2002-01-28 2007-05-29 Ipxl, Inc. Ontology-based information management system and method
JP2005352878A (ja) * 2004-06-11 2005-12-22 Hitachi Ltd 文書検索システム、検索サーバ、及び検索クライアント
JP4398461B2 (ja) * 2005-11-25 2010-01-13 三菱スペース・ソフトウエア株式会社 文献検索装置、文献検索方法および文献検索プログラム
JP5551025B2 (ja) * 2010-08-31 2014-07-16 有限会社アイ・アール・ディー 特許検索式生成装置、特許検索式生成方法、およびプログラム
US11948662B2 (en) * 2017-02-17 2024-04-02 The Regents Of The University Of California Metabolite, annotation, and gene integration system and method

Also Published As

Publication number Publication date
JPWO2020250812A1 (zh) 2020-12-17
US20220335092A1 (en) 2022-10-20
WO2020250812A1 (ja) 2020-12-17

Similar Documents

Publication Publication Date Title
You et al. GOLabeler: improving sequence-based large-scale protein function prediction by learning to rank
Womble GCG: The Wisconsin Package of sequence analysis programs
Mulder et al. InterPro and InterProScan: tools for protein sequence classification and comparison
US20050240352A1 (en) Online procurement of biologically related products/services using interactive context searching of biological information
Willis et al. Searching, viewing, and visualizing data in the Biomolecular Interaction Network Database (BIND)
Zaru et al. Uniprot tools: bLAST, align, peptide search, and ID mapping
Mistry et al. Pfam: a domain-centric method for analyzing proteins and proteomes
Salgado et al. Using RegulonDB, the Escherichia coli K‐12 gene regulatory transcriptional network database
Li et al. Ppicurator: a tool for extracting comprehensive protein–protein interaction information
O’Donoghue et al. Reflect: A practical approach to web semantics
Sharman et al. Accessing expert‐curated pharmacological data in the IUPHAR/BPS guide to PHARMACOLOGY
US20040205061A1 (en) System and method for searching information
Sherman et al. DAVID gene ID conversion tool
Ausiello et al. pdbFun: mass selection and fast comparison of annotated PDB residues
Mathema et al. OSTRFPD: Multifunctional tool for genome-wide short tandem repeat analysis for DNA, transcripts, and amino acid sequences with integrated primer designer
Glanville et al. Berkeley Phylogenomics Group web servers: resources for structural phylogenomic analysis
CN114270450A (zh) 文献信息提供方法以及程序
Hennell et al. Using GenBank® for genomic authentication: a tutorial
Albu et al. The DNA barcode linker
Sterk et al. The EMBL nucleotide sequence and genome reviews databases
Rosonovski et al. Searching and evaluating publications and preprints using Europe PMC
Pavesi et al. Using Weeder for the discovery of conserved transcription factor binding sites
Garda et al. Public data sources for regulatory genomic features
JP2007207113A (ja) 系統樹表示システム
Hoffmann Using the iHOP information resource to mine the biomedical literature on genes, proteins, and chemical compounds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination