KR101488338B1 - method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways - Google Patents

method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways Download PDF

Info

Publication number
KR101488338B1
KR101488338B1 KR20140141721A KR20140141721A KR101488338B1 KR 101488338 B1 KR101488338 B1 KR 101488338B1 KR 20140141721 A KR20140141721 A KR 20140141721A KR 20140141721 A KR20140141721 A KR 20140141721A KR 101488338 B1 KR101488338 B1 KR 101488338B1
Authority
KR
South Korea
Prior art keywords
bio
pathway
node
biopathway
language
Prior art date
Application number
KR20140141721A
Other languages
Korean (ko)
Inventor
최윤수
전선희
서동민
박동인
유석종
이민호
성원경
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR20140141721A priority Critical patent/KR101488338B1/en
Application granted granted Critical
Publication of KR101488338B1 publication Critical patent/KR101488338B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Abstract

The purpose of the present invention is to effectively combine biopathways that are expressed in different languages as biopathways are constructed separately and independently using various biopathway description languages such as KGML, SBML, BIOPAX, etc. by various biopathway-related institutions. For the purpose, the present invention comprises the steps of: receiving a biopathway (S90); converting the biopathway into a first language (S91); separating the biopathway (S92); standardizing the node or relation of the biopathway in a standard term, storing the biopathway by using the node or the relation and extracting attribute information relating to the node or the relation (S93); searching the biopathway (S94); and combining a plurality of biopathways (S95).

Description

바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체{method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways}FIELD OF THE INVENTION [0001] The present invention relates to a device for biopathway integration, a method thereof, and a storage medium storing a program for integrating the biopathways,

본 발명은 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체에 관한 것이다. The present invention relates to an apparatus for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths.

바이오 인포매틱스는 생명공학(Bio)과 정보공학(Informatics)의 합성어로 컴퓨터와 소프트웨어를 활용해 유전자의 염기서열 데이터를 수집, 분석, 관리 및 활용하는 것으로 생물정보학이라고도 한다. 최근 인간 게놈 프로젝트 완성으로 유전 정보량이 증가하면서 관리할 데이터 양도 늘어나 생물정보학의 중요성이 높아졌다. 이와 같이 생물정보학의 발전과 함께 생물 관련 정보들이 기하급수적으로 증가하고 있으며 연구 대상도 DNA, RNA, 단백질에서 더 나아가 이들의 상호작용 및 조절 메커니즘에 의해 기능들이 어떻게 수행되는 지에 관한 바이오패스웨이까지 포함하게 되었다. 바이오패스웨이는 광대한 양의 정보를 포괄하며 구성체 사이의 유기적 관계를 나타내고 있는 것이다. 생물학 분야에서 양질의 바이오패스웨이 데이터베이스는 다양한 생물체의 생명 활동 메커니즘 이해, 질병의 발병, 진행, 자연소멸 및 치유에 관한 실체적 원인규명 등에 활용될 수 있다. 생명공학 분야에서의 효율적인 연구개발과 더불어 지식서비스 관점에서의 실질적인 장점이 있지만, 다양한 바이오패스웨이 관련 기관에서 다양한 바이오패스웨이 기술 언어(KGML, SBML, BIOPAX 등)를 사용하여 개별적 독립적으로 구축하기 때문에 현재 바이오패스웨이 데이터베이스 구축, 연계, 활용 측면에서 많은 문제점과 한계점이 존재한다. 또한 현재 대부분의 바이오패스웨이 데이터베이스는 수작업으로 구축되므로 막대한 구축 비용이 필요하고 기술 발전에 맞춘 신속한 데이터베이스 확장 및 변경이 불가능하다. Bioinformatics is a combination of biotechnology (bio) and information engineering (informatics). It uses computers and software to collect, analyze, manage and utilize gene sequence data. It is also called bioinformatics. Recently, with the completion of the human genome project, the amount of data to be managed has increased as the amount of genetic information has increased, and the importance of bioinformatics has increased. With the development of bioinformatics, bio-related information is growing exponentially, and research subjects include DNA pathways for how functions are performed by DNA, RNA, proteins, and their interaction and control mechanisms. . The bio-pathway encompasses vast amounts of information and represents an organic relationship between constituents. In the field of biology, high quality biopathway databases can be used to understand the mechanisms of life activity of various organisms, to identify the causes of disease, progress, natural extinction and physical causes of healing. In addition to efficient research and development in the field of biotechnology, there are substantial advantages in terms of knowledge services. However, various biopathway-related institutes independently construct various biopathway language (KGML, SBML, BIOPAX, etc.) There are many problems and limitations in terms of building, linking and utilizing bio-pathway database. Also, since most of the bio-pathway databases are built by hand, they require enormous construction costs and can not be expanded or changed quickly in accordance with technological development.

본 발명은 상기한 바와 같은 문제점을 해결하기 위한 것으로서 이질적인 언어로 표현된 바이오패스웨이를 효과적으로 통합하기 위한 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공하는 데 그 목적이 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to provide a device for integrating a biopathway to effectively integrate a biopathway expressed in a heterogeneous language, a method thereof, and a storage medium storing a program for integrating biopathways The purpose is to provide.

이와 같은 목적을 달성하기 위한, 본 발명의 제 1 측면에 따르면, 본 발명에 따른 바이오패스웨이 통합 장치는, 적어도 하나 이상의 바이오패스웨이 입력을 받는 입력모듈; 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 언어통일모듈; 상기 제1언어로 변환된 바이오패스웨이를 분리하는 분리모듈, 상기 분리모듈은 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고; 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 표준화모듈; 및 복수의 상기 저장된 바이오패스웨이를 통합하는 통합모듈을 포함하는 패스웨이 통합 장치를 포함한다.In order to achieve the above object, according to a first aspect of the present invention, there is provided a bio-pathway integrating apparatus comprising: an input module receiving at least one bio-pathway input; A language unification module for converting the at least one biopathway into a first language; A separation module for separating the biopathways converted into the first language, and the separation module separating the biopathways converted into the first language into nodes or relations; A standardization module for standardizing the node or relation in standard terms, storing a bio-pathway converted into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And an integration module for integrating a plurality of the stored bio-pathways.

본 발명의 제 2 측면에 따르면, 적어도 하나 이상의 바이오패스웨이 입력을 받는 단계; 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 단계; 상기 제1언어로 변환된 바이오패스웨이를 분리하는 단계, 상기 분리하는 단계는 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고; 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 단계; 및 복수의 상기 저장된 바이오패스웨이를 통합하는 단계를 포함하는 패스웨이 통합 방법을 포함한다.  According to a second aspect of the present invention, there is provided a method of generating a bio-pathway, comprising: receiving at least one bio-pathway input; Converting the at least one bio-pathway into a first language; Separating the biopathways converted into the first language, and separating comprises separating the biopathways converted into the first language into nodes or relationships; Standardizing the node or relationship in standard terms, storing the biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And integrating a plurality of the stored bio-pathways.

또한 본 발명의 제 3 측면에 따르면, 적어도 하나 이상의 바이오패스웨이 입력을 받고, 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하고, 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하고, 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하고, 복수의 상기 저장된 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 포함한다. According to a third aspect of the present invention, there is provided a bio-pathway management method comprising: receiving at least one bio-pathway input, converting the at least one bio-pathway into a first language, Extracting attribute information related to the node or relationship, storing a plurality of the stored nodes or relationships in a standard language, storing a biopathway converted into the first language in the form of the node or relationship, And a storage medium storing a program for integrating the biopathways.

이상에서 설명한 바와 같이 본 발명에 의하면 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 저비용으로 바이오패스웨이 데이터베이스를 효율적으로 구축할 수 있다. As described above, according to the present invention, it is possible to efficiently construct a bio-pathway database at a low cost by providing a device for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths.

바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 통합된 패스웨이를 통해 심층 지식 추출을 통한 신규 발병 기전 추출이 가능하다. A device for biopathway integration, a method thereof, and a storage medium for storing a program for integrating biopathways are provided, whereby a new pathogenic mechanism can be extracted through deep knowledge extraction through an integrated pathway.

또한 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 기술 발전에 맞춰 신속한 데이터베이스 확장 및 변경이 가능하다. Also, by providing a storage medium storing a device for integrating a bio pathway, a method thereof, and a program for integrating a biopathway, rapid expansion and modification of the database can be performed in accordance with technological development.

도 1은 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 설명하기 위한 개략적인 흐름도,
도 2는 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치를 설명하기 위한 모듈 구성도,
도 3은 본 발명의 일 실시예에 따른 바이오패스웨이 통합의 전체적인 과정을 나타낸 도면,
도 4는 본 발명의 일 실시예에 따른 입력된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 5는 본 발명의 일 실시예에 따른 입력된 또 다른 하나의 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 6은 본 발명의 일 실시예에 따른 통합된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 7은 본 발명의 일 실시예에 따른 알츠하이머 병의 바이오패스웨이를 나타낸 도면,
도 8은 본 발명의 일 실시예에 따른 KGML언어로 표현된 바이오패스웨이를 나타낸 도면,
도 9는 본 발명의 일 실시예에 따른 바이오패스웨이 통합 방법을 설명하기 위한 흐름도이다.
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a schematic flow diagram illustrating an apparatus for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths according to an embodiment of the present invention;
FIG. 2 is a block diagram illustrating a device for integrating a bio-pathway according to an embodiment of the present invention. FIG.
3 is a diagram illustrating an overall process of integrating a bio-pathway according to an embodiment of the present invention;
FIG. 4 is a diagram illustrating input bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 5 is a view showing another inputted bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 6 is a view showing integrated bio-pathway information and stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 7 is a diagram illustrating a bio-pathway of Alzheimer's disease according to an embodiment of the present invention;
FIG. 8 is a diagram illustrating a bio-pathway expressed in the KGML language according to an embodiment of the present invention;
9 is a flowchart illustrating a bio-pathway integration method according to an embodiment of the present invention.

본 발명의 일 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. One embodiment of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

도 1은 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 설명하기 위한 개략적인 흐름도이다. FIG. 1 is a schematic flowchart for explaining an apparatus for integrating a bio-pathway, a method thereof, and a storage medium for storing a program for integrating bio-paths according to an embodiment of the present invention.

도 1을 참조하면, 본 발명에 따른 바이오패스웨이 통합은 바이오패스웨이 입력(10), 하나의 언어로 통일하기 위한 언어통일부(11), 하나의 언어로 통일된 바이오패스웨이를 노드 또는 관계로 분리하여 표준용어로 표준화하여 저장하는 저장부(12), 통합을 위해 원하는 바이오패스웨이를 검색하는 검색부(13), 복수의 바이오패스웨이들을 통합하는 통합생성부(14)를 통해 진행된다. Referring to FIG. 1, the bio-pathway integration according to the present invention includes a bio-pathway input 10, a language unification unit 11 for unifying in one language, a bio-pathway unified in one language as a node or relationship A storage unit 12 for separating and storing standardized standard terms and storing them, a search unit 13 for searching for a desired biopathway for integration, and an integration generating unit 14 for integrating a plurality of biopathways.

도 2는 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치를 설명하기 위한 모듈 구성도이다.2 is a block diagram illustrating an apparatus for integrating a bio-pathway according to an embodiment of the present invention.

도 2를 참조하면, 본 발명에 따른 바이오패스웨이 통합을 위한 장치는 입력모듈(20), 언어통일모듈(21), 분리모듈(22), 표준화모듈(23), 검색모듈(24), 및 통합모듈(25)을 포함한다. 입력모듈은(20)은 통합하기 원하는 바이오패스웨이 입력을 받는다. 2, an apparatus for integrating a bio-pathway according to the present invention includes an input module 20, a language unification module 21, a separation module 22, a standardization module 23, a search module 24, And an integration module 25. The input module 20 receives the bio-pathway input desired to be integrated.

언어통일모듈(21)은 다양한 기관에서 이질적인 언어로 표현된 바이오패스웨이를 하나의 언어로 통일한다. 이질적인 언어에는 KGML, SBML, BIOPAX, PSI-MI가 있다. 이질적인 언어로 표현된 바이오패스웨이를 하나의 언어로 통일시키기 위해서 SBML을 사용하지만 이는 사용자의 의도에 따라 변경하거나 새로운 언어 생성도 가능하다. 하나의 언어로 통일된 바이오패스웨이를 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. The language unification module 21 unifies bio pathways expressed in a heterogeneous language in various institutions in one language. The heterogeneous languages include KGML, SBML, BIOPAX, and PSI-MI. SBML is used to unify bio-pathways expressed in heterogeneous languages into one language, but it can be changed according to the user's intention or new language can be created. The unified biopathway in one language can be stored in the biopathway DB 26 for use in making future integrated biopathways.

분리모듈(22)은 바이오패스웨이를 노드 또는 관계로 분리한다. 노드의 예시로 단백질, 효소, 유전자 등이 있으며 관계는 노드와 노드 간의 매커니즘으로 예시로는 활성화, 발현, 전이 등이 있다. 구체적으로 바이오패스웨이를 노드-관계-노드 형태의 트리플형태로 변환하는 것이 바람직하지만 분리형태에서 관해서는 사용자의 의도에 따라 변경이 가능하며 트리플형태에 한정되지 않는다. 참고로 분리모듈은 바이오패스웨이로부터 분리되는 노드 또는 관계의 존재 여부 확인 등 전반적으로 바이오패스웨이로부터 노드 또는 관계를 분리하기 위한 필요한 정보를 얻기 위해 정보 DB(27)를 사용한다. 또한 분리된 바이오패스웨이를 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 분리된 형태로 바이오패스웨이 DB(26)에 저장할 수 있다. The separation module 22 separates the biopathway into nodes or relationships. Examples of nodes are proteins, enzymes, genes, etc. The relationship is a mechanism between nodes and nodes. Examples include activation, expression, and metastasis. Specifically, it is desirable to convert the bio-pathway into a triple-type node-relation-node type, but the separation type can be changed according to the user's intention and is not limited to the triple type. For reference, the separation module uses the information DB 27 to obtain necessary information for separating a node or a relation from the bio-pathway as a whole, such as checking whether a node or a relation is separated from the bio-pathway. In addition, the separated biopathway can be stored in the biopathway DB 26 in a separate form for use in making an integrated biopathway.

표준화모듈(23)은 하나의 언어로 통일된 바이오패스웨이로부터 분리된 노드 또는 관계가 실질적으로 동일한 기능을 지니더라도 다양한 용어로 표현될 수 있으므로 노드 또는 관계를 표준용어로 표준화한다. 참고로 의미가 동일하지만 다양한 용어로 표시된 노드란, 예를 들어 단백질의 한 종류인 ALDH1의 경우 Aldehyde dehydrogenase 1, Aldehyde dehydrogenase 1 family, member A1, ALHDII, ALDH-E1, Acetaldehyde dehydrogenase 1, Retinal dehydrogenase 1, RALDH 1, ALDC 등으로 다양하게 표현할 수 있다. 다른 표현으로 위와 같이 표현된 용어는 동일한 단백질을 나타내지만 사용자마다 다른 용어를 사용하는 경우가 많다. 참고로 표준화 모듈은 분리된 노드 또는 관계를 표준화하기 위하여 표준용어와 이와 의미가 동일하지만 표현이 다른 다양한 방언에 대한 매핑정보 등 분리된 노드 또는 관계를 표준화하기 위해 필요한 정보를 얻기 위해 정보DB(27)를 사용한다. 정보 DB의 예로 HPRD(Human Protein Reference Database)가 있지만 사용자의 의도에 따라 변경이 가능하므로 이에 한정하지 않는다. 또한 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 표준화된 노드 또는 관계의 형태로 바이오패스웨이를 바이오패스웨이 DB(26)에 저장할 수 있다. The standardization module 23 standardizes nodes or relationships into standard terms since the nodes or relationships separated from the unified biopathway in one language can be expressed in various terms even if they have substantially the same function. For example, in the case of ALDH1, which is a kind of protein, aldehyde dehydrogenase 1, Aldehyde dehydrogenase 1 family, member A1, ALHDII, ALDH-E1, Acetaldehyde dehydrogenase 1, Retinal dehydrogenase 1, RALDH 1, ALDC, and so on. In other words, the term represented by the above expression represents the same protein, but many users use different terms. For reference, the standardization module uses the information DB (27) to obtain information necessary for standardizing a separate node or relationship, such as mapping information for a dialect having the same meaning as the standard term but having different expressions, ) Is used. An example of the information DB is HPRD (Human Protein Reference Database), but it is not limited to this because it can be changed according to the user's intention. In addition, a bio-pathway can be stored in the biopathway DB 26 in the form of standardized nodes or relationships for use in making future integrated biopathways.

또한 표준화모듈(23)은 바이오패스웨이로부터 분리된 노드 또는 관계와 관련된 속성정보를 추출한다. 속성정보란 입력되는 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수가 포함되며 또한 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수를 포함한다. 하지만 속성정보의 종류는 사용자의 의도에 따라서 여러 가지가 가능하므로 여기에 언급된 것으로 한정되지는 않는다. 참고로 표준모듈은 속성정보를 추출하는데 있어서 전반적으로 필요한 정보를 얻기 위해 바이오패스웨이 DB(26)나 정보 DB(27)를 사용한다. 또한 추출된 속성정보는 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. In addition, the standardization module 23 extracts attribute information related to a node or relationship separated from the biopathway. The property information includes the frequency of each node of the bio-pathway, the number of links per node, and the frequency of each relationship, and includes the frequency of all the nodes of the stored bio-pathway, the number of links of all nodes, and the frequency of each relationship. However, the kind of attribution information can be variously changed according to the intention of the user, and therefore, the present invention is not limited to the above. For reference, the standard module uses the biopathway DB 26 or the information DB 27 to acquire information that is generally required in extracting the attribute information. In addition, the extracted attribute information can be stored in the biopathway DB 26 for use in making an integrated biopathway.

검색모듈(24)은 통합하고자 하는 바이오패스웨이를 검색한다. 구체적인 검색방법은 노드, 관계, 트리플(노드-관계-노드), 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 완전일치 또는 유사도를 기반으로 검색한다. 하지만 검색방법은 사용자의 의도에 따라 변경이 가능하므로 이에 한정하지 않는다. 참고로 검색방법을 다양하게 하기 위해 정보 DB(27)를 활용할 수 있다. 통합모듈(25)은 검색모듈을 통해 검색된 바이오패스웨이 또는 사용자가 임의로 지정한 바이오패스웨이(28)를 통합한다. 통합모듈은 바이오패스웨이들을 트리플(노드-관계-노드)를 기반으로 통합되지만 이에 한정하는 것은 아니며 사용자의 의도에 따라서 변경이 가능하다. 또한 통합된 바이오패스웨이와 통합된 바이오패스웨이의 노드 또는 관계와 관련된 속성정보는 향후 또 다른 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. The search module 24 searches for a bio pathway to be integrated. A specific search method searches based on exact match or similarity using nodes, relationships, triples (node-relation-node), part of a biopathway, and whole biopathway. However, the search method can be changed according to the intention of the user. For reference, the information DB 27 can be utilized to diversify the search method. The integration module 25 integrates the bio-pathway searched through the search module or the bio-pathway 28 arbitrarily designated by the user. The integration module integrates biopathways based on a triple (node-relationship-node) basis, but is not limited thereto and can be changed according to the user's intention. Also, the attribute information related to the node or relationship of the integrated pathway and the integrated pathway of the bio-pathway can be stored in the biopathway DB 26 for use in making another integrated pathway.

도 3은 본 발명의 일 실시예에 따른 바이오패스웨이 통합의 전체적인 과정을 나타낸 도면이다.FIG. 3 is a diagram illustrating an overall process of integrating a bio-pathway according to an embodiment of the present invention.

도 3를 참조하면, 본 발명에 따라 부호 30은 입력모듈(20)로 입력되는 바이오패스웨이를 의미하며 부호 31은 입력모듈로 입력되는 또 다른 하나의 바이오패스웨이를 의미한다. 부호 32 및 33은 입력된 바이오패스웨이들이 분리과정을 거쳐 노드-관계-노드, 일명 트리플형태로 분리된 것 중 공통된 트리플을 의미한다. 구체적으로 바이오패스웨이 통합 과정을 설명하면, 입력된 바이오패스웨이들(30,31)은 하나의 언어로 통일된 후 분리과정과 표준용어로 표준화과정을 거쳐 공통된 트리플을 기반으로 통합된다. 도 3에서 알 수 있듯이, 입력된 바이오 패스웨이들(30,31)의 공통된 트리플은 'B-D'(32,33)이며 입력된 바이오패스웨이들은 공통된 트리플인 'B-D'(34)를 기반으로 통합된다. Referring to FIG. 3, reference numeral 30 denotes a bio-pathway input to the input module 20, and reference numeral 31 denotes another bio-pathway input to the input module. Reference numerals 32 and 33 denote a common triple among those in which the inputted biopathways are separated into a node-relation-node, aka triple shape through a separation process. Specifically, the bio-pathway integration process will be described. The bio-pathways 30 and 31 are integrated into a single language, and are integrated based on a common triple through a separation process and a standardization process using standard terms. 3, the common triples of the input biopathways 30 and 31 are 'B-D' 32 and 33, and the inputted biopathways are 'B-D' 34, which is a common triple. .

도 4는 본 발명의 일 실시예에 따른 입력된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 4 is a view showing input bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention.

도 4를 참조하면, 본 발명에 따라 부호 40은 입력되는 바이오패스웨이며 부호 41은 분리모듈을 통해 바이오패스웨이(40)가 노드 또는 관계에 기반하여 트리플형태로 분리된 것을 나타낸다. 부호 42는 도 3에서 전술한 바와 같이 공통된 트리플을 나태낸다. 부호 43은 입력되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 44는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 45는 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 46은 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 입력되는 바이오패스웨이(40)의 노드 또는 관계와 관련된 속성정보를 살펴보면, 입력되는 바이오패스웨이(40)의 노드 A는 노드 B, C, D와 연결되어 링크수가 3개며 입력되는 바이오패스웨이 내에서 노드 A는 한 개만 존재하므로 빈도수는 1번이다. 입력되는 바이오패스웨이 내에서 트리플(관계)인 'B-D' 1개만 존재하므로 빈도수는 1번이다. Referring to FIG. 4, reference numeral 40 denotes an input bio-pathway, and reference numeral 41 denotes a bio-pathway 40 separated into triples based on a node or a relation through a separation module. Reference numeral 42 denotes a common triple as described above in Fig. Reference numeral 43 denotes the number of nodes and the number of links per node, which are attribute information extracted in association with nodes or relationships of the input bio-pathway, and reference numeral 44 denotes frequencies per relationship. The attribute information is stored in the bio-pathway DB and reflected in the attribute information related to the node or relation of the bio-pathway already stored in the bio-pathway DB. Therefore, reference numeral 45 denotes the frequency of all the nodes and the number of links of all the nodes, which are attribute information extracted in association with the nodes or relationships of the bio-pathway stored in the bio-pathway DB, and reference numeral 46 denotes frequencies of the entire relationships. The node A of the bio-pathway 40 is connected to the nodes B, C, and D so that the number of links is three, There is only one node A in the biopathway, so the frequency is one. Since there is only one triplet (relation) 'B-D' in the input bio-pathway, the frequency is 1.

도 5는 본 발명의 일 실시예에 따른 입력된 또 다른 하나의 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 5 is a diagram showing another inputted bio-pathway information and stored bio-pathway information according to an embodiment of the present invention.

도 5를 참조하면, 본 발명에 따라 부호 50은 입력되는 바이오패스웨이이며 부호 51은 분리모듈을 통해 바이오패스웨이(50)가 노드 또는 관계에 기반하여 트리플형태로 분리된 것을 나타낸다. 부호 52는 도 3에서 전술한 바와 같이 공통된 트리플을 나타낸다. 부호 53은 입력되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 54는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 55는 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 56은 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 입력되는 바이오패스웨이(50)의 노드 또는 관계와 관련된 속성정보를 살펴보면, 입력되는 바이오패스웨이(50)의 노드 B는 노드 D, E, F와 연결되어 링크수가 3개며 입력되는 바이오패스웨이 내에서 노드 B는 한 개만 존재하므로 빈도수는 1번이다. 입력되는 바이오패스웨이 내에서 트리플(관계)인 'B-D' 1 개만 존재하므로 빈도수는 1번이다. 또한 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 전체 속성정보를 살펴보면, 도 5에서는 또 다른 하나의 바이오패스웨이(50)가 추가로 입력되었기 때문에 도 5의 저장된 바이오패스웨이 전체 속성정보에서는 노드 B의 빈도수(55), 노드D의 빈도수(55), 트리플 'B-D' 빈도수(56)가 도 4의 저장된 바이오패스웨이 전체 속성정보와 비교하여 하나씩 증가했다. Referring to FIG. 5, reference numeral 50 denotes an input bio-pathway, and reference numeral 51 denotes a bio-pathway 50 separated into triples based on nodes or relationships through a separation module. Reference numeral 52 denotes a common triple as described above in Fig. Reference numeral 53 denotes the frequency of each node and the number of links per node, which are attribute information extracted in association with the node or relationship of the inputted bio-pathway, and reference numeral 54 denotes the frequency of each relation. The attribute information is stored in the bio-pathway DB and reflected in the attribute information related to the node or relation of the bio-pathway already stored in the bio-pathway DB. Therefore, reference numeral 55 denotes the frequency of each node and the number of links of all the nodes, which are attribute information extracted in association with the node or relationship of the bio-pathway stored in the bio-pathway DB, and 56 denotes the frequency of each relation. Specifically, the node B of the input bio-pathway 50 is connected to the nodes D, E, and F, and the number of links is three, There is only one node B in the biopathway, so the frequency is one. Since there is only one triplet (relation) 'B-D' in the input bio-pathway, the frequency is 1. 5, since another bio-pathway 50 is additionally input in FIG. 5, the stored entire bio-pathway property information of FIG. 5 indicates that the node < RTI ID = 0.0 > The frequency 55 of B, the frequency 55 of the node D and the frequency 56 of the triple BD are increased by one compared with the stored biopathway overall property information of FIG.

도 6은 본 발명의 일 실시예에 따른 통합된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 6 is a view showing integrated bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention.

도 6을 참조하면, 본 발명에 따라 부호 63은 통합된 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 65는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 67은 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 69는 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 통합된 바이오패스웨이의 노드 또는 관계와 관련된 속성정보를 살펴보면, 통합된 바이오패스웨이의 노드 B는 노드 A, D, E와 연결되어 링크수가 3개이다. 입력되는 바이오패스웨이 내에서 노드 D(62)는 도 4와 도 5에서 전술한 바와 같이 통합되기 전의 바이오패스웨이에서 각각 한 개씩 존재하였으므로 통합된 바이오패스웨이 내에서 빈도수는 2번이다. 또한 통합된 바이오패스웨이 내에서 트리플(관계)인 'B-D'(64)는 도 4와 도 5에서 전술한 바와 같이 통합되기 전의 바이오패스웨이에서 각각 한 개씩 존재하였으므로 통합된 바이오패스웨이 내에서 두 개가 존재하므로 빈도수는 2번이다. 또한 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 전체 속성정보를 살펴보면, 도 6에서 노드 D의 빈도수(66)가 다른 노드에 비해 현저히 낮다. 이는 곧 특정 바이오패스웨이에서만 집중적으로 나타나는 것을 의미하며 모든 바이오패스웨이에 비해 중요도가 높은 핵심정보라고 할 수 있다. 따라서 중요성을 나타내기 위해 노드 D를 다른 노드에 비해 확대(61)하여 표현한다. 또한 트리플 'B-D'(68)의 경우 다른 트리플 즉 다른 관계정보에 비해 빈도수가 현저히 낮음을 확인할 수 있다. 이는 곧 특정 바이오패스웨이에서만 집중적으로 나타나는 것을 의미하며 모든 바이오패스웨이에 비해 중요도가 높은 주요 매커니즘 즉, 핵심정보라고 할 수 있다. 따라서 중요성을 나타내기 위해 트리플 'B-D' 다른 트리플에 비해 굵게 표시(60)한다. 표현방식은 사용자의 의도에 따라 변경이 가능G함으로 이에 한정하지 않는다. Referring to FIG. 6, reference numeral 63 denotes the number of links per node and the number of links per node, which are attribute information extracted in association with nodes or relationships of the integrated bio-pathway, and reference numeral 65 denotes frequency numbers per relationship. The attribute information is stored in the bio-pathway DB and reflected in the attribute information related to the node or relation of the bio-pathway already stored in the bio-pathway DB. Therefore, reference numeral 67 denotes the frequency of each node and the number of links of all the nodes, which are attribute information extracted in association with the node or relationship of the bio-pathway stored in the bio-pathway DB, and reference numeral 69 denotes the frequency of each relation. Specifically, referring to the attribute information related to the node or the relationship of the integrated bio-pathway, the node B of the integrated bio-pathway is connected to the nodes A, D, and E, and the number of links is three. Since the node D (62) exists in the bio-pathway before being integrated as described above with reference to FIGS. 4 and 5, the number of frequencies is two in the integrated bio-pathway. In addition, since 'B-D' 64, which is a triple (relationship) in the integrated bio-pathway, exists in each of the bio-pathways before integration as described above with reference to FIGS. 4 and 5, The frequency is two. In addition, referring to the entire attribute information related to the node or relation of the stored bio-pathway, the frequency 66 of the node D in FIG. 6 is significantly lower than that of the other nodes. This means that it is concentrated only on a specific biopathway, and is more important than all biopathways. Therefore, in order to show the importance, the node D is enlarged (61) compared with other nodes. In the case of the triple 'B-D' (68), it can be confirmed that the frequency is significantly lower than other triples, that is, other relation information. This means that it is concentrated only on a specific biopathway, and is a key mechanism that is more important than all biopathways, that is, key information. Therefore, triple 'B-D' is shown in bold (60) to indicate its importance. The expression system can be changed according to the intention of the user.

도 7은 본 발명의 일 실시예에 따른 알츠하이머 병의 바이오패스웨이를 나타낸 도면이다.7 is a view illustrating a bio-pathway of Alzheimer's disease according to an embodiment of the present invention.

도 7을 참조하면, 본 발명에 따라 부호 70은 바이오패스웨이 내에서 사각형으로 표현된 노드를 의미하며 부호 71은 바이오패스웨이 내에서 화살표로 표현된 관계를 의미한다. Referring to FIG. 7, reference numeral 70 denotes a node represented by a quadrangle in the bio-pathway, and reference numeral 71 denotes a relationship represented by an arrow in the bio-pathway.

도 8은 본 발명의 일 실시예에 따른 KGML언어로 표현된 바이오패스웨이를 나타낸 도면이다.FIG. 8 is a diagram illustrating a bio-pathway expressed in the KGML language according to an embodiment of the present invention.

도 8을 참조하면, 본 발명에 따라 도 8은 도 7의 일부분을 확대하여 앞에서 전술한 KGML언어로 바이오패스웨이를 표현한 것이다. 부호 80은 'FADD->CASP80' 트리플을 나타내며 이는 XML로 텍스트 표현(81)이 가능하다. 구체적으로 설명하면, <graphics name>의 뒤에 나오는 내용이 노드명(CAPS8,82)을 의미하고 CAPS8, CASP-8 등 동일한 용어이지만 다른 형태의 용어들이 쉼표(,)로 분리되어 나올 수 있다. 이 노드명들은 정보 DB를 이용하여 표준화되고, 정보 DB(27) 확장에도 사용될 수 있다.Referring to FIG. 8, according to the present invention, FIG. 8 is an enlarged view of a portion of FIG. 7 to express the bio-pathway in the KGML language described above. The reference numeral 80 represents the 'FADD-> CASP80' triple, which can be represented by text (81) in XML. Specifically, the content after <graphics name> refers to node names (CAPS8 and 82), and the same terms such as CAPS8 and CASP-8, but other types of terms may be separated by a comma (,). These node names are standardized using the information DB and can also be used to expand the information DB 27.

또한 <relation>의 뒤에 나오는 내용은 관계정보(PPRel, 83)를 의미한다. 예를 들어 PPRel은 Protein Protein Relation의 약어로 단백질-단백질 관계를 의미하며, PCRel은 Protein Compound Relation의 약어로 단백질-복합물 관계를 의미한다. In addition, the content following the <relation> means relation information (PPRel, 83). For example, PPRel stands for Protein Protein Relation, which means protein-protein relationship, and PCRel stands for Protein Compound Relation, which means protein-complex relationship.

도 9는 본 발명의 일 실시예에 따른 바이오패스웨이 통합 방법을 설명하기 위한 흐름도이다.9 is a flowchart illustrating a bio-pathway integration method according to an embodiment of the present invention.

도 9를 참조하면, 본 발명에 따라 바이오패스웨이 통합 방법은 바이오패스웨이 입력을 받는 단계(S90), 바이오패스웨이를 제1언어로 변환하는 단계(S91), 바이오패스웨이를 분리하는 단계(S92), 바이오패스웨이의 노드 또는 관계를 표준용어로 표준화하고 노드 또는 관계 형태로 바이오패스웨이를 저장하고, 노드 또는 관계와 관련된 속성정보를 추출하는 단계(S93), 바이오패스웨이를 검색하는 단계(S94), 복수의 바이오패스웨이들을 통합하는 단계(S95)를 포함한다.  Referring to FIG. 9, the method of integrating a bio-pathway according to the present invention includes a step of receiving a bio-pathway input (S90), a step of converting a bio-pathway into a first language (S91) S92), standardizing the node or relationship of the bio-pathway with standard terms, storing the bio-pathway in the form of a node or relationship, extracting attribute information related to the node or relationship (S93), searching the bio- (S94), and integrating a plurality of biopathways (S95).

입력 모듈(20)은 바이오패스웨이 입력을 받는 단계(S90)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The input module 20 can be converted into a step S90 of receiving a bio-pathway input, and a detailed description thereof has been given above with reference to FIG.

언어통일모듈(21)은 바이오패스웨이를 제1언어로 변환하는 단계(S91)로 변환될 수 있고 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The language unification module 21 can be converted into a step S91 of converting the bio-pathway into a first language, and a detailed description thereof has been given above with reference to FIG.

분리모듈(22)은 바이오패스웨이를 분리하는 단계(S92)로 변환 될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한바 있다. The separation module 22 can be converted into a step S92 of separating the bio-pathway, and a detailed description thereof has been given above with reference to FIGS. 2, 3, 4, 5 and 6. FIG.

표준화모듈(23)은 바이오패스웨이의 노드 또는 관계를 표준용어로 표준화하고 노드 또는 관계 형태로 바이오패스웨이를 저장하고, 노드 또는 관계와 관련된 속성정보를 추출하는 단계(S93)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한 바 있다. The standardization module 23 can be converted to standardize the node or relationship of the bio-pathway in standard terms, store the bio-pathway in the form of nodes or relationships, and extract the attribute information related to the node or relationship (S93) A detailed description thereof has been given above with reference to Figs. 2, 3, 4, 5 and 6.

검색모듈(24)은 바이오패스웨이를 검색하는 단계(S94)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The search module 24 can be converted into a step S94 of searching for a biopathway, and a detailed description thereof has been given above with reference to FIG.

통합모듈(25)은 복수의 바이오패스웨이들을 통합하는 단계(S95)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한바 있다. The integration module 25 can be converted into a step S95 of integrating a plurality of biopathways, and detailed description thereof has been given above with reference to FIGS. 2, 3, 4, 5 and 6.

본 발명의 명세서에 개시된 실시예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다. The embodiments disclosed in the specification of the present invention do not limit the present invention. The scope of the present invention should be construed according to the following claims, and all the techniques within the scope of equivalents should be construed as being included in the scope of the present invention.

20 : 입력모듈
21 : 언어통일모듈
22 : 분리모듈
23 : 표준화모듈
24 : 검색모듈
25 : 통합모듈
26 : 바이오패스웨이 DB
27 : 정보 DB
20: input module
21: Language Unification Module
22: Separation module
23: Standardization module
24: Search module
25: Integration module
26: Biopathway DB
27: Information DB

Claims (20)

적어도 하나 이상의 바이오패스웨이 입력을 받는 입력모듈;
상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 언어통일모듈;
상기 제1언어로 변환된 바이오패스웨이를 분리하는 분리모듈,
상기 분리모듈은 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고;
상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 표준화모듈; 및
복수의 상기 저장된 바이오패스웨이들을 통합하는 통합모듈을 포함하는 바이오패스웨이 통합장치.
An input module for receiving at least one bio-pathway input;
A language unification module for converting the at least one biopathway into a first language;
A separation module for separating the bio-pathways converted into the first language,
Wherein the separation module comprises separating the biopathways converted into the first language into nodes or relationships;
A standardization module for standardizing the node or relation in standard terms, storing a bio-pathway converted into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And
And an integration module for integrating a plurality of the stored bio-pathways.
제 1항에 있어서, 상기 바이오패스웨이 통합장치는,
노드, 관계, 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 상기 저장된 바이오패스웨이를 검색하는 검색모듈을 더 포함하는 바이오패스웨이 통합장치.
The bio-pathway integrated device according to claim 1,
Further comprising a retrieval module for retrieving the stored biopathway by using the whole of the biopathway, a node, a relation, a part of the biopathway, and a whole of the biopathway.
제 1항에 있어서, 상기 적어도 하나 이상의 바이오패스웨이는,
이질적인 언어로 구축된 네트워크 형태로 표현되는 것을 포함하는 바이오패스웨이 통합장치.
The method of claim 1, wherein the at least one bio-
Wherein the network is expressed in a network constructed in a heterogeneous language.
제 1항에 있어서, 상기 언어통일모듈은,
상기 변환된 바이오패스웨이를 저장하는 것을 포함하는 바이오패스웨이 통합장치.
The method of claim 1, wherein the language unification module comprises:
And storing the converted bio-pathway.
제 1항에 있어서, 상기 분리된 바이오패스웨이는,
노드-관계-노드 형태로 분리하는 것을 포함하는 바이오패스웨이 통합장치.
[2] The method of claim 1,
Node-relationship-node. &Lt; / RTI &gt;
제 1항에 있어서, 상기 표준화모듈은,
노드-관계-노드와 같이 트리플 형태로 저장하는 것을 포함하는 바이오패스웨이 통합장치.
2. The method of claim 1,
Node-relationship-node in a triple form.
제 1항에 있어서, 상기 추출된 속성정보는,
상기 입력된 적어도 하나 이상의 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수, 상기 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수 및 이에 기반한 가중치 정보를 포함하는 바이오패스웨이 통합장치.
The method according to claim 1,
The number of links of each of the nodes, the number of links of each node, the frequency of each relation, the frequency of all the nodes of the stored bio pathway, the number of links of all the nodes, the frequency of each relation, A biopathway integrated device comprising:
제 1항에 있어서, 상기 통합모듈은,
사용자 지정에 의해 또는 검색에 의해 선택된 복수의 바이오패스웨이를 통합하는 것을 포함하는 바이오패스웨이 통합장치.
The information processing apparatus according to claim 1,
And integrating a plurality of biopathways selected by user selection or by searching.
제 1항에 있어서, 상기 통합모듈은,
상기 통합된 바이오패스웨이를 저장하는 것을 포함하는 바이오패스웨이 통합장치.
The information processing apparatus according to claim 1,
And storing the integrated bio-pathway.
제 1항에 있어서, 상기 통합모듈은,
바이오패스웨이가 관계정보를 기반으로 통합되는 것을 포함하는 바이오패스웨이 통합장치.
The information processing apparatus according to claim 1,
And integrating the bio-pathway based on the relationship information.
제 1항에 있어서, 상기 바이오패스웨이 통합장치는,
바이오패스웨이 DB와 정보 DB를 더 포함하는 바이오패스웨이 통합장치.
The bio-pathway integrated device according to claim 1,
A biopathway integration device further comprising a biopathway DB and an information database.
적어도 하나 이상의 바이오패스웨이 입력을 받는 단계;
상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 단계;
상기 제1언어로 변환된 바이오패스웨이를 분리하는 단계,
상기 분리하는 단계는 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고;
상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 단계; 및
복수의 상기 저장된 바이오패스웨이들을 통합하는 단계를 포함하는 바이오패스웨이 통합방법.
Receiving at least one biopathway input;
Converting the at least one bio-pathway into a first language;
Separating the bio-pathways converted into the first language,
Wherein the separating comprises separating the biopathic path translated into the first language into nodes or relationships;
Standardizing the node or relationship in standard terms, storing the biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And
And integrating a plurality of the stored biopathways.
제 12항에 있어서, 상기 바이오패스웨이 통합방법은,
노드, 관계, 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 상기 저장된 바이오패스웨이를 검색하는 검색하는 단계를 더 포함하는 바이오패스웨이 통합방법.
13. The bio-pathway integration method according to claim 12,
Further comprising the step of searching for the stored biopathway using the entire node, the relationship, a part of the biopathway, and the entire biopathway.
제 12항에 있어서, 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 단계는,
상기 변환된 바이오패스웨이를 저장하는 단계를 더 포함하는 바이오패스웨이 통합방법.
The method of claim 12, wherein the converting the at least one biopathway into a first language comprises:
Further comprising the step of storing the converted biopathway.
제 12항에 있어서, 상기 제1언어로 변환된 바이오패스웨이를 분리하는 단계는,
상기 제1언어로 변환된 바이오패스웨이를 노드-관계-노드 형태로 분리하는 것을 포함하는 바이오패스웨이 통합방법.
13. The method of claim 12, wherein separating the biopathways converted into the first language comprises:
And separating the bio-pathway converted into the first language into a node-relationship-node form.
제 12항에 있어서, 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 단계는,
상기 표준화된 바이오패스웨이를 노드-관계-노드와 같이 트리플형태로 저장하는 단계를 더 포함하는 바이오패스웨이 통합방법.
13. The method of claim 12, wherein standardizing the node or relationship to standard terms and storing a biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information associated with the node or relationship ,
Further comprising the step of storing the standardized bio-pathway in a triple form such as a node-relationship-node.
제 12항에 있어서, 상기 추출된 속성정보는,
상기 입력된 적어도 하나 이상의 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수, 상기 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수 및 이에 기반한 가중치 정보를 포함하는 바이오패스웨이 통합방법.
13. The method according to claim 12,
The number of links of each of the nodes, the number of links of each node, the frequency of each relation, the frequency of all the nodes of the stored bio pathway, the number of links of all the nodes, the frequency of each relation, A method for integrating a bio-pathway.
제 12항에 있어서, 상기 복수의 상기 저장된 바이오패스웨이를 통합하는 단계는,
사용자 지정에 의해 또는 검색에 의해 선택된 복수의 바이오패스웨이를 통합하는 것을 포함하는 바이오패스웨이 통합방법.
13. The method of claim 12, wherein integrating the plurality of stored bio-
Integrating a plurality of biopathways selected by user selection or by searching.
제 12항에 있어서, 상기 복수의 상기 저장된 바이오패스웨이를 통합하는 단계는,
바이오패스웨이가 관계정보를 기반으로 통합되는 것을 포함하는 바이오패스웨이 통합방법.
13. The method of claim 12, wherein integrating the plurality of stored bio-
A biopathway integration method comprising integrating a bio-pathway based on relationship information.
적어도 하나 이상의 바이오패스웨이 입력을 받고, 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하고, 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하고, 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하고, 복수의 상기 저장된 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체.The method comprising the steps of: receiving at least one bio-pathway input, converting the at least one bio-pathway into a first language, separating the bi-pathway translated into the first language into nodes or relationships, , Storing a biopathway converted into the first language in the form of the node or relationship, extracting attribute information related to the node or relationship, and integrating a plurality of the stored biopathways Storage medium.
KR20140141721A 2014-10-20 2014-10-20 method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways KR101488338B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20140141721A KR101488338B1 (en) 2014-10-20 2014-10-20 method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20140141721A KR101488338B1 (en) 2014-10-20 2014-10-20 method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways

Publications (1)

Publication Number Publication Date
KR101488338B1 true KR101488338B1 (en) 2015-01-30

Family

ID=52593162

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20140141721A KR101488338B1 (en) 2014-10-20 2014-10-20 method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways

Country Status (1)

Country Link
KR (1) KR101488338B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017065351A1 (en) * 2015-10-13 2017-04-20 한국과학기술원 System and method for predicting new efficacy of natural product material and ingredients
KR101792332B1 (en) * 2015-07-14 2017-11-20 연세대학교 산학협력단 Method and Device for Providing Multi Path Relation Information between Entities
KR101861180B1 (en) 2017-10-19 2018-05-28 한국과학기술정보연구원 apparatus for expanding bio pathway and method for expanding bio pathway

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167882A (en) 2001-11-30 2003-06-13 Celestar Lexico-Sciences Inc Pathway information display device, pathway information display method, program and recording medium
KR101243063B1 (en) 2012-08-03 2013-03-13 한국과학기술정보연구원 System and method for pathway construction
KR20140016784A (en) * 2012-08-03 2014-02-10 한국과학기술정보연구원 System and method for expanding pathway

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167882A (en) 2001-11-30 2003-06-13 Celestar Lexico-Sciences Inc Pathway information display device, pathway information display method, program and recording medium
KR101243063B1 (en) 2012-08-03 2013-03-13 한국과학기술정보연구원 System and method for pathway construction
KR20140016784A (en) * 2012-08-03 2014-02-10 한국과학기술정보연구원 System and method for expanding pathway

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
바이오패스웨이를 위한 지식 표현 시스템(정보과학회논문지:소프트웨어및응용제31권제3호,(2004.03)) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101792332B1 (en) * 2015-07-14 2017-11-20 연세대학교 산학협력단 Method and Device for Providing Multi Path Relation Information between Entities
WO2017065351A1 (en) * 2015-10-13 2017-04-20 한국과학기술원 System and method for predicting new efficacy of natural product material and ingredients
KR101861180B1 (en) 2017-10-19 2018-05-28 한국과학기술정보연구원 apparatus for expanding bio pathway and method for expanding bio pathway

Similar Documents

Publication Publication Date Title
Krauthammer et al. Term identification in the biomedical literature
US20080162541A1 (en) Visualization Technique for Biological Information
JP2012094141A (en) Genetic information management system and genetic information management method
CN109086573B (en) Multi-source biological big data fusion system
KR101488338B1 (en) method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways
US20130262091A1 (en) Automated extraction of bio-entity relationships from literature
US8745071B2 (en) Delta language translation
TWI735380B (en) Natural language processing method and computing apparatus thereof
Wang et al. A heterogeneous network-based method with attentive meta-path extraction for predicting drug–target interactions
US8078611B2 (en) Query modes for translation-enabled XML documents
EP3404568B1 (en) A system and a method for discovery of predicted site-specific protein phosphorylation candidates
Biryukov et al. Biokb-text mining and semantic technologies for biomedical content discovery
JP2005122231A (en) Screen display system and screen display method
US20050033569A1 (en) Methods and systems for automatically identifying gene/protein terms in medline abstracts
JP2014048741A (en) Data search program, database device, and information processing system
KR101448731B1 (en) A method for retrieving a gene-disease-chemical relationship using multi-dimensional indexes from huge bio-literatures
KR101374195B1 (en) Method for providing deep domain knowledge based on massive science information and apparatus thereof
KR101243063B1 (en) System and method for pathway construction
WO2019228833A1 (en) System and method for allele interpretation using a graph-based reference genome
US20060136147A1 (en) Biological relationship event extraction system and method for processing biological information
KR20170058879A (en) apparatus for expanding bio pathway and method for expanding bio pathway
KR101861180B1 (en) apparatus for expanding bio pathway and method for expanding bio pathway
Belhajjame et al. Proteome data integration: Characteristics and challenges
KR20140016784A (en) System and method for expanding pathway
Ristevski Using Graph Databases for Querying and Network Analysing

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190114

Year of fee payment: 5