KR101488338B1 - method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways - Google Patents
method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways Download PDFInfo
- Publication number
- KR101488338B1 KR101488338B1 KR20140141721A KR20140141721A KR101488338B1 KR 101488338 B1 KR101488338 B1 KR 101488338B1 KR 20140141721 A KR20140141721 A KR 20140141721A KR 20140141721 A KR20140141721 A KR 20140141721A KR 101488338 B1 KR101488338 B1 KR 101488338B1
- Authority
- KR
- South Korea
- Prior art keywords
- bio
- pathway
- node
- biopathway
- language
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Abstract
Description
본 발명은 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체에 관한 것이다. The present invention relates to an apparatus for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths.
바이오 인포매틱스는 생명공학(Bio)과 정보공학(Informatics)의 합성어로 컴퓨터와 소프트웨어를 활용해 유전자의 염기서열 데이터를 수집, 분석, 관리 및 활용하는 것으로 생물정보학이라고도 한다. 최근 인간 게놈 프로젝트 완성으로 유전 정보량이 증가하면서 관리할 데이터 양도 늘어나 생물정보학의 중요성이 높아졌다. 이와 같이 생물정보학의 발전과 함께 생물 관련 정보들이 기하급수적으로 증가하고 있으며 연구 대상도 DNA, RNA, 단백질에서 더 나아가 이들의 상호작용 및 조절 메커니즘에 의해 기능들이 어떻게 수행되는 지에 관한 바이오패스웨이까지 포함하게 되었다. 바이오패스웨이는 광대한 양의 정보를 포괄하며 구성체 사이의 유기적 관계를 나타내고 있는 것이다. 생물학 분야에서 양질의 바이오패스웨이 데이터베이스는 다양한 생물체의 생명 활동 메커니즘 이해, 질병의 발병, 진행, 자연소멸 및 치유에 관한 실체적 원인규명 등에 활용될 수 있다. 생명공학 분야에서의 효율적인 연구개발과 더불어 지식서비스 관점에서의 실질적인 장점이 있지만, 다양한 바이오패스웨이 관련 기관에서 다양한 바이오패스웨이 기술 언어(KGML, SBML, BIOPAX 등)를 사용하여 개별적 독립적으로 구축하기 때문에 현재 바이오패스웨이 데이터베이스 구축, 연계, 활용 측면에서 많은 문제점과 한계점이 존재한다. 또한 현재 대부분의 바이오패스웨이 데이터베이스는 수작업으로 구축되므로 막대한 구축 비용이 필요하고 기술 발전에 맞춘 신속한 데이터베이스 확장 및 변경이 불가능하다. Bioinformatics is a combination of biotechnology (bio) and information engineering (informatics). It uses computers and software to collect, analyze, manage and utilize gene sequence data. It is also called bioinformatics. Recently, with the completion of the human genome project, the amount of data to be managed has increased as the amount of genetic information has increased, and the importance of bioinformatics has increased. With the development of bioinformatics, bio-related information is growing exponentially, and research subjects include DNA pathways for how functions are performed by DNA, RNA, proteins, and their interaction and control mechanisms. . The bio-pathway encompasses vast amounts of information and represents an organic relationship between constituents. In the field of biology, high quality biopathway databases can be used to understand the mechanisms of life activity of various organisms, to identify the causes of disease, progress, natural extinction and physical causes of healing. In addition to efficient research and development in the field of biotechnology, there are substantial advantages in terms of knowledge services. However, various biopathway-related institutes independently construct various biopathway language (KGML, SBML, BIOPAX, etc.) There are many problems and limitations in terms of building, linking and utilizing bio-pathway database. Also, since most of the bio-pathway databases are built by hand, they require enormous construction costs and can not be expanded or changed quickly in accordance with technological development.
본 발명은 상기한 바와 같은 문제점을 해결하기 위한 것으로서 이질적인 언어로 표현된 바이오패스웨이를 효과적으로 통합하기 위한 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공하는 데 그 목적이 있다. SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and it is an object of the present invention to provide a device for integrating a biopathway to effectively integrate a biopathway expressed in a heterogeneous language, a method thereof, and a storage medium storing a program for integrating biopathways The purpose is to provide.
이와 같은 목적을 달성하기 위한, 본 발명의 제 1 측면에 따르면, 본 발명에 따른 바이오패스웨이 통합 장치는, 적어도 하나 이상의 바이오패스웨이 입력을 받는 입력모듈; 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 언어통일모듈; 상기 제1언어로 변환된 바이오패스웨이를 분리하는 분리모듈, 상기 분리모듈은 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고; 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 표준화모듈; 및 복수의 상기 저장된 바이오패스웨이를 통합하는 통합모듈을 포함하는 패스웨이 통합 장치를 포함한다.In order to achieve the above object, according to a first aspect of the present invention, there is provided a bio-pathway integrating apparatus comprising: an input module receiving at least one bio-pathway input; A language unification module for converting the at least one biopathway into a first language; A separation module for separating the biopathways converted into the first language, and the separation module separating the biopathways converted into the first language into nodes or relations; A standardization module for standardizing the node or relation in standard terms, storing a bio-pathway converted into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And an integration module for integrating a plurality of the stored bio-pathways.
본 발명의 제 2 측면에 따르면, 적어도 하나 이상의 바이오패스웨이 입력을 받는 단계; 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 단계; 상기 제1언어로 변환된 바이오패스웨이를 분리하는 단계, 상기 분리하는 단계는 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고; 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 단계; 및 복수의 상기 저장된 바이오패스웨이를 통합하는 단계를 포함하는 패스웨이 통합 방법을 포함한다. According to a second aspect of the present invention, there is provided a method of generating a bio-pathway, comprising: receiving at least one bio-pathway input; Converting the at least one bio-pathway into a first language; Separating the biopathways converted into the first language, and separating comprises separating the biopathways converted into the first language into nodes or relationships; Standardizing the node or relationship in standard terms, storing the biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And integrating a plurality of the stored bio-pathways.
또한 본 발명의 제 3 측면에 따르면, 적어도 하나 이상의 바이오패스웨이 입력을 받고, 상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하고, 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하고, 상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하고, 복수의 상기 저장된 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 포함한다. According to a third aspect of the present invention, there is provided a bio-pathway management method comprising: receiving at least one bio-pathway input, converting the at least one bio-pathway into a first language, Extracting attribute information related to the node or relationship, storing a plurality of the stored nodes or relationships in a standard language, storing a biopathway converted into the first language in the form of the node or relationship, And a storage medium storing a program for integrating the biopathways.
이상에서 설명한 바와 같이 본 발명에 의하면 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 저비용으로 바이오패스웨이 데이터베이스를 효율적으로 구축할 수 있다. As described above, according to the present invention, it is possible to efficiently construct a bio-pathway database at a low cost by providing a device for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths.
바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 통합된 패스웨이를 통해 심층 지식 추출을 통한 신규 발병 기전 추출이 가능하다. A device for biopathway integration, a method thereof, and a storage medium for storing a program for integrating biopathways are provided, whereby a new pathogenic mechanism can be extracted through deep knowledge extraction through an integrated pathway.
또한 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 제공함으로써 기술 발전에 맞춰 신속한 데이터베이스 확장 및 변경이 가능하다. Also, by providing a storage medium storing a device for integrating a bio pathway, a method thereof, and a program for integrating a biopathway, rapid expansion and modification of the database can be performed in accordance with technological development.
도 1은 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 설명하기 위한 개략적인 흐름도,
도 2는 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치를 설명하기 위한 모듈 구성도,
도 3은 본 발명의 일 실시예에 따른 바이오패스웨이 통합의 전체적인 과정을 나타낸 도면,
도 4는 본 발명의 일 실시예에 따른 입력된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 5는 본 발명의 일 실시예에 따른 입력된 또 다른 하나의 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 6은 본 발명의 일 실시예에 따른 통합된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면,
도 7은 본 발명의 일 실시예에 따른 알츠하이머 병의 바이오패스웨이를 나타낸 도면,
도 8은 본 발명의 일 실시예에 따른 KGML언어로 표현된 바이오패스웨이를 나타낸 도면,
도 9는 본 발명의 일 실시예에 따른 바이오패스웨이 통합 방법을 설명하기 위한 흐름도이다.BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a schematic flow diagram illustrating an apparatus for integrating a bio-pathway, a method thereof, and a storage medium storing a program for integrating bio-paths according to an embodiment of the present invention;
FIG. 2 is a block diagram illustrating a device for integrating a bio-pathway according to an embodiment of the present invention. FIG.
3 is a diagram illustrating an overall process of integrating a bio-pathway according to an embodiment of the present invention;
FIG. 4 is a diagram illustrating input bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 5 is a view showing another inputted bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 6 is a view showing integrated bio-pathway information and stored bio-pathway information according to an embodiment of the present invention; FIG.
FIG. 7 is a diagram illustrating a bio-pathway of Alzheimer's disease according to an embodiment of the present invention;
FIG. 8 is a diagram illustrating a bio-pathway expressed in the KGML language according to an embodiment of the present invention;
9 is a flowchart illustrating a bio-pathway integration method according to an embodiment of the present invention.
본 발명의 일 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. One embodiment of the present invention will be described in detail with reference to the accompanying drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.
도 1은 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치, 그 방법 및 바이오패스웨이들을 통합하는 프로그램을 저장하는 저장매체를 설명하기 위한 개략적인 흐름도이다. FIG. 1 is a schematic flowchart for explaining an apparatus for integrating a bio-pathway, a method thereof, and a storage medium for storing a program for integrating bio-paths according to an embodiment of the present invention.
도 1을 참조하면, 본 발명에 따른 바이오패스웨이 통합은 바이오패스웨이 입력(10), 하나의 언어로 통일하기 위한 언어통일부(11), 하나의 언어로 통일된 바이오패스웨이를 노드 또는 관계로 분리하여 표준용어로 표준화하여 저장하는 저장부(12), 통합을 위해 원하는 바이오패스웨이를 검색하는 검색부(13), 복수의 바이오패스웨이들을 통합하는 통합생성부(14)를 통해 진행된다. Referring to FIG. 1, the bio-pathway integration according to the present invention includes a
도 2는 본 발명의 일 실시예에 따른 바이오패스웨이 통합을 위한 장치를 설명하기 위한 모듈 구성도이다.2 is a block diagram illustrating an apparatus for integrating a bio-pathway according to an embodiment of the present invention.
도 2를 참조하면, 본 발명에 따른 바이오패스웨이 통합을 위한 장치는 입력모듈(20), 언어통일모듈(21), 분리모듈(22), 표준화모듈(23), 검색모듈(24), 및 통합모듈(25)을 포함한다. 입력모듈은(20)은 통합하기 원하는 바이오패스웨이 입력을 받는다. 2, an apparatus for integrating a bio-pathway according to the present invention includes an
언어통일모듈(21)은 다양한 기관에서 이질적인 언어로 표현된 바이오패스웨이를 하나의 언어로 통일한다. 이질적인 언어에는 KGML, SBML, BIOPAX, PSI-MI가 있다. 이질적인 언어로 표현된 바이오패스웨이를 하나의 언어로 통일시키기 위해서 SBML을 사용하지만 이는 사용자의 의도에 따라 변경하거나 새로운 언어 생성도 가능하다. 하나의 언어로 통일된 바이오패스웨이를 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. The
분리모듈(22)은 바이오패스웨이를 노드 또는 관계로 분리한다. 노드의 예시로 단백질, 효소, 유전자 등이 있으며 관계는 노드와 노드 간의 매커니즘으로 예시로는 활성화, 발현, 전이 등이 있다. 구체적으로 바이오패스웨이를 노드-관계-노드 형태의 트리플형태로 변환하는 것이 바람직하지만 분리형태에서 관해서는 사용자의 의도에 따라 변경이 가능하며 트리플형태에 한정되지 않는다. 참고로 분리모듈은 바이오패스웨이로부터 분리되는 노드 또는 관계의 존재 여부 확인 등 전반적으로 바이오패스웨이로부터 노드 또는 관계를 분리하기 위한 필요한 정보를 얻기 위해 정보 DB(27)를 사용한다. 또한 분리된 바이오패스웨이를 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 분리된 형태로 바이오패스웨이 DB(26)에 저장할 수 있다. The
표준화모듈(23)은 하나의 언어로 통일된 바이오패스웨이로부터 분리된 노드 또는 관계가 실질적으로 동일한 기능을 지니더라도 다양한 용어로 표현될 수 있으므로 노드 또는 관계를 표준용어로 표준화한다. 참고로 의미가 동일하지만 다양한 용어로 표시된 노드란, 예를 들어 단백질의 한 종류인 ALDH1의 경우 Aldehyde dehydrogenase 1, Aldehyde dehydrogenase 1 family, member A1, ALHDII, ALDH-E1, Acetaldehyde dehydrogenase 1, Retinal dehydrogenase 1, RALDH 1, ALDC 등으로 다양하게 표현할 수 있다. 다른 표현으로 위와 같이 표현된 용어는 동일한 단백질을 나타내지만 사용자마다 다른 용어를 사용하는 경우가 많다. 참고로 표준화 모듈은 분리된 노드 또는 관계를 표준화하기 위하여 표준용어와 이와 의미가 동일하지만 표현이 다른 다양한 방언에 대한 매핑정보 등 분리된 노드 또는 관계를 표준화하기 위해 필요한 정보를 얻기 위해 정보DB(27)를 사용한다. 정보 DB의 예로 HPRD(Human Protein Reference Database)가 있지만 사용자의 의도에 따라 변경이 가능하므로 이에 한정하지 않는다. 또한 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 표준화된 노드 또는 관계의 형태로 바이오패스웨이를 바이오패스웨이 DB(26)에 저장할 수 있다. The
또한 표준화모듈(23)은 바이오패스웨이로부터 분리된 노드 또는 관계와 관련된 속성정보를 추출한다. 속성정보란 입력되는 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수가 포함되며 또한 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수를 포함한다. 하지만 속성정보의 종류는 사용자의 의도에 따라서 여러 가지가 가능하므로 여기에 언급된 것으로 한정되지는 않는다. 참고로 표준모듈은 속성정보를 추출하는데 있어서 전반적으로 필요한 정보를 얻기 위해 바이오패스웨이 DB(26)나 정보 DB(27)를 사용한다. 또한 추출된 속성정보는 향후 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. In addition, the
검색모듈(24)은 통합하고자 하는 바이오패스웨이를 검색한다. 구체적인 검색방법은 노드, 관계, 트리플(노드-관계-노드), 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 완전일치 또는 유사도를 기반으로 검색한다. 하지만 검색방법은 사용자의 의도에 따라 변경이 가능하므로 이에 한정하지 않는다. 참고로 검색방법을 다양하게 하기 위해 정보 DB(27)를 활용할 수 있다. 통합모듈(25)은 검색모듈을 통해 검색된 바이오패스웨이 또는 사용자가 임의로 지정한 바이오패스웨이(28)를 통합한다. 통합모듈은 바이오패스웨이들을 트리플(노드-관계-노드)를 기반으로 통합되지만 이에 한정하는 것은 아니며 사용자의 의도에 따라서 변경이 가능하다. 또한 통합된 바이오패스웨이와 통합된 바이오패스웨이의 노드 또는 관계와 관련된 속성정보는 향후 또 다른 통합 바이오패스웨이를 만드는데 사용하기 위해 바이오패스웨이 DB(26)에 저장할 수 있다. The
도 3은 본 발명의 일 실시예에 따른 바이오패스웨이 통합의 전체적인 과정을 나타낸 도면이다.FIG. 3 is a diagram illustrating an overall process of integrating a bio-pathway according to an embodiment of the present invention.
도 3를 참조하면, 본 발명에 따라 부호 30은 입력모듈(20)로 입력되는 바이오패스웨이를 의미하며 부호 31은 입력모듈로 입력되는 또 다른 하나의 바이오패스웨이를 의미한다. 부호 32 및 33은 입력된 바이오패스웨이들이 분리과정을 거쳐 노드-관계-노드, 일명 트리플형태로 분리된 것 중 공통된 트리플을 의미한다. 구체적으로 바이오패스웨이 통합 과정을 설명하면, 입력된 바이오패스웨이들(30,31)은 하나의 언어로 통일된 후 분리과정과 표준용어로 표준화과정을 거쳐 공통된 트리플을 기반으로 통합된다. 도 3에서 알 수 있듯이, 입력된 바이오 패스웨이들(30,31)의 공통된 트리플은 'B-D'(32,33)이며 입력된 바이오패스웨이들은 공통된 트리플인 'B-D'(34)를 기반으로 통합된다. Referring to FIG. 3,
도 4는 본 발명의 일 실시예에 따른 입력된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 4 is a view showing input bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention.
도 4를 참조하면, 본 발명에 따라 부호 40은 입력되는 바이오패스웨이며 부호 41은 분리모듈을 통해 바이오패스웨이(40)가 노드 또는 관계에 기반하여 트리플형태로 분리된 것을 나타낸다. 부호 42는 도 3에서 전술한 바와 같이 공통된 트리플을 나태낸다. 부호 43은 입력되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 44는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 45는 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 46은 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 입력되는 바이오패스웨이(40)의 노드 또는 관계와 관련된 속성정보를 살펴보면, 입력되는 바이오패스웨이(40)의 노드 A는 노드 B, C, D와 연결되어 링크수가 3개며 입력되는 바이오패스웨이 내에서 노드 A는 한 개만 존재하므로 빈도수는 1번이다. 입력되는 바이오패스웨이 내에서 트리플(관계)인 'B-D' 1개만 존재하므로 빈도수는 1번이다. Referring to FIG. 4,
도 5는 본 발명의 일 실시예에 따른 입력된 또 다른 하나의 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 5 is a diagram showing another inputted bio-pathway information and stored bio-pathway information according to an embodiment of the present invention.
도 5를 참조하면, 본 발명에 따라 부호 50은 입력되는 바이오패스웨이이며 부호 51은 분리모듈을 통해 바이오패스웨이(50)가 노드 또는 관계에 기반하여 트리플형태로 분리된 것을 나타낸다. 부호 52는 도 3에서 전술한 바와 같이 공통된 트리플을 나타낸다. 부호 53은 입력되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 54는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 55는 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 56은 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 입력되는 바이오패스웨이(50)의 노드 또는 관계와 관련된 속성정보를 살펴보면, 입력되는 바이오패스웨이(50)의 노드 B는 노드 D, E, F와 연결되어 링크수가 3개며 입력되는 바이오패스웨이 내에서 노드 B는 한 개만 존재하므로 빈도수는 1번이다. 입력되는 바이오패스웨이 내에서 트리플(관계)인 'B-D' 1 개만 존재하므로 빈도수는 1번이다. 또한 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 전체 속성정보를 살펴보면, 도 5에서는 또 다른 하나의 바이오패스웨이(50)가 추가로 입력되었기 때문에 도 5의 저장된 바이오패스웨이 전체 속성정보에서는 노드 B의 빈도수(55), 노드D의 빈도수(55), 트리플 'B-D' 빈도수(56)가 도 4의 저장된 바이오패스웨이 전체 속성정보와 비교하여 하나씩 증가했다. Referring to FIG. 5,
도 6은 본 발명의 일 실시예에 따른 통합된 바이오패스웨이 정보와 저장된 바이오패스웨이 전체 정보를 나타낸 도면이다.FIG. 6 is a view showing integrated bio-pathway information and all stored bio-pathway information according to an embodiment of the present invention.
도 6을 참조하면, 본 발명에 따라 부호 63은 통합된 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 노드별 빈도수, 노드별 링크수를 나타내며 부호 65는 관계별 빈도수를 나타낸다. 속성정보들은 바이오패스웨이 DB에 저장되어 바이오패스웨이 DB에 이미 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 속성정보에 반영된다. 따라서 부호 67은 바이오패스웨이 DB에 저장되는 바이오패스웨이의 노드 또는 관계와 관련하여 추출된 속성정보인 전체 노드별 빈도수, 전체 노드별 링크수를 나타내며 부호 69는 전체 관계별 빈도수를 나타낸다. 구체적으로 설명하면, 통합된 바이오패스웨이의 노드 또는 관계와 관련된 속성정보를 살펴보면, 통합된 바이오패스웨이의 노드 B는 노드 A, D, E와 연결되어 링크수가 3개이다. 입력되는 바이오패스웨이 내에서 노드 D(62)는 도 4와 도 5에서 전술한 바와 같이 통합되기 전의 바이오패스웨이에서 각각 한 개씩 존재하였으므로 통합된 바이오패스웨이 내에서 빈도수는 2번이다. 또한 통합된 바이오패스웨이 내에서 트리플(관계)인 'B-D'(64)는 도 4와 도 5에서 전술한 바와 같이 통합되기 전의 바이오패스웨이에서 각각 한 개씩 존재하였으므로 통합된 바이오패스웨이 내에서 두 개가 존재하므로 빈도수는 2번이다. 또한 저장되어 있는 바이오패스웨이의 노드 또는 관계와 관련된 전체 속성정보를 살펴보면, 도 6에서 노드 D의 빈도수(66)가 다른 노드에 비해 현저히 낮다. 이는 곧 특정 바이오패스웨이에서만 집중적으로 나타나는 것을 의미하며 모든 바이오패스웨이에 비해 중요도가 높은 핵심정보라고 할 수 있다. 따라서 중요성을 나타내기 위해 노드 D를 다른 노드에 비해 확대(61)하여 표현한다. 또한 트리플 'B-D'(68)의 경우 다른 트리플 즉 다른 관계정보에 비해 빈도수가 현저히 낮음을 확인할 수 있다. 이는 곧 특정 바이오패스웨이에서만 집중적으로 나타나는 것을 의미하며 모든 바이오패스웨이에 비해 중요도가 높은 주요 매커니즘 즉, 핵심정보라고 할 수 있다. 따라서 중요성을 나타내기 위해 트리플 'B-D' 다른 트리플에 비해 굵게 표시(60)한다. 표현방식은 사용자의 의도에 따라 변경이 가능G함으로 이에 한정하지 않는다. Referring to FIG. 6,
도 7은 본 발명의 일 실시예에 따른 알츠하이머 병의 바이오패스웨이를 나타낸 도면이다.7 is a view illustrating a bio-pathway of Alzheimer's disease according to an embodiment of the present invention.
도 7을 참조하면, 본 발명에 따라 부호 70은 바이오패스웨이 내에서 사각형으로 표현된 노드를 의미하며 부호 71은 바이오패스웨이 내에서 화살표로 표현된 관계를 의미한다. Referring to FIG. 7,
도 8은 본 발명의 일 실시예에 따른 KGML언어로 표현된 바이오패스웨이를 나타낸 도면이다.FIG. 8 is a diagram illustrating a bio-pathway expressed in the KGML language according to an embodiment of the present invention.
도 8을 참조하면, 본 발명에 따라 도 8은 도 7의 일부분을 확대하여 앞에서 전술한 KGML언어로 바이오패스웨이를 표현한 것이다. 부호 80은 'FADD->CASP80' 트리플을 나타내며 이는 XML로 텍스트 표현(81)이 가능하다. 구체적으로 설명하면, <graphics name>의 뒤에 나오는 내용이 노드명(CAPS8,82)을 의미하고 CAPS8, CASP-8 등 동일한 용어이지만 다른 형태의 용어들이 쉼표(,)로 분리되어 나올 수 있다. 이 노드명들은 정보 DB를 이용하여 표준화되고, 정보 DB(27) 확장에도 사용될 수 있다.Referring to FIG. 8, according to the present invention, FIG. 8 is an enlarged view of a portion of FIG. 7 to express the bio-pathway in the KGML language described above. The
또한 <relation>의 뒤에 나오는 내용은 관계정보(PPRel, 83)를 의미한다. 예를 들어 PPRel은 Protein Protein Relation의 약어로 단백질-단백질 관계를 의미하며, PCRel은 Protein Compound Relation의 약어로 단백질-복합물 관계를 의미한다. In addition, the content following the <relation> means relation information (PPRel, 83). For example, PPRel stands for Protein Protein Relation, which means protein-protein relationship, and PCRel stands for Protein Compound Relation, which means protein-complex relationship.
도 9는 본 발명의 일 실시예에 따른 바이오패스웨이 통합 방법을 설명하기 위한 흐름도이다.9 is a flowchart illustrating a bio-pathway integration method according to an embodiment of the present invention.
도 9를 참조하면, 본 발명에 따라 바이오패스웨이 통합 방법은 바이오패스웨이 입력을 받는 단계(S90), 바이오패스웨이를 제1언어로 변환하는 단계(S91), 바이오패스웨이를 분리하는 단계(S92), 바이오패스웨이의 노드 또는 관계를 표준용어로 표준화하고 노드 또는 관계 형태로 바이오패스웨이를 저장하고, 노드 또는 관계와 관련된 속성정보를 추출하는 단계(S93), 바이오패스웨이를 검색하는 단계(S94), 복수의 바이오패스웨이들을 통합하는 단계(S95)를 포함한다. Referring to FIG. 9, the method of integrating a bio-pathway according to the present invention includes a step of receiving a bio-pathway input (S90), a step of converting a bio-pathway into a first language (S91) S92), standardizing the node or relationship of the bio-pathway with standard terms, storing the bio-pathway in the form of a node or relationship, extracting attribute information related to the node or relationship (S93), searching the bio- (S94), and integrating a plurality of biopathways (S95).
입력 모듈(20)은 바이오패스웨이 입력을 받는 단계(S90)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The
언어통일모듈(21)은 바이오패스웨이를 제1언어로 변환하는 단계(S91)로 변환될 수 있고 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The
분리모듈(22)은 바이오패스웨이를 분리하는 단계(S92)로 변환 될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한바 있다. The
표준화모듈(23)은 바이오패스웨이의 노드 또는 관계를 표준용어로 표준화하고 노드 또는 관계 형태로 바이오패스웨이를 저장하고, 노드 또는 관계와 관련된 속성정보를 추출하는 단계(S93)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한 바 있다. The
검색모듈(24)은 바이오패스웨이를 검색하는 단계(S94)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2에서 전술한 바 있다. The
통합모듈(25)은 복수의 바이오패스웨이들을 통합하는 단계(S95)로 변환될 수 있으며 이에 대한 구체적인 설명은 도 2, 도 3, 도 4, 도 5 및 도 6에서 전술한바 있다. The
본 발명의 명세서에 개시된 실시예들은 본 발명을 한정하는 것이 아니다. 본 발명의 범위는 아래의 특허청구범위에 의해 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술도 본 발명의 범위에 포함되는 것으로 해석해야 할 것이다. The embodiments disclosed in the specification of the present invention do not limit the present invention. The scope of the present invention should be construed according to the following claims, and all the techniques within the scope of equivalents should be construed as being included in the scope of the present invention.
20 : 입력모듈
21 : 언어통일모듈
22 : 분리모듈
23 : 표준화모듈
24 : 검색모듈
25 : 통합모듈
26 : 바이오패스웨이 DB
27 : 정보 DB20: input module
21: Language Unification Module
22: Separation module
23: Standardization module
24: Search module
25: Integration module
26: Biopathway DB
27: Information DB
Claims (20)
상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 언어통일모듈;
상기 제1언어로 변환된 바이오패스웨이를 분리하는 분리모듈,
상기 분리모듈은 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고;
상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 표준화모듈; 및
복수의 상기 저장된 바이오패스웨이들을 통합하는 통합모듈을 포함하는 바이오패스웨이 통합장치.An input module for receiving at least one bio-pathway input;
A language unification module for converting the at least one biopathway into a first language;
A separation module for separating the bio-pathways converted into the first language,
Wherein the separation module comprises separating the biopathways converted into the first language into nodes or relationships;
A standardization module for standardizing the node or relation in standard terms, storing a bio-pathway converted into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And
And an integration module for integrating a plurality of the stored bio-pathways.
노드, 관계, 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 상기 저장된 바이오패스웨이를 검색하는 검색모듈을 더 포함하는 바이오패스웨이 통합장치.The bio-pathway integrated device according to claim 1,
Further comprising a retrieval module for retrieving the stored biopathway by using the whole of the biopathway, a node, a relation, a part of the biopathway, and a whole of the biopathway.
이질적인 언어로 구축된 네트워크 형태로 표현되는 것을 포함하는 바이오패스웨이 통합장치.The method of claim 1, wherein the at least one bio-
Wherein the network is expressed in a network constructed in a heterogeneous language.
상기 변환된 바이오패스웨이를 저장하는 것을 포함하는 바이오패스웨이 통합장치.The method of claim 1, wherein the language unification module comprises:
And storing the converted bio-pathway.
노드-관계-노드 형태로 분리하는 것을 포함하는 바이오패스웨이 통합장치.[2] The method of claim 1,
Node-relationship-node. ≪ / RTI >
노드-관계-노드와 같이 트리플 형태로 저장하는 것을 포함하는 바이오패스웨이 통합장치.2. The method of claim 1,
Node-relationship-node in a triple form.
상기 입력된 적어도 하나 이상의 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수, 상기 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수 및 이에 기반한 가중치 정보를 포함하는 바이오패스웨이 통합장치.The method according to claim 1,
The number of links of each of the nodes, the number of links of each node, the frequency of each relation, the frequency of all the nodes of the stored bio pathway, the number of links of all the nodes, the frequency of each relation, A biopathway integrated device comprising:
사용자 지정에 의해 또는 검색에 의해 선택된 복수의 바이오패스웨이를 통합하는 것을 포함하는 바이오패스웨이 통합장치.The information processing apparatus according to claim 1,
And integrating a plurality of biopathways selected by user selection or by searching.
상기 통합된 바이오패스웨이를 저장하는 것을 포함하는 바이오패스웨이 통합장치.The information processing apparatus according to claim 1,
And storing the integrated bio-pathway.
바이오패스웨이가 관계정보를 기반으로 통합되는 것을 포함하는 바이오패스웨이 통합장치.The information processing apparatus according to claim 1,
And integrating the bio-pathway based on the relationship information.
바이오패스웨이 DB와 정보 DB를 더 포함하는 바이오패스웨이 통합장치.The bio-pathway integrated device according to claim 1,
A biopathway integration device further comprising a biopathway DB and an information database.
상기 적어도 하나 이상의 바이오패스웨이를 제1언어로 변환하는 단계;
상기 제1언어로 변환된 바이오패스웨이를 분리하는 단계,
상기 분리하는 단계는 상기 제1언어로 변환된 바이오패스웨이를 노드 또는 관계로 분리하는 것을 포함하고;
상기 노드 또는 관계를 표준용어로 표준화하고 상기 노드 또는 관계의 형태로 상기 제1언어로 변환된 바이오패스웨이를 저장하고, 상기 노드 또는 관계와 관련된 속성정보를 추출하는 단계; 및
복수의 상기 저장된 바이오패스웨이들을 통합하는 단계를 포함하는 바이오패스웨이 통합방법.Receiving at least one biopathway input;
Converting the at least one bio-pathway into a first language;
Separating the bio-pathways converted into the first language,
Wherein the separating comprises separating the biopathic path translated into the first language into nodes or relationships;
Standardizing the node or relationship in standard terms, storing the biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information related to the node or relationship; And
And integrating a plurality of the stored biopathways.
노드, 관계, 바이오패스웨이 일부분, 바이오패스웨이 전체를 이용하여 상기 저장된 바이오패스웨이를 검색하는 검색하는 단계를 더 포함하는 바이오패스웨이 통합방법.13. The bio-pathway integration method according to claim 12,
Further comprising the step of searching for the stored biopathway using the entire node, the relationship, a part of the biopathway, and the entire biopathway.
상기 변환된 바이오패스웨이를 저장하는 단계를 더 포함하는 바이오패스웨이 통합방법.The method of claim 12, wherein the converting the at least one biopathway into a first language comprises:
Further comprising the step of storing the converted biopathway.
상기 제1언어로 변환된 바이오패스웨이를 노드-관계-노드 형태로 분리하는 것을 포함하는 바이오패스웨이 통합방법.13. The method of claim 12, wherein separating the biopathways converted into the first language comprises:
And separating the bio-pathway converted into the first language into a node-relationship-node form.
상기 표준화된 바이오패스웨이를 노드-관계-노드와 같이 트리플형태로 저장하는 단계를 더 포함하는 바이오패스웨이 통합방법.13. The method of claim 12, wherein standardizing the node or relationship to standard terms and storing a biopathic way translated into the first language in the form of the node or relationship, and extracting attribute information associated with the node or relationship ,
Further comprising the step of storing the standardized bio-pathway in a triple form such as a node-relationship-node.
상기 입력된 적어도 하나 이상의 바이오패스웨이의 노드별 빈도수, 노드별 링크수, 관계별 빈도수, 상기 저장된 바이오패스웨이의 전체 노드별 빈도수, 전체 노드별 링크수, 전체 관계별 빈도수 및 이에 기반한 가중치 정보를 포함하는 바이오패스웨이 통합방법.13. The method according to claim 12,
The number of links of each of the nodes, the number of links of each node, the frequency of each relation, the frequency of all the nodes of the stored bio pathway, the number of links of all the nodes, the frequency of each relation, A method for integrating a bio-pathway.
사용자 지정에 의해 또는 검색에 의해 선택된 복수의 바이오패스웨이를 통합하는 것을 포함하는 바이오패스웨이 통합방법.13. The method of claim 12, wherein integrating the plurality of stored bio-
Integrating a plurality of biopathways selected by user selection or by searching.
바이오패스웨이가 관계정보를 기반으로 통합되는 것을 포함하는 바이오패스웨이 통합방법.13. The method of claim 12, wherein integrating the plurality of stored bio-
A biopathway integration method comprising integrating a bio-pathway based on relationship information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140141721A KR101488338B1 (en) | 2014-10-20 | 2014-10-20 | method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20140141721A KR101488338B1 (en) | 2014-10-20 | 2014-10-20 | method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101488338B1 true KR101488338B1 (en) | 2015-01-30 |
Family
ID=52593162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20140141721A KR101488338B1 (en) | 2014-10-20 | 2014-10-20 | method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101488338B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017065351A1 (en) * | 2015-10-13 | 2017-04-20 | 한국과학기술원 | System and method for predicting new efficacy of natural product material and ingredients |
KR101792332B1 (en) * | 2015-07-14 | 2017-11-20 | 연세대학교 산학협력단 | Method and Device for Providing Multi Path Relation Information between Entities |
KR101861180B1 (en) | 2017-10-19 | 2018-05-28 | 한국과학기술정보연구원 | apparatus for expanding bio pathway and method for expanding bio pathway |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003167882A (en) | 2001-11-30 | 2003-06-13 | Celestar Lexico-Sciences Inc | Pathway information display device, pathway information display method, program and recording medium |
KR101243063B1 (en) | 2012-08-03 | 2013-03-13 | 한국과학기술정보연구원 | System and method for pathway construction |
KR20140016784A (en) * | 2012-08-03 | 2014-02-10 | 한국과학기술정보연구원 | System and method for expanding pathway |
-
2014
- 2014-10-20 KR KR20140141721A patent/KR101488338B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003167882A (en) | 2001-11-30 | 2003-06-13 | Celestar Lexico-Sciences Inc | Pathway information display device, pathway information display method, program and recording medium |
KR101243063B1 (en) | 2012-08-03 | 2013-03-13 | 한국과학기술정보연구원 | System and method for pathway construction |
KR20140016784A (en) * | 2012-08-03 | 2014-02-10 | 한국과학기술정보연구원 | System and method for expanding pathway |
Non-Patent Citations (1)
Title |
---|
바이오패스웨이를 위한 지식 표현 시스템(정보과학회논문지:소프트웨어및응용제31권제3호,(2004.03)) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101792332B1 (en) * | 2015-07-14 | 2017-11-20 | 연세대학교 산학협력단 | Method and Device for Providing Multi Path Relation Information between Entities |
WO2017065351A1 (en) * | 2015-10-13 | 2017-04-20 | 한국과학기술원 | System and method for predicting new efficacy of natural product material and ingredients |
KR101861180B1 (en) | 2017-10-19 | 2018-05-28 | 한국과학기술정보연구원 | apparatus for expanding bio pathway and method for expanding bio pathway |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Krauthammer et al. | Term identification in the biomedical literature | |
US20080162541A1 (en) | Visualization Technique for Biological Information | |
JP2012094141A (en) | Genetic information management system and genetic information management method | |
CN109086573B (en) | Multi-source biological big data fusion system | |
KR101488338B1 (en) | method for combining biopathways, apparatus for combining biopathways and storage medium for storing a program combining biopathways | |
US20130262091A1 (en) | Automated extraction of bio-entity relationships from literature | |
US8745071B2 (en) | Delta language translation | |
TWI735380B (en) | Natural language processing method and computing apparatus thereof | |
Wang et al. | A heterogeneous network-based method with attentive meta-path extraction for predicting drug–target interactions | |
US8078611B2 (en) | Query modes for translation-enabled XML documents | |
EP3404568B1 (en) | A system and a method for discovery of predicted site-specific protein phosphorylation candidates | |
Biryukov et al. | Biokb-text mining and semantic technologies for biomedical content discovery | |
JP2005122231A (en) | Screen display system and screen display method | |
US20050033569A1 (en) | Methods and systems for automatically identifying gene/protein terms in medline abstracts | |
JP2014048741A (en) | Data search program, database device, and information processing system | |
KR101448731B1 (en) | A method for retrieving a gene-disease-chemical relationship using multi-dimensional indexes from huge bio-literatures | |
KR101374195B1 (en) | Method for providing deep domain knowledge based on massive science information and apparatus thereof | |
KR101243063B1 (en) | System and method for pathway construction | |
WO2019228833A1 (en) | System and method for allele interpretation using a graph-based reference genome | |
US20060136147A1 (en) | Biological relationship event extraction system and method for processing biological information | |
KR20170058879A (en) | apparatus for expanding bio pathway and method for expanding bio pathway | |
KR101861180B1 (en) | apparatus for expanding bio pathway and method for expanding bio pathway | |
Belhajjame et al. | Proteome data integration: Characteristics and challenges | |
KR20140016784A (en) | System and method for expanding pathway | |
Ristevski | Using Graph Databases for Querying and Network Analysing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190114 Year of fee payment: 5 |