KR100499752B1 - 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법 - Google Patents

유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법 Download PDF

Info

Publication number
KR100499752B1
KR100499752B1 KR10-2003-0092794A KR20030092794A KR100499752B1 KR 100499752 B1 KR100499752 B1 KR 100499752B1 KR 20030092794 A KR20030092794 A KR 20030092794A KR 100499752 B1 KR100499752 B1 KR 100499752B1
Authority
KR
South Korea
Prior art keywords
network
conceptualizing
protein
node
concept
Prior art date
Application number
KR10-2003-0092794A
Other languages
English (en)
Other versions
KR20050061033A (ko
Inventor
최재훈
박선희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR10-2003-0092794A priority Critical patent/KR100499752B1/ko
Priority to US10/971,872 priority patent/US20050137808A1/en
Publication of KR20050061033A publication Critical patent/KR20050061033A/ko
Application granted granted Critical
Publication of KR100499752B1 publication Critical patent/KR100499752B1/ko

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 단백질 상호작용 네트워크의 개념화 방법에 관한 것으로, 특히 유전자 온톨로지(Gene Ontology)를 이용하여 생체 내에 존재하는 단백질들에 대한 상호작용 관계를 시각화한 복잡하고 방대한 상호작용 네트워크를 생물학자들이 쉽게 이해하고, 다양한 관점에서 효과적으로 시각화할 수 있도록 단순하게 개념화하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법에 관한 것이다.
본 발명은 단백질 상호작용 네트워크를 개념화하기 위한 방법에 있어서, (a) 상기 상호작용 네트워크를 구성하는 단백질 노드들을 유전자 온톨로지 개념들로 개념화하여 네트워크를 재구성하기 위한 단백질 개념화 단계; (b) 상기 재구성된 네트워크에서 동일한 개념을 포함하는 노드들을 하나의 노드로 통합하여 네트워크를 생성하기 위한 정확일치에 의한 네트워크 개념화 단계; 및 (c) 상기 생성된 네트워크에서 유사한 개념을 가지는 여러 노드들을 하나의 노드로 통합하여 네트워크를 재구성하기 위한 근사일치에 의한 네트워크 개념화 단계를 포함하는 이루어진 것을 특징으로 한다.

Description

유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법{A method for conceptualizing protein interaction networks using Gene Ontology}
본 발명은 단백질 상호작용 네트워크의 개념화 방법에 관한 것으로, 특히 유전자 온톨로지(Gene Ontology)를 이용하여 생체 내에 존재하는 단백질들에 대한 상호작용 관계를 시각화한 복잡하고 방대한 상호작용 네트워크를 생물학자들이 쉽게 이해함과 아울러 다양한 관점에서 효과적으로 시각화할 수 있도록 단순하게 개념화하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법에 관한 것이다.
일반적으로, 단백질 상호작용 네트워크는 단백질이 가지는 생물학적 기능을 전체적인 관점에서 밝혀내기 위한 중요한 정보로 이용되고 있다. 그 이유는 단백질 상호작용 네트워크에서 밝혀지지 않은 특정 단백질의 기능을 이 단백질과 상호작용하는 다른 단백질로부터 유추할 수 있기 때문이다.
즉, 특정 기능을 억제하거나 활성화시킬 수 있는 단백질을 예측할 수 있다. 이러한 특성을 이용하여 단백질 상호작용 네트워크는 신약개발에서 고부가가치의 표적 단백질 선정에 매우 중요한 정보로 이용되고 있다. 이를 위해서는 사용자가 방대한 단백질들의 상호작용 네트워크를 다양하게 해석할 수 있도록 시스템이 여러 관점의 뷰(view)들을 시각화할 수 있어야 한다.
종래의 연구에서 특정 단백질에 대한 상호작용 네트워크는 다음과 같은 뷰로 시각화된다. 즉, 단백질과 단백질사이의 이진관계들로 상호작용 네트워크를 표현한 다음, 기존의 그래프 시각화 알고리즘에 의해 상기 이진관계들을 네트워크 형태로 시각화한다.
이때, 상기 시각화된 네트워크의 노드는 단백질 이름이나 유전자 이름으로 표시되고, 링크는 두 단백질 사이의 상호작용 관계를 나타내게 된다. 또한, 네트워크 시각화 알고리즘으로는 FDP(Force-Driected Placement)가 많이 이용되고 있다.
그러나, 생체 내에서 단백질 사이의 관계들의 양이 매우 방대하기 때문에, 이러한 종래의 뷰로 네트워크를 시각화한다면 사용자가 이 네트워크를 이해하기 매우 어렵고, 또한 다양한 관점에서 네트워크를 해석할 수 없다는 문제점을 가지고 있다.
본 발명은 전술한 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 유전자 온톨로지(Gene Ontology)가 가지는 세가지 측면(CC, BP, MF)을 이용하여 바이오인포매틱스(bioinformatics)에서 단백질들 사이의 상호작용 관계를 시각화한 복잡하고 방대한 상호작용 네트워크를 생물학자들이 쉽게 이해함과 아울러 다양한 관점에서 효과적으로 시각화할 수 있도록 단순하게 개념화하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 제공하는데 있다.
전술한 목적을 달성하기 위하여 본 발명의 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법은, 단백질 상호작용 네트워크를 개념화하기 위한 방법에 있어서, (a) 상기 상호작용 네트워크를 구성하는 단백질 노드들을 유전자 온톨로지 개념들로 개념화하여 네트워크를 재구성하기 위한 단백질 개념화 단계; (b) 상기 재구성된 네트워크에서 동일한 개념을 포함하는 노드들을 하나의 노드로 통합하여 네트워크를 생성하기 위한 정확일치에 의한 네트워크 개념화 단계; 및 (c) 상기 생성된 네트워크에서 유사한 개념을 가지는 여러 노드들을 하나의 노드로 통합하여 네트워크를 재구성하기 위한 근사일치에 의한 네트워크 개념화 단계를 포함하는 이루어진 것을 특징으로 한다.
이하 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명한다. 본 실시예는 본 발명의 권리범위를 한정하는 것은 아니고, 단지 예시로 제시된 것이다.
도 1은 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 구현하기 위한 하드웨어 시스템의 개략적인 블록 구성도이다.
도 1에 도시한 바와 같이, 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 구현하기 위한 하드웨어 시스템은, 메인 메모리부(100), 중앙 처리부(200), 입/출력부(300), 단백질 DB(400), 상호작용 네트워크 DB(500), 온톨로지 DB(600), 네트워크 개념화 시스템(700) 및 시스템 버스(800)를 포함하여 이루어진다.
전술한 구성에서, 메인 메모리부(100)에는 본 발명에 따른 네트워크 개념화 시스템(700)과 각 단계에서 요구되는 단백질 DB(400), 상호작용 네트워크 DB(500) 및 온톨로지 DB(600)의 정보들이 탑재되어 있다.
여기서, 단백질 DB(400)의 정보는 “SWISS-PROT”, 상호작용 관계 DB(500)의 정보는 “DIP” 또는 “BIND”, 그리고 유전자 온톨로지 DB(600)는 “유전자 온톨로지(Gene Ontology)”를 이용할 수 있다.
중앙 처리부(200)는 메인 메모리부(100)에 탑재된 네트워크 개념화 시스템 (700)의 정보를 단계별로 실행시키는 역할을 수행한다.
입/출력부(300)는 시스템에서 필요한 정보를 사용자로부터 수신하며 시스템에 의해 자동으로 개념화된 네트워크에 관련된 내용을 화면에 출력하는 역할을 수행한다. 이때, 각 부들 사이의 메시지나 정보들은 시스템 버스(800)를 통해 송/수신된다.
이하에는 전술한 구성을 가지는 본 발명의 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법에 대해서 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 설명하기 위한 전체적인 흐름도이고, 도 3은 도 2의 단백질 개념화 과정을 설명하기 위한 구체적인 흐름도이고, 도 4는 도 2의 정확일치에 의한 네트워크 개념화 과정을 설명하기 위한 구체적인 흐름도이고, 도 5는 도 2의 근사일치에 의한 네트워크 개념화 과정을 설명하기 위한 구체적인 흐름도이고, 도 6은 본 발명의 일 실시예에 적용된 유전자 온톨로지 DB의 일부분을 나타낸 도면이고, 도 7은 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 설명하기 위한 도면이다.
도 2 내지 도 7에 도시한 바와 같이, 먼저 단계S100에서는 상호작용 네트워크 DB(500)로부터 특정 네트워크(N)를 입력받고, 단계S200으로 진행하여 상기 입력받은 네트워크(N)에 소속된 단백질 노드들을 단백질 DB(400)로부터 파악하고, 상기 단백질들을 온톨로지 DB(600)를 구성하는 3개 계층 즉, 구성요소(Cellular Component, 이하, ‘CC’라 칭한다.), 생물학적 작용(Biological Process, 이하, ‘BP’라 칭한다.) 그리고, 분자기능(Molecular Function, 이하, ‘MF’라 칭한다.)의 개념들로 대치하여 네트워크를 재구성한다.
다음, 단계S300에서는 상기 재구성된 네트워크에 포함된 노드들 중에서 같은 개념들을 가지는 노드들을 하나의 노드로 통합한다. 이때, 관계 정보 역시 하나의 노드에 통합하여 네트워크를 개념화한다. 즉, 정확일치에 의한 네트워크 개념화를 수행한다.
다음, 단계S400에서는 상기 재구성된 네트워크를 FDP(Force-Directed Placement) 알고리즘을 적용하여 자동으로 시각화한 후, 단계S500으로 진행하여 상기 시각화된 네트워크의 개념화 정도를 기설정된 기준정도와 비교 판단하여 만족할 경우에는 종료하고, 그렇지 않을 경우에는 단계S600으로 진행하여 상기 재구성된 네트워크에 포함된 노드들 중에서 유사한 개념들을 가지는 노드들을 하나의 노드로 통합한다. 즉, 근사일치에 의한 네트워크 개념화를 수행한 다음, 상기 단계S400으로 리턴된다.
이때, 관계 정보 역시 하나의 노드에 통합됨으로써 네트워크를 개념화한다. 상기 개념들 사이의 유사도는 온톨로지 DB(600)의 개념 계층을 이용한다. 이렇게 유사한 노드들이 하나의 노드로 통합됨으로써, 개념화된 네트워크는 상기 단계S400을 통해 시각화될 수 있다.
한편, 전술한 상기 단계S200에서 단백질 개념화 과정을 도 3을 참조하여 구체적으로 살펴보면, 먼저 하나의 단백질은 상호작용 네트워크에서 세포의 특정부분에서 특정한 생물학적 처리의 일부기능을 담당하게 된다. 이러한 단백질의 특성들은 유전자 온톨로지의 CC, BP 및 MF 계층에 존재하는 개념들로 각각 명시될 수 있다.
도 3에 도시한 바와 같이, 단계S210에서는 네트워크(N)에서 하나의 단백질 노드(예컨대, )을 추출하고, 단계S220,S230,S240으로 진행하여 온톨로지 DB(600)로부터 단백질 노드()에 해당하는 CC 개념, BP 개념 및 MF 개념을 각각 할당한다. 여기서, 각각의 개념이 밝혀지지 않은 단백질은 "Unknown" 값을 할당한다.
다음, 단계S250에서는 상기 단백질 노드()를 개념 노드()로 대치한다.
즉, 도 7을 참조하여 설명하면, 최초 네트워크의 에는 CC 개념 "intracellular", BP 개념 "cell surface receptor linked signal transduction" 및 MF 개념 "Unknown"를 할당하여 로 대치한다. 은 CC 개념 "intracellular", BP 개념 "interpretation of external signals that regulate cell growth" 및 MF 개념 "Unknown"를 할당하여 로 대치한다. 이와 같은 방법으로 단백질 에 대해서도 개념화하여 단백질 개념화 네트워크를 생성한다. 따라서, 이 실시예에서는 편의상 CC와 BP 계층에 대한 개념들로 네트워크 개념화 과정을 설명한다.
그리고, 전술한 상기 단계S300에서 정확일치에 의한 네트워크 개념화 과정을 도 4를 참조하여 구체적으로 살펴보면, 먼저 단백질들이 개념화된 네트워크에서 각각의 노드들은 CC 개념, BP 개념 및 MF 개념으로 명시된다. 따라서, 네트워크의 노드에는 동일한 개념들로 명시된 노드가 존재할 수 있다.
도 4에 도시한 바와 같이, 단계S310에서는 정확일치에 의한 개념화를 진행하기 위해 유전자 온톨로지(Gene Ontology)에서 몇 개의 개념 계층(CC, BP, MF)을 선택한 다음, 단계S320으로 진행하여 네트워크(N)에서 하나의 개념 노드()를 추출한다.
다음, 단계S330에서는 상기 개념 노드()와 동일한 개념을 가지고 있는 다른 모든 개념 노드()를 탐색한다. 이때, 상기 단계S310에서 선택된 계층에 해당하는 유전자 온톨로지 개념들만이 비교대상으로 한다.
다음, 단계S340에서는 상기 탐색된 개념 노드들()과 상기 추출된 개념 노드()를 통합하여 하나의 개념 노드(C)로 대치한다. 이때, 상기 개념 노드()와 상기 개념 노드()가 가지는 모든 관계들 역시 상기 개념 노드(C)로 통합되기 때문에, 네트워크(N)의 의미는 그대로 유지하게 된다.
다음, 단계S350에서는 상기 개념 노드(C)를 다시 방문하지 않기 위해 상기 개념 노드(C)를 이미 처리했음을 표시한 후, 단계S360으로 진행하여 모든 개념 노드(C)가 방문되었는지를 판단하여 더 방문할 노드가 있을 경우에는 상기 단계S320로 리턴된다.
즉, 도 7을 참조하여 설명하면, 네트워크 (0)에서 네트워크 (1)의 정확일치에 의한 개념화 단계를 나타내는 바, 은 같은 개념을 가지는 다른 노드가 존재하지 않기 때문에, 네트워크 (1)의 노드 가 그대로 매핑된다. 노드 은 CC와 BP 개념을 각각 "intracellular"과 "interpretation of external signals that regulate cell growth"를 가지고 있기 때문에 통합되어 네트워크 (1)의 노드 으로 통합된다. 이와 같은 방법으로 노드 은 각각 "nucleus"과 "positive regulation of cell growth"를 가지고 있기 때문에 네트워크 (1)의 로 통합된다. 이때, 과 관계를 가지고 있기 때문에 네트워크 (0)에서 해당하는 두 노드 이 가지는 관계를 통합한 의미가 된다.
그리고, 전술한 상기 단계S600에서 근사일치에 의한 네트워크 개념화 과정을 도 5를 참조하여 구체적으로 살펴보면, 먼저 네트워크 노드에 포함된 유전자 온톨로지 개념들은 서로 유사한 의미를 가질 수 있다. 따라서, 서로 밀접한 의미의 개념들을 포함하고 있는 노드들 역시 하나의 노드로 통합함으로써 네트워크를 보다 개념화할 수 있다.
도 5에 도시한 바와 같이, 단계S610에서는 근사일치에 의한 개념화를 진행하려는 하나의 유전자 온톨로지 계층을 선택하고, 단계S620으로 진행하여 모든 노드에 대해 그 노드가 가지는 개념의 깊이를 계산한다. 이때, 개념의 계층 깊이는 상기 단계S610에서 선택된 유전자 온톨로지 계층에서 평가된다.
다음, 단계S630에서는 상기 계산된 노드 중에서 가장 깊은 깊이를 가지는 노드에 개념들을 한 단계 상위 개념으로 대치하고, 단계S640으로 진행하여 상기 대치된 개념들을 포함하는 노드들에 대해 상기 단계S300으로 리턴되어 정확일치에 의한 네트워크 개념화를 수행한다.
다음, 단계S650에서는 사용자에 의해 개념화 조건의 변경여부를 판단하여 사용자가 개념화를 진행하기를 원하지 않을 경우에는 종료하고, 사용자가 개념화를 계속 진행하기를 원할 경우에는 상기 단계S610으로 리턴된다.
즉, 도 7을 참조하여 설명하면, 네트워크 (1)에서 네트워크 (2), 그리고 네트워크 (2)에서 네트워크 (3)의 근사일치에 의한 개념화 단계로서, 먼저 상기 단계S610에서와 같이 시스템은 사용자로부터 개념화 계층이 BP임을 입력받는다. 상기 단계S620에서와 같이 네트워크 (1)에 존재하는 모든 노드의 계층 깊이를 계산한다.
유전자 온톨로지 BP 계층(도 6참조)에서 , 에 할당된 BP 개념들은 깊이가 모두 5이고 은 4이다. 또한, 는 6으로 깊이가 평가된다. 따라서, 단계S630에서와 같이 에 존재하는 개념 "positive regulation of cell growth"과 "negative regulation of cell growth"를 그 상위 개념 "regulation of cell growth"으로 BP 유전자 온톨로지를 참조하여 대치한다.
상기 대치된 노드 는 상기 단계S630에서와 같이 정확일치에 의한 개념화 과정을 통해 네트워크 (2)의 로 대치된다.
이와 같은 방법으로 네트워크 (2)를 네트워크 (3)로 개념화할 수 있다. 즉, , , 는 각각 계층 깊이가 5로 평가된다. 따라서, 이들이 가지는 개념들을 그 상위 개념으로 대치한다. 즉, 의 "cell surface receptor linked signal transduction"과 의 "interpretation of external signals that regulate cell growth"를 모두 "signal transduction"으로 의 "regulation of cell growth"과 의 "cell expansion"을 모두 "cell growth"로 대치한다. 이 대치된 개념을 통해 정확일치를 통한 개념화 과정을 통해 네트워크 (3)를 생성할 수 있다. 방대한 네트워크는 이 과정을 반복하여 보다 단순하게 개념화된 네트워크를 생성할 수 있다.
전술한 본 발명에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법에 대한 바람직한 실시예에 대하여 설명하였지만, 본 발명은 이에 한정되는 것이 아니고 특허청구범위와 발명의 상세한 설명 및 첨부한 도면의 범위 안에서 여러 가지로 변형하여 실시하는 것이 가능하고 이 또한 본 발명에 속한다.
이상에서 설명한 바와 같은 본 발명의 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법에 따르면, 유전자 온톨로지(Gene Ontology)가 가지는 세가지 측면(CC, BP, MF)을 이용하여 생체 내에 존재하는 단백질들에 대한 상호작용 관계를 시각화한 복잡하고 방대한 상호작용 네트워크를 그 의미를 유지하면서 단순하게 개념화시켜 줌으로써, 생물학자들이 쉽게 이해함과 아울러 다양한 관점에서 효과적으로 시각화할 수 있고, 사용자들이 상호작용 네트워크를 개념적으로 이해함과 더불어 관심이 있는 부분만을 집중적으로 분석할 수 있는 환경을 제공할 수 있으며, 네트워크 분석을 위한 비용을 현저하게 감소시킬 수 있는 이점이 있다.
도 1은 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 구현하기 위한 하드웨어 시스템의 개략적인 블록 구성도,
도 2는 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 설명하기 위한 전체적인 흐름도,
도 3은 도 2의 단백질 개념화 과정을 설명하기 위한 구체적인 흐름도,
도 4는 도 2의 정확일치에 의한 네트워크 개념화 과정을 설명하기 위한 구체적인 흐름도,
도 5는 도 2의 근사일치에 의한 네트워크 개념화 과정을 설명하기 위한 구체적인 흐름도,
도 6은 본 발명의 일 실시예에 적용된 유전자 온톨로지 DB의 일부분을 나타낸 도면,
도 7은 본 발명의 일 실시예에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법을 설명하기 위한 도면이다.
*** 도면의 주요 부분에 대한 부호 설명 ***
100 : 메인 메모리부, 200 : 중앙 처리부,
300 : 입/출력부, 400 : 단백질 DB,
500 : 상호작용 관계 DB, 600 : 온톨로지 DB,
700 : 네트워크 개념화 시스템, 800 : 시스템 버스

Claims (4)

  1. 복잡한 단백질 상호작용 네트워크를 단순한 형태로 개념화하기 위한 방법에 있어서,
    (a) 상기 상호작용 네트워크를 구성하는 단백질 노드들을 유전자 온톨로지 개념들로 개념화하여 네트워크를 재구성하기 위한 단백질 개념화 단계;
    (b) 상기 재구성된 네트워크에서 동일한 개념을 포함하는 노드들을 하나의 노드로 통합하여 네트워크를 생성하기 위한 정확일치에 의한 네트워크 개념화 단계; 및
    (c) 상기 생성된 네트워크에서 유사한 개념을 가지는 여러 노드들을 하나의 노드로 통합하여 네트워크를 재구성하기 위한 근사일치에 의한 네트워크 개념화 단계를 포함하는 이루어진 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법.
  2. 제 1항에 있어서, 상기 단계(a)에서의 단백질 개념화 단계는,
    (a1) 네트워크(N)에서 하나의 단백질 노드()를 추출하는 단계;
    (a2) 상기 추출된 단백질 노드()에 해당하는 CC 개념, BP 개념 및 MF 개념을 각각 할당하는 단계; 및
    (a3) 모든 단백질 노드()를 개념 노드()로 대치하는 단계를 포함하여 이루어진 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법.
  3. 제 1항 또는 제 2항에 있어서, 상기 단계(b)에서의 정확일치에 의한 네트워크 개념화 단계는,
    (b1) 유전자 온톨로지에서 복수의 개념 계층(CC, BP, MF)을 선택하는 단계;
    (b2) 네트워크(N)에서 하나의 개념 노드()를 추출하는 단계;
    (b3) 상기 추출된 개념 노드()와 동일한 개념을 가진 다른 모든 개념 노드()를 탐색하는 단계;
    (b4) 상기 추출된 개념 노드()와 상기 탐색된 개념 노드()를 통합하여 하나의 개념 노드(C)로 생성하는 단계; 및
    (b5) 상기 생성된 모든 개념 노드(C)의 방문을 표시하는 단계를 포함하여 이루어진 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법.
  4. 제 1항 또는 제 2항에 있어서, 상기 단계(c)에서의 근사일치에 의한 네트워크 개념화 단계는,
    (c1) 하나의 온톨로지 계층을 선택하는 단계;
    (c2) 상기 선택된 온톨로지 계층에 따라 모든 노드에 대해 그 노드가 가지는 개념의 깊이를 계산하는 단계;
    (c3) 상기 계산된 노드 중에서 가장 깊은 깊이를 가지는 노드 개념들을 상위 개념으로 대치하는 단계;
    (c4) 상기 대치된 개념들을 포함하는 노드들에 대해 상기 단계(b)로 리턴되어 정확일치에 의한 네트워크 개념화를 수행하는 단계; 및
    (c5) 사용자가 개념화를 계속 진행하기 원할 경우에 상기 단계(c1)~(c4)을 반복 수행하는 단계를 포함하여 이루어진 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 방법.
KR10-2003-0092794A 2003-12-18 2003-12-18 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법 KR100499752B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-2003-0092794A KR100499752B1 (ko) 2003-12-18 2003-12-18 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법
US10/971,872 US20050137808A1 (en) 2003-12-18 2004-10-22 Method for conceptualizing protein interaction networks using gene ontology

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0092794A KR100499752B1 (ko) 2003-12-18 2003-12-18 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법

Publications (2)

Publication Number Publication Date
KR20050061033A KR20050061033A (ko) 2005-06-22
KR100499752B1 true KR100499752B1 (ko) 2005-07-07

Family

ID=34675795

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0092794A KR100499752B1 (ko) 2003-12-18 2003-12-18 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법

Country Status (2)

Country Link
US (1) US20050137808A1 (ko)
KR (1) KR100499752B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692319B1 (ko) 2006-02-20 2007-03-12 한국생명공학연구원 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법
KR100898751B1 (ko) * 2006-12-04 2009-05-25 한국전자통신연구원 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법
KR100860498B1 (ko) * 2006-12-20 2008-09-26 건국대학교 산학협력단 바이오 정보 통합 검색 시스템 및 그 방법
WO2010018882A1 (en) * 2008-08-14 2010-02-18 Korea Basic Science Institute Apparatus for visualizing and analyzing gene expression patterns using gene ontology tree and method thereof
KR101082367B1 (ko) 2009-04-29 2011-11-10 충북대학교 산학협력단 질병네트워크로부터 질병단백체를 발굴하는 방법
KR101106174B1 (ko) * 2010-03-05 2012-01-20 인하대학교 산학협력단 온톨로지 기반의 단백질 상호작용 검색 엔진
CN108629159B (zh) * 2018-05-14 2021-11-26 辽宁大学 一种用于发现阿尔兹海默症致病关键蛋白质的方法
KR102176721B1 (ko) * 2019-03-20 2020-11-09 한국과학기술원 기능 유사한 유전자들의 그룹 지표를 이용한 질병 판별 시스템 및 방법
KR102516206B1 (ko) * 2020-11-16 2023-03-29 이현주 온톨로지에 기초한 데이터베이스 구축 방법, 이를 이용한 사용자 질의 응답 방법, 및 그 방법들이 구현된 시스템

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
WO2001080151A2 (en) * 2000-04-14 2001-10-25 Hybrigenics S.A. Method for constructing, representing or displaying protein interaction maps

Also Published As

Publication number Publication date
US20050137808A1 (en) 2005-06-23
KR20050061033A (ko) 2005-06-22

Similar Documents

Publication Publication Date Title
JP4028107B2 (ja) 分解及び分割によるハードウェアの検証並びに表現方法
CN113449857A (zh) 一种数据处理方法和数据处理设备
KR100499752B1 (ko) 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법
Wuytack et al. Memory management for embedded network applications
Ryu et al. A derivative-free trust-region method for biobjective optimization
Allard et al. Percolation and the effective structure of complex networks
US7386828B1 (en) SAT-based technology mapping framework
Yu et al. DDOT: a Swiss army knife for investigating data-driven biological ontologies
Moschini et al. A hybrid shared-memory parallel max-tree algorithm for extreme dynamic-range images
JP2000003373A (ja) サンプリングベ―スの順序付き二分決定グラフの変数順序決定方法
Ly et al. A generalized interconnect model for data path synthesis
JP2004533028A (ja) ヴィーバ
JP2003500745A (ja) 業者間アプリケーションサービスプロバイダー
CN116204847A (zh) 一种计算图优化方法、装置及设备
Baba et al. Extracting the underlying effective free energy landscape from single-molecule time series—local equilibrium states and their network
Li et al. A method for improving the accuracy of link prediction algorithms
Kozikoğlu et al. Thinking and designing with the idea of network in architecture
Jusoh et al. Development of breast cancer ontology based on hybrid approach
Gerard et al. Metabolic pathways synthesis based on ant colony optimization
KR20200123771A (ko) 멀티오믹스 네트워크 기반 신약 후보 물질 탐색 방법
Collingsworth et al. A self-organized approach for detecting communities in networks
Rutgers et al. An approximate maximum common subgraph algorithm for large digital circuits
Ligtenberg et al. Reconn: A cytoscape plug-in for exploring and visualizing reactome
Gajski et al. The SpecSyn design process and human interface
Saurabh Improving the Performance of Moore-Penrose pseudo-inverse for a Graph’s Laplacian Using GPU

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130527

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 19