KR100898751B1 - 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법 - Google Patents

시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법 Download PDF

Info

Publication number
KR100898751B1
KR100898751B1 KR1020070040512A KR20070040512A KR100898751B1 KR 100898751 B1 KR100898751 B1 KR 100898751B1 KR 1020070040512 A KR1020070040512 A KR 1020070040512A KR 20070040512 A KR20070040512 A KR 20070040512A KR 100898751 B1 KR100898751 B1 KR 100898751B1
Authority
KR
South Korea
Prior art keywords
node
nodes
merged
protein
visualization
Prior art date
Application number
KR1020070040512A
Other languages
English (en)
Other versions
KR20090001553A (ko
Inventor
방선이
최재훈
박종민
이용호
박수준
박선희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US11/932,880 priority Critical patent/US20080133197A1/en
Publication of KR20090001553A publication Critical patent/KR20090001553A/ko
Application granted granted Critical
Publication of KR100898751B1 publication Critical patent/KR100898751B1/ko

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Engineering & Computer Science (AREA)
  • Architecture (AREA)
  • Software Systems (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은, 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 물리적인 관계도가 높은 노드를 중심으로 다단계에 걸쳐 합병을 수행하고 최종 합병 그래프에 대해 다단계에 걸쳐 확장 및 FDP(Force-Directed Placement)를 수행함으로써, 방대한 단백질 상호작용 네트워크를 균형 상태의 그래프로 표현하고 고속으로 시각화하기 위한, 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 단백질 상호작용 네트워크를 이루는 각 서브 그래프의 노드 리스트를 추출하여 노드 인접 정도에 따라 정렬하는 노드 리스트 정렬 단계; 상기 정렬한 노드 리스트 중에서 노드 우선순위와 타 노드와의 합병 관계에 따라 시드 단백질(Seed Protein)을 선정하는 시드 단백질 선정 단계; 상기 선정한 시드 단백질을 중심으로 인접 노드들을 합병하여 합병 노드를 생성하는 합병 노드 생성 단계; 및 상기 생성한 합병 노드의 초기 위치를 선정하고 해당 시드 단백질을 중심으로 분할포인트 상에 합병된 노드를 위치시킨 후 시각화하는 시각화 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 단백질 상호작용 네트워크의 시각화 등에 이용됨.
바이오인포매틱스, 단백질 상호작용 네트워크, FDP 알고리즘, 인접 노드, 분할포인트, 시각화

Description

시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법{Layout Method for Protein-Protein Interaction Networks based on Seed Protein}
도 1 은 본 발명의 일실시예에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 구현하기 위한 장치의 블록 구성도,
도 2 는 본 발명에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 대한 일실시예 전체 흐름도,
도 3 은 본 발명에 따른 시드 단백질의 인접 노드들 중 합병대상 노드를 선정하여 합병하는 과정에 대한 일실시예 상세 흐름도,
도 4 는 본 발명에 따른 서브 그래프의 각 노드들을 합병하는 과정에 대한 일실시예 설명도,
도 5 은 본 발명에 따른 합병 노드의 1차 확장 과정에 대한 일실시예 설명도,
도 6 은 본 발명에 따른 1차 확장이 완료된 합병 노드의 2차 확장 과정에 대한 일실시예 설명도이다.
* 도면의 주요 부분에 대한 부호의 설명
110 : 입/출력부 120 : 주 메모리부
130 : 보조 메모리부 140 : 제어부
본 발명은 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 관한 것으로, 더욱 상세하게는 물리적인 관계도가 높은 노드를 중심으로 다단계에 걸쳐 합병을 수행하고 최종 합병 그래프에 대해 다단계에 걸쳐 확장 및 FDP(Force-Directed Placement)를 수행하기 위한, 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 관한 것이다.
일반적으로 하나의 단백질은 고유한 기능을 가지고 있지만, 생체 내에서 특정한 생물학적 역할을 수행하기 위해 여러 다른 단백질들과 다양한 상호작용을 한다. 따라서, 하나의 세포 내에는 다수의 단백질 사이에 복잡한 상호작용 관계들이 존재한다.
현재, 단백질 상호작용 네트워크는 보통 'Yeast Two-Hybrid'와 'co-AP/MS' 라는 생물학적 실험을 통해 빠르게 추출되고 있으며, 추출된 대표적인 데이터는 BIND(Biomolecular Interaction Network Database), DIP(Database of Interacting Protein), 'IntAct' 등과 같은 데이터베이스를 통해 체계적으로 관리되고 있다.
이러한 단백질들 간의 상호작용 데이터에서 각 단백질을 노드로 표현하고, 단백질들 사이의 상호작용을 에지로 표현하면 단백질 상호작용 네트워크로 나타낼 수 있다. 방대한 단백질들 사이의 복잡한 관계들로부터 특정 단백질이 아닌 전체적인 생체 메커니즘을 이해하기 위한 네트워크 분석 응용 시스템의 연구가 진행되고 있으며, 그 일환으로 서로 관계가 있는 대용량의 데이터를 쉽게 이해하기 위해 그래프로 표현하는 방식에 대한 연구가 진척되어 현재 널리 사용되고 있다.
단백질 상호작용 네트워크를 시각화하기 위해 FDP(Force-Directed Placement) 알고리즘이 많이 사용되고 있다. FDP 알고리즘은 노드와 에지의 집합에 대해 포스(force)를 지정하여 균형 상태를 이루도록 레이아웃을 한다. 이때, 에지들이 겹쳐져 레이아웃 되는 것을 방지하기 위해, 연결된 노드들 간의 에지는 서로 당기는 로컬 포스(local force)로 보며, 연결되지 않은 노드들은 서로 밀어내는 글로벌 포스(global force)로 본다.
이러한 FDP 알고리즘은 융통성 있고 구현하기 쉬우며 드로잉 결과도 양호하기 때문에 많이 사용되고 있지만, 대용량의 데이터에 대해서는 느리다는 단점이 있다.
이를 해결하기 위해, 노드 집합에 대해 다단계로 클러스터를 형성한 후 이를 확장하는 과정에서 FDP를 적용하는 'Walshaw'의 MFDP(Multilevel for Force-Directed Placement) 알고리즘이 개발되었다.
그러나, 이러한 MFDP 알고리즘은 단계별로 시작 노드를 임의로 설정해야 하며, 다단계로 클러스터를 형성하는 과정에서 모든 쌍의 노드들 간의 포스(force)를 계산해야 하기 때문에, 허브 노드와 같이 한 노드에 다수의 이웃 노드들을 가지고 있는 경우는 이를 처리하는데 상당한 시간이 소요되는 문제점이 있다.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 물리적인 관계도가 높은 노드를 중심으로 다단계에 걸쳐 합병을 수행하고 최종 합병 그래프에 대해 다단계에 걸쳐 확장 및 FDP(Force-Directed Placement)를 수행함으로써, 방대한 단백질 상호작용 네트워크를 균형 상태의 그래프로 표현하고 고속으로 시각화하기 위한, 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 방법은, 단백질 상호작용 네트워크를 이루는 각 서브 그래프의 노드 리스트를 추출하여 노드 인접 정도에 따라 정렬하는 노드 리스트 정렬 단계; 상기 정렬한 노드 리스트 중에서 노드 우선순위와 타 노드와의 합병 관계에 따라 시드 단백질(Seed Protein)을 선정하는 시드 단백질 선정 단계; 상기 선정한 시드 단백질을 중심으로 인접 노드들을 합병하여 합병 노드를 생성하는 합병 노드 생성 단계; 및 상기 생성한 합병 노드의 초기 위치를 선정하고 해당 시드 단백질을 중심으로 분할포인트 상에 합병된 노드를 위치시킨 후 시각화하는 시각화 단계를 포함한다.
한편, 본 발명의 다른 방법은, 단백질 상호작용 네트워크를 이루는 각 서브 그래프의 노드 리스트를 추출하여 노드 인접 정도에 따라 정렬하는 노드 리스트 정렬 단계; 상기 정렬한 노드 리스트 중에서 노드 우선순위와 타 노드와의 합병 관계에 따라 시드 단백질(Seed Protein)을 선정하는 시드 단백질 선정 단계; 상기 선정한 시드 단백질을 중심으로 인접 노드들을 다단계로 합병하여 합병 노드를 생성하는 다단계 합병 노드 생성 단계; 상기 생성한 합병 노드의 초기 위치를 선정하고 해당 시드 단백질을 중심으로 분할포인트 상에 합병된 노드를 위치시킨 후 상기 합병된 각 노드의 위치를 확정하는 노드 위치 확정 단계; 및 상기 위치가 확정된 노드들 중 합병 노드의 해당 시드 단백질을 중심으로 분할포인트를 설정하고 대표위치를 정한 후 분할된 노드를 위치시켜 시각화하는 시각화 단계를 포함한다.
또한, 본 발명은 단백질 상호작용 네트워크에서 물리적 관계도가 높은 단백질을 중심으로 다단계에 걸쳐 스프링-포스(spring force) 레이아웃 기법을 적용하여 그래프를 시각화함으로써, 단백질 상호작용 네트워크를 균형 상태의 그래프로 표현하고 고속으로 시각화한다.
또한, 본 발명은 물리적 관계도가 높은 노드를 중심으로 다단계로 합병 과정을 수행한 후, 합병된 여러 노드를 균일하게 배치하는 확장 과정을 수행함으로써, FDP(Force-Directed Placement) 수행 과정을 줄여 균형적인 시각화를 이루면서 속 도를 향상시킨다.
또한, 본 발명은 네트워크를 균형 상태의 그래프이면서 고속으로 시각화하기 위해 "Walshaw"의 MFDP 알고리즘의 시작노드 선정 과정, 합병 과정, 확장 과정을 개선한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1 은 본 발명의 일실시예에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 구현하기 위한 장치의 블록 구성도이다.
도 1에 도시한 바와 같이, 본 발명에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 구현하기 위한 장치는, 단백질 상호작용 데이터, 시각화한 단백질 상호작용 네트워크 및 시각화 과정에서 발생하는 서브 그래픽의 변화 상태 등을 입/출력하기 위한 입/출력부(110), 상기 입/출력부(110)를 통해 입력받은 단백질 상호작용 데이터, 단백질 상호작용 네트워크, 각종 계산 과정에서 발생하는 데이터 및 다단계 시각화 결과들을 저장하기 위한 주/보조메모리부(120, 130), 및 상기 주/보조 메모리부(120, 130)와 입/출력부(110)를 제어함과 아울러 물리적인 관계도가 높은 노드를 중심으로 다단계에 걸쳐 합병을 수행하고 최종 합병 그래프에 대해 다단계에 걸쳐 확장 및 FDP(Force-Directed Placement)를 수행함으로써, 방대한 단백질 상호작용 네트워크를 균형 상태의 그래프로 표현하고 고속으로 시각화하기 위한 제어부(140)를 포함한다.
전술한 구성에서, 제어부(140)는 마이크로프로세서(microprocessor)로 구현됨이 바람직하며, 이러한 제어부(140)에 후술하는 본 발명의 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 포함하고 있는 프로그램(program)을 로딩한 상태에서 단백질 상호작용 네트워크(데이터)를 입력하여 상기 프로그램을 실행시키면, 상기 프로그램이 각종 계산을 통해 단백질 상호작용 네트워크를 시각화할 수 있게 된다.
이하에서는 본 발명에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 대해서 도 2를 참조하여 주요 동작을 설명하고, 그 구체적인 동작 및 실시예는 도 3 내지 도 6을 참조하여 상세하게 설명하기로 한다.
도 2 는 본 발명에 따른 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 대한 일실시예 전체 흐름도이다.
먼저, 다수의 서브 네트워크(이하, "서브 그래프"라 함)로 구성된 단백질 상호작용 네트워크에서 각 서브 그래프의 노드 리스트를 추출한다(210).
이후, 상기 추출한 노드 리스트를 노드 인접 정도에 따라 정렬한다. 즉, 상기 추출한 노드 리스트 상의 각 노드별 인접 노드의 수를 비교하여 인접 노드의 수가 큰 순으로 정렬한다(220). 이때, 인접 노드의 수가 동일하면 합병된 노드의 수(nested degree)가 적은 순으로 정렬한다. 아울러, 합병된 노드의 수가 동일하면 임의로 정렬한다.
이후, 상기 정렬한 노드 리스트 중에서 노드 우선순위와 타 노드와의 합병 관계에 따라 시드 단백질(Seed Protein)을 선정한다. 즉, 상기 정렬한 노드 리스트에서 우선순위가 높은 노드부터 타 합병 노드의 구성 노드가 아닌 노드를 순차적으로 시드 단백질(Seed Protein)로 선정한다(230).
이후, 상기 선정한 시드 단백질을 중심으로 해당 인접 노드들을 합병한다(240).
이후, 상기 합병 노드의 초기 위치를 선정한 후 해당 시드 단백질을 중심으로 분할포인트 상에 합병된 노드를 위치시킨다(250).
이후, FDP 알고리즘을 이용하여 균형 상태의 그래프로 시각화한다(260).
도 3 은 본 발명에 따른 시드 단백질의 인접 노드들 중 합병대상 노드를 선정하여 합병하는 과정에 대한 일실시예 상세 흐름도이다.
먼저, 특정 합병 노드끼리 합병되지 않도록 임계치(CutValue)를 설정한다(301). 즉, 노드 리스트 상의 각 노드를 그에 상응하는 합병대상 노드의 수(nest degree)에 따라 내림차순으로 정렬한 후 일예로 상위 20%에 속하는 합병대상 노드 수로서 각 노드들의 합병대상 노드 수의 평균보다 큰 값들 중에서 최소 합병대상 노드의 수를 임계치(CutValue)로 설정한다.
이후, 상기 설정한 임계치보다 작은 합병대상 노드 수를 가지는 노드들을 추출한다(302).
이후, 상기 추출한 노드들을 합병대상 노드(nest node)로 구성한다(303).
이후, 상기 구성한 합병대상 노드로부터 합병대상 노드의 수를 계산하여 합병 노드를 생성한다(304). 이때, 합병대상 노드의 수는 합병의 주체가 되는 시드 노드(단백질)를 포함한 수이다.
이러한 노드 간 합병은 전체 그래프의 특정값 및 정해진 합병단계까지만 수행하는 것이 바람직하다.
이하, 도 4를 참조하여 상기 언급한 단백질 상호작용 네트워크에서 각 서브 그래프의 노드 리스트를 추출한 후 이를 합병하는 과정에 대해 상세히 살펴보기로 한다.
먼저, "410"은 단백질 상호작용 네트워크의 일 서브 그래프를 나타낸다. 상기 서브 그래프(410)에서 노드 리스트를 추출하여 정렬한 결과가 1, 2, 4, 10, 3, 7, 8, 5, 6, 9, 11이었다.
즉, 각 노드별 인접 노드의 수를 확인한 결과에 따르면, 노드 1, 노드 2, 노드 4, 노드 10은 모두 3개의 인접 노드를 가졌고, 노드 3, 노드 7, 노드 8은 모두 2개의 인접 노드를 가졌으며, 노드 5, 노드 6, 노드 9, 노드 11은 모두 1개의 인접 노드를 가졌다. 아울러, 상기 각 노드는 합병 노드가 아니었다.
따라서, 인접 노드의 수가 많은 순으로 각 노드들을 정렬하되, 동일한 인접 노드의 수를 가지는 노드들은 임의로 정렬한다.
이후, 상기 정렬한 노드 리스트 상에서 첫 번째 위치한 노드 1을 시드 단백질로 선정하여 인접 노드들과 합병한다. 이렇게 합병한 결과는 "420"과 같다. 즉, 노드 1, 노드 2, 노드 3, 노드 4를 합병하여 노드 c1을 생성한다. 이때, 노드 c1으로 합병된 노드의 수(nested degree)는 4이다.
다음으로, 상기 정렬된 노드 리스트 상의 차기 노드는 노드 2이지만, 노드 2는 이미 노드 1의 인접 노드로 합병되었으므로(노드 4 역시 마찬가지), 차기 시드 단백질은 노드 10이 된다.
따라서, 노드 10을 시드 단백질로 선정한 후 인접 노드, 즉 노드 7, 노드 8, 노드 11과 합병하여 노드 c2를 생성한다. 이렇게 합병한 결과는 "430"과 같다. 이때, 노드 c2로 합병된 노드의 수(nested degree) 역시 4이다.
다음으로, 차기 시드 단백질은 노드 5가 되는데, 그 인접 노드를 살펴보니 합병 노드인 노드 c1이다.
따라서, 상기 노드 c1이 합병대상 노드인지를 판단하기 위해 임계치(CutValue)를 구한다. 상기 임계치는 노드 리스트 추출 과정에서 미리 구해 둘 수도 있다.
임계치 생성 과정에 대해 살펴보면, 상기 정렬한 노드 리스트 상의 각 노드들을 합병시킬 경우 합병대상 노드의 수(인접 노드의 수 + 자기 자신 1)는 노드 1, 노드 2, 노드 4, 노드 10이 모두 4개이고, 노드 3, 노드 7, 노드 8이 모두 3개이며, 노드 5, 노드 6, 노드 9, 노드 11이 모두 2개이다.
여기서, 일예로 상위 20% 속하는 합병대상 노드 수는 4이고, 각 노드의 합병대상 노드 수의 평균은 3이다.
따라서, 일예로 상위 20% 속하는 합병대상 노드 수인 4에 속하면서 각 노드 의 합병대상 노드 수의 평균인 3보다 큰 값들 중에서 최소 합병대상 노드의 수는 4이다. 결국, 임계치(CutValue)는 4이다.
이때, 노드 c1에 합병된 노드의 수(4)가 임계치(4)보다 작아야 하는데, 동일하므로 노드 c1은 합병대상 노드가 아니다.
그러므로, 노드 5는 합병할 수 있는 노드가 없다.
마찬가지로, 노드 6과 노드 9도 합병할 수 있는 노드가 없다.
이렇게 모든 노드를 한 번씩 방문한 후 새롭게 생성한 합병 노드들로 치환하여 새로운 노드 리스트를 생성한다. 이때, 정렬 조건은 상기 언급한 바와 같다.
즉, 인접 노드의 수가 가장 많은 노드인 노드 c1을 첫 번째로 정렬하고, 인접 노드의 수가 동일한 노드 5, 노드 6, 노드 9, 노드 c2는 합병된 노드 수가 적은 순서로 정렬한다.
따라서, 합병된 노드 수 4를 갖는 노드 c2는 가장 나중에 정렬하고, 노드 5, 노드 6, 노드 9는 합병된 노드가 자기 자신 하나로 동일하므로 임의로 정렬한다.
이후, 새롭게 정렬한 노드 리스트 상의 첫 번째 노드인 노드 c1을 시드 단백질로 선정한 후 노드 5, 노드 6, 노드 9를 합병하여 노드 c3을 생성한다. 이렇게 합병된 최종 서브 그래프은 "440"과 같다.
도 5 은 본 발명에 따른 합병 노드의 1차 확장 과정에 대한 일실시예 설명도이다.
먼저, 일반적으로 널리 알려진 "natural spring force" 알고리즘을 통해 합병 노드 c3와 c2의 초기 위치를 선정한다(510).
이후, 합병 노드 c3와 c2의 시드 단백질을 중심으로 합병된 노드를 균등하게 배열하기 위한 분할포인트를 설정한다.
즉, 상기 합병 노드 c3와 c2에 대해 "spring force"를 반지름으로 하는 원 위에 합병된 노드의 수(nested degree)만큼 균등하게 분할포인트를 설정한다(520). 이때, 원의 중심은 해당 합병 노드 생성 시 시드 단백질로 선정된 노드를 위치시킨다.
이후, 합병 노드 c3와 c2에 각각 합병된 노드를 순차적으로 분할포인트에 위치시킨다(530). 이때, 합병된 노드인 노드 5, 노드 6, 노드 9 중 위치가 확정된 노드와 관계있는 노드가 없으므로 분할포인트에 순차적으로 위치한다.
이후, FDP(Force-Directed Placement) 알고리즘을 통해 상기 분할포인트 상에 각 노드의 위치를 확정한다(540).
이러한 과정을 통해 합병 노드의 1차 확장 과정이 완료된다.
이하, 도 6을 참조하여 1차 확장 과정이 완료된 합병 노드의 2차 확장 과정에 대해 살펴보기로 한다.
먼저, 합병 노드 c1의 시드 단백질인 노드 1을 중심으로 그에 합병된 노드인 노드 2, 노드 3, 노드 4의 분할포인트를 설정한다(550).
이때, 도 4의 "410"을 통해 알 수 있듯이 노드 2는 노드 8 및 노드 9와 관계가 있고, 노드 4는 노드 6 및 노드 7과 관계가 있다.
따라서, 노드 8과 노드 9가 이루는 x좌표와 y좌표의 중간지점(46A)을 노드 2의 대표위치로 정하고, 노드 6과 노드 7이 이루는 x좌표와 y좌표의 중간지점(46B) 을 노드 4의 대표위치로 정한다(560).
이후, 해당 노드의 대표위치와 같은 사분면에 설정한 분할포인트에 해당 노드를 위치시키고, 대표위치가 설정되지 않은 노드들은 빈 분할포인트에 위치시킨다(570).
이후, FDP 알고리즘을 수행하여 균형 상태의 그래프로 최종적으로 시각화한다(580).
이러한 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법과 "Walshaw"의 MFDP 알고리즘과 비교한 결과는 하기의 [표 1]과 같다
Figure 112007031362286-pat00001
상기 [표 1]에 나타난 바와 같이, 본 발명에 따른 시각화 속도가 최대 63%까지 향상되었다. 이는, 물리적 관계도가 높은 노드 정보를 이용하여 방대한 단백질 상호작용 네트워크를 고속으로 시각화할 수 있음을 보여준다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 물리적인 관계도가 높은 노드를 중심으로 다단계에 걸쳐 합병을 수행하고 최종 합병 그래프에 대해 다단계에 걸쳐 확장 및 FDP(Force-Directed Placement)를 수행함으로써, 방대한 단백질 상호작용 네트워크를 균형 상태의 그래프로 표현하고 고속으로 시각화할 수 있는 효과가 있다.

Claims (18)

  1. 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 구현하기 위한 장치에 의해 수행되는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 있어서,
    상기 장치의 입력부를 통해, 단백질 상호작용 데이터를 입력받는 단계;
    상기 입력받은 단백질 상호작용 데이터로부터 단백질 상호작용 네트워크를 이루는 각 서브 그래프의 노드 리스트를 추출하여 노드 인접 정도에 따른 우선순위로 정렬하는 노드 리스트 정렬 단계;
    상기 정렬한 노드 리스트 중에서 노드 우선순위가 높은 노드부터 타합병노드의 구성노드가 아닌 노드를 순차적으로 시드 단백질(Seed Protein)로 선정하는 시드 단백질 선정 단계;
    상기 선정한 시드 단백질의 인접 노드들 중, 노드 합병을 위한 임계치보다 작은 합병대상 노드 수를 가지는 노드들에 한해 상기 선정한 시드 단백질을 중심으로 합병하여 합병 노드를 생성하는 합병 노드 생성 단계; 및
    상기 생성한 합병 노드의 초기 위치를 선정하고 해당 시드 단백질을 중심으로 합병된 노드들을 균등하게 배열시키는 분할포인트 상에 합병된 노드를 위치시킴으로써, 시드 단백질 기반 단백질 상호작용 네트워크를 시각화하여 상기 장치의 출력부를 통해 출력하는 시각화 출력 단계
    를 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  2. 제 1 항에 있어서,
    상기 시드 단백질 기반 단백질 상호작용 네트워크 시각화 방법은,
    상기 정렬한 노드 리스트 상의 모든 노드들을 한 번씩 방문한 후 새롭게 생성된 합병 노드들로 치환하여 새로운 노드 리스트를 생성하는
    시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  3. 제 1 항에 있어서,
    상기 시각화 출력 단계는,
    상기 생성한 합병 노드의 초기 위치를 선정하는 초기 위치 선정 과정;
    상기 합병 노드의 시드 단백질을 중심으로 합병된 노드를 균등하게 배열하기 위한 분할포인트를 설정하는 과정;
    상기 합병 노드에 합병된 노드를 순차적으로 상기 설정한 분할포인트에 위치시키는 과정; 및
    상기 분할포인트 상에 각 노드의 위치를 확정한 균형 상태의 그래프로 시각화하는 시각화 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  4. 제 3 항에 있어서,
    상기 초기 위치 선정 과정은,
    "natural spring force" 알고리즘을 이용하여 상기 생성한 합병 노드의 초기 위치를 선정하는 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  5. 제 3 항에 있어서,
    상기 시각화 과정은,
    FDP(Force-Directed Placement) 알고리즘을 이용하여 상기 분할포인트 상에 각 노드의 위치를 확정하여 균형 상태의 그래프로 시각화하는 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 합병 노드 생성 단계는,
    노드 합병을 위한 임계치(CutValue)를 설정하는 과정;
    상기 설정한 임계치보다 작은 합병대상 노드 수를 가지는 노드들을 추출하는 과정;
    상기 추출한 노드들을 합병대상 노드(nest node)로 선정하는 과정; 및
    상기 선정한 합병대상 노드로부터 합병대상 노드의 수를 계산하여 합병 노드를 생성하는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  7. 제 1 항에 있어서,
    상기 임계치는,
    상기 정렬한 노드 리스트 상의 각 노드들의 합병대상 노드의 수(인접 노드의 수 + 자기 자신 1)를 확인한 후, 상위 20% 속하는 합병대상 노드 수이면서 각 노드의 합병대상 노드 수의 평균보다 큰 값들 중에서 최소 합병대상 노드의 수인 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  8. 제 1 항에 있어서,
    상기 시각화 출력 단계는,
    상기 분할포인트 상에 위치된 합병된 노드들 중 합병 노드가 존재하는 경우, 해당 합병 노드의 시드 단백질을 중심으로 상기 분할포인트를 설정하는 과정;
    상기 분할포인트 상에 위치된 합병된 노드들 중, 상기 해당 합병 노드에 합병된 노드와 관계가 있는 노드들의 중간지점을 상기 대표위치로 정하는 과정; 및
    상기 대표위치와 같은 사분면에 설정한 분할포인트에 상기 대표위치와 관계가 있는 노드를 위치시키고, 상기 대표위치가 설정되지 않은 노드들은 빈 분할포인트에 위치시킨 균형 상태 그래프로, 시드 단백질 기반 단백질 상호작용 네트워크를 시각화하여 상기 장치의 출력부를 통해 출력하는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  9. 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법을 구현하기 위한 장치에 의해 수행되는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법에 있어서,
    상기 장치의 입력부를 통해, 단백질 상호작용 데이터를 입력받는 단계;
    상기 입력받은 단백질 상호작용 데이터로부터 단백질 상호작용 네트워크를 이루는 각 서브 그래프의 노드 리스트를 추출하여 노드 인접 정도에 따른 우선순위로 정렬하는 노드 리스트 정렬 단계;
    상기 정렬한 노드 리스트 중에서 노드 우선순위가 높은 노드로부터 타합병노드의 구성노드가 아닌 노드를 순차적으로 시드 단백질(Seed Protein)로 선정하는 시드 단백질 선정 단계;
    상기 선정한 시드 단백질을 중심으로 인접 노드들을 다단계로 합병하여 합병 노드를 생성하는 다단계 합병 노드 생성 단계;
    상기 생성한 합병 노드의 초기 위치를 선정하고 해당 시드 단백질을 중심으로 합병된 노드들을 균등하게 배열시키는 분할포인트 상에 합병된 노드들을 위치시킨 후, FDP 알고리즘을 통해 상기 합병된 노드 각각의 위치를 확정하되,
    상기 위치가 확정된 노드들 중 합병 노드가 존재하는 경우, 해당 합병 노드의 시드 단백질을 중심으로 상기 분할포인트를 설정하고, 대표 위치를 정한 후, 해당 합병 노드에 합병된 노드들을 위치시킨 후, FDP 알고리즘을 통해 상기 합병된 노드들 각각의 위치를 확정하는 노드 위치 확정 단계; 및
    상기 노드 위치 확정 단계에 의해 시각화된 시드 단백질 기반 단백질 상호작용 네트워크를 상기 장치의 출력부를 통해 출력하는 시각화 출력단계
    를 포함하되,
    상기 정렬한 노드 리스트 상의 모든 노드들을 한 번씩 방문한 후, 새롭게 생성된 합병노드들로 치환하여 새로운 노드 리스트를 생성하는
    시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  10. 제 9 항에 있어서,
    상기 시각화 출력 단계는,
    상기 위치가 확정된 노드들 중 합병 노드가 존재하는 경우, 해당 합병 노드의 시드 단백질을 중심으로 상기 분할포인트를 설정하는 과정;
    상기 위치가 확정된 노드 중, 상기 해당 합병 노드에 합병된 노드와 관계가 있는 노드들의 중간지점을 상기 대표위치로 정하는 과정; 및
    상기 대표위치와 같은 사분면에 설정한 분할포인트에 상기 대표위치와 관계가 있는 노드를 위치시키고, 상기 대표위치가 설정되지 않은 노드들은 빈 분할포인트에 위치시킨 균형 상태 그래프로, 시드 단백질 기반 단백질 상호작용 네트워크를 시각화하여 상기 장치의 출력부를 통해 출력하는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  11. 제 9 항 또는 제 10 항에 있어서,
    상기 다단계 합병 노드 생성 단계는,
    상기 다단계 합병 노드 생성 시, 시드 단백질이 인접 노드로 합병 노드를 포함하는 경우에 합병대상 노드 여부를 결정하기 위해 임계치(CutValue)와 비교하는 과정;
    상기 비교 결과, 상기 임계치보다 작은 경우 합병대상 노드로 결정하는 과정; 및
    상기 비교 결과, 상기 임계치보다 크거나 같은 경우 합병대상 노드로 결정하지 않는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  12. 제 11 항에 있어서,
    상기 다단계 합병 노드 생성 단계는,
    상기 정렬한 노드 리스트 상의 모든 노드들을 한 번씩 방문한 후 새롭게 생성한 합병 노드들로 치환하여 새로운 노드 리스트를 생성하는 과정; 및
    상기 생성한 새로운 노드 리스트를 정렬하는 과정
    을 더 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  13. 제 12 항에 있어서,
    상기 새로운 노드 리스트를 정렬하는 과정은,
    상기 노드 리스트 상에 인접 노드의 수가 큰 순으로 정렬하고, 인접 노드의 수가 동일한 노드가 존재하는 경우 각 노드에 합병된 노드의 수(nested degree)가 적은 순으로 정렬하는 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  14. 제 11 항에 있어서,
    상기 임계치는,
    상기 정렬한 노드 리스트 상의 각 노드들의 합병대상 노드의 수(인접 노드의 수 + 자기 자신 1)를 확인한 후, 상위 20% 속하는 합병대상 노드 수이면서 각 노드의 합병대상 노드 수의 평균보다 큰 값들 중에서 최소 합병대상 노드의 수인 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  15. 제 9 항 또는 제 10 항에 있어서,
    상기 노드 위치 확정 단계는,
    FDP(Force-Directed Placement) 알고리즘을 이용하여 상기 합병된 각 노드의 위치를 확정하는 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  16. 제 1 항 내지 제 5 항, 제 9 항, 제 10 항 중 어느 한 항에 있어서,
    상기 시드 단백질 선정 단계는,
    상기 정렬한 노드 리스트에서 인접한 노드의 개수에 따른 우선순위가 높은 노드부터 타 합병 노드의 구성 노드가 아닌 노드를 순차적으로 시드 단백질(Seed Protein)로 선정하는 과정; 및
    상기 선정한 시드 단백질을 중심으로 해당 인접 노드들을 합병하는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  17. 제 1 항 내지 제 5 항, 제 9 항, 제 10 항 중 어느 한 항에 있어서,
    상기 노드 리스트 정렬 단계는,
    다수의 서브 그래프로 구성된 상기 단백질 상호작용 네트워크에서 각 서브 그래프의 노드 리스트를 추출하는 과정; 및
    상기 추출한 노드 리스트 상의 각 노드별 인접 노드의 수를 비교하여 인접 노드의 수가 큰 순으로 정렬하는 과정
    을 포함하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
  18. 제 17 항에 있어서,
    상기 노드 리스트 정렬 단계는,
    상기 노드 리스트 상에서 인접 노드의 수가 동일한 노드들끼리의 정렬은 임의로 정렬하는 것을 특징으로 하는 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법.
KR1020070040512A 2006-12-04 2007-04-25 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법 KR100898751B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US11/932,880 US20080133197A1 (en) 2006-12-04 2007-10-31 Layout method for protein-protein interaction networks based on seed protein

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20060121688 2006-12-04
KR1020060121688 2006-12-04

Publications (2)

Publication Number Publication Date
KR20090001553A KR20090001553A (ko) 2009-01-09
KR100898751B1 true KR100898751B1 (ko) 2009-05-25

Family

ID=40484623

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070040512A KR100898751B1 (ko) 2006-12-04 2007-04-25 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법

Country Status (1)

Country Link
KR (1) KR100898751B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101246101B1 (ko) * 2010-08-25 2013-03-20 서강대학교산학협력단 바이오 텍스트 데이터로부터 개체 간의 관계를 도출하는 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040102887A (ko) * 2003-05-30 2004-12-08 학교법인 인하학원 단백질 상호작용 네트워크의 시각화방법
KR20050061033A (ko) * 2003-12-18 2005-06-22 한국전자통신연구원 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법
KR20050063617A (ko) * 2003-12-22 2005-06-28 한국전자통신연구원 단백질 상호작용 데이터의 기능기반 추상화 방법 및 이를이용한 시각화 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040102887A (ko) * 2003-05-30 2004-12-08 학교법인 인하학원 단백질 상호작용 네트워크의 시각화방법
KR20050061033A (ko) * 2003-12-18 2005-06-22 한국전자통신연구원 유전자 온톨로지를 이용한 단백질 상호작용 네트워크의개념화 방법
KR20050063617A (ko) * 2003-12-22 2005-06-28 한국전자통신연구원 단백질 상호작용 데이터의 기능기반 추상화 방법 및 이를이용한 시각화 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문*

Also Published As

Publication number Publication date
KR20090001553A (ko) 2009-01-09

Similar Documents

Publication Publication Date Title
JP6751376B2 (ja) 最適解探索方法、最適解探索プログラム及び最適解探索装置
KR100996443B1 (ko) 고집적인덱스 데이터베이스 및 쿼리 데이터의 검색과 연산기능 분할에 의한 그래픽 프로세서 기반 병렬분산 처리 시스템 및 방법
CN104461693B (zh) 一种桌面云计算环境下的虚拟机更新方法和系统
US20080147589A1 (en) Method and System for Optimizing Configuration Classification of Software
CN110659284A (zh) 基于树图结构的区块定序方法及系统、数据处理终端
JPWO2018168383A1 (ja) 最適解判定方法、最適解判定プログラム及び最適解判定装置
Ülker B-Spline curve approximation using Pareto envelope-based selection algorithm-PESA
US20080133197A1 (en) Layout method for protein-protein interaction networks based on seed protein
KR100898751B1 (ko) 시드 단백질 기반 단백질 상호작용 네트워크의 시각화 방법
Srinivasan et al. Application of graph sparsification in developing parallel algorithms for updating connected components
CN116366538A (zh) 动态网络下的路径更新及等价路径规划方法及相关装置
CN107122849B (zh) 基于SparkR的产品检测总完工时间极小化方法
CN112768081B (zh) 基于子图及节点的共调控生物网络模体发现方法及装置
CN113001538B (zh) 一种命令解析方法及系统
JP2004302754A (ja) データベース検索経路判定方法
US7236168B2 (en) Method for removing blends in B-rep models
CN106155898B (zh) 一种流程图的路径获取方法及装置
US11113268B2 (en) Method and device for restoring missing operational data
EP3157209A1 (en) Route search apparatus and route search method
CN104516995A (zh) 网络流图缩减方法和装置
KR101974069B1 (ko) 바이너리 구조 도식화 장치 및 방법
CN114490799A (zh) 单个图的频繁子图挖掘方法及装置
JP5509952B2 (ja) シミュレーション方法、シミュレーション装置、プログラム、及び記憶媒体
JP2008299641A (ja) 連立一次方程式の並列求解方法およびノード順序付け方法
CN110399354A (zh) 数据库的分区交换方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130424

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 18