KR100551954B1 - 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법 - Google Patents

유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법 Download PDF

Info

Publication number
KR100551954B1
KR100551954B1 KR1020030087745A KR20030087745A KR100551954B1 KR 100551954 B1 KR100551954 B1 KR 100551954B1 KR 1020030087745 A KR1020030087745 A KR 1020030087745A KR 20030087745 A KR20030087745 A KR 20030087745A KR 100551954 B1 KR100551954 B1 KR 100551954B1
Authority
KR
South Korea
Prior art keywords
protein
information
search
database
protein interaction
Prior art date
Application number
KR1020030087745A
Other languages
English (en)
Other versions
KR20050054377A (ko
Inventor
정재영
최재훈
박선희
김대희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020030087745A priority Critical patent/KR100551954B1/ko
Publication of KR20050054377A publication Critical patent/KR20050054377A/ko
Application granted granted Critical
Publication of KR100551954B1 publication Critical patent/KR100551954B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioethics (AREA)

Abstract

본 발명은 단백질 상호작용 네트워크의 검색에 있어 불리언 연산자와 is-a, part-of의 계층구조를 갖는 유전자 온톨로지 개념을 이용하여 확장된 패싯 질의 기반으로 사용자 의도와 의미적으로 일치하는 정보를 순위화하여 제공하는 단백질 상호작용 네트워크 검색 시스템 및 방법에 관한 것이다.
본 발명은 각종 단백질 및 단백질 상호작용 정보와 유전자 온톨로지 정보를 데이터베이스화하는 단계; 사용자로부터 단백질 검색을 위한 각 질의항목들을 입력받는 단계; 데이터베이스의 계층구조 및 불리언 조합을 통해 사용자 질의를 확장하는 단계; 확장된 사용자 질의를 바탕으로 단백질를 검색하고 그 검색결과를 순위화하여 출력하는 단계; 및 단백질 검색결과중 사용자가 선택한 단백질리스트만을 포함하는 단백질 상호작용 네트워크 정보를 탐색하고 그 결과를 가중치 값에 따라 순위화하여 출력하는 단계;로 이루어진다.
유전자 온톨로지, 생명정보학, 단백질 상호작용 네트워크, 패싯항목, 불리언 연산자

Description

유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템 및 방법{System and Method of concept-based retrieval model of protein interaction networks with gene ontology}
도 1은 본 발명에 따른 단백질 상호작용 네트워크 검색에 대한 개념도.
도 2는 본 발명에 따른 단백질 상호작용 네트워크 검색 시스템에 대한 개략적 블록 구성도.
도 3은 본 발명에 따른 종 DB 계층구조의 일 예를 보여주는 도면.
도 4는 본 발명에 따른 유전자 온톨로지 계층구조의 일 예를 보여주는 도면.
도 5는 본 발명에 따른 사용자 질의 입력부에 대한 블록 구성도.
도 6은 본 발명에 따른 중앙처리부의 블록 구성도.
도 7은 본 발명에 따른 단백질 및 단백질 상호작용 네트워크 검색 과정에 대한 흐름도.
도 8은 본 발명에 따른 질의 입력부의 사용자 인터페이스 화면도.
도 9는 본 발명에 따른 유전자 온톨로지 계층구조를 통해 사용자 질의를 확장하는 예를 보여주는 도면.
도 10은 본 발명에 따른 단백질 검색결과 리스트를 보여주는 도면.
도 11은 본 발명에 따른 단백질 상호작용 네트워크 검색결과 리스트를 보여 주는 도면.
<도면의 주요부분에 대한 부호의 설명>
110: 사용자 질의입력부 111: 단백질 이름부
112: 단백질 종부 113: 단백질 처리부
114: 단백질 구성부 115: 단백질 기능부
120: 중앙처리부 121: 패싯항목 아이디 추출부
122: 검색가중치 추출부 123: 질의확장부
124: 불리언 연산 조합부 125: 단백질검색부
126: 단백질 상호작용 네트워크 검색부
127: 순위화 처리부 130: 데이터베이스부
131: 종 DB 132: 단백질 DB
133: 유전자 온톨로지 DB 134: 단백질 상호작용 DB
본 발명은 유전자 온톨로지를 이용하여 단백질 상호작용 네트워크를 검색하는 시스템 및 방법에 관한 것이며, 보다 상세히는 단백질 상호작용 네트워크의 검색에 있어 불리언 연산자와 is-a, part-of의 계층구조를 갖는 유전자 온톨로지 개념을 이용하여 사용자가 의도하는 정보를 검색해주는 단백질 상호작용 네트워크 검 색 시스템 및 방법에 관한 것이다.
최근 생물학과 정보학이 결합된 생명정보학(Bio-informatics)이 차세대 생명공학으로서 각광 받고 있으며, 이러한 바이오인포매틱스 분야에서 단백질 상호작용 네트워크 검색은 단백질들의 기능을 전체적인 관점에서 볼 수 있다는 점에서 매우 중요한 정보로 활용되고 있다. 즉, 통합된 단백질 상호작용 네트워크의 정보는 지놈(genome) 데이터에서 유전자의 분류, 조회 및 기능을 파악하는데 많은 도움이 된다. 그래서, 방대하고 다양한 형태인 단백질 상호작용 네트워크를 효과적으로 검색하는 방법에 대한 많은 연구가 진행되고 있으며 다수의 방법들이 종래 제안된 바 있다.
하지만, 이러한 종래의 단백질 상호작용 네트워크의 검색 방법 및 장치들은 일반적으로 사용자의 질의 색인어와 일치되는 정보만을 검색하기 때문에 이와 연계된 다양한 정보들은 얻을 수 없었고, 그 결과 사용자의 의도와 의미적으로 일치하는 정보들을 효과적으로 탐색할 수 없었다.
따라서, 본 발명은 상술한 종래의 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 검색어간의 불리언 연산자조합과 is-a, part-of의 계층 구조를 갖는 유전자 온톨로지 개념을 바탕으로 한 확장된 패싯을 기반으로 하여 사용자의 검색의도와 의미적으로 일치하는 정보들을 효과적으로 탐색하고 이를 관련정도에 따라 순위화하여 제공하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템 및 방법을 제공하는데 있다.
상기 본 발명의 목적을 달성하기 위한 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템은, 단백질 및 단백질 상호작용 정보와 유전자 온톨로지 정보를 포함하는 데이터베이스부; 사용자로부터 패싯 질의항목들을 입력받는 사용자 질의입력부; 상기 사용자 질의항목에 대해 불리언 조합을 하고, 상기 데이터베이스부의 계층구조 정보를 참조하여 사용자 질의를 확장하는 중앙처리부; 상기 질의 처리 결과를 바탕으로 개념기반 단백질 정보 검색을 수행하는 단백질 검색부; 및 상기 검색된 단백질 리스트를 포함하는 단백질 상호작용 네트워크 정보를 검색 제공하는 단백질 상호작용 네트워크 검색부;로 구성된다.
또한, 상기 본 발명의 목적을 달성하기 위한 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법은, 각종 단백질 및 단백질 상호작용 정보와 유전자 온톨로지 정보를 포함하여 데이터베이스화하는 단계; 사용자로부터 단백질 검색을 위한 각 질의항목들을 입력받는 단계; 상기 데이터베이스의 단백질 계층구조 정보와 불리언 조합을 통해 사용자 질의를 확장하는 단계; 상기 확장된 사용자 질의를 바탕으로 개념기반 단백질 정보를 검색하고 그 검색결과 리스트를 순위화하여 출력하는 단계; 상기 단백질 검색결과 리스트를 포함하는 단백질 상호작용 네트워크 정보를 탐색하고 그 결과를 가중치 값에 따라 순위화하여 출력하는 단계;로 이루어진다.
이하, 본 발명에 따른 실시예를 첨부한 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명에 따른 단백질 상호작용 네트워크 검색에 대한 개략적인 개념을 도시하고 있다.
도 1에 도시된 바와 같이, 본 발명의 단백질 상호작용 네트워크 검색은, 크게 유전자 온톨로지를 참조하여 사용자 질의에 대한 획장된 패싯 질의를 구성하는 제 1과정과, 데이터베이스로부터 상기 확장 패싯 질의와 일치하는 단백질을 검색하는 제 2과정과, 상기 검색된 단백질 정보를 포함하는 데이터베이스로부터 단백질 상호작용 네트워크를 검색하는 제 3과정으로 이루어진다.
또한, 본 발명은 단백질 상호작용 네트워크를 검색함에 있어, 사용자 질의어를 AND, OR 등의 불리언 연산자로 조합하고, is-a, part-of의 계층 구조를 갖는 유전자 온톨로지 개념을 바탕으로 한 확장된 패싯 기반의 검색을 수행한다. 여기에서, 패싯이란 검색하고자 하는 요구 항목들을 말한다.
즉, 본 발명은 기존의 색인어 검색의 단점을 보완하고 사용자의 검색 의도를 만족스럽게 표현하기 위해 불리언 질의를 사용하는 것으로, AND나 OR와 같은 불리언 연산자를 이용하여 사용자 질의들 사이의 논리적 관계를 자연스럽게 표현할 수 있다는 장점을 가진다.
하지만, 이와 같이 불리언 연산자만을 사용할 경우, 시스템 내부에서 관련된 질의들이 모두 동일한 관련 정도로 표현되기 때문에 사용자 의도에 따라 검색된 항목에 가중치를 적용할 수 없다는 단점이 있다. 이를 해결하기 위해 본 발명은 각 패싯 값에 해당하는 관련 정도를 종 데이터베이스, 유전자 온톨로지 데이터베이스, 단백질 데이터베이스, 단백질 상호작용 데이터베이스에 사전에 정의해 두어, 사용 자의 검색 질의와 검색된 결과 사이의 관련 정도를 평가할 수 있게 함으로써 시스템이 그 검색결과를 순위화된 형태로 사용자에게 제시할 수 있게 한다.
도 2는 본 발명에 따른 단백질 상호작용 네트워크 검색시스템에 대한 개략적인 블록 구성도이다.
도 2에 도시된 바와 같이, 본 발명에 따른 검색 시스템은, 사용자 질의 입력부(110)와, 데이터베이스부(130)와, 중앙처리부(120), 단백질 검색부(125), 및 단백질 상호작용 네트워크 검색부(126) 등으로 구성된다.
여기에서, 상기 사용자 질의 입력부(110)는 사용자로부터 질의항목들을 입력받기 위한 것으로, 사용자가 찾고자 하는 단백질 또는 단백질 상호작용 네트워크의 검색을 위해 요구되는 항목들로 이루어져 있다. 사용자 질의 입력부(110)에 대해서는 이하 도 5를 통해 상세히 설명하기로 한다.
또한, 상기 중앙처리부(120)는 상기 사용자 질의 입력부(110)로부터의 질의 항목과 데이터베이스부(130)에 저장되어 있는 데이터 사이의 관계를 처리하는 것으로, 이에 대해서는 이하 도 6을 통해 상세히 설명하도록 한다.
한편, 상기 데이터베이스부(130)는 종 DB(131), 단백질 DB(132), 유전자 온톨로지 DB(133), 단백질 상호작용 DB(134)로 이루어진다.
여기에서, 종 DB(131)에는 단백질 종(예; 사람, 쥐...)의 계층구조 정보가 저장된다. 도 3은 상기 종 DB(131)의 단백질 종 계층 구조에 대한 일 예를 보여주고 있다.
또한, 상기 단백질 DB(132)에는 지금까지 밝혀진 모든 단백질에 대한 단백질 이름(Protein Name), 고유 아이디(Access Number), 단백질 유사명(Protein Synonym), 유전자 이름(Gene Name), 종 정보(Taxonomy Information), 유전자 및 단백질에 대한 대용량 정보 데이터베이스를 보유하고 있는 NCBI 또는 SWISS-PROT, EBI, PIR과 같은 웹사이트와 연결될 수 있도록 URL 정보가 포함된다.
또한, 상기 유전자 온톨로지 DB(133)에는 세포 성분(Cellular Component), 생물학적 처리(Biological Process), 그리고 분자 기능(Molecular Function) 세 부분으로 이루어진 단백질들 사이의 상호 연관성을 나타내는 유전자 온톨로지 정보가 저장된다.
여기에서, 세포 컴포넌트(Cellular Component)는 세포의 구조, 위치, 거대 분자 집합 등의 정보를 포함하고, 상기 바이오 프로세서(Biological Process)는 분자 기능의 정렬화된 조합으로 이루어지며 화학적인 반응에 대한 정보를 포함한다. 또한, 상기 분자 기능(Molecular Function)은 개개 유전자 또는 단백질들의 수행 기능에 관한 정보를 포함한다.
아래 표 1은 단백질 정보 데이터베이스에 대한 일 예를 보여주고 있다.
[표 1]
Figure 112003046432107-pat00001
또한, 도 4는 상기 유전자 온톨로지 DB(133)의 유전자 온톨로지의 계층구조에 대한 예를 보여주고 있다.
상기 단백질 상호작용 DB(134)에는 하나의 단백질과 이와 물리적 화학적 결합관계를 가지는 모든 단백질 상호작용 네트워크 정보가 포함된다. 아래 표2는 이러한 단백질 상호작용 데이터베이스의 예를 보여주고 있다.
[표 2]
Figure 112003046432107-pat00002
한편, 도 5는 상기 사용자 질의 입력부(110)에 대한 보다 상세한 블록 구성도이다.
도 5에서와 같이, 상기 사용자 질의 입력부(110)는 단백질 이름부(111), 단백질 종부(112), 단백질 처리부(113), 단백질 구성부(114), 단백질 기능부(115) 등으로 구성된다.
여기에서, 상기 단백질 이름부(111)는 사용자로부터 임의의 단백질 이름을 입력받고 데이터베이스 내부의 단백질 DB(132)를 참조하여 그 관련 값을 중앙처리부(120)로 전달한다. 또한, 상기 단백질 종부(112)는 사용자로부터 단백질 종을 입력받고 종 DB(131)를 참조하여 그 관련 값을 중앙처리부(120)로 전달한다.
상기 단백질 처리부(113)는 사용자로부터 바이오 프로세서 값을 입력받고 유전자 온톨로지 DB(133)를 참조하여 그 관련 값을 중앙처리부(120)로 전달한다. 또한, 상기 단백질 구성부(114)는 사용자로부터 세포 컴포넌트 값을 입력받고 유전자 온톨로지 DB(133)를 참조하여 그 관련 값을 중앙처리부(120)로 전달한다.
또한, 상기 단백질 기능부(115)는 사용자로부터 분자 기능 값을 입력받고 데이터베이스 내부의 유전자 온톨로지 DB(133)를 참조하여 그 관련 값을 중앙처리부(120)로 전달한다.
한편, 도 6은 상기 중앙처리부(120)에 대한 보다 상세한 블록 구성도이다.
도 6을 참조하면, 상기 중앙처리부(120)는, 패싯항목 아이디 추출부(121), 검색 가중치 추출부(122), 데이터베이스 질의 확장부(123), 불리언 연산 조합부(124), 단백질 검색부(125), 단백질 상호작용 네트워크 검색부(126), 순위화 처리부(127) 등으로 구성된다.
여기에서, 상기 패싯항목 아이디 추출부(121)는 사용자 질의 입력부(110)의 각 항목에 대한 입력값과 매칭되는 데이터베이스의 값을 추출하는 기능을 수행한다.
또한, 상기 검색 가중치 추출부(122)는 상기 패싯항목 아이디 추출부(121)에서 데이터베이스 값 추출 시 그 상관 정도에 따른 검색 가중치를 추출 부여는 것으로, 이러한 상관도별 검색 가중치는 데이터베이스 구축 시 미리 정의된다.
상기 데이터베이스 질의 확장부(123)는, 사용자 질의 항목에 대하여 종 계층구조와 유전자 온톨로지 계층구조를 이용하여 사용자 질의를 확장하는 기능을 수행한다. 이때, 종 계층구조와 유전자 온톨로지 계층구조는 각각 종 DB(131)와 유전자 온톨로지 DB(133)를 참조한다.
또한, 상기 불리언 연산 조합부(124)는, 상기 데이터베이스 질의 확장부(123)에서 확장된 질의를 AND와 OR 등과 같은 불리언 연산자를 이용하여 이를 표현하는 기능을 수행한다.
상기 단백질 검색부(125)는 상기 불리언 연산 조합부(124)의 결과를 바탕으로 개념기반 검색과정을 통해 사용자의 의도와 의미적으로 일치하는 단백질 정보들을 탐색하는 기능을 수행한다.
또한, 단백질 상호작용 네트워크 검색부(126)는 상기 단백질 검색부(125)를 통해 검색된 단백질들 중 사용자가 선택한 단백질들의 리스트만을 포함하는 단백질 상호작용 네트워크 리스트 정보를 상기 단백질 상호작용 DB(134)를 참조하여 탐색한다. 이때, 사용자의 의도와 의미적으로 일치하는 검색을 위하여 확장된 패싯 질의어를 통한 개념 기반 검색과정을 수행한다.
한편, 상기 순위화 처리부(127)는 상기 단백질 검색부(125)와 단백질 상호작용 네트워크 검색부(126)의 검색결과 리스트에 대해, 상기 검색 가중치 추출부(122)의 값을 참조하여 사용자 의도와 가장 밀접한 관련을 가지는 목록순서로 순위화하여 사용자에게 출력한다.
도 7은 본 발명에 따른 단백질 검색 및 단백질 상호작용 네트워크 검색 과정에 대한 흐름도이다.
도 7을 참조하면, 먼저 질의어 입력 인터페이스를 통해 사용자로부터 각 패싯 질의 항목에 대해 입력받는다.(S701) 도 8은 상기 사용자 질의 입력부(110)의 윈도우 화면 즉, 사용자 인터페이스 화면을 예시하고 있다. 이를 통해 사용자는 각 패싯 질의 항목을 입력한다.
사용자의 질의 입력이 완료되면, 상기 패싯항목 아이디 추출부(121)는 상기 데이터베이스부(130)의 각각의 해당 DB로부터 사용자의 질의와 일치하는 패싯항목 아이디를 추출한다.(S702)
그리고, 상기 종 DB(131)와 유전자 온톨로지 DB(133)의 계층구조를 참조하여 상기 추출된 패싯항목 아이디의 계층구조를 확장한다. 또한, 이와 같이 사용자 질의를 확장하면서 그 관련정도에 따른 가중치 값들을 부여한다.(S703) 도 9에는 유전자 온톨로지 계층구조를 통해 사용자 질의를 확장하는 예를 보이고 있다.
그리고, 상기 확장된 결과물을 바탕으로 상기 데이터베이스부(130)로부터 각 패싯 항목에 대해 적합한 단백질을 검색한다.(S704)
이때, 상기 불리언 연산 조합부(124)는 상기 검색된 각 패싯 항목에 대한 단백질들에 대해 AND 또는 OR 등의 불리언 조합을 행하여 질의입력에 대한 사용자 의도를 반영한다. 이때, 불리언 조합 연산에는 가중치도 포함된다.(S705)
그리고, 이러한 불리언 연산 조합의 결과를 바탕으로 상기 데이터베이스부(130)로부터 사용자의 의도와 의미적으로 일치하는 단백질 리스트를 추출한다.(S706)
그리고, 상기 추출된 단백질 리스트에 대해 그 부여된 검색 가중치 값에 따라 순위화하고, 그 단백질 검색결과 리스트를 사용자 인터페이스를 통해 출력 표시한다.(S707) 도 10에는 이와 같은 단백질 검색결과 리스트에 대한 일 예를 도시하고 있다.
이와 같이 순위화된 단백질 리스트가 출력되면, 사용자는 그 중에서 원하는 단백질 항목들만을 선택하고 그에 대한 단백질 상호작용 네트워크 검색을 요구하게 된다.(S711)
이에 따라, 상기 단백질 상호작용 네트워크 검색부(126)는 먼저 상기 데이터베이스부(130)의 해당 DB들을 참조하여 상기 선택된 단백질 이름에 대한 단백질 아이디(ACCESS NUMBER)를 확장한다.(S712)
그리고, 상기 확장된 단백질 아이디에 대해 불리언 조합을 수행한다. 이때, 사용자 의도를 반영하기 위하여 검색 가중치도 포함된다.(S713)
그리고, 상기 불리언 조합 결과를 바탕으로 상기 단백질 상호작용 네트워크 DB(134)를 참조하여 사용자가 입력한 단백질들에 대한 단백질 상호작용 네트워크 리스트를 추출한다.(S714)
또한, 상기 추출된 단백질 상호작용 네트워크 리스트를 그 검색 가중치를 고려하여 순위화한 후, 그 단백질 상호작용 네트워크 검색결과를 사용자 인터페이스를 통해 출력 표시한다.(S715)
도 11는 이러한 단백질 상호작용 네트워크 검색결과 리스트에 대한 일 예를 보여주고 있다.
상기와 같은 본 발명의 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법은 컴퓨터로 읽을 수 있는 기록 매체에 저장될 수 있다. 이러한 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 기록매체를 포함하는 것으로, 그 예로는, 롬(Read Only Memory), 램(Random Access Memory), CD(Compact Disk)-Rom, DVD(Digital Video Disk)-Rom, 자기 테이 프, 플로피 디스크, 광데이터 저장장치 등이 있다. 또한, 이러한 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
상술한 바와 같이 본 발명에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템 및 방법은, 불리언 연산자와 is-a, part-of의 계층 구조를 갖는 유전자 온톨로지를 이용하여 확장된 패싯 질의의 개념 기반 검색을 수행하여 종래 색인어 기반 탐색의 단점들을 보완함으로써, 사용자 질의들 사이의 논리적 관계를 자연스럽게 표현할 수 있고 사용자의 의도와 의미적으로 일치하는 단백질 정보들을 효과적으로 검색할 수 있다.
또한, 확장된 패싯질의에 가중치를 적용하고 이에 따라 검색결과를 순위화함으로써 사용자에게 검색 편의를 제공할 수 있다.
이상에서 설명한 것은 본 발명에 따른 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템 및 방법을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기한 실시예에 한정되지 않고, 이하의 특허청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.

Claims (11)

  1. 단백질 및 단백질 상호작용 정보와 유전자 온톨로지 정보를 포함하는 데이터베이스부;
    사용자로부터 패싯 질의항목들을 입력받는 사용자 질의입력부;
    상기 사용자 질의항목에 대해 불리언 조합을 하고, 상기 데이터베이스부의 계층구조 정보를 참조하여 사용자 질의를 확장하는 중앙처리부;
    상기 질의 처리 결과를 바탕으로 개념기반 단백질 정보 검색을 수행하는 단백질 검색부; 및
    상기 검색된 단백질 리스트를 포함하는 단백질 상호작용 네트워크 정보를 검색 제공하는 단백질 상호작용 네트워크 검색부;로 구성되는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  2. 제 1항에 있어서, 상기 데이터베이스부는,
    계층구조에서의 상관도에 따라 각각의 데이터베이스 값에 대해 가중치를 미리 정의하여 두는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  3. 제 2항에 있어서, 상기 단백질 검색부, 및 상기 단백질 상호작용 네트워크 검색부는,
    질의 확장시 적용된 데이터베이스 값들의 가중치에 따라, 그 검색결과 리스트를 순위화하여 출력하는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  4. 제 1항에 있어서, 상기 데이터베이스부는,
    단백질 종의 계층구조 정보가 저장되는 종 DB;
    단백질 이름, 단백질 유사명, 유전자 이름을 포함하는 단백질 관련 정보와, 유전자 및 단백질 정보 데이터베이스를 갖는 외부 사이트의 URL 정보가 저장되는 단백질 DB;
    세포 성분, 생물학적 처리, 및 분자 기능의 세 부분으로 이루어진 단백질들간의 상호 연관성을 나타내는 유전자 온톨로지 정보 및 유전자 온톨로지 계층구조 정보가 저장되는 유전자 온톨로지 DB; 및
    단백질간의 물리 화학적 결합관계 정보인 단백질 상호작용 네트워크 정보를 갖는 단백질 상호작용 DB;를 포함하는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  5. 제 1항에 있어서, 상기 사용자 질의 입력부는,
    사용자로부터 단백질 이름, 단백질 종, 세포성분, 생물학적 처리, 분자 기능을 포함하는 패싯단위의 질의항목들을 입력받는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  6. 제 1항에 있어서, 상기 중앙처리부는,
    상기 데이터베이스부를 참조하여 사용자의 질의항목 입력값과 매칭되는 데이터베이스 값을 추출하는 패싯항목 아이디 추출부;
    상기 데이터베이스 값 추출 시 사용자 질의 입력값과의 상관 정도에 따른 검색 가중치를 부여하는 검색 가중치 추출부;
    상기 데이터베이스부의 계층구조 정보를 참조하여 사용자 질의를 확장하는 질의 확장부; 및
    상기 확장된 사용자 질의를 불리언 연산자를 사용하여 조합 표현하는 불리언 연산 조합부;로 이루어지는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 시스템.
  7. (a) 각종 단백질 및 단백질 상호작용 정보와 유전자 온톨로지 정보를 포함하여 데이터베이스화하는 단계;
    (b) 사용자로부터 단백질 검색을 위한 각 질의항목들을 입력받는 단계;
    (c) 상기 데이터베이스의 단백질 계층구조 정보와 불리언 조합을 통해 사용자 질의를 확장하는 단계;
    (d) 상기 확장된 사용자 질의를 바탕으로 개념기반 단백질 정보를 검색하고 그 검색결과 리스트를 순위화하여 출력하는 단계; 및
    (e) 상기 단백질 검색결과 리스트를 포함하는 단백질 상호작용 네트워크 정 보를 탐색하고 그 결과를 가중치 값에 따라 순위화하여 출력하는 단계;로 이루어지는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법.
  8. 제 7항에 있어서, 상기 (a)단계는,
    단백질 종의 계층구조 정보, 단백질 관련정보 및 단백질 정보를 갖는 외부 사이트의 URL 정보, 단백질 상호작용 네트워크 정보, 유전자 온톨로지 정보 및 유전자 온톨로지 계층구조 정보를 각각 데이터베이스화하여 관리하는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법.
  9. 제 7항에 있어서, 상기 (b)단계는,
    사용자로부터 단백질 이름, 단백질 종, 세포성분, 생물학적 처리, 분자 기능의 질의를 입력받는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법.
  10. 제 7항에 있어서, 상기 (c)단계는,
    상기 데이터베이스를 참조하여 각각의 사용자 질의항목과 일치하는 패싯항목 아이디를 추출하는 단계;
    상기 패싯항목 아이디 추출 시 사용자 질의 입력값과의 상관 정도에 따라 검색 가중치를 추출하는 단계;
    상기 데이터베이스의 계층구조를 참조하여 상기 추출된 각 패싯항목 아이디의 계층구조를 확장하는 단계; 및
    상기 확장 결과에 불리언 연산 조합을 수행하는 단계;로 이루어지는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법.
  11. 제 7항에 있어서, 상기 (e)단계는,
    상기 단백질 검색 결과들 중에서 사용자로부터 원하는 단백질들을 선택받는 단계;
    상기 데이터베이스를 참조하여 상기 선택된 단백질 명을 확장하는 단계;
    상기 확장된 단백질 명에 대해 불리언 조합을 수행하고 그 검색 가중치를 추출하는 단계; 및
    상기 불리언 조합 결과를 바탕으로 상기 데이터베이스의 단백질 상호작용 정보를 참조하여 사용자 선택 단백질들에 대한 단백질 상호작용 네트워크 리스트를 추출하고, 상기 추출된 검색 가중치 값에 따라 순위화하여 출력하는 단계;로 이루어지는 것을 특징으로 하는 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색 방법.
KR1020030087745A 2003-12-04 2003-12-04 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법 KR100551954B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030087745A KR100551954B1 (ko) 2003-12-04 2003-12-04 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030087745A KR100551954B1 (ko) 2003-12-04 2003-12-04 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20050054377A KR20050054377A (ko) 2005-06-10
KR100551954B1 true KR100551954B1 (ko) 2006-02-20

Family

ID=37249717

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030087745A KR100551954B1 (ko) 2003-12-04 2003-12-04 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법

Country Status (1)

Country Link
KR (1) KR100551954B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7869960B2 (en) 2005-12-08 2011-01-11 Electronics And Telecommunications Research Institute Method and apparatus for detecting bio-complexes using rule-based templates
KR100785780B1 (ko) * 2005-12-08 2007-12-18 한국전자통신연구원 규칙 기반 템플릿을 이용한 바이오 콤플렉스의 탐색 방법및 장치
KR100790870B1 (ko) * 2006-03-17 2008-01-03 삼성전자주식회사 유전자 서열 검색 방법 및 장치
KR100818357B1 (ko) * 2006-05-10 2008-04-02 (주)윕스 연관모델을 이용한 검색어 제시 시스템 및 그 제시 방법
KR100849497B1 (ko) * 2006-09-29 2008-07-31 한국전자통신연구원 온톨로지 매핑을 이용한 단백질 이름 정규화 방법
KR101106174B1 (ko) * 2010-03-05 2012-01-20 인하대학교 산학협력단 온톨로지 기반의 단백질 상호작용 검색 엔진

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023659A (en) * 1996-10-10 2000-02-08 Incyte Pharmaceuticals, Inc. Database system employing protein function hierarchies for viewing biomolecular sequence data
KR20010108116A (ko) * 1999-01-22 2001-12-07 추후보정 거대분자의 원자 구조의 전-게놈을 측정하기 위한 방법
KR20010109206A (ko) * 2000-06-01 2001-12-08 박준석, 유인청 네트워크 정보 통합 질의 인터페이스를 위한 방법 및장치
KR20020017076A (ko) * 2000-08-28 2002-03-07 인소란, 최정자 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023659A (en) * 1996-10-10 2000-02-08 Incyte Pharmaceuticals, Inc. Database system employing protein function hierarchies for viewing biomolecular sequence data
KR20010108116A (ko) * 1999-01-22 2001-12-07 추후보정 거대분자의 원자 구조의 전-게놈을 측정하기 위한 방법
KR20010109206A (ko) * 2000-06-01 2001-12-08 박준석, 유인청 네트워크 정보 통합 질의 인터페이스를 위한 방법 및장치
KR20020017076A (ko) * 2000-08-28 2002-03-07 인소란, 최정자 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
논문(유전자 온톨로지에서 제공하는 정보를 관계형 데이터베이스로 구축하고, 정보추출 시스템에서 얻어진 단백질 상호작용 정보와 조건정보를 데이터베이스에 통합함으로써 ''is-a'', ''part-of'' 관계를 포함한 보다 다양한 상호작용 관계를 이용하여 온톨로지를 확장하고 검증하는 시스템, 2002) *
한국정보과학회 2002년가을 학술발표논문집 Vol.29, No2, 2002 *

Also Published As

Publication number Publication date
KR20050054377A (ko) 2005-06-10

Similar Documents

Publication Publication Date Title
US8301437B2 (en) Tokenization platform
US9652558B2 (en) Lexicon based systems and methods for intelligent media search
US20080059512A1 (en) Identifying Related Objects Using Quantum Clustering
US20070244863A1 (en) Systems and methods for performing searches within vertical domains
EP1411448A2 (en) Data searching apparatus
US20070162546A1 (en) Sharing tags among individual user media libraries
US20070244862A1 (en) Systems and methods for ranking vertical domains
US20070073653A1 (en) Patent related search method and system
KR102069341B1 (ko) 전자 문서 검색 방법 및 그 서버
CN101395605A (zh) 比较性web搜索
US20100023505A1 (en) Search method, similarity calculation method, similarity calculation, same document matching system, and program thereof
JP2009043263A (ja) 質問分類方法およびそのシステム
JP2007188509A (ja) 検索結果提供方法および2段階検索システム実施方法
Li et al. Two-stage hashing for fast document retrieval
KR100551954B1 (ko) 유전자 온톨로지를 이용한 단백질 상호작용 네트워크 검색시스템 및 방법
JP2010277329A (ja) 近傍探索装置
Malhotra et al. An ingenious pattern matching approach to ameliorate web page rank
WO2007120781A2 (en) Systems and methods for performing searches within vertical domains
US6963865B2 (en) Method system and program product for data searching
Wang et al. Snpminer: A domain-specific deep web mining tool
Huang et al. Rough-set-based approach to manufacturing process document retrieval
JP2019125025A (ja) システム、文書データの管理方法、及びプログラム
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JP2005327225A (ja) 文書管理システム、文書管理方式、文書管理プログラム及びプログラム記録媒体
KR100665136B1 (ko) 단백질 기능 예측 장치 및 단백질 기능 예측 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091228

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee