KR101117603B1 - 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법 - Google Patents

상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법 Download PDF

Info

Publication number
KR101117603B1
KR101117603B1 KR1020110081189A KR20110081189A KR101117603B1 KR 101117603 B1 KR101117603 B1 KR 101117603B1 KR 1020110081189 A KR1020110081189 A KR 1020110081189A KR 20110081189 A KR20110081189 A KR 20110081189A KR 101117603 B1 KR101117603 B1 KR 101117603B1
Authority
KR
South Korea
Prior art keywords
information
map
query
link
biomedical
Prior art date
Application number
KR1020110081189A
Other languages
English (en)
Inventor
정종선
Original Assignee
(주)신테카바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)신테카바이오 filed Critical (주)신테카바이오
Priority to KR1020110081189A priority Critical patent/KR101117603B1/ko
Application granted granted Critical
Publication of KR101117603B1 publication Critical patent/KR101117603B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Abstract

본 발명은 사용자가 입력한 유전자, 화합물, 염기다형성정보, 약품정보 등의 바이오 메디컬 데이터에 대한 유전학적 정보 및 이들과 유사성을 갖는 정보를 검색하여 사용자에게 통합정보를 제공하는 시스템 및 방법에 관한 것으로, 본 발명은 (A) 사용자 단말기로부터 검색을 위한 검색 대상 데이터(Query, 쿼리)를 입력받는 단계와; (B) 상기 쿼리와 연관성이 있는 연관 쿼리를 산출하는 단계와; (C) 상기 쿼리 및 상기 연과 쿼리의 특성 정보를 검색하고, 상기 검색 결과를 이용하여 2차 링크 맵을 생성하는 단계를 포함하여 수행된다. 이와 같은 본 발명에 의하면, 새롭게 찾은 정보와 특성이 규명된 블럭버스터(Blockbuster) 유전자-질병, 약물-약물표적 및 변이체-질병과의 연관성을 쉽게 찾을 수 있기 때문에 연구자들의 고유한 유전자/약물후보/변이들에 주석작업을 위한 정보검색시간을 획기적으로 단축하는 효과가 있다.

Description

상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법 {SYSTEM AND METHOD FOR PROVIDING FUNCTIONAL CORRELATION INFORMATION OF BIOMEDICAL DATA BY GENERATING INTER-LINKABLE MAPS}
본 발명은 사용자가 입력한 유전자, 화합물, 염기다형성 정보, 약품정보 등의 바이오메디컬 기능정보 데이터에 대한 유전학적 정보 및 이들과 유사성을 갖는 정보를 효율적으로 검색하여 사용자에게 기능 및 질병연관성 정보를 제공하는 시스템 및 방법에 관한 것이다.
본원 발명의 출원인은 특허등록 0880531호에서, 대규모 데이터에 대하여 상기 데이터에 포함된 특정 검색 데이터로의 접근시간을 감소시키기 위하여, 데이터를 RVR 파일 및 RAT 파일 형태로 변환하여 저장하고, 저장된 데이터를 검색하는 방법에 대하여 특허등록을 받은 바 있다.
또한, 본원 발명의 출원인은 특허등록 0035959호에서, 사용자로부터 검색 대상이 되는 바이오메디컬 정보를 Query로 입력받고, 입력된 Query에 대한 정보와 이와 관련된 유관 데이터를 함께 검색하여 제공하도록 하는 바이오 메디컬 정보 제공 시스템 및 방법에 대하여 특허등록 받은 바 있다.
지금까지 알려진 유전자 정보(질병관련 유전자 포함)를 데이터베이스화 하는 경우, 그 서열개수는 약 61,000,000개에 달하고, 화합물 정보를 데이터베이스화 하는 경우, 그 개수는 약 28,000,000 개에 달하며, 염기다형성 정보를 데이터베이스화 하는 경우 그 개수는 약 23,000,000 개에 달한다.
여기서 상기 염기다형성 정보라 함은, SNP(Single Nucleotide Polymorphism)를 말하는 것으로, 다른 말로 '개체간 단일염기변이, 단일유전자변이, 단일염기다형성' 등으로 일컬어진다.
SNP는 세포핵 속의 염색체가 갖고 있는 30억개의 염기 서열 중 개인의 편차를 나타내는 약 4백만 개의 염기변이를 말하고, 여러 사람들의 DNA 염기순서를 비교하며 수백 염기 서열을 읽으면 흔히 다른 염기가 같은 위치에서 발견되는데 이러한 염기다형성을 SNP이라고 한다.
사람마다 머리색깔, 피부, 키, 눈색깔 등이 다르고 같은 약을 사용해도 사람마다 반응이 제각각 다르게 나타나는 것도 모두 SNP 때문이고, 한국인이 서양인에 비해 위암과 간암에 잘 걸리는 것도 이러한 차이에서 기인한다.
SNP가 단백질을 만드는 부분에 있을 경우 엉뚱한 단백질을 만들어 치명적 질병을 일으킬 수 있다. 혈우병 역시 단 하나의 염기변이로 일어난다.
하지만 모든 SNP가 질병을 일으키는 것은 아니다. 대부분(약 400만개 SNP 중 약 95%)은 유전적 근접성을 알려주는 지표 역할을 한다. 즉 가계가 가까우면 유전적으로 비슷하고 이에 따라 질병의 발병유형도 비슷하다는 것이다.
때문에 SNP의 패턴을 분석하면 어떤 유전적 형질일 때 어떤 병이 많은지, 같은 병이라도 한국인과 미국인은 발병 원인이 왜 다른지, 이에 따라 효과적인 약물이 무엇인지를 판단하는 근거가 된다.
따라서 SNP연구는 맞춤 의약, 신약 개발에까지 연결된다. 개인의 다양한 생리작용과 체질의 변화, 발병 가능성을 조기에 진단예측할 수 있으며 환자에 따라 맞는 약을 진단, 처방할 수 있다.
도 1에는 특허등록 0035959호에 개시된 바이오 메디컬 정보 제공 시스템의 구성이 블록도로 도시되어 있다.
이에 도시된 바와 같은 종래 기술에 의해 바이오메디컬 정보를 제공하는 경우, 특정 Query가 입력되는 경우, 상기 입력된 Query와 유사한 동종의 2차 Query들이 생성되고, 각각의 2차 Query들과 연관된 이종의 바이오메디컬 정보를 산출하여 사용자에게 제공한다.
그러나, 이와 같은 종래기술에는 다음과 같은 문제점이 있다.
일반적으로, 본 분야의 검색시스템은 이용자가 미확인된 바이오메디컬 데이터의 특성을 파악하기 위하여 사용한다. 즉, 입력되는 Query는 특성이 규명되지 않은 바이오메디컬 데이터가 대부분이고, 본 분야의 검색시스템을 이용하여 검색된 결과 대부분 역시 특성이 규명되지 않은 바이오 메디컬 데이터가 대부분이며, 검색결과의 데이터 양 역시 방대한 양의 결과가 산출된다.
따라서, 종래기술에서는 입력된 Query와 특성이 규명되어 확인된 바이오메디컬 정보와의 연관성을 찾는데 과도한 시간이 소요되고, 이 역시 연구자가 검색된 결과로부터 수작업을 통해 행해져야 하므로, 본 시스템의 효율성을 저해하는 문제점이 있었다.
대한민국 특허등록 제0880531호 대한민국 특허등록 제0035959호
본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 안출된 것으로, 검색 대상 데이터에 대한 정보와 이와 관련된 유관 데이터를 함께 검색하여 제공하되, 1차 검색된 결과물과 특성이 규명된 기준데이터들과의 연관성을 파악하여 사용자에게 알려주는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법을 제공하는 것이다.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명은 사용자 단말리기로부터 검색 대상 데이터(쿼리, Query)를 입력받아 검색을 수행하여 검색결과를 상기 사용자 단말기에 제공하는 바이오메디컬 연관정보 제공 시스템에 있어서, 사용자로부터 쿼리를 입력받고, 상기 검색 대상 데이터와 관련된 바이오 메디컬 정보를 검색하여 분석하는 제어부와; 바이오 메디컬 정보를 저장하는 데이터 베이스를 포함하여 구성되고: 상기 제어부는, 사용자로부터 입력된 쿼리 및 상기 쿼리와 관련성 있는 연관 쿼리를 상기 데이터베이스에서 검색하여 상기 쿼리 및 연관 쿼리에 대한 특성정보를 검색하는 검색엔진과; 상기 검색엔진으로부터 검색된 상기 쿼리 및 연관 쿼리에 대한 특성정보를 이용하여 2차 링크맵을 생성하는 링크 맵 생성부를 포함하여 구성되며: 상기 데이터베이스는, 유전자 정보를 저장하는 유전자DB, 화합물 정보를 저장하는 화합물DB, 염기서열 및 염기다형성 정보에 관한 블록(LD, Linkage disequilibrium) 정보가 저장되는 염기다형성DB, 약품 정보를 저장하는 약품DB, 항원 정보를 저장하는 항원DB 또는 바이오메디컬 정보를 제공하고 있는 웹페이지들의 링크 정보를 저장하는 관련링크DB 중 어느 하나 이상을 포함하여 구성되는 기본DB와; 유전자, 화합물, 염기다형성, 약품, 항원 또는 관련링크 중 어느 둘 이상 간의 연관관계가 저장되는 컨버전스DB를 포함하여 구성된다.
이때, 유전자DB, 화합물DB, 염기다형성DB, 약품DB 또는 항원DB 는, 대상물질의 특징을 저장하는 백본 DB와, 각 대상물질들 사이의 연관성이 저장되는 군집 DB를 포함하여 구성될 수도 있다.
그리고 상기 기본DB는, 구분 인자로 구분된 형태의 데이터(RVR 파일)로 저장되고; 상기 구분 인자의 기록위치를 저장한 인덱스 파일(RAT 파일)을 포함하여 구성됨될 수도 있다.
또한, 상기 데이터베이스는, 특성이 규명된 주요 바이오 메디컬 정보들에 대한 링크 맵이 저장된 기준 맵 DB를 더 포함하여 구성되고: 상기 제어부는, 상기 2차 링크 맵과 상기 기준 맵 DB에 저장된 링크 맵을 비교 연산하여, 상기 사용자로부터 입력된 Query와 상기 주요 바이오메디컬 정보와의 연관관계를 나타내는 3차 링크 맵을 생성할 수도 있다.
그리고 상기 기준 맵 DB에 저장된 링크 맵은 해시함수에 의해 인코딩되어 저장되고: 상기 링크맵 생성부는, 상기 2차 링크 맵을 상기 기준 맵 DB에 저장된 링크 맵에 적용된 키코드와 동일한 키코드 값을 갖는 해시함수로 인코딩하여 생성하며: 상기 비교 연산부는, 동일한 키코드를 갖는 해시함수에 의해 인코딩된 상기 기준 맵 DB의 링크맵과 상기 2차 링크 맵을 비교하여 3차 링크 맵을 생성할 수도 있다.
그리고 상기 비교 연산부는, 상기 3차 링크 맵을 생성함에 있어, 각 인자들의 연결 단계에 따라 가중치를 부여하여 연관도를 산출할 수도 있다.
한편, 본 발명은 (A) 사용자 단말기로부터 검색을 위한 검색 대상 데이터(Query, 쿼리)를 입력받는 단계와; (B) 상기 쿼리와 연관성이 있는 연관 쿼리를 산출하는 단계와; (C) 상기 쿼리 및 상기 연과 쿼리의 특성 정보를 검색하고, 상기 검색 결과를 이용하여 2차 링크 맵을 생성하는 단계를 포함하여 수행되는 링크 맵 생성을 통한 바이오 메디컬 연관 정보 제공 방법을 포함한다.
이때, 본 발명은 (D) 상기 제(C) 단계에서 생성된 2차 링크 맵과, 기준 맵 DB에 저장된 링크 맵을 비교하여 사용자로부터 입력된 Query와 상기 주요 바이오 메디컬 정보와의 연관관계를 나타내는 3차 링크맵을 생성하는 단계와; (E) 상기 2차 링크 맵과 상기 3차 기준 맵을 상기 사용자 단말기에 제공하는 단계를 더 포함하여 수행되고: 상기 기준맵 DB는, 특성이 규명된 주요 바이오 메디컬 정보들에 대한 링크 맵이 저장될 수도 있다.
그리고 상기 기준 맵 DB에 저장된 링크 맵은 해시함수에 의해 인코딩되어 저장되고: 상기 2차 링크 맵은, 상기 기준 맵 DB에 저장된 링크 맵에 적용된 키코드와 동일한 키코드 값을 갖는 해시함수로 인코딩하여 생성되며: 상기 3차 링크 맵은, 동일한 키코드를 갖는 해시함수에 의해 인코딩된 상기 기준 맵 DB의 링크맵과 상기 2차 링크 맵을 비교하여 생성될 수도 있다.
또한, 상기 3차 링크 맵은, 각 인자들의 연결 단계에 따라 가중치가 부여되어 산출된 연관도를 포함하여 생성될 수도 있다.
그리고 (d) 상기 제(C)단계에서 생성된 제2차 맵 상에 기능이 규명된 인자가 포함되어 있는지 여부를 판별하는 단계와; (e) 상기 (d) 단계의 판단결과, 상기 제2차 맵 상에 기능이 규명된 인자가 포함되지 않은 경우, 모집단 DB를 통해 교차링크 및 통계정보에 대한 선행연산을 수행하는 단계를 더 포함하여 수행되고: 상기 (d) 단계의 판별은, 기준맵 DB를 통해 수행될 수도 있다.
한편 본 발명은 1) 유전자, 약물, 변이, 질병 및 기능들에 대한 릴랙싱(혹은 유사성기반 군집)기법을 통한 BID(바이오메디컬 ID)(gene ID, compound ID, mutation ID, functional ID, disease ID)에 기초한 2차 링크 맵을 생성한다.
2) 각각의 맵에는 유전자-유전자, 유전자-약물, 유전자-질병 및 유전자-변이체 등의 연관성 정보를 가지는데 2개의 다른 맵에 있는 2개의 다른 2차 링크 연관성 정보를 연결하면 3차 링크 연관성 정보를 생성한다. 따라서, 2차링크 맵과 맵에 존재하는 모든 공통 BID를 검출하는 방식으로 3차 링크를 형성 할 수 있다. 그리고, 이것을 통해서 BID간의 새로운 연관성 정보를 얻을 수 있다.
3) 본 방법에 의하여 생성된 사용자의 쿼리 기반 맵과 선행계산에 의한 주요 약물, 유전자, 변이, 질병 등의 맵과 비교하여 사용자쿼리 맵을 주요 약물-질병 맵과의 연관성을 형성하는 시스템으로 사용 가능하다.
4)각각의 쿼리 맵에서 2차 링크 정보는 크게 3가지 다른 방식으로 저장을 한다. (1)Query 2 DB Link와, (2)DB 2 Query Link 및 (3) Cross-Link에 해당하는 Analytics로 구성된다. 그리고, Query 2 DB Link와 DB 2 Query Link들은 One 2 Many, Many 2 One정보 들을 보여주지만 전체의 통계정보는 보여주지 못한다. 그러나, 교차링크(Cross-Link) 부분의 Analytics은 쿼리와 연관된 DB정보들 사이의 교차 기능링크(Cross Functional Link) 정보 혹은 통계(statistics)정보를 위한 모듈들을 모아놓은 섹션이고 아래 (1) ~ (7)중에 해당하는 모듈을 포함한다.
(1) Disease Top 10,
(2) Pathway Top 10,
(3) Disease-Pathway Top 10,
(4) PCI Validation
(5) ChemModAction
(6) M2BMlink (map to blockbuster map link)
(7) IQC(inter query correlation)
따라서, 본 Analytics는 알려진 정보를 수집하여 기능링크 및 통계 정보도 제공하지만 알려진 정보가 단순 검색에 의하여 검색 될 수 없는 경우는 *모집단 DB (1)PDB-ligand complex, (2)Known Chemical Mode of Action DB, (3)Integrated PPI(protein-protein interaction) DB 및 (4)Integrated Disease-pathway를 사용하여 교차링크 및 통계정보에 대한 선행계산을 수행한다; 그리고 각각의 기능은 (1)단백질-리간드 컴플랙스를 활용한 유전자-화합물 연관성 검증 정보 제공 (2) 많은 경우에 chemical mode of action이 알려져 있지 않지만 상동성 정보를 사용하면 추가로 예측이 가능하다. (3-4)또한, 특정 ppi, pathway, 혹은 disease-pathway에 쿼리가 맵핑이 될 수 있지만 하나일 경우가 대부분이기 때문에 랭크가 의미가 없다. 그러나, 상호작용을 통한 노드를 2차 3차까지 확장하면 pathway의 랭크가 가능하다. 또한, 상동성에 의하여만 링크가 가능하면 상동성에 의한 chemical mode of action도 예측할 수 있다. 이런 방식으로 모집단 DB의 분석을 통하여 예측된 정보까지도 맵과 맵을 링크할 수 있도록 2차 링크 맵을 생성하면 바이오메디컬 고급 기능정보들에 대한 맵과 맵의 고급 3차 링크 생성도 가능하다.
특히, 본 발명에서 3차 링크 맵을 생성하는 데는 Analytics섹션에 있는 모듈 (6) M2BM Link 및 (7) IQC Link 기법이 적용된다.
M2BMLink(map 2 blockbuster map link)는 2개의 다른 맵을 연결하는 모듈이다. 쿼리 및 쿼리 릴랙싱 정보를 사용하여 쿼리-맵을 형성하면 맵은 2차링크 맵이 된다. 즉, 유전자(1차노드)에 다양한 정보링크(2차노드)가 형성이 된다. 그리고, 이러한 2차 링크로 구성된 2개의 다른 맵을 연결하면 3차링크 맵이 만들어 질 수 있다. 특히, 2번째 맵이 선행계산에 의한 유명한 블록버스터 유전자, 약물 맵이면 사용자는 새롭게 발견한 신규 유전자를 블록버스터 유전자와 혹은 블록버스터 약물과 링크가 가능하기 때문에 본 워크플로우 시스템에서 가장 강력하고 유용한 연관성 정보를 제공 할 수 있다.
또한, IQC(Inter Query Correlation)은 다중 쿼리가 주어지면 각 쿼리에 대한 2차 링크 맵을 구성하고 모든 구성된 2차 링크 쿼리 맵들사이에 존재하는 3차 링크 맵 생성을 위한 다리(bridge) 혹은 노드(node)를 찾고 다리 혹은 노드를 통하여 다중 유전자 쿼리, 다중 약물 쿼리, 다중 SNP 쿼리등 사이에 존재하는 연관성 정보를 검출할 수 있다.
과학자들은 오믹스연구를 통하여 새로운 질병연관성을 가지는 유전자를 찾는다. 그러나, 생물학적으로 찾은 이러한 질병연관성 유전자, 신약후보 및 질병의 원인 변이는 세상에 알려지지 않은 새로운 유전자, 새로운 약물 그리고 새로운 변이 일 뿐이다.
따라서, 이렇게 찾은 새로운 유전자/약물후보/변이의 유용성을 설명하기 위한 정보를 찾는데 많은 어려움을 가진다. 외냐하면 신규 유전자, 신규 약물후보 및 신규 변이는 세상에 알려져 있지 않기 때문이다.
(1)본 방법을 사용하면 새롭게 찾은 정보와 블럭버스터(Blockbuster) 유전자-질병, 약물-약물표적 및 변이체-질병과의 연관성을 쉽게 찾을 수 있기 때문에 연구자들의 고유한 유전자/약물후보/변이들에 주석작업을 위한 정보검색시간을 획기적으로 단축 하는 효과가 있다.
(2)현재까지 릴랙싱 방법에 의한 맵핑 방법과 2개의 연관성이 알려지지 않은 유전자, 약물, 질병에 대한 2차 링크 정보들을 가지고 3차 링크를 만들고 이것들을 사용한 기능 연관성을 예측하는 방법은 보고된 것이 없다. 따라서, 본 방법을 적용하면 2차 및 3차 단계의 링크들 간의 연결을 통한 새로운 약물기능 및 질병 메카니즘을 밝히는데 중요한 역할을 할 수 있다.
(3)또한, 오믹스연구(게노믹스, 프로티오믹스, 트렌스크립토믹스, 등)의 다음 단계의 계획(논문 및 임상실험)등을 위한 방향성을 제공받을 수 있다.
위에서 살핀 바와 같은 본 발명에 의한 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법에서는 다음과 같은 효과를 기대할 수 있다.
즉, 본 발명에 의하면, 새롭게 찾은 정보와 특성이 규명된 블럭버스터(Blockbuster) 유전자-질병, 약물-약물표적 및 변이체-질병과의 연관성을 쉽게 찾을 수 있기 때문에 연구자들의 고유한 유전자/약물후보/변이들에 주석작업을 위한 정보검색시간을 획기적으로 단축하는 효과가 있다.
또한, 본 발명에 의하면, 현재까지 릴랙싱 방법에 의한 맵핑 방법과 2개의 연관성이 없는 유전자, 약물, 질병에 대한 2차 및 3차 링크들 간의 연결을 만드는 방법은 기술적인 어려움으로 아직 보고된 것이 없다. 따라서, 본 방법을 적용하면 2차 및 3차 단계의 링크들 간의 연결을 통한 새로운 약물기능 및 질병메카니즘을 밝히는데 중요한 역할을 할 수 있는 장점이 있다.
그리고 본 발명에 의하면, 오믹스연구(게노믹스, 프로티오믹스, 트렌스크립토믹스, 등)의 다음 단계의 계획(논문 및 임상실험)등을 위한 방향성을 제공받을 수 있는 장점이 있다.
도 1은 종래기술에 의한 바이오 메디컬 정보 제공 시스템의 구체적인 실시예의 구성을 도시한 블록도.
도 2는 본 발명에 의한 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템의 구체적인 실시예의 구성을 도시한 블록도.
도 3은 본 발명에 의한 유전자 군집 DB의 일 예를 단순화 및 가시화하여 도시한 예시도.
도 4는 본 발명에 의한 화합물 군집 DB의 일 예를 단순화 및 가시화하여 도시한 예시도.
도 5는 본 발명에 의한 연관 블록 DB의 일 예를 단순화 및 가시화하여 도시한 예시도.
도 6은 본 발명에 의한 컨버전스 DB의 일 예를 단순화 및 가시화하여 도시한 예시도.
도 7은 본 발명에 의한 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법의 구체적인 실시예를 도시한 흐름도.
도 8은 본 발명에 의한 2차 링크 맵의 구체적인 실시예를 도시한 예시도.
도 9는 본 발명에 의한 기준 링크 맵의 구체적인 실시예를 도시한 예시도
도 10은 본 발명에 의한 링크 맵의 구성의 일 예를 도시한 예시도.
도 11은 본 발명에 의한 3차 링크 맵 생성을 위한 가중치 부가의 일 예를 가시적으로 도시한 예시도.
도 12은 본 발명에 의한 3차 링크 맵 생성에 있어 가중치가 부여된 가중치 프로파일의 일 예를 가시적으로 도시한 예시도.
도 13은 본 발명에 의한 3차 링크 맵 생성에 있어 링크 맵 간의 매칭의 일 예를 가시적으로 도시한 예시도.
도 14a 내지 도14d는 본 발명을 이용하여 암 관련 유전자를 Query로 입력하여 검색을 실시하는 일 예를 도시한 예시도.
이하에서는 상기한 바와 같은 본 발명에 의한 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법의 구체적인 실시예를 첨부된 도면을 참고하여 상세하게 설명한다.
도 2는 본 발명에 의한 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템의 구체적인 실시예의 구성을 도시한 블록도이다.
이에 도시된 바와 같이, 본 발명에 의한 바이오메디컬 연관 정보 제공 시스템은 사용자 단말기(100)와 상기 사용자 단말기(200)에 바이오메디컬 정보를 제공하는 바이오메디컬 정보제공서버(100)를 포함하여 구성된다.
상기 바이오메디컬 정보제공 서버(100)는 사용자로부터 검색 대상 데이터(이하 'Query'라 함)를 입력받아 검색을 수행하여 링크맵을 생성하고, 이들 링크 맵들을 비교 연산하는 제어부(110)을 포함하여 구성된다.
한편, 상기 제어부(110)는 검색엔진(112), 링크맵 생성부(114) 및 비교 연산부(116)를 포함하여 구성된다.
상기 검색엔진(112)은 사용자로부터 입력된 Query와 관련성 있는 연관 Query들을 후술할 데이터베이스로부터 검색하고, 상기 Query 및 연관 Query들에 대한 특성정보를 데이터베이스에서 검색하는 부분이다.
그리고 상기 링크맵 생성부(114)는 상기 검색엔지(112)에서 검색된 상기 Query 및 연관 Query에 대한 검색 결과를 이용하여 2차 링크맵을 생성하는 부분이다.
또한 상기 비교 연산부(116)는 상기 링크맵 생성부(114)에서 생성된 2차 링크맵과 후술할 데이터베이스에 저장된 기준 링크맵과 비교하여 3차 링크 맵을 생성하는 부분이다.
한편, 상기 바이오메디컬 정보제공 서버(100)는 데이터베이스(120)를 포함하여 구성된다.
이때, 상기 데이터베이스(120)는 유전자DB(112A), 화합물DB(122B), 염기다형성DB(122C), 약품DB(122D), 항원DB(122E) 및 관련링크DB(122F), 컨버전스DB(124) 및 기준맵DB(126)를 포함하여 구성된다.
먼저, 상기 유전자DB(112A)는 유전자 정보를 저장하는 부분으로, 상기 유전자DB(112A)는 도면에 도시하지는 않았지만, 유전자 백본 DB(Data base)와 유전자 군집 DB를 포함하여 구성된다.
상기 유전자 백본 DB는 현재까지 알려진 유전자와 이들의 밝혀진 특성을 저장하는 부분이다.
한편, 현재 알려진 유전자의 개수는 약 61,000,000 개에 달하고, 지속적으로 수많은 유전자가 발견되고 있는바, 이들 방대한 양의 데이터에 대한 검색속도를 고려하여 상기 유전자 백본 DB(122)는 구분 인자로 구분된 데이터(RVR 파일)로 저장되고, 이들 각 구분 인자의 기록위치를 저장한 인덱스 파일(RAT 파일)을 포함하여 구성되는 것이 바람직하다.
여기서 RVR 파일이란 원본 데이터를 설정된 구분 단위로 구분하여 변환된 파일 형식을 말하고, RAT 파일이라 함은 상기 RVR 파일의 레코딩 단위의 위치 및 관계를 기록한 파일을 말하는 것으로 상기 RVR 파일 및 RAT 파일의 구조 및 특성에 대하여는, 본 출원인의 선 특허등록 제0880531호의 공개공보에 개시된 바 있으므로, 이에 대하여 본 명세서에서 상세히 설명하지는 않도록 한다.
다음으로 상기 유전자 군집 DB는 유전자 백본 DB에 포함된 각 유전자들 간의 연관성을 저장하는 부분이다.
상기 유전자 군집 DB는 상기 유전자 백본 DB에 포함된 각 유전자에 대하여, 연관된 유전자를 정리하여 저장할 수도 있으나, 이와 같은 경우 유전자 군집 DB의 데이터 량이 과도하게 방대해지므로, 바람직하게는 각 유전자에 대한 관련도에 대한 링크 구조로 저장되는 것이 바람직하다.
예를 들어, 도 3에 도시된 바와 같이, 각 유전자들이 연관도에 따라 서로 링크된 구조로 연결된다. 이때, 상기 연관도의 구체적인 내용을 살펴보면, 동일 유전자의 각기 종에서 명칭/유전자 구조의 유사성/연관 형질의 연관성 등일 수 있다.
즉, 어떤 특정 간암표지마커 유전자가 인간에게는 CES1 로 표현되고, 이와 동일한 유전자가 생쥐에게는 Ces1d로 표현된다고 가정할 때, 이들 유전자 간에는 특별한 연관성이 있다고 설정된다.
실제로 특정 유전자가 특정 종에서 특정 질병과 관련된 유전 형질을 발현하는 경우, 동일 유전자가 다른 종에서도 또 다른 어떤 질병과 관련된 유전 형질을 나타내는데 관여하는 경우가 많다.
따라서 본 발명에 의한 바이오메디컬 정보제공 서버(100)를 이용하여 미지의 특정 유전자를 검색하여 이와 관련된 다른 유전자의 특성을 살필 수 있어, 미지의 유전자 특성을 연구하는데 큰 기본 지식이 될 수 있다.
또한 상기 화합물DB(122B)는 화합물 정보를 저장하는 부분으로, 상기 화합물DB(122B)는 도면에 도시하지는 않았지만, 화합물 백본DB와 화합물 군집DB를 포함하여 구성된다.
상기 화합물 백본 DB는 현재까지 알려진 화합물과 이들의 밝혀진 특성을 저장하는 부분이다.
한편, 현재 알려진 화합물의 개수는 약 28,000,000 개에 달하고, 지속적으로 수많은 화합물이 발견 또는 만들어지고 있는바, 이들 방대한 양의 데이터에 대한 검색속도를 고려하여 상기 화합물 백본 DB 역시 RVR 파일 및 RAT 파일로 구성되는 것이 바람직하다.
그리고 상기 화합물 군집 DB는 화합물 백본 DB에 포함된 각 화합물 간의 연관성을 저장하는 부분이다.
상기 화합물 군집 DB는 상기 화합물 백본 DB에 포함된 각 유전자에 대하여, 연관된 화합물을 정리하여 저장할 수도 있고, 각 유전자에 대한 관련도에 대한 링크 구조로 저장될 수도 있다.
상기 화합물 군집 DB(134)는 각 화합물들이 연관도에 따라 정리되어 저장되는데, 이때, 상기 연관도는 화합물의 특성상 화합물 구조/화학적 특성(약리효과) 등일 수 있다.
예를 들어, 도 4에 도시된 바와 같이, 각 화합물의 구조적 유사성에 따라 각 군(1군:유사성 90%이상, 2군 : 유사성 80%~90% 등...)으로 나누어 정리될 수 있다.
실제로, 특정 화합물과 구조적을 유사한 화합물인 경우, 동일 또는 유사한 화학적 특성(약리효과)를 나타내는 경우가 많고, 따라서, 본 발명에 의한 미지의 특정 화합물을 검색하여 이와 관련된 다른 화합물의 특성을 살피면, 미지의 화합물 특성을 연구하는데 큰 기본 지식이 될 수 있다.
한편, 상기 염기다형성DB(122C)는 염기서열 및 염기다형성 정보에 관한 블록(LD, Linkage disequilibrium) 정보가 저장되는 부분으로, 특정 종(이하, 인간을 예로 들어 설명한다)의 염기서열 구조를 저장하는 염기서열 기본 DB와, 상기 염기서열 중 특정 집단 내에서 유전되는 연관블록(LD : Linkage disequilibrium)에 대한 정보를 저장하는 연관블록 DB 그리고 특정 염기 변형에 대한 질병/유전과 관련된 정보가 저장되는 형질정보 DB를 포함하여 구성된다.
그리고 상기 염기서열 기본 DB는 사용자로부터 Query가 부분 염기서열로 입력된 경우, 상기 Query가 인간 전체 염기서열 구조 중 어느 부분에 해당하는지를 검색하기 위한 기준 염기서열을 저장하는 부분이다.
또한, 상기 연관블록DB는 전체 유전자 중 특정 집단에게 유전되는 염기서열 블록(이하 '연관블록'이라 함)에 대한 정보가 저장되는 부분이다.
염기다형성 정보(SNP: single nucleotide polymorphism)는 DNA의 염기 서열 중에 한 염기의 변형에 의하여 대략 인구 중에 4%이상이 변이를 가지면 그 위치의 염기를 다형성정보(SNP)라고 부르고, 어떤 염기다형성정보는 단백질의 아미노산의 돌연변이(mutation)을 유발한다.
특히, 이러한 염기다형성정보는 인종에 따라 유사한 특성을 갖고, 이러한 연관블록에서의 염기다형성 정보는 동일 집단에 유전(inheritance)되는 경향을 가진다.
따라서, 상기 연관블록DB는 도 5에 도시된 바와 같이, 전체 염기서열 구조 중에서, 특정 집단에게 유전되는 연관블록에 대한 정보가 각각의 특정 집단(예를 들면 인종/성별 등)에 대하여 정리되어 저장된다.
한편, 형질정보 DB에는 특정 염기 변형에 대한 질병/유전과 관련된 정보가 저장된다,
따라서, 입력된 Query에 해당하는 염기서열의 위치를 파악하고, 상기 Query의 위치가 연관블록을 포함하고 있으면, 이를 통해 Query의 인종/성별 등의 집단 속성을 파악할 수 있다.
상기 약품DB(122D)는 약품 정보를 저장하는 부분으로, 상기 약품DB(122D)는 도면에 도시하지는 않았지만, 약품 백본DB와 약품 군집DB를 포함하여 구성된다.
상기 약품 백본 DB는 현재까지 알려진 약품(FDA Drug 기준)과 이들의 밝혀진 특성을 저장하는 부분이고, 상기 약품 군집 DB는 상기 약품 백본 DB에 포함된 각 약품들 간의 연관성을 저장하는 부분이다.
한편, 상기 항원DB(122E)는 항원 정보를 저장하는 부분으로, 상기 항원DB(122E)는 도면에 도시하지는 않았지만, 항원 백본DB와 항원 군집DB를 포함하여 구성된다.
상기 항원 백본 DB는 현재까지 알려진 항원과 이들의 밝혀진 특성을 저장하는 부분이고, 상기 항원 군집 DB는 상기 항원 백본 DB에 포함된 각 항원들 간의 연관성을 저장하는 부분이다.
그리고 상기 관련링크DB(122F)는 바이오메디컬 정보를 제공하는 웹페이지 링크 정보를 저장하는 부분으로, 상기 관련링크DB(122F)는 도면에 도시하지는 않았지만, 관련링크 백본DB와 관련링크 군집DB를 포함하여 구성된다.
상기 관련링크 백본 DB는 현재 바이오메디컬 정보를 제공하고 있는 웹페이지들의 링크 정보를 저장하는 부분이고, 상기 관련링크 군집 DB는 상기 관련링크 백본 DB에 포함된 각 링크 정보(웹페이지 주소)들 간의 연관성을 저장하는 부분이다.
상기 컨버전스DB(124)는 유전자, 화합물, 염기다형성, 약품, 항원 및 관련링크 간의 연관관계를 저장하는 부분으로, 각각의 연관 DB를 포함하여 구성된다.
즉, 유전자/화합물, 유전자/염기다형성, 화합물/염기다형성 등과 같이 상호 간의 연관관계가 저장된다. 도 6에는 유전자, 염기다형성 및 화합물 간의 상호 연관 관계가 저장된 컨버전스 DB의 일 예가 도시되어 있다.
이를 통해 상기 검색엔진(112)은 사용자로부터 Query가 입력된 경우, 상기 입력된 Query 및 추출된 연관 Query들을 상기 컨버전스DB(124)를 통해 검색하여, 상기 Query 및 연관 Query들과 관련된 유전자, 화합물, 염기다형성, 약품, 항원 및 관련링크 정보를 검색한다.
예를 들어, 사용자에 의해 특정 유전자가 Query로 입력된 경우를 가정한다.
이 경우 상기 검색 엔진(112)은 상기 유전자를 유전자 백본 DB에서 검색하여 상기 유전자에 대한 정보를 추출하고, 상기 유전자 군집 DB를 통해 연관 유전자를 검색하여 상기 연관 유전자들에 대한 정보를 상기 유전자 백본 DB를 통해 추출한다.
또한, 상기 유전자 및 연관 유전자들을 상기 컨버전스 DB(124)에서 검색하여 상기 유전자 및 연관 유전자들과 관련된 화합물, 염기다형성 정보(염기서열), 약품, 항원 및 관련링크 정보를 검색한 이후, 이들을 이용하여 2차 링크 맵을 생성한다.
상기 2차 기준 맵의 구성은 이후, 도 8을 설명함에 있어 상세히 설명하도록 한다.
한편, 상기 기준맵DB(126)는 특성이 규명된 바이오메디컬 정보 중 널리 상용화 되거나 임상 연구에 있어 널리 활용되고 있는 바이오 메디컬 정보들에 대한 링크 맵을 저장하는 부분이다.
즉, 유전자, 화합물, 염기다형성, 약품 또는 항원(정보제공 웹페이지를 포함할 수도 있다)들 중 그 특성이 파악되어 바이오 산업에서 널리 활용되거나 기준이 되는 것들(블록버스터 유전자, 블록버스터 화합물 등)을 위에서 설명한 바와 같은 바이오 메디컬 정보제공 서버를 이용하여 검색을 실시하고, 이로부터 생성된 각각의 2차 링크 맵 정보를 저장하는 부분이다.
이하에서는 본 발명에 의한 바이오메디컬 연관 정보 제공 방법을 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 7은 본 발명에 의한 복수 링크 맵 생성을 통한 바이오 메디컬 연관 정보 제공 방법의 구체적인 실시예를 도시한 흐름도이고, 도 8은 본 발명에 의한 2차 링크 맵의 구체적인 실시예를 도시한 예시도이며, 도 9는 본 발명에 의한 기준 링크 맵의 구체적인 실시예를 도시한 예시도이고, 도 9는 본 발명에 의한 링크 맵의 구성의 일 예를 도시한 예시도이다.
이들 도면에 도시한 바와 같이, 본 발명에 의한 바이오 메디컬 연관 정보 검색은 사용자 단말기(200)로부터 검색을 위한 Query를 입력받는 것으로부터 시작된다(S100).
사용자로부터 Query가 입력되면, 상기 Query를 이용하여 2차 링크 맵을 생성한다(S200).
상기 2차 링크 맵 생성과정을 상세히 설명하면, 먼저 상기 입력된 Query가 어떤 형태(유전자/화합물/약품 등)의 Query인지 판단하고, 해당 DB를 통하여 연관 Query를 검색한다. 이때, 상기 입력된 Query 및 연관 Query에는 각각 ID가 부여되므로 이하 ID라 한다(S210).
이후, 상기 각각의 ID에 대하여 해당 백본 DB를 각 ID에 대한 정보를 검색하고, 아울러 상기 컨버전스 DB를 통하여 상기 각 ID와 연관된 요소를 검색한다(S220).
전술한 바와 같이, 상기 제220단계를 통하여, 입력된 ID에 대한 2차 링크 맵을 형성한다(S230).
상기 2차 링크 맵의 구조는 도 8에 도시된 바와 같이, 입력된 Query(ID) 및이와 관련된 연관 Query(ID1, ID2, , IDN)들에 대하여 각각 자신의 특성정보 및 자신과 연관성 있는 속성의 특성정보가 정리되어 저장된 구조를 갖는다.
여기서, 상기 특성정보라 함은, 유전자정보, 화합물정보, 염기다형성정보, 약품정보, 항원정보, 연관링크정보 중 어떤 것을 나타내는지 표시하는 것을 말한다.
한편, 상기 특성정보를 저장하는 특성 데이터 영역은 해시함수(hash function)를 이용하여 압축한다. 이때 상기 특성 데이터 영역을 해시함수로 압축하는 것은 상기 특성 데이터 영역을 암호화하기 위한 것이 아니고, 용량을 줄이기 위한 부분이다.
즉, 상기 특성 데이터 영역은 후술할 3차 링크 맵 생성을 위하여 기중 링크 맵의 특성정보 영역과 비교 분석되는 부분으로, 그 양이 방대하여 비교 분석에 방대한 시간이 소요된다. 또한, 상기 특성 데이터 영역 중 대부분의 영역은 비 일치하는 부분으로, 비교 분석의 대부분은 비 일치되는 부분을 매칭하는 과정으로 소비된다.
따라서, 이러한 3차 링크 맵 생성과정의 특성상 상기 특성 데이터 영역을 해시함수를 이용하여 압축한다.
상기 2차 링크맵이 생성된 이후에는, 상기 2차 링크맵과 상기 기준맵 DB(126)에 저장된 기준 링크 맵을 비교 분석하여 3차 링크맵을 생성한다.
상기 기준 링크 맵은 도 9에 도시된 바와 같이, 상기 2차 링크 맵과 동일한 형태의 구성을 갖되 상기 각각의 id는 블럭버스터 바이오메디컬 정보에 관한 것이다.
여기서, 상기 기준 링크 맵의 특성 데이터 영역 역시 해시함수를 통해 압축되어 저장된다.
이때 상기 2차 링크 맵의 특성 데이터 영역을 압축함에 사용된 Key-Code와 상기 기준 링크 맵의 특성 데이터 영역의 압축에 사용된 Key-Code는 동일한 것이어야 한다. 이는 이들을 비교하여 동일성 있는 데이터를 추출하기 위해서는 암호화된 데이터가 동일성 있게 유지되어야 하기 때문이다.
한편, 도 9에는 본 발명에 의한 3차 링크 맵의 구성 내용의 일 예가 도시되어 있다.
이에 도시된 바와 같이, 상기 3차 링크 맵은 Query의 기본적인 기능은 물론, 단백질과 단백질 사이의 상호 작용, 단백질과 약물과의 상호 작용과 같이 이종의 속성들에 대한 연관정보까지 제공된다.
이때 상호작용은 크게 물리적인 상호작용, 물리적인 접촉이 없음 상호연관성으로 나눌 수 있다.
여기서, 도 10에 도시된 바와 같이, 상기 링크 맵은 ID의 기본적인 기능(function)뿐만 아니라 관련된 인자들의 관련 내용을 포함하여 구성된다.
한편, 도 11은 본 발명에 의한 3차 링크 맵 생성을 위한 가중치 부가의 일 예를 가시적으로 도시한 예시도이고, 도 12는 본 발명에 의한 3차 링크 맵 생성에 있어 가중치가 부여된 가중치 프로파일의 일 예를 가시적으로 도시한 예시도이다.
이들 도면에 도시된 바와 같이, 상기 3차 링크 맵을 생성함에 있어, 각각의 연관관계에 따라 가중치를 부여하여 가중치에 따라 상관도를 결정할 수 있다.
즉, 서로 다른 맵의 구성요소에서 유전자, 약물, 혹은 변이가 공통으로 존재하면 점수를 주어 서로 간의 분별력을 높이기 위한 DB대 DB의 간의 가중치 맵을 생성 할 수 있다.
그리고 이를 통하여 만든 가중치 맵을 사용하여 DB대 DB의 가중치 프로파일 점수표를 생성한 모습이 도 11에 도시되어 있다.
일 예로, 본 점수표에서 첫 번째 맵의 구성요소인 Drug 관련DB가 2번째 맵의 구성요소인 Bioassay DB맵에 맵핑이 되면 DB 대 DB연관성 점수 10을 받는다. 이는 약물DB에서의 특정 약물이 BioassayDB에서 약물 실험결과 및 약물 표현형정보를 제공하기 때문에 약물 DB와 BioassayDB가 특정 약물로 연결이 되면 최상의 연관성을 보여주기 때문에 최고점수인 10점을 받는다.
그러나, pathway와 bioassay는 중간에 연결자가 있다 하더라도 2개DB의 연관성을 증명하려면 여러 개의 중간 연결자가 필요하기 때문에 유용성 관점에서 가장 낮은 점수인 1점을 받는다.
도 13은 본 발명에 의한 3차 링크 맵 생성에 있어 링크 맵 간의 매칭의 일 예를 가시적으로 도시한 예시도이다.
이에 도시된 표에서 링크 1의 점수를 계산하는 예를 살피면, 점수 = DB1의 점수(Binary_Int_d)+DB2의 점수(PharmDB_ppi_d)+DB1 과DB2의 상관성 점수로 결정되며, 즉, 10+10+10(도 11의 테이블 적용)이 되어 최종 30이 된다.
도 14a 내지 도 14d는 본 발명을 이용하여 암 관련 유전자를 Query로 입력하여 검색을 실시하는 일 예를 도시한 예시도이다.
도 14a에 도시된 바와 같이 사용자가 암과 관련될 것으로 예상되는 13개의 Query를 선별하여 본 발명을 이용하여 분석한 결과 도 14b와 같은 분석결과를 얻는다.
즉, 도 14b에 나타난 바와 같이 각 Query들과 이와 연관된 블럭버스터 요소들과의 상관관계가 정리되어 나타난다. 즉 도시된 바와 같이 유전자 맵 결과의 highlight는 6가지(Disease Rank, Disease-pathway Rank, Pathway rank, PCI validation, M2M link, 및 IQC)이다.
PCI는 13 Query중에서 5개가 단백질구조-ligand 정보를 가지고 있지 않고 8개가 풍부한 정보를 가지고 있는 것을 확인할 수 있다.
그리고 나머지, 질병, pathway는 비교적 다양한 Link 결과를 가지고 있는 것을 위의 요약표에서 볼 수 있다.
나아가 도 14b의 분석결과를 도 14c와 같이 그래프를 이용하여 도시하면, 사용자는 그 특성을 가시적으로 더 용이하게 파악할 수 있다.
한편, 도 14d는 FYN을 쿼리로 하여 M2BM (map to blockbuster map)를 사용하여 블럭버스터 약물/유전자맵에 맵핑을 결과물로, 100여 개 중에 가장 큰 연결고리(bridge: HSP90AA, heat shock단백질) 정보를 주는 도식이다.
이처럼 연결고리에 맵핑이 된 박스들이 블럭버스터 유전자(혹은 약물) 맵을 나타낸다.
본 발명의 권리는 위에서 설명된 실시예에 한정되지 않고 청구범위에 기재된 바에 의해 정의되며, 본 발명의 분야에서 통상의 지식을 가진 자가 청구범위에 기재된 권리범위 내에서 다양한 변형과 개작을 할 수 있다는 것은 자명하다.
본 발명은 사용자가 입력한 유전자, 화합물, 염기다형성 정보, 약품정보 등의 바이오 메디컬 데이터에 대한 유전학적 정보 및 이들과 유사성을 갖는 정보를 검색하여 사용자에게 통합정보를 제공하는 시스템 및 방법에 관한 것으로, 본 발명에 의하면, 새롭게 찾은 정보와 특성이 규명된 블럭버스터(Blockbuster) 유전자-질병, 약물-약물표적 및 변이체-질병과의 연관성을 쉽게 찾을 수 있기 때문에 연구자들의 고유한 유전자/약물후보/변이들에 주석작업을 위한 정보검색시간을 획기적으로 단축하는 효과가 있다.
100 : 바이오 메디컬 정보제공 서버 110 : 제어부
112 : 검색엔진 114 : 링크맵생성부
116 : 비교연산부 120 : 데이터베이스
122A : 유전자DB 122B : 화합물DB
122C : 염기다형성DB 122D : 약품DB
122E : 항원DB 122F : 관련링크DB
124 : 컨버전스 DB 126 : 기준맵 DB

Claims (11)

  1. 사용자 단말기로부터 검색 대상 데이터(쿼리, Query)를 입력받아 검색을 수행하여 검색결과를 상기 사용자 단말기에 제공하는 바이오메디컬 연관정보 제공 시스템에 있어서,
    사용자로부터 쿼리를 입력받고, 상기 검색 대상 데이터와 관련된 바이오 메디컬 정보를 검색하여 분석하는 제어부와;
    바이오 메디컬 정보를 저장하는 데이터베이스를 포함하여 구성되고:
    상기 제어부는,
    사용자로부터 입력된 쿼리 및 상기 쿼리와 관련성 있는 연관 쿼리를 상기 데이터베이스에서 검색하여 상기 쿼리 및 연관 쿼리에 대한 특성정보를 검색하는 검색엔진과;
    상기 검색엔진으로부터 검색된 상기 쿼리 및 연관 쿼리에 대한 특성정보를 이용하여 2차 링크맵을 생성하는 링크 맵 생성부를 포함하여 구성되며:
    상기 데이터베이스는,
    유전자 정보를 저장하는 유전자DB,
    화합물 정보를 저장하는 화합물DB
    염기서열 및 염기다형성 정보에 관한 블록(LD, Linkage disequilibrium) 정보가 저장되는 염기다형성DB,
    약품 정보를 저장하는 약품DB,
    항원 정보를 저장하는 항원DB 또는
    바이오 메디컬 정보를 제공하고 있는 웹페이지들의 링크 정보를 저장하는 관련링크DB 중 어느 하나 이상을 포함하여 구성되는 기본DB와;
    유전자, 화합물, 염기다형성, 약품, 항원 또는 관련링크 중 어느 둘 이상 간의 연관관계가 저장되는 컨버전스DB를 포함하여 구성되며:
    상기 데이터베이스는,
    특성이 규명된 주요 바이오 메디컬 정보들에 대한 링크 맵이 저장된 기준 맵 DB를 더 포함하여 구성되고:
    상기 제어부는,
    상기 2차 링크 맵과 상기 기준 맵 DB에 저장된 링크 맵을 비교 연산하여, 상기 사용자로부터 입력된 Query와 상기 주요 바이오 메디컬 정보와의 연관관계를 나타내는 3차 링크 맵을 생성함을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템.
  2. 제 1 항에 있어서,
    유전자DB, 화합물DB, 염기다형성DB, 약품DB 또는 항원DB 는,
    대상물질의 특징을 저장하는 백본 DB와, 각 대상물질들 사이의 연관성이 저장되는 군집 DB를 포함하여 구성됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템.
  3. 제 2 항에 있어서,
    상기 기본DB는,
    구분 인자로 구분된 형태의 데이터(RVR 파일)로 저장되고;
    상기 구분 인자의 기록위치를 저장한 인덱스 파일(RAT 파일)을 포함하여 구성됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템.
  4. 삭제
  5. 제 1 항에 있어서,
    상기 기준 맵 DB에 저장된 링크 맵은 해시함수에 의해 인코딩되어 저장되고:
    상기 링크맵 생성부는,
    상기 2차 링크 맵을 상기 기준 맵 DB에 저장된 링크 맵에 적용된 키코드와 동일한 키코드 값을 갖는 해시함수로 인코딩하여 생성하며:
    상기 비교 연산부는,
    동일한 키코드를 갖는 해시함수에 의해 인코딩된 상기 기준 맵 DB의 링크맵과 상기 2차 링크 맵을 비교하여 3차 링크 맵을 생성함을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템.
  6. 제 5 항에 있어,
    상기 비교 연산부는,
    상기 3차 링크 맵을 생성함에 있어,
    각 인자들의 연결 단계에 따라 가중치를 부여하여 연관도를 산출함을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템.
  7. 삭제
  8. 바이오메디컬 연관정보 제공 시스템이 사용자 단말기로부터 검색 대상 데이터(쿼리, Query)를 입력받아 검색을 수행하여 검색결과를 상기 사용자 단말기에 제공하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법에 있어서,
    상기 바이오메디컬 연관정보 제공 시스템이,
    (A) 사용자 단말기로부터 검색을 위한 검색 대상 데이터(Query, 쿼리)를 입력받는 단계와;
    (B) 상기 쿼리와 연관성이 있는 연관 쿼리를 산출하는 단계와;
    (C) 상기 쿼리 및 상기 연과 쿼리의 특성 정보를 검색하고, 상기 검색 결과를 이용하여 2차 링크 맵을 생성하는 단계와;
    (D) 상기 제(C) 단계에서 생성된 2차 링크 맵과, 기준 맵 DB에 저장된 링크 맵을 비교하여 사용자로부터 입력된 Query와 상기 주요 바이오 메디컬 정보와의 연관관계를 나타내는 3차 링크맵을 생성하는 단계; 그리고
    (E) 상기 2차 링크 맵과 상기 3차 기준 맵을 상기 사용자 단말기에 제공하는 단계를 포함하여 수행되고:
    상기 기준맵 DB는,
    특성이 규명된 주요 바이오 메디컬 정보들에 대한 링크 맵이 저장됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법.
  9. 제 8 항에 있어서,
    상기 기준 맵 DB에 저장된 링크 맵은 해시함수에 의해 인코딩되어 저장되고:
    상기 2차 링크 맵은, 상기 기준 맵 DB에 저장된 링크 맵에 적용된 키코드와 동일한 키코드 값을 갖는 해시함수로 인코딩하여 생성되며:
    상기 3차 링크 맵은, 동일한 키코드를 갖는 해시함수에 의해 인코딩된 상기 기준 맵 DB의 링크맵과 상기 2차 링크 맵을 비교하여 생성됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법.
  10. 제 9 항에 있어,
    상기 3차 링크 맵은, 각 인자들의 연결 단계에 따라 가중치가 부여되어 산출된 연관도를 포함하여 생성됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법.
  11. 바이오메디컬 연관정보 제공 시스템이 사용자 단말기로부터 검색 대상 데이터(쿼리, Query)를 입력받아 검색을 수행하여 검색결과를 상기 사용자 단말기에 제공하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법에 있어서,
    상기 바이오메디컬 연관정보 제공 시스템이,
    (A) 사용자 단말기로부터 검색을 위한 검색 대상 데이터(Query, 쿼리)를 입력받는 단계와;
    (B) 상기 쿼리와 연관성이 있는 연관 쿼리를 산출하는 단계와;
    (C) 상기 쿼리 및 상기 연과 쿼리의 특성 정보를 검색하고, 상기 검색 결과를 이용하여 2차 링크 맵을 생성하는 단계와;
    (d) 상기 제(C)단계에서 생성된 제2차 맵 상에 기능이 규명된 인자가 포함되어 있는지 여부를 판별하는 단계; 그리고
    (e) 상기 (d) 단계의 판단결과, 상기 제2차 맵 상에 기능이 규명된 인자가 포함되지 않은 경우, 모집단 DB를 통해 교차링크 및 통계정보에 대한 선행연산을 수행하는 단계를 포함하여 수행되고:
    상기 (d) 단계의 판별은,
    기준맵 DB를 통해 수행됨을 특징으로 하는 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 방법.
KR1020110081189A 2011-08-16 2011-08-16 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법 KR101117603B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110081189A KR101117603B1 (ko) 2011-08-16 2011-08-16 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110081189A KR101117603B1 (ko) 2011-08-16 2011-08-16 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR101117603B1 true KR101117603B1 (ko) 2012-03-07

Family

ID=46141233

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110081189A KR101117603B1 (ko) 2011-08-16 2011-08-16 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR101117603B1 (ko)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101332270B1 (ko) * 2012-04-09 2013-11-22 삼성에스디에스 주식회사 유전 정보 관리 장치 및 방법
KR20140009854A (ko) * 2012-07-13 2014-01-23 삼성전자주식회사 치료제 선정을 위한 유전 정보의 분석 방법 및 장치
KR101693717B1 (ko) 2015-12-28 2017-01-06 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
KR101693504B1 (ko) 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
KR101693510B1 (ko) 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
KR20180069651A (ko) 2016-12-15 2018-06-25 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000340A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000342A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000341A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
US10540324B2 (en) 2016-07-29 2020-01-21 Syntekabio Co., Ltd. Human haplotyping system and method
KR20210158124A (ko) * 2020-06-23 2021-12-30 주식회사 바이온사이트 바이오메디컬 정보의 계층 및 유사성을 이용한 바이오메디컬 정보제공방법
CN114255885A (zh) * 2021-12-14 2022-03-29 浙江创邻科技有限公司 一种基于图数据的新药研发管理系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055893A (ko) * 2002-12-23 2004-06-30 한국전자통신연구원 단백질 상호작용 네트워크 구축을 위한 템플릿 자동 생성방법
KR20100137398A (ko) * 2010-11-18 2010-12-30 (주)신테카바이오 군집 및 백본 데이터베이스 기반 바이오 메디컬 통합 정보 검색 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055893A (ko) * 2002-12-23 2004-06-30 한국전자통신연구원 단백질 상호작용 네트워크 구축을 위한 템플릿 자동 생성방법
KR20100137398A (ko) * 2010-11-18 2010-12-30 (주)신테카바이오 군집 및 백본 데이터베이스 기반 바이오 메디컬 통합 정보 검색 방법 및 시스템

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101332270B1 (ko) * 2012-04-09 2013-11-22 삼성에스디에스 주식회사 유전 정보 관리 장치 및 방법
KR20140009854A (ko) * 2012-07-13 2014-01-23 삼성전자주식회사 치료제 선정을 위한 유전 정보의 분석 방법 및 장치
KR101693717B1 (ko) 2015-12-28 2017-01-06 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
KR101693504B1 (ko) 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
KR101693510B1 (ko) 2015-12-28 2017-01-17 (주)신테카바이오 개인 전장 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
WO2017116139A1 (ko) * 2015-12-28 2017-07-06 (주)신테카바이오 개인 유전체의 유전변이정보를 이용한 생리활성변이 분석 시스템
WO2017116123A1 (ko) * 2015-12-28 2017-07-06 (주)신테카바이오 개인 유전체의 유전변이정보를 이용한 질병원인 발굴 시스템
WO2017116135A1 (ko) * 2015-12-28 2017-07-06 (주)신테카바이오 개인 유전체의 유전변이정보를 이용한 유전형 분석 시스템 및 방법
US10540324B2 (en) 2016-07-29 2020-01-21 Syntekabio Co., Ltd. Human haplotyping system and method
KR20180069651A (ko) 2016-12-15 2018-06-25 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000340A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000342A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20190000341A (ko) 2018-12-20 2019-01-02 (주)신테카바이오 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
KR20210158124A (ko) * 2020-06-23 2021-12-30 주식회사 바이온사이트 바이오메디컬 정보의 계층 및 유사성을 이용한 바이오메디컬 정보제공방법
KR102430656B1 (ko) 2020-06-23 2022-08-09 주식회사 바이온사이트 바이오메디컬 정보의 계층 및 유사성을 이용한 바이오메디컬 정보제공방법
CN114255885A (zh) * 2021-12-14 2022-03-29 浙江创邻科技有限公司 一种基于图数据的新药研发管理系统及方法

Similar Documents

Publication Publication Date Title
KR101117603B1 (ko) 상호 연계 가능한 다중 맵 생성을 통한 바이오메디컬 기능연관정보 제공 시스템 및 방법
Zhou et al. Hum-mPLoc 3.0: prediction enhancement of human protein subcellular localization through modeling the hidden correlations of gene ontology and functional domain features
Moreau et al. Computational tools for prioritizing candidate genes: boosting disease gene discovery
Vihinen How to evaluate performance of prediction methods? Measures and their interpretation in variation effect analysis
Gerstein Patterns of protein‐fold usage in eight microbial genomes: A comprehensive structural census
Dufayard et al. Tree pattern matching in phylogenetic trees: automatic search for orthologs or paralogs in homologous gene sequence databases
Gerstein A structural census of genomes: comparing bacterial, eukaryotic, and archaeal genomes in terms of protein structure
Xia et al. APIS: accurate prediction of hot spots in protein interfaces by combining protrusion index with solvent accessibility
Deville et al. An overview of data models for the analysis of biochemical pathways
Ji et al. Identifying time-lagged gene clusters using gene expression data
Ou et al. TMBETADISC-RBF: discrimination of β-barrel membrane proteins using RBF networks and PSSM profiles
Zou et al. Approaches for recognizing disease genes based on network
JP2009520278A (ja) 科学情報知識管理のためのシステムおよび方法
CN101151615A (zh) 用于收集与生物分子和疾病之间的关系相关的证据的系统和方法
Wang et al. Prediction of protein solubility based on sequence physicochemical patterns and distributed representation information with DeepSoluE
Petryszak et al. The predictive power of the CluSTr database
Sun et al. Smolign: a spatial motifs-based protein multiple structural alignment method
Van Driel et al. Bioinformatics methods for identifying candidate disease genes
Doctor et al. The apoptosis database
Sacan et al. LFM-Pro: a tool for detecting significant local structural sites in proteins
WO2007038414A2 (en) Mining protein interaction networks
JP2004334753A (ja) 情報検索方法
Guruprasad et al. Database of structural motifs in proteins
Azizi et al. Protein structure prediction by means of sequential pattern mining
Atas et al. Phylogenetic and other conservation-based approaches to predict protein functional sites

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141124

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151216

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170123

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191209

Year of fee payment: 9