KR20180109421A - 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 - Google Patents
약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 Download PDFInfo
- Publication number
- KR20180109421A KR20180109421A KR1020170039150A KR20170039150A KR20180109421A KR 20180109421 A KR20180109421 A KR 20180109421A KR 1020170039150 A KR1020170039150 A KR 1020170039150A KR 20170039150 A KR20170039150 A KR 20170039150A KR 20180109421 A KR20180109421 A KR 20180109421A
- Authority
- KR
- South Korea
- Prior art keywords
- drug
- similarity
- information
- path
- gene
- Prior art date
Links
Images
Classifications
-
- G06F19/707—
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G06F19/10—
-
- G06F19/709—
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Chemical & Material Sciences (AREA)
- Software Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
본 발명은 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체에 관한 것으로서, 더욱 상세하게는 물질의 생체 작용 경로 데이터베이스를 기반으로 약물의 작용 경로를 생성하고, 상기 약물의 작용 경로에 기초하여 약물의 유사도를 산출하는, 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체에 관한 것이다.
Description
본 발명은 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체에 관한 것으로서, 더욱 상세하게는 물질의 생체 작용 경로 데이터베이스를 기반으로 약물의 작용 경로를 생성하고, 상기 약물의 작용 경로에 기초하여 약물의 유사도를 산출하는, 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체에 관한 것이다.
약물의 작용 경로에 대한 연구는 여려 기관에 의해 수행되어 왔다. 표현형 선별에서부터 시판 후 부작용감시에 이르기까지 수많은 보고서와 후속 연구가 이루어져왔다. 하지만, 약물 작용에 대한 연구는 약물의 의도된 치료 효과, 또는 빈번히 발생되는 부작용에 대한 연구에 치중되어 있고, 이로 인해 의도치 않은 약물의 효과에 대한 작용 메커니즘을 해독하는 일에 있어서는 많은 어려움이 있다.
역사적으로 예기치 않은 약물 작용을 발견하는 것은 경험적으로 이루어져 왔다. 하지만, 의도치 않은 약물 작용의 이해, 새로운 약물 효과의 발견 또는 부작용의 예측에 있어서는 약물 작용에 대한 비편향적인 분석방법에 기초한 연구가 필요하다.
최근 들어 약리유전학, 약물 유발 유전자 발현 프로파일 및 약물 부작용 정보 등을 포함하는 문헌, 자료 등을 포함하는 데이터베이스가 급속히 성장하고 있고, 이러한 데이터베이스를 이용하여 약물 작용에 대한 해석의 필요성이 대두되고 있다. 또한 이러한 데이터베이스에 대한 접근성 및 사용성을 강화한 컴퓨터를 이용한 분석방법이 조명 받고 있다. 생체 혹은 시험관 실험과 비교하여 컴퓨터를 이용한 분석방법은 시간 및 비용 효율성 측면에서 매우 뛰어나고, 체계적인 구현을 통한 재현가능성이 높다. 이처럼 컴퓨터를 이용한 분석은 향후의 약물, 또는 실패한 약물의 분석에 적용될 수 있지만, 아직까지 적절한 방법이 제시되지 못하고 있다.
약물 작용에 대한 포괄적인 이해를 위해서는 약물 - 신호 전달 경로를 체계적으로 구성하고 분석 할 필요가 있다. 약물의 타겟, 화학 구조 및 부작용을 포함하여 약물의 유사성에 근거하여 약물 작용을 예측하려는 시도가 있어왔다. 이러한 특성은 신약 재창출에 있어 상당히 유용하지만, 이러한 시도는 약물의 내재적 메커니즘이 아닌 약물의 외적 특성에 의존하는 경향이 있다. 따라서 이러한 연구에 따른 결과는 제한적이게 된다.
약물 작용의 가장 확실한 메커니즘은 생체 분자를 의미하는 노드와 노드간의 상호 작용을 연결선으로 나타내는 네트워크이다. 약물은 단일 유전자 또는 단일 경로를 통하는 것이 아니라 분자 네트워크에서 다중 신호 전달 계통을 통해 효과를 발휘한다. 따라서 약물 - 신호 경로를 현실적으로 추론하는 네트워크 플랫폼을 고안할 필요성이 있다.
이전에는 특정 약물에 대한 새로운 경로를 확인하기 위해 분자 수준에서 약물 신호 전달 경로를 설계하려는 시도가 거의 없었다. 또한, 이러한 시도는 제한된 자원을 활용하여 경로를 생성하거나 생물학적 네트워크의 방향성을 고려하지 않고 있다. 더욱이, 분자 및 세포 반응의 중간단계를 표현하는 방법에 대한 체계적인 접근법은 아직 연구 초기 단계에 있기 때문에 활용에 제한이 있다.
본 발명의 목적은 물질의 생체 작용 경로 데이터베이스를 기반으로 약물의 작용 경로를 생성하고, 상기 약물의 작용 경로에 기초하여 약물의 유사도를 산출하는, 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체를 제공하는 것이다.
상기와 같은 과제를 해결하기 위하여 본 발명은, 약물의 유사도 판단장치로서, 기준이 되는 약물의 정보를 입력 받는 제1약물정보입력부; 비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력부; 생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드부; 상기 경로데이터에 기초하여 상기 제1약물정보입력부 및 제2약물정보입력부로부터 입력 받은 약물의 작용 경로를 생성하는 경로생성부; 상기 경로생성부에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교부; 및 상기 유사도비교부가 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정부;를 포함하는 약물의 유사도 판단장치를 제공한다.
본 발명에서는, 상기 경로데이터는 단백질 상호작용 경로, 유전자 발현 경로, 및 생체 분자 상호작용 경로를 포함할 수 있다.
본 발명에서는, 상기 제1약물정보입력부는 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 기준이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제2약물정보입력부는 상기 제1약물정보입력부에서 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제1약물정보입력부에서 기준이 되는 약물의 발현단계 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받을 수 있다.
본 발명에서는, 상기 유사도비교부는, 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교부; 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교부; 및 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교부;를 포함할 수 있다.
본 발명에서는, 상기 유전자기반비교부는, 약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출부; 및 상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정부;를 포함할 수 있다.
본 발명에서는, 상기 유전자온톨로지기반비교부는. 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출부; 및 상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교부;를 포함할 수 있다.
본 발명에서는, 상기 KEGG기반비교부는, 내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드부; 약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성부; 및 추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교부;를 포함할 수 있다.
본 발명에서는, 상기 유사성판정부는, 상기 유전자기반비교부, 상기 유전자온톨로지기반비교부, 및 상기 KEGG기반비교부에서 산출한 각각의 유사도가, 각 유사도별로 기설정된 값 이상일 경우 약물이 유사하다고 판정할 수 있다.
상기와 같은 과제를 해결하기 위하여 본 발명은, 약물의 유사도 판단방법으로서, 기준이 되는 약물의 정보를 입력 받는 제1약물정보입력단계; 비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력단계; 생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드단계; 상기 경로데이터에 기초하여 상기 제1약물정보입력단계 및 제2약물정보입력단계에서 입력 받은 약물의 작용 경로를 생성하는 경로생성단계; 상기 경로생성단계에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교단계; 및 상기 유사도비교단계에서 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정단계;를 포함하는 약물의 유사도 판단방법을 제공한다.
본 발명에서는, 상기 경로데이터는 단백질 상호작용 경로, 유전자 발현 경로, 및 생체 분자 상호작용 경로를 포함할 수 있다.
본 발명에서는, 상기 제1약물정보입력단계에서는 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 기준이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제2약물정보입력단계에서는 상기 제1약물정보입력단계에서 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제1약물정보입력단계에서 기준이 되는 약물의 발현단계 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받을 수 있다.
본 발명에서는, 상기 유사도비교단계는, 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교단계; 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교단계; 및 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교단계;를 포함할 수 있다.
본 발명에서는, 상기 유전자기반비교단계는, 약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출단계; 및 상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정단계;를 포함할 수 있다.
본 발명에서는, 상기 유전자온톨로지기반비교단계는, 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출단계; 및 상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교단계;를 포함할 수 있다.
본 발명에서는, 상기 KEGG기반비교단계는, 내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드단계; 약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성단계; 및 추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교단계;를 포함할 수 있다.
본 발명에서는, 상기 유사성판정단계는, 상기 유전자기반비교단계, 상기 유전자온톨로지기반비교단계, 및 상기 KEGG기반비교단계에서 산출한 각각의 유사도가, 각 유사도별로 기설정된 값 이상일 경우 약물이 유사하다고 판정할 수 있다.
상기와 같은 과제를 해결하기 위하여 본 발명은, 컴퓨터-판독가능 매체로서, 상기 컴퓨터-판독가능 매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은: 기준이 되는 약물의 정보를 입력 받는 제1약물정보입력단계; 비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력단계; 생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드단계; 상기 경로데이터에 기초하여 상기 제1약물정보입력단계 및 제2약물정보입력단계에서 입력 받은 약물의 작용 경로를 생성하는 경로생성단계; 상기 경로생성단계에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교단계; 및 상기 유사도비교단계에서 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정단계;를 포함하는, 컴퓨터-판독가능 매체를 제공한다.
본 발명의 일 실시예에 따르면, 생체 약물 작용에 대한 경로데이터에 기초하여 특정 약물의 작용 경로를 생성하여 의도하지 않은 약물의 작용을 이해할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하고, 다른 약물과의 유사성을 비교함으로써, 신약재창출을 용이하게 할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하고, 다른 약물과의 유사성을 비교함으로써, 신약의 적응증을 용이하게 예측할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하여 약물의 부작용을 예측할 수 있는 효과를 발휘할 수 있다.
도 1은 본 발명의 일 실시예에 따른 약물의 유사도 판단장치를 개략적으로 도시하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 약물의 유사도 판단장치의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 3은 본 발명의 일 실시예에 따른 제1약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 제2약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
도 5는 본 발명의 일 실시예에 따른 약물 작용 경로를 개략적으로 도시하는 도면이다.
도 6은 본 발명의 일 실시예에 따른 약물 작용 경로의 생성 단계를 개략적으로 도시하는 도면이다.
도 7은 본 발명의 일 실시예에 따른 유사도비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 8은 본 발명의 일 실시예에 따른 유전자기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 9는 본 발명의 일 실시예에 따른 유전자온톨로지기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 10은 본 발명의 일 실시예에 따른 KEGG기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 11은 본 발명의 일 실시예에 따른 유사성판정부의 동작을 개략적으로 도시하는 도면이다.
도 12는 본 발명의 일 실시예에 따른 약물의 유사도 판단방법을 개략적으로 도시하는 순서도이다.
도 13은 본 발명의 일 실시예에 따른 유사도비교단계를 개략적으로 도시하는 순서도이다.
도 14는 본 발명의 일 실시예에 있어서, 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅장치의 내부 구성의 일례를 설명하기 위한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 약물의 유사도 판단장치의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 3은 본 발명의 일 실시예에 따른 제1약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 제2약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
도 5는 본 발명의 일 실시예에 따른 약물 작용 경로를 개략적으로 도시하는 도면이다.
도 6은 본 발명의 일 실시예에 따른 약물 작용 경로의 생성 단계를 개략적으로 도시하는 도면이다.
도 7은 본 발명의 일 실시예에 따른 유사도비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 8은 본 발명의 일 실시예에 따른 유전자기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 9는 본 발명의 일 실시예에 따른 유전자온톨로지기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 10은 본 발명의 일 실시예에 따른 KEGG기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 11은 본 발명의 일 실시예에 따른 유사성판정부의 동작을 개략적으로 도시하는 도면이다.
도 12는 본 발명의 일 실시예에 따른 약물의 유사도 판단방법을 개략적으로 도시하는 순서도이다.
도 13은 본 발명의 일 실시예에 따른 유사도비교단계를 개략적으로 도시하는 순서도이다.
도 14는 본 발명의 일 실시예에 있어서, 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅장치의 내부 구성의 일례를 설명하기 위한 블록도이다.
이하에서는, 다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.
또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.
본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '~부', '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어를 의미할 수 있다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다.
또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
또한, 본 발명의 실시예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일 실시예에 따른 약물의 유사도 판단장치를 개략적으로 도시하는 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅장치(1000)는 외부의 경로데이터베이스(2000)와 연결된다.
상기 경로데이터베이스(2000)는 2 이상의 경로데이터베이스로 구성될 수 있으며, 상기 경로데이터베이스(2000)는 제1경로데이터베이스(2100), 제2경로데이터베이스(2200), 및 제N경로데이터베이스(2500) 등을 포함할 수 있다.
각각의 경로데이터베이스는 생체 약물 작용 경로로 사용될 수 있는 각종의 상호작용 네트워크에 대한 정보를 포함하고 있다. 본 발명의 일 실시예에 따르면 특정 약물에 반응하는 유전자 정보에 대한 데이터베이스를 갖추고 있는 DrugBank, PharmGKB 등의 약물정보 온라인 데이터베이스를 제1경로데이터베이스(2100)로, 단백질과 단백질 사이의 상호작용 정보에 대한 데이터베이스를 갖추고 있는 DIP(the Database of Interacting Proteins) 등의 단백질 상호작용 온라인 데이터베이스를 제2경로데이터베이스(2200)로, 생체분자간 상호작용 정보에 대한 데이터베이스를 갖추고 있는 IntAct 등의 온라인 데이터베이스를 제3경로데이터베이스(미도시)로, 유전자-단백질 발현 정보에 대한 데이터베이스를 갖추고 있는 BIND(Biomolecular Interaction Network Database) 등의 온라인 데이터베이스를 제4경로데이터베이스(미도시)로 구성하여 동작할 수 있다.
이와 같은 경로데이터베이스(2000)는 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅장치(1000)와 네트워크로 연결되어 컴퓨팅장치(1000)에서 상기 경로데이터베이스(2000)의 데이터에 접근할 수 있다.
도 2는 본 발명의 일 실시예에 따른 약물의 유사도 판단장치의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅장치(1000)는 프로세서(100), 버스(200), 네트워크인터페이스(300) 및 메모리(400)를 포함할 수 있다. 메모리(400)는 운영체제(410), 서비스제공루틴(420), 유사도판단기준(430), 및 경로데이터베이스(440)가 저장될 수 있다.
프로세서(100)는 제1약물정보입력부(110). 제2약물정보입력부(120), 경로데이터로드부(130), 경로생성부(140), 유사도비교부(150), 및 유사성판정부(160)를 포함할 수 있다. 다른 실시예들에서 약물의 유사도 판단장치는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다.
메모리는 컴퓨터에서 판독 가능한 기록 매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비 소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 또한, 메모리에는 운영체제(410), 서비스제공루틴(420), 유사도판단기준(430), 및 경로데이터베이스(440)를 위한 프로그램 코드 혹은 데이터가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 드라이브 메커니즘(drive mechanism, 미도시)을 이용하여 메모리와는 별도의 컴퓨터에서 판독 가능한 기록 매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록 매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록 매체(미도시)를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록 매체가 아닌 네트워크인터페이스(300)를 통해 메모리에 로딩될 수도 있다.
버스(200)는 컴퓨팅장치(1000)를 제어하는 장치 구성요소들간의 통신 및 데이터 전송을 가능하게 할 수 있다. 버스는 고속 시리얼 버스(high-speed serial bus), 병렬 버스(parallel bus), SAN(Storage Area Network) 및/또는 다른 적절한 통신 기술을 이용하여 구성될 수 있다.
네트워크인터페이스(300)는 약물의 유사도 판단장치로 기능하는 컴퓨팅장치(1000)를 컴퓨터 네트워크에 연결하기 위한 컴퓨터 하드웨어 구성 요소일 수 있다. 네트워크인터페이스(300)는 약물의 유사도 판단장치로 기능하는 컴퓨팅장치(1000)를 무선 또는 유선 커넥션을 통해 컴퓨터 네트워크에 연결시킬 수 있다. 이와 같은 네트워크인터페이스(300)를 통하여 약물의 유사도 판단장치로 기능하는 컴퓨팅장치(1000)가 경로데이터베이스(2000)에 무선적 혹은 유선적으로 접속될 수 있다.
프로세서는 기본적인 산술, 로직 및 약물의 유사도 판단장치로 기능하는 컴퓨팅장치(1000)의 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(400) 또는 네트워크인터페이스(300)에 의해, 그리고 버스(200)를 통해 프로세서(100)로 제공될 수 있다. 프로세서는 운영체제(410), 서비스제공루틴(420), 유사도판단기준(430), 및 경로데이터베이스(440)를 위한 프로그램 코드를 실행하도록 구성될 수 있다. 이러한 프로그램 코드는 메모리와 같은 기록 장치에 저장될 수 있다.
상기 운영체제(410), 서비스제공루틴(420), 유사도판단기준(430), 및 경로데이터베이스(440)는 이하에서 설명하게 될 컴퓨팅장치(1000)의 작동을 수행하기 위해 구성될 수 있다. 상기한 프로세서는 컴퓨팅장치(1000)를 제어하는 방법에 따라 일부 컴포넌트가 생략되거나, 도시되지 않은 추가의 컴포넌트가 더 포함되거나, 2개 이상의 컴포넌트가 결합될 수 있다.
본 발명의 일 실시예에 따른 약물의 유사도 판단장치는, 기준이 되는 약물의 정보를 입력 받는 제1약물정보입력부(110); 비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력부(120); 생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드부(130); 상기 경로데이터에 기초하여 상기 제1약물정보입력부 및 제2약물정보입력부로부터 입력 받은 약물의 작용 경로를 생성하는 경로생성부(140); 상기 경로생성부에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교부(150); 및 상기 유사도비교부가 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정부(160);를 포함한다.
상기 제1약물정보입력부(110)는 기준이 되는 약물의 정보를 입력 받는다. 입력 받는 상기 약물의 정보는 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 제1약물정보입력부(110)의 동작에 대해서는 후술하도록 한다.
상기 제2약물정보입력부(120)는 비교대상이 되는 약물의 정보를 입력 받는다. 제1약물정보입력부(110)와 마찬가지로 입력 받는 약물의 정보는 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 제2약물정보입력부(120)의 동작에 대해서는 후술하도록 한다.
상기 경로데이터로드부(130)는 내부의 메모리(400) 또는 외부의 데이터베이스로부터 생체 약물 작용에 대한 경로데이터를 불러온다. 도 1에서 도시된 바와 같이, 컴퓨팅장치(1000)는 네트워크를 통해 경로데이터베이스(2000)와 연결되어, 컴퓨팅장치(1000)에서 데이터에 접근할 수 있게 된다. 경로데이터로드부(130)는 제1약물정보입력부(110), 제2약물정보입력부(120), 및 경로생성부(140)의 동작에 있어 필요한 데이터를 네트워크인터페이스(300)를 통해 외부의 경로데이터베이스(2000)에 접속하여 불러오거나, 혹은 내부의 메모리(400)에 저장된 내부의 경로데이터베이스(440)에 접속하여 불러올 수 있다.
상기 경로생성부(140)는 제1약물정보입력부(110) 및 제2약물정보입력부(120)에서 입력 받은 약물의 정보에 따라 상기 경로데이터로드부(130)가 불러온 생체 약물 작용에 대한 경로데이터에 기초하여 상기 약물의 작용 경로를 생성한다. 상기 경로생성부(140)의 동작에 대해서는 후술하도록 한다.
상기 유사도비교부(150)는 상기 경로생성부(140)에서 생성된 약물의 작용 경로의 유사도를 산출한다. 본 발명의 일 실시예에 따르면, 상기 유사도를 산출하기 위해서는 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하거나, 약물의 작용 경로에 포함된 유전자의 온톨로지 정보에 기초하여 유사도를 산출하거나, 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하거나, 혹은 상기 산출 방법의 둘 이상의 조합에 의하여 유사도를 산출할 수 있다.
상기 유사성판정부(160)는 상기 유사도비교부(150)가 산출한 약물의 작용 경로의 유사도에 기초하여 약물의 유사 여부를 판단한다. 상기 약물의 유사 여부 판단을 위한 유사도판단기준(430)이 메모리(400)에 저장될 수 있다. 유사성판정부(160)는 두 약물의 작용 경로의 유사도가 상기 유사도판단기준(430)을 충족하는 경우 두 약물이 유사하다고 판단한다.
도 3은 본 발명의 일 실시예에 따른 제1약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
제1약물정보입력부(110)는 기준이 되는 약물의 정보를 입력 받는다. 입력 받는 상기 약물의 정보는 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 입력 받은 정보에 대해 상기 제1약물정보입력부(110)는 상기 정보에 기초하여 약물의 발현단계, 중간단계 및 목적단계의 정보를 도출한다.
상기 발현단계, 중간단계 및 목적단계는 약물의 작용 과정에 따라 발현되는 유전자의 정보를 뜻한다. 도 3의 (A)를 참조하면, 좌측에서부터 발현단계, 중간단계 및 목적단계를 거쳐 약물의 작용이 전달되는 것을 확인할 수 있다.
상기 발현단계, 중간단계 및 목적단계에 포함되는 유전자는 약물에 대한 반응 및 표현형에 따라서, 약물의 직접적인 전달 목표가 되는 목표 유전자(Target Genes, 이하 TG), 약물의 작용에 의해 활성화가 되는 변이 유전자(Variant Genes, 이하 VG), 질병의 유무에 따라 발현여부가 달라지는 차별 발현 유전자(Differentially Expressed Genes, 이하 DEG), 질병에 영향을 미치는 질병 유전자(Disease Genes, 이하 DisG), 및 부작용을 발생시키는 부작용 유전자(Side-Effect Genes, 이하 SEG)의 5개 종류의 유전자로 구분될 수 있다. 상기 5개 종류의 유전자는 도 3의 (A)와 같이 각각 TG는 발현단계, VG 및 DEG는 중간단계, DisG 및 SEG는 목적단계에 해당된다.
이와 같이 약물은 TG를 통해 VG 및 DEG를 거쳐 DisG 및 SEG의 전사 및 전위를 조절함으로써 약물 효과를 발휘하거나 부작용을 발생시킨다.
본 발명의 일 실시예에 따르면 제1약물정보입력부(110)는 상기 5개 종류의 유전자로 구분되는 발현단계, 중간단계 및 목적단계의 정보를 직접적으로 입력 받을 수도 있고, 혹은 간접적으로 입력 받을 수도 있다. 상기 제1약물정보입력부(110)는 약물이 직접 작용하는 유전자에 대한 정보를 발현단계, 중간단계 및 목적단계로 구분하여 입력 받을 수도 있고, 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보를 입력 받아 이에 기초하여 발현단계, 중간단계 및 목적단계의 정보를 도출할 수도 있다.
이를 위해 제1약물정보입력부(110)는 경로데이터베이스(2000)의 약물-유전자 반응 데이터베이스에서 입력 받은 약물의 TG, VG, DEG, DisG, 및 SEG 정보를 찾아, 해당 유전자 정보를 제1약물정보입력부(110)의 입력 정보로 간주할 수 있다. 상기 약물-유전자 반응 데이터베이스로는 DrugBank, PharmGKB, Connectivity Map, Online Mendelian Inheritance in Man (OMIM) Database, 혹은 SIDER database 등이 사용될 수 있다.
이와 같이 제1약물정보입력부는 약물의 정보를 입력 받을 때에 도 3의 (A)와 같이 약물의 발현단계, 중간단계, 및 목적단계의 정보를 입력 받을 수도 있고, 또는 도 3의 (B)와 같이 기준이 되는 약물의 발현단계 및 목적단계의 정보 만을 입력 받을 수도 있다.
도 4는 본 발명의 일 실시예에 따른 제2약물정보입력부의 입력 정보를 개략적으로 도시하는 도면이다.
제2약물정보입력부(120)는 비교대상이 되는 약물의 정보를 입력 받는다. 이는 제1약물정보입력부(110)와 마찬가지로 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 입력 받은 정보에 대해 상기 제2약물정보입력부(120)는 상기 정보에 기초하여 약물의 발현단계, 중간단계 및 목적단계의 정보를 도출하고, 도출 방법은 제1약물정보입력부(110)와 동일하다.
이 때, 제2약물정보입력부(120)가 도출 하는 정보는 제1약물정보입력부(110)의 입력 정보에 따라 달라지게 된다.
도 4의 (A)를 참조하면, 제1약물정보입력부(110)에서 약물의 발현단계, 중간단계 및 목적단계의 정보를 모두 입력 받은 경우, 제2약물정보입력부(120)는 약물의 발현단계, 중간단계 및 목적단계의 정보를 모두 입력 받을 수 있고, 또는 약물의 발현단계 및 목적단계의 정보만을 입력 받을 수 있다. 바람직하게는 제2약물정보입력부(120)의 입력 정보의 종류는 제1약물정보입력부(110)의 입력 정보의 종류와 동일하다.
도 4의 (B)를 참조하면, 제1약물정보입력부(110)에서 약물의 발현단계 및 목적단계의 정보만을 입력 받은 경우, 제2약물정보입력부(120)는 약물의 발현단계 및 목적단계의 정보만을 입력 받는다.
이처럼 제1약물정보입력부(110)의 입력 정보와 제2약물정보입력부(120)의 입력 정보의 종류를 일치시켜, 기준이 되는 약물 및 비교대상 약물의 작용 경로 탐색에 있어서 동일한 과정을 거치게 됨으로써 두 약물의 작용 경로의 유사도 판단을 보다 정확하게 할 수 있는 효과를 발휘할 수 있게 된다.
도 5는 본 발명의 일 실시예에 따른 약물 작용 경로를 개략적으로 도시하는 도면이다.
도 5를 참조하면 약물의 작용 경로는 시작점(Start points)로부터 끝점(End points)까지 노드 및 연결선으로 이루어진 네트워크를 이루고 있다. 상기 시작점 및 끝점은 유전자로 구성되고, 상기 노드는 단백질(P), 생체분자(B) 또는 유전자(미도시)로 구성되며, 상기 연결선은 유전자, 단백질 및 생체분자 사이의 상호작용 또는 신진대사 경로를 나타낸다.
도 5의 예를 참고하면, 시작점의 유전자로부터 단백질들(P)이 전사되고, 상기 단백질들(P)은 다른 단백질 또는 생체분자(B)와 상호작용을 한다. 상호작용을 한 단백질은 효소로 작용하여 끝점의 유전자의 전사 또는 전위를 조절 할 수 있고, 또는 생체분자(B)의 상호작용을 통해 유전자의 발현에 영향을 미칠 수 있다.
도 5의 예와는 달리, 시작점과 끝점의 유전자 외에 네트워크상에도 유전자 노드를 포함하여 경로를 구성할 수 있다. 이와 같은 경우에도 상기 도 5의 예와 마찬가지로, 단백질(P), 생체분자(B) 및 유전자(미도시)의 상호작용, 신진대사, 전사, 또는 전위 등을 통한 연결을 통해 네트워크가 구성된다.
도 6은 본 발명의 일 실시예에 따른 약물 작용 경로의 생성 단계를 개략적으로 도시하는 도면이다.
도 6을 참조하면 본 발명의 일 실시예에 따른 경로생성부(140)의 경로 생성 단계를 확인할 수 있다. 도 6은 좌측에 도시된 두 개의 시작점 및 오른쪽에 도시된 세 개의 끝점을 연결하는 경로를 생성하는 단계를 (A), (B), (C), 및 (D)의 네 개의 단계로 나누어 도시한다. 본 발명의 일 실시예에 따르면 상기 경로는 노드 및 연결선으로 구성되고, 상기 노드는 단백질, 생체분자 또는 유전자이고, 상기 연결선은 상기 노드 사이의 상호작용 또는 신진대사 경로를 나타낸다. 상기 상호작용 또는 신진대사 경로 정보는 경로데이터베이스(2000)에 저장되어 있다.
도 6의 (A)는 약물 작용 경로의 생성 첫 번째 단계를 개략적으로 도시한다. 도 6의 (A)를 참조하면 약물 작용 경로를 생성하기 위하여 우선 세 개의 끝점에 연결될 수 있는 모든 노드를 경로데이터베이스(2000)로부터 추출하여 도시한다. 끝점에 연결될 수 있는 노드라는 것은 끝점의 유전자 등과 상호작용하여 영향을 줄 수 있는 노드를 뜻하며, 끝점에 영향을 주지 못하고, 끝점에 의해 영향을 받기만 하는 노드는 포함되지 않는다. 즉, 영향의 방향성을 고려하여 노드를 추출하게 된다.
도 6의 (A)를 참조하면, 가장 위의 끝점에 대해서는 3개, 가운데의 끝점에 대해서도 3개, 가장 아래의 끝점에 대해서는 2개의 연결이 형성되었고, 그 중 하나의 노드는 가장 위의 끝점 및 가운데의 끝점에 모두 연결된다.
도 6의 (B)는 약물 작용 경로의 생성 두 번째 단계를 개략적으로 도시한다. 도 6의 (B)를 참조하면 끝점에 연결된 모든 노드에 대하여 연결될 수 있는 모든 노드를 경로데이터베이스(2000)로부터 추출하여 도시한다. 도 6의 (A)에서의 경우와 마찬가지로, 각각의 노드에 대해 연결될 수 있는 다수의 노드가 각각 연결되고, 이 중에는 하나의 노드가 2 이상의 노드로 각각 연결되는 경우도 있다. 도 6의 (B)에서의 과정 역시 연결의 방향성을 고려하여 기추출된 노드에 영향을 줄 수 있는 노드만을 추출하게 된다.
도 6의 (C)는 약물 작용 경로의 생성 세 번째 단계를 개략적으로 도시한다. 도 6의 (C)를 참조하면 도 6의 (B)에서와 같이 기 연결된 모든 노드에 대해 연결될 수 있는 모든 노드를 경로데이터베이스(2000)로부터 추출하여 도시하고, 이를 시작점에 연결될 때까지 반복한다.
도 6의 (D)는 약물 작용 경로의 생성 네 번째 단계를 개략적으로 도시한다. 도 6의 (D)를 참조하면, 도 6의 (C)에서와 같이 시작점과 끝점이 모두 연결된 네트워크가 형성이 되고 난 후, 시작점에서부터 끝점까지의 연결에 참여한 노드 및 연결선을 제외하고는 모두 제거하여, 시작점에서부터 끝점까지의 작용 경로를 확인할 수 있게 된다.
이와 같이 경로생성부(140)는 경로데이터베이스(2000)로부터 생체 작용 경로로 동작하는 상호작용 정보를 추출하여 끝점에서부터 시작하여 시작점까지의 경로를 생성하게 된다. 이처럼 끝점에서부터 시작하여 시작점까지로 경로를 생성함으로써, 멱급수 분포(power-law distribution)로 알려져 있는 생체 네트워크 분포에서, 노드의 연결 수가 낮을 것으로 예측되는 하위 연결 노드에서부터 연결을 시작함으로써, 노드 추출에 필요한 연산을 줄여 신속하고 정확한 경로 생성 과정을 수행할 수 있게 된다.
이와 같은 작용 경로 생성 단계를 제1약물정보입력부(110) 및 제2약물정보입력부(120)에서 입력 받은 발현단계, 중간단계, 및 목적단계를 각각 시작점 및 끝점으로 하여 수행함으로써, 입력 받은 제1약물 및 제2약물에 대한 약물 작용 경로를 각각 생성할 수 있게 된다.
이와 같이 단백질, 생체분자 및 유전자를 포함하고, 이들 간의 상호작용 및 신진대사 경로를 포함하는 약물 작용 경로를 생성함으로써, 약물의 의도하지 않은 작용에 대해 이해할 수 있고, 약물의 부작용을 예측할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따라 발현단계, 중간단계 및 목적단계를 모두 입력 받은 경우, 발현단계 및 중간단계를 각각 시작점 및 끝점으로 하여 약물 작용 경로를 생성하고, 중간단계 및 목적단계를 각각 시작점 및 끝점으로 하여 다시 한번 약물 작용 경로를 생성한 뒤, 최종적으로 두 경로를 결합하여 입력 받은 약물의 작용 경로를 생성한다.
만약 발현단계 및 목적단계만을 입력 받은 경우, 발현단계 및 목적단계를 각각 시작점 및 끝점으로 하여 약물 작용 경로를 생성하고 이를 입력 받은 약물의 작용 경로로 결정한다.
도 7은 본 발명의 일 실시예에 따른 유사도비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 7을 참조하면 본 발명의 일 실시예에 따른 유사도비교부(150)는, 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교부(151); 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교부(152); 및 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교부(153);를 포함한다.
본 발명의 일 실시예에 따른 유사도비교부(150)는 경로생성부(140)에서 생성된 약물의 작용 경로의 유사도를 산출한다. 이 때, 유사도비교부(150)는 유사도 산출 기반에 따라 유전자 기반 유사도, 유전자 온톨로지 기반 유사도, 및 KEGG 기반 유사도 세 종류의 유사도를 산출한다.
도 8은 본 발명의 일 실시예에 따른 유전자기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 8을 참조하면 본 발명의 일 실시예에 따른 유전자기반비교부(151)는, 약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출부(151.1); 및 상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정부(151.2);를 포함한다.
유전자기반비교부(151)는 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출한다. 이를 위해 유전자정보추출부(151.1)는 약물의 작용 경로에 포함된 유전자 정보를 추출한다. 구체적으로, 기준이 되는 약물 의 약물 작용 경로 및 비교대상이 되는 약물의 약물 작용 경로에 포함된 유전자들의 정보를 각각 추출한다.
매칭율산정부(151.2)는 상기 유전자정보추출부(151.1)에서 추출한 유전자 정보에 기초하여 약물의 작용 경로를 비교한다. 상기 매칭율산정부(151.2)는 두 약물의 작용 경로에 포함된 유전자들의 일치 여부를 비교하여 이들의 일치율을 도출하고, 이에 기초하여 두 약물의 유사도를 산출한다. 바람직하게는, 상기 유전자정보추출부(151.1)에서 추출한 유전자 정보에 기초하여, 약물의 작용 경로를 묘사하는 바이너리 벡터(Binary Vector)를 기준이 되는 약물 및 비교대상이 되는 약물에 대하여 각각 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
도 9는 본 발명의 일 실시예에 따른 유전자온톨로지기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 9를 참조하면 본 발명의 일 실시예에 따른 유전자온톨로지기반비교부(152)는. 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출부(152.1); 및 상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교부(152.2);를 포함한다.
유전자온톨로지기반비교부(152)는 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출한다.
유전자 온톨로지 (Gene Ontology, GO)는 유전자와 유전자 생산물(gene product)을 생물의 여러 종과 서로 다른 데이터베이스를 참조하는 표준화된 표현을 목표로 하는 프로젝트이다. 다양하게 쓰이고 있는 생물학 용어들을 정리하고, 복잡한 유전자 네트워크를 데이터베이스나 응용 프로그램에서 통용될 수 있는 문서 형식으로 전환하기 위하여, GO는 각종 생물체의 데이터베이스들의 컨소시엄의 형태로 결성되었고, GO는 사실상 이 분야의 표준으로 자리 잡고 있다. 이 프로젝트는 gene product의 특징을 설명하기 위해 잘 정의된 용어의 온톨로지를 제공한다.
본 발명의 일 실시예에 따르면 유전자온톨로지기반비교부(152)는 상기 유전자 온톨로지 정보에 기초하여 유사도를 산출한다.
유전자온톨로지정보추출부(152.1)는 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 추출한다. 이를 위해 유전자온톨로지정보추출부(152.1)는 내부에 유전자 온톨로지 데이터베이스를 구비하고 있을 수 있거나, 메모리(400)에 구비된 유전자 온톨로지 데이터베이스에서 필요한 정보를 불러오거나, 혹은 네트워크인터페이스(300)를 통해 외부의 경로데이터베이스(2000)의 유전자 온톨로지 정보를 불러올 수 있다.
유전자온톨로지유사도비교부(152.2)는 상기 유전자온톨로지정보추출부(152.1)에서 추출한 유전자 온톨로지 정보에 기초하여 유사도를 산출한다. 상기 유전자온톨로지유사도비교부(152.2)는 두 약물의 작용 경로에 포함된 유전자들의 유전자 온톨로지 정보를 비교하여 이들의 일치 여부에 따라 일치율을 도출하고, 이에 기초하여 두 약물의 유사도를 산출한다. 상세하게는, 유전자 온톨로지 정보에 기초하여, 약물의 작용 경로를 묘사하는 바이너리 벡터(Binary Vector)를 기준이 되는 약물 및 비교대상이 되는 약물에 대하여 각각 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
도 10은 본 발명의 일 실시예에 따른 KEGG기반비교부의 내부구성요소를 개략적으로 도시하는 블록도이다.
도 10을 참조하면 본 발명의 일 실시예에 따른 KEGG기반비교부(153)는, 내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드부(153.1); 약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성부(153.2); 및 추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교부(153.3);를 포함한다.
KEGG기반비교부(153)는 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출한다. KEGG는 Kyoto Encyclopedia of Genes and Genomes의 약자로서, 1995년 일본에서 만들어진 생화학 경로 데이터베이스이다. KEGG는 생화학 경로에 관련된 유전자들의 기능적 특성과 유전자내의 위치적 특성을 연계해서 제공한다. 또한, 유사한 기능이나 형태를 나타낼 뿐만 아니라, 특정 경로와 관련된 유전자들의 대사 관계 및 경로에 관련된 조절 기능을 수행하는 유전자의 위치나 상호 작용을 나타낸다.
KEGG데이터로드부(153.1)는 내부의 메모리(400)로부터 KEGG 경로 데이터베이스를 불러오거나, 또는 네트워크인터페이스(300)를 통해 외부의 경로데이터베이스(2000)로부터 KEGG 데이터베이스를 불러온다.
KEGG경로생성부(153.2)는 상기 KEGG데이터로드부(153.1)가 불러온 KEGG 경로 데이터베이스에 기초하여 약물의 작용 경로에서 KEGG 경로를 추출하고, 이를 특징화한다.
KEGG경로유사도비교부(153.3)는 상기 KEGG경로생성부(153.2)가 추출한 KEGG경로에 기초하여 유사도를 산출한다. 상기 KEGG경로유사도비교부(153.3)는 두 약물의 작용 경로에서 추출한 KEGG 경로를 비교하고, 이들의 일치 여부에 따른 일치율을 도출하고, 이에 기초하여 두 약물의 유사도를 산출한다. 바람직하게는, 상기 KEGG경로생성부(153.2)가 추출한 KEGG경로에 해당하는 요소를 지시하는 바이너리 벡터(Binary Vector)를 기준이 되는 약물 및 비교대상이 되는 약물에 대하여 각각 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
도 11은 본 발명의 일 실시예에 따른 유사성판정부의 동작을 개략적으로 도시하는 도면이다.
유사성판정부(160)은 유사도비교부(150)가 산출한 유사도에 기초하여 약물의 유사 여부를 판단한다.
본 발명의 일 실시예에 따르면 유사도비교부(150)는 유전자 기반 유사도, 유전자 온톨로지(GO) 기반 유사도, 및 KEGG 기반 유사도를 포함한 세 종류의 유사도를 산출한다. 도 11은 다양한 약물 조합에 대해 이와 같은 유사도 산출 결과를 정리한 결과이다. 각각의 유사도는 내림차순 순으로 정렬되어 있다.
도 11을 참조하면 약물 A와 약물 B의 유전자 기반 유사도는 0.62이고, 유전자 온톨로지 기반 유사도는 0.69이고, KEGG 기반 유사도는 0.96이다. 또한, 약물 C와 약물 E의 유전자 기반 유사도는 0.51이고, 유전자 온톨로지 기반 유사도는 0.77이고, KEGG 기반 유사도는 0.90이다.
유사성판정부(160)는 이와 같은 세 종류의 유사도 중 어느 하나의 유사도가 각각 설정된 일정 수치 이상의 유사도를 갖는 경우 유사 판정을 내릴 수 있다. 혹은 세 종류의 유사도 중 둘 이상의 유사도가 각각 설정된 일정 수치 이상의 유사도를 갖는 경우 유사 판정을 내릴 수도 있다. 가장 바람직하게는 세 종류의 유사도 모두에 대하여 각각 설정된 일정 수치 이상의 유사도를 갖는 약물쌍에 대하여만 유사 판정을 내리게 된다. 유사 판정을 내리기 위한 기준이 되는 수치는 세 종류의 유사도 각각에 대해 다르게 설정될 수 있고, 유사도 판단의 목적에 따라 다르게 설정될 수도 있다.
도 11의 예를 들면 도 11에 도시된 약물의 유사도 비교는 약물의 새로운 적응증을 발견하기 위한 유사도 판단 기준을 적용한 것으로서, 유전자 기반 유사도의 유사 판정 기준이 되는 유사도는 0.5이고, 유전자 온톨로지 기반 유사도의 유사 판정 기준이 되는 유사도는 0.6, KEGG 기반 유사도의 유사 판정 기준이 되는 유사도는 0.8에 해당된다. 따라서 약물 G 및 약물 K의 세 유사도는 모두 각각의 유사 판정 기준에 못 미치므로 두 약물은 유사하지 않다고 판단한다.
또한, 약물 F 및 약물 G의 유전자 온톨로지 기반 유사도 및 KEGG 기반 유사도는 각각 0.66 및 0.86으로 유사 판정 기준보다 높지만, 유전자 기반 유사도는 0.45로 유사 판정 기준인 0.5에 미치지 못하므로 두 약물은 유사하지 않다고 판단한다.
만약, 약물의 새로운 적응증을 발견하기 위한 유사도 판단이 아닌, 약물의 부작용을 예측하기 위한 유사도 판단을 할 경우, 유전자 기반 유사도의 유사 판정 기준이 되는 유사도는 0.35이고, 유전자 온톨로지 기반 유사도의 유사 판정 기준이 되는 유사도는 0.65, KEGG 기반 유사도의 유사 판정 기준이 되는 유사도는 0.85에 해당된다. 이 때 약물 F 및 약물 G의 세 유사도는 모두 각각의 유사 판정 기준을 충족하기 때문에 두 약물은 유사하다고 판단한다.
이처럼 유사 판정 기준은 그 목적 및 유사도에 따라 변할 수 있기 때문에, 각각의 목적 및 유사도에 대한 판단 기준이 미리 저장되어 있을 수 있다. 바람직하게는, 상기 판단 기준은 메모리(400)의 유사도 판단 기준(430)에 저장된다.
이와 같이 판정 기준을 설정하여 약물의 작용 경로의 유사도를 비교함으로써, 이미 알려진 약물과 새로운 약물의 유사 여부를 판단하고, 유사하다고 판단한 경우, 새로운 약물의 적응증을 용이하게 예측할 수 있는 효과를 발휘할 수 있고, 또한, 이미 알려진 약물의 경우 약물의 알려지지 않은 효과를 예측하여 약물에 대한 신약재창출을 용이하게 할 수 있는 효과를 발휘할 수 있게 된다.
도 12는 본 발명의 일 실시예에 따른 약물의 유사도 판단방법을 개략적으로 도시하는 순서도이다.
도 12를 참고하면 본 발명의 일 실시예에 따른 약물의 유사도 판단방법은, 기준이 되는 약물의 정보를 입력 받는 제1약물정보입력단계(S100); 비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력단계(S200); 생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드단계(S300); 상기 경로데이터에 기초하여 상기 제1약물정보입력단계 및 제2약물정보입력단계에서 입력 받은 약물의 작용 경로를 생성하는 경로생성단계(S400); 상기 경로생성단계에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교단계(S500); 및 상기 유사도비교단계에서 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정단계(S600);를 포함한다.
상기 제1약물정보입력단계(S100)는 기준이 되는 약물의 정보를 입력 받는다. 입력 받는 상기 약물의 정보는 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 제1약물정보입력단계(S100)는 앞서 설명한 약물의 유사도 판단장치의 제1약물정보입력부(110)의 동작과 동일하다.
상기 제2약물정보입력단계(S200)는 비교대상이 되는 약물의 정보를 입력 받는다. 제1약물정보입력단계(S100)와 마찬가지로 입력 받는 약물의 정보는 약물의 이름, 화학식, 구조식 등 약물 자체에 대한 정보일 수 있고, 혹은 약물이 직접 작용하는 유전자에 대한 정보일 수 있다. 상기 제2약물정보입력단계(S200)는 앞서 설명한 약물의 유사도 판단장치의 제2약물정보입력부(120)의 동작과 동일하다.
상기 경로데이터로드단계(S300)는 내부의 메모리 또는 외부의 데이터베이스로부터 생체 약물 작용에 대한 경로데이터를 불러온다. 상기 경로데이터로드단계(S300)는 앞서 설명한 약물의 유사도 판단장치의 경로데이터로드부(130)의 동작과 동일하다.
상기 경로생성단계(S400)는 제1약물정보입력단계(S100) 및 제2약물정보입력단계(S200)에서 입력 받은 약물의 정보에 따라 상기 경로데이터로드단계(S300)에서 불러온 생체 약물 작용에 대한 경로데이터에 기초하여 상기 약물의 작용 경로를 생성한다. 상기 경로생성단계(S400)는 앞서 설명한 약물의 유사도 판단장치의 경로생성부(140)의 동작과 동일하다.
상기 유사도비교단계(S500)는 상기 경로생성단계(S400)에서 생성된 약물의 작용 경로의 유사도를 산출한다. 본 발명의 일 실시예에 따르면, 상기 유사도를 산출하기 위해서는 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하거나, 약물의 작용 경로에 포함된 유전자의 온톨로지 정보에 기초하여 유사도를 산출하거나, 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하거나, 혹은 상기 산출 방법의 둘 이상의 조합에 의하여 유사도를 산출할 수 있다. 상기 유사도비교단계(S500)는 앞서 설명한 약물의 유사도 판단장치의 유사도비교부(150)의 동작과 동일하다.
상기 유사성판정단계(S600)는 상기 유사도비교단계(S500)에서 산출한 약물의 작용 경로의 유사도에 기초하여 약물의 유사 여부를 판단한다. 유사성판정단계(S600)에서는 두 약물의 작용 경로의 유사도가 기저장된 유사도판단기준을 충족하는 경우 두 약물이 유사하다고 판단한다.
도 13은 본 발명의 일 실시예에 따른 유사도비교단계를 개략적으로 도시하는 순서도이다.
도 13을 참고하면 본 발명의 일 실시예에 따른 유사도비교단계(S500)는, 약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교단계(S510); 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교단계(S520); 및 약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교단계(S530);를 포함한다.
본 발명의 일 실시예에 따른 유사도비교단계(S500)는 경로생성단계(S400)에서 생성된 약물의 작용 경로의 유사도를 산출한다.
유전자기반비교단계(S510)는, 약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출단계; 및 상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정단계;를 포함할 수 있다.
상기 유전자정보추출단계에서는 약물의 작용 경로에 포함된 유전자 정보를 추출한다. 이 후 상기 매칭율산정단계에서는 추출한 유전자 정보에 기초하여 약물의 작용 경로를 비교한다. 상세하게는, 상기 유전자정보추출단계에서 추출한 유전자 정보에 기초하여, 약물의 작용 경로를 묘사하는 바이너리 벡터(Binary Vector)를 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
유전자온톨로지기반비교단계(S520)는, 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출단계; 및 상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교단계;를 포함할 수 있다.
상기 유전자온톨로지정보추출단계에서는 약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 추출한다. 이 후 상기 유전자온톨로지유사도비교단계 에서는 추출한 유전자 온톨로지 정보에 기초하여 유사도를 산출한다. 상세하게는, 상기 유전자온톨로지정보추출단계에서 추출한 유전자 온톨로지 정보에 기초하여, 약물의 작용 경로를 묘사하는 바이너리 벡터(Binary Vector)를 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
KEGG기반비교단계는(S530), 내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드단계; 약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성단계; 및 추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교단계;를 포함할 수 있다..
상기 KEGG데이터로드단계에서는 내부 또는 외부의 경로데이터베이스로부터 KEGG 데이터베이스를 불러온다. 이 후 상기 KEGG경로생성단계에서는 불러온 KEGG 경로 데이터베이스에 기초하여 약물의 작용 경로에서 KEGG 경로를 추출하고, 이를 특징화한다. 이 후 상기 KEGG경로유사도비교단계에서는 추출한 KEGG경로에 기초하여 유사도를 산출한다. 상세하게는, 추출한 KEGG경로에 해당하는 요소를 지시하는 바이너리 벡터(Binary Vector)를 생성하고, 생성된 두 약물의 바이너리 벡터의 자카드 계수(Jaccard Coefficient)를 계산하여 유사도를 산출한다.
도 14는 본 발명의 일 실시예에 있어서, 약물의 유사도 판단장치로 기능할 수 있는 컴퓨팅 장치의 내부 구성의 일례를 설명하기 위한 블록도이다.
도 14에 도시한 바와 같이, 컴퓨팅 장치(11000)은 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/Osubsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅 장치(11000)은 사용자단말기 혹은 환전서비스제공시스템에 해당될 수 있다.
메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅 장치(11000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그밖에 다양한 데이터를 포함할 수 있다.
이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다.
주변장치 인터페이스(11300)는 컴퓨팅 장치(11000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅 장치(11000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.
입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템(11400)을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.
전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.
통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅 장치와 통신을 가능하게 할 수 있다.
또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅 장치와 통신을 가능하게 할 수도 있다.
이러한 도 19의 실시예는, 컴퓨팅 장치(11000)의 일례일 뿐이고, 컴퓨팅 장치(11000)은 도 19에 도시된 일부 컴포넌트가 생략되거나, 도 19에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅 장치는 도 19에도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(1160)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅 장치(11000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.
본 발명의 실시예에 따른 방법들은 다양한 컴퓨팅 장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 애플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅 장치 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
본 발명의 일 실시예에 따르면, 생체 약물 작용에 대한 경로데이터에 기초하여 특정 약물의 작용 경로를 생성하여 의도하지 않은 약물의 작용을 이해할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하고, 다른 약물과의 유사성을 비교함으로써, 신약재창출을 용이하게 할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하고, 다른 약물과의 유사성을 비교함으로써, 신약의 적응증을 용이하게 예측할 수 있는 효과를 발휘할 수 있다.
본 발명의 일 실시예에 따르면, 약물의 작용 경로를 파악하여 약물의 부작용을 예측할 수 있는 효과를 발휘할 수 있다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Claims (17)
- 약물의 유사도 판단장치로서,
기준이 되는 약물의 정보를 입력 받는 제1약물정보입력부;
비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력부;
생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드부;
상기 경로데이터에 기초하여 상기 제1약물정보입력부 및 제2약물정보입력부로부터 입력 받은 약물의 작용 경로를 생성하는 경로생성부;
상기 경로생성부에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교부; 및
상기 유사도비교부가 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정부;를 포함하는 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 경로데이터는 단백질 상호작용 경로, 유전자 발현 경로, 및 생체 분자 상호작용 경로를 포함하는, 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 제1약물정보입력부는 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 기준이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고,
상기 제2약물정보입력부는 상기 제1약물정보입력부에서 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제1약물정보입력부에서 기준이 되는 약물의 발현단계 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받는, 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 유사도비교부는,
약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교부;
약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교부; 및
약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교부;를 포함하는, 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 유사도비교부는 유전자기반비교부를 포함하고,
상기 유전자기반비교부는,
약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출부; 및
상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정부;를 포함하는, 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 유사도비교부는 유전자온톨로지기반비교부를 포함하고,
상기 유전자온톨로지기반비교부는.
약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출부; 및
상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교부;를 포함하는, 약물의 유사도 판단장치.
- 청구항 1에 있어서,
상기 유사도비교부는 KEGG기반비교부를 포함하고,
상기 KEGG기반비교부는,
내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드부;
약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성부; 및
추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교부;를 포함하는, 약물의 유사도 판단장치.
- 청구항 4에 있어서,
상기 유사성판정부는,
상기 유전자기반비교부, 상기 유전자온톨로지기반비교부, 및 상기 KEGG기반비교부에서 산출한 각각의 유사도가, 각 유사도별로 기설정된 값 이상일 경우 약물이 유사하다고 판정하는, 약물의 유사도 판단장치.
- 약물의 유사도 판단방법으로서,
기준이 되는 약물의 정보를 입력 받는 제1약물정보입력단계;
비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력단계;
생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드단계;
상기 경로데이터에 기초하여 상기 제1약물정보입력단계 및 제2약물정보입력단계에서 입력 받은 약물의 작용 경로를 생성하는 경로생성단계;
상기 경로생성단계에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교단계; 및
상기 유사도비교단계에서 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정단계;를 포함하는 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 경로데이터는 단백질 상호작용 경로, 유전자 발현 경로, 및 생체 분자 상호작용 경로를 포함하는, 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 제1약물정보입력단계에서는 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 기준이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고,
상기 제2약물정보입력단계에서는 상기 제1약물정보입력단계에서 기준이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계, 중간단계, 및 목적단계의 정보, 또는 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받고, 상기 제1약물정보입력단계에서 기준이 되는 약물의 발현단계 및 목적단계의 정보를 입력 받은 경우에는 비교대상이 되는 약물의 발현단계 및 목적단계의 정보를 직접 혹은 간접적으로 입력 받는, 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 유사도비교단계는,
약물의 작용 경로에 포함된 유전자의 정보에 기초하여 유사도를 산출하는 유전자기반비교단계;
약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지기반비교단계; 및
약물의 작용 경로와 KEGG 데이터베이스의 경로 정보에 기초하여 유사도를 산출하는 KEGG기반비교단계;를 포함하는, 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 유사도비교단계는 유전자기반비교단계를 포함하고,
상기 유전자기반비교단계는,
약물의 작용 경로에 포함된 유전자 정보를 획득하는 유전자정보추출단계; 및
상기 유전자 정보의 일치 여부에 기초하여 유사도를 산출하는 매칭율산정단계;를 포함하는, 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 유사도비교단계는 유전자온톨로지기반비교단계를 포함하고,
상기 유전자온톨로지기반비교단계는,
약물의 작용 경로에 포함된 유전자의 유전자 온톨로지 정보를 획득하는 유전자온톨로지정보추출단계; 및
상기 유전자 온톨로지 정보에 기초하여 유사도를 산출하는 유전자온톨로지유사도비교단계;를 포함하는, 약물의 유사도 판단방법.
- 청구항 9에 있어서,
상기 유사도비교단계는 KEGG기반비교단계를 포함하고,
상기 KEGG기반비교단계는,
내부의 메모리, 또는 외부의 데이터베이스로부터 KEGG 경로 데이터베이스를 불러오는 KEGG데이터로드단계;
약물의 작용 경로에서 KEGG 경로를 추출하여 특징화 하는 KEGG경로생성단계; 및
추출된 상기 KEGG 경로에 기초하여 유사도를 산출하는 KEGG경로유사도비교단계;를 포함하는, 약물의 유사도 판단방법.
- 청구항 12에 있어서,
상기 유사성판정단계는,
상기 유전자기반비교단계, 상기 유전자온톨로지기반비교단계, 및 상기 KEGG기반비교단계에서 산출한 각각의 유사도가, 각 유사도별로 기설정된 값 이상일 경우 약물이 유사하다고 판정하는, 약물의 유사도 판단방법.
- 컴퓨터-판독가능 매체로서,
상기 컴퓨터-판독가능 매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은:
기준이 되는 약물의 정보를 입력 받는 제1약물정보입력단계;
비교대상이 되는 약물의 정보를 입력 받는 제2약물정보입력단계;
생체 약물 작용에 대한 경로데이터를 내부의 메모리, 또는 외부의 데이터베이스로부터 불러오는 경로데이터로드단계;
상기 경로데이터에 기초하여 상기 제1약물정보입력단계 및 제2약물정보입력단계에서 입력 받은 약물의 작용 경로를 생성하는 경로생성단계;
상기 경로생성단계에서 생성된 약물의 작용 경로의 유사도를 산출하는 유사도비교단계; 및
상기 유사도비교단계에서 산출한 유사도에 기초하여 약물의 유사 여부를 판단하는 유사성판정단계;를 포함하는, 컴퓨터-판독가능 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170039150A KR101964694B1 (ko) | 2017-03-28 | 2017-03-28 | 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170039150A KR101964694B1 (ko) | 2017-03-28 | 2017-03-28 | 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180109421A true KR20180109421A (ko) | 2018-10-08 |
KR101964694B1 KR101964694B1 (ko) | 2019-08-07 |
Family
ID=63864736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170039150A KR101964694B1 (ko) | 2017-03-28 | 2017-03-28 | 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101964694B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200046314A (ko) * | 2018-10-24 | 2020-05-07 | 가천대학교 산학협력단 | 약의 신규 특성을 도출하는 방법, 장치 및 컴퓨터-판독가능 매체 |
WO2020138589A1 (ko) * | 2018-12-24 | 2020-07-02 | 주식회사 메디리타 | 신약 후보 물질 발굴을 위한 멀티오믹스 데이터 처리 장치 및 방법 |
WO2020184816A1 (ko) * | 2019-03-13 | 2020-09-17 | 주식회사 메디리타 | 신약 후보 물질 도출을 위한 데이터 처리 방법 |
KR20200110141A (ko) * | 2019-03-13 | 2020-09-23 | 주식회사 메디리타 | 신약 후보 물질 도출을 위한 데이터 처리 방법 |
KR20220043297A (ko) * | 2020-09-29 | 2022-04-05 | 가천대학교 산학협력단 | 유사도 측정에 기반한 약물의 부작용을 예측하는 방법, 시스템, 및 컴퓨터-판독가능 매체 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102110176B1 (ko) * | 2019-10-11 | 2020-05-13 | 주식회사 메디리타 | 신약 후보 물질 도출 방법 및 장치 |
WO2022119256A1 (ko) * | 2020-12-01 | 2022-06-09 | 광주과학기술원 | 자기주의 기반 계층구조 네트워크를 이용한 약물 반응 예측 장치 및 그 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160010276A (ko) * | 2014-07-17 | 2016-01-27 | 한국과학기술원 | 네트워크 조절 모티프 발굴 시스템 및 그 방법 |
-
2017
- 2017-03-28 KR KR1020170039150A patent/KR101964694B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160010276A (ko) * | 2014-07-17 | 2016-01-27 | 한국과학기술원 | 네트워크 조절 모티프 발굴 시스템 및 그 방법 |
Non-Patent Citations (2)
Title |
---|
A. Fokoue 외 3인, "Predicting Drug-Drug Interactions Through Similarity-Based Link Prediction Over Web Data", WWW’16 Companion, 2016.04.11. * |
L. Chen 외 5인, "Gene Ontology and KEGG Pathway Enrichment Analysis of a Drug Target-Based Classification System", PLOS ONE, 2015.05.07. * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200046314A (ko) * | 2018-10-24 | 2020-05-07 | 가천대학교 산학협력단 | 약의 신규 특성을 도출하는 방법, 장치 및 컴퓨터-판독가능 매체 |
WO2020138589A1 (ko) * | 2018-12-24 | 2020-07-02 | 주식회사 메디리타 | 신약 후보 물질 발굴을 위한 멀티오믹스 데이터 처리 장치 및 방법 |
US11915832B2 (en) | 2018-12-24 | 2024-02-27 | Medirita | Apparatus and method for processing multi-omics data for discovering new drug candidate substance |
WO2020184816A1 (ko) * | 2019-03-13 | 2020-09-17 | 주식회사 메디리타 | 신약 후보 물질 도출을 위한 데이터 처리 방법 |
KR20200110141A (ko) * | 2019-03-13 | 2020-09-23 | 주식회사 메디리타 | 신약 후보 물질 도출을 위한 데이터 처리 방법 |
KR20200123771A (ko) * | 2019-03-13 | 2020-10-30 | 주식회사 메디리타 | 멀티오믹스 네트워크 기반 신약 후보 물질 탐색 방법 |
KR20220043297A (ko) * | 2020-09-29 | 2022-04-05 | 가천대학교 산학협력단 | 유사도 측정에 기반한 약물의 부작용을 예측하는 방법, 시스템, 및 컴퓨터-판독가능 매체 |
Also Published As
Publication number | Publication date |
---|---|
KR101964694B1 (ko) | 2019-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20180109421A (ko) | 약물의 유사도 판단장치, 방법, 및 컴퓨터-판독가능매체 | |
Pun et al. | AI-powered therapeutic target discovery | |
MacLean | Knowledge graphs and their applications in drug discovery | |
JP6253644B2 (ja) | 統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 | |
Brown et al. | A graph-based genetic algorithm and its application to the multiobjective evolution of median molecules | |
Selvaraj et al. | Microarray data analysis and mining tools | |
Jacunski et al. | Connecting the dots: applications of network medicine in pharmacology and disease | |
Reimand et al. | Domain-mediated protein interaction prediction: From genome to network | |
Cruz-Monteagudo et al. | Systemic QSAR and phenotypic virtual screening: chasing butterflies in drug discovery | |
KR102356257B1 (ko) | 인공 지능 기반의 유전체 분석 및 의약 물질 개발 방법 및 시스템 | |
Cathryn et al. | A review of bioinformatics tools and web servers in different microarray platforms used in cancer research | |
Castillo-Secilla et al. | KnowSeq R-Bioc package: The automatic smart gene expression tool for retrieving relevant biological knowledge | |
Frasca | Automated gene function prediction through gene multifunctionality in biological networks | |
Zhang et al. | Modeling metabolic variation with single-cell expression data | |
KR102530114B1 (ko) | 유사도 측정에 기반한 약물의 부작용을 예측하는 방법, 시스템, 및 컴퓨터-판독가능 매체 | |
KR102321732B1 (ko) | Snp를 포함하는 약물의 효능변화 예측장치, 방법, 및 컴퓨터-판독가능매체 | |
Alaimo et al. | Computational methods to Investigate the Impact of miRNAs on pathways | |
van Gastel et al. | Enhanced molecular appreciation of psychiatric disorders through high-dimensionality data acquisition and analytics | |
Rouillard et al. | Reprint of “Abstraction for data integration: Fusing mammalian molecular, cellular and phenotype big datasets for better knowledge extraction” | |
Wang et al. | Leverage large-scale biological networks to decipher the genetic basis of human diseases using machine learning | |
Sarajlić et al. | Survey of Network‐Based Approaches to Research of Cardiovascular Diseases | |
Espinal-Enríquez et al. | Computational approaches in precision medicine | |
Heer et al. | Esearch3D: propagating gene expression in chromatin networks to illuminate active enhancers | |
Hung et al. | Analyzing microarray data | |
Heinzel et al. | Data graphs for linking clinical phenotype and molecular feature space |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |