KR20070060959A - 단백질 활성부위 검색 장치 및 방법 - Google Patents

단백질 활성부위 검색 장치 및 방법 Download PDF

Info

Publication number
KR20070060959A
KR20070060959A KR1020060013695A KR20060013695A KR20070060959A KR 20070060959 A KR20070060959 A KR 20070060959A KR 1020060013695 A KR1020060013695 A KR 1020060013695A KR 20060013695 A KR20060013695 A KR 20060013695A KR 20070060959 A KR20070060959 A KR 20070060959A
Authority
KR
South Korea
Prior art keywords
active site
input
residues
residue
protein
Prior art date
Application number
KR1020060013695A
Other languages
English (en)
Other versions
KR100734880B1 (ko
Inventor
김대희
박성희
박찬용
박선희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020060013695A priority Critical patent/KR100734880B1/ko
Priority to US11/505,397 priority patent/US7734425B2/en
Publication of KR20070060959A publication Critical patent/KR20070060959A/ko
Application granted granted Critical
Publication of KR100734880B1 publication Critical patent/KR100734880B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F1/00Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics
    • G02F1/01Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour 
    • G02F1/13Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour  based on liquid crystals, e.g. single liquid crystal display cells
    • G02F1/133Constructional arrangements; Operation of liquid crystal cells; Circuit arrangements
    • G02F1/1333Constructional arrangements; Manufacturing methods
    • G02F1/1335Structural association of cells with optical devices, e.g. polarisers or reflectors
    • G02F1/1336Illuminating devices
    • G02F1/133602Direct backlight
    • G02F1/133608Direct backlight including particular frames or supporting means
    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F1/00Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics
    • G02F1/01Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour 
    • G02F1/13Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour  based on liquid crystals, e.g. single liquid crystal display cells
    • G02F1/133Constructional arrangements; Operation of liquid crystal cells; Circuit arrangements
    • G02F1/1333Constructional arrangements; Manufacturing methods
    • G02F1/1335Structural association of cells with optical devices, e.g. polarisers or reflectors
    • G02F1/1336Illuminating devices
    • G02F1/133602Direct backlight
    • G02F1/133604Direct backlight with lamps
    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F1/00Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics
    • G02F1/01Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour 
    • G02F1/13Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour  based on liquid crystals, e.g. single liquid crystal display cells
    • G02F1/133Constructional arrangements; Operation of liquid crystal cells; Circuit arrangements
    • G02F1/1333Constructional arrangements; Manufacturing methods
    • G02F1/1335Structural association of cells with optical devices, e.g. polarisers or reflectors
    • G02F1/1336Illuminating devices
    • G02F1/133602Direct backlight
    • G02F1/133605Direct backlight including specially adapted reflectors
    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F1/00Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics
    • G02F1/01Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour 
    • G02F1/13Devices or arrangements for the control of the intensity, colour, phase, polarisation or direction of light arriving from an independent light source, e.g. switching, gating or modulating; Non-linear optics for the control of the intensity, phase, polarisation or colour  based on liquid crystals, e.g. single liquid crystal display cells
    • G02F1/133Constructional arrangements; Operation of liquid crystal cells; Circuit arrangements
    • G02F1/1333Constructional arrangements; Manufacturing methods
    • G02F1/133308Support structures for LCD panels, e.g. frames or bezels
    • G02F1/133314Back frames
    • GPHYSICS
    • G02OPTICS
    • G02FOPTICAL DEVICES OR ARRANGEMENTS FOR THE CONTROL OF LIGHT BY MODIFICATION OF THE OPTICAL PROPERTIES OF THE MEDIA OF THE ELEMENTS INVOLVED THEREIN; NON-LINEAR OPTICS; FREQUENCY-CHANGING OF LIGHT; OPTICAL LOGIC ELEMENTS; OPTICAL ANALOGUE/DIGITAL CONVERTERS
    • G02F2201/00Constructional arrangements not provided for in groups G02F1/00 - G02F7/00
    • G02F2201/46Fixing elements
    • G02F2201/465Snap -fit

Landscapes

  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Nonlinear Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Optics & Photonics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

단백질 활성부위 검색 장치 및 방법이 개시된다. 이 장치는 복수의 기준 활성부위에 대한 정보를 저장하는 활성부위 데이터베이스; 입력된 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 상호 간에 겹쳐진 잔기의 개수에 따라 3차원 구조상의 유사도를 산출하는 비교부; 및 상기 유사도에 따라 상기 입력활성부위에 대한 기준 활성부위를 검색하는 검색부를 포함하는 것을 특징으로 한다. 본 발명에 따르면, 유사한 활성부위를 낮은 복잡도로 검색할 수 있어, 정확한 신약 설계에 이용될 수 있다.

Description

단백질 활성부위 검색 장치 및 방법{Apparatus and method for Protein Active Site search}
도 1은 본 발명의 일실시예에 따른 단백질 활성부위 검색 장치의 구성을 나타내는 블록도이다.
도 2a는 본 발명의 일실시예에 따른 도 1의 활성부위 데이터베이스의 구체적인 구성을 예시한 블록도이며, 도 2b는 본 발명의 일실시예에 따른 활성부위 DB를 생성하는 방법을 나타내는 흐름도이다.
도 3은 본 발명의 일실시예에 따른 활성부위 검색을 위한 DB 테이블로서, 도 1의 활성부위 데이터베이스가 활성부위 정보를 저장한 형식을 예시한 것이다.
도 4는 도 1의 비교부의 구체적인 구성을 예시하는 블록도이다.
도 5a 및 도 5b는 각각 입력된 활성부위 및 저장된 활성부위의 예를 나타내며, 비교부(150)를 설명하기 위한 도면이다.
도 6는 본 발명의 일실시예에 따른 활성부위 검색에 사용되는 3차원 참조 프레임(3-Dimensional Reference Frame)을 나타낸다.
도 7은 본 발명의 일실시예에 따른 단백질 활성부위 검색 방법 및 장치의 동작을 나타내는 흐름도이다.
도 8은 본 발명의 일실시예에 따른 단백질 활성부위 검색 장치 및 방법에 대 한 사용자 인터페이스를 예시하는 도면이다.
본 발명은 단백질 활성부위 검색 장치 및 방법에 관한 것으로 신약개발에 있어서 중요한 역할을 하는 단백질 활성부위에 대해 이의 특징을 3차원 구조적으로 접근하여 다른 활성부위들과의 유사성을 찾아 검출 제공하는 단백질 활성부위 비교검색 장치 및 방법에 관한 것이다.
기존의 관련 연구를 살펴보면, 전체적으로 모양이 유사한 단백질 검색을 위한 방법들이 제안되어 왔으나, 활성부위 비교 검색은 그렇지 않다. 지금까지 단백질 구조 비교를 위한 많은 방법들이 제안되어 왔는데 단백질 원자의 위치와 원자들 간의 거리 비교에 따른 방법, 단백질 알파 탄소의 위치만을 가지고 유사도를 측정하는 방법 등을 들 수 있다. 또한, 단백질 구조 비교를 위해서 지오메트릭 해싱(geometric hashing)을 이용한 방법도 제안되었으나 단백질의 크기가 커질수록 복잡도가 제곱에 비례하여 커져 계산상 오랜 시간이 걸리는 단점을 지니고 있다.
본 발명이 이루고자 하는 기술적 과제는, 유사한 활성부위의 검색을 낮은 복잡도로 정확히 달성할 수 있도록 하는 단백질 활성부위 검색 장치 및 방법을 제공하는 데 있다.
상기의 기술적 과제를 이루기 위한, 본 발명에 의한 단백질 활성부위 검색 장치는 복수의 기준 활성부위에 대한 정보를 저장하는 활성부위 데이터베이스; 입력된 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 상호 간에 겹쳐진 잔기의 개수에 따라 3차원 구조상의 유사도를 산출하는 비교부; 및 상기 유사도에 따라 상기 입력활성부위에 대한 기준 활성부위를 검색하는 검색부를 포함하는 것을 특징으로 한다.
상기의 다른 기술적 과제를 이루기 위한, 본 발명에 의한 단백질 활성부위 검색 방법은 복수의 기준 활성부위에 대한 정보를 저장하는 단계; 입력된 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 상호 간에 겹쳐진 잔기의 개수에 따라 3차원 구조상의 유사도를 산출하는 비교 단계; 및 상기 유사도에 따라 상기 입력 활성부위에 대한 기준 활성부위를 검색하는 단계를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 방법 및 장치에 대해 상세히 설명한다.
구조 유전체학을 이용한 신약 개발은, 단백질의 형태를 3차원으로 모델링하여 단백질의 활성 부위와 구조적으로 결합할 수 있도록 약을 설계하는 방법을 사용한다. 여기서, 실제 비아그라와 같은 경우에서처럼 설계된 신약이 처리를 원하는 단백질의 활성부위와 결합할 뿐만 아니라 원하지 않는 다른 단백질의 활성부위와도 결합하여 두통, 안면홍조, 소화불량, 심장마비 등의 여러 가지 부작용을 초래한다. 따라서, 그와 같은 유사 활성부위를 정확하고 낮은 복잡도로 검색하는 방법이 필요 하며, 이는 좀더 정확한 신약 설계에 기여할 수 있다. 이에 본 발명은 단백질의 활성 부위들의 3차원 형태가 포켓(움푹 들어감)의 형태로 존재하기 때문에 단백질에서 활성부위 즉, 포켓을 추출하고 그 데이터를 DB(Data Base)로 저장한 후 사용자가 원하는 활성부위를 DB 내에 존재하는 활성부위들과 비교 검색하여 유사한 활성부위를 찾아내는 방법을 사용한다. 즉, 본 발명은 3차원 구조공간 상에서 활성부위를 잔기의 참조 프레임으로 표현하고 이를 지오메트릭 해싱 기법을 이용하여 검색한다. 활성부위 추출을 위해서 일반적으로 사용되는 Delaunay 삼각형 분할 방법을 이용하여 convex hull을 구성하고 alpha shape 방법으로 단백질의 표면을 구성하며 Descrete Flow 방법을 이용하여 활성부위를 재구성하였으며, 활성부위 검색은 잔기를 기준으로 지오메트릭 해싱에 기반하여 이루어진다.
도 1은 본 발명의 일실시예에 따른 단백질 활성부위 검색 장치의 구성을 나타내는 블록도로서, PDB 입력부(110), 디스플레이부(120), 활성부위 추출부(130), 활성부위 선택부(140), 비교부(150), 활성부위 데이터베이스(160) 및 순위화부(170)를 포함하여 이루어진다.
PDB 입력부(110)는 사용자로부터 PDB(Protein Data Bank : 이하, PDB라 칭함) 형식의 원하는 단백질을 입력받는다.
디스플레이부(120)는 입력된 PDB 파일로부터 단백질의 3차원 구조를 가시화한다. 즉, 입력된 PDB 파일에 대해서 화면에 원자들의 좌표를 기본으로 디스플레이하여, 사용자가 검색을 원하는 활성부위에 속하는 원자 및 잔기를 선택할 수 있게 한다.
활성부위 추출부(130)는 입력된 PDB 파일로부터 활성부위를 추출한다.
활성부위 선택부(140)는 입력된 PDB 파일에 포함된 단백질내의 활성부위 중에서, 데이터베이스(160)에 저장된 기준 활성부위와 비교검색을 원하는 활성부위를 선택하여 비교부(150)로 제공한다. 여기서, 선택 방법의 예로는, 활성부위 추출부(130)에서 추출된 활성부위 중에서 사용자가 선택하는 방법, 디스플레이부(120)에 디스플레이된 원자 또는 잔기 등을 사용자가 선택하면, 선택된 원자 또는 잔기가 속하는 활성부위가 선택되어, 비교부(150)로 제공하는 방법 등이 있으나, 반드시 이에 한하지는 않는다. 즉, 전자의 방법은 자동으로 추출된 활성부위 중에서 비교 검색을 원하는 활성부위를 사용자가 선택하는 것이고, 후자의 방법은 가시화된 화면상에서 원하는 활성부위를 원자 레벨에서 수동으로 선택하여 비교부(150)의 입력으로 제공하는 방법인 것이다.
비교부(150)는 활성부위 선택부(130)에서 선택된 활성부위(즉, 입력 활성부위)와 유사한 활성부위를 3차원 지오메트릭 해싱(Geometric Hashing)을 이용하여 활성 부위 데이터베이스(160)에서 검색한다. 즉, 비교부(150)는 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 3차원 구조상의 유사도를 산출한다. 본 명세서에서는, 선택된 활성부위를 입력 활성부위라 칭하고, 활성부위 데이터베이스(160)에 저장된 활성부위(즉, 입력 활성부위와 비교할 활성부위)를 기준 활성부위라 편의상 칭한다.
활성부위 데이터베이스(160)는 전처리를 통하여 기준 활성부위에 대한 정보를 데이터 베이스(data base) 형태로 저장한다. 즉, 복수의 기준 활성부위에 대한 정보를 저장하며, 그 저장되는 데이터 베이스 형태의 예로는 후술할 도 3의 데이터 베이스의 형태를 들 수 있다.
순위화부(170)는 산출된 유사도에 따라 입력 활성부위에 대한 기준 활성부위를 검색하는 검색부의 일실시예로서, 비교부(150)에서 산출된 복수 개의 유사도 결과를 순위화하여 사용자에게 상위순위에 해당되는 기준 활성부위에 대한 정보를 제공한다. 즉, 순위화부(170)는 검색결과를 유사도 순으로 사용자에게 디스플레이하는 기능을 갖는다.
도 2a는 본 발명의 일실시예에 따른 활성부위 데이터베이스(160)의 구체적인 구성을 예시한 블록도로서, PDB 입력부(210), 활성부위 추출부(220) 및 활성부위 DB 생성부(230)를 포함하여 이루어진다.
도 2b는 본 발명의 일실시예에 따른 활성부위 DB를 생성하는 방법을 나타내는 흐름도이다.
도 2a 및 도 2b를 참조하여, 활성부위 DB를 생성하는 과정을 설명하면 다음과 같다.
PDB 입력부(210)는 처리하고자 하는 단백질에 대한 정보를 포함하는 PDB(Protein Data Bank : 이하, PDB라 칭함) 파일을 입력받는다(S210).
활성부위 추출부(220)는 입력된 PDB 파일에서 활성부위를 추출한다. 구체적인 추출과정의 예로는 다음과 같다. PDB 파일을 기초로, 단백질에 대한 원자들의 좌표값을 파싱한 후(S220), 원자들의 좌표값을 입력으로 Delaunay 삼각형 분할 방법을 이용하여(S230) convex hull을 구성한다(S240). 이후, 구성된 convex hull에 대해서 적절한 alpha 값을 이용한 alpha shape 방법으로 단백질의 표면을 구성하고(S250), Descrete Flow로 활성부위를 추출한다(S260).
활성부위 DB 생성부(230)는 추출된 활성부위에 대한 정보를 소정의 형식의 데이터 베이스 형태로 생성한다. 여기서, 소정의 형식의 데이터 베이스에 대한 테이블의 예로서, 도 3을 들 수 있다. 데이터 베이스 생성 방법의 예로는 다음과 같다. 각각의 활성부위는 원자들의 좌표로 이루어져 있으며 각 원자가 포함된 잔기들을 활성부위로 재구성한다(S270). 여기서, 활성부위를 구성하는 최소 단위는 잔기이다. 이러한 일련의 과정을 거쳐 후술할 도 3과 같은 데이터 베이스 형태를 생성하여 저장하는 것이다(S280). 구조가 밝혀진 활성부위 추출을 원하는 다른 단백질에 대해서도 같은 방법으로 PDB 파일을 이용하여 데이터 베이스 구성을 완료한다.
한편, 도 2a와는 달리, 활성부위 데이터베이스(160)는 후술할 도 3의 내용을 저장한 데이터베이스라는 구성만으로 이루어질 수 있으며, 이 경우, PDB 입력부(210), 활성부위 추출부(220) 및 활성부위 DB 생성부(230)가 미리 동작하여 이러한 데이터 베이스를 생성하는 것이다. 즉, 이 경우 PDB 입력부(210), 활성부위 추출부(220) 및 활성 부위 DB 생성부(230)는 활성부위 데이터베이스(160)에 저장되는 데이터베이스를 생성하는 전처리 과정을 수행하는 것이다.
도 3은 본 발명의 일실시예에 따른 활성부위 검색을 위한 DB 테이블로서, 도 1의 활성부위 데이터베이스(160)가 활성부위 정보를 저장한 형식을 예시한 것이다.
도 3을 참조하면, DB 테이블은 모두 5개의 레코드로 구성되어 있으며, 단백 질 명칭, 단백질 활성부위 리스트, 활성부위를 구성하는 잔기들의 N, Cα, C의 위치데이터, 활성부위를 구성하는 잔기 리스트 및 각 잔기별 정규직교벡터(orthonomal vector)로 표현된다. 첫 번째 레코드에는 단백질 명칭이 들어가며, 두 번째 레코드에는 각 단백질에서 추출한 활성부위를 구성하고 있는 잔기들의 수를 기준으로 많은 것을 1번으로 하여 번호를 붙여 나간다. 세 번째 레코드에는 활성부위를 구성하는 잔기들의 N, Cα, C의 좌표 데이터를 저장하고, 그 외 원자들의 좌표는 생략한다. 즉, 활성부위가 10 개의 잔기로 구성되었다고 가정하면 10개의 N, Cα, C 좌표가 저장된다. 네 번째 레코드에는 활성부위를 구성하는 잔기 리스트를 기록한다. 다섯 번째 레코드에는 각 잔기별 정규직교벡터를 계산하여 기록한다.
도 4는 도 1의 비교부(150)의 구체적인 구성을 예시하는 블록도로서, 위치 정합부(400) 및 유사도 산출부(410)를 포함하여 이루어진다.
위치 정합부(400)는 입력 활성부위에 포함된 잔기와 기준 활성부위에 포함된 잔기가 적어도 하나 이상 겹쳐지도록, 입력 활성부위 및 기준 활성부위를 위치정합한다.
유사도 산출부(410)는 상술한 위치정합된 상태에서, 입력 활성부위 및 기준 활성부위 간에 겹쳐지는 잔기의 갯수를 기초로 상기 유사도를 산출한다.
도 5a 및 도 5b는 각각 입력 활성부위 및 기준 활성부위의 예를 나타내며, 비교부(150)를 설명하기 위한 도면이다.
도 5a의 Base라고 표기된 잔기와 도 5b의 Base라고 표기된 잔기를 겹치는 위 치 정합을 수행하면, Base로 표기된 잔기말고도, 2개의 잔기가 더 겹쳐짐을 알 수 있으며, 이 경우 산출된 유사도 값은 3이 되는 것이다. 한편, 모든 잔기에 대해 위치 정합 및 그에 따른 유사도 산출을 수행하는 것이 원칙이고, 도 5a의 활성부위에 포함된 잔기의 수는 5개이고, 도 5b의 활성부위에 포함된 잔기의 수는 4개이므로 상술한 작업(위치정합 및 유사도 산출)을 20회 수행하게 된다. 다만, 후술하는 바와 같이 산출된 유사도 값이 소정의 임계값보다 크다면, 수행되지 않은 나머지 잔기에 대한 위치정합 및 유사도 산출은 무시하고, 다음의 활성부위에 대해 검색하는 작업을 수행하는 방법도 있다.
한편, 단백질의 각 잔기는 N, Cα, C 원자를 가지고 있으며, N, Cα, C 원자들 간의 거리가 일정하다는 특성을 이용한 본 발명의 구체적인 동작을 도 5를 참조하여 설명하면 다음과 같다.
도 6는 본 발명의 일실시예에 따른 활성부위 검색에 사용되는 3차원 참조 프레임(3-Dimensional Reference Frame)으로서, 각 잔기마다 가지고 있는 N, Cα, C 원자를 사용하는 것이다.
본 발명의 일실시예에서는 잔기의 참조 프레임을 맞춰주기 위해서, Cα를 원점으로 하는 정규직교벡터
Figure 112006010439142-PAT00001
,
Figure 112006010439142-PAT00002
,
Figure 112006010439142-PAT00003
를 구하여 회전변환 및 이동변환을 실시한다. 이때,
Figure 112006010439142-PAT00004
,
Figure 112006010439142-PAT00005
,
Figure 112006010439142-PAT00006
를 구하기 위해 사용되는 수식은 수학식 1과 같다.
Figure 112006010439142-PAT00007
Figure 112006010439142-PAT00008
Figure 112006010439142-PAT00009
단백질의 각 잔기는 N, Cα, C 원자를 가지고 있으며, N, Cα, C 원자들 간의 거리가 일정하다는 특성을 이용하여, 활성부위 데이터베이스(160)는 도 3에 예시된 바와 같이, 단백질의 명칭, 상기 단백질에 포함된 활성부위의 명칭, 상기 활성부위에 포함된 잔기의 명칭, 상기 잔기의 N, Cα, C의 좌표데이터 및 상기 잔기의 정규직교벡터를 저장하며, 위치 정합부(400)는 벡터산출부(402) 및 변환부(404)를 포함하여 이루어진다.
벡터 산출부(402)는 입력 활성부위에 포함된 잔기의 N, Cα 및 C의 좌표를 기초로, 각각의 잔기에 대한 정규직교벡터를 산출한다. 도 5a의 경우라면, 활성부위에 포함된 잔기의 개수가 5개이므로 5개의 정규직교벡터가 수학식 1을 통하여 산출된다.
변환부(404)는 벡터 산출부(402)에서 산출된 정규직교벡터 및 활성부위 데이터베이스(160)에 저장된 정규직교벡터를 이용하여, 입력 활성부위에 포함된 좌표 및 기준 활성부위에 포함된 좌표를 회전변환 및 이동변환한다. 활성부위 데이터베이스(160)에 기준 활성부위로서 현재 처리중인 활성부위가 도 5b의 경우라면, 4개의 저장된 정규직교벡터가 변환부(404)에서 현재 처리중인 활성부위의 변환에 사용된다.
회전 변환은 수학식 2를 통하여 수행되며, 각 잔기의 정규직교벡터(
Figure 112006010439142-PAT00010
,
Figure 112006010439142-PAT00011
,
Figure 112006010439142-PAT00012
)로 활성부위에 포함된 모든 잔기의 좌표를 회전변환하여 새로운 좌표를 생성하는 것이다. 여기서,
Figure 112006010439142-PAT00013
,
Figure 112006010439142-PAT00014
,
Figure 112006010439142-PAT00015
는 각각
Figure 112006010439142-PAT00016
,
Figure 112006010439142-PAT00017
,
Figure 112006010439142-PAT00018
으로 표현되며,
Figure 112006010439142-PAT00019
,
Figure 112006010439142-PAT00020
,
Figure 112006010439142-PAT00021
는 입력 활성부위의 잔기 중 현재 변환될 잔기의 좌표데이터이며,
Figure 112006010439142-PAT00022
는 변환된 좌표데이터를 나타낸다.
Figure 112006010439142-PAT00023
즉, 도 5a와 같은 입력 활성부위는 5개의 잔기가 존재하여, 좌표 집합에는 5개의 잔기에 대한 좌표가 포함되어 있는 것이고, 이러한 좌표 집합에 대해, 각각의 정규직교벡터를 이용하여 회전변환을 하면 5개의 새로운 좌표집합이 생성된다. 수학식 2는 좌표 집합에 속하는 한 개의 잔기의 좌표 (
Figure 112006010439142-PAT00024
,
Figure 112006010439142-PAT00025
,
Figure 112006010439142-PAT00026
)를 5개의 잔기의 정규직교벡터 중의 하나인 (
Figure 112006010439142-PAT00027
,
Figure 112006010439142-PAT00028
,
Figure 112006010439142-PAT00029
)를 적용하여 회전변환된 (
Figure 112006010439142-PAT00030
,
Figure 112006010439142-PAT00031
,
Figure 112006010439142-PAT00032
) 좌표를 산출하는 것을 의미한다.
기준 활성부위도 마찬가지로 저장된 정규직교벡터를 이용하여 회전변환하고, 그 결과 기준 활성부위에 대한 새로운 잔기의 좌표가 산출된다. 도 5b를 참조하면, 4개의 새로운 좌표 집합이 생성되며, 각각의 새로운 좌표집합은 4개의 잔기에 대한 새로운 좌표를 포함한다.
유사도 산출부(410)는 변환부(402) 및 벡터 산출부(404)의 상술한 동작에 대응하여, 입력 활성부위에 포함된 잔기의 상기 변환된 좌표와 기준 활성부위에 포함된 잔기의 상기 변환된 좌표가 일치하면, 상기 잔기가 겹쳐지는 것으로 판단하는 방법으로 겹쳐지는 잔기의 개수를 산출한다. 유사도 산출 방법의 예로는 수학식 3에 의한 방법을 들 수 있으나, 반드시 이에 한정되는 것은 아니다.
Figure 112006010439142-PAT00033
한편, 도 5a인 입력 활성부위와 도 5b인 현재 처리중인 기준 활성부위의 비교에 있어서, 각각의 활성부위는 5개, 4개의 잔기를 가지게 되므로 20가지의 위치 정합된 조건에서 비교된다. 즉, 20 가지의 위치 정합된 조건 각각에 대해 겹쳐지는 잔기의 개수가 산출된다. 20 개의 산출된 잔기의 개수 중 가장 큰 값이 원칙적으로 현재 처리중인 기준 활성부위의 유사도가 된다. 다만, 유사도 산출 작업의 속도를 증가시키기 위해 산출된 겹쳐진 간기의 갯수가 소정 임계치보다 크면, 현재 처리중인 기준 활성부위에 대한 유사도 산출 작업을 종료하는 방법을 사용할 수도 있다.
도 7은 본 발명의 일실시예에 따른 단백질 활성부위 검색 방법 및 장치의 동작을 나타내는 흐름도이다. 도 1 및 도 4를 참조하여 설명하면 다음과 같다.
PDB 파일이 PDB 입력부(110)에 입력된 후(S700), 검색을 원하는 활성부위가 선택되는 데, 수동으로 활성부위가 선택될 것인지 사용자에 의해 결정된다(S705). 수동으로 활성부위가 선택되지 않는다고 결정되면(S705), 활성부위 추출부(130)에 의해 추출된 활성부위 중에서 선택되며, 수동으로 활성부위가 선택된다고 결정되면(S705) 사용자가 디스플레이부(120)에 표시된 단백질 및 그에 포함된 원자들을 보면서 원자들을 수동으로 선택하고, 선택된 부분의 원자들을 포함하고 있는 잔기들의 위치좌표를 파싱한다(S710). 이후, 활성부위의 잔기 데이터에서 참조 프레임으로 사용되는 N, Cα, C 원자들의 위치 좌표를 이용하여 선택된 활성부위의 모든 잔기에 대해서 정규직교벡터가 수학식 1을 이용하여 벡터 산출부(402)에 의해 산출된다(S715).
활성부위에 포함되는 잔기들의 개수가 n개라 하면, 모두 n개의 정규직교벡터가 산출되며, 선택된 활성부위의 잔기 좌표데이터 집합에 수학식 2를 모든 잔기에 적용하면 1 개의 정규직교벡터를 적용할 때마다 새로운 좌표집합 1개가 생성되므로 n개의 새로운 좌표 데이터 집합이 변환부(404)에 의해 생성된다(S720). 마찬가지 방법으로 활성부위 데이터베이스(160)에 존재하는 활성부위에 대해서 도 3과 같은 DB 테이블에 존재하는 정규직교벡터를 이용하여 변환된 좌표 벡터 즉, 변환된 좌표 데이터를 획득한다(S725). 선택된 활성부위의 잔기의 개수가 n개라면 S720 단계에서 변환되어 획득된 좌표데이터 집합은 n 개이며, DB내에 활성부위가 k개 있고, 그 중 현재 처리중인 활성부위가 m개의 잔기를 가지고 있다면 S725 단계에서 m개의 변환된 좌표데이터 집합이 획득된다. 즉, 선택된 활성부위의 좌표데이터 및 DB내의 활성부위 중 현재 처리중인 활성부위의 각 잔기의 좌표 데이터가 각각 S720 단계 및 S725 단계에서 회전변환되는 것이다.
회전 변환된 이후, 선택된 활성부위의 잔기 좌표데이터 및 현재 처리중인 기준 활성부위의 잔기 좌표데이터는 이동변환된다(S730). 이동변환되는 방법의 예로는, 선택된 활성부위 및 기준 활성부위 중 현재 처리중인 활성부위에 대해, 회전변환에 사용된 정규직교벡터가 속하는 잔기의
Figure 112006010439142-PAT00034
의 위치를 원점(0,0,0)로 일치되도록 회전 변환후의 좌표데이터를 이동변환하는 것이다. 도 5a 및 도 5b의 예를 참조하면 다음과 같다. 도 5a의 Base로 표기된 잔기의
Figure 112006010439142-PAT00035
의 위치와 도 5b의 Base로 표기된 잔기의 의
Figure 112006010439142-PAT00036
의 위치가 일치되도록 변환하기 위해서, 도 5a의 Base로 표기된 잔기의 회전변환후의
Figure 112006010439142-PAT00037
의 좌표와 도 5b의 Base로 표기된 잔기의 회전변환후의
Figure 112006010439142-PAT00038
의 좌표가 각각 (x1, y1, z1), (x2, y2, z2)일 경우, 선택된 활성부위의 회전변환된 좌표데이터 집합 및 현재 처리중인 기준 활성부위의 회전변환된 좌표데이터 집합에 이동변환행렬 [-x1, -y1, -z1]T, [-x2, -y2, -z2]T를 적용하는 것이다.
즉, S725 내지 S745의 과정은 선택된 활성부위에 속하는 n개의 좌표데이터 집합과 현재 처리중인 기준 활성부위에 속하는 m개의 좌표데이터 집합중에서, 각각 몇 번째 좌표 데이터 집합을 적용해야 최대로 잔기가 겹쳐지는가를 구하는 과정이며, S730의 이동변환을 거치면 겹치는 잔기가 적어도 하나 발생한다. 이러한 방법으로 1, 2, 3, ..., n개의 좌표 데이터 집합과 1, 2, ..., m개의 좌표 데이터 집합을 최소 1개의 겹쳐지는 잔기를 기준으로 위치 비교하여 겹쳐지는 잔기 수를 저장한다(S735).
위와 같은 일련의 과정을 거쳐서 나온 결과를 예를 들어 설명하면, 검색을 원해 선택된 활성부위의 변환된 n'번째 좌표 데이터 집합과 현재 처리 중인 기준 활성부위의 변환된 m'번째 집합 데이터 집합의 잔기가 10개가 겹쳐져 있다고 한다면, 선택된 활성부위의 n'번째 정규직교벡터를 이용하여 선택된 활성부위를 회전변환하고, 현재 처리중인 기준 활성부위의 m'번째 정규직교벡터를 이용하여 현재 처리중인 기준 활성부위를 회전변환한 후, 선택된 활성부위의 n'번째
Figure 112006010439142-PAT00039
의 위치를 기준으로 기준 활성부위의 변환된 좌표데이터 집합을 이동변환하여 두 활성부위를 겹쳤을 때 모두 10 개의 잔기가 겹쳐진다는 것을 의미한다.
검색 속도 향상을 위해, 겹쳐지는 잔기의 개수가 임계치 조건을 만족시키면(S740), 유사도가 수학식 3을 이용하여 유사도 산출부(410)에 의해 산출되고(S745), 겹쳐지는 잔기의 개수가 임계치 조건을 만족시키지 않는다면(S740), S735 단계로 복귀하여 그 다음의 정규직교벡터를 이용하여 회전 및 이동변환된 좌표데이터를 기초로 겹쳐지는 개수를 잔기 수가 저장된다. 여기서, 임계치 조건의 예로는 겹쳐지는 잔기의 개수가 선택된 활성부위의 잔기 개수의 1/2보다 큰 경우를 예로 들 수 있으나, 반드시 이에 한정되는 것은 아니다.
S745 단계 이후에, DB내의 모든 활성부위에 대해 상술한 과정을 거치지 않은 활성부위가 존재하는지를 판단한다(S750). 검색되지 않은 활성부위가 남아있다면 S725 단계로 복귀하여 상술한 과정을 반복한다. DB내의 모든 활성부위에 대해 상술한 검색 과정이 수행되었다고 판단되면(S750), 산출된 유사도 결과가 순위화부(170)에 의해 순위화된다(S755).
도 8은 본 발명의 일실시예에 따른 단백질 활성부위 검색 장치 및 방법에 대한 사용자 인터페이스를 예시하는 도면이다.
도 8을 참조하여 설명하면, 도 8의 우측 화면에 표시된 단백질은 단백질 1TBE를 나타내며, 좌측 중앙 부분을 참조하면 42개의 활성부위가 존재함을 알 수 있다. 이중 42번째 활성부위가 선택된 것이며, 그에 해당되는 부분이 우측 화면의 화살표가 가리키는 녹색 부분으로서 포켓처럼 들어간 부분이다. 활성부위 DB에는 단백질 1t9s 한 개가 저장된 상태에서 비교검색이 수행되며, 좌측 하단 부분을 참조하면 1t9s에는 87개 이상의 활성부위가 존재하며 87번째 포켓이 유사도 75%를 나타냄을 알 수 있다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 케리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이러한 본원 발명인 방법 및 장치는 이해를 돕기 위하여 도면에 도시된 실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
본 발명에 따르면, 유사한 활성부위를 낮은 복잡도로 검색할 수 있어, 정확한 신약 설계에 이용될 수 있으며, 검색을 원하는 활성부위 선택을 추출된 활성부위로 선택하거나 화면상에 표시된 원자들을 이용하여 선택할 수 있어 사용자에게 편리한 인터페이스를 제공하는 효과가 있다.

Claims (12)

  1. 복수의 기준 활성부위에 대한 정보를 저장하는 활성부위 데이터베이스;
    입력된 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 상호 간에 겹쳐진 잔기의 개수에 따라 3차원 구조상의 유사도를 산출하는 비교부; 및
    상기 유사도에 따라 상기 입력활성부위에 대한 기준 활성부위를 검색하는 검색부를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 장치.
  2. 제1항에 있어서, 상기 비교부는,
    상기 입력 활성부위에 포함된 잔기와 상기 기준 활성부위에 포함된 잔기가 적어도 하나 이상 겹쳐지도록 상기 입력 활성부위 및 상기 기준 활성부위를 위치정합하는 위치정합부; 및
    상기 위치정합된 상태에서, 상기 입력 활성부위 및 상기 기준 활성부위 간에 겹쳐지는 잔기의 갯수를 기초로 상기 유사도를 산출하는 유사도 산출부를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 장치.
  3. 제2항에 있어서,
    상기 활성부위 데이터베이스는,
    단백질의 명칭, 상기 단백질에 포함된 기준 활성부위의 명칭, 상기 기준 활 성부위에 포함된 잔기의 명칭, 상기 잔기의 N, Cα, C의 좌표데이터 및 상기 잔기의 정규직교벡터를 저장하고,
    상기 위치정합부는,
    상기 입력 활성부위에 포함된 잔기의 N, Cα 및 C의 좌표를 기초로, 각각의 잔기에 대한 정규직교벡터를 산출하는 벡터산출부; 및
    상기 산출된 정규직교벡터 및 상기 저장된 정규직교벡터를 이용하여, 상기 입력 활성부위에 포함된 좌표 및 상기 기준 활성부위에 포함된 좌표를 회전변환 및 이동변환하는 변환부를 포함하고,
    상기 유사도 산출부는,
    상기 입력 활성부위에 포함된 잔기의 상기 변환된 좌표와 상기 기준 활성부위에 포함된 잔기의 상기 변환된 좌표가 일치하면, 상기 잔기가 겹쳐지는 것으로 판단하는 것을 특징으로 하는 단백질 활성부위 검색 장치.
  4. 제1항에 있어서,
    활성부위에 대한 정보를 포함하는 PDB(Protein Data Bank) 파일을 입력받고, 상기 입력된 PDB 파일로부터 활성부위를 추출하는 활성부위 추출부;
    상기 추출된 활성부위를 디스플레이하는 디스플레이부; 및
    상기 디스플레이된 활성부위 중 사용자에 의해 선택된 활성부위를 상기 입력 활성부위로서 상기 비교부로 제공하는 활성부위선택부를 더 포함하는 것을 특징으 로 하는 단백질 활성부위 검색 장치.
  5. 제1항에 있어서,
    활성부위에 대한 정보를 포함하는 PDB(Protein Data Bank) 파일을 입력받고, 상기 입력된 PDB 파일에 포함된 원자 또는 잔기를 디스플레이하는 디스플레이부; 및
    상기 디스플레이된 원자 또는 잔기 중에서, 사용자가 선택한 원자 또는 잔기가 속하는 활성부위를 상기 입력 활성부위로서 상기 비교부로 제공하는 활성부위선택부를 더 포함하는 것을 특징으로 하는 단백질 활성부위 검색 장치.
  6. 제1항에 있어서, 상기 검색부는,
    복수 개의 상기 산출된 유사도를 순위화하는 것을 특징으로 하는 단백질 활성부위 검색 장치.
  7. 복수의 기준 활성부위에 대한 정보를 저장하는 단계;
    입력된 입력 활성부위와 상기 저장된 기준 활성부위에 대해, 상호 간에 겹쳐진 잔기의 개수에 따라 3차원 구조상의 유사도를 산출하는 비교 단계; 및
    상기 유사도에 따라 상기 입력 활성부위에 대한 기준 활성부위를 검색하는 단계를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
  8. 제7항에 있어서, 상기 비교 단계는,
    상기 입력 활성부위에 포함된 잔기와 상기 기준 활성부위에 포함된 잔기가 적어도 하나 이상 겹쳐지도록 상기 입력 활성부위 및 상기 기준 활성부위를 위치정합하는 단계; 및
    상기 위치정합된 상태에서, 상기 입력 활성부위 및 상기 기준 활성부위 간에 겹쳐지는 잔기의 갯수를 기초로 상기 유사도를 산출하는 단계를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
  9. 제8항에 있어서,
    상기 저장하는 단계는,
    단백질의 명칭, 상기 단백질에 포함된 기준 활성부위의 명칭, 상기 기준 활성부위에 포함된 잔기의 명칭, 상기 잔기의 N, Cα, C의 좌표데이터 및 상기 잔기의 정규직교벡터를 저장하는 단계를 포함하고,
    상기 위치정합하는 단계는,
    상기 입력 활성부위에 포함된 잔기의 N, Cα 및 C의 좌표를 기초로, 각각의 잔기에 대한 정규직교벡터를 산출하는 단계; 및
    상기 산출된 정규직교벡터 및 상기 저장된 정규직교벡터를 이용하여, 상기 입력 활성부위에 포함된 좌표 및 상기 기준 활성부위에 포함된 좌표를 회전변환 및 이동변환하는 단계를 포함하고,
    상기 유사도를 산출하는 단계는,
    상기 입력 활성부위에 포함된 잔기의 상기 변환된 좌표와 상기 기준 활성부위에 포함된 잔기의 상기 변환된 좌표가 일치하면, 상기 잔기가 겹쳐지는 것으로 판단하는 단계를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
  10. 제7항에 있어서,
    활성부위에 대한 정보를 포함하는 PDB(Protein Data Bank) 파일을 입력받고, 상기 입력된 PDB 파일로부터 활성부위를 추출하는 단계;
    상기 추출된 활성부위를 디스플레이하는 단계; 및
    상기 디스플레이된 활성부위 중 사용자에 의해 선택된 활성부위를 상기 입력 활성부위로 결정하는 단계를 더 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
  11. 제7항에 있어서,
    활성부위에 대한 정보를 포함하는 PDB(Protein Data Bank) 파일을 입력받고, 상기 입력된 PDB 파일에 포함된 원자 또는 잔기를 디스플레이하는 단계; 및
    상기 디스플레이된 원자 또는 잔기 중에서, 사용자가 선택한 원자 또는 잔기가 속하는 활성부위를 상기 입력 활성부위로 결정하는 단계를 더 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
  12. 제7항에 있어서, 상기 검색하는 단계는
    복수 개의 상기 산출된 유사도를 순위화하는 단계를 포함하는 것을 특징으로 하는 단백질 활성부위 검색 방법.
KR1020060013695A 2005-12-08 2006-02-13 단백질 활성부위 검색 장치 및 방법 KR100734880B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020060013695A KR100734880B1 (ko) 2005-12-08 2006-02-13 단백질 활성부위 검색 장치 및 방법
US11/505,397 US7734425B2 (en) 2005-12-08 2006-08-17 Apparatus and method for searching protein active site

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020050120191 2005-12-08
KR20050120191 2005-12-08
KR1020060013695A KR100734880B1 (ko) 2005-12-08 2006-02-13 단백질 활성부위 검색 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20070060959A true KR20070060959A (ko) 2007-06-13
KR100734880B1 KR100734880B1 (ko) 2007-07-03

Family

ID=38140502

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060013695A KR100734880B1 (ko) 2005-12-08 2006-02-13 단백질 활성부위 검색 장치 및 방법

Country Status (2)

Country Link
US (1) US7734425B2 (ko)
KR (1) KR100734880B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111837A (zh) * 2019-03-22 2019-08-09 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030096307A1 (en) * 2001-07-21 2003-05-22 Jacquelyn Fetrow Functional site profiles for proteins and methods of making and using the same
KR100550329B1 (ko) * 2003-11-15 2006-02-08 한국전자통신연구원 3차원 에지 히스토그램을 이용한 단백질 구조 비교검색장치 및 방법
KR100546779B1 (ko) * 2003-12-24 2006-01-25 한국전자통신연구원 미지 단백질의 구조를 예측하기 위한 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111837A (zh) * 2019-03-22 2019-08-09 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统
CN110111837B (zh) * 2019-03-22 2022-12-06 中南大学 基于两阶段结构比对的蛋白质相似性的搜索方法及系统

Also Published As

Publication number Publication date
US20070136000A1 (en) 2007-06-14
US7734425B2 (en) 2010-06-08
KR100734880B1 (ko) 2007-07-03

Similar Documents

Publication Publication Date Title
Battle et al. Dynamic prefetching of data tiles for interactive visualization
US8090745B2 (en) K-nearest neighbor search method, k-nearest neighbor search program, and k-nearest neighbor search device
EP2612263B1 (en) Sketch-based image search
US8606774B1 (en) Methods and systems for 3D shape retrieval
CN110413816B (zh) 彩色草图图像搜索
Larson et al. Spatial ranking methods for geographic information retrieval (GIR) in digital libraries
Sedmidubsky et al. A key-pose similarity algorithm for motion data retrieval
US9910878B2 (en) Methods for processing within-distance queries
CN111026922B (zh) 一种分布式向量索引方法、系统、插件及电子设备
JP2013127809A (ja) 画像処理装置、画像処理方法及びプログラム
Shahabi et al. An experimental study of alternative shape-based image retrieval techniques
KR100734880B1 (ko) 단백질 활성부위 검색 장치 및 방법
US11341660B1 (en) Feature based image detection
Areevijit et al. Reeb graph based partial shape retrieval for non-rigid 3D object
Hou et al. Dynamic query interface for 3D shape search
CN117581310A (zh) 用于医学图像数据的自动跟踪读取的方法和系统
JP2007073063A (ja) 空間インデックス方法
JP6521053B2 (ja) 検索プログラム、検索方法および検索装置
KR101839687B1 (ko) 질의 모델과 검색 대상 모델 간의 정밀도 차이를 고려한 모델 검색 장치 및 방법
KR20160127369A (ko) 이미지 검색 시스템 및 방법
Zhu et al. Organizing photographs with geospatial and image semantics
Paiva et al. Visualization of similarity queries with trajectory estimation in complex data
JP6167531B2 (ja) 領域検索方法、領域インデックス構築方法および領域検索装置
Zhuang et al. Effective location-based geo-tagged image retrieval for mobile culture and tourism education
Ma et al. An Automatic Extraction Method of Coronary Arteries Centerline Based on Cellular Automata

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130527

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150527

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee