KR101599186B1 - 단백질의 분자 구조의 결정 방법 및 장치 - Google Patents

단백질의 분자 구조의 결정 방법 및 장치 Download PDF

Info

Publication number
KR101599186B1
KR101599186B1 KR1020150031499A KR20150031499A KR101599186B1 KR 101599186 B1 KR101599186 B1 KR 101599186B1 KR 1020150031499 A KR1020150031499 A KR 1020150031499A KR 20150031499 A KR20150031499 A KR 20150031499A KR 101599186 B1 KR101599186 B1 KR 101599186B1
Authority
KR
South Korea
Prior art keywords
sphere
protein
molecular structure
amino acids
energy value
Prior art date
Application number
KR1020150031499A
Other languages
English (en)
Inventor
김덕수
유중현
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020150031499A priority Critical patent/KR101599186B1/ko
Application granted granted Critical
Publication of KR101599186B1 publication Critical patent/KR101599186B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G06F19/16

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

단백질의 분자 구조의 결정 방법 및 장치가 개시된다. 개시된 단백질의 분자 구조의 결정 방법은 다수의 회전 이성질체를 각각 포함하는 n(2 이상의 정수임)개의 아미노산으로 구성된 단백질의 분자 구조의 결정 방법으로, 상기 n개의 아미노산 각각에 대해, 상기 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택하는 단계; 및 상기 n개의 아미노산의 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 단계;를 포함하되, 상기 n개의 아미노산 중 i번째 아미노산에 대한 상기 하나의 회전 이성질체를 선택하는 단계는, 상기 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 단계; 상기 i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 단계; 상기 i번째 구 내의 원자들 및 상기 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 상기 i번째 구의 에너지값을 측정하는 제3 단계;를 포함하되, 상기 i번째 아미노산에 대한 상기 다수의 회전 이성질체 모두에 대해 상기 제1 단계, 상기 제2 단계 및 상기 제3 단계가 수행되고, 상기 i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택한다.

Description

단백질의 분자 구조의 결정 방법 및 장치{Method and Apparatus for determining molecular structure of the protein}
본 발명의 실시예들은 안정적인 단백질의 분자 구조를 결정할 수 있는 방법 및 장치에 관한 것이다.
단백질의 분자 구조를 단백질의 전체 에너지가 최소화되도록 최적화하는 문제는 생명공학의 여러 가지 응용문제, 특히 새로운 단백질의 기능을 설계하고 신약을 개발하는 일 등에서 매우 핵심적인 문제 중에 하나이다.
단백질은 다수의 아미노산(amino acid)이 펩티드(peptide) 결합에 의해서 선형적으로 연결된 구조를 가지고 있다. 아미노산은 모든 아미노산에 공통적으로 존재하는 부분인 골격(backbone)과 각 아미노산 별로 상이한 곁사슬(side chain)로 구성되며, 곁사슬에 의해서 각 아미노산의 고유한 특성이 결정된다. 이하, 도 1을 참조하여, 단백질의 구조에 대해 간략하게 설명하면 다음과 같다.
도 1을 참조하면, 펩티드 결합을 할 때 아미노기와 카복실기가 결합되면서 물 분자들이 생성되어 배출되고 남은 부분들이 합쳐져서 단백질이 구성되는데, 각각의 아미노산에 해당되는 부분을 아미노산 잔기(amino acid residue)라고 부른다.
도 1의 (a)는 펩티드 결합을 도식화시킨 것으로서, 곁사슬을 제외한 나머지 부분은 (N-Cα-C)의 순서가 반복됨을 알 수 있으며, 이 부분을 골격이라고 부른다. Cα는 각 아미노산의 결사슬이 연결되는 탄소로써 알파카본(alpha carbon)이라고 부른다.
도 1의 (b)는 아미노산 중 아스파르트산(aspartic acid)에 대한 화학식을 도시한 도면으로서, 알파카본을 포함한 윗부분인 (H2N, CH, C, O, OH)이 골격에 포함되고, 나머지 부분인 (CH2, C, O, O)가 곁사슬에 포함된다. 일반적으로 곁사슬의 구조는 곁사슬에 포함된 회전가능한 결합(rotatable bond)의 이면각(dihedral angle)으로 표현이 가능하다.
도 1의 (c)는 아스파르트산의 스틱모델(stick model)을 도시한 도면으로서, 곁사슬 내의 두 이면각(χ12)에 대한 예를 보여주고 있다. 단백질의 전체 구조에 대한 에너지가 최소가 되는 곁사슬(side chain)의 구조를 예측하는 문제를 "곁사슬 구조 예측 문제(Side-chain prediction problem)"라고 부르며, 이 문제는 계산이론분야에서 정의하는 NP-hard 문제로 증명되어 있다.
즉, 단백질이 제대로 된 기능을 수행하기 위해서는 다수의 곁사슬이 안정된 구조로 결합되어야 하고, 이는 다수의 곁사슬에 대한 에너지 즉, 단백질의 에너지가 최소가 되는 문제로 귀결된다. 이 때, 곁사슬은 도 1의 (c)에 도시된 바와 같이 이면각(χ12)이 존재하며, 이에 따라 도 1의 (d)에 도시된 것과 같은 다수의 회전 이성질체를 가지고 있다. 따라서, 다수의 곁사슬에 대한 에너지, 즉 단백질의 에너지가 최소값을 가지기 위해서는, 단백질 전체에 대해 최소의 에너지 값을 가지게 하는 곁사슬의 회전 이성질체를 예측 내지 결정하여야 한다.
그러나, 곁사슬 구조 예측 문제가 풀기 어려운 이유는, 입력 데이터의 수가 증가함에 따라 단백질의 에너지를 최소화하기 위해서 검색해야 할 실행 가능 영역의 크기가 지수적으로 매우 급격하게 증가하기 때문이다. 그러므로, 본 문제에 대한 최적해(optimal solution)을 계산하는 것은 현재의 계산이론으로는 불가능하며, 종래의 기술의 대부분은 SCWRL4 및 CISRR 등과 같은 휴리스틱(Heuristic) 방법을 사용하고 있으나, 종래 기술 모두 최적해를 보장해 주지는 못하는 단점이 있다.
상기한 바와 같은 종래기술의 문제점을 해결하기 위해, 본 발명에서는 계산량을 감소시키면서 안정적인 단백질의 분자 구조를 결정할 수 있는 단백질의 분자 구조의 결정 방법 및 장치를 제안하고자 한다.
본 발명의 다른 목적들은 하기의 실시예를 통해 당업자에 의해 도출될 수 있을 것이다.
상기한 목적을 달성하기 위해 본 발명의 바람직한 일 실시예에 따르면, 다수의 회전 이성질체를 각각 포함하는 n(2 이상의 정수임)개의 아미노산으로 구성된 단백질의 분자 구조의 결정 방법에 있어서, 상기 n개의 아미노산 각각에 대해, 상기 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택하는 단계; 및 상기 n개의 아미노산의 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 단계;를 포함하되, 상기 n개의 아미노산 중 i번째 아미노산에 대한 상기 하나의 회전 이성질체를 선택하는 단계는, 상기 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 단계; 상기 i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 단계; 상기 i번째 구 내의 원자들 및 상기 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 상기 i번째 구의 에너지값을 측정하는 제3 단계;를 포함하되, 상기 i번째 아미노산에 대한 상기 다수의 회전 이성질체 모두에 대해 상기 제1 단계, 상기 제2 단계 및 상기 제3 단계가 수행되고, 상기 i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택하는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법이 개시된다.
상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 단계는 m(2 이상의 정수임)회 동안 반복 수행될 수 있다.
상기 단백질의 분자 구조의 결정 방법은 상기 단백질의 골격을 입력받는 단계;를 더 포함하고, 상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 단계는 상기 골격을 이용하여 상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택할 수 있다.
상기 단백질의 분자 구조를 결정하는 단계는, 상기 선택된 하나의 회전 이성질체로 구성된 상기 단백질의 제1 분자 구조를 생성하는 단계; 상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 각각에 대해, 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하여 상기 선택된 하나의 회전 이성질체를 조정하는 단계; 및 상기 조정된 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 단계;를 포함할 수 있다.
상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 중 j번째 아미노산에 대한 상기 선택된 하나의 회전 이성질체를 조정하는 단계는, 상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 단계 A; 및 상기 j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 단계 B;를 수행하고, 상기 j번째 아미노산에 대한 이성질체의 이면각들을 다수 회 변경시키면서 상기 j번째 구의 에너지값이 최소가 되도록 상기 선택된 회전 이성질체를 조정할 수 있다.
상기 다수 회 변경되는 각도는 상기 이면각들의 단위 변화의 크기(step length) 및 상기 이면각의 변경되는 방향 벡터(direction vector)로 구성되되, 상기 단위 변화의 크기는 상기 j번째 구의 에너지값에 기초한 선형 탐색법(line search method)을 이용하여 산출되고, 상기 방향 벡터는 켤레 구배법(conjugate gradient method)을 이용하여 산출될 수 있다.
상기 j번째 구 내의 이면각들에 대한 방향 벡터는, 상기 j번째 구 내의 원자와 상기 j번째 구의 이웃 구 내의 원자들 사이의 에너지값의 도함수(derivative)를 이용하여 산출되고 상기 도함수는 아래의 수학식과 같이 표현될 수 있다.
Figure 112015022255815-pat00001
여기서,
Figure 112015022255815-pat00002
는 상기 도함수, x는 제1 원자와 제2 원자의 거리, r1는 상기 제1 원자의 반지름, r-2는 상기 제2 원자의 반지름을 각각 의미함.
상기 에너지값은 하기의 수학식과 같이 표현될 수 있다.
Figure 112015022255815-pat00003
여기서, x는 상기 원자들 중 제1 원자와 제2 원자의 거리, y는 상기 에너지값, r1는 상기 제1 원자의 반지름, r2는 상기 제2 원자의 반지름을 각각 의미함.
또한, 본 발명의 다른 실시예에 따르면, 다수의 회전 이성질체를 각각 포함하는 n(2 이상의 정수임)개의 아미노산으로 구성된 단백질의 분자 구조의 결정 장치에 있어서, 상기 n개의 아미노산 각각에 대해, 상기 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택하는 선택부; 및 상기 n개의 아미노산의 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 결정부;를 포함하되, 상기 선택부는 상기 n개의 아미노산 중 i번째 아미노산에 대한 상기 하나의 회전 이성질체를 선택하되, 상기 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고 n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 과정; 상기 i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 과정; 상기 i번째 구 내의 원자들 및 상기 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 상기 i번째 구의 에너지값을 측정하는 제3 과정;를 수행하되, 상기 i번째 아미노산에 대한 상기 다수의 회전 이성질체 모두에 대해 상기 제1 과정, 상기 제2 과정 및 상기 제3 과정을 수행하고, 상기 i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택하는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치가 제공된다.
본 발명에 따른 단백질의 분자 구조의 결정 방법 및 장치는 계산량을 감소시키면서 안정적인 단백질의 분자 구조를 결정할 수 있는 장점이 있다.
도 1은 단백질의 구조를 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 단백질의 분자 구조의 결정 장치의 개략적인 구성을 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 선택부 및 결정부의 동작 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 평가 함수의 개념을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 시뮬레이션 결과를 도시한 도면이다.
도 6는 본 발명의 일 실시예 따른 단백질의 분자 구조의 결정 방법의 흐름도를 도시한 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.
도 2는 본 발명의 일 실시예에 따른 단백질의 분자 구조의 결정 장치의 개략적인 구성을 도시한 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 단백질의 분자 구조의 결정 장치(200)는 입력부(210), 초기 설정부(220), 선택부(230) 및 결정부(240)를 포함한다. 이하, 각 구성요소 별로 그 기능을 상세하게 설명한다.
입력부(210)는 단백질의 골격(backbone)를 입력받는다. 또한, 입력부(210)는 골격에 연결되는 다수의 곁사슬(side chain)의 종류 정보를 더 입력받을 수 있다. 여기서, 곁사슬(side chain)의 종류 정보는 이면각 정보를 제외한 곁사슬의 원자의 종류, 곁사슬 안에서 원자가 나타나는 순서 등을 포함한다.
한편, 예외적으로 아미노산 중 알라닌과 글리신은 이면각이 존재하지 않으므로, 이는 본 발명의 적용 대상이 아니다.
초기 설정부(220)는 입력된 단백질의 골격을 이용하여 단백질의 초기의 분자 구조를 설정한다.
본 발명의 일 실시예에 따르면, 초기 설정부(220)는 n개의 아미노산에 포함된 곁사슬 각각에 대해, 다수의 회전 이성질체 중 나타날 확률이 가장 큰 회전 이성질체를 이용하여 단백질의 초기의 분자 구조를 설정한다. 이 때, 나타날 확률이 가장 큰 회전 이성질체는 실험적으로 결정될 수 있으며, 이는 회전 이성질체 라이브러리(rotamer library)에서 제공될 수 있다.
선택부(230)는 단백질의 초기의 분자 구조를 기반으로, n개의 아미노산 각각에 대해, 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택한다.
이하, 도 3을 참조하여 선택부(230)의 동작을 상세하게 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 선택부(230)의 동작 개념을 설명하기 위한 도면이다.
도 3에서는 하기에서 설명하는 구(sphere, 320)는 6개가 생성되는 것으로 도시하였으나, 이는 일례에 불과한 것으로서 구의 개수에는 제한이 없다.
먼저, 선택부(230)는 단백질의 초기의 분자 구조를 이용하여 n개의 아미노산과 각각 대응되는 n개의 구를 도 3와 같이 생성한다.
여기서, 투명한 구(320) 각각은 골격(310)와 연결되는 구(n개의 구)로서, 각 구(320)는 아미노산 내지 아미노산 잔기와 대응된다. 그리고, 투명한 구(320) 내의 작은 구(330)는 아미노산 내의 곁사슬을 구성하는 원자를 각각 의미한다.
이 때, 각 곁사슬의 이면각은 360도로 회전할 수 있지만, 종래의 연구에 따르면, 단백질을 구성하는 아미노산에 대한 기 설정된 대표 이면각이 존재하며, 다수의 회전 이성질체는 상기 대표 이면각을 기초로 설정될 수 있다. 즉, n개의 아미노산 각각은 골격 및 곁사슬을 포함하고, 곁사슬은 적어도 하나의 이면각을 포함하며, 다수의 회전 이성질체는 적어도 하나의 이면각에 기초하여 설정될 수 있다.
본 발명의 일 실시예에 따르면, 선택부(230)는 n개의 아미노산과 각각 대응되는 n개의 구(320)를 생성할 수 있고, n개의 구(320)에 대한 보로노이 다이어그램을 산출할 수 있다.
보로노이 다이어그램은 공간에 다수개의 점을 기준으로, 공간을 가장 가까운 점에 따라 나눈 다이어그램이다. 이 때, 점을 구로 확장한 것이 구의 보로노이 다이어그램이다. 구의 보로노이 다이어그램에 대해 간략하게 설명하면 다음과 같다.
S={s1, s2, … , sn}를 삼차원 공간에서의 구들의 집합이라 하고,각각의 구 si=(ci, ri)는 중심점 ci =(xi , yi , zi)와 반지름 ri로 구성되어 있다고 하고, 하나의 구가 다른 구에 완전히 포함되는 경우는 존재하지 않는다고 가정한다. 그러면, dist(a, b)를 점 a와 점 b 사이의 유클리드 거리라 할 때,각각의 구 si마다 VRi={p|dist(p,ci)-ri<dist(p,cj)-rj, i≠j}로 정의되는 보로노이 영역이 존재하게 되며,구집합 S에 대한 보로노이 다이어그램은 이러한 보로노이 영역의 집합인 VR(S)={VR1, VR2, …, VRn}로 정의된다.
또한, 점의 보로노이 다이어그램과 같이 구의 보로노이 다이어그램에서도 최소 볼록 집합의 경계를 이루는 구들은 무한대(unbounded)의 보로노이 영역을 가지며,이 외의 구들은 보로노이 면들로 둘러싸인(bounded) 보로노이 영역을 가지게 된다. 구의 보로노이 다이어그램의 경우 보로노이 곡면은 두 개의 구에 대한 이등분면(bisector)으로 정의되며,이엽쌍곡면(hyperboloid of two sheets)의 일부분을 이루게 된다.
그리고, 하나의 보로노이 곡면은 다른 보로노이 곡면과 교차하여 보로노이 모서리를 형성하고, 보로노이 모서리들이 교차하여 보로노이 꼭지점을 형성한다. 삼차원에서 구의 보로노이 다이어그램은 보로노이 영역들의 집합으로 구성되어 있는 셀 구조를 가지게 되는데,이는 CAD분야에서 널리 쓰이는 비다양체(non-manifold) 모델을 위한 자료구조 또는 약간 변형된 형태의 자료구조로 표현이 가능하다.
한편, 구의 보로노이 다이어그램은 당업자에게 자명한 사항이므로, 보다 상세한 설명은 생략하기로 한다.
다음으로, 선택부(230)는 n개의 구(320) 중 첫번째 아미노산과 대응되는 첫번째 구(320-1)에 대한 이웃 구를 검색한다. 여기서, 이웃 구는 대상 구와 맞닿아있는 구를 의미하는 것으로서, 두번째 구(320-2) 및 세번째 구(320-3)가 첫번째 구(320-1)의 이웃 구가 된다.
계속하여, 선택부(230)는 첫번째 구(320-1) 내의 원자들과 이웃 구 (320-2, 320-3) 내의 원자들 사이의 에너지값을 측정하여 첫번째 구(320-1)의 에너지값을 측정한다. 즉, 첫번째 구(320-1) 내의 하나의 원자(330-11)의 에너지값은 i) 하나의 원자(330-11)와 두번째 구(320-2) 내의 모든 원자들 사이의 에너지값과, ii) 하나의 원자(330-11)와 세번째 구(320-3) 내의 모든 원자들 사이의 에너지값을 모두 포함한 값이며, 첫번째 구(320-1) 내의 원자들 모두에 대해, i) 과정, ii) 과정을 반복함으로써 첫번째 구(320-1)에 대한 에너지값을 결정할 수 있다. 이 때, 에너지값에 대한 평가 함수는 아래에서 상세하게 설명하도록 한다.
상기에서 설명한 선택부(230)의 동작(구의 생성 과정, 이웃 구의 선택 과정 및 에너지값의 측정 과정)은 첫번째 구(320-1)의 모든 회전 이성질체 즉, 첫번째 구(320-1)의 다수의 이성질체에 대해 반복 수행되며, 첫번째 구(320-1)의 에너지값이 최소값을 가지는 회전 이성질체를 첫번째 구(320-1)의 회전 이성질체로 선택할 수 있다. 즉, 이웃 구(320-2, 320-3)의 구조가 단백질의 초기의 분자 구조에 따른 회전 이성질체로 설정되고, 첫번째 구(320-1)의 모든 회전 이성질체에 대해 상기에서 설명한 선택부(230)의 동작이 반복 수행되어 첫번째 구(320-1)의 회전 이성질체가 선택될 수 있다.
첫번째 구(320-1)의 회전 이성질체가 선택된 후, 선택부(230)는 두번째 구(320-2)의 다수의 회전 이성질체 모두에 대해 상기에서 설명한 구의 생성 과정, 이웃 구의 선택 과정 및 에너지값의 측정 과정을 수행하여, 다수의 이성질체 중 두번째 구(320-2)에 대한 회전 이성질체를 선택한다. 이 때, 첫번째 구(320-1), 세번째 구(320-3) 및 네번째 구(320-4)가 두번째 구(320-2)의 이웃 구이며, 에너지값의 측정을 위해, 첫번째 구(320-1)는 상기 선택된 회전 이성질체가 사용되고, 세번째 구(320-3) 및 네번째 구(320-4)는 단백질의 초기의 분자 구조에 따른 회전 이성질체가 사용된다.
첫번째 구(320-1) 및 두번째 구(320-2)의 회전 이성질체가 선택된 후, 선택부(230)는 세번째 구(320-3)의 다수의 회전 이성질체 모두에 대해 상기에서 설명한 구의 생성 과정, 이웃 구의 선택 과정 및 에너지값의 측정 과정을 수행하여, 세번째 구(320-3)의 회전 이성질체를 선택한다. 이 때, 첫번째 구(320-1), 두번째 구(320-2), 네번째 구(320-4) 및 다섯번째 구(320-5)가 세번째 구(320-3)의 이웃 구이며, 에너지값의 측정을 위해, 첫번째 구(320-1), 두번째 구(320-2)는 상기 선택된 회전 이성질체가 사용되고, 네번째 구(320-4), 다섯번째 구(320-5)는 단백질의 초기의 분자 구조에 따른 회전 이성질체가 사용된다.
이 후, 선택부(230)는 네번째 구(320-4) 내지 여섯번째 구(320-6)에 대해서도 상기의 과정들을 수행한다. 따라서, 첫번째 구(320-1) 내지 여섯번째 구(320-6)에 대해 상기 하나의 회전 이성질체가 선택된다.
정리하면, 선택부(230)는 n개의 아미노산 모두에 대해 하나의 회전 이성질체를 선택할 수 있다. 이 경우, i번째 아미노산을 기준으로 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 과정; i번째 아미노산과 대응되는 i번째 구에 대한 이웃 구를 검색하는 하는 제2 과정; i번째 구 내의 원자들 및 이웃 구 내의 원자들 사이의 에너지값을 측정하여 i번째 구의 에너지값을 측정하는 제3 과정;을 수행하되, i번째 아미노산에 대한 다수의 회전 이성질체 모두에 대해 제1 과정, 제2 과정 및 제3 과정을 수행하고, i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택할 수 있다.
한편, 본 발명의 일 실시예에 따르면, 선택부(230)는 n개의 아미노산 각각에 대한 하나의 회전 이성질체를 선택하는 동작은 m회 동안 반복 수행할 수 있다. 이는 단백질의 에너지값 측정에 대한 정확성을 높이기 위함이다.
즉, 선택부(230)가 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 동작을 한번 수행한 것으로 가정한 경우, 첫번째 구(320-1)의 에너지값은 이웃 구(320-2, 320-3)의 단백질의 초기의 분자 구조에 따른 회전 이성질체, 즉 "디폴트된" 회전 이성질체를 사용하여 측정한 값이므로, 정확하지 않을 수 있다. 따라서, 선택부(230)는 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 동작을 m회 동안 반복 수행함으로써 정확성을 높일 수 있다.
요컨대, 곁사슬 구조 결정 문제 즉, 단백질의 분자 구조의 결정 방법은 NP-hard라고 알려져 있으며, 현재의 계산이론으로는 최적해를 구할 수 없다. 그러므로, 적절한 시간 이내에 최적해에 근사한 해를 찾는 휴리스틱 방법을 구현해야 하며, 본 발명에서는 구의 보로노이 다이어그램을 이용하여, 주어진 곁사슬 구조 결정 문제를 좀 더 작은 구조의 결정 문제들의 집합으로 분할해 준다. 각각의 분할된 구조 결정 문제들은 상대적으로 원래의 문제에 비해서 풀기 쉬우며, 분할된 문제들의 해를 조합하여 원래의 문제의 해를 구할 수 있도록 해 준다.
다시 말해, 모든 가능한 조합(아미노산 각각의 회전 이성질체의 조합)을 고려하여 단백질 전체 구조를 결정하는 것은 불가능하기 때문에, 본 발명에서는 각각의 아미노산 잔기 별로 곁사슬 구조를 결정하는 작은 문제들로 원래의 문제를 분할하며, 이를 위해서 구의 보로노이 다이어그램(Voronoi diagram of spheres)을 이용하며, 이는 상기에서 설명한 선택부(220)에서 동작이 수행된다. 즉, 도 3와 같이 다수의 구(320) 사이의 공간상에서의 인접정보(proximity information)를 효율적으로 계산하고 저장할 수 있으며, 각각의 아미노산 잔기의 곁사슬에 대한 구조를 결정하기 위해서 구의 보로노이 다이어그램을 이용하여, 전체 단백질의 구조가 아닌 "해당 아미노산 잔기 주변의 몇 개의 잔기들의 구조"만을 고려하여 곁사슬의 구조를 결정할 수 있다. 이를 통해서, 가능해 공간을 효율적으로 감소시킬 수 있고, 원래의 문제의 해에 대한 품질을 적절한 수준으로 유지시킬 수 있는 장점이 있다.
한편, 본 발명의 일 실시예에 따르면, 원자들 사이의 에너지값은 하기의 수학식 1에 기초하여 에너지값이 측정될 수 있다.
Figure 112015022255815-pat00004
여기서, x는 원자들 중 제1 원자와 제2 원자의 거리, y는 에너지값, r1는 제1 원자의 반지름, r2는 제2 원자의 반지름을 각각 의미한다.
일례로서, 원자들이 탄소와 산소인 경우, 에너지값은 하기의 수학식 2와 같이 표현될 수 있다.
Figure 112015022255815-pat00005
이하, 도 4를 참조하여 보다 상세하게 설명하면 다음과 같다.
단백질 구조의 에너지값은 단백질을 구성하는 원자들 사이의 거리와 원자 특성에 의해서 결정되는데, 특히 원자 사이의 교차(intersection)가 생길 경우에는 해당 원자 사이의 에너지가 매우 높아진다.
도 4의 (a)는 탄소와 산소 원자 사이에서 정의되는 Lennard-Jones 에너지 함수의 예를 도시한 도면이다. 여기서, Lennard-Jones 에너지 함수는 두 원자 사이에 존재하는 van der Waals 에너지를 실험적으로 근사화해서 모델링한 함수이다. 이 그래프에서 수평축은 두 원자 사이의 거리를 나타내고 있으며 수직축은 해당 거리에서의 두 원자 간의 에너지값을 보여준다.
원자간 거리가 가까울 경우에는 에너지값이 급격히 높아지다가, 거리가 멀어지면 에너지값은 낮아지고, 어느 정도 거리가 떨어지면 에너지값이 최소가 되는 안정적인 상태가 되며, 더 거리가 멀어지면 0에 수렴하게 된다. 종래기술의 대부분은 상기한 함수를 그대로 이용하거나, 이 함수를 좀 더 간단한 1차식 혹은 2차식 정도로 근사화시킨 후 사용하고 있다.
하지만, 본 발명의 경우, 주어진 곁사슬 구조 결정 문제를 구의 보로노이 다이어그램을 이용하여 좀 더 작은 구조의 결정 문제들의 집합으로 분할해서 문제의 해를 구할 수 있도록 해 주므로, 종래의 방법과 같이 Lennard-Jones 에너지 함수를 직접 적용하여 해를 구하면, 다음과 같은 문제가 발생한다.
1. 원래의 문제가 두 개의 문제 A와 B로 분할되었다고 가정하면, A와 B의 해를 따로 구해서 결합함으로써 원 문제의 해를 구할 것이다. 이 때 A에 포함된 원자들 사이의 에너지를 계산하기 위해서 Lennard-Jones 에너지 함수를 사용한다면 정확한 에너지 값이 계산될 수 없을 것이다. 왜냐하면, B에 있는 원자들과의 에너지는 모두 제외되었기 때문이다. B에 포함된 원자들에 대해서도 동일한 문제점이 발생한다.
2. 상대적으로 멀리 떨어져 있는 원자들과의 에너지 값들(위 예에서 A의 원자와 B의 원자 사이의 에너지값)은 모두 제외된 상태에서 가까이에 있는 원자들 사이의 에너지 값만을 Lennard-Jones 에너지 함수를 이용하여 평가한다면 지나치게 민감한 평가를 하게 되는 결과가 된다.
따라서, 본 발명에서는 Lennard-Jones 에너지함수를 직접 사용하지 않고, 상대적으로 가까이에 존재하는 원자들 사이의 에너지값을 잘 평가할 수 있는 형태로 변형시키며, 이는 상기의 수학식 1와 같이 표현되며, 이는 도 4의 (b)와 같이 그래프로 나타낼 수 있다.
즉, 두 원자가 가까이 있어서 서로 교차가 발생할 경우(x<x0), 두 원자 사이의 교차에 의해서 생기는 부피(intersection volume)값을 함수로 이용하고, (함수 y2), 두 원자가 충분히 멀리 떨어져 있어서 교차가 생기지 않는 경우(x>x0), 두 원자의 경계면 사이의 거리를 함수로 이용한다(함수 y3).
다시, 도 2를 참조하여, 단백질의 분자 구조의 결정 장치(200)를 설명한다.
결정부(240)는 n개의 아미노산 각각에 대한 상기 선택된 하나의 회전 이성질체를 이용하여 단백질의 분자 구조를 결정한다.
보다 상세하게, 결정부(240)는 상기 선택된 하나의 회전 이성질체로 구성된 단백질의 제1 분자 구조를 생성하고, 단백질의 제1 분자 구조에 포함된 n개의 아미노산 각각에 대해, 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하여 상기 선택된 하나의 회전 이성질체를 조정하고, 조정된 상기 선택된 하나의 회전 이성질체를 이용하여 단백질의 분자 구조를 결정할 수 있다.
즉, 선택부(230)에서 선택된 회전 이성질체로 구성된 단백질의 제1 분자 구조 역시 안정적인 분자 구조일 수 있다. 하지만, 더욱더 안정적인 단백질의 분자 구조를 결정하여 위해, 결정부(240)는 선택부(230)에서 선택된 회전 이성질체 각각에 대한 이면각의 값들을 조금씩 변경시키면서 전체 단백질의 구조에 대한 에너지가 추가적으로 더 감소할 수 있는지를 확인한다.
본 발명의 일 실시예에 따르면, 결정부(240)는 단백질의 제1 분자 구조에 포함된 n개의 아미노산 모두에 대해 회전 이성질체를 조정할 수 있다. 이 경우, j번째 아미노산을 기준으로, 결정부(240)는 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 과정 A, j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 과정 B를 수행하고, j번째 아미노산에 대한 이성질체의 이면각들을 다수 회 변경시키면서 j번째 구의 에너지값이 최소가 되도록 상기 선택된 회전 이성질체를 조정할 수 있다. 상기 과정들의 수행은 선택부(230)의 동작과 유사하므로, 상세한 설명은 생략하기로 한다
이 때, 다수 회 변경되는 각도는 이면각들의 단위 변화의 크기(step length) 및 이면각들의 변경되는 방향 벡터(direction vector)로 구성될 수 있다. 이 경우, 단위 변화의 크기는 j번째 구의 에너지값에 기초한 선형 탐색법(line search method)을 이용하여 산출되고, 방향 벡터는 켤레 구배법(conjugate gradient method)을 이용하여 산출될 수 있다.
본 발명의 일 실시예에 따르면, j번째 구 내의 이면각들에 대한 방향 벡터는, j번째 구 내의 원자와 j번째 구의 이웃 구 내의 원자들 사이의 에너지값의 도함수(derivative)를 이용하여 산출되고, 도함수는 아래의 수학식 3과 같이 표현될 수 있다.
Figure 112015022255815-pat00006
여기서,
Figure 112015022255815-pat00007
는 에너지값의 도함수, x는 제1 원자와 제2 원자의 거리, r1는 제1 원자의 반지름, r2는 제2 원자의 반지름을 각각 의미한다.
이하, 상기의 내용에 대해 상세하게 설명한다.
다수 회 변경되는 각도에 대한 실행 공간은 연속적인(continuous) 공간으로서, 에너지값이 최소가 되도록 하는 최적의 이면각 조합을 구하는 비선형 최적화 (nonlinear optimization)문제가 된다. 이를 위해서는, 매번 변경해 볼 이면각의 단위 변화의 크기 및 이면각 조합을 변경할 방향벡터가 필요하며, 이는 수학식 4와 같이 표현될 수 있다.
Figure 112015022255815-pat00008
여기서,
Figure 112015022255815-pat00009
는 단백질의 제1 분자 구조에 포함된 상기 선택된 회전 이성질체의 이면각값들의 조합,
Figure 112015022255815-pat00010
는 조정된 회전 이성질체의 이면각값들의 조합, L은
Figure 112015022255815-pat00011
에서 변경해야 될 단위변화의 크기이며, D는 변경할 방향 벡터를 각각 의미한다. 최적의 단위변화의 크기 L은 에너지값(y)를 이용하는 황금 분할법(Golden section method)와 같은 일반적인 선형 탐색법(line search method)을 이용해서 구할 수 있고, 최적의 방향벡터 D는 아래의 수학식 5와 같이 정의되는 이면각들에 대한 에너지값(y)의 구배(그레디언트, gradient)를 이용하여 산출될 수 있다.
Figure 112015022255815-pat00012
즉, 현재 이면각값의 조합이
Figure 112015022255815-pat00013
일 때, 최적의 L과 D를 구한 후 수학식 4를 이용해서
Figure 112015022255815-pat00014
으로 이면각값의 조합을 변경시키면 에너지가 더 감소될 수 있다.
다시 말해, 매번 이면각값의 조합을 변경하기 위해서는 최적의 L과 D를 결정해야 하는데, L의 결정을 위해서는 매번 에너지값(y)을 평가하는 과정이 필요하고, D를 결정하기 위해서는 매번
Figure 112015022255815-pat00015
을 평가하는 과정이 필요하다. 즉, y와
Figure 112015022255815-pat00016
의 계산이 빈번하게 필요하다는 의미이며, y와
Figure 112015022255815-pat00017
는 신속하게 그 값을 산출할 수 있어야 함과 동시에 후보가 되는 해들 중 좋은 해를 잘 선별할 수 있어야 한다.
Figure 112015022255815-pat00018
값을 산출하기 위해서는 상기의 수학식 3에 표시한
Figure 112015022255815-pat00019
이 필요하다.
도 5는 본 발명의 일 실시예에 따른 시뮬레이션 결과를 도시한 도면이다.
도 5를 참조하면, 본 발명에 따른 단백질의 분자 구조의 결정 장치(BataSCP2)를 종래의 기술(SCWRL4, CISRR1)과 비교하기 위해서 단백질 모델 249개의 곁사슬들을 모두 제거한 후 각 기술 별로 다음 두 가지 실험을 실시하였다.
1. 예측된 단백질 구조간의 에너지값들을 평가하여 기술 별로 계산된 해의 품질을 비교
2. 각 기술 별로 예측하는데 들어간 계산시간을 측정하여 비교
도 5의 (a)는 종래 기술들과 본 발명에 따른 단백질의 분자구조의 결정장치에서 계산된 예측구조들의 에너지 값들을 도시한 도면이다. 도 5의 (a)에서, 수평축은 예측에 사용된 입력 단백질 모델을 크기를 보여주며, 수직축은 기술 별로 예측된 단백질 구조의 에너지값을 보여 준다(예측된 구조들의 에너지를 계산하기 위한 평가함수로는 도 4의 (a)를 이용하였음).
도 5의 (a)를 참조하면, 본 발명에 따른 단백질의 분자 구조의 결정 장치(BataSCP2)에 의해서 예측된 구조들의 에너지가 종래의 프로그램들로 계산한 구조들의 에너지보다 매우 낮은 안정적인 상태임을 확인할 수 있다.
도 5의 (b)는 동일한 입력 데이터를 세가지 프로그램으로 예측했을 때의 소요되는 시간을 도시한 도면이다. SCWRL4의 경우 예측된 단백질의 에너지는 매우 크게 나왔지만, 계산시간은 세가지 프로그램 중 가장 적게 소요되는 것으로 나왔다. 본 발명의 경우(BetaSCP2), CISRR1보다 약 3배 정도 빠르고 전체적인 계산시간의 경향은 입력 데이터의 크기 증가에 따라서 선형적인 증가 패턴을 보여주고 있다.
도 6는 본 발명의 일 실시예 따른 단백질의 분자 구조의 결정 방법의 흐름도를 도시한 도면이다. 이하, 각 구성 별로 수행되는 과정을 설명한다.
단계(610)에서는 단백질의 골격을 입력받는다
단계(620)에서는 입력된 단백질의 골격을 이용하여 단백질의 초기의 분자 구조를 설정한다.
단계(630)에서는 단백질의 초기의 분자 구조를 기반으로, n개의 아미노산 각각에 대해, 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택한다.
본 발명의 일 실시예에 따르면, 단계(630)에서는 n개의 아미노산 중 i번째 아미노산에 대한 하나의 회전 이성질체를 선택할 수 있다. 이 때, 단계(630)는 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 단계, i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 단계, i번째 구 내의 원자들 및 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 i번째 구의 에너지값을 측정하는 제3 단계를 포함할 수 있다. 이 경우, i번째 아미노산에 대한 다수의 회전 이성질체 모두에 대해 제1 단계, 제2 단계 및 제3 단계가 수행되고, i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택할 수 있다.
단계(640)에서는 n개의 아미노산 각각에 대한 상기 선택된 하나의 회전 이성질체를 이용하여 단백질의 분자 구조를 결정한다.
본 발명의 일 실시예에 따르면, 단계(640)에서는 상기 선택된 하나의 회전 이성질체로 구성된 단백질의 제1 분자 구조를 생성하고, 단백질의 제1 분자 구조에 포함된 n개의 아미노산 각각에 대해, 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하여 상기 선택된 하나의 회전 이성질체를 조정하고, 조정된 상기 선택된 하나의 회전 이성질체를 이용하여 단백질의 분자 구조를 결정할 수 있다.
이 때, 본 발명의 일 실시예에 따르면, 단계(640)에서는 단백질의 제1 분자 구조에 포함된 n개의 아미노산 모두에 대해 회전 이성질체를 조정할 수 있다. 이 경우, j번째 아미노산을 기준으로, 단계(640)에서는 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 단계 A, j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 단계 B를 수행하고, 다수 회 변경시킨 각도 중 j번째 구의 에너지값이 최소가 되도록 하는 각도로 회전 이성질체를 조정할 수 있다.
구의 보로노이 다이어그램을 이용하여 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하는 과정 A, j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 과정 B 및 j번째 구 내의 원자들 및 j번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 j번째 구의 에너지값을 측정하는 과정 C를 수행하되, j번째 아미노산에 대한 다수 회 변경되는 각도 모두에 대해 과정 A, 과정 B 및 과정 C가 수행되고, j번째 구의 에너지값이 최소값을 가지는 각도로 상기 선택된 회전 이성질체를 조정할 수 있다.
지금까지 본 발명에 따른 단백질의 분자 구조의 결정 방법의 실시예들에 대하여 설명하였고, 앞서 도 2 내지 도 5에서 설명한 단백질의 분자 구조의 결정 장치(200)에 관한 구성이 본 실시예에도 그대로 적용 가능하다. 이에, 보다 상세한 설명은 생략하기로 한다.
또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등이 포함되며, 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

Claims (16)

  1. 다수의 회전 이성질체를 각각 포함하는 n(2 이상의 정수임)개의 아미노산으로 구성된 단백질의 분자 구조의 결정 방법에 있어서,
    상기 n개의 아미노산 각각에 대해, 상기 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택하는 단계; 및
    상기 n개의 아미노산의 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 단계;를 포함하되,
    상기 n개의 아미노산 중 i번째 아미노산에 대한 상기 하나의 회전 이성질체를 선택하는 단계는, 상기 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 단계; 상기 i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 단계; 상기 i번째 구 내의 원자들 및 상기 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 상기 i번째 구의 에너지값을 측정하는 제3 단계;를 포함하되, 상기 i번째 아미노산에 대한 상기 다수의 회전 이성질체 모두에 대해 상기 제1 단계, 상기 제2 단계 및 상기 제3 단계가 수행되고, 상기 i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택하는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  2. 제1항에 있어서,
    상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 단계는 m(2 이상의 정수임)회 동안 반복 수행되는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  3. 제1항에 있어서,
    상기 단백질의 골격을 입력받는 단계;를 더 포함하고,
    상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 단계는 상기 골격을 이용하여 상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  4. 제1항에 있어서,
    상기 단백질의 분자 구조를 결정하는 단계는,
    상기 선택된 하나의 회전 이성질체로 구성된 상기 단백질의 제1 분자 구조를 생성하는 단계;
    상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 각각에 대해, 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하는 단계; 및
    상기 변경이 수행된 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 단계;를 포함하는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  5. 제4항에 있어서,
    상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 중 j번째 아미노산에 대한 상기 소정의 각도로 다수 회 변경하는 단계는,
    상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 단계 A; 및 상기 j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 단계 B;를 수행하고 상기 j번째 아미노산에 대한 이성질체의 이면각들을 다수 회 변경시키면서 상기 j번째 구의 에너지값이 최소가 되도록 하는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  6. 제5항에 있어서,
    상기 다수 회 변경되는 각도는 상기 이면각의 단위 변화의 크기(step length) 및 상기 이면각의 변경되는 방향 벡터(direction vector)로 구성되되,
    상기 단위 변화의 크기는 상기 j번째 구의 에너지값에 기초한 선형 탐색법(line search method)을 이용하여 산출되고, 상기 방향 벡터는 켤레 구배법(conjugate gradient method)을 이용하여 산출되는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.
  7. 제6항에 있어서,
    상기 j번째 구 내의 이면각들에 대한 방향 벡터는, 상기 j번째 구 내의 원자와 상기 j번째 구의 이웃 구 내의 원자들 사이의 에너지값의 도함수(derivative)를 이용하여 산출되고 상기 도함수는 아래의 수학식과 같이 표현되는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.

    Figure 112015022255815-pat00020


    여기서,
    Figure 112015022255815-pat00021
    는 상기 도함수, x는 제1 원자와 제2 원자의 거리, r1는 상기 제1 원자의 반지름, r2는 상기 제2 원자의 반지름을 각각 의미함.
  8. 제1항 및 제7항 중 어느 한 항에 있어서,
    상기 에너지값은 하기의 수학식과 같이 표현되는 것을 특징으로 하는 단백질의 분자 구조의 결정 방법.

    Figure 112015022255815-pat00022


    여기서, x는 상기 원자들 중 제1 원자와 제2 원자의 거리, y는 상기 에너지값, r1는 상기 제1 원자의 반지름, r2는 상기 제2 원자의 반지름을 각각 의미함.
  9. 제1항 내지 제7항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
  10. 다수의 회전 이성질체를 각각 포함하는 n(2 이상의 정수임)개의 아미노산으로 구성된 단백질의 분자 구조의 결정 장치에 있어서,
    상기 n개의 아미노산 각각에 대해, 상기 다수의 회전 이성질체 중 하나의 회전 이성질체를 선택하는 선택부; 및
    상기 n개의 아미노산의 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 결정부;를 포함하되,
    상기 선택부는 상기 n개의 아미노산 중 i번째 아미노산에 대한 상기 하나의 회전 이성질체를 선택하되, 상기 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고 n개의 구에 대한 보로노이 다이어그램을 산출하는 제1 과정; 상기 i번째 아미노산과 대응되는 i번째 구의 이웃 구를 검색하는 하는 제2 과정; 상기 i번째 구 내의 원자들 및 상기 i번째 구의 이웃 구 내의 원자들 사이의 에너지값을 측정하여 상기 i번째 구의 에너지값을 측정하는 제3 과정;를 수행하되, 상기 i번째 아미노산에 대한 상기 다수의 회전 이성질체 모두에 대해 상기 제1 과정, 상기 제2 과정 및 상기 제3 과정을 수행하고, 상기 i번째 구의 에너지값이 최소값을 가지는 회전 이성질체를 상기 하나의 회전 이성질체로 선택하는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.
  11. 제10항에 있어서,
    상기 n개의 아미노산 각각에 대한 상기 하나의 회전 이성질체를 선택하는 단계는 m(2 이상의 정수임)회 동안 반복 수행되는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.
  12. 제10항에 있어서,
    상기 결정부는, 상기 선택된 하나의 회전 이성질체로 구성된 상기 단백질의 제1 분자 구조를 생성하고, 상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 각각에 대해, 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하며, 상기 변경이 수행된 상기 선택된 하나의 회전 이성질체를 이용하여 상기 단백질의 분자 구조를 결정하는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.
  13. 제12항에 있어서,
    상기 결정부는,
    상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산 중 j번째 아미노산에 대해 상기 선택된 하나의 회전 이성질체를 정의하는 이면각을 소정의 각도로 다수 회 변경하되,
    상기 단백질의 제1 분자 구조에 포함된 n개의 아미노산과 각각 대응되는 n개의 구를 생성하고, n개의 구에 대한 보로노이 다이어그램을 산출하는 단계 A; 및 상기 j번째 아미노산과 대응되는 j번째 구의 이웃 구를 검색하는 단계 B;를 수행하고, 상기 j번째 아미노산에 대한 이성질체의 이면각들을 다수 회 변경시키면서 상기 j번째 구의 에너지값이 최소가 되도록 하는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.
  14. 제13항에 있어서,
    상기 다수 회 변경되는 각도는 상기 이면각의 단위 변화의 크기(step length) 및 상기 이면각의 변경되는 방향 벡터(direction vector)로 구성되되,
    상기 단위 변화의 크기는 상기 j번째 구의 에너지값에 기초한 선형 탐색법(line search method)을 이용하여 산출되고, 상기 방향 벡터는 켤레 구배법(conjugate gradient method)을 이용하여 산출되는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.
  15. 제14항에 있어서,
    상기 j번째 구 내의 이면각들에 대한 방향 벡터는, 상기 j번째 구 내의 원자와 상기 j번째 구의 이웃 구 내의 원자들 사이의 에너지값의 도함수(derivative)를 이용하여 산출되고 상기 도함수는 아래의 수학식과 같이 표현되는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.

    Figure 112015022255815-pat00023


    여기서,
    Figure 112015022255815-pat00024
    는 상기 도함수, x는 제1 원자와 제2 원자의 거리, r1는 상기 제1 원자의 반지름, r2는 상기 제2 원자의 반지름을 각각 의미함.
  16. 제10항 및 제15항 중 어느 한 항에 있어서,
    상기 에너지값은 하기의 수학식과 같이 표현되는 것을 특징으로 하는 단백질의 분자 구조의 결정 장치.

    Figure 112015022255815-pat00025


    여기서, x는 상기 원자들 중 제1 원자와 제2 원자의 거리, y는 에너지값, r1는 상기 제1 원자의 반지름, r2는 상기 제2 원자의 반지름을 각각 의미함.
KR1020150031499A 2015-03-06 2015-03-06 단백질의 분자 구조의 결정 방법 및 장치 KR101599186B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150031499A KR101599186B1 (ko) 2015-03-06 2015-03-06 단백질의 분자 구조의 결정 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150031499A KR101599186B1 (ko) 2015-03-06 2015-03-06 단백질의 분자 구조의 결정 방법 및 장치

Publications (1)

Publication Number Publication Date
KR101599186B1 true KR101599186B1 (ko) 2016-03-03

Family

ID=55535601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150031499A KR101599186B1 (ko) 2015-03-06 2015-03-06 단백질의 분자 구조의 결정 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101599186B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022145803A1 (ko) * 2020-12-30 2022-07-07 (주) 팜캐드 인공 지능(ai)을 이용하여 단백질 구조 추정에 이용되는 오메가 파라미터를 추정하는 장치 및 방법
WO2023085562A1 (ko) * 2021-11-11 2023-05-19 주식회사 아토믹스 기계 학습을 위한 분자 구조 샘플링 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030049680A1 (en) * 2001-05-24 2003-03-13 Gordon D. Benjamin Methods and compositions utilizing hybrid exact rotamer optimization algorithms for protein design
KR20030067488A (ko) * 2002-02-08 2003-08-14 가부시키가이샤 타로 분자구조모델 구성체
KR20070026497A (ko) * 2004-05-04 2007-03-08 한양대학교 산학협력단 3차원(3d) 보로노이 다이어그램 계산
US8571806B2 (en) * 1999-11-03 2013-10-29 Lonza Biologies PLC Method for generating information related to the molecular structure of a biomolecule

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8571806B2 (en) * 1999-11-03 2013-10-29 Lonza Biologies PLC Method for generating information related to the molecular structure of a biomolecule
US20030049680A1 (en) * 2001-05-24 2003-03-13 Gordon D. Benjamin Methods and compositions utilizing hybrid exact rotamer optimization algorithms for protein design
KR20030067488A (ko) * 2002-02-08 2003-08-14 가부시키가이샤 타로 분자구조모델 구성체
KR20070026497A (ko) * 2004-05-04 2007-03-08 한양대학교 산학협력단 3차원(3d) 보로노이 다이어그램 계산

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022145803A1 (ko) * 2020-12-30 2022-07-07 (주) 팜캐드 인공 지능(ai)을 이용하여 단백질 구조 추정에 이용되는 오메가 파라미터를 추정하는 장치 및 방법
WO2023085562A1 (ko) * 2021-11-11 2023-05-19 주식회사 아토믹스 기계 학습을 위한 분자 구조 샘플링 방법 및 장치

Similar Documents

Publication Publication Date Title
CN112585686B (zh) 通过组合距离图裁剪来确定蛋白距离图
Forrester et al. Recent advances in surrogate-based optimization
Piironen et al. Projection predictive model selection for Gaussian processes
Wriggers et al. Using situs for flexible and rigid-body fitting of multiresolution single-molecule data
Seo et al. Numerical analysis of added resistance on ships in short waves
JP5892657B2 (ja) 表示処理プログラム、表示処理方法及び表示処理装置
JP2009072576A (ja) 血管造影画像の定量的分岐解析のための方法、装置およびコンピュータプログラム
CN112484968B (zh) 用于光学量测的方法、系统、计算设备和存储介质
US20070075900A1 (en) System and method for determining the location of emitters having well-behaved timing features
WO2010094713A1 (en) Rendering caustics in computer graphics with photon mapping by relaxation
KR101599186B1 (ko) 단백질의 분자 구조의 결정 방법 및 장치
Gassner et al. A space–time adaptive discontinuous Galerkin scheme
CN110147837A (zh) 基于特征聚焦的任意方向密集目标检测方法、系统及设备
Chen et al. Evaluation of cell segmentation methods without reference segmentations
Yang et al. Cartesian-grid-based computational analysis for added resistance in waves
Economides et al. Hierarchical Bayesian uncertainty quantification for a model of the red blood cell
Huang et al. Variation-aware vision transformer quantization
CN107507218A (zh) 基于静态帧的部件运动性预测方法
CN112395712B (zh) 一种不规则颗粒的形状模拟方法、装置及设备
US20200380751A1 (en) Modeling method and apparatus and apparatus using fluid animation graph
KR101024428B1 (ko) 수식 처리 기법을 이용한 다목적 최적화 설계 지원 장치, 방법 및 기록 매체
Brabcová et al. The shape of non-axisymmetric bubbles on inclined planar surfaces
Daberdaku Identification of protein pockets and cavities by Euclidean Distance Transform
Kroll et al. Efficient prediction of grain boundary energies from atomistic simulations via sequential design
Kühbach et al. On Strong-Scaling and Open-Source Tools for High-Throughput Quantification of Material Point Cloud Data: Composition Gradients, Microstructural Object Reconstruction, and Spatial Correlations

Legal Events

Date Code Title Description
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 5

R401 Registration of restoration