KR101091785B1 - 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법 - Google Patents

알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법 Download PDF

Info

Publication number
KR101091785B1
KR101091785B1 KR1020100031907A KR20100031907A KR101091785B1 KR 101091785 B1 KR101091785 B1 KR 101091785B1 KR 1020100031907 A KR1020100031907 A KR 1020100031907A KR 20100031907 A KR20100031907 A KR 20100031907A KR 101091785 B1 KR101091785 B1 KR 101091785B1
Authority
KR
South Korea
Prior art keywords
virtual
virtual center
centers
distance
amino acid
Prior art date
Application number
KR1020100031907A
Other languages
English (en)
Other versions
KR20110112664A (ko
Inventor
조광휘
노경태
유민재
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020100031907A priority Critical patent/KR101091785B1/ko
Priority to PCT/KR2010/006033 priority patent/WO2011126183A1/ko
Priority to US13/635,401 priority patent/US20130018594A1/en
Publication of KR20110112664A publication Critical patent/KR20110112664A/ko
Application granted granted Critical
Publication of KR101091785B1 publication Critical patent/KR101091785B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding

Landscapes

  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법이 개시된다. 가상중심 결정부는 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 상기 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치한다. 나선구조 판별부는 대상 단백질에 대하여 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각을 기초로 연속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별한다. 병풍구조 판별부는 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별한다. 본 발명에 따르면, 알파탄소의 사이에서 결정되는 가상중심을 이용하여 가상중심 간의 거리 또는 이면각을 기초로 가상중심에 대응하는 아미노산이 속하는 2차 구조를 판별함으로써, 알파탄소의 좌표정보를 이용하는 기존의 방법들에 비해 향상된 정확도를 얻을 수 있다.

Description

알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법{Apparatus and method for identifying secondary structure of protein using alpha carbon coordinates}
본 발명은 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법에 관한 것으로, 보다 상세하게는, 단백질을 구성하는 알파탄소의 좌표정보만 주어진 경우에 주어진 좌표정보를 이용하여 단백질의 2차 구조를 결정하는 장치 및 방법에 관한 것이다.
생체 내에서 생명현상과 관련된 중요한 기능을 수행하는 생체분자인 단백질은 그 기능이 구조와 밀접한 관련을 가짐에 따라 단백질의 구조에 대한 관심이 높아지고 있다. 단백질의 구조는 1차, 2차, 3차 및 4차 구조로 정의된다. 1차 구조는 단백질을 구성하는 아미노산 서열의 정보를 지칭하고, 2차 구조는 아미노산 잔기(residue)들이 모여 일정한 패턴인 나선구조(helix), 병풍구조(strand) 또는 비정형구조(random coil)를 나타내는 것을 말한다. 또한 3차 구조는 2차 구조들이 모여 전체적으로 입체적인 구조를 가지는 것을 말하며, 4차 구조는 몇 개의 단백질 사슬(chain)이 모여 서로 상호작용하는 형태를 지칭하는 것이다. 이러한 단백질 구조 중에서 2차 구조는 3차 구조를 이루는 기반이 되므로, 2차 구조의 정확한 정의가 단백질 구조에 대한 연구의 기반이 된다.
2차 구조를 정의하는 방법으로는 엑스레이(x-ray)나 핵자기공명(NMR)에 의해 알아낸 단백질 내 각 원자의 좌표로부터 아마이드(amide)의 수소원자(H)와 카르보닐(carbonyl)의 산소원자(O)가 이루는 수소결합의 패턴을 이용하는 방법이 있다. 이 방법을 적용하기 위해서는 H, N, C 및 O 등의 단백질을 구성하는 원자들 중에서 백본(backbone)을 구성하는 원자의 위치를 정확하게 알아야 하고, 그 좌표들을 이용하여 수소결합 유무를 계산함으로써 2차 구조를 결정하게 된다. 이러한 방법을 사용한 대표적인 프로그램이 DSSP(Dictionary of Protein Secondary Structure)이다.
DSSP는 각각의 아미노산에 있는 O, N 및 C의 정보를 이용하여 H의 위치를 예측한 후에 네 개의 원자의 좌표를 이용하여 수소결합 에너지를 산출하고, 산출된 에너지가 -0.5Kcal/mol보다 작으면 수소결합으로 정의한 후, 수소결합의 정보에 의해 2차 구조를 정의한다. 수소결합 에너지는 다음의 수학식 1에 의해 산출된다.
Figure 112010022190841-pat00001
여기서, q1은 수소의 전하량, q2는 산소의 전하량, rON은 O-N 거리, rCH는 C-H 거리, rOH는 O-H 거리, 그리고 rCN은 C-N 거리이다.
단백질의 2차 구조를 결정하는 또 다른 방법인 STRIDE(Structural Identification) 역시 수소의 위치를 예측한 후에 그 정보를 이용하여 2차 구조를 정의하는 방법을 사용하였는데, 수소 결합의 유무를 판단하는 에너지 산출 공식에 있어서 DSSP와 차이를 보인다. 한편, PROSS의 경우에는 백본의 이면각(dihedral angles)을 이용하여 2차 구조를 정의한다.
DEFINE 및 VoTAP의 경우에는 알파탄소(Cα)의 정보만을 이용하여 단백질의 2차 구조를 정의한다. DEFINE은 알파탄소 간의 거리를 기준이 되는 이상적인 2차 구조에서의 거리와 비교하여 그 기준과 동일할 경우에 2차 구조를 정의하는 단순한 방법을 사용하며, VoTAP는 단백질을 구성하고 있는 각 아미노산별로 보로노이 배열(Voronoi tessellation)의 3차원 입체를 정의한 다음 이들 입체 간 접촉면의 상태를 이용하여 2차 구조를 정의한다.
단백질의 구조를 알아내고자 할 때 크기가 매우 큰 단백질의 엑스레이 구조나 전자현미경(Electron Microscopy : EM)에 의한 방법은 알파탄소의 좌표만을 제공하는 경우가 많으며, 구조가 알려진 단백질의 경우에도 일부 아미노산의 좌표 중에서 알파탄소의 좌표만 알려진 경우가 많다. 이러한 경우에는 알파탄소의 좌표만을 사용하여 수소결합의 유무를 판단함으로써 단백질의 2차 구조를 정의하여야 하는데, 위와 같이 제안된 기존의 방법들은 모든 원자의 좌표를 알고 정의하는 방법인 DSSP와 비교했을 때 그 정확도가 80% 초반에 미치는 수준이다. 수소결합의 유무를 정확하게 판단하기 위해서는 수소결합을 이루는 네 개의 원자(H, N, C, O)의 방향성이 매우 중요한데, 알파탄소의 좌표만으로는 이를 알기가 쉽지 않기 때문이다. 따라서 알파탄소의 좌표만을 사용하여 정확하게 단백질의 2차 구조를 정의할 수 있는 방법이 필요하다.
본 발명이 이루고자 하는 기술적 과제는, 알파탄소의 좌표정보만 알려진 단백질의 2차 구조를 높은 정확도로 판별할 수 있는 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 알파탄소의 좌표정보만 알려진 단백질의 2차 구조를 높은 정확도로 판별할 수 있는 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치는, 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 상기 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치하는 가상중심 결정부; 상기 대상 단백질에 대하여 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각을 기초로 상기 연속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별하는 나선구조 판별부; 및 상기 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 상기 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별하는 병풍구조 판별부;를 구비한다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별방법은, 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 상기 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치하는 가상중심 결정단계; 상기 대상 단백질에 대하여 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각을 기초로 상기 연속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별하는 나선구조 판별단계; 및 상기 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 상기 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별하는 병풍구조 판별단계;를 갖는다.
본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법에 의하면, 주어진 알파탄소의 좌표정보를 그대로 이용하지 않고 알파탄소의 사이에서 결정되는 가상중심을 이용하여 가상중심 간의 거리 또는 이면각을 기초로 가상중심에 대응하는 아미노산이 속하는 2차 구조를 판별함으로써, 단백질을 구성하는 아미노산 중에서 알파탄소의 좌표정보만 알려진 경우에도 해당 단백질의 2차 구조를 판별할 수 있고, 알파탄소의 좌표정보를 이용하는 기존의 방법들에 비해 향상된 정확도를 얻을 수 있다.
도 1은 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치에 대한 바람직한 실시예의 구성을 도시한 블록도,
도 2는 단백질의 1차구조의 예를 도시한 도면,
도 3은 알파 나선구조의 기본 골격을 도시한 도면,
도 4는 알파 나선구조를 위에서 본 형태를 도시한 도면,
도 5는 3/10 나선구조의 기본골격을 도시한 도면,
도 6은 3/10 나선구조를 위에서 본 형태를 도시한 도면,
도 7은 평행구조의 기본 골격을 도시한 도면,
도 8은 역평행구조의 기본 골격을 도시한 도면,
도 9a 및 도 9b는 각각 알파 나선구조에서 수소결합을 하는 아미노산들에 포함된 알파탄소 간의 거리분포 및 각각의 알파탄소에 대해 결정된 가상중심(pseudo center) 간의 거리분포를 도시한 그래프,
도 10은 단백질 내의 아미노산 결합으로부터 가상중심을 정의하는 일 예를 도시한 도면,
도 11은 PDB(Protein Data Bank) ID가 1OUN인 Nuclear Transport factor 2의 DSSP 결과를 이용하여 얻어진 2차 구조를 도시한 도면,
도 12는 도 11의 단백질에 포함된 아미노산 서열에서 가상중심 간의 거리가 일정한 거리범위 내에 속하는 잔기(residue)들을 도시한 도면,
도 13은 Nuclear Transport Factor 2의 서열과 DSSP에 의해 정의된 2차 구조를 도시한 도면,
도 14a 및 도 14b는 각각 알파 나선구조에서의 수소결합의 형태 및 가상중심을 이용한 알파 나선구조 판별의 일 예를 도시한 도면,
도 15a 및 도 15b는 각각 3/10 나선구조에서의 수소결합의 형태 및 가상중심을 이용한 3/10 나선구조 판별의 일 예를 도시한 도면,
도 16a 및 도 16b는 각각 병풍구조 중 평행구조에서의 수소결합의 형태 및 가상중심을 이용한 평행구조 판별의 일 예를 도시한 도면,
도 17a 및 도 17b는 각각 병풍구조 중 역평행구조에서의 수소결합의 형태 및 가상중심을 이용한 역평행구조 판별의 일 예를 도시한 도면,
도 18은 역평행구조 내의 아미노산이 다른 아미노산과 수소결합을 형성하는 일 예를 도시한 도면, 그리고,
도 19는 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치에 대한 바람직한 실시예의 수행과정을 도시한 흐름도이다.
이하에서 첨부된 도면들을 참조하여 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법의 바람직한 실시예에 대해 상세하게 설명한다.
도 1은 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치에 대한 바람직한 실시예의 구성을 도시한 블록도이다.
도 1을 참조하면, 본 발명에 따른 단백질 2차 구조 판별장치는, 가상중심 결정부(110), 나선구조 판별부(120) 및 병풍구조 판별부(130)를 구비한다.
먼저 본 발명에 따른 단백질 2차 구조 판별장치를 사용하여 판별하고자 하는 단백질의 2차 구조에 관하여 설명한다. 단백질의 단위체인 아미노산은 아미노기(N-H), 카르보닐기(C=O), 곁가지(side chain, R) 및 알파탄소(Cα)를 가지고 있다. 도 2에는 단백질의 1차구조의 예가 도시되어 있으며, 알파탄소의 위치가 굵게 표시되어 있다.
단백질의 2차 구조는 도 2에 나타낸 것과 같은 단백질 내의 아미노산끼리 수소결합을 통해 특정한 형태를 이루는 구조를 말하는 것으로, 수소결합은 아미노기의 H와 카르보닐기의 O 사이의 결합이다. 이러한 수소결합이 일정한 패턴으로 나타날 때 이를 2차 구조라 부른다. 2차 구조는 수소결합의 방향과 유형에 따라 몇 가지로 구분되는데, 대표적인 2차 구조로는 나선구조(helix), 병풍구조(strand), 턴(turn) 및 비정형구조(random coil) 등이 있다.
나선구조는 알파 나선구조(alpha helix)와 3/10 나선구조(3/10 helix)로 나눌 수 있고, 병풍구조는 평행구조(parallel)와 역평행구조(anti-parallel)로 나눌 수 있다. 두 개의 2차 구조를 연결해 주는 작은 고리를 턴(turn)이라 하고, 이상의 세 가지 2차 구조에 해당하지 않는 구조를 비정형구조라 한다. 알려진 단백질 중에서 2차 구조의 비율을 다음의 표 1에 나타내었다.
2차 구조의 종류 비율(%)
나선구조 38.01
병풍구조 16.98
0.38
비정형구조 44.63
또한 다음의 표 2는 DSSP에 의해 정의되고 세분화된 나선구조의 종류 및 그 비율을 나타낸 것이다.
나선구조의 종류 비율(%)
오른손 방향 알파 나선구조 36.1178
오른손 방향 오메가(omega) 나선구조 0.00024
오른손 방향 파이(pi) 나선구조 0.00130
오른손 방향 감마(gamma) 나선구조 0.00127
오른손 방향 3/10 나선구조 3.87257
왼손 방향 알파 나선구조 0.00065
왼손 방향 오메가 나선구조 0.00038
왼손 방향 감마 나선구조 0.00040
27 리본/나선구조 0.00044
폴리프롤린(polyproline) 나선구조 0.00098
표 2를 참조하면, 오른손 방향 알파 나선구조(right-handed alpha helix)와 오른손 방향 3/10 나선구조가 각각 36% 및 3.8%로 가장 많이 존재하며, 나머지는 0.001% 미만으로 존재하는 것을 확인할 수 있다.
나선구조 중에서 가장 빈번하게 나타나는 구조인 알파 나선구조에는 3개의 아미노산을 사이에 두고 이격되어 위치하는 아미노산 간의 수소결합이 존재하며, 연속하는 4개의 아미노산이 나선형을 이룬다. 도 3은 알파 나선구조의 기본 골격을 도시한 도면이다. 도 3을 참조하면, N번(도 3에서는 5번) 아미노산의 카르보닐기의 산소(O)와 N+4번(도 3에서는 9번) 아미노산의 아미노기의 수소(H)가 수소결합(점선)을 형성하고 있는 것을 확인할 수 있다. 이와 같은 유형의 결합이 형성되어 나선형을 이루고, 한 번의 360° 회전마다 3.6개의 단위체가 관여할 때, 이를 알파 나선구조라 정의한다.
도 4는 알파 나선구조를 위에서 본 형태를 도시한 도면이다. 도 4에서 음영으로 표시된 둥근 원자는 알파탄소를 나타낸 것이다. 알파탄소 간의 각도는 대략 100°이며, 알파 나선구조는 1/30 나선구조보다 안정적인 형태로서 수소결합이 3/10 나선구조에 비해 연속적이며 길게 존재한다.
3/10 나선구조에는 2개의 아미노산을 사이에 두고 이격되어 위치하는 아미노산 간의 수소결합이 나타나며, 연속하는 3개의 아미노산이 나선형을 이룬다. 도 5는 3/10 나선구조의 기본골격을 도시한 도면으로, N번(도 5에서는 6번) 아미노산 카르보닐기의 산소(O)와 N+3번(도 5에서는 9번) 아미노산 아미노기의 수소(H)가 수소결합(점선)을 형성하는 것을 확인할 수 있다. 이러한 결합이 형성되어 나선형을 이루고, 한 번의 회전에 3개의 아미노산이 관여하는 경우, 이를 3/10 나선구조라 부른다.
도 6은 3/10 나선구조를 위에서 본 형태를 도시한 도면이다. 도 6에서 음영으로 표시된 둥근 원자는 알파탄소를 나타낸다. 알파탄소 간의 각은 약 120°이며, 3/10 나선구조는 알파 나선구조에 비해 불안정한 상태이지만 흔히 나타나는 나선구조 중의 하나이다.
또 다른 대표적인 2차 구조인 병풍구조는 다시 평행 병풍구조(parallel strand, 이하, '평행구조'라 한다)와 역평행 병풍구조(anti-parallel strand, 이하, '역평행구조'라 한다)로 구분된다. 도 7은 평행구조의 기본 골격을 도시한 도면이다. 숫자가 함께 적힌 탄소원자(C)는 알파탄소를 나타내고, 알파탄소에 적혀 있는 숫자는 단위체의 번호를 의미한다. 또한 사각형 박스는 아미노산 하나를 나타내는 것이다. 도 7에서 화살표의 방향은 아미노산 서열의 진행방향을 나타내는데, 평행구조의 경우에는 두 아미노산 서열을 따라 동일한 방향으로 수소결합(점선)이 이루어진다. 또한 평행구조에서는 카르보닐기의 산소(O)와 아미노기의 수소(H)(예를 들면, 17번)가 마주하고 있는 아미노산(67번)과 결합하지 않고, 왼쪽 아미노산(66번)의 카르보닐기의 산소(O) 및 오른쪽 아미노산(68번)의 아미노기의 수소(H)와 각각 수소결합을 하게 된다. 이러한 유형으로 수소결합을 하는 경우, 병풍구조 중에서 평행구조라 한다.
또한 도 8은 역평행구조의 기본 골격을 도시한 도면이다. 도 8에서 화살표의 방향이 아미노산 서열의 진행방향을 나타내는 것이며, 평행구조와 달리 두 아미노산 서열이 서로 반대 방향으로 진행하며 수소결합이 이루어진다. 예를 들면, 17번 아미노산에서 카르보닐기의 산소(O)와 아미노기의 수소(H)가 마주하고 있는 65번 아미노산에 포함된 카르보닐기의 산소(O)와 아미노기의 수소(H)와 각각 수소결합을 하고, 17번 아미노산의 양 옆에 있는 아미노산(16번 및 18번)은 수소결합을 하지 않는다.
나선구조 및 평행구조 외에 턴이라는 2차 구조가 존재하지만, 그 양이 매우 적고 대부분 비정형구조와 같이 취급하며, 이하 본 발명에서도 턴을 비정형 구조로 간주한다.
이상에서 설명한 단백질의 2차 구조, 즉 나선구조 중에서 알파 나선구조와 3/10 나선구조, 그리고 병풍구조 중에서 평행구조와 역평행구조를 주어진 대상 단백질에 대해 판별하기 위해 본 발명에 따른 단백질 2차 구조 판별장치는 수소결합 에너지 대신 대상 단백질에 포함된 알파탄소의 좌표정보를 이용한다. 또한 알파탄소의 좌표정보를 그대로 이용하는 것이 아닌 알파탄소의 사이에 새롭게 배치되는 가상중심을 이용한다.
도 9a 및 도 9b는 각각 알파 나선구조에서 수소결합을 하는 아미노산들에 포함된 알파탄소 간의 거리분포 및 각각의 알파탄소에 대해 결정된 가상중심(pseudo center) 간의 거리분포를 도시한 그래프이다. 도 9a 및 도 9b의 그래프에서 가로축은 각각 알파탄소 간의 거리 및 가상중심 간의 거리이고, 세로축은 해당 거리에서 수소결합을 형성하는 아미노산의 개수이다. 도 9a를 참조하면 알파탄소를 이용하는 경우의 표준편차는 0.32이고, 도 9b를 참조하면 가상중심을 이용하는 경우의 표준편차가 0.27이다. 따라서 알파탄소를 이용하는 것보다 가상중심을 이용하는 경우에 더 좋은 결과가 얻어짐을 확인할 수 있다. 수소결합은 알파탄소 근처가 아닌 서로 인접한 두 알파탄소 사이의 중심점인 가상중심에 더 가까운 곳에서 이루어지기 때문이다.
이와 같이 단백질의 2차 구조를 판별하는 데 가상중심을 이용하기 위해 가상중심 결정부(110)는 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치한다.
도 10은 단백질 내의 아미노산 결합으로부터 가상중심을 정의하는 일 예를 도시한 도면이다. 도 10의 (a)는 단백질에서의 아미노산의 결합을 1차원으로 도시한 것이다. 엑스레이나 NMR을 통해 구조가 결정된 단백질의 경우에는 도 10의 (a)와 같이 중원자(heavy atom), 즉 아미노산을 구성하는 원자 중 수소를 제외한 원자의 정보가 주어진다. 다만, NMR의 경우에는 수소의 위치까지 결정된다. NMR에 의해 단백질의 구조가 결정된 것이 아닌 경우에도 수소의 위치는 중원자의 정보를 이용하여 도 10의 (b)와 같이 예측할 수 있다.
도 10의 (b)에 도시된 바와 같이 중원자의 수소 좌표가 얻어지면 수학식 1에 의해 수소결합 에너지를 계산하고, 그 에너지가 -0.5Kcal/mol보다 작으면 수소결합으로 정의한 후에 2차 구조를 판단하는 것이 기존의 DSSP에서 사용하는 방법이다.
그러나, 전자 현미경을 사용하거나 엑스레이를 사용하는 경우 중 일부의 경우에는 도 10의 (c)에 도시된 바와 같이 알파탄소의 좌표만 주어진다. 종래의 연구에서는 이와 같이 주어진 알파탄소를 직접 사용하여 단백질의 2차 구조를 예측하고자 하였으나, 알파탄소의 위치는 실제 수소결합을 하는 주체인 N-H와 C=O의 위치로부터 가상중심에 비하여 거리가 멀기 때문에 정확한 판단이 어렵다. 따라서 본 발명에 따른 단백질 2차 구조 판별장치에서는 알파탄소의 사이에 가상중심을 정의하고, 가상중심 간의 거리를 이용하여 수소결합의 유무를 판단하는 방법을 사용한다.
도 11은 PDB(Protein Data Bank) ID가 1OUN인 Nuclear Transport factor 2의 DSSP 결과를 이용하여 얻어진 2차 구조를 도시한 도면이다. 도 11에서 원통형은 나선구조를 나타내며, 화살표는 병풍구조를 나타낸다. 또한 도 12는 도 11의 단백질에 포함된 아미노산 서열에서 가상중심 간의 거리가 일정한 거리범위 내에 속하는 잔기(residue)들을 도시한 도면으로, 실선은 2~3Å의 범위에 포함되는 경우, 점선은 4~5Å의 범위에 포함되는 경우를 나타낸 것이다. 도 12의 그래프는 거리조건을 만족하는 잔기가 최소한 4개 이상 연속하는 경우만을 도시한 것이고, 중간에 한 개의 끊김이 있는 경우라도 4개 이상 연속하는 경우에는 도 12에 포함시켰다. 도 12의 실선은 도 11에서의 병풍구조를 나타내는 것으로, 병풍구조를 이루기 위해서는 짝을 이루는 병풍구조가 있어야 하므로 도 12의 실선 그래프에 두 개의 알파벳이 함께 표시된 것을 확인할 수 있다.
도 12에서 (a), (b) 및 (e)와 같이 대각방향의 그래프이며 중심으로부터 멀리 떨어지지 않은 것은 나선구조이며, (c,d), (f,g), (g,h) 및 (h,i)와 같이 대각선의 중심 근처에 위치하면서 역대각 방향의 그래프인 것은 연결루프가 길지 않은 역평형구조, 그리고 (c,i)와 같이 대각방향의 그래프이고 대각선의 중심으로부터 많이 떨어져 있는 경우에는 연결루프가 긴 평형구조를 이룬다는 것을 예상할 수 있다.
도 13은 Nuclear Transport Factor 2의 서열과 DSSP에 의해 정의된 2차 구조를 도시한 도면이다. 또한 도 13에서 각 서열에 표시된 알파벳은 도 12에서 각 서열의 위치에 대응하며, 화살표 형태의 서열 상하에 표시된 알파벳은 해당 서열과 수소결합을 이루는 병풍구조를 나타낸다. 도 13을 참조하면, 가상중심 간의 거리를 사용하여 2차 구조를 판별하는 경우에도 DSSP에 의해 예측한 결과와 유사한 결과가 얻어짐을 확인할 수 있다.
이하에서는 가상중심 결정부(110)에 의해 각각의 알파탄소에 대응하여 결정된 가상중심을 이용하여 대상 단백질에서 나타나는 2차 구조를 판별하는 방법에 대하여 상세하게 설명한다.
나선구조 판별부(120)는 대상 단백질에 대하여 결정된 가상중심들을 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 그룹으로 분류하고, 각각의 그룹에 속하는 가상중심 간의 거리 및 이면각을 기초로 각각의 그룹에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별한다.
앞에서 설명한 바와 같이 나선구조에는 알파 나선구조 및 3/10 나선구조가 있으므로, 나선구조 판별부(120)는 알파 나선구조 판별부(122) 및 3/10 나선구조 판별부(124)를 포함한다.
먼저 알파 나선구조 판별부(122)는 가상중심들 중에서 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 사전에 설정된 제1거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제1각도범위에 속하면 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 알파 나선구조인 것으로 판별한다.
도 14a 및 도 14b는 각각 알파 나선구조에서의 수소결합의 형태 및 가상중심을 이용한 알파 나선구조 판별의 일 예를 도시한 도면이다. 도 14a를 참조하면, 앞에서도 설명한 바와 같이 알파 나선구조는 N번(도 14a의 4번) 아미노산에 있는 카르보닐기의 산소(O)와 N+4번(도 14a의 8번) 아미노산에 있는 아미노기의 수소(H) 간의 수소결합을 포함한다. 이때 알파탄소의 위치만으로는 수소결합의 존재 여부를 판단하기 어려우므로 도 14b에 도시된 바와 같이 가상중심을 사용하여 N'번(도 14b의 4'번) 가상중심과 N+3번(도 14b의 7'번) 가상중심 사이의 거리가 사전에 설정된 제1거리범위 내에 포함되는지를 본다. 여기서 가상중심의 번호는 아미노산 서열의 진행방향에서 바로 직전에 위치하는 아미노산의 번호를 따른다.
N번 가상중심과 N+3번 가상중심 간의 거리가 제1거리범위 내에 들어오더라도 산소와 수소의 방향이 적절하지 않으면 수소결합이 이루어지지 않기 때문에, 수소의 방향을 예측하기 위해 이면각(dihedral angle)을 사용할 필요성이 있다. 이면각이란 네 점이 이루는 각도로서, 여기서는 N, N+1, N+2 및 N+3번 가상중심을 말한다. 이면각이 사전에 설정된 제1각도범위 내에 속하는 경우에는 주어진 서열은 알파 나선구조를 가지는 것으로 판단한다. 예를 들면, N번 가상중심과 N+3번 가상중심 간의 거리가 제1거리범위인 4.21~5.23Å의 범위에 속하고, N, N+1, N+2 및 N+3번 가상중심 간의 이면각이 제1각도범위인 43.52~78.32°의 범위에 속하면 N번 내지 N+3번의 연속하는 네 개의 아미노산 서열은 알파 나선구조를 형성하는 것으로 판별한다.
한편, 아미노산 중 프롤린(proline)의 경우, 다른 19가지의 아미노산과는 달리 카르보닐기의 산소(O)는 다른 아미노산과 수소결합이 가능하지만 아미노기의 경우에는 수소(H)가 없으므로 다른 아미노산과 수소결합을 형성하지 못한다. 따라서 프롤린의 경우에 가상중심 사이의 거리 및 이면각이 설정된 범위에 포함되어 수소결합을 하는 것으로 판단되는 경우에도 실제로는 수소결합을 할 수 없으므로 결합에 포함시키지 않는다.
최종적으로, 위와 같은 수소결합 유무의 판단 과정을 반복한 후 이러한 결합이 연속적으로 존재하면 주어진 단백질의 2차 구조를 알파 나선구조로 정의한다.
다음으로 3/10 나선구조 판별부(124)는 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 세 번째 가상중심 간의 거리, 두 번째 가상중심과 네 번째 가상중심 간의 거리 및 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 각각 사전에 설정된 제2거리범위, 제3거리범위 및 제4거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제2거리범위에 속하면 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 3/10 나선구조인 것으로 판별한다.
도 15a 및 도 15b는 각각 3/10 나선구조에서의 수소결합의 형태 및 가상중심을 이용한 3/10 나선구조 판별의 일 예를 도시한 도면이다. 도 15a를 참조하면, 이상적인 3/10 나선구조의 경우에 N번(도 15a의 4번) 아미노산에 있는 카르보닐기의 산소(O)와 N+3번(도 15a의 7번) 아미노산에 있는 아미노기의 수소(H) 사이에 수소결합이 형성된다. 이를 도 15b에 도시된 바와 같이 가상중심을 이용하여 나타내면, N번(도 15a의 4번) 아미노산에 있는 카르보닐기의 산소(O)는 N번(도 15b의 4'번) 가상중심으로 표현되고, N+2번(도 15a의 6번) 아미노산에 있는 아미노기의 수소(H)는 N+2번(도 15b의 6'번) 가상중심으로 표현된다.
알파 나선구조에서와 마찬가지로 N번 가상중심과 N+2번 가상중심 간의 거리가 설정된 거리범위에 포함된다 하더라도 이면각을 이용하여 산소(O)와 수소(H)의 방향이 수소결합을 형성하기에 적절한지를 판별해야 한다. 알파 나선구조에서는 수소결합을 형성하는 가상중심이 3개의 차이를 두고 떨어져 있으므로 수소결합을 형성하는 양끝의 가상중심과 그 사이의 가상중심들(N, N+1, N+2, N+3)을 이용하여 이면각을 계산하였다. 그런데 3/10 나선구조의 경우에는 수소결합을 이루는 가상중심 간의 차이가 2개이므로 이면각을 계산할 때 N+3번(도 15b의 7'번) 가상중심을 추가하여 4개의 연속하는 가상중심에 의해 이면각을 계산한다.
N+3번 가상중심이 추가됨에 따라 3/10 나선구조 판별부(124)는 추가적인 판별조건으로서 N+1번(도 15b의 5'번) 가상중심과 N+3번(도 15b의 7'번) 가상중심 간의 거리 및 N번(도 15b의 4'번) 가상중심과 N+3번 (도 15b의 7'번) 가상중심 간의 거리를 사용하였다. 즉, 1개의 이면각과 3개의 가상중심 간 거리가 2차 구조의 판별조건으로 사용되는 것이다.
가장 바람직한 실시예로서, N번 가상중심과 N+2번 가상중심 간의 거리가 제2거리범위인 4.82Å 이내, N+1번 가상중심과 N+3번 가상중심 간의 거리가 제3거리범위인 5.24Å 이내에 속하고, N번 가상중심과 N+3번 가상중심 간의 거리가 제4거리범위인 5.14~9.12Å의 범위에 속하며, N, N+1, N+2, N+3번 가상중심 사이의 이면각이 제2각도범위인 42.1~119.5°의 범위에 포함되면 N번 내지 N+3번의 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 3/10 나선구조인 것으로 판별할 수 있다.
대상 단백질로부터 결정된 가상중심들에 대하여 나선구조에 해당하는지 여부를 판별한 다음에는 나선구조에 해당하지 않는 가상중심들이 병풍구조에 해당하는지 여부를 판별하는 과정이 수행된다.
병풍구조 판별부(130)는 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별한다.
앞에서 설명한 바와 같이 단백질의 2차 구조 중에서 병풍구조에는 평행구조와 역평행구조가 있으므로, 병풍구조 판별부(130)는 평행구조 판별부(132)와 역평행구조 판별부(134)를 구비한다.
평행구조 판별부(132)는 진행방향이 동일한 서로 다른 가상중심 서열에 각각 포함된 가상중심 간의 거리가 사전에 설정된 제5거리범위에 속하고, 서로 다른 가상중심 서열에 각각 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제6거리범위에 속하면 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 평행 병풍구조인 것으로 판별한다.
도 16a 및 도 16b는 각각 병풍구조 중 평행구조에서의 수소결합의 형태 및 가상중심을 이용한 평행구조 판별의 일 예를 도시한 도면이다. 도 16a를 참조하면, 진행방향이 서로 동일하며 평행구조를 이루는 아미노산 서열 간의 수소결합은 하나의 아미노산 서열에 포함된 아미노산에 있는 아미노기의 수소(H)와 카르보닐기의 산소(O)가 모두 다른 아미노산 서열에 포함된 아미노산에 있는 아미노기의 수소(H)와 카르보닐기의 산소(O)와 결합함으로써 형성된다. 또한 N번(도 16a의 15번) 아미노산이 수소결합을 형성하는 경우, N-1번(도 16a의 14번) 아미노산과 N+1번(도 16a의 16번) 아미노산은 수소결합을 하지 않는다.
주어진 단백질의 2차 구조를 판별하기 위해서는 도 16b에 도시된 바와 같이 평행구조를 형성하는 아미노산 서열에 대응하는 가상중심 서열에서 가상중심 간의 거리가 연속해서 일정한 범위 내에 속하는지를 조사하게 된다. 예를 들면, 도 16b에서 서로 다른 가상중심 서열에 속하는 N번(도 16b의 14'번) 가상중심과 M번(도 16b의 64'번) 간의 거리가 제5거리범위인 2.58~5.18Å의 범위에 속하며, N-1번(도 16b의 13'번) 가상중심과 M-1번(도 16b의 63'번) 가상중심 간의 거리가 제6거리범위인 4.34~5.03Å의 범위에 속하면 평행구조를 이루는 것으로 판별한다. 이때 N과 M 사이의 차이는 5 이상인 것이 바람직하다.
다음으로 역평행구조 판별부(134)는 진행방향이 반대인 서로 다른 가상중심 서열에 각각 포함된 가상중심 간의 거리가 사전에 설정된 제7거리범위에 속하고, 서로 다른 가상중심 서열에 각각 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제8거리범위에 속하며, 서로 다른 가상중심 서열에 각각 포함된 가상중심에 각각 대응하는 알파탄소 간의 거리가 사전에 설정된 제9거리범위에 속하면 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 역평행 병풍구조인 것으로 판별한다.
도 17a 및 도 17b는 각각 병풍구조 중 역평행구조에서의 수소결합의 형태 및 가상중심을 이용한 역평행구조 판별의 일 예를 도시한 도면이다. 도 17a를 참조하면, 역평행구조를 이루는 아미노산 서열 간의 수소결합은 하나의 아미노산 서열에 포함된 아미노산에 있는 아미노기의 수소(H) 및 카르보닐기에 있는 산소(O)가 모두 마주보는 다른 아미노산 서열에 포함된 아미노산에 있는 카르보닐기의 산소(O) 및 아미노기의 수소(H)와 각각 결합함으로써 형성된다. 또한 N번(도 17a의 15번) 아미노산이 수소결합을 형성하는 경우에 N-1번(도 17a의 14번) 아미노산과 N+1번(도 17a의 16번) 아미노산은 수소결합을 형성하지 않는다.
도 17b는 역평행구조에서 나타나는 가상중심을 도시한 도면으로, 평행구조와 마찬가지로 연속하는 두 쌍의 가상중심이 설정된 거리 범위에 속하면 주어진 단백질의 2차 구조가 역평행구조인 것으로 판별하게 된다. 다만, 역평행구조의 경우에는 평행구조와 다르게 알파탄소 간의 거리도 이용된다. 즉, N번(도 17b의 15'번) 가상중심과 M번(도 17b의 66'번) 가상중심 간의 거리가 제7거리범위인 4.36~5.19Å의 범위에 속하고, N+1번(도 17b의 16'번) 가상중심과 M-1번(도 17b의 65'번) 가상중심 간의 거리가 제8거리범위인 4.16~5.27Å의 범위에 속하며, N+1번(도 17b의 16번) 알파탄소와 M번(도 17b의 66번) 알파탄소 간의 거리가 제9거리범위인 1.42~5.99Å의 범위에 속한다면 역평행구조의 수소결합에 해당하는 것으로 판별한다. 따라서 N번, N+1번, M-1번 및 M번 아미노산이 형성하는 2차 구조는 역평행구조가 된다.
역평행구조에서 위와 같은 조건, 즉 가상중심 간의 거리 및 알파탄소 간의 거리정보를 사용하는 경우에 아미노산 서열의 중간 부분에서는 정확도가 높지만, 가장자리 부분의 정확도는 상대적으로 낮아진다. 따라서 아미노산 서열의 가장자리에 위치하는 아미노산의 경우에는 수소결합에 관여하는 아미노산과 그렇지 않은 아미노산을 구별할 필요가 있다. 즉, 도 17a에 도시된 아미노산 서열의 앞부분 가장자리의 경우, 15번 및 67번 아미노산은 수소결합을 하기 때문에 양쪽 가상중심의 거리에 의해 역평행구조에 포함되는지 여부를 쉽게 판단할 수 있다. 그러나 14번 및 68번 아미노산의 경우는 직접 수소결합을 하지 않으므로 13번 아미노산과 69번 아미노산이 수소결합을 하는지 여부에 따라 역평행구조에 포함시킬 것인지 여부가 결정된다. 이때 수소결합 여부를 직접 판단하기 어렵기 때문에 정확한 판단을 위해 13번 알파탄소와 69번 알파탄소 간의 거리가 3.00~6.70Å의 범위에 속하거나 13'번 가상중심과 68'번 가상중심 간의 거리가 5.64Å 이내의 범위에 속하지 않는 경우에는 역평행구조로 정의하지 않는다.
도 17b의 끝부분 가장자리(20번 및 62번 아미노산)의 경우, 21번 알파탄소와 61번 알파탄소 간의 거리가 4.427~6.40Å의 범위에 속하거나 20'번 가상중심과 61'번 가상중심 간의 거리가 6.26Å 이내의 범위에 속하지 않을 경우 수소 결합을 하지 않는 아미노산으로 간주하고 이 경우를 역평행구조(anti-parallel)로 정의하지 않는다.
역평행구조를 형성하는 두 개의 아미노산 서열에서 하나의 아미노산이 제 3의 아미노산 서열에 포함된 다른 아미노산과 수소결합을 이루는 경우가 있다. 도 18은 역평행구조 내의 아미노산이 다른 아미노산과 수소결합을 형성하는 일 예를 도시한 도면이다. 도 18에서 63번 아미노산은 역평행구조 내에 있지만 다른 아미노산인 17번 아미노산과 수소결합을 형성한다. 이와 같이 역평행구조에서 하나의 아미노산이 다른 병풍구조에 속하는 아미노산과 수소결합을 형성하는 경우에도 해당 아미노산이 포함된 구조를 역평행구조로 판별할 수 있다.
마지막으로 이상에서 설명한 네 가지의 2차 구조(알파 나선구조, 3/10 나선구조, 평행구조 및 역평행구조)의 어디에도 해당하지 않는 단백질의 2차 구조는 비정형구조로 판별하게 된다.
한편, 나선구조는 가상중심 간의 거리가 일정한 범위 내에 속하는 단위체들의 경우에 대부분 1대1 대응으로 존재한다. 만약 1대2의 대응이 존재하더라도 나선구조를 이루기 위해서는 N+3 또는 N+4의 일정한 패턴을 이루어야 하므로 수소결합을 형성하는 단위체를 예측할 수 있다. 병풍구조의 경우, 도 11에서의 (h)와 같이 평행한 형태로 존재하기도 하지만, (g)와 같이 구부러진 형태도 존재한다. 구부러진 부분에서 병풍구조는 약간의 뒤틀림을 가지는데, 이로 인해 가상중심 간의 거리가 정해진 범위 내에 포함되지 않고, 1대2 또는 1대3의 대응이 되는 경우가 있다.
하나의 단위체는 다른 하나의 단위체와 수소결합을 형성하므로, 1대2 이상의 대응을 하는 경우에 1대1 대응이 되는 단위체 정보를 이용하여 1대2 대응인 단위체 중 하나를 선택한다. 예를 들어, 10번 단위체와 30번 단위체 간의 거리가 설정된 범위에 속하고, 11번 단위체와 30번, 31번 및 32번 단위체 간의 거리가 모두 설정된 범위에 속하는 경우에는 일대일 대응을 이루는 10번과 30번 단위체의 대응을 기준으로 하여 11번 단위체와 31번 단위체가 수소결합을 형성하는 것으로 결정할 수 있다.
본 발명에 따른 단백질 2차 구조 판별장치 및 DSSP를 사전에 제공된 183개의 단백질 데이터에 각각 적용하여 그 정확도를 비교한 결과를 다음의 표 3에 나타내었다.
DSSP 기준 본 발명의 정확도(%) 본 발명 기준 DSSP의 정확도(%)
나선구조 94.51 93.56
병풍구조 89.13 88.44
비정형구조 89.13 90.09
평균 90.91 90.91
표 3을 참조하면, 본 발명의 DSSP에 대한 정확도는 90.91%로 알파탄소의 좌표를 사용하는 종래의 방법들 중 최고 정확도가 83.2%인 것에 비해 향상된 성능을 보임을 확인할 수 있다.
도 19는 본 발명에 따른 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치에 대한 바람직한 실시예의 수행과정을 도시한 흐름도이다.
도 19를 참조하면, 가상중심 결정부(110)는 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치한다(S1910).
다음으로 나선구조 판별부(120)는 대상 단백질에 대해 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각에 의해 연속하는 가상중심에 대응하는 아미노산 서열이 나선구조를 형성하는지 여부를 판별한다(S1920) 이때 알파 나선구조 판별부(122)는 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 사전에 설정된 제1거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제1각도범위에 속하면 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 알파 나선구조인 것으로 판별한다(S1930).
또한 3/10 나선구조 판별부(124)는 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 세 번째 가상중심 간의 거리, 두 번째 가상중심과 네 번째 가상중심 간의 거리 및 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 각각 사전에 설정된 제2거리범위, 제3거리범위 및 제4거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제2거리범위에 속하면 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 3/10 나선구조인 것으로 판별한다(S1940).
다음으로 병풍구조 판별부(130)는 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 산출하여 병풍구조에 해당하는지 여부를 판별한다(S1950). 이를 위해 평행구조 판별부(132)는 진행방향이 동일한 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제5거리범위에 속하고, 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제6거리범위에 속하면 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 평행 병풍구조인 것으로 판별한다(S1960).
다음으로 역평행구조 판별부(134)는 추가적인 판별 조건으로서 서로 다른 가상중심 서열에 포함된 가상중심에 각각 대응하는 알파탄소 간의 거리를 산출하고(S1970), 진행방향이 반대인 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제7거리범위에 속하고, 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제8거리범위에 속하며, 서로 다른 가상중심 서열에 포함된 가상중심에 각각 대응하는 알파탄소 간의 거리가 사전에 설정된 제9거리범위에 속하면 상기 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 역평행 병풍구조인 것으로 판별한다(S1980).
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상에서 본 발명의 바람직한 실시예에 대해 도시하고 설명하였으나, 본 발명은 상술한 특정의 바람직한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능한 것은 물론이고, 그와 같은 변경은 청구범위 기재의 범위 내에 있게 된다.
110 - 가상중심 결정부
120 - 나선구조 판별부
122 - 알파 나선구조 판별부
124 - 3/10 나선구조 판별부
130 - 병풍구조 판별부
132 - 평행구조 판별부
134 - 역평행구조 판별부

Claims (13)

  1. 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 상기 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치하는 가상중심 결정부;
    상기 대상 단백질에 대하여 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각을 기초로 상기 연속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별하는 나선구조 판별부; 및
    상기 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 상기 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별하는 병풍구조 판별부;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  2. 제 1항에 있어서,
    상기 나선구조 판별부는,
    상기 가상중심들 중에서 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 사전에 설정된 제1거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제1각도범위에 속하면 상기 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 알파 나선구조인 것으로 판별하는 알파 나선구조 판별부; 및
    상기 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 세 번째 가상중심 간의 거리, 두 번째 가상중심과 네 번째 가상중심 간의 거리 및 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 각각 사전에 설정된 제2거리범위, 제3거리범위 및 제4거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제2거리범위에 속하면 상기 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 3/10 나선구조인 것으로 판별하는 3/10 나선구조 판별부;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  3. 제 2항에 있어서,
    상기 병풍구조 판별부는,
    진행방향이 동일한 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제5거리범위에 속하고, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제6거리범위에 속하면 상기 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 평행 병풍구조인 것으로 판별하는 평행구조 판별부; 및
    진행방향이 반대인 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제7거리범위에 속하고, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제8거리범위에 속하며, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 각각 대응하는 알파탄소 간의 거리가 사전에 설정된 제9거리범위에 속하면 상기 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 역평행 병풍구조인 것으로 판별하는 역평행구조 판별부;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서,
    상기 가상중심 결정부는 서로 인접한 두 개의 알파탄소 사이의 중심 지점에 상기 가상중심을 배치하는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  5. 제 2항 또는 제 3항에 있어서,
    상기 알파 나선구조 판별부는 상기 연속하는 네 개의 가상중심에 대응하는 아미노산 서열에 프롤린(proline)이 포함되어 있으면 해당 아미노산 서열에 대하여는 알파 나선구조에 해당하는지 여부를 판별하지 않는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  6. 제 3항에 있어서,
    상기 역평행구조 판별부는 연속하는 복수의 가상중심 서열에 대응하는 아미노산 서열이 모두 역평행 병풍구조인 것으로 판별되면 연속하여 역평행 병풍구조를 가지는 연속 아미노산 서열의 양단에 위치하는 가상중심 각각에 대하여 상기 양단에 위치하는 가상중심에 대해 상기 연속 아미노산 서열의 바깥쪽으로 인접한 가상중심이 수소결합을 형성하는지 여부에 따라 상기 역평행 병풍구조에 포함시킬 것인지 여부를 결정하는 것을 특징으로 하는 단백질 2차 구조 판별장치.
  7. 대상 단백질을 구성하는 아미노산 서열에 포함된 일련의 알파탄소의 좌표정보를 입력받아 각각의 알파탄소에 대응하는 가상중심을 상기 각각의 알파탄소와 인접한 알파탄소와의 사이에서 결정된 지점에 배치하는 가상중심 결정단계;
    상기 대상 단백질에 대하여 결정된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심 간의 거리 및 이면각을 기초로 상기 연속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 나선구조에 해당하는지 여부를 판별하는 나선구조 판별단계; 및
    상기 나선구조에 해당하지 않는 것으로 판별된 가상중심들 중에서 사전에 설정된 개수의 연속하는 가상중심으로 이루어진 복수의 가상중심 서열에 대하여 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리를 기초로 상기 각각의 가상중심 서열에 속하는 가상중심에 대응하는 복수의 아미노산이 형성하는 2차 구조가 병풍구조에 해당하는지 여부를 판별하는 병풍구조 판별단계;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  8. 제 7항에 있어서,
    상기 나선구조 판별단계는,
    상기 가상중심들 중에서 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 사전에 설정된 제1거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제1각도범위에 속하면 상기 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 알파 나선구조인 것으로 판별하는 알파 나선구조 판별단계; 및
    상기 연속하는 네 개의 가상중심에 대하여 첫 번째 가상중심과 세 번째 가상중심 간의 거리, 두 번째 가상중심과 네 번째 가상중심 간의 거리 및 첫 번째 가상중심과 네 번째 가상중심 간의 거리가 각각 사전에 설정된 제2거리범위, 제3거리범위 및 제4거리범위에 속하고, 네 개의 가상중심이 이루는 이면각이 사전에 설정된 제2거리범위에 속하면 상기 네 개의 가상중심에 대응하는 아미노산 서열이 형성하는 2차 구조가 3/10 나선구조인 것으로 판별하는 3/10 나선구조 판별단계;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  9. 제 8항에 있어서,
    상기 병풍구조 판별단계는,
    진행방향이 동일한 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제5거리범위에 속하고, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제6거리범위에 속하면 상기 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 평행 병풍구조인 것으로 판별하는 평행구조 판별단계; 및
    진행방향이 반대인 서로 다른 가상중심 서열에 포함된 가상중심 간의 거리가 사전에 설정된 제7거리범위에 속하고, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 대해 연속하는 가상중심 간의 거리가 사전에 설정된 제8거리범위에 속하며, 상기 서로 다른 가상중심 서열에 포함된 가상중심에 각각 대응하는 알파탄소 간의 거리가 사전에 설정된 제9거리범위에 속하면 상기 서로 다른 가상중심 서열에 대응하는 아미노산 서열이 형성하는 2차 구조가 역평행 병풍구조인 것으로 판별하는 역평행구조 판별단계;를 포함하는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  10. 제 7항 내지 제 9항 중 어느 한 항에 있어서,
    상기 가상중심 결정단계에서, 서로 인접한 두 개의 알파탄소 사이의 중심 지점에 상기 가상중심을 배치하는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  11. 제 8항 또는 제 9항에 있어서,
    상기 알파 나선구조 판별단계에서, 상기 연속하는 네 개의 가상중심에 대응하는 아미노산 서열에 프롤린(proline)이 포함되어 있으면 해당 아미노산 서열에 대하여는 알파 나선구조에 해당하는지 여부를 판별하지 않는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  12. 제 9항에 있어서,
    상기 역평행구조 판별단계에서, 연속하는 복수의 가상중심 서열에 대응하는 아미노산 서열이 모두 역평행 병풍구조인 것으로 판별되면 연속하여 역평행 병풍구조를 가지는 연속 아미노산 서열의 양단에 위치하는 가상중심 각각에 대하여 상기 양단에 위치하는 가상중심에 대해 상기 연속 아미노산 서열의 바깥쪽으로 인접한 가상중심이 수소결합을 형성하는지 여부에 따라 상기 역평행 병풍구조에 포함시킬 것인지 여부를 결정하는 것을 특징으로 하는 단백질 2차 구조 판별방법.
  13. 제 7항 내지 제 9항 중 어느 한 항에 기재된 단백질 2차 구조 판별방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020100031907A 2010-04-07 2010-04-07 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법 KR101091785B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020100031907A KR101091785B1 (ko) 2010-04-07 2010-04-07 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법
PCT/KR2010/006033 WO2011126183A1 (ko) 2010-04-07 2010-09-06 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법
US13/635,401 US20130018594A1 (en) 2010-04-07 2010-09-06 Apparatus and method for identifying secondary structure of protein using alpha carbon coordinates

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100031907A KR101091785B1 (ko) 2010-04-07 2010-04-07 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110112664A KR20110112664A (ko) 2011-10-13
KR101091785B1 true KR101091785B1 (ko) 2011-12-08

Family

ID=44763102

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100031907A KR101091785B1 (ko) 2010-04-07 2010-04-07 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법

Country Status (3)

Country Link
US (1) US20130018594A1 (ko)
KR (1) KR101091785B1 (ko)
WO (1) WO2011126183A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729577B (zh) * 2013-12-12 2017-08-22 深圳先进技术研究院 基于混合并行方式的蛋白质热力学分析高效随机模拟方法
US20210304847A1 (en) * 2018-09-21 2021-09-30 Deepmind Technologies Limited Machine learning for determining protein structures
CN111445768B (zh) * 2020-03-16 2021-12-14 哈尔滨医科大学 一种模块化组装肽链空间结构模型

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490532B1 (en) 1999-01-25 2002-12-03 Mount Sinai Hospital Method to construct protein structures
US20040083061A1 (en) 2001-09-28 2004-04-29 Hannah Eric C. Fast secondary structure discovery method for protein folding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002354462A1 (en) * 2001-12-10 2003-07-09 Fujitsu Limited Apparatus for predicting stereostructure of protein and prediction method
US7672791B2 (en) * 2003-06-13 2010-03-02 International Business Machines Corporation Method of performing three-dimensional molecular superposition and similarity searches in databases of flexible molecules

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490532B1 (en) 1999-01-25 2002-12-03 Mount Sinai Hospital Method to construct protein structures
US20040083061A1 (en) 2001-09-28 2004-04-29 Hannah Eric C. Fast secondary structure discovery method for protein folding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
International Journal of Quantum Chemistry, Vol. 108, pp.2782-2792 (2008.07.11.)

Also Published As

Publication number Publication date
KR20110112664A (ko) 2011-10-13
US20130018594A1 (en) 2013-01-17
WO2011126183A1 (ko) 2011-10-13

Similar Documents

Publication Publication Date Title
CN109994038B (zh) 不规则区域内兴趣点确定方法、装置、电子设备
EP1678659B1 (en) Method and image processing device for analyzing an object contour image, method and image processing device for detecting an object, industrial vision apparatus, smart camera, image display, security system, and computer program product
US20180181887A1 (en) Library book reservation method based on ultrahigh-frequency rfid technology
CN106951736B (zh) 一种基于多重进化矩阵的蛋白质二级结构预测方法
CN108921166A (zh) 基于深度神经网络的医疗票据类文本检测识别方法及系统
US8189924B2 (en) Phishing abuse recognition in web pages
KR101091785B1 (ko) 알파탄소의 좌표정보를 이용한 단백질 2차 구조 판별장치 및 방법
CN105320979B (zh) 高容量二维彩色条形码和用于解码其的方法
Buchin et al. Evolution strategies for optimizing rectangular cartograms
EP2715278B1 (en) 3d scanner using structured lighting
CN102136133B (zh) 一种图像处理方法及图像处理装置
CN107180425A (zh) 轨道扣件自动识别方法和装置
JP2005529382A (ja) 共通する蛋白質の表面形状およびその使用
CN107423738A (zh) 一种基于模板匹配的试卷题目定位方法及装置
CN112627538B (zh) 基于计算机视觉的钢筋网扎丝绑扎质量智能验收方法
CN105740818A (zh) 一种应用于增强现实的人工标志检测方法
JP3585440B2 (ja) レーン追跡システムおよび方法
Wenyin et al. Extended summary of the arc segmentation contest
CN112102316A (zh) 产品缺陷位置分布获取方法和装置
CN115727836B (zh) 一种基于激光反光板和里程计的融合定位方法及系统
La Boissonière et al. Atom based grain extraction and measurement of geometric properties
CN111613045A (zh) 道路通行情况的验证方法及装置
CN109782216A (zh) 一种二维空间谱峰值搜索的简易方法
CN106778061B (zh) 一种基于周期三临近特征的外显子预测方法
CN106557796B (zh) 条形码的校验位的确定方法及装置、条形码读取方法及装置、图像处理装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140930

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee