KR100757040B1 - System and method for analysis of interfaces based on protein domain and recording medium therefor - Google Patents

System and method for analysis of interfaces based on protein domain and recording medium therefor Download PDF

Info

Publication number
KR100757040B1
KR100757040B1 KR20050121684A KR20050121684A KR100757040B1 KR 100757040 B1 KR100757040 B1 KR 100757040B1 KR 20050121684 A KR20050121684 A KR 20050121684A KR 20050121684 A KR20050121684 A KR 20050121684A KR 100757040 B1 KR100757040 B1 KR 100757040B1
Authority
KR
South Korea
Prior art keywords
protein
atom
atoms
information
domain
Prior art date
Application number
KR20050121684A
Other languages
Korean (ko)
Other versions
KR20070062025A (en
Inventor
박종화
공성삼
최한솔
박창범
박대의
오동훈
Original Assignee
오브젝트인터랙션테크놀로지스(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오브젝트인터랙션테크놀로지스(주) filed Critical 오브젝트인터랙션테크놀로지스(주)
Priority to KR20050121684A priority Critical patent/KR100757040B1/en
Publication of KR20070062025A publication Critical patent/KR20070062025A/en
Application granted granted Critical
Publication of KR100757040B1 publication Critical patent/KR100757040B1/en

Links

Images

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Data Mining & Analysis (AREA)

Abstract

본 발명은 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템 및 방법과 이를 위한 기록매체에 관한 것으로, 상호작용면 분석 시스템은 각 분석 대상물의 서열정보, 화학식, 3차원 정보를 각각 저장하고 있는 데이터베이스, 상호작용면 분석 대상물의 명칭이 입력 또는 선택됨에 따라 상기 데이터베이스를 참조하여 해당 분석 대상물을 3차원으로 나타내고, 분석 대상물 간의 상호작용면을 예측하기 위한 상호작용면 추출 장치 및 상호작용면을 시각적으로 출력하기 위한 상호작용면 시각화 장치를 포함하고, 상호작용면 분석 방법은 분석 대상물 명칭을 입력 또는 선택함에 따라, 각 분석 대상물의 3차원 정보를 저장하고 있는 데이터베이스로부터 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하여 리스트를 생성하는 단계, 각 원자 및 원자쌍을 3차원으로 변형하는 단계, 3차원으로 도식화된 원자 및 원자쌍을 이용하여 분석 대상물 각각을 3차원 형태로 출력하는 단계 및 3차원 처리된 분석 대상물 간의 상호작용면을 예측하여 시각적으로 출력하는 단계를 포함하여, 단백질 도메인 간 또는 단백질 도메인과 화합물간의 상호작용면을 높은 해상도로 신속하고 정확하게 추출할 수 있다.The present invention relates to an interaction surface analysis system and method between proteins or proteins and compounds based on a protein domain, and a recording medium therefor. The interaction surface analysis system includes sequence information, chemical formula, and three-dimensional information of each analyte. And an interactive surface extraction apparatus for predicting the interactive surface between the analysis objects in three dimensions by referring to the database as the names of the interaction surface analysis objects are input or selected. An interactive surface visualization device for visually outputting the interactive surface, and the interactive surface analysis method includes inputting or selecting an analyte name, and from the database storing three-dimensional information of each analyte to the analysis object. Extract the contained atom and atom pair information to Generating, transforming each atom and pair of atoms in three dimensions, outputting each of the analytes in three-dimensional form using atoms and atom pairs depicted in three dimensions, and interacting between the three-dimensional processed analytes Predicting and visually outputting the planes allows fast and accurate extraction of the planes of interaction between protein domains or between protein domains and compounds.

도메인, 단백질, 화합물, 상호작용면 Domains, proteins, compounds, interactions

Description

단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템 및 방법과 이를 위한 기록매체{System and Method for Analysis of Interfaces Based on Protein Domain and Recording Medium Therefor}System and Method for Analysis of Interfaces Based on Protein Domain and Recording Medium Therefor}

도 1은 본 발명의 일 실시예에 의한 상호작용면 분석 시스템의 구성도,1 is a block diagram of an interactive surface analysis system according to an embodiment of the present invention,

도 2는 본 발명에 의한 상호작용면 분석 방법을 설명하기 위한 흐름도,2 is a flowchart illustrating a method for analyzing an interaction surface according to the present invention;

도 3은 본 발명의 다른 실시예에 의한 상호작용면 분석 시스템의 구성도,3 is a block diagram of an interactive surface analysis system according to another embodiment of the present invention;

도 4는 본 발명의 분석방법에 따라 두 개의 도메인으로부터 추출된 상호작용면을 가시화한 것이다.4 is a visualization of the interaction surface extracted from the two domains according to the analysis method of the present invention.

도 5는 본 발명의 분석방법을 이용하여 다양한 분석 대상물로부터 다양한 상호작용면을 추출 및 가시화한 것이다.FIG. 5 illustrates the extraction and visualization of various interaction surfaces from various analytes using the analysis method of the present invention.

<도면의 주요 부분에 대한 부호 설명><Description of the symbols for the main parts of the drawings>

100 : 상호작용면 분석 시스템 110 : 제어부100: interactive surface analysis system 110: control unit

120 : 데이터베이스 122 : 단백질 데이터베이스120: Database 122: Protein Database

124 : 도메인 데이터베이스 126 : 화합물 데이터베이스124: Domain Database 126: Compound Database

130 : I/O 인터페이스 140 : 상호작용면 시각화 장치130: I / O interface 140: interactive surface visualization device

142 : 입체정보 추출부 144 : 3차원 처리부142: stereoscopic information extraction unit 144: three-dimensional processing unit

146 : 효과 처리부 150 : 상호작용면 추출 장치146: effect processor 150: interactive surface extraction device

160 : 저장수단 170 : 통신망 인터페이스160: storage means 170: communication network interface

200 : 개인용 컴퓨터 300 : 정보제공 서버200: personal computer 300: information providing server

310 : 제어부 320 : 통신망 인터페이스310: control unit 320: communication network interface

330 : 데이터베이스330: Database

본 발명은 단백질 상호작용면 분석 시스템 및 방법과 이를 위한 기록매체에 관한 것으로 보다 자세하게는 화합물을 포함하는 도메인을 기반으로 한 단백질 상호작용면 분석 시스템 및 방법과 이를 위한 기록매체에 관한 것이다.The present invention relates to a protein interaction surface analysis system and method and a recording medium therefor, and more particularly, to a protein interaction surface analysis system and method based on a domain including a compound and a recording medium for the same.

자연적 또는 인공적으로 생성된 모든 단백질은 생체 내에서 구조 형성, 반응 촉매, 운반, 조절, 방어를 비롯한 중요한 역할을 담당하는 분자이다. 대부분의 단백질들은 다른 분자 특히, 다른 단백질과의 상호작용을 통하여 기능을 발휘한다. 실제로 단백질간의 상호작용은 엄격하게 제어되고 진화 과정 중에 상당히 보존되어 왔다(Bolser, D.M. et al. Genomics and Informatics, 2003, vol.1, pp. 1-7). 무작위적 돌연변이로부터 유발된 불필요하거나 불충분한 상호작용은 분자의 기능 상실을 초래한다. 따라서 상호작용 파트너 특히, 단백질 도메인과 리간드들의 상호작용 영역 혹은 구역은 단백질 상호작용 네트워크의 진화 과정을 통하여 자연적으 로 선택되고 상당히 제어되어 왔다(Caffrey et al. 2004, Protein Science, vol.13, pp.190-202).All proteins, naturally or artificially produced, are molecules that play an important role in vivo, including structure formation, reaction catalysis, transport, regulation, and defense. Most proteins function through interactions with other molecules, especially other proteins. Indeed, protein-to-protein interactions are tightly controlled and have been significantly conserved during evolution (Bolser, D.M. et al. Genomics and Informatics, 2003, vol. 1, pp. 1-7). Unnecessary or insufficient interactions resulting from random mutations result in loss of function of the molecule. Thus, interaction domains or regions of interaction partners, particularly protein domains and ligands, have been naturally selected and significantly controlled throughout the evolution of protein interaction networks (Caffrey et al. 2004, Protein Science, vol. 13, pp 190-202).

1970년부터 단백질간 인식의 원리를 확인하고자 하는 노력이 계속되어져 왔다. Chothia 및 Janin은 인식 과정과 관련된 단백질의 상호작용 위치의 물리적 및 화학적 성질을 연구하였다(Chothia, C. et al, 1975, Nature, vol.256, pp. 705-70). Lawrence 및 Colman은 모양 상관 인덱스(shape correlation index)를 이용하여 상호작용면의 모양 상보성에 초점을 두었다(Lawrence, M.C. et al. 1993, J.Mol.Biol. vol.234, pp.946-950). Argos는 단백질 서브유니트 및 단백질 도메인 간의 상호작용면을 연구함에 있어서, 단백질 상호작용면의 물리 화학적 성질뿐만 아니라 단백질 상호작용면의 기하학적 특징을 연구하였다(Argos, P. 1988, Protein Engineering, vol.2, pp.101-113). Jones and Thornton은 단백질간의 상호작용에 관여하는 파라미터를 동정하기 위하여 표면 패치 방법(surface patch method)을 도입하였다(Jones, S. et al. 1997, Proc.Natl.Acad.Sci. vol.93, pp.13-2).Since 1970, efforts have been made to confirm the principle of interprotein recognition. Chothia and Janin studied the physical and chemical properties of the interaction sites of proteins involved in the recognition process (Chothia, C. et al, 1975, Nature, vol. 256, pp. 705-70). Lawrence and Colman focused on the shape complementarity of the interaction plane using the shape correlation index (Lawrence, MC et al. 1993, J. Mol. Biol. Vol. 234, pp. 946-950). . In studying the interaction planes between protein subunits and protein domains, Argos studied not only the physicochemical properties of the protein interaction planes, but also the geometrical features of the protein interaction planes (Argos, P. 1988, Protein Engineering, vol. 2). , pp. 101-113). Jones and Thornton introduced a surface patch method to identify the parameters involved in protein interactions (Jones, S. et al. 1997, Proc. Natl. Acad. Sci. Vol. 93, pp. 13-2).

현재 완전한 게놈 서열이 이용 가능함에 따라 모든 단백질 도메인의 상호작용을 지도화(map)하는 단백질 구조의 상호작용체학(interactomics)이 중요해지고 있다(Kim, W.K. et al, 2004, Bioinformatics, vol.20, pp.1138-1150). 최근에 효모 이종 하이브리드(Yeast two hybrid)와 같은 실험 데이터의 증가로 인하여 사람의 전체 단백체 상호작용체(interactome)가 지도화 되었다(Kim, H.G. et al. 2003, Lecture Notes in Computer Science, vol.2637, pp.159-165). 이제는 더 높은 해상도의 모든 분자를 포함한 상호작용면 연구가 대규모의 단백질 상호작용 연구에 선행하여 이루어져야 한다.As complete genomic sequences are available, interactomics of protein structures that map the interactions of all protein domains are becoming important (Kim, WK et al, 2004, Bioinformatics, vol. 20, pp. 1138-1150). Recently, the increase in experimental data, such as the yeast two hybrid, has led to the mapping of human whole protein interactants (Kim, HG et al. 2003, Lecture Notes in Computer Science, vol. 2637). , pp.159-165). Interfacial studies involving all molecules of higher resolution should now be preceded by large-scale protein interaction studies.

이를 위한 대한민국특허공개 제2004-0026227호는 대규모의 유전체와 단백체수준의 단백질 상호작용 데이터를 시각화한 3차원 그래프를 생성하는 기법에 관한 것으로 보다 자세하게는 단백질 상호작용 데이터의 모든 노드들을 극좌표의 수평 및 수직 각도 모두를 증가시킴으로써 구체(sphere) 표면에 배치하여 초기 레이아웃을 생성하는 제 1 단계와 초기 레이아웃의 각 노드를 인접 노드들과의 로컬 스프링 포스(local spring force)와 비인접 노드들과의 글로벌 스프링 포스(global spring force) 둘 다를 고려하여 평형위치(equilibrium position)로 이동시키는 과정을 미리 정해진 횟수만큼 반복하여 그래프를 생성하는 제 2단계를 포함하는 것을 특징으로 하는 대규모 단백질 상호작용 데이터의 효율적 시각화 기법을 제시하고 있다.Korean Patent Laid-Open Publication No. 2004-0026227 relates to a technique for generating a three-dimensional graph that visualizes large-scale genome and protein-level protein interaction data. The first step of creating an initial layout by placing all of the vertical angles on the sphere surface to create an initial layout, with each node in the initial layout having a local spring force with adjacent nodes and a global with non-adjacent nodes. Efficient visualization of large-scale protein interaction data comprising a second step of generating a graph by repeating a predetermined number of times of shifting the equilibrium position in consideration of both the spring forces The technique is presented.

그러나 상기 가시화 방법은 단백질의 상호작용면을 3차원으로 시각화할 수 있지만 입체적으로 생성하지 못할 뿐만 아니라 현재까지 공지된 단백질의 개수가 약 2백 3십만개에 이르기 때문에 단백질별로 상호작용면을 추출하기 위해서는 방대한 작업이 요구된다는 단점이 있다.However, the visualization method can visualize the interaction surface of the protein in three dimensions, but it is not possible to generate three-dimensionally, and since the number of proteins known to date is about 2.3 million, it is possible to extract the interaction surface for each protein. This requires a lot of work.

본 발명자들은 단백질, 단백질 도메인, 화합물 그리고 이들의 상호작용면을 높은 해상도로 시각화할 수 있는 시스템을 개발하였다. 또한, 단백질의 기능은 실질적으로 도메인 단위에서 유래된다는 사실과 현재까지 공지된 약 6만 5천여개의 도메인을 기반으로 하여 모든 가능한 상호작용면을 추출하고, 상기 추출된 상호작 용면이 저장된 데이터베이스를 이용하면 궁극적으로 단백질체에 포함된 수많은 단백질의 또 다른 단백질 또는 화합물과의 상호작용면들을 컴퓨터 시스템을 통해서 신속하게 예측할 수 있다는 점에 착안하여 본 발명을 완성하기에 이르렀다.The inventors have developed a system that can visualize proteins, protein domains, compounds and their interactions at high resolution. In addition, based on the fact that the function of the protein is substantially derived from the domain unit and about 65,000 domains known to date, all possible interaction surfaces are extracted and a database storing the extracted interaction surfaces is used. Ultimately, the present invention has been completed in light of the fact that a computer system can rapidly predict the interaction surface of a large number of proteins contained in a protein body with another protein or compound.

본 발명에서 "분석 대상물"은 단백질, 단백질 도메인, 화합물일 수 있다. 분석 대상물이 단백질인 경우에는 도메인으로 분류한 후 이 도메인과 다른 분석 대상물간의 상호작용면을 분석하는 것이 바람직하다. 분석 대상물이 모두 단백질인 경우에는 단백질간의 상호작용면을, 한 분석 대상물은 단백질이고 다른 분석 대상물은 화합물인 경우에는 단백질과 화합물간의 상호작용면을 분석할 수 있다.In the present invention, an "analyte" may be a protein, a protein domain, or a compound. If the analyte is a protein, it is preferable to classify it into domains and then analyze the interaction between the domain and other analytes. If all of the analytes are proteins, the interaction between proteins can be analyzed. If one is an protein and the other is a compound, the interaction between the protein and the compound can be analyzed.

본 발명에서 "단백질"은 당 업계에 알려진 약 2백 3십만개의 단백질 뿐만 아니라 이들과 구조적 기능적으로 유사한 상동체를 포함한다.In the present invention, "protein" includes about 2.3 million proteins known in the art, as well as structurally and functionally similar homologs to them.

본 발명에서 "도메인"은 단백질의 기능 및 구조 유니트(unit)를 의미하는 것으로 당업계에서 단백질의 도메인은 SCOP (Structural Classification of Protein), FSSH (Holm L. et al. Science, 1996, vol.273, pp.595-602) 또는 CATH (Orengo, C.A. et al. Structure 5, pp.1093-1108)와 같은 단백질 도메인 분류 시스템에 의해 분류되고 데이터베이스화되어 있다. 본 발명에서는 SCOP에 따른 데이터베이스의 도메인을 이용하는 것이 바람직하다.In the present invention, "domain" refers to a functional and structural unit of a protein. In the art, domains of a protein include SCOP (Structural Classification of Protein) and FSSH (Holm L. et al. Science, 1996, vol. 273). , pp. 595-602) or CATH (Orengo, CA et al. Structure 5, pp. 1093-1108). In the present invention, it is preferable to use the domain of the database according to the SCOP.

본 발명에서는 두 개 이상의 상이한 분석 대상물간의 상호작용면을 예측한다. 여기서 "상호작용면"은 후술하는 알고리즘에 의해 정의되는 것으로, 제 1 분 석 대상물을 구성하는 원자와 제 2 분석 대상물을 구성하는 원자들 중 접촉하는 원자들의 그룹을 의미한다. 본 발명에서는 제 1 분석 대상물과 제 2 분석 대상물로부터 상호작용면을 추출하기 위하여 유클리디안 거리 방법(Euclidean distance Method), 기하학적 다이어그램(예: Voronoi Diagram) 또는 접근가면 알고리즘(Accessible Surface Area)을 이용할 수 있다. 특히, 유클리디안 거리 방법은 본 발명자들에 의해 제시된 PSIMAP (Jong Park et al. JMB, 2001, vol.307, pp.929-938) 방법에 기반하고 있다. 이하에서, 상기 알고리즘들을 상세히 설명한다.The present invention predicts the plane of interaction between two or more different analytes. Here, the "interaction surface" is defined by an algorithm described below and means a group of atoms in contact among atoms constituting the first analysis object and atoms constituting the second analysis object. In the present invention, an Euclidean distance method, a geometric diagram (eg, Voronoi Diagram), or an accessible surface area algorithm is used to extract the interaction surface from the first and second analytes. Can be. In particular, the Euclidean distance method is based on the PSIMAP (Jong Park et al. JMB, 2001, vol. 307, pp. 929-938) method presented by the present inventors. In the following, the algorithms are described in detail.

(i) 유클리디안 거리 방법: 제 1 분석 대상물을 구성하는 각 원자별로 제 2 분석 대상물을 구성하는 원자와의 거리에 따른 상호작용 여부를 확인하여 상호작용하는 원자를 선별하는 방법으로 이렇게 선별된 원자들이 수집되면 상호작용면을 형성하게 된다.(i) Euclidean distance method: Each atom constituting the first analyte is selected in this manner by checking whether or not interacting according to the distance with the atoms constituting the second analyte. When atoms are collected, they form an interaction surface.

(ii) 기하학적 다이어그램: 제 1 분석 대상물을 구성하는 각 원자별로 제 2 분석 대상물을 구성하는 각 원자와의 원자간 거리의 절반에 해당하는 지점을 연결한 것으로 상기 지점을 연결함으로써 제 1 분석 대상물과 제 2 분석 대상물간의 상호작용면을 형성할 수 있다.(ii) geometric diagram: a point corresponding to half of the distance between atoms of each atom constituting the second analyte for each atom constituting the first analyte, which is connected to the first analyte by connecting the points; Interaction planes between the second analytes can be formed.

(iii) 접근가면 알고리즘: 제 1 분석 대상물과 제 2 분석 대상물이 분리된 상태일 때 물 분자와 접촉하는 원자를 각각 선별한 후 이들이 결합된 상태일 때 물 분자와 접촉하는 원자를 선별한다. 전자에서 선별되었으나 후자에서 선별되지 않은 원자들의 군이 제 1 분석 대상물과 제 2 분석 대상물간의 상호작용면을 이루게 된다.(iii) Approach mask algorithm: Atoms are selected for contacting the water molecules when the first analyte and the second analyte are separated, and then atoms that contact the water molecules when they are bound. A group of atoms selected from the former but not from the latter forms the interaction plane between the first analyte and the second analyte.

본 발명은 두 개 이상의 분석 대상물의 상호작용면을 아래에서 설명되는 분석 시스템 및 방법과 이를 위한 기록매체를 이용하여 가시화할 수 있다.The present invention can visualize the interaction plane of two or more analytes using an analysis system and method described below and a recording medium therefor.

본 발명은 한 관점으로 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템으로서, 제어부; 각 단백질, 도메인 및 화합물의 3차원 정보, 서열정보 및 화학식 정보를 저장하고 있는 데이터베이스; I/O 인터페이스; 상호작용면을 분석하고자 하는 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 상기 I/O 인터페이스를 통해 입력 또는 선택됨에 따라 상기 데이터베이스를 참조하여 해당 분석 대상물을 3차원으로 나타내고, 예측된 분석 대상물 간의 상호작용면을 시각화 처리하여 상기 I/O 인터페이스를 통해 시각적으로 출력하기 위한 상호작용면 시각화 장치; 상기 분석 대상물 간의 상호작용면을 예측하기 위한 상호작용면 추출 장치; 및 저장 수단을 포함하여 구성되는 도메인을 기반으로 한 상호 작용면 분석 시스템을 제공한다.In one aspect, the present invention provides a system for analyzing an interaction surface between proteins or proteins and compounds based on a protein domain, comprising: a control unit; A database storing three-dimensional information, sequence information, and chemical formula information of each protein, domain, and compound; I / O interface; The name of at least two or more analytes (protein name, domain name, compound and protein name or compound and domain name) for which the interaction surface is to be analyzed is referred to the database as input or selected through the I / O interface. An interactive surface visualization device for displaying the analysis object in three dimensions and visualizing the interaction surface between the predicted analysis objects and visually outputting them through the I / O interface; An interaction surface extraction device for predicting an interaction surface between the analysis targets; And an interaction surface analysis system based on domains configured to include storage means.

다른 관점으로 상호작용면을 분석하기 위한 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 입력 또는 선택됨에 따라, 각 분석 대상물별 3차원 정보를 저장하고 있는 데이터베이스로부터 상기 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하고, 상기 추출된 원자 및 원자쌍 정보를 이용하여 원자 및 원자쌍의 리스트를 생성하는 단계; 상기 원자 및 원자쌍 정보를 참조하여 각 원자 및 원자쌍을 3차원으로 변형하는 단 계; 상기 3차원으로 도식화된 원자 및 원자쌍을 상기 분석 대상물의 3차원 정보에 따라 각각 배열하여, 상기 분석 대상물 각각을 3차원 형태로 출력하는 단계; 상기 3차원 처리된 분석 대상물에 대한 상호작용면을 예측하는 단계; 상기 예측된 상호작용면을 구성하는 원자들을 각각 매칭(matching)하고 도킹(docking)하는 단계; 및 상기 예측된 상호작용면을 출력장치를 통해 시각적으로 출력하는 단계를 포함하는 도메인을 기반으로 한 상호작용면 분석 방법을 제공한다.In other respects, three-dimensional information for each analyte may be obtained as input or selection of at least two analytes (protein names, domain names, compound and protein names, or compound and domain names) for analyzing the interaction surface. Extracting atom and atom pair information included in the analyte from a database stored therein, and generating a list of atoms and atom pairs using the extracted atom and atom pair information; Modifying each atom and atom pair in three dimensions by referring to the atom and atom pair information; Arranging the atoms and atom pairs depicted in three dimensions according to three-dimensional information of the analyte, and outputting each of the analytes in a three-dimensional form; Predicting an interaction surface for the three-dimensionally processed analyte; Matching and docking respective atoms constituting the predicted interaction surface; And it provides a domain-based interaction surface analysis method comprising the step of visually outputting the predicted interaction surface through the output device.

또 다른 관점으로, 상호작용면을 분석하기 위한 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 입력 또는 선택됨에 따라, 각 분석 대상물별 3차원 정보를 저장하고 있는 데이터베이스로부터 상기 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하고, 상기 추출된 원자 및 원자쌍 정보를 이용하여 원자 및 원자쌍의 리스트를 생성하는 기능; 상기 원자 및 원자쌍 정보를 참조하여 각 원자 및 원자쌍을 3차원으로 변형하는 기능; 상기 3차원으로 도식화된 원자 및 원자쌍을 상기 분석 대상물의 3차원 정보에 따라 각각 배열하여, 상기 분석 대상물 각각을 3차원 형태로 출력하는 기능; 상기 3차원 처리된 분석 대상물에 대한 상호작용면을 예측하는 기능; 상기 예측된 상호작용면을 구성하는 원자들을 각각 매칭(matching)하고 도킹(docking)하는 기능; 상기 예측된 상호작용면을 출력장치를 통해 시각적으로 출력하는 기능; 및 상기 3차원 처리된 분석 대상물에 포함된 원자 또는 원자쌍의 시각적 효과를 변경하는 기능을 순차적으로 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In another aspect, the three-dimensional dimension of each analyte, as input or selection of at least two analytes (protein names, domain names, compound and protein names, or compound and domain names) for analyzing the interaction surface. Extracting atom and atom pair information included in the analyte from a database storing information, and generating a list of atoms and atom pairs using the extracted atom and atom pair information; A function of modifying each atom and atom pair in three dimensions by referring to the atom and atom pair information; Arranging the atoms and atom pairs illustrated in the three-dimensional form according to three-dimensional information of the analyte, and outputting each of the analyte in three-dimensional form; Predicting an interactive surface for the three-dimensionally processed analyte; Matching and docking respective atoms constituting the predicted interaction surface; A function of visually outputting the predicted interactive surface through an output device; And a computer readable recording medium having recorded thereon a program for sequentially executing a function of changing a visual effect of an atom or an atomic pair included in the three-dimensional processed object.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 의한 상호작용면 분석 시스템의 구성도이다.1 is a block diagram of an interactive surface analysis system according to an embodiment of the present invention.

도시한 것과 같이, 도메인을 기반으로 한 상호작용면 분석 시스템(100)은 데이터 신호 및 제어 신호 송수신 등 전체적인 동작을 제어하는 제어부(110), 각 단백질, 도메인 및 화합물의 서열정보, 도메인별 3차원 정보, 서열정보 등을 저장하고 있는 데이터베이스(120), 모니터, 키보드, 마우스 등과 같은 입출력 장치(도시하지 않음)와 상호작용 분석 시스템(100) 간의 접속을 위한 I/O 인터페이스(130), 적어도 두 개의 상호작용면 분석 대상물의 명칭이 I/O 인터페이스(130)를 통해 입력 또는 선택됨에 따라 데이터베이스(120)를 참조하여 해당 분석 대상물을 3차원으로 나타내고, 예측된 분석 대상물 간의 상호작용면을 시각화 처리하여 I/O 인터페이스(130)를 통해 시각적으로 출력하기 위한 상호작용면 시각화 장치(140), 분석 대상물 간의 상호작용면을 예측하기 위한 상호작용면 추출 장치(150) 및 상호작용면 분석 시스템(100)의 동작에 필요한 정보, 추출된 분석 대상물 간 상호작용면 정보 등을 저장하기 위한 저장 수단(160)을 포함하여 구성된다.As shown, the domain-based interaction surface analysis system 100 is a control unit 110 that controls the overall operation, such as data signal and control signal transmission and reception, sequence information of each protein, domain and compound, domain 3D At least two I / O interfaces 130 for connection between an interactive analysis system 100 and an input / output device (not shown) such as a database 120 storing information, sequence information, monitors, keyboards, mice, and the like. As the names of the two interactive surfaces analyzed are input or selected through the I / O interface 130, the database 120 is referred to in three dimensions to visualize the interactive surfaces between the predicted analysis objects. Interactive surface visualization device 140 for visually output through the I / O interface 130, for predicting the interaction surface between the analysis object It is configured to include a storage means 160 for storing the interaction surface extraction unit 150 and the interaction surface analysis information required for the operation of the system 100, between the extracted analyte interaction surface information.

여기에서, 상호작용면 분석 대상물의 명칭은 사용자가 직접 입력하거나, 데이터베이스(120)에 저장되어 있는 단백질명, 도메인명 또는 화합물명과 같은 분석 대상물 리스트로부터 선택하거나, 또는 분석 대상물 중 일부의 명칭은 직접 입력하고 나머지 일부는 분석 대상물명 리스트로부터 선택할 수 있다. 이를 위하여, 본 발명에 적용되는 데이터베이스(120)는 각 단백질별로 단백질의 서열정보, 3차원 정보 등이 저장되는 단백질 DB(122), 각 도메인별로 서열정보, 3차원 정보 등이 저장되는 도메인 DB(124) 및 각 화합물별로 화학식 및 3차원 정보 등이 저장되는 화합물 DB(126)를 포함하도록 구현한다.Here, the name of the interactive surface analyte may be directly input by the user, or may be selected from a list of analytes such as a protein name, a domain name, or a compound name stored in the database 120, or the names of some of the analytes may be directly You can enter and select the rest of the list from the list of analysis names. To this end, the database 120 applied to the present invention is a protein DB 122 for storing protein sequence information, three-dimensional information, etc. for each protein, a domain DB for storing sequence information, three-dimensional information, etc. for each domain ( 124) and the compound DB 126 in which chemical formulas and three-dimensional information are stored for each compound.

보다 구체적으로 설명하면, 각각의 데이터베이스(122, 124, 126)에는 각 단백질, 도메인 및 화합물의 3차원 정보, 각 단백질, 도메인 및 화합물에 포함된 원자(atom) 및 원자쌍(atom pair)의 종류, 각 단백질, 도메인 및 화합물에서 원자의 상대적 3차원 좌표와 지름, 각 단백질, 도메인 및 화합물에서 원자쌍을 이루는 원자간의 거리, 결합 종류(공유결합, 수소결합, 반데르발스 결합, 디설파이드 결합) 등이 저장된다.More specifically, each database 122, 124, and 126 includes three-dimensional information of each protein, domain, and compound, and types of atoms and atom pairs included in each protein, domain, and compound. , The relative three-dimensional coordinates and diameters of atoms in each protein, domain, and compound, the distance between atoms in an atom-pair in each protein, domain, and compound, the type of bond (covalent, hydrogen, van der Waals, disulfide) Is stored.

또한, 상호작용면 시각화 장치(140)는 입체 정보 추출부(142) 및 3차원 처리부(144)를 포함하여 이루어진다. 입체 정보 추출부(142)는 I/O 인터페이스(130)를 통해 분석하고자 하는 적어도 두 개 이상의 단백질명, 도메인명, 단백질명과 화합물명 또는 도메인명과 화합물명과 같은 분석 대상물의 명칭이 입력 또는 선택되면, 제어부(110)의 제어에 의해 데이터베이스(120)를 조회하여 해당 분석 대상물 각각을 구성하고 있는 원자 및 원자쌍의 정보를 추출한다. 원자 및 원자쌍의 정보는 해당 분석 대상물 각각에서 각 원자의 상대 좌표와 지름, 결합관계에 있는 두 원자쌍의 결합 정보와 두 원자간의 거리 등을 포함한다.In addition, the interactive surface visualization apparatus 140 includes a stereoscopic information extraction unit 142 and a three-dimensional processing unit 144. When the stereoscopic information extracting unit 142 inputs or selects at least two or more protein names, domain names, protein names and compound names or domain names and compound names to be analyzed through the I / O interface 130, The database 120 is queried by the control of the controller 110 to extract information on atoms and pairs of atoms constituting the respective analytes. The atomic and atomic pair information includes the relative coordinates and diameters of each atom in each of the analytes of interest, the coupling information of the two atomic pairs in the bonding relationship, and the distance between the two atoms.

입체 정보 추출부(142)에서 해당 분석 대상물 각각에 대한 원자 및 원자쌍 정보가 추출되면, 3차원 처리부(144)는 원자 및 원자쌍 정보를 이용하여 각 원자와 원자쌍을 3차원 형태로 생성한다. 이때, 각 원자의 상대 좌표, 지름, 원자쌍의 경우 원자간의 거리를 알고 있으므로, 원자의 경우 원자의 좌표를 중심으로 하는 구 형태로 각 원자를 시각화할 수 있으며, 원자쌍의 경우 두 원자의 좌표를 중심으로 하는 두 개의 구가 중첩된 형태로 각 원자쌍을 시각화할 수 있다.When the stereoscopic information extraction unit 142 extracts atom and atom pair information on each of the corresponding analysis targets, the three-dimensional processing unit 144 generates each atom and atom pair in three-dimensional form using the atom and atom pair information. . In this case, since the relative coordinates, diameters, and atomic pairs of each atom are known, the atoms can be visualized in the form of a sphere centered on the coordinates of the atoms. We can visualize each pair of atoms in a form of two superimposed spheres.

이와 같이 하여, 분석 대상물을 3차원으로 나타낼 수 있으며, 상호작용면 추출 장치(150)는 3차원 처리된 분석 대상물에 대한 상호작용면을 전술한 유클리디안 거리 방법(Euclidean distance Method), 기하학적 방법(예, 보로노이 다이어그램), 접근가면 알고리즘(Accessible Surface Area) 중 어느 하나의 알고리즘을 이용하여 예측하게 된다. 그리고, 분석 대상물 간의 상호작용면 예측 결과는 상호작용면 시각화 장치(140)의 3차원 처리부(144)에 의해 3차원 형태로 출력되게 된다.In this way, the analysis object may be represented in three dimensions, and the interaction surface extraction apparatus 150 may describe the interaction surface with respect to the three-dimensionally processed analysis object as described above by the Euclidean distance method and the geometric method. (Eg, Voronoi diagram) or an approach mask algorithm (Accessible Surface Area) using one of the predictions. The result of the interaction plane prediction between the analysis objects is output in a three-dimensional form by the three-dimensional processing unit 144 of the interaction plane visualization apparatus 140.

아울러, 본 발명에 의한 상호작용면 시각화 장치(140)는 효과 처리부(146)를 더 구비할 수 있다. 효과 처리부(146)는 각 분석 대상물을 이루는 각 원자에 대하여, 원자의 종류, 원자쌍별 또는 아미노산별로의 색상 설정, 사용자의 요청에 따른 색상 설정, 방향 변경, 조명 효과를 주는 등의 기능을 수행한다.In addition, the interactive surface visualization apparatus 140 according to the present invention may further include an effect processor 146. The effect processor 146 performs functions such as setting the color of the atom, the atom pair or the amino acid, setting the color according to the user's request, changing the direction, and giving an illumination effect to each atom constituting each analysis target. .

도 2는 본 발명에 의한 상호작용면 분석 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method of analyzing an interactive surface according to the present invention.

먼저, 사용자가 입력 장치를 통해 상호작용면을 분석하기 위한 적어도 두 개의 단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명과 같은 분석 대상물명을 입력 또는 선택한다(S110). 분석 대상물명 입력시에는 사용자가 예를 들어, 키보드 등을 조작하여 직접 입력할 수도 있고, 데이터베이스(120)에 저장되어 있는 단백질, 도메인 또는 화합물 리스트로부터 원하는 분석 대상물을 선택할 수도 있다.First, a user inputs or selects at least two protein names, domain names, compound and protein names, or analyte names such as compound and domain names for analyzing an interaction surface through an input device (S110). When inputting an analysis object name, a user may directly input a user by operating a keyboard, for example, or select a desired analysis object from a list of proteins, domains or compounds stored in the database 120.

분석 대상물명이 입력 또는 선택됨에 따라, 입체 정보 추출부(142)는 데이터베이스(120)를 조회하여 해당 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하고, 이를 이용하여 원자 및 원자쌍의 리스트를 생성한다(S120). 상술하였듯이, 원자 및 원자쌍 정보에는 각 분석 대상물에서 원자의 상대적 3차원 좌표와 지름, 각 분석 대상물에서 원자쌍을 이루는 원자간의 거리, 결합 종류 등이 포함된다.As the analysis object name is input or selected, the stereoscopic information extraction unit 142 searches the database 120 to extract atom and atom pair information included in the analysis object, and generates a list of atoms and atom pairs using the same. (S120). As described above, the atom and atom pair information includes relative three-dimensional coordinates and diameters of atoms in each analyte, distance between atoms forming atom pairs in each analyte, and bond type.

각 분석 대상물에 대한 원자 및 원자쌍에 대한 리스트가 생성되면 3차원 처리부(144)는 원자 및 원자쌍 정보를 참조하여 각 원자 및 원자쌍을 3차원으로 나타내며(S130), 이들을 해당 분석 대상물의 3차원 정보에 따라 배열하여, 결과적으로 각 분석 대상물을 3차원 형태로 출력한다(S140).When a list of atoms and atom pairs for each analyte is generated, the three-dimensional processor 144 refers to the atom and atom pair information in three dimensions by referring to the atom and atom pair information (S130), and the three of the corresponding analytes Arranged according to the dimensional information, and as a result, each analysis object is output in a three-dimensional form (S140).

이후, 상호작용면 추출부(150)는 3차원 처리된 분석 대상물에 대한 상호작용면을 예측하며(S150), 예측된 상호작용면을 구성하는 원자들을 각각 매칭(matching)하고 도킹(docking)한 후(S160), 출력장치를 통해 시각적으로 출력한다(S170).Subsequently, the interaction surface extractor 150 predicts the interaction surface for the three-dimensionally processed analyte (S150), and matches and docks the atoms constituting the predicted interaction surface, respectively. After (S160), the visual output through the output device (S170).

한편, 각 분석 대상물을 3차원 처리하여 출력한 후, 또는 예측된 상호작용면을 출력한 후, 사용자의 요청에 따라 각 분석 대상물에 포함된 원자 또는 원자쌍의 시각적 효과를 변경할 수 있다. 즉, 원자별, 원자쌍별, 아미노산별로 각기 다른 색상을 지정하거나, 사용자 임의로 색상을 지정하거나, 상호작용면 부위를 강조하기 위하여 조명 효과를 주는 등, 작업자의 요구에 맞게 가시화할 수 있다.On the other hand, after three-dimensional processing and outputting each of the analysis target, or after outputting the predicted interaction surface, the visual effect of the atoms or pairs of atoms included in each analysis can be changed at the request of the user. That is, it can be visualized according to the needs of the operator, such as specifying different colors by atoms, atomic pairs, and amino acids, or by arbitrarily assigning colors to users, or by providing lighting effects to emphasize the interaction surface area.

이상에서 설명한 상호작용면 분석 시스템은 데이터베이스(120)가 각 시스템 마다 독립적으로 구축되어 있기 때문에, 데이터베이스(120)가 변경되는 경우 이를 실시간으로 반영하기 어려운 점이 있다. 그러므로 데이터베이스(120)를 특정 서버 시스템에서 관리하고, 인터넷과 같은 통신망을 통해 데이터베이스(120)를 공유한다면, 데이터베이스(120)가 변경되더라도, 항상 최신의 데이터를 이용하여 상호작용면을 시각화하고 예측할 수 있을 것으로 기대된다. 이를 위한 상호 작용면 분석 시스템을 도 3에 도시하였다.In the interactive surface analysis system described above, since the database 120 is independently established for each system, it is difficult to reflect this in real time when the database 120 is changed. Therefore, if the database 120 is managed by a specific server system, and the database 120 is shared through a communication network such as the Internet, even if the database 120 is changed, it is always possible to visualize and predict the interaction surface using the latest data. It is expected to be. An interactive surface analysis system for this is shown in FIG. 3.

도 3은 본 발명의 다른 실시예에 의한 상호작용면 분석 시스템의 구성도이다.3 is a block diagram of an interactive surface analysis system according to another embodiment of the present invention.

본 실시예에 의한 상호작용면 분석 시스템은 상호작용면 시각화 장치(140) 및 상호작용면 추출 장치(150)가 구비된 개인용 컴퓨터(200), 개인용 컴퓨터(200)와 인터넷(400)과 같은 통신망을 통해 접속되는 정보제공 서버(300)를 포함한다.The interactive surface analysis system according to the present embodiment includes a personal computer 200 equipped with the interactive surface visualization apparatus 140 and the interactive surface extraction apparatus 150, a communication network such as the personal computer 200 and the Internet 400. It includes an information providing server 300 connected through.

개인용 컴퓨터(200)는 데이터 신호 및 제어 신호 송수신 등 전체적인 동작을 제어하기 위한 제어부(110), 모니터, 키보드, 마우스 등과 같은 입출력 장치(도시하지 않음)와 상호작용 분석 시스템(100) 간의 접속을 위한 I/O 인터페이스(130), 상호작용면 분석 대상물명이 I/O 인터페이스(130)를 통해 입력 또는 선택됨에 따라 데이터베이스(330)를 참조하여 해당 분석 대상물을 3차원으로 나타내고, 예측된 분석 대상물 간의 상호작용면을 시각화 처리하여 I/O 인터페이스(130)를 통해 시각적으로 출력하기 위한 상호작용면 시각화 장치(140), 분석 대상물 간의 상호작용면을 예측하기 위한 상호작용면 추출 장치(150), 상호작용면 분석 시스템(100)의 동작에 필요한 정보, 추출된 분석 대상물 간 상호작용면 정보 등을 저장하기 위한 저장 수 단(160) 및 인터넷(400)을 통해 정보제공 서버(300)와 접속하기 위한 통신망 인터페이스(170)를 포함하여 구성된다.The personal computer 200 may be configured to connect an input / output device (not shown) such as a control unit 110, a monitor, a keyboard, a mouse, and the like to control the overall operation such as data signal and control signal transmission and reception, and the interaction analysis system 100. As the I / O interface 130 and the interactive surface analysis object name are input or selected through the I / O interface 130, the corresponding analysis object is represented in three dimensions with reference to the database 330, and the interaction between the predicted analysis objects is displayed. Interactive surface visualization device 140 for visualizing and outputting the working surface through the I / O interface 130, interaction surface extraction device 150 for predicting the interaction surface between the analysis object, interaction Storage information 160 and the Internet 400 to store information necessary for the operation of the surface analysis system 100, the interaction surface information between the extracted analysis objects, etc. It is configured to include a network interface 170 for connection to the service server 300.

여기에서, 상호작용면 시각화 장치(140)는 입체정보 추출부(142), 3차원 처리부(144) 및 효과 처리부(146)를 구비하며, 각 처리부의 기능 및 동작은 도 1 및 도 2에서 설명한 것과 유사하므로 구체적인 설명은 생략하기로 한다.Here, the interactive surface visualization device 140 includes a stereoscopic information extraction unit 142, a three-dimensional processing unit 144 and an effect processing unit 146, the function and operation of each processing unit described in Figures 1 and 2 Since it is similar to the above, a detailed description thereof will be omitted.

한편, 정보제공 서버(300)는 제어부(310), 통신망 인터페이스(320) 및 데이터베이스(330)를 포함하여 구성된다. 데이터베이스(330)는 단백질 DB, 도메인 DB 및 화합물 DB를 포함할 수 있으며, 각 단백질, 도메인 및 화합물과 같은 분석 대상물 각각의 서열정보, 3차원 정보 및 화학식 정보, 각 분석 대상물에 포함된 원자 및 원자쌍의 종류, 각 분석 대상물에서 원자의 상대적 3차원 좌표와 지름, 각 분석 대상물에서 원자쌍을 이루는 원자간의 거리, 결합 종류 등이 저장된 형태로 구성할 수도 있다.Meanwhile, the information providing server 300 includes a controller 310, a communication network interface 320, and a database 330. The database 330 may include a protein DB, a domain DB, and a compound DB, and include sequence information, three-dimensional information, and chemical formula information of each analyte such as each protein, domain, and compound, and atoms and atoms included in each analyte. The types of pairs, relative three-dimensional coordinates and diameters of the atoms in each analyte, the distance between atoms in the analytical pair in each analyte, and the type of bond may be stored.

본 실시예에서는 상호작용면 분석의 기초가 되는 단백질, 도메인 또는 화합물의 3차원 정보 등을 정보제공 서버(300)에서 중앙 집중식으로 관리하기 때문에 새로운 단백질, 도메인 및 화합물이 합성되거나 발견되는 경우 데이터베이스(330)의 일괄적 갱신이 용이하며, 각 개인용 컴퓨터(200) 사용자가 최신의 3차원 정보를 이용하기 편리한 이점이 있다.In this embodiment, since the information server 300 centrally manages three-dimensional information of a protein, domain, or compound that is the basis of the interaction surface analysis, a database (if a new protein, domain, or compound is synthesized or found) The collective update of 330 is easy, and each personal computer 200 user has an advantage of using the latest three-dimensional information.

아울러, 상호작용면 시각화 장치(140) 및 상호작용면 추출 장치(150)는 개인용 컴퓨터(140)에 접속되는 독립적인 장치로 구성하는 것도 가능하지만, 이러한 기능을 수행할 수 있는 하나의 소프트웨어로 구성하는 것도 가능하다. 상호작용면 시각화 장치(140)와 상호작용면 추출 장치(150)의 기능을 소프트웨어로 제작하는 경우, 정보제공 서버(300)에서 이를 요구하는 사용자에게 다운로드하여 주고, 사용자가 개인용 컴퓨터(200)에 이를 설치한 후 상호작용면 분석에 사용하도록 하거나 플로피 디스크, CD, DVD 등과 같은 모든 가능한 기록매체에 저장된 형태로 제작하는 것도 가능하다.In addition, the interaction surface visualization apparatus 140 and the interaction surface extraction apparatus 150 may be configured as independent devices connected to the personal computer 140, but may be configured as one software capable of performing such a function. It is also possible. When the functions of the interactive surface visualization apparatus 140 and the interactive surface extraction apparatus 150 are manufactured by software, the information providing server 300 downloads them to the requesting user, and the user sends them to the personal computer 200. After installation, it can be used for analysis of interactive surfaces, or it can be produced in a form stored on all possible recording media such as floppy disk, CD, DVD, and the like.

도 4는 본 발명의 분석방법에 따라 두 개의 도메인으로부터 추출된 상호작용면을 가시화한 것이다.4 is a visualization of the interaction surface extracted from the two domains according to the analysis method of the present invention.

SCOP 분류 시스템에 의해 분류되고 명명된 두 개의 도메인 d1a25a와 d1a25b를 각각 3차원화한 후 도메인 d125a를 구성하는 각 원자별로 도메인 d1a25b를 구성하는 원자와의 거리에 따른 상호작용 여부를 확인하여 상호작용하는 원자를 선별하고, 즉 도메인 d1a25a와 도메인 d1a25b의 상호작용면을 추출하고 이를 백색으로 가시화한 것이다.After three-dimensionalizing two domains d1a25a and d1a25b classified and named by the SCOP classification system, each atom constituting the domain d125a interacts by checking the interaction with the atoms constituting the domain d1a25b. Atoms were selected, i.e., the interaction surface of domain d1a25a and domain d1a25b was extracted and visualized as white.

도 5는 본 발명의 분석방법에 따라 다양한 상호작용면을 가시화한 것이다.5 is a visualization of the various interaction surface in accordance with the analysis method of the present invention.

A는 헤모글로빈 단백질을 SCOP 분류 시스템에 의해 분류되고 명명된 두 개의 도메인 1cbma_와 1cbmb_로 각각 3차원화한 후 도메인 1cbma_를 구성하는 원자와 도메인 1cbmb_를 구성하는 원자의 거리에 따른 상호작용 여부를 확인하여 상호작용하는 원자를 선별하고, 모든 가능한 상호작용을 추출하고 이를 점선으로 가시화한 것이다. B는 헤모글로빈 단백질에 존재하는 세 개의 도메인을 Connolly surface, 반데르 발스에 따른 반지름, 스켈렉톤 형태로 가시화한 것이다. C는 A와 동일한 절차에 따라 진행하되, 기하학적 방법(예: 보로노이 다이어그램)에 의해 추출된 상호 작용면을 가시화한 것이다. D는 헤모글로빈 단백질의 한 서브유니트인 1cbm와 화합물 (Heme 구조) 간의 유클리디안 거리 방법을 통해 추출된 상호작용면을 가시화한 것이다.A three-dimensionalizes the hemoglobin protein into two domains, 1cbma_ and 1cbmb_, classified and named by the SCOP classification system, and then interacts according to the distance between the atoms constituting the domain 1cbma_ and atoms constituting the domain 1cbmb_ By checking whether or not the interaction atoms were selected, all possible interactions were extracted and visualized with dotted lines. B visualizes the three domains in the hemoglobin protein in the form of Connolly surface, radius according to van der Waals, and skeleton. C follows the same procedure as A, but visualizes the interaction surface extracted by geometric methods (eg Voronoi diagram). D is a visualization of the interaction surface extracted by the Euclidean distance method between 1 ccb, a subunit of hemoglobin protein, and the compound (Heme structure).

이상과 같이 분석된 상호작용면의 3차원 구조와 서열은 마이크로어레이(예, 단백질 칩) 또는 신약 개발 등에 이용될 수 있다. 일례로 발암 단백질에 빈번하게 존재하는 도메인의 상호작용면을 모방한 모방체(mimics; 상호작용면의 3차원 구조와 유사한 인공적으로 합성된 물질)를 통상적인 단백질 칩 용 기판 상에 부착한 후 여기에 상기 발암 단백질과 상호작용할 것으로 예상되는 후보 물질(예, 단백질, 핵산, 화합물 등)을 주입하여 상기 도메인과 상호작용하는 후보 물질을 스크리닝할 수 있다.The three-dimensional structure and sequence of the interaction surface analyzed as described above may be used for microarray (eg, protein chip) or drug development. For example, mimics that mimic the interaction planes of domains that are frequently present in carcinogenic proteins (mimics (artificially synthesized materials similar to the three-dimensional structure of the interaction plane) are attached onto a substrate for a conventional protein chip, and then Candidates (eg, proteins, nucleic acids, compounds, etc.) that are expected to interact with the carcinogenic proteins may be injected into the candidate substances that interact with the domains.

본 발명에 따른 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템 및 방법과 이를 위한 기록매체를 이용하여 단백질간, 도메인간, 단백질과 화합물간, 또는 도메인과 화합물 간의 상호작용면을 높은 해상도로 신속하고 정확하게 추출할 수 있으며, 이렇게 분석된 상호작용면은 단백질간 상호작용면의 예측, 원자 매칭과 도킹, 신약 타겟(target) 스크리닝 및 발굴과 단백질 칩의 제조에 이용될 수 있다.Interaction between proteins, between domains, between proteins and compounds, or between domains and compounds using a system and method for analyzing the surface of proteins or proteins and compounds based on the protein domain according to the present invention and a recording medium therefor Surfaces can be extracted quickly and accurately at high resolution, and these analyzed surfaces can be used to predict inter-protein interaction surfaces, atomic matching and docking, drug target screening and discovery, and manufacturing of protein chips. have.

Claims (13)

단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템으로서,A system for analyzing surface interaction between proteins or proteins and compounds based on protein domains, 제어부;Control unit; 각 단백질, 도메인 및 화합물의 3차원 정보, 서열정보 및 화학식 정보를 저장하고 있는 데이터베이스;A database storing three-dimensional information, sequence information, and chemical formula information of each protein, domain, and compound; I/O 인터페이스;I / O interface; 상호작용면을 분석하고자 하는 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 상기 I/O 인터페이스를 통해 입력 또는 선택됨에 따라 상기 데이터베이스를 참조하여 해당 분석 대상물을 3차원으로 나타내고, 예측된 분석 대상물 간의 상호작용면을 시각화 처리하여 상기 I/O 인터페이스를 통해 시각적으로 출력하기 위한 상호작용면 시각화 장치;The name of at least two or more analytes (protein name, domain name, compound and protein name or compound and domain name) for which the interaction surface is to be analyzed is referred to the database as input or selected through the I / O interface. An interactive surface visualization device for displaying the analysis object in three dimensions and visualizing the interaction surface between the predicted analysis objects and visually outputting them through the I / O interface; 상기 분석 대상물 간의 상호작용면을 예측하기 위한 상호작용면 추출 장치; 및An interaction surface extraction device for predicting an interaction surface between the analysis targets; And 저장 수단;Storage means; 을 포함하여 구성되는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.Interaction surface analysis system between proteins or proteins and compounds based on a protein domain comprising a. 제 1 항에 있어서,The method of claim 1, 상기 데이터베이스는 각 단백질, 도메인 및 화합물의 3차원 정보, 각 단백질, 도메인 및 화합물에 포함된 원자 및 원자쌍의 종류, 각 단백질, 도메인 및 화합물에서 원자의 상대적 3차원 좌표와 지름, 각 단백질, 도메인 및 화합물에서 원자쌍을 이루는 원자간의 거리, 결합 종류, 각 단백질 및 도메인의 서열정보, 각 화합물의 화학식 정보를 저장하는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.The database includes three-dimensional information of each protein, domain, and compound, types of atoms and pairs of atoms included in each protein, domain, and compound, relative three-dimensional coordinates and diameters of atoms in each protein, domain, and compound, each protein, and domain. And an interface between proteins or a protein-based compound based on a protein domain, characterized in that it stores distances between atoms constituting an atomic pair in the compound, binding type, sequence information of each protein and domain, and chemical formula information of each compound. Analysis system. 제 1 항에 있어서,The method of claim 1, 상기 상호작용면 시각화 장치는 상기 I/O 인터페이스를 통해 분석하고자 하는 적어도 두 개 이상의 분석 대상물명이 입력 또는 선택됨에 따라, 상기 제어부의 제어에 의해 상기 데이터베이스를 조회하여 해당 분석 대상물에 포함된 각 원자의 상대 좌표와 지름, 결합관계에 있는 두 원자쌍의 결합 정보와 두 원자간의 거리 정보를 포함하는 원자 및 원자쌍의 정보를 추출하는 입체 정보 추출부; 및As the interactive surface visualization apparatus inputs or selects at least two or more analysis object names to be analyzed through the I / O interface, the interactive surface visualization apparatus searches the database under the control of the control unit, and displays each of the atoms included in the analysis object. A stereoscopic information extracting unit for extracting information of atoms and pairs of atoms including relative information about the coordinates and diameters, the coupling information of two pairs of atoms in a bonding relationship, and distance information between the two atoms; And 상기 분석 대상물에 포함된 원자 및 원자쌍 정보가 상기 입체 정보 추출부에서 추출됨에 따라, 상기 원자 및 원자쌍 정보를 이용하여 각 원자와 원자쌍을 3차원 형태로 생성하기 위한 3차원 처리부;A three-dimensional processing unit for generating each atom and atom pair in a three-dimensional form using the atom and atom pair information as the atom and atom pair information included in the analysis object is extracted from the stereoscopic information extraction unit; 를 포함하여 구성되는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.Interaction surface analysis system between proteins or proteins and compounds based on the protein domain, characterized in that comprises a. 제 3 항에 있어서,The method of claim 3, wherein 상기 3차원 처리부는 상기 원자의 좌표를 중심으로 하는 구 형태로 각 원자를 시각화하고, 상기 원자쌍을 이루는 두 원자의 좌표를 중심으로 하는 두 개의 구가 중첩된 형태로 각 원자쌍을 시각화하는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.The three-dimensional processing unit visualizes each atom in the form of a sphere centered on the coordinates of the atoms, and visualizes each pair of atoms in the form of superimposing two spheres centered on the coordinates of two atoms constituting the atom pair. Characterized by the domain of a protein based protein domains or interaction surface analysis system between proteins and compounds. 제 1 항에 있어서,The method of claim 1, 상기 상호작용면 추출 장치는 유클리디안 거리 방법(Euclidean distance Method), 기하학적 다이어그램, 접근가면 알고리즘(Accessible Surface Area) 중 어느 하나 이상을 이용하여 상호작용면을 예측하는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.The apparatus for extracting the interaction surface is based on a protein domain, which predicts the interaction surface using any one or more of Euclidean distance method, geometric diagram, and accessible surface area algorithm. A system for analyzing the plane of interaction between proteins or between proteins and compounds. 제 1 항에 있어서,The method of claim 1, 상기 상호작용면 분석 시스템은 상기 분석 대상물을 이루는 각 원자에 대하여, 원자의 종류, 원자쌍별 또는 아미노산별로의 색상 설정, 사용자의 요청에 따른 색상 설정, 방향 변경, 조명 효과를 주는 등의 기능을 수행하기 위한 효과 처리부를 더 포함하는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 시스템.The interactive surface analysis system performs functions such as setting a color of each atom, atomic pair or amino acid, setting a color according to a user's request, changing a direction, and lighting effects for each atom constituting the analyte. An interaction surface analysis system between proteins or proteins and compounds based on a protein domain, characterized in that it further comprises an effect processing unit. 상호작용면을 분석하기 위한 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 입력 또는 선택됨에 따라, 각 분석 대상물별 3차원 정보를 저장하고 있는 데이터베이스로부터 상기 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하고, 상기 추출된 원자 및 원자쌍 정보를 이용하여 원자 및 원자쌍의 리스트를 생성하는 단계;As the names of at least two analytes (protein name, domain name, compound and protein name or compound and domain name) for analyzing the interacting surface are input or selected, three-dimensional information for each analyte is stored. Extracting atom and atom pair information included in the analyte from a database, and generating a list of atoms and atom pairs using the extracted atom and atom pair information; 상기 원자 및 원자쌍 정보를 참조하여 각 원자 및 원자쌍을 3차원으로 변형하는 단계;Modifying each atom and atom pair in three dimensions by referring to the atom and atom pair information; 상기 3차원으로 도식화된 원자 및 원자쌍을 상기 분석 대상물의 3차원 정보에 따라 각각 배열하여, 상기 분석 대상물 각각을 3차원 형태로 출력하는 단계;Arranging the atoms and atom pairs depicted in three dimensions according to three-dimensional information of the analyte, and outputting each of the analytes in a three-dimensional form; 상기 3차원 처리된 분석 대상물에 대한 상호작용면을 예측하는 단계;Predicting an interaction surface for the three-dimensionally processed analyte; 상기 예측된 상호작용면을 구성하는 원자들을 각각 매칭(matching)하고 도킹(docking)하는 단계; 및Matching and docking respective atoms constituting the predicted interaction surface; And 상기 예측된 상호작용면을 출력장치를 통해 시각적으로 출력하는 단계;Visually outputting the predicted interactive surface through an output device; 를 포함하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.Method of analysis of the interaction surface between proteins or proteins and compounds based on the protein domain comprising a. 제 7 항에 있어서,The method of claim 7, wherein 상기 원자 및 원자쌍 정보는 각 분석 대상물에서 원자의 상대적 3차원 좌표와 지름, 각 분석 대상물에서 원자쌍을 이루는 원자간의 거리, 결합 종류가 포함되 는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.The atomic and atomic pair information is a protein domain-based protein between the three-dimensional coordinates and diameter of the atoms in each analyte, the distance between the atoms forming the pair of atoms in each analyte, the type of bond between proteins Or an interaction plane analysis method between a protein and a compound. 제 7 항에 있어서,The method of claim 7, wherein 상기 분석 대상물을 3차원 형태로 출력하는 단계 이후, 상기 각 분석 대상물에 포함된 원자 또는 원자쌍의 시각적 효과를 변경하는 단계를 더 포함하는 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.After the output of the analyte in the three-dimensional form, the protein between the protein domain or the protein based on the protein domain, characterized in that further comprising the step of changing the visual effect of the atoms or atomic pairs included in the analyte; Method of analysis of the interaction surface between compounds. 제 9 항에 있어서,The method of claim 9, 상기 원자 또는 원자쌍의 시각적 효과를 변경하는 단계는 상기 원자별, 원자쌍별로 각기 다른 색상을 지정하거나, 사용자 임의로 색상을 지정하거나, 상호작용면 부위를 강조하기 위하여 조명 효과를 주는 단계인 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.The step of changing the visual effects of the atoms or pairs of atoms is to specify a different color for each atom, each pair of atoms, or to give a user's arbitrary color, or to give a lighting effect to highlight the interaction surface area Method of analysis of the interaction surface between proteins or between proteins and compounds based on protein domains. 제 7 항에 있어서,The method of claim 7, wherein 상기 각 원자 및 원자쌍을 3차원으로 변형하는 단계는 상기 원자의 좌표를 중심으로 하는 구 형태로 각 원자를 시각화하고, 상기 원자쌍을 이루는 두 원자의 좌표를 중심으로 하는 두 개의 구가 중첩된 형태로 각 원자쌍을 시각화하는 단계인 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.The step of transforming each atom and the atom pair in three dimensions may visualize each atom in the form of a sphere centered on the coordinates of the atoms, and overlap two spheres centered on the coordinates of the two atoms constituting the atom pair. Visualizing each atomic pair in the form, characterized in that the protein domain based on the protein domain or the interaction surface analysis method between proteins and compounds. 제 7 항에 있어서,The method of claim 7, wherein 상기 분석 대상물에 대한 상호작용면을 예측하는 단계는 유클리디안 거리 방법(Euclidean distance Method), 기하학적 다이어그램, 접근가면 알고리즘(Accessible Surface Area) 중 어느 하나 이상을 이용하여 상기 상호작용면을 예측하는 단계인 것을 특징으로 하는 단백질 도메인을 기반으로 한 단백질 간 또는 단백질과 화합물 간의 상호작용면 분석 방법.Predicting the interaction plane for the analyte includes predicting the interaction plane using any one or more of Euclidean distance method, geometric diagram, and accessible surface area algorithm. Method for analyzing the surface of the protein-based or the interaction between the protein and the compound based on the protein domain, characterized in that. 상호작용면을 분석하기 위한 적어도 두 개 이상의 분석 대상물의 명칭(단백질명, 도메인명, 화합물과 단백질명 또는 화합물과 도메인명)이 입력 또는 선택됨에 따라, 각 분석 대상물별 3차원 정보를 저장하고 있는 데이터베이스로부터 상기 분석 대상물에 포함된 원자 및 원자쌍 정보를 추출하고, 상기 추출된 원자 및 원자쌍 정보를 이용하여 원자 및 원자쌍의 리스트를 생성하는 기능;As the names of at least two analytes (protein name, domain name, compound and protein name or compound and domain name) for analyzing the interacting surface are input or selected, three-dimensional information for each analyte is stored. Extracting atom and atom pair information included in the analyte from a database and generating a list of atoms and atom pairs using the extracted atom and atom pair information; 상기 원자 및 원자쌍 정보를 참조하여 각 원자 및 원자쌍을 3차원으로 변형하는 기능;A function of modifying each atom and atom pair in three dimensions by referring to the atom and atom pair information; 상기 3차원으로 도식화된 원자 및 원자쌍을 상기 분석 대상물의 3차원 정보에 따라 각각 배열하여, 상기 분석 대상물 각각을 3차원 형태로 출력하는 기능;Arranging the atoms and atom pairs illustrated in the three-dimensional form according to three-dimensional information of the analyte, and outputting each of the analyte in three-dimensional form; 상기 3차원 처리된 분석 대상물에 대한 상호작용면을 예측하는 기능;Predicting an interactive surface for the three-dimensionally processed analyte; 상기 예측된 상호작용면을 구성하는 원자들을 각각 매칭(matching)하고 도킹(docking)하는 기능;Matching and docking respective atoms constituting the predicted interaction surface; 상기 예측된 상호작용면을 출력장치를 통해 시각적으로 출력하는 기능; 및A function of visually outputting the predicted interactive surface through an output device; And 상기 3차원 처리된 분석 대상물에 포함된 원자 또는 원자쌍의 시각적 효과를 변경하는 기능;Changing the visual effect of atoms or pairs of atoms included in the three-dimensionally processed analyte; 을 순차적으로 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having a program recorded thereon for executing the program sequentially.
KR20050121684A 2005-12-12 2005-12-12 System and method for analysis of interfaces based on protein domain and recording medium therefor KR100757040B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20050121684A KR100757040B1 (en) 2005-12-12 2005-12-12 System and method for analysis of interfaces based on protein domain and recording medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20050121684A KR100757040B1 (en) 2005-12-12 2005-12-12 System and method for analysis of interfaces based on protein domain and recording medium therefor

Publications (2)

Publication Number Publication Date
KR20070062025A KR20070062025A (en) 2007-06-15
KR100757040B1 true KR100757040B1 (en) 2007-09-07

Family

ID=38357568

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20050121684A KR100757040B1 (en) 2005-12-12 2005-12-12 System and method for analysis of interfaces based on protein domain and recording medium therefor

Country Status (1)

Country Link
KR (1) KR100757040B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100856526B1 (en) 2008-03-13 2008-09-04 한국생명공학연구원 System comprising scoring algorithm and method for identifying alternative splicing isoforms using peptide mass fingerprinting, and recording media having program therefor
WO2008151140A2 (en) * 2007-05-31 2008-12-11 The Regents Of The University Of California Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required
KR101797192B1 (en) 2015-08-31 2017-12-13 한국과학기술원 Method and system for preparing binding protein library
KR20200080082A (en) 2018-12-26 2020-07-06 주식회사 유클리드소프트 System for Molecular Dynamics Simulation based on web

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100957386B1 (en) * 2008-03-14 2010-05-11 씨비에스바이오사이언스 주식회사 Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008151140A2 (en) * 2007-05-31 2008-12-11 The Regents Of The University Of California Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required
WO2008151140A3 (en) * 2007-05-31 2009-03-05 Univ California Method for identifying peptides using tandem mass spectra by dynamically determining the number of peptide reconstructions required
KR100856526B1 (en) 2008-03-13 2008-09-04 한국생명공학연구원 System comprising scoring algorithm and method for identifying alternative splicing isoforms using peptide mass fingerprinting, and recording media having program therefor
WO2009113752A1 (en) * 2008-03-13 2009-09-17 Korea Research Institute Of Bioscience And Biotechnology System comprising scoring algorithm and method for identifying alternative splicing isoforms using peptide mass fingerprinting, and recording media having program therefor
KR101797192B1 (en) 2015-08-31 2017-12-13 한국과학기술원 Method and system for preparing binding protein library
KR20200080082A (en) 2018-12-26 2020-07-06 주식회사 유클리드소프트 System for Molecular Dynamics Simulation based on web
KR20220008249A (en) 2018-12-26 2022-01-20 주식회사 유클리드소프트 System for Molecular Dynamics Simulation based on web

Also Published As

Publication number Publication date
KR20070062025A (en) 2007-06-15

Similar Documents

Publication Publication Date Title
JP7458678B2 (en) Decoding approach method for protein identification
Tuncbag et al. A survey of available tools and web servers for analysis of protein–protein interactions and interfaces
CN107038348B (en) Drug target prediction method based on protein-ligand interaction fingerprint
Coleman et al. Travel depth, a new shape descriptor for macromolecules: application to ligand binding
KR100757040B1 (en) System and method for analysis of interfaces based on protein domain and recording medium therefor
Mitusińska et al. Applications of water molecules for analysis of macromolecule properties
Sowmya et al. Protein-protein interactions and prediction: a comprehensive overview
US20230317214A1 (en) Methods for predicting an active set of compounds having alternative cores, and drug discovery methods involving the same
BG107717A (en) Method of operating a computer system to perform a discrete substructural analysis
Waibl et al. Conformational ensembles of antibodies determine their hydrophobicity
US20060161407A1 (en) Modeling biological effects of molecules using molecular property models
CN115938488B (en) Recognition method of protein allosteric modulator based on deep learning and computational simulation
Su et al. Computational studies of protein–protein dissociation by statistical potential and coarse-grained simulations: A case study on interactions between colicin E9 endonuclease and immunity proteins
Guo et al. TRScore: a 3D RepVGG-based scoring method for ranking protein docking models
Flower et al. Computational vaccinology: quantitative approaches
Chen et al. The Application of Artificial Intelligence Accelerates G Protein-Coupled Receptor Ligand Discovery
Bravi Development and use of machine learning algorithms in vaccine target selection
Carl et al. Protein surface conservation in binding sites
KR100456627B1 (en) System and method for predicting 3d-structure based on the macromolecular function
JP5142179B2 (en) Prediction method of interaction sites in biopolymers
Roberts et al. Foldy: a web application for interactive protein structure analysis
McCaffrey Bioinformatic Techniques for Vaccine Development: Epitope Prediction and Structural Vaccinology
Al-Khafaji et al. Computational techniques for studying protein-protein interactions
US20230245712A1 (en) Approaches to simulating the interactions of biological systems through the use of modular computational workflows
Poudyal Molecular Docking Technique

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120824

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130904

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150904

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160906

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170904

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180906

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190904

Year of fee payment: 13