KR100773055B1 - System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor - Google Patents

System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor Download PDF

Info

Publication number
KR100773055B1
KR100773055B1 KR1020060062631A KR20060062631A KR100773055B1 KR 100773055 B1 KR100773055 B1 KR 100773055B1 KR 1020060062631 A KR1020060062631 A KR 1020060062631A KR 20060062631 A KR20060062631 A KR 20060062631A KR 100773055 B1 KR100773055 B1 KR 100773055B1
Authority
KR
South Korea
Prior art keywords
protein
database
interacting
searched
docking
Prior art date
Application number
KR1020060062631A
Other languages
Korean (ko)
Inventor
박종화
공성삼
박대의
Original Assignee
한국생명공학연구원
오브젝트인터랙션테크놀로지스(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원, 오브젝트인터랙션테크놀로지스(주) filed Critical 한국생명공학연구원
Priority to KR1020060062631A priority Critical patent/KR100773055B1/en
Application granted granted Critical
Publication of KR100773055B1 publication Critical patent/KR100773055B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A system, a method and a recording medium for searching materials interfacing with proteins based on interfaceome are provided to search materials interfacing with proteins more accurately and rapidly from database including information about interfaceome between proteins and other subject materials. A system for searching materials interfacing with proteins based on interfaceome comprises a controlling part(110); a database(120) which stores information about proteins, interfaceome and compounds; I/O interface(130); a device for extracting interfaceome(140) which generates a three dimensional structure of the proteins by referencing the database in accordance with inputting of an amino acid sequence of the protein to be searched, extracts the surface structure from the three dimensional structure and matches the surface structure with the each of the stored interfaceome to extract the interfaceome matched with a predetermined value; an interfacing material extracting device(150) which extracts the material having the interfaceome corresponding to the interfaceome of the protein to be searched from the database; a docking energy calculation device(170) which docks the material selected from the interfaceome of the protein to be searched and database and calculates the energy of the material during docking; and a storing unit(180). The system further comprises a lead material selecting device(160) which selects a series of materials to dock from the database.

Description

상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 시스템 및 방법과 이를 위한 기록매체{System and Method for Searching Materials Interfacing with Proteins Based on Interfaceome and Recording Medium Therefor}System and Method for Searching Materials Interfacing with Proteins Based on Interfaceome and Recording Medium Therefor}

도 1은 본 발명의 일 실시예에 의한 검색 시스템의 구성도,1 is a block diagram of a search system according to an embodiment of the present invention;

도 2는 본 발명에 의한 상호작용물질 검색 방법을 설명하기 위한 흐름도,2 is a flowchart illustrating a method for searching for an interactive substance according to the present invention;

도 3은 본 발명의 다른 실시예에 의한 검색 시스템의 구성도,3 is a block diagram of a search system according to another embodiment of the present invention;

도 4는 본 발명의 한 검색 방법에 의해 Bak 단백질과 상호작용하는 물질을 검색하는 과정을 예시한 것이다.Figure 4 illustrates the process of searching for a substance that interacts with Bak protein by a search method of the present invention.

도 5는 본 발명의 다른 검색 방법에 의해 Bak 단백질과 상호작용하는 물질을 검색하는 과정을 예시한 것이다. Figure 5 illustrates the process of searching for a substance that interacts with Bak protein by another search method of the present invention.

<도면의 주요 부분에 대한 부호 설명><Description of the symbols for the main parts of the drawings>

100: 검색 시스템 110: 제어부100: search system 110: control unit

120: 데이터베이스 122: 단백질 데이터베이스120: database 122: protein database

124: 상호작용면체 데이터베이스 126: 화합물 데이터베이스124: Interfacial Database 126: Compound Database

130: I/O 인터페이스 140: 상호작용면체 추출 장치130: I / O interface 140: interactive tetrahedral extraction device

142: 3차원 구조 생성부 144: 표면 구조 추출부142: three-dimensional structure generation unit 144: surface structure extraction unit

146: 상호작용면체 매칭부 150: 상호작용물질 추출 장치146: interactive face matching unit 150: interactive material extraction device

160: 선도물질 선별 장치 170: 도킹 에너지 계산 장치160: lead material sorting device 170: docking energy calculation device

172: 도킹부 174: 에너지 계산부172: docking unit 174: energy calculation unit

180: 저장수단 190: 통신망 인터페이스180: storage means 190: communication network interface

200: 개인용 컴퓨터 300: 정보제공 서버200: personal computer 300: information providing server

310: 제어부 320: 데이터베이스310: control unit 320: database

330: 통신망 인터페이스 400: 인터넷330: network interface 400: the Internet

본 발명은 단백질과 상호작용하는 물질을 검색하는 시스템, 방법 및 기록매체에 관한 것으로서, 보다 자세하게는 상호작용면체를 기반으로 하여 단백질과 상호작용하는 물질을 검색하는 시스템, 방법 및 기록매체에 관한 것이다.The present invention relates to a system, a method and a recording medium for searching a substance interacting with a protein. More particularly, the present invention relates to a system, a method and a recording medium for searching a substance interacting with a protein on the basis of an interaction cube. .

단백질은 세포의 최소 기능단위이며, 단백질들의 상호작용을 통하여 생체 신호 전달이 이루어진다. 특히 단백질의 상호작용은 현재 주목받고 있는 분야인 시스템 생물학에서도 핵심적인 역할을 담당하고 있다. 이에 따라 세계 각국에서는 단백질 상호작용에 대한 연구에 많은 노력을 기울이고 있다. 현재의 각국의 기술들을 구체적으로 살펴보면 다음과 같다.Proteins are the smallest functional unit of a cell, and biosignal transmission occurs through the interaction of proteins. In particular, protein interactions play a key role in system biology, an area that is currently in the spotlight. As a result, many countries around the world are putting a lot of effort into researching protein interactions. The current technology of each country is as follows.

일본의 이토(Ito) 그룹은 2000년 출아 효모(budding yeast)의 전체 단백질 네트워크를 발표하였고, 미국의 필즈(Fields) 그룹 역시 2001년 출아 효모의 전체 단백질 네트워크에 대하여 발표하였다. 또한, 벤처회사인 셀좀(Cellzome)사가 2002년에 TAP/MA 기법을 사용하여 출아 효모의 단백질 네트워크를 발표하였고, 캐나다의 엔디에스 프로테오믹스(NDS proteomics)사가 MS 기법으로 출아 효모의 단백질 네트워크를 발표하였다. 2003년에는 역시 벤처회사인 쿠라젠(CuraGen)이 Y2H 기법으로 초파리에 대한 단백질 네트워크를 발표하였고, 올해에는 미국의 비달(Vidal) 그룹이 Y2H 기법으로 예쁜꼬마선충(C. elegans)의 단백질 네트워크를 발표하였다.Japan's Ito Group released its entire protein network of budding yeast in 2000, and Fields Group of the United States also published its entire protein network of budding yeast in 2001. In addition, venture firm Cellzome announced the protein network of germinating yeast using the TAP / MA technique in 2002, and NDS proteomics of Canada announced the protein network of germinating yeast using MS technique. . In 2003, CuraGen, a venture company, also announced a protein network for fruit flies using the Y2H technique, and this year, the Vidal group of the United States used the Y2H technique to build a protein network for C. elegans. Announced.

그러나, 단백질 상호작용 여부 확인에 사용되는 Y2H나 TAP/MS와 같은 실험 기법은 단백질체 수준의 단백질 네트워크를 확인하는데 많은 비용과 시간을 필요로 하며 종마다 같은 실험을 반복해야 하는 단점이 있다. 이러한 단점을 극복하기 위하여 생물정보학적 접근이 시도되고 있으며, 유전자 융합(gene fusion), 필로제네틱 프로필(phylogenetic profile) 등과 같은 방법이 이용되고 있다. 현재까지 진행되고 있는 생물정보학적 방법의 경우 대량, 고속 탐색이 가능한 장점이 있으나, 인간이나 쥐 등과 같은 진핵 생물에 적용하기 어렵다는 점과 정확성을 검증하여야 하는 문제가 있다.However, experimental techniques such as Y2H and TAP / MS, which are used to confirm protein interaction, require a lot of cost and time to identify protein-level protein networks, and have the disadvantage of repeating the same experiment for each species. Bioinformatics approaches have been attempted to overcome these shortcomings, and methods such as gene fusion and phylogenetic profiles have been used. The bioinformatics method that has been carried out to date has the advantage of being able to search in large quantities and at high speeds, but it is difficult to apply to eukaryotic organisms such as humans and rats, and there is a problem of verifying accuracy.

한편, 신약개발에서 선도물질(lead compound)을 처리하는 과정은 크게 두 단계로 나눌 수 있다. 첫 번째는 화합물 라이브러리(Chemical Library)에서 의약 후보 물질을 찾아내는 과정(Drug Lead Identification)이고 두 번째는 의약 후보 물질 최적화 과정(Drug Lead Optimization)이다. 의약 후보 물질을 찾아내는 과정에 있어서 최근 HTS(High-Through Screening) 방법의 발달이 두드러지고 있으며, 특히 DOS(Diversity Oriented Chemical Synthesis)의 방법을 통해 화합물 라이브러리를 생성하고 HTS 기법을 이용하여 많은 양의 화합물을 무작위로 스크리닝하는 방법이 각광받고 있다.On the other hand, the treatment of lead compounds in drug development can be divided into two stages. The first is Drug Lead Identification in the Chemical Library, and the second is Drug Lead Optimization. In the process of finding drug candidates, the development of high-through screening (HTS) method has recently been prominent. In particular, a compound library is generated by the method of diversity oriented chemical synthesis (DOS) and a large amount of compound using the HTS technique. Random screening method is in the spotlight.

이러한 DOS, HTS 기법으로 하루에 수백만의 화합물을 주어진 의약 작용 단백질(Drug Target Protein)에 대하여 스크리닝하는 것이 가능하다. 그러나 새로운 의약 작용 단백질에 대하여 무작위로 스크리닝하는 것은 실험에 투입되는 화합물의 개수 대비 선도물질로 선택되는 정확도(Hit Ratio)는 십만분의 일에 이를 정도로 매우 작다. 또한, 유전체학의 발달로 잠재적인 의약 작용 단백질이 기하급수적으로 늘어나고 있기 때문에 모든 의약 작용 단백질에 대하여 실험을 통하여 무작위로 스크리닝하는 것은 비용과 시간에 있어서 그 효율성이 낮다.This DOS, HTS technique makes it possible to screen millions of compounds per day for a given drug target protein. However, random screening for new medicinal proteins is very small, with a hit ratio of one hundred thousand as the lead relative to the number of compounds in the experiment. In addition, because of the exponential growth of potential pharmacological proteins due to the development of genomics, the random screening of all medicinal proteins through experiments is inefficient in terms of cost and time.

이에, 본 발명자들은 단백질과 상호작용하는 물질을 보다 정확하고 신속하게 검색하기 위하여 단백질과 다른 대상물간의 상호작용면체에 대한 정보를 포함한 데이터베이스를 구축하고, 이를 이용하여 단백질과 상호작용하는 물질을 검색하는 시스템, 방법 및 기록매체를 개발하였다.Accordingly, the present inventors have constructed a database including information on the interacting polyhedron between the protein and other objects in order to search for a substance that interacts with the protein more accurately and quickly, and uses the same to search for a substance that interacts with the protein. A system, method and recording medium were developed.

본 발명은 상호작용면체를 기반으로 하여 단백질과 상호작용하는 물질을 검색하기 위한 것이다.The present invention is to search for a substance that interacts with the protein based on the interacting polyhedron.

본 발명에서 "상호작용면체"는 제 1 분석 대상물(단백질, 단백질 도메인 또는 화합물)을 구성하는 원자와 제 2 분석 대상물(단백질, 단백질 도메인 또는 화합 물)을 구성하는 원자들 중 접촉하는 원자들의 그룹을 의미하는 것으로서, 유클리디안 거리 방법(Euclidean distance Method), 기하학적 다이어그램(예: Voronoi Diagram) 또는 접근가면 알고리즘(Accessible Surface Area)에 의해 정의된다. 이하, 상기 알고리즘을 상세하게 설명한다.In the present invention, “interactive icosahedron” refers to a group of atoms contacting among atoms constituting the first analyte (protein, protein domain or compound) and atoms constituting the second analyte (protein, protein domain or compound). It is defined by the Euclidean distance method, geometric diagram (eg, Voronoi Diagram) or accessible surface area (Accessible Surface Area). The algorithm is described in detail below.

(i) 유클리디안 거리 방법: 제 1 분석 대상물을 구성하는 각 원자별로 제 2 분석 대상물을 구성하는 원자와의 거리에 따른 상호작용 여부를 확인하여 상호작용하는 원자를 선별하는 방법으로 이렇게 선별된 원자들이 수집되면 상호작용면을 형성하게 된다.(i) Euclidean distance method: Each atom constituting the first analyte is selected in this manner by checking whether or not interacting according to the distance with the atoms constituting the second analyte. When atoms are collected, they form an interaction surface.

(ii) 기하학적 다이어그램: 제 1 분석 대상물을 구성하는 각 원자별로 제 2 분석 대상물을 구성하는 각 원자와의 원자간 거리의 절반에 해당하는 지점을 연결한 것으로 상기 지점을 연결함으로써 제 1 분석 대상물과 제 2 분석 대상물 간의 상호작용면을 형성할 수 있다.(ii) geometric diagram: a point corresponding to half of the distance between atoms of each atom constituting the second analyte for each atom constituting the first analyte, which is connected to the first analyte by connecting the points; Interaction planes between the second analytes can be formed.

(iii) 접근가면 알고리즘: 제 1 분석 대상물과 제 2 분석 대상물이 분리된 상태일 때 물 분자와 접촉하는 원자를 각각 선별한 후 이들이 결합된 상태일 때 물 분자와 접촉하는 원자를 선별한다. 전자에서 선별되었으나, 후자에서 선별되지 않은 원자들의 군이 제 1 분석 대상물과 제 2 분석 대상물간의 상호작용면을 이루게 된다.(iii) Approach mask algorithm: Atoms are selected for contacting the water molecules when the first analyte and the second analyte are separated, and then atoms that contact the water molecules when they are bound. A group of atoms selected from the former but not selected from the latter constitutes an interaction plane between the first analyte and the second analyte.

"상호작용면체"에 대한 보다 상세한 설명은 본 출원인이 2005년 12월 12일자로 출원한 바 있는 대한민국특허출원 2005-0121684호로부터 참조할 수 있다.A more detailed description of “interactive icosahedron” can be referred to from Korean Patent Application No. 2005-0121684, filed December 12, 2005 by the applicant.

본 발명은 이상의 상호작용면체를 기반으로 하여 아래에서 설명되는 시스템 및 방법과 이를 위한 기록매체를 이용하여 임의의 단백질과 상호작용하는 물질을 검색할 수 있다.The present invention can search for a substance that interacts with any protein using the system and method described below and the recording medium therefor based on the above-described interacting polyhedron.

본 발명의 한 관점은 제어부; 단백질에 대한 정보, 상호작용면체에 대한 정보, 화합물에 대한 정보를 저장하고 있는 데이터베이스; I/O 인터페이스; 검색 대상 단백질의 아미노산 서열이 입력됨에 따라 데이터베이스를 참조하여 상기 단백질의 3차원 구조를 생성하고, 이로부터 표면 구조를 추출한 후 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하여 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체로 추출하는 상호작용면체 추출 장치; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응하는 상호작용면체를 가진 물질을 추출하는 상호작용물질 추출 장치; 및/또는 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하는 도킹 에너지 계산 장치; 및 저장수단을 포함하여 구성되는 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 시스템을 제공한다.One aspect of the invention is a control unit; A database that stores information about proteins, information about interacting polyhedrons, and information about compounds; I / O interface; As the amino acid sequence of the protein to be searched is input, a three-dimensional structure of the protein is generated by referring to a database, a surface structure is extracted from the protein, and the surface structure and each of the interacting polyhedrons stored in the database are matched to a specified value or more. An interfacial extraction apparatus for extracting an interfacial surface of the protein into an interfacial surface of the protein; An interaction material extraction device for extracting a material having an interaction face corresponding to the interaction face of the protein to be searched from the database; And / or a docking energy calculation device for docking a material selected from the interacting surface of the protein to be searched and the database and calculating energy at docking; And it provides a search system for a substance that interacts with the protein based on the interacting surface is configured to include a storage means.

본 발명에 따른 검색 시스템이 도킹 에너지 계산 장치를 포함한다는 것을 전제로 하여, 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하는 데이터베이스로부터 도킹하고자 하는 일련의 물질을 선별하는 선도 물질 선별 장치를 추가로 포함하여 구성되는 것이 바람직하다.On the premise that the search system according to the present invention includes a docking energy calculation device, a series of substances to be docked from a database that docks a selected material from the database and the surface of the interacting polyhedron of the protein to be searched and calculates the energy at the time of docking It is preferred to further comprise a lead material sorting device for sorting.

본 발명의 다른 관점은 검색 대상 단백질의 아미노산 서열을 입력하는 단계; 상기 단백질의 3차원 구조를 생성하는 단계; 상기 생성된 3차원 구조로부터 표면 구조를 추출하는 단계; 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하는 단계; 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체를 추출하는 단계; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응되는 상호작용면체를 가진 물질을 추출하는 단계; 및/또는 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 단계를 포함한 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 방법을 제공한다.Another aspect of the invention comprises the steps of inputting the amino acid sequence of the protein to be searched; Generating a three-dimensional structure of the protein; Extracting a surface structure from the generated three-dimensional structure; Matching the surface structure with each of the interacting cubes stored in the database; Extracting the interacting polyhedron of the protein from the interacting polyhedron matching the specified value or more; Extracting a substance having an interaction cube corresponding to the interaction cube of the protein to be searched from the database; And / or docking a material selected from the database and the interacting surface of the protein to be searched and calculating the energy at docking to select a material that docks below a specified energy. Provide a method of searching for a substance.

본 발명에 따른 검색 방법이 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 단계를 포함하는 것을 전제로 하여, 상기 단계에 앞서 데이터베이스로부터 도킹하고자 하는 일련의 화합물을 선별하는 단계를 추가로 포함하는 것이 바람직하다.On the premise that the search method according to the present invention includes the step of docking a selected substance from the interacting surface of the protein to be searched and the database, calculating the energy at the time of docking, and selecting a substance that docks below a specified energy. Preferably, the method further comprises the step of selecting a series of compounds to be docked from a database.

본 발명의 또 다른 관점은 검색 대상 단백질의 아미노산 서열이 입력됨에 따라 데이터베이스를 참조하여 3차원 구조를 생성하는 기능; 상기 생성된 3차원 구조로부터 표면 구조를 추출하는 기능; 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하는 기능; 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체를 추출하는 기능; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응되는 상호작용면체를 가진 물질을 추출하는 기능; 및/또는 검 색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 기능을 순차적으로 실행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공한다.Another aspect of the present invention provides a function of generating a three-dimensional structure with reference to a database as an amino acid sequence of a search target protein is inputted; Extracting a surface structure from the generated three-dimensional structure; Matching the surface structure with each of the interacting cubes stored in the database; Extracting the interacting polyhedron of the protein from the interacting polyhedron matching the specified value or more; Extracting a substance having an interacting body corresponding to the interacting body of the protein to be searched from the database; And / or a computer program for sequentially executing the function of docking a selected substance from the interacting surface of the protein to be searched and the database, calculating the energy at the docking time, and selecting a substance that docks below a specified energy. Provides a record medium that can be.

본 발명에 따른 기록매체가 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 기능을 포함하는 것을 전제로 하여, 상기 기능에 앞서 데이터베이스로부터 도킹하고자 하는 일련의 화합물을 선별하는 기능을 추가로 실행하는 것이 바람직하다.On the premise that the recording medium according to the present invention includes a function of docking a material selected from an interacting surface of a protein to be searched and a database, and calculating a energy at docking to select a material that docks below a specified energy. Prior to this it is desirable to further perform the function of selecting a series of compounds to be docked from the database.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 의한 검색 시스템의 구성도이다.1 is a block diagram of a search system according to an embodiment of the present invention.

도시한 바와 같이, 상호작용면체를 기반으로 한 상호작용물질 검색 시스템(100)은 데이터 신호 및 제어 신호 송수신 등 전체적인 동작을 제어하는 제어부(110), 단백질의 아미노산 서열과 그에 상응하는 3차원 구조에 대한 정보, 상호작용면체와 상기 상호작용면체가 어떤 대상물 간에 형성된 것인지에 대한 정보, 화합물의 명칭, 구조 및 성질에 대한 정보 등을 저장하고 있는 데이터베이스(120), 모니터, 키보드, 마우스 등과 같은 입출력 장치(도시하지 않음)와 상호작용물질 검색 시스템(100) 간의 접속을 위한 I/O 인터페이스(130), 검색 대상 단백질의 아미 노산 서열이 I/O 인터페이스(130)를 통해 입력됨에 따라 데이터베이스(120)를 참조하여 상기 단백질의 3차원 구조를 생성하고, 이로부터 표면 구조를 추출하여 나타낸 후 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하여 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체로 추출하는 상호작용면체 추출 장치(140), 검색 대상 단백질의 상호작용면체에 대응하는 상호작용면체를 가진 물질을 데이터베이스로부터 선택하는 상호작용물질 추출 장치(150), 데이터베이스로부터 도킹하고자 하는 일련의 물질을 선별하는 선도물질 선별 장치(160), 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질(예, 선도물질)을 도킹하고 도킹시의 에너지를 계산하는 도킹 에너지 계산 장치(170) 및 상호작용물질 검색 시스템(100)의 동작에 필요한 정보, 검색 대상 단백질의 상호작용면체에 대한 정보, 상기 상호작용면체에 대응되는 상호작용면체를 가진 물질에 대한 정보 등을 저장하기 위한 저장 수단(180)을 포함하여 구성된다.As shown, the interacting substance search system 100 based on the interacting surface is a control unit 110 that controls the overall operation such as data signal and control signal transmission and reception, the amino acid sequence of the protein and the corresponding three-dimensional structure An input / output device such as a database 120, a monitor, a keyboard, a mouse, and the like, which stores information on information about an object, a structure, and properties of the compound, and information on the object and the object. I / O interface 130 for connection between the interactor search system 100 and the amino acid sequence of the protein to be searched is input through the I / O interface 130. The three-dimensional structure of the protein is generated by reference, and the surface structure is extracted and displayed therefrom. An interactive polyhedron extracting apparatus 140 for extracting an interactive polyhedron matching each of the loaded interactive polyhedrons by a specified value or more, into an interactive polyhedron of the protein; Interactive material extraction device 150 for selecting a substance from the database, a leading material screening device 160 for selecting a series of materials to be docked from the database, a material selected from the database and the interacting surface of the protein to be searched (e.g., Leading material) and information necessary for the operation of the docking energy calculation device 170 and the interactive substance search system 100 that calculates the energy at the time of docking, information on the interacting polyhedron of the protein to be searched, the interacting polyhedron Storage means 180 for storing information about a material having an interacting surface corresponding to It is configured.

여기서는 사용자가 검색 대상 단백질의 아미노산 서열을 입력하면, 공지된 단백질의 아미노산 서열과 그에 상응하는 3차원 구조를 참조하여 상기 단백질의 3차원 구조를 생성하고, 공지된 상호작용면체를 참조하여 검색 대상 단백질의 상호작용면체를 추출한 후 상기 상호작용면체와 상호작용하는 물질(예, 공지 화합물)을 검색한다. 이를 위하여, 본 발명에서 적용되는 데이터베이스(120)는 단백질의 아미노산 서열과 그에 상응하는 3차원 구조에 대한 정보 등이 저장된 단백질 DB(122), 상호작용면체와 상기 상호작용면체가 어떤 대상물들 간에 형성된 것인지에 대한 정보 등이 저장된 상호작용면체 DB(124), 화합물 명칭, 구조 및 성질 등에 대한 정보가 저장된 화합물 DB(126)를 포함하도록 구현한다. 상기 상호작용면체 DB로서 본 출원인이 2005년 12월 12일자로 출원한 바 있는 대한민국특허출원 2005-0121684호에 개시된 기술에 의해 구축된 상호작용면체 DB가 이용될 수 있다.In this case, when a user inputs an amino acid sequence of a protein to be searched, a three-dimensional structure of the protein is generated by referring to an amino acid sequence of a known protein and a corresponding three-dimensional structure, and a protein to be searched by referring to a known interaction polyhedron. After extracting the interacting octahedron of the substance to search for interacting with the interacting (eg known compound). To this end, the database 120 applied in the present invention is a protein DB 122, the interacting octahedra and the interaction hexahedral are formed between any object that stores information about the amino acid sequence of the protein and the corresponding three-dimensional structure, etc. It is implemented to include a compound DB 126, which stores information on the interaction, etc., which is stored in the tetrahedron DB 124, and the compound name, structure and properties. As the interacting surface DB, an interacting surface DB constructed by the technology disclosed in Korean Patent Application No. 2005-0121684 filed by the applicant on December 12, 2005 may be used.

또한, 상호작용면체 추출 장치(140)는 3차원 구조 생성부(142), 표면 구조 추출부(144) 및 상호작용면체 매칭부(146)를 포함하여 이루어진다. 3차원 구조 생성부(142)는 I/O 인터페이스(130)를 통하여 검색 대상 단백질의 아미노산 서열이 입력되면, 제어부(110)의 제어에 의해 데이터베이스(120)를 조회하여 상기 아미노산 서열과 가장 유사한 아미노산 서열을 가진 단백질을 추출한 후, 검색 대상 단백질의 아미노산 서열에 근거하여 앞서 추출된 단백질의 3차원 구조를 적합하게 변형시켜 검색 대상 단백질의 3차원 구조를 생성한다.In addition, the interactive icosahedral extraction apparatus 140 includes a three-dimensional structure generator 142, a surface structure extractor 144, and an interactive icosahesis matching unit 146. When the amino acid sequence of the search target protein is input through the I / O interface 130, the 3D structure generating unit 142 inquires the database 120 under the control of the controller 110 to determine the amino acid most similar to the amino acid sequence. After extracting the protein having the sequence, the three-dimensional structure of the protein previously extracted based on the amino acid sequence of the protein to be searched is appropriately modified to generate the three-dimensional structure of the protein to be searched.

검색 대상 단백질의 3차원 구조가 생성되면, 표면 구조 추출부(144)는 상기 3차원 구조로부터 표면 구조만을 추출한다. 이러한 표면 구조 추출부(144)는 실질적으로 단백질의 표면이 대상물과의 상호작용에 관여하기 때문에 필요하다. 한 양태로서, 표면 구조 추출부(144)는 접근가면 알고리즘을 이용하여 검색 대상 단백질의 3차원 구조로부터 표면 구조만을 추출할 수 있다. 상기 알고리즘은 단백질의 3차원 구조에 물을 굴려서 각각의 아미노산별로 물과 닿는 면적을 계산하고, 실험적으로 그 아미노산이 물과 접촉할 수 있는 최대 면적을 구하여 두 면적의 차이가 유의 수준 이상일 경우 해당 아미노산은 표면에 존재하는 아미노산으로 추출한다.When the three-dimensional structure of the protein to be searched is generated, the surface structure extractor 144 extracts only the surface structure from the three-dimensional structure. The surface structure extracting unit 144 is necessary because the surface of the protein is substantially involved in the interaction with the object. In one embodiment, the surface structure extraction unit 144 may extract only the surface structure from the three-dimensional structure of the protein to be searched using an access mask algorithm. The algorithm calculates the area in contact with water for each amino acid by rolling water on a three-dimensional structure of the protein, and experimentally obtains the maximum area that the amino acid can contact with water. Extracted with amino acids present on the surface.

검색 대상 단백질의 3차원 구조로부터 표면 구조가 추출되면, 상호작용면체 매칭부(146)는 제어부(110)의 제어에 의해 데이터베이스(120)에 저장된 모든 상호 작용면체를 개별적으로 상기 표면 구조와 매칭하고, 사용자에 의해 지정된 값 이상으로 매칭하는 상호작용면체를 검색 대상 단백질의 상호작용면체로 추출한다. 한 양태로서, 매칭부(146)는 구조비교 알고리즘을 이용하여 검색 대상 단백질의 3차원 구조로부터 추출된 표면 구조와 데이터베이스(120)에 저장된 모든 상호작용면체를 개별적으로 매칭할 수 있다. 구조비교 알고리즘은 두 매칭 대상물의 2차 서열에 대한 정렬 이후, 유의미한 정렬 결과에 해당되는 3차 구조를 변환(transformation), 회전하여 두 매칭 대상물의 3차 구조를 중첩하여 보았을 때 해당 좌표의 편차의 값으로 구조 비교에 대한 결과를 제시한다. 이렇게 얻은 결과 값들 중 사용자에 의해 지정된 값 이상으로 매칭하는 상호작용면체를 검색 대상 단백질의 상호작용면체로 추출한다.When the surface structure is extracted from the three-dimensional structure of the protein to be searched, the interactive facet matching unit 146 individually matches all the surface facets stored in the database 120 with the surface structure under the control of the controller 110. Then, the interacting polyhedron matching the value specified by the user or more is extracted as the interacting polyhedron of the searched protein. As an aspect, the matching unit 146 may individually match the surface structure extracted from the three-dimensional structure of the protein to be searched and all the interacting cubes stored in the database 120 using a structure comparison algorithm. The structure comparison algorithm transforms and rotates the tertiary structure corresponding to the significant alignment result after the alignment of the secondary sequences of the two matching objects. By value the results of the structure comparison are presented. Among the obtained values, the interacting polyhedron matching the value specified by the user or more is extracted as the interacting polyhedron of the target protein.

이렇게 하여, 검색 대상 단백질의 상호작용면체가 추출되면, 상호작용물질 추출 장치(150)는 제어부(110)의 제어에 의해 데이터베이스에 저장된 상기 상호작용면체에 대응되는 상호작용면체를 가진 물질을 추출하고, 그 결과를 I/O 인터페이스(130)를 통해 출력한다. 전술된 바와 같이 본 발명의 데이터베이스(120)는 상호작용면체에 대한 정보 뿐만 아니라 상기 상호작용면체가 어떤 대상물들 간에 형성된 것인지에 정보를 보유하고 있기 때문에, 일단 검색 대상 단백질의 상호작용면체가 추출되면, 검색 대상 단백질과 상호작용하는 물질을 추출하는 것이 가능하다.In this way, when the interacting polyhedron of the protein to be searched is extracted, the interacting substance extraction apparatus 150 extracts a material having the interacting polyhedron corresponding to the interacting polyhedron stored in the database under the control of the controller 110 and The result is output through the I / O interface 130. As described above, since the database 120 of the present invention holds not only information about interacting cubes but also information on which objects the interacting cubes are formed between, once the interacting cubes of the protein to be searched are extracted, It is possible to extract substances that interact with the protein of interest.

한편, 본 발명의 검색 시스템이 후술되는 도킹 에너지 계산 장치(170)를 포함하는 것을 전제로 하여, 선도물질 선별 장치(160)를 추가로 포함하는 것이 바람직하다. 이러한 선도물질 선별 장치(160)는 도킹 에너지 계산 장치(170)가 검색 대상 단백질의 상호작용면체와 데이터베이스에 저장된 물질들 중 특정한 조건에 부합하는 물질만을 도킹하고자 할 경우에 본 발명에 따른 검색 시스템에 도입되는 것이 바람직하다. 선도물질 선별 장치(160)는 제어부(110)의 제어에 의해 데이터베이스에 저장된 물질로부터 검색 대상 단백질의 상호작용면체와 도킹하고자 하는 일련의 물질(즉, 선도물질)을 선택하게 된다. 선도물질은 사용자가 임의로 지정한 조건에 의해 결정되는 것으로서, 예를 들면 특정 분자량 이상 또는 이하의 물질, 특정 부(moiety)를 가진 물질 또는 특정 화학 결합을 가진 물질일 수 있다.On the other hand, it is preferred that the search system of the present invention further includes a lead material sorting device 160 on the premise that the docking energy calculation device 170 to be described later. The lead material sorting device 160 is used in the search system according to the present invention when the docking energy calculation device 170 wants to dock only materials meeting specific conditions among the interacting polyhedron of the searched protein and the material stored in the database. It is preferred to be introduced. The lead substance selection device 160 selects a series of substances (ie, lead substances) to be docked with the interacting surface of the protein to be searched from the substances stored in the database under the control of the controller 110. The lead material is determined by conditions arbitrarily designated by the user, and may be, for example, a material having a specific molecular weight or more, a material having a certain moiety, or a material having a specific chemical bond.

아울러, 도킹 에너지 계산 장치(170)는 도킹부(172)와 에너지 계산부(173)를 포함하여 이루어진다. 앞서 상호작용면체 추출 장치(140)에 의해 검색 대상 단백질의 상호작용면체가 추출되고, 제어부(110)의 제어에 의해 데이터베이스로부터 소정의 물질이 선택되거나, 본 발명의 검색 시스템이 상술된 선도물질 선별 장치(160)를 포함하고 있어 선도물질 선별 장치(160)에 의해 데이터베이스로부터 도킹하고자 하는 선도물질이 선택되면, 도킹부(172)는 제어부(110)의 제어에 의하여 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질 또는 선도물질을 개별적으로 도킹한다.In addition, the docking energy calculation device 170 includes a docking unit 172 and the energy calculation unit 173. The interacting surface of the protein to be searched is extracted by the interacting surface extracting apparatus 140, and a predetermined substance is selected from a database under the control of the controller 110, or the screening system of the present invention is selected as the leading substance. When the lead material to be docked is selected from the database by the lead material sorting device 160, the docking unit 172 is controlled by the control unit 110 and the interacting surface of the protein to be searched Individually dock the selected material or lead material from the database.

에너지 계산부(174)는 데이터베이스로부터 선택된 물질 또는 선도물질 별로 상호작용면체와 도킹할 때의 에너지를 계산하고, 그 값은 I/O 인터페이스(130)를 통하여 출력한다. 한 양태로서, 에너지 계산부(174)는 데이터베이스로부터 선택된 소정의 물질 또는 선도물질이 상호작용면체와 도킹할 때, 정확한 위치와 방향을 다음의 수학식 1을 이용하여 계산할 수 있다.The energy calculation unit 174 calculates the energy at the time of docking with the interacting surface for each material or lead material selected from the database, and outputs the value through the I / O interface 130. As an aspect, the energy calculation unit 174 may calculate the exact position and direction by using Equation 1 below when a predetermined material or lead material selected from the database docks with the interacting surface.

E bind = E vdw + E elec E bind = E vdw + E elec

도킹 에너지(E bind)는 거리에 대한 함수(E vdw)와 전기적 에너지에 대한 함수(E elec)로 나눌 수 있다. 여기서, 거리 함수는 통계적 반데르발스(van der Waals) 에너지로 표현되는데, 상호작용면체의 원자와 선도물질 원자 간의 거리에 의한 인력과 척력을 나타낸다. 전기적 에너지(electrostatic energy) 함수는 도킹 원자 사이의 정전기적 에너지에 대한 표현으로, 양전하량과 음전하량 사이의 인력과 척력을 나타낸다.Docking energy ( E bind ) can be divided into a function of distance ( E vdw ) and a function of electrical energy ( E elec ). Here, the distance function is expressed as statistical van der Waals energy, which represents the attractive force and repulsive force by the distance between the interacting atoms and the leading material atoms. The electrostatic energy function is a representation of the electrostatic energy between the docking atoms and represents the attractive force and repulsive force between the positive and negative charges.

도 2는 본 발명에 의한 상호작용물질 검색 방법을 설명하기 위한 흐름도이다.2 is a flowchart illustrating a method for searching for an interactive substance according to the present invention.

먼저, 사용자가 입력 장치를 통해 검색 대상 단백질의 아미노산 서열을 입력한다(S110). 단백질의 아미노산 서열 입력 시에는 예를 들어, 키보드 등을 조작하여 직접 입력하거나, 데이터베이스(120)에 저장된 단백질의 아미노산 서열 리스트로부터 검색 대상 단백질의 아미노산 서열을 선택하여 입력할 수도 있다.First, a user inputs an amino acid sequence of a search target protein through an input device (S110). When the amino acid sequence of the protein is input, for example, a keyboard or the like may be directly inputted, or the amino acid sequence of the protein to be searched may be selected and input from the amino acid sequence list of the protein stored in the database 120.

검색 대상 단백질의 아미노산 서열이 입력됨에 따라, 3차원 구조 생성부(142)는 데이터베이스(120)를 조회하여 검색 대상 단백질의 아미노산 서열과 가장 유사한 아미노산 서열을 갖는 단백질을 선택하고, 검색 대상 단백질의 아미노산 서열을 참조하여 앞서 선택된 단백질의 3차원 구조를 적합하게 변형시켜서 검색 대 상 단백질의 3차원 구조를 생성한다(S120).As the amino acid sequence of the search target protein is input, the 3D structure generator 142 searches the database 120 to select a protein having an amino acid sequence most similar to the amino acid sequence of the search target protein, and the amino acid of the search target protein. By appropriately modifying the three-dimensional structure of the protein selected previously with reference to the sequence to generate a three-dimensional structure of the target protein (S120).

검색 대상 단백질의 3차원 구조가 생성되면, 표면 구조 추출부(144)는 검색 대상 단백질의 3차원 구조로부터 검색 대상 단백질과 대상물 간의 상호작용에 실질적으로 관여하는 표면 구조를 추출한다(S130).When the three-dimensional structure of the search target protein is generated, the surface structure extractor 144 extracts a surface structure substantially involved in the interaction between the search target protein and the target object from the three-dimensional structure of the search target protein (S130).

검색 대상 단백질의 3차원 구조로부터 표면 구조가 추출되면, 상호작용면체 매칭부(146)는 상기 검색 대상 단백질의 표면 구조와 데이터베이스에 저장된 상호작용면체를 개별적으로 매칭하고(S140), 여기서 지정된 값 이상으로 매칭하는 상호작용면체를 검색 대상 단백질의 상호작용면체로 추출한다(S150).When the surface structure is extracted from the three-dimensional structure of the protein to be searched, the interactive facet matching unit 146 individually matches the surface of the protein to be searched and the interacting facets stored in the database (S140), and the value specified or more. By matching the matching polyhedron is extracted as the interaction polyhedron of the target protein (S150).

이렇게 하여 검색 대상 단백질의 상호작용면체가 추출되면, 데이터베이스(120)를 참조하여 상기 상호작용면체에 대응되는 상호작용면체를 가진 물질들을 선별한다(S160). 본 발명의 데이터베이스(120)는 상호작용면체에 대한 정보 뿐만 아니라 상기 상호작용면체가 어떤 대상물들 간에 형성된 것인지에 정보를 보유하고 있기 때문에, 일단 검색 대상 단백질의 상호작용면체가 추출되면, 검색 대상 단백질과 상호작용하는 물질을 추출하는 것이 가능하다.In this way, when the interacting polyhedron of the protein to be searched is extracted, the materials having the interacting polyhedron corresponding to the interacting polyhedron are selected with reference to the database 120 (S160). Since the database 120 of the present invention retains not only information about the interacting polyhedron but also information on which objects the interacthedron is formed between, once the interacting polyhedron of the protein to be searched is extracted, It is possible to extract the interacting substance.

한편, 본 발명의 검색 방법이 후술되는 단계(S180-S200)를 포함하는 것을 전제로 하여, 선도물질 선별 장치(160)가 데이터베이스에 저장된 물질들 중에서 앞서 추출된 검색 대상 단백질의 상호작용면체에 도킹하고자 하는 일련의 물질들을 사용자가 지정한 일정 기준에 따라 선택하는 단계를 포함하는 것이 바람직하다(S170). 상기 단계(S170)는 다음 단계(S180 및 S190)에서 검색 대상 단백질의 상호작용면체와 데이터베이스에 저장된 물질들 중에서 특정한 조건에 부합하는 물질들만을 도킹 하고자 하는 경우에 본 발명에 따른 검색 방법에 도입되는 것이 바람직하다.On the other hand, on the premise that the search method of the present invention includes the steps (S180-S200) to be described later, the lead material screening device 160 is docked on the interacting surface of the previously searched protein from the substances stored in the database It is preferable to include a step of selecting a series of materials to be selected according to a user specified criteria (S170). The step (S170) is introduced to the search method according to the present invention in the case that the next step (S180 and S190) to dock only those substances that meet a specific condition among the material of the interacting polyhedron and the database stored in the database to be searched It is preferable.

이렇게 하여 먼저 검색 대상 단백질의 상호작용면체가 추출되고, 데이터베이스에 저장된 소정의 물질이 선택되거나, 선도물질 추출 장치(160)로부터 선도물질이 선택되면, 도킹 에너지 계산 장치(170)는 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 소정의 물질 또는 선도물질을 개별적으로 도킹하고(S180), 도킹시 에너지 값을 계산한다(S190). 이어서, 사용자에 의해 지정된 에너지 값 이하로 도킹하는 데이터베이스로부터 선택된 소정의 물질 또는 선도물질을 상호작용물질로 선별하는데(S200), 이러한 물질이 검색 대상 단백질과 상호작용할 것으로 예측되기 때문이다.In this way, when the interacting surface of the protein to be searched is first extracted, and a predetermined material stored in the database is selected, or a lead material is selected from the lead material extracting device 160, the docking energy calculation device 170 determines the The predetermined material or the leading material selected from the interacting surface and the database are individually docked (S180), and an energy value is calculated at docking (S190). Subsequently, a predetermined substance or a leading substance selected from a database docked below a specified energy value by the user is selected as an interacting substance (S200), because such a substance is expected to interact with a protein to be searched.

이상에서 설명한 상호작용물질 검색 시스템은 데이터베이스(120)가 각 시스템마다 독립적으로 구축되어 있기 때문에, 데이터베이스(120)가 변경되는 경우 이를 실시간으로 반영하기 어려운 점이 있다. 그러므로 데이터베이스(120)를 특정 서버 시스템에서 관리하고, 인터넷과 같은 통신망을 통해 데이터베이스(120)를 공유한다면, 데이터베이스(120)가 변경되더라도, 항상 최신의 데이터를 이용하여 상호작용물질을 검색할 수 있을 것으로 기대된다. 이를 위한 상호작용물질 검색 시스템을 도 3에 도시하였다.The interactive substance search system described above has a difficulty in reflecting this in real time when the database 120 is changed because the database 120 is independently established for each system. Therefore, if the database 120 is managed in a specific server system, and the database 120 is shared through a communication network such as the Internet, even if the database 120 is changed, it is always possible to search for the interactive substance using the latest data. It is expected to be. The interactive substance search system for this is shown in FIG. 3.

도 3은 본 발명에 따른 검색 시스템의 제 1 양태의 다른 실시예에 대한 구성도이다.3 is a block diagram of another embodiment of a first aspect of a search system according to the present invention.

본 실시예에 의한 상호작용물질 분석 시스템은 상호작용면체 추출 장치(140), 상호작용물질 추출 장치(150), 선도물질 선별 장치(160) 및 도킹 에너지 계산장치(170)가 구비된 개인용 컴퓨터(200), 개인용 컴퓨터(200)와 인터넷(400)과 같은 통신망을 통해 접속되는 정보제공 서버(300)를 포함한다.The interactive substance analyzing system according to the present embodiment includes a personal computer equipped with an interactive tetrahedral extraction device 140, an interactive substance extraction device 150, a leading material sorting device 160, and a docking energy calculation device 170. 200, the personal computer 200 and the information providing server 300 connected through a communication network such as the Internet 400.

개인용 컴퓨터(200)는 데이터 신호 및 제어 신호 송수신 등 전체적인 동작을 제어하기 위한 제어부(110), 모니터, 키보드, 마우스 등과 같은 입출력 장치(도시하지 않음)와 상호작용물질 검색 시스템(100)간의 접속을 위한 I/O 인터페이스(130), 검색 대상 단백질의 아미노산 서열이 I/O 인터페이스(130)를 통해 입력됨에 따라 데이터베이스(320)를 참조하여 상기 단백질의 3차원 구조를 생성하고, 이로부터 표면 구조를 추출하여 나타낸 후 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하여 지정된 값 이상으로 매칭하는 상호작용면체를 검색 대상 단백질의 상호작용면체로 추출하는 상호작용면체 추출 장치(140) 및 상기 추출된 상호작용면체에 대응되는 상호작용면체를 가진 단백질을 데이터베이스로부터 추출하는 상호작용물질 추출 장치(150), 데이터베이스로부터 도킹하고자 하는 일련의 물질을 선별하는 선도물질 선별 장치(160), 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질(예, 선도물질)을 도킹하고 도킹시의 에너지를 계산하는 도킹 에너지 계산 장치(170), 상호작용물질 검색 시스템(100)의 동작에 필요한 정보, 검색 대상 단백질의 상호작용면체에 대한 정보, 상기 상호작용면체에 대응되는 상호작용면체를 가진 물질에 대한 정보 등을 저장하기 위한 저장 수단(180) 및 인터넷(400)을 통해 정보제공 서버(300)와 접속하기 위한 통신망 인터페이 스(190)를 포함하여 구성된다.The personal computer 200 connects an input / output device (not shown) such as a control unit 110, a monitor, a keyboard, a mouse, and the like to control the overall operation such as transmitting and receiving data signals and control signals, and the interactive substance search system 100. As the amino acid sequence of the I / O interface 130 for the protein to be searched is input through the I / O interface 130, the three-dimensional structure of the protein is generated with reference to the database 320, and the surface structure is derived therefrom. After extracting and representing the surface of the surface and the corresponding interaction cubes stored in the database to match the interaction polyhedron to extract more than a specified value to the interaction cube of the search target protein 140 and the extracted Interaction material extraction device 150 for extracting a protein having an interacting surface corresponding to the interacting surface from the database , A lead material selection device 160 for selecting a series of materials to be docked from a database, a docking energy for docking a selected material (eg, lead material) from a database and interacting facets of a protein to be searched and docking Stores information necessary for the operation of the calculation device 170, the interactive substance search system 100, information on the interacting polyhedron of the target protein, information on the material having the interacting polyhedron corresponding to the interacting polyhedron, etc. And a communication network interface 190 for connecting to the information providing server 300 through the storage means 180 and the Internet 400.

여기에서, 상호작용면체 추출 장치(140)는 3차원 구조 생성부(142), 표면 구조 추출부(144) 및 상호작용면체 매칭부(146)를 구비하며, 각 처리부의 기능 및 동작은 도 1에서 설명한 것과 유사하므로 구체적인 설명은 생략하기로 한다. 상호작용물질 추출 장치(150)의 경우에도 기능과 동작은 전술된 바와 유사하여 관련 설명은 생략하기로 한다.Here, the interactive icosahedral extraction apparatus 140 includes a three-dimensional structure generator 142, a surface structure extractor 144, and an interactive icosahesis matching unit 146, and the function and operation of each processing unit are illustrated in FIG. 1. Since it is similar to that described in the detailed description thereof will be omitted. In the case of the interactive substance extracting device 150, the functions and operations are similar to those described above, and thus the description thereof will be omitted.

한편, 선도물질 추출 장치(160)는 도킹 에너지 계산 장치(170)를 포함하는 것을 전제로 하여 도입되고, 도킹 에너지 계산 장치(170)는 도킹부(172) 및 에너지 계산부(174)를 구비하며, 각 장치와 처리부의 기능 및 동작은 도 1에서 설명한 것과 유사하므로 구체적인 설명은 생략하기로 한다.Meanwhile, the lead material extracting device 160 is introduced under the premise of including the docking energy calculating device 170, and the docking energy calculating device 170 includes a docking unit 172 and an energy calculating unit 174. Since the functions and operations of the devices and the processing units are similar to those described in FIG. 1, detailed descriptions thereof will be omitted.

한편, 정보제공 서버(300)는 제어부(310), 통신망 인터페이스(330) 및 데이터베이스(320)를 포함하여 구성된다. 데이터베이스(320)는 단백질의 아미노산 서열정보와 그에 상응하는 3차원 구조 정보 등이 저장된 단백질 DB(122), 상호작용면체와 상기 상호작용면체가 어떤 대상물 간에 형성된 것인지에 대한 정보 등이 저장된 상호작용면체 DB(124) 및 화합물의 명칭, 구조 및 성질에 대한 정보 등이 저장된 화합물 DB(126)를 포함하도록 구현한다.Meanwhile, the information providing server 300 includes a controller 310, a communication network interface 330, and a database 320. The database 320 includes a protein DB 122 in which amino acid sequence information of a protein and corresponding three-dimensional structure information are stored, and an interaction polyhedron DB in which information about an interaction polyhedron and an object of the interaction polyhedron is formed is stored. 124 and information about the name, structure, and properties of the compound, and the like, including the stored compound DB 126.

본 실시예에서는 상호작용 분석 물질의 기초가 되는 단백질의 아미노산 서열, 3차원 구조, 상호작용면체에 대한 정보 등을 정보제공 서버(300)에서 중앙 집중식으로 관리하기 때문에 새로운 단백질, 상호작용면체가 발견되는 경우 데이터베이스(320)의 일괄적 갱신이 용이하며, 각 개인용 컴퓨터(200) 사용자가 최신의 3차 원 정보를 이용하기 편리한 이점이 있다.In this embodiment, since the information providing server 300 centrally manages the amino acid sequence, the three-dimensional structure, and the information about the interacting surface of the protein that is the basis of the interaction analysis material, new proteins and interacting surfaces are discovered. In this case, it is easy to update the database 320 collectively, and the user of each personal computer 200 may use the latest three-dimensional information.

아울러, 상호작용면체 추출 장치(140), 상호작용물질 추출 장치(150), 선도물질 선별 장치(160), 도킹 에너지 계산 장치(170)는 개인용 컴퓨터(200)에 접속되는 독립적인 장치로 구성하는 것도 가능하지만, 이러한 기능을 수행할 수 있는 하나의 소프트웨어를 구성하는 것도 가능하다. 상호작용면체 추출 장치(140), 상호작용물질 추출 장치(150), 선도물질 선별 장치(160), 도킹 에너지 계산 장치(170)의 기능을 갖는 소프트웨어도 제작하는 경우, 정보제공 서버(300)에서 이를 요구하는 사용자에게 다운로드하여 주고, 사용자가 개인용 컴퓨터(200)에 이를 설치한 후 상호작용물질 검색에 사용하도록 하거나, 플로피 디스크, CD, DVD 등과 같은 모든 가능한 기록매체에 저장된 형태로 제작하는 것도 가능하다.In addition, the interactive icosahedral extraction device 140, the interaction material extraction device 150, the lead material screening device 160, the docking energy calculation device 170 is composed of an independent device connected to the personal computer 200 It is also possible, but it is also possible to configure one software that can perform this function. In the case of producing software having the functions of the interfacial extraction device 140, the interaction material extraction device 150, the leading material sorting device 160, the docking energy calculation device 170, the information providing server 300 It can be downloaded to the user who requests it, and the user can install it on the personal computer 200 and use it for searching for interactive substances, or it can be produced in a form stored in all possible recording media such as floppy disk, CD, DVD, and the like. Do.

도 4는 본 발명의 검색 방법에 따라 Bak 단백질과 상호작용하는 물질을 검색하는 과정 및 결과를 나타낸 것이다.Figure 4 shows the process and results of searching for substances that interact with Bak protein according to the search method of the present invention.

도 4a에 나타낸 Bak 단백질의 아미노산 서열이 입력됨에 따라 데이터베이스를 조회하여 상기 아미노산 서열과 가장 유사한 아미노산 서열을 가진 단백질을 찾아내고, 이 단백질의 3차원 구조를 Bak 단백질의 아미노산 서열을 참조하여 변형하여 Bak 단백질의 3차원 구조를 생성하였다(도 4b 참조). 이렇게 하여 생성된 Bak 단백질의 3차원 구조로부터 도 4c에 나타낸 바와 같이 표면 구조만을 추출하였다. 이어서, 데이터베이스에 저장된 상호작용면체를 개별적으로 상기 Bak 단백질의 표면 구조에 매칭하여 지정된 값 이상으로 매칭하는 상호작용면체를 선택하였다. 그 상호작용면체 lfnv_dlfnval_dlfnvbl_A가 결국 Bak 단백질의 상호작용면체로 추출되었고(도 4d 참조), 도면으로 나타내지 않았지만, 상기 작용면체에 대응되는 lfnv_dlfnval_dlfnvbl_B를 가진 물질은 모두 Bak 단백질과 상호작용하는 것으로 예측가능하다.As the amino acid sequence of the Bak protein shown in FIG. 4A is input, a database is searched to find a protein having an amino acid sequence most similar to the amino acid sequence, and the three-dimensional structure of the protein is modified with reference to the amino acid sequence of the Bak protein to Bak. The three-dimensional structure of the protein was generated (see FIG. 4B). Only the surface structure was extracted from the three-dimensional structure of the Bak protein thus produced, as shown in FIG. 4C. Subsequently, the interaction cubes stored in the database were individually matched to the surface structure of the Bak protein to select the interaction cubes matching the specified value or more. The icosahedron lfnv_dlfnval_dlfnvbl_A was eventually extracted into the icosahedron of Bak protein (see FIG. 4D), and although not shown in the figure, all substances with lfnv_dlfnval_dlfnvbl_B corresponding to the icosahedron could be predicted to interact with Bak protein.

도 5는 본 발명의 검색 방법에 따라 Bak 단백질과 상호작용하는 화합물을 검색하는 과정 및 결과를 나타낸 것이다.Figure 5 shows the process and results of searching for compounds that interact with Bak protein according to the search method of the present invention.

도 4d에 나타낸 상호작용면체 lfnv_dlfnval_dlfnvbl_A에 여러 선도물질을 도킹하고(도 5a 참조), 각 선도물질 별로 도킹시 에너지를 계산하여 이를 그래프로 도시하였다(도 5b 참조). 상기 그래프는 Y축이 에너지에 관한 것으로서, 그래프 중 우측 상단에 있는 에너지 값 -32로 도킹하는 선도물질이 상기 상호작용면체와 가장 안정적이고 강하게 상호작용하는 화합물임을 알 수 있었다.Several lead materials were docked in the interacting polyhedron lfnv_dlfnval_dlfnvbl_A shown in FIG. 4D (see FIG. 5A), and the energy at the time of docking for each lead material was calculated and shown graphically (see FIG. 5B). The graph shows that the Y-axis is related to energy, and the leading material docked with the energy value of -32 in the upper right corner of the graph is the compound that interacts most strongly and strongly with the interacting surface.

본 발명에 따른 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 시스템 및 방법과 이를 위한 기록매체를 이용하여 단백질 상호작용에 대한 분자 수준의 예측과 신약 선도물질에 대한 새로운 스크리닝 방법에 이용될 수 있다.A system and method for screening a substance interacting with a protein based on an icosahedron according to the present invention, and using a recording medium therefor, for a molecular level prediction of a protein interaction and a novel screening method for a new drug leader Can be.

Claims (9)

제어부;Control unit; 단백질에 대한 정보, 상호작용면체에 대한 정보, 화합물에 대한 정보를 저장하고 있는 데이터베이스;A database that stores information about proteins, information about interacting polyhedrons, and information about compounds; I/O 인터페이스;I / O interface; 검색 대상 단백질의 아미노산 서열이 입력됨에 따라 데이터베이스를 참조하여 상기 단백질의 3차원 구조를 생성하고, 이로부터 표면 구조를 추출한 후 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하여 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체로 추출하는 상호작용면체 추출 장치;As the amino acid sequence of the protein to be searched is input, a three-dimensional structure of the protein is generated by referring to a database, a surface structure is extracted from the protein, and the surface structure and each of the interacting polyhedrons stored in the database are matched to a specified value or more. An interfacial extraction apparatus for extracting an interfacial surface of the protein into an interfacial surface of the protein; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응하는 상호작용면체를 가진 물질을 추출하는 상호작용물질 추출 장치; 및An interaction material extraction device for extracting a material having an interaction face corresponding to the interaction face of the protein to be searched from the database; And 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하는 도킹 에너지 계산 장치; 및A docking energy calculation device for docking a material selected from an interacting polyhedron and a database of a search target protein and calculating energy at docking; And 저장수단을 포함하여 구성되는 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 장치.Apparatus for retrieving a substance interacting with a protein based on the interacting surface, including a storage means. 제 1항에 있어서,The method of claim 1, 데이터베이스로부터 도킹하고자 하는 일련의 물질을 선별하는 선도물질 선별 장치를 추가로 포함하여 구성되는 것을 특징으로 하는 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 장치.Searching apparatus for interacting with the protein based on the interacting surface, characterized in that it further comprises a leader screening device for selecting a series of materials to be docked from the database. 제 1항에 있어서,The method of claim 1, 상호작용면체 추출 장치는 접근 가면 알고리즘을 이용하여 검색 대상 단백질의 3차원 구조로부터 표면 구조를 추출하는 것을 특징으로 하는 검색 장치.The apparatus for extracting an interactive polyhedron extracts a surface structure from a three-dimensional structure of a protein to be searched using an access mask algorithm. 제 1항에 있어서,The method of claim 1, 상호작용면체 추출 장치는 구조 비교 알고리즘을 이용하여 검색 대상 단백질의 상호작용면체를 추출하는 것을 특징으로 하는 검색 장치.The apparatus for extracting an interacting polyhedron extracts the interacting polyhedron of a protein to be searched using a structure comparison algorithm. 제 1항에 있어서,The method of claim 1, 도킹 에너지 계산 장치는 다음 수학식 [1]Docking energy calculation device is the following equation [1] E bind = E vdw + E elec E bind = E vdw + E elec 을 이용하여 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질 간의 도킹시 에너지를 계산하는 것을 특징으로 하는 검색 장치.Searching device, characterized in that for calculating the docking energy between the interacting surface of the protein to be searched and the material selected from the database using. 검색 대상 단백질의 아미노산 서열을 입력하는 단계; Inputting an amino acid sequence of a protein to be searched for; 상기 단백질의 3차원 구조를 생성하는 단계;Generating a three-dimensional structure of the protein; 상기 생성된 3차원 구조로부터 표면 구조를 추출하는 단계;Extracting a surface structure from the generated three-dimensional structure; 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하는 단계;Matching the surface structure with each of the interacting cubes stored in the database; 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체를 추출하는 단계;Extracting the interacting polyhedron of the protein from the interacting polyhedron matching the specified value or more; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응되는 상호작용면체를 가진 물질을 추출하는 단계; 및Extracting a substance having an interaction cube corresponding to the interaction cube of the protein to be searched from the database; And 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 단계를 포함한 상호작용면체를 기반으로 한 단백질과 상호작용하는 물질의 검색 방법.Search for a substance that interacts with a protein based on an icosahedron, including docking the selected substance from the database and the database of the protein of interest, and calculating the energy at docking to select a substance that docks below the specified energy Way. 제 6항에 있어서,The method of claim 6, 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택한 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 단계에 앞서 데이터베이스로부터 도킹하고자 하는 일련의 화합물을 선별하는 단계를 추가로 포함하는 것을 특징으로 하는 검색 방법.Docking a selected material from the interacting polyhedron and database of the protein to be searched, calculating the energy at docking, and selecting a series of compounds to be docked from the database prior to selecting the material to dock below a specified energy. Search method comprising the. 검색 대상 단백질의 아미노산 서열이 입력됨에 따라 데이터베이스를 참조하여 3차원 구조를 생성하는 기능;A function of generating a three-dimensional structure by referring to a database as an amino acid sequence of a search target protein is input; 상기 생성된 3차원 구조로부터 표면 구조를 추출하는 기능;Extracting a surface structure from the generated three-dimensional structure; 상기 표면 구조와 데이터베이스에 저장된 각 상호작용면체를 매칭하는 기능;Matching the surface structure with each of the interacting cubes stored in the database; 지정된 값 이상으로 매칭하는 상호작용면체를 상기 단백질의 상호작용면체를 추출하는 기능;Extracting the interacting polyhedron of the protein from the interacting polyhedron matching the specified value or more; 데이터베이스로부터 검색 대상 단백질의 상호작용면체에 대응되는 상호작용면체를 가진 물질을 추출하는 기능; 및Extracting a substance having an interacting body corresponding to the interacting body of the protein to be searched from the database; And 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 기능을 순차적으로 실행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium in which a program for sequentially performing a function of docking a selected substance from a database and a database of a target protein to be searched, calculating an energy at docking, and selecting a substance that docks below a specified energy is recorded. . 제 8항에 있어서,The method of claim 8, 검색 대상 단백질의 상호작용면체와 데이터베이스로부터 선택된 물질을 도킹하고 도킹시의 에너지를 계산하여 지정된 에너지 이하로 도킹하는 물질을 선택하는 기능에 앞서 데이터베이스로부터 도킹하고자 하는 일련의 화합물을 선별하는 기능을 추가로 실행하는 것을 특징으로 하는 기록매체.In addition to the ability to dock a selected substance from the interacting polyhedron and database of the protein to be searched, calculate the energy at the time of docking, and select a substance that docks below the specified energy. A recording medium, characterized in that for executing.
KR1020060062631A 2006-07-04 2006-07-04 System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor KR100773055B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060062631A KR100773055B1 (en) 2006-07-04 2006-07-04 System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060062631A KR100773055B1 (en) 2006-07-04 2006-07-04 System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor

Publications (1)

Publication Number Publication Date
KR100773055B1 true KR100773055B1 (en) 2007-11-02

Family

ID=39060717

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060062631A KR100773055B1 (en) 2006-07-04 2006-07-04 System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor

Country Status (1)

Country Link
KR (1) KR100773055B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018097635A1 (en) * 2016-11-24 2018-05-31 한양대학교 산학협력단 Method for excavating new drug candidate targeting nonstructure-structure transition site and apparatus for excavating new drug candidate

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005000624A (en) * 2003-06-13 2005-01-06 Takashi Tokuno Incontinence preventive underpants

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005000624A (en) * 2003-06-13 2005-01-06 Takashi Tokuno Incontinence preventive underpants

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
공성삼, "싸이베이스와 인터페어:~", 한국과학기술원 석사논문, 2005.06.24

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018097635A1 (en) * 2016-11-24 2018-05-31 한양대학교 산학협력단 Method for excavating new drug candidate targeting nonstructure-structure transition site and apparatus for excavating new drug candidate

Similar Documents

Publication Publication Date Title
CN107038348B (en) Drug target prediction method based on protein-ligand interaction fingerprint
Lin et al. Efficient classification of hot spots and hub protein interfaces by recursive feature elimination and gradient boosting
CN106909807B (en) A kind of prediction technique based on multivariate data prediction drug targeting interactions between protein
Bradley et al. Improved beta‐protein structure prediction by multilevel optimization of nonlocal strand pairings and local backbone conformation
KR102576033B1 (en) Protein-ligand binding affinity prediction using ensemble of 3d convolutional neural network and system therefor
Weisel et al. Architectural repertoire of ligand‐binding pockets on protein surfaces
CN115938488A (en) Method for identifying protein allosteric modulator based on deep learning and computational simulation
Laine et al. Protein social behavior makes a stronger signal for partner identification than surface geometry
KR100773055B1 (en) System and method for searching materials interfacing with proteins based on interfaceome and recording medium therefor
KR100757040B1 (en) System and method for analysis of interfaces based on protein domain and recording medium therefor
Adamson et al. Optimizing low energy pathways in receptor-ligand binding with motion planning
Devaurs et al. A multi-tree approach to compute transition paths on energy landscapes
KR102571178B1 (en) Method for predict affinity between drug and target substance
WO2022099259A1 (en) Network approach to navigating the human genome
Hohm et al. A multiobjective evolutionary method for the design of peptidic mimotopes
WO2002020564A2 (en) A method for identifying peptide sequences having a specific functionality
Zhang A new hybrid Monte Carlo algorithm for protein potential function test and structure refinement
Moradi et al. Addressing the embeddability problem in transition rate estimation from Markov state models
Maali et al. Suitability of sequence-based feature vector for classification algorithm improves accuracy of human protein-protein interaction prediction: a red blood cell case study
Czejdo et al. Improvement of protein model scoring using grouping and interpreter for machine learning
Woltz et al. Methods for stable multimeric molecular dynamics simulation and modeling of cardiac SK2 channel function
CN116665807B (en) Molecular intelligent generation method, device, equipment and medium based on diffusion model
Mariano et al. Bioinformatics and Computational Biology Research at the Computer Science Department at UFMG
Alber et al. Integrative structure determination of protein assemblies by satisfaction of spatial restraints
Spiridon et al. Robosample: A software using constrained molecular dynamics coupled with Gibbs sampling to investigate macromolecules

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20120824

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131004

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141010

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20151029

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20171031

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180906

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20191030

Year of fee payment: 13