KR101606160B1 - 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램 - Google Patents

상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램 Download PDF

Info

Publication number
KR101606160B1
KR101606160B1 KR1020147034564A KR20147034564A KR101606160B1 KR 101606160 B1 KR101606160 B1 KR 101606160B1 KR 1020147034564 A KR1020147034564 A KR 1020147034564A KR 20147034564 A KR20147034564 A KR 20147034564A KR 101606160 B1 KR101606160 B1 KR 101606160B1
Authority
KR
South Korea
Prior art keywords
protein
structure information
compound
interaction
information
Prior art date
Application number
KR1020147034564A
Other languages
English (en)
Other versions
KR20150008179A (ko
Inventor
히로아키 기타노
군이 신
사믹 고슈
Original Assignee
각코호진 오키나와가가쿠기쥬츠다이가쿠인 다이가쿠가쿠엔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 각코호진 오키나와가가쿠기쥬츠다이가쿠인 다이가쿠가쿠엔 filed Critical 각코호진 오키나와가가쿠기쥬츠다이가쿠인 다이가쿠가쿠엔
Publication of KR20150008179A publication Critical patent/KR20150008179A/ko
Application granted granted Critical
Publication of KR101606160B1 publication Critical patent/KR101606160B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Computing Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Library & Information Science (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Peptides Or Proteins (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)

Abstract

본 발명은, 화합물 구조 정보를 취득하고, 화합물과의 상호 작용의 후보 단백질의 후보 단백질 구조 정보를 취득하며, 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 화합물의 결합 강도를 산출하고, 결합 강도의 종합 평가를 행함으로써 예측되는 결합 강도인 예측 결합 강도를 결정하며, 화합물과 상호 작용하는 것이 예측되는 후보 단백질인 예측 단백질을 결정하고, 결합 강도 시뮬레이션 방법을 이용하여 상호 작용 강도를 산출하며, 상호 작용 강도의 종합 평가를 행함으로써 예측되는 상호 작용 강도인 예측 상호 작용 강도를 결정한다.

Description

상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램{INTERACTION PREDICTION DEVICE, INTERACTION PREDICTION METHOD, AND PROGRAM}
본 발명은 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램에 관한 것이다.
종래부터, 생체 분자의 결합 예측을 행하는 기술이 개시되어 있다.
비특허문헌 1 및 2에 기재된 리간드 도킹 시스템에 있어서는, 리셉터 부위 내에서 각각 리간드 유래의 모든 강체 프래그먼트(fragment)를 도킹시킴으로써, 강체 프래그먼트의 원자 위치의 미세한 샘플링과, 회전 가능한 결합의 이면각의 연속적 미세 조정을 수반하는 유연한 도킹 알고리즘을 드래그 디자인에 적용하는 기술이 개시되어 있다.
Zsoldos Z, Reid D, Simon A, Sadjad BS, Johnson AP. eHiTS: an innovative approach to the docking and scoring function problems. Curr Protein Pept Sci. 2006 Oct;7(5):421-35. Zsoldos Z, Reid D, Simon A, Sadjad SB, Johnson AP. eHiTS: a new fast, exhaustive flexible ligand docking system. J Mol Graph Model. 2007 Jul;26(1):198-212. Epub 2006 Jun 17.
그러나, 비특허문헌 1 및 2에 기재된 종래의 리간드 도킹 시스템에 있어서는, 신약 개발의 후보 화합물이 주로 상호 작용하는 타깃 분자를 동정(同定)하지만, 대부분의 경우, 후보 화합물이 상호 작용하는 많은 생체 내 분자 중 하나 또는 극히 소수를 타깃 분자로서 인식할 뿐이라는 문제점을 갖고 있었다. 그 때문에, 종래의 리간드 도킹 시스템에 있어서는, 후보 화합물은, 어떤 의미에서 자의적으로 결정된 타깃 분자와만 상호 작용을 한다는 전제로, 신약 개발 프로세스가 진행되고, 신약 개발 기업 등의 연구자 등의 유저가 상정하는 후보 화합물의 효과와 실제의 효과에 괴리가 생기는 경우가 있다는 문제점을 갖고 있었다. 즉, 일반적으로 후보 화합물은, 단일의 생체 내 분자와만 상호 작용하는 것이 아니고, 많은 생체 내 분자와 여러 가지의 강도로 상호 작용하며, 이들의 종합적인 효과가 실제의 후보 화합물의 효과가 되기 때문이다.
본 발명은, 상기 문제점을 감안하여 이루어진 것이고, 화합물 등의 화학 물질이, 생체 내의 어느 단백질과 상호 작용하는지, 또한 그들의 상호 작용이 생체에 어떤 영향을 미치는지를 예측할 수 있는 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램을 제공하는 것을 목적으로 한다.
이러한 목적을 달성하기 위해, 본 발명의 상호 작용 예측 장치는, 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 있어서, 상기 기억부는, 화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과, 단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고, 상기 제어부는, 상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 수단과, 상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 수단과, 상기 화합물 구조 정보 취득 수단에 의해 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 수단에 의해 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 수단과, 상기 화합물 구조 정보 취득 수단에 의해 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 수단에 의해 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법, 및/또는, 상기 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 수단을 구비한 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 장치는, 상기 기재의 상호 작용 예측 장치에 있어서, 상기 단백질 구조 정보 기억 수단은, 세포 내 또는 생체 내의 네트워크 상에 있어서의 상기 단백질의 위치에 관한 위치 정보를 포함하는, 당해 네트워크에 관한 네트워크 정보에 대응지어, 당해 단백질의 구조에 관한 상기 단백질 구조 정보를 기억하고, 상기 제어부는, 상기 상호 작용 강도 결정 수단에 의해 결정된 상기 예측 상호 작용 강도, 및, 상기 단백질 구조 정보 기억 수단에 기억된 상기 네트워크 정보에 의거하여, 상기 화합물의 상기 예측 단백질에 대한 영향을 예측하는 영향 예측 수단을 더 구비한 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 장치는, 상기 기재의 상호 작용 예측 장치에 있어서, 상기 기억부는, 세포 내 또는 생체 내의 분자간 상호 작용에 관한 분자간 상호 작용 정보를 기억하는 분자간 상호 작용 정보 기억 수단을 더 구비하고, 상기 예측 단백질 결정 수단, 및/또는, 상기 상호 작용 강도 결정 수단은, 추가로, 상기 분자간 상호 작용 정보 기억 수단에 기억된 상기 분자간 상호 작용 정보를 이용하여 상기 종합 평가를 행하는 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 장치는, 상기 기재의 상호 작용 예측 장치에 있어서, 상기 기억부는, 단백질의 구조의 유사성에 관한 단백질 구조 유사성 정보를 기억하는 단백질 구조 유사성 정보 기억 수단을 더 구비하고, 상기 예측 단백질 결정 수단, 및/또는, 상기 상호 작용 강도 결정 수단은, 추가로, 상기 단백질 구조 유사성 정보 기억 수단에 기억된 상기 단백질 구조 유사성 정보를 이용하여 상기 종합 평가를 행하는 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 장치는, 상기 기재의 상호 작용 예측 장치에 있어서, 상기 단백질 구조 정보 취득 수단은, 상기 구조 예측 방법을 이용하여 복수의 상기 단백질 구조 정보를 예측하고, 상기 학습 방법, 및/또는, 상기 메타 추정 방법을 이용하여 당해 단백질 구조 정보의 상기 종합 평가를 행함으로써 상기 후보 단백질 구조 정보를 예측함으로써 취득하는 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 장치는, 상기 기재의 상호 작용 예측 장치에 있어서, 상기 기억부는, 개인의 유전자에 관한 유전자 정보를 기억하는 유전자 정보 기억 수단을 더 구비하고, 상기 단백질 구조 정보 취득 수단은, 상기 유전자 정보 기억 수단에 기억된 상기 유전자 정보에 의거하여, 상기 구조 예측 방법을 이용하여 상기 후보 단백질 구조 정보를 예측함으로써 취득하는 것을 특징으로 한다.
또, 본 발명의 상호 작용 예측 방법은, 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 있어서 실행되는 상호 작용 예측 방법에 있어서, 상기 기억부는, 화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과, 단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고, 상기 제어부에 있어서 실행되는, 상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 단계와, 상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 단계와, 상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 단계에서 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 단계와, 상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 단계에서 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법, 및/또는, 상기 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 단계를 포함하는 것을 특징으로 한다.
또, 본 발명의 프로그램은, 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 실행시키기 위한 프로그램에 있어서, 상기 기억부는, 화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과, 단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고, 상기 제어부에 있어서, 상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 단계와, 상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 단계와, 상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 단계에서 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 단계와, 상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 단계에서 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법, 및/또는, 상기 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 단계를 실행시키는 것을 특징으로 한다.
이 발명에 의하면, 화합물의 화합물 구조 정보를 취득, 또는, 기억되어 있지 않은 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하고, 화합물과의 상호 작용의 후보가 되는 단백질인 후보 단백질의 단백질 구조 정보인 후보 단백질 구조 정보를 취득, 또는, 기억되어 있지 않은 후보 단백질 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하며, 취득된 화합물 구조 정보, 및, 취득된 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 화합물의 결합 강도를 복수 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써, 어느 하나의 결합 강도, 또는, 복수의 결합 강도의 조합을 최종적으로 예측되는 결합 강도인 예측 결합 강도로서 결정하며, 화합물과 상호 작용하는 것이 예측되는 후보 단백질인 예측 단백질을 결정하고, 취득된 화합물 구조 정보, 및, 결정된 예측 단백질의 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 결합 강도를 복수 산출하며, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 복수의 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 화합물이, 경합적으로 작용하는 다른 화합물의 존재하에서, 예측 단백질과 어느 정도 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하므로, 새로운 약의 개발 등에 있어서, 후보가 되는 화합물이, 생체 내에서 상호 작용하는 단백질 등의 생체 분자를 효율적으로 동정할 수 있다는 효과를 갖는다.
또, 이 발명에 의하면, 결정된 예측 상호 작용 강도, 및 기억된 네트워크 정보에 의거하여, 화합물의 예측 단백질에 대한 영향을 예측하므로, 화합물의 효과의 예측 및 부작용의 예측의 정밀도를 대폭 향상시킬 수 있다는 효과를 갖는다.
또, 이 발명에 의하면, 또한, 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하므로, 기지(旣知)의 데이터를 지표로서 이용함으로써, 더 정확한 종합 평가를 할 수 있다는 효과를 갖는다.
또, 이 발명에 의하면, 또한, 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하므로, 후보 단백질에 유사한 기지의 단백질의 데이터를 지표로서 이용함으로써, 더 정확한 종합 평가를 할 수 있다는 효과를 갖는다.
또, 이 발명에 의하면, 구조 예측 방법을 이용하여 복수의 단백질 구조 정보를 예측하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 단백질 구조 정보의 종합 평가를 행함으로써 후보 단백질 구조 정보를 예측함으로써 취득하므로, 타깃 분자의 자의성(恣意性)을 더 배제할 수 있다는 효과를 갖는다.
또, 이 발명에 의하면, 기억된 유전자 정보에 의거하여, 구조 예측 방법을 이용하여 후보 단백질 구조 정보를 예측하므로, 개인의 유전적 배열의 차이를 토대로, 단백질의 구조의 차이를 예측하여, 후보 화합물의 영향에 관한 개인차를 추정할 수 있다는 효과를 갖는다.
도 1은, 본 실시형태의 기본 원리를 나타내는 플로우 차트이다.
도 2는, 본 실시형태에 있어서의 상호 작용 예측 장치의 구성의 일례를 나타내는 블록도이다.
도 3은, 본 실시형태의 상호 작용 예측 장치의 처리의 일례를 나타내는 플로우 차트이다.
도 4는, 본 실시형태에 있어서의 예측 결합 강도 결정 처리의 일례를 나타내는 도면이다.
도 5는, 본 실시형태에 있어서의 예측 결합 강도 결정 처리의 일례를 나타내는 도면이다.
도 6은, 본 실시형태에 있어서의 예측 상호 작용 강도 결정 처리의 일례를 나타내는 도면이다.
도 7은, 본 실시형태에 있어서의 예측 상호 작용 강도 결정 처리의 일례를 나타내는 도면이다.
도 8은, 본 실시형태에 있어서의 상호 작용 강도 예측 처리의 일례를 나타내는 도면이다.
도 9는, 본 실시형태에 있어서의 영향 예측 처리의 일례를 나타내는 도면이다.
도 10은, 본 실시형태에 있어서의 화합물과 생체 분자의 결합 강도를 계산 예측한 결과를 나타내는 도면이다.
도 11은, 본 실시형태에 있어서의 화합물과 생체 분자의 결합 강도를 계산 예측한 결과를 나타내는 도면이다.
도 12는, 본 실시형태에 있어서의 화합물과 생체 분자의 결합 강도를 계산 예측한 결과를 나타내는 도면이다.
도 13은, 본 실시형태에 있어서의 MEK의 억제제로서 치험(治驗)이 행하여져 있는 화합물에 대한 해석 결과를 나타내는 도면이다.
도 14a는, 도 13에 나타낸 해석 결과에 의거하는 상호 작용 강도에 의거하여, 생체 내 분자의 상호 작용 네트워크를 분류한 도면이다.
도 14b는, 도 13에 나타낸 해석 결과에 의거하는 상호 작용 강도에 의거하여, 생체 내 분자의 상호 작용 네트워크를 분류한 도면이다.
도 15는, 본 실시형태에 있어서의 계산 예측의 일례를 나타내는 도면이다.
이하에, 본 발명에 관련된 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램의 실시형태를 도면에 의거하여 상세하게 설명한다. 또한, 이 실시형태에 의해 이 발명이 한정되는 것은 아니다.
[본 발명의 실시형태의 개요]
이하, 본 발명의 실시형태의 개요에 대해 도 1을 참조하여 설명하고, 그 후, 본 실시형태의 구성 및 처리 등에 대해 상세하게 설명한다. 도 1은, 본 실시형태의 기본 원리를 나타내는 플로우 차트이다. 본 실시형태는, 개략적으로, 이하의 기본적 특징을 갖는다.
즉, 본 실시형태의 상호 작용 예측 장치의 제어부는, 도 1에 나타내는 바와 같이, 유저가 원하는 화합물의 화합물 구조 정보를 기억부로부터 취득, 또는, 기억부에 기억되어 있지 않은 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득한다(단계 SA-1).
그리고, 상호 작용 예측 장치 제어부는, 화합물과의 상호 작용의 후보가 되는 단백질인 후보 단백질의 단백질 구조 정보인 후보 단백질 구조 정보를 기억부로부터 취득, 또는, 기억부에 기억되어 있지 않은 후보 단백질 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득한다(단계 SA-2). 여기서, 제어부는, 구조 예측 방법을 이용하여 복수의 단백질 구조 정보를 예측하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 단백질 구조 정보의 종합 평가를 행함으로써 후보 단백질 구조 정보를 예측함으로써 취득해도 된다. 또, 제어부는, 기억부에 기억된 유저 개인의 유전자에 관한 유전자 정보에 의거하여, 구조 예측 방법을 이용하여 후보 단백질 구조 정보를 예측함으로써 취득해도 된다.
그리고, 상호 작용 예측 장치의 제어부는, 단계 SA-1에서 취득한 화합물 구조 정보, 및, 단계 SA-2에서 취득한 후보 단백질 구조 정보에 의거하여, 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 화합물의 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측 결합 강도를 결정하며, 당해 화합물과 상호 작용하는 것이 예측되는 후보 단백질인 예측 단백질을 결정한다(단계 SA-3). 여기서, 제어부는, 또한, 기억부에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 또, 제어부는, 또한, 기억부에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다.
그리고, 상호 작용 예측 장치의 제어부는, 단계 SA-1에서 취득한 화합물 구조 정보, 및, 단계 SA-3에서 결정한 예측 단백질의 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 방법을 이용하여 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 상호 작용 강도인 예측 상호 작용 강도를 결정하며(단계 SA-4), 처리를 종료한다. 여기서, 제어부는, 또한, 기억부에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 또, 제어부는, 또한, 기억부에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다.
이상으로, 본 실시형태의 개요의 설명을 마친다.
[상호 작용 예측 장치(100)의 구성]
다음으로, 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 구성의 상세에 대해, 도 2를 참조하여 이하에 설명한다. 도 2는, 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 구성의 일례를 나타내는 블록도이고, 당해 구성 중 본 발명에 관련된 부분만을 개념적으로 나타내고 있다. 여기서, 본 실시형태에 있어서의 상호 작용 예측 장치(100)에 있어서는, 각 구성이 일 하우징 내에 모두 구비되고, 단독으로 처리를 행하는 것(스탠드 얼론(stand-alone)형)을, 상호 작용 예측 장치(100)로서 설명하지만, 당해 실시예에 한정되지 않으며, 각 구성이 분리된 하우징 내에 구비되고, 네트워크(300) 등을 통해 접속되어 하나의 개념으로서의 장치를 구성하는 것(예를 들면, 클라우드 컴퓨팅 등)이어도 된다.
도 2에 있어서, 외부 시스템(200)은, 네트워크(300)를 통해, 상호 작용 예측 장치(100)와 서로 접속되고, 단백질 구조 정보, 화합물 구조 정보, 유전자 정보, 분자간 상호 작용 정보, 및/또는, 단백질 구조 유사성 정보 등에 관한 외부 데이터베이스, 및/또는, 유저 인터페이스 등을 실행하는 웹 사이트를 제공하는 기능 등을 갖고 있어도 된다.
여기서, 외부 시스템(200)은, WEB 서버나 ASP 서버 등으로서 구성하고 있어도 된다. 또, 외부 시스템(200)의 하드웨어 구성은, 일반적으로 시판되는 워크스테이션, 퍼스널 컴퓨터 등의 정보 처리 장치 및 그 부속 장치에 의해 구성하고 있어도 된다. 또, 외부 시스템(200)의 각 기능은, 외부 시스템(200)의 하드웨어 구성 중의 CPU, 디스크 장치, 메모리 장치, 입력 장치, 출력 장치, 통신 제어 장치 등 및 그들을 제어하는 프로그램 등에 의해 실현되어도 된다.
또, 네트워크(300)는, 상호 작용 예측 장치(100)와 외부 시스템(200)을 서로 접속하는 기능을 갖고, 예를 들면, 인터넷 등이다.
또, 상호 작용 예측 장치(100)는, 개략적으로, 제어부(102)와 통신 제어 인터페이스부(104)와 입출력 제어 인터페이스부(108)와 기억부(106)를 구비한다. 여기서, 제어부(102)는, 상호 작용 예측 장치(100)의 전체를 통괄적으로 제어하는 CPU 등이다. 또, 통신 제어 인터페이스부(104)는, 통신 회선 등에 접속되는 라우터(router) 등의 통신 장치(도시 생략)에 접속되는 인터페이스이고, 입출력 제어 인터페이스부(108)는, 표시부(112), 및 입력부(114)에 접속되는 인터페이스이다. 또, 기억부(106)는, 각종의 데이터베이스나 테이블 등을 저장하는 장치이다. 이들 상호 작용 예측 장치(100)의 각 부는 임의의 통신로를 통해 통신 가능하게 접속되어 있다. 또한, 이 상호 작용 예측 장치(100)는, 라우터 등의 통신 장치 및 전용선 등의 유선 또는 무선의 통신 회선을 통해, 네트워크(300)에 통신 가능하게 접속되어 있다.
기억부(106)에 저장되는 각종의 데이터베이스나 테이블(화합물 구조 정보 데이터베이스(106a), 단백질 구조 정보 데이터베이스(106b), 유전자 정보 데이터베이스(106c), 분자간 상호 작용 정보 데이터베이스(106d), 및 단백질 구조 유사성 정보 데이터베이스(106e))은, 고정 디스크 장치 등의 스토리지 수단이다. 예를 들면, 기억부(106)는, 각종 처리에 이용하는 각종의 프로그램, 테이블, 파일, 데이터베이스, 및 웹 페이지 등을 저장한다.
이들 기억부(106)의 각 구성 요소 중, 화합물 구조 정보 데이터베이스(106a)는, 화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단이다. 이들 화합물 구조 정보는, 화합물 구조 정보 데이터베이스(106a)에 미리 기억되어 있고, 상호 작용 예측 장치(100)의 제어부(102)는, 정기적으로, 및/또는, 제어부(102)에 의한 처리에 따라 네트워크(300)를 통해 최신의 데이터를 외부 시스템(200) 등으로부터 다운로드하여 화합물 구조 정보 데이터베이스(106a)에 기억된 화합물 구조 정보를 업데이트해도 된다.
또, 단백질 구조 정보 데이터베이스(106b)는, 단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단이다. 여기서, 단백질 구조 정보 데이터베이스(106b)는, 세포 내 또는 생체 내의 네트워크(예를 들면, 분자간 상호 작용 네트워크, 시그널 전달 네트워크, 대사(代謝) 네트워크, 또는, 유전자 제어 네트워크 등) 상에 있어서의 단백질의 위치에 관한 위치 정보를 포함하는, 당해 네트워크에 관한 네트워크 정보에 대응지어, 당해 단백질의 구조에 관한 단백질 구조 정보를 기억해도 된다. 이들 단백질 구조 정보는, 단백질 구조 정보 데이터베이스(106b)에 미리 기억되어 있고, 상호 작용 예측 장치(100)의 제어부(102)는, 정기적으로, 및/또는, 제어부(102)에 의한 처리에 따라(예를 들면, 제어부(102)에 있어서 데이터가 필요해지는 계기(契機) 등에) 네트워크(300)를 통해 최신의 데이터를 외부 시스템(200) 등으로부터 다운로드하여 단백질 구조 정보 데이터베이스(106b)에 기억된 단백질 구조 정보를 업데이트해도 된다.
또, 유전자 정보 데이터베이스(106c)는, 유저 개인의 유전자에 관한 유전자 정보를 기억하는 유전자 정보 기억 수단이다. 여기서, 유전자 정보는, 염기 배열, 유전자형, 게노타입(genotype), 페노타입(phenotype), 및/또는, 어노테이션 등에 관한 정보를 포함하고 있어도 된다. 이들 유전자 정보는, 유전자 정보 데이터베이스(106c)에 미리 기억되어 있고, 상호 작용 예측 장치(100)의 제어부(102)는, 정기적으로, 및/또는, 제어부(102)에 의한 처리에 따라 네트워크(300)를 통해 최신의 데이터를 외부 시스템(200) 등으로부터 다운로드하여 유전자 정보 데이터베이스(106c)에 기억된 유전자 정보를 업데이트해도 된다.
또, 분자간 상호 작용 정보 데이터베이스(106d)는, 세포 내 또는 생체 내의 분자간 상호 작용에 관한 분자간 상호 작용 정보를 기억하는 분자간 상호 작용 정보 기억 수단이다. 이들 분자간 상호 작용 정보는, 분자간 상호 작용 정보 데이터베이스(106d)에 미리 기억되어 있고, 상호 작용 예측 장치(100)의 제어부(102)는, 정기적으로, 및/또는, 제어부(102)에 의한 처리에 따라 네트워크(300)를 통해 최신의 데이터를 외부 시스템(200) 등으로부터 다운로드하여 분자간 상호 작용 정보 데이터베이스(106d)에 기억된 분자간 상호 작용 정보를 업데이트해도 된다.
또, 단백질 구조 유사성 정보 데이터베이스(106e)는, 단백질의 구조의 유사성에 관한 단백질 구조 유사성 정보를 기억하는 단백질 구조 유사성 정보 기억 수단이다. 여기서, 단백질 구조 유사성 정보는, 단백질 구조 유사성 네트워크(PSIN)에 관한 정보를 포함하고 있어도 된다. 이들 단백질 구조 유사성 정보는, 단백질 구조 유사성 정보 데이터베이스(106e)에 미리 기억되어 있고, 상호 작용 예측 장치(100)의 제어부(102)는, 정기적으로, 및/또는, 제어부(102)에 의한 처리에 따라 네트워크(300)를 통해 최신의 데이터를 외부 시스템(200) 등으로부터 다운로드하여 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보를 업데이트해도 된다.
또, 도 2에 있어서, 통신 제어 인터페이스부(104)는, 상호 작용 예측 장치(100)와 네트워크(300)(또는 라우터 등의 통신 장치)의 사이에 있어서의 통신 제어를 행한다. 즉, 통신 제어 인터페이스부(104)는, 외부 시스템(200), 및 다른 단말 등과 통신 회선을 통해 데이터를 통신하는 기능을 갖는다.
또, 도 2에 있어서, 입출력 제어 인터페이스부(108)는, 표시부(112), 및 입력부(114)의 제어를 행한다.
여기서, 표시부(112)로서는, 애플리케이션 등의 표시 화면을 표시하는 표시 수단(예를 들면, 액정 또는 유기 EL 등으로 구성되는 디스플레이, 모니터, 및 터치 패널 등)이어도 된다. 또, 입력부(114)는, 예를 들면 키 입력부, 터치 패널, 컨트롤 패드(예를 들면 터치 패드, 및 게임 패드 등), 마우스, 키보드, 및 마이크 등이어도 된다.
또, 도 2에 있어서, 제어부(102)는, OS(Operating System) 등의 제어 프로그램이나, 각종의 처리 순서 등을 규정한 프로그램, 및, 소요 데이터를 저장하기 위한 내부 메모리를 갖는다. 그리고, 제어부(102)는, 이들 프로그램 등에 의해, 다양한 처리를 실행하기 위한 정보 처리를 행한다. 제어부(102)는, 기능 개념적으로, 화합물 구조 정보 취득부(102a), 단백질 구조 정보 취득부(102b), 예측 단백질 결정부(102c), 상호 작용 강도 결정부(102d), 및 영향 예측부(102e)를 구비한다.
이 중, 화합물 구조 정보 취득부(102a)는, 화합물의 화합물 구조 정보를 화합물 구조 정보 데이터베이스(106a)로부터 취득, 또는, 화합물 구조 정보 데이터베이스(106a)에 기억되어 있지 않은 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 수단이다.
또, 단백질 구조 정보 취득부(102b)는, 화합물과의 상호 작용의 후보가 되는 단백질인 후보 단백질의 단백질 구조 정보인 후보 단백질 구조 정보를 단백질 구조 정보 데이터베이스(106b)로부터 취득, 또는, 단백질 구조 정보 데이터베이스(106b)에 기억되어 있지 않은 후보 단백질 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 수단이다. 여기서, 단백질 구조 정보 취득부(102b)는, 구조 예측 방법을 이용하여 복수의 단백질 구조 정보를 예측하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 단백질 구조 정보의 종합 평가를 행함으로써 후보 단백질 구조 정보를 예측함으로써 취득해도 된다. 또, 단백질 구조 정보 취득부(102b)는, 유전자 정보 데이터베이스(106c)에 기억된 유전자 정보에 의거하여, 구조 예측 방법을 이용하여 후보 단백질 구조 정보를 예측함으로써 취득해도 된다.
또, 예측 단백질 결정부(102c)는, 화합물 구조 정보 취득부(102a)에 의해 취득된 화합물 구조 정보, 및, 단백질 구조 정보 취득부(102b)에 의해 취득된 후보 단백질 구조 정보에 의거하여, 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 화합물의 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측 결합 강도를 결정하며, 화합물과 상호 작용하는 것이 예측되는 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 수단이다. 여기서, 예측 단백질 결정부(102c)는, 또한, 분자간 상호 작용 정보 데이터베이스(106d)에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 또, 예측 단백질 결정부(102c)는, 또한, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다.
또, 상호 작용 강도 결정부(102d)는, 화합물 구조 정보 취득부(102a)에 의해 취득된 화합물 구조 정보, 및, 예측 단백질 결정부(102c)에 의해 결정된 예측 단백질의 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 방법을 이용하여 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 수단이다. 여기서, 상호 작용 강도 결정부(102d)는, 또한, 분자간 상호 작용 정보 데이터베이스(106d)에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 또, 상호 작용 강도 결정부(102d)는, 또한, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다.
또, 영향 예측부(102e)는, 상호 작용 강도 결정부(102d)에 의해 결정된 예측 상호 작용 강도, 및, 단백질 구조 정보 데이터베이스(106b)에 기억된 네트워크 정보에 의거하여, 화합물의 예측 단백질에 대한 영향을 예측하는 영향 예측 수단이다. 여기서, 영향은, 효과(예를 들면 활성 효과, 또는, 억제 효과 등)여도 된다. 예를 들면, 화합물의 단백질에 대한 영향은, 화합물에 의한 단백질의 활성화, 또는, 불활성화 등이어도 된다.
이상으로, 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 구성의 일례의 설명을 마친다.
[상호 작용 예측 장치(100)의 처리]
다음으로, 이렇게 구성된 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 처리의 상세에 대해, 이하에 도 3 내지 도 9를 참조하여 상세하게 설명한다. 도 3은, 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 처리의 일례를 나타내는 플로우 차트이다.
도 3에 나타내는 바와 같이, 화합물 구조 정보 취득부(102a)는, 유저가 신약의 개발 등을 할 때에, 신약의 후보가 되는 화합물인 후보 화합물의 구조에 관한 화합물 구조 정보(분자 구조 정보)를 화합물 구조 정보 데이터베이스(106a)로부터 취득, 또는, 화합물 구조 정보 데이터베이스(106a)에 기억되어 있지 않은 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득한다(단계 SB-1). 여기서, 화합물 구조 정보는, 미리 또는 처리 실행 시에, 유저에 의해 입력부(114)를 통해 입력되고, 화합물 구조 정보 데이터베이스(106a)에 저장된 것이어도 된다.
여기서, 구조 예측 방법으로서는, 구조 예측에 널리 사용되고 있는 구조 기지의 단백질로부터 구조 미지(未知)의 단백질의 구조를 추정하는, 템플릿에 의거하는 방법(Template Based Modeling), 및/또는, 아미노산의 배열로부터 구조 미지의 단백질의 구조를 추정하는, 템플릿 없는 방법(Template Free Modeling) 등을 이용해도 된다. 여기서, 템플릿에 의거하는 방법으로서는, 호몰로지 모델링, 또는, 폴드(fold) 인식에 의거하는 방법 등의 다양한 방법이어도 된다. 또, 구조 예측 방법으로서는, 구조 미지의 단백질의 아미노산 배열의 일부와, 구조 기지의 단백질의 아미노산 배열의 유사성 탐색으로부터, 구조 미지의 단백질의 일부의 구조를 예측하고, 복수의 예측을 조합하여 구조 미지의 단백질의 구조를 예측하는 프래그먼트 어셈블리법이어도 된다. 또, 구조 예측 방법으로서는, 단백질의 구조 예측을 게임화하여, 외부 시스템(200)에서 예측(예를 들면, 많은 제3자(외부 유저)에 의해 외부 시스템(200)에서 예측 등)된 구조 미지의 단백질의 구조를 취득(예를 들면, 네트워크(300)를 통해 취득 등)하는 방법이어도 된다. 또, 구조 예측 방법으로서는, 이들의 방법을 가능하고 또한 합리적인 범위에서, 동시 병행으로 이용하고, 이들의 추정 결과로부터, 종합 평가를 행하여, 구조 미지의 단백질의 구조를 예측해도 된다.
그리고, 단백질 구조 정보 취득부(102b)는, 후보 화합물과의 상호 작용의 후보가 되는 단백질인 후보 단백질의 단백질 구조 정보인 후보 단백질 구조 정보를 단백질 구조 정보 데이터베이스(106b)로부터 취득, 또는, 단백질 구조 정보 데이터베이스(106b)에 기억되어 있지 않은 후보 단백질 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득한다(단계 SB-2). 여기서, 단백질 구조 정보 취득부(102b)는, 구조 예측 방법을 이용하여 복수의 단백질 구조 정보를 예측하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 단백질 구조 정보의 종합 평가를 행함으로써 후보 단백질 구조 정보를 예측함으로써 취득해도 된다. 또, 단백질 구조 정보 취득부(102b)는, 유전자 정보 데이터베이스(106c)에 기억된 유저 개인의 유전자에 관한 유전자 정보(퍼스널 게놈 정보)에 의거하여, 구조 예측 방법을 이용하여 후보 단백질 구조 정보를 예측함으로써 취득해도 된다. 이에 따라, 개인간의 유전자 배열의 차이가, 단백질의 구조에 영향을 줌으로써, 후보 화합물과의 상호 작용이 변화하고, 그 결과, 후보 화합물의 영향에 변화가 생길 가능성을 고려한 후보 단백질 구조 정보를 예측할 수 있다. 여기서, 유전자 정보는, 미리 또는 처리 실행 시에, 유저에 의해 입력부(114)를 통해 입력되고, 유전자 정보 데이터베이스(106c)에 저장된 것이어도 된다.
여기서, 단백질 구조 정보 취득부(102b)는, 유저가 원하는(예를 들면, 유저가 알고 싶은 생물학적 효과에 관련되는 등) 하나 또는 복수의 네트워크를 특정하고, 당해 네트워크 상에 존재하는 일부 또는 전부의 단백질로부터, 후보 단백질을 특정해도 된다. 예를 들면, 단백질 구조 정보 취득부(102b)는, 세포 내 또는 생체 내의 네트워크(예를 들면 분자간 상호 작용 네트워크, 시그널 전달 네트워크, 대사 네트워크, 또는, 유전자 제어 네트워크 등) 상에 존재하는 각각의 단백질에 대해, 그 구조를 특정하여, 후보 단백질 구조 정보를 단백질 구조 정보 데이터베이스(106b) 등으로부터 취득해도 된다. 여기서, 어떤 화합물에 대해 어느 단백질이 상호 작용을 하는지를 예측할 때에는, 많은 단백질의 리스트를 이용하여 후보 단백질을 특정하는 방법이 생각되지만, 상기와 같이 네트워크를 특정함으로써, 주목하는 생물학적 영향과는 관계없는 단백질에 많은 계산 시간을 할당하는 것을 회피할 수 있고, 필요한 단백질이 리스트로부터 누락되는 것도 회피할 수 있다. 또, 네트워크에 관한 정보는, 미리 또는 처리 실행 시에, 유저에 의해 입력부(114)를 통해 입력되고, 단백질 구조 정보 데이터베이스(106b)에 저장된 것이어도 된다.
또, 단백질 구조 정보 취득부(102b)는, 단백질 구조 정보 데이터베이스(106b)에 단백질 구조 데이터가 존재하지 않는 경우, 각종의 계산 방법, 즉, 분자 다이나믹스(Molecular Dynamics) 등에 의한 구조 예측의 방법, 또는, 단백질의 유사성 네트워크(Protein Similarity Network)를 이용한 방법에 의해, 후보 단백질 구조 정보를 예측해도 된다. 또한, 단백질 구조 정보 취득부(102b)는, 복수의 다른 방식의 추정으로부터 최종적인 추정을 행하는 메타 추정 시스템을 도입해도 된다. 여기서, 메타 추정 시스템은, 구조가 기지의 단백질의 1차 배열 및 그 구조와, 각각의 추정 방법의 추정 결과를 이용하여, 뉴럴(neural) 네트워크 또는 서포트 벡터 머신 등의 학습 방법에 의해, 최적의 추정이 되는 구조 미지의 단백질 구조를 예측하는 것이어도 된다. 또, 당해 학습 방법에 있어서는, 단백질 구조를 정확하게 예측하는 것도 중요하지만, 특히, 화합물과의 상호 작용에 관련된 부위의 구조를 더 정확하게 예측할 수 있는 것이 중요하고, 학습 시에 당해 사항의 가중을 해도 된다. 또, 단백질 구조 정보 취득부(102b)는, 유저 개인의 유전자 정보가 이용 가능할 때에는, 당해 유전자 정보에 의거하여, 각 단백질을 코딩하고 있는 영역을 해석하고, 당해 단백질의 구조 등에 변화를 주는지를 기지의 정보로부터 특정하며, 기지의 정보가 존재하지 않는 경우, 상기의 각종의 계산 방법 등을 이용하여 그 영향(예를 들면, 당해 단백질의 구조 등에 변화를 주는지 등)을 추정하고, 당해 영향을 가미하여 후보 단백질 구조 정보를 예측해도 된다.
여기서, 본 실시형태에 있어서의 종합 평가에 있어서는, 미리 복수의 구조 기지의 단백질에 대해, 이 시스템에 편입된 복수의 구조 예측 방법(추정 방법)을 이용하여 단백질의 구조의 추정을 행하여도 된다. 그리고, 당해 종합 평가에 있어서는, 어느 추정 방법이, 어떤 특징을 갖는 단백질의 구조에 대한 추정 정밀도가 높은지, 어떤 단백질의 부분 구조에 대한 추정 정밀도가 높은지 등의 정보를 뉴럴 네트워크, 또는, 서포트 벡터 머신 등의 학습 방법을 이용하여 학습시켜도 된다. 그리고, 당해 종합 평가에 있어서는, 구조 미지의 단백질의 구조를 추정할 때에, 이들의 학습 결과를 이용하여, 복수의 구조 예측 방법을 이용하여 취득한 복수의 추정 결과에 대해, 확신도의 가중을 행함으로써 후보 단백질 구조 정보를 예측함으로써 취득해도 된다. 즉, 본 실시형태에 있어서의 종합 평가에 있어서는, 각 구조 예측 방법이, 어떤 사례이고, 어느 방법이, 정밀도가 높은 추정이 가능하며, 또는, 어떤 부분에 관해서는 정밀도가 높은 등의 특징을 이용하고 있다. 또, 본 실시형태에 있어서의 종합 평가에 있어서는, 단지 다수결 등을 이용한 경우, 사용되고 있는 추정 방법의 선택 방법에 의해 결과가 좌우되는 문제가 발생하기 때문에, 복수의 구조 예측 방법을 이용하여 취득한 복수의 추정 결과에 대해, 소정의 학습 방법을 이용하여, 이러한 바이어스를 회피하고 있다.
그리고, 예측 단백질 결정부(102c)는, 화합물 구조 정보 취득부(102a)에 의해 취득된 화합물 구조 정보, 및, 단백질 구조 정보 취득부(102b)에 의해 취득된 후보 단백질 구조 정보에 의거하여, 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 후보 화합물의 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측 결합 강도를 결정하며, 후보 단백질 및 예측 결합 강도에 관한 결과 정보를, 유저가 입력부(114)를 통해 선택 가능하게 표시부(112)에 표시시킨다(단계 SB-3). 여기서, 예측 단백질 결정부(102c)는, 또한, 분자간 상호 작용 정보 데이터베이스(106d)에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 여기서, 분자간 상호 작용 정보는, 미리 또는 처리 실행 시에, 유저에 의해 입력부(114)를 통해 입력되고, 분자간 상호 작용 정보 데이터베이스(106d)에 저장된 것이어도 된다. 또, 예측 단백질 결정부(102c)는, 또한, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다. 여기서, 단백질 구조 유사성 정보는, 미리 또는 처리 실행 시에, 유저에 의해 입력부(114)를 통해 입력되고, 단백질 구조 유사성 정보 데이터베이스(106e)에 저장된 것이어도 된다.
즉, 예측 단백질 결정부(102c)는, 각각의 후보 단백질에 대해, 일련의 후보 화합물과의 도킹 시뮬레이션을 행하고, 그 결합 강도를 계산해도 된다. 여기서, 도킹 시뮬레이션은, 복수의 도킹 시뮬레이션 소프트웨어를 이용하여, 각각의 결과를 개별이 아니고, 종합 평가함으로써 최종적인 예측 결합 강도를 결정해도 된다. 또, 예측 단백질 결정부(102c)는, 각각의 도킹 시뮬레이션 소프트웨어에 채용되어 있는 방법론의 차이에 의해, 예측 정밀도에 편향이 있기 때문에, 각각의 소프트웨어의 출력 경향(성향)을 평가하고, 최적의 예측 결과의 조합을 이용해도 된다. 이때, 예측 단백질 결정부(102c)는, 뉴럴 네트워크, 또는, 서포트 벡터 머신 등 각종의 학습 방법을 이용해도 된다. 즉, 예측 단백질 결정부(102c)는, 실험적으로 옳은 값이 알려져 있는 조합을 복수 준비하고, 각각의 방식에 의한 시뮬레이션을 실시하여, 그 결과와 실제의 실험값을 대조하는 학습 방식을 이용해도 된다. 이때에, 예측 단백질 결정부(102c)는, 화합물 및 단백질의 구조에 관한 정보, 및, 각 시뮬레이션 소프트웨어의 추정 결과 등을 입력으로 하고, 실제로 실험에서 구해진 수치를 교사 데이터(교사 신호)로서 이용해도 된다.
또, 예측 단백질 결정부(102c)는, 이들의 학습을 거쳐 획득된 결과를, 메타 추정 시스템에 이용하여, 실측값이 존재하지 않는 화합물과 단백질의 결합에 관한 추정을 행하여도 된다. 또한, 이 학습에 관해서는, 단백질과 화합물의 정보, 또는, 단백질끼리의 상호 작용을 예측하는 경우에는, 그것에 관련된 복수의 단백질의 정보에 의거하여, 그룹 나눔을 행하고, 각각의 그룹에서 학습을 함으로써, 이 결과를 이용하는 메타 추론 시스템으로부터 초래되는 예측 정밀도를 향상시킬 수 있다. 또, 예측 단백질 결정부(102c)는, 또한 구조가 유사하고, 후보 화합물과의 상호 작용이 알려져 있는 생체 내 분자(단백질)가 있는 경우, 그 정보를 이용하여 추정해도 된다. 구조의 유사성을 갖는 생체 내 분자의 탐색에는, 단백질 유사성 네트워크(PSIN) 등을 이용하는 경우도 있다. 또, 예측 단백질 결정부(102c)는, 각각의 예측 모듈의 결과, 및, 메타 추정 시스템의 결과를 모두 표시부(112)에 표시하고, 유저(이용자)에게 어느 결과를 이용하는지를 선택시켜도 된다.
여기서, 도 4 및 도 5를 참조하여, 본 실시형태에 있어서의 예측 결합 강도 결정 처리의 일례에 대해 설명한다. 도 4 및 도 5는, 본 실시형태에 있어서의 예측 결합 강도 결정 처리의 일례를 나타내는 도면이다.
도 4에 나타내는 바와 같이, 예측 단백질 결정부(102c)는, 화합물 구조 정보 및 단백질 구조 정보(후보 단백질 구조 정보)에 의거하여, 도킹 시뮬레이션 1, 도킹 시뮬레이션 2, 및 도킹 시뮬레이션 3에 의한 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 후보 화합물의 결합 강도의 추정 결과 1, 추정 결과 2, 및 추정 결과 3을 산출하고, 결합 강도의 실측값을 교사 데이터로 하는 학습 시스템에 의한 학습 방법을 이용하여 당해 추정 결과 1, 당해 추정 결과 2, 및 당해 추정 결과 3의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측값(예측 결합 강도)을 결정하고 있다.
또, 도 5에 나타내는 바와 같이, 예측 단백질 결정부(102c)는, 화합물 구조 정보 및 단백질 구조 정보(후보 단백질 구조 정보)에 의거하여, 도킹 시뮬레이션 1, 도킹 시뮬레이션 2, 및 도킹 시뮬레이션 3에 의한 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 후보 화합물의 결합 강도의 추정 결과 1, 추정 결과 2, 및 추정 결과 3을 산출하고, 메타 추정 시스템에 의한 메타 추정 방법을 이용하여 당해 추정 결과 1, 당해 추정 결과 2, 및 당해 추정 결과 3의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측값(예측 결합 강도)을 결정하고 있다.
도 3으로 되돌아가, 예측 단백질 결정부(102c)는, 유저에 의해 입력부(114)를 통해 결과 정보가 선택된 경우, 유저에 의해 선택된 결과 정보에 의거하여, 후보 화합물과 상호 작용하는 것이 예측되는 후보 단백질을 예측 단백질로서 결정한다(단계 SB-4).
그리고, 상호 작용 강도 결정부(102d)는, 화합물 구조 정보 취득부(102a)에 의해 취득된 화합물 구조 정보, 및, 예측 단백질 결정부(102c)에 의해 결정된 예측 단백질의 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 방법을 이용하여 결합 강도를 산출하고, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 상호 작용 강도인 예측 상호 작용 강도를 결정한다(단계 SB-5). 여기서, 상호 작용 강도 결정부(102d)는, 또한, 분자간 상호 작용 정보 데이터베이스(106d)에 기억된 분자간 상호 작용 정보를 이용하여 종합 평가를 행하여도 된다. 또, 상호 작용 강도 결정부(102d)는, 또한, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보를 이용하여 종합 평가를 행하여도 된다. 즉, 상호 작용 강도 결정부(102d)는, 상호 작용이 예측된, 각각의 화합물과 단백질의 조합에 대해 상호 작용 강도 예측을 행하여도 된다. 또, 상호 작용 강도 결정부(102d)는, 복수의 추정 방식의 결과와 실측값에 의한 학습 방식을 이용해도 된다.
여기서, 본 실시형태에 있어서의 결합 강도 시뮬레이션 방법(결합 강도의 추정 방법)으로서는, 스코어링 함수를 이용한 추정 방법이어도 된다. 여기서, 스코어링 함수(예를 들면, X-CSCORE 등)로서는, 화합물과 단백질 사이의 van der Waals 상호 작용, 수소 결합, 구조의 변형의 효과, 및/또는, 소수성 효과 등을 변수로 하는 방정식이고, 그 결과로서 결합 강도를 추정하는 것이어도 된다. 여기서, 이러한 스코어링 함수는, 다수 존재하고, 각 스코어링 함수에서, 어떤 조합의 경우에는, 높은 정밀도로 추정할 수 있는지는 다르게 된다. 그래서, 본 실시형태에 있어서의 결합 강도 시뮬레이션 방법에 있어서는, 단지 다수결 등을 이용하는 방법에서는, 이용하는 스코어링 함수의 선택 방법에 의해 결과가 좌우되는 문제가 발생하기 때문에, 복수의 스코어링 함수를 이용하여 추정한 결합 강도에 대해, 소정의 학습 방법을 이용하여, 이러한 바이어스를 회피해도 된다.
여기서, 도 6 및 도 7을 참조하여, 본 실시형태에 있어서의 예측 상호 작용 강도 결정 처리의 일례에 대해 설명한다. 도 6 및 도 7은, 본 실시형태에 있어서의 예측 상호 작용 강도 결정 처리의 일례를 나타내는 도면이다.
도 6에 나타내는 바와 같이, 상호 작용 강도 결정부(102d)는, 화합물 구조 정보 및 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 1, 결합 강도 시뮬레이션 2, 및 결합 강도 시뮬레이션 3에 의한 결합 강도 시뮬레이션 방법을 이용하여 결합 강도의 추정 결과 1, 추정 결과 2, 및 추정 결과 3을 산출하고, 상호 작용 강도의 실측값을 교사 데이터로 하는 학습 시스템에 의한 학습 방법을 이용하여 당해 추정 결과 1, 당해 추정 결과 2, 및 당해 추정 결과 3의 종합 평가를 행함으로써 최종적으로 예측되는 상호 작용 강도인 추정값(예측 상호 작용 강도)을 결정하고 있다.
또, 도 7에 나타내는 바와 같이, 상호 작용 강도 결정부(102d)는, 화합물 구조 정보 및 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 1, 결합 강도 시뮬레이션 2, 및 결합 강도 시뮬레이션 3에 의한 결합 강도 시뮬레이션 방법을 이용하여 결합 강도의 추정 결과 1, 추정 결과 2, 및 추정 결과 3을 산출하고, 메타 추정 시스템에 의한 메타 추정 방법을 이용하여 당해 추정 결과 1, 당해 추정 결과 2, 및 당해 추정 결과 3의 종합 평가를 행함으로써 최종적으로 예측되는 상호 작용 강도인 추정값(예측 상호 작용 강도)을 결정하고 있다.
또, 도 8을 참조하여, 본 실시형태에 있어서의 상호 작용 강도 예측 처리의 일례에 대해 설명한다. 도 8은, 본 실시형태에 있어서의 상호 작용 강도 예측 처리의 일례를 나타내는 도면이다.
도 8에 나타내는 바와 같이, 화합물 구조 제시 모듈(화합물 구조 정보 취득부(102a))은, 신약의 후보가 되는 화합물인 후보 화합물의 후보 화합물 리스트가 유저에 의해 입력부(114)를 통해 입력된 경우, 후보 화합물의 구조에 관한 화합물 분자 구조 정보(화합물 구조 정보)를 화합물 DB(화합물 구조 정보 데이터베이스(106a))로부터 취득, 또는, 화합물 구조 추정 방법(구조 예측 방법)을 이용하여 화합물 DB에 기억되어 있지 않은 화합물 분자 구조 정보를 예측함으로써 취득하고, 화합물 분자 구조 기억 장치(예를 들면, RAM 등의 메모리 장치 등)에 저장하고 있다.
그리고, 생체 분자 구조 제시 모듈(단백질 구조 정보 취득부(102b))은, 유저가 알고 싶은 생물학적 효과에 관련된 생체 분자 상호 작용 네트워크에 속하는 생체 분자 리스트를 취득하고, 후보 화합물과의 상호 작용의 후보가 되는 당해 생체 분자 리스트에 포함되는 단백질인 후보 단백질의 단백질 구조 정보인 생체 분자 구조 정보(후보 단백질 구조 정보)를 분자 구조 DB(단백질 구조 정보 데이터베이스(106b))로부터 취득, 또는, 당해 유저 개인의 개인 유전자 정보가 이용 가능할 때에는, 개인 유전자 정보로부터 유전자형 리스트를 취득하며, 당해 유전자형 리스트에 포함되는 유전자의 구성이 단백질의 구조 등에 변화를 주는 영향 등을 가미하여, 분자 구조 추정 계산 방법(구조 예측 방법)을 이용하여 단백질 구조 정보 데이터베이스(106b)에 기억되어 있지 않은 생체 분자 구조 정보를 예측함으로써 취득하고, 생체 분자 구조 기억 장치(예를 들면, RAM 등의 메모리 장치 등)에 저장하고 있다.
그리고, 상호 작용 강도 예측 모듈(예측 단백질 결정부(102c))은, 화합물 분자 구조 기억 장치에 기억된 화합물 분자 구조 정보, 및, 생체 분자 구조 기억 장치에 기억된 생체 분자 구조 정보에 의거하여, 도킹 시뮬레이션 방법을 이용하여 후보 단백질과 화합물의 결합 강도를 산출하고, 학습 방법, 및, 메타 추정 방법을 이용하여 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도인 예측 결합 강도를 결정하며, 화합물과 상호 작용하는 것이 예측되는 후보 단백질인 예측 단백질을 결정하고 있다.
그리고, 상호 작용 강도 예측 모듈(상호 작용 강도 결정부(102d))은, 화합물 분자 구조 기억 장치에 기억된 화합물 분자 구조 정보, 및, 상호 작용 강도 예측 모듈에 의해 결정된 예측 단백질의 단백질 구조 정보에 의거하여, 결합 강도 시뮬레이션 방법을 이용하여 결합 강도를 산출하고, 메타 추정 방법, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보에 의거하는 유사 구조로부터의 추정, 및, 상호 작용 DB(분자간 상호 작용 정보 데이터베이스(106d))에 기억된 분자간 상호 작용 정보를 교사 데이터로 하는 학습 방법을 이용하여, 당해 결합 강도의 종합 평가를 행함으로써 최종적으로 상호 작용 강도(예측 상호 작용 강도)를 예측하고 있다.
도 3으로 되돌아가, 영향 예측부(102e)는, 상호 작용 강도 결정부(102d)에 의해 결정된 예측 상호 작용 강도, 및, 단백질 구조 정보 데이터베이스(106b)에 기억된 네트워크 정보에 의거하여, 후보 화합물의 예측 단백질에 대한 활성 효과, 또는, 억제 효과를 예측하고(단계 SB-6), 처리를 종료한다.
여기서, 도 9를 참조하여, 본 실시형태에 있어서의 영향 예측 처리의 일례에 대해 설명한다. 도 9는, 본 실시형태에 있어서의 영향 예측 처리의 일례를 나타내는 도면이다.
도 9에 나타내는 바와 같이, 활성화/불활성화 예측 모듈(영향 예측부(102e))은, 상호 작용 강도 결정부(102d)에 의해 결정된 예측 상호 작용 강도, 및, 단백질 구조 정보 데이터베이스(106b)에 기억된, 생체 내의 네트워크 상에 있어서의 생체 분자(단백질)의 위치에 관한 위치 정보를 포함하는, 당해 네트워크에 관한 네트워크 정보에 의거하여, 도킹 시뮬레이션 방법, 단백질 구조 유사성 정보 데이터베이스(106e)에 기억된 단백질 구조 유사성 정보에 의거하는 유사 구조로부터의 추정, 및, 상호 작용 DB(분자간 상호 작용 정보 데이터베이스(106d))에 기억된 분자간 상호 작용 정보를 교사 데이터로 하는 학습 방법을 이용하여, 후보 화합물의 예측 단백질에 대한 활성화, 또는, 불활성화의 예측을 행하고 있다. 여기서, 활성화/불활성화 예측 모듈은, 정성(定性)적으로 변화의 방향을 네트워크 모델 상에서 전파시킴으로써, 어느 단백질이, 참조 기준에 대해 상대적으로 활성 방향, 또는, 억제 방향으로 변화하는지, 나아가서는, 정량적인 해석에 의해 그 결과가 바뀔 수 있는 것인지를 제시해도 된다.
즉, 활성화/불활성화 예측 모듈은, 후보 화합물의 상호 작용 부분으로부터 억제성이면 (-)를, 활성성이면 (+)를, 기술한 마커(marker)를 설정하고, 네트워크 모델 상을 전파시킨다. 예를 들면, 활성화/불활성화 예측 모듈은, 억제 효과가, 그 전파처에서의 억제성을 유지하면서 전파하는 경우에는 (-)를 유지하고, 네트워크 모델 상에 있어서, 각각의 단백질에 (-)의 표시를 부가하며, 억제성의 전파가, 활성성으로 변화한 경우에는, 부호를 (+)로 교체하고, 그 이후에는, 각각의 단백질에 (+)의 부호를 부여한다. 그리고, 활성화/불활성화 예측 모듈은, 이 전파를 행한 후에, 각각의 단백질을 표현하는 네트워크 모델 상의 노드에, 어떤 부호가 기록되어 있는지를 조사하고, (-)만이 기록되어 있으면, 그 단백질은 억제를 받으며, (+)만이 기록되어 있으면 활성화된다고 예측해도 된다. 여기서, 도 9에 나타내는 바와 같이, 활성화/불활성화 예측 모듈은, 또한, 생체 분자와 화합물의 상호 작용 강도를 시각적으로 표현한 생체 분자 상호 작용 네트워크 정보(예를 들면, 생체 분자 상호 작용 네트워크도(圖) 등)를 유저에게 제시해도 된다(예를 들면, 표시부(112)에 표시시켜도 된다). 또, 도 9에 나타내는 바와 같이, 활성화/불활성화 예측 모듈은, 또한, 생체 분자와 화합물의 상호 작용 강도와, 활성화/불활성화를 시각적으로 표현한 생체 분자 상호 작용 네트워크 정보(예를 들면, 생체 분자 상호 작용 네트워크도 등)를 유저에게 제시해도 된다(예를 들면, 표시부(112)에 표시시켜도 된다).
그리고, 모델 파라미터 추정 모듈(영향 예측부(102e))은, 예측 단백질의 활성화 및 불활성화의 예측이 혼재하는 경우에, 그 단백질이 활성화 또는 불활성화되는지의 정량적인 해석이 필요하기 때문에, 예측한 후보 화합물의 예측 단백질에 대한 효과(활성화 또는 불활성화)를 반영한 계산 모델군을 이용하여, 생체 내의 네트워크의 동적 해석을 행하고, 별도의 모듈, 및/또는, 기지의 실험 데이터를 이용한 시뮬레이션 및 해석 방법을 이용하여, 후보 화합물이 생체에 어떤 영향을 주는지의 예측을 후보 화합물 영향 평가 결과로서 취득해도 된다. 여기서, 모델 파라미터 추정 모듈은, 이들의 계산의 표준적으로 되어 있는 단백질을 전제로 한 모델과, 개인의 유전자 정보를 토대로 한 유전자형에 의한 변화를 포함한 단백질을 전제로 한 모델, 및, 복수의 개인의 유전자 정보에 의한 단백질의 차이를 반영한 모델의 비교를 행함으로써, 후보 화합물의 예측 단백질에 대한 효과에 관한 개인간에서의 차이의 예측을 퍼스널 게놈 영향 평가 결과로서 취득해도 된다. 또한, 본 실시형태에 있어서의 방법은, 대상으로 하는 네트워크와 그것에 포함되는 단백질을 정의함으로써, 후보 화합물의 독성의 예측에도 이용할 수 있다. 또, 본 실시형태에 있어서의 방법은, 후보 화합물이 당초 상정하고 있는 질병에 관련된 네트워크 이외의 네트워크로도 계산의 대상을 넓힘으로써, 당해 후보 화합물의 당초의 상정 이외의 질병에의 효과를 확인하는 것에도 이용 가능하다.
또한, 본 방법은, 단백질과 단백질의 상호 작용의 예측에 응용해도 된다. 또, 본 방법은, 식물에 대해 병변으로부터의 회복, 생산성의 향상, 또는, 스트레스 내성의 향상 등을 목적으로 하여 화학 물질을 이용하는 경우에도 응용해도 된다.
이상으로, 본 실시형태에 있어서의 상호 작용 예측 장치(100)의 처리의 일례의 설명을 마친다.
실시예
이하에, 도 10 내지 도 15를 참조하여, 본 실시형태에 있어서의 상호 작용 예측 방법을 일련의 후보 화합물에 대해 적용하고, 일련의 생체 내 분자(단백질)와의 결합 강도의 예측 등을 행한 실시예에 대해 설명한다.
먼저, 도 10 내지 도 12는, 본 실시형태에 있어서의 도킹 시뮬레이션 방법을 이용하여, 5종류의 화합물(AMP, ATP, Lapatinib, Sunitinib, 및 Tiliroside)과, 3종류의 생체 분자(mTOR, PDK1, 및 PTEN)의 결합 강도를 계산 예측한 결과이다. 여기서, 도 10 내지 도 12에 나타내는 바와 같이, 각 생체 분자에 대해 막대로 나타내어져 있는 스코어는, 가장 좌측에 각 생체 분자와 네이티브 리간드의 결합값(결합 강도)이 나타내어져 있고, 좌측으로부터 순서대로 각 생체 분자와, AMP, ATP, Lapatinib, Sunitinib, 및 Tiliroside의 결합 강도가 나타내어져 있다. 즉, 도 10 내지 도 12는, 예를 들면 유저에 의해, 5종류의 화합물이 선택되고, mTOR 시그널 전달계에 대해 해석을 행하는 것이 지정되며, 당해 전달계의 모든 단백질에 대해 해석을 행하는 것이 아니고, 그 중으로부터, 특히, mTOR, PDK1, 및 PTEN에 대한 예측만을 표시시키는 설정이 된 경우의 출력이다. 또한, 당해 네이티브 리간드와의 상대값으로써 각 생체 분자와 각 화합물의 결합 강도의 기준으로 하는 것도 가능하고, 당해 네이티브 리간드와의 상대적 차이를 별도 정의한 함수에 따라 상대 결합 강도로 하는 것도 가능하다.
구체적으로, 도 10에는, 본 실시형태에 있어서 eHITS라는 도킹 시뮬레이션만을 이용한 경우의, eHITS의 추정 결과, 즉, 5종류의 화합물과 3종류의 생체 분자의 결합 강도의 계산 예측 결과를 나타내고 있다. 또, 도 11에는, 본 실시형태에 있어서 GOLD라는 도킹 시뮬레이션만을 이용한 경우의, GOLD의 추정 결과를 나타내고 있다. 또, 도 12에는, 본 실시형태에 있어서 MOE라는 도킹 시뮬레이션만을 이용한 경우의, MOE의 추정 결과를 나타내고 있다. 이렇게, 본 실시형태에 있어서는, 유저에게, 복수의 결과의 종합 평가 결과, 및, 네트워크 전체에 대한 망라적 해석을 제시할 뿐만 아니라, 유저의 선택에 의해 특정한 방법에 의한 결과를, 특정한 분자에 주목하여 제시하는 기능을 가져도 된다. 그러나, 도 10 내지 도 12에 나타내는 바와 같이, 단일의 방법(도킹 시뮬레이션)만으로는, 충분하지 않은 경우가 많다. 즉, 도 10 내지 도 12에 나타내는 바와 같이, 방법마다 추정 결과가 크게 다른 경우가 있다. 구체적으로는, 도 10에 나타내는 eHITS에 의한 추정 결과에 있어서는, mTOR과 Lapatinib의 결합 강도가, mTOR과 Sunitinib의 결합 강도보다 명확하게 강한 것을 나타내고 있지만, 도 12에 나타내는 MOE에 의한 추정 결과에 있어서는, mTOR과 Sunitinib의 결합 강도의 쪽이, 약간, mTOR과 Lapatinib의 결합 강도보다 강한 결과를 나타내고 있다. 또, 도 11에 나타내는 GOLD에 의한 추정 결과에 있어서는, mTOR과 Lapatinib의 결합 강도, 및, mTOR과 Sunitinib의 결합 강도의 추정 자체가 되어 있지 않다. 이렇게, 단일의 방법을 이용한 추정에서는, 각각의 추정 방법의 성향이나 기술적 한계에 직면하는 경우가 있기 때문에, 본 실시형태에 있어서는, 학습 방법, 및/또는, 메타 추정 방법을 이용하여 결합 강도의 종합 평가를 행함으로써 최종적으로 예측되는 결합 강도를 결정해도 된다.
또, 도 13은, AZD6244, CI-1040, PD0325901, 및 TAK-733이라는 모두 MEK의 억제제로서 치험이 행하여져 있는 화합물에 대한 본 실시형태에 있어서의 해석 결과이다. 도 13에 나타내는 바와 같이, MEK2에 대해서는, 어느 화합물도 강한 상호 작용이 인정되지만, 본 실시형태에 있어서의 상호 작용 예측 방법에 의해, BRAF, IGF1R, 및 Wee1 등에 의해 강한 상호 작용이 예측되어 있다.
또, 도 14는, 도 13에 나타낸 해석 결과에 의거하는 상호 작용 강도에 의거하여, 생체 내 분자의 상호 작용 네트워크를 분류한 도면이다. 도 14에 나타내는 바와 같이, MEK를 타깃으로 한다는 상정하에 임상 시험이 행하여져 있는 화합물(AZD6244, CI-1040, PD0325901, 및 TAK-733)의 상호 작용이 예측되는 단백질을, 도 13에 나타낸 해석 결과에 의거하여 착색하고 있다. 이렇게, 이들 화합물은, 유저(예를 들면, 제약 회사 등)가 이해하고 있는 범위를 넘어, 훨씬 광범위하게 여러 가지의 단백질과 상호 작용하고 있다. 또, 그 상호 작용은, 동일한 생물학적 기능에 관련된 시그널 전달계 네트워크 상에 분포하고 있고, 배양 세포 및 임상 치험에 의한 결과가, MEK 단백질의 억제에 의한 것인지는 의문인 것이 추측된다. 또, 도 14에 나타내는 바와 같이, 본 실시형태에 있어서의 상호 작용 예측 방법의 이용에 의해, 당해 화합물은, MEK 단백질의 억제뿐만 아니라, BRAF, IGF1R, Wee1, APC, EGFR, IGF-1, 및 AKT1 등에 대한 상호 작용의 종합적 결과로서 효과를 나타내고 있다고 생각하는 것이 더 타당한 것을 알 수 있다.
또한, 본 실시형태에 있어서는, 각각의 후보 화합물과 생체 내 분자가, 예측되는 형태로 상호 작용을 행한 경우, 그것은 상호 작용의 상대가 되는 생체 분자의 활성도를 높이는 것인지 낮추는 것인지의 판정을 행할 필요가 있다. 이 단계에 있어서도, 복수의 방법으로부터의 선택 또는 통합적 판단을 행하는 방법론이 채용된다. 여기서도, 이미 결합 강도 예측 등으로 이용된 복수 방법의 결과를 이용한 메타 추정 시스템을 이용하는 경우가 있다. 또, 많은 생체 내 분자와 화합물의 상호 작용에 관한 데이터베이스에, 대상이 되는 생체 내 분자와 후보 화합물의 조합이 존재하는 경우, 그 데이터로부터 활성화, 및 불활성화의 정보를 얻을 수 있다. 예를 들면, 본 실시형태에 있어서는, 기지의 리간드 또는 화합물을 타깃의 단백질과 상호 작용했을 때에, 그 단백질을 활성화시킨다고 한다. 여기서, 대상이 되는 리간드 또는 화합물도, 동일한 결합 양식으로 상호 작용하는 경우, 이 화합물도, 이 단백질을 활성화시키는 것으로 추정할 수 있다.
또, 단백질을 활성화시키는 분자가 대상이 되는 리간드 또는 화합물과 경합적으로 작용하는 경우는, 억제적이라고 추정해도 된다. 예를 들면, A라는 약제(화합물)는, X라는 단백질의 특정한 결합 영역에 결합하고, 동일하게 X의 결합 영역에 동시에 결합하는 분자 Y가, 단백질 X를 활성화시킨다고 한다. 이 경우, 화합물 A와 분자 Y는, 경합적으로 X의 동일한 결합 도메인(바인딩 포켓)에 상호 작용하게 된다. 여기서, 약제 A는, 분자 Y와 단백질 X의 상호 작용을 저해할 가능성이 있어, 억제적으로 기능할 가능성이 있다. 이 경우, 단지 약제 A가 분자 Y와 경합적으로 단백질 X의 동일한 도메인과 상호 작용한다는 것만으로는, 그것이 억제가 되므로, 한층 더 활성화가 되는 것인지를 알 수 없다. 따라서, 본 실시형태에 있어서는, 단백질 X의 동일한 도메인과 상호 작용을 하는 분자와 그 작용 방향에 관한 데이터베이스가 있는 경우에는, 그것을 참조해도 된다.
또, 주요한 단백질에 관해, 어느 단백질이, 다른 어느 단백질의 어느 부위에 상호 작용하고, 그 결과, 어떤 효과가 나타나는지에 관한 실험적으로 알려져 있는 것이 많다. 그래서, 본 실시형태에 있어서는, 이 지식의 데이터베이스를 이용함으로써, 후보 화합물이 단백질의 활성을 억제 또는 활성하는지를 추정해도 된다. 또, 단백질이, 다른 어느 단백질의 어느 부위에 상호 작용하고, 그 결과, 어떤 효과가 나타나는지에 관한 실험적 데이터가 존재하지 않는 경우, 구조가 유사한 생체 내 물질과 후보 화합물의 조합이 존재하면, 그 정보를 이용하여 활성화, 불활성화를 특정할 수 있다. 그래서, 본 실시형태에 있어서는, 더 정밀한 방법이 개발될 때마다, 이들의 신규 방법을 갱신·새롭게 도입해도 된다. 여기서, 구조의 유사성은 분자 전체, 또는, 분자의 일부(프래그먼트)의 유사성이어도 된다. 또, 본 실시형태에 있어서는, 생체 내 분자와 후보 화합물이 상호 작용하는 상세한 위치로부터 활성화하는지 불활성화하는지를 계산하는 방법도, 그 정밀도가 충분한 것은 도입해도 된다. 이들의 복수의 방법으로 산출된 예측은, 각각의 방법의 특징을 감안한 방법으로 최종적인 결과가 유도된다. 이 과정에 있어서, 본 실시형태에 있어서는, 뉴럴 네트워크 또는 통계적 학습 방법 등의 방법을 이용하여 최종적인 예측을 가져오는 방법을 도입해도 된다. 이들에 의해, 각각의 후보 화합물의 종합적 영향을 계산할 수 있다.
여기서, 대상이 되는 생명 현상에 관련된 생체 분자 상호 작용 네트워크에 대해, 각종의 방법을 이용하여 동적 시뮬레이션을 행하기 위해 필요한 파라미터가 이미 결정된 계산 모델이 존재하는 경우에 있어서, 이들의 파라미터의 결정은, 예를 들면, 정상 상태의 세포에 대해, 얼마간의 기지의 자극을 준 경우의 단백질의 인산화 상태의 시계열 데이터 등을 이용하여, 유전적 알고리즘, 확률적 어닐링법, 및/또는, 구배 하강법 등의 방법을 이용하여 모델의 거동이, 실험 데이터에 일치하도록 계산하여 얻어진 것이어도 된다.
또, 본 실시형태에 있어서는, 생체 내 분자(단백질)에 대해 후보 화합물을 투여하지 않는 상태와 비교하여, 각각의 후보 화합물을 투여한 경우에, 어떤 변화가 나타나는지의 시뮬레이션 계산을 행하여도 된다. 여기서, 본 실시형태에 있어서의 하나의 방법으로서는, 먼저, 후보 화합물 등이 투여되어 있지 않은 상태에서의 거동을 계산하고, 하나의 후보 화합물이 투여된 상태를 상정해도 된다. 여기서, 후보 화합물이 상호 작용한다고 예측된 각각의 생체 내 분자에 대해, 후보 화합물의 양 등을 감안하여, KD, Kd, 및 Ka 등의 값을 변화시킨 방정식을 설정해도 된다. 그리고, 동일한 처리를, 일련의 후보 화합물에 있어서 행할 수 있다. 이 단계에서, 계산 모델은, 생체 내 분자(단백질)에 대해 후보 화합물이 일정량 투여된 경우에, 투여가 없는 경우에 비해, 어느 정도의 세포 내 응답의 차이가 발생되는지가, 계산 가능하게 되어 있다.
예를 들면, 세포의 시그널 전달계의 모델로서 일련의 미분 방정식이 설정되어 있었을 경우, 그 미분 방정식에, 후보 화합물에 의한 영향이, 식으로서 부가되어 있으므로, 당해 미분 방정식을 푸는 것에 의해, 후보 화합물의 투여하에서의 세포의 응답의 계산 예측이 행하여진다. 이 계산을, 일련의 후보 화합물에 대해 행함으로써, 각각의 후보 화합물이, 대상 생체계에 어떤 효과를 생기게 하는지가 예측 가능해진다. 여기서, 도 15는, 본 실시형태에 있어서의 계산 예측의 일례(시뮬레이션 계산에 의한 변화 예측)이다. 도 15에 나타내는 바와 같이, 포유 동물 세포의 시그널 전달계에 돌연변이가 생긴 경우에, 생체 내 분자(에스트로겐 수용체)의 활성도가 계시적으로 어떻게 변화하는지를 계산기 예측한 경우의 그래프이고, 실선이 변이형, 파선이 정상형을 나타내고 있다.
[그 밖의 실시형태]
지금까지 본 발명의 실시형태에 대해 설명했지만, 본 발명은, 상술한 실시형태 이외에도, 특허청구의 범위에 기재된 기술적 사상의 범위 내에 있어서 다양한 다른 실시형태로 실시되어도 되는 것이다.
예를 들면, 상호 작용 예측 장치(100)가 스탠드 얼론의 형태로 처리를 행하는 경우를 일례로 설명했지만, 상호 작용 예측 장치(100)는, 클라이언트 단말(상호 작용 예측 장치(100)와는 별도 하우징이다)로부터의 요구에 따라 처리를 행하고, 그 처리 결과를 당해 클라이언트 단말에 반환하도록 해도 된다.
또, 실시형태에 있어서 설명한 각 처리 중, 자동적으로 행하여지는 것으로서 설명한 처리의 전부 또는 일부를 수동적으로 행할 수도 있고, 혹은, 수동적으로 행하여지는 것으로서 설명한 처리의 전부 또는 일부를 공지의 방법으로 자동적으로 행할 수도 있다.
이 외에, 상기 문헌 중이나 도면 중에서 나타낸 처리 순서, 제어 순서, 구체적 명칭, 각 처리의 등록 데이터나 검색 조건 등의 파라미터를 포함하는 정보, 화면예, 데이터베이스 구성에 대해서는, 특기(特記)하는 경우를 제외하고 임의로 변경할 수 있다.
또, 상호 작용 예측 장치(100)에 관해, 도시의 각 구성 요소는 기능 개념적인 것이고, 반드시 물리적으로 도시와 같이 구성되어 있는 것을 필요로 하지 않는다.
예를 들면, 상호 작용 예측 장치(100)의 각 장치가 구비하는 처리 기능, 특히 제어부(102)에서 행하여지는 각 처리 기능에 대해서는, 그 전부 또는 임의의 일부를, CPU(Central Processing Unit) 및 당해 CPU에서 해석 실행되는 프로그램으로 실현해도 되고, 또, 와이어드 로직(wired logic)에 의한 하드웨어로서 실현해도 된다. 또한, 프로그램은, 후술하는, 컴퓨터에 본 발명에 관련된 방법을 실행시키기 위한 프로그램화된 명령을 포함하는, 일시적이 아닌 컴퓨터 판독 가능한 기록 매체에 기록되어 있고, 필요에 따라 상호 작용 예측 장치(100)에 기계적으로 판독된다. 즉, ROM 또는 HDD(Hard Disk Drive) 등의 기억부(106) 등에는, OS(Operating System)와 협동하여 CPU에 명령을 주고, 각종 처리를 행하기 위한 컴퓨터 프로그램이 기록되어 있다. 이 컴퓨터 프로그램은, RAM에 로드됨으로써 실행되고, CPU와 협동하여 제어부를 구성한다.
또, 이 컴퓨터 프로그램은, 상호 작용 예측 장치(100)에 대해 임의의 네트워크(300)를 통해 접속된 애플리케이션 프로그램 서버에 기억되어 있어도 되고, 필요에 따라 그 전부 또는 일부를 다운로드하는 것도 가능하다.
또, 본 발명에 관련된 프로그램을, 컴퓨터 판독 가능한 기록 매체에 저장해도 되고, 또, 프로그램 제품으로서 구성할 수도 있다. 여기서, 이 「기록 매체」는, 메모리 카드, USB 메모리, SD 카드, 플렉시블 디스크, 광자기 디스크, ROM, EPROM, EEPROM, CD-ROM, MO, DVD, 및 Blu-ray Disc 등의 임의의 「가반(可搬)용의 물리 매체」를 포함하는 것으로 한다.
또, 「프로그램」은, 임의의 언어나 기술 방법으로 기술된 데이터 처리 방법이고, 소스 코드나 바이너리 코드 등의 형식을 불문한다. 또한, 「프로그램」은 반드시 단일적으로 구성되는 것에 한정되지 않고, 복수의 모듈이나 라이브러리로서 분산 구성되는 것이나, OS(Operating System)로 대표되는 별개의 프로그램과 협동하여 그 기능을 달성하는 것도 포함한다. 또한, 실시형태에 나타낸 각 장치에 있어서 기록 매체를 판독하기 위한 구체적인 구성, 판독 순서, 혹은, 판독 후의 인스톨 순서 등에 대해서는, 주지의 구성이나 순서를 이용할 수 있다.
기억부(106)에 저장되는 각종의 데이터베이스 등(화합물 구조 정보 데이터베이스(106a), 단백질 구조 정보 데이터베이스(106b), 유전자 정보 데이터베이스(106c), 분자간 상호 작용 정보 데이터베이스(106d), 및 단백질 구조 유사성 정보 데이터베이스(106e))은, RAM, ROM 등의 메모리 장치, 하드 디스크 등의 고정 디스크 장치, 플렉시블 디스크, 및 광 디스크 등의 스토리지 수단이고, 각종 처리나 웹 사이트 제공에 이용하는 각종의 프로그램, 테이블, 데이터베이스, 및 웹 페이지용 파일 등을 저장한다.
또, 상호 작용 예측 장치(100)는, 기지의 데스크탑형 또는 노트형의 퍼스널 컴퓨터, 휴대전화, 스마트폰, PHS, 및 PDA 등의 휴대 단말 장치, 및 워크스테이션 등의 정보 처리 장치로서 구성해도 되고, 또, 당해 정보 처리 장치에 임의의 주변 장치를 접속하여 구성해도 된다. 또, 상호 작용 예측 장치(100)는, 당해 정보 처리 장치에 본 발명의 방법을 실현시키는 소프트웨어(프로그램, 데이터 등을 포함한다)를 실장함으로써 실현해도 된다.
또한, 장치의 분산·통합의 구체적 형태는 도시하는 것에 한정되지 않고, 그 전부 또는 일부를, 각종의 부가 등에 따라, 또는, 기능 부하에 따라, 임의의 단위로 기능적 또는 물리적으로 분산·통합하여 구성할 수 있다. 즉, 상술한 실시형태를 임의로 조합하여 실시해도 되고, 실시형태를 선택적으로 실시해도 된다.
산업상의 이용 가능성
이상 상세하게 설명한 바와 같이, 본 발명에 의하면, 화합물 등의 화학 물질이, 생체 내의 어느 단백질과 상호 작용하는지, 또한 그들의 상호 작용이 생체에 어떤 영향을 미치는지를 예측할 수 있는 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램을 제공할 수 있으므로, 특히 의료, 제약, 신약 개발, 및 생물학 연구 등의 여러 가지의 분야에 있어서 매우 유용하다.
100: 상호 작용 예측 장치 102: 제어부
102a: 화합물 구조 정보 취득부 102b: 단백질 구조 정보 취득부
102c: 예측 단백질 결정부 102d: 상호 작용 강도 결정부
102e: 영향 예측부 104: 통신 제어 인터페이스부
106: 기억부
106a: 화합물 구조 정보 데이터베이스
106b: 단백질 구조 정보 데이터베이스
106c: 유전자 정보 데이터베이스
106d: 분자간 상호 작용 정보 데이터베이스
106e: 단백질 구조 유사성 정보 데이터베이스
108: 입출력 제어 인터페이스부 112: 표시부
114: 입력부 200: 외부 시스템
300: 네트워크

Claims (8)

  1. 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 있어서,
    상기 기억부는,
    화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과,
    단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고,
    상기 제어부는,
    상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 수단과,
    상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 수단과,
    상기 화합물 구조 정보 취득 수단에 의해 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 수단에 의해 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법 및 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 수단과,
    상기 화합물 구조 정보 취득 수단에 의해 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 수단에 의해 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법 및 상기 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 수단을 구비한 것을 특징으로 하는 상호 작용 예측 장치.
  2. 제 1 항에 있어서,
    상기 단백질 구조 정보 기억 수단은,
    세포 내 또는 생체 내의 네트워크 상에 있어서의 상기 단백질의 위치에 관한 위치 정보를 포함하는, 당해 네트워크에 관한 네트워크 정보에 대응지어, 당해 단백질의 구조에 관한 상기 단백질 구조 정보를 기억하고,
    상기 제어부는,
    상기 상호 작용 강도 결정 수단에 의해 결정된 상기 예측 상호 작용 강도, 및, 상기 단백질 구조 정보 기억 수단에 기억된 상기 네트워크 정보에 의거하여, 상기 도킹 시뮬레이션 방법을 적어도 이용하여 상기 화합물의 상기 예측 단백질에 대한 영향을 예측하는 영향 예측 수단을 더 구비한 것을 특징으로 하는 상호 작용 예측 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 기억부는,
    세포 내 또는 생체 내의 분자간 상호 작용에 관한 분자간 상호 작용 정보를 기억하는 분자간 상호 작용 정보 기억 수단을 더 구비하고,
    상기 예측 단백질 결정 수단 및 상기 상호 작용 강도 결정 수단 중 하나 이상은,
    추가로, 상기 분자간 상호 작용 정보 기억 수단에 기억된 상기 분자간 상호 작용 정보를 이용하여 상기 예측 결합 강도 또는 상기 예측 상호 작용 강도를 결정하는 것을 특징으로 하는 상호 작용 예측 장치.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 기억부는,
    단백질의 구조의 유사성에 관한 단백질 구조 유사성 정보를 기억하는 단백질 구조 유사성 정보 기억 수단을 더 구비하고,
    상기 예측 단백질 결정 수단 및 상기 상호 작용 강도 결정 수단 중 하나 이상은,
    추가로, 상기 단백질 구조 유사성 정보 기억 수단에 기억된 상기 단백질 구조 유사성 정보를 이용하여 상기 예측 결합 강도 또는 상기 예측 상호 작용 강도를 결정하는 것을 특징으로 하는 상호 작용 예측 장치.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 단백질 구조 정보 취득 수단은,
    상기 구조 예측 방법을 이용하여 복수의 상기 단백질 구조 정보를 예측하고, 상기 학습 방법 및 상기 메타 추정 방법 중 하나 이상을 이용하여 상기 후보 단백질 구조 정보를 예측함으로써 취득하는 것을 특징으로 하는 상호 작용 예측 장치.
  6. 제 1 항 또는 제 2 항에 있어서,
    상기 기억부는,
    개인의 유전자에 관한 유전자 정보를 기억하는 유전자 정보 기억 수단을 더 구비하고,
    상기 단백질 구조 정보 취득 수단은,
    상기 유전자 정보 기억 수단에 기억된 상기 유전자 정보에 의거하여, 상기 구조 예측 방법을 이용하여 상기 후보 단백질 구조 정보를 예측함으로써 취득하는 것을 특징으로 하는 상호 작용 예측 장치.
  7. 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 있어서 실행되는 상호 작용 예측 방법에 있어서,
    상기 기억부는,
    화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과,
    단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고,
    상기 제어부에 있어서 실행되는,
    상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 단계와,
    상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 단계와,
    상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 단계에서 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법 및 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 단계와,
    상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 단계에서 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법 및 상기 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 단계를 포함하는 것을 특징으로 하는 상호 작용 예측 방법.
  8. 기억부와 제어부를 적어도 구비한 상호 작용 예측 장치에 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체에 있어서,
    상기 기억부는,
    화합물의 구조에 관한 화합물 구조 정보를 기억하는 화합물 구조 정보 기억 수단과,
    단백질의 구조에 관한 단백질 구조 정보를 기억하는 단백질 구조 정보 기억 수단을 구비하고,
    상기 제어부에 있어서,
    상기 화합물의 상기 화합물 구조 정보를 상기 화합물 구조 정보 기억 수단으로부터 취득, 또는, 상기 화합물 구조 정보 기억 수단에 기억되어 있지 않은 상기 화합물 구조 정보를 구조 예측 방법을 이용하여 예측함으로써 취득하는 화합물 구조 정보 취득 단계와,
    상기 화합물과의 상호 작용의 후보가 되는 상기 단백질인 후보 단백질의 상기 단백질 구조 정보인 후보 단백질 구조 정보를 상기 단백질 구조 정보 기억 수단으로부터 취득, 또는, 상기 단백질 구조 정보 기억 수단에 기억되어 있지 않은 상기 후보 단백질 구조 정보를 상기 구조 예측 방법을 이용하여 예측함으로써 취득하는 단백질 구조 정보 취득 단계와,
    상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 단백질 구조 정보 취득 단계에서 취득된 상기 후보 단백질 구조 정보에 의거하여, 복수의 도킹 시뮬레이션 방법을 이용하여 상기 후보 단백질과 상기 화합물의 결합 강도를 복수 산출하고, 학습 방법 및 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터, 어느 하나의 상기 결합 강도, 또는, 상기 복수의 결합 강도의 조합을 최종적으로 예측되는 상기 결합 강도인 예측 결합 강도로서 결정하며, 상기 화합물과 상호 작용하는 것이 예측되는 상기 후보 단백질인 예측 단백질을 결정하는 예측 단백질 결정 단계와,
    상기 화합물 구조 정보 취득 단계에서 취득된 상기 화합물 구조 정보, 및, 상기 예측 단백질 결정 단계에서 결정된 상기 예측 단백질의 상기 단백질 구조 정보에 의거하여, 복수의 결합 강도 시뮬레이션 방법을 이용하여 상기 결합 강도를 복수 산출하고, 상기 학습 방법 및 상기 메타 추정 방법 중 하나 이상을 이용하여 복수의 당해 결합 강도로부터 최종적으로 예측되는, 당해 화합물 구조 정보에 의거하는 상기 화합물이, 경합적으로 작용하는 다른 상기 화합물의 존재하에서, 상기 예측 단백질과 어느 정도 상기 상호 작용하는지의 강도를 나타내는 상호 작용 강도인 예측 상호 작용 강도를 결정하는 상호 작용 강도 결정 단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체.
KR1020147034564A 2012-06-13 2013-06-13 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램 KR101606160B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2012-134261 2012-06-13
JP2012134261A JP5905781B2 (ja) 2012-06-13 2012-06-13 相互作用予測装置、相互作用予測方法、および、プログラム
PCT/JP2013/066323 WO2013187468A1 (ja) 2012-06-13 2013-06-13 相互作用予測装置、相互作用予測方法、および、プログラム

Publications (2)

Publication Number Publication Date
KR20150008179A KR20150008179A (ko) 2015-01-21
KR101606160B1 true KR101606160B1 (ko) 2016-03-24

Family

ID=49758286

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147034564A KR101606160B1 (ko) 2012-06-13 2013-06-13 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램

Country Status (10)

Country Link
US (1) US20150169822A1 (ko)
EP (1) EP2862924A4 (ko)
JP (1) JP5905781B2 (ko)
KR (1) KR101606160B1 (ko)
CN (1) CN104350141B (ko)
AU (1) AU2013275211B2 (ko)
CA (1) CA2876051A1 (ko)
RU (1) RU2607039C2 (ko)
SG (1) SG11201408017VA (ko)
WO (1) WO2013187468A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3356999T3 (da) * 2015-10-04 2020-02-03 Atomwise Inc System til anvendelse af et konvolutionsnetværk til rumlige data
KR102457974B1 (ko) 2015-11-04 2022-10-21 삼성전자주식회사 신규 물질 탐색 방법 및 장치
JP2019508821A (ja) * 2015-12-31 2019-03-28 サイクリカ インクCyclica Inc. タンパク質−リガンド相互作用を同定するためのプロテオームドッキング方法
KR101809599B1 (ko) * 2016-02-04 2017-12-15 연세대학교 산학협력단 약물과 단백질 간 관계 분석 방법 및 장치
CN110352459B (zh) * 2016-11-24 2023-08-22 汉阳大学校产学协力团 靶向非结构-结构转移位点的新药候选物质挖掘方法及新药候选物质挖掘装置
KR102220653B1 (ko) * 2017-10-30 2021-03-02 서울대학교산학협력단 심화 학습 기반의 약물-표적 단백질 간 상호작용 예측 시스템 및 그 방법
GB2573102A (en) * 2018-04-20 2019-10-30 Drugai Ltd Interaction property prediction system and method
US12094576B2 (en) * 2019-12-16 2024-09-17 John McDevitt System and method for improved genetic modifications to support beneficial adaptation to unanticipated conditions and unintended consequences by utilizing randomization
CN111816252B (zh) * 2020-07-21 2021-08-31 腾讯科技(深圳)有限公司 一种药物筛选方法、装置及电子设备
CN115862768B (zh) * 2022-12-11 2023-09-01 南昌大学 一种用于大规模药物虚拟筛选的优化方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3443039B2 (ja) * 1999-06-21 2003-09-02 科学技術振興事業団 ネットワーク推定方法および装置
JP2001188768A (ja) * 1999-12-28 2001-07-10 Japan Science & Technology Corp ネットワーク推定方法
FR2888850B1 (fr) * 2005-07-22 2013-01-11 Pf Medicament Nouveaux anticorps anti-igf-ir et leurs applications
JP2007219760A (ja) * 2006-02-15 2007-08-30 Fujitsu Ltd ドッキングシミュレーションプログラム、該プログラムを記録した記録媒体、ドッキングシミュレーション装置、およびドッキングシミュレーション方法
WO2008035729A1 (fr) * 2006-09-21 2008-03-27 Astellas Pharma Inc. Procédé de recherche d'un ligand
WO2010026738A2 (ja) * 2008-09-05 2010-03-11 国立大学法人神戸大学 酵素活性をコンピュータを用いたシミュレーションにより予測する方法
JP5336453B2 (ja) * 2010-10-01 2013-11-06 学校法人沖縄科学技術大学院大学学園 ネットワークモデル統合装置、ネットワークモデル統合システム、ネットワークモデル統合方法、および、プログラム

Also Published As

Publication number Publication date
EP2862924A4 (en) 2015-12-23
CN104350141B (zh) 2016-04-27
JP2013255467A (ja) 2013-12-26
WO2013187468A1 (ja) 2013-12-19
AU2013275211B2 (en) 2016-05-12
JP5905781B2 (ja) 2016-04-20
AU2013275211A1 (en) 2015-01-15
CN104350141A (zh) 2015-02-11
SG11201408017VA (en) 2015-01-29
RU2014153560A (ru) 2016-08-10
US20150169822A1 (en) 2015-06-18
EP2862924A1 (en) 2015-04-22
KR20150008179A (ko) 2015-01-21
CA2876051A1 (en) 2013-12-19
RU2607039C2 (ru) 2017-01-10

Similar Documents

Publication Publication Date Title
KR101606160B1 (ko) 상호 작용 예측 장치, 상호 작용 예측 방법, 및 프로그램
Uffelmann et al. Genome-wide association studies
Sanchez-Garcia et al. BIPSPI: a method for the prediction of partner-specific protein–protein interfaces
Fu et al. Discovery of the consistently well-performed analysis chain for SWATH-MS based pharmacoproteomic quantification
Tiberti et al. PyInteraph: a framework for the analysis of interaction networks in structural ensembles of proteins
Sachs et al. Causal protein-signaling networks derived from multiparameter single-cell data
Dehouck et al. PoPMuSiC 2.1: a web server for the estimation of protein stability changes upon mutation and sequence optimality
Vlasblom et al. Markov clustering versus affinity propagation for the partitioning of protein interaction graphs
Garcia-Garcia et al. iFrag: a protein–protein interface prediction server based on sequence fragments
Lätzer et al. Conformational switching upon phosphorylation: a predictive framework based on energy landscape principles
Fan et al. Harnessing reversed allosteric communication: a novel strategy for allosteric drug discovery
Bajikar et al. Multiscale models of cell signaling
Goodsell Computational docking of biomolecular complexes with AutoDock
Marchand et al. CAVIAR: a method for automatic cavity detection, description and decomposition into subcavities
Papin et al. Bioinformatics and cellular signaling
Das et al. Machine-learning technique, QSAR and molecular dynamics for hERG–drug interactions
Marks et al. Increasing the accuracy of protein loop structure prediction with evolutionary constraints
Yang et al. Importance of interface and surface areas in protein-protein binding affinity prediction: A machine learning analysis based on linear regression and artificial neural network
Rath et al. A benchmark server using high resolution protein structure data, and benchmark results for membrane helix predictions
Zhang et al. FuncPhos-STR: An integrated deep neural network for functional phosphosite prediction based on AlphaFold protein structure and dynamics
Korenberg Prediction of treatment response using gene expression profiles
Tsishyn et al. FiTMuSiC: leveraging structural and (co) evolutionary data for protein fitness prediction
Mai et al. Computational prediction of kink properties of helices in membrane proteins
Stepanova et al. In silico modelling of hormone response elements
Sinha et al. Classification of PTEN missense VUS through exascale simulations

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190304

Year of fee payment: 4