KR20020028925A - New method for desiging molaculars of new medicines - Google Patents

New method for desiging molaculars of new medicines Download PDF

Info

Publication number
KR20020028925A
KR20020028925A KR1020020000990A KR20020000990A KR20020028925A KR 20020028925 A KR20020028925 A KR 20020028925A KR 1020020000990 A KR1020020000990 A KR 1020020000990A KR 20020000990 A KR20020000990 A KR 20020000990A KR 20020028925 A KR20020028925 A KR 20020028925A
Authority
KR
South Korea
Prior art keywords
probe
probes
weight
physiological activity
energy
Prior art date
Application number
KR1020020000990A
Other languages
Korean (ko)
Inventor
신환철
채종학
Original Assignee
신환철
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신환철 filed Critical 신환철
Priority to KR1020020000990A priority Critical patent/KR20020028925A/en
Publication of KR20020028925A publication Critical patent/KR20020028925A/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

PURPOSE: A molecular design method is provided to construct chromosome with weighting values of probes as genes, to optimize an average weighing value of the probes by applying a least square method and a genetic algorithm alternatively or repeatedly, and analyze three dimensional quantitative structure activity relation so that it can estimate a physiological activity of unknown chemical compound. CONSTITUTION: The method comprises steps of generating probes for calculating probe interaction energy(100), generating initial objects by expressing weighting values of the probes as genes(200), obtaining a linear coefficient of chromosome by using a least square method for expressing a relation between the weighted probe interaction energy and the physiological activity(300), obtaining the average weighting value of the probes, and then obtaining the linear coefficient based the average weighting value(400), obtaining better weighting value of the probe by using a genetic algorithm(600), and obtaining the physiological activity by using spatial coordinates, a partial charge, and a final weighting coefficient of the probes(700).

Description

신약 개발을 위한 새로운 분자 설계방법{New method for desiging molaculars of new medicines}New method for desiring molaculars of new medicines

본 발명은 신약 개발과정에서의 효율성을 높여주는 분자설계 방법인 삼파원의 정량적 구조-활성 관계 분석에 의한 신약개발을 위한 새로운 분자설계 방법에 관한 것이다.The present invention relates to a new molecular design method for drug development by analyzing the quantitative structure-activity relationship of the three-wave source, which is a molecular design method that improves the efficiency in the drug development process.

일반적으로 하나의 신약을 개발하기 위해서는 수없이 많은 물질들을 합성해서 각각의 생리활성을 측정하고 독성을 검증하는 복합적 과정을 거쳐야 하기 때문에 신약 개발에는 천문학적 투자가 필요하다.In general, developing a new drug requires an astronomical investment because it involves a complex process of synthesizing numerous substances to measure their physiological activity and verifying their toxicity.

따라서 약리 작용을 분자의 수준에서 이해하고 이를 토대로 합성 대상물질을 선택하는 합리적 신약설계(rational drug design)에 접근하는 방법이 전 세계적인 추세에 있다.Therefore, there is a global trend in approaching rational drug design, which understands pharmacological action at the molecular level and selects synthetic substances based on it.

약리작용은 생체내에서 목표물이 되는 효소나 수용체(receptor)와 같은 단백질과 약효를 갖는 분자인 리간드(ligand)와의 삼차원적 상호작용에 따라 나타나는 현상으로써 수용체의 입체구조를 알고 있을 때는 구조에 기초한 신약설계(structure-based drug design)방법을 이용하고 있다.Pharmacological action is a phenomenon caused by three-dimensional interaction between a target enzyme in the living body and a protein such as a receptor and a ligand, a molecule that has a medicinal effect. Structure-based drug design is used.

그러나 수용체의 입체구조를 모를 때에는 이미 약효를 알고 있는 리간드 분자들만을 이용하여 이들의 삼차원 분자구조와 약효간의 정량적 관계를 알아내고 이 관계로부터 실험을 하지 않은 분자들의 약효를 계산에 의해 예측케 할 수 있는 삼차원의 정량적 구조-활성 관계법(three-dimensional quantitative structure-activity relationship;3D-QSAR)도 있으며 세계적으로 많은 대학과 제약회사 연구소에서 여러가지의 삼차원의 정량적 구조-활성 관계 분석법의 개발과 응용 연구가 활발하게 진행되고 있다.However, when not knowing the three-dimensional structure of the receptor, only the ligand molecules that already know the drug can be used to find out the quantitative relationship between the three-dimensional molecular structure and the drug, and from this relationship can predict the drug's efficacy by calculation. There is also a three-dimensional quantitative structure-activity relationship (3D-QSAR), and many universities and pharmaceutical research institutes around the world are actively developing and applying various three-dimensional quantitative structure-activity relationships. Is going on.

현재 신약개발 과정에 삼차원의 정량적 구조-활성 관계법을 이용하는 소프트웨어로 가장 널리 이용되고 있는 것은 1988년 Cramer가 발명한 방법이 있고 미국 세인트루이스시(St. Louis)에 소재한 트리포스사(Tripos, Inc.)에서 판매하는 콤파(CoMFA; Comparative Molecular Field Analysis의 약칭)가 있다.The most widely used software that uses three-dimensional quantitative structure-activity relations in the drug development process is the method invented by Cramer in 1988 and Tripos, Inc., St. Louis, USA. CoMFA (abbreviated for Comparative Molecular Field Analysis).

이 소프트웨어에서 이용되는 알고리즘은 미국 특허번호 5,025,388과 5,307,287로 등록되어 있다.The algorithms used in this software are registered in US Pat. Nos. 5,025,388 and 5,307,287.

이 방법에서는 리간드의 약효 혹은 활성도(ativity)의 로그(log)값이 수용체와의 결합 에너지(binding energy)와 비례한다는 일반적 화학이론에 입각하여, 여러분자들을 중첩시킨 후 그 주위의 공간상에 격자점(lattice)들을 설정하고 각 점에 위치한 원자 프로브(probe)와 리간드 분자들간의 상호작용 에너지(interaction energy)를 계산하여 각 격자점의 값으로 택하고 각각의 리간드 분자의 약효에 기여하는 상수(coefficient)를 구한 다음, 이 상수들을 이용하여 미지 화합물의 활성도를 예측한다.In this method, based on the general chemical theory that the logarithm of the ligand's potency or activity is proportional to the binding energy with the receptors, you overlap and lattice the space around it. Calculate the interaction energy between atomic probes and ligand molecules located at each point by selecting the points and choosing them as the values of the lattice points and contributing to the efficacy of each ligand molecule. coefficients) and then use these constants to predict the activity of the unknown compound.

이때 격자점 수 즉 변수의 갯수가 분자의 갯수 즉 측정치의 갯수보다 월등히 많아 보통의 통계적 방법인 다중회귀법(multiple regression)으로는 원하는 해답을 얻을 수 없기 때문에 이해하기 어렵고 복잡한 통계방법인 부분최소자승법(partial least squrres)이라는 특수한 알고리즘을 이용한다.At this time, the number of grid points, that is, the number of variables, is much greater than the number of molecules, that is, the number of measurements, so the partial least squares method, which is difficult to understand because of multiple regression, which is a common statistical method, cannot be obtained. A special algorithm called partial least squrres is used.

그러나 적어도 두 종류이상의 프로브를 이용하여야 하며 부분최소자승법에서의 변수 선택과 사용자가 결정해 주어야하는 여러 환경변수에 따라 결과가 많이 변하는 등 수학적으로 야기되는 문제점들이 많아 이를 개선시키려는 연구가 계속되고 있으며 또한 결과의 해석도 직관적이기보다는 간접적인 측면이 강하다.However, at least two types of probes must be used, and there are many mathematical problems such as variable selection in the partial least squares method and results vary depending on various environmental variables that the user must decide. The interpretation of the results is also indirect, rather than intuitive.

그러나 신약 개발 과정에서의 삼차원의 정량적 구조-활성 관계법의 효용성과 아직은 마땅한 대안이 없는 상황이기때문에 위의 방법론상의 문제점과 고가의 워크스테이션에서만 사용이 가능하다는 단점에도 불구하고 콤파는 전 세계적으로 널리 쓰이고 있다.However, despite the problems of the above methodology and the disadvantage of being available only on expensive workstations, the comparator is widely used all over the world because of the effectiveness of the three-dimensional quantitative structure-activity method in the development of new drugs and the lack of alternatives. have.

본 발명에서는 콤파를 비롯한 기존의 방법론과는 다른 개념의 접근 방법과 다른 수학적 해결방법을 이용하여 미지 화합물의 활성도 예측을 더욱 정확히 할 수 있고 사용자의 의사 판단 과정을 최소화하고 결과의 직관적 해석이 가능하며 또한 계산 시간이 짧고 일반 개인용 컴퓨터에서도 사용 가능한 소프트웨어로 만들 수 있는 새로운 삼차원의 정량적 구조-활성 관계 분석방법에 의한 신약개발을 위한 새로운 분자 설계방법을 제공코저하는 것이다.In the present invention, it is possible to more accurately predict the activity of an unknown compound by using a different concept approach and a different mathematical solution than the conventional methodology including the compa, minimizing the user's decision making process and intuitive interpretation of the result. In addition, it is to provide a new molecular design method for new drug development by using a new three-dimensional quantitative structure-activity relationship analysis method that can be made with software that is short in computation time and can be used in general personal computers.

도 1 은 본 발명에 따른 가중된 프로브 상호작용 에너지를 이용한 삼차원의 정량적 구조-활성 관계 분석계 통도.1 is a three-dimensional quantitative structure-activity relationship analysis system using the weighted probe interaction energy according to the present invention.

도 2 는 코티코스테로이드 결합 단백질에 결합하는 21개의 스테로이드 화합물들의 훈련분자로 하여 얻은 가중치가 0이 아닌 프로브들과 한개의 화합물 상태도.2 is a non-zero weighted probe and one compound state diagram obtained by training molecules of 21 steroid compounds that bind to corticosteroid binding protein.

도 3 은 훈련분자에 포함되지 않았던 미지 분자들의 생리 활성도의 실험치와 도2에 있는 프로브들을 이용하여 얻은 계산치를 나타낸 그라프.3 is a graph showing experimental values of physiological activities of unknown molecules not included in a training molecule and calculations obtained using the probes of FIG. 2.

본 발명의 가중된 프로브 상호작용 에너지를 이용한 삼차원의 정량적 구조-활성 관계분석 방법은 다음과 같은 이론적 배경을 바탕으로 한다.The three-dimensional quantitative structure-activity relationship analysis method using the weighted probe interaction energy of the present invention is based on the following theoretical background.

신약 개발과정에서는 많은 화합물들을 합성하여 약효를 측정하는데 분자구조에 따라 각기 다른 약효(IC50)를 나타내게 된다.In the process of drug development, many compounds are synthesized to measure drug efficacy, and they exhibit different drug effects (IC 50 ) depending on the molecular structure.

그 이유는 각 리간드 분자들과 효소와 같은 특정 단백질 수용체와의 결합 에너지 E의 차이에 기인하여 i번째 화합물의 생리 활성도 Ai는 식(1)과 같이 Ei의 일차 함수로 나타낼 수 있는 것으로 알려져 있다.The reason is that the physiological activity A i of the i-th compound can be expressed as the first-order function of E i as shown in Equation (1) due to the difference in binding energy E between each ligand molecule and specific protein receptor such as enzyme. have.

따라서 Ei는 계산이 가능한 양이므로 선형계수 a와 b를 정할 수 있으면 생리활성도 Ai나 IC50를 계산해 낼 수 있다.Therefore, E i is a calculable amount, so if the linear coefficients a and b can be determined, the biological activity A i or IC 50 can be calculated.

(1) 생리활성도(Ai) = -log(IC50) = a + b Ei (1) physiological activity (A i ) = -log (IC 50 ) = a + b E i

본 발명에서는 리간드 분자들과 이들을 둘러싼 주위환경과의 상호작용에 의하여 약효가 달라지며 따라서 주위환경을 프로브들의 집합으로 대체 표현할 때 어느 프로브들은 약효의 차이와 관계가 있고 어느 것들은 관계가 없을 것이라는 생각하에 약효의 차이를 설명해 줄 수 있는 프로브들의 상호작용 에너지에의 기여도를 정함으로써 삼차원의 정량적 구조-활성 관계를 알아낼 수 있다는 가정을 세웠다.In the present invention, the drug varies depending on the interaction between ligand molecules and the surrounding environment. Therefore, when the expression of the environment is replaced by a set of probes, some probes are related to the difference in drug efficacy and some are not related. The hypothesis is that three-dimensional quantitative structure-activity relationships can be identified by determining the contributions of the probes to the interaction energy that may explain the difference in efficacy.

즉 식(1)에서의 Ei를 프로브들과 약효가 알려져 있는 i번째 리간드 분자(이들을 훈련분자(training molecules)라 부름)간의 결합에너지(혹은 상호작용 에너지)로 대치하고 j번째 프로브의 가중치(weight)를 0에서 1까지의 값을 갖는 wj로 표현할 때 Ei는 식(2)로 나타낼 수 있다.In other words, replace E i in Equation (1) with the binding energy (or interaction energy) between the probes and the i-th ligand molecule (known as training molecules), and the weight of the j-th probe ( E i can be represented by equation (2) when weight) is expressed as wj having a value from 0 to 1.

이 개념은 간단하지만 본 발명의 핵심적 요지 중의 하나이다.This concept is simple but is one of the key points of the present invention.

(2) Ei= ∑j probeswjEij (2) E i = ∑ j probes w j E ij

식(2)를 다시 식(1)에 대입하면 i번째 화합물의 생리 활성도 Ai의 계산식(3)이 된다.Substituting Equation (2) into Equation (1) again yields the physiological activity A i of the i-th compound (3).

(3) Ai cal= a + b∑j probeswjEij (3) A i cal = a + b∑ j probes w j E ij

이 (3)식을 이용한 Ai의 계산치와 실험으로부터 얻은 값과의 차이가 최소가 되게하는 a와 b, 그리고 wj를 정해주면 삼차원 정량적 구조-활성관계식이 된다.If we set a, b, and w j to minimize the difference between the calculated value of A i using the equation (3) and the value obtained from the experiment, it becomes the three-dimensional quantitative structure-activity relationship.

그러나 실험치는 불과 수십개인데 반해 프로브의 갯수는 적어도 수백개에 달하므로 a와 b, wj를 정해주는 것은 콤파에서와 마찬가지로 수학적으로 풀기 어려운 언더디터민드 문제(underdetermined problem)가 된다.However, while there are only a few dozen experiments, the number of probes is at least hundreds, so setting a, b, and w j is an underdetermined problem that is difficult to solve mathematically, as in a comparator.

본 발명에서는 이 문제를 최적화 알고리즘으로 알려져 있는 선형 최소자승법(linear least squares method)과 유전알고리즘(genetic algorithm)을 반복적으로 이용하여 해결하였다.In the present invention, this problem is solved repeatedly by using a linear least squares method and a genetic algorithm known as an optimization algorithm.

즉 프로브들의 가중치 wj를 프로브 당 n개의 이진법 비트(bit)를 갖는 유전자로 표현한 후 이 유전자들로 구성되는 염색체(chromosome)를 만들고, 보편적인 유전알고리즘을 이용하여 Ai의 계산치와 실험치와의 차이가 최소가 되게하는 각 프로브의 wj를 구할 수 있는 새로운 알고리즘을 개발하였다.In other words, the weights of the probes w j are expressed as genes with n binary bits per probe, and then a chromosome composed of these genes is generated. The common genetic algorithm is used to compare the calculated values of A i with experimental values. We developed a new algorithm to find the w j of each probe to minimize the difference.

선형 계수 a와 b는 각 진화단계마다 최소자승법을 이용하여 정할 수 있음으로 유전알고리즘과 최소자승법을 반복적으로 적용하여 최적화된 wj를 구할 수 있다.Since the linear coefficients a and b can be determined by using the least-square method for each evolutionary step, the optimized w j can be obtained by repeatedly applying the genetic algorithm and the least-squares method.

wj는 0부터 1사이의 실수(real number)값이므로 각각의 가중치wj가 실수로 표현되는 유전자로 염색체를 구성해도 무방하지만, wj를 실수 값 대신 n비트 정수(lineger)로 표현하면 실수로 염색체를 구성하는 것보다 프로그램의 효율성이 증대되고 계산속도도 훨씬 빨라지는 장점이 있다.Since w j is a real number value between 0 and 1, each weight w j may be a chromosome composed of a gene represented by a real number, but if w j is expressed as an n-bit integer instead of a real value, real Compared to constructing a chromosome, the program efficiency is increased and the calculation speed is much faster.

즉 wj를 0,1,2,3을 나타낼 수 있는 2비트 정수로 대치하고 3으로 나누어주면 1/3(즉 0.3333) 간격의 숫자로 표현할 수 있으며, 4비트 정수로 대치하고 15로 나누어주면 1/15(즉 0.0667)간격의 실수로 표현할 수 있다.In other words, replace w j with a two-bit integer that can represent 0,1,2,3, and divide it by 3 to express it as a number with intervals of 1/3 (that is, 0.3333) .If you substitute a 4-bit integer and divide by 15, It can be expressed as a real number of 1/15 (ie 0.0667) interval.

일반적으로 n비트 정수로 유전자를 구성하면 1/(2n-1)간격의 실수로 wj를 표현한 것과 같다.In general, constructing a gene with n-bit integers is equivalent to representing w j by a real number of 1 / (2 n -1) intervals.

여러조건을 테스트해 본 결과 결과의 정밀도와 계산의 신속성 사이의 균형이라는 측면에서 4비트 정수로 가중치 wj를 나타낼 때가 최적이다.As a result of testing several conditions, it is best to express the weight w j as a 4-bit integer in terms of the balance between the precision of the result and the speed of the calculation.

일단 최적화된 a,b,wj를 구하면, 합성과 약효 실험을 수행하지 않은 미지분자들의 삼차원 구조를 훈련분자들과 공간상에 중첩(superposition)시킨 후 식(1)과 (2)를 이용하여 약효를 계산으로 미리 예측할 수 있게 된다.Once the optimized a, b, w j are obtained, superposition of the three-dimensional structures of the undifferentiated molecules that have not been synthesized and tested in the superposition in the space with the training molecules is then performed using equations (1) and (2). Drug efficacy can be predicted in advance by calculation.

이하에서 첨부된 도1을 참조하여 본 발명의 구체적 계산 방법론을 상세히 설면하면 다음과 같다.Hereinafter, the detailed calculation methodology of the present invention will be described in detail with reference to FIG. 1.

본 발명에서는 대부분의 삼차원의 정량적 구조-활성 관계분석법에서와 마찬가지로 약효가 알려져 있는 여러 훈련분자들(training molecules)의 삼차원 입체구조를 중첩시킨 후 이들을 구조 데이터로 이용하였다.In the present invention, as in most three-dimensional quantitative structure-activity relationship analysis method, three-dimensional conformation of several training molecules known to be effective is used after superimposing them.

도1의 프로브 생성 및 에너지 계산부(100)에서는 다음과 같은 작업을 수행한다.The probe generation and energy calculation unit 100 of FIG. 1 performs the following operations.

중첩된 분자표면에서 일정 간격 떨어져 있는 두개의 다른 용매 접촉표면(solvent accessible surface)을 만든 후 그 표면상에 약 2Å(옹스트롬)정도의 간격을 갖도록 원자 프로브들을 설정한다.Two different solvent accessible surfaces are created, spaced apart from the overlapping molecular surface, and the atomic probes are set to have an interval of about 2 microns (angstroms) on the surface.

안쪽 용매 접촉표면에는 수소 결합에너지를 계산할 프로브를, 바깥쪽 표면에는 반데르발스 에너지(vander Waals 혹은 steric energy)와 정전기적 에너지(electrostatic energy)를 계산할 프로브를 놓는다.On the inner solvent contact surface, a probe to calculate the hydrogen bond energy is placed on the outer surface, and a probe to calculate the van der Waals or steric energy and electrostatic energy.

이 세가지 에너지의 합이 리간드 분자와 프로브간의 상호 작용 에너지가 된다.The sum of these three energies is the interaction energy between the ligand molecule and the probe.

프로브의 생성은 논문에 발표된 마칭 큐브 알고리즘(Heiden, W.; Goetze, T.; Brickmann, J. Fast Generation of Molecular Surfaces from 3D Date Fields with an Enhanced "Marching Cube" Algorithm. J. Comput. Chem. 1993, 25, 246-250)을 이용하였다.The generation of probes is described in the Marching cube algorithm (Heiden, W .; Goetze, T .; Brickmann, J. Fast Generation of Molecular Surfaces from 3D Date Fields with an Enhanced "Marching Cube" Algorithm. J. Comput. Chem. 1993, 25, 246-250).

수소 결합에너지 프로브들은 리간드 분자들과의 수소 결합이 가능한 것들만 미리 선택하고 나머지는 프로브 리스트에서 제거한다.Hydrogen bond energy probes preselect only those capable of hydrogen bonding with ligand molecules and remove the rest from the probe list.

정전기적 에너지를 계산할 때 필요한 프로브의 부분 전하(partial charge)는리간드와 수용체간에 상호 보완적인 정전기적 결합이 있다는 일반적 사실에 근거하여 리간드 분자들의 정전기 포텐셜(electrostatic potential)의 평균값과 크기는 같으나 부호가 반대인 값으로 준다.The partial charge of the probe required to calculate the electrostatic energy is equal in magnitude but equal in magnitude to the electrostatic potential of the ligand molecules, based on the general fact that there is a complementary electrostatic bond between the ligand and the receptor. Give it the opposite value.

프로브로는 어떠한 원자를 사용해도 무방하나 여러 테스트 결과 가장 간단히 한 종류의 원자만을 이용하여도 좋은 결과를 얻을 수 있음이 밝혀져 본 발명에서는 분자 표면에서 1.6Å과 2.0Å떨어진 곳에 산소 프로브를 만들어 이용한 결과를 인용하였다.Although any atom may be used as the probe, it was found that a simple result using only one type of atom can be obtained by various test results. According to the present invention, the oxygen probe is used at a distance of 1.6Å and 2.0Å away from the surface of the molecule. Cited.

또한 여러 의약품을 대상으로 실험한 결과 반데르발스 에너지 프로브뿐만 아니라 수소 결합 에너지 프로브들을 포함시키는 것이 결과의 정확성을 높이는데 큰 역할을 한다는 것을 알았다.In addition, experiments with various drugs have shown that the inclusion of hydrogen bond energy probes as well as van der Waals energy probes plays a significant role in improving the accuracy of the results.

도1의 초기 개체 생성부(200)에서는 프로브들의 가중치 wj를 나타내기 위해 각 비트 당 0 또는 1을 무작위(randommly)로 배치한 염색체들을 사용자가 지정하는 입력 데이터인 개체수(population size)만큼 만든다.The initial object generation unit 200 of FIG. 1 creates chromosomes randomly arranged 0 or 1 for each bit to represent the weight w j of the probes by the population size, which is input data specified by the user. .

도1의 초기 개체 평가부(300)에서는 좋은 염색체를 판별한다.The initial individual evaluation unit 300 of FIG. 1 determines a good chromosome.

이때 Ai의 계산치와 실험치와의 차이가 작아지게하는 wj들을 포함하는 염색체인지를 판별케 해주는 적합성 함수(fitness function)는 식(4)으로 정의하였다.In this case, a fitness function for determining whether a chromosome including w j causes a difference between the calculated value of A i and the experimental value to be small is defined by Equation (4).

염색체 k에 대해 Xk 2이 작아질수록 좋은 염색체가 된다.The smaller X k 2 with respect to chromosome k is the better chromosome.

(4) Xk 2= ∑i training[Ai obs- Ai cal]2 (4) X k 2 = ∑ i training [A i obs -A i cal ] 2

= ∑i training[Ai obs-(ak+bkj probeswjkEij)]2 = ∑ i training [A i obs- (a k + b kj probes w jk E ij )] 2

Xk 2을 구하기 위해서는 각 진화단계마다 주어진 wj로부터 ∑j probeswjkEij를 계산하고 Aiobs와 ∑j probeswjkEij로부터 최소자승법을 이용하여 염색체마다 a,b를 구한다.To obtain the X k 2 from the given w j for each evolution Σ j w jk probes calculate E ij and A iobs and Σ j w jk probes E using a least square method to calculate a, b each chromosome from ij.

도1의 평균가중치 결정부(400)와 수렴확인 과정(500)에서는 한개의 염색체보다는 Xk 2이 작은 여러개의 염색체 즉 엘리트(elite)들 만으로부터 볼츠만(Boltzmann)식을 이용하여 wj의 평균값을 구해 최종 wj로 삼고 이들로부터 전체 시스템의 a,b를 구하며, 또한 Xk 2이 더 이상 작아지지 않으면 진화과정을 중단하고 wj를 변화시켜 Xk 2이 더 감소할 수 있으면 진화과정을 계속하도록 하는 수렴확인 작업을 수행한다.In the mean weight determination unit 400 and the convergence check process 500 of FIG. 1, the average value of w j is obtained by using the Boltzmann equation from only chromosomes, elites, of which X k 2 is smaller than one chromosome. To obtain the final w j and obtain the a, b of the whole system from them. Also, if X k 2 is no longer smaller, stop the evolution and change w j to reduce the evolution if X k 2 can be further reduced. Perform convergence checks to continue.

도1의 유전조작 개체 생성부(600)에서는 Xk 2이 작아지는 방향으로 각 프로브의 wj를 변화시키도록 유전자를 조작하는 진화과정을 수행한다.The genetically engineered entity generator 600 of FIG. 1 performs an evolution process of manipulating a gene to change w j of each probe in a direction in which X k 2 decreases.

진화는 어떠한 유전 알고리즘을 이용하여도 무방하나 본 발명에서는 다음과 같은 간단한 방법을 이용하였다.Evolution may be any genetic algorithm, but the present invention uses the following simple method.

즉 토너먼트 선택법(tournament selection)을 이용하여 무작위로 두 염색체를 선택한 후 Xk 2이 작은 것을 다음 세대의 부모로 택하는 과정을 두번 수행하고 택해진 두개의 부모를 균일 교배(uniform crossover)시켜 다음 세대(generation)의 자식 두개를 만드는 과정을 반복적으로 수행하여 원하는 수의 자식을 만든 후, 이들 중 일부를 돌연변이(mutation)시키는 방법을 이용하여 진행시켰다.That tournament selection method to select the two chromosomes at random using the (tournament selection) performed twice through the process of selecting that X k 2 smaller as parents of the next generation, and even crossed the two parents became chose (uniform crossover) to the next generation The process of making two children of (generation) was repeatedly performed to make the desired number of children, and then some of them were mutated.

도1의 개체평가부(300)와 유전조작 개체 생성부(600)의 과정을 수렴이 이루어질때까지 수백 세대에 걸쳐 반복 수행하므로써 최적화된 즉 실험적으로 측정된 생리 활성도들과 가장 근접한 계산치들을 줄 수 있는 프로브들의 평균 가중치 wj와 선형 계수 a,b를 얻을 수 있다.By repeating the processes of the individual evaluation unit 300 and the genetically engineered individual generation unit 600 of FIG. 1 for hundreds of generations until convergence is achieved, the optimized values can be given closest to the experimentally measured physiological activities. The average weights w j of the probes and the linear coefficients a, b can be obtained.

도1의 생리활성도 예측부(700)에서는 가중치가 0이 아닌 프로브들의 공간좌표, 부분전하, 가중치(wj) 그리고 선형계수 a,b를 이용하여 위에서 언급한대로 미지 분자들의 삼차원 구조를 훈련분자들과 공간상에 중첩(superpostion)시킨 후 식(3)을 이용하여 미지 분자들의 생리 활성도를 계산한다.In the physiological activity predictor 700 of FIG. 1, the training molecules are used to train the three-dimensional structure of the unknown molecules using the spatial coordinates, partial charges, weights (w j ), and linear coefficients a and b of probes whose weight is not zero. After superpostion and space, the physiological activity of unknown molecules is calculated using Eq. (3).

여러 의약품을 대상으로 실험한 결과 최초의 프로브 숫자의 약70 내지 80%의 프로브들은 가중치가 0이 되었다.Experiments with several drugs resulted in weights of probes of about 70-80% of the original probe number being zero.

가중치가 0이 아닌 나머지 프로브들의 집합은 가상적인 수용체(hypothetical receptor)라고 부를 수도 있다.The remaining set of non-zero probes may be called a hypothetical receptor.

이들 프로브들을 삼차원 컴퓨터 그래픽스를 이용하여 분자와같이 보여주면 분자의 어떤 부분을 어떻게 바꾸면 상호 작용 에너지가 감소하여 약효가 좋아지겠다하는 것을 직관적으로 알 수도 있어 분자설계에 중요한 도구로 이용할 수 있다.If these probes are shown as molecules using three-dimensional computer graphics, one can intuitively see how changing any part of the molecule reduces the interaction energy and improves its efficacy, making it an important tool for molecular design.

상기 방법론의 모든 계산 과정은 C언어로 작성된 컴퓨터 프로그램으로 만들었고 개인용 컴퓨터에서 사용할 수 있다.All of the calculations in the methodology were made in computer programs written in C and can be used on personal computers.

WeP(가중된 프로브 상호작용 에너지 방법; weighted probe intraction energy method)이라 명명된 프로그램을 이용하여 삼차원 원자좌표 파일과 최소한의 사용자 변수(초기 개체수; initial population size)를 지정해 주는 파일을 마련해주면 모든 결과를 자동적으로 얻을 수 있다.Using a program called the WeP (weighted probe intraction energy method), a file that specifies a three-dimensional atomic coordinate file and a minimum user variable (initial population size) can be found. You can get it automatically.

실제로 WeP 프로그램을 이용하여 테스트한 결과를 도2와 3에 도시하였다.Actually, the test results using the WeP program are shown in FIGS. 2 and 3.

테스트 셈플은 코티코스테로이드 결합 단백질(corticosteroid binding globulin; CBG)에 결합하는 여러 종류의 스테로이드 화합물들이다.Test samples are a variety of steroid compounds that bind to corticosteroid binding globulin (CBG).

이 CBG 스테로이드들은 Cramer가 이를 이용한 콤파 연구 논문(Cramer Ⅲ, R. D.; Patterson, D.E.; Bunce, J.D. Comparative Molecular Field Analysis (CoMFA).1.Effect of Shape on Binding of Steroids to Carrier Proteins. J. Am. Chem. Soc. 1988, 110, 5959-5967)을 처음으로 발표한 후 거의 모든 3D-QSAR 방법론 연구의 벤치마크(benchmark)샘플이 되어 그 결과를 상호 비교하는데 이용되고 있다.These CBG steroids are described by Cramer in a Comparator study (Cramer III, RD; Patterson, DE; Bunce, JD Comparative Molecular Field Analysis (CoMFA). 1.Effect of Shape on Binding of Steroids to Carrier Proteins.J. Am. Chem Soc. 1988, 110, 5959-5967) has been the benchmark sample of almost all 3D-QSAR methodology studies and has been used to compare the results.

생리활성도 즉 약효가 알려진 21개의 스테로이드 화합물들을 훈련분자로 이용하여 구조-활성 관계식을 얻고 이를 이용하여 역시 약효가 알려졌지만 훈련분자로 이용되지 않은 10개의 스테로이드 화합물들의 약효를 계산한다.The physiological activity, that is, 21 steroid compounds of known efficacy, is used as a training molecule to obtain a structure-activity relationship, and the same is used to calculate the effects of 10 steroid compounds, which are also known as drugs but not used as training molecules.

이때 계산치와 실험치와의 차이가 작을수록 더 좋은 방법이 되는 것이다.The smaller the difference between the calculated value and the experimental value, the better the method.

이 차이를 정량적으로 표현해주는 파라미터로는 예측에러의표준편차(standard deviation of the error of predictions 또는 SDEP)가 자주 쓰이는데 SDEP가 작을수록 더 좋은 결과가 된다.The standard deviation of the error of predictions (SDEP) is often used as a parameter to express this difference quantitatively. The smaller the SDEP, the better the result.

상기 Cramer의 연구 논문에 있는 21개 스테로이드 화합물의 구조와 약효 데이터를 이용하여 WeP 계산을 수행한 결과 초기 전체 프로브 수는 240개가 생성되나 유전 알고리즘으로 프로브의 가중치를 최적화시킨 결과 가중치가 0이 아닌 프로브는 40개였다.As a result of WeP calculation using the structure and pharmacological data of 21 steroid compounds in Cramer's research paper, the initial total number of probes is generated 240, but as a result of optimizing the weight of probes by genetic algorithm, non-weight probes Was 40.

40개 프로브는 각기 다른 가중치와 부분전하를 갖고 있는데 이들을 가중치에 비례하는 크기의 구(sphere)로 훈련분자 중 하나와 함께 컴퓨터 그래픽스 프로그램을 이용하여 도2에 도시하였다.The 40 probes have different weights and partial charges, which are shown in FIG. 2 using a computer graphics program with one of the training molecules in a sphere proportional to the weights.

이들 40개 프로브들을 이용하여 생리 활성도는 알려져 있으나 훈련분자에 포함시키지 않았던 10개의 스테로이드 화합물들의 생리 활성도를 계산한 결과를 도3에 도시하였다.The results of calculating the physiological activities of 10 steroidal compounds using known 40 probes but not included in the training molecule are shown in FIG. 3.

약효(생리 활성도)의 계산치와 실험치가 정확히 일치하면 이 도표에서 모든 점들은 도표에 그려진 y=x의 직선상에 놓이게 된다.If the calculated physiological activity (physiological activity) is exactly the same as the experimental value, all the points in this plot are on a straight line of y = x plotted on the plot.

WeP결과의 SDEP는 0.547이다.The SDEP of the WeP result is 0.547.

최근에 발표된 논문(Robinson, D. D.; Winn, P.J.; Lyne, P.D.; Richards, W.G. Self-Organizing Molecular Field Analysis: A Tool for Structure-Activity Studies. J. Med. Chem. 1999, 42, 573-583)에 원형 그대로의 콤파와 이를 개선하거나 변형시킨 여섯가지의 새로운 삼차원의 정량적 구조-활성 관계규명방법들을 이용해서 얻은 결과를 비교해 놓았는데 콤파의 SDEP는 0.837이고 다른 방법들의 SDEP는 0.640에서 0.716이며 단 한가지 솜파(SOMFA)라 불리는 방법(상기 Robinson의 논문)의 SDEP만이 0.583이었다.Recently published papers (Robinson, DD; Winn, PJ; Lyne, PD; Richards, WG Self-Organizing Molecular Field Analysis: A Tool for Structure-Activity Studies.J. Med. Chem. 1999, 42, 573-583) We compared the results obtained by using a primitive comparator with six new three-dimensional quantitative structure-activity relationship methods that improved or modified it. The SDEP of the compa was 0.837 and the SDEP of the other methods was 0.640 to 0.716. Only the SDEP of the method called SOMFA (Robin's paper, above) was 0.583.

따라서 0.547의 SDEP을 주는 WeP방법을 이용한 약효의 예측이 현존하는 방법 중 최고의 정확도를 지니고 있음을 알 수 있다.Therefore, it can be seen that the prediction of the drug efficacy using the WeP method giving a SDEP of 0.547 has the best accuracy among the existing methods.

본 발명에 의하면, WeP방법은 기존의 삼차원 구조-활성 정량적 관계규명방법보다 예측치가 더 정확하며, 교차확인(cross validation)을 이용해야되는 부분최소자승법과 같은 복잡한 통계적 분석법을 사용하지 않아 계산과정을 이해하기 쉽고, 결과의 해석이 용이하며 최소한의 사용자 의사 판단 과정과 입력 데이터만이 필요하고, 결과 또한 컴퓨터 그래픽스를 이용한 분자 설계에서의 직관적 이용이 가능하다는 장점이 있다.According to the present invention, the WeP method is more accurate than the conventional three-dimensional structure-activity quantitative relationship identification method, and does not use a complex statistical analysis method such as partial least squares method that requires cross validation. It is easy to understand, easy to interpret the results, requires minimal user decision making process and input data, and the results can also be used intuitively in molecular design using computer graphics.

따라서 본 WeP 프로그램을 이용하면 신약 개발과정에서 합성과 약효실험에 드는 시간과 비용을 절감케해주어 경쟁력을 높이는데 일조를 할 수 있다.Therefore, this WeP program can help increase competitiveness by saving time and cost for synthesis and drug efficacy test in new drug development process.

또한 지금까지 알려져 있던 삼차원 구조-활성 정량적 관계 규명 방법과는 다른 개념의 접근 방법과 수학적 해결방법을 이용하고 있으므로, 이 분야의 세계 소프트웨어 시장을 독점하고 있는 콤파에 대응할 수 있는 상업적 소프트웨어로의 개발도 가능할 것이다.In addition, since it uses a concept approach and a mathematical solution that are different from the three-dimensional structure-activity quantitative relationship known methods, the development of commercial software to cope with the monopolization of the world software market in this field is also possible. It will be possible.

Claims (8)

프로브 상호작용 에너지 계산을 위한 프로브 생성 및 에너지 계산부(100); 프로브의 가중치를 염색체의 유전자로 표현하는 초기 개체 생성부(200), 가중된 프로브 상호작용 에너지와 생리 활성도의 관계를 나타내는 염색체의 선형 계수를 최소자승법으로 정하는 개체 평가부(300), 프로브의 평균 가중치와 이로부터 선형 계수를 최소자승법으로 정하는 평균 가중치 결정부(400), 유전 알고리즘을 이용하여 더 좋은 프로브의 가중치들을 얻고자하는 유전 조작 개체 생성부(600) 및 프로브들의 공간좌표, 부분전하, 최종 가중치와 선형계수를 이용하여 생리 활성도의 계산치를 얻는 생리 활성도 예측부(700)로 구성됨을 특징으로하는 신약개발을 위한 새로운 분자 설계방법.Probe generation and energy calculation unit 100 for calculating the probe interaction energy; Initial entity generation unit 200 expressing the weight of the probe in the gene of the chromosome, entity evaluation unit 300 for determining the linear coefficient of the chromosome representing the relationship between the weighted probe interaction energy and the physiological activity by the least square method, and the average of the probes An average weight determiner 400 for determining the weight and linear coefficients from the least square method, a genetic manipulation entity generator 600 for obtaining better probe weights using a genetic algorithm, spatial coordinates, partial charges, New molecular design method for drug development, characterized in that consisting of the physiological activity predictor 700 to obtain a calculation of physiological activity using the final weight and the linear coefficient. 제1항에 있어서, 프로브 생성 및 에너지 계산부(100)에서는 안쪽 표면에는 수소 결합 에너지를 계산할 프로브를 놓고 바깥쪽 표면에는 반데르발스 에너지와 정전기적 에너지를 계산할 프로브를 놓는 두개의 다른 용매접촉 표면을 만드는 것으로 구성되는 신약 개발을 위한 새로운 분자 설계방법.The method of claim 1, wherein the probe generation and energy calculation unit 100 has two different solvent contact surfaces for placing the probe to calculate the hydrogen bonding energy on the inner surface and the probe to calculate the van der Waals energy and electrostatic energy on the outer surface A new molecular design method for drug discovery, which consists of making a drug. 제1항에 있어서, 초기 개체 생성부(200)에서는 이진법 n비트를 이용한 정수로 표현된 유전자를 (2n-1)로 나누어 얻은 실수로 프로브의 가중치를 표현하고 이들 유전자로부터 염색체를 얻는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The method of claim 1, wherein the initial individual generation unit 200 consists of a real number obtained by dividing a gene represented by an integer using a binary n-bit by (2 n -1) by the weight of the probe and obtaining a chromosome from these genes. New molecular design method for drug development characterized in that. 제1항에 있어서, 개체 평가부(300)에서는 가중된 프로브 상호작용 에너지가 생리 활성도와 선형관계가 있다는 가정하에 각 염색체마다의 선형 계수를 최소자승법으로 정하는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The method according to claim 1, wherein the individual evaluation unit 300 is configured to determine the linear coefficient for each chromosome by the least square method under the assumption that the weighted probe interaction energy has a linear relationship with the physiological activity. New Molecular Design Method. 제1항에 있어서, 평균가중치 결정부(400)에서는 프로브의 평균 가중치를 구하고 이로부터 전체 시스템의 선형계수를 최소자승법으로 정하는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The method of claim 1, wherein the mean weight determination unit (400) is configured to obtain the average weight of the probe and to determine the linear coefficient of the entire system from the least square method from the new molecular design method for drug development. 제1항에 있어서, 유전조작 개체 생성부(600)에서는 n비트로 표현된 유전자로 구성된 염색체들을 유전 조작하여 더 나은 프로브의 가중치로 이루어진 염색체들을 얻는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The method of claim 1, wherein the genetically engineered object generation unit 600 genetically manipulates chromosomes consisting of genes expressed in n-bit to obtain a new molecule design for drug development, characterized in that to obtain chromosomes consisting of a better probe weight Way. 제1항에 있어서, 생리 활성도 예측부(700)에서는 가중치가 0이 아닌 프로브들의 공간좌표, 부분전하, 평균 가중치와 선형 계수 a,b를 이용하여 삼차원 원자좌표가 중첩된 미지 분자들의 생리 활성도를 계산하는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The physiological activity predictor 700 uses the spatial coordinates, partial charges, average weights, and linear coefficients a, b of probes whose weight is not zero to determine physiological activities of unknown molecules in which three-dimensional atomic coordinates overlap. A new molecular design method for drug discovery, characterized by computing. 제1항에 있어서, 개체 평가부(300), 평균가중치 결정부(400) 및 유전조작 개체생성부(600)에서는 최소자승법과 유전 알고리즘을 교대로 그리고 반복적으로 사용하여 최적화된 프로브의 가중치를 얻는 것으로 구성됨을 특징으로하는 신약 개발을 위한 새로운 분자 설계방법.The method of claim 1, wherein the individual evaluation unit 300, the average weight determination unit 400, and the genetic manipulation individual generation unit 600 alternately and repeatedly use a least square method and a genetic algorithm to obtain an optimized probe weight. New molecular design method for drug discovery, characterized in that consisting of.
KR1020020000990A 2002-01-08 2002-01-08 New method for desiging molaculars of new medicines KR20020028925A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020020000990A KR20020028925A (en) 2002-01-08 2002-01-08 New method for desiging molaculars of new medicines

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020000990A KR20020028925A (en) 2002-01-08 2002-01-08 New method for desiging molaculars of new medicines

Publications (1)

Publication Number Publication Date
KR20020028925A true KR20020028925A (en) 2002-04-17

Family

ID=19718277

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020020000990A KR20020028925A (en) 2002-01-08 2002-01-08 New method for desiging molaculars of new medicines

Country Status (1)

Country Link
KR (1) KR20020028925A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793582A (en) * 2014-03-05 2014-05-14 福州大学 Optimization method for cylindrical shell large opening connecting pipe structure
KR20190000167A (en) * 2017-06-22 2019-01-02 한국과학기술원 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments
WO2022270754A1 (en) * 2021-06-21 2022-12-29 주식회사 에이아이트릭스 Device and method for discovering hit molecule for new drug development

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5526281A (en) * 1993-05-21 1996-06-11 Arris Pharmaceutical Corporation Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5699268A (en) * 1995-03-24 1997-12-16 University Of Guelph Computational method for designing chemical structures having common functional characteristics
US6208942B1 (en) * 1996-08-15 2001-03-27 Tripos, Inc Molecular hologram QSAR
US6219440B1 (en) * 1997-01-17 2001-04-17 The University Of Connecticut Method and apparatus for modeling cellular structure and function
WO2001067299A1 (en) * 2000-03-10 2001-09-13 Daiichi Pharmaceutical Co., Ltd. Method of anticipating interaction between proteins

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5526281A (en) * 1993-05-21 1996-06-11 Arris Pharmaceutical Corporation Machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics
US5699268A (en) * 1995-03-24 1997-12-16 University Of Guelph Computational method for designing chemical structures having common functional characteristics
US6208942B1 (en) * 1996-08-15 2001-03-27 Tripos, Inc Molecular hologram QSAR
US6219440B1 (en) * 1997-01-17 2001-04-17 The University Of Connecticut Method and apparatus for modeling cellular structure and function
WO2001067299A1 (en) * 2000-03-10 2001-09-13 Daiichi Pharmaceutical Co., Ltd. Method of anticipating interaction between proteins

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793582A (en) * 2014-03-05 2014-05-14 福州大学 Optimization method for cylindrical shell large opening connecting pipe structure
CN103793582B (en) * 2014-03-05 2016-07-06 福州大学 Cylindrical shell large opening structural optimization method
KR20190000167A (en) * 2017-06-22 2019-01-02 한국과학기술원 Method and system for predicting new drug lead compound candidate by applying association rules between pharmacologically active similas compounds and their fragments
WO2022270754A1 (en) * 2021-06-21 2022-12-29 주식회사 에이아이트릭스 Device and method for discovering hit molecule for new drug development

Similar Documents

Publication Publication Date Title
JP7121725B2 (en) Correcting First Classifier Errors by Evaluating Classifier Outputs in Parallel
Bitencourt-Ferreira et al. Molegro virtual docker for docking
JP6975140B2 (en) Systems and methods for applying convolutional networks to spatial data
Lee et al. Network medicine in pathobiology
Hou et al. Characterization of domain–peptide interaction interface: a case study on the amphiphysin-1 SH3 domain
Bikadi et al. Predicting P-glycoprotein-mediated drug transport based on support vector machine and three-dimensional crystal structure of P-glycoprotein
Golbraikh et al. Beware of q2!
EP0592421B1 (en) COMPARATIVE MOLECULAR FIELD ANALYSIS (CoMFA)
Hasegawa et al. GA strategy for variable selection in QSAR studies: application of GA-based region selection to a 3D-QSAR study of acetylcholinesterase inhibitors
Mannhold et al. Advanced computer-assisted techniques in drug discovery
Kumar et al. Extension of the transferable aspherical pseudoatom data bank for the comparison of molecular electrostatic potentials in structure–activity studies
Rothenberg Data mining in catalysis: Separating knowledge from garbage
Schweitzer et al. The development of a quantitative structure property relationship (QSPR) for the prediction of dielectric constants using neural networks
Jha et al. Multipolar Atom Types from Theory and Statistical Clustering (MATTS) data bank: restructurization and extension of UBDB
Polanski Self-organizing neural networks for pharmacophore mapping
Roncaglioni et al. In silico-aided prediction of biological properties of chemicals: oestrogen receptor-mediated effects
Mohseni Behbahani et al. Deep Local Analysis deconstructs protein–protein interfaces and accurately estimates binding affinity changes upon mutation
Franke et al. General introduction to QSAR
US8374837B2 (en) Descriptors of three-dimensional objects, uses thereof and a method to generate the same
De Julian-Ortiz Virtual Darwinian Drug Design QSAR Inverse Problem, Virtual Combinatorial Chemistry, and Computational Screening.
Ajjarapu et al. Ligand-based drug designing
Polanski et al. Probability issues in molecular design: Predictive and modeling ability in 3D-QSAR schemes
KR20020028925A (en) New method for desiging molaculars of new medicines
Kaufman et al. Multi-knockout genetic network analysis: the Rad6 example
EP1862927B1 (en) Descriptors of three-dimensional objects, uses thereof and a method to generate the same

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application