EA001095B1 - Computational method for designing chemical structures having common functional characteristics - Google Patents

Computational method for designing chemical structures having common functional characteristics Download PDF

Info

Publication number
EA001095B1
EA001095B1 EA199800843A EA199800843A EA001095B1 EA 001095 B1 EA001095 B1 EA 001095B1 EA 199800843 A EA199800843 A EA 199800843A EA 199800843 A EA199800843 A EA 199800843A EA 001095 B1 EA001095 B1 EA 001095B1
Authority
EA
Eurasian Patent Office
Prior art keywords
affinity
receptor
genotype
target
molecular
Prior art date
Application number
EA199800843A
Other languages
Russian (ru)
Other versions
EA199800843A1 (en
Inventor
Джонатан М. Шмидт
Original Assignee
Юниверсити Оф Гуелф
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Юниверсити Оф Гуелф filed Critical Юниверсити Оф Гуелф
Publication of EA199800843A1 publication Critical patent/EA199800843A1/en
Publication of EA001095B1 publication Critical patent/EA001095B1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Computing Systems (AREA)
  • Biochemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

1. A computer-based method of designing chemical structures having a preselected functional characteristic, comprising the steps of: (a) producing a physical model of a simulated receptor phenotype encoded in a linear charater sequence, and providing a set of target molecules sharing at least one quantifiable functional characteristic; (b) for each target molecule; (i) calculating an affinity between the receptor and the target molecule in each of a plurality of orientations using an effective affinity calculation; (ii) calculating a sum affinity by summing the calculated affinities; (iii) identifying a maximal affinity; (c) using the calculated sum and maximal affinities to: (i) calculate a maximal affinity correlation coefficient between the maximal affinities and the quantifiable functional characteristic; (ii) calculate a sum affinity correlation coefficient between the sum affinities and the quantifiable functional characteristic; (d) using the maximal correlation coefficient and sum correlation coefficient to calculate a fitness coefficient; (e) altering the structure of the receptor and repeating steps (b) through (d) until a population of receptors having a preselected fits coefficient are obtained; (f) providing a physical model of a chemical structure encoded in a molecular linear character sequence, calculating an affinity between the chemical structure and each receptor in a plurality of orientations using said effective affinity calculation, using the calculated affinities to calculate an affinity fitness score; (g) altering the chemical structure to produce a variant of the chemical structure and repeating step (f); and (h) retaining and further altering those variants of the chemical structure whose affinity score approaches a preselected affinity score. 2. The method according to claim 1 wherein the step of producing a simulated receptor genotype comprises generating a receptor linear character sequence which codes for spatial occupancy and charge, and wherein the step of producing a physical model of a chemical structure comprises generating said molecular linear character sequence which codes for spatial occupancy and charge. 3. The method according to claim 2 wherein said effective affinity calculation comprises two measures, the first being a proximity measure wherein the proportion of uncharged portions on said simulated receptors being sufficiently close to non-polar regions on said molecular structure to generate effective London dispersion forces is estimated, and the second being the summed strengths of charge-dipole electrostatic force interactions generated between charged portions of said simulated receptor and dipoles present in said molecular structure. 4. The method according to claim 2 wherein said step of calculating the affinity fitness score includes calculating a sum and maximal affinity between the molecular structure and each receptor, the fitness score being calculated as: Σ {(|calculated maximal affinity - target maximal affinity|/ target maximal affinity} and wherein said preselected fitness score is substantially zero. 5. The method according to claim 2 wherein said step of calculating the affinity fitness score includes calculating a sum and maximal affinity between the molecular structure and each receptor, the fitness score being calculated as: Σ {(|calculated maximal affinity-target maximal affinity|/ 2 x target maximal affinity) + (|calculated sum affinity target sum affinityl/2 x target sum affinity|)}, and wherein said preselected fitness score is substantially zero. 6. The method according to claim 2 wherein said sum affinity correlation coefficient is rSA<2>, said maximal affinity correlation coefficient is rMA<2> , and wherein said fitness coefficient is F=(rMA<2> x rSA<2>)<0.5>, and wherein said preselected fitness coefficient is substantially unity. 7. The method according to claim 2 wherein said sum affinity correlation coefficient is rSA-MA<2>, said maximal affinity correlation coefficient is rMA<2>, and wherein said fitness coefficient is F=(rMA<2> x (1-rSA-MA<2>))<0.5> and wherein said preselected fitness coefficient is substantially unity. 8. The method according to claim 2 wherein said molecular linear character sequences comprise a plurality of sequential character triplets, a first character of said triplet being randomly selected from a first character set specifying position and identity of an occupying atom in a molecular skeleton of said molecular structure, a second character of said triplet being randomly selected from a second character set specifying the identity of a substituent group attached to said occupying atom, and a third character of said triplet being randomly selected from a third character set specifying the location of said substituent on the atom specified by said first character of the triplet. 9. The method according to claim 8 wherein the molecular linear character sequence is decoded using an effective molecular assembly algorithm which sequentially translates each triplet from said molecular linear sequence and thereafter fills unfilled positions on said molecular skeleton with hydrogen atoms. 10. The method according to claim 9 wherein the step of mutating said molecular structure includes at least one of the following steps: i) mutating said molecular genotype by randomly interchanging at least one of said first, second and third characters of at least one triplet from the associated character sets, ii) deletion wherein a triplet from molecular genotype is deleted, iii) duplication wherein a triplet in the molecular genotype is duplicated, iv) inversion wherein the sequential order of one or more triplets in the molecular genotype is reversed, and v) insertion wherein a triplet from the molecular genotype is inserted at a different position in the molecular genotype. 11. The method according to claim 10 wherein the step of mutating said molecular genotypes includes recombining randomly selected pairs of said retained mutated molecular genotypes whereby corresponding characters in said molecular linear sequences are interchanged. 12. The method according to claim 2 wherein each character in the receptor linear character sequence specifies one of either a spatial turning instruction and a charged site with no turn. 13. The method according to claim 12 wherein said receptor phenotype comprises at least one linear polymer provided with a plurality of subunits, one of said subunits being a first subunit in said at least one linear polymer. 14. The method according to claim 13 wherein said receptor linear character sequence is decoded using an effective receptor assembly algorithm in which turning instructions applied to each subunit subsequent to said first subunit are made relative to an initial position of said first subunit. 15. The method according to claim 14 wherein said characters specifying spatial turning instructions code for no turn, right turn, left turn, up turn, down turn, and wherein characters specifying charge sites code for positively charged site with no turn, and negatively charged site with no turn. 16. The method according to claim 14 wherein said subunits are substantially spherical having a Van der Waals radii substantially equal to the Van der Waals radius of hydrogen. 17. The method according to claim 15 wherein the step of mutating said receptor genotype includes at least one of the following steps: i) deletion wherein a character from the receptor genotype is deleted, ii) duplication wherein a character in the receptor genotype is duplicated, iii) inversion wherein the sequential order of one or more characters in the receptor genotype is reversed, and iv) insertion wherein a character from the receptor genotype is inserted at a different position in the genotype. 18. The method according to claim 17 wherein the step of mutating said receptor genotypes includes recombining randomly selected pairs of said retained mutated receptor genotypes whereby corresponding characters in said receptor linear sequences are interchanged. 19. A method of screening chemical structures for preselected functional characteristics, comprising: a) producing a simulated receptor genotype by generating a receptor linear character sequence which codes for spatial occupancy and charge; b) decoding the genotype to produce a receptor phenotype, providing at least one target molecule exhibiting a selected functional characteristic, calculating an affinity between the receptor and each target molecule in a plurality of orientations using an effective affinity calculation, calculating a sum and maximal affinity between each target molecule and receptor, calculating a sum affinity correlation coefficient for sum affinity versus said functional characteristic of the target molecule and a maximal affinity correlation coefficient for maximal affinity versus said functional characteristic, and calculating a fitness coefficient dependent on said sum and maximal affinity correlation coefficients; c) mutating the receptor genotype and repeating step b) and retaining and mutating those receptors exhibiting increased fitness coefficients until a population of receptors with preselected fitness coefficients are obtained; thereafter d) calculating an affinity between a chemical structure being screened and each receptor in a plurality of orientations using said effective affinity calculation, calculating an affinity fitness score which includes calculating a sum and maximal affinity between the compound and each receptor and comparing at least one of said sum and maximal affinity to the sum and maximal affinities between said at least one target and said population of receptors whereby said comparison is indicative of the level of functional activity of said chemical structure relative to said at least one target molecule. 20. The method according to claim 19 wherein said effective affinity calculation comprises two measures,

Description

Данное изобретение относится к способам, предусматривающим создание химических структур, обладающих общими полезными функциональными свойствами, с использованием компьютера и основанным на специфических комбинациях пространственной конфигурации и сродства к связыванию. Более конкретно, данное изобретение предусматривает способ получения моделированных при помощи компьютера рецепторов, которые функционально имитируют биологические рецепторы. Моделированные рецепторы создаются для того, чтобы обеспечить оптимальное селективное сродство к известным молекулам мишеней. Затем генерируются и химические структуры, которые проявляют селективное сродство к моделированным рецепторам.This invention relates to methods involving the creation of chemical structures having common useful functional properties using a computer and based on specific combinations of spatial configuration and binding affinity. More specifically, this invention provides a method for producing computer-modeled receptors that functionally mimic biological receptors. Simulated receptors are created in order to provide optimal selective affinity for known target molecules. Then, chemical structures are also generated that exhibit selective affinity for simulated receptors.

Предпосылки создания изобретенияBACKGROUND OF THE INVENTION

Биологические рецепторы представляют собой линейные полимеры либо аминокислот, либо нуклеотидов, цепи которых укладываются с созданием трёхмерных оболочек для связывания субстрата. Расположение этих специфических трёхмерных линейных структур и размещение заряженных сайтов на поверхности оболочек является результатом эволюционного выбора на основе функциональной эффективности.Biological receptors are linear polymers of either amino acids or nucleotides, the chains of which are stacked with the creation of three-dimensional membranes for binding the substrate. The location of these specific three-dimensional linear structures and the placement of charged sites on the surface of the shells is the result of evolutionary choices based on functional efficiency.

Селективность биологических рецепторов зависит от величины сил притяжения и отталкивания, возникших между рецептором и субстратом. Величина этих сил изменяется с изменением величины и близости заряженных сайтов на поверхностях рецептора и субстрата.The selectivity of biological receptors depends on the magnitude of the attractive and repulsive forces arising between the receptor and the substrate. The magnitude of these forces varies with the magnitude and proximity of the charged sites on the surfaces of the receptor and substrate.

Поскольку субстраты различаются по числу и величине заряженных сайтов, имеющихся или наведенных на этих поверхностях, а также пространственному расположению этих сайтов, сродство к связыванию может изменяться в зависимости от структуры субстрата. Субстраты со сходным сродством к связыванию с одним и тем же рецептором очень похожи друг на друга по пространственному расположению, по меньшей мере, некоторых наведенных и фиксированных заряженных сайтов. Если функция рецептора коррелируется со сродством к связыванию, тогда субстраты со сходным сродством к связыванию должны быть функционально подобны по своему действию. В этом смысле можно сказать, что рецептор распознает или определяет количественно сходство субстратов.Since substrates differ in the number and size of charged sites that are present or induced on these surfaces, as well as in the spatial arrangement of these sites, binding affinity may vary depending on the structure of the substrate. Substrates with similar affinity for binding to the same receptor are very similar to each other in the spatial arrangement of at least some induced and fixed charged sites. If receptor function is correlated with binding affinity, then substrates with similar binding affinity should be functionally similar in effect. In this sense, we can say that the receptor recognizes or quantifies the similarity of the substrates.

Традиционные методы, используемые для молекулярного распознавания идентичности или определения новых химических соединений или субстратов, имеющих селективное сродство к связыванию рецепторов, основаны на нахождении молекулярных общих подграфов активных субстратов и их использовании для предсказания новых похожих соединений. Недостаток такой методики заключается в том, что она основана на предположении, что субстраты, проявляющие сходную эффективность связывания, структурно подобны. Однако во многих случаях субстраты, отличающиеся по структуре, могут проявлять сходное сродство к связыванию с одним и тем же рецептором. Более поздние методики, основанные на определении количественных соотношений структураактивность (0§АК), пригодны только для создания новых соединений одного класса структур и почти не годятся при создании новых молекулярных структур, проявляющих желательное селективное сродство, см., например, Беаи, ΡΗίΙίρ М., Мо1еси1аг КесодшНои: ТЬе МеакигетеШ аий ЗеатсЬ Рот Мо1еси1аг ШтйатНу ίη Ыдаий-Кекер!от 1и1геасНои, ίη Соисер1к аий АррНсаНоик оГ Мо1еси1аг ЗипПагНу. Ей. Магк А. 1окикои аий Оета1й М. Маддюта, рр. 211-238 (1990).The traditional methods used for molecular recognition of identity or the determination of new chemical compounds or substrates with selective affinity for binding to receptors are based on finding molecular common subgraphs of active substrates and using them to predict new similar compounds. The disadvantage of this technique is that it is based on the assumption that substrates exhibiting similar binding efficiency are structurally similar. However, in many cases, substrates that differ in structure can exhibit a similar affinity for binding to the same receptor. Later methods based on quantification of structural activity ratios (0§AK) are suitable only for creating new compounds of one class of structures and are hardly suitable for creating new molecular structures exhibiting the desired selective affinity, see, for example, Beai, ΡΗίΙίρ M. , Mo1esi1ag KesodshNoey: Thie Meakiget Sha Zeat Roth Mo1esi1ag ShtjatNu ίη Idaii-Keker! From 1 and 1geasNoey, ίη Soicerkiy ArrNsaNoik oG Mo1esiag ZipPagNu. Her. Magk A. 1okikoi aiy Oeta 1st M. Maddyuta, r. 211-238 (1990).

Недавние попытки были направлены на создание атомных моделей или псевдорецепторов, в которых атомы и функциональные группы связаны, или мини-рецепторов, представляющих собой несвязанные наборы атомов или функциональных групп (§иуйет, ΤΡ. (1993) Ιη 3Ό 0§АК ίη Эгид Бе51дп: ТЬеоту, Мейюйк аий АррБсаНоик; КиЫш, Н. Ей.; Ексот, БеИет Ρ. 336). Другие методы включают создание вокруг лигандов известной мишени оболочки из ряда атомов модели и расчет межмолекулярных сил, возникших между лигандом и моделью рецептора. Такие модели характеризуются высокой степенью корреляции между рассчитанной энергией связывания и биологической активностью (^а11егк, Б.Е. аий Ншйк, К.М. (1994) 1. Мейю. Скет. 37: 2527), но они не были разработаны до такой степени, когда можно получить новые химические структуры, обладающие селективным сродством к моделям рецепторов.Recent attempts have focused on creating atomic models or pseudoreceptors in which atoms and functional groups are linked, or mini-receptors, which are unconnected sets of atoms or functional groups (§iuyet, ΤΡ. (1993) Ιη 3Ό 0§AK ίη Aegis Be51dp: Thyot, Meyyuk aiy ArrBsaNoik; Kiysh, N.Ye .; Exot, BeIet Ρ. 336). Other methods include creating around the ligands a known target of a shell from a number of atoms of the model and calculating the intermolecular forces arising between the ligand and the receptor model. Such models are characterized by a high degree of correlation between the calculated binding energy and biological activity (^ a11egk, B.E. Aiy Nshyk, K.M. (1994) 1. Meyu. Sket. 37: 2527), but they have not been developed to such an extent when it is possible to obtain new chemical structures with selective affinity for receptor models.

Следовательно, было бы очень желательно создать способ определения нетривиального сходства между различными химическими структурами, которое достаточно и необходимо для объяснения их общих свойств, которые могут быть затем использованы в качестве основы для создания новых химических структур с полезными функциональными свойствами, основанный на специфических комбинациях пространственной конфигурации и сродства к связыванию.Therefore, it would be very desirable to create a method for determining non-trivial similarities between different chemical structures, which is sufficient and necessary to explain their general properties, which can then be used as a basis for creating new chemical structures with useful functional properties, based on specific combinations of spatial configuration and binding affinities.

Сущность изобретенияSUMMARY OF THE INVENTION

Данное изобретение предусматривает способ определения нетривиального сходства различных химических структур, которое необходимо и достаточно для объяснения их одинаковых функциональных свойств. Способ также предусматривает создание новых химических структур, которые проявляют сходные функциональные свойства.This invention provides a method for determining the non-trivial similarity of various chemical structures, which is necessary and sufficient to explain their identical functional properties. The method also involves the creation of new chemical structures that exhibit similar functional properties.

Принцип, лежащий в основе данного изобретения, заключается в использовании двухстадийного компьютерного способа для создания или открытия химических структур с полезными функциональными свойствами на основе специфических комбинаций стерической кон3 фигурации и сродства к связыванию. На первой стадии этого процесса используют алгоритмическую эмуляцию образования антитела для создания популяции моделированных при помощи компьютера рецепторов, которые имитируют биологические рецепторы с оптимизированным сродством к связыванию с выбранными субстратами-мишенями. На второй стадии процесса используют моделированные или виртуальные рецепторы для того, чтобы оценить сродство к связыванию существующих соединений или создать новые субстраты с оптимальным связыванием.The principle underlying this invention is to use a two-stage computer method to create or discover chemical structures with useful functional properties based on specific combinations of steric configuration and binding affinity. At the first stage of this process, algorithmic emulation of antibody formation is used to create a population of computer-simulated receptors that mimic biological receptors with optimized binding affinity for selected target substrates. In the second stage of the process, simulated or virtual receptors are used in order to evaluate the affinity for binding of existing compounds or to create new substrates with optimal binding.

Способ, описанный в данной заявке, предусматривает создание моделированных рецепторов, которые имитируют выбранные признаки биологических рецепторов, включая эволюционные процессы, которые оптимизируют их селективность к связыванию. Миметики или моделированные рецепторы, созданные этим способом, можно использовать для распознавания специфического сходства между молекулами. Подобно антителам и другим биологическим рецепторам моделированные рецепторы по изобретению представляют собой механизмы извлечения признаков: они могут быть использованы для идентификации или распознавания общих или подобных структурных признаков субстратов-мишеней. Связывание между рецепторами и субстратами-мишенями используется для распознавания признаков. Субстратымишени могут быть количественно классифицированы на основе величины связывания со специфическим моделированным рецептором. Соединения, имеющие общие особые структурные признаки, будут также обладать сходным связыванием с одним и тем же виртуальным рецептором.The method described in this application provides for the creation of simulated receptors that mimic selected features of biological receptors, including evolutionary processes that optimize their selectivity for binding. Mimetics or simulated receptors created in this way can be used to recognize specific similarities between molecules. Like antibodies and other biological receptors, the modeled receptors of the invention are feature extraction mechanisms: they can be used to identify or recognize common or similar structural features of target substrates. Binding between receptors and target substrates is used to recognize traits. Substrates can be quantified based on the amount of binding to a specific modeled receptor. Compounds having common specific structural features will also have similar binding to the same virtual receptor.

Сродство между биологическими рецепторами и субстратами определяется стерическим соответствием между смежными поверхностями рецептора и субстрата, отсутствием воды между неполярными сайтами двух поверхностей и величиной электростатических сил, возникших между соседними заряженными сайтами. В некоторых случаях образование ковалентных связей между субстратом и рецептором также вносит свой вклад в величину связывания. Моделированные рецепторы, полученные этим способом, имитируют механизмы связывания их биологических двойников. Средняя величина близости поверхностей рецептора и мишени и величина силы электростатического притяжения, возникшего между заряженными центрами на обеих поверхностях, используются для определения величины сродства к связыванию. Полученные величины используют для оценки молекулярного сходства субстратов.The affinity between biological receptors and substrates is determined by the steric correspondence between adjacent surfaces of the receptor and substrate, the absence of water between the nonpolar sites of the two surfaces and the magnitude of the electrostatic forces arising between adjacent charged sites. In some cases, the formation of covalent bonds between the substrate and the receptor also contributes to the amount of binding. Modeled receptors obtained in this way mimic the binding mechanisms of their biological counterparts. The average proximity of the surfaces of the receptor and the target and the magnitude of the electrostatic attraction force arising between the charged centers on both surfaces are used to determine the binding affinity. The obtained values are used to assess the molecular similarity of the substrates.

Величина связывания может в общем зависеть от взаимодействия между всей поверхностью субстрата и закрытым рецептором или оболочкой рецептора, полностью окружающей субстрат. В этом случае анализ общего сходства между субстратами является основой для установления полезных количественных отношений структура-активность. Однако в большинстве, если не во всех биологических системах, сродство определяется скорее локально, а не глобально. В общем, взаимодействие между молекулами субстрата и биологическими рецепторами ограничивается контактами между изолированными фрагментами поверхностей рецептора и субстрата. В этой ситуации исследование общего (глобального) сходства между субстратами не подходит как метод исследования взаимосвязи структура-активность, так как в образовании связывания участвуют только фрагменты субстрата.The amount of binding may generally depend on the interaction between the entire surface of the substrate and the closed receptor or receptor membrane completely surrounding the substrate. In this case, an analysis of the general similarity between the substrates is the basis for establishing useful quantitative structure-activity relationships. However, in most, if not all biological systems, affinity is determined locally rather than globally. In general, the interaction between substrate molecules and biological receptors is limited to contacts between isolated fragments of the surfaces of the receptor and substrate. In this situation, the study of general (global) similarity between substrates is not suitable as a method for studying the structure-activity relationship, since only fragments of the substrate participate in the formation of binding.

Структуры, имеющие локальное сходство, обладают одинаковыми структурными фрагментами в одинаковых положениях и ориентациях. Структуры, имеющие локальное сходство, необязательно имеют глобальное сходство. Выборка молекулярных свойств может быть достигнута методом полного отбора проб, включающим оценку глобального сходства; методом фрагментарного отбора проб, включающим оценку локального сходства, и методом фрагментарного множественного отбора проб, включающим оценку и локального, и глобального сходства.Structures with local similarity have the same structural fragments in the same positions and orientations. Structures having local affinity do not necessarily have global affinity. A sample of molecular properties can be achieved by a complete sampling method, including an assessment of global similarity; the method of fragmented sampling, including the assessment of local similarity, and the method of fragmented multiple sampling, including the assessment of both local and global similarity.

Анализ локального сходства основан на отборе проб дискретных участков субстратов для сходных структур и определении распределения зарядов. В биологических рецепторах локальный отбор проб возможен вследствие нерегулярности или неровностей прилегающих поверхностей субстрата и рецептора. Взаимодействие между близко расположенными противоположными поверхностями будут преобладать над взаимодействиями между более удаленными участками при определении сродства к связыванию. Близость прилегающих поверхностей будет также определять силу гидрофобного связывания. Эффективные моделированные рецепторы, полученные по данному способу, должны использовать локальный дискретный отбор проб субстратов-мишеней (молекул) для оценки функционально релевантного сходства соединений.The analysis of local similarity is based on sampling of discrete sections of substrates for similar structures and determining the distribution of charges. In biological receptors, local sampling is possible due to irregularities or irregularities in the adjacent surfaces of the substrate and receptor. Interactions between closely spaced opposing surfaces will prevail over interactions between more distant sites in determining binding affinity. The proximity of adjacent surfaces will also determine the strength of hydrophobic binding. Effective simulated receptors obtained by this method should use local discrete sampling of target substrates (molecules) to assess the functionally relevant similarity of the compounds.

Определение локального сходства осложняется двумя факторами: 1) число, расположение и идентичность релевантных фрагментов, необходимых и достаточных для специфического связывания, обычно не могут быть установлены простой дедукцией на основе химической структуры субстрата; и 2) положения и ориентация фрагментов, отобранных в ходе анализа, зависят от структуры всей молекулы.The determination of local similarity is complicated by two factors: 1) the number, location and identity of the relevant fragments, necessary and sufficient for specific binding, usually cannot be established by simple deduction based on the chemical structure of the substrate; and 2) the position and orientation of the fragments selected during the analysis depend on the structure of the whole molecule.

Часть данного метода, направленного на получение моделированных рецепторов, способных классифицировать сходство между химическими субстратами, в основном представляет собой поиск рецепторов, которые являются образцами релевантных фрагментов субстратов в релевантном положении в пространстве. Процесс оптимизации основывается на четырех признаках моделированных рецепторов: 1) универсальности: способности рецепторов связывать более одного субстрата; 2) специфичности: связывание рецепторов зависит от структуры субстрата; 3) экономичности: рецепторы различают субстраты по минимальному набору локальных структурных признаков; и 4) мутабильности: изменение структуры рецептора может изменить его сродство к связыванию специфического субстрата. Кодирование фенотипа рецептора в виде линейного генотипа, представленного характерной нитью, облегчает процессы мутации, рекомбинации и наследования структурных характеристик моделированных рецепторов.Part of this method, aimed at obtaining simulated receptors that can classify the similarity between chemical substrates, is mainly a search for receptors that are samples of relevant fragments of substrates in a relevant position in space. The optimization process is based on four features of simulated receptors: 1) universality: the ability of receptors to bind more than one substrate; 2) specificity: receptor binding depends on the structure of the substrate; 3) cost-effectiveness: receptors distinguish substrates by the minimum set of local structural features; and 4) mutability: a change in the structure of the receptor can alter its affinity for binding to a specific substrate. Encoding the receptor phenotype in the form of a linear genotype represented by a characteristic strand facilitates the processes of mutation, recombination, and inheritance of the structural characteristics of simulated receptors.

Моделированные рецепторы, которые удовлетворяют этим основным критериям, могут быть оптимизированы для достижения специфического связывания с локально подобными субстратами с использованием методов эволюционного селективного воспроизводства. Это осуществляется путем кодирования пространственной конфигурации и распределения заряженных сайтов рецептора в наследуемом формате, который может подвергаться изменениям или мутациям. Подобно биологическим рецепторам моделированные рецепторы, полученные этим методом, определяют трехмерное пространство отчуждения. Такое трехмерное пространство может быть очерчено в произвольной степени разрешения одномерной линией достаточной длины и извитости. Белки, образованные линейными полимерами аминокислот, являются примерами таких структур. Подобным образом трехмерная структура моделированных рецепторов может быть кодирована как линейное образование изменяющихся команд. Эта одномерная кодированная форма рецептора представляет собой его генотип. Декодированная форма, используемая для достижения связывания, представляет собой его фенотип. В процессе оптимизации осуществляются изменения (мутации) генотипа рецептора. Затем оценивается влияние этих изменений на сродство фенотипа к связыванию. Генотипы, генерирующие фенотипы с заданным сродством к связыванию, сохраняются для дальнейшего изменения, пока не достигается за счет итерации мутации и процесса селекции желаемая степень оптимизации фенотипа. Для создания популяций моделированных рецепторов с оптимальными величинами связывания могут быть использованы разнообразные эволюционные методы, включая классические генетические алгоритмы-рецепторы, полученные этим методом, используют затем для генерирования или идентификации новых химических структур (соединений), которые обладают специфическими полезными свойствами молекулярных мишеней, используемыми как критерий выбора при получении моделированных рецепторов. При использовании взаимодействия с рецепторами в качестве критерия выбора создаются новые химические структуры, оптимально соответствующие рецепторам. Поскольку эти структуры должны удовлетворять требованиям, необходимым и достаточным для обеспечения селективности рецепторов, они должны также обладать биологической активностью, подобной активности исходных молекулярных мишеней. Популяция моделированных рецепторов с улучшенной селективностью может также быть использована для скрининга существующих химических структур для соединений с высоким сродством, которые могут обладать этими полезными свойствами. Тот же самый способ может быть использован для скрининга соединений с выбранными токсикологическими или иммунологическими свойствами.Simulated receptors that satisfy these basic criteria can be optimized to achieve specific binding to locally similar substrates using evolutionary selective reproduction techniques. This is done by encoding the spatial configuration and distribution of the charged receptor sites in an inherited format that can undergo changes or mutations. Like biological receptors, simulated receptors obtained by this method define a three-dimensional alienation space. Such a three-dimensional space can be outlined to an arbitrary degree of resolution by a one-dimensional line of sufficient length and tortuosity. Proteins formed by linear polymers of amino acids are examples of such structures. Similarly, the three-dimensional structure of simulated receptors can be encoded as a linear formation of changing teams. This one-dimensional encoded form of the receptor is its genotype. The decoded form used to achieve binding is its phenotype. In the process of optimization, changes (mutations) of the receptor genotype are made. The effect of these changes on the affinity of the phenotype for binding is then evaluated. Genotypes generating phenotypes with a given binding affinity are saved for further change until the desired degree of phenotype optimization is achieved through iteration of the mutation and selection process. A variety of evolutionary methods can be used to create simulated receptor populations with optimal binding values, including classical genetic receptor algorithms obtained by this method, then used to generate or identify new chemical structures (compounds) that have specific useful properties of molecular targets used as selection criteria for obtaining simulated receptors. When using interactions with receptors as a selection criterion, new chemical structures are created that are optimal for the receptors. Since these structures must satisfy the requirements necessary and sufficient to ensure selectivity of the receptors, they must also have biological activity similar to the activity of the original molecular targets. A population of simulated receptors with improved selectivity can also be used to screen existing chemical structures for compounds with high affinity, which may have these beneficial properties. The same method can be used to screen compounds with selected toxicological or immunological properties.

Согласно одному аспекту данного изобретения предусматривается компьютерный метод создания химических структур, имеющих заданные функциональные характеристики, включающий операции:According to one aspect of the present invention, there is provided a computer method for creating chemical structures having predetermined functional characteristics, including operations:

(а) создания физической модели фенотипа моделированного рецептора, кодированного в линейной характерной последовательности и создания набора молекул мишеней, обладающих, по меньшей мере, одной общей количественной функциональной характеристикой;(a) creating a physical model of the phenotype of a simulated receptor encoded in a linear characteristic sequence and creating a set of target molecules having at least one common quantitative functional characteristic;

(б) для каждой молекулы мишени:(b) for each target molecule:

(ί) определения величины сродства между рецептором и молекулой мишени в каждой из множества ориентаций с использованием расчета эффективного сродства;(ί) determining the affinity between the receptor and the target molecule in each of the multiple orientations using the calculation of the effective affinity;

(ίί) определения суммарного сродства путем суммирования рассчитанных величин сродства;(ίί) determining the total affinity by summing the calculated affinity values;

(ш) идентификации максимальной величины сродства;(w) identification of the maximum affinity;

(в) использования рассчитанной суммарной и максимальной величин сродства для:(c) using the calculated total and maximum affinity values for:

(ί) определения максимального коэффициента корреляции сродства между максимальными величинами сродства и количественной функциональной характеристикой;(ί) determining the maximum affinity correlation coefficient between the maximum affinity values and the quantitative functional characteristic;

(ίί) определения суммарного коэффициента корреляции сродства между суммарным сродством и количественной функциональной характеристикой;(ίί) determining the total affinity correlation coefficient between the total affinity and the quantitative functional characteristic;

(г) использования максимального коэффициента корреляции и суммарного коэффициента корреляции для определения коэффициента соответствия;(d) using the maximum correlation coefficient and the total correlation coefficient to determine the correspondence coefficient;

(д) изменения структуры рецептора и повторение операций (б) - (г) до тех пор, пока не будет получена популяция рецепторов, обладающих заданным коэффициентом соответствия;(e) changes in the structure of the receptor and the repetition of operations (b) - (d) until a population of receptors with a given correspondence coefficient is obtained;

(е) создания физической модели химической структуры, кодированной в молекулярной линейной характерной последовательности, определения сродства между химической структурой и каждым рецептором во множестве ориентаций с использованием указанного определения эффективного сродства, использования определенных величин сродства для определения степени соответствия сродства;(f) creating a physical model of the chemical structure encoded in a molecular linear characteristic sequence, determining the affinity between the chemical structure and each receptor in a variety of orientations using the specified definition of effective affinity, using certain affinity values to determine the degree of affinity correspondence;

(ж) изменения химической структуры для получения варианта химической структуры и повторения операции (е); и (з) сохранения и дальнейшего изменения тех вариантов химической структуры, степень сродства которых приближается к заданной величине.(g) changing the chemical structure to obtain a variant of the chemical structure and repeating operation (e); and (h) preservation and further change of those variants of the chemical structure, the degree of affinity of which is approaching a given value.

Согласно другому аспекту изобретения предусматривается метод скрининга химических структур для получения заданных функциональных свойств, включающий:According to another aspect of the invention, there is provided a method for screening chemical structures to obtain desired functional properties, including:

(а) получение генотипа моделированного рецептора генерированием линейной последовательности признаков рецептора, которая кодирует пространственное расположение и заряд;(a) obtaining a genotype of a simulated receptor by generating a linear sequence of receptor traits that encodes the spatial arrangement and charge;

(б) декодирование генотипа для получения фенотипа рецептора, создание, по меньшей мере, одной молекулы мишени, проявляющей заданную функциональную характеристику, расчет сродства между рецептором и каждой молекулой мишени во множестве ориентаций с использованием расчета эффективного сродства, нахождение суммарного и максимального сродства между каждой молекулой мишени и рецептором, определение суммарного коэффициента корреляции сродства для зависимости суммарного сродства от указанной функциональной характеристики молекулы мишени и максимального коэффициента корреляции сродства для зависимости максимального сродства от указанной функциональной характеристики и расчета коэффициента соответствия в зависимости от указанных суммарного и максимального коэффициентов корреляции сродства;(b) decoding the genotype to obtain the receptor phenotype, creating at least one target molecule exhibiting a given functional characteristic, calculating the affinity between the receptor and each target molecule in a variety of orientations using the calculation of effective affinity, finding the total and maximum affinity between each molecule target and receptor, determination of the total affinity correlation coefficient for the dependence of the total affinity on the specified functional characteristics of the target molecule and and the maximum affinity correlation coefficient for the dependence of the maximum affinity on the specified functional characteristics and the calculation of the compliance coefficient depending on the specified total and maximum affinity correlation coefficients;

(в) мутацию генотипа и повторение операции (б) и сохранение и мутацию тех рецепторов, которые обладают повышенными коэффициентами соответствия до тех пор, пока не образуется популяция рецепторов с заданными коэффициентами соответствия;(c) mutation of the genotype and repetition of the operation (b) and preservation and mutation of those receptors that have increased correspondence coefficients until a population of receptors with predetermined matching coefficients is formed;

(г) расчета сродства между химической структурой, скрининг которой проводится, и каждым рецептором во множестве ориентаций с использованием указанного эффективного расчета сродства, расчета степени соответствия сродства, который включает вычисление суммарного и максимального сродства между соединением и каждым рецептором и сравнения, по меньшей мере, одного из указанных суммарного и максимального сродства с суммарным и максимальным сродством, по меньшей мере, одной мишени и указанной популяции рецепторов, причем указанное сравнение является показателем уровня функциональной активности указанной химической структуры по отношению к, по меньшей мере, одной молекуле мишени.(d) calculating the affinity between the chemical structure being screened and each receptor in a variety of orientations using the indicated effective affinity calculation, calculating the degree of affinity correspondence, which includes calculating the total and maximum affinity between the compound and each receptor and comparing at least one of the indicated total and maximum affinity with the total and maximum affinity of at least one target and said population of receptors, wherein said comparison S THE indicator of the level of functional activity of said chemical structure with respect to at least one target molecule.

Согласно еще одному аспекту изобретения предусмотрен метод создания моделированных рецепторов, имитирующих биологические рецепторы, обладающие селективным сродством к соединениям со сходными функциональными характеристиками, включающий операции:According to another aspect of the invention, there is provided a method for creating simulated receptors that mimic biological receptors with selective affinity for compounds with similar functional characteristics, including operations:

(а) получения генотипа моделированного рецептора путем генерации линейной последовательности рецептора, которая кодирует пространственное расположение и заряд;(a) obtaining the genotype of a simulated receptor by generating a linear receptor sequence that encodes a spatial arrangement and charge;

(б) декодирования генотипа для получения фенотипа рецептора, создания набора молекул мишеней, обладающих сходными функциональными характеристиками, расчета сродства между рецептором и каждой молекулой мишени во множестве ориентаций с использованием эффективного расчета сродства, расчета суммарного и максимального сродства между каждой молекулой мишени и рецептором, расчета суммарного коэффициента корреляции сродства для зависимости суммарного сродства от функциональной характеристики для каждой молекулы мишени и максимального коэффициента корреляции сродства для зависимости максимального сродства от указанной функциональной характеристики для каждой молекулы мишени и расчета коэффициента соответствия в зависимости от указанных суммарного и максимального коэффициентов корреляции сродства для каждой молекулы мишени; и (в) мутации генотипа и повторение стадии (б) и сохранение и мутация тех рецепторов, которые обладают повышенными коэффициентами соответствия до получения популяции рецепторов с заданными коэффициентами соответствия.(b) decoding the genotype to obtain the receptor phenotype, creating a set of target molecules with similar functional characteristics, calculating the affinity between the receptor and each target molecule in a variety of orientations using an effective affinity calculation, calculating the total and maximum affinity between each target molecule and receptor, calculating the total affinity correlation coefficient for the dependence of the total affinity on the functional characteristic for each target molecule and the maximum correlation coefficient for the dependence of the maximum affinity from the affinities of said functional characteristics for each of the target molecule and calculation of the corresponding coefficients in dependence on said sum and maximal affinity correlation coefficients for each of the target molecule; and (c) mutations of the genotype and repetition of stage (b) and the conservation and mutation of those receptors that have increased correspondence coefficients until a receptor population with predetermined matching coefficients is obtained.

Согласно дальнейшему аспекту данного изобретения предусматривается компьютерный метод создания химических структур с заданной функциональной характеристикой, включающий операции:According to a further aspect of the present invention, there is provided a computer method for creating chemical structures with a given functional characteristic, including operations:

(а) создания физической модели рецептора и набора молекул мишеней, причем последние обладают, по меньшей мере, одной поддающейся количественному определению функциональной характеристикой;(a) creating a physical model of the receptor and a set of target molecules, the latter having at least one quantifiable functional characteristic;

(б) для каждой молекулы мишени:(b) for each target molecule:

(ί) определения сродства между рецептором и молекулой мишени в каждой из множества ориентаций с использованием расчета эффективного сродства;(ί) determining the affinity between the receptor and the target molecule in each of the multiple orientations using the calculation of the effective affinity;

(ίί) расчета суммарного сродства путем суммирования найденных величин сродства;(ίί) calculating the total affinity by summing the found affinity values;

(ίίί) определения максимального сродства;(ίίί) determining maximum affinity;

(в) использования рассчитанных величин суммарного и максимального сродства для того, чтобы:(c) using calculated total and maximum affinity values in order to:

(ί) рассчитать максимальный коэффициент корреляции сродства между максимальным сродством и поддающейся количественному определению функциональной характеристикой;(ί) calculate the maximum affinity correlation coefficient between the maximum affinity and the quantifiable functional characteristic;

(ц) рассчитать суммарный коэффициент корреляции сродства между суммарным сродством и поддающейся количественному определению функциональной характеристикой;(c) calculate the total affinity correlation coefficient between the total affinity and the quantifiable functional characteristic;

(г) использования максимального коэффициента корреляции и суммарного коэффициента корреляции для расчета коэффициента соответствия;(d) using the maximum correlation coefficient and the total correlation coefficient to calculate the correspondence coefficient;

(д) изменения структуры рецептора и повторения операций (б) - (г) до тех пор, пока не образуется популяция рецепторов с заданным коэффициентом соответствия;(e) changes in the structure of the receptor and repetition of operations (b) - (d) until a population of receptors is formed with a given correspondence coefficient;

(е) создания физической модели химической структуры, определения сродства между химической структурой и каждым рецептором во множестве ориентаций с использованием указанного расчета эффективного сродства, использования рассчитанных величин сродства для нахождения степени соответствия сродства;(f) creating a physical model of the chemical structure, determining the affinity between the chemical structure and each receptor in a variety of orientations using the indicated calculation of effective affinity, using the calculated affinity values to find the degree of affinity correspondence;

(ж) изменения химической структуры для создания варианта химической структуры и повторения стадии (е); и (з) сохранения и дальнейшего изменения тех вариантов химической структуры, чья степень соответствия сродства приближается к заданной величине.(g) changing the chemical structure to create a variant of the chemical structure and repeating stage (e); and (h) the preservation and further change of those variants of the chemical structure whose degree of affinity correspondence approaches a predetermined value.

Согласно еще одному аспекту изобретения предусматривается метод кодирования химических структур, включающих атомные элементы, причем метод включает создание линейной характерной последовательности, которая кодирует пространственное расположение и заряд для каждого атома указанной химической структуры.According to yet another aspect of the invention, there is provided a method for encoding chemical structures comprising atomic elements, the method comprising creating a linear characteristic sequence that encodes the spatial arrangement and charge for each atom of said chemical structure.

Краткое описание фигурBrief Description of the Figures

Ниже данное изобретение будет проиллюстрировано на примере со ссылкой на прилагаемые фигуры.Below the invention will be illustrated by example with reference to the accompanying figures.

На фиг. 1 представлена схема, показывающая соотношение между созданием кода генотипа и трансляцией с получением соответствующего фенотипа, отражающая часть данного изобретения;In FIG. 1 is a diagram showing the relationship between creating a genotype code and translating to obtain the corresponding phenotype, reflecting part of the present invention;

на фиг. 2 показана общая схема, отражающая операции оптимизации рецептора для селективного связывания с рядом субстратов с использованием точечных мутаций, отражающая часть данного изобретения;in FIG. 2 shows a general diagram illustrating receptor optimization operations for selectively binding to a number of substrates using point mutations, reflecting part of the present invention;

на фиг. 3 показана общая схема операций способа получения популяции рецепторов с оптимальным сродством к селективному связыванию с рядом химических субстратов и использования этих оптимизированных рецепторов для получения ряда новых химических субстратов с общими одинаковыми функциональными характеристиками;in FIG. Figure 3 shows a general flow diagram of a method for producing a population of receptors with optimal affinity for selective binding to a number of chemical substrates and using these optimized receptors to produce a number of new chemical substrates with common identical functional characteristics;

на фиг. 4а представлены несколько химических соединений, использованных в примере, относящемся к генерации лигандов;in FIG. 4a shows several chemical compounds used in the example related to ligand generation;

на фиг. 4Ь показаны лиганды 1.1-1.4, полученные методом по данному изобретению в примере, иллюстрирующем генерацию лигандов, где каждый лиганд имеет, по меньшей мере, одну ориентацию, при которой он структурно подобен бензальдегиду;in FIG. 4b shows ligands 1.1-1.4 obtained by the method of this invention in an example illustrating ligand generation, where each ligand has at least one orientation in which it is structurally similar to benzaldehyde;

на фиг. 4с представлены лиганды 2.1-2.4, полученные методом по данному изобретению в примере, иллюстрирующем генерацию лигандов, относящейся к созданию химических структур, проявляющих эффективность при отпугивании комаров.in FIG. 4c shows ligands 2.1-2.4 obtained by the method of this invention in an example illustrating the generation of ligands related to the creation of chemical structures that are effective in repelling mosquitoes.

Описание предпочтительных вариантовDescription of Preferred Options

Данный способ можно разбить на две части: (А) эволюция популяции моделированных рецепторов с селективным сродством к соединениям с общими функциональными свойствами и (Б) образование новых химических структур, имеющих общие функциональные свойства. Часть (А) состоит из нескольких операций, включая 1 ) генерацию генотипа и фенотипа рецептора; 2) генерацию мишени; 3) презентацию известных химических структур(ы) рецептору; 4) оценку сродства рецептора к химической структуре(ам); 5) оценку селективности рецептора по отношению к химической структуре(ам); 6) эволюцию семейства родственных рецепторов с оптимизированными селективным сродством к химической структуре(ам); скрининг химических субстратов для оценки токсикологии и фармакологической активности и использование оптимизированных рецепторов для создания новой химической структуры(структур) с селективным сродством к рецепторам.This method can be divided into two parts: (A) the evolution of a population of simulated receptors with selective affinity for compounds with common functional properties; and (B) the formation of new chemical structures having common functional properties. Part (A) consists of several operations, including 1) generation of the receptor genotype and phenotype; 2) target generation; 3) the presentation of known chemical structures (s) to the receptor; 4) an assessment of the affinity of the receptor for the chemical structure (s); 5) an assessment of the selectivity of the receptor with respect to the chemical structure (s); 6) the evolution of a family of related receptors with optimized selective affinity for the chemical structure (s); screening of chemical substrates to assess toxicology and pharmacological activity and the use of optimized receptors to create a new chemical structure (s) with selective affinity for receptors.

Нижеследующее описание лучшего примера осуществления изобретения относится к различным таблицам молекулярных и атомных радиусов, поляризуемостей, величин эффективного диполя и факторов переходных состояний и присоединения, эти величины приведены в табл. 1-5, приведенных в конце описания. Схемы, иллюстрирующие примеры расчетов, не ограничивающие изобретение, представлены в конце описания в виде модулей 1 -1 4.The following description of a better embodiment of the invention relates to various tables of molecular and atomic radii, polarizabilities, effective dipole values, and transition and coupling factors, these values are given in table. 1-5 are given at the end of the description. Schemes illustrating calculation examples, not limiting the invention, are presented at the end of the description in the form of modules 1 -1 4.

Часть А: Эволюция популяции моделированных рецепторов, обладающих селективным сродством к молекулам мишеней, имеющим общие функциональные свойства (1) Генерация кода генотипа и фенотипа рецептораPart A: Evolution of a population of simulated receptors with selective affinity for target molecules having common functional properties (1) Generation of the receptor genotype and phenotype code

И генотипы, и фенотип моделированного рецептора представляют собой рассчитанные объекты. Фенотипы моделированных рецепторов состоят из складчатых неразветвленных полимеров сферических субъединиц, диаметр которых равен радиусу Ван дер Ваальса для атомного водорода (—110 пм). Субъединицы могут быть связаны друг с другом в любых двух из шести точек, соответствующих отрезкам сфер с каждой из их основных осей. В данном случае связи между субъединицами не могут вытягиваться или вращаться, и центры двух связанных субъединиц всегда отделены расстоянием, равным длине их сторон (т.е. радиусу 1 водорода). Когда две субъединицы не прилегают к противоположным поверхностям их общего соседа, возникают повороты (витки). Возможны четыре вида ортогональных поворотов: левый, правый, верхний и нижний. Повороты должны быть параллельны одной из основных осей. Для упрощения вычислений в том случае, когда повороты пересекаются с другими субъединицами в полимере, принимают, что субъединицы занимают одно и то же пространство с другими субъединицами.Both genotypes and phenotype of the simulated receptor are calculated objects. The phenotypes of simulated receptors consist of folded, unbranched polymers of spherical subunits, the diameter of which is equal to the van der Waals radius for atomic hydrogen (-110 pm). Subunits can be connected to each other at any two of six points corresponding to segments of spheres with each of their main axes. In this case, the bonds between the subunits cannot stretch or rotate, and the centers of two connected subunits are always separated by a distance equal to the length of their sides (i.e., radius 1 of hydrogen). When two subunits do not adhere to opposite surfaces of their common neighbor, turns (turns) occur. Four types of orthogonal turns are possible: left, right, upper and lower. Turns should be parallel to one of the main axes. To simplify the calculations, when the turns intersect with other subunits in the polymer, it is assumed that the subunits occupy the same space with other subunits.

Моделированный рецептор состоит из одного или нескольких дискретных полимеров. В случае рецепторов, состоящих из многих полимеров, индивидуальные полимеры могут располагаться в различных точках пространства. Для упрощения в данном случае принимают, что все полимеры, составляющие один рецептор, имеют одну и ту же длину (= числу субъединиц). Это ограничение не является требованием для функциональности, и для моделирования специфических систем могут быть пригодны полимеры с разной длиной.A simulated receptor consists of one or more discrete polymers. In the case of receptors consisting of many polymers, individual polymers can be located at different points in space. To simplify, in this case, it is assumed that all polymers constituting the same receptor have the same length (= the number of subunits). This limitation is not a requirement for functionality, and polymers of different lengths may be suitable for modeling specific systems.

Структура каждого полимера кодируется как последовательный набор изменяющихся команд. Эти команды определяют отдельные изменения по отношению к внутренней рамке обозначения, основанной на первоначальной ориентации первой субъединицы в каждом полимере.The structure of each polymer is encoded as a sequential set of changing instructions. These commands define individual changes with respect to the internal designation frame based on the initial orientation of the first subunit in each polymer.

Гидраты рецептора и субстрата в данном случае не обрабатываются, вместо этого предполагается, что любые молекулы воды, имеющиеся на участке связывания, постоянно присоединены к поверхности рецептора и входят в его структуру. Это произвольное приближение, и специалистам очевидно, что можно осуществить более точную обработку (см., например, УапОзз. 1995, Мо1еси1аг 1ттипо1оду 32:199211).In this case, the receptor and substrate hydrates are not processed; instead, it is assumed that any water molecules present at the binding site are constantly attached to the surface of the receptor and enter its structure. This is an arbitrary approximation, and it will be apparent to those skilled in the art that a more accurate processing can be carried out (see, for example, Alcoz. 1995, Moecius1agentipod 32: 199211).

Как видно из фиг. 1, модуль создания кода генерирует произвольные нити признаков. Каждый признак представляет изменяющуюся команду или определяет характеристики заряда или реактивность в точке в трёхмерной форме, представляющей собой виртуальный рецептор. Для создания нити, описывающей трёхмерную форму рецептора в Картезианской (прямоугольной) системе координат, требуется минимум пять различных признаков. Другие системы, например, тетраэдральные структуры, также могут быть созданы с использованием различных наборов изменяющихся команд. Признаки представляют изменяющиеся команды, которые определены в отношении текущего направления в структуре виртуального рецептора в трёхмерном пространстве (т.е. команды относятся к рамке обозначения, присущей виртуальному рецептору, а не к произвольной внешней рамке обозначения).As can be seen from FIG. 1, the code generation module generates arbitrary feature threads. Each sign represents a changing team or determines the characteristics of the charge or reactivity at a point in three-dimensional form, which is a virtual receptor. To create a thread that describes the three-dimensional shape of the receptor in the Cartesian (rectangular) coordinate system, at least five different attributes are required. Other systems, such as tetrahedral structures, can also be created using various sets of variable commands. Attributes represent changing teams that are defined with respect to the current direction in the structure of the virtual receptor in three-dimensional space (i.e., the commands refer to the notation frame inherent in the virtual receptor, and not to an arbitrary external notation frame).

Изменяющиеся команды даны по отношению к направлению тока и ориентации полимера. Разрешаются только левые, правые, верхние и нижние повороты. Если поворот не возникает, цепь полимера или заканчивается, или продолжается в том же направлении.Changing commands are given with respect to the direction of the current and the orientation of the polymer. Only left, right, top and bottom turns are allowed. If the rotation does not occur, the polymer chain either ends or continues in the same direction.

Для прямоугольной системы существует следующий минимальный набор признаков: С1 = нет поворота; С2 = правый поворот; С3 = левый поворот; С4 = верхний поворот и С5 = нижний поворот. Ясно, что команды могут быть объединены для создания поворотов по диагонали, например, Л1>2 = 0С2; Л2>1 = С2С и т.д. Число различных признаков, которые определяют различные заряды или реактивные состояния, не ограничено и может быть подобрано в соответствии с эмпирическими данными. Коды могут отличаться друг от друга по длине (числу признаков) и частоте, с которой конкретные признаки появляются в сериях.For a rectangular system, there is the following minimum set of features: C 1 = no rotation; C 2 = right turn; C 3 = left turn; C 4 = upper turn and C 5 = lower turn. It is clear that teams can be combined to create diagonal turns, for example, L 1> 2 = 0С 2 ; L 2> 1 = C 2 C, etc. The number of different features that define different charges or reactive states is not limited and can be selected in accordance with empirical data. Codes may differ from each other in length (number of features) and the frequency with which specific features appear in series.

Пример создания генотипа.An example of creating a genotype.

Специалистам очевидно, что нижеследующий пример создания кода генотипа и экспрессии фенотипа является только иллюстративным. В этом примере применяются следующие условия.It will be apparent to those skilled in the art that the following example of creating a genotype code and expressing a phenotype is only illustrative. In this example, the following conditions apply.

(1) Набор символов, используемых для образования кодов, состоит из пяти символов, относящихся к изменяющимся командам, и двух символов, идентифицирующих заряженный сайт: 0 = нет поворота; 1 = правый поворот; 2 = верхний поворот; 3 = левый поворот; 4 = нижний поворот; 5 = положительно заряженный сайт (нет поворота) и 6 = отрицательно заряженный сайт (нет поворота).(1) The character set used to generate the codes consists of five characters related to changing teams and two characters identifying a charged site: 0 = no rotation; 1 = right turn; 2 = top turn; 3 = left turn; 4 = bottom turn; 5 = positively charged site (no turnaround) and 6 = negatively charged site (no turnaround).

(2) Субъединицы делятся на два типа: заряженные и незаряженные. Предполагается, что все заряженные субъединицы несут единичный положительный или отрицательный заряд. Однородная величина заряда является произвольным условием.(2) Subunits are divided into two types: charged and uncharged. It is assumed that all charged subunits carry a single positive or negative charge. A uniform charge is an arbitrary condition.

(3) Рецепторы содержат 15 дискретных полимеров. Длина полного кода всегда кратна пятнадцати. Длина каждого полимера равна длине всего кода, деленной на пятнадцать. Очевидно, что рецепторы могут быть созданы из любого количества дискретных полимеров с изменяющейся или постоянной длиной.(3) Receptors contain 15 discrete polymers. The length of the complete code is always a multiple of fifteen. The length of each polymer is equal to the length of the entire code divided by fifteen. Obviously, receptors can be created from any number of discrete polymers with a variable or constant length.

(4) Пользователем определены следующие параметры: (а) общая длина кода (и длина полимера); (б) частота, с которой каждый символ появляется в коде; и (в) наличие комбинаций символов. Модуль 1 представляет пример схемы создания кода генотипа.(4) The following parameters are defined by the user: (a) total code length (and polymer length); (b) the frequency with which each character appears in the code; and (c) combinations of characters. Module 1 provides an example of a scheme for creating a genotype code.

Пример создания фенотипа рецептора.An example of creating a receptor phenotype.

Каждый код генотипа подвергается трансляции для создания трехмерного описания соответствующего фенотипа или виртуального рецептора. Для превращения изменяющихся команд в серию координатных триплетов, которые описывают положение последовательных субъединиц, представляющих собой полимеры рецептора, используется алгоритм трансляции из заданной исходной точки. Исходные координаты для каждого полимера должны быть заданы до трансляции. Трансляция предполагает, что центры последовательных субъединиц отделены друг от друга расстоянием, равным ковалентному диаметру атома водорода.Each genotype code is translated to create a three-dimensional description of the corresponding phenotype or virtual receptor. To convert the changing commands into a series of coordinate triplets that describe the position of consecutive subunits representing receptor polymers, a translation algorithm from a given starting point is used. The initial coordinates for each polymer must be set prior to translation. Translation assumes that the centers of consecutive subunits are separated from each other by a distance equal to the covalent diameter of the hydrogen atom.

Алгоритм трансляции считывает кодированную нить последовательно с образованием последовательных поворотов и прямых отрезков. Интерпретация последовательных поворотов по отношению к внешней системе координат зависит от предшествующей последовательности поворотов. Предполагается, что для каждого полимера, образующего рецептор, начальная ориентация одинакова. В данном случае алгоритм трансляции описан в табл. 1, показывающей состояния на входе и выходе. Если поворот не образуется, для определения нового координатного триплета используются самые последние величины для Ах, Ау, Δζ и новые состояния. Сайты зарядов обрабатываются как прямые (без поворотов) отрезки. Начальная величина старого состояния равна 20.The translation algorithm reads the coded thread sequentially with the formation of sequential turns and straight segments. The interpretation of successive rotations with respect to the external coordinate system depends on the previous sequence of rotations. It is assumed that for each polymer forming the receptor, the initial orientation is the same. In this case, the translation algorithm is described in table. 1, showing input and output states. If no rotation is formed, the latest values for Ax, Au, Δζ and new states are used to determine the new coordinate triplet. Charge sites are processed as straight (without turns) segments. The initial value of the old state is 20.

Пользователем могут быть определены следующие параметры:The user can define the following parameters:

а. Исходные координаты для каждого полимера, образующего рецептор.but. The initial coordinates for each polymer forming the receptor.

Выходные данные хранятся в виде:The output is stored as:

а) трех векторов (один для каждой оси: {х1, х2, Хз, хп}, {у1, Уп}, {Ζ1, ..., ζη}).a) three vectors (one for each axis {x 1, x2, Xs, x}, {y1, Vn}, {Ζ1, ..., ζη }).

б) трехмерной бинарной матрицы.b) three-dimensional binary matrix.

в) отдельных векторов для координат сайтов зарядов. Пример трансляции кода приведен в модуле 2.c) separate vectors for the coordinates of charge sites. An example of code translation is given in module 2.

(2) Г енерация мишени(2) Target Generation

Мишени представлены в виде молекул, состоящих из сферических атомов. Считается, что атомы являются твердыми сферами с фиксированными радиусами для каждого вида атомов. Радиус твердой сферы, при котором сила отталкивания, действующая между атомами мишени и виртуальным рецептором, считается бесконечно большой величиной, аппроксимируется радиусом Ван дер Ваальса, приведенным в табл.Targets are presented in the form of molecules consisting of spherical atoms. It is believed that atoms are solid spheres with fixed radii for each type of atom. The radius of the solid sphere, at which the repulsive force acting between the target atoms and the virtual receptor, is considered to be an infinitely large value, is approximated by the Van der Waals radius given in Table.

2. Другие примерные величины радиуса Ван дер Ваальса могут быть использованы вместо величин, приведенных в табл. 2.2. Other approximate values of the radius of van der Waals can be used instead of the values given in table. 2.

Расстояние между атомными центрами двух атомов, связанных ковалентной связью, выражено в виде суммы радиусов их ковалентных связей. Радиусы ковалентных связей изменяются с изменением порядка связи в виде атомов. Примеры подходящих величин радиусов приведены в табл. 3. Как первое приближение предполагается, что длина связи фиксирована (т.е. игнорируются вибрации связей). Допускается вращение связей, и для выборки представительных ротационных состояний требуются многочисленные конфигурации одной и той же структуры. Стабильность конфигураций не рассматривается, поскольку связывание с виртуальным рецептором может стабилизировать энергетически нестабильные конфигурации. Для образования лигандов мишеней можно применять различные алгоритмы минимизации энергии.The distance between the atomic centers of two atoms linked by a covalent bond is expressed as the sum of the radii of their covalent bonds. The radii of covalent bonds change with a change in the order of the bonds in the form of atoms. Examples of suitable radii are given in table. 3. As a first approximation, it is assumed that the bond length is fixed (ie, vibration of the bonds is ignored). Rotation of bonds is allowed, and multiple configurations of the same structure are required to select representative rotational states. Configuration stability is not considered, since binding to a virtual receptor can stabilize energetically unstable configurations. For the formation of target ligands, various energy minimization algorithms can be used.

Электрические заряды, обусловленные дипольными моментами связей, считаются локализованными в атомных ядрах. Отрицательный заряд переносится атомом с большей величиной электроотрицательности. Величины диполей, используемые в данном случае, приведены в табл. 4. Вместо величин, указанных в табл. 4, можно использовать другие величины диполей.Electric charges due to dipole moments of bonds are considered localized in atomic nuclei. A negative charge is carried by an atom with a greater magnitude of electronegativity. The dipole values used in this case are given in table. 4. Instead of the values indicated in the table. 4, other dipole values may be used.

(3) Презентация мишеней(3) Presentation of targets

Сродство каждой мишени к моделированному рецептору(ам) испытывается для нескольких ориентаций мишени относительно верхней поверхности рецептора. Верхняя поверхность определяется алгоритмом сдвига. Перед оценкой сродства к связыванию мишень и рецептор должны быть приведены в контакт. Контакт возникает, когда расстояние между центрами, по меньшей мере, одной субъединицы рецептора и, по меньшей мере, одним атомом мишени равно их объединенным радиусам Ван дер Ваальса. Для того чтобы определить относительные положения мишени и рецептора в точке контакта, мишень перемещают с приращением по направлению к поверхности рецептора вдоль траектории, перпендикулярной поверхности и проходящей через геометрические центры и рецептора, и мишени. При возникновении контакта мишень достигает положения коллизии с рецептором. Перемещенные атомы мишени, когда достигается положение коллизии, используются для расчета расстояний между атомами мишени и субъединицами рецептора. Эти расстояния используются для определения силы электростатических взаимодействий и проксимальности.The affinity of each target for the simulated receptor (s) is tested for several target orientations relative to the upper surface of the receptor. The upper surface is determined by the shift algorithm. Before evaluating the binding affinity, the target and receptor must be brought into contact. Contact occurs when the distance between the centers of at least one receptor subunit and at least one target atom is equal to their combined van der Waals radii. In order to determine the relative positions of the target and the receptor at the contact point, the target is moved incrementally towards the surface of the receptor along a path perpendicular to the surface and passing through the geometric centers of both the receptor and the target. When contact occurs, the target reaches a position of collision with the receptor. The moved target atoms, when the collision position is reached, are used to calculate the distances between the target atoms and the receptor subunits. These distances are used to determine the strength of electrostatic interactions and proximality.

В данном случае предполагается, что мишень перемещается по прямой линии по направлению к рецептору и сохраняет свою начальную ориентацию в момент контакта. Альтернативный подход позволил бы мишени менять свою ориентацию с приращением по мере приближения к рецептору таким образом, чтобы положение максимального сродства достигалось в точке контакта. Хотя этот метод функционально подобен используемому, он гораздо более сложен для вычислений. В данном случае многочисленные ориентации испытывают при использовании более простого вычислительного аппарата. Данный метод предусматривает регулируемое замещение траектории вдоль оси х и/или у рецептора для размещения более крупных молекул. Это требуется для повышения селективности, когда на одном и том же рецепторе испытывают молекулы, отличающиеся по размеру.In this case, it is assumed that the target moves in a straight line towards the receptor and retains its initial orientation at the moment of contact. An alternative approach would allow the target to change its orientation incrementally as it approaches the receptor so that the position of maximum affinity is reached at the point of contact. Although this method is functionally similar to that used, it is much more complicated to compute. In this case, multiple orientations are tested using a simpler computing device. This method provides for controlled displacement of the trajectory along the x axis and / or at the receptor to accommodate larger molecules. This is required to increase selectivity when molecules of different sizes are tested on the same receptor.

Перед определением положения соприкосновения ориентация мишени рандомизируется случайным вращением с приращением в 6° вокруг каждой из х, у и ζ-осей. Можно использовать большие или меньшие величины приращения. В данной серии испытаний каждая из этих случайных ориентаций мишени является единственной. Надежность процесса оптимизации зависит от числа ориентаций используемой мишени, а также от числа оцениваемых соединений мишеней. Пример осуществления способа презентации мишеней показан в модуле 3.Before determining the contact position, the target orientation is randomized by random rotation with an increment of 6 ° around each of the x, y, and ζ axes. You can use larger or smaller increment values. In this test series, each of these random target orientations is unique. The reliability of the optimization process depends on the number of orientations of the target used, as well as on the number of estimated target compounds. An example implementation of the method of target presentation is shown in module 3.

(4) Расчет сродства(4) Calculation of affinity

Стратегия аппроксимации.Approximation Strategy.

Данный вариант осуществления способа основан на упрощенной аппроксимации, которая сводится к оценке основных компонентов, участвующих в связывании, с использованием сравнительно простого вычислительного аппарата. Аппроксимация описана в следующих разделах. Однако специалистам очевидно, что можно использовать более точные методы расчета, которые позволяют получить более точное значение сродства. Известные пакеты программ для определения более точных значений сродства могут быть использованы в данном способе.This embodiment of the method is based on a simplified approximation, which boils down to assessing the main components involved in the binding using a relatively simple computing device. Approximation is described in the following sections. However, it will be apparent to those skilled in the art that more accurate calculation methods can be used that provide a more accurate affinity value. Known software packages for determining more accurate affinity values can be used in this method.

Исследования краун-эфиров показывают, что распределение электронной плотности малых молекул можно использовать для описания электронных плотностей соединений с большими молекулами (Втишпд, Н. Гпб Рей, Ό. (1991) 1. Сошти!. Сйеш. 12:1). Для определения распределения строго локальных зарядов, характеризующихся зарядом и дипольным моментом, можно использовать метод (НйзйГеМ, Р.Ь. (1977) Тйеот. Сйеш. Ас!а 44:129). Результатом является распределение общей электронной плотности молекулы на перекрывающиеся атомные части, размеры которых связаны с радиусами свободных атомов.Studies of crown ethers show that the electron density distribution of small molecules can be used to describe the electron densities of compounds with large molecules (Vtishpd, N. GPB Rey, Ό. (1991) 1. Sosti !. Seyes. 12: 1). To determine the distribution of strictly local charges, characterized by a charge and a dipole moment, the method can be used (NyzGeM, R.L. (1977) Tjeot. Sjes. As! A 44: 129). The result is a distribution of the total electron density of the molecule into overlapping atomic parts whose dimensions are related to the radii of free atoms.

На примере краун-эфиров можно показать, что основные компоненты электростатического взаимодействия определяются скорее местным, чем глобальным перемещением зарядов между атомами. Распределение зарядов в основном распределяется эффектом небольших интервалов, обусловленным различными химическими связями. В частности, не являющиеся соседними атомы вносят небольшой вклад в дипольные моменты атомов. Кроме того, хотя на передачу зарядов между атомами также влияет электростатическое поле всей молекулы, расчеты для краун-эфиров показывают только очень небольшое влияние на распределение зарядов.On the example of crown ethers, it can be shown that the main components of the electrostatic interaction are determined more by local rather than global movement of charges between atoms. The charge distribution is mainly distributed by the effect of small intervals due to various chemical bonds. In particular, non-neighboring atoms make a small contribution to the dipole moments of atoms. In addition, although the transfer of charges between atoms is also affected by the electrostatic field of the whole molecule, calculations for crown ethers show only a very small effect on the distribution of charges.

Определенные величины атомных зарядов и дипольных моментов могут быть использованы для описания электростатического взаимодействия (Втишпд, Н. Гпб Рей, Ό. (1991) 1. Сотги!. Сйет. 12:1). Помимо радиуса Ван дер Ваальса, только небольшой вклад вносят атомные квадрупольные моменты. Расчет электростатического потенциала, который учитывает только атомные заряды, дает очень плохие результаты, в то время как использование дипольных моментов позволяет получить более точные величины.Certain quantities of atomic charges and dipole moments can be used to describe the electrostatic interaction (Vtishpd, N. GPB Rey, Ό. (1991) 1. Sotgi !. Set. 12: 1). In addition to the radius of van der Waals, only a small contribution is made by atomic quadrupole moments. The calculation of the electrostatic potential, which takes into account only atomic charges, gives very poor results, while the use of dipole moments makes it possible to obtain more accurate values.

На основании этих рассуждений можно сказать, что метод по данному изобретению использует аппроксимацию сродства между лигандом мишени и моделированным рецептором(ами), созданными на основе двух величин.Based on these considerations, we can say that the method according to this invention uses an approximation of the affinity between the target ligand and the simulated receptor (s), created on the basis of two values.

. Величина электростатических сил, действующих между заряженными субъединицами моделированного рецептора(ов) и атомными диполями лиганда мишени (химической структуры). Предполагается, что поскольку заряженные субъединицы переносят непередающиеся единичные заряды, величина этих сил прямо пропорциональна величине атомного диполя и обратно пропорциональна расстоянию между моделированным рецептором и атомным диполем лиганда.. The magnitude of the electrostatic forces acting between the charged subunits of the simulated receptor (s) and the atomic dipoles of the target ligand (chemical structure). It is assumed that since charged subunits transfer non-transferring unit charges, the magnitude of these forces is directly proportional to the magnitude of the atomic dipole and inversely proportional to the distance between the simulated receptor and the atomic dipole of the ligand.

2. Отношение неполярных или незаряженных субъединиц моделированного рецептора, достаточно близких к неполярным участкам лиганда для образования значительных дискретных сил Лондона.2. The ratio of non-polar or uncharged subunits of the simulated receptor close enough to non-polar sections of the ligand for the formation of significant discrete forces in London.

Предположения, используемые для расчета (определения) сродства согласно данному варианту осуществления способа.Assumptions used to calculate (determine) affinity according to this embodiment of the method.

. Предполагается, что химические субстраты-мишени, исследуемые согласно данному способу, являются нейтральными (т.е. неионизированными) молекулами. Это произвольное ограничение, но одну и ту же методику можно использовать для заряженных и незаряженных мишеней.. It is assumed that the chemical target substrates studied according to this method are neutral (i.e. non-ionized) molecules. This is an arbitrary restriction, but the same technique can be used for charged and uncharged targets.

2. Предполагается, что дипольные моменты локализованы в атомных ядрах. Аналогичное определение сродства можно провести, предположив, что дипольный момент находится на ковалентной связи. Согласно АШпдйат е! а1. (1989), эти предположения функционально эквивалентны.2. It is assumed that dipole moments are localized in atomic nuclei. A similar definition of affinity can be made by assuming that the dipole moment is in a covalent bond. According to AShdyat e! a1. (1989), these assumptions are functionally equivalent.

3. Предполагается, что окружающая виртуальный рецептор среда представляет собой растворитель, в котором растворена мишень. Мишень распределена между растворителем и виртуальным рецептором.3. It is assumed that the environment surrounding the virtual receptor is a solvent in which the target is dissolved. The target is distributed between the solvent and the virtual receptor.

4. Предполагается, что в момент определения сродства мишень и рецептор являются неподвижными по отношению друг к другу и находятся в специфической фиксированной ориентации.4. It is assumed that at the time of determining the affinity, the target and receptor are motionless in relation to each other and are in a specific fixed orientation.

5. Предполагается, что мишени взаимодействуют только с двумя типами сайта на поверхности рецептора: сайтами с фиксированными зарядами (положительно или отрицательно заряженные) и неполярными сайтами.5. It is assumed that targets interact only with two types of sites on the receptor surface: sites with fixed charges (positively or negatively charged) and non-polar sites.

На основе этих предположений необходимо только рассмотреть следующие факторы, которые вносят вклад в величину силы взаимодействия.Based on these assumptions, it is only necessary to consider the following factors that contribute to the magnitude of the interaction force.

1. Заряд-диполь -О2ц2/6(4пе)2кТг4 1. A charge-dipole -O 2 q 2/6 (4ne) 2 4 CTG

2. Заряд-неполярный -ф2а/2(4пе)2г4 2. Charge-nonpolar ip 2 a / 2 (4ne) 2 g 4

3. Диполь-неполярный (энергия Дебая) -ц2о/(4пе)2г6 3. Dipole-non-polar (Debye energy) -ts 2 o / (4pe) 2 g 6

4. Неполярный-неполярный (энергия Лондона) -.75[йуа2/4пе)2г6]4. Non-polar-non-polar (energy of London) -.75 [yua 2 / 4pe) 2 g 6 ]

Согласно данному методу при аппроксимации рассматриваются только относительные силы, следовательно, пренебрегают всеми константами. Кроме того, предполагается, что сайт с фиксированным зарядом является унитарным и или положительно, или отрицательно заряженным. Основываясь на этом, можно представить вышеприведенные выражения в следующем упрощенном виде:According to this method, only relative forces are considered in the approximation; therefore, all constants are neglected. In addition, it is assumed that the site with a fixed charge is unitary and either positively or negatively charged. Based on this, we can present the above expressions in the following simplified form:

1. Заряд-диполь -ц24 или -μ/г2 1. Charge-dipole -ts 2 / g 4 or -μ / g 2

2. Заряд-неполярный -α/г4 2. Charge-non-polar -α / g 4

3. Диполь-неполярный (энергия Дебая) μ2α/τ6 или -μα'53 3. Dipole-non-polar (Debye energy) μ 2 α / τ 6 or -μα ' 5 / Γ 3

4. Неполярный-неполярный (энергия Лондона) -а26 или -α/г3 4. Non-polar-non-polar (London energy) -a 2 / g 6 or -α / g 3

В общем факторы 2 и 3 вносят только незначительный вклад во взаимодействие. Однако факторы 1 и 4 значительно влияют на величину энергии взаимодействия. Согласно данной методике предполагается, что большая часть взаимодействий между неполярными фрагментами происходит между смежными алкильными группами и водородами ароматических соединений и неполярными субъединицами рецептора. Предполагается, что при этих условиях величина α является постоянной.In general, factors 2 and 3 make only a small contribution to the interaction. However, factors 1 and 4 significantly affect the magnitude of the interaction energy. According to this technique, it is assumed that most of the interactions between non-polar fragments occur between adjacent alkyl groups and the hydrogens of aromatic compounds and non-polar subunits of the receptor. It is assumed that under these conditions the value of α is constant.

Вклад гидрофобной силы и исключения воды.Contribution of hydrophobic strength and exclusion of water.

При определении сродства к связыванию важное значение имеют эффекты сольватации. Например, образование гидрофобной связи основывается на близкой пространственной ассоциации неполярных гидрофобных групп, при этом контакт между гидрофобными участками и молекулами воды уменьшается до минимума. Вклад образования гидрофобной связи равен половине величины общей прочности связей антитело-антиген. Г идратация поверхностей рецептора и субстрата также является значительным фактором. Вода, связанная с полярными сайтами поверхности рецептора или субстрата, может влиять на связывание или увеличивать сродство за счет образования поперечных мостиков между поверхностями.When determining the affinity for binding, solvation effects are important. For example, the formation of a hydrophobic bond is based on close spatial association of nonpolar hydrophobic groups, while the contact between the hydrophobic sites and water molecules is reduced to a minimum. The contribution of the formation of a hydrophobic bond is equal to half the total strength of the antibody-antigen bonds. Hydration of the surfaces of the receptor and substrate is also a significant factor. Water bound to the polar sites on the surface of the receptor or substrate can affect binding or increase affinity due to the formation of transverse bridges between the surfaces.

Гидрофобное взаимодействие характеризует сильное притяжение между гидрофобными молекулами в воде. В случае взаимодействий рецептор-мишень следует указать на притяжение между неполярными фрагментами мишени и соседних доменов субъединиц неполярных рецепторов. Эффект появляется в основном вследствие энтропийных факторов, приводящих к перестройке поверхностей с исключением наличия воды между соседними неполярными доменами. Точные теоретические обоснования гидрофобного взаимодействия отсутствуют, однако, установлено, что вклад гидрофобных сил составляет до 50% от величины силы притяжения между антителами и антигенами. Для определения гидрофобного взаимодействия между мишенями и виртуальными рецепторами данная методика предусматривает оценку части рецептора, которая эффективно защищена от сольватирования за счет связывания с мишенью. Считается, что все неполярные (незаряженные) субъединицы, которые находятся не далее фиксированного расстояния неполярных атомов мишени, защищены от сольватирования молекулами растворителя, диаметр которых равен или больше лимитирующего расстояния.Hydrophobic interaction characterizes a strong attraction between hydrophobic molecules in water. In the case of receptor-target interactions, the attraction between nonpolar fragments of the target and neighboring domains of non-polar receptor subunits should be noted. The effect appears mainly due to entropic factors leading to the rearrangement of surfaces with the exception of the presence of water between neighboring non-polar domains. There are no exact theoretical grounds for hydrophobic interaction; however, it has been established that the contribution of hydrophobic forces is up to 50% of the magnitude of the attractive force between antibodies and antigens. To determine the hydrophobic interaction between targets and virtual receptors, this technique involves the assessment of a portion of the receptor that is effectively protected from solvation by binding to the target. It is believed that all non-polar (uncharged) subunits that are no further than a fixed distance of non-polar target atoms are protected from solvation by solvent molecules whose diameter is equal to or greater than the limiting distance.

Расчет общего сродства.Calculation of total affinity.

Расчет общего сродства, используемый в данном методе, сочетает два компонента взаимодействия: суммарные силы взаимодействия заряд-диполь и величина близости. Предполагается, что в данном случае эти оба фактора являются изотропными. Специалистам в данной области очевидно, что можно получить большую степень разрешения, если используются анизотропные определения сродства, хотя вычисления при этом гораздо сложнее.The calculation of the total affinity used in this method combines two components of the interaction: the total charge-dipole interaction forces and the proximity value. It is assumed that in this case, both of these factors are isotropic. It will be apparent to those skilled in the art that a greater degree of resolution can be obtained if anisotropic affinity determinations are used, although the calculations are much more complicated.

Взаимодействие заряд-диполь рассчитывается как Э=Тр|/г||''. где μ^дипольный момент ίго атома мишени и рурасстояние между ί-им атомом и _)-им сайтом заряда на рецепторе, и коэффициент ν может быть 2, 3 или 4. Вклад Ό в величину общего сродства более чувствителен к разделению зарядов для больших величин ν.The charge-dipole interaction is calculated as E = Tr | / g || ''. where μ ^ is the dipole moment of the ίth target atom and the distance between the ίth atom and _) is their charge site on the receptor, and the coefficient ν can be 2, 3, or 4. The contribution of Ό to the total affinity is more sensitive to charge separation for large quantities ν.

Мера проксимации определяется как Ρ=Ση1/Ν, где п1=числу незаряженных субъединиц рецептора, которые определены максимальным расстоянием д от ί-го атома мишени с дипольным моментом <0,75 Дебая. В данном методе д может колебаться от 1 до 4 диаметров субъединицы (эта величина приближается к вандерваальсовому радиусу воды). Ν обозначает общее количество субъединиц, образующих рецептор.The proximation measure is defined as Ρ = Ση 1 / Ν, where n 1 = the number of uncharged receptor subunits, which are determined by the maximum distance d from the ί-th target atom with a dipole moment <0.75 Debye. In this method, q can vary from 1 to 4 diameters of the subunit (this value approaches the van der Waals radius of water). Ν indicates the total number of subunits forming the receptor.

Величина сродства А рассчитывается по величинам Ό и Р с использованием следующего уравнения Α=[Ρ(Ό+ΝΡ/Κ)]0,5, где к обозначает константу соответствия (в данном случае к=1 0000). Величина Р в уравнении играет две роли. В первом случае это весомый фактор. Как мера высокой степени соответствия она используется для того, чтобы перевесила величина сродства в отношении тех конфигураций, в которых неполярные участки мишени и рецептора находятся в тесном контакте. В этих условиях величины энергии гидрофобных взаимодействий будут большими и будут значительно влиять на стабильность и силу связи. В этих условиях у мишени имеется меньше возможных траекторий для того, чтобы избежать контакта, и время ее удержания будет больше. Во втором случае Р используется для оценки вклада энер19 гии дисперсии в силу взаимодействия. Предполагается, что энергия дисперсии будет значительной только для незаряженных, неполярных сайтов и что она значительна только тогда, когда мишень и рецептор близки друг другу (т.е. когда расстояние между ними меньше д). Величины к и д могут быть подобраны так, чтобы возможно было изменить относительный вклад Р и Ό. В общем Р доминирует в случае неполярных мишеней, а Ό более значительна для мишеней с большими локальными диполями. Связывание водорода аппроксимируется спаренными отрицательно и положительно заряженными единицами рецептора, одновременно взаимодействующими с гидроксильными, карбоксильными или аминными группами мишени.The affinity value A is calculated from the values of Ό and P using the following equation Α = [Ρ (Ό + ΝΡ / Κ)] 0.5 , where k denotes the correspondence constant (in this case, k = 1 0000). The value of P in the equation plays two roles. In the first case, this is a significant factor. As a measure of high degree of conformity, it is used to outweigh the magnitude of affinity for those configurations in which the non-polar portions of the target and receptor are in close contact. Under these conditions, the energies of hydrophobic interactions will be large and will significantly affect the stability and strength of the bond. Under these conditions, the target has fewer possible trajectories in order to avoid contact, and its retention time will be longer. In the second case, P is used to estimate the contribution of the dispersion energy to the interaction force. It is assumed that the dispersion energy will be significant only for uncharged, non-polar sites and that it will be significant only when the target and receptor are close to each other (i.e., when the distance between them is less than d). The quantities k and q can be selected so that it is possible to change the relative contribution of P and Ό. In general, P dominates in the case of nonpolar targets, and Ό is more significant for targets with large local dipoles. Hydrogen binding is approximated by paired negative and positively charged receptor units, which simultaneously interact with the hydroxyl, carboxyl or amine groups of the target.

Альтернативные подходы к определению сродства-поляризуемости связи.Alternative approaches to determining the affinity-polarizability of a bond.

В некоторых случаях в методику определения сродства может быть предпочтительным ввести параметр, соответствующий относительной поляризуемости атомов мишени. В этом случае уравнение для расчета Р2 в равенстве Α=[Ρ(Ό+ΝΡ2/Ε)]0·5 не является: Ρ2=Ση1/Ν. Вместо этого Р2 рассчитывается по уравнению Р2=Σα1η1/N, где п1=числу заряженных или незаряженных субъединиц рецептора, которые определены максимальным расстоянием д от ί-го атома мишени, и обозначает относительную поляризуемость ί-го атома мишени. Для простоты аН для алифатического водорода принимается равной 1,0. Величина к должна быть подобрана, если используются поляризуемости. Величины поляризуемостей на основе сумм поляризуемостей соседних связей приведены в табл. 5.In some cases, it may be preferable to introduce into the affinity determination method a parameter corresponding to the relative polarizability of the target atoms. In this case, the equation for calculating P 2 in the equality Α = [Ρ (Ό + ΝΡ 2 / Ε)] 0 · 5 is not: Ρ 2 = Ση 1 / Ν. Instead, P 2 is calculated by the equation P 2 = Σα 1 η 1 / N, where n 1 = the number of charged or uncharged receptor subunits, which are determined by the maximum distance d from the ίth atom of the target, and denotes the relative polarizability of the ίth atom of the target. For simplicity, a H for aliphatic hydrogen is taken to be 1.0. The value of k must be selected if polarizability is used. The values of polarizabilities based on the sums of polarizabilities of neighboring bonds are given in table. 5.

Поскольку поляризуемость связана со смещением электронного облака, поляризуемость молекулы может быть рассчитана как сумма поляризуемостей её ковалентных связей. Эта аддитивность действует для неароматических молекул, которые не имеют делокализованных электронов.Since the polarizability is related to the displacement of the electron cloud, the polarizability of a molecule can be calculated as the sum of the polarizabilities of its covalent bonds. This additivity is valid for non-aromatic molecules that do not have delocalized electrons.

Альтернативная методика-специфичность функциональных групп.An alternative technique is the specificity of functional groups.

Аппроксимация сродства, используемая в данном случае, может быть заменена функционально сходными вычислениями, при которых сохраняется отношение между локальными зарядами, дисперсионной энергией и расстоянием мишень-рецептор. Кроме того, могут быть определены величины сродства для заряженных мишеней. Данный метод оценивает только нековалентные взаимодействия, однако, метод может быть расширен при включении в виртуальный рецептор субъединиц, способных к реакциям образования специфичных ковалентных связей с выбранными функциональными группами мишени. Модуль 5 отражает пример схемы предпочтительного расчета эффективного сродства, используемого в данном изобретении.The affinity approximation used in this case can be replaced by functionally similar calculations, in which the relation between local charges, dispersion energy, and the target – receptor distance is preserved. In addition, affinity values for charged targets can be determined. This method evaluates only non-covalent interactions; however, the method can be expanded by including subunits capable of forming specific covalent bonds with selected functional groups of the target in the virtual receptor. Module 5 reflects an example of a preferred affinity calculation scheme used in the present invention.

(5) Оценка селективного сродства(5) Assessment of selective affinity

Высокая степень соответствия между виртуальным рецептором и рядом субстратовмишеней оценивается при сравнении величины известной активности или сродства для мишеней с величинами, полученными для комплекса виртуальный рецептор-мишень. Максимальные величины сродства оптимального виртуального рецептора должны быть скоррелированы с известными величинами сродства. Последовательные повторения эволюционного процесса могут быть использованы для повышения степени этой корреляции (фиг. 3).A high degree of correspondence between the virtual receptor and a number of target targets is estimated by comparing the values of the known activity or affinity for the targets with the values obtained for the virtual receptor-target complex. The maximum affinity values of the optimal virtual receptor should be correlated with known affinity values. Successive repetitions of the evolutionary process can be used to increase the degree of this correlation (Fig. 3).

Известными величинами могут быть любой показатель, который зависит (или предполагается, что зависит) от сродства к связыванию, включая (не ограничивая) ЕИ50, ГО50, сродство к связыванию и величины когезии. Испытуемые величины должны быть положительными. Может потребоваться логарифмическая трансформация данных. Нельзя использовать необоснованно ранжированные данные.Known values can be any indicator that depends (or is assumed to depend) on the affinity for binding, including (without limitation) EI 50 , GO 50 , affinity for binding, and cohesion values. The test values should be positive. Logarithmic data transformation may be required. You cannot use unreasonably ranked data.

Оптимальная ориентация мишеней для достижения максимального сродства к связыванию до опытов неизвестна. Для того чтобы получить репрезентативную величину значений сродства рецептора к мишени, каждую мишень следует испытать повторно, используя различные случайные ориентации относительно поверхности рецептора. В каждом опыте для оценки сродства используется Модуль 4. В общем, надежность полученных величин максимального сродства зависит от размера образца, так как возрастает вероятность того, что образец будет характеризоваться подлинной максимальной величиной. Тот же набор ориентаций мишени используется для испытания каждого рецептора.The optimal target orientation to achieve maximum binding affinity is unknown prior to the experiments. In order to obtain a representative value of the receptor affinity for the target, each target should be retested using various random orientations relative to the surface of the receptor. In each experiment, Module 4 is used to evaluate affinity. In general, the reliability of the obtained maximum affinity values depends on the size of the sample, since it increases the likelihood that the sample will have a true maximum value. The same set of target orientations is used to test each receptor.

В данном способе используются две методики для того, чтобы избежать необходимости в наличии большого набора образцов для генерирования оптимизированных рецепторов: 1 ) использование метода измерения, объединяющего среднее (или суммарное) сродство и максимальное сродство для выбора рецепторов с более высокой селективностью; и 2) увеличение с приращением числа ориентаций, изучаемых с последовательными изменениями процесса оптимизации (оптимизация начинается с небольшого числа ориентаций мишени, как только генерируются рецепторы с высокой степенью соответствия, испытывается большее число ориентаций).This method uses two techniques in order to avoid the need for a large set of samples to generate optimized receptors: 1) using a measurement method that combines the average (or total) affinity and maximum affinity for selecting receptors with higher selectivity; and 2) an increase in increments in the number of orientations studied with successive changes in the optimization process (optimization begins with a small number of target orientations, as soon as receptors with a high degree of correspondence are generated, a greater number of orientations are tested).

В соответствии с данным методом определяется сумма величин сродства, полученных для всех испытанных ориентаций каждой мишени. Эта степень суммарного сродства является мерой средней величины сродства между рецептором и мишенью. В то же самое время также определяется величина максимального сродства.In accordance with this method, the sum of the affinity values obtained for all tested orientations of each target is determined. This degree of total affinity is a measure of the average magnitude of affinity between the receptor and the target. At the same time, the maximum affinity is also determined.

Рассматривается корреляция между известными значениями и как суммарным сродст21 вом, так и максимальным сродством, чтобы получить гЗА 2 и гМА 2 соответственно. Исходная точка (0,0) включена в корреляцию на основе предположения, что соединения-мишени, не проявляющие никакой активности, должны обладать небольшим сродством к виртуальному рецептору или не обладать сродством совсем. Это предположение не может быть всегда достоверным, и в некоторых опытах могут потребоваться другие величины.A correlation between the known values and how total srodst21 CMV and maximal affinity to receive FOR g 2 and g 2, respectively MA. The starting point (0,0) is included in the correlation based on the assumption that target compounds that do not exhibit any activity should have little affinity for the virtual receptor or not have affinity at all. This assumption cannot always be reliable, and in some experiments other quantities may be required.

Корреляция суммарного сродства является мерой средней степени соответствия. Если эта корреляция значительна, а корреляция между максимальным сродством и известным сродством незначительна, результат предполагает, что виртуальный рецептор не является селективным, т.е. многочисленные ориентации мишени могут эффективно взаимодействовать с рецептором. Наоборот, если максимальное сродство коррелируется в значительной степени с известными величинами сродства и корреляция суммарного сродства мала, виртуальный рецептор может быть высоко селективным. Если и суммарное сродство, и максимальное сродство в значительной степени коррелируется с известным сродством, вероятно, что ориентации образцов идентифицировали характеристики реакции рецептора с ограниченными погрешностями (уменьшаются ошибки типа I и типа II: сходство неверного положительного или неверного отрицательного результата). В некоторых случаях может быть целесообразным свести к минимуму корреляцию между известными величинами сродства и величиной суммарного сродства, в то же время выбирая повышенную степень корреляции между максимальным сродством и известной величиной сродства. Такой выбор потребует вычитания максимального сродства из общей суммы, чтобы исключить эти величины, как неоднозначные.Correlation of total affinity is a measure of average degree of compliance. If this correlation is significant, and the correlation between the maximum affinity and the known affinity is insignificant, the result suggests that the virtual receptor is not selective, i.e. multiple target orientations can efficiently interact with the receptor. Conversely, if the maximum affinity is largely correlated with known affinity values and the correlation of the total affinity is small, the virtual receptor can be highly selective. If both the total affinity and the maximum affinity are significantly correlated with the known affinity, it is likely that the orientation of the samples identified the response characteristics of the receptor with limited errors (errors of type I and type II are reduced: the similarity of an incorrect or negative result). In some cases, it may be appropriate to minimize the correlation between the known affinity values and the total affinity value, at the same time choosing an increased degree of correlation between the maximum affinity and the known affinity value. Such a choice will require subtracting the maximum affinity from the total to exclude these values as ambiguous.

Согласно данному методу используется величина объединенной корреляции на основе выбора селекции. Эта величина определяется как квадратный корень произведения суммарного сродства и максимального сродстваAccording to this method, the value of the combined correlation based on the selection selection is used. This value is defined as the square root of the product of total affinity and maximum affinity

Р=(Тма2 X Т3А2)0·5 P = (Tma 2 X T 3 A 2 ) 0 · 5

Эта величина оптимизируется в эволюционном процессе, применяемом для виртуальных рецепторов. Примечание: Если гМА 2 и гЗА2 коррелируются в значительной степени друг с другом, тогда величины, влияющие на гза2, должны или индивидуально коррелироваться с величиной максимального сродства, или незначительно влиять на суммарную величину. Помимо этого может быть рассчитана корреляция (гза-ма) для зависимости величины (суммарное сродство - максимальное сродство) от известной величины сродства и критерийThis value is optimized in the evolutionary process used for virtual receptors. Note: If r MA 2 and rza 2 are correlated to a large extent with each other, then the values affecting rza 2 should either individually correlate with the maximum affinity or slightly affect the total value. In addition, a correlation (g z -ma ) can be calculated for the dependence of the value (total affinity - maximum affinity) on the known affinity value and the criterion

Р=(Гма2 X (1-Тза-ма2))05 максимизирован. Использование этого критерия позволяет выбрать рецепторы, которые имеют высокое сродство к очень ограниченному набору ориентаций мишени. Модуль 5 иллюстрирует схему расчета степени соответствия образца.P = (Gma 2 X (1-Tza-ma 2 )) 0 ' 5 maximized. Using this criterion allows you to select receptors that have a high affinity for a very limited set of target orientations. Module 5 illustrates a scheme for calculating the degree of conformity of a sample.

(6) Процесс оптимизации(6) Optimization process

Цель процесса оптимизации заключается в выявлении виртуального рецептора, который имеет селективное сродство к набору мишеней. Требуется высокоэффективный механизм нахождения решений, так как общее число возможных генотипов, содержащих 300 команд, равно 7 или примерно 10 . Следующие четыре фазы суммируют стадии процесса оптимизации, причем каждая фаза обсуждается более подробно с приведением примеров расчетов.The goal of the optimization process is to identify a virtual receptor that has a selective affinity for a set of targets. A highly efficient mechanism for finding solutions is required, since the total number of possible genotypes containing 300 teams is 7 or about 10. The following four phases summarize the stages of the optimization process, with each phase being discussed in more detail with examples of calculations.

Фаза 1: Генерировать набор произвольных генотипов и осуществить поиск минимального уровня активности. Использовать выбранный генотип как основу для дальнейшей оптимизации с использованием генетического алгоритма (рекомбинация) и методики однонаправленной мутации.Phase 1: Generate a set of arbitrary genotypes and search for a minimum level of activity. Use the selected genotype as a basis for further optimization using a genetic algorithm (recombination) and a unidirectional mutation technique.

Фаза 2: Осуществить мутацию выбранного генотипа с получением селекционной популяции отличающихся друг от друга, но родственных генотипов для рекомбинаций. Выбрать самые селективные мутанты из популяции для рекомбинации.Phase 2: Carry out a mutation of the selected genotype to obtain a breeding population that differ from each other, but related genotypes for recombination. Select the most selective mutants from the population for recombination.

Фаза 3: Осуществить генерирование новых генотипов путем рекомбинации селективных мутантов. Выбрать из полученных генотипов те, которые проявляют самую высокую степень соответствия. Использовать эту субпопуляцию для последующего рекомбинантного или мутационного генерирования.Phase 3: Generate new genotypes by recombination of selective mutants. Choose from the obtained genotypes those that show the highest degree of compliance. Use this subpopulation for subsequent recombinant or mutational generation.

Фаза 4: Выбрать лучшие продукты рекомбинации и осуществить повторные точечные мутации для увеличения селективности.Phase 4: Select the best recombination products and repeat point mutations to increase selectivity.

Фаза 1 : Эволюция-генерирование первичного кода.Phase 1: Evolution-generation of primary code.

Для поиска оптимальных решений многих проблем может быть использован генетический алгоритм, разработанный Но11апб (Но11апб, ТН. (1975) Абар1айоп ίη Иа1ига1 апб АгППс1а1 8у§1сш5. и. МюЫдап Рте88. Апп АтЬоит). Обычно эта методика применяется для большого числа первоначально произвольных решений. При осуществлении данного метода методику значительно изменили для того, чтобы уменьшить число испытаний и итераций, требующихся для нахождения виртуальных рецепторов с высокой селективностью. Это изменение осуществили путем использования набора родственных генотипов в качестве первоначальной популяции и применения высоких скоростей мутации при каждой итерации. Для любого набора соединений-мишеней можно создать различные рецепторы с оптимальными величинами сродства. Например, рецепторы могут оптимально связываться с одними и теми же мишенями, но в разных ориентациях. Использование первоначальной популяции близкородственных генотипов увеличивает вероятность того, что процесс оп23 тимизации сведётся к одному решению. Рекомбинация неродственных генотипов, хотя и может привести к образованию новых генотипов с повышенной степенью соответствия, скорее приведет к различным решениям.To find optimal solutions to many problems, the genetic algorithm developed by Ho11apb (Ho11apb, TN. (1975) Abarlaiop ίη Иa1iga1 apb ArPPs1a1 8u§1ssh5. And. Myuyapd Rte88. App Atyoit) can be used. Typically, this technique is used for a large number of initially arbitrary decisions. When implementing this method, the technique was significantly changed in order to reduce the number of tests and iterations required to find virtual receptors with high selectivity. This change was made by using a set of related genotypes as the initial population and applying high mutation rates at each iteration. For any set of target compounds, various receptors with optimal affinity values can be created. For example, receptors can optimally bind to the same targets, but in different orientations. Using the initial population of closely related genotypes increases the likelihood that the optimization process will be reduced to one solution. The recombination of unrelated genotypes, although it may lead to the formation of new genotypes with an increased degree of correspondence, is more likely to lead to different solutions.

Цель первой стадии процесса оптимизации заключается в получении генотипа с минимальной степенью сродства к набору мишеней. Этот генотип затем используется для генерирования популяции родственных генотипов. Схема процесса генерирования генотипа с минимальной степенью сродства отражена в Модуле 6.The goal of the first stage of the optimization process is to obtain a genotype with a minimum degree of affinity for a set of targets. This genotype is then used to generate a population of related genotypes. The scheme of the genotype generation process with a minimal degree of affinity is reflected in Module 6.

Фаза 2: Эволюция-мутация первичного кода.Phase 2: Evolution-mutation of the primary code.

Мутация генотипа состоит в изменении одного или нескольких признаков кода. Согласно данному методу мутации не приводят к изменению числа субъединиц, образующих полимеры рецептора, и не влияют на длину генотипа. Ясно, что эти условия являются произвольными и понятно, что в некоторых системах могут использоваться другие варианты.A mutation of a genotype consists in changing one or more features of a code. According to this method, mutations do not lead to a change in the number of subunits forming the receptor polymers and do not affect the length of the genotype. It is clear that these conditions are arbitrary and it is clear that in some systems other options may be used.

Мутации могут изменить характер укладки фенотипа, приводя к изменению пространственной формы рецептора и расположения или экспозиции сайтов связывания. Мутации, влияющие на конфигурацию периферических участков фенотипа, могут привести к смещению центра рецептора относительно центра мишени.Mutations can change the pattern of phenotype folding, leading to a change in the spatial shape of the receptor and the location or exposure of the binding sites. Mutations that affect the configuration of the peripheral regions of the phenotype can lead to a shift in the center of the receptor relative to the center of the target.

Нейтральные мутации.Neutral mutations.

Все виды мутации приводят к изменению структуры фенотипа, однако, не все вызывают изменение функциональности рецептора. Такие нейтральные мутации могут вызывать изменение компонентов рецептора, которые не влияют на величину сродства. В некоторых случаях эти нейтральные мутации могут объединяться с последующими мутациями, что приводит к появлению синергичного эффекта.All types of mutations lead to a change in the structure of the phenotype, however, not all cause a change in the functionality of the receptor. Such neutral mutations can cause changes in the components of the receptor that do not affect the magnitude of the affinity. In some cases, these neutral mutations may combine with subsequent mutations, resulting in a synergistic effect.

Популяция для воспроизводства.Population for reproduction.

Цель второй фазы эволюционного процесса заключается в генерировании различных, но родственных генотипов, полученных из первичного генотипа. Затем члены этой популяции используются для генерирования рекомбинантов. Эта селекционная популяция создается путем множественной мутации первичного генотипа. Осуществляют трансляцию и скрининг полученного генотипа для достижения селективности. Продукты с наибольшей селективностью сохраняются для рекомбинации. Модуль 7 отражает схему процесса множественной мутации генотипа.The purpose of the second phase of the evolutionary process is to generate different but related genotypes derived from the primary genotype. The members of this population are then used to generate recombinants. This breeding population is created by multiple mutations of the primary genotype. The obtained genotype is translated and screened to achieve selectivity. Products with the highest selectivity are stored for recombination. Module 7 reflects a diagram of the process of multiple genotype mutations.

Фаза 3: Эволюция-рекомбинация.Phase 3: Evolution-recombination.

Цель рекомбинации состоит в создании новых генотипов с повышенной степенью соответствия. Рекомбинация облегчает сохранение фрагментов генотипа, которые существенны для соответствия фенотипа, причем в то же самое время она приводит к интродукции новых комбинаций команд. В общем рекомбинация в сочетании с результатами селекции приводит к быстрой оптимизации селективности. Модуль 8 иллюстрирует схему процесса рекомбинации генотипа.The purpose of recombination is to create new genotypes with an increased degree of correspondence. Recombination facilitates the preservation of fragments of the genotype, which are essential for phenotype matching, and at the same time it leads to the introduction of new combinations of teams. In general, recombination in combination with selection results leads to rapid optimization of selectivity. Module 8 illustrates a diagram of the process of recombination of a genotype.

Данный способ предусматривает сохранение популяции, использованной для рекомбинации, с целью испытаний на стадии 7 Модуля 8. Это приводит к тому, что генотипы с высокой селективностью не вытесняются генотипами с более низкой селективностью. Кроме того, мутации (Модуль 7) применяются для 50% рекомбинантных генотипов до испытаний (стадия 7 Модуль 8). Эта стадия приводит к вариабильности рекомбинантной популяции. Испытуемые популяции согласно данному методу могут насчитывать от 10 до 40 генотипов. Это популяция сравнительно небольшого размера. В некоторых условиях могут потребоваться популяции большего размера.This method provides for the preservation of the population used for recombination for testing in stage 7 of Module 8. This leads to the fact that genotypes with high selectivity are not replaced by genotypes with lower selectivity. In addition, mutations (Module 7) are used for 50% of the recombinant genotypes before testing (stage 7 Module 8). This stage leads to variability of the recombinant population. Test populations according to this method can have from 10 to 40 genotypes. This population is relatively small. In some circumstances, larger populations may be required.

Фаза 4: Эволюция-созревание.Phase 4: Evolution-maturation.

Методика прогрессивной микромутации.The method of progressive micromutation.

Заключительная стадия процесса оптимизации имитирует созревание антител в иммунной системе млекопитающего. К генотипу применяются серии единичных точечных мутаций и оценивается влияние на соответствие фенотипа. В отличие от рекомбинации этот процесс обычно приводит только к небольшим инкрементным изменениям в селективности фенотипа. Процесс созревания используется в эволюционной стратегии (1+1) Рехенберга (РесНепЬегд, I. (1973), Еуо1ийоп881га1ед1е. Р. Ртоттаии. δΙηΙΙдай). При каждом генерировании соответствие генотипа предшественника сравнивается с соответствием его продукта мутации, и для следующего генерирования сохраняется генотип с большей селективностью. В результате этот процесс является строго однонаправленным, так как менее селективные мутанты не замещают своих предшественников. Модуль 9 отражает схему примера созревания генотипа (этот пример не является ограничивающим).The final stage of the optimization process mimics the maturation of antibodies in the mammalian immune system. A series of single point mutations are applied to the genotype and the effect on phenotype compliance is evaluated. In contrast to recombination, this process usually leads only to small incremental changes in the phenotype selectivity. The ripening process is used in the evolutionary strategy of (1 + 1) Rechenberg (ResNepbegd, I. (1973), Euphorbiaceae r. Rottottai. ΔΙηΙΙ give). With each generation, the correspondence of the precursor genotype is compared with the correspondence of its mutation product, and for the next generation, the genotype is preserved with greater selectivity. As a result, this process is strictly unidirectional, since less selective mutants do not replace their predecessors. Module 9 reflects the outline of an example of genotype maturation (this example is not limiting).

Во время каждой итерации процесса созревания изменяется только одна команда кода. Если предшественник и продукт его мутации обладают одной и той же селективностью, предшественник заменяется его продуктом в следующем поколении. Этот метод приводит к аккумуляции нейтральных мутаций, которые могут давать синергичный эффект в сочетании с последующими мутациями. Это условие является произвольным.During each iteration of the ripening process, only one code command changes. If the precursor and the product of its mutation have the same selectivity, the precursor is replaced by its product in the next generation. This method leads to the accumulation of neutral mutations, which can give a synergistic effect in combination with subsequent mutations. This condition is arbitrary.

Если рекомбинация или созревание не приводят к появлению улучшенной селективности после повторных итераций, может быть необходимым повторить фазу 2 для того, чтобы повысить вариабельность генома селекционной популяции.If recombination or maturation does not result in improved selectivity after repeated iterations, it may be necessary to repeat phase 2 in order to increase the variability of the genome of the selection population.

Некоторые применения данного способаSome applications of this method

Способ по данному изобретению можно использовать в нескольких областях, включая 1 ) скрининг для соединений с выбранными фармакологической или токсикологической активно25 стями; и 2) создание новых химических структур с выбранными функциональными характеристиками. Ниже рассматриваются примеры этого применения.The method of this invention can be used in several areas, including 1) screening for compounds with selected pharmacological or toxicological activities25; and 2) the creation of new chemical structures with selected functional characteristics. The following are examples of this application.

1А) Метод скрининга1A) Screening Method

Популяция рецепторов, которые были выявлены как имеющие селективное сродство со специфической группой соединений, обладающих одинаковыми фармакологическими свойствами, может быть использована в качестве зондов для идентификации других соединений с такой же активностью, при условии, что эта активность зависит от сродства к связыванию. Например, может быть выявлена популяция рецепторов, обладающих специфическим сродством к салицилатам. Если сродство этих рецепторов к салицилатам близко коррелируется со сродством циклооксигеназы к салицилатам, рецепторы должны, по меньшей мере, частично имитировать функционально релевантные признаки сайта связывания молекулы циклооксигеназы. Эти рецепторы могут поэтому быть использованы для скрининга других соединений с возможным сродством к связыванию с циклооксигеназой.A population of receptors that have been identified as having selective affinity for a specific group of compounds having the same pharmacological properties can be used as probes to identify other compounds with the same activity, provided that this activity depends on the binding affinity. For example, a population of receptors with a specific affinity for salicylates can be detected. If the affinity of these receptors for salicylates is closely correlated with the affinity of cyclooxygenase for salicylates, the receptors should at least partially mimic functionally relevant features of the binding site of the cyclooxygenase molecule. These receptors can therefore be used to screen other compounds with possible affinity for binding to cyclooxygenase.

Эта методика также может быть использована для скрининга соединений, потенциально проявляющих токсикологическую или карциногенную активность. Например, могут быть выявлены рецепторы, которые имитируют сродство к специфическому связыванию рецепторов стероидных гормонов. Затем эти рецепторы могут быть использованы для оценки сродства пестицидов, растворителей, пищевых добавок и других синтетических материалов на предмет наличия возможного сродства к связыванию до испытаний ίη νίίΓΟ или ίη νίνο. Могут быть созданы моделированные рецепторы, проявляющие сродство к чередующимся сайтам мишени, транспортированным протеином или не связывающиеся с мишенями.This technique can also be used to screen compounds that are potentially toxic or carcinogenic. For example, receptors that mimic the affinity for specific binding of steroid hormone receptors can be detected. These receptors can then be used to assess the affinity of pesticides, solvents, food additives, and other synthetic materials for possible binding affinity prior to the ίη νίίΓΟ or ίη νίνο tests. Simulated receptors can be created that show affinity for alternating target sites transported by protein or not binding to targets.

1В) Скрининг для выявления субмаксимальной активности1B) Screening for submaximal activity

В некоторых случаях соединения с высоким сродством могут проявлять вредные побочные эффекты или могут быть неподходящими для введения хроническим больным. В этом случае могут потребоваться соединения с меньшим сродством к связыванию. Такие методики как комбинаторный синтез, не обеспечивает легкое генерирование или идентификацию таких соединений. По контрасту, моделированные рецепторы могут быть использованы для эффективного скрининга структур, которые проявляют сродство к связыванию любого уровня.In some cases, compounds with high affinity may exhibit harmful side effects or may not be suitable for administration to chronic patients. In this case, compounds with a lower binding affinity may be required. Techniques such as combinatorial synthesis do not provide for the easy generation or identification of such compounds. In contrast, simulated receptors can be used to effectively screen structures that exhibit binding affinity at any level.

1С) Измерение молекулярного подобия1C) Measurement of molecular similarity

Селективность моделированных рецепторов может быть использована как количественная мера молекулярного подобия.The selectivity of simulated receptors can be used as a quantitative measure of molecular similarity.

Пример моделированных рецепторов.An example of simulated receptors.

В этом примере для демонстрации способности программы генерирования рецепторов с получением моделированных рецепторов, имитирующих любую произвольно выбранную активность, были выбраны величины фиктивных испытаний сродства мишеней.In this example, to demonstrate the ability of a receptor generation program to produce simulated receptors that mimic any random activity, fictitious target affinity tests were selected.

В этом примере все рецепторы состоят из 15 полимеров. Величины ширины, длины и глубины обозначают первоначальные координаты 1 5 полимеров относительно центра рецептора.In this example, all receptors are composed of 15 polymers. The values of width, length and depth indicate the initial coordinates of 1 5 polymers relative to the center of the receptor.

Пример 1 .Example 1

Был получен моделированный рецептор со следующими характеристиками:A simulated receptor was obtained with the following characteristics:

число субъединиц: 240; ширина: 6; длина: 6; глубина: 25number of subunits: 240; width: 6; length: 6; depth: 25

Код:The code:

4100033103212204103333424052312013341024 12402223233401003224251014405133243400324 62041210013131004311210113241202242130241 32311243301331003230523000433414010202230 21404144435026520341310331022051414141021 40 21340143100102311103312352100162404100033103212204103333424052312013341024 12402223233401003224251014405133243400324 62041210013131004311210113241202242130241 32311243301331003230523000433414010202230 2140414143102103103102103103202103103103103103103304304304304304303303304303104304103103404303103403403403403403403403403303303303303303103103000

Каждая мишень испытывалась 20 раз в отношении рецептора.Each target was tested 20 times with respect to the receptor.

Степень сродства оптимизированного рецептора равна 0,9358, т.е. сравнительно низкая.The affinity of the optimized receptor is 0.9358, i.e. relatively low.

Субстраты-мишени, используемые для оптимизации рецептора, представляли собой бензол, фенол, бензойную кислоту и осалициловую кислоту. Предшественник аспирина о-салициловая кислота является ингибитором синтеза простагландинов при помощи циклооксигеназы. Бензойная кислота и фенол обладают гораздо более низким сродством к этому же сайту. Величины сродства мишеней и степени сродства для рецептора приведены ниже в табл. А, которая показывает, что моделированный рецептор обладает максимальным сродством к о-салициловой кислоте.The target substrates used to optimize the receptor were benzene, phenol, benzoic acid, and osalicylic acid. The aspirin precursor, o-salicylic acid, is an inhibitor of prostaglandin synthesis by cyclooxygenase. Benzoic acid and phenol have a much lower affinity for the same site. The affinity of the target and the degree of affinity for the receptor are shown below in table. A, which shows that the simulated receptor has a maximum affinity for o-salicylic acid.

Таблица АTable a

Соединение- мишень Compound- target Сродство мишени Affinity target Степень суммарного сродства Power total affinities Степень максимального сродства Power maximum affinities Бензол Benzene 0,6 0.6 20,88 20.88 3,38 3.38 Фенол Phenol 1,2 1,2 8,03 8.03 4,99 4.99 Бензойная кислота Benzoic acid 1,6 1,6 41,23 41.23 12,98 12.98 о-Салициловая кислота o-salicylic acid 4,4 4.4 80,33 80.33 34,71 34.71

Осуществлялась оценка трёх испытуемых субстратов с применением моделированного рецептора. Известно, что два соединения менее активны, чем о-салициловая кислота: мсалициловая кислота и п-салициловая кислота. Третье соединение, ИШи81па1, представляет собой производное фторированной салициловой кислоты, эффективность которого равна или выше эффективности салициловой кислоты. Результаты оценки приведены в табл. В.Three test substrates were evaluated using a simulated receptor. Two compounds are known to be less active than o-salicylic acid: msalicylic acid and p-salicylic acid. The third compound, ISh81pa1, is a derivative of fluorinated salicylic acid, the effectiveness of which is equal to or higher than the effectiveness of salicylic acid. The evaluation results are given in table. IN.

Таблица ВTable B

Соединение-мишень Target compound Степень суммарного сродства Power total affinities Степень максимального сродства Power maximum affinities м-Салициловая кислота m-salicylic acid 45,9 45.9 12,3 12.3 п-Салициловая кислота p-salicylic acid 63,5 63.5 27,5 27.5 ИЯи8ша1 IIA8sha1 117 117 71,2 71.2 о-Салициловая кислота o-salicylic acid 80,33 80.33 34,71 34.71

Результаты, полученные с использованием моделированного рецептора, соответствуют фармакологическим данным для этих соединений: м-салициловая кислота и п-салициловая кислота характеризуются более низкими степенями сродства, чем о-салициловая кислота, а ύίΠιϊδίηαΙ более активен, чем о-салициловая кислота. Дальнейшая очистка моделированного рецептора и использование дополнительных, независимо оптимизированных рецепторов потребуются для повышения правильности этих предсказаний активности.The results obtained using the simulated receptor correspond to the pharmacological data for these compounds: m-salicylic acid and p-salicylic acid are characterized by lower affinity levels than o-salicylic acid, and ύίΠιϊδίηαΙ is more active than o-salicylic acid. Further purification of the simulated receptor and the use of additional, independently optimized receptors will be required to increase the accuracy of these predictions of activity.

Часть В. Создание новых соединений с выбранными функциональными свойствамиPart B. Creating new compounds with selected functional properties

Эволюция новых лигандов.The evolution of new ligands.

Популяция моделированных рецепторов, обладающих селективным сродством к набору соединений-мишеней с одинаковыми функциональными свойствами, может быть использована для создания новых соединений с одинаковыми свойствами, при условии, что эти свойства тесно коррелируются со структурой или сродством к связыванию модельных соединений. Используя взаимодействие с рецепторами как критерий выбора, можно выявить новые химические структуры, оптимально соответствующие рецепторам. Поскольку эти соединения должны отвечать необходимым и достаточным требованиям к селективности рецептора, вероятно, что эти новые соединения также обладают активностью, подобной активности первоначальных молекулярных мишеней.A population of simulated receptors with selective affinity for a set of target compounds with the same functional properties can be used to create new compounds with the same properties, provided that these properties are closely correlated with the structure or binding affinity of model compounds. Using interaction with receptors as a selection criterion, it is possible to identify new chemical structures that are optimal for receptors. Since these compounds must meet the necessary and sufficient requirements for receptor selectivity, it is likely that these new compounds also have activity similar to the activity of the original molecular targets.

Общая схема процесса.The general scheme of the process.

1. Получить популяцию моделированных рецепторов с оптимизированной селективностью к набору охарактеризованных соединениймишеней. В некоторых случаях может быть желательным осуществить генерирование нескольких популяций с различными показателями сродства. Например, могут быть получены три популяции моделированных рецепторов, первая - имитирующая свойства выбранного сайта мишени, вторая - имитирующая сайт, требуемый для транспорта лиганда к его основной мишени и третья - популяция моделированных рецепторов, имитирующая сайт мишени, обуславливающий нежелательные побочные эффекты. Создание новой структуры лиганда в этом случае потребует одновременной оптимизации сродства к первым двум популяциям рецепторов и минимизации сродства к третьей популяции.1. Obtain a population of simulated receptors with optimized selectivity for the set of characterized target compounds. In some cases, it may be desirable to generate several populations with different affinities. For example, three populations of simulated receptors can be obtained, the first simulating the properties of a selected target site, the second simulating the site required for transporting a ligand to its main target, and the third a population of simulated receptors simulating a target site causing undesirable side effects. The creation of a new ligand structure in this case will require simultaneous optimization of affinity for the first two receptor populations and minimization of affinity for the third population.

2. Определить сродство новой основной структуры к популяции(ям) моделированных рецепторов.2. Determine the affinity of the new basic structure for the population (s) of simulated receptors.

3. Модифицировать основную структуру и оценить сродство с использованием популяции(ий) моделированных рецепторов. Если модификация улучшает сродство, модифицированная структура сохраняется для дальнейшей модификации. В противном случае испытывается другая модификация. Ранее отвергнутые модификации могут быть вновь использованы в сочетании с другими модификациями.3. Modify the basic structure and evaluate the affinity using the population (s) of simulated receptors. If the modification improves affinity, the modified structure is retained for further modification. Otherwise, another modification is tested. Previously rejected modifications can be reused in combination with other modifications.

4. Стадия 3 повторяется до тех пор, пока не получится соединение с подходящими величинами сродства.4. Step 3 is repeated until a compound with suitable affinity values is obtained.

Примечание: Используя дискриминирующие моделированные рецепторы, можно выявить химические структуры со сродством к выбранному сайту мишени ниже максимального.Note: Using discriminatory simulated receptors, it is possible to identify chemical structures with an affinity for the selected target site below the maximum.

1) Генерация кода молекулярного генотипа1) Molecular genotype code generation

Кодирование фенотипа лиганда (молекулярной структуры) в виде линейного генотипа, представленного нитью признаков (символов), облегчает процессы мутации, рекомбинации и наследования структурных признаков лиганда во время эволюционного процесса.Encoding the ligand phenotype (molecular structure) as a linear genotype, represented by a string of characters (characters), facilitates the processes of mutation, recombination, and inheritance of the structural characteristics of the ligand during the evolutionary process.

Лиганды, выявленные данным методом, состоят из замещенных углеродных скелетов. Каждый код состоит из трех векторов признаков. Вектор первичного кода содержит изменяющиеся команды для генерации углеродного скелета и определяет положение каждого атома углерода в скелете. Вектор вторичного кода идентифицирует функциональные группы, присоединенные к каждому атому углерода. Вектор третичного кода определяет положение функциональной группы по отношению к углеродухозяину. Молекулярные скелеты, соединяющие атомы кроме углерода (например, в простых эфирах, амидах и гетероциклах), могут быть созданы гомологическим путем с использованием дополнительных символов в коде для обозначения атомов, замещающих атомы углерода в скелете.Ligands detected by this method are composed of substituted carbon skeletons. Each code consists of three feature vectors. The primary code vector contains varying instructions for generating the carbon skeleton and determines the position of each carbon atom in the skeleton. The secondary code vector identifies functional groups attached to each carbon atom. The tertiary code vector determines the position of the functional group with respect to the carbon host. Molecular skeletons connecting atoms other than carbon (for example, in ethers, amides and heterocycles) can be created homologously using additional symbols in the code to designate atoms replacing carbon atoms in the skeleton.

Углеродный скелет создается из серий точек, которые образуют узлы трехмерной тетраэдральной системы координат. Во время создания углеродного скелета расстояние между ближайшими точками равно средней длине связи между углеродными атомами алкила.The carbon skeleton is created from a series of points that form the nodes of a three-dimensional tetrahedral coordinate system. During the creation of the carbon skeleton, the distance between the nearest points is equal to the average bond length between the carbon atoms of the alkyl.

Вектор первичного кода: детерминанты скелета лиганда.Primary code vector: determinants of the ligand skeleton.

Вектор первичного кода состоит из символов, идентифицирующих изменяющуюся команду в отношении данного положения атома. Каждая изменяющаяся команда определяет координаты следующего атома в тетраэдральной матрице. От каждого атома могут быть взяты четыре направления (1, 2, 3, 4), соответствующие незаполненным валентностям 8р3 углерода. Каждый из углеродных атомов принадлежит одному из четырех возможных состояний (А, В, С, И). Эти состояния соответствуют числу узлов в тетраэдральной системе координат.The primary code vector consists of characters identifying a changing command with respect to a given atom position. Each changing command determines the coordinates of the next atom in the tetrahedral matrix. Four directions can be taken from each atom (1, 2, 3, 4), corresponding to unfilled valences of 8p 3 carbon. Each of the carbon atoms belongs to one of four possible states (A, B, C, I). These states correspond to the number of nodes in the tetrahedral coordinate system.

Соотношение между направлением поворота и новыми координатами для следующего атома в скелете приведено в следующих таблицах. Две таблицы В1 и В 2 ниже представляют два меняющихся условия, требующихся для создания лигандов. Условие образования конформации ванны приводит к генерации тетраэдральной матрицы, в которой замкнутые 6членные кольца (циклогексаны) принимают конформацию ванны. Условие образования конформации кресла приводит к генерации матрицы, в которой циклогексильные кольца принимают конформацию кресла. Можно объединить оба условия во время генерации кода. В примерах, обсуждаемых в данном описании, используется только условие образования конформации кресла.The relationship between the direction of rotation and the new coordinates for the next atom in the skeleton is shown in the following tables. The two tables B1 and B 2 below represent the two changing conditions required to create the ligands. The condition for the formation of a bath conformation leads to the generation of a tetrahedral matrix in which closed 6-membered rings (cyclohexanes) accept the bath conformation. The condition for the formation of chair conformation leads to the generation of a matrix in which cyclohexyl rings accept the chair conformation. You can combine both conditions during code generation. In the examples discussed in this description, only the condition for the formation of conformation of the chair is used.

Таблица В1Table B1

Условия образования конформации ванны Настоящее положение = (х, у, ζ) Новое положение после поворотаConditions for the formation of a bath conformation Current position = (x, y, ζ) New position after rotation

Настоящее положение The present position Поворот=1 Turn = 1 Поворот=2 Turn = 2 Поворот=3 Turn = 3 Поворот=4 Turn = 4 А BUT (х-.75, у+.433, ζ-.5) (x-.75, y + .433, ζ-.5) (х-.75, у+.433, ζ-.5) (x-.75, y + .433, ζ-.5) (х, у-.864, ζ-.5) (x, y-.864, ζ-.5) х, у, ζ+1) x, y, ζ + 1) В IN (х+.75, у-.433, ζ+.5) (x + .75, y-.433, ζ + .5) (х-.75, у-.433, ζ+.5) (x-.75, y-.433, ζ + .5) (х, у+.864, ζ+.5) (x, y + .864, ζ + .5) х, у, ζ-1) x, y, ζ-1) С FROM (х-.75, у+.433, ζ+.5) (x-.75, y + .433, ζ + .5) (х+.75, у+.433, ζ+.5) (x + .75, y + .433, ζ + .5) (х, у-.864, ζ+.5) (x, y-.864, ζ + .5) х, у, ζ-1) x, y, ζ-1) И AND (х+.75, у-.433, ζ-.5) (x + .75, y-.433, ζ-.5) (х-.75, у-.433, ζ-.5) (x-.75, y-.433, ζ-.5) (х, у+.864, ζ-.5) (x, y + .864, ζ-.5) х, у, ζ+1) x, y, ζ + 1)

Каждый поворот приводит только к определению состояния нового атома:Each rotation leads only to determine the state of the new atom:

Новое состояние после поворотаNew state after turning

Настоящее положение The present position Поворот=1 Turn = 1 Поворот=2 Turn = 2 Поворот=3 Turn = 3 Поворот=4 Turn = 4 А BUT В IN В IN В IN С FROM В IN А BUT А BUT А BUT И AND С FROM И AND И AND И AND А BUT И AND С FROM С FROM С FROM В IN

Таблица В2Table B2

Условия образования конформации кресла Настоящее положение = (х, у, ζ) Новое положение после поворотаConditions for the formation of chair conformity Current position = (x, y, ζ) New position after rotation

Настоящее положение The present position Поворот=1 Turn = 1 Поворот=2 Turn = 2 Поворот=3 Turn = 3 Поворот=4 Turn = 4 А BUT (х-. 75, у+.433, ζ-.5) (x-. 75, y + .433, ζ-.5) (х-.75, у+.433, ζ-.5) (x-.75, y + .433, ζ-.5) (х, у-.864, ζ-.5) (x, y-.864, ζ-.5) х, у, ζ+1) x, y, ζ + 1) В IN (х+.75, у-,433, ζ+.5) (x + .75, y-, 433, ζ + .5) (х-.75, у-.433, ζ+.5) (x-.75, y-.433, ζ + .5) (х, у+.864, ζ+.5) (x, y + .864, ζ + .5) х, у, ζ-1) x, y, ζ-1) С FROM (х-.75, у-,433, ζ+.5) (x-.75, y-, 433, ζ + .5) (х+.75, у-.433, ζ+.5) (x + .75, y-.433, ζ + .5) (х, у+.864, ζ+.5) (x, y + .864, ζ + .5) х, у, ζ-1) x, y, ζ-1) И AND (х+.75, у+.433, ζ-.5) (x + .75, y + .433, ζ-.5) (х-.75, у+.433, ζ-.5) (x-.75, y + .433, ζ-.5) (х, у-.864, ζ-.5) (x, y-.864, ζ-.5) х, у, ζ+1) x, y, ζ + 1)

Каждый поворот также приводит к определению положения нового атома:Each rotation also leads to the determination of the position of the new atom:

Новое состояние после поворотаNew state after turning

Настоящее положение The present position Поворот=1 Turn = 1 Поворот=2 Turn = 2 Поворот=3 Turn = 3 Поворот=4 Turn = 4 А BUT В IN В IN В IN С FROM В IN А BUT А BUT А BUT И AND С FROM И AND И AND И AND А BUT И AND С FROM С FROM С FROM В IN

Используя эти соотношения, можно декодировать векторы первичного кода, состоящие из нитей символов 1, 2, 3 и 4 с созданием трёхмерных образований атомов углерода. Полученной нити атомов углерода позволяют складываться или образовывать замкнутые петли с получением коротких боковых цепей и кольцевых структур. Могут быть введены специфические кольцевые структуры (например, циклогексаны) непосредственно в виде характерных последовательностей символов, как показано ниже.Using these relations, it is possible to decode the primary code vectors, consisting of strands of symbols 1, 2, 3 and 4 with the creation of three-dimensional formations of carbon atoms. The resulting filaments of carbon atoms allow folding or forming closed loops to produce short side chains and ring structures. Specific ring structures (e.g. cyclohexanes) can be introduced directly in the form of representative character sequences, as shown below.

Вектор вторичного кода: заместители. Вектор вторичного кода, той же длины, что и вектор первичного кода, применяется для выделения типа заместителя при атоме углерода, определяемом вектором первичного кода. Каждый заместитель идентифицируется отдель31 ным символом. Заместители добавляют по одному к углеродному скелету. Отдельный атом углерода может иметь более одного заместителя, но только в случае, если он описывается первичным кодом более одного раза.Secondary code vector: substituents. A secondary code vector, of the same length as the primary code vector, is used to highlight the type of substituent at the carbon atom defined by the primary code vector. Each substituent is identified by a separate symbol. Substituents are added one to the carbon skeleton. A single carbon atom may have more than one substituent, but only if it is described by the primary code more than once.

В процессе построения лиганда в данном методе все валентности, не заполненные заместителями, описываемыми вектором вторичного кода, автоматически насыщаются атомами водорода. Для насыщения свободных валентностей атомами, отличными от водорода, можно применять другие правила.In the process of constructing the ligand in this method, all valencies not filled with substituents described by the secondary code vector are automatically saturated with hydrogen atoms. Other rules can be used to saturate free valencies with atoms other than hydrogen.

Третичный вектор: вектор связи с заместителем.Tertiary vector: vector of communication with a substituent.

Вектор третичного кода, той же длины, что и вектор первичного кода, применяется для выделения валентности, связывающей заместитель, описываемый вектором вторичного кода. Третичный код состоит из символов 1, 2, 3 и 4, каждый из которых относится к направлению поворота, определяемому для первичного кода. Заместители распределяются только в случае, если валентность ещё не заполнена либо атомом углерода, определяемым вектором первичного кода, либо другим, предварительно выделенным (распределенным) заместителем. Или же последующие заместители могут заменить предварительно распределённые заместители.A tertiary code vector, of the same length as the primary code vector, is used to highlight the valency linking the substituent described by the secondary code vector. The tertiary code consists of characters 1, 2, 3 and 4, each of which refers to the direction of rotation defined for the primary code. Substituents are distributed only if the valency is not yet filled either with a carbon atom defined by the primary code vector, or another, previously allocated (distributed) substituent. Or, subsequent substituents may replace previously distributed substituents.

2) Создание программы (кода)2) Creating a program (code)

Чтобы создать углеродные скелеты, конструируется первичная программа (первичный код) с помощью случайной упорядоченности (последовательности) символов, относящихся к множеству (набору) {1, 2, 3, 4}. Создание гетероциклических структур, простых эфиров, амидов имидов и карбоксильных соединений выполняется заменой скелетного атома углерода на другой атом, определяемый вторичным кодом (вторичной программой).To create carbon skeletons, a primary program (primary code) is constructed using random ordering (sequence) of characters belonging to the set (set) {1, 2, 3, 4}. The creation of heterocyclic structures, ethers, amides of imides and carboxylic compounds is carried out by replacing the skeletal carbon atom with another atom defined by the secondary code (secondary program).

Вторичный код создают, исходя из случайной упорядоченности символов, определяющих типы заместителей. Частота символов может быть случайной или ранее фиксированной до генерации команд.The secondary code is created based on the random ordering of characters that determine the types of substituents. The frequency of characters may be random or previously fixed before generating commands.

Третичный код состоит из символов из набора (множества) {1, 2, 3, 4}. Циклические структуры можно конструировать сознательно (в противоположность случайной генерации), добавляя (последовательности) упорядоченности конкретных символов к первичному коду. Например, 431423 кодирует циклогексильные кольца. Сумма из 24 строк кодирует все возможные положения циклогексильных групп в тетраэдральной матрице. Векторы вторичного и третичного кода для первичных кодов цикла создают так, как описано выше. Модуль 10 представляет блок-схему примерного создания программы для генерации углеродных скелетов, включающих циклы.The tertiary code consists of characters from the set (set) {1, 2, 3, 4}. Cyclic structures can be constructed consciously (as opposed to random generation) by adding (sequences) the ordering of specific characters to the primary code. For example, 431423 encodes cyclohexyl rings. A sum of 24 lines encodes all possible positions of cyclohexyl groups in the tetrahedral matrix. The secondary and tertiary code vectors for the primary loop codes are created as described above. Module 10 is a block diagram of an exemplary program for generating carbon skeletons including cycles.

Относительные положения точек входа и выхода из части углеродного скелета, содержащей цикл, определяется длиной упорядоченностей символов, применяемых для создания цикла. Конкретно, если упорядоченности (последовательности) содержат шесть символов, например, 432413, то точка входа и выхода представляет собой тот же самый член цикла. Если последовательность является частично повторной и добавляется к первоначальным шести символам, точка входа и точка выхода не будут являться тем же самым членом цикла. Например, 4314134 и 43141343141 образуют циклы, у которых точки выхода у членов кольца прилегают к точкам входа.The relative positions of the entry and exit points of the part of the carbon skeleton containing the cycle is determined by the length of the orderings of the symbols used to create the cycle. Specifically, if the ordering (sequence) contains six characters, for example, 432413, then the entry and exit point is the same member of the cycle. If the sequence is partially repeated and added to the original six characters, the entry point and exit point will not be the same member of the loop. For example, 4314134 and 43141343141 form cycles in which the exit points of the ring members are adjacent to the entry points.

В данном случае кольца присоединяют к скелету, добавляя последовательности (упорядоченности) из 6 или более символов к коду. Для цикла, описываемого 431413, возможными используемыми последовательностями (упорядоченностями) являются:In this case, the rings are attached to the skeleton, adding sequences of 6 or more characters to the code. For the cycle described by 431413, the possible sequences used (ordering) are:

431413431413

43141344314134

4314134343141343

431413431431413431

43141343144314134314

4314134314143141343141

431413431413431413431413

431413431413431413431413

Предлагаемые правила создания нового генотипа лигандов можно применять для кодирования других химических структур в линейном формате как для хранения (в памяти), так и для введения в процесс эволюции лигандов. Например, известный фармакофор можно кодировать в линейном формате и применять в качестве исходной точки для выявления новых лигандов с подобными или улучшенными функциональными свойствами. Подобным образом, наборы фармакофоров, взаимодействующих с общим сайтом мишени, можно кодировать в линейном формате и использовать для рекомбинации.The proposed rules for creating a new ligand genotype can be used to encode other chemical structures in a linear format both for storage (in memory) and for introducing ligands into the evolution process. For example, a well-known pharmacophore can be encoded in a linear format and used as a starting point to identify new ligands with similar or improved functional properties. Similarly, pharmacophore sets interacting with a common target site can be encoded in a linear format and used for recombination.

3) Трансляция кода и конструирование (построение) лиганда3) Code translation and ligand construction (construction)

Векторы кода преобразуют в трёхмерные изображения лигандов в процессе трансляции, состоящем из трёх дискретных стадий. На первой стадии (конструируют) строят углеродный скелет, используя первичный (основной) код. На второй стадии углеродный скелет дополняют заместителями, применяя команды векторов вторичного и третичного кода. Команды векторов вторичного и третичного кода могут также определять (устанавливать) замещение атомов углерода в скелете на другие атомы. Команды вторичного и третичного кодов могут также менять число и направление валентностей, имеющихся у атома углерода или другого атома, составляющего часть основного (первичного) скелета. Например, добавление карбонильного кислорода насыщает (заполняет) две свободные валентности. На третьей стадии все валентности, не заполненные заместителями на второй стадии, насыщаются атомами водорода (если не указано иначе).Code vectors are converted into three-dimensional images of ligands in the translation process, which consists of three discrete stages. At the first stage (construct), a carbon skeleton is built using the primary (main) code. In the second stage, the carbon skeleton is supplemented with substituents using the commands of the secondary and tertiary code vectors. The teams of the vectors of the secondary and tertiary code can also determine (establish) the substitution of carbon atoms in the skeleton for other atoms. The teams of the secondary and tertiary codes can also change the number and direction of valencies of a carbon atom or another atom that is part of the main (primary) skeleton. For example, the addition of carbonyl oxygen saturates (fills) two free valencies. In the third stage, all valencies not filled with substituents in the second stage are saturated with hydrogen atoms (unless otherwise indicated).

Первичное декодирование: построение скелета лиганда.Primary decoding: building a ligand skeleton.

Первичное декодирование использует команды поворота от вектора первичного кода для установления положения каждого атома углерода. Предполагается, что первый атом расположен в начале системы координат. Предполагается, что первый атом занимает в матрице состояние А.Primary decoding uses rotation instructions from the primary code vector to establish the position of each carbon atom. It is assumed that the first atom is located at the origin of the coordinate system. It is assumed that the first atom occupies state A.

Декодирование происходит последовательно. Результат процесса первичного декодирования представляет собой 3 х η матрицу, содержащую координаты х, у и ζ каждого из η скелетных атомов углерода. Поскольку петли и повороты разрешены, одно и то же положение в пространстве может занимать не один углеродный атом. В подобных случаях допускают, что только один атом углерода занимает данное положение. В результате число атомов углерода, образующих окончательный скелет, может быть меньше, чем число символов в векторе первичного кода.Decoding occurs sequentially. The result of the primary decoding process is a 3 x η matrix containing the x, y, and ζ coordinates of each of the η skeletal carbon atoms. Since loops and turns are allowed, more than one carbon atom can occupy the same position in space. In such cases, it is assumed that only one carbon atom occupies a given position. As a result, the number of carbon atoms forming the final skeleton may be less than the number of characters in the primary code vector.

Когда первичный код считан, создается перечень (список) из вторичного кода, который определяет заместители у каждого атома углерода. В то же самое время создается параллельный список с использованием третичного кода для определения валентности, насыщаемой каждым заместителем.When the primary code is read, a list (list) is created from the secondary code that defines the substituents for each carbon atom. At the same time, a parallel list is created using a tertiary code to determine the valency saturated by each substituent.

Вторичное декодирование: введение (добавление) заместителей.Secondary decoding: the introduction (addition) of substituents.

Заместители добавляют (вводят) последовательно к каждому атому углерода на основе списка, образованного из вторичного кода при первичном декодировании. Для определения положения валентности заместителя относительно основного (скелетного) углерода (углерода-хозяина) используют соответствующее значение из третичного кода. Если положение уже занято либо соседним атомом углерода, либо ранее описанным заместителем, замещение не выполняется. Или же может создаваться процесс декодирования, в котором осуществляется замещение в следующее незанятое положение, или происходит замена ранее описанного заместителя. Расстояние между заместителем и атомом углерода вычисляют исходя из справочных таблиц длин связей. Данные положения (позиции) и длины связей используют для расчета координат заместителя. В случае многокомпонентных заместителей, например, гидроксильной, нитро- и аминогрупп, для каждого атома в заместителе рассчитывают координаты относительно углерода- хозяина.Substituents are added (introduced) sequentially to each carbon atom based on a list formed from the secondary code during primary decoding. To determine the position of the valency of the substituent relative to the basic (skeletal) carbon (carbon host), use the corresponding value from the tertiary code. If the position is already occupied either by an adjacent carbon atom or by a substituent previously described, substitution is not performed. Or, a decoding process can be created in which the substitution is made to the next unoccupied position, or the previously described substitute is replaced. The distance between the substituent and the carbon atom is calculated from reference tables of bond lengths. These positions (positions) and bond lengths are used to calculate the substituent coordinates. In the case of multicomponent substituents, for example, hydroxyl, nitro and amino groups, coordinates for the carbon host are calculated for each atom in the substituent.

После того, как все заместители, описанные с помощью вектора вторичного кода, введены в скелет, все незаполненные позиции, остающиеся в скелете, насыщают атомами водорода. Для расчета координат каждого водородного атома используют длину связи водород3 §р -углеродный атом.After all the substituents described using the secondary code vector are introduced into the skeleton, all the unfilled positions remaining in the skeleton are saturated with hydrogen atoms. To calculate the coordinates of each hydrogen atom, the hydrogen bond length is used. 3 §p is a carbon atom.

Отдельные атомы углерода могут иметь более одного заместителя, отличного от водорода. Это может происходить, если одно и то же положение описывается вектором первичного кода более одного раза. Данный вариант осуществления изобретения не включает множественные заместители, непосредственно использующие вторичный код, хотя это можно легко осуществить.Individual carbon atoms may have more than one substituent other than hydrogen. This can happen if the same position is described by the primary code vector more than once. This embodiment of the invention does not include multiple substituents directly using a secondary code, although this can easily be done.

Заместители разрешены только в положениях, не занятых атомами углерода, образующими скелет лиганда. Сводный (кумулятивный) список содержит все занятые сайты (положения) в тетраэдральной матрице.Substituents are allowed only in positions not occupied by carbon atoms forming the ligand skeleton. The summary (cumulative) list contains all occupied sites (positions) in the tetrahedral matrix.

В процессе вторичного декодирования транслируется список типов, радиусов и положения всех атомов, содержащихся в лиганде. Этот список является основой для последующей генерации мишеней.In the process of secondary decoding, a list of types, radii, and positions of all atoms contained in the ligand is translated. This list is the basis for the subsequent generation of targets.

На этой стадии процесса не оценивается осуществимость структуры, создаваемой на основе упорядоченности (последовательности) кода. В некоторых случаях координаты атомов можно вводить в программы минимизации энергии с целью создания более правдоподобных структур. Однако в данном случае не делается никаких допущений относительно конфигурации лиганда во время связывания. Кроме того, данный вариант осуществления способа сохраняет уникальность структуры специфической конфигурации той же молекулы. Например, данная разработка различает три вращательных изомера бутана и рассматривает каждый изомер как отдельную молекулу.At this stage of the process, the feasibility of a structure created on the basis of ordering (sequence) of code is not evaluated. In some cases, atom coordinates can be entered into energy minimization programs to create more plausible structures. However, in this case, no assumptions are made regarding the configuration of the ligand during binding. In addition, this embodiment of the method preserves the uniqueness of the structure of a specific configuration of the same molecule. For example, this development distinguishes between three rotational isomers of butane and considers each isomer as a separate molecule.

Векторы кодов составляют генотип соответствующего лиганда и могут подвергаться (изменению) мутации и рекомбинации, изменяя в результате структуру лиганда. Сама по себе структура лиганда представляет собой фенотип, используемый для оценки сродства к связыванию с выбранной популяцией виртуальных рецепторов.The vectors of the codes make up the genotype of the corresponding ligand and can undergo (change) mutation and recombination, resulting in a change in the structure of the ligand. The ligand structure itself is a phenotype used to evaluate binding affinity for a selected population of virtual receptors.

4) Презентация мишеней4) Presentation of targets

Химические структуры мишеней лигандов первоначально строят на основе случайно генерированных (созданных) кодов. После декодирования из справочных таблиц получают значения координат, радиусов, дипольных моментов и поляризуемостей каждого атома в мишенилиганде и используют для оценки сродства к связыванию между лигандом и выбранной популяции виртуальных рецепторов.The chemical structures of ligand targets are initially built on the basis of randomly generated (created) codes. After decoding, from the look-up tables, the coordinates, radii, dipole moments, and polarizabilities of each atom in the target ligand are obtained and used to assess the binding affinity between the ligand and the selected virtual receptor population.

Сродство мишени к каждому из виртуальных рецепторов проверяют для многих ориентаций мишени относительно поверхностей рецептора. Не делается никаких допущений насчет относительной ориентации лиганда и моделированного рецептора. Прежде, чем оценивать сродство к связыванию, мишень и рецептор должны войти в контакт. Способ презентации мишени и расчета сродства между химическими структурами и моделированными рецепторами практически такой же, как обсуждавшийся выше в Модуле 4 между молекулами известных мишеней и моделированными рецепторами.The affinity of the target for each of the virtual receptors is checked for many orientations of the target relative to the surfaces of the receptor. No assumptions are made regarding the relative orientation of the ligand and simulated receptor. Before evaluating binding affinity, the target and receptor must come into contact. The method for presenting a target and calculating the affinity between chemical structures and simulated receptors is almost the same as that discussed above in Module 4 between molecules of known targets and simulated receptors.

5) Оценка сродства к связыванию и соответствия5) Assessment of binding affinity and compliance

Сродство к связыванию лиганда-мишени с каждым из моделированных рецепторов, применяемое для (оценки) определения соответствия, рассчитывают, применяя тот же способ расчета эффективного сродства, который описан для генерации моделированных рецепторов с применением молекул мишеней. Как отмечено ранее, можно вводить в процесс проверки соответствия расчеты сродства с применением других критериев, но эффективность и точность вычислений в данном случае зависит частично от использования того же самого расчета эффективного сродства к генерации виртуальных рецепторов и генераций химических структур с применением популяций моделированных рецепторов.The affinity for binding the target ligand to each of the simulated receptors used to (evaluate) the determination of conformity is calculated using the same method for calculating the effective affinity that is described for generating simulated receptors using target molecules. As noted earlier, affinity calculations can be introduced into the conformity checking process using other criteria, but the efficiency and accuracy of the calculations in this case depends in part on the use of the same effective affinity calculation for generating virtual receptors and generating chemical structures using populations of simulated receptors.

6) Изменение (эволюция) лиганда6) Change (evolution) of the ligand

Проверка степени соответствия.Check compliance.

Степень соответствия между выбранной популяцией моделированных рецепторов и новым лигандом или химической структурой оценивают, сравнивая значения активности или сродства мишени к лиганду с таковыми, полученными для моделированных комплексов рецептор-лиганд. Максимальные значения сродства оптимального селективного виртуального рецептора должны чётко коррелировать с величинами сродства мишени. Последующие операции процесса эволюции (изменения) применяют для повышения степени этой корреляции (соответствия).The degree of correspondence between the selected population of simulated receptors and a new ligand or chemical structure is evaluated by comparing the activity or affinity of the target to the ligand with those obtained for simulated receptor-ligand complexes. The maximum affinity values of the optimal selective virtual receptor should clearly correlate with the affinity values of the target. Subsequent operations of the evolution (change) process are used to increase the degree of this correlation (correspondence).

Значения сродства к связыванию мишени могут (находиться на любом уровне) быть различными. Не требуется, чтобы у лиганда было одинаковое сродство к связыванию со всеми виртуальными рецепторами в процессе отбора. В данном случае для расчета величины сродства мишени к связыванию используют величины максимального сродства к связыванию оптимизированных виртуальных рецепторов с известными субстратами. Например, величины сродства мишеней могут составлять до 90% от сродства к связыванию каждого члена популяции виртуальных рецепторов с конкретным субстратом. Или же величина сродства мишени к связыванию может находиться около нуля, если взаимодействие между лигандом и виртуальным рецептором должно быть сведено к минимуму.The affinity for binding to the target can (be at any level) be different. It is not required that the ligand have the same affinity for binding to all virtual receptors during the selection process. In this case, the maximum affinity for binding of optimized virtual receptors to known substrates is used to calculate the target affinity for binding. For example, target affinity values can be up to 90% of the affinity for binding each member of the virtual receptor population to a particular substrate. Or, the binding affinity of the target may be near zero if the interaction between the ligand and the virtual receptor should be minimized.

Путем сочетания моделированных рецепторов, оптимизированных для различных наборов субстратов, и ассоциацией выбранных значений сродства мишени с каждым рецептором, можно выбрать новые лиганды с конкретными параметрами сродства к связыванию. Соответствие лиганда является мерой того, насколько совпадают значения вычисленного для лиганда сродства к связыванию и сродства мишени. Процесс оптимизации делает соответствие лиганда максимальным.By combining simulated receptors optimized for different sets of substrates and associating selected target affinity values with each receptor, new ligands with specific binding affinity parameters can be selected. Ligand compliance is a measure of how the values of the binding affinity calculated for the ligand and the affinity of the target match. The optimization process maximizes ligand compliance.

Оптимальная ориентация лигандов с целью достижения максимального сродства к связыванию до тестирования неизвестна. Чтобы получить репрезентативный порядок (размер) интервала сродства рецептор-лиганд, каждый новый лиганд нужно проверять неоднократно при различных случайных ориентациях относительно плоскости (поверхности) рецептора. Каждый тест использует Модуль 4, обсуждаемый в части А, для оценки сродства. В целом надежность полученных величин максимального сродства зависит от размера выборки, так как увеличивается вероятность того, что выборка содержит действительно максимальное значение.The optimal orientation of the ligands in order to achieve maximum affinity for binding prior to testing is unknown. In order to obtain a representative order (size) of the receptor-ligand affinity interval, each new ligand needs to be checked repeatedly for various random orientations relative to the plane (surface) of the receptor. Each test uses Module 4, discussed in Part A, to evaluate affinity. In general, the reliability of the obtained maximum affinity values depends on the size of the sample, since the probability that the sample contains a truly maximum value increases.

Чтобы избежать необходимости в большой выборке для генерации оптимизированных новых лигандов или химических структур, в данном аспекте изобретения используют две методики:To avoid the need for a large sample to generate optimized new ligands or chemical structures, two techniques are used in this aspect of the invention:

1. Применение величины, сочетающей среднее (или суммарное) сродство и максимальное сродство, с целью выбора лигандов с оптимизированными профилями сродства.1. The use of a value that combines the average (or total) affinity and maximum affinity, in order to select ligands with optimized affinity profiles.

2. Инкрементное увеличение числа ориентаций, проверяемых последовательными итерациями процесса оптимизации. (Оптимизацию начинают с малого набора ориентаций мишени; когда генерируются более пригодные лиганды, тестируют больше ориентаций).2. Incremental increase in the number of orientations verified by successive iterations of the optimization process. (Optimization begins with a small set of target orientations; when more suitable ligands are generated, more orientations are tested).

В данном случае вычисляют сумму значений сродства, полученных для всех проверяемых ориентаций каждого лиганда. Эта величина суммарного сродства есть мера среднего сродства между рецептором и лигандом. В то же время определяется также величина максимального сродства.In this case, the sum of the affinity values obtained for all verified orientations of each ligand is calculated. This total affinity value is a measure of the average affinity between the receptor and the ligand. At the same time, the maximum affinity is also determined.

Как суммарное, так и максимальное сродство применяют для проверки степени соответствия виртуального рецептора и нового лиганда. Соответствие каждого нового лиганда оценивают, исходя из разницы между расчетными значениями суммарного и максимального сродства и величинами этих параметров для мишени. В данном случае величина:Both total and maximum affinity are used to check the degree of correspondence of the virtual receptor and the new ligand. The correspondence of each new ligand is evaluated based on the difference between the calculated values of the total and maximum affinity and the values of these parameters for the target. In this case, the value:

рассчитывается как степень соответствия для каждой новой пары лиганд-моделированный рецептор. Соответствие является максимальным, когда степень соответствия равна нулю. Величины максимального сродства и суммарного сродства мишеней получены с помощью обратных функций, найденных в процессе эволюции оптимизируемых виртуальных рецепторов, как описано в предыдущих разделах. Значения для мишеней получены следующим образом:calculated as the degree of compliance for each new ligand-modeled receptor pair. Compliance is maximum when the degree of compliance is zero. The maximum affinity and total affinity of the targets were obtained using inverse functions found during the evolution of optimized virtual receptors, as described in the previous sections. The values for the targets are obtained as follows:

макс. сродство мишени = £ х максимальное сродство наиболее активного (сильного) субстрата, применяемого для генерации виртуального рецептора суммарное сродство мишени = £ х и суммарное сродство наиболее сильного субстрата, применяемого для генерации виртуального рецептора, где £ = коэффициент масштабирования.Max. affinity of the target = £ x maximum affinity of the most active (strong) substrate used to generate the virtual receptor; total affinity of the target = £ x and total affinity of the strongest substrate used to generate the virtual receptor, where £ = scaling factor.

Когда для оценки соответствия лиганда используют более одного моделированного рецептора, значения степени соответствия каждой пары лиганд-моделированный рецептор суммируются.When more than one simulated receptor is used to evaluate ligand conformity, the degree of compliance of each ligand-simulated receptor pair is summed.

В этом случае степень соответствия максимизируется, когда сумма степеней соответствия равна нулю. В некоторых случаях желательно использовать только степень максимального сродства при тестировании нового лиганда относительно панели различных моделированных рецепторов. В этом случае соответствие будет выражаться как:In this case, the degree of compliance is maximized when the sum of the degrees of compliance is zero. In some cases, it is desirable to use only the degree of maximum affinity when testing a new ligand relative to a panel of various simulated receptors. In this case, compliance will be expressed as:

Р(О(= £ 'вычисленное макс, сродство, - макс, сродство к мишени,1/ 1=1 макс, сродство к мишени{ P (D (= £ 'max calculated affinity, - max, the affinity for the target 1/1 = 1 max, affinity for the target {

В этом случае соответствие также максимизируется, когда сумма степеней соответствия равна нулю. Для измерения общей степени соответствия лиганда, проверяемого относительно ряда моделированных рецепторов, можно применять другие способы, например, геометрический способ.In this case, the correspondence is also maximized when the sum of the degrees of correspondence is zero. Other methods, for example, a geometric method, can be used to measure the overall degree of compliance of the ligand being tested against a number of simulated receptors.

Использование значений как максимального сродства, так и суммарного, полученных для каждого моделированного рецептора, гарантирует, что селективность виртуальных рецепторов включается в оценку соответствия лиганда. Таким образом, соответствие лиганда отражает не только сродство лиганда, но также то, что он удовлетворяет пространственным требованиям виртуального рецептора, которые лежат в основе селективности.Using values of both maximum affinity and total obtained for each simulated receptor ensures that the selectivity of virtual receptors is included in the assessment of ligand compliance. Thus, the ligand match reflects not only the ligand affinity, but also the fact that it satisfies the spatial requirements of the virtual receptor, which underlie selectivity.

6а) Цель процесса оптимизации6a) The purpose of the optimization process

Создание нового лиганда с избранным сродством к мишени для набора моделированных рецепторов. Требуется высокоэффективный механизм для решения (этой задачи), так как общее число возможных генотипов, отвечающих 25 командам, составляет 25625.Create a new ligand with selected affinity for the target for a set of simulated receptors. A highly effective mechanism is required to solve (this problem), since the total number of possible genotypes corresponding to 25 teams is 256 25 .

Процесс.Process.

(1) Фаза 1. Создайте набор случайных генотипов, кодирующих лиганды, и подвергните скринингу относительно набора моделированных рецепторов с целью выбора лигандов, превосходящих порог степени соответствия.(1) Phase 1. Create a set of random genotypes encoding the ligands, and screen for a set of simulated receptors to select ligands that exceed the degree of compliance threshold.

(2) Фаза 2. Выбранный генотип используют как основу для дальнейшей оптимизации, применяя методику генетического алгоритма (рекомбинации) и однонаправленной мутации. Подвергните мутации выбранный генотип с целью генерации популяции для воспроизводства отдельных, но родственных генотипов для рекомбинации.(2) Phase 2. The selected genotype is used as the basis for further optimization, using the methodology of the genetic algorithm (recombination) and unidirectional mutation. Mutate the selected genotype to generate a population to reproduce individual but related genotypes for recombination.

(3) Выберите наиболее селективные мутанты из популяции для рекомбинации.(3) Select the most selective mutants from the population for recombination.

(4) Фаза 3. Создайте новые генотипы путем рекомбинации селективных мутантов. Выберите из полученных генотипов таковые, соответствующие наиболее высокой степени сродства. Примените эту субпопуляцию для последующей генерации рекомбинаций (повторить фазу 3) или мутаций (повторить фазу 4).(4) Phase 3. Create new genotypes by recombination of selective mutants. Select from the obtained genotypes those corresponding to the highest degree of affinity. Use this subpopulation for subsequent generation of recombinations (repeat phase 3) or mutations (repeat phase 4).

(5) Фаза 4. Возьмите лучшие продукты рекомбинации и примените к ним повторные точечные мутации с целью повышения селективности.(5) Phase 4. Take the best recombination products and apply repeated point mutations to them to increase selectivity.

(6) Процесс оптимизации завершен, когда генерированы (созданы) лиганды с заданным соответствием.(6) The optimization process is completed when ligands with a given match are generated (created).

Фаза 1: Эволюция-генерация первичного кодаPhase 1: Evolution-Generation of Primary Code

Задачей первой стадии процесса оптимизации является создание генотипа и фенотипа соответствующего лиганда с минимальной степенью соответствия. Этот генотип затем используют для создания популяции родственных генотипов.The task of the first stage of the optimization process is to create the genotype and phenotype of the corresponding ligand with a minimum degree of compliance. This genotype is then used to create a population of related genotypes.

Генетический алгоритм, открытый Но11аиб (Холландом), можно применять для поиска оптимальных решений множества задач. Обычно эта методика применяется с использованием больших, первоначально случайных наборов решений. В данном аспекте изобретения методика значительно модифицирована с целью уменьшения числа тестов и итераций, требуемых для нахождения лигандов с высоким селективным сродством. Это было выполнено с использованием набора генотипов с близким родством в качестве исходной популяции и применения высоких скоростей мутации при каждой итерации. Для каждого набора соединениймишеней можно получить (найти) отдельные лиганды с оптимальными характеристиками сродства. Например, рецепторы могут оптимально связываться с теми же самыми мишенями, но с различной ориентацией. Применение исходной популяции близко родственных генотипов повышает вероятность того, что процесс оптимизации сведется к единственному решению. Рекомбинация неродственных генотипов, хотя она и может создать новые генотипы с повышенной совместимостью, но более вероятно то, что она приведет к дивергенции.The genetic algorithm discovered by Ho11aib (Holland) can be used to search for optimal solutions to many problems. Typically, this technique is applied using large, initially random sets of solutions. In this aspect of the invention, the technique is significantly modified to reduce the number of tests and iterations required to find ligands with high selective affinity. This was accomplished using a set of genotypes with close affinity as the initial population and the use of high mutation rates at each iteration. For each set of target compounds, one can obtain (find) individual ligands with optimal affinity characteristics. For example, receptors can optimally bind to the same targets, but with different orientations. The use of the initial population of closely related genotypes increases the likelihood that the optimization process will be reduced to a single solution. Recombination of unrelated genotypes, although it may create new genotypes with increased compatibility, it is more likely that it will lead to divergence.

Фаза 2: Мутация лигандаPhase 2: Ligand Mutation

Задачей второй фазы процесса эволюции является генерация популяции отдельных, но родственных генотипов, образованных из первичного генотипа. Члены этой популяции затем используются для получения рекомбинаций. Эта популяция для воспроизводства (улучшения) создается с помощью множественной мутации первичного генотипа. Образующиеся в результате генотипы транслируются и подвер39 гаются скринингу на предмет селективности. Продукты с наибольшей селективностью сохраняют для рекомбинации.The task of the second phase of the evolution process is to generate a population of separate but related genotypes formed from the primary genotype. Members of this population are then used to obtain recombination. This population for reproduction (improvement) is created using the multiple mutations of the primary genotype. The resulting genotypes are translated and screened for selectivity. Products with the highest selectivity are stored for recombination.

Лиганды подвергаются мутации путем изменения признаков (символов) генотипа (векторов кода), кодирующих их структуры. Эти мутации изменяют размер лиганда, а также расположение и тип имеющейся в лиганде функциональной группы. Мутации в данном случае могут менять число атомов углерода, составляющих скелет лиганда. Модуль 11 представляет собой блок-схему примерного процесса множественной точечной мутации.Ligands undergo mutations by changing the characteristics (symbols) of the genotype (code vectors) encoding their structures. These mutations change the size of the ligand, as well as the location and type of the functional group present in the ligand. Mutations in this case can change the number of carbon atoms that make up the ligand skeleton. Module 11 is a flowchart of an exemplary multiple point mutation process.

Мутации могут менять характер упорядочивания фенотипа лиганда, изменяя в результате размер и местоположение или вид функциональной группы. Мутации, которые влияют на конфигурацию периферических участков фенотипа лиганда, могут приводить к сдвигу позиции относительно рецепторного центра.Mutations can change the nature of the ordering of the ligand phenotype, resulting in a change in the size and location or appearance of the functional group. Mutations that affect the configuration of the peripheral regions of the ligand phenotype can lead to a shift in position relative to the receptor center.

Нейтральные мутации.Neutral mutations.

Все мутации изменяют структуру фенотипа, однако, не все мутации приводят к изменению функциональности лиганда. Такие нейтральные мутации могут менять компоненты (составляющие) лиганда, которые не влияют на сродство. В некоторых случаях такие нейтральные мутации могут сочетаться с последующими мутациями, оказывая синергичное воздействие.All mutations change the structure of the phenotype, however, not all mutations lead to a change in the functionality of the ligand. Such neutral mutations can change the components (components) of the ligand, which do not affect the affinity. In some cases, such neutral mutations can be combined with subsequent mutations, providing a synergistic effect.

Мутации последовательности.Mutation Sequences.

Мутации последовательности не меняют непосредственно символы кода. Вместо этого изменяется последовательность символов в коде. Мутации последовательности могут менять размер лиганда, (структурную) конфигурацию и наличие и местоположение функциональных групп. По данному аспекту изобретения применяют четыре типа мутации последовательности:Sequence mutations do not directly change code characters. Instead, the sequence of characters in the code is changed. Mutation sequences can change the size of the ligand, (structural) configuration and the presence and location of functional groups. Four types of sequence mutations are used in this aspect of the invention:

a) ДЕЛЕЦИЯ: из кода удаляется последовательность символов.a) DELETION: a sequence of characters is removed from the code.

АВСЭЕА АВЕАAVSEEA AVEA

b) ИНВЕРСИЯ: порядок символов, составляющих последовательность внутри кода, меняется на обратный.b) INVERSION: the order of the characters that make up the sequence within the code is reversed.

АВСЭЕА АВЭСЕАAVSEEA AVESEA

c) ДУПЛИКАЦИЯ (удвоение): последовательность символов, составляющих часть кода, повторяется.c) DUPLICATION (doubling): the sequence of characters that make up part of the code is repeated.

АВСЭЕААВСЭСЭЕАAVSEEEAAVSESEEEA

Л) ИНСЕРЦИЯ: в код встраивается последовательность символов.L) INSERT: a sequence of characters is embedded in the code.

АВСЭЕА АВСЭВСЕАAVSEEA AVSEEVSEA

Мутации по данному изобретению применяются в комбинации. Модуль 12 представляет блок-схему примерной мутации последовательности.The mutations of this invention are used in combination. Module 12 is a block diagram of an exemplary sequence mutation.

Фаза 3: Генерация рекомбинантного кодаPhase 3: Recombinant Code Generation

Во время рекомбинации, случайно выбранной, происходит обмен комплементарными секциями между выбранными генотипами. Задачей рекомбинации является генерация новых генотипов с повышенным соответствием. Рекомбинация облегчает сохранение фрагментов генотипа, существенных для соответствия фенотипов, и в то же время вводит новые комбинации команд. В целом, рекомбинация, соединённая с отбором, дает быструю оптимизацию селективности. Модуль 13 представляет блоксхему примерной процедуры рекомбинации.During recombination, randomly selected, complementary sections are exchanged between the selected genotypes. The task of recombination is the generation of new genotypes with increased compliance. Recombination facilitates the conservation of genotype fragments that are essential for phenotype matching, and at the same time introduces new combinations of commands. In general, recombination combined with selection gives a quick optimization of selectivity. Module 13 presents a block diagram of an exemplary recombination procedure.

В данном случае сохраняется популяция, используемая для рекомбинации, с целью тестирования. Этим гарантируется, что генотипы с высокой селективностью не замещаются на генотипы с более низким соответствием. По данному аспекту изобретения перед тестированием множественным мутациям подвергается до 50% рекомбинантных генотипов. Этот процесс повышает вариабельность внутри рекомбинантной популяции. Тестируемые популяции, применяемые по данному изобретению, имеют размеры в интервале от 1 0 до 40 генотипов. Это относительно малый размер популяции. В некоторых случаях (при некоторых условиях) могут потребоваться большие популяции.In this case, the population used for recombination for the purpose of testing is preserved. This ensures that genotypes with high selectivity are not replaced by genotypes with a lower match. In this aspect of the invention, up to 50% of the recombinant genotypes undergo multiple mutations before testing. This process increases the variability within the recombinant population. The tested populations used according to this invention have sizes ranging from 10 to 40 genotypes. This is a relatively small population size. In some cases (under certain conditions) large populations may be required.

Фаза 4: Созревание лигандаPhase 4: Ligand Maturation

Методика прогрессивной микромутации.The method of progressive micromutation.

На конечной стадии процесса оптимизации имитируется созревание антител в иммунной системе млекопитающих. Проводят ряд одноточечных мутаций в генотипе и оценивают действие на соответствие фенотипов. В отличие от рекомбинации этот процесс обычно приводит только к малым изменениям, повышающим селективность фенотипа. Процесс созревания использует (1+1) эволюционный способ Рехенберга (КесНеиЬегд). С каждым поколением (генерацией) соответствие исходного генотипа сравнивают с таковым продукта мутации и генотип с более высокой селективностью сохраняют для последующей генерации. В результате этот процесс является строго однонаправленным, так как менее селективные мутанты не замещают предшественника. При каждой итерации процесса созревания по данному изобретению меняется (только) единственная команда в коде.At the final stage of the optimization process, antibody maturation in the mammalian immune system is simulated. A series of single-point mutations are carried out in the genotype and the effect on phenotype compliance is evaluated. Unlike recombination, this process usually leads only to small changes that increase the selectivity of the phenotype. The ripening process uses the (1 + 1) Rechenberg evolutionary method (KesNeuber). With each generation (generation), the correspondence of the initial genotype is compared with that of the product of the mutation, and the genotype with higher selectivity is retained for subsequent generation. As a result, this process is strictly unidirectional, since less selective mutants do not replace the precursor. At each iteration of the ripening process according to this invention, only the only command in the code changes.

Если предшественник и продукт его мутации обладают одинаковой селективностью, предшественник замещается продуктом в следующей генерации. Этот способ приводит к накоплению нейтральных мутаций, которые могут оказывать действие синергичное с последующими мутациями. Это условие является необязательным, случайным. Модуль 1 4 представляет блок-схему примерного процесса созревания.If the precursor and the product of its mutation have the same selectivity, the precursor is replaced by the product in the next generation. This method leads to the accumulation of neutral mutations, which may have a synergistic effect with subsequent mutations. This condition is optional, random. Module 1 to 4 is a flow chart of an exemplary ripening process.

Если рекомбинация или созревание не дают улучшенной селективности после повторных итераций, возможно, станет необходимым повторить множественные мутации (фаза 2), чтобы повысить вариабельность генома популяции для воспроизводства (размножения).If recombination or maturation does not provide improved selectivity after repeated iterations, it may be necessary to repeat multiple mutations (phase 2) in order to increase the variability of the genome of the population for reproduction (reproduction).

Примеры генерации лигандаLigand Generation Examples

Общее представлениеGeneral view

Комаров Лебек аедурИ (желтолихорадочный) отпугивает бензальдегид и, в значительно меньшей степени, бензол и толуол (табл. 1). Этот вид не отпугивает в значительной степени циклогексан или гексан (табл. 1). В следующем тесте новой генерации лигандов используется способ для создания, аЬ ίηίίίο (с начала), соединений, которые имели бы подобную бензальдегиду активность в качестве репеллентов. На первой стадии генерации лигандов были созданы моделированные рецепторы с высоким сродством к бензальдегиду и низким сродством к бензолу. На второй стадии выявляются лиганды со сродством к связыванию с моделированными рецепторами, подобным таковому (родству) бензальдегида.Mosquito Lebeck Idur (yellow fever) repels benzaldehyde and, to a much lesser extent, benzene and toluene (Table 1). This species does not significantly deter cyclohexane or hexane (Table 1). In the next test of the new generation of ligands, a method is used to create, a ίηίίίο (from the beginning), compounds that would have activity similar to benzaldehyde as repellents. At the first stage of ligand generation, simulated receptors with high affinity for benzaldehyde and low affinity for benzene were created. At the second stage, ligands with an affinity for binding to simulated receptors similar to that of benzaldehyde are detected.

Реакции (ответ) комаровReactions (response) of mosquitoes

Комары являются выращенными в лаборатории, в возрасте 7-14 дней и не кормленными. Эксперименты проводят в течение шести дней при 20°С и ультрафиолетовом облучении. Тесты осуществляют между 12.00 и 17.00 восточного поясного времени. Испытуемые популяции в четырех наборах для испытаний содержат 200, 175, 105 и 95 женских особей. Комарам дают питьевую воду.Mosquitoes are laboratory grown, 7-14 days old and not fed. The experiments are carried out for six days at 20 ° C and ultraviolet radiation. Tests are carried out between 12.00 and 17.00 Eastern Standard Time. Test populations in four test kits contain 200, 175, 105, and 95 females. Mosquitoes are given drinking water.

Тесты проводят в пеналах (боксах) из прозрачного плексигласа размером 35 х 35 х 35 см с двумя противоположными сторонами, представляющими собой экраны-сита. Скрининг (просеивание) проходит через два слоя: внутренний слой из пластика с большими отверстиями и внешний нейлоновый слой с частыми (мелкими) отверстиями. Пенал помещают в атмосферу паров так, чтобы воздух поступал через одну из экранированных сторон и выходил через противоположную сторону. Ток воздуха <0,5 см/с.Tests are carried out in cases (boxes) of transparent plexiglass measuring 35 x 35 x 35 cm with two opposite sides, which are screen screens. Screening (screening) passes through two layers: the inner plastic layer with large holes and the outer nylon layer with frequent (small) holes. The pencil case is placed in a vapor atmosphere so that air enters through one of the shielded sides and exits through the opposite side. Air current <0.5 cm / s.

Комары помещаются на стенках пенала (бокса) головками вверх. Для подачи стимулирующего вещества используют треугольные (4 х 4 х 1 мм) бумажные фильтры (XV На I та η, Ватман, № 1). Концы погружают в испытуемый раствор на глубину 0,5 см и используют немедленно. Реакцию (ответ) на испытуемые растворы определяют следующим образом:Mosquitoes are placed on the walls of the pencil case (box) with their heads up. To supply a stimulating substance, triangular (4 x 4 x 1 mm) paper filters are used (XV On I and η, Whatman, No. 1). The ends are immersed in the test solution to a depth of 0.5 cm and used immediately. The reaction (response) to the test solutions is determined as follows:

. Неподвижную женскую особь, находящуюся на внутреннем сите наветренной стенки, отбирают для тестирования.. A fixed female, located on the inner sieve of the windward wall, is selected for testing.

2. Обработанный конец бумажного фильтра помещают на внешней стороне экрана-сита и располагают напротив среднегрудной лапки комара. Во всех случаях начинают подход с нижнего расположения комара.2. The processed end of the paper filter is placed on the outside of the screen sieve and placed opposite the mid-thoracic paw of the mosquito. In all cases, start the approach from the bottom of the mosquito.

3. Кончик (фильтра) сохраняют в (данном) положении максимум в течение 3 с и отмечают реакцию комара.3. The tip (filter) is kept in (this) position for a maximum of 3 s and the mosquito reaction is noted.

Затем повторяют процедуру для нового индивидуума. Комаров тестируют только один раз ежедневно на каждое соединение. Кончики (фильтров) используют для пяти тестов каждый (суммарная продолжительность использования <30 с), затем заменяют. Соединения проверяют в случайном порядке, и каждое соединение проверяют дважды в разные дни. Два набора контрольных (опытов) проводят с применением необработанных (сухих) концов фильтровальной бумаги и концов, смоченных дистиллированной водой, таким же образом, что и с обработанными концами. Тесты этих контрольных образцов регулярно распределяются среди тестов репеллентов. Реакция на контрольные соединения не изменяется в течение эксперимента (р <0,25).Then repeat the procedure for a new individual. Mosquitoes are tested only once daily for each compound. The tips (filters) are used for five tests each (total duration of use <30 s), then replaced. The connections are checked at random, and each connection is checked twice on different days. Two sets of control (experiments) are carried out using the untreated (dry) ends of the filter paper and the ends moistened with distilled water, in the same way as with the treated ends. Tests of these control samples are regularly distributed among repellent tests. The reaction to control compounds does not change during the experiment (p <0.25).

Отмечено (записано) четыре поведенческих (бихевиористских) реакции:Four behavioral (behavioral) reactions are noted (recorded):

. Нет реакции: комар остается неподвижным.. No reaction: the mosquito remains motionless.

2. Взлёт: комар улетает с места расположения.2. Take-off: a mosquito flies away from its location.

3. Подъем ипсилатеральной ноги (лапки): комар поднимает среднегрудую лапку на той же стороне, где находится источник раздражителя.3. Raising the ipsilateral leg (tarsus): the mosquito raises the mid-thoracic tarsus on the same side as the source of the stimulus.

4. Подъем контралатеральной лапки: комар поднимает среднегрудую лапку на стороне, противоположной той, где находится источник раздражителя.4. Raising the contralateral paw: the mosquito raises the mid-thoracic paw on the side opposite to where the source of the stimulus is located.

За подъемом ипсилатеральной лапки часто следует взлет, в этом случае регистрируют оба вида поведения. При тестировании и на всех фазах приготовления соединения используются полиэтиленовые перчатки.The rise of the ipsilateral paw is often followed by take-off, in which case both types of behavior are recorded. During testing and at all phases of the preparation of the compound, polyethylene gloves are used.

Таблица Е1Table E1

Реакция комаров на выбранные летучие соединенияMosquito response to selected volatile compounds

Соединение Compound Температура кипения, °С Boiling point, ° С N N % Реакция- взлет % Reaction- takeoff % Реакция подъем лапки % Reaction raising the paws Относительная отталкивающая способность* Relative repulsive ability * Бензальдегид Benzaldehyde 178 178 130 130 90 90 10 10 178 178 Бензол Benzene 80 80 72 72 72 72 12.5 12.5 68 68 Толуол Toluene 110 110 166 166 67 67 27 27 94 94 Циклогексан Cyclohexane 81 81 80 80 6 6 0 0 4.9 4.9 Гексан Hexane 69 69 100 one hundred 4 4 0 0 2.8 2.8 Контрольный (слепой) Control (blind) 450 450 5 5 0 0

* Относительная отталкивающая способность = [(% Реакция-взлет + % Реакция лапки) Ч температура кипения /100* Relative repulsive ability = [(% Reaction-take-off +% Reaction of the foot) H boiling point / 100

Генерация модулированного рецептора и лиганда.Modulated receptor and ligand generation.

Моделированные рецепторы генерируют (получают), используя те же критерии отбора. Каждый рецептор используют независимо для получения набора лигандов.Simulated receptors generate (receive) using the same selection criteria. Each receptor is used independently to produce a set of ligands.

Подбор молекул 1Selection of molecules 1

Фаза 1: генерация рецептора.Phase 1: receptor generation.

Выявляется рецептор с селективным сродством к бензальдегиду. Испытуемыми мишенями являются бензол и бензальдегид. Для расчета величин сродства используют пятнадцать ориентаций каждой мишени.A receptor with selective affinity for benzaldehyde is detected. The test targets are benzene and benzaldehyde. Fifteen orientations of each target are used to calculate affinity values.

Результаты процесса эволюции таковы:The results of the evolutionary process are as follows:

Мишень Target Величина активности Value activity Суммарное сродство Total affinity Максимальное сродство Maximum affinity Бензол Benzene 1,0 1,0 6,87 6.87 2,21 2.21 Бензальдегид Benzaldehyde 5,9 5.9 75,87 75.87 13,02 13.02

Степень сродства к рецептору равна 0,992.The degree of affinity for the receptor is 0.992.

Код для оптимизированного 25 х 6 х 7 рецептора бенCode for the optimized 25 x 6 x 7 receptor bin

231014406145231014406145

412061421302412061421302

022224-31514022224-31514

402131114311402131114311

053400324221053400324221

413231124335413231124335

143431012321143431012321

010233120331010233120331

412100131300412100131300

133100333032133100333032

341310334122341310334122

260214016231260214016231

0631121 01132 300043541401 1 01 4141 41 0210631121 01132 300043541401 1 01 4141 41 021

Фаза 2: генерация лиганда Оптимизированный моделированный рецептор используют в качестве матрицы для эволюции новых лигандов. С помощью случайной мутации и селекции подбирают четыре различных лиганда. Лиганды отбирают по сходству с бензальдегидом.Phase 2: ligand generation An optimized simulated receptor is used as a matrix for the evolution of new ligands. Using random mutation and selection, four different ligands are selected. Ligands are selected similar to benzaldehyde.

Величины сродства к лиганду таковы:The ligand affinity values are as follows:

Бензальдегид Benzaldehyde Лиганд 1.1 С8Н17С12ОН Ligand 1.1 S8N17S12ON Лиганд 1.2 С8Н15С1 Ligand 1.2 C8H15C1 Лиганд 1.3 С8Н13С1(=О) Ligand 1.3 C8H13C1 (= O) Лиганд 1.4 С13Н16ОН(=О) Ligand 1.4 C13H16ON (= O) Суммарное сродство Total affinity 75,87 75.87 74,03 74.03 67,88 67.88 72,25 72.25 72,94 72.94 Максимальное сродство Maximum affinity 13,02 13.02 12,82 12.82 15,14 15.14 12,58 12.58 11,2 11.2

Выделенные лиганды от 1 . 1 до 1 .4 показаны на фиг. 4Ь. По меньшей мере, одна ориентация каждого лиганда сходна по структуре с бензальдегидом.Selected ligands from 1. 1 to 1 .4 are shown in FIG. 4b. At least one orientation of each ligand is similar in structure to benzaldehyde.

Подбор молекул 2Selection of molecules 2

Фаза 1 : генерация рецептора.Phase 1: receptor generation.

Рецептор 25 х 6 х 7 выявляют по избирательному сродству к бензальдегиду. В качестве испытуемых мишеней используют бензол и бензальдегид. Для расчета величин сродства берут пятнадцать ориентаций каждой мишени.A 25 x 6 x 7 receptor is detected by selective affinity for benzaldehyde. Benzene and benzaldehyde are used as test targets. Fifteen orientations of each target are taken to calculate affinity values.

Результаты процесса эволюции таковы:The results of the evolutionary process are as follows:

Мишень Target Степень активности Power activity Суммарное сродство Total affinity Максимальное сродство Maximum affinity Бензол Benzene 1,0 1,0 25,88 25.88 8,53 8.53 Бензальдегид Benzaldehyde 5,8 5.8 162,23 162.23 42,74 42.74

Степень сродства к рецептору составляет 0,996.The degree of affinity for the receptor is 0.996.

Код рецептора следующий:The receptor code is as follows:

031264441313031264441313

543301114446543301114446

224223503403224223503403

323030313214323030313214

004422243042004422243042

210043042311210043042311

432003432122432003432122

002321144010002321144010

223140112054223140112054

323431131340323431131340

002221221113002221221113

000243013133000243013133

302122330134 1 300201 201 33 411440003113302122330134 1 300201 201 33 411440003113

Фаза 2: генерация лиганда.Phase 2: ligand generation.

В качестве матрицы для эволюции новых лигандов используют оптимизированный моделированный рецептор. Случайной мутацией и селекцией подбирают четыре различных лиганда. Лиганды отбирают по сходству с бензальдегидом.An optimized simulated receptor is used as a matrix for the evolution of new ligands. Four different ligands are selected by random mutation and selection. Ligands are selected similar to benzaldehyde.

Значения сродства к лиганду следующие:The ligand affinity values are as follows:

Бензальдегид Benzaldehyde Лиганд 2.1 С8Н13С1(=О) Ligand 2.1 С8Н13С1 (= О) Лиганд 2.2 С9Н15С1(=О) Ligand 2.2 C9H15C1 (= O) Лиганд 2.3 С6Н10СЫ(=О) Ligand 2.3 С6Н10СЫ (= О) Лиганд 2.4 СН„(=О) Ligand 2.4 CH „(= O) Суммарное сродство Total affinity 162,23 162.23 182,4 182.4 166,5 166.5 159,7 159.7 156,8 156.8 Максимальное сродство Maximum affinity 42,74 42.74 48,97 48.97 43,0 43.0 39,0 39.0 46,5 46.5 Степень соответствия Power compliance 0,135 0.135 0,02 0.02 0,05 0.05 0,06 0.06

Выделенные лиганды от 2.1 до 2.4 изображены на фиг. 4с. По меньшей мере, одна ориентация каждого лиганда по структуре сходна с бензальдегидом.Isolated ligands from 2.1 to 2.4 are shown in FIG. 4s At least one orientation of each ligand is similar in structure to benzaldehyde.

Соединения 2.1 и 2.4 являются производными замещённого циклогексанона. Лиганд 2.2 представляет собой 5-хлорнона-2,7-дион и лиганд 2.3 является 2-цианогексан-5-оном. Лиганд 1 .4 содержит фрагмент, соответствующий по строению метилциклогексилкетону. Экспери- что эти лиганды также являются репеллентами менты по проверке отталкивающей способности по отношению к комарам (табл. Е2).Compounds 2.1 and 2.4 are derivatives of substituted cyclohexanone. Ligand 2.2 is 5-chloronone-2,7-dione and ligand 2.3 is 2-cyanohexan-5-one. Ligand 1 .4 contains a fragment corresponding in structure to methylcyclohexyl ketone. Experiment that these ligands are also repellents of cops to check repellent ability in relation to mosquitoes (Table E2).

циклогексанона, ментона, метилциклогексилкетона и октан-2-она (см. фиг. 4а) подтверждают,cyclohexanone, menton, methylcyclohexylketone and octan-2-one (see Fig. 4a) confirm

Таблица Е2Table E2

Реакция комаров на выбранные летучие соединенияMosquito response to selected volatile compounds

Соединение Compound Температура кипения, °С Boiling point, ° С N N % Реакция- взлет % Reaction- takeoff % Реакция подъем лапки % Reaction raising the paws Относительная отталкивающая способность* Relative repulsive ability * Бензальдегид Benzaldehyde 178 178 130 130 90 90 10 10 178 178 2-Октанон 2-Octanon 173 173 80 80 82 82 12,5 12.5 162 162 2-Ацетилциклогексанон 2-acetylcyclohexanone 225 225 100 one hundred 54 54 24 24 175 175 Циклогексанон Cyclohexanone 156 156 134 134 99 99 1 one >154 > 154 Ментон Menton 207 207 110 110 72 72 11 eleven 172 172 Контрольный (слепой) Control (blind) - - 450 450 5 5 0 0

* Относительная отталкивающая способность = [(% взлет + % реакции лапки) х температура кипения /1 00* Relative repulsive ability = [(% take-off +% reaction of the foot) x boiling point / 1 00

Предлагаемый в данном описании способ построения новых химических структур, проявляющих выбранные заранее функциональные характеристики или свойства, был описан только на примере. Например, способ можно легко применить на практике, используя другие известные или приемлемые значения поляризуемостей, дипольных моментов, ковалентных радиусов и тому подобное. Кроме того, блоксхемы, дающие стадии расчета процесса в модулях, предназначены только для иллюстрации. Например, расчет сродства можно провести с применением доступных вычислительных пакетов, используя меньше аппроксимаций (приближений), чем сделано в данном описании. Способ образования новых химических структур опирается на первую генерацию одного или более моделированных рецепторов, проявляющих заранее выбранное сродство к известным соединениям-мишеням со сходными функциональными характеристиками и на использовании этих рецепторов для создания новых структур, обладающих этими характеристиками в заданной степени. Рецепторы сами по себе можно использовать для других применений, помимо образования (генерации) новых химических структур, например, как средство для скрининга фармацевтических или токсокологических свойств известных соединений. Таким образом, специалистам в данной области понятно, что многие изменения способа, данного в настоящем описании, могут быть сделаны не за рамками изобретения.The method proposed in this description for constructing new chemical structures exhibiting pre-selected functional characteristics or properties has been described only by way of example. For example, the method can be easily put into practice using other known or acceptable values of polarizabilities, dipole moments, covalent radii, and the like. In addition, the block diagrams giving the stages of the process calculation in the modules are for illustration purposes only. For example, the affinity calculation can be carried out using available computing packages using fewer approximations (approximations) than is done in this description. The method for the formation of new chemical structures is based on the first generation of one or more simulated receptors exhibiting a pre-selected affinity for known target compounds with similar functional characteristics and on the use of these receptors to create new structures possessing these characteristics to a given degree. The receptors themselves can be used for other applications, in addition to the formation (generation) of new chemical structures, for example, as a means for screening the pharmaceutical or toxicological properties of known compounds. Thus, it will be understood by those skilled in the art that many changes to the method described herein may not be made outside the scope of the invention.

Таблица 1Table 1

Переходные состояния и коэфф ициенты добавленийTransitional states and addition coefficients

Старое состояние Old state Коэффициенты присоединения Joining ratios Новое состояние для поворота = New state to rotate = Δχ Δχ Δу Δy Δζ Δζ Правый Right Вверх Up Левый Left Вниз Down 1 one 0 0 1 one 0 0 2 2 4 4 3 3 5 5 2 2 -1 -one 0 0 0 0 15 fifteen 6 6 1 one 24 24 3 3 1 one 0 0 0 0 1 one 7 7 15 fifteen 22 22 4 4 0 0 0 0 -1 -one 12 12 23 23 14 14 1 one 5 5 0 0 0 0 1 one 9 nine 1 one 16 sixteen 23 23 6 6 0 0 0 0 -1 -one 11 eleven 20 twenty 10 10 2 2 7 7 0 0 0 0 -1 -one 13 thirteen 21 21 8 8 3 3 8 8 0 0 -1 -one 0 0 7 7 9 nine 24 24 14 14 9 nine -1 -one 0 0 0 0 17 17 10 10 5 5 8 8 10 10 0 0 1 one 0 0 6 6 14 14 22 22 9 nine 11 eleven 0 0 -1 -one 0 0 22 22 16 sixteen 6 6 12 12 12 12 -1 -one 0 0 0 0 18 eighteen 11 eleven 4 4 13 thirteen 13 thirteen 0 0 1 one 0 0 24 24 12 12 7 7 16 sixteen 14 14 1 one 0 0 0 0 4 4 8 8 18 eighteen 10 10 15 fifteen 0 0 -1 -one 0 0 3 3 17 17 2 2 18 eighteen 16 sixteen 1 one 0 0 0 0 5 5 13 thirteen 17 17 11 eleven 17 17 0 0 0 0 -1 -one 16 sixteen 19 nineteen 9 nine 15 fifteen 18 eighteen 0 0 0 0 1 one 14 14 15 fifteen 12 12 19 nineteen 19 nineteen 0 0 1 one 0 0 20 twenty 18 eighteen 21 21 17 17 20 twenty 1 one 0 0 0 0 23 23 24 24 19 nineteen 6 6 21 21 -1 -one 0 0 0 0 19 nineteen 22 22 23 23 7 7

22 22 0 0 0 0 1 one 10 10 3 3 11 eleven 21 21 23 23 0 0 -1 -one 0 0 21 21 5 5 20 twenty 4 4 24 24 0 0 0 0 1 one 8 8 2 2 13 thirteen 20 twenty

Формула для алгоритма: Входные данные (старое состояние, поворот) выходные данные (Ах, Ау,Formula for the algorithm: Input data (old state, rotation) output data (Ah, Au,

Δζ, новое состояние)Δζ, new state)

Пример: исходное положение (12, 34, -18); Входные данные: старое состояние =10, поворот = вправо:Example: starting position (12, 34, -18); Input data: old state = 10, turn = right:

Выходные данные: новое состояние = 6, Δх=0, Δу=1, Δζ=0; Последующее положение (12, 35, -18).Output data: new state = 6, Δх = 0, Δу = 1, Δζ = 0; Subsequent position (12, 35, -18).

Таблица 2table 2

Радиусы Ван-дер-ВаальсаVan der Waals Radii

Элемент Element Н N Р R О ABOUT N N С FROM С1 C1 3 3 Вг Vg Р R I I Радиус Ван-дер-Ваальса (пикометры) Van der Waals Radius (picometers) 110 110 140 140 150 150 150 150 170 170 180 180 180 180 190 190 190 190 200 200 Относительный радиус (Н=0,5) Relative radius (H = 0.5) 0,5 0.5 0,64 0.64 0,68 0.68 0,68 0.68 0,77 0.77 0,82 0.82 0,82 0.82 0,86 0.86 0,86 0.86 0,91 0.91

Взято из: N.8. Ьзасз, 1987. Рйу81са1 Огдатс СйетЫгу. Ьопдтап Заепййс апб Тесйтса1, №\ν Уогк. 828 рр.Adapted from: N.8. Lzasz, 1987. Ryu81sa1 Ogdats Syetugu. Lopdtap Zaepyys apb Tesytsa1, No. \ ν 828 pp.

Таблица 3Table 3

Радиус ковалентных связей (пМ)The radius of covalent bonds (PM)

Порядок связи Communication order Первый First Н 28 В N 28 IN С FROM N N О ABOUT Р R Первый First 88 88 77 77 70 70 66 66 64 64 Второй Second 66.5 66.5 60 60 55 55 Третий Third 60.2 60.2 55 55 Ароматический Aromatic Р R 70 3 70 3 С1 C1 Первый First 117 117 110 110 104 104 99 Вг 99 Vg Первый First 114 114

Взято из: N.3. Тззасз (1987).Adapted from: N.3. Tzzazz (1987).

Таблица 4Table 4

Значения эффективных дипольных моментов, применяемых для отнесения зарядаValues of effective dipole moments used for charge assignment

Связь Communication Атом Atom Величина дипольного момента (Дебай) The magnitude of the dipole moment (Debye) С-Н CH Н N +0,35 или +0,084* +0.35 or + 0.084 * С FROM нет отнесения заряда no charge attribution АгС-Н AgS-N Н N +0,6 +0.6 С FROM -0,366 или нет отнесения заряда -0.366 or no charge attribution =С-Н = CH Н N +0,366 +0.366 С FROM -0,6 или нет отнесения заряда -0.6 or no charge attribution С=О C = O О ABOUT -2,7 -2.7 С FROM нет отнесения заряда* или +1,35 no charge assignment * or +1.35 С-О-С SOS О ABOUT -0,8 -0.8 С-ОН SLEEP Н N +1,5 или +1,7 +1.5 or +1.7 О ABOUT -1,1 -1.1 С-ЫН2 SUN 2 Н N +1,3 +1.3 N N -1,3 -1.3 С-ЫО2 C-YO2 О ABOUT -2,0 -2.0 N N +4,0 +4.0 С N C n N N -3,7 -3.7 С FROM нет отнесения заряда no charge attribution С-З-С S-S-S 3 3 в тиофене или диметилсульфиде +1,5* (может быть отрицательно заряжен в контексте) in thiophene or dimethyl sulfide + 1.5 * (may be negatively charged in context) С-Ы=С C-S = C N N в пиридине или СН3-Ы=СН2 +1,5 или +1,3in pyridine or CH 3 —Y = CH 2 +1.5 or +1.3 Аг-Р или С=С-Р Ar-P or C = CP Р R -1,3 -1.3 С-Р SR Р R -1,8 -1.8

Аг-С1 или С=С-С1 Ar-C1 or C = C-C1 С FROM -1,7 -1.7 С-С1 C-C1 С1 C1 -2,1 -2.1 Аг-Вг или С=С-Вг Ar-Br or C = C-Br Вг Vg -2,0 -2.0 С-Вг S-Vg Вг Vg -2,0 -2.0 С-1 S-1 I I -2,0 -2.0

* Предпочтительно в большинстве случаев* Preferable in most cases

Каждый атом мишени полностью описывается набором из восьми значений {х;, у;, ζ„ η, Ьг1, сг1, б1, α}!, где х;, у и ζ координаты положений относительно геометрического центра молекулы, г1 означает радиус Ван дер Ваальса, Ьг1 означает связь или ковалентный радиус, сг1 означает радиус перекрывания (столкновения) (=г1+0,5), α! означает поляризуемость и б1 означает величину эффективного дипольного момента.Each target atom is completely described by a set of eight values {x ; , y ; , ζ „η, bg 1 , cr 1 , b 1 , α} !, where x ;, y and ζ are the coordinates of the positions with respect to the geometric center of the molecule, r 1 means the van der Waals radius, bg 1 means the bond or the covalent radius, c 1 means the radius of overlap (collision) (= g 1 +0.5), α! means polarizability and b 1 means the value of the effective dipole moment.

Таблица 5Table 5

Выбранные значения относительных эффективных поляризуемостей атомов отобранных мишенейSelected values of the relative effective polarizabilities of the atoms of the selected targets

Атом Atom Контекст Context Относительная поляризуемость (α1)Relative polarizability (α 1 ) Н N С-Н CH 1,0 1,0 Н N N-11 N-11 1,1 1,1 Н N О-Н IT 1,1 1,1 Н N 8-Н 8-N 3,0* 3.0 * Р R С-Р SR 1,5* 1.5 * С1 C1 С-С1 C-C1 4,0 4.0 Вг Vg С-Вг S-Vg 5,8 5.8 I I С-1 S-1 8,9* 8.9 * С FROM С-СН3 C-CH3 3,7 3,7 С FROM С-СН2-С C-CH2-C 3,5 3,5 С FROM С-СС2-Н S-SS2-N 3,2 3.2 С FROM С=СН2 C = CH2 4,5 4,5 С FROM С=СН-С C = CH-C 4,3 4.3 Ζ Ζ С=СС2 C = CC2 4,0 4.0 С FROM С С-Н C SN 4,9* 4.9 * С FROM С С-С C-C 4,6* 4.6 * С FROM Арил Aryl 4,3* или 2,6 (на основе бензола (делокализованное электронное облако) 4.3 * or 2.6 (based on benzene (delocalized electron cloud) С FROM С-С=N C-C = N 4,0 4.0 С FROM С3-С-О- C3-C-O- 3,6 3.6 С FROM С2Н-С-О- S2H-S-O- 3,8 3.8 С FROM СН2-С-О- CH2-C-O- 4,1 4.1 С FROM Н3-С-О- H3-C-O- 4,4 4.4 С FROM С2-С=О- C2-C = O- 3,6 3.6 С FROM СН-С=О- CH-C = O- 3,8 3.8 С FROM С2-С=N C2-C = N ? ? С FROM СН-С=N CH-C = N ? ? С FROM Сэ-С-И S-S-I 3,1 3,1 С FROM С2Н-С^ C2H-C ^ 3,3 3.3 С FROM СЩ-С-Ц SSH-S-Ts 3,6 3.6 С FROM Нз-С-Ы NZ-S-S 3,8 3.8 О ABOUT С-О-Н SLEEP 2,1 2.1 О ABOUT С=О C = O 2,1 2.1 О ABOUT С-О-С SOS 1,8 1.8 О ABOUT ; \ Oh ; 1,9* 1.9 * N N С-МН2 S-MH 2 3,1 3,1 N N С-НН-С C-HH-S 2,8* 2.8 * N N С^С2 C ^ C2 2,5* 2.5 * N N ; \ Oh ; 4,5* (может быть больше в малых молекулах) 4,5 * (maybe more in small molecules) N N С N C n 3,2 3.2 8 8 С=8 C = 8 7,7 7.7 8 8 С-8-С C-8-C ? ? 8 8 С-8-Н S-8-N 5,0 5,0

* Вычислено исходя из молекулярных поляризуемостей.* Calculated based on molecular polarizabilities.

? Значения могут быть определены на основе соответствующих молекулярных данных.? Values can be determined based on the corresponding molecular data.

Модуль 1: Генерация программного кода для расчета моделированных рецепторов.Module 1: Generating software code for calculating simulated receptors.

Операция 1. Введите параметры объектного кода (генерации команд): ι) длина (число символов) кода; и ΐΐ) частота команд.Step 1. Enter the parameters of the object code (command generation): ι) length (number of characters) of the code; and ΐΐ) frequency of commands.

Операция 2. Инициализируйте пустую строку для записи кода в памяти.Step 2. Initialize an empty line to write code in memory.

Операция 3. Генерируйте случайное число.Operation 3. Generate a random number.

Операция 4. Исходя из случайного числа и частоты команд, выберите символ {'0', '1',..., '6'} для конкатенации со строкой кода. Повторяйте операцию 4 до тех пор, пока длина строки не сравняется с предварительно заданной длиной кода.Operation 4. Based on a random number and frequency of commands, select the symbol {'0', '1', ..., '6'} to concatenate with a line of code. Repeat step 4 until the line is equal to the predefined code length.

Операция 5. Выведите код.Step 5. Print the code.

Модуль 2: Трансляция кода для расчета моделированных рецепторов.Module 2: Code Translation for Calculating Simulated Receptors.

Операция 1 . Введите начальные координаты полимеров, входящих в состав (составляющих) рецептора.Operation 1. Enter the initial coordinates of the polymers that make up the (constituent) receptor.

Операция 2. Введите код полимера.Step 2. Enter the polymer code.

Операция 3. Прочитайте первый символ кода.Step 3. Read the first character of the code.

Операция 4. Если символ является командой поворота, используйте алгоритм трансляции для определения координат субъединицы, иначе перейдите к операции 7.Operation 4. If the symbol is a rotation command, use the translation algorithm to determine the coordinates of the subunit, otherwise go to step 7.

Операция 5. Введите в память координаты субъединицы. Присвойте субъединице величину заряда 0.Step 5. Enter the subunit coordinates into memory. Assign the charge 0 to the subunit.

Операция 6. Если символ не является последним символом кода, повторите операцию 3, иначе перейдите к следующей операции.Step 6. If the character is not the last character of the code, repeat step 3, otherwise go to the next step.

Операция 7. Если символ представляет собой команду заряда, примените алгоритм трансляции для определения координат субъединицы, не предполагающих поворота.Operation 7. If the symbol is a charge command, use the translation algorithm to determine the coordinates of the subunit that do not involve rotation.

Операция 8. Сохраните в памяти координаты субъединицы. Присвойте субъединице величину заряда +1 или -1 в зависимости от символа.Step 8. Store the subunit coordinates in memory. Assign a charge of +1 or -1 to the subunit, depending on the character.

Операция 9. Если символ не является последним символом кода, повторите операцию 3, иначе перейдите к следующей.Step 9. If the character is not the last character of the code, repeat step 3, otherwise go to the next.

Операция 1 0. Повторите операции с 2 до 9 для каждого из полимеров, входящих в состав рецептора.Step 1 0. Repeat steps 2 through 9 for each of the polymers that make up the receptor.

Операция 11 . Выведите координаты и значения зарядов субъединицы.Operation 11. Print the coordinates and values of the charges of the subunit.

Модуль 3: Презентация мишени.Module 3: Presentation of the target.

Операция 1 . Введите координаты и радиусы атомов мишени (χΈ, уЕ, ζΐ£, радиус^ (1=число атомов в мишени)Operation 1. Enter the coordinates and radii of the target atoms (χΈ, уЕ, ζΐ £ , radius ^ (1 = number of atoms in the target)

Введите координаты рецептора (хг,, у!}, ζη, зарод)Enter the coordinates of the receptor (xg ,, y!}, Ζη, nucleus)

()=число субъединиц в рецепторе)() = number of subunits in the receptor)

Операция 2. Задайте случайные значения углов (Δθ, Δφ) и сдвига (кх, ку).Step 2. Set the random values of the angles (Δθ, Δφ) and shift (k x , k y ).

Операция 3. Вращайте и сдвигайте координаты атомов на случайную величину.Operation 3. Rotate and shift the coordinates of atoms by a random value.

Операция 3 а. Переведите координаты мишени в полярную форму (х±ь уГ, ζΪ£, радиус^ (θι, φι, ρι, радиус))Operation 3 a. Translate the coordinates of the target into the polar form (х ± b уГ, ζΪ £, radius ^ (θι, φι, ρι, radius))

Операция 3Ь. Добавьте произвольные изменения к углам (θ), ф), Р), радиус)) (θ)+Δθ), ф^+Δф^, рь радиус))Operation 3b. Add arbitrary changes to the angles (θ), f), P), a radius)) (θ) + Δθ) , f + Δf ^ ^ e r radius))

Операция 3 с. Переведите в систему декартовых (прямоугольных) координат (θ)+Δθ), ф^+Δф^, рь радиус)) (хь ух, ζχ, радиус)Operation 3 s. Turn in Cartesian (rectangular) coordinate (θ) + Δθ), f + Δf ^ ^ e r radius)) (x s x y, ζ χ, radius)

Операция 3ά. Добавьте случайный сдвиг (χηχ, упь ζηχ, радиус)) (ххх, у+ку, ζχ, радиус)Operation 3ά. Add a random shift (χη χ , y ζη χ , radius)) (x x + k x , y + k y , ζ χ , radius)

Операция 4. Поместите центр мишени в начало координат (0,0,0).Step 4. Place the center of the target at the origin (0,0,0).

Операция 4а. Найдите максимальное и минимальное значения для хп), уп), ζη).Operation 4a. Find the maximum and minimum values for xn), yn), ζη).

Операция 4Ь. Найдите геометрический центр рецептора у'П центр (УИ-максимумАИ-минимумХ2, (ζη Operation 4b. Find the geometric center of the receptor at the 'U Center (IM-maksimumAI minimumH-2, (ζη

Чмаксимум ζη минимум )/2. Maximum ζη minimum ) / 2.

Операция 4с. Вычислите координаты относительно центра (хпс,, упс,, ζησ^^ί-χη^^ρ, уп1-уПцонтр, ζηχ- ^И-максимум).Operation 4s. Calculate the coordinates with respect to the center (xps ,, oops ,, ζησ ^^ ί-χη ^^ ρ, yn 1 -Uncontrol, ζη χ - ^ I-maximum).

Операция 5. Используйте радиусы атомов и преобразованные координаты (хпс), упс), ζη^, радиус)) для построения поверхности столкновения мишени β(χ§^§)=ζ§ Operation 5. Use the radii of the atoms and the transformed coordinates (xps), oops), ζη ^, radius)) to construct the collision surface of the target β (χ § ^ § ) = ζ §

Операция 5а. Создайте координатную сетку с интервалом, равным диаметру субъединицы рецептора (=1). Координаты сетки: х8е{1п±(хпмиимум- хх^ентр), 1пЦхйШ1Имум - х&нтр ) + 1 . . .0, . . 1п1(хпмаксимум- хп центр) * Е 1п£(хПмаксимум* ^^центр)} у8е{1п1(упминимум- уц^лЛ 1п1(у^инимум - уйнтр ) + 1 . . .0, . . 1п1(уп максимум* УАентр) - Е Ь*(УП максимум* У^центр) }Operation 5a. Create a grid with an interval equal to the diameter of the receptor subunit (= 1). Coordinates of the grid: x 8 e {1n ± (xn miimum - xx ^ center), 1nCxy 1 Imum - x & ntr ) + 1. . .0,. . 1n1 (xn maximum - xn center) * E 1n £ (xn maximum * ^^ center)} y 8 e {1n1 (yn minimum - yn ^ lLnn (y ^ at least - ynntr ) + 1 ... 0.,. . 1n1 (yn maximum * Uaenter) - E b * (Yn maximum * Y ^ center)}

Задайте нулевые начальные значения ё(х§,у§) во всех точках координатной сетки.Set zero initial values of ё (х§, у§) at all points of the coordinate grid.

Операция 5Ь. Для каждого атома (ΐ) задайте значение д(х§§) (вес) каждой точки координатной сетки (х§§) в соответствии со следующим правилом:Operation 5b. For each atom (ΐ), set the value g (x § , y § ) (weight) of each grid point (x § , y § ) in accordance with the following rule:

Для ί = от 1 до числа атомов в мишениFor ί = from 1 to the number of atoms in the target

Если (хпсгхр)2 + (упС)-ур)2 < радиус)2, тогда ё(х§,у§) = минимум (§(х§,у§), ζη^ - радиус))If (xps r x p ) 2 + (ynC) -ur) 2 <radius) 2 , then e (x§, y§) = minimum (§ (x§, y § ), ζη ^ is the radius))

ИначеOtherwise

Если (хпсгхр)2 + (упС)-ур)2 < радиус)+ .5)2, тогда §(х§,у§) = минимум (§(х§§), ζη^ - радиус!/2)) If (xps r x p ) 2 + (ynC) -ur) 2 <radius) + .5) 2 , then § (x§, y § ) = minimum (§ (x § , y § ), ζη ^ is the radius s ! / 2))

Еще ё§,у§) = минимум (ё^уД 0) Also e (x § ,) = minim y m (e ^ yD 0)

Затем ίThen ί

Операция 6. Поместите центр рецептора в начало координат (0,0).Step 6. Place the center of the receptor at the origin (0,0).

Операция 6а. Найдите максимальное и минимальное значения хт,, γη и ζη.Operation 6a. Find the maximum and minimum values of xm ,, γη and ζη.

Операция 6Ь. Найдите геометрический центр рецептора хгцентр=(хгмаксимум-хгминимум)/2, угцентр=(уг максимум-уГ минимум )/2, ^Гцентр (^Гмаксимум“^Гминимум)/2 Operation 6b. Find the geometric center of the receptor xg center = ( xg maximum -xG minimum ) / 2 , yr center = ( yg maximum -yG minimum) / 2, ^ G center ( ^ G maximum “^ G minimum ) / 2

0, .0,0, .0,

Операция 6с. Вычислите координаты рецептора относительно центра (хс^ ус^ ζοί)=(χΓί хцентр, уПцентр, ^Г1-^максимум)·Operation 6s. Calculate the coordinates of the receptor relative to the center (xc, yc ^ ^ ζο ί) = (χΓ ί x center, y n y Center, G ^ 1 - ^ max) ·

Операция 7. Постройте поверхность столкновения рецептора з(х88)=78, используя координаты рецептора относительно центра в соответствии со следующим правилом:Operation 7. Build the collision surface of the receptor s (x 8 , y 8 ) = 7 8 using the coordinates of the receptor relative to the center in accordance with the following rule:

Задайте все начальные значения з(хс8,ус8) кSet all the initial values of s (xs 8 , us 8 ) to

Для й = от 1 до числа субъединиц в рецепторе, если ζ^ > 8(хс|,уср, тогда 8(χο^θ|)=ζθίFor = = from 1 to the number of subunits in the receptor, if ζ ^> 8 (xc |, usr, then 8 (χο ^ θ |) = ζθί

Переходите к следующему й‘.Go to the next й.

Операция 8. Найдите минимальное расстояние между поверхностью столкновения рецептора и поверхностью столкновения мишени. Рассчитайте разностную матрицу 4(х§§) следующим образом для всех х8е{1п£(хпминимум- хд,е11тр), 1п£(хц шшмум Хйнтр ) + 1Step 8. Find the minimum distance between the collision surface of the receptor and the collision surface of the target. Calculate the difference matrix 4 (x § , y § ) as follows for all x 8 e {1n £ (xn minimum - xd, e11tr ), 1n £ (xx wxhm Xntr) + 1

1п£(хпмаксимум- хп центр) 1, 1п£(хпмаксимум- хпЦС11тр)} и Уае{1п£(упминимум- уПценТр), ЬКуп™,,^- уц,ентр) + 1 1п£(упмаксимум- упцептр) - 1, 1п£(упмакснмум- упцептр)}1P £ (x max - x center) 1, 1P £ (x max - x TsS11tr)} and {In AU 1P £ (y minimum - the UOC UNT p), Kup ™ ,, ^ - yu, Centralized) + 1 1P £ (yn maximum - ynpt ) - 1, 1n £ (yn maxnum - ynpt )}

Вычислите 4(х§§) = (Н(х§§) - ζηминимум + ζпмаксимум) + (8(х§,У§) + ^минимум - ^максимум)Calculate 4 (x § , y § ) = (H (x § , y § ) - ζη m minimum + ζп maximum ) + ( 8 ( x §, у §) + ^ minimum - ^ maximum)

Для всех х§§ найдите минимальное значение 4(х§§) = 4тЬ с1т|п означает минимальное расстояние.For all x § , y §, find the minimum value 4 (x § , y § ) = 4 mb c1 m | n means the minimum distance.

Операция 9. Трансформируйте координаты конфигурации столкновения (коллизии) мишени и рецептора.Step 9. Transform the coordinates of the collision configuration (collision) of the target and receptor.

Для рецептора:For the receptor:

(хрецепторр урецепторр ζрецептор^)=(хс^, уср ζ^ + Минимум -^максимум)(hretseptorr uretseptorr ζretseptor) = (^ xc, yc p ζ ^ + Minimum - ^ max)

Для мишени: (хмишеньь умишеньь ζмишень1)=(хηс1, упсх, ζη^ - ζпминимум +For a target (s hmishen umishen ζmishen s 1) = (hηs 1 x ups, ζη ^ - + ζpminimum

2‘Пмаксимум-йт1п).2 ' n max-ym1n ) .

Операция 10. Примените (хмишеньь умишеньь ζмишень^) и (хрецепторр урецепторр ζрецептор^) для расчетов сродства.Operation 10 Use (s hmishen umishen ζmishen s ^) and (hretseptorr uretseptorr ζretseptor ^) for the affinity calculations.

Повторите операции 2-9 для расчета конфигурации каждой испытуемой мишени.Repeat steps 2–9 to calculate the configuration of each test target.

Модуль 4: Расчёт сродства.Module 4: Calculating Affinity.

Операция 1 . Введите координаты столкновения мишени и рецептора (хмишень^ умишеньь ζмишень^) и (хрецепторр урецепторр ζрецептор^), где ι = число атомов в мишени, й = число субъединиц в рецепторе.Operation 1. Type coordinates collision target and receptor (hmishen umishen ^ s ^ ζmishen) and (hretseptorr uretseptorr ζretseptor ^) where ι = number of atoms in the target, d = number of subunits in the receptor.

Операция 2. Введите значения дипольных моментов для мишени (άΐρ(ΐ)) дип(1)Step 2. Enter the dipole moment values for the target ((ρ (ΐ)) dip (1)

Введите значения зарядов для рецептора заряд 0)Enter the charge values for the receptor charge 0)

Операция 3. Введите пороговое значение для расчета проксимальности ΤΗΚΕ8ΗΟΡΌ (порог)Step 3. Enter the threshold value for calculating proximality ΤΗΚΕ8ΗΟΡΌ (threshold)

Операция 4. Рассчитайте значение сродства диполяStep 4. Calculate the dipole affinity

Операция 4а. Для каждой заряженной субъединицы (заряд 0)^0) рассчитайте е(1,й)=дип(1)/(хмишеньгхрецептор^2 + (умишень - урецепторр2 + ^мишень^рецепторр2)1,5.Operation 4a. For each subunit charged (charge 0) = 0) to calculate e (1, j) = dip (1) / (r hmishen hretseptor ^ 2 + (umishen - uretseptorr ^ 2 + target retseptorr ^ 2) 1.5.

Операция 4Ъ. Вычислите сумму е(О для всех комбинаций ι и й с зарядом 0)^0.Operation 4b. Calculate the sum e (0 for all combinations of v and d with a charge of 0) ^ 0.

(ДИПОЛЬ) ЭЙРОБЕ = Ее(Ц)(DIPOLE) EYROBE = Her (C)

Операция 5. Рассчитайте значение проксимальности (эту операцию можно заменить расчётом на основе поляризуемости)Operation 5. Calculate the proximal value (this operation can be replaced by a calculation based on polarizability)

Операция 5а. Для каждого атома мишени с №(1)| < 0,75Operation 5a. For each atom of the target with No. (1) | <0.75

Вычислите 1(Ц) = ((хмишеньгхрецепторр2 + (умишень - урецепторр2 + ^мишень ζрецептор^)2)0,5 Calculate 1 (C) = ((target г receptor 2 + (target - ureceptor 2 + ^ target ζ receptor ^) 2 ) 0.5

Если 1(0 < ПОРОГ, тогда ргох(0 = 1If 1 (0 <THRESHOLD, then prox (0 = 1

Операция 5Ъ. Вычислите сумму ргох(0 для всех комбинаций ι и й с |дип(й)| < 0,75Operation 5b. Calculate the sum rgox (0 for all combinations of v and th with | dip (s) | <0.75

ΡΚΟΧΙΜΙΤΥ (ПРОКСИМАЛЬНОСТЬ) = Σ ргох(ОΡΚΟΧΙΜΙΤΥ (PROXIMALITY) = Σ rgo x ( O

Операция 6. Рассчитайте значение сродства для комбинации мишень-субстрат = СРОДСТВО (ΑΡΡΙΝΙΤΥ)Step 6. Calculate the affinity for the target-substrate combination = affinity (ΑΡΡΙΝΙΤΥ)

СРОДСТВО = (ПРОКСИМАЛЬНОСТЬ/й) (ПРОКСИМЛЛЬНОСТЬ/10000 + ДИПОЛЬ),Affinity = (PROXIMALITY / th) (PROXIMILITY / 10000 + DIPOLE),

ΑΡΡΙΝΙΤ = (ΡΚΟΧΙΜΙΤΥ/й) (ΡΚΟΧΙΜΙΤΥ/ 10000) + ΌΙΡΟΡΕ)ΑΡΡΙΝΙΤ = (ΡΚΟΧΙΜΙΤΥ / d) (ΡΚΟΧΙΜΙΤΥ / 10000) + ΌΙΡΟΡΕ)

Модуль 5: Расчёт степени соответствия.Module 5: Calculating the degree of compliance.

Операция 1 . Введите значения эффективности или сродства известной мишени (ук), к = число испытуемых мишенейOperation 1. Enter the efficacy or affinity values of a known target (y k ), k = number of tested targets

Операция 2. Введите координаты коллизии (столкновения) мишеней и рецептора (хмишеньА, умишеньА, ζмишень^) и (хрецепторр урецепторр ζрецептор^), где 1к = число атомов в мишени к, й = число субъединиц в рецептореStep 2. Enter the coordinates of the collision (collision) of the targets and the receptor (target A , target A , ζ target ^ ) and (chreceptor ureceptor ζ receptor ^), where 1 k = number of atoms in the target k, и = number of subunits in the receptor

Операция 3. Введите число подлежащих тестированию ориентаций мишени (=т).Step 3. Enter the number of target orientations to be tested (= t).

Операция 4. Используйте Модуль 5 для получения значений сродства для каждой мишени и ориентации мишени ^ΑΡΡΙΝΙΤΥ^).Step 4. Use Module 5 to obtain affinity values for each target and target orientation (^ ΑΡΡΙΝΙΤΥ ^).

Операция 5. Определите значения максимального сродства (МСк) (МАк) и суммарного сродства (ССк) (8Ак) для каждой мишени.Step 5. Determine the maximum affinity (MS k ) (MA k ) and total affinity (SS k ) (8A k ) for each target.

Операция 6. Вычислите коэффициенты корреляции гМС 2 (гМА2) для максимального сродства (МСк; МАк) относительно величин эффективности известной мишени или величины характеристик сродства (ук) и г 2 для суммарного сродства (ССк; 8Ак) относительно величин эффективности и сродства известной мишени (ук).Operation 6. Calculate the correlation coefficients g MS 2 (gMA 2 ) for maximum affinity (MSC; MA k ) relative to the efficiencies of a known target or the value of affinity characteristics (y k ) and g 8A 2 for total affinity (SS k ; 8A k ) relative values of efficiency and affinity of a known target (uk).

Операция 7. Рассчитайте коэффициент соответствия Ρ Ρ = МА2 Х Г§а2)0,5 Operation 7. Calculate the compliance coefficient Ρ Ρ = (g MA 2 X G § a 2) 0.5

ИлиOr

Операция 6'. Рассчитайте коэффициенты корреляции гМА 2 для максимального сродства (МАк) относительно величин эффективности сродства известной мишени (ук) и г8А-МА2 для суммарного сродства (8Ак) - максимальное сродство относительно величин эффективности и сродства известной мишени (ук).Operation 6 '. Calculate the correlation coefficients g MA 2 for maximum affinity (MAk) relative to the affinity efficiency values of a known target (yk) and g8A-MA 2 for total affinity (8Ak) - maximum affinity relative to the efficiency and affinity values of a known target (yk).

Операция 7'. Рассчитайте коэффициент соответствия Ρ Ρ = МА2 Х (1 -Г8А-МА2))0,5 Operation 7 '. Calculate the compliance coefficient Ρ Ρ = (g MA 2 X (1-G 8A-MA 2)) 0.5

Модуль 6: Генерируйте генотип с минимальной степенью сродства.Module 6: Generate a genotype with a minimum degree of affinity.

Операция 1 . Задайте порог минимального соответствияOperation 1. Set minimum compliance threshold

Операция 2. Генерируйте случайный генотип (Модуль 1 )Step 2. Generate a Random Genotype (Module 1)

Операция 3. Транслируйте генотип для построения фенотипа (Модуль 2)Step 3. Translate the genotype to build the phenotype (Module 2)

Операция 4. Проверьте сродство фенотипа к мишеням (Модули 3, 4, 5, 6)Step 4. Check the affinity of the phenotype for the targets (Modules 3, 4, 5, 6)

Операция 5. Если степень соответствия фенотипа превышает пороговое значение, прекратите генерацию кода и перейдите к исполнению Фазы 2. Иначе повторите операции 1-5.Step 5. If the degree of phenotype compliance exceeds the threshold value, stop generating the code and proceed to the execution of Phase 2. Otherwise, repeat steps 1-5.

Модуль 7: Множественная мутация.Module 7: Multiple Mutation

Операция 1. Введите первичный код (из Фазы 1 ).Step 1. Enter the primary code (from Phase 1).

Операция 2. Введите число (=с|) мутаций в коде (в данном случае мутирует 2,5-5% символов в генотипе).Step 2. Enter the number (= c |) of mutations in the code (in this case, 2.5-5% of the characters in the genotype mutate).

Операция 3. Введите размер популяции (=р).Step 3. Enter the population size (= p).

Операция 4. Произвольно выберите позицию в генотипе.Step 4. Randomly select a position in the genotype.

Операция 5. Замените символ кода в данной позиции другим, произвольно выбранным символом.Step 5. Replace the code symbol at this position with another, arbitrarily selected symbol.

Операция 6. Повторите операции 4 и 5, пока не достигнете числа ц (ц раз).Step 6. Repeat steps 4 and 5 until you reach the number q (q times).

Операция 7. Повторите операции 4-6, пока общая сумма новых генерированных кодов не достигнет р.Operation 7. Repeat operations 4-6 until the total amount of newly generated codes reaches p.

Операция 8. Примените Модули 1-6 для проверки соответствия мутантной популяции. Выберите субпопуляцию с наибольшей селективностью для применения в Фазе 3.Step 8. Apply Modules 1-6 to verify the mutant population. Select the subpopulation with the highest selectivity for use in Phase 3.

Модуль 8: Рекомбинация.Module 8: Recombination.

Операция 1 . Введите размер популяции (=р).Operation 1. Enter the population size (= p).

Операция 2. Выберите произвольно два кода из популяции, генерированной Фазой 2.Step 2. Choose two codes from a population generated by Phase 2 at random.

Операция 3. Произвольно выберите позицию в генотипе.Step 3. Randomly select a position in the genotype.

Операция 4. Создайте случайное число для числа обмениваемых символов.Step 4. Create a random number for the number of characters exchanged.

Операция 5. Поменяйте местами символы между кодами, начиная с выбранной позиции.Step 5. Swap the characters between the codes, starting from the selected position.

Операция 6. Повторите операции 2-5 до создания р новых генотипов.Step 6. Repeat steps 2–5 until p new genotypes are created.

Операция 7. Примените Модули 2-6 для проверки соответствия мутантной популяции. Выберите субпопуляцию с наибольшей селективностью для следующей серии рекомбинаций или для созревания в Фазе 4.Step 7. Apply Modules 2-6 to verify compliance with the mutant population. Choose the subpopulation with the highest selectivity for the next series of recombinations or for maturation in Phase 4.

Модуль 9: Созревание.Module 9: Ripening.

Операция 1 . Введите начальный код, образованный на основании Фазы 3.Operation 1. Enter the start code generated from Phase 3.

Операция 2. Введите число итераций.Step 2. Enter the number of iterations.

Операция 3. Выберите произвольно позицию в исходном генотипе.Step 3. Choose an arbitrary position in the original genotype.

Операция 4. Замените символ кода в этой позиции на другой, произвольно выбранный символ.Operation 4. Replace the code symbol in this position with another, arbitrarily selected symbol.

Операция 5. Проверьте селективность кода предшественника (Рр) и продукта мутации (Рм), используя Модули 2-6.Step 5. Verify the selectivity of the precursor code (P p ) and mutation product (P m ) using Modules 2-6.

Операция 6. Если Рм > Рр, замените исходный генотип на продукт мутации.Step 6. If P m > P p , replace the original genotype with the mutation product.

Операция 7. Повторите операции 3-6 требующееся число итераций.Step 7. Repeat steps 3–6 for the required number of iterations.

Модуль 1 0: Создание программного кода углеродного скелета. содержащего циклы (6членные циклы, точка входа = точка выхода).Module 1 0: Creating carbon skeleton code. containing cycles (6 membered cycles, entry point = exit point).

Операция 1 . Введите (длину) число символов в кодеOperation 1. Enter (length) the number of characters in the code

Введите ν1, ν2, ν3, ., νη (частота групп заместителей).Enter ν1, ν2, ν3,., Νη (frequency of substituent groups).

Введите ргоЪ_гшд (частота последовательности кода цикла). (0 < ргоЪ_гшд < 1)Enter pgb_hfd (cycle code sequence frequency). (0 <pgb_gfd <1)

Операция 2. Инициализируйте рптесобе = .Operation 2. Initialize pptesobe =.

Инициализируйте 8есоиб-собе = .Initialize 8soeb-sobe =.

Инициализируйте бйгб-собе = .Initialize bygb-sobe =.

Операция 3. Создайте строки символов.Step 3. Create character strings.

Повторите операцию 4 до получения кода заданной длины.Repeat step 4 until you get the code of the specified length.

Операция 4а. Если ргоЪ_гшд > гаибот (случайное число) (0 < гаибот < 1) тоOperation 4a. If ρο г ш д>> gaibot (random number) (0 <gaibot <1) then

Присваивание символов кольцу (условие ванны).Assigning characters to a ring (bath condition).

Задайте новый_символ_1 (ием_сНагас1ег_1) случайно выбранному члену из {'431413', '314134', '141343', '132132', '321321', '213213', '123123', '231231', '312312', '421412', '214124', '141242', '324234', '242343', '423432'}Set the new_symbol_1 (name_cNagas1eg_1) to a randomly selected member from {'431413', '314134', '141343', '132132', '321321', '213213', '123123', '231231', '312312', '421412', '214124', '141242', '324234', '242343', '423432'}

Присваивание символов заместителям.Assigning characters to alternates.

Задайте новый_символ_от_2 (ием_ сйагас1ег_2) до 6 членам, произвольно выбранным из {с1, с2, с3, ., си}, используя частоты ν1, ν2, ν3, ., νΐ'ΐ.Set the new_symbol_of_2 (em_syagas1eg_2) to 6 members arbitrarily selected from {c1, c2, c3,., Si} using the frequencies ν1, ν2, ν3,., Νΐ'ΐ.

(с1 . с2 представляют собой символы, определяющие различные функциональные группы).(c1. c2 are symbols defining various functional groups).

Присваивание символов валентностям заместителей.Assigning symbols to valencies of substituents.

Задайте новый_символ_от_3 (ием_ сйагас1ег_3) до 6 произвольно выбранным членам из {'1', '2', '3', '4'}.Set new_symbol_of_3 (em_syagas1eg_3) to 6 randomly selected members from {'1', '2', '3', '4'}.

ИначеOtherwise

Операция 4Ъ. Присваивание единичных (некольцевых) символов первичному коду.Operation 4b. Assignment of single (non-ring) characters to the primary code.

Задайте ием_сНагас1ег_1 (новый_символ_1) произвольно выбранному члену из {'1', '2', '3', '4'}.Set user_cNagas1eg_1 (new_symbol_1) to a randomly selected member from {'1', '2', '3', '4'}.

Отнесение символов к заместителям.Assigning characters to alternates.

Задайте ием_сНагас1ег_2 произвольно выбранному члену из {с1, с2, ., си}, применяя частоты ν 1, ν2, ν3, ., νιι.Set em_cNagas1eg_2 to an arbitrarily selected term from {c1, c2,., Si}, using the frequencies ν 1, ν2, ν3,., Νιι.

Присваивание символов валентностям заместителей.Assigning symbols to valencies of substituents.

Задайте пе\\_с11агас1ег_3 произвольно выбранному члену из {'1', '2', '3', '4'}.Set ne \\ _ c11agas1eg_3 to a randomly selected member from {'1', '2', '3', '4'}.

Операция 4с. Конкатенируйте новые символы со строками кода Рпте_соДе = Рпте_соДе апД пе\у_сНагас1ег_ 1 (первичный_код = первичный_код и новый_символ_1)Operation 4s. Concatenate new characters with lines of code Ppt_soDe = Ppt_cODe apD ne \ y_sNagas1eg_ 1 (primary_code = primary_code and new_symbol_1)

ЗссопД_соДс = ЗссопД_соДс апД пс\\_ сНагас1сг_2ZssopD_soODs = ZssopD_soODs apD ps \\ _ s Nagas1sg_2

ТЫгД_соДе = ТЫгД_соДе апД пс\\_ сНагас1сг_3TYGD_SODE = TYGD_SODE apD ps \\ _ sNagas1sg_3

Модуль 11: Множественная точечная мутация.Module 11: Multiple Point Mutation

Операция 1 . Введите первичный код.Operation 1. Enter the primary code.

Операция 2. Задайте число (=4) мутаций на код (В данном случае мутирует 2,5-5% символов генотипа).Step 2. Set the number (= 4) of mutations per code (In this case, 2.5-5% of genotype characters mutate).

Операция 3. Введите размер популяции (=р).Step 3. Enter the population size (= p).

Операция 4. Произвольно выберите позицию в генотипе.Step 4. Randomly select a position in the genotype.

Операция 5. Замените символы кода в этой позиции в каждом векторе кода другими, произвольно выбранными символами.Step 5. Replace the code characters at this position in each code vector with other, arbitrarily selected characters.

Операция 6. Повторите операции 4 и 5 до с| раз.Step 6. Repeat steps 4 and 5 to c | time.

Операция 7. Повторите операции 4-6, чтобы генерировать в сумме не р новых кодов.Step 7. Repeat steps 4–6 to generate a total of not new codes.

Операция 8. Проверьте соответствие каждого члена мутантной популяции.Step 8. Verify that each member of the mutant population matches.

Отберите субпопуляцию с наибольшим соответствием для использования при рекомбинации или дополнительной множественной мутации 3.Select the most suitable subpopulation for use in recombination or additional multiple mutation 3.

Модуль 1 2: Мутации последовательности.Module 1 2: Mutation Sequences.

Операция 1. Задайте РПЕь, РЮу, Рюз и Р . как пороговые значения для наличия мутации (0<Рх<1).Operation 1. Set P PE L, p U y, and P Ruse. as threshold values for the presence of a mutation (0 <P x <1).

Операция 2. Генерируйте произвольную позицию (=х) в коде (0 < Р < Длина кода).Operation 2. Generate an arbitrary position (= x) in the code (0 <P <Code length).

Операция 3. Генерируйте случайную длину последовательности (=Ь) (0 < Ь < Длина кода - х).Operation 3. Generate a random sequence length (= b) (0 <b <code length - x).

Операция 4. Скопируйте последовательность из кода, начиная с х и с расширением до общей суммы Ь символов.Operation 4. Copy the sequence from the code, starting with x and with the extension to the total amount of b characters.

Операция 5. Если 0 < Рюу < Случайное число < 1 ТогдаOperation 5. If 0 <P uu <Random number <1 Then

Перемените порядок символов в строке на обратный.Reverse the order of the characters in the string.

Операция 6. Если 0 < РсиР < Случайное число < 1 ТогдаOperation 6. If 0 <P CuP <Random Number <1 Then

Скопируйте последовательность и конкатенируйте копию с последовательностью.Copy the sequence and concatenate the copy to the sequence.

Операция 7. Если 0 < РСЕЪ < Случайное число < 1 ТогдаOperation 7. If 0 <P CEB <Random Number <1 Then

Элиминируйте Ь символов из кода, начиная с позиции х.Eliminate b characters from the code, starting at position x.

ИначеOtherwise

Замените последовательность в коде на последовательность, генерированную в операциях 5 и 6.Replace the sequence in the code with the sequence generated in steps 5 and 6.

Операция 8. Если 0 < Рюз < Случайное число < 1 ТогдаStep 8: If 0 <P SW <random number <1 Then

Генерируйте позицию (=у) в коде произвольно (0 < у < Длина кода).Generate a position (= y) in the code arbitrarily (0 <y <code length).

Вставьте последовательность, генерированную в операциях 5 и 6, в позицию у.Insert the sequence generated in steps 5 and 6 into position y.

Модуль 13: Рекомбинация.Module 13: Recombination.

Операция 1. Задайте размер популяции (=р).Step 1. Set the population size (= p).

Операция 2. Отберите произвольно два кода из популяции, генерированной множественной мутацией.Step 2. Randomly select two codes from the population generated by the multiple mutation.

Операция 3. Выберите произвольно позицию в генотипе.Step 3. Choose an arbitrary position in the genotype.

Операция 4. Генерируйте случайное число для числа подлежащих обмену символов.Operation 4. Generate a random number for the number of characters to be exchanged.

Операция 5. Поменяйте местами символы между каждыми из трех векторов кода, начиная с выбранной позиции.Step 5. Swap the characters between each of the three code vectors, starting from the selected position.

Операция 6. Повторите операции 2-5 до момента генерации р новых генотипов.Step 6. Repeat steps 2–5 until p new genotypes are generated.

Операция 7. Проверьте соответствие каждого лиганда в образующейся мутантной популяции. Отберите субпопуляцию с наибольшим соответствием для следующих серий рекомбинации или для созревания.Step 7. Check the correspondence of each ligand in the resulting mutant population. Select the most appropriate subpopulation for the next series of recombination or for maturation.

Модуль 1 4: Созревание.Module 1 4: Ripening.

Операция 1. Введите начальный код, образованный из рекомбинации.Step 1. Enter the initial code formed from recombination.

Операция 2. Задайте число итераций.Step 2. Set the number of iterations.

Операция 3. Задайте произвольно позицию в исходном генотипе.Step 3. Specify an arbitrary position in the original genotype.

Операция 4. Замените символы кода в этих позициях в каждом векторе кода на другие, произвольно выбранные символы.Step 4. Replace the code characters at these positions in each code vector with other, arbitrarily selected characters.

Операция 5. Проверьте соответствие кода предшественника (Рр) и продукта мутации (Рм), используя Модули 4 и 5.Step 5. Verify that the precursor code (P p ) and mutation product (P m ) match using Modules 4 and 5.

Операция 6. Если Рм > Рр, замените генотип предшественника на продукт мутации.Step 6. If P m > P p , replace the precursor genotype with the mutation product.

Операция 7. Повторите операции 3-6 до требуемого числа итераций.Step 7. Repeat steps 3-6 until the desired number of iterations.

Claims (52)

1 . Способ компьютерного конструирования химических структур, обладающих предварительно выбранной функциональной характеристикой, включающий следующие стадии:one . A method for computer-aided design of chemical structures having a pre-selected functional characteristic, comprising the following stages: (а) создание физической модели фенотипа моделированного рецептора, кодируемого в виде линейной последовательности символов, и создание набора молекул мишеней, имеющих, по меньшей мере, одну общую поддающуюся количественному измерению функциональную характеристику;(a) creating a physical model of a phenotype of a simulated receptor encoded as a linear sequence of characters, and creating a set of target molecules having at least one common quantifiable functional characteristic; (б) для каждой молекулы мишени (ί) расчет сродства между рецептором и молекулой мишени в каждой из множества ориентаций с применением расчета эффективного сродства;(b) for each target molecule (ί) calculating the affinity between the receptor and the target molecule in each of the multiple orientations using the calculation of the effective affinity; (ίί) расчет суммарного сродства суммированием вычисленных значений сродства;(ίί) calculating the total affinity by summing the calculated affinity values; (ш) определение максимального сродства;(iii) determination of maximum affinity; (в) применение вычисленных величин суммарного и максимального сродства для (ί) расчета коэффициента корреляции максимального сродства между максимальным сродством и поддающейся количественному определению функциональной характеристикой;(c) applying the calculated values of the total and maximum affinity for (ί) calculating the correlation coefficient of the maximum affinity between the maximum affinity and a quantifiable functional characteristic; (ίί) расчета коэффициента корреляции суммарного сродства между суммарным сродством и определяемой количественно функциональной характеристикой;(ίί) calculating the correlation coefficient of the total affinity between the total affinity and a quantitatively determined functional characteristic; (г) применение максимального коэффициента корреляции и суммарного коэффициента корреляции для расчета коэффициента соответствия;(d) the application of the maximum correlation coefficient and the total correlation coefficient to calculate the correspondence coefficient; (д) изменение структуры рецептора и повторение стадий от (б) до (г) до получения популяции рецепторов, обладающих заранее выбранным коэффициентом соответствия;(e) changing the structure of the receptor and repeating steps (b) to (d) to obtain a population of receptors having a pre-selected matching coefficient; (е) создания физической модели химической структуры, кодируемой в виде молекулярной линейной последовательности символов; расчет сродства между химической структурой и каждым рецептором из множества ориентаций с применением указанного метода вычисления эффективного сродства, применение расчетных величин сродства для расчета степени соответствия сродства;(e) creating a physical model of a chemical structure encoded as a molecular linear sequence of characters; calculating the affinity between the chemical structure and each receptor from a variety of orientations using the indicated method for calculating the effective affinity, using the calculated affinity values to calculate the degree of affinity correspondence; (ж) изменение химической структуры для получения варианта химической структуры и повторение стадии (е); и (з) сохранение и дальнейшее изменение тех вариантов химической структуры, степень сродства которых приближается к заранее заданной (выбранной) степени сродства.(g) changing the chemical structure to obtain a variant of the chemical structure and repeating stage (e); and (h) preservation and further change of those variants of the chemical structure, the degree of affinity of which approaches a predetermined (selected) degree of affinity. 2. Способ по п.1, отличающийся тем, что линейная последовательность символов, кодирующих указанный фенотип рецептора, получается генерацией линейной последовательности символов рецептора, которая кодирует пространственное распределение и заряд, и также отличающийся тем, что стадия создания физической модели химической структуры включает генерацию указанной молекулярной линейной последовательности символов, которая кодирует пространственное распределение и заряд.2. The method according to claim 1, characterized in that the linear sequence of characters encoding the indicated phenotype of the receptor is obtained by generating a linear sequence of characters of the receptor, which encodes the spatial distribution and charge, and also characterized in that the step of creating a physical model of the chemical structure includes generating said a molecular linear sequence of characters that encodes a spatial distribution and charge. 3. Способ по п.2, отличающийся тем, что указанный расчет эффективного сродства включает два критерия, причем первый является критерием проксимальности, отличающийся тем, что незаряженные участки указанного моделированного рецептора достаточно близки к неполярным участкам указанной молекулярной структуры, чтобы интенсивность эффективной Лондоновской дисперсии стало возможным определить, а второй является суммарной интенсивностью электростатического взаимодействия заряд-диполь, возникающего между заряженными участками указанного моделированного рецептора и диполями, присутствующими в указанной молекулярной структуре.3. The method according to claim 2, characterized in that said calculation of effective affinity includes two criteria, the first being a proximal criterion, characterized in that the uncharged portions of the indicated simulated receptor are sufficiently close to the non-polar portions of the indicated molecular structure so that the intensity of the effective London dispersion becomes it is possible to determine, and the second is the total intensity of the electrostatic charge-dipole interaction arising between the charged sections of the indicated m receptor and to model the dipoles present in the said molecular structure. 4. Способ по п.2, отличающийся тем, что указанная стадия расчета степени соответствия сродства включает расчет суммарного и максимального сродства между молекулярной структурой и каждым рецептором, причем степень соответствия рассчитывают следующим образом:4. The method according to claim 2, characterized in that said step of calculating the degree of affinity correspondence includes calculating the total and maximum affinity between the molecular structure and each receptor, and the degree of correspondence is calculated as follows: Σ {| вычисленное максимальное сродство - максимальное сродство мишени| /максимальное сродство мишени}, и отличающийся также тем, что указанная предварительно выбранная степень соответствия практически равна нулю.Σ {| calculated maximum affinity - maximum affinity of the target | / maximum affinity of the target}, and also characterized in that said pre-selected degree of compliance is practically zero. 5. Способ по п.2, отличающийся тем, что указанная стадия расчета степени соответствия сродства включает расчет суммарного и максимального сродства между молекулярной структурой и каждым рецептором, причем степень соответствия рассчитывают следующим образом:5. The method according to claim 2, characterized in that said step of calculating the degree of affinity correspondence includes calculating the total and maximum affinity between the molecular structure and each receptor, and the degree of correspondence is calculated as follows: Σ {(| расчетное максимальное сродство - максимальное сродство мишени| /2 х максимальное сродство мишени) + (| расчетное суммарное сродство - суммарное сродство мишени|)}, и отличающийся также тем, что указанная предварительно выбранная степень соответствия практически равна нулю.Σ {(| estimated maximum affinity is the maximum affinity of the target | / 2 x maximum affinity of the target) + (| calculated total affinity is the total affinity of the target |)}, and also characterized in that the pre-selected degree of compliance is practically zero. 6. Способ по п.2, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой гЗА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, и также тем, что указанный коэффициент соответствия означает Р = (гМА2 х гЗА 2)0,5, а также тем, что предварительно выбранный коэффициент соответствия практически равен единице.6. The method according to claim 2, characterized in that said correlation coefficient of the total affinity is g ZA 2 , said correlation coefficient of maximum affinity is gMA 2 , and also that said correspondence coefficient means P = (gMA 2 x g ZA 2 ) 0.5 , as well as the fact that the pre-selected matching coefficient is practically equal to one. 7. Способ по п.2, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой гЗА-МА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, также отличающийся тем, что указанный коэффициент соответствия представляет собой Р = (гМА2 х (1гзА-мА 2))05, и также тем, что указанный предварительно выбранный коэффициент практически равен единице.7. The method according to claim 2, characterized in that said correlation coefficient of total affinity is g ZA-MA 2 , said correlation coefficient of maximum affinity is gMA 2 , also characterized in that said correspondence coefficient is P = (gMA 2 x (1 g s A- m A 2 )) 0 ' 5 , and also by the fact that said pre-selected coefficient is practically equal to unity. 8. Способ по п.2, отличающийся тем, что указанные молекулярные линейные последовательности символов включают множество последовательностей триплетов символов, причем первый символ указанного триплета произвольно выбран из набора первых символов, определяющих положение и идентичность заселяющего атома в молекулярном скелете указанной молекулярной структуры, второй символ указанного триплета произвольно выбран из набора вторых символов, определяющих идентичность заместителя, связанного с указанным заселяющим атомом, а третий символ указанного триплета произвольно выбирается из набора треть61 их символов, определяющих местоположение указанного заместителя при атоме, точно определяемом первым символом триплета.8. The method according to claim 2, characterized in that said molecular linear symbol sequences include a plurality of symbol triple sequences, the first symbol of said triple being arbitrarily selected from the set of first symbols determining the position and identity of the populating atom in the molecular skeleton of said molecular structure, the second symbol the specified triplet is arbitrarily selected from the set of second symbols that determine the identity of the substituent associated with the specified populating atom, and the third symbol seemed triplet randomly selected from a set of symbols tret61 determining the location of said substituent at precisely defined by the first character of the triplet. 9. Способ по п.8, отличающийся тем, что молекулярную линейную последовательность символов декодируют, применяя алгоритм компоновки эффективной молекулы, который последовательно перемещает каждый триплет указанной молекулярной линейной последовательности, а затем насыщает незаполненные позиции при указанном молекулярном скелете атомами водорода.9. The method according to claim 8, characterized in that the molecular linear sequence of characters is decoded using an efficient molecule arrangement algorithm that sequentially moves each triplet of the specified molecular linear sequence and then saturates the unfilled positions at the specified molecular skeleton with hydrogen atoms. 10. Способ по п.9, отличающийся тем, что стадия изменения молекулярной структуры включает, по меньшей мере, одну из следующих операций: ί) мутацию указанного генотипа молекулы путем произвольного взаимного обмена, по меньшей мере, одним из указанных первым, вторым или третьим символом с, по меньшей мере, одним триплетом из наборов соответствующих символов, ϊϊ) делецию, при которой триплет из генотипа молекулы удаляют, ίίί) дупликацию, при которой триплет в генотипе молекулы дублируется, ίν) инверсию, при которой последовательный порядок одного или более триплетов в генотипе молекулы меняется на обратный, и ν) инсерцию, при которой триплет из генотипа молекулы вводят в другое положение в генотипе молекулы.10. The method according to claim 9, characterized in that the stage of changing the molecular structure includes at least one of the following operations: ί) mutation of the indicated genotype of the molecule through arbitrary mutual exchange of at least one of the first, second or third a symbol with at least one triplet from the sets of corresponding symbols, ϊϊ) a deletion in which the triplet is removed from the genotype of the molecule, ίίί) duplication, in which the triplet in the genotype of the molecule is duplicated, ίν) inversion, in which the sequential order of one or more triplets in the genotype of the molecule are reversed, and ν) the insertion, in which a triple from the genotype of the molecule is introduced into a different position in the genotype of the molecule. 11. Способ по п. 1 0, отличающийся тем, что стадия мутации указанных молекулярных генотипов включает рекомбинацию произвольно выбранных пар указанных сохранённых мутантных молекулярных генотипов, в то время как соответствующие символы в указанных молекулярных линейных последовательностях взаимно обмениваются.11. The method according to p. 1 0, characterized in that the stage of mutation of the indicated molecular genotypes includes the recombination of randomly selected pairs of these stored mutant molecular genotypes, while the corresponding characters in the indicated molecular linear sequences are mutually exchanged. 12. Способ по п.2, отличающийся тем, что каждый символ в линейной последовательности символов рецептора определяет либо команду пространственного поворота, либо заряженного сайта без поворота.12. The method according to claim 2, characterized in that each symbol in a linear sequence of receptor symbols defines either a spatial rotation command or a charged site without rotation. 1 3. Способ по п. 1 2, отличающийся тем, что указанный фенотип рецептора содержит, по меньшей мере, один линейный полимер с множеством субъединиц, причем одна из указанных субъединиц является первой субъединицей в указанном, по меньшей мере, одном линейном полимере.1 3. The method according to p. 1 2, characterized in that said receptor phenotype contains at least one linear polymer with a plurality of subunits, wherein one of said subunits is the first subunit in said at least one linear polymer. 14. Способ по п. 13, отличающийся тем, что указанную линейную последовательность символов рецептора декодируют, применяя алгоритм сборки эффективного рецептора, в котором команды поворота, применяемые к каждой субъединице, следующей за указанной первой субъединицей, задаются относительно позиции указанной первой субъединицы.14. The method of claim 13, wherein said linear sequence of receptor symbols is decoded using an efficient receptor assembly algorithm in which rotation instructions applied to each subunit following said first subunit are relative to the position of said first subunit. 15. Способ по п. 14, отличающийся тем, что указанные символы определяют программу команд пространственного поворота для нет поворота, поворот направо, поворот налево, поворот вверх, поворот вниз, и тем, что символы определяют код сайтов зарядов для положительно заряженного сайта без поворота и отрицательно заряженного сайта без поворота.15. The method according to p. 14, characterized in that said symbols define a program of spatial rotation commands for no rotation, right rotation, left rotation, upward rotation, downward rotation, and the symbols determine charge site code for a positively charged site without rotation and negatively charged site without turning. 16. Способ по п.14, отличающийся тем, что указанные субъединицы являются практически сферическими с радиусами Ван дер Ваальса, практически равными радиусу Ван дер Ваальса водорода.16. The method according to 14, characterized in that said subunits are practically spherical with Van der Waals radii almost equal to the van der Waals radius of hydrogen. 17. Способ по п.15, отличающийся тем, что стадия изменения указанного генотипа рецептора включает, по меньшей мере, одну из следующих операций: ί) делецию, при которой удаляется символ из генотипа рецептора, ίί) дупликацию, при которой дублируется символ в генотипе рецептора, ίίί) инверсию, при которой последовательный порядок одного или более символов в генотипе рецептора меняется на обратный, и ίν) инсерцию, при которой символ из генотипа рецептора вводят в другое положение в генотипе.17. The method of claim 15, wherein the step of changing said receptor genotype includes at least one of the following operations: ί) a deletion in which a symbol is deleted from the receptor genotype, ίί) a duplication in which the symbol in the genotype is duplicated receptor, ίίί) inversion, in which the sequential order of one or more characters in the receptor genotype is reversed, and ίν) insertion, in which the symbol from the receptor genotype is introduced into a different position in the genotype. 18. Способ по п.17, отличающийся тем, что стадия мутации указанных генотипов рецепторов включает рекомбинацию произвольно выбранных пар указанных сохранённых генотипов мутантных рецепторов, при этом соответствующие символы в указанных линейных последовательностях рецепторов взаимно обмениваются.18. The method according to 17, characterized in that the stage of mutation of the indicated genotypes of the receptors includes the recombination of randomly selected pairs of the indicated stored genotypes of the mutant receptors, while the corresponding characters in the indicated linear sequences of the receptors are mutually exchanged. 19. Способ компьютерного скрининга химических структур с предварительно выбранными функциональными характеристиками, заключающийся в (а) создании генотипа моделированного рецептора генерацией рецепторной линейной последовательности символов, которая кодирует пространственное распределение и заряд;19. A method of computer screening of chemical structures with pre-selected functional characteristics, which consists in (a) creating a genotype of a simulated receptor by generating a receptor linear sequence of characters that encodes a spatial distribution and charge; (б) декодировании генотипа с целью создания фенотипа рецептора, предусматривающего, по меньшей мере, одну молекулу мишени, проявляющую выбранную функциональную характеристику, расчете сродства между рецептором и каждой молекулой мишени во множестве ориентаций с применением расчета эффективного сродства, расчете суммарного и максимального сродства между каждой молекулой мишени и рецептором, расчете коэффициента корреляции суммарного сродства для суммарного сродства относительно указанной функциональной характеристики молекулы мишени и коэффициента корреляции максимального сродства для максимального сродства относительно указанной функциональной характеристики (мишени), и расчете коэффициента соответствия, зависящего от указанных коэффициентов корреляции суммарного и максимального сродства;(b) decoding the genotype in order to create a receptor phenotype comprising at least one target molecule exhibiting a selected functional characteristic, calculating the affinity between the receptor and each target molecule in a variety of orientations using effective affinity calculation, calculating the total and maximum affinity between each target molecule and receptor, calculating the total affinity correlation coefficient for total affinity relative to the specified functional characteristics of the target molecule the correlation coefficient and the maximum affinity for maximum affinity relative to the specified functional characteristics (targets), and the calculation of the coefficient of compliance, depending on the specified correlation coefficients of the total and maximum affinity; (в) мутации генотипа рецептора и повторении стадии (б) и сохранении и мутации рецепторов с повышенными коэффициентами соответствия до тех пор, пока не будет получены популяции рецепторов с предварительно выбранными коэффициентами соответствия; далее (г) расчете сродства между подвергаемой скринингу химической структурой и каждым рецептором во множестве ориентаций, используя указанный расчет эффективного сродства, расчете степени соответствия сродства, который включает расчет суммарного и максимального сродства между соединением и каждым рецептором и сравнение, по меньшей мере, одной из величин указанного суммарного и максимального сродства с величинами суммарного и максимального сродства между указанной, по меньшей мере, одной мишенью и указанной популяцией рецепторов, при этом указанное сравнение является показателем степени функциональной активности указанной химической структуры относительно указанной, по меньшей мере, одной молекулы мишени.(c) mutation of the receptor genotype and repetition of step (b) and conservation and mutation of receptors with increased compliance coefficients until receptor populations with pre-selected matching coefficients are obtained; further (d) calculating the affinity between the screened chemical structure and each receptor in a variety of orientations, using the indicated calculation of effective affinity, calculating the degree of affinity correspondence, which includes calculating the total and maximum affinity between the compound and each receptor and comparing at least one of the values of the specified total and maximum affinity with the values of the total and maximum affinity between the specified at least one target and the specified population of receptors, etc. and this comparison is an indicator of the degree of functional activity of the indicated chemical structure relative to the specified at least one target molecule. 20. Способ по п. 19, отличающийся тем, что указанный расчет эффективного сродства содержит два критерия, причем первый является критерием проксимальности, при которой незаряженные участки указанных моделированных рецепторов достаточно близки к неполярным участкам указанной молекулярной структуры, чтобы сделать возможным определение (интенсивности) эффективной Лондоновской дисперсии, а второй является суммарной силой электростатического взаимодействия заряд-диполь, возникающей между заряженными участками указанного моделированного рецептора и диполями, имеющимися в указанной молекулярной структуре.20. The method according to p. 19, characterized in that said calculation of effective affinity contains two criteria, the first being a proximal criterion in which uncharged portions of these simulated receptors are close enough to non-polar portions of the indicated molecular structure to make it possible to determine (intensity) effective Of the London dispersion, and the second is the total force of the electrostatic charge-dipole interaction arising between the charged sections of the specified modeled etseptora and dipoles existing in said molecular structure. 21 . Способ по п.20, отличающийся тем, что степень соответствия вычисляют как Σ{| расчётное максимальное сродство - максимальное сродство мишени| /максимальное сродство мишени}.21. The method according to claim 20, characterized in that the degree of compliance is calculated as Σ {| estimated maximum affinity - maximum target affinity | / maximum affinity of the target}. 22. Способ по п.20, отличающийся тем, что степень соответствия вычисляют как Σ{(| расчетное максимальное сродство - максимальное сродство мишени| /2 х максимальное сродство мишени) + (| расчетное суммарное сродство суммарное сродство мишени| /2 х суммарное сродство мишени)}.22. The method according to claim 20, characterized in that the degree of compliance is calculated as Σ {(| estimated maximum affinity - maximum affinity of the target | / 2 x maximum affinity of the target) + (| calculated total affinity total affinity of the target | / 2 x total affinity targets)}. 23. Способ по п.20, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой тЗА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, и тем, что указанный коэффициент соответствия представляет собой Р = (гМА2 х гЗА 2)0·5, а также тем, что предварительно выбранный коэффициент соответствия практически равен единице.23. The method according to claim 20, characterized in that the correlation coefficient of the total affinity is t FOR 2 , the specified correlation coefficient of the maximum affinity is gMA 2 , and that the specified compliance coefficient is P = (gMA 2 x g FOR 2 ) 0 · 5 , as well as the fact that the pre-selected matching coefficient is practically equal to unity. 24. Способ по п.20, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой тЗА-МА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, и тем, что указанный коэффициент соответствия представляет собой Р = (гМА2 х (1- гЗА-МА 2))0·5, а также тем, что указанный заранее выбранный коэффициент соответствия практически равен единице.24. The method according to claim 20, characterized in that said correlation coefficient of total affinity is t ZA-MA 2 , said correlation coefficient of maximum affinity is gMA 2 , and that said correspondence coefficient is P = (gMA 2 x (1- g ZA-MA 2 )) 0 · 5 , as well as the fact that the specified pre-selected matching coefficient is practically equal to one. 25. Способ по п.20, отличающийся тем, что каждый символ в рецепторной линейной последовательности символов определяет либо команду поворота в пространстве, либо заряженный сайт без поворота.25. The method according to claim 20, characterized in that each symbol in the receptor linear sequence of characters determines either a rotation command in space or a charged site without rotation. 26. Способ по п.25, отличающийся тем, что указанный фенотип рецептора содержит, по меньшей мере, один линейный полимер с множеством субъединиц, причем одна из этих субъединиц является первой субъединицей в указанном, по меньшей мере, одном линейном полимере.26. The method according A.25, characterized in that the phenotype of the receptor contains at least one linear polymer with many subunits, and one of these subunits is the first subunit in the specified at least one linear polymer. 27. Способ по п.26, отличающийся тем, что указанную рецепторную линейную последовательность символов декодируют, применяя алгоритм сборки эффективного рецептора, в котором (алгоритме) команды поворота, применяемые к каждой субъединице, следующей за указанной первой субъединицей, задаются относительно начальной позиции указанной первой субъединицы.27. The method according to p. 26, characterized in that the indicated linear receptor sequence of characters is decoded using an efficient receptor assembly algorithm in which (the algorithm) rotation commands applied to each subunit following the specified first subunit are set relative to the initial position of the specified first subunits. 28. Способ по п.27, отличающийся тем, что указанные символы определяют программу команд поворота в пространстве для нет поворота, правый поворот, левый поворот, поворот вверх, поворот вниз, и также тем, что символы определяют код сайтов зарядов для положительно заряженного сайта без поворота и отрицательно заряженного сайта без поворота.28. The method according to item 27, wherein said symbols define a program of rotation commands in space for no rotation, right turn, left turn, turn up, turn down, and also that symbols determine the code of charge sites for a positively charged site without turning and negatively charged site without turning. 29. Способ по п.28, отличающийся тем, что указанные субъединицы являются практически сферическими с радиусами Ван дер Ваальса, практически равными радиусу Ван дер Ваальса водорода.29. The method of claim 28, wherein said subunits are substantially spherical with van der Waals radii substantially equal to the van der Waals radius of hydrogen. 30. Способ по п.27, отличающийся тем, что стадия мутации указанного генотипа рецептора включает, по меньшей мере, одну из следующих операций: ί) делецию, при которой удаляется символ из генотипа рецептора, ίί) дупликацию, при которой дублируется символ в генотипе рецептора, ίίί) инверсию, при которой последовательный порядок одного или более символов в генотипе рецептора меняется на обратный, и ίν) инсерцию, при которой символ из генотипа рецептора вводят в другое положение в генотипе.30. The method according to item 27, wherein the stage of mutation of the indicated receptor genotype includes at least one of the following operations: ί) deletion, which removes the symbol from the receptor genotype, ίί) duplication, in which the symbol in the genotype is duplicated receptor, ίίί) inversion, in which the sequential order of one or more characters in the receptor genotype is reversed, and ίν) insertion, in which the symbol from the receptor genotype is introduced into a different position in the genotype. 31. Способ по п.30, отличающийся тем, что стадия мутации указанных генотипов рецепторов включает рекомбинацию произвольно выбранных пар указанных сохранённых генотипов мутантных рецепторов, при этом соответствующие символы в указанных линейных последовательностях рецепторов взаимно обмениваются.31. The method according to p. 30, characterized in that the stage of mutation of the indicated genotypes of the receptors includes the recombination of randomly selected pairs of these stored genotypes of the mutant receptors, while the corresponding characters in the indicated linear sequences of the receptors are mutually exchanged. 32. Способ компьютерного построения моделированных рецепторов, имитирующих биологические рецепторы, проявляющие селективное сродство к соединениям со сходными функциональными характеристиками, содержащий стадии (а) создания генотипа моделированного рецептора генерацией рецепторной линейной последовательности символов, которая кодирует пространственное распределение и заряд;32. A method for the computer construction of simulated receptors that mimic biological receptors exhibiting selective affinity for compounds with similar functional characteristics, comprising the steps of: (a) creating a simulated receptor genotype by generating a receptor linear sequence of characters that encodes a spatial distribution and charge; (б) декодирования генотипа с целью создания фенотипа рецептора, создания набора молекул мишеней, имеющих общие сходные функциональные характеристики, расчет сродства между рецептором и каждой молекулой мишени во множестве ориентаций с применением расчета эффективного сродства, расчет суммарного и максимального сродства между каждой молекулой мишени и рецептором, расчет коэффициента корреляции суммарного сродства относительно функциональной характеристики каждой молекулы мишени и коэффициента корреляции максимального сродства относительно указанной функциональной характеристики для каждой молекулы мишени, и расчет коэффициента соответствия, зависящего от указанных коэффициентов корреляции суммарного и максимального сродства для каждой молекулы мишени; и (в) мутации генотипа и повторение стадии (б) и сохранения и мутации рецепторов с повышенными коэффициентами соответствия до тех пор, пока не будет создана популяция рецепторов с заранее выбранными коэффициентами соответствия.(b) decoding the genotype in order to create a receptor phenotype, create a set of target molecules having common similar functional characteristics, calculate the affinity between the receptor and each target molecule in many orientations using the calculation of effective affinity, calculate the total and maximum affinity between each target molecule and receptor , calculation of the correlation coefficient of total affinity relative to the functional characteristics of each target molecule and the correlation coefficient of maximum affinity from ositelno said functional characteristics for each target molecule and calculation of the corresponding coefficients, dependent on said correlation coefficients and maximum cumulative affinity for each target molecule; and (c) mutations of the genotype and repetition of step (b) and conservation and mutation of receptors with increased compliance coefficients until a population of receptors with pre-selected matching coefficients is created. 33. Способ по п.32, отличающийся тем, что каждый символ в рецепторной линейной последовательности символов определяет либо команду поворота в пространстве, либо заряженный сайт без поворота.33. The method according to p, characterized in that each symbol in the receptor linear sequence of characters determines either a rotation command in space or a charged site without rotation. 34. Способ по п.33, отличающийся тем, что указанный фенотип рецептора содержит множество линейных полимеров с множеством субъединиц, причем каждый линейный полимер кодируется соответствующей линейной последовательностью символов и одна из указанных субъединиц является первой субъединицей в указанном, по меньшей мере, одном линейном полимере.34. The method according to p. 33, characterized in that the receptor phenotype contains many linear polymers with many subunits, each linear polymer being encoded by a corresponding linear sequence of characters and one of these subunits is the first subunit in the specified at least one linear polymer . 35. Способ по п.34, отличающийся тем, что указанную рецепторную линейную последовательность символов декодируют, применяя алгоритм сборки эффективного рецептора, в котором (алгоритме) команды поворота, применяемые к каждой субъединице, следующей за указанной первой субъединицей, задаются относительно исходной позиции указанной первой субъединицы.35. The method according to clause 34, wherein said linear receptor linear sequence of characters is decoded using an efficient receptor assembly algorithm in which (algorithm) rotation commands applied to each subunit following said first subunit are set relative to the starting position of said first subunits. 36. Способ по п.35, отличающийся тем, что указанные символы задают программу команд поворота в пространстве для нет поворота, поворот направо, поворот налево, поворот вверх, поворот вниз, и тем, что символы определяют код сайтов заряда для положительно заряженного сайта без поворота и отрицательно заряженного сайта без поворота.36. The method according to claim 35, characterized in that said symbols specify a program of rotation commands in space for no rotation, right rotation, left rotation, up rotation, downward rotation, and that symbols define a charge site code for a positively charged site without turning and negatively charged site without turning. 37. Способ по п.36, отличающийся тем, что указанные субъединицы являются практически сферическими с радиусами Ван дер Ваальса, практически равными радиусу Ван дер Ваальса водорода.37. The method according to clause 36, wherein said subunits are almost spherical with van der Waals radii practically equal to the van der Waals radius of hydrogen. 38. Способ по п.35, отличающийся тем, что стадия мутации указанного генотипа рецептора включает, по меньшей мере, одну из следующих операций: ί) делецию, при которой из генотипа рецептора удаляется символ, ίί) дупликацию, при которой в генотипе рецептора дублируется символ, ίίί) инверсию, при которой последовательный порядок одного или более символов в генотипе рецептора меняется на обратный, и ΐν) инсерцию, при которой символ из генотипа рецептора вводят в другое положение в генотипе.38. The method according to clause 35, wherein the stage of mutation of the indicated receptor genotype includes at least one of the following operations: ί) deletion, in which the symbol is removed from the receptor genotype, ίί) duplication, in which duplicates in the receptor genotype a symbol, ίίί) an inversion in which the sequential order of one or more characters in the receptor genotype is reversed, and ΐν) an insertion in which a symbol from the receptor genotype is introduced into a different position in the genotype. 39. Способ по п.38, отличающийся тем, что стадия мутации генотипов указанного рецептора включает рекомбинацию произвольно выбранных пар указанных сохранённых генотипов мутантных рецепторов, при этом соответствующие символы в указанных рецепторных линейных последовательностях взаимно обмениваются.39. The method according to § 38, characterized in that the stage of mutation of the genotypes of the indicated receptor includes the recombination of randomly selected pairs of these stored genotypes of mutant receptors, while the corresponding characters in the indicated linear receptor sequences are mutually exchanged. 40. Способ по п.33, отличающийся тем, что указанный расчет эффективного сродства содержит два критерия, причем первый является критерием проксимальности, при которой незаряженные участки указанных моделированных рецепторов достаточно близки к неполярным участкам указанной молекулярной структуры, чтобы интенсивность эффективной Лондоновской дисперсии стало возможным определить, а второй является суммарной интенсивностью электростатического взаимодействия заряддиполь, возникающего между заряженными участками указанного моделированного рецептора и диполями, присутствующими в указанной молекулярной структуре.40. The method according to p. 33, characterized in that said calculation of effective affinity contains two criteria, the first being a proximal criterion in which uncharged portions of these simulated receptors are close enough to non-polar portions of the indicated molecular structure so that the intensity of the effective London dispersion can be determined and the second is the total intensity of the electrostatic interaction of the charge-dipole arising between the charged sections of the specified receptor and dipoles present in the indicated molecular structure. 41. Способ по п.40, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой гЗА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, и также отличающийся тем, что указанный коэффициент соответствия означает Р = (гМА2 х гЗА 2)0·5, а также тем, что предварительно выбранный коэффициент соответствия практически равен единице.41. The method according to p. 40, characterized in that the correlation coefficient of the total affinity is g FOR 2 , the correlation coefficient of the maximum affinity is gMA 2 , and also characterized in that the coefficient of compliance means P = (gMA 2 x g FOR 2 ) 0 · 5 , as well as the fact that the pre-selected matching coefficient is practically equal to one. 42. Способ по п.40, отличающийся тем, что указанный коэффициент корреляции суммарного сродства представляет собой гЗА-МА 2, указанный коэффициент корреляции максимального сродства представляет собой гМА2, также отличающийся тем, что указанный коэффициент соответствия представляет собой Р = (гМА2 х (1г 2))05, и также тем, что указанный предварительно выбранный коэффициент практически равен единице.42. The method according to claim 40, wherein said total affinity correlation coefficient is g ZA-MA 2 , said maximum affinity correlation coefficient is gMA 2 , also characterized in that said correspondence coefficient is P = (gMA 2 x (1g 8A 2 )) 0 ' 5 , and also by the fact that said pre-selected coefficient is practically equal to unity. 43. Способ компьютерного создания химических структур с заранее выбранными функциональными особенностями, включающий следующие стадии:43. A method for the computer creation of chemical structures with pre-selected functional features, comprising the following stages: (а) создание физической модели рецептора и набора молекул мишеней, при этом молекулы мишени обладают, по меньшей мере, одной общей поддающейся количественному определению функциональной характеристикой;(a) creating a physical model of a receptor and a set of target molecules, wherein the target molecules have at least one general quantifiable functional characteristic; (б) для каждой молекулы мишени (ί) расчет сродства между рецептором и молекулой мишени в каждой из множества ориентаций с применением расчета эффективного сродства;(b) for each target molecule (ί) calculating the affinity between the receptor and the target molecule in each of the multiple orientations using the calculation of the effective affinity; (ΐΐ) расчет суммарного сродства суммированием вычисленных значений сродства;(ΐΐ) calculating the total affinity by summing the calculated affinity values; (ш) определение максимального сродства;(iii) determination of maximum affinity; (в) применение вычисленных значений суммарного и максимального сродства для (ί) расчета коэффициента корреляции максимального сродства между значениями максимального сродства и количественно определяемой функциональной характеристикой;(c) applying the calculated values of the total and maximum affinity for (ί) calculating the correlation coefficient of the maximum affinity between the maximum affinity values and a quantitatively determined functional characteristic; (и) расчета коэффициента корреляции суммарного сродства между значениями суммарного сродства и количественно определяемой функциональной характеристикой;(i) calculating the correlation coefficient of the total affinity between the values of the total affinity and a quantitatively determined functional characteristic; (г) применение максимального коэффициента корреляции и суммарного коэффициента корреляции к расчету коэффициента соответствия;(d) applying the maximum correlation coefficient and the total correlation coefficient to the calculation of the correspondence coefficient; (д) изменение структуры рецептора и повторение стадий от (б) до (г) до получения популяции рецепторов с заранее выбранным коэффициентом соответствия;(e) changing the structure of the receptor and repeating steps (b) to (d) to obtain a receptor population with a pre-selected matching coefficient; (е) создания физической модели химической структуры, расчет сродства между химической структурой и каждым рецептором во множестве ориентаций с применением указанного расчета эффективного сродства, использование расчетных величин сродства для расчета степени соответствия сродства;(f) creating a physical model of the chemical structure, calculating the affinity between the chemical structure and each receptor in a variety of orientations using the specified calculation of effective affinity, using calculated affinity values to calculate the degree of affinity correspondence; (ж) изменение химической структуры с целью получения варианта химической структуры и повторение стадии (е); и (з) сохранение и дальнейшее изменение тех вариантов химической структуры, степень сродства которых приближается к заранее заданной степени сродства.(g) changing the chemical structure in order to obtain a variant of the chemical structure and repeating stage (e); and (h) preservation and further change of those variants of the chemical structure, the degree of affinity of which approaches a predetermined degree of affinity. 44. Способ по п.43, отличающийся тем, что стадия создания физической модели рецептора включает генерацию рецепторной линейной последовательности символов, которая кодирует пространственное распределение и заряд, и тем, что стадия создания физической модели химической структуры включает генерацию линейной последовательности символов, которая кодирует пространственное распределение и заряд.44. The method according to item 43, wherein the step of creating a physical model of the receptor includes generating a linear receptor sequence of characters that encodes a spatial distribution and charge, and the fact that the step of creating a physical model of the chemical structure includes generating a linear sequence of characters that encodes a spatial distribution and charge. 45. Способ по п.44, отличающийся тем, что указанные линейные последовательности символов для указанной химической структуры содержат множество последовательных триплетов символов, причем первый символ указанного триплета произвольно выбирается из набора первых символов, определяющих позицию и тождественность заселяющего атома в скелете молекулы указанной химической структуры, второй символ указанного триплета произвольно выбирается из набора вторых символов, определяющих тождественность заместителя, связанного с указанным заселяющим атомом, а третий символ указанного триплета произвольно выбирают из набора третьих символов, определяющих местоположение заместителя при атоме, точно определяемом первым символом триплета.45. The method according to claim 44, wherein said linear symbol sequences for said chemical structure comprise a plurality of consecutive symbol triplets, wherein the first symbol of said triplet is arbitrarily selected from the set of first symbols determining the position and identity of the populating atom in the skeleton of the molecule of said chemical structure , the second symbol of the specified triplet is arbitrarily selected from the set of second symbols that determine the identity of the substituent associated with the specified populating atom, and the third symbol of the indicated triplet is arbitrarily selected from the set of third symbols that determine the location of the substituent at the atom, precisely determined by the first symbol of the triplet. 46. Способ по п.45, отличающийся тем, что линейную последовательность символов химической структуры декодируют, применяя алгоритм сборки эффективной молекулы, который последовательно перемещает каждый триплет из указанной молекулярной линейной последовательности, а затем насыщает незаполненные позиции при указанном молекулярном скелете атомами водорода.46. The method according to item 45, wherein the linear sequence of characters of the chemical structure is decoded using an efficient molecule assembly algorithm that sequentially moves each triplet from the specified molecular linear sequence, and then saturates the unfilled positions at the specified molecular skeleton with hydrogen atoms. 47. Способ кодирования химической структуры, содержащей атомные элементы, при этом способ заключается в создании линейной последовательности символов, которая кодирует пространственное распределение, относительную позицию атома, тип связи и заряд для каждого атома с целью определить единственную трёхмерную конформацию указанной химической структуры.47. A method of encoding a chemical structure containing atomic elements, the method comprising creating a linear sequence of characters that encodes the spatial distribution, relative position of an atom, type of bond, and charge for each atom in order to determine a single three-dimensional conformation of said chemical structure. 48. Способ по п.47, отличающийся тем, что указанная линейная последовательность символов для указанной химической структуры содержит множество последовательных триплетов символов, причем первый символ указанного триплета произвольно выбирается из набора первых символов, определяющих позицию и тождественность заселяющего атома в скелете молекулы указанной химической структуры, второй символ указанного триплета произвольно выбирается из набора вторых символов, определяющих тождественность заместителя, связанного с указанным заселяющим атомом, а третий символ указанного триплета произвольно выбирают из набора третьих символов, определяющих местоположение заместителя при атоме, точно определяемом первым символом триплета.48. The method according to clause 47, wherein said linear sequence of characters for the specified chemical structure contains many consecutive triplets of characters, and the first character of the specified triplet is arbitrarily selected from the set of first characters that determine the position and identity of the populating atom in the skeleton of the molecule of the specified chemical structure , the second symbol of the specified triplet is arbitrarily selected from the set of second symbols that determine the identity of the substituent associated with the specified populating atom, and the third symbol of the indicated triplet is arbitrarily selected from the set of third symbols that determine the location of the substituent at the atom, precisely determined by the first symbol of the triplet. 49. Способ по п.45, отличающийся тем, что линейную последовательность символов декодируют, применяя алгоритм сборки эффективной молекулы, который последовательно перемещает каждый триплет из указанной линейной последовательности символов и затем насыщает незаполненные позиции у этого молекулярного скелета заранее выбранными атомами.49. The method according to item 45, wherein the linear sequence of characters is decoded using an efficient molecule assembly algorithm that sequentially moves each triplet from the specified linear sequence of characters and then saturates the unfilled positions of this molecular skeleton with pre-selected atoms. 50. Способ по п.49, включающий операцию хранения указанной линейной последовательности символов в запоминающем устройстве компьютера.50. The method according to 49, including the operation of storing the specified linear sequence of characters in a computer storage device. 51. Способ по п.19, отличающийся тем, что указанной функциональной характеристикой является биологическая токсичность.51. The method according to claim 19, characterized in that said functional characteristic is biological toxicity. 52. Способ по п.19, отличающийся тем, что указанной функциональной характеристикой является каталитическая активность.52. The method according to claim 19, characterized in that said functional characteristic is catalytic activity.
EA199800843A 1996-03-22 1996-03-22 Computational method for designing chemical structures having common functional characteristics EA001095B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CA1996/000166 WO1997036252A1 (en) 1996-03-22 1996-03-22 Computational method for designing chemical structures having common functional characteristics

Publications (2)

Publication Number Publication Date
EA199800843A1 EA199800843A1 (en) 1999-02-25
EA001095B1 true EA001095B1 (en) 2000-10-30

Family

ID=4173144

Family Applications (1)

Application Number Title Priority Date Filing Date
EA199800843A EA001095B1 (en) 1996-03-22 1996-03-22 Computational method for designing chemical structures having common functional characteristics

Country Status (4)

Country Link
EP (1) EP0888591A1 (en)
JP (1) JP2000507940A (en)
EA (1) EA001095B1 (en)
WO (1) WO1997036252A1 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2282357A1 (en) * 1997-02-28 1998-09-03 Bearsden Bio, Inc. Method of determining protein-ligand interactions via computer modeling
WO2002041184A1 (en) * 2000-11-14 2002-05-23 Kyorin Pharmaceutical Co., Ltd. Method of searching for novel lead compound
WO2002044112A1 (en) * 2000-11-30 2002-06-06 Toyo Suisan Kaisha, Ltd Method of designing the molecular structure of inhibitor to enzyme
AU2003231879A1 (en) * 2002-05-28 2003-12-12 The Trustees Of The University Of Pennsylvania Methods, systems, and computer program products for computational analysis and design of amphiphilic polymers
JP4572304B2 (en) 2004-01-27 2010-11-04 独立行政法人情報通信研究機構 Chemical genetic programming device and chemical genetic programming method
GB0518558D0 (en) 2005-09-12 2005-10-19 Givaudan Sa Improvements in or related to organic compounds
US20180137256A1 (en) * 2016-11-16 2018-05-17 Paul MERRITHEW System and method of calculating the structure and properties of chemicals

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations

Also Published As

Publication number Publication date
JP2000507940A (en) 2000-06-27
AU4935096A (en) 1997-10-17
AU712188B2 (en) 1999-10-28
EP0888591A1 (en) 1999-01-07
WO1997036252A1 (en) 1997-10-02
EA199800843A1 (en) 1999-02-25

Similar Documents

Publication Publication Date Title
Perelson Immune network theory
Bicanski et al. Neuronal vector coding in spatial cognition
US6219622B1 (en) Computational method for designing chemical structures having common functional characteristics
Kauffman et al. The NK model of rugged fitness landscapes and its application to maturation of the immune response
Manallack et al. Neural networks in drug discovery: have they lived up to their promise?
Holyoak et al. A framework for large scale community ecology
US5699268A (en) Computational method for designing chemical structures having common functional characteristics
Ruxton et al. Fitness‐dependent dispersal in metapopulations and its consequences for persistence and synchrony
US6219440B1 (en) Method and apparatus for modeling cellular structure and function
Morris Optimally foraging deer mice in prairie mosaics: a test of habitat theory and absence of landscape effects
Gasteiger et al. Neural networks as data mining tools in drug design
Gong et al. A population-based artificial immune system for numerical optimization
EA001095B1 (en) Computational method for designing chemical structures having common functional characteristics
Kauffman et al. Search strategies for applied molecular evolution
Mazzucato Socio-material archaeological networks at Çatalhöyük a community detection approach
Selvaraj et al. Survey of swarm intelligence algorithms
Conrad Algorithmic specification as a technique for computing with informal biological models
CN113436686A (en) Artificial intelligence-based compound library construction method, device, equipment and storage medium
Koenig Generating urban structures: A method for urban planning supported by multi-agent systems and cellular automata
Bernard et al. Comparison of chemical databases: Analysis of molecular diversity with Self Organising Maps (SOM)
Zaman et al. Using subpopulation EAs to map molecular structure landscapes
Tsutsui et al. Performance of aggregation pheromone system on unimodal and multimodal problems
Garrido et al. Collaboration between hyperheuristics to solve strip-packing problems
Castiglione et al. A network of cellular automata for the simulation of the immune system
Manavi et al. Simulation and analysis of antibody aggregation on cell surfaces using motion planning and graph analysis

Legal Events

Date Code Title Description
MM4A Lapse of a eurasian patent due to non-payment of renewal fees within the time limit in the following designated state(s)

Designated state(s): AM AZ BY KZ KG MD TJ TM RU