JP4691728B2 - Conformational notation device and notation method - Google Patents

Conformational notation device and notation method Download PDF

Info

Publication number
JP4691728B2
JP4691728B2 JP2008113263A JP2008113263A JP4691728B2 JP 4691728 B2 JP4691728 B2 JP 4691728B2 JP 2008113263 A JP2008113263 A JP 2008113263A JP 2008113263 A JP2008113263 A JP 2008113263A JP 4691728 B2 JP4691728 B2 JP 4691728B2
Authority
JP
Japan
Prior art keywords
conformation
notation
conformational
encoded
molecular model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008113263A
Other languages
Japanese (ja)
Other versions
JP2009265855A (en
Inventor
博 和泉
敦 尾形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2008113263A priority Critical patent/JP4691728B2/en
Priority to US12/385,856 priority patent/US11119033B2/en
Publication of JP2009265855A publication Critical patent/JP2009265855A/en
Application granted granted Critical
Publication of JP4691728B2 publication Critical patent/JP4691728B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、薬効などに関連する物性値をその立体配座構造とともに簡便にかつより精緻に表記する装置及び方法に関する。   The present invention relates to an apparatus and a method for easily and more accurately expressing physical property values related to medicinal properties and the like together with their conformational structures.

ポストゲノム研究の進展に伴い、様々なタンパク質構造が明らかにされるにつれ、例えば抗癌剤として機能するタキソール(パクリタキセル)が微小管を構成するチューブリンと呼ばれるタンパク質と結合安定化することにより脱重合を阻害する結果、癌細胞の分裂を阻害することがわかってきた。さらに、薬剤が機能する環境下では、薬剤は液相状態をとることから、例えばタキソールは様々な形をとることができ、その活性種の構造が構造活性相関の観点から興味をもたれている。これらの様々な形のことを立体配座と呼ぶが、タキソールについては様々な活性種の立体配座が提唱され、議論になっている(非特許文献1)。ところが、現存する装置の空間分解能の制約や核磁気共鳴(NMR)装置特有のNMRタイムスケールの制約、分子力場計算の精度の問題などから、その活性種の立体配座をいかにして表記するかについて関心がもたれている。例えば、現在、タキソールについてはT-TaxolやPTX-NYのような表記が用いられているが、このような表記自体から立体配座そのものを比較することは不可能である。さらに、タンパク質自体の構造変化を表記から変化部位を簡便に把握することも不可能である。   As the progress of post-genome research, various protein structures are revealed. For example, taxol (paclitaxel), which functions as an anticancer agent, inhibits depolymerization by stabilizing the binding to a protein called tubulin that forms microtubules. As a result, it has been found to inhibit cancer cell division. Furthermore, under the environment where the drug functions, since the drug takes a liquid phase state, for example, taxol can take various forms, and the structure of the active species is interesting from the viewpoint of the structure-activity relationship. These various forms are referred to as conformations. Concerning taxol, conformations of various active species have been proposed and have been discussed (Non-patent Document 1). However, how to describe the conformation of the active species due to the limitations of the spatial resolution of existing devices, the limitations of the NMR time scale unique to nuclear magnetic resonance (NMR) devices, and the accuracy of molecular force field calculations. There is interest in For example, currently, notation such as T-Taxol and PTX-NY is used for taxol, but it is impossible to compare the conformation itself from such notation itself. Furthermore, it is impossible to simply grasp the change site from the notation of the structural change of the protein itself.

ゲノムについては、共通するG、C、T、Aの簡略化した記号を用いて表記することにより、大規模な電算機処理を行うことが出来るようになり、飛躍的な進歩を遂げている。   For the genome, it is possible to perform large-scale computer processing by using the common G, C, T, and A simplified symbols, and it has made tremendous progress.

本発明者らは、生体分子をはじめとするキラリティーを有する物質の赤外円二色性(VCD)バンドが立体配座に対して極めて敏感であることを見出し(非特許文献2−4)、すでに立体配座解析に必要となる、注目する化学結合のそれぞれの端に結合しかつ優先則に従い選択されたリガンドがなすねじれ角に基づいて立体配座を表すと定められたIUPAC命名法に準拠した規則を取り入れた立体配座解析装置及び解析方法に関する提案を行っている(特許文献1)。その中で、立体配座の微妙な構造の違いがある場合にも簡略化した記号を用いて容易に該立体配座構造の比較を行うことができ、かつ任意の分子を統一的に扱うことができ、かつ大規模な電算機処理を可能とすることができる簡便な符号化立体配座表記を用いて表記する提案を行っているが、レボフロキサシンやイブプロフェンなどにおいて、IUPAC命名法に準拠した規則に従うとさらに微妙な構造の違いがある場合に区別できないという問題があることがわかった。また、IUPAC命名法のリガンドの優先則として、(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合において、1つの符号化立体配座表記で複数の分子モデルが対応するケース及び1つの分子モデルにおいて、複数の符号化立体配座表記をとりうるケースがあり、IUPAC命名法に準拠した規則に従うと立体配座を一義的に決定できない問題があることがわかった。   The present inventors have found that infrared circular dichroism (VCD) bands of biomolecular and other substances having chirality are extremely sensitive to conformation (Non-patent Documents 2-4). In accordance with the IUPAC nomenclature, which is already required for conformational analysis, it is defined to represent the conformation based on the twist angle formed by the ligands selected according to the priority rules and bound to each end of the chemical bond of interest. The proposal about the conformation analysis apparatus and analysis method which adopted the rule which followed was performed (patent document 1). Among them, even if there are subtle conformational differences, the conformational structure can be easily compared using simplified symbols, and any molecule can be handled in a unified manner. Can be used, and a simple coding conformational notation that enables large-scale computer processing has been proposed, but rules such as levofloxacin and ibuprofen that conform to the IUPAC nomenclature According to, it was found that there was a problem that it could not be distinguished when there were subtle structural differences. In addition, as a ligand priority rule in the IUPAC nomenclature, (3) When all ligands are the same, the one with the smallest twist angle is selected. In the corresponding case and one molecular model, there are cases where multiple encoded conformational notations can be taken, and it has been found that there is a problem that the conformation cannot be uniquely determined according to the rules based on the IUPAC nomenclature. .

そこで、これらの問題を解決するための立体配座構造を電算機処理するための表記技術が求められていた。
A. A. Alcaraz 他、J. Med. Chem., 2006, 49, 2478 H. Izumi 他、J. Am. Chem. Soc., 2004, 126, 194 H. Izumi 他、J. Org. Chem., 2007, 72, 277 H. Izumi 他、J. Org. Chem., 2008, 73, 2367 PCT/JP2008/051673
Therefore, a notation technique for computer processing the conformation structure for solving these problems has been demanded.
AA Alcaraz et al., J. Med. Chem., 2006, 49, 2478 H. Izumi et al., J. Am. Chem. Soc., 2004, 126, 194 H. Izumi et al., J. Org. Chem., 2007, 72, 277 H. Izumi et al., J. Org. Chem., 2008, 73, 2367 PCT / JP2008 / 051673

本発明は、このような従来技術の実状に鑑みてなされたもので、IUPAC命名法に準拠した規則に従うと立体配座を一義的に決定できない場合においても、立体配座を一義的に表記でき、任意の分子を統一的に扱うことができ、大規模な電算機処理を可能とすることができる立体配座表記装置及び表記方法を提供することを課題とする。   The present invention has been made in view of such a state of the art, and even when conformation cannot be uniquely determined according to the rules based on the IUPAC nomenclature, the conformation can be uniquely described. It is an object of the present invention to provide a conformation notation apparatus and a notation method that can handle arbitrary molecules in a unified manner and can perform large-scale computer processing.

上記課題を解決するため、本発明は、第1には、好ましくは、立体配座の微妙な構造の違いがある場合にも簡略化した記号を用いて容易に該立体配座構造の比較を行うことができ、かつ任意の分子を統一的に扱うことができ、かつ大規模な電算機処理を可能とすることができる簡便な立体配座表記を行う方法において、
処理部が、解析対象化合物の分子モデルの入力を受け付け、
前記処理部が、各分子モデルに対して下記の(1)〜(9)の工程を含む処理を行うことを特徴とする立体配座表記方法を提供する。
(1)入力を受け付けた分子モデルをフラグメント毎に分け、IUPAC命名法で定められた位置番号の順序により、各々の化学結合部位においてIUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択し、二面角を求め、当該二面角の分類として、360度を6分割し、その分割された部位に対応するように予め定めた1〜6のいずれかの符号を付す工程
(2)前記化学結合部位において、異なった立体配座と判断すべき立体配座が、前記6分割による符号のいずれの分類においても同一の分類に属する場合に、二面角分類として、前記6分割による符号のそれぞれにα(時計回り)、β(反時計回り)に相当する2種類の符号を加えた12分割の符号のいずれかを付す工程、
(3)前記フラグメントの立体配座を表記するにあたり、一部の化学結合の表記を省略しても一義的に決定できる構造の場合に、当該立体配座表記の注目する化学結合に対応する前記符号を付すか、もしくは二面角の位置だけを的確に示すための接頭辞と前記符号とを組み合わせた表記を用いて表記し、あわせて不要な表記を省略する工程、
(4)上記工程(1)〜(3)によって定義された立体配座表記(以下、符号化立体配座表記と示す)により、前記異なる立体配座に対応する各分子モデルの立体配座がいずれも一義的に決定できる構造であることを確認する工程、
(5)前記分子モデルに対応させて前記符号化立体配座表記を抽出し、抽出した符号化立体配座表記を各分子モデルに対応させてデータベース部に記憶させる工程
(6)続いて、前記処理部において、前記注目する立体配座に対応する各分子モデルのそれぞれの符号化立体配座表記に基づき、前記データベース部から各分子モデルを取り出すとともに各分子モデルの構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値もしくは他の物性値を求め、当該物性値を各分子モデルに対応させてデータベース部に記憶させる工程であって、かつ、構造最適化の結果立体配座に変化が生じた分子モデルに対しては、新たに前記(1)〜(4)の工程による符号化立体配座表記を抽出し、抽出した符号化立体配座表記を当該分子モデルに対応させてデータベース部に記憶させると共に、前記物性値も当該分子モデルに対応させてデータベース部に記憶させる工程、
(7)さらに、前記解析対象化合物についての実測によるエネルギー値もしくは他の物性値がある場合で、かつ解析対象化合物に対応する分子モデルのいずれかに当該物性値が関連づけられる場合に、当該物性値を前記分子モデルに対応させてデータベース部に記憶させる工程
(8)次に、前記処理部において、前記データベース部から解析対象化合物についての複数の分子モデルに対応する前記符号化立体配座表記を取り出すと共に、前記工程(6)又は(7)で記憶させた、各々の分子モデルに対応する、最適化構造のエネルギー値もしくは他の物性値、及び実測によるエネルギー値もしくは他の物性値のうちのいずれか1つ以上の物性値を取り出す工程、
(9)次いで、前記処理部において、解析対象化合物の注目する異なる立体配座に対応する各分子モデルごとに、前記符号化立体配座表記と前記物性値とを関連づけて表示部に出力する工程
In order to solve the above-described problems, the present invention preferably first compares the conformational structures easily using simplified symbols even when there are subtle structural differences in conformation. In a method of performing a simple conformational notation that can be performed uniformly, can handle any molecule in a unified manner, and enables large-scale computer processing,
The processing unit accepts the input of the molecular model of the compound to be analyzed,
Provided is a conformation notation method, wherein the processing unit performs processing including the following steps (1) to (9) on each molecular model .
(1) dividing the molecular models, the input of which is accepted for each fragment, the sequence position numbers defined by IUPAC nomenclature, according to the priority rules of Oite IUPAC nomenclature ligands to each of the chemical binding sites, most priority substituent A group or atom is selected, a dihedral angle is obtained, and 360 degrees is divided into 6 as a classification of the dihedral angle, and any one of the symbols 1 to 6 determined in advance so as to correspond to the divided portions is used. process be attached,
(2) When the conformation to be judged as a different conformation in the chemical binding site belongs to the same classification in any of the classifications of the six division codes, A step of adding one of 12 division codes obtained by adding two types of codes corresponding to α (clockwise) and β (counterclockwise) to each of the codes by division;
(3) In notation of the conformation of the fragment, in the case of a structure that can be uniquely determined even if some of the chemical bonds are omitted, the conformation corresponding to the chemical bond of interest in the conformation notation A process of adding a code or using a notation that combines the above-mentioned code with a prefix for accurately indicating only the position of a dihedral angle, and omitting unnecessary notation,
(4) The conformation of each molecular model corresponding to the different conformation is determined by the conformation notation defined by the steps (1) to (3) (hereinafter referred to as an encoded conformation notation). A process for confirming that both are structures that can be uniquely determined ,
(5) the in correspondence with the molecular model to extract the encoded conformational notation, the extracted encoded conformational notation Ru is stored in the database unit to correspond to each molecule model process,
(6) Subsequently, in the processing unit, based on the respective coding conformational representation of the molecular model corresponding to the conformation of the target, the structure of the molecular model is taken out of each molecular model from the database unit perform optimization and frequency calculation, the energy value or other physical properties of the optimized structure determined, a process the physical properties Ru is stored in the database unit to correspond to each molecule model and structure For molecular models whose conformation has changed as a result of optimization, newly extracted encoded conformational notations by the steps (1) to (4) above are extracted, and the extracted encoded conformational notations are extracted. Storing in the database unit corresponding to the molecular model and storing the physical property value in the database unit corresponding to the molecular model,
(7) Further, when there is an actually measured energy value or other physical property value for the analysis target compound, and the physical property value is associated with any of the molecular models corresponding to the analysis target compound, the physical property value step Ru is stored in the database unit in correspondence with the molecular model,
(8) Next, in the processing unit , the encoded conformational notation corresponding to a plurality of molecular models for the analysis target compound is extracted from the database unit and stored in the step (6) or (7). and, corresponding to each of the molecular model, to eject the any one or more of the physical properties of the energy values or other physical properties, and the energy value or other physical properties by the actual measurement of the optimized structure process,
(9) Next, in the processing unit, for each molecular model corresponding to a different conformation of interest of the analysis target compound, the encoded conformation notation and the physical property value are associated and output to the display unit .

また、第2には、上記第1の方法において、前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、複数の分子モデルに対して1つの前記符号化立体配座表記が対応する場合には、さらに相対的な位置関係に基づくρ(シス)、τ(トランス)に相当する符号を付すことで立体配座を一義的に表記することを特徴とする立体配座表記方法を提供する。
Second, in the first method, in the steps (1) to (3) for defining the conformation of the molecular model, according to the ligand priority rule of the IUPAC nomenclature, the most preferred substituent Alternatively, when the priority rule corresponding to “select the one with the smallest twist angle when all the ligands are the same” is selected when selecting atoms, one of the encoded solids for a plurality of molecular models is applied. In the case where conformation notation is supported, the conformation is uniquely represented by adding symbols corresponding to ρ (cis) and τ (trans) based on the relative positional relationship. Provide conformational notation.

また、第3には、上記第1の方法において、前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、リガンドの二面角のなす角度が同じになり、時計回りあるいは反時計回りのいずれのリガンドを選択すべきか決定できないために、1つの分子モデルに対して複数の前記符号化立体配座表記とりうる場合に、時計回りを優先するという優先則を設けて前記符号化立体配座表記を選択することにより、立体配座を一義的に表記できるようにすることを特徴とする立体配座表記方法を提供する。
Thirdly, in the first method, in the steps (1) to (3) for defining the conformation of the molecular model, according to the ligand priority rule of the IUPAC nomenclature, the most preferred substituent Or, when selecting the atom, applying the priority rule corresponding to “select the one with the smallest twist angle when all the ligands are the same”, the angle formed by the dihedral angle of the ligand becomes the same, to not be determined whether to select a clockwise or any of the ligand counterclockwise, if for a single molecule models a plurality of said encoded conformational notation may take, a priority rule that prioritize clockwise provided by selecting the encoded conformational notation and provides conformational notation method characterized by to be uniquely notation conformation.

また、第4には、上記第1の方法において、上記第2の方法及び上記第3の方法を組み合わせることを特徴とする立体配座表記方法を提供する。   According to a fourth aspect of the present invention, there is provided a conformational notation method characterized by combining the second method and the third method in the first method.

さらに、本発明は、第5には、好ましくは、立体配座の微妙な構造の違いがある場合にも簡略化した記号を用いて容易に該立体配座構造の比較を行うことができ、かつ任意の分子を統一的に扱うことができ、かつ大規模な電算機処理を可能とすることができる簡便な立体配座表記を行う装置において、
処理部が、解析対象化合物の注目する異なる立体配座に対応する複数の分子モデルの入力を受け付け、
前記処理部が、各分子モデルに対して下記の(1)〜(9)の工程を含む処理を行うことを特徴とする立体配座表記装置を提供する。
(1)入力を受け付けた分子モデルをフラグメント毎に分け、IUPAC命名法で定められた位置番号の順序により、各々の化学結合部位においてIUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択し、二面角を求め、当該二面角の分類として、360度を6分割し、その分割された部位に対応するように予め定めた1〜6のいずれかの符号を付す工程
(2)前記化学結合部位において、異なった立体配座と判断すべき立体配座が、前記6分割による符号のいずれの分類においても同一の分類に属する場合に、二面角分類として、前記6分割による符号のそれぞれにα(時計回り)、β(反時計回り)に相当する2種類の符号を加えた12分割の符号のいずれかを付す工程、
(3)前記フラグメントの立体配座を表記するにあたり、一部の化学結合の表記を省略しても一義的に決定できる構造の場合に、当該立体配座表記の注目する化学結合に対応する前記符号を付すか、もしくは二面角の位置だけを的確に示すための接頭辞と前記符号とを組み合わせた表記を用いて表記し、あわせて不要な表記を省略する工程、
(4)上記工程(1)〜(3)によって定義された立体配座表記(以下、符号化立体配座表記と示す)により、前記異なる立体配座に対応する各分子モデルの立体配座がいずれも一義的に決定できる構造であることを確認する工程、
(5)前記分子モデルに対応させて前記符号化立体配座表記を抽出し、抽出した符号化立体配座表記を各分子モデルに対応させてデータベース部に記憶させる工程
(6)続いて、前記処理部において、前記注目する立体配座に対応する各分子モデルのそれぞれの符号化立体配座表記に基づき、前記データベース部から各分子モデルを取り出すとともに各分子モデルの構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値もしくは他の物性値を求め、当該物性値を各分子モデルに対応させてデータベース部に記憶させる工程であって、かつ、構造最適化の結果立体配座に変化が生じた分子モデルに対しては、新たに前記(1)〜(4)の工程による符号化立体配座表記を抽出し、抽出した符号化立体配座表記を当該分子モデルに対応させてデータベース部に記憶させると共に、前記物性値も当該分子モデルに対応させてデータベース部に記憶させる工程、
(7)さらに、前記解析対象化合物についての実測によるエネルギー値もしくは他の物性値がある場合で、かつ解析対象化合物に対応する分子モデルのいずれかに当該物性値が関連づけられる場合に、当該物性値を前記分子モデルに対応させてデータベース部に記憶させる工程
(8)次に、前記処理部において、前記データベース部から解析対象化合物についての複数の分子モデルに対応する前記符号化立体配座表記を取り出すと共に、前記工程(6)又は(7)で記憶させた、各々の分子モデルに対応する、最適化構造のエネルギー値もしくは他の物性値、及び実測によるエネルギー値もしくは他の物性値のうちのいずれか1つ以上の物性値を取り出す工程、
(9)次いで、前記処理部において、解析対象化合物の注目する異なる立体配座に対応する各分子モデルごとに、前記符号化立体配座表記と前記物性値とを関連づけて表示部に出力する工程
Further, in the fifth aspect of the present invention, preferably, the conformation structure can be easily compared using a simplified symbol even when there is a subtle conformational structure difference. And in a device that can handle any molecule in a unified manner and can perform a large-scale computer processing and perform a simple conformational notation,
The processing unit receives input of a plurality of molecular models corresponding to different conformations of interest of the compound to be analyzed,
Provided is a conformation notation device characterized in that the processing unit performs processing including the following steps (1) to (9) on each molecular model .
(1) dividing the molecular models, the input of which is accepted for each fragment, the sequence position numbers defined by IUPAC nomenclature, according to the priority rules of Oite IUPAC nomenclature ligands to each of the chemical binding sites, most priority substituent A group or atom is selected, a dihedral angle is obtained, and 360 degrees is divided into 6 as a classification of the dihedral angle, and any one of the symbols 1 to 6 determined in advance so as to correspond to the divided portions is used. process be attached,
(2) When the conformation to be judged as a different conformation in the chemical binding site belongs to the same classification in any of the classifications of the six division codes, A step of adding one of 12 division codes obtained by adding two types of codes corresponding to α (clockwise) and β (counterclockwise) to each of the codes by division;
(3) In notation of the conformation of the fragment, in the case of a structure that can be uniquely determined even if some of the chemical bonds are omitted, the conformation corresponding to the chemical bond of interest in the conformation notation A process of adding a code or using a notation that combines the above-mentioned code with a prefix for accurately indicating only the position of a dihedral angle, and omitting unnecessary notation,
(4) The conformation of each molecular model corresponding to the different conformation is determined by the conformation notation defined by the steps (1) to (3) (hereinafter referred to as an encoded conformation notation). A process for confirming that both are structures that can be uniquely determined ,
(5) the in correspondence with the molecular model to extract the encoded conformational notation, the extracted encoded conformational notation Ru is stored in the database unit to correspond to each molecule model process,
(6) Subsequently, in the processing unit, based on the respective coding conformational representation of the molecular model corresponding to the conformation of the target, the structure of the molecular model is taken out of each molecular model from the database unit perform optimization and frequency calculation, the energy value or other physical properties of the optimized structure determined, a process the physical properties Ru is stored in the database unit to correspond to each molecule model and structure For molecular models whose conformation has changed as a result of optimization, newly extracted encoded conformational notations by the steps (1) to (4) above are extracted, and the extracted encoded conformational notations are extracted. Storing in the database unit corresponding to the molecular model and storing the physical property value in the database unit corresponding to the molecular model,
(7) Further, when there is an actually measured energy value or other physical property value for the analysis target compound, and the physical property value is associated with any of the molecular models corresponding to the analysis target compound, the physical property value step Ru is stored in the database unit in correspondence with the molecular model,
(8) Next, in the processing unit , the encoded conformational notation corresponding to a plurality of molecular models for the analysis target compound is extracted from the database unit and stored in the step (6) or (7). and, corresponding to each of the molecular model, to eject the any one or more of the physical properties of the energy values or other physical properties, and the energy value or other physical properties by the actual measurement of the optimized structure process,
(9) Next, in the processing unit, for each molecular model corresponding to a different conformation of interest of the analysis target compound, the encoded conformation notation and the physical property value are associated and output to the display unit .

また、第6には、上記第5の装置において、前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、複数の分子モデルに対して1つの前記符号化立体配座表記が対応する場合には、さらに相対的な位置関係に基づくρ(シス)、τ(トランス)に相当する符号を付すことで立体配座を一義的に表記することを特徴とする立体配座表記装置を提供する。
Sixthly, in the fifth apparatus, in the steps (1) to (3) for defining the conformation of the molecular model, according to the ligand priority rule of the IUPAC nomenclature, the most preferred substituent Alternatively, when the priority rule corresponding to “select the one with the smallest twist angle when all the ligands are the same” is selected when selecting atoms, one of the encoded solids for a plurality of molecular models is applied. In the case where conformation notation is supported, the conformation is uniquely represented by adding symbols corresponding to ρ (cis) and τ (trans) based on the relative positional relationship. A conformation notation device is provided.

また、第7には、上記第5の装置において、前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、リガンドの二面角のなす角度が同じになり、時計回りあるいは反時計回りのいずれのリガンドを選択すべきか決定できないために、1つの分子モデルに対して複数の前記符号化立体配座表記とりうる場合に、時計回りを優先するという優先則を設けて前記符号化立体配座表記を選択することにより、立体配座を一義的に表記できるようにすることを特徴とする立体配座表記装置を提供する。
Seventhly, in the fifth apparatus, in the steps (1) to (3) for defining the conformation of the molecular model, according to the ligand priority rule of the IUPAC nomenclature, the most preferred substituent Or, when selecting the atom, applying the priority rule corresponding to “select the one with the smallest twist angle when all the ligands are the same”, the angle formed by the dihedral angle of the ligand becomes the same, to not be determined whether to select a clockwise or any of the ligand counterclockwise, if for a single molecule models a plurality of said encoded conformational notation may take, a priority rule that prioritize clockwise by selecting the encoded conformational notation provided, to provide a conformational notation apparatus characterized by to be uniquely notation conformation.

また、第8には、上記第5の装置において、上記第6の装置及び上記第7の装置を組み合わせることを特徴とする立体配座表記装置を提供する。   Eighth, there is provided a conformational notation device characterized in that, in the fifth device, the sixth device and the seventh device are combined.

本発明によれば、立体配座の微妙な構造の違いがある場合にも簡略化した記号を用いて容易に該立体配座構造の比較を行うことができ、かつ任意の分子を統一的に扱うことができ、かつ大規模な電算機処理を可能とすることができる。
すなわち、本発明によれば、IUPAC命名法に準拠した規則より厳密に二面角の符号化等を定義するようにしたので、IUPAC命名法のリガンドの優先則として、(3)全部が同じときはねじれ角が一番小さくなるものを選択した場合においても立体配座を一義的に決定でき、任意の分子を統一的に扱うことができ、大規模な電算機処理を可能とすることが可能となる。
According to the present invention, even when there are subtle conformational differences in conformation, the conformational structures can be easily compared using simplified symbols, and any molecules can be unified. It can be handled and large-scale computer processing can be performed.
That is, according to the present invention, encoding of dihedral angles, etc. is defined more strictly than the rule based on the IUPAC nomenclature. Therefore, as a priority rule of the ligand of the IUPAC nomenclature, (3) Even when the one with the smallest twist angle is selected, the conformation can be uniquely determined, and any molecule can be handled in a unified manner, enabling large-scale computer processing. It becomes.

また、本発明によれば、レボフロキサシンやイブプロフェンなどのような従来用いられてきた表記自体では、一義的に立体配座を決定することは不可能であったが、本解析技術に用いる表記法では容易にそれぞれの立体配座の違いについて比較することができ、また、分子のフラグメント毎のデータベース化が容易になり、さらに、赤外円二色性データを組み合わせて使用することにより、液相状態における存在比の大きい立体配座表記を取り出すことができる。   In addition, according to the present invention, it has been impossible to uniquely determine the conformation with the conventionally used notation itself such as levofloxacin and ibuprofen, but in the notation used in this analysis technique, It is possible to easily compare the differences in conformation of each, and to facilitate the creation of a database for each molecular fragment. Furthermore, by using infrared circular dichroism data in combination, the liquid phase state A conformational notation having a large abundance ratio can be extracted.

従って、本発明は、例えばレボフロキサシンの活性種の立体配座を参考に進められている新規薬剤設計などに活用することができ、構造活性相関等を活用した、有害物質の人体への影響評価や薬理プロテオミクスによる創薬などの応用面での展開が充分に期待されるものである。   Therefore, the present invention can be used for, for example, the design of new drugs that are being promoted with reference to the conformation of the active species of levofloxacin, and the effects of harmful substances on the human body can be evaluated using structure-activity relationships and the like. The development of application such as drug discovery by pharmacological proteomics is fully expected.

以下、本発明を好ましい実施形態に基づいて詳細に説明する。   Hereinafter, the present invention will be described in detail based on preferred embodiments.

図1は、本発明の立体配座表記装置のシステム構成図である。この立体配座表記装置は、表示部1、入力部2、処理部3、主記憶部4、出力部5、外部インターフェース(I/O)部6、データベース7よりなり、各部はバス8により接続されている。このような立体配座表記装置は、例えば、立体配座表記を行うためのプログラムを取り込んだパーソナルコンピュータ等により構築することができる。   FIG. 1 is a system configuration diagram of a conformation notation apparatus according to the present invention. This conformational notation device comprises a display unit 1, an input unit 2, a processing unit 3, a main storage unit 4, an output unit 5, an external interface (I / O) unit 6, and a database 7. Each unit is connected by a bus 8. Has been. Such a conformation notation device can be constructed by, for example, a personal computer incorporating a program for performing conformation notation.

表示部1は、CRTや液晶ディスプレイ等よりなり、立体配座表記のための画面表示を行う。入力部2は、キーボード等の各種入力手段よりなり、ユーザが必要なデータや情報を入力するために用いる。処理部3は、CPUより構成することができ、立体配座表記のための各種制御、演算等を行う。主記憶部4は立体配座表記のためのプログラム等を格納している。出力部5は、プリンタ等よりなり、ユーザに処理結果等を出力する。外部インターフェース(I/O)部6は、LANやインターネット等により他の端末機器等への接続を行う。データベース7は、立体配座表記のための各種データ等を書き換え可能に記憶する。   The display unit 1 includes a CRT, a liquid crystal display, and the like, and performs screen display for conformational notation. The input unit 2 includes various input means such as a keyboard and is used for inputting data and information required by the user. The processing unit 3 can be composed of a CPU, and performs various controls and calculations for conformation notation. The main storage unit 4 stores a program for conformation notation. The output unit 5 includes a printer or the like, and outputs a processing result or the like to the user. An external interface (I / O) unit 6 connects to other terminal devices via a LAN, the Internet, or the like. The database 7 stores various data for conformation notation in a rewritable manner.

本発明の立体配座表記装置では、IUPAC命名法に準拠した規則より厳密に二面角の符号化を定義するようにした表記法を用いる。このため、本発明の解析対象となる化合物は、有機化合物であれば構造の一部に鎖状構造、環状構造いずれを有していても構わない。さらに、エステル基、カルボニル基、ヒドロキシル基、フェニル基、アルケン、ハロゲン、リン原子、硫黄原子のような官能基で置換されていてもかまわない。また、共有結合ではない、例えば水素結合、配位結合で結合した構造を有していてもかまわない。但し、赤外円二色性データを組み合わせて、液相中における存在比の大きい立体配座構造を取り出す場合には、解析対象となる化合物は光学活性分子に限定される。   The conformation notation apparatus of the present invention uses a notation method in which dihedral angle encoding is defined more strictly than a rule based on the IUPAC nomenclature. For this reason, as long as the compound used as the analysis object of this invention is an organic compound, it may have either a chain structure or a cyclic structure in a part of structure. Furthermore, it may be substituted with a functional group such as an ester group, a carbonyl group, a hydroxyl group, a phenyl group, an alkene, a halogen, a phosphorus atom, or a sulfur atom. Further, it may have a structure which is not a covalent bond, for example, a hydrogen bond or a coordinate bond. However, when a conformational structure having a large abundance ratio in the liquid phase is extracted by combining infrared circular dichroism data, the compound to be analyzed is limited to an optically active molecule.

このような有機化合物としては、例えば、以下のような化合物を例示することができる。   As such an organic compound, the following compounds can be illustrated, for example.

レボフロキサシン、ピペラジン、イブプロフェン、イブプロフェン二量体、2-フェニルプロピオン酸、サリドマイド、サリドマイド二量体、5'-ヒドロキシサリドマイド、フタルイミド、ジオキソピペリジン、パクリタキセル、パクリタキセルtail、パクリタキセルtailメチルエステル、バッカチンIII、ベンズアミド、マラチオン、ジエチルサクシネート、2-メルカプトジエチルサクシネート、2-ブタノール、2-ペンタノール、2-ヘキサノール、2-ヘプタノール、2-オクタノール、2-ノナノール、2-デカノール、2-メチル-1-ブタノール、3-メチル-1-ペンタノール、4-メチル-1-ヘキサノール、5-メチル-1-ヘプタノール、6-メチル-1-オクタノール、cis-ペルメトリン、cis-3-(2,2-ジクロロビニル)-2,2-ジメチルシクロプロパンカルボン酸ベンジルエステル、cis-3-(2,2-ジクロロビニル)-2,2-ジメチルシクロプロパンカルボン酸メチルエステル、3-フェノキシベンジルアルコール、コレステロールアセテート、コレステロールプロピオネート、n-ブチリックアシッドコレステロールエステル、コレステロールn-バレレート、コレステロールn-ヘキサノエート、コレステロールn-ヘプタノエート、コレステロールn-カプリレート、コレステロールぺラルゴネート、コレステロールn-カプレート、コレステロールラウレート、コレステロールミリステート、コレステロールパルミテート、コレステロール、β-コレスタノール、コレステリルクロライド、コレステリルブロマイド、コレステロールメチルカルボネート、コレステロールエチルカルボネート、コレステロール-n-ブチルカルボネート、コレステロール-n-アミルカルボネート、コレステロール-n-ヘキシルカルボネート、コレステロール-n-ヘプチルカルボネート、コレステロール-n-ノニルカルボネート、コレステロールオレイルカルボネート。   Levofloxacin, piperazine, ibuprofen, ibuprofen dimer, 2-phenylpropionic acid, thalidomide, thalidomide dimer, 5'-hydroxythalidomide, phthalimide, dioxopiperidine, paclitaxel, paclitaxel tail, paclitaxel tail methyl ester, baccatin III, benzamide , Malathion, diethyl succinate, 2-mercaptodiethyl succinate, 2-butanol, 2-pentanol, 2-hexanol, 2-heptanol, 2-octanol, 2-nonanol, 2-decanol, 2-methyl-1-butanol 3-methyl-1-pentanol, 4-methyl-1-hexanol, 5-methyl-1-heptanol, 6-methyl-1-octanol, cis-permethrin, cis-3- (2,2-dichlorovinyl) -2,2-Dimethylcyclopropanecarboxylic acid benzyl ester, cis-3- (2,2-di- (Rolovinyl) -2,2-dimethylcyclopropanecarboxylic acid methyl ester, 3-phenoxybenzyl alcohol, cholesterol acetate, cholesterol propionate, n-butyric acid cholesterol ester, cholesterol n-valerate, cholesterol n-hexanoate, cholesterol n- Heptanoate, cholesterol n-caprylate, cholesterol pelargonate, cholesterol n-caprate, cholesterol laurate, cholesterol myristate, cholesterol palmitate, cholesterol, β-cholestanol, cholesteryl chloride, cholesteryl bromide, cholesterol methyl carbonate, cholesterol ethyl carbonate , Cholesterol-n-butyl carbonate, cholesterol-n-amyl carbonate Over DOO, cholesterol -n- hexyl carbonate, cholesterol -n- heptyl carbonate, cholesterol -n- nonyl carbonate, cholesterol oleyl carbonate.

本実施形態の立体配座表記装置による立体配座表記の概要を述べると、まず、処理部3が、解析対象化合物の分子モデルの入力を受け付ける。次に、処理部3は、入力を受け付けた分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付し、一つの立体配座表記で立体配座を一義的に決定できる構造について、注目する符号化立体配座の表記を抽出するとともに、抽出した符号化立体配座表記をデータベース7に記憶させる。次に、処理部3は、抽出した符号化立体配座の表記に基づいて分子モデルの構造最適化及び振動数計算を行い、構造最適化とその最適化構造の物性値を求める。そして、構造最適化の結果、構造に変化が生じた場合にはその構造の符号化立体配座の表記を抽出するとともに、抽出した符号化立体配座表記をデータベース7に記憶させる。処理部3は、データベース7から注目する分子モデルに対応する前記符号化立体配座表記及び物性値を取り出し表記する。必要に応じて処理部3が、解析対象化合物の実測の物性値あるいは分子構造の入力を受け付ける。次に処理部3は、実測の物性値をデータベース7に記憶させる。あるいは処理部3は、入力を受け付けた実測の分子構造に基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付し、一つの立体配座表記で立体配座を一義的に決定できる構造について、注目する符号化立体配座の表記を抽出するとともに、抽出した符号化立体配座表記をデータベース7に記憶させる。処理部3は、データベース7から最適化構造の物性値、構造最適化された分子モデル、実測の物性値および実測の分子構造の中から必要となるものをその符号化立体配座表記とともに取り出し、その符号化立体配座表記に基づいて相同性の解析を行う。さらに処理部3は、必要に応じて存在比を用いた平均化処理などの数値演算を行い、得られた結果を用いてその符号化立体配座表記に基づいて相同性の解析を行う。処理部3は、相同性の解析結果を前記符号化立体配座表記とともに表記する。   The outline of the conformational notation by the conformational notation device of the present embodiment will be described. First, the processing unit 3 receives an input of a molecular model of the analysis target compound. Next, the processing unit 3 attaches a predetermined code based on the dihedral angle to each chemical bonding site based on the molecular model that has received the input, and defines the conformation with a single conformational notation. For the structure that can be determined automatically, the notation of the noticed encoded conformation is extracted and the extracted encoded conformation notation is stored in the database 7. Next, the processing unit 3 performs structure optimization and frequency calculation of the molecular model based on the extracted coded conformation notation, and obtains structure optimization and physical property values of the optimized structure. When the structure is changed as a result of the structure optimization, the encoded conformation notation of the structure is extracted and the extracted encoded conformation notation is stored in the database 7. The processing unit 3 takes out the encoded conformational notation and physical property values corresponding to the molecular model of interest from the database 7 and describes them. As necessary, the processing unit 3 receives an input of an actually measured physical property value or molecular structure of the analysis target compound. Next, the processing unit 3 stores the actually measured physical property values in the database 7. Alternatively, the processing unit 3 attaches a predetermined code based on the dihedral angle to each chemical bonding site based on the actually measured molecular structure that has received the input, and the conformation is uniquely defined by one conformational notation. For the structure that can be determined automatically, the notation of the noticed encoded conformation is extracted and the extracted encoded conformation notation is stored in the database 7. The processing unit 3 takes out the necessary physical property value of the optimized structure, the molecular model that has been optimized from the database 7, the actually measured physical property value, and the actually measured molecular structure together with its encoded conformation notation, Based on the encoded conformation notation, homology is analyzed. Further, the processing unit 3 performs a numerical operation such as an averaging process using the abundance ratio as necessary, and analyzes the homology based on the encoded conformation notation using the obtained result. The processing unit 3 describes the homology analysis result together with the encoded conformation notation.

図2のフローチャートを用いてさらに詳細に説明すると、本発明においては、まず分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義を行う(ステップS1〜S3)。この場合、例えばあらかじめ化合物名、化学構造式および分子モデルを対応させてデータベース7にその情報を記憶させておき、ユーザが入力部2より化合物名あるいは化学構造式を入力すると、対応する分子モデルに変換できるようにしておいてよい。   In more detail using the flowchart of FIG. 2, in the present invention, the conformation is first achieved by attaching a predetermined code based on the dihedral angle to each chemical bonding site based on the molecular model. A conformation notation that is uniquely determined is defined (steps S1 to S3). In this case, for example, a compound name, a chemical structural formula, and a molecular model are associated in advance and the information is stored in the database 7. When the user inputs a compound name or chemical structural formula from the input unit 2, the corresponding molecular model is displayed. You may be able to convert.

さらに詳しく説明すると、環構造をもつ場合など一個の立体配座表記で立体配座を一義的に決定できる構造について、注目する化学結合の表記を残して不要な表記を省略して、立体配座を一義的に示す表記の定義を行う(ステップS3)。この定義に基づき、符号だけを取り出した表記を用いて立体配座解析に使用する。データベース化の観点から化合物をフラグメント毎に区切り表記した方が簡便な場合にはフラグメントの接頭辞と符号を組み合わせた表記を用いてもかまわない。また、X線結晶構造解析データのように水素原子の位置が決められない場合などに備えて、二面角をもとにした予め定めた符号の代わりに対応する二面角の位置だけを意味する符号を用いてもかまわない。   In more detail, for a structure that can uniquely determine the conformation with a single conformation notation, such as when it has a ring structure, leave the notation of the chemical bond of interest, omit the unnecessary notation, and the conformation Is defined to uniquely indicate (step S3). Based on this definition, it uses for the conformational analysis using the notation which extracted only the code | symbol. If it is more convenient to separate the compounds into fragments from the viewpoint of creating a database, a combination of fragment prefixes and codes may be used. In addition, only the position of the corresponding dihedral angle is used instead of the predetermined code based on the dihedral angle, in case the position of the hydrogen atom cannot be determined as in the X-ray crystal structure analysis data. You may use the code to do.

ここで、二面角を表す符号を付す方法として、一般的には360度を6分割し、その分割された部位に図3に示す1-6のような予め定めた符号を付し、主にこの符号を用いて立体配座を表記する。まれにこの分類では2種類の違った立体配座と判断すべき立体配座が同一のコードとして表記される場合があるため、その場合にはさらにその6分割された各々の部位をさらに2分割し、2分割された部位にα(時計回り)、β(反時計回り)のような予め定めた符号を付し、主にこれらの2種類の符号のような組み合わせを用いて図3に示す12分割された部位に対応する符号を用いて立体配座を表記する。さらに、偶然対応する二面角がその境界線上に位置する場合に備えて、境界線上では図3に示す符号を用いてもかまわない。   Here, as a method of attaching a sign representing a dihedral angle, generally, 360 degrees is divided into six parts, and a predetermined sign such as 1-6 shown in FIG. The conformation is written using this code. In rare cases, the conformation that should be judged as two different conformations in this classification may be expressed as the same code. In that case, each of the six divided parts is further divided into two parts. Then, predetermined parts such as α (clockwise) and β (counterclockwise) are attached to the divided parts, and a combination such as these two kinds of codes is mainly shown in FIG. The conformation is described using symbols corresponding to the 12 divided parts. Furthermore, the code shown in FIG. 3 may be used on the boundary line in preparation for a case where the corresponding dihedral angle is located on the boundary line.

さらに、本発明では、IUPAC命名法に準拠した規則において、(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合において、1つの符号化立体配座表記で複数の分子モデルが対応する場合が起こりうるため、その場合には新たに相対的な位置関係に基づくρ(シス)、τ(トランス)のような符号を用いて、一義的に立体配座を表記できるようにする。例えば、(S)-イブプロフェンにおいてプロピオン酸部位の結合した芳香環において二面角を決める場合には(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合に該当するが、ibu-32α(ph-35β)という符号化立体配座表記では図4に示す同一の表記で表される2種類の立体配座構造が存在する。その場合には注目する結合間の相対位置関係を用いて、ρ(シス)およびτ(トランス)の符号を用いて区別する。   Furthermore, in the present invention, in the rule based on the IUPAC nomenclature, when all the ligands are the same, when the one having the smallest twist angle is selected, a plurality of coding conformational notations are used. Since there may be cases where the molecular model corresponds, in that case, the conformation can be expressed uniquely using a code such as ρ (cis) or τ (trans) based on a new relative positional relationship. Like that. For example, in (S) -ibuprofen, when the dihedral angle is determined in the aromatic ring to which the propionic acid moiety is bonded, (3) when all the ligands are the same, the one with the smallest twist angle is selected. However, in the encoded conformational notation ibu-32α (ph-35β), there are two kinds of conformational structures represented by the same notation shown in FIG. In that case, the relative positional relationship between the bonds of interest is used to distinguish using the symbols ρ (cis) and τ (transformer).

また、IUPAC命名法に準拠した規則において、(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合に時計回りあるいは反時計回りかで、区別できないリガンドの二面角のなす角度が同じになることが起こりうる。その場合、1つの分子モデルにおいて複数の符号化立体配座表記が可能となるため、時計回りでねじれ角が一番小さくなるものを優先する。例えば、レボフロキサシンにおいて図5に示すピペラジン環の二面角では、ピペラジン環自体が左右対称であるためリガンドの二面角のなす角度が正負逆で絶対値は同じになっており、2種類の符号化立体配座表記をとりうる。優先則を適用することによりlevo-2-15(pipa-11β)と一義的に立体配座の表記を定義する。その他の規則については前記特許文献1あるいは非特許文献4に記載されたIUPAC命名法に準拠した規則に従う。   In addition, in the rules based on the IUPAC nomenclature, (3) when all ligands are the same, the dihedral angle of the ligand that cannot be distinguished by clockwise or counterclockwise rotation when the one with the smallest twist angle is selected. It can happen that the angles made by In that case, since a plurality of encoded conformational representations are possible in one molecular model, the one with the smallest twist angle in the clockwise direction is given priority. For example, in the dihedral angle of the piperazine ring shown in FIG. 5 in levofloxacin, since the piperazine ring itself is symmetrical, the angle formed by the dihedral angle of the ligand is the opposite and the absolute value is the same. Conformational conformation notation can be taken. By applying the priority rule, the conformational notation is uniquely defined as levo-2-15 (pipa-11β). Other rules follow the rules based on the IUPAC nomenclature described in Patent Document 1 or Non-Patent Document 4.

本実施形態の立体配座表記装置では前記立体配座表記と関連づけて解析を行ったのちに必要となる物性値などの情報とともに符号化立体配座表記を表示する。すなわち、立体配座表記に対応する分子モデルについて構造の最適化及び振動数計算を行い(ステップS4)、その最適化構造のエネルギー値及び物性値を求める(ステップS5)。さらに、構造最適化の前後で構造に変化が起きていないかチェックし、構造変化が生じた場合には改めて分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義に基づき符号化立体配座表記を抽出する(ステップS6)。ここで、実測の物性値のみで相同性の比較を行う場合には、構造の最適化及び振動数計算のステップを省略してもよい。次に、実測の物性値との比較を行う必要がない場合には前記立体配座表記を用いて最適化構造の物性値の相同性の比較を行う(ステップS12)。ここで、分子モデルの構造最適化及び振動数計算の方法に特に制限はないが、好ましくはB3LYPファンクショナルを用いた密度汎関数法による分子軌道法計算が使用される。   In the conformation notation apparatus of the present embodiment, the encoded conformation notation is displayed together with information such as physical property values required after analysis in association with the conformation notation. That is, structure optimization and frequency calculation are performed for the molecular model corresponding to the conformational notation (step S4), and the energy value and physical property value of the optimized structure are obtained (step S5). Furthermore, it is checked whether the structure has changed before and after the structure optimization. If the structure has changed, a predetermined code based on the dihedral angle at each chemical bonding site based on the molecular model is newly obtained. To extract the encoded conformation notation based on the definition of the conformation notation that uniquely determines the conformation (step S6). Here, in the case of comparing the homology only with the actually measured physical property values, the steps of structure optimization and frequency calculation may be omitted. Next, when it is not necessary to compare with the actual physical property value, the homology of the physical property value of the optimized structure is compared using the conformational notation (step S12). Here, there are no particular limitations on the method of molecular model structure optimization and frequency calculation, but molecular orbital calculation by density functional method using B3LYP functional is preferably used.

実測の物性値との比較を行う場合には、まず、X線結晶構造解析データのような、比較対象となる実測の分子構造について各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義に基づき符号化立体配座表記を抽出する(ステップS8)。赤外円二色性データを比較する場合のように、実測の物性値に実測の分子構造のデータが伴っていない場合にはステップS8は省略することができる。次に、実測の物性値や活性についてステップS12の相同性の解析が行える形に立体配座情報の処理を行う(ステップS9)。さらに、本発明において、液相中の赤外円二色性との比較を行う場合のように複数個の立体配座構造を考慮しなくてはならない場合には、物性値の平均化処理や使用した複数個の立体配座構造の、前記符号化立体配座表記のデータベース化等の数値演算処理を行うことができる(ステップS10〜S12)。液相中の赤外円二色性との比較を行うには、例えば、前記特許文献1記載の方法を用いればよい。   When comparing the measured physical property values, first, the measured molecular structure to be compared, such as X-ray crystal structure analysis data, is previously determined based on the dihedral angle at each chemical bonding site. The encoded conformational notation is extracted based on the definition of the conformational notation that uniquely determines the conformation (step S8). As in the case of comparing infrared circular dichroism data, when the measured physical property value is not accompanied by the measured molecular structure data, step S8 can be omitted. Next, the conformation information is processed in such a way that the homology in step S12 can be analyzed for the measured physical property values and activities (step S9). Furthermore, in the present invention, when it is necessary to consider a plurality of conformational structures as in the case of comparison with infrared circular dichroism in the liquid phase, the physical property value averaging process or Numerical calculation processing such as creating a database of the encoded conformation notation of the plurality of conformation structures used can be performed (steps S10 to S12). In order to compare with the infrared circular dichroism in the liquid phase, for example, the method described in Patent Document 1 may be used.

尚、立体配座表記の符号化のプロセス、分子モデルの構造最適化、物性値抽出のプロセスおよび相同性の解析のプロセスは前後してもかまわない。また、例えば、前記特許文献1記載の方法に従い、タンパク質に取り込まれた有機分子の立体配座構造のような、異なる測定解析から得られた立体配座構造について、前記立体配座表記を用いて相同性の解析を行ってもかまわない。   The conformation notation encoding process, molecular model structure optimization, physical property value extraction process, and homology analysis process may be mixed. In addition, for example, according to the method described in Patent Document 1, a conformational structure obtained from different measurement analysis, such as a conformational structure of an organic molecule incorporated into a protein, using the conformational notation. Analysis of homology may be performed.

次に本発明を実施例により、さらに詳細に説明する。
実施例1
下記化学構造式(I)で表せるレボフロキサシンの分子モデルについて、各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義[levo-A-BC(pipa-ab)]を行い、符号化立体配座表記を抽出した。次に、符号化立体配座表記に基づく分子モデルについて、B3LYPファンクショナルを用いた密度汎関数法による構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値を求めた。構造最適化の結果、構造に変化が生じたものについては改めて分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義に基づき符号化立体配座表記を抽出した。立体配座を一義的に決定するには、各々の化学結合部位に、360度を6分割し、その分割された部位に予め定めた符号を付し、さらにそれぞれの部位をさらに2分割し別の予め定めた符号を付すことで定められた2種類の符号を用いて、立体配座表記を表示する必要のあることがわかった。
レボフロキサシン(I)においてピペラジン環の二面角では、ピペラジン環自体が左右対称であるためリガンドの二面角のなす角度が正負逆で絶対値は同じになっていた。そのため、2種類の符号化立体配座表記をとり得ることから、予め定めた優先則を適用することにより符号化立体配座表記を抽出した。次に、符号化立体配座表記を用いて最適化構造の物性値の相同性の解析を行い、エネルギー的に安定な立体配座構造levo-2-15(pipa-11β)を抽出した。符号化立体配座表記及び相同性の解析結果を表1に示す。levo-2-15(pipa-11β)で表される立体配座の分子モデルを図6に示す。前記解析結果が立体配座表記装置から出力および表記された。
Next, the present invention will be described in more detail with reference to examples.
Example 1
Conformation that uniquely determines the conformation of a molecular model of levofloxacin represented by the following chemical structural formula (I) by assigning a predetermined code based on the dihedral angle to each chemical binding site The notation definition [levo-A-BC (pipa-ab)] was performed, and the encoded conformation notation was extracted. Next, for the molecular model based on the encoded conformational notation, the structure was optimized by the density functional method using B3LYP functional and the frequency was calculated, and the energy value of the optimized structure was obtained. Conformation is uniquely determined by attaching a predetermined code based on the dihedral angle to each chemical bonding site based on the molecular model for those structural changes resulting from structural optimization. The encoded conformational notation was extracted based on the definition of the conformational notation to be determined. In order to uniquely determine the conformation, each chemical bonding site is divided into 360 degrees by 6 parts, a predetermined code is added to each divided part, and each part is further divided into two parts. It was found that the conformation notation needs to be displayed using two types of codes determined by attaching the predetermined codes.
In levofloxacin (I), the dihedral angle of the piperazine ring was symmetrical, so the angle formed by the dihedral angle of the ligand was positive and negative and the absolute value was the same. Therefore, since two types of encoded conformational notations can be taken, the encoded conformational notations are extracted by applying a predetermined priority rule. Next, the homology of the physical property values of the optimized structure was analyzed using the encoded conformation notation, and the conformation structure levo-2-15 (pipa-11β) that was stable in terms of energy was extracted. Table 1 shows the results of the analysis of the encoded conformation notation and homology. A conformational molecular model represented by levo-2-15 (pipa-11β) is shown in FIG. The analysis results were output and written from the conformation notation device.

実施例2
下記化学構造式(II)で表せる(S)-イブプロフェンの分子モデルについて、各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義[ibu-AB(ph-CD)]を行い、符号化立体配座表記を抽出した。次に、符号化立体配座表記に基づく分子モデルについて、B3LYPファンクショナルを用いた密度汎関数法による構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値を求めた。構造最適化の結果、構造に変化が生じたものについては改めて分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義に基づき符号化立体配座表記を抽出した。立体配座を一義的に決定するには、各々の化学結合部位に、360度を6分割し、その分割された部位に予め定めた符号を付し、さらにそれぞれの部位をさらに2分割し別の予め定めた符号を付すことで定められた2種類の符号を用いて、立体配座表記を表示する必要のあることがわかった。
(S)-イブプロフェン(II)において、プロピオン酸部位の結合した芳香環において二面角を決める場合には(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合に該当するが、同一の表記で表される2種類の立体配座構造が存在した。そのため注目する結合間の相対位置関係を用いて、ρ(シス)およびτ(トランス)の符号を用いて区別を行うことにより符号化立体配座表記を抽出した。次に、符号化立体配座表記を用いて最適化構造の物性値の相同性の解析を行ったところ、単量体である(S)-イブプロフェン(II)では、計算から求められた赤外二色性バンドはプロピオン酸部位の結合した芳香環付近の置換基の位置関係によって大きく変化し、これらのフラグメントの影響を強く受けることがわかった。さらに、エネルギー的に安定な立体配座構造ibu-32ασ(ph-3σ5β)を抽出した。符号化立体配座表記及び相同性の解析結果を表2に示す。ibu-32ασ(ph-3σ5β)で表される立体配座の分子モデルを図7に示す。前記解析結果が立体配座表記装置から出力および表記された。
Example 2
Concerning the molecular model of (S) -ibuprofen represented by the following chemical structural formula (II), the conformation is uniquely determined by attaching a predetermined code based on the dihedral angle to each chemical binding site. The conformational notation was defined [ibu-AB (ph-CD)], and the encoded conformational notation was extracted. Next, for the molecular model based on the encoded conformational notation, the structure was optimized by the density functional method using B3LYP functional and the frequency was calculated, and the energy value of the optimized structure was obtained. Conformation is uniquely determined by attaching a predetermined code based on the dihedral angle to each chemical bonding site based on the molecular model for those structural changes resulting from structural optimization. The encoded conformational notation was extracted based on the definition of the conformational notation to be determined. In order to uniquely determine the conformation, each chemical bonding site is divided into 360 degrees by 6 parts, a predetermined code is added to each divided part, and each part is further divided into two parts. It was found that the conformation notation needs to be displayed using two types of codes determined by attaching the predetermined codes.
In (S) -ibuprofen (II), when the dihedral angle is determined in the aromatic ring to which the propionic acid moiety is bonded, (3) When all the ligands are the same, the one with the smallest twist angle is selected. Although applicable, there were two types of conformational structures represented by the same notation. Therefore, using the relative positional relationship between the bonds of interest, the encoded conformation notation was extracted by making a distinction using the symbols of ρ (cis) and τ (trans). Next, the homology of the property values of the optimized structure was analyzed using the encoded conformation notation, and for the monomer (S) -ibuprofen (II), the calculated infrared was obtained. It was found that the dichroic band changed greatly depending on the positional relationship of the substituents near the aromatic ring to which the propionic acid site was bonded, and was strongly influenced by these fragments. Furthermore, the energetically stable conformation structure ibu-32ασ (ph-3σ5β) was extracted. Table 2 shows the results of the analysis of the encoded conformation notation and homology. A conformational molecular model represented by ibu-32ασ (ph-3σ5β) is shown in FIG. The analysis results were output and written from the conformation notation device.

実施例3
下記化学構造式(III)で表せる(S)-イブプロフェン二量体の分子モデルについて、各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義[ibu-ABCD(ibu-A’B’C’D’)]を行い、符号化立体配座表記を抽出した。次に、符号化立体配座表記に基づく分子モデルについて、B3LYPファンクショナルを用いた密度汎関数法による構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値を求めた。構造最適化の結果、構造に変化が生じたものについては改めて分子モデルに基づき各々の化学結合部位に二面角をもとにした予め定めた符号を付すことにより、立体配座を一義的に決定する立体配座表記の定義に基づき符号化立体配座表記を抽出した。立体配座を一義的に決定するには、各々の化学結合部位に、360度を6分割し、その分割された部位に予め定めた符号を付し、さらにそれぞれの部位をさらに2分割し別の予め定めた符号を付すことで定められた2種類の符号を用いて、立体配座表記を表示する必要のあることがわかった。
(S)-イブプロフェン二量体(III)において、プロピオン酸部位の結合した芳香環において二面角を決める場合には(3)全部のリガンドが同じときはねじれ角が一番小さくなるものを選択した場合に該当するが、同一の表記で表される2種類の立体配座構造が存在した。そのため注目する結合間の相対位置関係を用いて、ρ(シス)およびτ(トランス)の符号を用いて区別を行うことにより符号化立体配座表記を抽出した。次に、符号化立体配座表記を用いて最適化構造の物性値の相同性の解析を行ったところ、(S)-イブプロフェン二量体(III)では、計算から求められた赤外二色性バンドはプロピオン酸部位の結合した芳香環付近の置換基の位置関係によって大きく変化し、これらのフラグメントの影響を強く受けることがわかった。さらに、エネルギー的に安定な立体配座構造ibu-23βτ3τ5β(ibu-23βτ3τ5β)を抽出した。符号化立体配座表記及び相同性の解析結果を表3に示す。ibu-23βτ3τ5β(ibu-23βτ3τ5β)で表される立体配座の分子モデルを図8に示す。
Example 3
Concerning the molecular model of (S) -ibuprofen dimer represented by the following chemical structural formula (III), the conformation is unambiguous by attaching a predetermined code based on the dihedral angle to each chemical binding site. Defined conformational notation [ibu-ABCD (ibu-A'B'C'D ')] was extracted, and the encoded conformational notation was extracted. Next, for the molecular model based on the encoded conformational notation, the structure was optimized by the density functional method using B3LYP functional and the frequency was calculated, and the energy value of the optimized structure was obtained. Conformation is uniquely determined by attaching a predetermined code based on the dihedral angle to each chemical bonding site based on the molecular model for those structural changes resulting from structural optimization. The encoded conformational notation was extracted based on the definition of the conformational notation to be determined. In order to uniquely determine the conformation, each chemical bonding site is divided into 360 degrees by 6 parts, a predetermined code is added to each divided part, and each part is further divided into two parts. It was found that the conformation notation needs to be displayed using two types of codes determined by attaching the predetermined codes.
In (S) -ibuprofen dimer (III), when determining the dihedral angle in the aromatic ring to which the propionic acid moiety is bonded, (3) when all ligands are the same, select the one with the smallest twist angle However, there are two types of conformational structures represented by the same notation. Therefore, using the relative positional relationship between the bonds of interest, the encoded conformation notation was extracted by making a distinction using the symbols of ρ (cis) and τ (trans). Next, we analyzed the homology of the property values of the optimized structure using the encoded conformation notation.In the (S) -ibuprofen dimer (III), the infrared dichroism obtained from the calculation The sex band varied greatly depending on the positional relationship of the substituents near the aromatic ring to which the propionic acid moiety was attached, and it was found that these fragments were strongly influenced by these fragments. Furthermore, the energetically stable conformation structure ibu-23βτ3τ5β (ibu-23βτ3τ5β) was extracted. Table 3 shows the results of the encoded conformation notation and homology analysis. A conformational molecular model represented by ibu-23βτ3τ5β (ibu-23βτ3τ5β) is shown in FIG.

次に、赤外領域のそれぞれの振動モードについて旋光強度の値を用いて各々の立体配座の予測スペクトルを作成した。液相中では存在比の大きい立体配座構造が複数存在していることから、符号化立体配座表記に付随する計算結果を用いて最も安定な立体配座構造から1 kcal/mol以内の立体配座構造を16配座抽出した。16個の立体配座構造について、最適化構造のギブズ自由エネルギー値をボルツマンポピュレーションに変換した後、各々の立体配座の予測スペクトルにボルツマンポピュレーションの係数を掛けたものを足すことにより平均予測スペクトルを作成した。   Next, a predicted spectrum of each conformation was created using the value of optical rotation intensity for each vibration mode in the infrared region. Since there are multiple conformational structures with large abundance ratios in the liquid phase, using the calculation results associated with the encoded conformational notation, the most stable conformation within 1 kcal / mol 16 conformational structures were extracted. For 16 conformational structures, the Gibbs free energy value of the optimized structure is converted into Boltzmann population, and then the average prediction is made by adding the predicted spectrum of each conformation multiplied by the coefficient of Boltzmann population A spectrum was created.

一方で、(S)-イブプロフェン二量体(III)を重クロロホルムに溶解し濃度を0.11 Mにした後、BaF2窓板サンプルセルに入れ、4時間積算を行い、赤外円二色性スペクトル(VCD)及び赤外吸収スペクトル(IR)を収集した。実測の赤外円二色性スペクトルと平均予測スペクトルとの比較を行ったところ、非常によい一致が確認された。このことから、重クロロホルム中の存在比の大きい立体配座に、水素結合をもつibu-23βτ3τ5β(ibu-23βτ3τ5β)で表される立体配座が含まれることが検証された。実測の赤外円二色性スペクトルと平均予測スペクトルを比較したチャートを図9に示す。さらに、スペクトルの詳細な解析から実測のスペクトルでは(S)-イブプロフェン単量体の寄与等、存在比はあまり大きくはないものの16配座以外の数多くの立体配座構造が存在し、バンド強度が予測値よりも小さくなっていることが示唆された。前記解析結果が立体配座表記装置から出力および表記された。   On the other hand, (S) -ibuprofen dimer (III) was dissolved in deuterated chloroform to a concentration of 0.11 M, then placed in a BaF2 window plate sample cell, integrated for 4 hours, and an infrared circular dichroism spectrum ( VCD) and infrared absorption spectra (IR) were collected. When the measured infrared circular dichroism spectrum was compared with the average predicted spectrum, a very good agreement was confirmed. From this, it was verified that the conformation represented by ibu-23βτ3τ5β (ibu-23βτ3τ5β) having a hydrogen bond is included in the conformation having a large abundance ratio in deuterated chloroform. FIG. 9 shows a chart comparing the actually measured infrared circular dichroism spectrum and the average predicted spectrum. In addition, there are many conformational structures other than the 16 conformation, although the abundance ratio is not so large, such as the contribution of (S) -ibuprofen monomer in the measured spectrum from detailed analysis of the spectrum, and the band intensity is It was suggested that it was smaller than the predicted value. The analysis results were output and written from the conformation notation device.

本発明に係る前記表記装置は、IUPAC命名法に準拠した規則より厳密に二面角の符号化等を定義するようにしたので、立体配座を一義的に決定でき、任意の分子を統一的に扱うことができ、大規模な電算機処理を可能とすることにより、薬効などに関連する立体配座の構造変化を簡便に表記することが出来ることから、例えばレボフロキサシンの活性種の立体配座を参考に進められている新規薬剤設計などに活用することができ、構造活性相関等を活用した、有害物質の人体への影響評価や薬理プロテオミクスによる創薬などの応用面での展開が充分に期待されるものである。   The notation device according to the present invention defines the encoding of dihedral angles more strictly than the rule based on the IUPAC nomenclature, so that the conformation can be uniquely determined, and any molecule can be unified. By allowing large-scale computer processing, the conformational change related to medicinal properties and the like can be expressed easily. For example, the conformation of the active species of levofloxacin It can be used for new drug design, etc. that are being promoted with reference to the above, and it is fully developed in applications such as evaluation of the effects of harmful substances on the human body and drug discovery by pharmacological proteomics utilizing structure-activity relationships, etc. Expected.

本発明の立体配座表記装置のシステム構成図である。It is a system block diagram of the conformation description apparatus of this invention. 本発明に係る解析処理のフローチャートである。It is a flowchart of the analysis process which concerns on this invention. 符号化立体配座表記に用いる二面角を表す符号の分類を示す図である。It is a figure which shows the classification | category of the code | symbol showing the dihedral angle used for encoding conformation description. 1つの符号化立体配座表記で複数の分子モデルが対応する場合に相対的な位置関係に基づくρ(シス)、τ(トランス)のような符号を用いて、一義的に立体配座を表記できるようにした例示を示す図である。Conformation is uniquely expressed using symbols such as ρ (cis) and τ (trans) based on relative positional relationships when multiple molecular models correspond with one encoded conformation. It is a figure which shows the illustration which was made possible. 1つの分子モデルにおいて複数の符号化立体配座表記が可能となる場合の優先則を説明するための例示となる図である。It is a figure used as an example for demonstrating the priority rule in case the some encoding conformation description is attained in one molecule | numerator model. levo-2-15(pipa-11β)で表される立体配座の分子モデルを示す図である。It is a figure which shows the molecular model of the conformation represented by levo-2-15 (pipa-11β). ibu-32ασ(ph-3σ5β)で表される立体配座の分子モデルを示す図である。It is a figure which shows the molecular model of the conformation represented by ibu-32 (alpha) (ph-3 (sigma) 5 (beta)). ibu-23βτ3τ5β(ibu-23βτ3τ5β)で表される立体配座の分子モデルを示す図である。It is a figure which shows the molecular model of the conformation represented by ibu-23βτ3τ5β (ibu-23βτ3τ5β). (S)-イブプロフェン二量体(III)の実測及び予測平均赤外円二色性スペクトルを示す図である。It is a figure which shows the measurement and prediction average infrared circular dichroism spectrum of (S) -ibuprofen dimer (III).

符号の説明Explanation of symbols

1 表示部
2 入力部
3 処理部
4 主記憶部
5 出力部
6 外部インターフェース(I/O)部
7 データベース
8 バス
DESCRIPTION OF SYMBOLS 1 Display part 2 Input part 3 Processing part 4 Main memory part 5 Output part 6 External interface (I / O) part 7 Database 8 Bus

Claims (8)

処理部が、解析対象化合物の注目する異なる立体配座に対応する複数の分子モデルの入力を受け付け、
前記処理部が、各分子モデルに対して下記の(1)〜(9)の工程を含む処理を行うことを特徴とする立体配座表記方法
(1)入力を受け付けた分子モデルをフラグメント毎に分け、IUPAC命名法で定められた位置番号の順序により、各々の化学結合部位においてIUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択し、二面角を求め、当該二面角の分類として、360度を6分割し、その分割された部位に対応するように予め定めた1〜6のいずれかの符号を付す工程
(2)前記化学結合部位において、異なった立体配座と判断すべき立体配座が、前記6分割による符号のいずれの分類においても同一の分類に属する場合に、二面角分類として、前記6分割による符号のそれぞれにα(時計回り)、β(反時計回り)に相当する2種類の符号を加えた12分割の符号のいずれかを付す工程、
(3)前記フラグメントの立体配座を表記するにあたり、一部の化学結合の表記を省略しても一義的に決定できる構造の場合に、当該立体配座表記の注目する化学結合に対応する前記符号を付すか、もしくは二面角の位置だけを的確に示すための接頭辞と前記符号とを組み合わせた表記を用いて表記し、あわせて不要な表記を省略する工程、
(4)上記工程(1)〜(3)によって定義された立体配座表記(以下、符号化立体配座表記と示す)により、前記異なる立体配座に対応する各分子モデルの立体配座がいずれも一義的に決定できる構造であることを確認する工程、
(5)前記分子モデルに対応させて前記符号化立体配座表記を抽出し、抽出した符号化立体配座表記を各分子モデルに対応させてデータベース部に記憶させる工程
(6)続いて、前記処理部において、前記注目する立体配座に対応する各分子モデルのそれぞれの符号化立体配座表記に基づき、前記データベース部から各分子モデルを取り出すとともに各分子モデルの構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値もしくは他の物性値を求め、当該物性値を各分子モデルに対応させてデータベース部に記憶させる工程であって、かつ、構造最適化の結果立体配座に変化が生じた分子モデルに対しては、新たに前記(1)〜(4)の工程による符号化立体配座表記を抽出し、抽出した符号化立体配座表記を当該分子モデルに対応させてデータベース部に記憶させると共に、前記物性値も当該分子モデルに対応させてデータベース部に記憶させる工程、
(7)さらに、前記解析対象化合物についての実測によるエネルギー値もしくは他の物性値がある場合で、かつ解析対象化合物に対応する分子モデルのいずれかに当該物性値が関連づけられる場合に、当該物性値を前記分子モデルに対応させてデータベース部に記憶させる工程
(8)次に、前記処理部において、前記データベース部から解析対象化合物についての複数の分子モデルに対応する前記符号化立体配座表記を取り出すと共に、前記工程(6)又は(7)で記憶させた、各々の分子モデルに対応する、最適化構造のエネルギー値もしくは他の物性値、及び実測によるエネルギー値もしくは他の物性値のうちのいずれか1つ以上の物性値を取り出す工程、
(9)次いで、前記処理部において、解析対象化合物の注目する異なる立体配座に対応する各分子モデルごとに、前記符号化立体配座表記と前記物性値とを関連づけて表示部に出力する工程
The processing unit receives input of a plurality of molecular models corresponding to different conformations of interest of the compound to be analyzed,
The conformation notation method, wherein the processing unit performs a process including the following steps (1) to (9) on each molecular model :
(1) dividing the molecular models, the input of which is accepted for each fragment, the sequence position numbers defined by IUPAC nomenclature, according to the priority rules of Oite IUPAC nomenclature ligands to each of the chemical binding sites, most priority substituent A group or atom is selected, a dihedral angle is obtained, and 360 degrees is divided into 6 as a classification of the dihedral angle, and any one of the symbols 1 to 6 determined in advance so as to correspond to the divided portions is used. process be attached,
(2) When the conformation to be judged as a different conformation in the chemical binding site belongs to the same classification in any of the classifications of the six division codes, A step of adding one of 12 division codes obtained by adding two types of codes corresponding to α (clockwise) and β (counterclockwise) to each of the codes by division;
(3) In notation of the conformation of the fragment, in the case of a structure that can be uniquely determined even if some of the chemical bonds are omitted, the conformation corresponding to the chemical bond of interest in the conformation notation A process of adding a code or using a notation that combines the above-mentioned code with a prefix for accurately indicating only the position of a dihedral angle, and omitting unnecessary notation,
(4) The conformation of each molecular model corresponding to the different conformation is determined by the conformation notation defined by the steps (1) to (3) (hereinafter referred to as an encoded conformation notation). A process for confirming that both are structures that can be uniquely determined ,
(5) the in correspondence with the molecular model to extract the encoded conformational notation, the extracted encoded conformational notation Ru is stored in the database unit to correspond to each molecule model process,
(6) Subsequently, in the processing unit, based on the respective coding conformational representation of the molecular model corresponding to the conformation of the target, the structure of the molecular model is taken out of each molecular model from the database unit perform optimization and frequency calculation, the energy value or other physical properties of the optimized structure determined, a process the physical properties Ru is stored in the database unit to correspond to each molecule model and structure For molecular models whose conformation has changed as a result of optimization, newly extracted encoded conformational notations by the steps (1) to (4) above are extracted, and the extracted encoded conformational notations are extracted. Storing in the database unit corresponding to the molecular model and storing the physical property value in the database unit corresponding to the molecular model,
(7) Further, when there is an actually measured energy value or other physical property value for the analysis target compound, and the physical property value is associated with any of the molecular models corresponding to the analysis target compound, the physical property value step Ru is stored in the database unit in correspondence with the molecular model,
(8) Next, in the processing unit , the encoded conformational notation corresponding to a plurality of molecular models for the analysis target compound is extracted from the database unit and stored in the step (6) or (7). and, corresponding to each of the molecular model, to eject the any one or more of the physical properties of the energy values or other physical properties, and the energy value or other physical properties by the actual measurement of the optimized structure process,
(9) Next, in the processing unit, for each molecular model corresponding to a different conformation of interest of the analysis target compound, the encoded conformation notation and the physical property value are associated and output to the display unit .
前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、複数の分子モデルに対して1つの前記符号化立体配座表記が対応する場合には、さらに相対的な位置関係に基づくρ(シス)、τ(トランス)に相当する符号を付すことで立体配座を一義的に表記することを特徴とする請求項1に記載の立体配座表記方法。 In the steps (1) to (3) for defining the conformation of the molecular model, when selecting the most preferred substituent or atom according to the ligand priority rule of the IUPAC nomenclature, “all ligands are the same. When the priority rule corresponding to “when the one with the smallest twist angle is selected” is applied, when one encoded conformational notation corresponds to a plurality of molecular models, it is further relative. based on the positional relationships [rho (cis), tau characterized by uniquely notation conformation by reference numeral corresponding to (trans) conformation representation method according to claim 1. 前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、リガンドの二面角のなす角度が同じになり、時計回りあるいは反時計回りのいずれのリガンドを選択すべきか決定できないために、1つの分子モデルに対して複数の前記符号化立体配座表記とりうる場合に、時計回りを優先するという優先則を設けて前記符号化立体配座表記を選択することにより、立体配座を一義的に表記できるようにすることを特徴とする請求項1に記載の立体配座表記方法。 In the steps (1) to (3) for defining the conformation of the molecular model, when selecting the most preferred substituent or atom according to the ligand priority rule of the IUPAC nomenclature, “all ligands are the same. When the priority rule corresponding to `` select the one with the smallest twist angle '' is applied, the angle formed by the dihedral angle of the ligand will be the same, and whether the ligand should be selected clockwise or counterclockwise to not be determined, if for a single molecule models a plurality of said encoded conformational notation may take, by selecting the encoded conformational notation provided priority rule giving priority clockwise , characterized in that to allow uniquely notation conformation, conformational notation method according to claim 1. 請求項2及び3に記載の立体配座表記方法を組み合わせることを特徴とする請求項1に記載の立体配座表記方法。   The conformation notation method according to claim 1, wherein the conformation notation method according to claim 2 is combined. 処理部が、解析対象化合物の注目する異なる立体配座に対応する複数の分子モデルの入力を受け付け、
前記処理部が、各分子モデルに対して下記の(1)〜(9)の工程を含む処理を行うことを特徴とする立体配座表記装置
(1)入力を受け付けた分子モデルをフラグメント毎に分け、IUPAC命名法で定められた位置番号の順序により、各々の化学結合部位においてIUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択し、二面角を求め、当該二面角の分類として、360度を6分割し、その分割された部位に対応するように予め定めた1〜6のいずれかの符号を付す工程
(2)前記化学結合部位において、異なった立体配座と判断すべき立体配座が、前記6分割による符号のいずれの分類においても同一の分類に属する場合に、二面角分類として、前記6分割による符号のそれぞれにα(時計回り)、β(反時計回り)に相当する2種類の符号を加えた12分割の符号のいずれかを付す工程、
(3)前記フラグメントの立体配座を表記するにあたり、一部の化学結合の表記を省略しても一義的に決定できる構造の場合に、当該立体配座表記の注目する化学結合に対応する前記符号を付すか、もしくは二面角の位置だけを的確に示すための接頭辞と前記符号とを組み合わせた表記を用いて表記し、あわせて不要な表記を省略する工程、
(4)上記工程(1)〜(3)によって定義された立体配座表記(以下、符号化立体配座表記と示す)により、前記異なる立体配座に対応する各分子モデルの立体配座がいずれも一義的に決定できる構造であることを確認する工程、
(5)前記分子モデルに対応させて前記符号化立体配座表記を抽出し、抽出した符号化立体配座表記を各分子モデルに対応させてデータベース部に記憶させる工程
(6)続いて、前記処理部において、前記注目する立体配座に対応する各分子モデルのそれぞれの符号化立体配座表記に基づき、前記データベース部から各分子モデルを取り出すとともに各分子モデルの構造の最適化及び振動数計算を行い、その最適化構造のエネルギー値もしくは他の物性値を求め、当該物性値を各分子モデルに対応させてデータベース部に記憶させる工程であって、かつ、構造最適化の結果立体配座に変化が生じた分子モデルに対しては、新たに前記(1)〜(4)の工程による符号化立体配座表記を抽出し、抽出した符号化立体配座表記を当該分子モデルに対応させてデータベース部に記憶させると共に、前記物性値も当該分子モデルに対応させてデータベース部に記憶させる工程、
(7)さらに、前記解析対象化合物についての実測によるエネルギー値もしくは他の物性値がある場合で、かつ解析対象化合物に対応する分子モデルのいずれかに当該物性値が関連づけられる場合に、当該物性値を前記分子モデルに対応させてデータベース部に記憶させる工程
(8)次に、前記処理部において、前記データベース部から解析対象化合物についての複数の分子モデルに対応する前記符号化立体配座表記を取り出すと共に、前記工程(6)又は(7)で記憶させた、各々の分子モデルに対応する、最適化構造のエネルギー値もしくは他の物性値、及び実測によるエネルギー値もしくは他の物性値のうちのいずれか1つ以上の物性値を取り出す工程、
(9)次いで、前記処理部において、解析対象化合物の注目する異なる立体配座に対応する各分子モデルごとに、前記符号化立体配座表記と前記物性値とを関連づけて表示部に出力する工程
The processing unit receives input of a plurality of molecular models corresponding to different conformations of interest of the compound to be analyzed,
The conformation notation device, wherein the processing unit performs processing including the following steps (1) to (9) on each molecular model :
(1) dividing the molecular models, the input of which is accepted for each fragment, the sequence position numbers defined by IUPAC nomenclature, according to the priority rules of Oite IUPAC nomenclature ligands to each of the chemical binding sites, most priority substituent A group or atom is selected, a dihedral angle is obtained, and 360 degrees is divided into 6 as a classification of the dihedral angle, and any one of the symbols 1 to 6 determined in advance so as to correspond to the divided portions is used. process be attached,
(2) When the conformation to be judged as a different conformation in the chemical binding site belongs to the same classification in any of the classifications of the six division codes, A step of adding one of 12 division codes obtained by adding two types of codes corresponding to α (clockwise) and β (counterclockwise) to each of the codes by division;
(3) In notation of the conformation of the fragment, in the case of a structure that can be uniquely determined even if some of the chemical bonds are omitted, the conformation corresponding to the chemical bond of interest in the conformation notation A process of adding a code or using a notation that combines the above-mentioned code with a prefix for accurately indicating only the position of a dihedral angle, and omitting unnecessary notation,
(4) The conformation of each molecular model corresponding to the different conformation is determined by the conformation notation defined by the steps (1) to (3) (hereinafter referred to as an encoded conformation notation). A process for confirming that both are structures that can be uniquely determined ,
(5) the in correspondence with the molecular model to extract the encoded conformational notation, the extracted encoded conformational notation Ru is stored in the database unit to correspond to each molecule model process,
(6) Subsequently, in the processing unit, based on the respective coding conformational representation of the molecular model corresponding to the conformation of the target, the structure of the molecular model is taken out of each molecular model from the database unit perform optimization and frequency calculation, the energy value or other physical properties of the optimized structure determined, a process the physical properties Ru is stored in the database unit to correspond to each molecule model and structure For molecular models whose conformation has changed as a result of optimization, newly extracted encoded conformational notations by the steps (1) to (4) above are extracted, and the extracted encoded conformational notations are extracted. Storing in the database unit corresponding to the molecular model and storing the physical property value in the database unit corresponding to the molecular model,
(7) Further, when there is an actually measured energy value or other physical property value for the analysis target compound, and the physical property value is associated with any of the molecular models corresponding to the analysis target compound, the physical property value step Ru is stored in the database unit in correspondence with the molecular model,
(8) Next, in the processing unit , the encoded conformational notation corresponding to a plurality of molecular models for the analysis target compound is extracted from the database unit and stored in the step (6) or (7). and, corresponding to each of the molecular model, to eject the any one or more of the physical properties of the energy values or other physical properties, and the energy value or other physical properties by the actual measurement of the optimized structure process,
(9) Next, in the processing unit, for each molecular model corresponding to a different conformation of interest of the analysis target compound, the encoded conformation notation and the physical property value are associated and output to the display unit .
前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、複数の分子モデルに対して1つの前記符号化立体配座表記が対応する場合には、さらに相対的な位置関係に基づくρ(シス)、τ(トランス)に相当する符号を付すことで立体配座を一義的に表記することを特徴とする請求項5に記載の立体配座表記装置。 In the steps (1) to (3) for defining the conformation of the molecular model, when selecting the most preferred substituent or atom according to the ligand priority rule of the IUPAC nomenclature, “all ligands are the same. When the priority rule corresponding to “when the one with the smallest twist angle is selected” is applied, when one encoded conformational notation corresponds to a plurality of molecular models, it is further relative. based on the positional relationships [rho (cis), tau characterized by uniquely notation conformation by reference numeral corresponding to (trans), conformational notation device according to claim 5. 前記分子モデルの立体配座を定義する前記工程(1)〜(3)において、IUPAC命名法のリガンドの優先則に従い、最も優先する置換基もしくは原子を選択する際に、「全部のリガンドが同じときはねじれ角が一番小さくなるものを選択する」に対応する優先則を適用すると、リガンドの二面角のなす角度が同じになり、時計回りあるいは反時計回りのいずれのリガンドを選択すべきか決定できないために、1つの分子モデルに対して複数の前記符号化立体配座表記とりうる場合に、時計回りを優先するという優先則を設けて前記符号化立体配座表記を選択することにより、立体配座を一義的に表記できるようにすることを特徴とする請求項5に記載の立体配座表記装置。 In the steps (1) to (3) for defining the conformation of the molecular model, when selecting the most preferred substituent or atom according to the ligand priority rule of the IUPAC nomenclature, “all ligands are the same. When the priority rule corresponding to `` select the one with the smallest twist angle '' is applied, the angle formed by the dihedral angle of the ligand will be the same, and whether the ligand should be selected clockwise or counterclockwise to not be determined, if for a single molecule models a plurality of said encoded conformational notation may take, by selecting the encoded conformational notation provided priority rule giving priority clockwise , characterized in that to allow uniquely notation conformation, conformational notation device according to claim 5. 請求項6及び7に記載の立体配座表記装置を組み合わせることを特徴とする請求項5に記載の立体配座表記装置。   The conformation notation device according to claim 5, wherein the conformation notation device according to claim 6 is combined.
JP2008113263A 2007-03-23 2008-04-24 Conformational notation device and notation method Active JP4691728B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008113263A JP4691728B2 (en) 2008-04-24 2008-04-24 Conformational notation device and notation method
US12/385,856 US11119033B2 (en) 2007-03-23 2009-04-22 Conformation analysis device, analysis method, conformational notation device and notation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008113263A JP4691728B2 (en) 2008-04-24 2008-04-24 Conformational notation device and notation method

Publications (2)

Publication Number Publication Date
JP2009265855A JP2009265855A (en) 2009-11-12
JP4691728B2 true JP4691728B2 (en) 2011-06-01

Family

ID=41391649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008113263A Active JP4691728B2 (en) 2007-03-23 2008-04-24 Conformational notation device and notation method

Country Status (1)

Country Link
JP (1) JP4691728B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5672596B2 (en) * 2010-02-23 2015-02-18 独立行政法人産業技術総合研究所 Conformational homology evaluation apparatus and evaluation method, and structure pattern analysis apparatus and analysis method
JP6085814B2 (en) * 2013-05-31 2017-03-01 国立研究開発法人産業技術総合研究所 Protein structure evaluation apparatus, structure evaluation method, structure evaluation program, and computer-readable recording medium recording the structure evaluation program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305628A (en) * 1996-05-20 1997-11-28 Kureha Chem Ind Co Ltd Device for generating canonized data and its method
JP2005345131A (en) * 2004-05-31 2005-12-15 National Institute Of Advanced Industrial & Technology Apparatus for evaluating and analyzing physical characteristies of chiral liquid crystal molecule
JP2007323182A (en) * 2006-05-30 2007-12-13 Riron Soyaku Kenkyusho:Kk System and method for searching chemical structure from large-scale chemical structure database at high speed

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305628A (en) * 1996-05-20 1997-11-28 Kureha Chem Ind Co Ltd Device for generating canonized data and its method
JP2005345131A (en) * 2004-05-31 2005-12-15 National Institute Of Advanced Industrial & Technology Apparatus for evaluating and analyzing physical characteristies of chiral liquid crystal molecule
JP2007323182A (en) * 2006-05-30 2007-12-13 Riron Soyaku Kenkyusho:Kk System and method for searching chemical structure from large-scale chemical structure database at high speed

Also Published As

Publication number Publication date
JP2009265855A (en) 2009-11-12

Similar Documents

Publication Publication Date Title
E Lohning et al. A practical guide to molecular docking and homology modelling for medicinal chemists
Bragina et al. The SwissSimilarity 2021 web tool: novel chemical libraries and additional methods for an enhanced ligand-based virtual screening experience
Brookes et al. The implementation of SOMO (SOlution MOdeller) in the UltraScan analytical ultracentrifugation data analysis suite: enhanced capabilities allow the reliable hydrodynamic modeling of virtually any kind of biomacromolecule
Steiner et al. Quantum chemical microsolvation by automated water placement
Meisner et al. The lewis pair polymerization of lactones using metal halides and N-heterocyclic olefins: theoretical insights
Kolinski et al. An efficient Monte Carlo model of protein chains. Modeling the short-range correlations between side group centers of mass
Paoloni et al. Toward fully unsupervised anharmonic computations complementing experiment for robust and reliable assignment and interpretation of IR and VCD spectra from mid-IR to NIR: the case of 2, 3-butanediol and trans-1, 2-cyclohexanediol
JP4691728B2 (en) Conformational notation device and notation method
Minkiewicz et al. Annotation of peptide structures using SMILES and other chemical codes–practical solutions
Sugita et al. Molecular recognition and self-organization in life phenomena studied by a statistical mechanics of molecular liquids, the rism/3d-rism theory
JP4941869B2 (en) Conformational analysis apparatus and analysis method
Rudnev et al. Current Approaches in Supersecondary Structures Investigation
Shenderovich et al. Modeling of solute-solvent interactions using an external electric field—from tautomeric equilibrium in nonpolar solvents to the dissociation of alkali metal halides
Greer et al. ProSight Annotator: Complete control and customization of protein entries in UniProt XML files
Fujita et al. XyM Notation for Electronic Communication of Organic Chemical Structures
US11119033B2 (en) Conformation analysis device, analysis method, conformational notation device and notation method
Chávez-Hernández et al. Yin-yang in drug discovery: rethinking de novo design and development of predictive models
Mizera et al. Ligand-receptor interactions and machine learning in GCGR and GLP-1R drug discovery
Vogt et al. 3D visualization of molecular structures in the MOGADOC database
Bradley et al. WONKA: objective novel complex analysis for ensembles of protein–ligand structures
Kalydi et al. Fully symmetric cyclodextrin polycarboxylates: How to determine reliable protonation constants from NMR titration data
Zhou et al. Computational screening of metal-organic frameworks for ethylene purification from ethane/ethylene/acetylene mixture
Ochoa et al. pyPept: a python library to generate atomistic 2D and 3D representations of peptides
Motati et al. Determination of Abraham model solute descriptors for 62 additional C10 through C13 methyl-and ethyl-branched alkanes
JP6085814B2 (en) Protein structure evaluation apparatus, structure evaluation method, structure evaluation program, and computer-readable recording medium recording the structure evaluation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4691728

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250