JP5734586B2 - Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program - Google Patents

Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program Download PDF

Info

Publication number
JP5734586B2
JP5734586B2 JP2010158035A JP2010158035A JP5734586B2 JP 5734586 B2 JP5734586 B2 JP 5734586B2 JP 2010158035 A JP2010158035 A JP 2010158035A JP 2010158035 A JP2010158035 A JP 2010158035A JP 5734586 B2 JP5734586 B2 JP 5734586B2
Authority
JP
Japan
Prior art keywords
mode
monosaccharide
orientation
atom
outer product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010158035A
Other languages
Japanese (ja)
Other versions
JP2012021806A (en
Inventor
一作 山田
一作 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Noguchi Inst
Original Assignee
Noguchi Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Noguchi Inst filed Critical Noguchi Inst
Priority to JP2010158035A priority Critical patent/JP5734586B2/en
Publication of JP2012021806A publication Critical patent/JP2012021806A/en
Application granted granted Critical
Publication of JP5734586B2 publication Critical patent/JP5734586B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、糖鎖の構造を認識するための解析方法、解析装置およびプログラムに関し、具体的には、椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析方法、解析装置およびプログラムに関する。   The present invention relates to an analysis method, an analysis apparatus, and a program for recognizing a sugar chain structure, and specifically, an analysis for recognizing a chemical structure of a sugar chain comprising a monosaccharide of a chair type conformation. The present invention relates to a method, an analysis apparatus, and a program.

糖鎖は、遺伝情報を担う核酸、生体機能分子を構成するタンパク質に続く、第三の生命鎖として位置づけられ、その重要な特性は構造の多様性にある。核酸は4種類の塩基、タンパク質は20種類のアミノ酸を構成要素とし、一列に並ぶのに対して、糖鎖は、グルコース、ガラクトースなどの単糖を構成要素とする鎖状物質であり、単糖が保有する複数の水酸基を結合に活用し得るため、図1に示すように、複雑な構造を作り出すことができる。   The sugar chain is positioned as the third life chain following the nucleic acid that carries genetic information and the protein that constitutes the biofunctional molecule, and its important characteristic is its structural diversity. Nucleic acids are composed of 4 types of bases, proteins are composed of 20 types of amino acids and are arranged in a row, whereas sugar chains are chained substances composed of monosaccharides such as glucose and galactose. Since a plurality of hydroxyl groups possessed by can be used for bonding, a complicated structure can be created as shown in FIG.

糖鎖の構造を2次元上に表記する場合、構成要素である単糖単位でその種別を把握して、把握した単糖を組み合わせることにより糖鎖を識別し、表現することが慣例となっている。しかし、単糖の環状形を描く方法として、図2に示すように、Fischer投影、Haworth投影、Mills表示、配座を考慮した表示形式(以下、配座表示)、Glcなどの簡略化された文字列略号など、複数の表記方法が存在し、画一的ではない。さらに、例えば、β−D−グルコースを配座表示により描いた場合、立体構造の描画における観察方向の違いおよび配座によって、図3に示すように、同一の構造であるにも関わらず、24通りに描かれる。   When describing the structure of a glycan two-dimensionally, it is customary to identify and express the glycan by combining the monosaccharides that are identified by the monosaccharide unit that is the component, and combining the recognized saccharides. Yes. However, as shown in FIG. 2, as a method of drawing a cyclic form of a monosaccharide, Fischer projection, Haworth projection, Mills display, conformation-considered display format (hereinafter referred to as conformation display), Glc, and the like are simplified. There are multiple notation methods such as string abbreviations, which are not uniform. Further, for example, when β-D-glucose is drawn by conformation display, the difference in the observation direction and the conformation in the drawing of the three-dimensional structure, as shown in FIG. Drawn on the street.

一方、単糖の構造を特定するためには、3次元構造における6員環炭素に結合する水酸基の結合向きを判定し、α/β異性体、L体/D体異性体を区別する必要がある。さらに、椅子型配座の糖については、1C44C1の2通りの異性体を区別する必要がある。したがって、ある表記方法で描かれた糖鎖を構成する単糖の構造を特定するためには、水酸基の向きを判定し、糖鎖における部分構造の母体となる単糖の種類を識別する処理、および図3に示される各化学構造式が同一の化合物であることを認識する処理が必要となる。また、糖鎖については、糖鎖の隣り合う単糖同士が、いずれの水酸基を用いてどのような向きで結合しているのかを判定する処理が必要となる。 On the other hand, in order to specify the structure of a monosaccharide, it is necessary to determine the bonding direction of the hydroxyl group bonded to the 6-membered ring carbon in the three-dimensional structure and to distinguish between the α / β isomer and the L isomer / D isomer. is there. Furthermore, for chair-type conformational sugars, it is necessary to distinguish between two isomers, 1 C 4 and 4 C 1 . Therefore, in order to identify the structure of a monosaccharide that constitutes a sugar chain drawn by a certain notation method, a process for determining the direction of the hydroxyl group and identifying the type of monosaccharide that is the parent of the partial structure in the sugar chain, And the process which recognizes that each chemical structural formula shown by FIG. 3 is the same compound is needed. In addition, for sugar chains, it is necessary to determine in which direction the monosaccharides adjacent to each other are bound using which hydroxyl group.

化学情報に関するデータベースは、現代の化学・創薬研究において欠くことのできない重要なツールとなっているばかりでなく、特許情報や試薬管理などにおいても必要不可欠なツールとなっている。コンピュータが化学情報をデータとして取り扱うことを可能にする、化学志向のアプリケーションプログラムとしては、ISIS Draw、ChemDraw(登録商標)、およびACD/ChemSketchなどが知られている。また、化学情報の入力を支援する機能として、化学略号やテンプレートを指定することにより、該当する化学構造式の入力を可能とするシステムが提案されている。   The database on chemical information is not only an indispensable tool in modern chemical and drug discovery research, but also an indispensable tool for patent information and reagent management. Known application programs that allow a computer to handle chemical information as data include ISIS Draw, ChemDraw (registered trademark), and ACD / ChemSketch. In addition, as a function for supporting the input of chemical information, a system that enables input of a corresponding chemical structural formula by specifying a chemical abbreviation or a template has been proposed.

特表2003−531419号公報JP-T-2003-531419 特表2003−502773号公報Japanese translation of PCT publication No. 2003-502773

M. Arita, T. Tokimatsu, ‘‘Detection of monosaccharide types from coordinates’’, Proceedings of the 18th International Conference on Genome Informatics (Genome Informatics Series Vol. 19) pp3-14, 2007.M. Arita, T. Tokimatsu, ‘‘ Detection of monosaccharide types from coordinates ’’, Proceedings of the 18th International Conference on Genome Informatics (Genome Informatics Series Vol. 19) pp3-14, 2007.

上述のように、化学情報のシステム化が進んでおり、研究開発を支援する有益な情報を提供することが可能となっている。また、システムを利用するにあたって、化学構造式を入力するコストは削減されてきている。しかしながら、入力した化学構造式が意図した化学構造式となっているか否か確認するという点においては十分ではなかった。例えば、データ作成者が化学構造式を入力する場合、すでに入力されている類似の化学構造式を修正して新規の構造式を作成する場合がある。この際、修正漏れや変更不備により、意図している構造とは異なる化学構造式を作成してしまう可能性が考えられるが、上述したように複雑な化学構造を有する物質に関して、正確に確認することは困難である。   As described above, the systematization of chemical information is progressing, and it is possible to provide useful information that supports research and development. Also, the cost of inputting chemical structural formulas when using the system has been reduced. However, it is not sufficient in confirming whether the inputted chemical structural formula is the intended chemical structural formula. For example, when a data creator inputs a chemical structural formula, a similar chemical structural formula that has already been input may be modified to create a new structural formula. At this time, there is a possibility that a chemical structural formula different from the intended structure may be created due to omission of correction or improper modification. However, as described above, the substance having a complicated chemical structure is confirmed accurately. It is difficult.

化学構造式を入力する段階で誤った場合、以降のデータ検索において活用されない、誤った情報を提供する、誤った化学構造式を利用することにより二次的な誤入力を招くなど、莫大な損失を被る問題に発展する。   If a mistake is made at the stage of entering a chemical structure, it will not be used in subsequent data retrieval, providing incorrect information, or using a wrong chemical structure will lead to a second erroneous entry. It develops into a problem that suffers.

本発明は、このような問題に鑑みてなされたもので、その目的とするところは、入力された化学構造式が正確か否かを判定するために、簡略化された記号・略号を用いて化学構造式を表示することにより、ユーザの構造認識を支援する解析方法、解析装置およびプログラムを提供することにある。   The present invention has been made in view of such problems, and the object of the present invention is to use simplified symbols and abbreviations in order to determine whether or not an inputted chemical structural formula is accurate. An object of the present invention is to provide an analysis method, an analysis apparatus, and a program that support a user's structural recognition by displaying a chemical structural formula.

発明者は、椅子型配座の単糖の構造認識において、構成原子に関する所与の計算値を用いることによって、従来不可能であったα/β異性体、および1C44C1異性体を区別できることを見いだした。そして、この知見により、椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析方法、解析装置、およびプログラムを完成させた。 The inventors have, in the structure recognition of the monosaccharide of the chair conformation, by using a given Calculated for constituting atom, which has heretofore been impossible alpha / beta isomer, and 1 C 4/4 C 1 isomer I found that I can distinguish the body. Based on this knowledge, an analysis method, an analysis apparatus, and a program for recognizing a chemical structure of a sugar chain having a chair type conformation monosaccharide as a constituent element have been completed.

請求項1に記載の発明は、椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析方法であって、解析対象の化学構造式データを受信するステップと、前記受信した解析対象の化学構造式データから単糖の部分構造を抽出するステップと、前記抽出した単糖の部分構造について構成原子の位置情報を取得するステップと、前記取得した位置情報に基づいて、単糖の環の内角、および前記内角をなす角とするモードベクトルの外積を算出するステップと、前記算出したモードベクトルの外積と前記算出した内角に基づいて、前記モードベクトルの外積および前記内角とモードとを関連付けるモードテーブルを使用して、単糖の回転構造のモードを判定するステップと、前記取得した位置情報に基づいて、向き判定対象原子と、前記向き判定対象原子に結合する第1の環構成原子と、前記第1の環構成原子に隣接する第2の環構成原子とで構成される角をなす角とする向きベクトルの外積を算出するステップと、前記向きベクトルの外積、前記内角、前記取得した位置情報、および前記判定したモードに基づいて、前記向き判定対象原子の向きを判定するステップと、前記判定した回転構造および前記判定した向きに基づいて、単糖の略号と化学構造とを関連付ける略号テーブルを使用して、前記解析対象である単糖の化学構造を対応する略号に変換するステップと、前記変換した略号を出力するステップとを含むことを特徴とする。   The invention according to claim 1 is an analysis method for recognizing a chemical structure of a sugar chain comprising a monosaccharide of a chair type conformation as a constituent element, the step of receiving chemical structural formula data to be analyzed; Based on the step of extracting the partial structure of the monosaccharide from the received chemical structural formula data to be analyzed, the step of acquiring the positional information of the constituent atoms for the extracted partial structure of the monosaccharide, and the acquired positional information Calculating an outer product of a mode vector having an inner angle of a ring of a monosaccharide and an angle forming the inner angle, and an outer product of the mode vector and the inner angle based on the outer product of the calculated mode vector and the calculated inner angle And a mode table for associating the mode with each other, determining a mode of the rotational structure of the monosaccharide, and based on the acquired position information, orientation determination target atoms, Calculates the outer product of the orientation vectors having the angle formed by the first ring member atom bonded to the orientation determination target atom and the second ring member atom adjacent to the first ring member atom. Determining the orientation of the orientation determination target atom based on the outer product of the orientation vector, the inner angle, the acquired position information, and the determined mode, the determined rotational structure, and the determined orientation And a step of converting the chemical structure of the monosaccharide to be analyzed into a corresponding abbreviation using an abbreviation table that associates the monosaccharide abbreviation with the chemical structure, and outputting the converted abbreviation. It is characterized by including.

請求項2に記載の発明は、請求項1に記載の椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析方法であって、環構成原子間の結合情報を取得するステップをさらに含み、前記モードを判定するステップは、前記取得した結合情報に基づいてモードを判定し、前記向きを判定するステップは、前記取得した結合情報に基づいて向きを判定することを特徴とする。   Invention of Claim 2 is the analysis method for recognizing the chemical structure of the sugar chain which uses the monosaccharide of the chair type | mold conformation of Claim 1 as a component, Comprising: The coupling | bonding information between ring member atoms The step of determining the mode determines the mode based on the acquired combined information, and the step of determining the direction determines the direction based on the acquired combined information. It is characterized by.

請求項3に記載の発明は、椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析装置であって、解析対象の化学構造式データを受信する化学構造式データ受信部と、前記受信した解析対象の化学構造式データから単糖の部分構造を抽出する部分構造検索部と、前記抽出した単糖の部分構造について構成原子の位置情報を取得する位置情報取得部と、前記取得した位置情報に基づいて単糖の環の内角、前記内角をなす角とするモードベクトルの外積、および向き判定対象原子と、前記向き判定対象原子に結合する第1の環構成原子と、前記第1の環構成原子に隣接する第2の環構成原子とで構成される角をなす角とする向きベクトルの外積を算出する算出部と、前記モードベクトルの外積および前記内角とモードとを関連付けるモードテーブルと、単糖の略号と化学構造とを関連付ける略号テーブルとを管理する記憶部と、前記算出したモードベクトルの外積と前記算出した内角に基づいて、前記モードテーブルを使用して単糖の回転構造のモードを判定するモード判定部と、前記向きベクトルの外積、前記内角、前記取得した位置情報、および前記判定したモードに基づいて、前記向き判定対象原子の向きを判定する向き判定部と、前記判定した回転構造および前記判定した向きに基づいて、前記略号テーブルを使用して前記解析対象である単糖の化学構造を対応する略号に変換するデータ変換部と、前記変換した略号を出力する出力部とを備えたことを特徴とする。   The invention according to claim 3 is an analysis apparatus for recognizing a chemical structure of a sugar chain comprising a monosaccharide of a chair type conformation as a constituent element, and receives a chemical structural formula data to be analyzed. A data reception unit; a partial structure search unit that extracts a partial structure of a monosaccharide from the received chemical structural formula data to be analyzed; and position information acquisition that acquires positional information of constituent atoms for the extracted partial structure of the monosaccharide A first ring structure that binds to the orientation determination target atom and the orientation determination target atom, the inner product of the ring of the monosaccharide based on the acquired position information, the outer product of the mode vectors as the angle forming the internal angle A calculation unit for calculating an outer product of orientation vectors having an angle formed by an atom and a second ring-constituting atom adjacent to the first ring-constituting atom; an outer product of the mode vector and the inner angle; Associate a mode A storage unit that manages a mode table, an abbrev table for associating an abbreviation of a monosaccharide with a chemical structure, a monosaccharide using the mode table based on the outer product of the calculated mode vector and the calculated inner angle A mode determination unit that determines the mode of the rotational structure of the direction determination unit, and a direction determination unit that determines the direction of the orientation determination target atom based on the outer product of the direction vectors, the inner angle, the acquired position information, and the determined mode And based on the determined rotational structure and the determined orientation, a data conversion unit that converts the chemical structure of the monosaccharide to be analyzed into a corresponding abbreviation using the abbreviation table, and the converted abbreviation And an output unit for outputting.

請求項4に記載の発明は、請求項3に記載の椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析装置であって、環構成原子間の結合情報を取得する結合情報取得部をさらに含み、前記モード判定部は、前記取得した結合情報に基づいてモードを判定し、前記向き判定部は、前記取得した結合情報に基づいて向きを判定することを特徴とする。   Invention of Claim 4 is an analyzer for recognizing the chemical structure of the sugar chain which uses the monosaccharide of the chair type conformation of Claim 3 as a constituent element, Comprising: Bonding information between ring constituent atoms The mode determination unit determines a mode based on the acquired combination information, and the direction determination unit determines a direction based on the acquired combination information. Features.

請求項5に記載の発明は、プログラムであって、請求項1または2に記載の糖鎖構造認識用解析方法を、コンピュータに実行させることを特徴とする。 Invention of Claim 5 is a program, Comprising: It makes a computer perform the analysis method for sugar chain structure recognition of Claim 1 or 2.

本発明により、化学構造式のデータ作成者は、作成した化学構造式が目的とする化学構造式と一致しているかを視覚的・直感的に判断することが可能となる。さらに、作成した化学構造式が目的とする化学構造式と一致していない場合、意図しない化学構造式を目的とする化学構造式に容易に修正することが可能となる。   According to the present invention, a data creator of a chemical structural formula can visually and intuitively determine whether the created chemical structural formula matches the target chemical structural formula. Furthermore, when the created chemical structural formula does not match the intended chemical structural formula, it is possible to easily correct the unintended chemical structural formula to the intended chemical structural formula.

糖鎖の分岐構造を示す図である。It is a figure which shows the branched structure of sugar chain. 単糖の環状形を描く表記方法を示す図である。It is a figure which shows the notation method which draws the cyclic | annular form of a monosaccharide. β−D−グルコースの回転構造を示す図である。It is a figure which shows the rotation structure of (beta) -D-glucose. 本発明の一実施形態にかかる化学構造認識支援システムを示す構成図である。It is a block diagram which shows the chemical structure recognition assistance system concerning one Embodiment of this invention. 本発明の一実施形態にかかる化学構造式解析サーバのモジュール構成図である。It is a module block diagram of the chemical structural formula analysis server concerning one Embodiment of this invention. 本発明の一実施形態にかかる単糖を構成要素とする糖鎖の化学構造を認識するための全体の処理を示すフローチャートである。It is a flowchart which shows the whole process for recognizing the chemical structure of the sugar chain which uses the monosaccharide concerning one Embodiment of this invention as a component. 本発明の一実施形態にかかる解析対象の化学構造式を示す図である。It is a figure which shows the chemical structural formula of the analysis object concerning one Embodiment of this invention. 本発明の一実施形態にかかるナンバリングした単糖を示す図である。It is a figure which shows the numbered monosaccharide concerning one Embodiment of this invention. 本発明の一実施形態にかかる配座表示で表記された単糖の回転構造を判定する処理を示すフローチャートである。It is a flowchart which shows the process which determines the rotation structure of the monosaccharide represented by the conformation display concerning one Embodiment of this invention. 本発明の一実施形態にかかる配座表示で表記された単糖の水酸基の向きを判定する処理を示すフローチャートである。It is a flowchart which shows the process which determines the direction of the hydroxyl group of the monosaccharide represented by the conformation display concerning one Embodiment of this invention. 本発明の一実施形態にかかる単糖の水酸基の向きを判定する処理において、6員環構成原子へ割り当てられる情報を示す図である。It is a figure which shows the information allocated to a 6-membered ring member atom in the process which determines the direction of the hydroxyl group of the monosaccharide concerning one Embodiment of this invention. 本発明の一実施形態にかかる配座表示で表記された単糖の水酸基の向きを判定する処理を示すフローチャートである。It is a flowchart which shows the process which determines the direction of the hydroxyl group of the monosaccharide represented by the conformation display concerning one Embodiment of this invention. 本発明の一実施形態にかかる配座表示で表記された単糖の水酸基の向きを判定する処理を示すフローチャートである。It is a flowchart which shows the process which determines the direction of the hydroxyl group of the monosaccharide represented by the conformation display concerning one Embodiment of this invention. 本発明の一実施形態にかかる単糖の水酸基の向きを判定する処理において、判定に用いる領域情報を示す図である。It is a figure which shows the area | region information used for determination in the process which determines the direction of the hydroxyl group of the monosaccharide concerning one Embodiment of this invention. 本発明の一実施形態にかかるモードDBに格納された情報の一例を示す図である。It is a figure which shows an example of the information stored in mode DB concerning one Embodiment of this invention. 本発明の一実施形態にかかる略号DBに格納された情報の一例を示す図である。It is a figure which shows an example of the information stored in the abbreviation DB concerning one Embodiment of this invention. 本発明の一実施形態にかかる化学構造式を解析した結果画面の一例を示す図である。It is a figure which shows an example of the result screen which analyzed the chemical structural formula concerning one Embodiment of this invention. 本発明の一実施形態にかかる化学構造式を解析した結果画面の変換例を示す図である。It is a figure which shows the example of a conversion of the result screen which analyzed the chemical structural formula concerning one Embodiment of this invention. 本発明の一実施形態にかかる化学構造式を解析した結果画面の変換例を示す図である。It is a figure which shows the example of a conversion of the result screen which analyzed the chemical structural formula concerning one Embodiment of this invention. 本発明の一実施形態にかかる化学構造式を解析した結果画面の変換例を示す図である。It is a figure which shows the example of a conversion of the result screen which analyzed the chemical structural formula concerning one Embodiment of this invention.

図4は、本発明の一実施形態にかかる化学構造認識支援システムを示す構成図である。化学構造認識支援システムを実装する、化学構造式を入力するデータ作成者が使用するクライアントコンピュータ401と、化学構造式解析サーバ403とが、ネットワーク402を介して通信を行うよう構成されている。クライアントコンピュータ401は、液晶ディスプレイなどの表示手段、およびマウス、キーボードなどの入力手段を備える。本実施形態のネットワーク402は、本技術分野で知られたインターネット通信網を使用することができるが、これに限られず、専用の、あるいは汎用のネットワークを使用することができる。   FIG. 4 is a block diagram showing a chemical structure recognition support system according to an embodiment of the present invention. A client computer 401 used by a data creator who inputs a chemical structural formula, which implements a chemical structure recognition support system, and a chemical structural formula analysis server 403 are configured to communicate via a network 402. The client computer 401 includes display means such as a liquid crystal display and input means such as a mouse and a keyboard. The network 402 of the present embodiment can use an Internet communication network known in this technical field, but is not limited to this, and a dedicated or general-purpose network can be used.

図5は、本発明の一実施形態にかかる化学構造式解析サーバのモジュール構成図である。化学構造式解析サーバ403は、解析対象の化学構造式データをクライアントコンピュータ401から受信する化学構造式データ受信部501、解析対象の化学構造式データから特定の部分構造を抽出する部分構造検索部502、構成原子の位置情報を取得する位置情報取得部503、取得した位置情報に基づいて、特定の角度、外積を計算する算出部504、単糖の回転構造を表すモードを判定するモード判定部505、単糖の水酸基の向きを判定する向き判定部506、解析結果に基づいて単糖を略号に変換するデータ変換部507、関連データを管理する記憶部508、およびクライアントコンピュータに解析結果を表示する画面を提供する解析結果出力部509を備える。   FIG. 5 is a module configuration diagram of the chemical structural formula analysis server according to the embodiment of the present invention. The chemical structural formula analysis server 403 includes a chemical structural formula data receiving unit 501 that receives chemical structural formula data to be analyzed from the client computer 401, and a partial structural search unit 502 that extracts a specific partial structure from the chemical structural formula data to be analyzed. A position information acquisition unit 503 that acquires position information of constituent atoms, a calculation unit 504 that calculates a specific angle and a cross product based on the acquired position information, and a mode determination unit 505 that determines a mode representing a rotation structure of a monosaccharide , A direction determination unit 506 for determining the direction of the hydroxyl group of a monosaccharide, a data conversion unit 507 for converting a monosaccharide to an abbreviation based on the analysis result, a storage unit 508 for managing related data, and displaying the analysis result on a client computer An analysis result output unit 509 that provides a screen is provided.

記憶部508は、単糖の回転構造を表すモードに関する情報を格納するモードDB、単糖の略号に関する情報を格納する略号DBを管理する。以上、本実施形態のモジュール構成を説明したが、これは単なる例示であり、各モジュールをさらに機能毎に分解し、あるいは各モジュールの機能を統合した新たなモジュールを想定して実装することができる。   The storage unit 508 manages a mode DB that stores information related to a mode representing the rotational structure of a monosaccharide, and an abbreviation DB that stores information related to an abbreviation of the monosaccharide. Although the module configuration of the present embodiment has been described above, this is merely an example, and each module can be further disassembled for each function, or can be mounted assuming a new module in which the functions of each module are integrated. .

(単糖を構成要素とする糖鎖の化学構造を認識するための全体の処理)
図6は、本発明の一実施形態にかかる単糖を構成要素とする糖鎖の化学構造を認識するための全体の処理を示すフローチャートである。処理S601において、化学構造式受信部501は、解析対象の化学構造としての本実施形態の一例である、例えば、図7に示すような糖鎖の化学構造式データを受信したものとする。この化学構造式データは、クライアントコンピュータ401を介してユーザから、または外部のシステムなどから受信することができる。
(Whole process for recognizing the chemical structure of a sugar chain consisting of monosaccharides
FIG. 6 is a flowchart showing an overall process for recognizing a chemical structure of a sugar chain having a monosaccharide as a constituent element according to an embodiment of the present invention. In process S601, the chemical structural formula receiving unit 501 receives chemical structural formula data of a sugar chain as shown in FIG. 7, which is an example of the present embodiment as a chemical structure to be analyzed. This chemical structural formula data can be received from the user or from an external system via the client computer 401.

処理S602において、部分構造検索部502は、受信した化学構造式データから6員環を抽出する。本実施形態では、10個の6員環が抽出される。処理S603以降については、処理S602で抽出された全ての6員環に対して、繰り返し処理が行われる。   In process S602, the partial structure search unit 502 extracts a six-membered ring from the received chemical structural formula data. In this embodiment, ten 6-membered rings are extracted. From step S603 onward, iterative processing is performed on all six-membered rings extracted in step S602.

処理S603において、位置情報取得部503は、6員環の構成原子、および構成原子に結合する酸素原子(0原子)と炭素原子(C原子)について、順位規則に基づいてナンバリングを行う。図8に、本発明の一実施形態にかかるナンバリングした単糖を示す。さらに位置情報取得部503は、ナンバリングした原子の位置情報を取得する。   In step S603, the position information acquisition unit 503 performs numbering on the six-membered ring constituent atoms, and the oxygen atoms (0 atoms) and carbon atoms (C atoms) bonded to the constituent atoms based on the ranking rule. FIG. 8 shows a numbered monosaccharide according to an embodiment of the present invention. Further, the position information acquisition unit 503 acquires the position information of the numbered atoms.

処理S604において、算出部504は、6員環の内角をなす角とするベクトルの外積c1k〜c5k、およびo5kを算出する。具体的には、C1→O5とC1→C2の外積(c1k)、C2→C1とC2→C3の外積(c2k)、C3→C2とC3→C4の外積(c3k)、C4→C3とC4→C5の外積(c4k)、C5→C4とC5→O5の外積(c5k)およびO5→C5とO5→C1の外積(o5k)を算出する。   In process S604, the calculation unit 504 calculates outer products c1k to c5k and o5k of vectors having angles forming the inner angle of the six-membered ring. Specifically, the outer product of C1 → O5 and C1 → C2 (c1k), the outer product of C2 → C1 and C2 → C3 (c2k), the outer product of C3 → C2 and C3 → C4 (c3k), C4 → C3 and C4 → Calculate the outer product of C5 (c4k), the outer product of C5 → C4 and C5 → O5 (c5k), and the outer product of O5 → C5 and O5 → C1 (o5k).

処理S605において、算出部504は、以下の数式1で示される、処理S604で算出した外積のSIGN関数の和の絶対値を算出する。   In step S605, the calculation unit 504 calculates the absolute value of the sum of the SIGN function of the outer product calculated in step S604, which is expressed by the following mathematical formula 1.

処理S606において、算出される絶対値が6でない場合、解析対象の単糖が配座表示で表記されていると判定され、処理S607に進む。算出される絶対値が6である場合、解析対象の単糖がMills表示で表記されていると判定され、処理S608に進む。本実施形態では、算出される絶対値は2なので、処理S607に進む。   In the process S606, when the calculated absolute value is not 6, it is determined that the monosaccharide to be analyzed is described in the conformation display, and the process proceeds to the process S607. When the calculated absolute value is 6, it is determined that the monosaccharide to be analyzed is described in Mills display, and the process proceeds to step S608. In the present embodiment, since the calculated absolute value is 2, the process proceeds to step S607.

後述するように、処理S607または処理S608において、各表記方法に沿った解析処理を行い、処理S609において、データ変換部507は、解析結果に基づいて化学構造式を変換する。   As will be described later, in processing S607 or S608, analysis processing according to each notation method is performed, and in processing S609, the data conversion unit 507 converts the chemical structural formula based on the analysis result.

処理S610において、処理S602で抽出したすべての6員環について解析が終了したかどうか判定する。すべての6員環について解析が終了していない場合、処理S603に戻って、処理S603〜処理S610を繰り返す。   In process S610, it is determined whether or not the analysis has been completed for all the six-membered rings extracted in process S602. If the analysis has not been completed for all the six-membered rings, the process returns to the process S603 and the processes S603 to S610 are repeated.

すべての6員環について解析が終了している場合、処理S611において、解析結果出力部509は、クライアントコンピュータに解析結果を表示する画面を提供し、終了する。   If the analysis has been completed for all the six-membered rings, in step S611, the analysis result output unit 509 provides a screen for displaying the analysis results on the client computer, and the processing ends.

(単糖の回転構造を判定する処理)
図9は、本発明の一実施形態にかかる配座表示で表記された単糖の回転構造を判定する処理を示すフローチャートである。図6の処理S606に続いて、図8に示す単糖の回転構造を判定するものとする。
(Process to determine the rotation structure of monosaccharides)
FIG. 9 is a flowchart showing a process for determining a rotation structure of a monosaccharide represented by a conformation display according to an embodiment of the present invention. Following the processing S606 in FIG. 6, the rotation structure of the monosaccharide shown in FIG. 8 is determined.

処理S901において、モード判定部505は、図6の処理S604で算出した外積に基づいて、モードDBを使用して、基準角を特定する。モードDBは、図15に示すように、少なくとも外積の符号、基準角、鋭角フラグ、4C1のモード、および1C4のモードに関する属性を有する。基準角は、6員環の内角のうちの1つであり、外積の符号の組み合わせにより特定することができる。例えば、本実施形態では、外積c1k、外積c3k、外積c4kおよび外積o5kの符号がマイナスであり、外積c2kおよび外積c5kの符号がプラスであることから、基準角はC1となる。また、鋭角フラグは、基準角が鋭角であるか否かを示す。 In the process S901, the mode determination unit 505 identifies the reference angle using the mode DB based on the outer product calculated in the process S604 of FIG. As shown in FIG. 15, the mode DB has attributes related to at least the sign of the outer product, the reference angle, the acute angle flag, the 4 C 1 mode, and the 1 C 4 mode. The reference angle is one of the inner angles of the six-membered ring, and can be specified by a combination of outer product codes. For example, in this embodiment, the signs of the outer product c1k, outer product c3k, outer product c4k, and outer product o5k are negative, and the signs of the outer product c2k and outer product c5k are positive, so the reference angle is C1. The acute angle flag indicates whether the reference angle is an acute angle.

処理S902において、算出部504は基準角の角度を算出し、モード判定部505は、基準角が鋭角であるか否かに基づいて、モードDBのレコードを一意に特定する。図15に示すように、モードDBのレコードは、6員環の内角をなす角とするベクトルの外積の符号および鋭角フラグの組み合わせにより一意に特定され、モードを1C4のモードのうちの1つと4C1のモードのうちの1つのいずれかに絞り込むことができる。例えば、本実施形態では、外積の符号により判定した基準角C1が鋭角であるため、モード判定部505はIDが1であるレコードを特定し、モードは4C1+0または1C4+180のいずれかに絞り込まれる。 In process S902, the calculation unit 504 calculates the angle of the reference angle, and the mode determination unit 505 uniquely identifies the record in the mode DB based on whether or not the reference angle is an acute angle. As shown in FIG. 15, the record of the mode DB is uniquely identified by the combination of the sign of the outer product of vectors that form the inner angle of the six-membered ring and the acute angle flag, and the mode is one of the 1 C 4 modes. And one of 4 C 1 modes. For example, in the present embodiment, since the reference angle C1 determined by the code of the outer product is an acute angle, the mode determination unit 505 identifies the record whose ID is 1, and the mode is 4 C 1 +0 or 1 C 4 +180. It is narrowed down to either.

処理S903において、算出部504はZ軸回転角を算出し、モード判定部505は、Z軸回転角に基づいて、モードを判定する。Z軸回転角は、処理S902において特定したレコードの4C1のモードに対する標準構造(図3に示す)からZ軸方向に回転した角度である。具体的には、モード判定部505は、Z軸回転角が90度以下または270度以上である場合は4C1のモードであると判定し、その他の場合は1C4のモードであると判定し、暫定的に1つのモードに特定する。本実施形態では、特定したレコードの4C1+0に対する標準構造からの回転が0度であるため、モードは暫定的に4C1+0に特定される。 In process S903, the calculation unit 504 calculates the Z-axis rotation angle, and the mode determination unit 505 determines the mode based on the Z-axis rotation angle. The Z-axis rotation angle is an angle rotated in the Z-axis direction from the standard structure (shown in FIG. 3) for the 4 C 1 mode of the record specified in step S902. Specifically, the mode determination unit 505 determines that the mode is the 4 C 1 mode when the Z-axis rotation angle is 90 degrees or less or 270 degrees or more, and otherwise determines that the mode is the 1 C 4 mode. Determine and provisionally specify one mode. In the present embodiment, since the rotation from the standard structure with respect to 4 C 1 +0 of the specified record is 0 degree, the mode is provisionally specified as 4 C 1 +0.

さらに、処理S904において、モード判定部505は、くさびを考慮して最終的なモードを確定するために、6員環構成原子のうち、標準構造となるようにZ軸方向に回転した後にy軸上で上に位置する3つの構成原子および下側の鋭角の頂点である構成原子を結ぶ3本の結合のいずれかがくさびで表記されているかどうか判定する。本実施形態では、y軸上で上に位置する3つの構成原子(C4原子、C5原子、O5原子)、および下側の鋭角の頂点である構成原子(C1原子)を結ぶ3本の結合はくさびで表記されていないので、単糖のモードは4C1+0に確定し、処理は終了する。 Further, in process S904, the mode determination unit 505 determines the final mode in consideration of the wedge, and then rotates the y-axis after rotating in the Z-axis direction so as to become a standard structure among the six-membered ring constituent atoms. It is determined whether or not any of the three bonds connecting the three constituent atoms located above and the constituent atom that is the apex of the acute angle on the lower side is represented by a wedge. In the present embodiment, the three bonds connecting the three constituent atoms (C4 atom, C5 atom, O5 atom) located on the y-axis and the lower sharp vertex (C1 atom) are as follows: Since it is not represented by a wedge, the monosaccharide mode is fixed at 4 C 1 +0, and the process ends.

処理S904において、くさびで表記されていると判定されると、処理S905において、モード判定部505は、処理S903で判定したモードの4と1、および±を入れ替える。例えば、処理S903で4C1+60と判定された単糖の対応する結合が、くさびで表記されている場合、処理S905によってモードが1C4-60に確定する。 If it is determined in the process S904 that it is written as a wedge, in the process S905, the mode determination unit 505 exchanges the modes 4 and 1, and ± determined in the process S903. For example, when the corresponding bond of the monosaccharide determined to be 4 C 1 +60 in the process S903 is represented by a wedge, the mode is fixed to 1 C 4 -60 by the process S905.

(単糖の水酸基の向きを判定する処理)
続いて、単糖の水酸基の向きを判定する処理を、図10〜図14を参照して説明する。処理S1001において、向き判定部506は、6員環構成原子について、O1原子〜O4原子、またはC6原子が結合しているかどうか判定する。結合している場合、処理S1003以降の処理によって、水酸基の向きを判定する。いずれかの処理において水酸基の向きが判定されると、処理S1002に戻る(図示せず)。
(Process to determine the orientation of the hydroxyl group of a monosaccharide)
Next, processing for determining the orientation of the hydroxyl group of a monosaccharide will be described with reference to FIGS. In process S1001, the direction determination unit 506 determines whether or not an O1 atom to an O4 atom or a C6 atom is bonded to a six-membered ring constituent atom. In the case of bonding, the orientation of the hydroxyl group is determined by the processing after processing S1003. When the orientation of the hydroxyl group is determined in any process, the process returns to process S1002 (not shown).

O1原子〜O4原子、またはC6原子が結合していない場合、処理S1002において、向き判定部506は、すべての6員環構成原子の解析が終了したかどうか判定する。すべての6員環構成原子の解析が終了している場合、単糖の水酸基の向きを判定する処理を終了する。解析が終了していない場合、再び処理S1001に戻り、未解析の6員環構成原子について解析を行う。   When the O1 atom to O4 atom or the C6 atom is not bonded, in step S1002, the direction determination unit 506 determines whether the analysis of all the six-membered ring atoms has been completed. When the analysis of all 6-membered ring atoms has been completed, the process for determining the direction of the hydroxyl group of the monosaccharide is completed. If the analysis has not ended, the process returns to step S1001 again, and the analysis is performed on the unanalyzed six-membered ring constituent atoms.

処理S1003において、算出部504は、図11に示すように、O1原子〜O4原子またはC6原子のいずれかと接続しているC原子をC_connectとし、C_connectと隣接する2つの6員環構成原子をそれぞれC_neighbor1、C_neighbor2とした場合に、C_connect→C_neighbor1とC_connect→O(またはC6)の外積o_1、およびC_connect→C_neighbor2とC_connect→O(またはC6)の外積o_2を算出する。   In process S1003, as shown in FIG. 11, the calculation unit 504 sets C atoms connected to any one of O1 to O4 atoms or C6 atoms as C_connect, and sets two six-membered ring atoms adjacent to C_connect, respectively. When C_neighbor1 and C_neighbor2 are set, the outer product o_1 of C_connect → C_neighbor1 and C_connect → O (or C6) and the outer product o_2 of C_connect → C_neighbor2 and C_connect → O (or C6) are calculated.

処理S1004において、向き判定部506は、C_neighbor1-C_connect-C_neighbor2で構成される内角ckが90度未満かどうか判定する。内角ckが90度未満である場合、処理S1005に進み、内角ckが90度以上である場合は図12に続く。本実施形態では、c1kおよびc4kの場合、内角ckが90度未満であると判定され、処理S1005に進む。   In step S1004, the direction determination unit 506 determines whether the interior angle ck configured by C_neighbor1-C_connect-C_neighbor2 is less than 90 degrees. When the inner angle ck is less than 90 degrees, the process proceeds to step S1005, and when the inner angle ck is 90 degrees or more, the process continues to FIG. In the present embodiment, in the case of c1k and c4k, it is determined that the internal angle ck is less than 90 degrees, and the process proceeds to step S1005.

処理S1005において、向き判定部506は、処理S1003で算出した外積o_1およびo_2の符合が共に正であるか、共に負であるか、またはその他であるかどうか判定する。外積の符号が共に正である場合、処理S1006に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。外積の符号が共に負である場合、処理S1007に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。   In process S1005, the orientation determination unit 506 determines whether the signs of the outer products o_1 and o_2 calculated in process S1003 are both positive, negative, or other. When the signs of the outer products are both positive, the process proceeds to step S1006, and the orientation determination unit 506 determines the final orientation of the hydroxyl group based on the position of C_connect. When the signs of the outer products are both negative, the process proceeds to step S1007, and the orientation determination unit 506 determines the final orientation of the hydroxyl group based on the position of C_connect.

ここで、C_connectの位置とは、標準構造となるようにZ軸方向に回転した際に、処理S1004で90度未満であると判定される2つの内角の頂点である6員環構成原子のうちC_connectが、他方に対してx軸上で右であるか、左であるかを表す。本実施形態では、c1kの頂点であるC1原子がx軸上で右であり、c4kの頂点であるC4原子がx軸上で左である。   Here, the position of C_connect is the 6-membered ring constituent atoms that are the vertices of the two inner angles determined to be less than 90 degrees in process S1004 when rotated in the Z-axis direction so as to have a standard structure. Indicates whether C_connect is right or left on the x-axis relative to the other. In the present embodiment, the C1 atom that is the apex of c1k is right on the x-axis, and the C4 atom that is the apex of c4k is left on the x-axis.

C1原子に結合する水酸基については、処理S1005で外積の符号が共に正であると判定され、処理S1006でC_connectが右に位置すると判定され、上向きであることがわかる。C4原子に結合する水酸基については、処理S1005で外積の符号が共に正であると判定され、処理S1006でC_connectが左に位置すると判定され、下向きであることがわかる。   Regarding the hydroxyl group bonded to the C1 atom, it is determined in process S1005 that both signs of the outer product are positive, and in process S1006 it is determined that C_connect is located on the right, indicating that it is upward. Regarding the hydroxyl group bonded to the C4 atom, it is determined in process S1005 that both signs of the outer product are positive, and in process S1006, it is determined that C_connect is located on the left, and it can be seen that it is downward.

なお、外積の符号がその他である場合、水酸基の向きは上向きと下向きの中間であると判定される。   When the sign of the outer product is other, the direction of the hydroxyl group is determined to be intermediate between upward and downward.

ここで、図10、図12、図13を通じて判定される水酸基の向きは、「モードが4C1のモードであり、かつ、処理S904で判定した結合がくさびで表記されていない単糖」または「モードが1C4のモードであり、かつ、処理S904で判定した結合がくさびで表記されている単糖」に対する結果を示すものである。上述した条件を満たさない場合、水酸基の向きは上下が逆になる。 Here, the orientation of the hydroxyl group determined through FIG. 10, FIG. 12, and FIG. 13 is “a monosaccharide in which the mode is a 4 C 1 mode and the bond determined in step S904 is not represented by a wedge” or The results are shown for “a monosaccharide in which the mode is 1 C 4 mode and the binding determined in step S904 is represented by a wedge”. When the above-mentioned conditions are not satisfied, the direction of the hydroxyl group is upside down.

図10の処理S1004で内角ckが90度以上であると判定されると図12に進み、処理S1201において、向き判定部506は、C_neighbor1-C_connect-C_neighbor2で構成される内角ckが180度未満かどうか判定する。内角ckが180度未満である場合、処理S1202に進み、内角ckが180度以上である場合は図13に続く。本実施形態では、c3kおよびo5kの場合、内角ckが180度未満であると判定され、処理S1202に進む。   If it is determined in process S1004 of FIG. 10 that the internal angle ck is 90 degrees or more, the process proceeds to FIG. Judge whether. When the inner angle ck is less than 180 degrees, the process proceeds to step S1202, and when the inner angle ck is 180 degrees or more, the process continues to FIG. In the present embodiment, in the case of c3k and o5k, it is determined that the internal angle ck is less than 180 degrees, and the process proceeds to step S1202.

処理S1202において、算出部504は、図11に示すように、C_connectの対面に位置する6員環構成原子をC_diagonalとした場合に、C_connect→C_neighbor1とC_connect→C_neighbor2の内、傾きがC_connect→C_diagonalに近い方と、C_connect→O(またはC6)の外積を算出する。ここで、傾きが近いとは、x軸に対する傾きの差が少ないことを表す。   In process S1202, as shown in FIG. 11, when the six-membered ring atoms located on the opposite side of C_connect is C_diagonal, the calculation unit 504 has a slope of C_connect → C_diagonal among C_connect → C_neighbor1 and C_connect → C_neighbor2 Calculate the outer product of the closest one and C_connect → O (or C6). Here, that the inclination is close means that the difference in inclination with respect to the x-axis is small.

処理S1203において、向き判定部506は、算出した外積のSignが1であるか、−1であるか、または0であるかどうか判定する。Signが1である場合、処理S1204に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。Signが−1である場合、処理S1205に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。   In process S1203, the direction determination unit 506 determines whether the calculated sign of the outer product is 1, −1, or 0. If Sign is 1, the process proceeds to step S1204, and the orientation determination unit 506 determines the final orientation of the hydroxyl group based on the position of C_connect. When Sign is −1, the process proceeds to step S1205, and the orientation determination unit 506 determines the final orientation of the hydroxyl group based on the position of C_connect.

ここで、C_connectの位置とは、標準構造となるようにZ軸方向に回転した際に、処理S1201で180度未満であると判定される2つの内角の頂点である6員環構成原子のうちC_connectが、他方に対してx軸上で右であるか、左であるかを表す。本実施形態では、c3kの頂点であるC3原子がx軸上で左である。C3原子に結合する水酸基については、処理S1203でSignが−1であると判定され、処理S1205でC_connect左に位置すると判定され、上向きであることがわかる。   Here, the position of C_connect is the six-membered ring constituent atoms that are the vertices of the two inner angles that are determined to be less than 180 degrees in process S1201 when rotated in the Z-axis direction so as to have a standard structure. Indicates whether C_connect is right or left on the x-axis relative to the other. In the present embodiment, the C3 atom that is the apex of c3k is on the left on the x-axis. With respect to the hydroxyl group bonded to the C3 atom, it is determined that Sign is −1 in process S1203, it is determined to be located to the left of C_connect in process S1205, and it can be seen that it is upward.

なお、Signが0である場合、水酸基の向きは上向きと下向きの中間であると判定される。   When Sign is 0, the direction of the hydroxyl group is determined to be intermediate between upward and downward.

図12の処理S1201で内角ckが180度以上であると判定されると図13に進み、処理S1301において、向き判定部506は、C_connect→O(またはC6)の位置が領域1であるか、領域2であるか、またはその他であるかどうか判定する。ここで、領域1は、図13に示すように、6員環の外側の領域を表す。領域2は、図13に示すように、C_neighbor1-C_connect結合の延長線とC_neighbor2-C_connect結合の延長線で構成される、領域1に対して対称の領域を表す。   If it is determined in process S1201 of FIG. 12 that the internal angle ck is 180 degrees or more, the process proceeds to FIG. 13, and in process S1301, the orientation determination unit 506 determines whether the position of C_connect → O (or C6) is region 1 or not. It is determined whether it is area 2 or other. Here, region 1 represents a region outside the six-membered ring, as shown in FIG. As illustrated in FIG. 13, the region 2 represents a region that is symmetric with respect to the region 1 and includes an extension line of the C_neighbor1-C_connect coupling and an extension line of the C_neighbor2-C_connect coupling.

C_connect→O(またはC6)の位置が領域1である場合、処理S1302に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。C_connect→O(またはC6)の位置が領域2である場合、処理S1303に進み、向き判定部506は、C_connectの位置に基づいて最終的な水酸基の向きを判定する。   When the position of C_connect → O (or C6) is the region 1, the process proceeds to step S1302, and the orientation determination unit 506 determines the final hydroxyl orientation based on the location of C_connect. When the position of C_connect → O (or C6) is the region 2, the process proceeds to step S1303, and the orientation determination unit 506 determines the final orientation of the hydroxyl group based on the location of C_connect.

ここで、C_connectの位置とは、標準構造となるようにZ軸方向に回転した際に、図12の処理S1201で180度以上であると判定される2つの内角の頂点である6員環構成原子のうちC_connectが、他方に対してy軸上で上であるか、下であるかを表す。本実施形態では、c2kの頂点であるC2原子がy軸上で下であり、c5kの頂点であるC5原子がy軸上で上である。C2原子に結合する水酸基については、処理S1301でC_connect→Oの位置が領域1であると判定され、処理S1302でC_connectが下に位置すると判定され、下向きであることがわかる。C5原子に結合するC6原子については、処理S1301でC_connect→C6の位置が領域1であると判定され、処理S1302でC_connectが上に位置すると判定され、上向きであることがわかる。   Here, the position of C_connect is a 6-membered ring configuration that is the apex of the two inner angles that are determined to be 180 degrees or more in step S1201 of FIG. 12 when rotated in the Z-axis direction so as to have a standard structure. Indicates whether C_connect of atoms is up or down on the y-axis relative to the other. In this embodiment, the C2 atom that is the apex of c2k is down on the y-axis, and the C5 atom that is the apex of c5k is up on the y-axis. With respect to the hydroxyl group bonded to the C2 atom, it is determined in step S1301 that the position of C_connect → O is region 1, and in step S1302, it is determined that C_connect is positioned below, indicating that it is downward. For the C6 atom bonded to the C5 atom, the position of C_connect → C6 is determined to be the region 1 in the process S1301, and it is determined that the C_connect is positioned upward in the process S1302, and it can be seen that it is upward.

なお、C_connect→O(またはC6)の位置がその他である場合、水酸基の向きは上向きと下向きの中間であると判定される。   If the position of C_connect → O (or C6) is other than that, the direction of the hydroxyl group is determined to be intermediate between upward and downward.

(単糖の化学構造式を略号に変換する処理)
図9、図10、図12、図13の処理を通じて、単糖のモードおよび水酸基の向きを判定することができる。単糖の化学構造式の略号を特定するために、データ変換部507は、変換のために必要な情報として、(1)C1原子に結合するC0原子が存在するか否か、(2)C6原子が存在するか否か、(3)置換基が存在するか否か、および置換基の種類などを化学構造式データから取得する。これらの情報は、モードおよび水酸基の向きの判定とは異なり、化学構造式を構成する特定の構成原子の情報に基づいて容易に判定することができるため、ここでは詳述しない。
(Process to convert chemical structural formula of monosaccharide to abbreviation)
Through the processes of FIGS. 9, 10, 12, and 13, the mode of monosaccharide and the direction of hydroxyl group can be determined. In order to specify the abbreviation for the chemical structural formula of the monosaccharide, the data conversion unit 507 uses (1) whether or not there is a C0 atom bonded to the C1 atom as information necessary for the conversion, and (2) C6 Whether or not an atom is present, (3) whether or not a substituent is present, the type of the substituent, and the like are acquired from the chemical structural formula data. Unlike the determination of the mode and the direction of the hydroxyl group, such information can be easily determined based on the information of specific constituent atoms constituting the chemical structural formula, and thus will not be described in detail here.

変換に必要な情報を取得した後、データ変換部507は、C0原子およびC6原子の存在の有無、並びにC2原子〜C5原子に結合する基の向きを示すシンボルデータを生成する。本実施形態では、C0原子およびC6原子について、構成原子が存在しない場合に「/」、構成原子が存在する場合に「|」を用い、また、C2原子〜C5原子に結合する基について、向きが上向きの場合に「+」、下向きの場合に「−」、構成原子に結合する基が存在しない場合に「*」を用いることとする。例えば、図8に示す単糖の場合、「C0/C2−C3+C4−C5+C6|」が生成される。   After acquiring information necessary for the conversion, the data conversion unit 507 generates symbol data indicating the presence / absence of the C0 atom and the C6 atom and the direction of the group bonded to the C2 atom to the C5 atom. In this embodiment, with respect to the C0 atom and the C6 atom, “/” is used when there is no constituent atom, “|” is used when there is a constituent atom, and the group bonded to the C2 to C5 atoms is oriented. “+” Is used when is upward, “−” is downward, and “*” is used when there is no group bonded to the constituent atom. For example, in the case of the monosaccharide shown in FIG. 8, “C0 / C2−C3 + C4−C5 + C6 |” is generated.

データ変換部507は、記憶部508を介して略号DBにアクセスを行い、作成したシンボルデータに対応する単糖の略号を取得する。略号DBは、図16に示すように、少なくとも単糖の略号および略号に対応するシンボルに関する属性を有する。作成したシンボルデータに該当するレコードが存在しない場合、糖として認識し得る化学構造ではないことを表す。次に、データ変換部507は、C1原子に結合する水酸基の向きによってα/βを判定し、さらに、置換基などを考慮して最終的な略号を特定する。   The data conversion unit 507 accesses the abbreviation DB via the storage unit 508, and acquires a monosaccharide abbreviation corresponding to the created symbol data. As shown in FIG. 16, the abbreviation DB has at least attributes relating to symbols corresponding to abbreviations and abbreviations of monosaccharides. If there is no record corresponding to the created symbol data, it indicates that the chemical structure is not recognizable as sugar. Next, the data conversion unit 507 determines α / β based on the direction of the hydroxyl group bonded to the C1 atom, and further specifies a final abbreviation in consideration of a substituent and the like.

(解析結果を出力する処理)
すべての単糖について解析が終了した後、解析結果出力部509は、図17に示すような解析結果を、クライアントコンピュータ401に送信して表示させる。本実施形態では、データ作成者は、β−D−GlcNAcで構成される糖鎖を目的としてデータを作成したものとする。図17に示すように、解析対象の化学構造式には、意図しないβ−D−GalNAc、β−L−GalNAc、β−D−Allがそれぞれ1つ、β−L−GlcNAcが2つ、および単糖として認識できないものが1つ含まれていることがわかる。データ作成者がキーボードやマウスなどの入力手段により変換指示を行うことにより、データ変換部508は、現在の表示形態(略号)から他の表示形態(化学構造式、ナンバリング表示など)に変換し、解析結果出力部509は、図18〜20に示すような解析結果を、クライアントコンピュータ401に送信して表示させることができる。
(Process to output analysis results)
After the analysis is completed for all monosaccharides, the analysis result output unit 509 transmits the analysis results as shown in FIG. 17 to the client computer 401 for display. In this embodiment, it is assumed that the data creator creates data for the purpose of a sugar chain composed of β-D-GlcNAc. As shown in FIG. 17, the chemical structural formula to be analyzed includes one unintended β-D-GalNAc, β-L-GalNAc, and β-D-All, two β-L-GlcNAc, and It turns out that one thing which cannot be recognized as a monosaccharide is contained. When the data creator gives a conversion instruction using an input means such as a keyboard or mouse, the data conversion unit 508 converts the current display form (abbreviation) to another display form (chemical structural formula, numbering display, etc.) The analysis result output unit 509 can transmit the analysis results as shown in FIGS. 18 to 20 to the client computer 401 for display.

図18は、図17に示す解析結果の一変換例であり、単糖をナンバリング表示で表記した解析結果を示す。図19は、図17に示す解析結果の一変換例であり、単糖を配座表示で表記した解析結果を示す。図20は、図17に示す解析結果の一変換例であり、単糖を略号およびナンバリング表示で表記した解析結果を示す。なお、図17および図20に示すように、略号には、当分野において慣例として使用される色が付される。当業者は、略号の形(四角、丸等)および色(黄色、水色等)により、単糖の構造を把握することができる。例えば、GlcNAc−βは水色の四角で表記され、GalNAc−βは黄色の四角で表記される。また、当分野に精通していないユーザであっても、解析結果を変換することにより、6員環構成原子のナンバリング情報や配座を把握することができる。   FIG. 18 is a conversion example of the analysis result shown in FIG. 17 and shows the analysis result in which monosaccharides are expressed in numbering display. FIG. 19 is an example of conversion of the analysis result shown in FIG. 17 and shows the analysis result in which monosaccharides are expressed in conformation. FIG. 20 is a conversion example of the analysis result shown in FIG. 17 and shows the analysis result in which monosaccharides are represented by abbreviations and numbering displays. Note that, as shown in FIGS. 17 and 20, the abbreviations are given colors that are commonly used in this field. A person skilled in the art can grasp the structure of a monosaccharide by the shape of abbreviation (square, circle, etc.) and color (yellow, light blue, etc.). For example, GlcNAc-β is represented by a light blue square, and GalNAc-β is represented by a yellow square. In addition, even a user who is not familiar with this field can grasp the numbering information and conformation of the six-membered ring constituent atoms by converting the analysis result.

以上、本発明によれば、化学構造式のデータ作成者は、作成した化学構造式が目的とする化学構造式と一致しているかを視覚的・直感的に判断することが可能となる。さらに、作成した化学構造式が目的とする化学構造式と一致していない場合、意図しない化学構造式を目的とする化学構造式に容易に修正することが可能となる。   As described above, according to the present invention, the data creator of the chemical structural formula can visually and intuitively determine whether the created chemical structural formula matches the target chemical structural formula. Furthermore, when the created chemical structural formula does not match the intended chemical structural formula, it is possible to easily correct the unintended chemical structural formula to the intended chemical structural formula.

Claims (5)

椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析方法であって、
解析対象の化学構造式データを受信するステップと、
前記受信した解析対象の化学構造式データから単糖の部分構造を抽出するステップと、
前記抽出した単糖の部分構造について構成原子の位置情報を取得するステップと、
前記取得した位置情報に基づいて、単糖の環の内角、および前記内角をなす角とするモードベクトルの外積を算出するステップと、
前記算出したモードベクトルの外積と前記算出した内角に基づいて、前記モードベクトルの外積および前記内角とモードとを関連付けるモードテーブルを使用して、単糖の回転構造のモードを判定するステップと、
前記取得した位置情報に基づいて、向き判定対象原子と、前記向き判定対象原子に結合する第1の環構成原子と、前記第1の環構成原子に隣接する第2の環構成原子とで構成される角をなす角とする向きベクトルの外積を算出するステップと、
前記向きベクトルの外積、前記内角、前記取得した位置情報、および前記判定したモードに基づいて、前記向き判定対象原子の向きを判定するステップと、
前記判定した回転構造および前記判定した向きに基づいて、単糖の略号と化学構造とを関連付ける略号テーブルを使用して、前記解析対象である単糖の化学構造を対応する略号に変換するステップと、
前記変換した略号を出力するステップと
を含むことを特徴とする糖鎖構造認識用解析方法。
An analysis method for recognizing the chemical structure of a sugar chain comprising a monosaccharide of a chair type conformation,
Receiving chemical structure data to be analyzed;
Extracting a partial structure of a monosaccharide from the received chemical structural formula data to be analyzed;
Obtaining positional information of constituent atoms for the extracted partial structure of the monosaccharide;
Based on the acquired positional information, calculating an inner product of a ring of monosaccharides, and an outer product of mode vectors as angles forming the inner angle;
Determining a mode of the rotational structure of the monosaccharide using a mode table that associates the outer product of the mode vector and the inner angle with the mode based on the outer product of the calculated mode vector and the calculated inner angle;
Based on the acquired position information, it is composed of an orientation determination target atom, a first ring constituent atom bonded to the orientation determination target atom, and a second ring constituent atom adjacent to the first ring constituent atom. Calculating an outer product of orientation vectors whose angles form an angle to be formed;
Determining the orientation of the orientation determination target atom based on the outer product of the orientation vector, the interior angle, the acquired position information, and the determined mode;
Converting the chemical structure of the monosaccharide to be analyzed into a corresponding abbreviation using an abbreviation table that associates the abbreviation of the monosaccharide with the chemical structure based on the determined rotational structure and the determined orientation; and ,
And a step of outputting the converted abbreviation.
環構成原子間の結合情報を取得するステップをさらに含み、
前記モードを判定するステップは、前記取得した結合情報に基づいてモードを判定し、
前記向きを判定するステップは、前記取得した結合情報に基づいて向きを判定することを特徴とする請求項1に記載の糖鎖構造認識用解析方法。
Further comprising obtaining bond information between ring members,
The step of determining the mode determines a mode based on the acquired combination information,
The sugar chain structure recognition analysis method according to claim 1, wherein in the step of determining the direction, the direction is determined based on the acquired binding information.
椅子型配座の単糖を構成要素とする糖鎖の化学構造を認識するための解析装置であって、
解析対象の化学構造式データを受信する化学構造式データ受信部と、
前記受信した解析対象の化学構造式データから単糖の部分構造を抽出する部分構造検索部と、
前記抽出した単糖の部分構造について構成原子の位置情報を取得する位置情報取得部と、
前記取得した位置情報に基づいて単糖の環の内角、前記内角をなす角とするモードベクトルの外積、および向き判定対象原子と、前記向き判定対象原子に結合する第1の環構成原子と、前記第1の環構成原子に隣接する第2の環構成原子とで構成される角をなす角とする向きベクトルの外積を算出する算出部と、
前記モードベクトルの外積および前記内角とモードとを関連付けるモードテーブルと、単糖の略号と化学構造とを関連付ける略号テーブルとを管理する記憶部と、
前記算出したモードベクトルの外積と前記算出した内角に基づいて、前記モードテーブルを使用して単糖の回転構造のモードを判定するモード判定部と、
前記向きベクトルの外積、前記内角、前記取得した位置情報、および前記判定したモードに基づいて、前記向き判定対象原子の向きを判定する向き判定部と、
前記判定した回転構造および前記判定した向きに基づいて、前記略号テーブルを使用して前記解析対象である単糖の化学構造を対応する略号に変換するデータ変換部と、
前記変換した略号を出力する出力部と
を備えたことを特徴とする糖鎖構造認識用解析装置。
An analyzer for recognizing the chemical structure of a sugar chain comprising a monosaccharide of a chair type conformation,
A chemical structure data receiver for receiving chemical structure data to be analyzed;
A partial structure search unit for extracting a partial structure of a monosaccharide from the received chemical structural formula data to be analyzed;
A positional information acquisition unit that acquires positional information of constituent atoms for the extracted partial structure of the monosaccharide;
Based on the acquired position information, the inner angle of the ring of the monosaccharide, the outer product of the mode vector as the angle forming the inner angle, the orientation determination target atom, and the first ring constituent atom bonded to the orientation determination target atom, A calculation unit for calculating an outer product of orientation vectors having an angle formed by a second ring-constituting atom adjacent to the first ring-constituting atom;
A storage unit that manages a mode table that associates the outer product of the mode vector and the inner angle with the mode, and an abbreviation table that associates the abbreviation of the monosaccharide with the chemical structure;
Based on the outer product of the calculated mode vector and the calculated inner angle, a mode determination unit that determines the mode of the rotation structure of the monosaccharide using the mode table;
An orientation determination unit that determines the orientation of the orientation determination target atom based on the outer product of the orientation vector, the interior angle, the acquired position information, and the determined mode;
Based on the determined rotational structure and the determined orientation, a data conversion unit that converts the chemical structure of the monosaccharide to be analyzed into the corresponding abbreviation using the abbreviation table;
An analyzer for recognizing a sugar chain structure, comprising: an output unit that outputs the converted abbreviation.
環構成原子間の結合情報を取得する結合情報取得部をさらに含み、
前記モード判定部は、前記取得した結合情報に基づいてモードを判定し、
前記向き判定部は、前記取得した結合情報に基づいて向きを判定することを特徴とする請求項3に記載の糖鎖構造認識用解析装置。
It further includes a bond information acquisition unit that acquires bond information between ring atoms,
The mode determination unit determines a mode based on the acquired combination information,
The sugar chain structure recognition analysis apparatus according to claim 3, wherein the direction determination unit determines a direction based on the acquired binding information.
請求項1または2に記載の糖鎖構造認識用解析方法を、コンピュータに実行させるプログラム。 A program that causes a computer to execute the analysis method for sugar chain structure recognition according to claim 1 or 2.
JP2010158035A 2010-07-12 2010-07-12 Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program Expired - Fee Related JP5734586B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010158035A JP5734586B2 (en) 2010-07-12 2010-07-12 Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010158035A JP5734586B2 (en) 2010-07-12 2010-07-12 Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program

Publications (2)

Publication Number Publication Date
JP2012021806A JP2012021806A (en) 2012-02-02
JP5734586B2 true JP5734586B2 (en) 2015-06-17

Family

ID=45776213

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010158035A Expired - Fee Related JP5734586B2 (en) 2010-07-12 2010-07-12 Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program

Country Status (1)

Country Link
JP (1) JP5734586B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021125206A1 (en) 2019-12-16 2021-06-24 富士フイルム株式会社 Image analysis device, image analysis method, and program

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62169290A (en) * 1986-01-22 1987-07-25 Nec Corp Chemical structure formula recognizing system
IE911347A1 (en) * 1990-04-24 1991-11-06 Scripps Clinic Res System and method for determining three-dimensional¹structures of proteins
JPH06249841A (en) * 1993-02-24 1994-09-09 Nakano Vinegar Co Ltd Sugar chain analyzing device
JP2909616B2 (en) * 1995-10-27 1999-06-23 株式会社超高速ネットワーク・コンピュータ技術研究所 3D shape display method
JPH1031751A (en) * 1996-07-17 1998-02-03 Brother Ind Ltd Graphic processor and graphic processing method
JP2000251081A (en) * 1999-02-26 2000-09-14 Canon Inc Inner point deciding method, graphic drawing device, and program storage medium
DE19928512A1 (en) * 1999-06-22 2000-12-28 Merck Patent Gmbh Process for representing chemical structural formulae on a display comprises allocating codes to known and/or recently synthesized chemical substances, and storing the codes in a computer which is connected to a drawing program
JP4660675B2 (en) * 1999-10-08 2011-03-30 独立行政法人理化学研究所 Methods for stereochemical encoding of molecules
EP1259907A2 (en) * 2000-02-29 2002-11-27 Cambridgesoft Corporation Managing chemical information and commerce
JP3735767B2 (en) * 2000-10-26 2006-01-18 独立行政法人科学技術振興機構 Method for identifying structural isomers of non-aromatic 6-membered cyclic structure compounds
EP1521192A4 (en) * 2002-07-05 2008-01-02 Fujitsu Ltd Method and apparatus of analysing sugar chain sterostructure
JP4025850B2 (en) * 2004-03-19 2007-12-26 独立行政法人産業技術総合研究所 Glycan structure identification method and analyzer
JP2005293296A (en) * 2004-03-31 2005-10-20 Shionogi & Co Ltd Method for evaluating interaction of sugar with protein
US20090216705A1 (en) * 2005-04-13 2009-08-27 National Institute Of Advanced Industrial Science And Technology Method for predicting sugar chain structure

Also Published As

Publication number Publication date
JP2012021806A (en) 2012-02-02

Similar Documents

Publication Publication Date Title
Orsburn Proteome discoverer—a community enhanced data processing suite for protein informatics
Deutsch et al. Proteomics standards initiative: fifteen years of progress and future work
Rainer et al. A modular and expandable ecosystem for metabolomics data annotation in R
Nickerson et al. The Human Physiome: how standards, software and innovative service infrastructures are providing the building blocks to make it achievable
Sagar et al. Comment on the optimal parameters to derive intrinsically disordered protein conformational ensembles from small-angle X-ray scattering data using the ensemble optimization method
Schessner et al. A practical guide to interpreting and generating bottom‐up proteomics data visualizations
Paul et al. Bioinformatics for renal and urinary proteomics: call for aggrandization
von Köckritz et al. Speckle tracking analysis reveals altered left atrial and ventricular myocardial deformation in patients with end-stage liver disease
Stein et al. singlecellVR: interactive visualization of single-cell data in virtual reality
Tausch et al. Patholive—real-time pathogen identification from metagenomic illumina datasets
Eller Improving the quality of published chemical names with nomenclature software
Gupta et al. Single-point nail sampling to diagnose onychomycosis caused by non-dermatophyte molds: utility of polymerase chain reaction (PCR) and histopathology
Tordai et al. Comprehensive collection and prediction of ABC transmembrane protein structures in the AI era of structural biology
Burton et al. Pattern analysis of organellar maps for interpretation of proteomic data
JP5734586B2 (en) Sugar chain structure recognition analysis method, sugar chain structure recognition analyzer and program
Lee et al. Review of liquid chromatography-mass spectrometry-based proteomic analyses of body fluids to diagnose infectious diseases
Serino et al. Disentangling the contribution of spatial reference frames to executive functioning in healthy and pathological aging: An experimental study with virtual reality
Hryc et al. Beyond the backbone: the next generation of pathwalking utilities for model building in CryoEM density maps
Jong et al. Current methods for identifying plasma membrane proteins as cancer biomarkers
Xu et al. SEGF: a novel method for gene fusion detection from single-end next-generation sequencing data
Jin et al. Atom Identifiers Generated by a Neighborhood-Specific Graph Coloring Method Enable Compound Harmonization across Metabolic Databases
Radtke et al. SOP: construction of organ mapping antibody panels for multiplexed antibody-based imaging of human tissues
Bouzid et al. Empirical evaluation of the use of computational HLA binding as an early filter to the mass spectrometry-based epitope discovery workflow
Zhan et al. T-Cell Receptor β Chain and B-Cell Receptor Repertoires in Chronic Hepatitis B Patients with Coexisting HBsAg and Anti-HBs
Yuriev et al. Carbohydrates in cyberspace

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130705

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130705

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20141015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20141015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150415

R150 Certificate of patent or registration of utility model

Ref document number: 5734586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees