JP4638726B2 - Sample set manufacturing method, gene alignment program, and sample set - Google Patents

Sample set manufacturing method, gene alignment program, and sample set Download PDF

Info

Publication number
JP4638726B2
JP4638726B2 JP2004372059A JP2004372059A JP4638726B2 JP 4638726 B2 JP4638726 B2 JP 4638726B2 JP 2004372059 A JP2004372059 A JP 2004372059A JP 2004372059 A JP2004372059 A JP 2004372059A JP 4638726 B2 JP4638726 B2 JP 4638726B2
Authority
JP
Japan
Prior art keywords
node
gene
genes
sample
alignment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004372059A
Other languages
Japanese (ja)
Other versions
JP2006174774A (en
Inventor
雄樹 内藤
Original Assignee
株式会社アルファジェン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社アルファジェン filed Critical 株式会社アルファジェン
Priority to JP2004372059A priority Critical patent/JP4638726B2/en
Publication of JP2006174774A publication Critical patent/JP2006174774A/en
Application granted granted Critical
Publication of JP4638726B2 publication Critical patent/JP4638726B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、対象物群を整列させ、特に、遺伝子群を整列させて、この遺伝子群に対応するサンプル群を複数の格納部を備えたサンプル容器に格納したサンプルセットを製造するためのサンプルセット製造方法、遺伝子整列プログラム及びサンプルセットに関する。 The present invention relates to a sample set for producing a sample set in which object groups are arranged, in particular, gene groups are arranged and sample groups corresponding to the gene groups are stored in a sample container having a plurality of storage units. manufacturing method relates to a gene alignment programs and sample set.

ヒト・マウス等、特定の生物の全遺伝子を対象に作製されたsiRNAライブラリ、siRNA発現ベクターライブラリ、shRNA発現ベクターライブラリ、siRNA発現DNA断片ライブラリ、shRNA発現DNA断片ライブラリ、cDNAクローンライブラリ、遺伝子検出用PCRプライマー・プローブライブラリ等のように大規模なサンプル群を保存又は操作する際には、通常96穴又は384穴等の多穴のマイクロプレートが用いられる。例えば96穴のマイクロプレートを利用すると、ヒト全遺伝子を標的とする約30,000種類のsiRNAは、約300枚のマイクロプレートに格納できる。   SiRNA library, siRNA expression vector library, shRNA expression vector library, siRNA expression DNA fragment library, shRNA expression DNA fragment library, cDNA clone library, PCR for gene detection prepared for all genes of specific organisms such as humans and mice When a large-scale sample group such as a primer / probe library is stored or manipulated, a multi-well microplate such as 96-well or 384-well is usually used. For example, when a 96-well microplate is used, about 30,000 types of siRNA targeting all human genes can be stored in about 300 microplates.

一方、遺伝子を分類・整理するための概念のひとつとして遺伝子オントロジー(Gene Ontology (GO))がある(例えば、非特許文献1参照。)。
遺伝子オントロジーには、例えば、「signal transducer activity(GO:0004871)」「receptor activity (GO:0004872)」のような遺伝子の属性が定義されており、さらに「receptor activity という属性は、signal transducer activityという属性を受け継ぐ」というような属性間の継承関係が定義されている。属性の定義及び属性間の継承関係は、ジーン・オントロジー・コンソシアム:Gene Ontology Consortium(http://www.geneontology.org/)より入手可能である。また、ヒトやマウスの各遺伝子と、Gene Ontology の属性との対応関係は、キャンサー・ゲノム・アナトミー・プロジェクト:Cancer Genome Anatomy Project(http://cgap.nci.nih.gov/) 等各種データベースより入手可能である。遺伝子のGene Ontology との対応データから、例えばヒトZYX遺伝子(NM_003461)はreceptor activity をもつことがわかり、さらに属性間の継承関係を用いて、ZYX遺伝子は同時にsignal transducer activityをもつことを導くことができる。
Meanwhile, as a concept for classifying and organizing genes, there is a gene ontology (Gene Ontology (GO)) (see, for example, Non-Patent Document 1).
The gene ontology defines gene attributes such as “signal transducer activity (GO: 0004871)” and “receptor activity (GO: 0004872)”, and the attribute “receptor activity” is called signal transducer activity. An inheritance relationship between attributes such as “inherit attributes” is defined. The definition of attributes and inheritance relationships between attributes are available from the Gene Ontology Consortium (http://www.geneontology.org/). The correspondence between human and mouse genes and Gene Ontology attributes is based on various databases such as the Cancer Genome Anatomy Project (http://cgap.nci.nih.gov/). It is available. From the correspondence data with Gene Ontology of the gene, for example, the human ZYX gene (NM_003461) is found to have a receptor activity, and further, using the inheritance relationship between attributes, it can be derived that the ZYX gene has a signal transducer activity at the same time. it can.

遺伝子オントロジーでは、遺伝子の属性(annotation)について、各属性の定義や属性間の継承関係の定義がされている。この遺伝子オントロジーにおける属性間の継承関係は、図8のような非循環有向グラフ(DAG)を形成する。遺伝子オントロジーでは、図8に示すように、「遺伝子の機能(molecular function)」、「生物学的現象(biological process)」、「細胞内局在(cellular component)」により遺伝子を分類・整理している。そして、各分類方法において、属性間の継承関係が定義されており、図8では、この属性間の継承関係の一部を示している。なお、図8においては、各属性について、属性の名称と、遺伝子オントロジーにおける属性のIDとを示している。
Gene Ontology Consortium、"Gene Ontology Consortium ホームページ" 、[online]、1999年、Gene Ontology Consortium、[平成16年10月25日検索]、インターネット<URL:http://www.geneontology.org/>
In gene ontology, the definition of each attribute and the inheritance relationship between attributes are defined for gene attributes. The inheritance relationship between attributes in this gene ontology forms an acyclic directed graph (DAG) as shown in FIG. In gene ontology, as shown in Fig. 8, genes are classified and organized by "molecular function", "biological process", and "cellular component". Yes. In each classification method, an inheritance relationship between attributes is defined, and FIG. 8 shows a part of the inheritance relationship between attributes. In FIG. 8, for each attribute, the attribute name and the attribute ID in the gene ontology are shown.
Gene Ontology Consortium, "Gene Ontology Consortium Home Page", [online], 1999, Gene Ontology Consortium, [October 25, 2004 search], Internet <URL: http://www.geneontology.org/>

上記のようなヒト全遺伝子を標的とするsiRNAのサンプルがマイクロプレートに格納されている場合を考える。マイクロプレートにサンプルがランダムに配置されている場合、特定の機能に関するサンプル(例えば、転写因子(約1,000サンプル程度))の
みを取り出して実験を行う場合でも、ほとんどすべてのマイクロプレートを冷凍庫より取り出して作業をする必要がある。つまり、ほとんどすべてのマイクロプレートについて、冷凍庫より取り出して、融解させ、シールを剥がし、必要なサンプルの位置を、ひとつひとつ確認しながらピペットでサンプルを取り出し、プレートを再びシーリングし、冷凍庫にしまう必要がある。このため、大規模なサンプル群がランダムに配置されていると、サンプル管理及び実験操作の能率が低下する。
Consider a case where siRNA samples targeting all human genes as described above are stored in a microplate. When samples are randomly placed on the microplate, even if only samples related to a specific function (for example, transcription factors (about 1,000 samples)) are taken out and experiments are performed, almost all microplates are removed from the freezer. Need to work out. This means that almost all microplates need to be removed from the freezer, thawed, peeled off the seal, pipetted to remove the sample while checking each sample's position, sealing the plate again, and freezing. . For this reason, if a large-scale sample group is arranged at random, the efficiency of sample management and experimental operation is reduced.

また、遺伝子オントロジーに限らず、対象物が属するグループ群が非循環有向グラフを構成する場合がある。このような場合に、対象物がグループ毎にまとめられている場合でも、グループの並べ方がランダムである場合は、グループに属する対象物やこれに対応する対象物を効率よく取り扱うことができない。   In addition to the gene ontology, the group group to which the object belongs may constitute an acyclic directed graph. In such a case, even when the objects are grouped for each group, if the group arrangement is random, the objects belonging to the group and the objects corresponding thereto cannot be handled efficiently.

本発明は、上記問題点を解決するためになされたものであり、その目的は、対象物を効率よく取り扱え、特に、複数の格納部を備えたサンプル容器に格納するサンプルの管理や実験操作の能率を向上させるためのサンプルセット製造方法、遺伝子整列プログラム及びサンプルセットを提供することにある。 The present invention has been made in order to solve the above-described problems, and the object thereof is to efficiently handle an object, and in particular, management of a sample stored in a sample container having a plurality of storage units and an experimental operation. sample set production method for improving the efficiency, is to provide a gene alignment program and the sample set.

本発明は、遺伝子群に対応するサンプル群を対象とし、各遺伝子に対応するサンプルを複数の格納部を備えたサンプル容器に格納したサンプルセットを製造するものであって、遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出し、前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる整列処理を行い、前記整列させられた遺伝子に対応するサンプルを前記サンプル容器の各格納部に格納してサンプルセットを製造する。これによれば、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを連続させて複数の格納部を備えたサンプル容器の格納部に格納することが可能となる。このため、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを同じサンプル容器中に格納できる可能性が高くなる。従って、使用するサンプルセットを限定でき、サンプル管理や実験操作の能率を向上させられる。また、同じサンプルセット中では、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを、近接する位置に配置できるため、例えば、列毎の操作が可能となり、実験操作の能率を、より向上させられる。また、特定の属性をルートノードとすれば、このルートノード及びこのルートノードの下位ノードに対応する属性の遺伝子を整列させて、これらの遺伝子に対応するサンプルをサンプル容器に格納したサンプルセットを製造できる。 The present invention is directed to a sample group corresponding to a gene group, and produces a sample set in which a sample corresponding to each gene is stored in a sample container having a plurality of storage units, and the gene attribute in the gene ontology For each node, a node size is calculated by summing the number of all genes belonging to this node and all nodes below this node, and the acyclic directed graph is calculated according to the node size. The branches are identified, the nodes of the branches are identified in the order of connection , the genes are aligned by sequentially aligning the genes belonging to the identified nodes, and the sample corresponding to the aligned genes is A sample set is manufactured by storing in each storage part of the sample container. According to this, it is possible to store a sample corresponding to a gene with the same attribute or a sample corresponding to a gene with an attribute inheriting the same attribute in a storage part of a sample container having a plurality of storage parts. Become. For this reason, there is a high possibility that a sample corresponding to a gene having the same attribute or a sample corresponding to a gene having an attribute inheriting the same attribute can be stored in the same sample container. Therefore, the sample set to be used can be limited, and the efficiency of sample management and experiment operation can be improved. Also, in the same sample set, samples corresponding to genes with the same attribute and samples corresponding to genes with the same attribute can be placed at close positions, for example, operation for each column is possible, The efficiency of the experimental operation can be further improved. In addition, if a specific attribute is a root node, genes of attributes corresponding to the root node and lower nodes of the root node are aligned, and a sample set in which samples corresponding to these genes are stored in a sample container is manufactured. it can.

さらに、本発明によれば、前記整列処理は、特定ノードに、遺伝子が整列されていない未処理の子ノードがある場合に、この中からノードサイズに従って次の処理対象の子ノードを特定する子ノード探索処理と、特定ノードに、遺伝子が整列されていない未処理の子ノードがない場合に、この特定ノードに属する遺伝子を順次整列させる遺伝子整列処理と、この特定ノードの親ノードを次の処理対象として特定する親ノード特定処理とを含むノードサイズ対応深さ優先探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより遺伝子を整列させることができる。 Further, according to the present invention, when the specific node includes an unprocessed child node in which genes are not aligned, a child node for specifying a next child node to be processed according to the node size is selected from the unprocessed child nodes. Node search processing, gene alignment processing for sequentially aligning genes belonging to this specific node when there is no unprocessed child node in which the gene is not aligned in the specific node, and next processing for the parent node of this specific node It is possible to align genes by repeating the node size-corresponding depth priority search process including the parent node specifying process specified as a target, starting with the root node as a specified node and performing the gene alignment process for all nodes. .

さらに、本発明によれば、前記整列処理において、同じ遺伝子の重複を排除することができる。これによれば、同じ遺伝子に対応するサンプルが重複しないようにすることができるとともに、重複する遺伝子について、例えば、ノードサイズが大きい方に整列させることが可能となる。従って、例えば、ノードサイズが大きい方に、遺伝子をまとめて整列
させることが可能となる。
Furthermore, according to the present invention, duplication of the same gene can be eliminated in the alignment process. According to this, it is possible to prevent samples corresponding to the same gene from overlapping, and it is possible to align overlapping genes, for example, in a larger node size. Therefore, for example, genes can be arranged together in a larger node size.

さらに、本発明によれば、前記サンプル群は、siRNAライブラリ、siRNA発現ベクターライブラリ、shRNA発現ベクターライブラリ、siRNA発現DNA断片ライブラリ、shRNA発現DNA断片ライブラリ、cDNAクローンライブラリ、遺伝子検出用PCRプライマー・プローブライブラリのいずれか1つとすることができる。   Furthermore, according to the present invention, the sample group includes siRNA library, siRNA expression vector library, shRNA expression vector library, siRNA expression DNA fragment library, shRNA expression DNA fragment library, cDNA clone library, PCR primer / probe library for gene detection. Any one of them can be used.

本発明は、コンピュータを用いて遺伝子を整列させるものであって、コンピュータが、遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出し、前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる。これによれば、同じ属性の遺伝子や、同じ属性を継承する属性の遺伝子を連続させて整列させることができる。また、特定の属性をルートノードとすることで、このルートノード及びこのルートノードの下位ノードに対応する属性の遺伝子を整列させることができる。このため、特定の属性の遺伝子に関して実験を行う場合に、実験対象の遺伝子に対応するサンプルを実験操作の能率を向上させることができるように配置することが可能となる。 The present invention arranges genes using a computer, and the computer uses a non-circular directed graph with the attributes of genes in the gene ontology as nodes, and each node is below this node and below this node. Calculate the node size that is the sum of all the genes belonging to all nodes, identify the branch of the acyclic directed graph according to the node size, identify the nodes of this branch in the order of connection, and select the gene belonging to the identified node The genes are aligned by sequential alignment. According to this, genes having the same attribute or genes having the same attribute can be continuously arranged. Further, by setting a specific attribute as a root node, genes having attributes corresponding to the root node and lower nodes of the root node can be arranged. For this reason, when an experiment is performed on a gene with a specific attribute, it is possible to arrange a sample corresponding to the gene to be experimented so that the efficiency of the experiment operation can be improved.

本発明によれば、複数の格納部を備えたサンプル容器に格納するサンプルの管理や実験操作の能率を向上させることができる。   ADVANTAGE OF THE INVENTION According to this invention, the efficiency of management of the sample stored in the sample container provided with the some storage part and experiment operation can be improved.

以下、本発明を具体化した一実施形態を図1〜図7に従って説明する。本実施形態では、遺伝子を整列させて、整列させられた遺伝子に対応するsiRNAのサンプルをサンプル容器としてのマイクロプレートの各ウェル(格納部)に格納することによりサンプルプレート(サンプルセット)を製造するためのサンプルセット製造方法、遺伝子整列プログラム及びサンプルセットとして説明する。なお、本明細書において、各ウェルにサンプルを格納したマイクロプレートを「サンプルプレート」と呼ぶこととする。本実施形態では、ヒトの生物の全遺伝子を対象にそれぞれ作製されたsiRNAのサンプルを96穴のマイクロプレートの各ウェルに格納することによりサンプルプレートを製造する。ここでは、まず、簡略化した例を用いて処理手順を説明し、次に、ヒトの全遺伝子を対象にそれぞれ作製されたsiRNAライブラリのサンプルプレートを製造する場合について説明する。   Hereinafter, an embodiment embodying the present invention will be described with reference to FIGS. In the present embodiment, a sample plate (sample set) is manufactured by aligning genes and storing siRNA samples corresponding to the aligned genes in each well (storage part) of a microplate as a sample container. A sample set manufacturing method, a gene alignment program, and a sample set will be described. In this specification, a microplate in which a sample is stored in each well is referred to as a “sample plate”. In this embodiment, a sample plate is manufactured by storing siRNA samples prepared for all genes of a human organism in each well of a 96-well microplate. Here, a processing procedure will be described first using a simplified example, and then a case will be described in which a sample plate of an siRNA library prepared for all human genes is manufactured.

図1に示すように、遺伝子整列装置20は、制御コンピュータ21、入力部22、出力部23を備えている。
制御コンピュータ21は、図示しない制御手段(CPU)、記憶手段(RAM、ROM等)を有し、後述する処理を行う。そのための遺伝子整列プログラムを実行することにより、制御コンピュータ21は、特許請求の範囲に記載のノードサイズ算出手段、整列手段、配置手段等として機能する。
As shown in FIG. 1, the gene alignment apparatus 20 includes a control computer 21, an input unit 22, and an output unit 23.
The control computer 21 includes control means (CPU) and storage means (RAM, ROM, etc.) not shown, and performs processing described later. By executing the gene alignment program for that purpose, the control computer 21 functions as a node size calculation unit, an alignment unit, an arrangement unit, and the like described in the claims.

ノードサイズ算出手段は、ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出する。整列手段は、子ノード探索処理と、遺伝子整列処理と、親ノード特定処理とを含むノードサイズ対応深さ優先探索処理を、ルートノードを親ノードとして特定して開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返す。子ノード探索処理は、特定された親ノードについて遺伝子整列処理が未処理(未訪問)の子ノードがある場合に、この親ノードに対する遺伝子整列処理が未処理の子ノードについて、ノードサイズが最も大きい子ノードを選択し、選択された子ノードを親ノードとして特定する。遺伝子整列処理は、特定された親ノードについて遺伝子整列処理が未処理(未訪問)の子ノードがない場合に、この親ノードについて、このノードの属性に属する遺伝子を順次整列させる。親ノード特定処理は、前記遺伝子整列処理を行った場合に、前記遺伝子整列処理の処理対象のノードの親ノードを特定する。この子ノード探索処理と、遺伝子整列処理と、親ノード特定処理とを含むノードサイズ対応深さ優先探索処理により、遺伝子が整列させられる。配置手段は、前記遺伝子整列処理により整列させられた遺伝子をマイクロプレートの各ウェルに対応させて配置する。   For each node, the node size calculating means calculates a node size that is the sum of the numbers of all genes belonging to this node and all nodes below this node. The alignment means starts a node size-corresponding depth priority search process including a child node search process, a gene alignment process, and a parent node specification process by specifying the root node as a parent node, and gene alignment for all nodes. Repeat until processing. In the child node search process, when there is a child node whose gene alignment process has not been processed (unvisited) for the specified parent node, the node size is the largest for the child node that has not been subjected to the gene alignment process for this parent node. A child node is selected, and the selected child node is specified as a parent node. In the gene alignment process, when there is no child node whose gene alignment process has not been processed (unvisited) for the identified parent node, genes belonging to the attribute of this node are sequentially aligned for this parent node. The parent node specifying process specifies the parent node of the processing target node of the gene alignment process when the gene alignment process is performed. Genes are aligned by the node size corresponding depth priority search process including the child node search process, the gene alignment process, and the parent node specifying process. The arrangement means arranges the genes aligned by the gene alignment process in correspondence with each well of the microplate.

制御コンピュータ21中のRAMには、後述するデータを格納するスタックを備える。さらに、RAMには、遺伝子オントロジーデータ記憶部25から読み出された遺伝子オントロジーデータ250が記録され、各属性に対応するノードが訪問された場合(遺伝子整列処理が行われた場合)に、ノードに関連付けて訪問フラグが記録される。   The RAM in the control computer 21 includes a stack for storing data to be described later. Further, the gene ontology data 250 read from the gene ontology data storage unit 25 is recorded in the RAM, and when a node corresponding to each attribute is visited (when a gene alignment process is performed), the RAM is stored in the node. The visit flag is recorded in association.

入力部22は、キーボード、マウス等で構成され、本実施形態の方法による遺伝子の整列要求を行う場合等に使用される。
出力部23は、ディスプレイ装置等の他の装置に接続される。本実施形態では、整列させた遺伝子の遺伝子名、プレート番号、ウェル番号(縦),(横)を、出力部23を介してディスプレイ装置に出力し、ディスプレイ装置に、整列させた遺伝子の遺伝子名、プレート番号、ウェル番号(縦),(横)を表示させる。
The input unit 22 includes a keyboard, a mouse, and the like, and is used when a gene alignment request is made by the method of the present embodiment.
The output unit 23 is connected to another device such as a display device. In the present embodiment, the gene name, plate number, well number (vertical), (horizontal) of the aligned genes are output to the display device via the output unit 23, and the gene names of the aligned genes are displayed on the display device. , Plate number, well number (vertical), (horizontal) are displayed.

また、遺伝子整列装置20は、遺伝子オントロジーデータ記憶部25、遺伝子属性データ記憶部26、整列データ記憶部27及びサンプル指定データ記憶部(図示せず)を含むハードディスク等の記憶装置を備えている。   In addition, the gene alignment device 20 includes a storage device such as a hard disk including a gene ontology data storage unit 25, a gene attribute data storage unit 26, an alignment data storage unit 27, and a sample designation data storage unit (not shown).

遺伝子オントロジーデータ記憶部25には、図2に示すように、遺伝子オントロジーデータ250が記録されている。この遺伝子オントロジーデータ250は、遺伝子オントロジー(Gene ontology:GO)における属性の定義及び属性間の継承関係の定義に関するデータである。本実施形態では、この遺伝子オントロジーデータ250としてジーン・オントロジー・コンソシアム:Gene Ontology Consortium(http://www.geneontology.org/)よりダウンロードにより入手可能である。本実施形態では、予め入手した遺伝子オントロジーデータ250が遺伝子オントロジーデータ記憶部25に記録されている。この遺伝子オントロジーデータ250では、属性間の継承関係が階層的に示されている。   In the gene ontology data storage unit 25, gene ontology data 250 is recorded as shown in FIG. The gene ontology data 250 is data relating to the definition of attributes in gene ontology (GO) and the definition of inheritance relationships between attributes. In the present embodiment, the gene ontology data 250 can be downloaded from the Gene Ontology Consortium (http://www.geneontology.org/). In the present embodiment, gene ontology data 250 obtained in advance is recorded in the gene ontology data storage unit 25. In the gene ontology data 250, inheritance relationships between attributes are hierarchically shown.

ここでは、処理手順の説明を簡略化するために、図2においては、属性間の継承関係を示した非循環有向グラフ251を用いる。この非循環有向グラフ251において、遺伝子オントロジーにおける属性に対応するノードA〜Iが構成されている。また、各ノードを結ぶ線(枝)は、属性間の継承関係を示す。   Here, in order to simplify the description of the processing procedure, a non-circular directed graph 251 showing the inheritance relationship between attributes is used in FIG. In this acyclic directed graph 251, nodes A to I corresponding to attributes in the gene ontology are configured. In addition, a line (branch) connecting each node indicates an inheritance relationship between attributes.

遺伝子属性データ記憶部26には、図3に示すように、遺伝子と遺伝子オントロジーにおける属性との対応関係を示す遺伝子属性データ260が遺伝子毎に記録されている。遺伝子属性データ260は、各遺伝子について、遺伝子名及び1以上の属性に関するデータを含んで構成される。   As shown in FIG. 3, gene attribute data 260 indicating the correspondence between genes and attributes in gene ontology is recorded in the gene attribute data storage unit 26 for each gene. The gene attribute data 260 includes, for each gene, data related to the gene name and one or more attributes.

遺伝子名データ領域には、遺伝子名に関するデータが記録される。なお、遺伝子名とともに、或いは遺伝子名に代えて公共の遺伝子データベースにおけるアクセッション番号が記録されてもよい。   Data relating to gene names is recorded in the gene name data area. The accession number in the public gene database may be recorded together with the gene name or instead of the gene name.

属性データ領域には、この遺伝子の属性に関するデータが記録される。なお、遺伝子が複数の属性に属する場合は、複数の属性が記録される。
この遺伝子属性データ260は、キャンサー・ゲノム・アナトミー・プロジェクト:Cancer Genome Anatomy Project(http://cgap.nci.nih.gov/) 等各種データベースより入手可能である。本実施形態では、予め入手した遺伝子属性データ260が遺伝子属性データ記憶部26に記録されている。
In the attribute data area, data relating to the attribute of this gene is recorded. When a gene belongs to a plurality of attributes, a plurality of attributes are recorded.
The gene attribute data 260 can be obtained from various databases such as the Cancer Genome Anatomy Project (http://cgap.nci.nih.gov/). In the present embodiment, gene attribute data 260 obtained in advance is recorded in the gene attribute data storage unit 26.

整列データ記憶部27には、図4に示すように、マイクロプレートの各ウェルに格納するサンプルに対応する遺伝子毎に、整列データ270が記録される。この整列データ270は、後述する処理に従って遺伝子を整列させた場合に記録される。整列データ270は、順番、プレート番号、ウェル番号(縦)、ウェル番号(横)、遺伝子名及びサンプル名に関するデータを含んで構成される。   As shown in FIG. 4, the alignment data storage unit 27 records alignment data 270 for each gene corresponding to the sample stored in each well of the microplate. This alignment data 270 is recorded when the genes are aligned according to the processing described later. The alignment data 270 includes data relating to order, plate number, well number (vertical), well number (horizontal), gene name, and sample name.

順番データ領域には、整列させた遺伝子の順番に関するデータが記録される。
プレート番号データ領域には、この遺伝子に対応するサンプルを格納するプレートの識別番号に関するデータが記録される。
In the order data area, data relating to the order of the aligned genes is recorded.
In the plate number data area, data relating to the identification number of the plate storing the sample corresponding to this gene is recorded.

ウェル番号(縦)データ領域には、この遺伝子に対応するサンプルを格納するウェルの位置(縦)を特定するためのデータが記録される。具体的には、12列(01〜12)のいずれかが記録される。   In the well number (vertical) data area, data for specifying the position (vertical) of a well storing a sample corresponding to this gene is recorded. Specifically, one of 12 columns (01 to 12) is recorded.

ウェル番号(横)データ領域には、この遺伝子に対応するサンプルを格納するウェルの位置(横)を特定するためのデータが記録される。具体的には、8列(A〜H)のいずれかが記録される。   In the well number (horizontal) data area, data for specifying the position (horizontal) of a well storing a sample corresponding to this gene is recorded. Specifically, any of 8 columns (A to H) is recorded.

遺伝子名データ領域には、整列させた遺伝子の遺伝子名に関するデータが記録される。なお、遺伝子名とともに、或いは遺伝子名に代えてアクセッション番号が記録されてもよい。   In the gene name data area, data relating to the gene names of the aligned genes is recorded. The accession number may be recorded together with the gene name or instead of the gene name.

サンプル名データ領域には、この遺伝子のサンプル名に関するデータが記録される。
サンプル指定データ記憶部には、各遺伝子に対応して作製するサンプルのサンプル名に関するサンプル指定データが記録される。このサンプル指定データは、遺伝子名及びサンプル名に関するデータを含んで構成される。遺伝子に対応するサンプルが複数ある場合があるが、本実施形態では、各遺伝子について、それぞれ予め指定した1種類のサンプルのみを用いる。このため、各遺伝子について、どのサンプルを用いるかを予め指定し、遺伝子名とサンプル名とを関連付けたサンプル指定データを記録しておく。
Data relating to the sample name of this gene is recorded in the sample name data area.
In the sample designation data storage unit, sample designation data relating to the sample name of the sample produced corresponding to each gene is recorded. The sample designation data includes data related to the gene name and the sample name. There may be a plurality of samples corresponding to genes, but in this embodiment, only one type of sample specified in advance is used for each gene. Therefore, for each gene, which sample is used is designated in advance, and sample designation data in which the gene name and the sample name are associated is recorded.

制御コンピュータ21は、後述する処理を行い、マイクロプレートの各ウェルに対応させて遺伝子を整列させた整列データ270を記録し、この整列データ270を出力する。この整列データ270中の遺伝子名で特定される遺伝子に対応するsiRNAが、96穴のマイクロプレート30の各ウェル31にそれぞれ格納される。   The control computer 21 performs processing described later, records the alignment data 270 in which the genes are aligned corresponding to each well of the microplate, and outputs the alignment data 270. The siRNA corresponding to the gene specified by the gene name in the alignment data 270 is stored in each well 31 of the 96-well microplate 30.

(処理手順)
上記のように構成されたシステムにおいて、遺伝子オントロジーを用いて、後述するノードサイズが大きい順番に深さ優先探索(ノードサイズ対応深さ優先探索処理)を行うことにより遺伝子を整列させて、各遺伝子にマイクロプレート上に配置する場合の処理手順を、図5を用いて説明する。ここでは、非循環有向グラフ251に示す属性間の継承関係がある場合を想定して、図6を用いて説明する。図6において、遺伝子オントロジーにおける属性(annotation)をノード41とし、継承関係を枝42で示す非循環有向グラフ(DAG)が示される。ここでは、属性Aについてのノード41がルートノードとなっている。また各ノード41には、このノードに対応する属性に対応づけられた遺伝子名を表示する吹き出し43が示されている。なお、各属性に対応付けられた遺伝子名は、遺伝子属性データ260により取得できる。さらに、各ノードの上には、ノードサイズ44が示されている。本実施形態では、ノードサイズ44を、「そのノード及びその下層にあるすべてのノードに属する全遺伝子の数」と定義する。例えば、ノードBについては、ノードB,C,D,Eに属する遺伝子数の合計がノードサイズとなり、ノードサイズは「6」となる。
(Processing procedure)
In the system configured as described above, genes are aligned by performing a depth-first search (node size-corresponding depth-first search process) in descending order of the node size, which will be described later, using a gene ontology. A processing procedure in the case of arranging on a microplate will be described with reference to FIG. Here, the case where there is an inheritance relationship between attributes shown in the acyclic directed graph 251 will be described with reference to FIG. In FIG. 6, an acyclic directed graph (DAG) in which an attribute in gene ontology is a node 41 and an inheritance relationship is represented by a branch 42 is shown. Here, the node 41 for the attribute A is the root node. Each node 41 also has a balloon 43 that displays the gene name associated with the attribute corresponding to this node. The gene name associated with each attribute can be acquired from the gene attribute data 260. Furthermore, a node size 44 is shown above each node. In the present embodiment, the node size 44 is defined as “the number of all genes belonging to the node and all nodes below it”. For example, for node B, the total number of genes belonging to nodes B, C, D, and E is the node size, and the node size is “6”.

以下に、図6の非循環有向グラフを用いて、図5に従って処理手順を説明する。
まず、制御コンピュータ21は、ルートノードをスタックに記録する(ステップS1)。ここでは、ルートノードはノードAであり、ノードAをスタックに記録する。
The processing procedure will be described below with reference to FIG. 5 using the acyclic directed graph of FIG.
First, the control computer 21 records the root node on the stack (step S1). Here, the root node is node A, and node A is recorded on the stack.

次に、制御コンピュータ21は、スタックが空かどうかを判別する(ステップS2)。ここでは、スタックにはノードAが記録されており空ではないため(ステップS2においてNOであるため)、未訪問の子ノードが存在するかを判別する(ステップS3)。ここでは、ノードAに対する子ノードはノードB、ノードF及びノードGであり、いずれも訪問フラグが記録されていない。   Next, the control computer 21 determines whether or not the stack is empty (step S2). Here, since node A is recorded in the stack and is not empty (NO in step S2), it is determined whether there is an unvisited child node (step S3). Here, the child nodes for node A are node B, node F, and node G, and no visit flag is recorded.

このように未訪問の子ノードが存在するため(ステップS3においてYESであるため)、未訪問の子ノードについてそれぞれノードの大きさ(ノードサイズ)を算出する(ステップS4)。ここで、「ノードの大きさ(ノードサイズ)」を「そのノード及びその下層にあるすべてのノードに属する全遺伝子の数」と定義する。具体的には、まず、未訪問の子ノードそれぞれについて、遺伝子オントロジーデータ250における属性の継承関係に基づいて、下層にあるすべてのノードを特定する。そして、未訪問の子ノードそれぞれについて、そのノード及びその下層にあるすべてのノードについて、各ノードの属性に属する遺伝子の数を、それぞれの属性についての遺伝子属性データ260の数をカウントすることにより取得する。そして、未訪問の子ノードそれぞれについて、そのノード及びその下層にあるすべてのノードについてそれぞれカウントした遺伝子の数を合計することにより、ノードサイズを算出する。   Since there are unvisited child nodes in this way (because YES in step S3), the node size (node size) is calculated for each unvisited child node (step S4). Here, the “node size (node size)” is defined as “the number of all genes belonging to the node and all the nodes below it”. Specifically, first, for each unvisited child node, all lower nodes are specified based on the attribute inheritance relationship in the gene ontology data 250. Then, for each unvisited child node, the number of genes belonging to the attribute of each node and the number of genes attribute data 260 for each attribute are obtained for that node and all nodes below it. To do. Then, for each unvisited child node, the node size is calculated by summing the number of genes counted for each node and all the nodes below it.

図6において、ノードBの大きさはノードB,C,D,Eに属する遺伝子数の合計(遺伝子数:6)であり、ノードFの大きさはノードFに属する遺伝子数(遺伝子数:2)であり、ノードGの大きさはノードG,H,Iに属する遺伝子数の合計(遺伝子数:4)である。このようにして算出したノードサイズを図6において示す各ノードの上にノードサイズ44として示す。   In FIG. 6, the size of node B is the total number of genes belonging to nodes B, C, D and E (number of genes: 6), and the size of node F is the number of genes belonging to node F (number of genes: 2). The size of the node G is the total number of genes belonging to the nodes G, H, and I (the number of genes: 4). The node size calculated in this way is shown as a node size 44 on each node shown in FIG.

そして、制御コンピュータ21は、未訪問の子ノードのノードサイズの大きさを比較し、最も大きいノードサイズの子ノードを選択し、スタックに記録する(ステップS5)。これにより、選択された子ノードが、次の処理の親ノードとして特定される。なお、最も大きいノードサイズの子ノードが複数存在する場合には、このうちの1つを選択する。ここでは、ノードBが最も大きいため、ノードBをスタックに記録する。すなわち、ノード
Aから分岐したノードBを含む枝が特定される。そして、ステップS2の処理に戻る。
Then, the control computer 21 compares the node sizes of the unvisited child nodes, selects the child node having the largest node size, and records it on the stack (step S5). Thereby, the selected child node is specified as the parent node of the next process. When there are a plurality of child nodes having the largest node size, one of them is selected. Here, since node B is the largest, node B is recorded on the stack. That is, a branch including the node B branched from the node A is specified. Then, the process returns to step S2.

ここで、スタックにはノードA,Bが記録されており、スタックは空ではないため(ステップS2においてNOであるため)、最後にスタックに記録したノードBについて、未訪問の子ノードが存在するかを判別する(ステップS3)。ここでは、未訪問の子ノードとして、ノードC,Eが存在する。このため(ステップS3においてYESであるため)、未訪問の子ノードについて大きさを算出する(ステップS4)。そして、ノードC(遺伝子数:2)、ノードE(遺伝子数:1)のノードサイズを比較し、最も大きい子ノードであるノードCをスタックに記録する(ステップS5)。すなわち、ノードBから分岐したノードCを含む枝が特定される。そして、ステップS2の処理に戻る。   Here, since the nodes A and B are recorded in the stack and the stack is not empty (NO in step S2), there is an unvisited child node for the node B that is recorded last in the stack. Is determined (step S3). Here, nodes C and E exist as unvisited child nodes. For this reason (because it is YES in step S3), the size is calculated for an unvisited child node (step S4). Then, the node sizes of node C (number of genes: 2) and node E (number of genes: 1) are compared, and node C, which is the largest child node, is recorded on the stack (step S5). That is, a branch including the node C branched from the node B is specified. Then, the process returns to step S2.

ここで、スタックにはノードA,B,Cが記録されており、スタックは空ではないため(ステップS2においてNOであるため)、最後にスタックに記録したノードCについて、未訪問の子ノードが存在するかを判別する(ステップS3)。ここでは、未訪問の子ノードとして、ノードDが存在する。このため(ステップS3においてYESであるため)、未訪問の子ノードについて大きさを算出し(ステップS4)、最も大きい子ノードであるノードDをスタックに記録する(ステップS5)。なお、この場合のように、未訪問の子ノードが1つの場合は、ノードサイズの算出は行わずに、この未訪問の子ノードをスタックに記録してもよい。そして、ステップS2の処理に戻る。   Here, since nodes A, B, and C are recorded in the stack and the stack is not empty (NO in step S2), an unvisited child node is the last node C recorded in the stack. It is determined whether it exists (step S3). Here, node D exists as an unvisited child node. For this reason (because it is YES in step S3), the size of the unvisited child node is calculated (step S4), and the largest child node, node D, is recorded on the stack (step S5). In this case, when there is one unvisited child node, the unvisited child node may be recorded on the stack without calculating the node size. Then, the process returns to step S2.

ここで、スタックにはノードA,B,C,Dが記録されており、スタックは空ではないため(ステップS2においてNOであるため)、最後にスタックに記録したノードDについて、未訪問の子ノードが存在するかを判別する(ステップS3)。ノードDはリーフノードであって、未訪問の子ノードがないため(ステップS3においてNOであるため)、スタックから最後に記録したノードを取り出す(ステップS6)。ここでは、ノードDが取り出される。すなわち、ノードBから分岐したノードCを含む枝において、最も深いノードであるノードDが特定される。そして、取り出したノードに対応する遺伝子名を遺伝子属性データ記憶部26から抽出する(ステップS7)。ここでは、遺伝子名としてa006及びa007が抽出される。そして、記録済でない遺伝子名について、順番、プレート番号、及びウェル番号(縦),(横)、遺伝子名及びサンプル名を整列データ記憶部27に記録する(ステップS8)。具体的には、まず、抽出された遺伝子名で整列データ270を検索する。ここで、抽出された遺伝子名と同じ遺伝子名の整列データ270が記録されている場合、抽出された遺伝子名が記録済であるため、整列データ270の記録を行わない。記録済でない場合、制御コンピュータ21は、順番、プレート番号、ウェル番号(縦),(横)を採番する。プレート番号は、「1」から順番に採番し、先に記録した整列データ270がウェル番号(縦),(横)が「12,H」である場合に、1を加算した番号を採番する。ウェル番号(縦)は、「01」から順番に「12」まで採番し、先に記録した整列データ270のウェル番号(横)が「H」の場合に、1を加算した番号を採番する。そして、先に記録した整列データ270のウェル番号(縦),(横)が「12」,「H」の場合、「01」に戻って採番する。ウェル番号(横)は、「A」から順番に「H」まで採番し、先に記録した整列データ270のウェル番号(横)が「H」の場合に、「A」に戻って採番する。ここでは、順番「1」、プレート番号「1」、ウェル番号(縦)「01」、ウェル番号(横)「A」、遺伝子名「a006」をそれぞれ設定した整列データ270と、順番「2」、プレート番号「1」、ウェル番号(縦)「01」、ウェル番号(横)「B」、遺伝子名「a007」をそれぞれ設定した整列データ270が記録される。また、制御コンピュータ21は、遺伝子名に基づいて、サンプル名データ記憶部からサンプル名を抽出し、整列データ270にそれぞれ設定する。なお、順番、遺伝子名及び遺伝子オントロジーにおける属性の継承関係を整列表示51に示す。そして、処理を行ったノードに関連付けて訪問フラグを記録する。ここでは、ノードDについて訪問フラグを記録する。そして、制御コンピュータ21は、ステップS2の処理に戻る。   Here, since nodes A, B, C, and D are recorded in the stack and the stack is not empty (NO in step S2), an unvisited child of node D recorded in the stack at the end is recorded. It is determined whether a node exists (step S3). Since node D is a leaf node and there is no unvisited child node (because it is NO in step S3), the node recorded last is taken out from the stack (step S6). Here, node D is taken out. That is, in the branch including the node C branched from the node B, the node D that is the deepest node is specified. Then, the gene name corresponding to the extracted node is extracted from the gene attribute data storage unit 26 (step S7). Here, a006 and a007 are extracted as gene names. Then, the order, plate number, well number (vertical), (horizontal), gene name, and sample name are recorded in the alignment data storage unit 27 for the gene names that have not been recorded (step S8). Specifically, first, the alignment data 270 is searched with the extracted gene name. Here, when the alignment data 270 having the same gene name as the extracted gene name is recorded, the alignment data 270 is not recorded because the extracted gene name is already recorded. If not recorded, the control computer 21 numbers the order, plate number, well number (vertical), (horizontal). The plate number is numbered in order from “1”, and when the previously recorded alignment data 270 is the well number (vertical) and (horizontal) is “12, H”, the number obtained by adding 1 is numbered. To do. Well numbers (vertical) are numbered sequentially from “01” to “12”. When the well number (horizontal) of the previously recorded alignment data 270 is “H”, the number obtained by adding 1 is numbered. To do. If the well numbers (vertical) and (horizontal) of the previously recorded alignment data 270 are “12” and “H”, the number is returned to “01”. Well numbers (horizontal) are numbered sequentially from “A” to “H”, and when the well number (horizontal) of the previously recorded alignment data 270 is “H”, the number is returned to “A” and numbered. To do. Here, the order data “1”, the plate number “1”, the well number (vertical) “01”, the well number (horizontal) “A”, and the gene name “a006” are set, and the order “2”. , The alignment data 270 in which the plate number “1”, well number (vertical) “01”, well number (horizontal) “B”, and gene name “a007” are set is recorded. Further, the control computer 21 extracts the sample name from the sample name data storage unit based on the gene name, and sets it in the alignment data 270. Note that the order, gene name, and inheritance relationship of attributes in the gene ontology are shown in the alignment display 51. Then, a visit flag is recorded in association with the processed node. Here, a visit flag is recorded for node D. Then, the control computer 21 returns to the process of step S2.

このようにして、制御コンピュータ21は、処理を続行する。ここで、スタックにはノードA,B,Cが記録されており、最後にスタックに記録されたノードCが親ノードとして特定される。このノードCについて未訪問の子ノードが存在しないため、ノードCをスタックから取り出す。すなわち、ノードBから分岐したノードCを含む枝において、先に特定されたノードDに連結されたノードCが特定される。ノードCに対応する遺伝子名「a005」が順番「3」となる。   In this way, the control computer 21 continues the process. Here, nodes A, B, and C are recorded in the stack, and the node C recorded last in the stack is specified as the parent node. Since there is no unvisited child node for this node C, node C is taken out of the stack. That is, in the branch including the node C branched from the node B, the node C connected to the previously specified node D is specified. The gene name “a005” corresponding to the node C is “3” in order.

ここで、スタックにはノードA,Bが記録されており、ノードBについて未訪問の子ノード(ノードE)が存在するため、ノードEをスタックに記録する。このノードEについては未訪問の子ノードが存在しないため、ノードEをスタックから取り出す。ノードEに対応する遺伝子名「a008」が順番「4」となる。   Here, nodes A and B are recorded in the stack, and since there is an unvisited child node (node E) for node B, node E is recorded in the stack. Since there is no unvisited child node for this node E, the node E is taken out of the stack. The gene name “a008” corresponding to the node E becomes “4” in order.

ここで、スタックにはノードA,Bが記録されており、ノードBについて未訪問の子ノードが存在しないため、ノードBをスタックから取り出す。ノードBに対応する遺伝子名「a003」、「a004」が順番「5」、「6」となる。   Here, since nodes A and B are recorded in the stack and there is no unvisited child node for node B, node B is taken out of the stack. The gene names “a003” and “a004” corresponding to the node B are in the order “5” and “6”.

ここで、スタックにはノードAが記録されており、ノードAについて未訪問の子ノード(ノードF,G)が存在し、ノードF(遺伝子数:2)、ノードG(遺伝子数:4)についてノードサイズを比較する。そして、最も大きい子ノードであるノードGをスタックに記録する。このノードGについて未訪問の子ノード(ノードH,I)が存在し、ノードH(遺伝子数:2)、ノードI(遺伝子数:1)についてノードサイズを比較する。そして、最も大きい子ノードであるノードHをスタックに記録する。このノードHについては未訪問の子ノードが存在しないため、ノードHをスタックから取り出す。ノードHに対応する遺伝子名「a012」、「a013」が順番「7」、「8」になる。   Here, node A is recorded in the stack, there are unvisited child nodes (nodes F and G) for node A, and node F (number of genes: 2) and node G (number of genes: 4). Compare node sizes. Then, node G, which is the largest child node, is recorded on the stack. There are unvisited child nodes (nodes H and I) for this node G, and the node sizes of node H (number of genes: 2) and node I (number of genes: 1) are compared. Then, node H, which is the largest child node, is recorded on the stack. Since there is no unvisited child node for this node H, the node H is taken out of the stack. The gene names “a012” and “a013” corresponding to the node H become “7” and “8” in order.

ここで、スタックにはノードA,Gが記録されており、ノードGにおいて未訪問の子ノード(ノードI)が存在するため、ノードIをスタックに記録する。このノードIには未訪問の子ノードが存在しないため、ノードIをスタックから取り出す。ここで、ノードIに対応する遺伝子名「a008」は、ノードEにも対応しているため、遺伝子名「a008」の整列データ270が既に記録されている。このため、この段階では遺伝子名「a008」についての整列データ270を記録しない。   Here, nodes A and G are recorded in the stack, and since there is an unvisited child node (node I) in node G, node I is recorded in the stack. Since there is no unvisited child node in this node I, node I is taken out of the stack. Here, since the gene name “a008” corresponding to the node I also corresponds to the node E, the alignment data 270 of the gene name “a008” has already been recorded. Therefore, the alignment data 270 for the gene name “a008” is not recorded at this stage.

ここで、スタックにはノードA,Gが記録されており、ノードGにおいて未訪問の子ノードが存在しないため、ノードGをスタックから取り出す。ノードGに対応する遺伝子名「a011」が順番「9」となる。   Here, since the nodes A and G are recorded in the stack and there are no unvisited child nodes in the node G, the node G is taken out of the stack. The gene name “a011” corresponding to the node G becomes “9” in order.

ここで、スタックにはノードAが記録されており、ノードAにおいて未訪問の子ノード(ノードF)が存在するため、ノードFをスタックに記録する。このノードFには未訪問の子ノードが存在しないため、ノードFをスタックから取り出す。ノードFに対応する遺伝子名「a009」、「a010」が順番「10」、「11」となる。   Here, since the node A is recorded in the stack and there is an unvisited child node (node F) in the node A, the node F is recorded in the stack. Since there is no unvisited child node in this node F, the node F is taken out of the stack. The gene names “a009” and “a010” corresponding to the node F become the order “10” and “11”.

ここで、スタックにはノードAが記録されており、ノードAにおいて未訪問の子ノードが存在しないため、ノードAをスタックから取り出す。ノードAに対応する遺伝子名「a001」、「a002」が順番「12」、「13」となる。   Here, since node A is recorded in the stack and there is no unvisited child node in node A, node A is taken out of the stack. The gene names “a001” and “a002” corresponding to the node A are “12” and “13” in this order.

ここで、スタックは空であるため(ステップS2でYESであるため)、処理を終了する。
このようにして整列させられた遺伝子について、順番、遺伝子名及び遺伝子オントロジーにおける属性の継承関係を整列表示51に示す。ここで、整列表示51に対応する整列
データ270が整列データ記憶部27に記録されている。遺伝子整列装置20は、この整列データ270を出力する。この整列データ270における、順番、プレート番号、ウェル番号(縦),(横)、遺伝子名及びサンプル名に従って、各遺伝子に対応するsiRNAを各マイクロプレートの各ウェルに格納する。図7に、上記の例においてマイクロプレートの各ウェルに格納するsiRNAについて、それぞれ対応する遺伝子名及び遺伝子オントロジーにおける属性の継承関係を示す。
Here, since the stack is empty (YES in step S2), the process is terminated.
For the genes arranged in this way, the order, gene name, and inheritance relationship of attributes in the gene ontology are shown in the alignment display 51. Here, the alignment data 270 corresponding to the alignment display 51 is recorded in the alignment data storage unit 27. The gene alignment apparatus 20 outputs this alignment data 270. According to the order, plate number, well number (vertical), (horizontal), gene name, and sample name in this alignment data 270, siRNA corresponding to each gene is stored in each well of each microplate. FIG. 7 shows the inheritance relationship of attributes in the corresponding gene name and gene ontology for the siRNA stored in each well of the microplate in the above example.

整列データ270においては、上述のように、遺伝子オントロジーを用いて、ノードサイズが大きい順番に深さ優先探索を行うことにより整列させられ、プレート番号、ウェル番号(縦),(横)が順番に採番されている。上記の例では、図7に示すように、「01」列について、整列させられた遺伝子が「A」から順番に対応し、さらに、「02」列について、整列させられた遺伝子が「A」から順番に対応する。   In the alignment data 270, as described above, the gene ontology is used to perform alignment by performing a depth-first search in descending order of the node size, and the plate number, well number (vertical), and (horizontal) are sequentially displayed. It is numbered. In the above example, as shown in FIG. 7, for the “01” column, the aligned genes correspond in order from “A”, and for the “02” column, the aligned genes are “A”. Corresponding in order.

そして、整列データ270における、順番、プレート番号、ウェル番号(縦),(横)、遺伝子名に従って、各遺伝子に対応するsiRNAを各マイクロプレートの各ウェルに格納する。例えば、用意したサンプルを、マイクロプレートの各ウェルにそれぞれ注入するための装置を用いる。一方、整列データ270に基づいて、プレート番号、ウェル番号(縦),(横)、遺伝子名及びサンプル名を遺伝子整列装置20に接続されたディスプレイ装置に表示させる。そして、ディスプレイ装置に表示されたプレート番号、ウェル番号(縦),(横)、遺伝子名及びサンプル名に従って、各遺伝子に対応するsiRNAを、ディスプレイ装置の表示により指示されているマイクロプレート及びウェルの位置に対応させて上記の装置にセットする。そして、この装置を用いて、整列させられた遺伝子に対応するsiRNAをマイクロプレートの各ウェルに注入する。このようにして、遺伝子オントロジーを用いて、ノードサイズが大きい順番に深さ優先探索を行うことにより遺伝子を整列させて、この整列させられた遺伝子に対応するsiRNAをマイクロプレートのウェルにそれぞれ格納することにより、サンプルプレートを製造する。   Then, siRNA corresponding to each gene is stored in each well of each microplate according to the order, plate number, well number (vertical), (horizontal), and gene name in the alignment data 270. For example, an apparatus for injecting the prepared sample into each well of the microplate is used. On the other hand, based on the alignment data 270, the plate number, well number (vertical), (horizontal), gene name, and sample name are displayed on a display device connected to the gene alignment apparatus 20. Then, according to the plate number, well number (vertical), (horizontal), gene name and sample name displayed on the display device, siRNA corresponding to each gene is assigned to the microplate and well indicated by the display on the display device. Set to the above device according to the position. Then, using this apparatus, siRNA corresponding to the aligned genes is injected into each well of the microplate. In this way, genes are aligned by performing depth-first search in descending order of node size using gene ontology, and siRNAs corresponding to the aligned genes are respectively stored in the wells of the microplate. Thus, a sample plate is manufactured.

以上、本実施形態によれば、以下に示す効果を得ることができる。
・ 上記実施形態では、遺伝子オントロジーにおける遺伝子の属性をノード41とする非循環有向グラフを用いて、任意のノード41のノードサイズ44を、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数と定義し、各ノード41についてノードサイズを算出する。そして、ルートノード(ノードA)から開始して、ノードサイズが大きい順番に深さ優先探索を行い、子ノードの属性に属する遺伝子(遺伝子名表示43)を整列させた後に親ノードの属性に属する遺伝子(遺伝子名表示43)を整列させるようにして遺伝子を整列させる。そして、整列させた遺伝子をマイクロプレートのウェルに順次対応させて配置する。これにより、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを連続させてマイクロプレートのウェルに格納することが可能となる。このため、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを同じマイクロプレート中に格納できる可能性が高くなる。従って、使用するマイクロプレートを限定でき、冷凍庫からの出し入れが必要なマイクロプレートを限定できるため、サンプル管理や実験操作の能率を向上させられる。また、同じマイクロプレート中では、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを、近接する位置に配置できるため、例えば、列毎の操作が可能となり、実験操作の能率を、より向上させられる。具体的には、96穴のマイクロプレートについて、整列させたサンプルを縦に(8レーンずつ)並べて配置しているため、8チャンネルのピペットを用いて、実験操作の能率を上げることができる。
As described above, according to the present embodiment, the following effects can be obtained.
In the above embodiment, using the acyclic directed graph with the gene attribute in the gene ontology as the node 41, the node size 44 of the arbitrary node 41 is set to all the genes belonging to this node and all nodes below this node. The node size is calculated for each node 41. Then, starting from the root node (node A), a depth-first search is performed in descending order of the node size, and after the genes (gene name display 43) belonging to the attributes of the child nodes are aligned, they belong to the attributes of the parent node. The genes are aligned by aligning the genes (gene name display 43). Then, the aligned genes are sequentially arranged corresponding to the wells of the microplate. As a result, samples corresponding to genes having the same attribute and samples corresponding to genes having the same attribute can be successively stored in the wells of the microplate. For this reason, there is a high possibility that a sample corresponding to a gene with the same attribute or a sample corresponding to a gene with an attribute inheriting the same attribute can be stored in the same microplate. Therefore, since the microplate to be used can be limited and the microplate that needs to be taken in and out of the freezer can be limited, the efficiency of sample management and experimental operation can be improved. Also, in the same microplate, samples corresponding to genes with the same attribute and samples corresponding to genes with the same attribute can be placed at close positions, so for example, operations can be performed for each column, The efficiency of the experimental operation can be further improved. Specifically, since the aligned samples are arranged vertically (8 lanes) in a 96-well microplate, the efficiency of the experimental operation can be increased using an 8-channel pipette.

・ 上記実施形態では、ステップS8において、記録済の遺伝子については、整列データ270を記録しない。つまり、整列済の遺伝子は、重複して整列させない。これにより
、同じ遺伝子に対応するサンプルが重複しないようにすることができるとともに、ノードサイズが大きい順番に深さ優先検索を行うことにより遺伝子を整列させるため、重複する遺伝子について、ノードサイズが大きい方に整列させることができる。従って、使用される頻度がより多いと予想される属性、もしくは重要度が高い属性の方に、siRNAのサンプルをまとめてマイクロプレート上に配置でき、使用される頻度がより多いと予測される属性ほど、サンプル管理や実験操作の能率を上げることができる。
In the above embodiment, the alignment data 270 is not recorded for recorded genes in step S8. That is, the aligned genes are not aligned in duplicate. As a result, samples corresponding to the same gene can be prevented from overlapping, and the genes are aligned by performing depth-first search in the order of the largest node size. Can be aligned. Therefore, siRNA samples can be placed together on the microplate for attributes that are expected to be used more frequently or have higher importance, and attributes that are expected to be used more frequently. The efficiency of sample management and experiment operation can be improved.

(siRNAライブラリのサンプルプレート)
上記実施形態では処理手順の説明のために簡略化した例を用いたが、ヒトの全遺伝子を対象に作製されたsiRNAライブラリの各サンプルをマイクロプレートの各ウェルに格納する場合も、同様にして行うことができる。例えば、ヒト全遺伝子をそれぞれ標的とする約30,000種類のsiRNAは、約300枚のマイクロプレートに格納できるが、この場合も、遺伝子オントロジーを用いて、ノードサイズが大きい順番に深さ優先探索を行うことにより遺伝子を整列させる。
(SiRNA library sample plate)
In the above embodiment, a simplified example is used for the explanation of the processing procedure. However, when each sample of the siRNA library prepared for all human genes is stored in each well of the microplate, the same applies. It can be carried out. For example, about 30,000 siRNAs targeting all human genes can be stored in about 300 microplates. In this case as well, depth-first search is performed in descending order of node size using gene ontology. To align the genes.

例えば、転写因子(遺伝子オントロジーにおける属性の継承関係:「Gene Ontology―molecular function−binding−nucleic acid binding−DNA binding−transcription factor activity」)に関するsiRNA(約1,000サンプル程度)のみを取り出して実験を行う場合を想定する。siRNAのサンプルがランダムに約300枚のマイクロプレートに配置されている場合、ほとんどすべてのマイクロプレートについて、冷凍庫から取り出して、実験操作をする必要がある。これに対し、上記のように、遺伝子オントロジーを用いて、ノードサイズが大きい順番に深さ優先探索を行って遺伝子を整列させていれば、転写因子という同じ属性の遺伝子に対応するsiRNAはまとまって配置されているため、約10枚を実験に使用すればよい。従って、冷凍庫から取り出すマイクロプレートを限定でき、サンプル管理や実験の能率を向上させることができる。また、このようなマイクロプレートを購入する場合は、必要なもののみ購入することができるため、経済効率がよくなる。   For example, only siRNAs (about 1,000 samples) related to transcription factors (inheritance of attributes in gene ontology: “Gene Ontology-molecular function-binding-nucleic acid binding-DNA binding-transcription factor activity”) are extracted and experimented. Assume the case to do. When siRNA samples are randomly arranged on about 300 microplates, almost all microplates need to be removed from the freezer and subjected to an experimental operation. On the other hand, as described above, siRNAs corresponding to genes having the same attribute as transcription factors are grouped by performing a depth-first search in order of increasing node size using gene ontology. Since it is arranged, about 10 sheets may be used for the experiment. Therefore, the microplate taken out from the freezer can be limited, and the efficiency of sample management and experiments can be improved. Moreover, when purchasing such a microplate, since only what is necessary can be purchased, economic efficiency improves.

また、同じマイクロプレート上でも、同じ属性の遺伝子や同じ属性を継承する属性の遺伝子はまとまって配置されるため、同じ属性の遺伝子に対応するsiRNAを用いる場合、例えば、8チャンネルのピペットを用いて操作をすることで、実験の能率を向上させることができる。   In addition, since genes having the same attribute and genes inheriting the same attribute are arranged together on the same microplate, when using siRNA corresponding to the same attribute gene, for example, using an 8-channel pipette By performing the operation, the efficiency of the experiment can be improved.

実際のヒトの遺伝子については、同じ遺伝子が複数の属性(annotation)に属する場合が多数存在するが、上述のように、整列データ270を記録する際に遺伝子名の重複を排除するため、同じ遺伝子について整列データ270が重複して記録されることはない。このため、同じ遺伝子に対応するsiRNAをマイクロプレートに重複して格納することはない。   As for an actual human gene, there are many cases where the same gene belongs to a plurality of annotations. As described above, in order to eliminate duplication of gene names when recording the alignment data 270, the same gene Alignment data 270 is not recorded in duplicate. For this reason, siRNA corresponding to the same gene is not redundantly stored in the microplate.

また、複数の属性に関連付けられている遺伝子をどの属性として扱うかは、siRNAを格納するマイクロプレート及びウェルの位置に影響するが、ノードサイズが大きい順番に深さ優先探索を行うことで、ノードサイズが大きい方の属性として扱われることとなる。従って、遺伝子が複数の属性に関連付けられている場合、この遺伝子に対応するsiRNAは、ノードサイズが大きい方に対応するsiRNAの集合に含められてマイクロプレートに配置される。   In addition, which attribute is handled as a gene associated with a plurality of attributes affects the positions of microplates and wells that store siRNA. However, by performing depth-first search in descending order of node size, It will be treated as the attribute with the larger size. Therefore, when a gene is associated with a plurality of attributes, the siRNA corresponding to this gene is included in the set of siRNAs corresponding to the larger node size and arranged on the microplate.

ノードサイズが大きい属性は、一般的に、機能等が詳細に調べられている遺伝子が属する属性に該当する。このため、複数の属性に関連付けられている遺伝子についても、ノードサイズが大きい方の属性の遺伝子群とともに実験が行われる可能性が高い。従って、複数の属性に関連付けられている遺伝子の属性を、ノードサイズが大きい方の属性として扱
うことで、同時に使用される可能性が高いsiRNAを集合させてマイクロプレートに配置することができる。これにより、同時に使用される可能性が高いsiRNAが多くのマイクロプレートに分散しないようにすることができ、サンプル管理や実験の能率を向上させることができる。
An attribute having a large node size generally corresponds to an attribute to which a gene whose function or the like has been examined in detail belongs. For this reason, there is a high possibility that an experiment will be performed on genes associated with a plurality of attributes together with a gene group having an attribute with a larger node size. Therefore, by treating the gene attributes associated with a plurality of attributes as attributes having a larger node size, siRNAs that are likely to be used simultaneously can be assembled and placed on the microplate. As a result, siRNA that is likely to be used simultaneously can be prevented from being dispersed in many microplates, and the efficiency of sample management and experiments can be improved.

また、実際の遺伝子については、すべての遺伝子について機能等が完全に解明されている訳ではない。遺伝子オントロジーにおける属性と遺伝子との対応付けにおいては、より詳細な機能が不明である場合、より上位の明らかな機能についての属性に遺伝子を対応付けている。例えば、ある遺伝子について、「Gene Ontology―molecular function−binding−nucleic acid binding−DNA binding」の継承関係がある「DNA binding」まで明らかになっているが、より詳細な機能が明らかでない場合、この遺伝子は「DNA binding」と
いう属性に対応付けられている。このように、より詳細な機能が不明である場合でも、明らかな機能についての属性に遺伝子を対応付けているため、ノードサイズが大きい順番での深さ優先探索により、この属性を継承する属性の遺伝子の次に、この遺伝子が整列させられる。このため、より詳細な機能が不明である遺伝子と、この遺伝子が対応付けられた属性を継承する属性の遺伝子とを実験対象とする場合、同じマイクロプレート上における近接した位置に各サンプルが配置されているため、サンプル管理や実験の能率を向上させることができる。
In addition, for actual genes, the functions and the like are not completely elucidated for all genes. In the association between the attribute and the gene in the gene ontology, when the more detailed function is unknown, the gene is associated with the attribute of the higher-level obvious function. For example, for a certain gene, “DNA binding”, which has the inheritance relationship of “Gene Ontology-molecular function-binding-nucleic acid binding-DNA binding”, has been clarified. Is associated with an attribute called “DNA binding”. In this way, even if a more detailed function is unknown, since the gene is associated with the attribute for the obvious function, the attribute inheriting this attribute by the depth-first search in the descending order of the node size. Next to the gene, this gene is aligned. For this reason, when a gene whose detailed function is unknown and a gene with an attribute that inherits the attribute associated with this gene is the subject of the experiment, each sample is placed at a close position on the same microplate. Therefore, the efficiency of sample management and experiments can be improved.

さらに、上記のように、実際の遺伝子については、すべての遺伝子について機能等が完全に解明されている訳ではないので、各遺伝子が属する属性が変更となる可能性がある。例えば、上記のように、ある遺伝子について、「Gene Ontology―molecular function−binding−nucleic acid binding−DNA binding」の継承関係がある「DNA binding」まで明らかになっているが、より詳細な機能が明らかでない場合、この遺伝子は「DNA binding
」という属性に対応付けられている。ここで、この遺伝子について、「DNA binding」と
いう属性を継承する「transcription activity」(「Gene Ontology―molecular function−binding−nucleic acid binding−DNA binding−transcription factor activity」)の機能が明らかになった場合、この遺伝子は、「transcription factor activity」とい
う属性に対応付けられる。このように、より詳細な機能が不明であるためにより上位の属性と対応付けられていた遺伝子の機能が、より詳細に解明されることにより、この遺伝子がより下位の属性に対応付けられるように変更される場合がある。
Furthermore, as described above, since the functions and the like of all genes are not completely elucidated as described above, the attribute to which each gene belongs may be changed. For example, as described above, it has been clarified up to "DNA binding" that has the inheritance relationship of "Gene Ontology-molecular function-binding-nucleic acid binding-DNA binding" for a certain gene. If not, this gene is "DNA binding
Is associated with the attribute "." Here, when the function of "transcription activity"("Gene Ontology-molecular function-binding-nucleic acid binding-DNA binding-transcription factor activity") that inherits the attribute "DNA binding" is revealed for this gene This gene is associated with the attribute “transcription factor activity”. In this way, since the function of the gene associated with the higher attribute because the more detailed function is unknown is elucidated in more detail, this gene can be associated with the lower attribute. May be changed.

本発明の方法で遺伝子を整列させる場合には、遺伝子が、より詳細な機能が不明であるためにより上位の属性と対応付けられていた場合、この上位の属性に対応する位置に整列させられる。そして、この遺伝子の機能が、より詳細に解明されることにより、この遺伝子がより下位の属性に対応付けられるように変更された場合、この遺伝子は、より下位の属性に対応する位置に整列させられる。   When aligning genes by the method of the present invention, if a gene is associated with a higher-order attribute because its detailed function is unknown, it is aligned at a position corresponding to this higher-order attribute. And if the function of this gene is elucidated in more detail so that this gene is modified to be associated with a lower attribute, this gene is aligned at a position corresponding to the lower attribute. It is done.

この遺伝子が新たに対応付けられた属性に対応するノードは、もともと対応付けられていた属性に対応するノードの下位ノードとなる。本発明の方法では、深さ優先探索を行い、あるノードに対応する属性の遺伝子とその下位ノードに対応する属性の遺伝子とをまとめて整列させるため、より詳細な機能が明らかになる前後のいずれでも、この遺伝子は、このまとまりの中に整列させられることとなる。このため、この遺伝子の機能が、より詳細に明らかになった場合も、もともと対応付けられていた属性に関するまとまりに含まれるため、この遺伝子に対応するサンプルが格納されるサンプルプレートやサンプルプレート上の配置が大きく変わることがない。また、より詳細な機能が明らかになっていない遺伝子については、機能が明らかになっている範囲で、同じ属性の遺伝子とまとめて整列させるため、この遺伝子に対応するサンプルを、機能が明らかになっている範囲で、同じ属性の遺伝子に対応するサンプルとまとめて配置したサンプルプレートを製造できる。   The node corresponding to the attribute with which this gene is newly associated becomes a lower node of the node corresponding to the attribute with which the gene was originally associated. In the method of the present invention, a depth-first search is performed, and the gene of the attribute corresponding to a certain node and the gene of the attribute corresponding to the lower node are collectively aligned. However, this gene will be aligned in this cluster. For this reason, even if the function of this gene becomes clear in more detail, it is included in the group related to the attribute that was originally associated, so the sample corresponding to this gene is stored on the sample plate or sample plate. The arrangement does not change significantly. In addition, for genes for which more detailed functions have not been clarified, in order to align the genes with the same attributes as long as the functions have been clarified, the functions of the samples corresponding to these genes will be clarified. Within a certain range, sample plates arranged together with samples corresponding to genes having the same attribute can be manufactured.

なお、遺伝子がより下位の属性に対応付けられた場合、変更後の遺伝子と属性との対応関係を用いて、遺伝子を再度整列させる。具体的には、変更後の遺伝子と属性との対応関係に関するデータにより遺伝子属性データ260を更新する。そして、この遺伝子属性データ260を用いて上述の処理を行うことにより、遺伝子を再度整列させる。そして、再度整列させた遺伝子に対応するsiRNAをそれぞれ対応するマイクロプレートの対応する各ウェルに格納する。これにより、遺伝子の機能等が新たに明らかになった場合に、その情報を反映させてsiRNAを整列させたサンプルプレートを製造できる。   When a gene is associated with a lower attribute, the genes are rearranged using the correspondence relationship between the changed gene and the attribute. Specifically, the gene attribute data 260 is updated with data relating to the correspondence relationship between the changed gene and attribute. Then, by performing the above-described processing using the gene attribute data 260, the genes are rearranged. And siRNA corresponding to the rearranged gene is stored in each corresponding well of the corresponding microplate. Thereby, when the function of a gene etc. becomes newly clear, the sample plate which arranged the siRNA reflecting that information can be manufactured.

なお、上記実施形態は、以下の態様に変更してもよい。
○ 上記実施形態では、サンプル群としてヒトの全遺伝子を対象とするsiRNAライブラリを想定したが、本発明はこれに限られるものではなく、特定の生物の全遺伝子を対象に作製された大規模なサンプル群について、本発明を用いることができる。例えば、ヒト・マウス等、特定の生物の全遺伝子を対象に作製されたsiRNAライブラリ、siRNA発現ベクターライブラリ、shRNA発現ベクターライブラリ、siRNA発現DNA断片ライブラリ、shRNA発現DNA断片ライブラリ、cDNAクローンライブラリ、遺伝子検出用PCRプライマー・プローブライブラリ等のような大規模なサンプル群について、同様にして整列させられた遺伝子に対応するサンプルをマイクロプレートに配置してもよい。
In addition, you may change the said embodiment into the following aspects.
In the above embodiment, the siRNA library targeting all human genes is assumed as a sample group. However, the present invention is not limited to this, and a large-scale sample prepared for all genes of a specific organism. The present invention can be used for sample groups. For example, siRNA library, siRNA expression vector library, shRNA expression vector library, siRNA expression DNA fragment library, shRNA expression DNA fragment library, cDNA clone library, gene detection prepared for all genes of specific organisms such as humans and mice For large-scale sample groups such as PCR primers and probe libraries, samples corresponding to genes arranged in the same manner may be placed on the microplate.

○ 上記実施形態では、96穴のマイクロプレートにサンプルを格納する場合について説明したが、マイクロプレートの穴数はこれに限られない。例えば、384穴のマイクロプレートについて、同様にしてサンプルを格納してもよい。この場合も、ノードサイズが大きい順番に深さ優先探索を行うことにより整列させた遺伝子に対応するサンプルを、1列ずつ順番にマイクロプレートに整列させる。   In the above embodiment, the case where a sample is stored in a 96-well microplate has been described, but the number of holes in the microplate is not limited thereto. For example, a sample may be stored in the same manner for a 384-hole microplate. Also in this case, the samples corresponding to the aligned genes are aligned on the microplate one column at a time by performing a depth-first search in the descending order of the node size.

○ 上記実施形態では、96穴のマイクロプレートについて、整列させたサンプルを縦に(8レーンずつ)並べて配置したが、整列させたサンプルを横に(12レーンずつ)並べて配置してもよい。これにより、12チャンネルのピペットを用いて、実験操作を効率よく行うことができる。   In the above embodiment, the aligned samples are arranged vertically (8 lanes) for the 96-well microplate, but the aligned samples may be arranged horizontally (12 lanes). Thereby, an experimental operation can be performed efficiently using a 12-channel pipette.

○ 上記実施形態では、探索したノードをスタックに記録して深さ優先探索を行ったが、ノードサイズが大きい順番に深さ優先探索を行うのであれば、探索のアルゴリズムは限定されない。例えば、次のノードへの移動を、再帰呼出しを用いて行うことにより、ノードサイズが大きい順番に深さ優先探索を行ってもよい。   In the above embodiment, the depth-first search is performed by recording the searched nodes on the stack. However, the search algorithm is not limited as long as the depth-first search is performed in the order of the node size. For example, a depth-first search may be performed in order of increasing node size by moving to the next node using recursive calls.

○ 上記実施形態では、ヒトの全遺伝子を対象として遺伝子の整列を行い、整列させられた遺伝子に対応するサンプルを格納したサンプルプレートを製造した。これに代えて、ヒト等の特定の生物の遺伝子のうち、特定の属性及びこの属性を継承する属性の遺伝子について遺伝子の整列を行い、整列させられた遺伝子に対応するサンプルを格納したサンプルプレートを製造してもよい。この場合、この特定の属性をルートノードとする非循環有向グラフについて、ノードサイズが大きい順番に深さ優先探索を行う。これにより、特定の属性の遺伝子を対象とする場合も、サンプル管理や実験操作の能率を向上させられるサンプルプレートを製造できる。また、ルートノードとする属性を、システムの利用者が指定するようにしてもよい。なお、このシステムの利用者は、サンプルプレートのユーザ、サンプルプレートの提供者のいずれであってもよい。   In the above embodiment, gene alignment was performed for all human genes, and a sample plate storing samples corresponding to the aligned genes was manufactured. Instead of this, a sample plate storing samples corresponding to the aligned genes is arranged for genes having specific attributes and genes that inherit these attributes among genes of specific organisms such as humans. It may be manufactured. In this case, a depth-first search is performed on the acyclic directed graph having the specific attribute as a root node in order of increasing node size. This makes it possible to manufacture a sample plate that can improve the efficiency of sample management and experimental operation even when a gene with a specific attribute is targeted. Also, the attribute of the root node may be specified by the system user. The user of this system may be either a sample plate user or a sample plate provider.

また、利用者により指定された属性について、この属性及びこの属性を継承する属性の遺伝子を整列させ、この整列情報を提供してもよい。これにより、特定の属性について、この属性及びこの属性を継承する属性の遺伝子の整列情報に基づいて、サンプルを配置することが可能となる。   In addition, for the attribute specified by the user, this attribute and the gene of the attribute that inherits this attribute may be aligned to provide this alignment information. This makes it possible to place a sample for a specific attribute based on the gene alignment information of this attribute and the attribute that inherits this attribute.

○ 上記実施形態では、未訪問の子ノードのノードサイズを比較する際に、その都度ノードサイズを算出したが、各ノードのノードサイズを初めに算出して記録しておき、これを用いて未訪問の子ノードのノードサイズを比較してもよい。   ○ In the above embodiment, when comparing the node size of unvisited child nodes, the node size was calculated each time. However, the node size of each node is calculated and recorded first, and this is used to determine the node size. The node sizes of the child nodes of the visit may be compared.

○ 上記実施形態では、遺伝子を整列させる際に、その都度マイクロプレート上での配置を決定したが、すべての遺伝子を整列させた後にマイクロプレート上での配置を決定してもよい。   In the above embodiment, when the genes are aligned, the arrangement on the microplate is determined each time. However, the arrangement on the microplate may be determined after all the genes are aligned.

○ 上記実施形態では、遺伝子が整列済の場合、この遺伝子を重複して整列させないようにした。これに代えて、整列済の遺伝子についても、重複して整列させてもよい。これにより、どの属性についても、対象とする属性及びこの属性を継承する属性の遺伝子に対応するサンプルをまとめてサンプルプレートに配置できる。   In the above embodiment, when the genes are already aligned, the genes are not overlapped. Alternatively, the aligned genes may be overlapped and aligned. As a result, for any attribute, samples corresponding to the target attribute and the gene of the attribute inheriting this attribute can be collectively placed on the sample plate.

また、ノードサイズが一定値以上の場合に、整列済の遺伝子についても重複して整列させるようにしてもよい。これにより、ノードサイズが一定値以上の、使用頻度がある程度高いと予測される属性、もしくは重要度がある程度高い属性については、この属性及びこの属性を継承する属性の遺伝子に対応するサンプルをまとめて配置できる。   Further, when the node size is equal to or larger than a certain value, the already arranged genes may be overlapped. As a result, for attributes that have a node size of a certain value or more and are expected to be used to a certain degree of high frequency, or have a high degree of importance, collect samples corresponding to this attribute and genes of attributes that inherit this attribute. Can be placed.

○ 上記実施形態では、ヒトの全遺伝子を標的とするsiRNAのサンプルをマイクロプレートに格納する場合を想定し、遺伝子オントロジーにおけるすべての属性を処理対象とした。これに代えて、対象とする属性を限定してもよい。この場合、例えば、このシステムの利用者により指定された属性に関するデータ(属性指定データ)を記録しておく。そして、上記のステップS8において、処理対象の属性が、この属性指定データで指定された属性又はこの属性を継承する属性である場合にのみ、整列データ270を記録する。この場合、全遺伝子を対象としてノードサイズに依存した深さ優先探索を行って遺伝子を整列させるとともに、利用者により指定された属性又はこの属性を継承する属性の遺伝子についてのみ、整列データ270を記録できる。   In the above embodiment, assuming that siRNA samples targeting all human genes are stored in a microplate, all attributes in the gene ontology are targeted for processing. Instead, the target attribute may be limited. In this case, for example, data related to the attribute specified by the user of this system (attribute specifying data) is recorded. In step S8, the alignment data 270 is recorded only when the attribute to be processed is an attribute designated by this attribute designation data or an attribute inheriting this attribute. In this case, a depth-first search depending on the node size is performed for all genes, and the genes are aligned, and the alignment data 270 is recorded only for genes specified by the user or inherited from the attributes. it can.

また、このシステムの利用者により指定された属性及びこの属性に対応する属性の下位ノードに対応する属性のいずれでもない属性について遺伝子数を「0」として取り扱ってもよい。この場合、利用者により指定された属性及びこの属性を継承する属性の遺伝子数のみを対象としてノードサイズを算出することとなる。従って、利用者により指定された属性及びこの属性を継承する属性の遺伝子を対象としてノードサイズに依存した深さ優先探索を行って、遺伝子を整列させることができる。   Further, the number of genes may be handled as “0” for an attribute specified by the user of this system and an attribute that is neither an attribute corresponding to a lower node of the attribute corresponding to this attribute. In this case, the node size is calculated only for the attribute designated by the user and the number of genes of the attribute inheriting this attribute. Accordingly, the genes can be aligned by performing a depth-first search depending on the node size for the gene specified by the user and the gene having the attribute that inherits the attribute.

このようにすることで、利用者により指定された特定の属性の遺伝子に対応するサンプルのみを整列させてサンプルプレートに格納することができる。従って、全遺伝子のうち、特に重要な遺伝子に対応するサンプルのみを整列させて格納したサンプルプレート群を製造できる。   By doing in this way, only the sample corresponding to the gene of the specific attribute designated by the user can be aligned and stored in the sample plate. Therefore, a sample plate group in which only samples corresponding to particularly important genes among all genes are arranged and stored can be manufactured.

○ 上記実施形態では、遺伝子を整列させる際に整列データ270を記録したが、これに加えて属性に関するデータを記録し、製造したサンプルプレートを検索する場合に用いてもよい。この場合、サンプルプレートの製造のために遺伝子を整列させる整列工程と、製造したサンプルプレートに格納されたサンプルを検索する検索工程とを含むシステム(サンプル整理システム)を構築してもよい。   In the above embodiment, the alignment data 270 is recorded when the genes are aligned. However, in addition to this, the data regarding attributes may be recorded and used to search the manufactured sample plate. In this case, a system (sample organizing system) including an alignment process for aligning genes for manufacturing a sample plate and a search process for searching for a sample stored in the manufactured sample plate may be constructed.

整列工程においては、上記実施形態のようにして遺伝子を整列させる。そして、整列させた遺伝子に対応するサンプルを格納したサンプルプレートを製造する。このとき、遺伝子を整列させる際に、順番、プレート番号、ウェル番号(縦),(横)、遺伝子名、サン
プル名及び属性に関するデータ(サンプル配置特定データ)を記録する。ここで、属性については、例えば、この遺伝子の属性とこの属性に対応するノードの上位ノードの属性とを記録する。
In the alignment step, the genes are aligned as in the above embodiment. And the sample plate which stored the sample corresponding to the arranged gene is manufactured. At this time, when the genes are aligned, data on order, plate number, well number (vertical), (horizontal), gene name, sample name, and attributes (sample arrangement specifying data) are recorded. Here, for the attribute, for example, the attribute of this gene and the attribute of the upper node of the node corresponding to this attribute are recorded.

そして、検索工程において、このシステムの利用者により入力された遺伝子名又は属性に基づいて、サンプル配置特定データを特定し、プレート番号及びウェル番号(縦),(横)を抽出することにより、プレート番号や、サンプルプレート上の配置を特定する。ここで、属性に基づいて検索を行う場合には、属性データ領域に検索対象の属性が記録されているサンプル配置特定データを特定する。そして、このようにして特定されたサンプル配置特定データのプレート番号及びウェル番号(縦),(横)を抽出することにより、プレート番号や、サンプルプレート上の配置を特定する。   In the search process, the sample arrangement specifying data is specified based on the gene name or attribute input by the user of this system, and the plate number and well number (vertical), (horizontal) are extracted, Identify the number and placement on the sample plate. Here, when the search is performed based on the attribute, the sample arrangement specifying data in which the attribute to be searched is recorded in the attribute data area is specified. Then, by extracting the plate number and well number (vertical) and (horizontal) of the sample arrangement specifying data specified in this way, the plate number and the arrangement on the sample plate are specified.

なお、整列工程において、整列させる遺伝子に対応するノードの属性のみを記録してもよい。この場合には、検索工程において属性に基づいて検索を行う場合、まず、遺伝子オントロジーデータ250を用いて、利用者により入力された検索対象の属性のノードの下位ノードを特定する。そして、検索対象の属性と、この属性のノードの下位ノードの属性とについて、サンプル配置特定データを特定する。   In the alignment step, only the attribute of the node corresponding to the gene to be aligned may be recorded. In this case, when performing a search based on an attribute in the search step, first, the gene ontology data 250 is used to specify a lower node of the node of the search target attribute input by the user. Then, the sample arrangement specifying data is specified for the search target attribute and the attribute of the lower node of the node of this attribute.

このようなサンプル整理システムの利用形態として、例えば、サンプルプレートのユーザが遺伝子名や属性を指定してサンプルプレートを注文し、これに応じてサンプルプレートを販売する場合を想定する。この場合、サンプル整理システムは、ユーザにより指定された遺伝子名や属性に基づいて、サンプル配置特定データを特定し、プレート番号を抽出する。サンプルプレートの提供者は、プレート番号により特定されたサンプルプレートをユーザに提供する。   As a usage form of such a sample arrangement system, for example, a case is assumed in which a user of a sample plate orders a sample plate by specifying a gene name and an attribute, and sells the sample plate accordingly. In this case, the sample arrangement system specifies the sample arrangement specifying data based on the gene name and attribute designated by the user, and extracts the plate number. The provider of the sample plate provides the user with the sample plate specified by the plate number.

また、サンプル整理システムは、サンプルプレートのユーザが使用するクライアント端末(ユーザ端末)とサーバ(サンプル整理サーバ)とをインターネットを介して接続可能に構成してもよい。この場合、ユーザ端末を用いて、ウェブページ上で、ユーザが遺伝子名や属性を入力して検索要求を行って、サンプル整理サーバからサンプルプレートのプレート番号及びウェル番号(縦),(横)を取得してもよい。この場合、ユーザ端末から送信された遺伝子名又は属性に基づいて、サンプル整理サーバがサンプル配置特定データを検索してプレート番号等を抽出し、プレート番号を表示するウェブページをユーザ端末に送信する。ユーザは、このプレート番号により、サンプルプレートの注文を行う。また、ユーザが購入済のサンプルプレートを保管している場合に、必要なサンプルについて、遺伝子名や属性を用いて、このサンプル整理システムにより、必要なサンプルが格納されたプレートのプレート番号や、サンプルプレート上の配置位置を検索可能にしてもよい。   In addition, the sample organization system may be configured such that a client terminal (user terminal) used by a user of the sample plate and a server (sample organization server) can be connected via the Internet. In this case, using the user terminal, on the web page, the user inputs a gene name or attribute and makes a search request, and the plate number and well number (vertical) and (horizontal) of the sample plate are obtained from the sample organizing server. You may get it. In this case, based on the gene name or attribute transmitted from the user terminal, the sample organizing server searches the sample arrangement specifying data, extracts the plate number and the like, and transmits a web page displaying the plate number to the user terminal. The user places an order for the sample plate using this plate number. In addition, when the user keeps the purchased sample plate, this sample organization system uses the gene name and attribute for the necessary sample, and the plate number of the plate where the necessary sample is stored, The arrangement position on the plate may be made searchable.

これにより、サンプルプレートの提供者やユーザは、遺伝子名又は属性を指定することにより、サンプルプレートのプレート番号や、サンプルプレート上の配置を容易に知ることができる。また、属性を指定すれば、その属性に対応するノード及びその下位ノードに対応する属性の遺伝子が格納されたサンプルプレートを特定できるため、指定された属性の遺伝子群(その属性の下位の属性の遺伝子群を含む)に対応するサンプルプレートを特定できる。   Thereby, the provider and user of the sample plate can easily know the plate number of the sample plate and the arrangement on the sample plate by designating the gene name or attribute. In addition, if an attribute is specified, a sample plate storing a node corresponding to the attribute and a gene of the attribute corresponding to the lower node can be specified. The sample plate corresponding to the gene group) can be identified.

○ 上記実施形態では、ステップS8において、記録済の遺伝子については整列データ270を記録しないことにより、遺伝子の重複を排除した。これに代えて、すべてのノードに対応する遺伝子を整列させた後に、遺伝子の重複の排除を行ってもよい。   In the above embodiment, gene duplication is eliminated in step S8 by not recording the alignment data 270 for the recorded genes. Alternatively, gene duplication may be eliminated after the genes corresponding to all nodes are aligned.

○ 上記実施形態では、非循環有向グラフの全体の各ノードに対応する遺伝子を順次整列させた。これに代えて、非循環有向グラフを分割して、分割された各非循環有向グラフ
について遺伝子の整列を行い、これを統合してもよい。具体的には、まず、対象とする非循環有向グラフを複数個に分割し、分割されたそれぞれの非循環有向グラフについて遺伝子の整列を行う。そして、全体の非循環有向グラフについて、最上位ノードのノードサイズが大きい順番に深さ優先探索を行い、探索された最上位ノードの順番に、先に整列させた遺伝子をまとめて整列させる。そして、すべてのノードに対応する遺伝子を整列させた後に遺伝子の重複を排除してもよい。
In the above embodiment, the genes corresponding to each node of the entire acyclic directed graph are sequentially arranged. Alternatively, the acyclic directed graph may be divided, the genes may be aligned for each of the divided acyclic directed graphs, and these may be integrated. Specifically, first, the target acyclic directed graph is divided into a plurality of segments, and genes are aligned for each of the divided acyclic directed graphs. Then, the depth-first search is performed on the entire acyclic directed graph in the order of the node size of the highest node, and the previously arranged genes are arranged together in the order of the searched highest node. Then, gene duplication may be eliminated after the genes corresponding to all nodes are aligned.

○ 上記実施形態では、非循環有向グラフの枝をノードサイズが大きい順番に特定し、この枝について深いノードから順番に連結順にノードを特定し、特定されたノードの属性の遺伝子を順次整列させることにより、遺伝子を整列させた。遺伝子の整列は、ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードの属性の遺伝子を順次整列させることにより行うのであれば、これに限られない。例えば、以下のようにして遺伝子を整列させてもよい。   ○ In the above embodiment, by specifying the branches of the acyclic directed graph in descending order of the node size, specifying the nodes in order of connection from the deepest node with respect to this branch, and sequentially arranging the genes of the attributes of the specified nodes The genes were aligned. The gene alignment is limited to this if the branch of the acyclic directed graph is specified according to the node size, the nodes of this branch are specified in the order of connection, and the genes of the attribute of the specified node are sequentially aligned. I can't. For example, the genes may be aligned as follows.

・ 非循環有向グラフの枝をノードサイズが小さい順番に特定し、この枝について浅いノードから順番に連結順にノードを特定し、特定されたノードの属性の遺伝子を順次整列させることにより、遺伝子を整列させてもよい。この処理手順を、上記実施形態の説明に使用した図6を用いて説明する。   ・ Specify the branches of the acyclic directed graph in ascending order of the node size, specify the nodes in order of connection from the shallowest node in this order, and align the genes of the attribute of the specified node in order, thereby aligning the genes. May be. This processing procedure will be described with reference to FIG. 6 used in the description of the above embodiment.

まず、ルートノードであるノードAの属性の遺伝子を整列させる。そして、このノードAの子ノードのうち、ノードサイズが最も小さいノードFを特定し、このノードFの属性の遺伝子を整列させる。このノードFには子ノードがないため、ノードAに戻り、遺伝子整列処理を行っていない子ノードのうち最もノードサイズが小さいノードGを特定する。そして、このノードGの属性の遺伝子を整列させる。次に、このノードGの子ノードのうち最もノードサイズが小さいノードIを特定し、このノードIの属性の遺伝子を整列させる。そして、ノードGに戻り、ノードGの子ノードのうち遺伝子整列処理を行っていないノードHの属性の遺伝子を整列させる。そして、ノードGに戻り、ノードGには遺伝子整列処理を行っていない子ノードがないため、ノードAに戻る。そして、ノードAの子ノードで遺伝子整列処理を行っていないノードBを特定し、このノードBの属性の遺伝子を整列させる。以下、同様にして処理を行う。   First, the attribute genes of the node A that is the root node are aligned. Then, the node F having the smallest node size among the child nodes of the node A is specified, and the gene having the attribute of the node F is aligned. Since this node F has no child nodes, the node G is returned to the node A, and the node G having the smallest node size among the child nodes that have not been subjected to the gene alignment process is specified. Then, the gene having the attribute of the node G is aligned. Next, the node I having the smallest node size among the child nodes of the node G is specified, and genes having the attribute of the node I are aligned. Then, returning to the node G, the genes having the attribute of the node H that is not subjected to the gene alignment process among the child nodes of the node G are aligned. Then, returning to the node G, the node G does not have any child nodes that have not been subjected to the gene alignment process, and therefore returns to the node A. Then, a node B that is not subjected to the gene alignment process among the child nodes of the node A is specified, and the gene having the attribute of the node B is aligned. Thereafter, processing is performed in the same manner.

すなわち、遺伝子整列処理を行っていない特定ノードについて、この特定ノードの属性の遺伝子を順次整列させる遺伝子整列処理と、この特定ノードに遺伝子整列処理が未処理の子ノードがある場合に、このうちノードサイズが最も小さい子ノードを次の処理対象として特定する処理と、この特定ノードに遺伝子整列処理が未処理の子ノードがない場合に、この特定ノードの親ノードに戻る処理とを含む探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより、遺伝子を整列させる。   That is, for a specific node that has not been subjected to gene alignment processing, the gene alignment processing for sequentially aligning the genes of the attribute of this specific node, and if this specific node has a child node that has not yet been subjected to gene alignment processing, of these nodes A search process including a process for specifying a child node having the smallest size as a next processing target and a process for returning to the parent node of the specific node when there is no child node for which gene alignment processing has not been performed in the specific node. The genes are aligned by starting with the root node as a specific node and repeating until all nodes have been subjected to gene alignment processing.

このようにしても、同様に、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを連続させてサンプルプレート上に配置できるように遺伝子を整列させることができる。また、同じ属性については、順番は逆になるが、結果的には、機能等がより詳細に調べられた遺伝子についてのサンプルから並べられることとなる。このため、上記実施形態による順番で遺伝子の整列を行った場合と同様の利便性を得ることができる。   Even in this case, similarly, it is possible to align genes so that samples corresponding to genes with the same attribute or samples corresponding to genes with the same attribute can be continuously arranged on the sample plate. . For the same attribute, the order is reversed, but as a result, they are arranged from samples of genes whose functions and the like have been examined in more detail. For this reason, the same convenience as when the genes are arranged in the order according to the above embodiment can be obtained.

さらに、この場合も、遺伝子の重複の排除を行ってもよい。例えば、遺伝子整列処理において、処理対象のノードの属性に属する遺伝子が整列済の場合、既に整列済の遺伝子を削除することによって、遺伝子の重複を排除する。上記の例の場合、ノードEの属性の遺伝子「a008」を整列させる際に、この遺伝子「a008」は、既にノードIの属性の
遺伝子として整列させられている。ここで、ノードIの属性の遺伝子として既に整列済の遺伝子「a008」のデータを削除して、ノードEの属性の遺伝子として遺伝子「a008」のデータを新たに記録する。
In this case, gene duplication may also be eliminated. For example, when genes belonging to the attribute of a node to be processed are already aligned in gene alignment processing, gene duplication is eliminated by deleting already aligned genes. In the case of the above example, when the gene “a008” having the attribute of the node E is aligned, the gene “a008” is already aligned as the gene having the attribute of the node I. Here, the data of the gene “a008” already arranged as the gene of the attribute of the node I is deleted, and the data of the gene “a008” is newly recorded as the gene of the attribute of the node E.

これにより、遺伝子の重複を排除できるとともに、使用される頻度がより多いと予測される属性、もしくは重要度が高い属性の方に、各遺伝子に対応するサンプルをまとめてサンプルプレート上に配置できる。   As a result, gene duplication can be eliminated, and samples corresponding to each gene can be placed together on the sample plate for attributes that are predicted to be used more frequently or have higher importance.

・ 非循環有向グラフの枝をノードサイズが大きい順番に特定し、この枝について浅いノードから順番に連結順にノードを特定し、特定されたノードの属性の遺伝子を順次整列させることにより、遺伝子を整列させてもよい。すなわち、遺伝子整列処理を行っていない特定ノードについて、この特定ノードの属性の遺伝子を順次整列させる遺伝子整列処理と、この特定ノードに遺伝子整列処理が未処理の子ノードがある場合に、このうちノードサイズが最も大きい子ノードを次の処理対象として特定する処理と、この特定ノードに遺伝子整列処理が未処理の子ノードがない場合に、この特定ノードの親ノードに戻る処理とを含む探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより、遺伝子を整列させる。   -Specify the branches of the acyclic directed graph in descending order of the node size, specify the nodes in order of connection from the shallowest node in this order, and align the genes of the specified node attributes in order, thereby aligning the genes. May be. That is, for a specific node that has not been subjected to gene alignment processing, the gene alignment processing for sequentially aligning the genes of the attribute of this specific node, and if this specific node has a child node that has not yet been subjected to gene alignment processing, of these nodes A search process including a process for specifying the child node having the largest size as the next processing target and a process for returning to the parent node of the specific node when there is no child node for which gene alignment processing has not been performed in the specific node. The genes are aligned by starting with the root node as a specific node and repeating until all nodes have been subjected to gene alignment processing.

このようにしても、同様に、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを連続させてサンプルプレート上に配置できるように遺伝子を整列させることができる。   Even in this case, similarly, it is possible to align genes so that samples corresponding to genes with the same attribute or samples corresponding to genes with the same attribute can be continuously arranged on the sample plate. .

さらに、この場合も、遺伝子の重複の排除を行ってもよい。例えば、整列済の遺伝子については、同じ遺伝子を重複して整列させないことで、遺伝子の重複の排除を行う。これにより、遺伝子の重複を排除できるとともに、使用される頻度がより多いと予測される属性、もしくは重要度が高い属性の方に、各遺伝子に対応するサンプルをまとめてサンプルプレート上に配置できる。   In this case, gene duplication may also be eliminated. For example, with respect to already arranged genes, gene duplication is eliminated by not arranging the same genes in duplicate. As a result, gene duplication can be eliminated, and samples corresponding to each gene can be placed together on the sample plate for attributes that are predicted to be used more frequently or have higher importance.

・ 非循環有向グラフの枝をノードサイズが小さい順番に特定し、この枝について深いノードから順番に連結順にノードを特定し、特定されたノードの属性の遺伝子を順次整列させることにより、遺伝子を整列させてもよい。すなわち、遺伝子を整列させる処理を、特定ノードに遺伝子整列処理が未処理の子ノードがある場合に、このうちノードサイズが最も小さい子ノードを次の処理対象として特定する処理と、特定ノードに遺伝子整列処理が未処理の子ノードがない場合に、この特定ノードの属性の遺伝子を順次整列させる遺伝子整列処理と、この特定ノードの親ノードを次の処理対象として特定する処理とを含むノードサイズ対応深さ優先探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより行う。   ・ Specify the branches of the acyclic directed graph in ascending order of the node size, specify the nodes in order of connection from the deepest node to this branch, and arrange the genes of the attribute of the specified node in order, thereby aligning the genes. May be. In other words, when there are child nodes that have not yet been subjected to gene alignment processing in a specific node, the processing for aligning genes is performed by specifying the child node having the smallest node size as the next processing target and the gene in the specific node. Node size support that includes gene alignment processing that sequentially aligns the genes of the attributes of this specific node and processing that specifies the parent node of this specific node as the next processing target when there are no unprocessed child nodes The depth-first search process is performed by starting with the root node as a specific node and repeating the gene alignment process for all nodes.

このようにしても、同様に、同じ属性の遺伝子に対応するサンプルや、同じ属性を継承する属性の遺伝子に対応するサンプルを連続させてサンプルプレート上に配置できるように遺伝子を整列させることができる。   Even in this case, similarly, it is possible to align genes so that samples corresponding to genes with the same attribute or samples corresponding to genes with the same attribute can be continuously arranged on the sample plate. .

さらに、この場合も、遺伝子の重複の排除を行ってもよい。例えば、遺伝子整列処理において、処理対象のノードの属性に属する遺伝子が整列済の場合、既に整列済の遺伝子を削除することによって、遺伝子の重複を排除する。これにより、遺伝子の重複を排除できるとともに、使用される頻度がより多いと予測される属性、もしくは重要度が高い属性の方に、各遺伝子に対応するサンプルをまとめてサンプルプレート上に配置できる。   In this case, gene duplication may also be eliminated. For example, when genes belonging to the attribute of a node to be processed are already aligned in gene alignment processing, gene duplication is eliminated by deleting already aligned genes. As a result, gene duplication can be eliminated, and samples corresponding to each gene can be placed together on the sample plate for attributes that are predicted to be used more frequently or have higher importance.

○ 上記実施形態では、マイクロプレートの各ウェルにサンプルを格納する場合を想定して説明したが、複数のサンプルを格納したサンプルセットを製造するのであれば、本発
明はこれに限られるものではない。例えば、サンプルセットは、サンプル容器としてのスライドガラス等の基板の各格納部にDNA等を結合させたマイクロアレイ(DNAチップ)等であってもよい。
In the above embodiment, the case where samples are stored in each well of the microplate has been described. However, the present invention is not limited to this as long as a sample set storing a plurality of samples is manufactured. . For example, the sample set may be a microarray (DNA chip) in which DNA or the like is bound to each storage part of a substrate such as a slide glass as a sample container.

○ 上記実施形態では、遺伝子オントロジーにおける属性間の継承関係が形成する非循環有向グラフを用いて遺伝子を整列させた。この整列方法は、遺伝子を整列させる場合に限らず、非循環有向グラフを形成するグループ群の各グループにそれぞれ属する対象物を整列させる場合に用いることができる。すなわち、上記実施形態における遺伝子を対象物とし属性をグループとして、上記実施形態と同様の整列方法を用いて対象物を整列させることができる。   In the above embodiment, genes are aligned using an acyclic directed graph formed by inheritance relationships between attributes in gene ontology. This alignment method can be used not only when aligning genes but also when aligning objects belonging to each group of groups that form a directed acyclic graph. That is, it is possible to align objects using the same alignment method as in the above embodiment with the genes in the above embodiment as objects and the attributes as groups.

すなわち、コンピュータを、対象物が属するグループをノードとする非循環有向グラフを用いて、ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全対象物の数を合計したノードサイズを算出するノードサイズ算出手段と、前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードのグループに属する対象物を順次整列させることにより対象物を整列させる整列手段として機能させることにより、コンピュータを用いて対象物を整列させる。   That is, the computer calculates, for each node, a node size obtained by summing up the number of all objects belonging to this node and all nodes below this node, using an acyclic directed graph with the group to which the object belongs as a node. According to the node size calculating means, the branch of the acyclic directed graph is identified according to the node size, the nodes of the branch are identified in the order of connection, and the objects belonging to the group of the identified nodes are sequentially aligned to align the objects. By functioning as the aligning means to be aligned, the objects are aligned using a computer.

ここで、整列手段は、例えば、非循環有向グラフの枝をノードサイズが大きい順番に特定し、この枝について深いノードから順番に連結順にノードを特定し、特定されたノードのグループに属する対象物を順次整列させることにより、対象物を整列させる。これにより、より重要度が高いと予想される方から順番にグループ毎に対象物を整列させることができる。また、上記の場合と同様にして、対象物の重複を排除してもよい。   Here, the alignment means, for example, identifies the branches of the acyclic directed graph in order from the largest node size, identifies the nodes in order of connection from the deepest node with respect to this branch, and identifies objects belonging to the identified group of nodes. The objects are aligned by sequentially aligning them. Thereby, it is possible to align the objects for each group in order from the one that is expected to be more important. Moreover, you may exclude duplication of a target object similarly to said case.

例えば、対象物をファイルとしグループをフォルダ(又はディレクトリ)として、この方法で対象物(ファイル)を整列させる。また、個人名とこの個人が属する組織とを登録するアドレス帳において、対象物を個人名としグループを組織として、この方法で対象物(個人名)を整列させる。また、個人が複数の組織に属する場合には、上記の場合と同様にして、重複を排除してもよい。   For example, the objects (files) are arranged in this manner, with the object as a file and the group as a folder (or directory). Further, in the address book for registering the individual name and the organization to which the individual belongs, the object (individual name) is aligned by this method with the object as the individual name and the group as the organization. When an individual belongs to a plurality of organizations, duplication may be eliminated in the same manner as described above.

本発明の一実施形態のシステムの概略図。1 is a schematic diagram of a system according to an embodiment of the present invention. 遺伝子オントロジーデータ記憶部に記憶されたデータの説明図。Explanatory drawing of the data memorize | stored in the gene ontology data storage part. 遺伝子属性データ記憶部に記憶されたデータの説明図。Explanatory drawing of the data memorize | stored in the gene attribute data storage part. 整列データ記憶部に記憶されたデータの説明図。Explanatory drawing of the data memorize | stored in the alignment data storage part. 本発明の一実施形態の処理手順の説明図。Explanatory drawing of the process sequence of one Embodiment of this invention. ノードサイズ対応深さ優先探索処理による整列の説明図。Explanatory drawing of the alignment by the depth priority search process corresponding to a node size. マイクロプレート上のサンプルの配置の説明図。Explanatory drawing of arrangement | positioning of the sample on a microplate. 遺伝子オントロジーにおける属性間の継承関係の説明図。Explanatory drawing of the inheritance relationship between attributes in gene ontology.

符号の説明Explanation of symbols

20…遺伝子整列装置、21…制御コンピュータ、25…遺伝子オントロジーデータ記憶部、26…遺伝子属性データ記憶部、30…サンプル容器としてのマイクロプレート、31…格納部としてのウェル。   DESCRIPTION OF SYMBOLS 20 ... Gene alignment apparatus, 21 ... Control computer, 25 ... Gene ontology data storage part, 26 ... Gene attribute data storage part, 30 ... Microplate as a sample container, 31 ... Well as storage part.

Claims (12)

遺伝子群に対応するサンプル群を対象とし、各遺伝子に対応するサンプルを複数の格納部を備えたサンプル容器に格納したサンプルセットを製造する方法であって、
遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、
ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出し、
前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる整列処理を行い、
前記整列させられた遺伝子に対応するサンプルを前記サンプル容器の各格納部に格納してサンプルセットを製造することを特徴とするサンプルセット製造方法。
A method for producing a sample set in which a sample group corresponding to a gene group is targeted and a sample corresponding to each gene is stored in a sample container having a plurality of storage units,
Using an acyclic directed graph with gene attributes as nodes in gene ontology,
For each node, calculate the node size by summing the number of all genes belonging to this node and all nodes below this node,
Identify the branch of the acyclic directed graph according to the node size, identify the nodes of this branch in the order of connection, perform an alignment process to align the genes by sequentially aligning the genes belonging to the identified nodes ,
A sample set manufacturing method, wherein a sample set is manufactured by storing a sample corresponding to the aligned gene in each storage part of the sample container.
前記整列処理は、
特定ノードに、遺伝子が整列されていない未処理の子ノードがある場合に、この中からノードサイズに従って次の処理対象の子ノードを特定する子ノード探索処理と、
特定ノードに、遺伝子が整列されていない未処理の子ノードがない場合に、この特定ノードに属する遺伝子を順次整列させる遺伝子整列処理と、この特定ノードの親ノードを次の処理対象として特定する親ノード特定処理と
を含むノードサイズ対応深さ優先探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより遺伝子を整列させることを特徴とする請求項1に記載のサンプルセット製造方法。
The alignment process includes:
When there is an unprocessed child node in which genes are not arranged in the specific node, a child node search process for specifying the next child node to be processed according to the node size from among these,
If there is no unprocessed child node in which a gene is not arranged in a specific node, a gene alignment process for sequentially arranging genes belonging to this specific node, and a parent that specifies the parent node of this specific node as the next processing target 2. The gene alignment is performed by repeating a node size-corresponding depth priority search process including a node identification process, starting with a root node as a specific node and performing a gene alignment process for all nodes. The sample set manufacturing method as described in 2.
前記整列処理において、同じ遺伝子の重複を排除することを特徴とする請求項1又は2に記載のサンプルセット製造方法。   The sample set manufacturing method according to claim 1, wherein duplication of the same gene is excluded in the alignment process. 前記サンプル群は、siRNAライブラリ、siRNA発現ベクターライブラリ、shRNA発現ベクターライブラリ、siRNA発現DNA断片ライブラリ、shRNA発現DNA断片ライブラリ、cDNAクローンライブラリ、遺伝子検出用PCRプライマー・プローブライブラリのいずれか1つであることを特徴とする請求項1〜3のいずれか1つに記載のサンプルセット製造方法。   The sample group is any one of siRNA library, siRNA expression vector library, shRNA expression vector library, siRNA expression DNA fragment library, shRNA expression DNA fragment library, cDNA clone library, and PCR primer / probe library for gene detection. The sample set manufacturing method according to any one of claims 1 to 3. コンピュータを用いて遺伝子を整列させる遺伝子整列プログラムであって、
前記コンピュータを、
遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、
ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出するノードサイズ算出手段と、
前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる整列手段
として機能させるための遺伝子整列プログラム。
A gene alignment program for aligning genes using a computer,
The computer,
Using an acyclic directed graph with gene attributes as nodes in gene ontology,
For each node, a node size calculating means for calculating a node size that is the sum of the number of all genes belonging to this node and all nodes under this node;
Gene alignment for specifying the branch of the acyclic directed graph according to the node size, specifying the nodes of the branch in the order of connection, and sequentially arranging the genes belonging to the specified node to function as an alignment means for aligning the genes program.
遺伝子群に対応するサンプル群を対象とし、各遺伝子に対応するサンプルを複数の格納部を備えたサンプル容器に格納したサンプルセットを製造するために、コンピュータを用いて遺伝子を整列させる遺伝子整列プログラムであって、
前記コンピュータを、
遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、
ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出するノードサイズ算出手段と、
前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝について深いノードから順番にノードを特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる整列手段と、
前記整列させられた遺伝子を前記サンプル容器の各格納部に対応させて配置する配置手段
として機能させるための遺伝子整列プログラム。
A gene alignment program that uses a computer to align genes in order to produce a sample set in which a sample group corresponding to a gene group is stored and a sample corresponding to each gene is stored in a sample container having a plurality of storage units. There,
The computer,
Using an acyclic directed graph with gene attributes as nodes in gene ontology,
For each node, a node size calculating means for calculating a node size that is the sum of the number of all genes belonging to this node and all nodes under this node;
An alignment means for specifying a branch of the acyclic directed graph according to the node size, specifying a node in order from a deep node with respect to the branch, and aligning genes by sequentially aligning genes belonging to the specified node ;
The gene alignment program for functioning as an arrangement | positioning means to arrange | position the said aligned gene corresponding to each storage part of the said sample container.
前記整列手段を、
特定ノードに、遺伝子が整列されていない未処理の子ノードがある場合に、この中からノードサイズに従って次の処理対象の子ノードを特定する子ノード探索処理と、
特定ノードに、遺伝子が整列されていない未処理の子ノードがない場合に、この特定ノードに属する遺伝子を順次整列させる遺伝子整列処理と、この特定ノードの親ノードを次の処理対象として特定する親ノード特定処理と
を含むノードサイズ対応深さ優先探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより遺伝子を整列させる手段として機能させることを特徴とする請求項5又は6に記載の遺伝子整列プログラム。
The alignment means;
When there is an unprocessed child node in which genes are not arranged in the specific node, a child node search process for specifying the next child node to be processed according to the node size from among these,
If there is no unprocessed child node in which a gene is not arranged in a specific node, a gene alignment process for sequentially arranging genes belonging to this specific node, and a parent that specifies the parent node of this specific node as the next processing target A node size-corresponding depth-first search process including a node specifying process is started as a specified node, and is repeated until a gene aligning process is performed for all nodes, thereby functioning as a means for aligning genes. The gene alignment program according to claim 5 or 6.
前記整列手段を、さらに、同じ遺伝子の重複を排除する手段として機能させることを特徴とする請求項5〜7のいずれか1つに記載の遺伝子整列プログラム。   The gene alignment program according to any one of claims 5 to 7, wherein the alignment means further functions as means for eliminating duplication of the same gene. 遺伝子群に対応するサンプル群を対象とし、各遺伝子に対応するサンプルを複数の格納部を備えたサンプル容器に格納したサンプルセットであって、
遺伝子オントロジーにおける遺伝子の属性をノードとする非循環有向グラフを用いて、
ノード毎に、このノード及びこのノードの下層にあるすべてのノードに属する全遺伝子の数を合計したノードサイズを算出し、
前記ノードサイズに従って前記非循環有向グラフの枝を特定し、この枝のノードを連結順に特定し、特定されたノードに属する遺伝子を順次整列させることにより遺伝子を整列させる整列処理を行い、
前記整列させられた遺伝子に対応するサンプルを前記サンプル容器の各格納部に格納してサンプルセットを製造することにより製造されたサンプルセット。
A sample set for a sample group corresponding to a gene group, in which a sample corresponding to each gene is stored in a sample container having a plurality of storage units,
Using an acyclic directed graph with gene attributes as nodes in gene ontology,
For each node, calculate the node size by summing the number of all genes belonging to this node and all nodes below this node,
Identify the branch of the acyclic directed graph according to the node size, identify the nodes of this branch in the order of connection, perform an alignment process to align the genes by sequentially aligning the genes belonging to the identified nodes ,
A sample set manufactured by storing a sample corresponding to the aligned gene in each storage part of the sample container to manufacture a sample set.
前記整列処理は、
特定ノードに、遺伝子が整列されていない未処理の子ノードがある場合に、この中からノードサイズに従って次の処理対象の子ノードを特定する子ノード探索処理と、
特定ノードに、遺伝子が整列されていない未処理の子ノードがない場合に、この特定ノードに属する遺伝子を順次整列させる遺伝子整列処理と、この特定ノードの親ノードを次の処理対象として特定する親ノード特定処理と
を含むノードサイズ対応深さ優先探索処理を、ルートノードを特定ノードとして開始し、すべてのノードについて遺伝子整列処理を行うまで繰り返すことにより遺伝子を整列させることを特徴とする請求項9に記載のサンプルセット。
The alignment process includes:
When there is an unprocessed child node in which genes are not arranged in the specific node, a child node search process for specifying the next child node to be processed according to the node size from among these,
If there is no unprocessed child node in which a gene is not arranged in a specific node, a gene alignment process for sequentially arranging genes belonging to this specific node, and a parent that specifies the parent node of this specific node as the next processing target 10. The node size-corresponding depth-first search process including a node specifying process is started with a root node as a specified node, and the genes are aligned by repeating until the gene alignment process is performed for all nodes. Sample set as described in.
前記整列処理において、同じ遺伝子の重複を排除することを特徴とする請求項9又は10に記載のサンプルセット。   The sample set according to claim 9 or 10, wherein duplication of the same gene is excluded in the alignment process. 前記サンプル群は、siRNAライブラリ、siRNA発現ベクターライブラリ、shRNA発現ベクターライブラリ、siRNA発現DNA断片ライブラリ、shRNA発現DNA断片ライブラリ、cDNAクローンライブラリ、遺伝子検出用PCRプライマー・プローブライブラリのいずれか1つであることを特徴とする請求項9〜11のいずれか1つに記載のサンプルセット The sample group is any one of siRNA library, siRNA expression vector library, shRNA expression vector library, siRNA expression DNA fragment library, shRNA expression DNA fragment library, cDNA clone library, and PCR primer / probe library for gene detection. The sample set according to any one of claims 9 to 11 .
JP2004372059A 2004-12-22 2004-12-22 Sample set manufacturing method, gene alignment program, and sample set Expired - Fee Related JP4638726B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004372059A JP4638726B2 (en) 2004-12-22 2004-12-22 Sample set manufacturing method, gene alignment program, and sample set

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004372059A JP4638726B2 (en) 2004-12-22 2004-12-22 Sample set manufacturing method, gene alignment program, and sample set

Publications (2)

Publication Number Publication Date
JP2006174774A JP2006174774A (en) 2006-07-06
JP4638726B2 true JP4638726B2 (en) 2011-02-23

Family

ID=36729432

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004372059A Expired - Fee Related JP4638726B2 (en) 2004-12-22 2004-12-22 Sample set manufacturing method, gene alignment program, and sample set

Country Status (1)

Country Link
JP (1) JP4638726B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293191A (en) * 1999-04-02 2000-10-20 Canon Inc Device and method for voice recognition and generating method of tree structured dictionary used in the recognition method
JP2003509776A (en) * 1999-09-14 2003-03-11 エラジェン バイオサイエンシズ インコーポレイテッド Graphical user interface for displaying and analyzing biological sequence data
JP2004510256A (en) * 2000-09-29 2004-04-02 キヤノン株式会社 Database annotation and search

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7584240B2 (en) * 2001-11-07 2009-09-01 Genvault Corporation Automated biological sample archive for storage, retrieval and analysis of large numbers of samples for remote clients

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293191A (en) * 1999-04-02 2000-10-20 Canon Inc Device and method for voice recognition and generating method of tree structured dictionary used in the recognition method
JP2003509776A (en) * 1999-09-14 2003-03-11 エラジェン バイオサイエンシズ インコーポレイテッド Graphical user interface for displaying and analyzing biological sequence data
JP2004510256A (en) * 2000-09-29 2004-04-02 キヤノン株式会社 Database annotation and search

Also Published As

Publication number Publication date
JP2006174774A (en) 2006-07-06

Similar Documents

Publication Publication Date Title
Oughtred et al. The BioGRID interaction database: 2019 update
You et al. GOLabeler: improving sequence-based large-scale protein function prediction by learning to rank
Kopylova et al. SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data
Safran et al. GeneCards Version 3: the human gene integrator
Alves et al. Gene association analysis: a survey of frequent pattern mining from gene expression data
Tian et al. SAGA: a subgraph matching tool for biological graphs
Turner et al. iRefWeb: interactive analysis of consolidated protein interaction data and their supporting evidence
Dufayard et al. Tree pattern matching in phylogenetic trees: automatic search for orthologs or paralogs in homologous gene sequence databases
Schug Using TESS to predict transcription factor binding sites in DNA sequence
Blankenberg et al. Galaxy: a web‐based genome analysis tool for experimentalists
Schmitt et al. SeqXML and OrthoXML: standards for sequence and orthology information
Korhonen et al. Fast motif matching revisited: high-order PWMs, SNPs and indels
JP2009520278A (en) Systems and methods for scientific information knowledge management
Arendsee et al. phylostratr: A framework for phylostratigraphy
Kucherov Evolution of biosequence search algorithms: a brief survey
Masoudi-Nejad et al. RETRACTED ARTICLE: Candidate gene prioritization
Jou et al. The ENCODE portal as an epigenomics resource
Petrillo et al. JRC GMO-Amplicons: a collection of nucleic acid sequences related to genetically modified organisms
Cannataro et al. Data management of protein interaction networks
Kong et al. GAAP: a genome assembly+ annotation pipeline
Korab-Laskowska et al. The organelle genome database project (GOBASE)
Saripella et al. Benchmarking the next generation of homology inference tools
Tatusova Update on genomic databases and resources at the national center for biotechnology information
Nunez Villavicencio-Diaz et al. Bioinformatics tools for the functional interpretation of quantitative proteomics results
Satoh et al. Further development of a reaction generator in the SOPHIA system for organic reaction prediction. Knowledge-guided addition of suitable atoms and/or atomic groups to product skeleton

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101102

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4638726

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees