JP4819382B2 - Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program - Google Patents

Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program Download PDF

Info

Publication number
JP4819382B2
JP4819382B2 JP2005083677A JP2005083677A JP4819382B2 JP 4819382 B2 JP4819382 B2 JP 4819382B2 JP 2005083677 A JP2005083677 A JP 2005083677A JP 2005083677 A JP2005083677 A JP 2005083677A JP 4819382 B2 JP4819382 B2 JP 4819382B2
Authority
JP
Japan
Prior art keywords
gene
expression
simultaneous
coefficient
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005083677A
Other languages
Japanese (ja)
Other versions
JP2006268268A (en
Inventor
重之 三井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Space Software Co Ltd
Original Assignee
Mitsubishi Space Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Space Software Co Ltd filed Critical Mitsubishi Space Software Co Ltd
Priority to JP2005083677A priority Critical patent/JP4819382B2/en
Publication of JP2006268268A publication Critical patent/JP2006268268A/en
Application granted granted Critical
Publication of JP4819382B2 publication Critical patent/JP4819382B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、遺伝子の発現相互作用を推定するバイオインフォマティクスにおける発現速度式生成装置、発現速度式生成方法および発現速度式生成プログラムに関するものである。   The present invention relates to an expression rate expression generation device, an expression rate expression generation method, and an expression rate expression generation program in bioinformatics for estimating gene expression interaction.

遺伝子間での各遺伝子の発現相互作用の解明が期待されおり、その推定方法の一つにS−Systemモデルを適用する方法がある。S−Systemモデルを適用した方法では、与えられた観測データ(タイムコースデータ)を再現するために遺伝子の発現速度を表す式を遺伝子の生成速度を示す項と分解速度を示す項とで表す(非特許文献1)。
松原謙一、榊佳之監修「ゲノム情報生物学」中山書店,2001年7月10日,pp.165−188
Elucidation of the expression interaction of each gene between genes is expected, and one of the estimation methods is a method of applying an S-System model. In the method to which the S-System model is applied, in order to reproduce given observation data (time course data), an expression indicating a gene expression rate is expressed by a term indicating a gene generation rate and a term indicating a decomposition rate ( Non-patent document 1).
Kenichi Matsubara and Yoshiyuki Tsuji, “Genome Information Biology”, Nakayama Shoten, July 10, 2001, pp. 165-188

S−Systemモデルによる遺伝子発現相互作用推定方法では、分解系及び生成系の両方が同時に動作することに伴い、莫大な計算を必要とする。また、遺伝子発現相互作用の推定を行うために推定対象である全ての遺伝子に対するタイムコースデータを必要とする。   The gene expression interaction estimation method based on the S-System model requires enormous calculation as both the decomposition system and the generation system operate simultaneously. In addition, in order to estimate the gene expression interaction, time course data for all genes to be estimated is required.

本発明は、上記の課題を解決するためになされたもので、遺伝子間の発現相互作用の推定を目的とする。   The present invention has been made to solve the above-described problems, and an object thereof is to estimate expression interaction between genes.

本発明の発現速度式生成装置は、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶する分解系係数算出部と、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて第1の遺伝子に対する生成系係数を算出して記憶部に記憶する生成系係数算出部とを備えることを特徴とする。   The expression rate expression generation apparatus of the present invention is configured to determine a gene involved in the degradation of the first gene based on the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene. Under the condition that only the first gene is used, a degradation system coefficient calculation unit that calculates a degradation system coefficient for the first gene and stores it in the storage unit, and expression of each gene in the non-destructive strain for the first gene And a generation system coefficient calculation unit that calculates a generation system coefficient for the first gene based on non-destructive strain time course data that is the amount of data observed, and stores the generation system coefficient in a storage unit.

また、前記分解系係数算出部は、前記発現速度式により発現相互作用を表す対象の遺伝子の数に対して前記破壊株タイムコースデータのデータ量が不足している場合に、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出することを特徴とする。   In addition, the degradation system coefficient calculation unit, when the data amount of the disrupted strain time course data is insufficient with respect to the number of genes of interest expressing the expression interaction by the expression rate formula, The degradation system coefficient for the first gene is calculated under the condition that only the first gene is involved in the degradation.

本発明の発現速度式生成装置は、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて第1の遺伝子に対する分解系係数を算出して記憶部に記憶する分解系係数算出部と、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶する生成系係数算出部とを備えることを特徴とする。   The expression rate expression generating apparatus of the present invention calculates a degradation system coefficient for the first gene based on the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene. Based on non-destructive strain time course data, which is data obtained by observing the expression level of each gene for the non-destructive strain for the first gene, and for the generation of the first gene A generation system coefficient calculation unit that calculates a generation system coefficient for the first gene and stores the generation system coefficient in a storage unit under a condition that limits the number of genes involved to a specific number or less.

また、前記生成系係数算出部は、前記発現速度式により発現相互作用を表す対象の遺伝子の数に対して前記非破壊株タイムコースデータのデータ量が不足している場合に、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出することを特徴とする。   In addition, the generation system coefficient calculation unit is configured to output the first gene when the data amount of the non-destructive strain time course data is insufficient with respect to the number of target genes representing the expression interaction by the expression rate equation. A generation system coefficient for the first gene is calculated under a condition that limits the number of genes involved in the generation of the gene to a specific number or less.

本発明の発現速度式生成装置は、第1の遺伝子の破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶する分解系係数算出部と、第1の遺伝子の非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶する生成系係数算出部とを備えることを特徴とする。   The expression rate expression generation device of the present invention determines the genes involved in the degradation of the first gene based on the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain of the first gene. Under the condition that only one gene is used, a degradation system coefficient calculation unit that calculates a degradation system coefficient for the first gene and stores it in the storage unit, and an expression level of each gene for a non-destructive strain of the first gene Based on the nondestructive strain time course data, which is the observed data, the generation system coefficient for the first gene is calculated under the condition that the number of genes involved in the generation of the first gene is limited to a specific number or less. And a generation system coefficient calculation unit stored in the storage unit.

また、前記分解系係数算出部は、前記発現速度式により発現相互作用を表す対象の遺伝子の数に対して前記破壊株タイムコースデータのデータ量が不足している場合に、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出し、前記生成系係数算出部は、前記発現速度式により発現相互作用を表す対象の遺伝子の数に対して前記非破壊株タイムコースデータのデータ量が不足している場合に、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出することを特徴とする。   In addition, the degradation system coefficient calculation unit, when the data amount of the disrupted strain time course data is insufficient with respect to the number of genes of interest expressing the expression interaction by the expression rate formula, Under the condition that the gene involved in degradation is only the first gene, a degradation system coefficient for the first gene is calculated, and the generation system coefficient calculation unit is a target for expressing the expression interaction by the expression rate equation. When the data amount of the non-destructive strain time course data is insufficient with respect to the number of genes, the first is under the condition that the number of genes involved in the generation of the first gene is limited to a specific number or less. It is characterized in that a production system coefficient for the gene of is calculated.

さらに、前記発現速度式生成装置は、破壊株タイムコースデータと非破壊株タイムコースデータとを入力し、破壊株タイムコースデータの示す各タイムコース値の対数値についてスプライン補間計算して求めた関数に対する第1の微係数を算出して記憶部に記憶し、非破壊株タイムコースの示す各タイムコース値の対数値についてスプライン補間計算して求めた関数に対する第2の微係数を算出して記憶部に記憶する前処理部を備え、前記分解系係数算出部は、前記前処理部が破壊株タイムコースデータに基づいて算出した第1の微係数を記憶部から取得し、取得した第1の微係数に基づいて第1の遺伝子に対する分解系係数を算出し、前記生成系係数算出部は、前記前処理部が非破壊株タイムコースデータに基づいて算出した第2の微係数を記憶部から取得し、取得した第2の微係数に基づいて第1の遺伝子に対する生成系係数を算出することを特徴とする。   Further, the expression rate expression generation device inputs the destroyed strain time course data and the non-destructive strain time course data, and calculates the spline interpolation calculation for the logarithmic value of each time course value indicated by the destroyed strain time course data. The first derivative is calculated and stored in the storage unit, and the second derivative is calculated and stored for the function obtained by the spline interpolation calculation for the logarithmic value of each time course value indicated by the non-destructive stock time course. The decomposition system coefficient calculation unit acquires the first differential coefficient calculated by the preprocessing unit based on the destroyed stock time course data from the storage unit, and acquires the first A decomposition system coefficient for the first gene is calculated based on the derivative, and the generation system coefficient calculation unit is configured to calculate the second derivative coefficient calculated by the preprocessing unit based on non-destructive strain time course data. Acquired from the storage unit, and calculates a production system coefficients for the first gene based on the obtained second derivative.

また、前記発現速度式生成装置は、前記発現速度式で発現相互作用を表す対象の遺伝子の数をnとし、前記第1の遺伝子に対応するi番目遺伝子(1≦i≦n)の発現量をXとし、i番目遺伝子の生成系係数であり生成速度を示す項に乗じる係数をα、i番目遺伝子の生成形係数でありi番目遺伝子の生成に対するj番目遺伝子(1≦j≦n)の相互作用係数をgijとし、i番目遺伝子の分解系係数であり分解速度を示す項に乗じる係数をβ、i番目遺伝子の分解系係数でありi番目遺伝子の分解に対するj番目遺伝子の相互作用係数をhijとした場合に次式で示される前記発現速度式について、i番目の遺伝子の生成系係数α及びgijとi番目遺伝子の分解系係数β及びhijとを算出することを特徴とする。 In addition, the expression rate expression generation device uses n as the number of target genes that express the expression interaction in the expression rate expression, and the expression level of the i-th gene (1 ≦ i ≦ n) corresponding to the first gene Is the i-th gene production system coefficient and the coefficient to be multiplied by the term indicating the production rate is α i , the i-th gene production form coefficient and the j-th gene for the generation of the i-th gene (1 ≦ j ≦ n) ) Is the decomposition coefficient of the i-th gene and the coefficient to be multiplied by the term indicating the decomposition rate is β i , the decomposition system coefficient of the i-th gene and the j-th gene When the interaction coefficient is h ij , the generation system coefficients α i and g ij of the i th gene and the degradation system coefficients β i and h ij of the i th gene are calculated with respect to the expression rate expression expressed by the following formula: It is characterized by doing.

Figure 0004819382
Figure 0004819382

さらに、前記発現速度式生成装置は、前記分解系係数算出部が算出した第1の遺伝子に対する分解系係数と前記生成系係数算出部が算出した第1の遺伝子に対する生成系係数とを入力し、入力した第1の遺伝子に対する分解系係数と生成系係数とを使用して前記発現速度式を生成し、生成した前記発現速度式に基づいて第1の遺伝子の発現量を算出し、前記生成系係数算出部が算出した第1の遺伝子に対する生成系係数についての評価結果を前記非破壊株タイムコースデータの示す第1の遺伝子の発現量と算出した第1の遺伝子の発現量との比較結果に基づいて出力する第1の評価部を備えることを特徴とする。   Furthermore, the expression rate equation generation device inputs a decomposition system coefficient for the first gene calculated by the decomposition system coefficient calculation unit and a generation system coefficient for the first gene calculated by the generation system coefficient calculation unit, The expression rate equation is generated using the degradation system coefficient and the generation system coefficient for the input first gene, the expression level of the first gene is calculated based on the generated expression rate equation, and the generation system The evaluation result of the production system coefficient for the first gene calculated by the coefficient calculation unit is the comparison result between the expression level of the first gene indicated by the non-destructive strain time course data and the calculated expression level of the first gene. A first evaluation unit that outputs based on the first evaluation unit is provided.

さらに、前記発現速度式生成装置は、第1の遺伝子の生成に関与する遺伝子についての評価を行う第2の評価部を備え、前記生成系係数算出部は、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定して遺伝子の組を生成し、第1の遺伝子に対する生成系係数を各遺伝子の組毎に算出し、前記第1の評価部は、前記生成系係数算出部が算出した各遺伝子の組に対応する各生成系係数毎に評価結果として評価値を算出し、前記第2の評価部は、前記第1の評価部が算出した各評価値を対応する各遺伝子の組に含まれる各遺伝子毎に合計し、各遺伝子に対する合計値に基づいて第1の遺伝子の生成に関与する遺伝子についての評価結果を出力することを特徴とする。   Further, the expression rate expression generation device includes a second evaluation unit that evaluates a gene involved in the generation of the first gene, and the generation system coefficient calculation unit is involved in the generation of the first gene. Gene sets are generated by limiting the number of genes to a specific number or less, a generation coefficient for the first gene is calculated for each gene set, and the first evaluation unit is the generation system coefficient calculation unit An evaluation value is calculated as an evaluation result for each generative coefficient corresponding to each gene set calculated by the first evaluation unit, and the second evaluation unit corresponds to each gene corresponding to each evaluation value calculated by the first evaluation unit. And the evaluation result for the gene involved in the generation of the first gene is output based on the total value for each gene.

さらに、前記発現速度式生成装置は、複数の遺伝子について、各遺伝子の発現速度を表す各発現速度式を連立して各遺伝子の発現量を算出し、算出した各遺伝子の発現量に基づいて各発現速度式で使用した生成系係数を評価する連立評価部を備え、前記分解系係数算出部は各遺伝子の破壊株についての各破壊株タイムコースデータを入力して各遺伝子に対する分解系係数を算出し、前記生成系係数算出部は各遺伝子の非破壊株についての各非破壊株タイムコースデータを入力して各遺伝子に対する生成系係数を算出し、前記連立評価部は、前記分解系係数算出部が算出した各遺伝子に対する分解系係数と前記生成系係数算出部が算出した各遺伝子に対する生成系係数とを入力し、入力した各遺伝子に対する分解系係数と生成系係数とを使用して各発現速度式を生成し、生成した各発現速度式を連立して各遺伝子の発現量を算出し、前記生成系係数算出部が算出した各遺伝子に対する生成系係数についての評価結果を全株(前記破壊株と前記非破壊株)のタイムコースデータとの示す各遺伝子の発現量と算出した各遺伝子の発現量との比較結果に基づいて出力することを特徴とする。   Further, the expression rate expression generation device calculates the expression level of each gene by combining the expression rate formulas representing the expression rate of each gene for a plurality of genes, and based on the calculated expression level of each gene, It has a simultaneous evaluation unit that evaluates the production system coefficient used in the expression rate formula, and the degradation system coefficient calculation unit inputs the time course data of each disrupted strain for each gene and calculates the degradation system coefficient for each gene. The generation system coefficient calculation unit inputs each non-destructive strain time course data for the non-destructive strain of each gene and calculates a generation system coefficient for each gene, and the simultaneous evaluation unit calculates the decomposition system coefficient calculation unit The decomposition system coefficient for each gene calculated by and the generation system coefficient for each gene calculated by the generation system coefficient calculation unit are input, and the input decomposition system coefficient and generation system coefficient for each gene are used. Each expression rate formula is generated, and the expression level of each gene is calculated by combining the generated expression rate formulas. The evaluation results for the generation system coefficient for each gene calculated by the generation system coefficient calculation unit are all strains ( It outputs based on the comparison result of the expression level of each gene which the time course data of the said destroyed strain and the said non-destructive strain show, and the calculated expression level of each gene.

また、前記生成系係数算出部は、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を複数算出し、前記連立評価部は、複数の遺伝子のうち1つの遺伝子を選択し、連立する発現速度式に対応する遺伝子である連立遺伝子として選択した遺伝子を登録し、前記選択した遺伝子に対する複数の生成系係数のうち1つの生成系係数を選択し、連立する発現速度式に使用する生成系係数である連立生成系係数として選択した生成系係数を登録する第1の登録部と、前記第1の登録部が連立遺伝子として登録した遺伝子以外の遺伝子の中から1つの遺伝子を選択して仮連立遺伝子として登録し、前記仮連立遺伝子に対する複数の生成系係数のうち2以上の生成系係数をそれぞれ仮連立生成系係数として選択し、連立遺伝子に対する分解系係数と連立生成系係数と前記仮連立遺伝子に対する分解系係数と各仮連立生成系係数とを使用して連立遺伝子に対する発現速度式と前記仮連立遺伝子に対する各発現速度式とを生成し、生成した連立遺伝子に対する発現速度式を前記仮連立遺伝子に対する各発現速度式それぞれと連立して連立遺伝子の発現量と前記仮連立遺伝子の発現量とを前記仮連立遺伝子に対する各仮連立生成系係数それぞれについて算出し、算出した連立遺伝子と前記仮連立遺伝子との発現量と全株(前記破壊株および前記非破壊株)のタイムコースデータの示す連立遺伝子と前記仮連立遺伝子との発現量との比較結果に基づいて各仮連立生成系係数それぞれに対して評価値を算出し、算出した各評価値と特定値とを比較し、少なくともいずれかの評価値が前記特定値以上である場合に前記仮連立遺伝子を連立遺伝子として追加して登録すると共に、最も高い評価値に対応する仮連立生成系係数を連立生成系係数として追加して登録する第2の登録部とを備え、
前記連立評価部は、前記第1の登録部を実行後に仮連立遺伝子として未選択の全遺伝子について前記第2の登録部を実行し、連立生成系係数として登録した生成系係数を出力することを特徴とする。
The generation system coefficient calculation unit calculates a plurality of generation system coefficients for the first gene under a condition that limits the number of genes involved in the generation of the first gene to a specific number or less, and the simultaneous evaluation The unit selects one gene from a plurality of genes, registers the selected gene as a simultaneous gene that is a gene corresponding to the simultaneous expression rate expression, and selects one of a plurality of generation system coefficients for the selected gene. A first registration unit that selects a generation system coefficient and registers the generation system coefficient selected as a simultaneous generation system coefficient that is a generation system coefficient used in the simultaneous expression rate equation; and the first registration unit serves as a simultaneous gene One gene is selected from genes other than the registered genes and registered as temporary simultaneous genes, and two or more generating system coefficients for each of the temporary simultaneous genes are temporarily generated. Select as a coefficient, using the decomposition system coefficient for the simultaneous gene, the simultaneous generation system coefficient, the decomposition system coefficient for the temporary simultaneous gene, and each temporary simultaneous generation system coefficient, and the expression rate formula for the simultaneous gene and each of the temporary simultaneous gene An expression rate expression, and the expression rate expression for the generated simultaneous gene is associated with each expression rate expression for the temporary simultaneous gene to express the expression level of the simultaneous gene and the expression level of the temporary simultaneous gene. Calculated for each temporary simultaneous generation system coefficient, and the expression level of the calculated simultaneous genes and the temporary simultaneous genes and the simultaneous genes and the temporary simultaneouss indicated by the time course data of all strains (the disrupted strain and the non-destructed strain) An evaluation value is calculated for each temporary simultaneous generation coefficient based on the result of comparison with the expression level with the gene, and the calculated evaluation value is compared with the specific value. When at least one of the evaluation values is equal to or greater than the specific value, the temporary simultaneous gene is added and registered as a simultaneous gene, and the temporary simultaneous generation coefficient corresponding to the highest evaluation value is used as the simultaneous generation system coefficient. A second registration unit for additionally registering,
The simultaneous evaluation unit executes the second registration unit for all unselected genes as temporary simultaneous genes after executing the first registration unit, and outputs the generation system coefficient registered as the simultaneous generation system coefficient. Features.

さらに、前記連立評価部は、連立遺伝子として登録した遺伝子を1つ選択し、選択した遺伝子に対する生成系係数であり連立生成系係数として登録していない生成系係数を1つ選択し、前記選択した遺伝子に対して選択した生成系係数に対する評価値と前記選択した遺伝子に対して連立生成系係数として登録した生成系係数に対する評価値とを比較し、前記選択した生成系係数の方が高い評価値である場合に前記選択した生成系係数で前記選択した遺伝子に対して登録した連立生成系係数を更新する生成系係数更新部を備えることを特徴とする。   Furthermore, the simultaneous evaluation unit selects one gene registered as a simultaneous gene, selects one generation system coefficient that is a generation system coefficient for the selected gene and is not registered as a simultaneous generation system coefficient, and selects the selected gene The evaluation value for the generative coefficient selected for the gene is compared with the evaluation value for the generative coefficient registered as a simultaneous generative coefficient for the selected gene, and the evaluation value of the selected generative coefficient is higher A generating system coefficient updating unit that updates the simultaneous generating system coefficient registered for the selected gene with the selected generating system coefficient.

さらに、前記連立評価部は、連立遺伝子として登録していない遺伝子を1つ選択し、連立遺伝子に対する分解系係数と連立生成系係数と連立遺伝子として未登録の遺伝子に対する分解系係数と連立遺伝子として未登録の遺伝子に対する各生成系係数とに対して、それらを使用して連立遺伝子と連立遺伝子として未登録の遺伝子とに対する各発現速度式をそれぞれ連立して連立遺伝子の発現量と連立遺伝子として未登録の遺伝子との発現量とを算出し、算出した連立遺伝子と連立遺伝子として未登録の遺伝子との発現量と全株(破壊株と非破壊株)のタイムコースデータの示す連立遺伝子と連立遺伝子として未登録の遺伝子との発現量との比較結果に基づいて連列遺伝子として未登録の遺伝子の各生成系係数に対してそれぞれ評価値を算出し、算出した評価値と特定値とを比較し、少なくともいずれかの評価値が前記特定値以上である場合に連立遺伝子として未登録の遺伝子を連立遺伝子として追加して登録すると共に、最も高い評価値に対応する未登録の遺伝子の生成系係数を連立生成系係数として追加登録する生成系係数追加登録部を備えることを特徴とする。   Further, the simultaneous evaluation unit selects one gene that is not registered as a simultaneous gene, a degradation system coefficient for the simultaneous gene, a simultaneous generation system coefficient, a degradation system coefficient for an unregistered gene as a simultaneous gene, and an unrecognized gene as a simultaneous gene. For each generative coefficient for the registered gene, the expression rate expression for the simultaneous gene and the unregistered gene as a simultaneous gene is used to register each gene expression coefficient and the unregistered as the simultaneous gene expression level. As the simultaneous gene and simultaneous gene, the expression level of the calculated simultaneous gene and the unregistered gene as a simultaneous gene and the time course data of all strains (destructed strain and non-destructed strain) are calculated. Based on the result of comparison with the expression level with the unregistered gene, an evaluation value is calculated for each generation coefficient of the unregistered gene as a contiguous gene, Compare the evaluation value and the specific value, and if at least one of the evaluation values is equal to or higher than the specific value, add the unregistered gene as a simultaneous gene and register it as a simultaneous gene. A generation system coefficient additional registration unit that additionally registers a generation system coefficient of a corresponding unregistered gene as a simultaneous generation system coefficient is provided.

本発明の発現速度式生成方法は、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて第1の遺伝子に対する生成系係数を算出して記憶部に記憶することを特徴とする。   The expression rate expression generation method of the present invention is based on the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene. Under the condition that only the first gene is used, the degradation system coefficient for the first gene is calculated and stored in the storage unit, and the expression level of each gene is observed for the non-destructive strain for the first gene. A generation system coefficient for the first gene is calculated based on certain non-destructive strain time course data and stored in a storage unit.

本発明の発現速度式生成方法は、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶することを特徴とする。   The expression rate formula generation method of the present invention calculates the degradation system coefficient for the first gene based on the time course data of the disrupted strain, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene. Based on the non-destructive strain time course data that is stored in the storage unit and the expression level of each gene is observed for the non-destructive strain for the first gene, the number of genes involved in the generation of the first gene is calculated. A generation system coefficient for the first gene is calculated and stored in a storage unit under a condition limited to a specific number or less.

本発明の発現速度式生成方法は、第1の遺伝子の破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子の非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶することを特徴とする。   The expression rate expression generation method of the present invention is based on the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain of the first gene. Under the condition that only one gene is used, the degradation system coefficient for the first gene is calculated and stored in the storage unit, and the non-destructive strain of the first gene is data obtained by observing the expression level of each gene. Based on the disrupted strain time course data, the generation system coefficient for the first gene is calculated and stored in the storage unit under the condition that the number of genes involved in the generation of the first gene is limited to a specific number or less. It is characterized by that.

本発明の発現速度式生成プログラムは、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて第1の遺伝子に対する生成系係数を算出して記憶部に記憶することをコンピュータに実行させる。
The expression rate expression generation program of the present invention uses the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene, to determine the genes involved in the degradation of the first gene. Under the condition that only the first gene is used, the degradation system coefficient for the first gene is calculated and stored in the storage unit, and the expression level of each gene is observed for the non-destructive strain for the first gene. The computer is caused to calculate a generation system coefficient for the first gene based on certain non-destructive strain time course data and store it in the storage unit.
.

本発明の発現速度式生成プログラムは、第1の遺伝子についての破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子についての非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶することをコンピュータに実行させる。   The expression rate expression generation program of the present invention calculates a degradation system coefficient for the first gene based on the time course data of the disrupted strain, which is data obtained by observing the expression level of each gene for the disrupted strain for the first gene. Based on the non-destructive strain time course data that is stored in the storage unit and the expression level of each gene is observed for the non-destructive strain for the first gene, the number of genes involved in the generation of the first gene is calculated. Under a condition limited to a specific number or less, the computer is caused to calculate the generation coefficient for the first gene and store it in the storage unit.

本発明の発現速度式生成プログラムは、第1の遺伝子の破壊株について各遺伝子の発現量を観測したデータである破壊株タイムコースデータに基づいて、第1の遺伝子の分解に関与する遺伝子を第1の遺伝子だけとする条件の下で、第1の遺伝子に対する分解系係数を算出して記憶部に記憶し、第1の遺伝子の非破壊株について各遺伝子の発現量を観測したデータである非破壊株タイムコースデータに基づいて、第1の遺伝子の生成に関与する遺伝子の数を特定数以下に限定する条件の下で、第1の遺伝子に対する生成系係数を算出して記憶部に記憶することをコンピュータに実行させる。   The expression rate expression generation program of the present invention determines the genes involved in the degradation of the first gene on the basis of the disrupted strain time course data, which is data obtained by observing the expression level of each gene for the disrupted strain of the first gene. Under the condition that only one gene is used, the degradation system coefficient for the first gene is calculated and stored in the storage unit, and the non-destructive strain of the first gene is data obtained by observing the expression level of each gene. Based on the disrupted strain time course data, the generation system coefficient for the first gene is calculated and stored in the storage unit under the condition that the number of genes involved in the generation of the first gene is limited to a specific number or less. Let the computer do that.

本発明によれば、遺伝子発現相互作用推定装置において、分解系係数算出部が分解に関与する遺伝子を自遺伝子だけとする条件の下で分解系係数を算出し、また、生成系係数算出部が生成に関与する遺伝子の数を特定数以下に限定する条件の下で生成系係数を算出することで、タイムコースデータのデータ量が不十分であっても遺伝子の発現速度式を生成することができる。
また、第1の評価部が生成系係数を評価することで、評価結果に基づいてより適した生成系係数を選択して遺伝子の発現速度式を生成することができる。
また、連立評価部が各遺伝子の発現速度式を連立して評価することで、評価結果に基づいてより適した生成系係数を選択して遺伝子の発現速度式を生成することができる。
また、第2の評価部が生成系係数の評価結果を遺伝子毎に纏めて評価することで、評価結果に基づいて各遺伝子の生成に関与する遺伝子の推定を行うことができる。
According to the present invention, in the gene expression interaction estimation apparatus, the degradation system coefficient calculation unit calculates the degradation system coefficient under the condition that the gene involved in the degradation is only its own gene, and the generation system coefficient calculation unit By generating generative coefficients under conditions that limit the number of genes involved in generation to a specific number or less, gene expression rate formulas can be generated even when the amount of time course data is insufficient it can.
Further, the first evaluation unit evaluates the generation system coefficient, so that a more suitable generation system coefficient can be selected based on the evaluation result to generate a gene expression rate expression.
In addition, the simultaneous evaluation unit can evaluate the expression rate expression of each gene in combination, thereby generating a gene expression rate expression by selecting a more suitable generation coefficient based on the evaluation result.
Moreover, the 2nd evaluation part can estimate the gene concerned in the production | generation of each gene based on the evaluation result by collectively evaluating the evaluation result of a production | generation system coefficient for every gene.

参考例1.
S−Systemモデルによる遺伝子発現相互作用推定方法は、タイムコースデータを再現するための式を遺伝子発現量の微分方程式(発現速度式)として「発現量の変化率(発現速度)=生成速度−分解速度[式1]」で表している。
Reference Example 1
The gene expression interaction estimation method using the S-System model is expressed as follows: “Expression rate change rate (expression rate) = production rate−decomposition” with a formula for reproducing time course data as a differential equation of gene expression level (expression rate formula) Speed [formula 1] ".

Figure 0004819382
Figure 0004819382

そして、式1における生成系係数α,gij及び分解系係数β,hijの算出を行う。
αはi番目遺伝子の生成系係数であり生成速度を示す項に乗じる係数である。また、gijはi番目遺伝子の生成系係数でありi番目遺伝子の生成に対するj番目遺伝子の相互作用係数である。また、βはi番目遺伝子の分解系係数であり分解速度を示す項に乗じる係数である。また、hijはi番目遺伝子の分解系係数でありi番目遺伝子の分解に対するj番目遺伝子の相互作用係数である。
Then, the generation system coefficients α i and g ij and the decomposition system coefficients β i and h ij in Expression 1 are calculated.
α i is a generation system coefficient of the i-th gene and is a coefficient to be multiplied by a term indicating the generation speed. G ij is a generation coefficient of the i-th gene, and is an interaction coefficient of the j-th gene with respect to the generation of the i-th gene. Β i is a decomposition system coefficient of the i-th gene and is a coefficient by which a term indicating the decomposition rate is multiplied. H ij is a decomposition system coefficient of the i-th gene, and is an interaction coefficient of the j-th gene with respect to the decomposition of the i-th gene.

ここで、式1の各係数の最適値を膨大な計算を要さずに算出するための方法として、以下の方法(特願2004−101773号)をとるとよい。
この方法では、破壊株のタイムコースデータを利用し、その対数空間に変換した値及び補間データから得た微係数を使用して、最小二乗法により分解系係数β,hijの最適値を算出する。また、その分解系係数を前提として、非破壊株データのタイムコースデータを利用し、その対数空間に変換した値及び補間データから微係数、生成速度プロファイルを算出し、それを利用して最小二乗法により生成系係数α,gijの最適値を算出する。
以下に、この方法の手順を説明する。
Here, the following method (Japanese Patent Application No. 2004-101773) may be taken as a method for calculating the optimum value of each coefficient of Equation 1 without requiring enormous calculation.
In this method, using the time course data of the disrupted strain, using the value converted to the logarithmic space and the derivative obtained from the interpolation data, the optimum value of the decomposition system coefficients β i and h ij is obtained by the least square method. calculate. Also, assuming the decomposition system coefficient, the time course data of the non-destructive strain data is used, the derivative and the generation speed profile are calculated from the value converted into the logarithmic space and the interpolation data, and then used to calculate the minimum two The optimum values of the generation system coefficients α i and g ij are calculated by multiplication.
The procedure of this method will be described below.

図1は、参考例1における遺伝子発現相互作用推定方法の処理の流れを示すフローチャートである。
図1に基づいて手順を説明する。
FIG. 1 is a flowchart showing a processing flow of the gene expression interaction estimation method in Reference Example 1.
The procedure will be described with reference to FIG.

まず、野生株(非破壊株)及び破壊株のタイムコースデータを入力する(S101)。   First, the time course data of a wild strain (non-destructive strain) and a disrupted strain are input (S101).

次に、前処理として、タイムコース値の対数値を基にしたスプライン補間係数の算出と、スプライン補間係数とタイムコース値とを使用しての対数値データの微係数の算出とを行う(S102)。   Next, as preprocessing, calculation of a spline interpolation coefficient based on the logarithmic value of the time course value and calculation of a differential coefficient of logarithmic value data using the spline interpolation coefficient and the time course value are performed (S102). ).

Figure 0004819382
Figure 0004819382

スプライン補間係数の算出では、k株の遺伝子iのタイムコースの対数値がZ (k)(t)(j=1,2,・・・m)である場合に、各tとtj+1の間を1つの3次多項式で表現できるような係数(スプライン補間係数)を求める。この求める係数は、3次多項式を関数としてグラフで表した時に、Z (k)(t)の各点をとおり、多項式の切り替え点tで滑らかにつながるような値である。 In calculating the spline interpolation coefficient, when the logarithmic value of the time course of the gene i of the k strain is Z i (k) (t j ) (j = 1, 2,... M), each t j and t A coefficient (spline interpolation coefficient) that can be expressed by one cubic polynomial between j + 1 is obtained. The coefficient to be obtained is a value that passes through each point of Z i (k) (t j ) and is smoothly connected at the switching point t j of the polynomial when represented by a graph using a cubic polynomial as a function.

上記のように係数を求めスプライン補間ができれば、関数を時間の多項式で表したことになるので多項式の微分ができる。微分計算後の各係数が微係数である。
微係数は、野生株と破壊株とのそれぞれに対して算出する。
If the coefficient can be obtained as described above and spline interpolation can be performed, the function can be expressed by a time polynomial, and the polynomial can be differentiated. Each coefficient after differential calculation is a derivative.
The derivative is calculated for each of the wild strain and the disrupted strain.

次に、分解系係数β,hijの推定を行う(S103)。 Next, the decomposition system coefficients β i and h ij are estimated (S103).

分解系係数β,hijの推定では、まず、遺伝子iの破壊株のデータに対して、 In the estimation of the degradation system coefficients β i and h ij , first, for the data of the disrupted strain of gene i,

Figure 0004819382
Figure 0004819382

以下のベクトルbと行列Aとを求める。 The following vector b 1 and matrix A 1 are obtained.

Figure 0004819382
Figure 0004819382

そして、行列A、ベクトルbを使用して、「b=A」となるようなベクトルcを最小二乗法により推定し、遺伝子iに対する分解系係数β,hijを算出する。分解系係数β,hijとベクトルcの関係は以下のようになる。 Then, using the matrix A 1 and the vector b 1 , a vector c 1 such that “b 1 = A 1 c 1 ” is estimated by the least square method, and the decomposition system coefficients β i and h ij for the gene i are obtained. calculate. The relationship between the decomposition system coefficients β i , h ij and the vector c 1 is as follows.

Figure 0004819382
Figure 0004819382

以上の処理を全遺伝子に対して行い、全遺伝子の分解系係数β,hijを推定する。 The above processing is performed for all genes, and the degradation system coefficients β i and h ij of all genes are estimated.

次に、生成系係数α,gijの推定を行う(S104)。 Next, the generation system coefficients α i and g ij are estimated (S104).

生成系係数α,gijの推定では、まず、遺伝子iの非破壊株のデータに対して、 In the estimation of the production system coefficients α i and g ij , first, for the data of the non-destructive strain of gene i,

Figure 0004819382
Figure 0004819382

以下のベクトルbと行列Aとを求める。 The following vector b 2 and matrix A 2 are obtained.

Figure 0004819382
Figure 0004819382

そして、行列A、ベクトルbを使用して、「b=A」となるようなベクトルcを最小二乗法により推定し、遺伝子iに対する生成系係数α,gijを算出する。生成系係数α,gijとベクトルcの関係は以下のようになる。 Then, using the matrix A 2 and the vector b 2 , a vector c 2 such that “b 2 = A 2 c 2 ” is estimated by the least square method, and the generation system coefficients α i and g ij for the gene i are obtained. calculate. The relationship between the generation system coefficients α i and g ij and the vector c 2 is as follows.

Figure 0004819382
Figure 0004819382

以上の処理を全遺伝子に対して行い、全遺伝子の生成系係数α,gijを推定する。 The above processing is performed on all genes, and the generative coefficients α i and g ij of all genes are estimated.

上記の最小二乗法では、「|b−Ac|」の値が最も小さくなるベクトルcを算出し、各係数の最適値を推定する。   In the least square method, the vector c having the smallest value of “| b−Ac |” is calculated, and the optimum value of each coefficient is estimated.

図1で説明した手順により、膨大な計算を要さずに式1の各係数の最適値を算出することができる。   With the procedure described with reference to FIG. 1, it is possible to calculate the optimum value of each coefficient of Equation 1 without requiring enormous calculation.

実施の形態1.
上記参考例1の方法の場合、解析に供する全ての遺伝子に対し破壊株のタイムコースデータを必要とするが、全ての遺伝子に対し破壊株のタイムコースデータを、最初から準備することは困難である。
そこで、実施の形態1では、破壊株が存在しない場合や、破壊株のタイムコースデータが不十分で最小二乗法を適用できない場合に関する解法及びその方法を実行するための遺伝子発現相互作用推定装置100について説明する。これにより破壊株のタイムコースデータの有無にかかわらず解(各係数)を算出する事が出来る。
Embodiment 1 FIG.
In the case of the method of Reference Example 1 above, time course data of the disrupted strain is required for all genes to be analyzed, but it is difficult to prepare time course data of the disrupted strain for all genes from the beginning. is there.
Therefore, in the first embodiment, a solution for a case where a disrupted strain does not exist or a case where the time course data of the disrupted strain is insufficient and the least square method cannot be applied, and a gene expression interaction estimation apparatus 100 for executing the method. Will be described. As a result, the solution (each coefficient) can be calculated regardless of the presence or absence of time course data of the destroyed stock.

図2は、実施の形態1における遺伝子発現相互作用推定装置100の外観を示す図である。
図2において、遺伝子発現相互作用推定装置100は、システムユニット910、CRT(Cathode Ray Tube)表示装置901、キーボード(K/B)902、マウス903、コンパクトディスク装置(CDD)905、プリンタ装置906、スキャナ装置907を備え、これらはケーブルで接続されている。
さらに、遺伝子発現相互作用推定装置100は、FAX機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク(LAN)942、ウェブサーバ941を介してインターネット940に接続されている。
FIG. 2 is a diagram illustrating an appearance of the gene expression interaction estimation apparatus 100 according to the first embodiment.
2, a gene expression interaction estimation apparatus 100 includes a system unit 910, a CRT (Cathode Ray Tube) display device 901, a keyboard (K / B) 902, a mouse 903, a compact disk device (CDD) 905, a printer device 906, A scanner device 907 is provided, and these are connected by a cable.
Further, the gene expression interaction estimation apparatus 100 is connected to a FAX machine 932 and a telephone 931 via a cable, and is connected to the Internet 940 via a local area network (LAN) 942 and a web server 941.

図3は、実施の形態1における遺伝子発現相互作用推定装置100のハードウェア構成図である。
図3において、遺伝子発現相互作用推定装置100は、プログラムを実行するCPU(Central Processing Unit)911を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、CRT表示装置901、K/B902、マウス903、FDD(Flexible Disk Drive)904、磁気ディスク装置920、CDD905、プリンタ装置906、スキャナ装置907と接続されている。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920、光ディスク装置は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915は、FAX機932、電話器931、LAN942等に接続されている。
例えば、通信ボード915、K/B902、スキャナ装置907、FDD904などは、情報入力部の一例である。
また、例えば、通信ボード915、CRT表示装置901などは、出力部の一例である。
FIG. 3 is a hardware configuration diagram of the gene expression interaction estimation apparatus 100 according to the first embodiment.
In FIG. 3, the gene expression interaction estimation apparatus 100 includes a CPU (Central Processing Unit) 911 that executes a program. The CPU 911 includes a ROM 913, a RAM 914, a communication board 915, a CRT display device 901, a K / B 902, a mouse 903, an FDD (Flexible Disk Drive) 904, a magnetic disk device 920, a CDD 905, a printer device 906, and a scanner device 907. Connected with.
The RAM 914 is an example of a volatile memory. The ROM 913, the FDD 904, the CDD 905, the magnetic disk device 920, and the optical disk device are examples of nonvolatile memories. These are examples of a storage device or a storage unit.
The communication board 915 is connected to a FAX machine 932, a telephone 931, a LAN 942, and the like.
For example, the communication board 915, the K / B 902, the scanner device 907, the FDD 904, and the like are examples of the information input unit.
Further, for example, the communication board 915, the CRT display device 901, and the like are examples of the output unit.

ここで、通信ボード915は、LAN942に限らず、直接、インターネット940、或いはISDN等のWAN(ワイドエリアネットワーク)に接続されていても構わない。直接、インターネット940、或いはISDN等のWANに接続されている場合、遺伝子発現相互作用推定装置100は、インターネット940、或いはISDN等のWANに接続され、ウェブサーバ941は不用となる。
磁気ディスク装置920には、オペレーティングシステム(OS)921、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923は、CPU911、OS921、ウィンドウシステム922により実行される。
Here, the communication board 915 is not limited to the LAN 942 but may be directly connected to the Internet 940 or a WAN (Wide Area Network) such as ISDN. When directly connected to the Internet 940 or a WAN such as ISDN, the gene expression interaction estimation apparatus 100 is connected to the Internet 940 or a WAN such as ISDN, and the web server 941 is unnecessary.
The magnetic disk device 920 stores an operating system (OS) 921, a window system 922, a program group 923, and a file group 924. The program group 923 is executed by the CPU 911, the OS 921, and the window system 922.

上記プログラム群923には、以下に述べる実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜を判定し」、「〜を判定した結果」、「〜を計算し」、「〜を計算した結果」、「〜を処理し」、「〜を処理した結果」のような表現で説明する結果情報が、「〜ファイル」として記憶されている。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータの入出力を示し、そのデータの入出力のためにデータは、磁気ディスク装置920、FD(Flexible Disk cartridge)、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)、その他の記録媒体に記録される。あるいは、信号線やその他の伝送媒体により伝送される。
The program group 923 stores programs that execute functions described as “˜units” in the description of the embodiments described below. The program is read and executed by the CPU 911.
In the file group 924, in the description of the embodiment described below, “determined to”, “result of determining to”, “calculated to”, “calculated result of”, and “to” are processed. The result information described in terms of expressions such as “Shi” and “Result of processing” is stored as “˜File”.
In addition, the arrow portion of the flowchart described in the description of the embodiment described below mainly indicates input / output of data, and for the input / output of the data, the data is the magnetic disk device 920, FD (Flexible Disk cartridge), Recording is performed on an optical disc, a CD (compact disc), an MD (mini disc), a DVD (Digital Versatile Disk), and other recording media. Alternatively, it is transmitted through a signal line or other transmission medium.

また、以下に述べる実施の形態の説明において「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、ハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。   In addition, what is described as “unit” in the description of the embodiment described below may be realized by firmware stored in the ROM 913. Alternatively, it may be implemented by software alone, hardware alone, a combination of software and hardware, or a combination of firmware.

また、以下に述べる実施の形態を実施するプログラムは、磁気ディスク装置920、FD、光ディスク、CD、MD、DVD、その他の記録媒体による記録装置を用いて記憶されても構わない。   In addition, a program for implementing the embodiment described below may be stored using a magnetic disk device 920, an FD, an optical disk, a CD, an MD, a DVD, or other recording media.

図4は、実施の形態1における遺伝子発現相互作用推定装置100の構成図である。
図4において、実施の形態1における遺伝子発現相互作用推定装置100は、前処理部110、分解系係数推定部120、生成系係数推定部130、連立評価部140、単独評価部150、記憶部190を備える。
FIG. 4 is a configuration diagram of the gene expression interaction estimation apparatus 100 according to the first embodiment.
4, the gene expression interaction estimation apparatus 100 according to Embodiment 1 includes a preprocessing unit 110, a decomposition system coefficient estimation unit 120, a generation system coefficient estimation unit 130, a simultaneous evaluation unit 140, a single evaluation unit 150, and a storage unit 190. Is provided.

前処理部110は、野生株および破壊株のタイムコースデータを入力し、タイムコースの対数値データの微係数Y1_i (k)(t)の算出を行う。
分解系係数推定部120は、分解系係数β,hijの推定処理を行う。
生成系係数推定部130は、生成系係数α,gijの推定処理を行い、推定した生成系係数α,gijに対する評価値の算出を行う。
連立評価部140は、各遺伝子に対する生成系係数α,gijと分解系係数β,hijとをS−Systemモデルの微分方程式[式1]に適用した場合の評価処理を行い、最適な各係数を求める。このとき、各遺伝子に対する微分方程式[式1]を連立して評価処理を行う。
単独評価部150は、遺伝子jの遺伝子iに対する生成に関わる度合いの評価処理を行う。
記憶部190は、野生株および破壊株のタイムコースデータ、求めた各係数のデータ、評価した度合いのデータや各部の処理結果データおよび処理用変数データ等を記憶する。
前処理部110、分解系係数推定部120、生成系係数推定部130、連立評価部140および単独評価部150は記憶部190から各種データを入力し、記憶部190に処理結果のデータを出力する。
The preprocessing unit 110 inputs time course data of the wild strain and the disrupted strain, and calculates a differential coefficient Y 1 — i (k) (t j ) of logarithmic data of the time course.
The decomposition system coefficient estimation unit 120 performs an estimation process of the decomposition system coefficients β i and h ij .
Generating system coefficient estimating section 130 performs a process of estimating the generation system coefficients alpha i, g ij, and calculates the evaluation value for the estimated generated based coefficients alpha i, g ij.
The simultaneous evaluation unit 140 performs an evaluation process when applying the generation system coefficients α i and g ij and the decomposition system coefficients β i and h ij for each gene to the differential equation [Equation 1] of the S-System model, Find each coefficient. At this time, the differential equation [Equation 1] for each gene is simultaneously performed for the evaluation process.
The single evaluation unit 150 performs an evaluation process of the degree related to the generation of the gene j with respect to the gene i.
The storage unit 190 stores time course data of wild strains and destroyed strains, data of each obtained coefficient, evaluated degree data, processing result data of each unit, processing variable data, and the like.
The preprocessing unit 110, the decomposition system coefficient estimation unit 120, the generation system coefficient estimation unit 130, the simultaneous evaluation unit 140, and the single evaluation unit 150 input various data from the storage unit 190, and output processing result data to the storage unit 190. .

また、連立評価部140は、連立遺伝子登録部141、生成系係数更新(山登り)部142、連立遺伝子追加登録部143を備える。   The simultaneous evaluation unit 140 includes a simultaneous gene registration unit 141, a generation system coefficient update (mountain climbing) unit 142, and a simultaneous gene addition registration unit 143.

連立遺伝子登録部141は、ある遺伝子を基準に、他の遺伝子のS−Systemモデルの微分方程式[式1]と連立して評価を行い、評価値が基準値以上となる遺伝子の組み合わせ(連立遺伝子)を登録する。
生成系係数更新(山登り)部142は、生成系係数を入れ換えて評価処理を行い、評価結果に基づいて生成系係数の更新を行う。
連立遺伝子追加登録部143は、組み合わせた遺伝子に他の遺伝子を追加して評価処理を行い、評価結果に基づいて追加する遺伝子を決定する。
The simultaneous gene registration unit 141 performs evaluation in combination with a differential equation [Equation 1] of an S-System model of another gene based on a certain gene, and a combination of genes whose evaluation value is equal to or greater than a reference value (simultaneous gene ).
The generation system coefficient updating (mountain climbing) unit 142 replaces the generation system coefficient to perform an evaluation process, and updates the generation system coefficient based on the evaluation result.
The simultaneous gene addition registration unit 143 performs an evaluation process by adding another gene to the combined genes, and determines a gene to be added based on the evaluation result.

図5は、実施の形態1における遺伝子発現相互作用推定方法の処理の流れを示すフローチャートである。
実施の形態1における遺伝子間での各遺伝子の発現相互作用を推定する処理の流れについて、図5に基づいて以下に説明する。
FIG. 5 is a flowchart showing a process flow of the gene expression interaction estimation method according to the first embodiment.
The flow of processing for estimating the expression interaction of each gene in the first embodiment will be described below with reference to FIG.

まず、前処理部110は、野生株及び破壊株のタイムコースデータを入力する(S201)。この処理は前記S101と同じである。   First, the preprocessing unit 110 inputs time course data of a wild strain and a disrupted strain (S201). This process is the same as S101.

野生株及び破壊株のタイムコースデータは、外部装置から入力しても良いし、記憶部190にあらかじめ記憶しておいても良い。   The time course data of the wild strain and the disrupted strain may be input from an external device, or may be stored in the storage unit 190 in advance.

次に、前処理部110は、入力した野生株及び破壊株のタイムコースデータに基づいて前処理を行う。そして、算出した微係数Y1_i (k)(T)のデータを記憶部190に記憶する(S202)。この処理は前記S102と同じである。 Next, the preprocessing unit 110 performs preprocessing based on the input time course data of the wild strain and the disrupted strain. Then, the calculated data of the derivative Y 1 — i (k) (T j ) is stored in the storage unit 190 (S202). This process is the same as S102.

次に、分解系係数推定部120は、各遺伝子に対する分解系係数β,hijの推定処理を行い、推定した分解系係数β,hijのデータを記憶部190に登録(記憶)する(S203)。この処理は前記S103に対応する。 Next, the decomposition system coefficient estimation unit 120 performs an estimation process of the decomposition system coefficients β i and h ij for each gene, and registers (stores) the data of the estimated decomposition system coefficients β i and h ij in the storage unit 190. (S203). This process corresponds to S103.

図6は、実施の形態1における分解系係数の推定/登録の処理の流れを示すフローチャートである。
実施の形態1において分解系係数推定部120が行うS203の処理の流れについて、図6に基づいて以下に説明する。
FIG. 6 is a flowchart showing a flow of processing for estimating / registering decomposition system coefficients in the first embodiment.
The processing flow of S203 performed by the decomposition system coefficient estimation unit 120 in the first embodiment will be described below with reference to FIG.

未処理の遺伝子、つまり、分解系係数β,hijの推定を行う対象の遺伝子の中から1つの遺伝子iを選択する(S301)。 One gene i is selected from unprocessed genes, that is, genes for which the degradation system coefficients β i and h ij are estimated (S301).

次に、記憶部190を参照し、S301で選択した遺伝子iの破壊株のタイムコースデータが存在するか判定する(S302)。   Next, with reference to the storage unit 190, it is determined whether there is time course data of the disrupted strain of gene i selected in S301 (S302).

S302の判定の結果、遺伝子iの破壊株のタイムコースデータが存在する場合、そのタイムコースデータを記憶部190から取得し、取得したタイムコースデータが十分な観測点数のデータであるかを「観測点数n_sp≧遺伝子数n+1」で判定する(S303)。   As a result of the determination in S302, if there is time course data of the disrupted strain of gene i, the time course data is obtained from the storage unit 190, and whether or not the obtained time course data is data with a sufficient number of observation points is observed. Determination is made by “score n_sp ≧ number of genes n + 1” (S303).

以下の処理において、ベクトルbと行列Aに対して「b=Ac」を満足するベクトルcを最小二乗法により求めるが、最小二乗法では未知数(遺伝子数+1)より制約条件数(破壊株の観測点数)が大きい必要がある。つまり、ベクトルcの次元(未知数)よりベクトルbの次元(制約条件数)が小さいと「b=Ac」を満足するベクトルcは存在しない。
そこで、「観測点数n_sp≧遺伝子数n+1」の判定を行う。
In the following processing, a vector c satisfying “b = Ac” is obtained for the vector b and the matrix A by the least square method. In the least square method, the constraint condition number (observation of the disrupted strain) is determined from the unknown number (the number of genes + 1). (Score) needs to be large. That is, when the dimension (number of constraint conditions) of the vector b is smaller than the dimension (unknown number) of the vector c, there is no vector c that satisfies “b = Ac”.
Therefore, the determination “number of observation points n_sp ≧ number of genes n + 1” is performed.

S303の判定の結果、「観測点数n_sp≧遺伝子数n+1」の条件を満たす場合、ベクトルb、行列Aを計算し(S304)、最小二乗法によりベクトルcを推定し(S305)、ベクトルcから遺伝子iに対する分解系係数β,hijを算出して記憶部190に記憶する(S306)。
S304〜S306の処理は前記S103と同じである。
As a result of the determination in S303, when the condition “number of observation points n_sp ≧ number of genes n + 1” is satisfied, the vector b 1 and the matrix A 1 are calculated (S304), the vector c 1 is estimated by the least square method (S305), and the vector The decomposition system coefficients β i and h ij for the gene i are calculated from the c 1 and stored in the storage unit 190 (S306).
The processing of S304 to S306 is the same as S103.

また、S303の判定の結果、「観測点数n_sp≧遺伝子数n+1」の条件を満たさない場合、「関与している遺伝子は自分(遺伝子i)だけ」と仮定し、その仮定に対応する以下のベクトルb、行列Aを算出する(S307)。 If the result of determination in S303 does not satisfy the condition “number of observation points n_sp ≧ number of genes n + 1”, it is assumed that “the only gene involved is self (gene i)”, and the following vector corresponding to the assumption: b 3 and matrix A 3 are calculated (S307).

Figure 0004819382
Figure 0004819382

ここでは、物質が分解する際に、その物質の一定割合が壊れていく(関与している遺伝子が自分だけ)ことは通常の自然現象でよくある事であること、さらに、分解速度をなんらかの遺伝子が制御(促進および抑制)している効果は、後で生成する生成速度の項において逆効果として現れると考えられることを理由に、「関与している遺伝子は自分(遺伝子i)だけ」という仮定を立てた。
これにより、「観測点数n_sp≧遺伝子数n(1)+1」の条件を満たし、以下の処理で最小二乗法によりベクトルcを推定することができる。
Here, when a substance decomposes, a certain percentage of the substance is broken (the gene involved is only you), which is a common natural phenomenon, and the rate of decomposition Assuming that “the only gene involved (the gene i) is involved” is that the effect that is controlled (promoted and suppressed) appears to appear as an adverse effect in the term of the production rate that is generated later. Stood up.
As a result, the condition “number of observation points n_sp ≧ number of genes n (1) +1” is satisfied, and the vector c 3 can be estimated by the following method with the least square method.

次に、「b=A」となるようなベクトルcを最小二乗法により推定する(S308)。 Next, a vector c 3 that satisfies “b 3 = A 3 c 3 ” is estimated by the least square method (S308).

そして、ベクトルcから遺伝子iに対する分解系係数β,hijを算出して記憶部190に記憶する(S309)。分解系係数β,hijとベクトルcの関係は以下のようになる。 Then, the decomposition system coefficients β i and h ij for the gene i are calculated from the vector c 3 and stored in the storage unit 190 (S309). The relationship between the decomposition system coefficients β i , h ij and the vector c 3 is as follows.

Figure 0004819382
Figure 0004819382

このとき、「関与している遺伝子は自分(遺伝子i)だけ」という仮定から次式が成立する。   At this time, the following equation is established based on the assumption that “the gene involved is only me (gene i)”.

ij=0(i≠j) [式2] h ij = 0 (i ≠ j) [Formula 2]

また、S302の判定の結果、遺伝子iの破壊株のタイムコースデータが存在しない場合、遺伝子iの生成速度が正になるように分解系係数βを算出し、hii=1,hij=0(i≠j)と共に記憶部190に登録する(S310)。 If the time course data of the disrupted strain of gene i does not exist as a result of the determination in S302, the degradation system coefficient β i is calculated so that the generation rate of gene i is positive, and h ii = 1, h ij = 0 (i ≠ j) is registered in the storage unit 190 (S310).

前記のとおり、遺伝子iの破壊株のタイムコースデータが存在しない場合、最小二乗法によりベクトルcを求めることができない。
そこで、「関与している遺伝子は自分(遺伝子i)だけ」と仮定し、S309と同様に前記式2が成立する。
さらに、hiiを以下の式で仮定する。
As described above, if the time course data of disruption strain of gene i is not present, it is impossible to determine the vector c 3 by the least squares method.
Therefore, assuming that “the only gene involved is self (gene i)”, Equation 2 is established as in S309.
Further, h ii is assumed by the following equation.

ii=1 [式3] h ii = 1 [Formula 3]

また、全ての非破壊株のタイムコースデータに対して、遺伝子iの生成速度が正になる様に決定する。遺伝子iの生成速度が正になる必要条件は、全ての非破壊株kの全ての観測点tに対して、分解系係数hijの条件式[式2]が先に与えた形である場合、βを次式で表すことができる。 Further, the generation rate of gene i is determined to be positive with respect to the time course data of all non-destructive strains. The necessary condition for the generation rate of gene i to be positive is that the conditional expression [Equation 2] of the decomposition system coefficient h ij is given in advance for all observation points t of all non-destructive strains k. , Β i can be expressed by the following equation.

1_i (k)(t)>β [式4] Y 1 — i (k) (t)> β i [Formula 4]

βは式4を満足するように算出する。 β i is calculated so as to satisfy Equation 4.

βを、遺伝子iの生成速度が正になる様に決定するのは、S−Systemモデルの微分方程式[式1]において、遺伝子iの生成速度と分解速度が必ず正である必要があるためである。 The reason why β i is determined so that the generation rate of gene i is positive is that the generation rate and decomposition rate of gene i must be positive in the differential equation [Equation 1] of the S-System model. It is.

ここで、生成速度が正である条件は、S−Systemモデルの微分方程式[式1]を用いて次式で表すことができる。   Here, the condition that the generation speed is positive can be expressed by the following equation using the differential equation [Equation 1] of the S-System model.

Figure 0004819382
Figure 0004819382

ここで、上記の「hij=0(i≠j)」[式2]という仮定により、次式が成立する。 Here, the following equation is established based on the assumption that “h ij = 0 (i ≠ j)” [Equation 2].

Figure 0004819382
Figure 0004819382

また、遺伝子iの発現量の対数値に対する微係数であるY1_iは、次式で表すことができる。 Further, Y 1 — i that is a differential coefficient with respect to the logarithmic value of the expression level of gene i can be expressed by the following equation.

Figure 0004819382
Figure 0004819382

左辺は、展開すると次式のように表すことができる。   When expanded, the left side can be expressed as:

Figure 0004819382
Figure 0004819382

つまり、生成速度が正である条件は、   In other words, the condition that the generation rate is positive is

Figure 0004819382
Figure 0004819382

となり、結果βは「Y1_i (k)(t)>β」[式4]の条件を満たすこととなる。 Thus, the result β i satisfies the condition of “Y 1 — i (k) (t)> β i ” [Formula 4].

上記のS302〜S310の処理により、S301で選択した遺伝子iに対する分解系係数β,hijを推定し、記憶部190に登録することができる。 Through the processes in S302 to S310, the decomposition system coefficients β i and h ij for the gene i selected in S301 can be estimated and registered in the storage unit 190.

そして、分解系係数β,hijの推定、登録(記憶)を行っていない未処理の遺伝子について上記のS301〜S310の処理を行い、対象である全ての遺伝子の分解系係数β,hijを記憶部190に登録する(S311)。 Then, the unprocessed genes for which the degradation system coefficients β i and h ij are not estimated and registered (stored) are processed in S301 to S310, and the degradation system coefficients β i and h of all the genes of interest. ij is registered in the storage unit 190 (S311).

次に、生成系係数推定部130は、各遺伝子に対する生成系係数α,gijの推定処理を行い、推定した生成系係数α,gijのデータを記憶部190に登録(記憶)する。また、推定した生成系係数α,gijに対して評価処理を行い、評価値を記憶部190に登録する(S204)。図5において、S204〜S207の処理は前記S104に対応する。 Next, the generation system coefficient estimation unit 130 performs an estimation process of the generation system coefficients α i and g ij for each gene, and registers (stores) the data of the estimated generation system coefficients α i and g ij in the storage unit 190. . In addition, an evaluation process is performed on the estimated generation system coefficients α i and g ij and the evaluation value is registered in the storage unit 190 (S204). In FIG. 5, the processing of S204 to S207 corresponds to S104.

図7は、実施の形態1における生成系係数の推定/登録の処理の流れを示すフローチャートである。
実施の形態1において生成系係数推定部130が行う前記S204の処理の流れについて、図7に基づいて以下に説明する。
FIG. 7 is a flowchart showing a flow of processing for estimating / registering a generation system coefficient in the first embodiment.
The flow of the process of S204 performed by the generation system coefficient estimation unit 130 in the first embodiment will be described below with reference to FIG.

未処理の遺伝子、つまり、生成系係数α,gijの推定を行う対象の遺伝子の中から1つの遺伝子iを選択する(S401)。 One gene i is selected from unprocessed genes, that is, genes for which the generation system coefficients α i and g ij are estimated (S401).

次に、S301で選択した遺伝子iの非破壊株のタイムコースデータを記憶部190から取得し、取得したタイムコースデータが十分な観測点数のデータであるかを「観測点数n_sp≧遺伝子数n+1」で判定する(S402)。   Next, the time course data of the non-destructive strain of the gene i selected in S301 is acquired from the storage unit 190, and whether or not the acquired time course data is data of a sufficient number of observation points is “the number of observation points n_sp ≧ the number of genes n + 1”. (S402).

S402の判定の結果、「観測点数n_sp≧遺伝子数n+1」の条件を満たす場合、ベクトルb、行列Aを計算し(S403)、最小二乗法によりベクトルcを推定し(S404)、ベクトルcから遺伝子iに対する生成系係数α,gijを算出して記憶部190に登録する(S405)。
S403〜S405の処理は前記S104と同じである。
As a result of the determination in S402, when the condition “number of observation points n_sp ≧ number of genes n + 1” is satisfied, the vector b 2 and the matrix A 2 are calculated (S403), the vector c 2 is estimated by the least square method (S404), and the vector Generating system coefficients α i and g ij for gene i are calculated from c 2 and registered in the storage unit 190 (S405).
The processing of S403 to S405 is the same as S104.

また、S402の判定の結果、「観測点数n_sp≧遺伝子数n+1」の条件を満たさない場合、遺伝子iの生成に関わっている遺伝子数に制限を加えた関与遺伝子の集合を示す生成系遺伝子組Lを生成する。生成した生成系遺伝子組Lのデータは記憶部190に登録する(S406)。   Further, as a result of the determination in S402, when the condition “number of observation points n_sp ≧ number of genes n + 1” is not satisfied, a gene generator set L indicating a set of participating genes with restriction on the number of genes involved in the generation of gene i Is generated. The data of the generative gene set L thus generated is registered in the storage unit 190 (S406).

前記S203の処理において分解系係数β,hijが算出できれば、最小二乗法に適用する制約条件式「b=A」は算出する事ができる。しかし、観測点数が少ない場合には最小二乗法を解くために十分な数の制約条件を得る事が出来ない。例えば、非破壊株数が少なく遺伝子数が多い場合にはこのような状況になる。
そこで、遺伝子iの生成に関わっている遺伝子の数に対して制限を加えて、このような状態に対し対処する。
If the decomposition system coefficients β i and h ij can be calculated in the process of S203, the constraint condition expression “b 2 = A 2 c 2 ” applied to the least square method can be calculated. However, when the number of observation points is small, a sufficient number of constraints cannot be obtained to solve the least squares method. For example, this situation occurs when the number of non-destructive strains is small and the number of genes is large.
Therefore, a limit is imposed on the number of genes involved in the generation of gene i to deal with such a situation.

以下、「観測点数n_sp≧遺伝子数n+1」の条件を満たす最大関与遺伝子数をnmxとする。但し、この中に自分自身は含めないものとする。この場合、生成系遺伝子組Lは以下のように表すことができる。 Hereinafter, the maximum number of genes involved that satisfies the condition “number of observation points n_sp ≧ number of genes n + 1” is n mx . However, this does not include myself. In this case, the generation gene set L can be expressed as follows.

Figure 0004819382
Figure 0004819382

ここで、全遺伝子数をnとすると、この条件を満足する生成系遺伝子組Lの組数ncalは次式で表すことができる。 Here, when the total number of genes is n, the number n cal of the generation gene sets L satisfying this condition can be expressed by the following equation.

Figure 0004819382
Figure 0004819382

例えば、全遺伝子数が5、対象遺伝子番号iが3、nmxが2とした場合の生成系遺伝子組Lは、m=1ではL={3}のみ、m=2ではL={1,3},{2,3},{3,4},{3,5}の4ケース、m=3ではL={1,2,3},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}の6ケースである。そして、生成系遺伝子組Lの組数ncalは1+4+6の11ケースである。 For example, when the total number of genes is 5, the target gene number i is 3, and n mx is 2, the generation gene set L is only L = {3} when m = 1, and L = {1, when m = 2. 3}, {2, 3}, {3, 4}, {3, 5}, m = 3, L = {1, 2, 3}, {1, 3, 4}, {1, 3 , 5}, {2, 3, 4}, {2, 3, 5}, {3, 4, 5}. Further, the number n cal of the generation gene set L is 11 cases of 1 + 4 + 6.

以下、生成した各生成系遺伝子組Lについて処理を行うが、組数ncalが非常に大きい場合には、ランダムに許容数分の生成系遺伝子組Lを処理して、処理計算量を抑えるとよい。 In the following, processing is performed for each generative gene set L that is generated. If the number of sets ncal is very large, it is possible to process the generative gene sets L for an allowable number at random to reduce the processing complexity. Good.

次に、S406で生成した生成系遺伝子組Lを示すデータを記憶部190から取得し、未処理の生成系遺伝子組Lから処理対象とする対象遺伝子組を選択する(S407)。   Next, data indicating the generation gene set L generated in S406 is acquired from the storage unit 190, and a target gene set to be processed is selected from the unprocessed generation gene set L (S407).

次に、S407で選択した対象遺伝子組に対して、以下のベクトルb、行列Aを算出する(S408)。 Next, the following vector b 4 and matrix A 4 are calculated for the target gene group selected in S407 (S408).

Figure 0004819382
Figure 0004819382

次に、「b=A」となるようなベクトルcを最小二乗法により推定する(S409)。 Next, a vector c 4 that satisfies “b 4 = A 4 c 4 ” is estimated by the least square method (S409).

そして、ベクトルcから遺伝子iに対する生成系係数α,gijを算出し、対象遺伝子組と対応させて記憶部190に登録する(S410)。生成系係数α,gijとベクトルcの関係は以下のようになる。 Then, the generation system coefficients α i and g ij for the gene i are calculated from the vector c 4 and registered in the storage unit 190 in association with the target gene set (S410). The relationship between the generation system coefficients α i , g ij and the vector c 4 is as follows.

Figure 0004819382
Figure 0004819382

このとき、対象遺伝子組に含まれない遺伝子jについて次式が成立する。   At this time, the following equation is established for a gene j not included in the target gene set.

Figure 0004819382
Figure 0004819382

なお、ベクトルbは上記ベクトルbと同じである。また、行列Aとベクトルcは、上記行列Aと上記ベクトルcが全遺伝子1〜nに対するものであるのに対して、対象遺伝子組の要素である遺伝子i〜iに対するものである。 Incidentally, the vector b 4 are as defined above vector b 2. Further, the matrix A 4 and the vector c 4 is that the above matrix A 2 and the vector c 2 is for all genes 1 to n, that for gene i 1 through i m a subject genetically element It is.

次に、S409で算出した生成系係数α,gij及び前記S203の処理で算出した分解系係数β,hijを基に、S−Systemモデルの微分方程式[式1]を数値積分して、対象遺伝子組について遺伝子iの推定遺伝子発現量を算出する(S411)。 Next, the differential equation [Equation 1] of the S-System model is numerically integrated based on the generation system coefficients α i and g ij calculated in S409 and the decomposition system coefficients β i and h ij calculated in the process of S203. Then, the estimated gene expression level of gene i is calculated for the target gene set (S411).

Figure 0004819382
Figure 0004819382

例えば、全遺伝子数を5、対象遺伝子を3番とすると、S−Systemモデルの微分方程式   For example, if the total number of genes is 5 and the target gene is number 3, the differential equation of the S-System model

Figure 0004819382
Figure 0004819382

の値を計算するために各遺伝子の発現量X,X,X,X,Xが必要になる。ここで、対象遺伝子である3番以外の発現量X,X,X,Xはスプライン補間データを使用する。そして、対象遺伝子である3番の発現量Xは、S410で算出した生成系係数α,gij、前記S203の処理で算出した分解系係数β,hij及びスプライン補間データから取得したX,X,X,Xを用い、微分方程式[式12]を積分して求める。この積分した結果が推定遺伝子発現量である。
ここで、スプライン補間データとは前記前処理(S202)でタイムコースデータをスプライン補間して表した関数から求まる値を示す。
In order to calculate the value, the expression levels X 1 , X 2 , X 3 , X 4 , and X 5 of each gene are required. Here, spline interpolation data is used for expression levels X 1 , X 2 , X 4 , and X 5 other than the No. 3 target gene. Then, the expression level X 3 of the third is the target gene, generating system coefficients calculated in S410 alpha i, g ij, acquired from the catabolic factor beta i, h ij and spline interpolation data calculated in the processing of the S203 Using X 1 , X 2 , X 4 , and X 5 , the differential equation [Formula 12] is integrated and determined. The result of this integration is the estimated gene expression level.
Here, the spline interpolation data indicates a value obtained from a function expressed by spline interpolation of the time course data in the preprocessing (S202).

次に、S411で算出した遺伝子iの推定遺伝子発現量をスプライン補間データ(非破壊株タイムコースデータ)が示す各値であるスプライン補間値と比較し、S410で算出した生成形係数α,gijに対する評価値を算出する。そして、算出した評価値を遺伝子i及び対象遺伝子組と対応させて記憶部190に登録する(S412)。 Next, the estimated gene expression level of gene i calculated in S411 is compared with spline interpolation values which are values indicated by the spline interpolation data (non-destructive strain time course data), and the generated shape coefficients α i , g calculated in S410 are compared. An evaluation value for ij is calculated. Then, the calculated evaluation value is registered in the storage unit 190 in association with the gene i and the target gene set (S412).

Figure 0004819382
Figure 0004819382

また、評価値を算出する評価関数をf (i)(L (i))で表す。
そして、評価関数は次のように表すことができる。
An evaluation function for calculating an evaluation value is represented by f v (i) (L j (i) ).
The evaluation function can be expressed as follows.

Figure 0004819382
Figure 0004819382

評価関数は算出した推定遺伝子発現量がスプライン補間値と一致性の高いほど大きな値となるように定義する。   The evaluation function is defined so that the calculated estimated gene expression level becomes larger as the coincidence with the spline interpolation value becomes higher.

Figure 0004819382
Figure 0004819382

上記のS408〜S412の処理により、S407で選択した対象遺伝子組について遺伝子iに対する生成系係数α,gij及び評価値を算出し、記憶部190に登録することができる。 Through the processing of S408 to S412, the generation system coefficients α i and g ij and the evaluation value for the gene i can be calculated and registered in the storage unit 190 for the target gene group selected in S407.

そして、生成系係数α,gij及び評価値の算出を行っていない未処理の生成系遺伝子組Lについて上記のS407〜S412の処理を行い、全ての生成系遺伝子組Lについて遺伝子iの生成系係数α,gij及び評価値を記憶部190に登録する(S413)。 Then, the processes of S407 to S412 are performed on the unprocessed generation gene set L for which the generation system coefficients α i and g ij and the evaluation values are not calculated, and the generation of the gene i is performed for all the generation gene sets L The system coefficients α i , g ij and the evaluation value are registered in the storage unit 190 (S413).

次に、記憶部190に記憶した生成系遺伝子組Lのデータ(生成系遺伝子組,生成系係数α,gij,評価値)を評価値でソートする(S414)。 Next, the data of the generation system gene set L (generation system gene set, generation system coefficients α i , g ij , evaluation value) stored in the storage unit 190 is sorted by evaluation value (S414).

上記のS402〜S414の処理により、S401で選択した遺伝子iに対する生成系係数α,gij(及び評価値)を算出し、記憶部190に登録することができる。 The generation system coefficients α i , g ij (and evaluation values) for the gene i selected in S 401 can be calculated and registered in the storage unit 190 by the processing in S 402 to S 414.

そして、生成系係数α,gij(及び評価値)を算出していない未処理の遺伝子について上記のS401〜S414の処理を行い、対象である全ての遺伝子の生成系係数α,gij(及び評価値)を記憶部190に登録する(S415)。 Then, the unprocessed genes for which the generation system coefficients α i , g ij (and evaluation values) are not calculated are processed in S401 to S414, and the generation system coefficients α i , g ij of all the genes of interest are obtained. (And the evaluation value) are registered in the storage unit 190 (S415).

前記S204の処理により、各遺伝子に対して生成系係数α,gijを算出した。
このとき、非破壊株のタイムコースデータの観測点数が「観測点数n_sp≧遺伝子数n+1」の条件を満たさない場合は、関与遺伝子の集合(生成系遺伝子組L)毎に生成系係数α,gijを算出し、且つ、評価関数によって評価した。また、各生成系遺伝子組Lの生成系係数α,gijは評価関数で算出した評価値でソートを行った。つまり、各遺伝子に対して複数(生成系遺伝子組Lの数)の生成系係数α,gijを算出した。
By the process of S204, the generation system coefficients α i and g ij were calculated for each gene.
At this time, if the number of observation points of the time course data of the non-destructive strain does not satisfy the condition “number of observation points n_sp ≧ number of genes n + 1”, the generation system coefficient α i , for each set of participating genes (generation system gene set L), g ij was calculated and evaluated by an evaluation function. Further, the generation system coefficients α i and g ij of each generation system gene set L were sorted by the evaluation values calculated by the evaluation function. That is, a plurality of generation system coefficients α i and g ij were calculated for each gene (the number of generation system gene sets L).

以下、S205〜S207の処理により、各遺伝子に対する生成系係数α,gijを連立してS−Systemモデルの微分方程式[式1]を積分して評価を行い、各遺伝子に対する最適な生成系遺伝子α,gijを取得する。 Hereinafter, by the processes of S205 to S207, the generation system coefficients α i and g ij for each gene are coupled and evaluated by integrating the differential equation [Equation 1] of the S-System model, and the optimal generation system for each gene Genes α i and g ij are acquired.

まず、第1の連立評価処理を行い、各遺伝子に対する生成系係数α,gijを登録する(連立評価1)(S205)。 First, the first simultaneous evaluation process is performed, and the generation system coefficients α i and g ij for each gene are registered (simultaneous evaluation 1) (S205).

図8は、実施の形態1における連立評価1の処理の流れを示すフローチャートである。
実施の形態1において連立遺伝子登録部141が行うS205の処理の流れについて、図8に基づいて以下に説明する。
FIG. 8 is a flowchart showing the flow of processing for simultaneous evaluation 1 in the first embodiment.
The flow of the process of S205 performed by the simultaneous gene registration unit 141 in the first embodiment will be described below based on FIG.

まず、対象である遺伝子から一つの遺伝子iitg(1)をランダムに選択する。選択した遺伝子iitg(1)は、連立評価を行う遺伝子の集合を示す連立遺伝子Mitgに登録して記憶部190に記憶する(S501)。 First, one gene i itg (1) is selected at random from the gene of interest . The selected gene i itg (1) is registered in the simultaneous gene Mitg indicating the set of genes for simultaneous evaluation and stored in the storage unit 190 (S501).

このときの連立遺伝子Mitgを「Mitg={iitg(1)}」で表す。 The simultaneous gene M itg at this time is represented by “M itg = {i itg (1) }”.

次に、S501で選択した遺伝子iitg(1)について、前記S204で記憶部190に登録した各生成系遺伝子組Lに対応する生成系遺伝子α,gijの中から最も評価値の高いものを選択する。選択した生成系係数α,gij(連立生成系係数)は遺伝子iitg(1)に対応させて記憶部190に登録する(S502)。 Next, with respect to the gene i itg (1) selected in S501, the gene having the highest evaluation value among the generation system genes α i and g ij corresponding to each generation system gene set L registered in the storage unit 190 in S204 Select. The selected generator coefficient α i , g ij (simultaneous generator coefficient) is registered in the storage unit 190 in association with the gene i itg (1) (S502).

Figure 0004819382
Figure 0004819382

次に、連立評価による評価値の最大値を設定する変数「最高スコア」に「0」を設定し、記憶部190に記憶する(S503)。   Next, “0” is set to the variable “highest score” for setting the maximum evaluation value by simultaneous evaluation and stored in the storage unit 190 (S503).

次に、連立遺伝子Mitgに登録した以外の遺伝子からランダムに遺伝子iitg(j)(仮連立遺伝子)を選択し、連立遺伝子Mitgに加えて登録する(S504)。 Next, a gene i itg (j) (provisional simultaneous gene) is selected at random from genes other than those registered in the simultaneous gene Mitg , and is registered in addition to the simultaneous gene Mitg (S504).

次に、S504で選択した遺伝子iitg(j)について、連立評価による評価値が基準値以上である生成系係数α,gijが存在することを示す変数「合格フラグ」に「0(不合格)」を設定する。
また、「最高スコア」に対応する生成系係数α,gijを設定する変数「W生成系係数」を初期化する。
各変数は記憶部190に記憶する(S505)。
Next, with respect to the gene i itg (j) selected in S504, the variable “pass flag” indicating that the generation system coefficients α i and g ij whose evaluation values by the simultaneous evaluation are equal to or higher than the reference value exists is set to “0 (not set). Pass) ”is set.
Also, the variable “W generating system coefficient” for setting the generating system coefficients α i and g ij corresponding to the “highest score” is initialized.
Each variable is stored in the storage unit 190 (S505).

次に、各遺伝子を連立評価し、各評価値が基準値以上で、且つ、連立する遺伝子全体に対する評価を示す評価値allが最高となる、遺伝子iitg(j)に対する生成系係数α,gijを抽出する(S506)。 Next, simultaneous evaluation of each gene, each evaluation value is equal to or higher than a reference value, and the generation system coefficient α i , for the gene i itg (j) , which has the highest evaluation value all indicating the evaluation of all the simultaneous genes, g ij is extracted (S506).

図9は、実施の形態1における遺伝子iitg(j)に対する生成系係数α,gijの抽出処理の流れを示すフローチャートである。
実施の形態1において連立遺伝子登録部141が行うS506の処理の流れについて、図9に基づいて以下に説明する。
FIG. 9 is a flowchart showing a flow of extraction processing of generation system coefficients α i and g ij for gene i itg (j) in the first embodiment.
The flow of the process of S506 performed by the simultaneous gene registration unit 141 in the first embodiment will be described below based on FIG.

まず、S504で選択した遺伝子iitg(j)について、前記S204で記憶部190に登録した各生成系遺伝子組Lに対応する生成系遺伝子α,gijについて評価値の高い順に選択する。選択した生成系係数αi,gij(仮連立生成系係数)は遺伝子iitg(j)に対応させて記憶部190に記憶(仮登録)する(S601)。 First, the gene i itg (j) selected in S504 is selected in descending order of the evaluation value for the generation system genes α i and g ij corresponding to each generation system gene set L registered in the storage unit 190 in S204. The selected generator coefficients αi and g ij (provisional simultaneous generator coefficients) are stored (temporarily registered) in the storage unit 190 in association with the gene i itg (j) (S601).

次に、連立遺伝子Mitgに登録した各遺伝子について、各遺伝子に対応する生成系係数α,gijを使用してS−Systemモデルの微分方程式[式1]を連立して積分し、それぞれの推定遺伝子発現量を算出する(S602)。 Next, for each gene registered in the simultaneous gene M itg , the differential equation [Equation 1] of the S-System model is integrated and integrated using the generation system coefficients α i and g ij corresponding to each gene, The estimated gene expression level is calculated (S602).

各遺伝子の推定遺伝子発現量の算出処理は前記S411と同様である。
例えば、遺伝子数が5、連立遺伝子Mitgに登録済みの遺伝子が3番で、S504の処理で新たに加えた遺伝子が5番だとする。この場合、連立遺伝子である3番と5番以外の発現量X,X,Xはスプライン補間データを使用する。そして、連立遺伝子である3番と5番の発現量X,XはそれぞれS502とS601で登録した生成系係数α,gij、前記S203の処理で算出した分解系係数β,hij及びスプライン補間データから取得したX,X,Xを用いて遺伝子3番に対する微分方程式と遺伝子5番に対する微分方程式とを連立して積分し、遺伝子3番と遺伝子5番の推定遺伝子発現量をそれぞれ算出する。
また、連立遺伝子Mitgに登録済みの遺伝子が3番と5番で、S504の処理で新たに加えた遺伝子が2番だとする。この場合、連立遺伝子である3番と5番と2番以外の発現量X,Xはスプライン補間データを使用する。そして、連立遺伝子である3番と5番と2番の発現量X,X,Xはそれぞれ登録した生成系係数α,gij、前記S203の処理で算出した分解系係数β,hij及びスプライン補間データから取得したX,Xを用いて各微分方程式を連立して積分し、遺伝子3番と遺伝子5番と遺伝子2番の推定遺伝子発現量をそれぞれ算出する。
The calculation process of the estimated gene expression level of each gene is the same as S411.
For example, it is assumed that the number of genes is 5, the number of genes registered in the simultaneous gene Mitg is No. 3, and the number of genes newly added in the processing of S504 is No. 5. In this case, spline interpolation data is used for expression levels X 1 , X 2 , and X 4 other than the 3rd and 5th simultaneous genes. The expression amounts X 3 and X 5 of the No. 3 and No. 5 simultaneous genes are the generation system coefficients α i and g ij registered in S502 and S601, respectively, and the decomposition system coefficients β i and h calculated in the processing of S203. The differential equation for gene No. 3 and the differential equation for gene No. 5 are simultaneously integrated using X 1 , X 2 , X 4 obtained from ij and spline interpolation data, and the estimated gene of gene No. 3 and No. 5 Each expression level is calculated.
In addition, it is assumed that the genes already registered in the simultaneous gene Mitg are the 3rd and 5th genes, and the gene newly added in the process of S504 is the 2nd gene. In this case, spline interpolation data is used for expression levels X 1 and X 4 other than the simultaneous genes No. 3, No. 5, and No. 2. The expression amounts X 3 , X 5 and X 2 of the simultaneous genes No. 3, No. 5 and No. 2 are respectively registered generation system coefficients α i , g ij , and decomposition system coefficient β i calculated in the process of S203. , H ij and X 1 and X 4 acquired from the spline interpolation data, the differential equations are integrated and integrated to calculate the estimated gene expression levels of gene No. 3, gene No. 5, and gene No. 2, respectively.

次に、連立遺伝子Mitgに登録した各遺伝子について、S602で算出した推定遺伝子発現量を評価し、それぞれの評価値を算出する(S603)。 Next, for each gene registered in the simultaneous gene Mitg , the estimated gene expression level calculated in S602 is evaluated, and each evaluation value is calculated (S603).

各遺伝子の推定遺伝子発現量の評価処理は前記処理(S412)と同様である。   The process of evaluating the estimated gene expression level of each gene is the same as the process (S412).

Figure 0004819382
Figure 0004819382

次に、連立遺伝子Mitgに登録した各遺伝子について、S603で算出した評価値と基準値とを比較し、全ての評価値が基準値以上(合格)であるか判定する(S604)。 Next, for each gene registered in the simultaneous gene Mitg , the evaluation value calculated in S603 is compared with the reference value, and it is determined whether all the evaluation values are equal to or higher than the reference value (pass) (S604).

S604の判定の結果が合格である場合、連立遺伝子Mitgに登録した全遺伝子についての評価を行い、評価値allを算出する(S605)。 If the result of the determination in S604 is a pass, all genes registered in the simultaneous gene Mitg are evaluated, and an evaluation value all is calculated (S605).

Figure 0004819382
Figure 0004819382

次に、S605で算出した評価値allと記憶部190に記憶した最高スコアとを比較し、評価値allが最高スコアより大きい値であるか判定する(S606)。 Next, the evaluation value all calculated in S605 is compared with the highest score stored in the storage unit 190, and it is determined whether the evaluation value all is larger than the highest score (S606).

S606の判定の結果、評価値allが最高スコアより大きい値である場合、最高スコアを評価値allで更新する。また、合格フラグに「1(合格)」を設定し、W生成系係数にS601で仮登録した遺伝子iitg(j)に対する生成系係数α,gijを設定する(S607)。 As a result of the determination in S606, when the evaluation value all is larger than the highest score, the highest score is updated with the evaluation value all . Further, “1 (pass)” is set in the pass flag, and the generation system coefficients α i and g ij for the gene i itg (j) provisionally registered in S601 are set in the W generation system coefficient (S607).

そして、生成系係数α,gijについて連立評価していない未処理の遺伝子iitg(j)の生成系遺伝子組Lについて上記のS601〜S607の処理を行い、遺伝子iitg(j)の各生成系遺伝子組Lに対する生成系係数α,gijについて連立評価する(S608)。 Then, the above-described processing of S601 to S607 is performed on the generation system gene set L of the unprocessed gene i itg (j) that has not been simultaneously evaluated for the generation system coefficients α i and g ij , and each of the genes i itg (j) is processed. The generation system coefficients α i and g ij for the generation system gene set L are simultaneously evaluated (S608).

このとき、連立評価する生成系遺伝子組Lの数を特定組数ntestに制限し、評価値が上位である生成系遺伝子組Lのみ連立評価をしてもよい。これにより、計算量を抑えることができる。 At this time, the number of generation system gene sets L to be evaluated simultaneously may be limited to the specific number n test, and only the generation system gene sets L having higher evaluation values may be subjected to simultaneous evaluation. Thereby, the amount of calculation can be suppressed.

図9に基づいて上記で説明したS506の処理により、W生成系係数にはS505で登録した遺伝子iitg(j)について連立評価で合格し最も評価値の高かった生成系係数α,gijを設定している。また、最高スコアにはその最も高かった評価値を設定している。また、合格フラグには合格した生成系係数α,gijの有無を設定している。 By the process of S506 described above based on FIG. 9, the W generation system coefficients α i and g ij that passed the simultaneous evaluation for the gene i itg (j) registered in S505 and had the highest evaluation value. Is set. The highest score is set to the highest evaluation value. In the pass flag, presence / absence of passed generation system coefficients α i and g ij is set.

次に、合格フラグにより合格した生成系係数α,gijの有無を判定する(S507)。 Next, the presence / absence of the generation system coefficients α i and g ij that have passed with the pass flag is determined (S507).

S507の判定の結果、合格した生成系係数α,gijが有る場合(合格フラグ=1)、W生成系係数に設定された生成系係数α,gij(連立生成系係数)を、連立遺伝子Mitgに登録した遺伝子iitg(j)に対応させて記憶部190に登録する(S508)。 As a result of the determination in S507, if there is a passed generation system coefficient α i , g ij (pass flag = 1), the generation system coefficient α i , g ij (simultaneous generation system coefficient) set in the W generation system coefficient is The gene is registered in the storage unit 190 in association with the gene i itg (j) registered in the simultaneous gene M itg (S508).

S507の判定の結果、合格した生成系係数α,gijが無い場合(合格フラグ=0)、遺伝子iitg(j)を連立遺伝子Mitgから削除する。また、仮登録した遺伝子iitg(j)に対する生成系係数α,gijを削除する(S509)。 As a result of the determination in S507, when there is no passed generation system coefficient α i , g ij (pass flag = 0), the gene i itg (j) is deleted from the simultaneous gene M itg . Further, the generation system coefficients α i and g ij for the temporarily registered gene i itg (j) are deleted (S509).

次に、連立遺伝子Mitgから削除した遺伝子iitg(j)を非連立遺伝子Mfailに登録し記憶部190に登録する(S510)。 Next, the gene i itg (j) deleted from the simultaneous gene M itg is registered in the non-simultaneous gene M fail and registered in the storage unit 190 (S510).

そして、連立評価していない残りの遺伝子について上記のS504〜S510の処理を行い、(最大)連立遺伝子Mitg及びそれに対応する生成系係数α,gijを記憶部190に登録する(S511)。 Then, the processing of S504 to S510 is performed on the remaining genes that have not been evaluated simultaneously, and (maximum) simultaneous genes M itg and the corresponding generation system coefficients α i and g ij are registered in the storage unit 190 (S511). .

以下、S206〜S207の処理により、各遺伝子に対する生成系係数α,gijの更新(S206)と非連立遺伝子Mfailに登録した遺伝子の連立遺伝子Mitgへの追加登録(S207)とを繰り返し、各遺伝子に対する最適な生成系遺伝子α,gijを取得する。 Thereafter, by the processes of S206 to S207, the generation system coefficients α i and g ij for each gene are updated (S206), and the additional registration of the genes registered in the non-simultaneous gene M fail to the coupled gene M itg (S207) is repeated. Then, the optimum generation system genes α i and g ij for each gene are obtained.

第2の連立評価処理により、各遺伝子に対する生成系係数α,gijの更新処理(山登り処理)を行う(連立評価2)(S206)。 In the second simultaneous evaluation process, the generation system coefficients α i and g ij for each gene are updated (mountain climbing process) (simultaneous evaluation 2) (S206).

図10は、実施の形態1における連立評価2の処理の流れを示すフローチャートである。
実施の形態1において生成系係数更新(山登り)部142が行うS206の処理の流れについて、図10に基づいて以下に説明する。
FIG. 10 is a flowchart showing a process flow of simultaneous evaluation 2 in the first embodiment.
A processing flow of S206 performed by the generation system coefficient updating (mountain climbing) unit 142 in the first embodiment will be described below with reference to FIG.

まず、連立遺伝子Mitgに登録したいずれかの遺伝子に対する生成系係数α,gijを更新したことを示す変数「山登りフラグ」に「0(山登り無し)」を設定し、記憶部190に記憶する(S701)。 First, “0 (no hill climbing)” is set in the variable “hill climbing flag” indicating that the generation system coefficients α i and g ij for any of the genes registered in the simultaneous gene M itg are updated, and stored in the storage unit 190. (S701).

次に、連立遺伝子Mitgに登録した遺伝子の中から未処理の遺伝子、つまり、生成系係数α,gijの更新を行う遺伝子iitg(j)をランダムに1つ選択する(S702)。 Next, an unprocessed gene, that is, a gene i itg (j) for updating the generation system coefficients α i and g ij is randomly selected from the genes registered in the simultaneous gene M itg (S702).

次に、S702で選択した遺伝子iitg(j)に対して更新する生成系係数α,gijの有無を示す変数「更新フラグ」に「0(更新無し)」を設定する。
また、更新する生成系係数α,gijを設定する変数「W生成系係数」を初期化する。
また、遺伝子iの登録済みの生成系係数α,gijを退避する変数「R生成系係数」に遺伝子iの登録済みの生成系係数α,gijを設定する。
各変数は記憶部190に記憶する(S703)。
Next, “0 (no update)” is set to a variable “update flag” indicating whether or not the generation system coefficients α i and g ij to be updated with respect to the gene i itg (j) selected in S702.
Also, the variable “W generating system coefficient” for setting the generating system coefficients α i and g ij to be updated is initialized.
Also, it sets the registered product based coefficients alpha i, g ij registered product based coefficients alpha i, g ij gene variable "R generated based coefficient" for saving the i gene i.
Each variable is stored in the storage unit 190 (S703).

次に、各遺伝子を連立評価し、各評価値が基準値以上で、且つ、連立する遺伝子全体に対する評価を示す評価値allが最高となる、遺伝子iitg(j)に対応する生成系係数α,gijを抽出する(S704)。 Next, each gene is evaluated in a simultaneous manner, each evaluation value is equal to or higher than a reference value, and the generation system coefficient α corresponding to the gene i itg (j) having the highest evaluation value all indicating the evaluation of all the simultaneous genes. i and g ij are extracted (S704).

S704の処理は前記S506の処理と同様である。
「更新フラグ」は前記S506における「合格フラグ」に対応する。
S704の処理により、W生成系係数にはS702で選択した遺伝子iitg(j)について連立評価で合格し最も評価値allの高かった生成系係数α,gijを設定している。また、最高スコアにはその最も高かった評価値allを設定している。また、更新フラグには更新する生成系係数α,gijの有無を設定している。
The process of S704 is the same as the process of S506.
The “update flag” corresponds to the “pass flag” in S506.
By the processing of S704, the generation system coefficients α i and g ij that pass the simultaneous evaluation for the gene i itg (j) selected in S702 and have the highest evaluation value all are set as the W generation system coefficient. The highest evaluation value all is set as the highest score. In addition, in the update flag, presence / absence of generation system coefficients α i and g ij to be updated is set.

次に、更新フラグにより更新する生成系係数α,gijの有無を判定する(S705)。 Next, it is determined whether or not the generation system coefficients α i and g ij to be updated by the update flag are present (S705).

S705の判定の結果、更新する生成系係数α,gijが有る場合(更新フラグ=1)、W生成系係数に設定された生成系係数α,gijで、遺伝子iitg(j)に登録済みの生成系係数α,gijを更新する。また、山登りフラグに「1(山登り有り)」を設定する(S706)。 As a result of the determination in S705, when there are generation system coefficients α i and g ij to be updated (update flag = 1), the gene i itg (j) is generated with the generation system coefficients α i and g ij set in the W generation system coefficient. The generation system coefficients α i and g ij registered in (1) are updated. Further, “1 (with mountain climbing)” is set in the mountain climbing flag (S706).

S705の判定の結果、更新する生成系係数α,gijが無い場合(更新フラグ=0)、S703でR生成系係数に退避した生成系係数α,gijを、連立遺伝子Mitgに登録した遺伝子iitg(j)に対応させて記憶部190に登録して元の生成系係数α,gijに戻す(S707)。 If the generation system coefficients α i and g ij to be updated are not found as a result of the determination in S705 (update flag = 0), the generation system coefficients α i and g ij saved in the R generation system coefficient in S703 are used as the simultaneous gene M itg . Corresponding to the registered gene i itg (j) , it is registered in the storage unit 190 and returned to the original generation system coefficients α i , g ij (S707).

そして、処理していない残りの遺伝子について上記のS702〜S707の処理を行い、更新した生成系係数α,gijを記憶部190に登録する(S708)。 Then, the processing of S702 to S707 is performed on the remaining genes that have not been processed, and the updated generation system coefficients α i and g ij are registered in the storage unit 190 (S708).

上記で説明した連立評価2(山登り)(S206)での連立評価時と、前記連立評価1(S205)での連立評価時とでは、連立遺伝子Mitgに登録されている遺伝子が異なるため、連立評価の結果も異なり、より適した生成系係数α,gijで更新できる場合がある。
同様に、前記連立評価1(S205)で非連立遺伝子Mfailに登録した各遺伝子を連立遺伝子Mitgに追加登録できる場合がある。
The simultaneous registration in the simultaneous evaluation 2 (mountain climbing) (S206) described above and the simultaneous evaluation in the simultaneous evaluation 1 (S205) are different because the genes registered in the simultaneous gene Mitg are different. The evaluation results are also different, and there are cases where updating can be performed with more suitable generation system coefficients α i and g ij .
Similarly, in some cases, each gene registered in the non-simultaneous gene M fail in the simultaneous evaluation 1 (S205) can be additionally registered in the simultaneous gene M itg .

そこで、第3の連立評価処理により、非連立遺伝子Mfailに登録した各遺伝子について連立遺伝子Mitgへの追加登録処理を行う(連立評価3)(S207)。 Therefore, by the third simultaneous evaluation process, an additional registration process to the simultaneous gene M itg is performed for each gene registered in the non-simultaneous gene M fail (simultaneous evaluation 3) (S207).

図11は、実施の形態1における連立評価3の処理の流れを示すフローチャートである。
実施の形態1において連立遺伝子追加登録部143が行うS207の処理の流れについて、図11に基づいて以下に説明する。
FIG. 11 is a flowchart showing a flow of processing of simultaneous evaluation 3 in the first embodiment.
The process flow of S207 performed by the simultaneous gene addition registration unit 143 in the first embodiment will be described below with reference to FIG.

まず、記憶部190を参照し、非連立遺伝子Mfailに登録した遺伝子の有無を判定する(S801)。 First, with reference to the storage unit 190, it is determined whether or not there is a gene registered in the non-simultaneous gene M fail (S801).

S801の判定の結果、非連立遺伝子Mfailに登録した遺伝子が有る場合、連立遺伝子Mitgに追加登録する遺伝子の有無を示す「連立増加フラグ」に「0(追加登録無し)」を設定し、記憶部190に記憶する(S802)。 As a result of the determination in S801, if there is a gene registered in the non-simultaneous gene M fail , “0 (no additional registration)” is set in the “simultaneous increase flag” indicating the presence / absence of the gene additionally registered in the simultaneous gene M itg , It memorize | stores in the memory | storage part 190 (S802).

次に、非連立遺伝子Mfailに登録した遺伝子の中から未処理の遺伝子、つまり、連立遺伝子Mitgに追加登録する遺伝子iitg(j)をランダムに1つ選択する(S803)。 Next, the gene unprocessed from the gene registered in the non-simultaneous gene M fail, that is, one randomly selects a gene i ITG (j) for additionally registering the simultaneous gene M itg (S803).

以下、S808を除き、S804〜S811の処理は前記S505〜S511の処理と同様である。
S808では、連立増加フラグに「1(追加登録有り)」を設定する。
Hereinafter, the processing of S804 to S811 is the same as the processing of S505 to S511, except for S808.
In S808, “1 (additional registration exists)” is set in the simultaneous increase flag.

次に、記憶部190に記憶した連立増加フラグを参照し、非連立遺伝子Mfailから連立遺伝子Mitgに追加登録した遺伝子が有るか判定する(S812)。 Next, referring to the simultaneous increase flag stored in the storage unit 190, it is determined whether there is a gene additionally registered from the non-simultaneous gene M fail to the simultaneous gene M itg (S812).

S812の判定の結果、非連立遺伝子Mfailから連立遺伝子Mitgに追加登録した遺伝子が有る場合(連立増加フラグ=1)、再度、連立評価2(山登り)処理を行う(S206)。 As a result of the determination in S812, when there is a gene additionally registered from the non-simultaneous gene M fail to the simultaneous gene M itg (simultaneous increase flag = 1), the simultaneous evaluation 2 (mountain climbing) process is performed again (S206).

連立遺伝子Mitgに登録された遺伝子が異なれば、連立評価の結果も異なるため、より適した生成系係数α,gijに更新できる場合がある。
以後、連立評価2(S206)と連立評価3(S207)を生成系係数α,gijが改善しなくなるまで繰り返す。
If the genes registered in the simultaneous gene M itg are different, the results of the simultaneous evaluation are also different. Therefore, there are cases where the generative coefficients α i and g ij can be updated more appropriately.
Thereafter, simultaneous evaluation 2 (S206) and simultaneous evaluation 3 (S207) are repeated until the generation system coefficients α i and g ij are not improved.

S812の判定の結果、非連立遺伝子Mfailから連立遺伝子Mitgに追加登録した遺伝子が無い場合(連立増加フラグ=0)、又は、S801の判定の結果、非連立遺伝子Mfailに登録した遺伝子が無い場合、記憶部190に記憶した山登りフラグを参照し、連立評価2(S206)で更新した生成系係数α,gijが有るか(山登りしたか)判定する(S813)。 As a result of the determination in S812, when there is no gene additionally registered from the non-simultaneous gene M fail to the simultaneous gene M itg (simultaneous increase flag = 0), or, as a result of the determination in S801, a gene registered in the non-simultaneous gene M fail If not, the hill-climbing flag stored in the storage unit 190 is referred to and it is determined whether the generation system coefficients α i and g ij updated in the simultaneous evaluation 2 (S206) are present (whether hill-climbed) (S813).

S813の判定の結果、更新した生成系係数α,gijが有る(山登りした)場合、再度、連立評価2(山登り)処理を行う(S206)。 As a result of the determination in S813, when the updated generation system coefficients α i and g ij are present (hill climbing), simultaneous evaluation 2 (hill climbing) processing is performed again (S206).

連立遺伝子Mitgに登録された遺伝子に対する生成系係数α,gijが異なれば、連立評価の結果も異なるため、より適した生成系係数α,gijに更新できる場合がある。
以後、連立評価2(S206)と連立評価3(S207)を生成系係数α,gijが改善しなくなるまで繰り返す。
If the generation system coefficients α i and g ij for the genes registered in the simultaneous gene Mitg are different, the result of the simultaneous evaluation is also different, so that it may be possible to update the generation system coefficients α i and g ij to be more suitable.
Thereafter, simultaneous evaluation 2 (S206) and simultaneous evaluation 3 (S207) are repeated until the generation system coefficients α i and g ij are not improved.

上記で説明したS201〜S207の処理により、破壊株または非破壊株のタイムコースデータが不足する場合であっても、S−Systemモデルの微分方程式[式1]についてより適した各係数(生成系係数,分解系係数)を取得することができる。また、各係数の取得処理において計算量を抑えることができる。
また、各係数の取得処理においてランダムな順に遺伝子を選択しているため、再度、各係数の取得処理をした場合に異なる結果が出る可能性がある。そこで、複数回に渡り各係数の取得処理を行うことで、各結果に基づいてより適した係数を取得することができる。
そして、取得した各係数によりS−Systemモデルの微分方程式[式1]を生成し、遺伝子発現相互作用について推定することができる。
Even when the time course data of the disrupted strain or the non-destroyed strain is insufficient by the processing of S201 to S207 described above, each coefficient (generation system) more suitable for the differential equation [Formula 1] of the S-System model. Coefficient, decomposition system coefficient). In addition, it is possible to reduce the amount of calculation in each coefficient acquisition process.
In addition, since genes are selected in a random order in each coefficient acquisition process, different results may be obtained when each coefficient acquisition process is performed again. Thus, by performing each coefficient acquisition process a plurality of times, a more suitable coefficient can be acquired based on each result.
Then, a differential equation [Equation 1] of the S-System model can be generated from each acquired coefficient, and the gene expression interaction can be estimated.

次に、S208で行う生成系関与遺伝子の推定処理(単独評価)について説明する。
図12は、実施の形態1における単独評価処理の流れを示すフローチャートである。
単独評価処理では、各遺伝子について遺伝子の生成に関与する(遺伝子を制御する)遺伝子(生成系関与遺伝子)の推定を行う。
実施の形態1において単独評価部150が行う単独評価処理(S208)について図12に基づいて以下に説明する。
Next, the generation system related gene estimation process (single evaluation) performed in S208 will be described.
FIG. 12 is a flowchart showing the flow of the single evaluation process in the first embodiment.
In the single evaluation process, for each gene, a gene (gene controlling gene) involved in gene generation (gene control) is estimated.
The single evaluation process (S208) performed by the single evaluation unit 150 in the first embodiment will be described below with reference to FIG.

ここで、上記で説明したS201〜S204の処理により、各遺伝子に対して、生成に関与する遺伝子の集合(生成系遺伝子組L)に対して生成系係数α,gijが算出でき、且つ、評価関数によって評価値を算出できている。 Here, the generation system coefficients α i and g ij can be calculated for a set of genes involved in generation (generation system gene set L) for each gene by the processing of S201 to S204 described above, and The evaluation value can be calculated by the evaluation function.

そこで、この評価値を、関与遺伝子毎に加算し、遺伝子毎にスコアfsgl (i)(i)を算出する(S901)。 Therefore, this evaluation value is added for each gene involved, and a score f sgl (i) (i x ) is calculated for each gene (S901).

スコアfsgl (i)(i)は次式のように表すことができる。 The score f sgl (i) (i x ) can be expressed as:

Figure 0004819382
Figure 0004819382

このスコアfsgl (i)(i)は、遺伝子iが生成系遺伝子組Lに含まれていた場合の遺伝子iに対する生成系係数の評価値の合計であり、スコアfsgl (i)(i)が大きい方ほど遺伝子iが遺伝子iを制御している可能性が高いと考られる。但し、どの生成系遺伝子組Lにも遺伝子iを含めている為、遺伝子iのスコアfsgl (i)(i)は評価対象外とする。 The score f sgl (i) (i x ) is the sum of the evaluation values of the generation system coefficients for the gene i when the gene i x is included in the generation system gene set L, and the score f sgl (i) ( It is considered that the larger i x ) is, the higher the possibility that the gene i x controls the gene i. However, since the gene i is included in any gene series L, the score f sgl (i) (i) of the gene i is not evaluated.

次に、遺伝子i以外の遺伝子iに対するスコアfsgl (i)(i)[i:1,・・・,i−1,i+1,・・・,n]を統計データに見立ててZスコアZsgl (i)(i)[i:1,・・・,i−1,i+1,・・・,n]を算出する(S902)。 Then, the score f sgl for gene i x other than gene i (i) (i x) [i x: 1, ···, i-1, i + 1, ···, n] to be likened to statistics Z score Z sgl (i) (i x ) [i x: 1, ···, i-1, i + 1, ···, n] is calculated (S902).

このZスコア値が基準値より大きいときに、その遺伝子iは遺伝子iを制御しているとする。 When the Z-score value is greater than the reference value, and the gene i x are controlled gene i.

例えば、遺伝子の数を5、遺伝子iを3番とすると、ZスコアZsgl (i)(i)は次式で表すことができる。 For example, if the number of genes is 5 and the gene i is number 3, the Z score Z sgl (i) (i x ) can be expressed by the following equation.

Figure 0004819382
Figure 0004819382

次に、S902で算出したZスコアZsgl (i)(i)に基づいて統計処理により生成系関与遺伝子を推定する(S903)。 Next, the gene involved in the generation system is estimated by statistical processing based on the Z score Z sgl (i) (i x ) calculated in S902 (S903).

上記で説明した単独評価処理(S208)により、少ない計算量で各遺伝子について生成系遺伝子の推定を行うことができる。   By the single evaluation process (S208) described above, it is possible to estimate a gene for a gene for each gene with a small amount of calculation.

参考例1における遺伝子発現相互作用推定方法の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the gene expression interaction estimation method in Reference Example 1. 実施の形態1における遺伝子発現相互作用推定装置100の外観を示す図。FIG. 3 shows an appearance of a gene expression interaction estimation apparatus 100 according to the first embodiment. 実施の形態1における遺伝子発現相互作用推定装置100のハードウェア構成図。FIG. 3 is a hardware configuration diagram of the gene expression interaction estimation device 100 according to the first embodiment. 実施の形態1における遺伝子発現相互作用推定装置100の構成図。1 is a configuration diagram of a gene expression interaction estimation apparatus 100 according to Embodiment 1. FIG. 実施の形態1における遺伝子発現相互作用推定方法の処理の流れを示すフローチャート。5 is a flowchart showing a processing flow of a gene expression interaction estimation method according to Embodiment 1. 実施の形態1における分解系係数の推定/登録の処理の流れを示すフローチャート。5 is a flowchart showing a flow of processing for estimation / registration of decomposition system coefficients in the first embodiment. 実施の形態1における生成系係数の推定/登録の処理の流れを示すフローチャート。6 is a flowchart showing a flow of processing for estimating / registering a generation system coefficient in the first embodiment. 実施の形態1における連立評価1の処理の流れを示すフローチャート。5 is a flowchart showing a flow of processing for simultaneous evaluation 1 in the first embodiment. 実施の形態1における遺伝子iitg(j)に対する生成系係数α,gijの抽出処理の流れを示すフローチャート。9 is a flowchart showing a flow of extraction processing for generating system coefficients α i and g ij for gene i itg (j) in the first embodiment. 実施の形態1における連立評価2の処理の流れを示すフローチャート。4 is a flowchart showing a flow of simultaneous evaluation 2 processing in the first embodiment. 実施の形態1における連立評価3の処理の流れを示すフローチャート。5 is a flowchart showing a flow of processing for simultaneous evaluation 3 in the first embodiment. 実施の形態1における単独評価処理の流れを示すフローチャート。5 is a flowchart showing the flow of a single evaluation process in the first embodiment.

符号の説明Explanation of symbols

100 遺伝子発現相互作用推定装置、110 前処理部、120 分解系係数推定部、130 生成系係数推定部、140 連立評価部、141 連立遺伝子登録部、142 生成系係数更新(山登り)部、143 連立遺伝子追加登録部、150 単独評価部、190 記憶部、901 CRT表示装置、902 K/B、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 FAX機、940 インターネット、941 ウェブサーバ、942 LAN。   DESCRIPTION OF SYMBOLS 100 Gene expression interaction estimation apparatus, 110 Pre-processing part, 120 Decomposition system coefficient estimation part, 130 Generation system coefficient estimation part, 140 Simultaneous evaluation part, 141 Simultaneous gene registration part, 142 Generation system coefficient update (mountain climbing) part, 143 Simultaneous Gene addition registration unit, 150 single evaluation unit, 190 storage unit, 901 CRT display device, 902 K / B, 903 mouse, 904 FDD, 905 CDD, 906 printer device, 907 scanner device, 910 system unit, 911 CPU, 912 bus 913 ROM, 914 RAM, 915 communication board, 920 magnetic disk device, 921 OS, 922 window system, 923 program group, 924 file group, 931 telephone, 932 FAX machine, 940 Internet, 941 web server, 94 2 LAN.

Claims (15)

n個(nは1以上の整数)の遺伝子に含まれる遺伝子i(1≦i≦n)の発現速度を求めるS−Systemモデルの発現速度式であって遺伝子iの分解系係数を含んだS−Systemモデルの発現速度式に含まれる遺伝子iの分解系係数を算出する発現速度式生成装置において、This is an expression rate expression of an S-System model for obtaining an expression rate of a gene i (1 ≦ i ≦ n) included in n genes (n is an integer of 1 or more), and includes a decomposition system coefficient of the gene i. -In an expression rate expression generation device for calculating a decomposition system coefficient of gene i included in an expression rate expression of a System model,
各時刻に観測された遺伝子iの発現量を示す破壊株のタイムコースデータを外部装置から入力する前処理部と、A preprocessing unit for inputting time course data of the disrupted strain indicating the expression level of the gene i observed at each time from an external device;
前記前処理部が入力した破壊株のタイムコースデータに示される遺伝子iの発現量の数とn+1とをCPU(Central Processing Unit)を用いて比較し、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上であるか否かをCPUを用いて判定し、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、遺伝子iの分解に関与する遺伝子を遺伝子iだけとする条件で、前記破壊株のタイムコースデータに示される遺伝子iの発現量に基づいて最小二乗法により遺伝子iの分解系係数をCPUを用いて算出する分解系係数推定部とThe number of expression levels of gene i indicated in the time course data of the disrupted strain input by the pre-processing unit and n + 1 are compared using a CPU (Central Processing Unit), and the gene indicated in the time course data of the disrupted strain It is determined whether or not the number of expression levels of i is n + 1 or more using a CPU, and when the number of expression levels of gene i indicated in the time course data of the disrupted strain is not n + 1 or more, the decomposition of gene i Decomposition system coefficient that uses a CPU to calculate the degradation system coefficient of gene i by the least squares method based on the expression level of gene i shown in the time course data of the disrupted strain under the condition that only gene i is involved Estimator and
を備えることを特徴とする発現速度式生成装置。The expression rate type | formula production | generation apparatus characterized by the above-mentioned.
前記S−Systemモデルの発現速度式は遺伝子iの生成系係数を含み、The expression rate equation of the S-System model includes a generation coefficient of gene i,
前記前処理部は、各時刻に観測された遺伝子iの発現量を示す非破壊株のタイムコースデータを入力し、The pre-processing unit inputs time course data of a non-destructive strain indicating the expression level of the gene i observed at each time,
前記発現速度式生成装置は、さらに、The expression rate expression generator further includes:
前記前処理部が入力した非破壊株のタイムコースデータに示される遺伝子iの発現量の数とn+1とをCPUを用いて比較し、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上であるか否かをCPUを用いて判定し、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がm+1(mは1以上の整数)以上となるmを遺伝子iの生成に関与する遺伝子の数とする条件で、前記非破壊株のタイムコースデータに示される遺伝子iの発現量に基づいて最小二乗法により遺伝子iの生成系係数をCPUを用いて算出する生成系係数推定部を備えるThe number of expression levels of gene i indicated in the time course data of the non-destructive strain input by the pre-processing unit and n + 1 are compared using a CPU, and the expression of gene i indicated in the time course data of the non-destructive strain is expressed. It is determined whether or not the number of quantities is n + 1 or more by using a CPU, and when the number of expression levels of gene i indicated in the time course data of the non-destructive strain is not n + 1 or more, the time course of the non-destructive strain In the time course data of the non-destructive strain, the number of genes i expressed in the data is m + 1 (m is an integer of 1 or more) and m is the number of genes involved in the generation of gene i. A generation system coefficient estimation unit is provided that calculates a generation system coefficient of gene i using a CPU based on the expression level of gene i indicated by the least square method.
ことを特徴とする請求項1記載の発現速度式生成装置。The expression rate type | formula production | generation apparatus of Claim 1 characterized by the above-mentioned.
前記S−Systemモデルの発現速度式は、遺伝子iの分解系係数βThe expression rate equation of the S-System model is expressed by a decomposition system coefficient β of gene i. i と遺伝子iに対する遺伝子j(1≦j≦n)の分解系の相互作用係数hInteraction coefficient h of gene j (1 ≦ j ≦ n) with respect to gene i ijij とを含んだ式(1)で表される式であり、And an expression represented by the expression (1) including:
前記前処理部は、入力した破壊株のタイムコースデータに示される遺伝子iの発現量に対応する対数値の微係数を算出し、The preprocessing unit calculates a differential coefficient of logarithmic value corresponding to the expression level of the gene i indicated in the time course data of the input disrupted strain,
前記分解系係数推定部は、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記破壊株のタイムコースデータに示される遺伝子iの発現量と前記前処理部により算出された対数値の微係数とを用いて式(2)で表されるベクトルbWhen the number of expression levels of the gene i indicated in the time course data of the disrupted strain is not n + 1 or more, the degradation system coefficient estimation unit determines the expression level of the gene i indicated in the time course data of the disrupted strain and the preprocessing Vector b expressed by equation (2) using the logarithmic value derivative calculated by the unit 3 と式(3)で表される行列AAnd the matrix A represented by the equation (3) 3 とを算出し、「bAnd "b 3 =A= A 3 c 3 」を満たすベクトルcC satisfying " 3 を最小二乗法により推定し、推定したベクトルcIs estimated by the least square method, and the estimated vector c 3 と式(4)と式(5)とを用いて遺伝子iの分解系係数βAnd the decomposition coefficient β of the gene i using the equations (4) and (5) i と遺伝子iに対する遺伝子jの分解系の相互作用係数hCoefficient h of the degradation system of gene j with respect to gene i ijij とを算出するAnd calculate
ことを特徴とする請求項2記載の発現速度式生成装置。The expression rate type | formula production | generation apparatus of Claim 2 characterized by the above-mentioned.
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
前記生成系係数推定部は、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がm+1以上となるmと式(6)とに基づいて複数の生成系遺伝子組Lを生成し、生成系遺伝子組L毎に式(7)で表されるベクトルbWhen the number of expression levels of the gene i indicated in the time course data of the non-destructive strain is not n + 1 or more, the generation system coefficient estimation unit determines the number of expression levels of the gene i indicated in the time course data of the non-destructive strain A plurality of generative gene sets L are generated based on m with m + 1 or more and formula (6), and a vector b represented by formula (7) for each generative gene set L 4 と式(8)で表される行列AAnd a matrix A represented by equation (8) 4 とを算出し、「bAnd "b 4 =A= A 4 c 4 」を満たすベクトルcC satisfying " 4 を最小二乗法により推定し、推定したベクトルcIs estimated by the least square method, and the estimated vector c 4 と式(9)と式(10)とに基づいてS−Systemモデルの発現速度式(1)に含まれる遺伝子iの生成系係数αAnd the expression coefficient α of the gene i included in the expression rate expression (1) of the S-System model based on Expression (9) and Expression (10) i と遺伝子iに対する遺伝子jの生成系の相互作用係数gInteraction coefficient g of gene j with respect to gene i ijij とを算出するAnd calculate
ことを特徴とする請求項3記載の発現速度式生成装置。The expression rate type | formula production | generation apparatus of Claim 3 characterized by the above-mentioned.
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
前記生成系係数推定部は、生成系遺伝子組L毎に算出した生成系係数αThe generating system coefficient estimation unit calculates the generating system coefficient α calculated for each generating system gene set L. i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij と、前記分解系係数推定部により算出された分解系係数βAnd the decomposition system coefficient β calculated by the decomposition system coefficient estimation unit i と分解系の相互作用係数hCoefficient h ijij とに基づいてS−Systemモデルの発現速度式(1)を数値積分して生成系遺伝子組L毎に遺伝子iの推定遺伝子発現量をCPUを用いて算出し、算出した遺伝子iの推定遺伝子発現量と前記非破壊株タイムコースデータに示される発現量と式(11)とに基づいて生成系遺伝子組L毎に生成系係数αBased on the above, the expression rate expression (1) of the S-System model is numerically integrated to calculate the estimated gene expression level of the gene i for each generation gene set L using the CPU, and the estimated gene expression of the calculated gene i is calculated. The production system coefficient α for each production system gene set L based on the expression level and the expression level indicated in the non-destructive strain time course data and the equation (11) i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とに対する評価値をCPUを用いて算出するThe evaluation value for and is calculated using the CPU
ことを特徴とする請求項4記載の発現速度式生成装置。The expression rate expression generation device according to claim 4.
Figure 0004819382
Figure 0004819382
前記発現速度式生成装置は、さらに、The expression rate expression generator further includes:
前記生成系係数推定部により生成系遺伝子組L毎に算出された生成系係数αThe production system coefficient α calculated for each production system gene set L by the production system coefficient estimation unit i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とに対する評価値と式(12)とに基づいて生成系遺伝子組Lに含まれる遺伝子iThe gene i included in the gene family L based on the evaluation value for and the expression (12) x 毎に遺伝子iEvery gene i x のスコアをCPUを用いて算出し、遺伝子iIs calculated using the CPU, and the gene i x 毎に算出した遺伝子iGene i calculated for each x のスコアと式(13)とに基づいて遺伝子iAnd the gene i based on the score of (13) x 毎に遺伝子iEvery gene i x のZスコアをCPUを用いて算出し、遺伝子iThe Z score of is calculated using a CPU and gene i x 毎に算出した遺伝子iGene i calculated for each x のZスコアに基づいて遺伝子iの生成に関与する生成系関与遺伝子をCPUを用いて推定する単独評価部を備えるA single evaluation unit that uses a CPU to estimate a gene involved in the generation system involved in the generation of gene i based on the Z score of
ことを特徴とする請求項5記載の発現速度式生成装置。The expression rate expression generation device according to claim 5.
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
前記生成系係数推定部は、遺伝子iを除いた残りの遺伝子毎に生成系遺伝子組Lを生成し、生成した生成系遺伝子組Lの生成系係数αThe generating system coefficient estimation unit generates a generating system gene set L for each of the remaining genes excluding the gene i, and the generating system coefficient α of the generated generating system gene set L i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とを算出し、And
前記生成系係数推定部は、遺伝子iを除いた残りの遺伝子それぞれの生成系遺伝子組L毎に生成系係数αThe generating system coefficient estimation unit generates the generating system coefficient α for each generating system gene set L of each of the remaining genes excluding the gene i. i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とに対する評価値を算出し、And the evaluation value for
前記発現速度式生成装置は、さらに、The expression rate expression generator further includes:
前記生成系係数推定部により算出された遺伝子iの各生成系遺伝子組Lの生成系係数αThe generative coefficient α of each generative gene set L of gene i calculated by the generative coefficient estimation unit i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とのうち前記生成系係数推定部により算出された評価値が最も高い生成系係数αThe generation coefficient α having the highest evaluation value calculated by the generation coefficient estimation unit i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とをS−Systemモデルの発現速度式(1)に使用する遺伝子iの連立生成系係数として記憶装置に登録し、n個の遺伝子から遺伝子i以外の遺伝子を仮連立遺伝子としてランダムに一つずつ選択し、選択した仮連立遺伝子を連立遺伝子MAre registered in the storage device as simultaneous generation system coefficients of the gene i used in the expression rate equation (1) of the S-System model, and genes other than the gene i from the n genes are randomly selected as temporary simultaneous genes one by one Select the selected temporary simultaneous gene as the simultaneous gene M itgitg として登録し、前記生成系係数推定部により算出された仮連立遺伝子の各生成系遺伝子組Lの生成系係数αAnd the generation system coefficient α of each generation system gene set L of the temporary simultaneous genes calculated by the generation system coefficient estimation unit i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とから前記生成系係数推定部により算出された評価値が高い順に仮連立遺伝子の生成系係数αThe generation coefficient α of the temporary simultaneous gene in descending order of the evaluation value calculated by the generation coefficient estimation unit i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とを仮連立遺伝子の連立生成系係数として選択し、遺伝子iの連立生成系係数を用いて遺伝子iの発現速度式(1)を生成し、仮連立遺伝子の連立生成系係数を用いて仮連立遺伝子の発現速度式(1)を生成し、遺伝子iの発現速度式(1)と仮連立遺伝子の発現速度式(1)とを連立して積分し、遺伝子iの推定遺伝子発現量と仮連立遺伝子の推定遺伝子発現量とを算出し、遺伝子iの推定遺伝子発現量と式(11)とに基づいて遺伝子iの連立生成系係数に対する評価値を算出し、仮連立遺伝子の推定遺伝子発現量と式(11)とに基づいて仮連立遺伝子の連立生成系係数に対する評価値を算出し、遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値とを所定の基準値と比較し、遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値とが基準値以上である場合、遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値との合計値を評価値Is selected as the simultaneous generation coefficient of the temporary simultaneous gene, the expression rate expression (1) of the gene i is generated using the simultaneous generation system coefficient of the gene i, and the temporary simultaneous generation is performed using the simultaneous generation system coefficient of the temporary simultaneous gene. Gene expression rate expression (1) is generated, and expression rate expression (1) for gene i and expression rate expression (1) for temporary simultaneous genes are integrated and integrated, and the estimated gene expression level of gene i and temporary simultaneous expression An estimated gene expression level of the gene is calculated, an evaluation value for the simultaneous generation system coefficient of the gene i is calculated based on the estimated gene expression level of the gene i and the formula (11), and the estimated gene expression level of the temporary simultaneous gene Based on the equation (11), an evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene is calculated, and an evaluation value for the simultaneous generation system coefficient of the gene i and an evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene are set to a predetermined criterion. Compared to the value, simultaneous generation of gene i When the evaluation value for the system coefficient and the evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene are greater than or equal to the reference value, the evaluation value for the simultaneous generation system coefficient of the gene i and the evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene Total value is evaluated value allall として算出し、仮連立遺伝子の各生成系遺伝子組Lの連立生成系係数のうち遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値とが基準値以上になる仮連立遺伝子の生成系遺伝子組Lの連立生成系係数が存在しなかった場合、仮連立遺伝子を連立遺伝子MAnd the evaluation value for the simultaneous generation system coefficient of the gene i and the evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene are equal to or greater than the reference value. If there are no simultaneous generative coefficients for the gene set L of the temporary gene, the temporary gene is assigned to the gene M itgitg から削除し、仮連立遺伝子の各生成系遺伝子組Lの連立生成系係数のうち遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値とが基準値以上になる生成系遺伝子組Lの連立生成系係数が存在した場合、評価値The evaluation value for the simultaneous generation system coefficient of the gene i and the evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene are equal to or greater than the reference value. If there is a simultaneous generation system coefficient of the generation system gene set L, the evaluation value allall が最も高い連立生成系係数を仮連立遺伝子の連立生成系係数として記憶装置に登録する連立評価部を備えるA simultaneous evaluation unit that registers the highest simultaneous generation coefficient in the storage device as the simultaneous generation coefficient of the temporary simultaneous gene
ことを特徴とする請求項5または請求項6記載の発現速度式生成装置。The expression rate expression generation device according to claim 5 or 6, characterized in that
前記連立評価部は、新たな仮連立遺伝子をランダムに選択し、選択した新たな仮連立遺伝子を連立遺伝子MThe simultaneous evaluation unit randomly selects a new temporary simultaneous gene, and selects the selected new temporary simultaneous gene as the simultaneous gene M. itgitg に追加し、前記生成系係数推定部により算出された評価値が高い順に新たな仮連立遺伝子の連立生成系係数を選択し、選択した連立生成系係数を用いて新たな仮連立遺伝子の発現速度式(1)を生成し、遺伝子iの発現速度式(1)と仮連立遺伝子の発現速度式(1)と新たな仮連立遺伝子の発現速度式(1)とを連立して積分し、遺伝子iの推定遺伝子発現量と仮連立遺伝子の推定遺伝子発現量と新たな仮連立遺伝子の推定遺伝子発現量とを算出し、遺伝子iの連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値と新たな仮連立遺伝子の連立生成系係数に対する評価値とを算出し、算出した各評価値が基準値以上である場合、算出した各評価値の合計値を評価値In addition, a new temporary simultaneous gene coefficient is selected in descending order of the evaluation value calculated by the generating system coefficient estimation unit, and the expression rate of the new temporary simultaneous gene is selected using the selected simultaneous generation system coefficient. Generating the expression (1), integrating the expression rate expression (1) of the gene i, the expression speed expression (1) of the temporary simultaneous gene, and the expression speed expression (1) of the new temporary simultaneous gene, Calculate the estimated gene expression level of i, the estimated gene expression level of the temporary simultaneous gene, and the estimated gene expression level of the new temporary simultaneous gene, the evaluation value for the simultaneous generation system coefficient of gene i and the simultaneous generation system coefficient of the temporary simultaneous gene And the evaluation value for the simultaneous generation system coefficient of the new temporary simultaneous gene is calculated, and when each calculated evaluation value is equal to or higher than the reference value, the total value of the calculated evaluation values is calculated as the evaluation value. allall として算出し、算出した各評価値が基準値以上になる新たな仮連立遺伝子の連立生成系係数が存在しなかった場合、仮連立遺伝子を連立遺伝子MIf there is no simultaneous generation coefficient of a new temporary simultaneous gene whose calculated evaluation value is equal to or greater than the reference value, the temporary simultaneous gene is determined as the simultaneous gene M. itgitg から削除し、算出した各評価値が基準値以上になる新たな仮連立遺伝子の連立生成系係数が存在した場合、評価値If there is a simultaneous generation coefficient of a new temporary simultaneous gene whose calculated evaluation value exceeds the reference value, the evaluation value allall が最も高い連立生成系係数を新たな仮連立遺伝子の連立生成系係数として記憶装置に登録するRegister the highest simultaneous generative coefficient to the storage device as a new temporary gene gene
ことを特徴とする請求項7記載の発現速度式生成装置。The expression rate type | formula production | generation apparatus of Claim 7 characterized by the above-mentioned.
前記連立評価部は、連立遺伝子MThe simultaneous evaluation unit is a simultaneous gene M itgitg として登録されている遺伝子から遺伝子をランダムに一つずつ選択し、選択した遺伝子の各生成系遺伝子組Lの生成系係数αGene is selected one by one from the genes registered as, and the generation coefficient α of each generation gene set L of the selected gene i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とから前記生成系係数推定部により算出された評価値が高い順に選択した遺伝子の連立生成系係数を選択し、選択した連立生成系係数を用いて選択した遺伝子の発現速度式(1)を生成し、遺伝子iの発現速度式(1)と選択した遺伝子の発現速度式(1)と選択した遺伝子以外の連立遺伝子MFrom the above, the simultaneous generation system coefficients of the genes selected in descending order of the evaluation value calculated by the generation system coefficient estimation unit are selected, and the expression rate expression (1) of the selected gene is generated using the selected simultaneous generation system coefficients Expression rate formula (1) of gene i, expression rate formula (1) of the selected gene, and simultaneous genes M other than the selected gene itgitg の発現速度式(1)とを連立して積分し、遺伝子iの推定遺伝子発現量と選択した遺伝子の推定遺伝子発現量と選択した遺伝子以外の連立遺伝子MThe expression rate expression (1) is integrated and integrated, and the estimated gene expression level of gene i, the estimated gene expression level of the selected gene, and the simultaneous gene M other than the selected gene itgitg の推定遺伝子発現量とを算出し、遺伝子iの連立生成系係数に対する評価値と選択した遺伝子の連立生成系係数に対する評価値と選択した遺伝子以外の連立遺伝子MThe estimated gene expression level of the gene i is calculated, the evaluation value for the simultaneous generation system coefficient of the gene i, the evaluation value for the simultaneous generation system coefficient of the selected gene, and the simultaneous gene M other than the selected gene itgitg の連立生成系係数に対する評価値とを算出し、算出した各評価値が基準値以上である場合、算出した各評価値の合計値を評価値The evaluation value for the simultaneous generation system coefficient is calculated, and when each calculated evaluation value is greater than or equal to the reference value, the total value of the calculated evaluation values is the evaluation value. allall として算出し、算出した評価値And calculated evaluation value allall が選択した遺伝子の登録されている連立生成系係数の評価値Evaluation value of registered simultaneous system coefficient of gene selected by allall より大きな値である場合、選択した遺伝子の登録されている連立生成系係数を選択した連立生成系係数で更新するIf the value is larger, update the registered simultaneous generator coefficient of the selected gene with the selected simultaneous generator coefficient.
ことを特徴とする請求項8記載の発現速度式生成装置。The expression rate expression generation device according to claim 8.
前記連立評価部は、n個の遺伝子のうち遺伝子iと連立遺伝子MThe simultaneous evaluation unit includes the gene i and the simultaneous gene M among n genes. itgitg とを除いた非連立遺伝子MNon-cognate gene M excluding failfail から仮連立遺伝子をランダムに一つずつ選択し、選択した仮連立遺伝子を連立遺伝子MThe temporary simultaneous genes are selected one by one at random, and the selected temporary simultaneous genes are selected as the simultaneous genes M. itgitg に追加し、仮連立遺伝子の各生成系遺伝子組Lの生成系係数αAnd the generation coefficient α of each generation gene set L of the provisional simultaneous gene i と生成系の相互作用係数gAnd generation system interaction coefficient g ijij とから前記生成系係数推定部により算出された評価値が高い順に仮連立遺伝子の連立生成系係数を選択し、選択した連立生成系係数を用いて仮連立遺伝子の発現速度式(1)を生成し、遺伝子iの発現速度式(1)と連立遺伝子MFrom the above, the simultaneous generation system coefficients of the temporary simultaneous gene are selected in descending order of the evaluation value calculated by the generation system coefficient estimation unit, and the expression rate expression (1) of the temporary simultaneous gene is generated using the selected simultaneous generation system coefficient And the expression rate expression (1) of gene i and the coupled gene M itgitg の発現速度式(1)と仮連立遺伝子の発現速度式(1)とを連立して積分し、遺伝子iの推定遺伝子発現量と連立遺伝子MThe expression rate equation (1) of the gene and the expression rate equation (1) of the temporary simultaneous gene are integrated and integrated, and the estimated gene expression level of the gene i and the simultaneous gene M itgitg の推定遺伝子発現量と仮連立遺伝子の推定遺伝子発現量とを算出し、遺伝子iの連立生成系係数に対する評価値と連立遺伝子MThe estimated gene expression level of the gene and the estimated gene expression level of the temporary simultaneous gene are calculated, and the evaluation value for the simultaneous generation system coefficient of the gene i and the simultaneous gene M itgitg の連立生成系係数に対する評価値と仮連立遺伝子の連立生成系係数に対する評価値とを算出し、算出した各評価値が基準値以上である場合、算出した各評価値の合計値を評価値Calculate the evaluation value for the simultaneous generation system coefficient of and the evaluation value for the simultaneous generation system coefficient of the temporary simultaneous gene. If each evaluation value is equal to or greater than the reference value, the total value of the calculated evaluation values is the evaluation value. allall として算出し、算出した各評価値が基準値以上になる仮連立遺伝子の連立生成系係数が存在しなかった場合、仮連立遺伝子を連立遺伝子MIf there is no simultaneous generation coefficient of the temporary simultaneous gene for which each calculated evaluation value is equal to or greater than the reference value, the temporary simultaneous gene is determined as the simultaneous gene M. itgitg から削除し、算出した各評価値が基準値以上になる仮連立遺伝子の連立生成系係数が存在した場合、評価値If there is a simultaneous generation system coefficient of a temporary simultaneous gene that is deleted from allall が最も高い連立生成系係数を仮連立遺伝子の連立生成系係数として記憶装置に登録するRegister the highest simultaneous generative coefficient to the storage device as the simultaneous generative coefficient of the temporary gene
ことを特徴とする請求項9記載の発現速度式生成装置。The expression rate type | formula production | generation apparatus of Claim 9 characterized by the above-mentioned.
n個(nは1以上の整数)の遺伝子に含まれる遺伝子i(1≦i≦n)の発現速度を求めるS−Systemモデルの発現速度式であって遺伝子iの分解系係数を含んだS−systemモデルの発現速度式に含まれる遺伝子iの分解系係数を算出する発現速度式生成装置の発現速度式生成方法において、This is an expression rate expression of an S-System model for obtaining an expression rate of a gene i (1 ≦ i ≦ n) included in n genes (n is an integer of 1 or more), and includes a decomposition system coefficient of the gene i. In the expression rate expression generation method of the expression rate expression generation device that calculates the decomposition system coefficient of the gene i included in the expression rate expression of the system model,
前処理部が、各時刻に観測された遺伝子iの発現量を示す破壊株のタイムコースデータを外部装置から入力し、The preprocessing unit inputs time course data of the disrupted strain indicating the expression level of the gene i observed at each time from an external device,
分解系係数推定部が、前記前処理部が入力した破壊株のタイムコースデータに示される遺伝子iの発現量の数とn+1とをCPU(Central Processing Unit)を用いて比較し、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上であるか否かをCPUを用いて判定し、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、遺伝子iの分解に関与する遺伝子を遺伝子iだけとする条件で、前記破壊株のタイムコースデータに示される遺伝子iの発現量に基づいて最小二乗法により遺伝子iの分解系係数をCPUを用いて算出するThe degradation system coefficient estimation unit compares the number of expression levels of gene i indicated in the time course data of the disrupted strain input by the preprocessing unit with n + 1 using a CPU (Central Processing Unit), and It is determined whether or not the number of gene i expressed in the time course data is n + 1 or more using the CPU, and the number of gene i expressed in the time course data of the disrupted strain is not n + 1 or more. In this case, under the condition that only the gene i is involved in the degradation of the gene i, the degradation coefficient of the gene i is calculated by the least square method based on the expression level of the gene i indicated in the time course data of the disrupted strain. Calculate using
ことを特徴とする発現速度式生成方法。An expression rate expression generation method characterized by the above.
前記S−Systemモデルの発現速度式は遺伝子iの生成系係数を含み、The expression rate equation of the S-System model includes a generation coefficient of gene i,
前記前処理部は、各時刻に観測された遺伝子iの発現量を示す非破壊株のタイムコースデータを入力し、The pre-processing unit inputs time course data of a non-destructive strain indicating the expression level of the gene i observed at each time,
前記発現速度式生成装置は、さらに、The expression rate expression generator further includes:
生成系係数推定部が、前記前処理部が入力した非破壊株のタイムコースデータに示される遺伝子iの発現量の数とn+1とをCPUを用いて比較し、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上であるか否かをCPUを用いて判定し、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がm+1(mは1以上の整数)以上となるmを遺伝子iの生成に関与する遺伝子の数とする条件で、前記非破壊株のタイムコースデータに示される遺伝子iの発現量に基づいて最小二乗法により遺伝子iの生成系係数をCPUを用いて算出するThe generation system coefficient estimation unit compares the number of expression levels of the gene i indicated in the time course data of the non-destructive strain input by the preprocessing unit with n + 1 using a CPU, and the time course data of the non-destructive strain Whether the number of expression levels of gene i shown in (b) is n + 1 or more using a CPU, and if the number of expression levels of gene i shown in the time course data of the non-destructive strain is not n + 1 or more, On the condition that m is the number of genes involved in the generation of gene i, where the number of expression levels of gene i indicated in the time course data of the non-destructive strain is m + 1 (m is an integer of 1 or more) Based on the expression level of the gene i shown in the time course data of the disrupted strain, the gene i generation system coefficient is calculated by the CPU using the least square method.
ことを特徴とする請求項11記載の発現速度式生成方法。The expression rate expression generation method according to claim 11.
前記S−Systemモデルの発現速度式は、遺伝子iの分解系係数βThe expression rate equation of the S-System model is expressed by a decomposition system coefficient β of gene i. i と遺伝子iに対する遺伝子j(1≦j≦n)の分解系の相互作用係数hInteraction coefficient h of gene j (1 ≦ j ≦ n) with respect to gene i ijij とを含んだ式(1)で表される式であり、And an expression represented by the expression (1) including:
前記前処理部は、入力した破壊株のタイムコースデータに示される遺伝子iの発現量に対応する対数値の微係数を算出し、The preprocessing unit calculates a differential coefficient of logarithmic value corresponding to the expression level of the gene i indicated in the time course data of the input disrupted strain,
前記分解系係数推定部は、前記破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記破壊株のタイムコースデータに示される遺伝子iの発現量と前記前処理部により算出された対数値の微係数とを用いて式(2)で表されるベクトルbWhen the number of expression levels of the gene i indicated in the time course data of the disrupted strain is not n + 1 or more, the degradation system coefficient estimation unit determines the expression level of the gene i indicated in the time course data of the disrupted strain and the preprocessing Vector b expressed by equation (2) using the logarithmic value derivative calculated by the unit 3 と式(3)で表される行列AAnd the matrix A represented by the equation (3) 3 とを算出し、「bAnd "b 3 =A= A 3 c 3 」を満たすベクトルcC satisfying " 3 を最小二乗法により推定し、推定したベクトルcIs estimated by the least square method, and the estimated vector c 3 と式(4)と式(5)とを用いて遺伝子iの分解系係数βAnd the decomposition coefficient β of the gene i using the equations (4) and (5) i と遺伝子iに対する遺伝子jの分解系の相互作用係数hCoefficient h of the degradation system of gene j with respect to gene i ijij とを算出するAnd calculate
ことを特徴とする請求項12記載の発現速度式生成方法。The expression rate expression generation method according to claim 12.
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
前記生成系係数推定部は、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がn+1以上でない場合、前記非破壊株のタイムコースデータに示される遺伝子iの発現量の数がm+1以上となるmと式(6)とに基づいて複数の生成系遺伝子組Lを生成し、生成系遺伝子組L毎に式(7)で表されるベクトルbWhen the number of expression levels of the gene i indicated in the time course data of the non-destructive strain is not n + 1 or more, the generation system coefficient estimation unit determines the number of expression levels of the gene i indicated in the time course data of the non-destructive strain A plurality of generative gene sets L are generated based on m with m + 1 or more and formula (6), and a vector b represented by formula (7) for each generative gene set L 4 と式(8)で表される行列AAnd a matrix A represented by equation (8) 4 とを算出し、「bAnd "b 4 =A= A 4 c 4 」を満たすベクトルcC satisfying " 4 を最小二乗法により推定し、推定したベクトルcIs estimated by the least square method, and the estimated vector c 4 と式(9)と式(10)とに基づいてS−Systemモデルの発現速度式(1)に含まれる遺伝子iの生成系係数αAnd the expression coefficient α of the gene i included in the expression rate expression (1) of the S-System model based on Expression (9) and Expression (10) i と遺伝子iに対する遺伝子jの生成系の相互作用係数gInteraction coefficient g of gene j with respect to gene i ijij とを算出するAnd calculate
ことを特徴とする請求項13記載の発現速度式生成方法。The expression rate expression generation method according to claim 13.
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
Figure 0004819382
請求項11から請求項14いずれかに記載の発現速度式生成方法をコンピュータに実行させる発現速度式生成プログラム。An expression rate expression generation program for causing a computer to execute the expression rate expression generation method according to claim 11.
JP2005083677A 2005-03-23 2005-03-23 Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program Expired - Fee Related JP4819382B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005083677A JP4819382B2 (en) 2005-03-23 2005-03-23 Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005083677A JP4819382B2 (en) 2005-03-23 2005-03-23 Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program

Publications (2)

Publication Number Publication Date
JP2006268268A JP2006268268A (en) 2006-10-05
JP4819382B2 true JP4819382B2 (en) 2011-11-24

Family

ID=37204206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005083677A Expired - Fee Related JP4819382B2 (en) 2005-03-23 2005-03-23 Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program

Country Status (1)

Country Link
JP (1) JP4819382B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4699861B2 (en) * 2005-10-21 2011-06-15 三菱スペース・ソフトウエア株式会社 Gene interaction estimation device, gene interaction estimation method, and gene interaction estimation program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4611656B2 (en) * 2004-03-31 2011-01-12 三菱スペース・ソフトウエア株式会社 Gene expression interaction estimation apparatus, gene expression interaction estimation method, and computer-readable recording medium and program recording the program

Also Published As

Publication number Publication date
JP2006268268A (en) 2006-10-05

Similar Documents

Publication Publication Date Title
JP4591794B2 (en) Information processing apparatus and method, and program
JP5638503B2 (en) Text summarization apparatus, method and program
JP2015230570A (en) Learning model creation device, determination system and learning model creation method
Ghanbari et al. Reconstruction of gene networks using prior knowledge
JP7390250B2 (en) A system that generates compound structure representations
KR102174630B1 (en) Method for providing disease associated gene ranking information
JP2018128708A (en) Tensor factor decomposition processing apparatus, tensor factor decomposition processing method and tensor factor decomposition processing program
JPH09319784A (en) Circuit dividing method and its device
CN113377964A (en) Knowledge graph link prediction method, device, equipment and storage medium
Conte et al. A structural approach to unknown inputs observation for switching linear systems
JP2020046891A (en) Prediction program, prediction method, and learning device
JP4819382B2 (en) Expression rate expression generation device, expression rate expression generation method, and expression rate expression generation program
JP5555238B2 (en) Information processing apparatus and program for Bayesian network structure learning
JP4591793B2 (en) Estimation apparatus and method, and program
JP2018124754A (en) Apparatus, method, and program for extracting rough structure of multilayered neural network
CN112465105B (en) Computer-readable recording medium on which learning program is recorded, and learning method
JP7310884B2 (en) Parameter estimation device, parameter estimation method, and parameter estimation program
JP2023005735A (en) Mathematical model acquisition device, estimation device, mathematical model acquisition method, estimation method, and program
JP4611656B2 (en) Gene expression interaction estimation apparatus, gene expression interaction estimation method, and computer-readable recording medium and program recording the program
CN113495986A (en) Data processing method and device
JP7085521B2 (en) Information processing equipment, information processing methods, and programs
CN113792784B (en) Method, electronic device and storage medium for user clustering
WO2022074711A1 (en) Learning method, estimation method, learning device, estimation device, and program
US12079728B2 (en) Device, method, and program for quantitatively analyzing structure of a neural network
JP2019191634A (en) Data analysis method, data analysis program and data analysis system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees