JP2006031308A - Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect - Google Patents

Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect Download PDF

Info

Publication number
JP2006031308A
JP2006031308A JP2004208067A JP2004208067A JP2006031308A JP 2006031308 A JP2006031308 A JP 2006031308A JP 2004208067 A JP2004208067 A JP 2004208067A JP 2004208067 A JP2004208067 A JP 2004208067A JP 2006031308 A JP2006031308 A JP 2006031308A
Authority
JP
Japan
Prior art keywords
function
base sequence
sequence
nucleic acid
inhibition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004208067A
Other languages
Japanese (ja)
Inventor
Genichi Ishikawa
元一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Space Software Co Ltd
Original Assignee
Mitsubishi Space Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Space Software Co Ltd filed Critical Mitsubishi Space Software Co Ltd
Priority to JP2004208067A priority Critical patent/JP2006031308A/en
Publication of JP2006031308A publication Critical patent/JP2006031308A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To design an array of an siRNA impeding the function of a target gene, also taking a non-target gene having a low homology into consideration. <P>SOLUTION: The base sequence of the siRNA is designed using a nucleic array design apparatus 100 including: a candidate array acquisition portion 200 for acquiring the base sequence of siRNA candidates; to the base sequence acquired in the candidate array acquisition portion 200, an activity score calculation portion 300 for calculating an activity score indicating a degree of impeding the function of the gene by the base sequence; an effect score calculation portion 400 for calculating an effect score indicating a degree of impeding the function of the non-target gene by the base sequence acquired by the candidate array acquisition portion 200; and an impeding array decision portion 500 for deciding the base sequence of the siRNA, based on the activity score and the effect score. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、標的とする遺伝子に対して特異的な作用を及ぼす核酸の配列設計における核酸配列設計装置、核酸配列設計方法、核酸配列設計プログラム、機能阻害効果算出装置、機能阻害効果算出方法、機能阻害効果算出プログラム、機能阻害影響度算出装置、機能阻害影響度算出方法および機能阻害影響度算出プログラムに関するものである。   The present invention relates to a nucleic acid sequence design device, a nucleic acid sequence design method, a nucleic acid sequence design program, a function inhibition effect calculation device, a function inhibition effect calculation method, a function in a nucleic acid sequence design that has a specific action on a target gene. The present invention relates to an inhibition effect calculation program, a function inhibition influence degree calculation device, a function inhibition influence degree calculation method, and a function inhibition influence degree calculation program.

21残基程度の長さを持ち、両端に2残基のT(チミン)のオーバーハングを持つ二本鎖核酸は、siRNA(Short Interfering RiboNucleic Acid)と呼ばれ、線虫、ハエ、哺乳類、植物などの多くの生物の細胞中で、相補的な配列を持つmRNA(messenger RNA)の切断や、タンパク質への翻訳を抑制し機能を阻害することが知られている。
このsiRNAを細胞に導入すると、細胞質で2本鎖のうちの片方の鎖だけがRISC(RNA Induced Silencing Complex)と呼ばれる複合体に組み込まれ、RISCは、この取り込んだ核酸の配列と相補的な配列を持つmRNAに結合して、このmRNAを切断する。このsiRNAの持つ性質を利用して、特定の遺伝子に対するsiRNAを作成して生体内に導入しその遺伝子を抑制することで、遺伝子の機能解析実験や遺伝子治療が可能になる。
A double-stranded nucleic acid having a length of about 21 residues and having an overhang of 2 residues T (thymine) at both ends is called siRNA (Short Interfering RiboNucleic Acid), and is a nematode, fly, mammal, plant In cells of many organisms such as, it is known to inhibit the function by suppressing cleavage of mRNA (messenger RNA) having a complementary sequence and translation into protein.
When this siRNA is introduced into a cell, only one of the two strands in the cytoplasm is incorporated into a complex called RISC (RNA Induced Silencing Complex), and RISC is a sequence complementary to the sequence of the incorporated nucleic acid. This mRNA is cleaved by binding to mRNA having By utilizing this property of siRNA, siRNA for a specific gene is prepared and introduced into a living body, and the gene is suppressed, thereby enabling gene function analysis experiments and gene therapy.

siRNAのように遺伝子の機能を阻害する核酸を機能阻害核酸とする。   A nucleic acid that inhibits the function of a gene such as siRNA is referred to as a function-inhibiting nucleic acid.

図1は、従来技術におけるsiRNAの配列設計の処理の流れを示す図である。
図1で表した従来のsiRNAの配列設計方法では、まず、標的遺伝子から転写されたmRNAの配列を入力する(S1)。
入力したmRNAの配列から全ての21残基の配列を取り出して、それぞれをsiRNAの候補配列とする(S2)。
siRNAの候補配列に対して、いくつかの指標を用いて活性を予測し、その程度をスコア化する(S3)。
スコア化の際に、siRNAの配列が非標的遺伝子の配列と完全一致する場合は、このsiRNAの配列を候補配列から除外する。
活性の程度のスコアの高いものをsiRNAの配列に決定する(S4)。
FIG. 1 is a diagram showing the flow of siRNA sequence design processing in the prior art.
In the conventional siRNA sequence design method shown in FIG. 1, first, an mRNA sequence transcribed from a target gene is input (S1).
All 21-residue sequences are extracted from the input mRNA sequence, and each is used as a siRNA candidate sequence (S2).
The activity is predicted for the siRNA candidate sequence using several indices, and the degree is scored (S3).
In the scoring, if the siRNA sequence completely matches the sequence of the non-target gene, the siRNA sequence is excluded from the candidate sequences.
A siRNA sequence having a high score of activity is determined (S4).

従来のsiRNA配列の設計方法は、siRNAの持つmRNAの分解作用の原理のみに従ったものである。siRNAのmRNAの分解作用は、1塩基程度のミスマッチがあるとほとんど効果が無くなることが知られており、そのため、非標的遺伝子の配列と完全一致のsiRNAの候補配列だけを除くという方法が取られている。   The conventional siRNA sequence design method follows only the principle of siRNA degradation action of siRNA. It is known that the degradation effect of siRNA mRNA is almost ineffective when there is a mismatch of about one base, and therefore, only a candidate sequence of siRNA that completely matches the sequence of the non-target gene is removed. ing.

しかし、siRNAを導入することで、そのsiRNAと配列が1つ程度のミスマッチのmRNAの発現を変動させたり、また3〜4塩基のミスマッチがあるmRNAからのタンパク質の翻訳を阻害したりするという報告がされている。   However, by introducing siRNA, it is reported that the expression of a mismatched mRNA whose sequence is about 1 or that of the siRNA or that the translation of a protein from mRNA having a mismatch of 3 to 4 bases is inhibited. Has been.

例えば、生物に内在のmicroRNAがタンパク質への翻訳を阻害するのと同様に、siRNAを導入することで、siRNAと同様な配列を持つmRNAからタンパク質への翻訳の阻害を引き起こすことが明らかにされている(非特許文献1)。
例えば、標的遺伝子のコーディング領域または3‘UTR(UnTranslated Region)の配列中にsiRNAと3〜4塩基のミスマッチを許して相同である配列が存在すれば十分な翻訳阻害の効果を発揮する例を示している。
For example, it has been clarified that introduction of siRNA causes inhibition of translation from mRNA to protein having the same sequence as siRNA, in the same way that microRNAs endogenous to living organisms inhibit translation into proteins. (Non-Patent Document 1).
For example, if the target gene coding region or 3'UTR (UnTranslated Region) sequence contains a sequence that is homologous to the siRNA by allowing a mismatch of 3 to 4 bases, the example shows the effect of sufficient translation inhibition. ing.

また、siRNAは、化学的な構造がほとんどmicroRNAと一致するため、microRNAと同様のメカニズムでRISCに取り込まれて、翻訳の阻害を引き起こすと考えられる。
microRNAは、以下のような生成過程をたどり、ある段階において、siRNAと化学的な構造が似ている。
microRNAの生成過程を説明すると、まずゲノム中からステムループ構造を持つRNAとして転写され、5’末端にリン酸基を持ち3‘末端に2残基のオーバーハングを持つ2本鎖RNAとして切り出され、後にそのうちの片方の鎖がmicroRNAとしてRISCに取り込まれる。
microRNAは2本鎖RNAの段階において、siRNAと同様な化学的構造を持つ。
microRNAは、mRNAのコーディング領域または3’UTRの配列中にmicroRNAの5‘末端側の8残基と一致する配列があれば、そのmRNAからタンパク質への翻訳を阻害することが報告されている(非特許文献2)。
このため、siRNAでも5’末端側の8残基と相同な配列を持つmRNAからのタンパク質の翻訳を阻害することがありうる。
Saxenaら、2003、Small RNAs with imperfect match to endogenous mRNA repress translation、The journal of biological chemistry 278:44312−44319 Laiら、2002、MicroRNAs are complementary to 3’UTR motifs that mediate negative post−transcriptional regulation、Nature genetics、30:363−364
Moreover, since siRNA has a chemical structure almost identical to that of microRNA, it is considered that siRNA is incorporated into RISC by the same mechanism as microRNA and causes translational inhibition.
microRNA follows the following production process, and at a certain stage, the chemical structure is similar to siRNA.
The production process of microRNA will be explained. First, it is transcribed from the genome as RNA having a stem loop structure, and then excised as double-stranded RNA having a phosphate group at the 5 'end and an overhang of 2 residues at the 3' end. Later, one of the strands is incorporated into the RISC as microRNA.
microRNA has a chemical structure similar to siRNA at the stage of double-stranded RNA.
It has been reported that microRNA inhibits translation from mRNA to protein if there is a sequence that matches 8 residues at the 5 ′ end of the microRNA in the coding region of mRNA or the sequence of 3′UTR ( Non-patent document 2).
For this reason, even siRNA may inhibit protein translation from mRNA having a sequence homologous to 8 residues on the 5 ′ end side.
Saxena et al., 2003, Small RNAs with impact match to endogenous mRNA repression translation, The journal of biochemical 278: 44312-44319. Lai et al., 2002, MicroRNAs are complementary to 3′UTR motifs mediate negative post-transcriptional regulation, Nature genetics, 30: 363-364.

このように、siRNAを設計する際に、標的とした遺伝子(以下、標的遺伝子とする)以外の遺伝子(以下、非標的遺伝子とする)に対する効果を考慮しなければ、siRNAの想定される利用目的にとって、望ましくない結果をもたらす。
つまり、従来技術によるsiRNAの配列設計方法では、低い相同性は想定されていないため、設計されたsiRNAを導入した細胞で、予期せず、非標的遺伝子の発現を抑制してしまう。
Thus, when designing siRNA, if the effect on a gene (hereinafter referred to as a non-target gene) other than the target gene (hereinafter referred to as a target gene) is not taken into consideration, the intended use purpose of siRNA Produces undesirable results.
That is, in the siRNA sequence design method according to the prior art, since low homology is not expected, the expression of a non-target gene is unexpectedly suppressed in a cell into which the designed siRNA is introduced.

そこで、本発明は、標的遺伝子の機能を阻害し、低い相同性を持つ非標的遺伝子も考慮に入れたsiRNAの配列を設計することを目的とする。   Therefore, an object of the present invention is to design an siRNA sequence that inhibits the function of a target gene and also takes into consideration a non-target gene having low homology.

本発明の核酸配列設計装置は、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、候補配列取得部の取得した塩基配列に対して、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部と、候補配列取得部の取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出部と、活性スコア算出部が算出した活性スコアと、影響スコア算出部が算出した影響スコアとに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部とを備えたことを特徴とする。   The nucleic acid sequence design apparatus of the present invention inputs a data on a gene of a target organism, acquires a candidate sequence acquisition unit that acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the input data on the gene, and acquires a candidate sequence The activity score calculation unit that calculates the activity score indicating the degree to which the base sequence inhibits the function of the gene with respect to the acquired base sequence, and the base sequence acquired by the candidate sequence acquisition unit The base obtained by the candidate sequence obtaining unit based on the influence score calculating unit that calculates the influence score indicating the degree of influence to be inhibited, the activity score calculated by the activity score calculating unit, and the influence score calculated by the influence score calculating unit And an inhibitory sequence determination unit that determines a base sequence from sequence candidates and outputs the determined base sequence as a designed base sequence.

本発明の核酸配列設計装置は、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、候補配列取得部の取得した塩基配列に対して、塩基配列を構成する残基の種類と、塩基配列中の位置とに基づいて、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部と、活性スコア算出部が算出した活性スコアに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部とを備えたことを特徴とする。   The nucleic acid sequence design apparatus of the present invention inputs a data on a gene of a target organism, acquires a candidate sequence acquisition unit that acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the input data on the gene, and acquires a candidate sequence Activity score for calculating the activity score indicating the degree to which the base sequence inhibits the function of the gene based on the type of residue constituting the base sequence and the position in the base sequence Based on the activity score calculated by the calculation unit and the activity score calculation unit, the base sequence is determined from the base sequence candidates acquired by the candidate sequence acquisition unit, and the determined base sequence is output as the designed base sequence And a section.

上記核酸配列設計装置は、さらに、塩基配列を構成する残基の種類と、塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部を備え、上記活性スコア算出部は、阻害相関値記憶部に記憶される阻害相関値に基づいて、上記候補配列取得部が取得した塩基配列の活性スコアを算出することを特徴とする。   The nucleic acid sequence design apparatus further targets the function-inhibiting nucleic acid when each residue is present at each position of the base sequence with respect to the type of residue constituting the base sequence and the position in the base sequence. An inhibition correlation value storage unit that stores a degree of inhibition of the function of the gene as an inhibition correlation value, and the activity score calculation unit is configured to acquire the candidate sequence acquisition unit based on the inhibition correlation value stored in the inhibition correlation value storage unit The activity score of the obtained base sequence is calculated.

上記阻害相関値記憶部が記憶する阻害相関値は、標的遺伝子に対する機能の阻害の有無が既知である機能阻害核酸を示す、既知核酸に基づくデータであり、F(m,n)は、位置mに残基nが存在する場合の阻害相関値を示し、Q(m,n)は、機能を阻害する既知核酸に対する、機能を阻害する既知核酸のうちで位置mに残基nが存在する割合を示し、P(m,n)は、全既知核酸に対する、位置mに残基nが存在する割合を示し、
F(m,n)=log{Q(m,n)/P(m,n)}
で求められていることを特徴とする。
The inhibition correlation value stored in the inhibition correlation value storage unit is data based on a known nucleic acid indicating a function-inhibited nucleic acid whose presence or absence of inhibition of the function for the target gene is known, and F (m, n) is a position m Shows the inhibition correlation value when residue n is present in Q, and Q (m, n) is the ratio of the known nucleic acid that inhibits function to the presence of residue n at position m among the known nucleic acids that inhibit function P (m, n) represents the proportion of residue n at position m relative to all known nucleic acids,
F (m, n) = log {Q (m, n) / P (m, n)}
It is characterized in that it is required.

上記活性スコア算出部は、塩基配列にグアニンとシトシンとの少なくともいずれかについて、4つ以上連続している個所の有無と、塩基配列中のグアニンとシトシンの含量を示すGC含量と、標的遺伝子に対する塩基配列の位置と、非標的遺伝子と塩基配列との相同関係との少なくともいずれかに基づいて、上記候補配列取得部が取得した塩基配列の活性スコアを算出することを特徴とする。   The activity score calculation unit includes at least one of guanine and cytosine in the base sequence, the presence / absence of four or more consecutive portions, the GC content indicating the content of guanine and cytosine in the base sequence, and the target gene The activity score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on at least one of the position of the base sequence and the homology between the non-target gene and the base sequence.

本発明の核酸配列設計装置は、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、候補配列取得部の取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出部と、影響スコア算出部が算出した影響スコアに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部とを備えたことを特徴とする。   The nucleic acid sequence design apparatus of the present invention inputs a data on a gene of a target organism, acquires a candidate sequence acquisition unit that acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the input data on the gene, and acquires a candidate sequence The candidate sequence acquisition unit acquires the influence score calculation unit that calculates the influence score indicating the degree of influence that inhibits the function of the non-target gene, and the influence score calculated by the influence score calculation unit. And an inhibitory sequence determination unit for determining a base sequence from the determined base sequence candidates and outputting the determined base sequence as a designed base sequence.

上記核酸配列設計装置は、さらに、塩基配列を構成する残基の種類と、塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部を備え、上記影響スコア算出部は、阻害相関値記憶部に記憶される阻害相関値に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   The nucleic acid sequence design apparatus further provides a function-inhibiting nucleic acid when a residue is present at each position of the base sequence with respect to the type of the residue constituting the base sequence and the position in the base sequence. An inhibition correlation value storage unit that stores the degree of inhibition of the function of the target gene as an inhibition correlation value, and the influence score calculation unit obtains the candidate sequence based on the inhibition correlation value stored in the inhibition correlation value storage unit The influence score of the base sequence acquired by the part is calculated.

上記阻害相関値記憶部が記憶する阻害相関値は、非標的遺伝子に対する機能の阻害の有無が既知である機能阻害核酸を示す、既知核酸に基づくデータであり、F(m,n)は、位置mに残基nが存在する場合の阻害相関値を示し、Q(m,n)は、機能を阻害する既知核酸に対する、機能を阻害する既知核酸のうちで位置mに残基nが存在する割合を示し、P(m,n)は、全既知核酸に対する、位置mに残基nが存在する割合を示し、
F(m,n)=log{Q(m,n)/P(m,n)}
で求められていることを特徴とする。
The inhibition correlation value stored in the inhibition correlation value storage unit is data based on a known nucleic acid indicating a function-inhibited nucleic acid whose presence or absence of inhibition of the function for a non-target gene is known, and F (m, n) is a position Inhibition correlation value when residue n is present in m, Q (m, n) is a known nucleic acid that inhibits function, and residue n is present at position m among known nucleic acids that inhibit function P (m, n) represents the proportion of residue n at position m relative to all known nucleic acids,
F (m, n) = log {Q (m, n) / P (m, n)}
It is characterized in that it is required.

上記影響スコア算出部は、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、上記阻害相関値記憶部に記憶される阻害相関値とに基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   The influence score calculation unit, when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid, at least one of the amount of genetic information expressed from the non-target gene and the functional importance of the non-target gene, The influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on the inhibition correlation value stored in the inhibition correlation value storage unit.

上記影響スコア算出部は、上記阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係とに基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   Based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid, the influence score calculation unit The influence score of the acquired base sequence is calculated.

上記影響スコア算出部は、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、上記阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係とに基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   The influence score calculation unit, when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid, at least one of the amount of genetic information expressed from the non-target gene and the functional importance of the non-target gene, Based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid, the influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated. It is characterized by calculating.

上記影響スコア算出部は、非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   The said influence score calculation part calculates the influence score of the base sequence which the said candidate sequence acquisition part acquired based on the homology of the base sequence of a non-target gene, and the base sequence of a function inhibition nucleic acid, It is characterized by the above-mentioned.

上記影響スコア算出部は、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、非標的遺伝子と塩基配列との相同関係とに基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする。   When the non-target gene is not inhibited by the function-inhibiting nucleic acid, the influence score calculation unit calculates at least one of the amount of genetic information expressed from the non-target gene and the functional importance of the non-target gene, Based on the homology between the target gene and the base sequence, the influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated.

上記候補配列取得部は、対象とする生物の属する生物種の遺伝子に関する塩基配列を記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、遺伝情報の塩基配列を示す遺伝情報配列を取得する種別配列取得部を備え、上記候補配列取得部は、種別配列取得部が取得した遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする。   The candidate sequence acquisition unit acquires a genetic information sequence indicating a base sequence of genetic information as data related to a gene of a target organism from a storage unit that stores a base sequence related to a gene of a biological species to which the target organism belongs. A type sequence acquisition unit is provided, and the candidate sequence acquisition unit acquires a base sequence candidate of a function-inhibiting nucleic acid based on the genetic information sequence acquired by the type sequence acquisition unit.

上記候補配列取得部は、さらに、対象とする生物の遺伝子に関するデータとして標的遺伝子を入力し、上記種別配列取得部が取得した塩基配列と、対象とする生物の標的遺伝子の塩基配列とで異なる部分の塩基配列を取得する異配列取得部と、上記種別配列取得部が取得した塩基配列と、異配列取得部が取得した塩基配列とに基づいて塩基配列を生成する塩基配列生成部とを備え、上記候補配列取得部は、塩基配列生成部が生成した塩基配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする。   The candidate sequence acquisition unit further inputs a target gene as data relating to the gene of the target organism, and the portion that differs between the base sequence acquired by the type sequence acquisition unit and the base sequence of the target gene of the target organism A different sequence acquisition unit for acquiring the base sequence, a base sequence generation unit for generating a base sequence based on the base sequence acquired by the type sequence acquisition unit and the base sequence acquired by the different sequence acquisition unit, The candidate sequence acquisition unit acquires a candidate for a base sequence of a function-inhibiting nucleic acid based on the base sequence generated by the base sequence generation unit.

上記候補配列取得部は、対象とする生物の遺伝子に関するデータとして標的遺伝子を入力し、対象とする生物の標的遺伝子から塩基配列を取得する塩基配列取得部と、対象とする生物の属する生物種が持つ各遺伝子の塩基配列を、遺伝情報領域の塩基配列を示す遺伝情報領域配列と、非遺伝情報領域の塩基配列を示す非遺伝情報領域配列とに分けて記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得する種別領域配列取得部と、塩基配列取得部が取得した塩基配列と、種別領域配列取得部が取得した遺伝情報領域配列および非遺伝情報領域配列との相同関係に基づいて、塩基配列取得部が取得した塩基配列から、遺伝情報領域配列を抽出し、抽出した遺伝情報領域配列に基づいて、遺伝情報の塩基配列を示す遺伝情報配列を取得する情報配列取得部とを備え、上記候補配列取得部は、情報配列取得部が取得した遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする。   The candidate sequence acquisition unit is configured to input a target gene as data relating to a gene of a target organism, acquire a base sequence from the target gene of the target organism, and a biological species to which the target organism belongs The target organism from the storage unit that stores the base sequence of each gene separately into a genetic information region sequence indicating the base sequence of the genetic information region and a non-genetic information region sequence indicating the base sequence of the non-genetic information region As the data related to the gene, the type region sequence acquisition unit for acquiring the genetic information region sequence and the non-genetic information region sequence for the target gene, the base sequence acquired by the base sequence acquisition unit, and the type region sequence acquisition unit Based on the homology between the genetic information region sequence and the non-genetic information region sequence, the genetic information region sequence was extracted from the base sequence acquired by the base sequence acquisition unit and extracted. An information sequence acquisition unit that acquires a genetic information sequence indicating a base sequence of genetic information based on the transmission information region sequence, the candidate sequence acquisition unit based on the genetic information sequence acquired by the information sequence acquisition unit, A candidate for a base sequence of a function-inhibiting nucleic acid is obtained.

上記候補配列取得部は、機能阻害核酸の塩基配列の候補を記憶する記憶部から、機能阻害核酸の塩基配列の候補を取得することを特徴とする。   The candidate sequence acquisition unit acquires a candidate of a base sequence of a function-inhibiting nucleic acid from a storage unit that stores a base sequence candidate of the function-inhibiting nucleic acid.

本発明の核酸配列設計方法は、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、候補配列取得工程で取得した塩基配列に対して、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程と、候補配列取得工程で取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出工程と、活性スコア算出工程で算出した活性スコアと、影響スコア算出工程で算出した影響スコアとに基づいて、候補配列取得工程で取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程とを実行することを特徴とする。   The nucleic acid sequence design method of the present invention includes a candidate sequence acquisition step of inputting data related to a gene of a target organism, acquiring a candidate of a base sequence of a function-inhibiting nucleic acid based on the input data related to the gene, and acquiring a candidate sequence The activity score calculation step for calculating the activity score indicating the degree to which the base sequence inhibits the function of the gene with respect to the base sequence acquired in the step, and the base sequence acquired in the candidate sequence acquisition step The base obtained in the candidate sequence acquisition step based on the influence score calculation step for calculating the influence score indicating the degree of influence to be inhibited, the activity score calculated in the activity score calculation step, and the influence score calculated in the influence score calculation step Performing an inhibitory sequence determination step of determining a base sequence from sequence candidates and outputting the determined base sequence as a designed base sequence That.

対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計方法において、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、候補配列取得工程で取得した塩基配列に対して、塩基配列を構成する残基の種類と、塩基配列中の位置とに基づいて、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程と、活性スコア算出工程で算出した活性スコアに基づいて、候補配列取得工程が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程とを実行することを特徴とする。   In a nucleic acid sequence design method for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism, data on the gene of the target organism is input, and function inhibition is performed based on the input data on the gene. A candidate sequence acquisition step for acquiring nucleic acid base sequence candidates, and a base sequence acquired in the candidate sequence acquisition step based on the types of residues constituting the base sequence and the position in the base sequence An activity score calculation step for calculating an activity score indicating the degree to which the sequence inhibits the function of the gene, and based on the activity score calculated in the activity score calculation step, the nucleotide sequence is obtained from the nucleotide sequence candidates acquired by the candidate sequence acquisition step. An inhibitory sequence determination step of determining and outputting the determined base sequence as a designed base sequence.

対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計方法において、対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、候補配列取得工程で取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出工程と、影響スコア算出工程で算出した影響スコアに基づいて、候補配列取得工程で取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程とを実行することを特徴とする。   In a nucleic acid sequence design method for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism, data on the gene of the target organism is input, and function inhibition is performed based on the input data on the gene. A candidate sequence acquisition step for acquiring nucleic acid base sequence candidates, an influence score calculation step for calculating an influence score indicating the degree of influence that the base sequence acquired in the candidate sequence acquisition step inhibits the function of the non-target gene, and an influence Based on the influence score calculated in the score calculation step, the base sequence is determined from the candidate of the base sequence acquired in the candidate sequence acquisition step, and the inhibition sequence determination step of outputting the determined base sequence as the designed base sequence is executed It is characterized by that.

本発明の核酸配列設計プログラムは、上記核酸配列設計方法をコンピュータに実行させる。   The nucleic acid sequence design program of the present invention causes a computer to execute the nucleic acid sequence design method.

本発明の機能阻害効果算出装置は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、機能阻害核酸の塩基配列を入力し、入力した機能阻害核酸の塩基配列と、阻害相関値記憶部に記憶される阻害相関値とに基づいて、入力した機能阻害核酸が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部とを備えたことを特徴とする。   The function-inhibiting effect calculation apparatus of the present invention provides each residue at each position of the base sequence with respect to the types of residues constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. In this case, the inhibition correlation value storage unit for storing the degree of inhibition of the function of the gene by the function-inhibiting nucleic acid as an inhibition correlation value, the base sequence of the function-inhibiting nucleic acid, and the input base sequence of the function-inhibiting nucleic acid and the inhibition And an activity score calculating unit that calculates an activity score indicating the degree to which the input function-inhibiting nucleic acid inhibits the function of the gene based on the inhibition correlation value stored in the correlation value storage unit.

本発明の機能阻害効果算出方法は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、機能阻害核酸の塩基配列を入力し、入力した機能阻害核酸の塩基配列と、阻害相関値記憶工程で記憶された阻害相関値とに基づいて、入力した機能阻害核酸が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程とを実行することを特徴とする。   In the method for calculating the function-inhibiting effect of the present invention, each residue is present at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. In this case, the inhibition correlation value storage step for storing the degree of inhibition of the function of the gene by the function-inhibiting nucleic acid as an inhibition correlation value, the base sequence of the function-inhibiting nucleic acid, and the input base sequence of the function-inhibiting nucleic acid and the inhibition And an activity score calculating step of calculating an activity score indicating the degree to which the input function-inhibiting nucleic acid inhibits the function of the gene based on the inhibition correlation value stored in the correlation value storing step.

本発明の機能阻害効果算出プログラムは、上記機能阻害効果算出方法をコンピュータに実行させる。   The function inhibition effect calculation program of the present invention causes a computer to execute the function inhibition effect calculation method.

本発明の機能阻害影響度算出装置は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、阻害相関値記憶部に記憶される阻害相関値とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部とを備えたことを特徴とする。   The function inhibition influence calculation apparatus of the present invention provides each residue at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. When present, an inhibition correlation value storage unit that stores the degree of inhibition of the function of the non-target gene by the function-inhibiting nucleic acid as an inhibition correlation value and the base sequence of the function-inhibiting nucleic acid are input. When the function is not inhibited, based on the amount of genetic information expressed from the non-target gene, the functional importance of the non-target gene, and the inhibition correlation value stored in the inhibition correlation value storage unit And an influence score calculation unit for calculating an influence score indicating the degree of inhibition of the function of the non-target gene by the base sequence of the input function-inhibiting nucleic acid.

本発明の機能阻害影響度算出装置は、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部を備えたことを特徴とする。   The function inhibition influence calculation device of the present invention inputs the base sequence of a function-inhibiting nucleic acid, and when the non-target gene is not inhibited by the function-inhibiting nucleic acid, the amount of genetic information expressed from the non-target gene and the non-target Based on at least one of the functional importance of the gene and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the degree to which the input function-inhibiting nucleic acid inhibits the function of the non-target gene is determined. An influence score calculation unit for calculating an influence score is provided.

本発明の機能阻害影響度算出装置は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、機能阻害核酸の塩基配列を入力し、阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部とを備えたことを特徴とする。   The function inhibition influence calculation apparatus of the present invention provides each residue at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. If present, the inhibition correlation value storage unit that stores the degree of inhibition of the function of the non-target gene by the function inhibiting nucleic acid as an inhibition correlation value, and the base sequence of the function inhibiting nucleic acid are input and stored in the inhibition correlation value storage unit. Based on the inhibition correlation value and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, an influence score indicating the degree to which the base sequence of the input function-inhibiting nucleic acid inhibits the function of the non-target gene is calculated. And an influence score calculation unit for calculating.

本発明の機能阻害影響度算出装置は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部とを備えたことを特徴とする。   The function inhibition influence calculation apparatus of the present invention provides each residue at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. When present, an inhibition correlation value storage unit that stores the degree of inhibition of the function of the non-target gene by the function-inhibiting nucleic acid as an inhibition correlation value and the base sequence of the function-inhibiting nucleic acid are input. When the function is not inhibited, at least one of the amount of genetic information expressed from the non-target gene and the functional importance of the non-target gene, the inhibition correlation value stored in the inhibition correlation value storage unit, and the non-target An influence score calculation unit for calculating an influence score indicating the degree of inhibition of the function of the non-target gene based on the homology between the gene and the base sequence of the input function-inhibiting nucleic acid. And it said that there were pictures.

本発明の機能阻害影響度算出方法は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、阻害相関値記憶工程で記憶された阻害相関値とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程とを実行することを特徴とする。   In the method for calculating the degree of influence of function inhibition of the present invention, each residue is located at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. When present, an inhibition correlation value storing step for storing the degree of inhibition of the function of the non-target gene by the function-inhibiting nucleic acid as an inhibition correlation value, and the base sequence of the function-inhibiting nucleic acid are input. When the function is not inhibited, based on the amount of genetic information expressed from the non-target gene, the functional importance of the non-target gene, and the inhibition correlation value stored in the inhibition correlation value storage step And an influence score calculation step of calculating an influence score indicating the degree to which the base sequence of the input function-inhibiting nucleic acid inhibits the function of the non-target gene.

本発明の機能阻害影響度算出方法は、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程を実行することを特徴とする。   The method for calculating the degree of influence of function inhibition according to the present invention is the method of inputting the base sequence of a function-inhibiting nucleic acid, and the amount of genetic information expressed from the non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid. Based on at least one of the functional importance of the gene and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the degree to which the input function-inhibiting nucleic acid inhibits the function of the non-target gene is determined. An influence score calculation step of calculating an influence score to be shown is executed.

本発明の機能阻害影響度算出方法は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、機能阻害核酸の塩基配列を入力し、阻害相関値記憶工程で記憶された阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程とを実行することを特徴とする。   In the method for calculating the degree of influence of function inhibition of the present invention, each residue is located at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. If present, the inhibition correlation value storing step for storing the degree of inhibition of the function of the non-target gene by the function inhibiting nucleic acid as an inhibition correlation value and the base sequence of the function inhibiting nucleic acid are input and stored in the inhibition correlation value storing step. Based on the inhibition correlation value and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, an influence score indicating the degree to which the base sequence of the input function-inhibiting nucleic acid inhibits the function of the non-target gene is calculated. An influence score calculation step is calculated.

本発明の機能阻害影響度算出方法は、機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、機能阻害核酸の塩基配列を入力し、非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、非標的遺伝子の機能的な重要度との少なくともいずれかと、阻害相関値記憶工程で記憶された阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程とを実行することを特徴とする。   In the method for calculating the degree of influence of function inhibition of the present invention, each residue is located at each position of the base sequence with respect to the type of the residue constituting the base sequence of the function-inhibited nucleic acid and the position in the base sequence of the function-inhibited nucleic acid. When present, an inhibition correlation value storing step for storing the degree of inhibition of the function of the non-target gene by the function-inhibiting nucleic acid as an inhibition correlation value, and the base sequence of the function-inhibiting nucleic acid are input. When the function is not inhibited, at least one of the amount of genetic information expressed from the non-target gene and the functional importance of the non-target gene, the inhibition correlation value stored in the inhibition correlation value storing step, and the non-target Based on the homology between the gene and the base sequence of the entered function-inhibiting nucleic acid, the impact score calculator calculates the impact score that indicates the degree to which the base sequence of the input function-inhibited nucleic acid inhibits the function of the non-target gene. And executes and.

本発明の機能阻害影響度算出プログラムは、機能阻害影響度算出方法をコンピュータに実行させる。   The function inhibition influence degree calculation program of the present invention causes a computer to execute a function inhibition influence degree calculation method.

上記候補配列取得部は、対象とする生物の属する生物種の遺伝子に関する塩基配列を記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、遺伝情報の塩基配列を示す遺伝情報配列を標的遺伝子と非標的遺伝子とについて取得する種別配列取得部を備え、上記候補配列取得部は、種別配列取得部が取得した標的遺伝子の遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、上記影響スコア算出部は、種別配列取得部が取得した非標的遺伝子の遺伝情報配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする。   The candidate sequence acquisition unit stores a genetic information sequence indicating a genetic information base sequence as a target gene from a storage unit that stores a base sequence related to a gene of a species to which the target organism belongs. And a non-target gene to obtain a type sequence acquisition unit, and the candidate sequence acquisition unit acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the genetic information sequence of the target gene acquired by the type sequence acquisition unit. The influence score calculation unit calculates the influence score based on the homology between the genetic information sequence of the non-target gene acquired by the type sequence acquisition unit and the base sequence of the function-inhibiting nucleic acid acquired by the candidate sequence acquisition unit. It is characterized by that.

上記候補配列取得部は、さらに、対象とする生物の遺伝子に関するデータとして標的遺伝子と非標的遺伝子とを入力し、上記種別配列取得部が取得した標的遺伝子の塩基配列と、対象とする生物の標的遺伝子の塩基配列とで異なる部分の塩基配列と、上記種別配列取得部が取得した非標的遺伝子の塩基配列と、対象とする生物の非標的遺伝子の塩基配列とで異なる部分の塩基配列とを取得する異配列取得部と、上記種別配列取得部が取得した標的遺伝子の塩基配列と、異配列取得部が取得した標的遺伝子の異なる部分の塩基配列とに基づいて対象とする生物の標的遺伝子の塩基配列を生成し、上記種別配列取得部が取得した非標的遺伝子の塩基配列と、異配列取得部が取得した非標的遺伝子の異なる部分の塩基配列とに基づいて対象とする生物の非標的遺伝子の塩基配列を生成する塩基配列生成部とを備え、上記候補配列取得部は、塩基配列生成部が生成した標的遺伝子の塩基配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、上記影響スコア算出部は、塩基配列生成部が生成した非標的遺伝子の塩基配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする。   The candidate sequence acquisition unit further inputs a target gene and a non-target gene as data relating to the gene of the target organism, the base sequence of the target gene acquired by the type sequence acquisition unit, and the target of the target organism Obtain the base sequence of the portion that differs from the base sequence of the gene, the base sequence of the non-target gene acquired by the above-mentioned type sequence acquisition unit, and the base sequence of the portion that is different from the base sequence of the non-target gene of the target organism. Base sequence of the target gene of the target organism based on the base sequence of the target gene acquired by the different sequence acquisition unit and the base sequence of the target gene acquired by the different sequence acquisition unit A target sequence based on the base sequence of the non-target gene acquired by the type sequence acquisition unit and the base sequence of the different part of the non-target gene acquired by the different sequence acquisition unit. A base sequence generation unit that generates a base sequence of the non-target gene, and the candidate sequence acquisition unit generates a base sequence candidate of the function-inhibiting nucleic acid based on the base sequence of the target gene generated by the base sequence generation unit. The influence score calculation unit calculates the influence score based on the homology between the base sequence of the non-target gene generated by the base sequence generation unit and the base sequence of the function-inhibiting nucleic acid acquired by the candidate sequence acquisition unit. It is characterized by doing.

上記候補配列取得部は、対象とする生物の遺伝子に関するデータとして標的遺伝子と非標的遺伝子とを入力し、対象とする生物の標的遺伝子から標的遺伝子の塩基配列を取得し、対象とする生物の非標的遺伝子から非標的遺伝子の塩基配列を取得する塩基配列取得部と、対象とする生物の属する生物種が持つ各遺伝子の塩基配列を、遺伝情報領域の塩基配列を示す遺伝情報領域配列と、非遺伝情報領域の塩基配列を示す非遺伝情報領域配列とに分けて記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得し、非標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得する種別領域配列取得部と、塩基配列取得部が取得した塩基配列と、種別領域配列取得部が取得した遺伝情報領域配列および非遺伝情報領域配列との相同関係に基づいて、塩基配列取得部が取得した塩基配列から、遺伝情報領域配列を抽出し、抽出した遺伝情報領域配列に基づいて、遺伝情報の塩基配列を示す遺伝情報配列を標的遺伝子と非標的遺伝子とについて取得する情報配列取得部とを備え、上記候補配列取得部は、情報配列取得部が取得した標的遺伝子の遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、上記影響スコア算出部は、情報配列取得部が取得した非標的遺伝子の遺伝情報配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする。   The candidate sequence acquisition unit inputs a target gene and a non-target gene as data relating to the gene of the target organism, acquires the base sequence of the target gene from the target gene of the target organism, A base sequence acquisition unit for acquiring a base sequence of a non-target gene from a target gene, a base sequence of each gene possessed by a species to which the target organism belongs, a genetic information region sequence indicating a base sequence of the genetic information region, Acquires the genetic information region sequence and non-genetic information region sequence for the target gene as data related to the gene of the target organism from the memory unit that stores the genetic information region base sequence indicating the base sequence of the genetic information region. The type region sequence acquisition unit for acquiring the genetic information region sequence and the non-genetic information region sequence for the non-target gene, the base sequence acquired by the base sequence acquisition unit, and the species Based on the homology between the genetic information region sequence obtained by the region sequence obtaining unit and the non-genetic information region sequence, the genetic information region sequence is extracted from the base sequence obtained by the base sequence obtaining unit, and the extracted genetic information region sequence An information sequence acquisition unit that acquires a genetic information sequence indicating a base sequence of genetic information for a target gene and a non-target gene, and the candidate sequence acquisition unit includes the target gene acquired by the information sequence acquisition unit. Based on the genetic information sequence, a candidate for the base sequence of the function-inhibiting nucleic acid is obtained, and the influence score calculation unit acquires the genetic information sequence of the non-target gene acquired by the information sequence acquisition unit and the candidate sequence acquisition unit An influence score is calculated based on the homology with the base sequence of the function-inhibiting nucleic acid.

本発明によれば、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出することができる。   According to the present invention, it is possible to calculate an influence score indicating the degree of influence that inhibits the function of a non-target gene.

これにより、算出した影響スコアに基づき、低い相同性を持つ非標的遺伝子も考慮に入れたsiRNAの配列を設計することができる。   Thereby, based on the calculated influence score, it is possible to design a sequence of siRNA taking into consideration a non-target gene having low homology.

また、本発明によれば、標的遺伝子の機能を阻害する影響度を示す活性スコアを算出することができる。   Further, according to the present invention, an activity score indicating the degree of influence that inhibits the function of a target gene can be calculated.

これにより、算出した活性スコアに基づき、標的遺伝子に対する機能阻害に効果があるsiRNAの配列を設計することができる。   Thereby, based on the calculated activity score, it is possible to design an siRNA sequence that is effective in inhibiting the function of the target gene.

これらを併せることにより、算出した活性スコアと影響スコアとに基づき、標的遺伝子に対する機能阻害に効果があり、且つ、低い相同性を持つ非標的遺伝子も考慮に入れたsiRNAの配列を設計することができる。   By combining these, based on the calculated activity score and influence score, it is possible to design a siRNA sequence that is effective in inhibiting the function of the target gene and also takes into account non-target genes with low homology. it can.

つまり、siRNAの作用の対象となる生物の遺伝子情報に基づいて、非標的遺伝子への作用を厳密に予測する手段を含むため、標的となる遺伝子のみに高い効果を発揮し、その他の非標的遺伝子に影響を及ぼすことのないsiRNAの配列を得ることができる。   In other words, since it includes means for strictly predicting the action on non-target genes based on the genetic information of the organism that is the target of siRNA action, it exerts a high effect only on the target gene, and other non-target genes SiRNA sequences that do not affect the sequence can be obtained.

実施の形態1.
図2は、実施の形態1における核酸配列設計装置100の構成図である。
実施の形態1における核酸配列設計装置100の構成について、図2に基づいて説明する。
Embodiment 1 FIG.
FIG. 2 is a configuration diagram of the nucleic acid sequence designing apparatus 100 according to the first embodiment.
The configuration of the nucleic acid sequence design apparatus 100 according to Embodiment 1 will be described with reference to FIG.

核酸配列設計装置100は、以下のものを備える。   The nucleic acid sequence designing apparatus 100 includes the following.

設計するsiRNAにより、機能を阻害する、対象の生物体が属する生物種の遺伝子のmRNAの塩基配列を記憶する種別情報配列記憶部181。
種別情報配列記憶部181から対象生物種の標的遺伝子および非標的遺伝子のmRNAの塩基配列を取得する種別配列取得部210。
種別配列取得部210が取得したmRNAの塩基配列に基づいて、mRNAの塩基配列と、siRNAの塩基配列の候補(以下、siRNA候補配列とする)を取得する候補配列取得部200。
A type information sequence storage unit 181 that stores the base sequence of the mRNA of the gene of the species to which the target organism belongs, the function of which is inhibited by the siRNA to be designed.
A type sequence acquisition unit 210 that acquires the base sequences of the target gene and non-target gene mRNA of the target species from the type information sequence storage unit 181.
A candidate sequence acquisition unit 200 that acquires an mRNA base sequence and siRNA base sequence candidates (hereinafter referred to as siRNA candidate sequences) based on the mRNA base sequence acquired by the type sequence acquisition unit 210.

siRNAの塩基配列を構成する残基の種類と、各塩基の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合の、標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部191。
遺伝子の発現量と機能的な重要度との値を重み付け情報値として記憶する遺伝子情報記憶部192。
The degree of inhibition of the function of the target gene when each residue is present in each position of the base sequence, relative to the type of residue constituting the base sequence of siRNA and the position in the base sequence of each base. An inhibition correlation value storage unit 191 that stores the inhibition correlation value.
A gene information storage unit 192 that stores values of gene expression level and functional importance as weighted information values.

候補配列取得部200から標的遺伝子のmRNAの塩基配列とsiRNA候補配列とを入力し、入力したsiRNA候補配列に対する阻害相関値を阻害相関値記憶部191から取得し、取得した阻害相関値と入力したmRNAとに基づいて活性スコアを算出する活性スコア算出部300。   The base sequence of the target gene mRNA and the siRNA candidate sequence are input from the candidate sequence acquisition unit 200, the inhibition correlation value for the input siRNA candidate sequence is acquired from the inhibition correlation value storage unit 191, and the acquired inhibition correlation value is input. An activity score calculation unit 300 that calculates an activity score based on mRNA.

候補配列取得部200から非標的遺伝子のmRNAの塩基配列とsiRNA候補配列とを入力し、入力したsiRNA候補配列に対する阻害相関値を阻害相関値記憶部191から取得し、また、入力したmRNAに対応する遺伝子の重み付け情報値を遺伝子情報記憶部192から取得し、取得した阻害相関値と重み付け情報値とに基づいて影響スコアを算出する影響スコア算出部400。   The base sequence of the mRNA of the non-target gene and the siRNA candidate sequence are input from the candidate sequence acquisition unit 200, and the inhibition correlation value for the input siRNA candidate sequence is acquired from the inhibition correlation value storage unit 191, and also corresponds to the input mRNA. An influence score calculation unit 400 that obtains a weighting information value of a gene to be obtained from the gene information storage unit 192 and calculates an influence score based on the acquired inhibition correlation value and the weighting information value.

候補配列取得部200の取得したsiRNA候補配列と、活性スコア算出部300の算出した活性スコアと、影響スコア算出部400の算出した影響スコアとを入力し、入力した活性スコアと影響スコアとに基づいて、入力したsiRNA候補配列からsiRNAの塩基配列を決定する阻害配列決定部500。   The siRNA candidate sequence acquired by the candidate sequence acquisition unit 200, the activity score calculated by the activity score calculation unit 300, and the influence score calculated by the influence score calculation unit 400 are input, and based on the input activity score and influence score An inhibitory sequence determination unit 500 that determines the base sequence of siRNA from the input siRNA candidate sequence.

図3は、実施の形態1における核酸配列設計装置100の処理の流れを示す図である。
実施の形態1における核酸配列設計装置100が行うsiRNAの配列設計方法の処理の流れを図3に基づいて説明する。
FIG. 3 is a diagram showing a processing flow of the nucleic acid sequence designing apparatus 100 according to the first embodiment.
The flow of the process of the siRNA sequence design method performed by the nucleic acid sequence design apparatus 100 according to the first embodiment will be described with reference to FIG.

核酸配列設計装置100は、阻害核酸の配列設計を以下のようにして行う。   The nucleic acid sequence design apparatus 100 performs sequence design of inhibitory nucleic acids as follows.

標的遺伝子のmRNAの塩基配列を取得する(S101)。
また、非標的遺伝子のmRNAの塩基配列を取得する(S102)。
各遺伝子のmRNAの塩基配列の取得は、種別配列取得部210が、対象とする生物種の遺伝子のmRNA塩基配列を、種別情報配列記憶部181から取得することで行う。
The base sequence of the mRNA of the target gene is obtained (S101).
Moreover, the base sequence of mRNA of a non-target gene is acquired (S102).
Acquisition of the mRNA base sequence of each gene is performed by the type sequence acquisition unit 210 acquiring the mRNA base sequence of the gene of the target biological species from the type information sequence storage unit 181.

次に、S101で取得した標的遺伝子のmRNAの塩基配列からsiRNA候補配列を抽出する(S103)。
siRNA候補配列の抽出は、候補配列取得部200が、標的遺伝子のmRNAの塩基配列から、19bp(base pair)の長さの配列を全てsiRNA候補配列として取り出すことで行う。
Next, siRNA candidate sequences are extracted from the base sequence of the mRNA of the target gene obtained in S101 (S103).
The extraction of siRNA candidate sequences is performed by the candidate sequence acquisition unit 200 extracting all sequences having a length of 19 bp (base pair) from the base sequence of the target gene mRNA as siRNA candidate sequences.

次に、S103で抽出したsiRNA候補配列に対して、S101で取得した標的遺伝子のmRNAの塩基配列への活性スコアを算出する(S104)。
活性スコアの算出方法について、図4および図5に基づいて説明する。
Next, an activity score for the base sequence of the mRNA of the target gene obtained in S101 is calculated for the siRNA candidate sequences extracted in S103 (S104).
A method for calculating the activity score will be described with reference to FIGS.

図4は、実施の形態1における阻害相関値記憶部191の記憶内容を示す図である。
図4において、残基の種類にはA(アデニン)、U(ウラシル)、G(グアニン)、C(シトシン)があり、阻害相関値記憶部191は、遺伝子Aや遺伝子Bなどの各遺伝子に対して、siRNA候補配列における位置1〜19にA、U、G、Cのそれぞれが位置する場合の阻害相関値を記憶する。
FIG. 4 is a diagram showing the contents stored in the inhibition correlation value storage unit 191 in the first embodiment.
In FIG. 4, the types of residues include A (adenine), U (uracil), G (guanine), and C (cytosine), and the inhibition correlation value storage unit 191 stores each gene such as gene A and gene B. On the other hand, the inhibition correlation value when each of A, U, G, and C is located at positions 1 to 19 in the siRNA candidate sequence is stored.

阻害相関値記憶部191に記憶される阻害相関値は、実験等により既に求められている、任意のsiRNAの塩基配列の各遺伝子に対する機能の阻害の度合いを示す値である。
この阻害相関値は、遺伝子の活性がある可能性が高いほど大きな値を示し、活性が無い可能性が高いほど小さな値を示す。
ここで活性とは、siRNAが遺伝子の機能を阻害することである。
つまり、阻害相関値は、siRNAが遺伝子の機能を阻害するほど大きな値を示す。
位置mに残基nが位置する場合の阻害相関値であるF(m,n)は、以下の式により求められる。
F(m,n)=log{Q(m,n)/P(m,n)}
ここで、P(m,n)とQ(m,n)は以下の式で表される。
P(m,n)=(全体のsiRNAのうちで、m番目の残基がnであるsiRNAの本数)/(全体のsiRNAの本数)
Q(m,n)=(活性のあるsiRNAのうちで、m番目の残基がnであるsiRNAの本数)/(活性のあるsiRNAの本数)
The inhibition correlation value stored in the inhibition correlation value storage unit 191 is a value indicating the degree of inhibition of the function for each gene of the base sequence of any siRNA that has already been obtained through experiments or the like.
This inhibition correlation value indicates a larger value as the possibility of the activity of the gene is higher, and indicates a smaller value as the possibility of the absence of the activity is higher.
Here, activity means that siRNA inhibits the function of a gene.
That is, the inhibition correlation value is so large that siRNA inhibits the function of the gene.
F (m, n), which is an inhibition correlation value when residue n is located at position m, is obtained by the following equation.
F (m, n) = log {Q (m, n) / P (m, n)}
Here, P (m, n) and Q (m, n) are expressed by the following equations.
P (m, n) = (number of siRNAs in which the m-th residue is n among all siRNAs) / (number of all siRNAs)
Q (m, n) = (the number of siRNAs in which the m-th residue is n among active siRNAs) / (the number of active siRNAs)

例えば、108個のsiRNAを作って実験した結果、そのうちの27個に活性があったとする。
全てのsiRNA、つまり108個のsiRNAのうちで、1番目の残基がAであるものが28個あったとすると、P(1,A)=28/108≒0.26になる。
また、活性のあるsiRNA、つまり27個のsiRNAうちで、1番目の残基がAであるものが6個あったとすると、Q(1,A)=6/27≒0.22になる。
上記からF(1,A)を計算すると、F(1,A)=log{Q(1,A)/P(1,A)}=log(0.22/0.26)=−0.07になる。
For example, suppose that 27 siRNAs were active as a result of experimentation with 108 siRNAs.
If there are 28 of all siRNAs, that is, 108 siRNAs whose first residue is A, P (1, A) = 28 / 108≈0.26.
Also, assuming that there are 6 active siRNAs, that is, 27 siRNAs whose first residue is A, Q (1, A) = 6 / 27≈0.22.
F (1, A) = log {Q (1, A) / P (1, A)} = log (0.22 / 0.26) = − 0. 07.

活性の有無は、実験により以下のように判断することができる。
例えば、細胞中で酵素として働くことにより発光現象を起こすルシフェラーゼ遺伝子をレポーター遺伝子として使用し、レポータージーンアッセイを行う。
まず、実験対象の遺伝子のプロモーター下流にルシフェラーゼ遺伝子を結合させ、これをプラスミドなどのベクターに結合する。
次に、結合したベクターを大腸菌などの培養細胞に導入し、細胞の培養を行う。
この培養した細胞にsiRNAを導入したときと、導入していないときとのルシフェラーゼの相対発光量を求め、求めた相対発光量が一定値より少ない、つまり、siRNAによる機能の阻害が一定値より多い場合に活性があるとする。
この発光量は機器を用いて測定することができる。
計算式は以下のようになる。
siRNAの活性=100(%)−ルシフェラーゼの相対発光量(%)
ルシフェラーゼの相対発光量(%)=siRNAを作用させたときの発光量/siRNAを作用させないときの発光量
つまり、ルシフェラーゼの発光を抑えれば抑えるほど、siRNAの活性が高いということになる。
The presence or absence of activity can be determined by experiment as follows.
For example, a reporter gene assay is performed using a luciferase gene that causes a luminescence phenomenon by acting as an enzyme in a cell as a reporter gene.
First, a luciferase gene is bound downstream of the promoter of the gene to be tested, and this is bound to a vector such as a plasmid.
Next, the combined vector is introduced into cultured cells such as Escherichia coli, and the cells are cultured.
The relative luminescence amount of luciferase when siRNA is introduced into this cultured cell and when it is not introduced is determined, and the obtained relative luminescence amount is less than a certain value, that is, the inhibition of function by siRNA is more than a certain value. In some cases active.
This amount of luminescence can be measured using an instrument.
The calculation formula is as follows.
siRNA activity = 100 (%)-relative luminescence amount of luciferase (%)
Relative luminescence amount of luciferase (%) = luminescence amount when siRNA is applied / luminescence amount when siRNA is not acted In other words, the more luminescence of luciferase is suppressed, the higher the activity of siRNA.

ここで、レポーター遺伝子はルシフェラーゼ遺伝子に限らず、活性の有無の判断方法も上記のレポータージーンアッセイを用いた方法に限らない。   Here, the reporter gene is not limited to the luciferase gene, and the method for determining the presence or absence of activity is not limited to the method using the reporter gene assay.

阻害相関値を使用した活性スコアの算出は、活性スコア算出部300が、上記の方法により求められ阻害相関値記憶部191に記憶された阻害相関値を使用して活性スコアを算出する。
siRNA候補配列の各位置に対してF(m,n)の値を取得し、取得した値の合計値を活性スコアとする。
In calculating the activity score using the inhibition correlation value, the activity score calculation unit 300 calculates the activity score using the inhibition correlation value obtained by the above method and stored in the inhibition correlation value storage unit 191.
The value of F (m, n) is acquired for each position of the siRNA candidate sequence, and the total value of the acquired values is used as the activity score.

例えば、siRNA候補配列がAGCU・・・AGCUで、図4においてsiRNAにより機能を阻害される遺伝子が遺伝子Aである場合は、F(1,A)+F(2,G)+F(3,C)+F(4,U)+・・・+F(16,A)+F(17,G)+F(18,C)+F(19,U)の計算結果が活性スコアになる。   For example, when the siRNA candidate sequence is AGCU... AGCU and the gene whose function is inhibited by siRNA in FIG. 4 is gene A, F (1, A) + F (2, G) + F (3, C) The calculation result of + F (4, U) +... + F (16, A) + F (17, G) + F (18, C) + F (19, U) becomes the activity score.

活性スコアは、値が大きいほど、siRNAによる機能阻害の可能性が高くなる。   The greater the value of the activity score, the higher the possibility of function inhibition by siRNA.

図5は、実施の形態1における指標に基づく活性スコアの算出処理の流れを示す図である。
活性スコア算出部300は、図5に示す処理により、指標に基づく活性スコアを算出する。
FIG. 5 is a diagram showing a flow of activity score calculation processing based on the index in the first embodiment.
The activity score calculation unit 300 calculates an activity score based on the index by the process shown in FIG.

指標の一つとして、siRNA候補配列はGまたはCが4つ以上連続しているかを判定する(S201)。
判定した結果、GまたはCが4つ以上連続しているsiRNA候補配列の場合、これを候補配列から除外する(S202)。
As one of the indexes, it is determined whether the siRNA candidate sequence has four or more consecutive G or C (S201).
As a result of the determination, in the case of an siRNA candidate sequence in which four or more G or C are continuous, this is excluded from the candidate sequence (S202).

次に、指標の一つとして、siRNA候補配列のGとCとの含量(以下、GC含量とする)についてのGCスコアを求める(S203)。
例えば、GC含量が30%〜50%の場合にGCスコアを高くする。
Next, as one of the indices, a GC score for the content of G and C of the siRNA candidate sequence (hereinafter referred to as GC content) is obtained (S203).
For example, the GC score is increased when the GC content is 30% to 50%.

次に、指標の一つとして、siRNA候補配列が対応する標的遺伝子のmRNAの塩基配列の位置についての位置スコアを求める(S204)。
例えば、siRNA候補配列と対応するmRNAの塩基配列の位置が、開始コドンから50塩基以上下流の場合に位置スコアを高くする。
また、siRNA候補配列と対応するmRNAの塩基配列の位置が、5’末端および3’末端の非翻訳領域(UTR)の場合に位置スコアを低くする。
Next, as one of the indices, a position score is obtained for the position of the base sequence of the mRNA of the target gene to which the siRNA candidate sequence corresponds (S204).
For example, the position score is increased when the position of the base sequence of mRNA corresponding to the siRNA candidate sequence is 50 bases or more downstream from the start codon.
In addition, the position score is lowered when the position of the base sequence of mRNA corresponding to the siRNA candidate sequence is the untranslated region (UTR) at the 5 ′ end and the 3 ′ end.

次に、指標の一つとして、siRNA候補配列と非標的遺伝子のmRNAの塩基配列との相同関係についての相同スコアを求める(S205)。
例えば、最も互いの塩基配列が一致する部分について、一致する塩基の数が多いほど相同スコアを低くする。
Next, as one of the indexes, a homology score is obtained for the homology between the siRNA candidate sequence and the base sequence of the mRNA of the non-target gene (S205).
For example, the homology score is lowered as the number of matching bases increases in the part where the base sequences match each other most.

各指標に基づき求めたGCスコア、位置スコア、相同スコアを合計し、その合計値を活性スコアとする(S206)。   The GC score, position score, and homology score obtained based on each index are summed, and the sum is used as the activity score (S206).

指標に基づく活性スコアの算出処理は、他の指標を上記指標に追加しても良いし、上記指標の一部の指標に基づいて算出してもよい。   In the activity score calculation process based on the index, another index may be added to the index, or may be calculated based on a part of the index.

活性スコア算出部300は、上記のように、阻害相関値や指標に基づいて活性スコアを算出するが、活性スコアは、阻害相関値に基づく活性スコアと指標に基づく活性スコアとの合計値でもよい、どちらか一方の活性スコアの値でもよいし、他の処理により求めた活性スコアを加えてもよい。   As described above, the activity score calculation unit 300 calculates the activity score based on the inhibition correlation value and the index, but the activity score may be a total value of the activity score based on the inhibition correlation value and the activity score based on the index. The value of either activity score may be used, or the activity score obtained by other processing may be added.

図3において、次に、S103で抽出したsiRNA候補配列に対して、S102で取得した非標的遺伝子のmRNAへの影響スコアを算出する(S105)。
影響スコアの算出方法について、図6に基づいて説明する。
In FIG. 3, next, for the siRNA candidate sequence extracted in S103, an influence score on the mRNA of the non-target gene obtained in S102 is calculated (S105).
A method for calculating the influence score will be described with reference to FIG.

図6は、実施の形態1における影響スコア算出処理の流れを示す図である。
影響スコア算出部400は、図6に示す処理により影響スコアを算出する。
FIG. 6 is a diagram showing a flow of influence score calculation processing in the first embodiment.
The influence score calculation unit 400 calculates an influence score by the process shown in FIG.

まず、影響スコアを0にセットする(S301)。   First, the influence score is set to 0 (S301).

次に、候補配列取得部200から入力したmRNAの塩基配列のうち、非標的遺伝子のmRNAの塩基配列を1つ取り出す(S302)。   Next, one base sequence of mRNA of the non-target gene is taken out from the base sequence of mRNA input from the candidate sequence acquisition unit 200 (S302).

次に、siRNA候補配列と、S302で取り出した非標的遺伝子のmRNAの塩基配列との相同関係についての相同スコアを求める(S303)。
例えば、最も互いの塩基配列が一致する部分について、一致する塩基の数が多いほど相同スコアを高くする。
Next, a homology score is obtained for the homology between the siRNA candidate sequence and the base sequence of the mRNA of the non-target gene extracted in S302 (S303).
For example, the homology score is increased as the number of matching bases increases in the portion where the base sequences match most.

次に、S302で取り出したmRNAの塩基配列に対応する非標的遺伝子に対して、siRNA候補配列が機能を阻害する度合いを示す活性スコアを算出する(S304)。
活性スコアの算出方法は、図4に基づいて説明した活性スコアの算出方法と同様である。
Next, an activity score indicating the degree to which the siRNA candidate sequence inhibits the function is calculated for the non-target gene corresponding to the base sequence of the mRNA extracted in S302 (S304).
The activity score calculation method is the same as the activity score calculation method described with reference to FIG.

次に、S302で取り出したmRNAの塩基配列に対応する非標的遺伝子の重み付け情報値を取得する(S305)。
重み付け情報値は遺伝子情報記憶部192に記憶される。
重み付け情報値には、遺伝子からのmRNAの発現量に対する値と遺伝子の機能的な重要度に対する値がある。
Next, the weighting information value of the non-target gene corresponding to the base sequence of mRNA extracted in S302 is acquired (S305).
The weighting information value is stored in the gene information storage unit 192.
The weighting information value includes a value for the expression level of mRNA from the gene and a value for the functional importance of the gene.

遺伝子からのmRNAの発現量について、mRNAの発現量が少ない場合は、元々、そのmRNAによる機能が機能していないとすることができるため、重み付け情報値が低くなる。
このmRNAの発現量は、対象生物体および対象生物種から取り出したmRNAを蛍光ラベル化し、蛍光ラベル化したmRNAを、mRNAの塩基配列と相補的な塩基配列を持つ遺伝子がスポットされたマイクロアレイ上で、遺伝子とハイブリダイズさせ、洗浄後蛍光の量を観察するという方法で、計測することができる。
As for the expression level of mRNA from a gene, when the expression level of mRNA is small, it can be assumed that the function of the mRNA is not functioning originally, so that the weighting information value is low.
The expression level of this mRNA is determined by fluorescently labeling mRNA extracted from the target organism and species, and then labeling the fluorescently labeled mRNA on a microarray on which a gene having a base sequence complementary to the mRNA base sequence is spotted. It can be measured by a method of hybridizing with a gene and observing the amount of fluorescence after washing.

機能的な重要度について、対象である遺伝子の機能を阻害しても、機能を阻害していないときと細胞の様子がほとんど変化しない場合は、重み付け情報の値が低くなり、変化の程度に応じて重み付け情報値が決まる。
この変化の程度に対する重み付け情報の値は、任意のsiRNAやノックアウト個体を用いた機能阻害実験の結果に基づいて設定することができる。
In terms of functional importance, even if the function of the target gene is inhibited, if the function is not inhibited and the state of the cell is almost unchanged, the value of the weighting information will be low, and depending on the degree of change Thus, the weighting information value is determined.
The value of the weighting information for the degree of change can be set based on the result of a function inhibition experiment using an arbitrary siRNA or knockout individual.

重み付け情報値は、発現量に対する値と重要度に対する値との合計値でもよいし、どちらか一方の値でもよいし、その他の重み付け情報値を加えてもよい。   The weighting information value may be a total value of the value for the expression level and the value for the importance level, or may be one of these values, or other weighting information values may be added.

次に、S305で取得した機能的な重要度に対する値に基づいて、S302で取り出したmRNAの塩基配列に対応する非標的遺伝子が必須遺伝子か判定する(S306)。
非標的遺伝子の機能を阻害することで、細胞が壊死するなど致命的な影響が起きることを特別に扱う。
Next, based on the value for the functional importance acquired in S305, it is determined whether the non-target gene corresponding to the base sequence of the mRNA extracted in S302 is an essential gene (S306).
Special treatment of the fatal effects such as necrosis of cells by inhibiting the function of non-target genes.

非標的遺伝子が必須遺伝子だと判定した場合、S304で算出した活性スコアが任意の閾値Aを超える値か判定する(S307)。   When it is determined that the non-target gene is an essential gene, it is determined whether the activity score calculated in S304 is a value exceeding an arbitrary threshold A (S307).

非標的遺伝子が必須遺伝子で且つ活性スコアが任意の閾値Aを超える値の場合、対象のsiRNA候補配列を候補配列から除外する(S308)。   If the non-target gene is an essential gene and the activity score exceeds the arbitrary threshold A, the target siRNA candidate sequence is excluded from the candidate sequences (S308).

次に、S303で求めた相同スコアとS304で算出した活性スコアとの合計値と、S305で取得した重み付け情報値とを掛け合わせ、掛け合わせた値を影響スコアの値に足しあわせる(S309)。   Next, the total value of the homology score calculated in S303 and the activity score calculated in S304 is multiplied by the weighted information value acquired in S305, and the multiplied value is added to the value of the influence score (S309).

次に、候補配列取得部200から入力したmRNAの塩基配列に、影響スコアを求めていない、非標的遺伝子のmRNAの塩基配列があるか判定する(S310)。
影響スコアを求めていない非標的遺伝子のmRNAの塩基配列がある場合、S202からS209を繰返し、全非標的遺伝子に対する影響スコアを算出する。
Next, it is determined whether there is a base sequence of mRNA of a non-target gene for which an influence score is not obtained in the base sequence of mRNA input from the candidate sequence acquisition unit 200 (S310).
When there is a base sequence of mRNA of a non-target gene for which an influence score is not obtained, S202 to S209 are repeated, and an influence score for all non-target genes is calculated.

影響スコアは、相同スコアと活性スコアと重み付け情報値とに基づいて算出してもよいし、いずれかの値またはいずれかの値の組合せに基づいて算出してもよい。また、その他の影響スコアを加えてもよい。   The influence score may be calculated based on the homology score, the activity score, and the weighting information value, or may be calculated based on any value or any combination of values. Other influence scores may be added.

図3において、次に、S104で算出した活性スコアとS105で算出した影響スコアとに基づいて、S103で取得したsiRNA候補配列からsiRNAの塩基配列を決定する(S106)。
siRNAの塩基配列の決定方法について、図7に基づいて説明する。
In FIG. 3, next, based on the activity score calculated in S104 and the influence score calculated in S105, the base sequence of siRNA is determined from the siRNA candidate sequence acquired in S103 (S106).
A method for determining the base sequence of siRNA will be described with reference to FIG.

図7は、実施の形態1におけるsiRNAの塩基配列の決定処理の流れを示す図である。
阻害配列決定部500は、図7に示す処理によりsiRNAの塩基配列を決定する。
FIG. 7 is a diagram showing a flow of siRNA base sequence determination processing in the first embodiment.
The inhibitory sequence determination unit 500 determines the base sequence of siRNA by the process shown in FIG.

まず、siRNA候補配列から、標的遺伝子に対する活性スコアが任意の閾値Bより小さいものを除く(S401)。   First, siRNA candidate sequences are excluded from those whose activity score for the target gene is smaller than an arbitrary threshold B (S401).

次に、siRNA候補配列から、非標的遺伝子に対する影響スコアが任意の閾値Cより大きいものを除く(S402)。   Next, siRNA candidate sequences are excluded from those whose influence score for non-target genes is greater than an arbitrary threshold C (S402).

次に、残ったsiRNA候補配列に対して、標的遺伝子に対する活性スコアから、非標的遺伝子に対する影響スコアを差し引いて、総合評価スコアを算出する(S403)。   Next, an overall evaluation score is calculated by subtracting the influence score for the non-target gene from the activity score for the target gene for the remaining siRNA candidate sequences (S403).

そして、総合評価スコアの高いものを設計したsiRNAの塩基配列に決定する(S404)。   Then, the designed siRNA base sequence having a high overall evaluation score is determined (S404).

これにより、それぞれのsiRNA候補配列について、標的遺伝子に対する活性スコアが高く、非標的遺伝子に対する影響スコアが低いものを、siRNAの塩基配列に採用することができる。   Thereby, about each siRNA candidate sequence, what has a high activity score with respect to a target gene, and a low influence score with respect to a non-target gene is employable as a base sequence of siRNA.

図3において、核酸配列設計装置100は、上記の流れにより、siRNAの塩基配列を決定する。   In FIG. 3, the nucleic acid sequence designing apparatus 100 determines the base sequence of siRNA according to the above flow.

図8は、実施の形態1における核酸配列設計処理のデータの流れを示す図である。
実施の形態1における核酸配列設計処理のデータの流れを図8に基づいて説明する。
FIG. 8 is a diagram showing a data flow of the nucleic acid sequence design process in the first embodiment.
The data flow of the nucleic acid sequence design process in the first embodiment will be described with reference to FIG.

種別情報配列記憶部181に記憶される対象生物種のmRNAの塩基配列に基づいて、標的遺伝子のmRNAの塩基配列と非標的遺伝子のmRNAの塩基配列とsiRNA候補配列とを取得する(S501)。   Based on the base sequence of the mRNA of the target species stored in the type information sequence storage unit 181, the base sequence of the target gene mRNA, the base sequence of the non-target gene mRNA, and the siRNA candidate sequence are acquired (S 501).

標的遺伝子のmRNAの塩基配列と非標的遺伝子のmRNAの塩基配列と、阻害相関値記憶部191に記憶されるsiRNA候補配列に対する阻害相関値とに基づいて活性スコアを算出する(S502)。   An activity score is calculated based on the base sequence of the target gene mRNA, the base sequence of the non-target gene mRNA, and the inhibition correlation value for the siRNA candidate sequence stored in the inhibition correlation value storage unit 191 (S502).

siRNA候補配列と非標的遺伝子のmRNAの塩基配列と、阻害相関値記憶部191に記憶されるsiRNAに対する阻害相関値と、遺伝子情報記憶部に記憶される遺伝子の重み付け情報値とに基づいて、影響スコアを算出する。
また、活性スコアと影響スコアとに基づいてsiRNAの塩基配列を決定する(S403)。
Based on the siRNA candidate sequence, the base sequence of the mRNA of the non-target gene, the inhibition correlation value for siRNA stored in the inhibition correlation value storage unit 191, and the weighted information value of the gene stored in the gene information storage unit Calculate the score.
Further, the base sequence of siRNA is determined based on the activity score and the influence score (S403).

実施の形態1において、核酸配列設計装置100は、上記のようにsiRNAの塩基配列を決定する。   In the first embodiment, the nucleic acid sequence design device 100 determines the base sequence of siRNA as described above.

実施の形態1では、種別配列取得部210は、核酸配列設計装置100が備えた種別情報配列記憶部181から対象生物種のmRNA塩基配列を取得した。
ただし、核酸配列設計装置100が種別情報配列記憶部181を備えず、種別配列取得部210は、ネットワークを介して、対象生物種のmRNA塩基配列を取得してもよい。
対象生物種のmRNA塩基配列の取得元には、NCBI(National Center for Biotechnology Information)の提供するデータベースであるUniGeneなどがある。
In the first embodiment, the type sequence acquisition unit 210 acquires the mRNA base sequence of the target species from the type information sequence storage unit 181 provided in the nucleic acid sequence design device 100.
However, the nucleic acid sequence design device 100 may not include the type information sequence storage unit 181, and the type sequence acquisition unit 210 may acquire the mRNA base sequence of the target organism species via a network.
Sources of obtaining the mRNA base sequence of the target species include UniGene, which is a database provided by NCBI (National Center for Biotechnology Information).

実施の形態1では、核酸配列設計装置100が活性スコア算出部300と影響スコア算出部400とを備え、活性スコアと影響スコアとに基づいてsiRNAの塩基配列を決定した。
ただし、核酸配列設計装置100は活性スコア算出部300と影響スコア算出部400とのいずれかを備え、いずれかが算出した値に基づいてsiRNAの塩基配列を決定してもよいし、さらにその他の値を考慮してsiRNAの塩基配列を決定してもよい。
In the first embodiment, the nucleic acid sequence design device 100 includes the activity score calculation unit 300 and the influence score calculation unit 400, and the siRNA base sequence is determined based on the activity score and the influence score.
However, the nucleic acid sequence design apparatus 100 includes either the activity score calculation unit 300 or the influence score calculation unit 400, and may determine the base sequence of siRNA based on the value calculated by either of them, or other The base sequence of siRNA may be determined in consideration of the value.

実施の形態2.
上記実施の形態1では、対象生物種の標的遺伝子のmRNAの塩基配列に基づいてsiRNA候補配列を取得する場合を説明した。
実施の形態2では、siRNA候補配列を記憶部から取得する場合を説明する。
Embodiment 2. FIG.
In the first embodiment, the case has been described in which the siRNA candidate sequence is obtained based on the base sequence of the mRNA of the target gene of the target species.
In the second embodiment, a case where a siRNA candidate sequence is acquired from a storage unit will be described.

図9は、実施の形態2における核酸配列設計装置100の構成図である。
実施の形態2における核酸配列設計装置100の構成を図9に基づいて説明する。
ここで、上記実施の形態1における図2の核酸配列設計装置100と異なる構成を説明し、その他の構成は図2と同様であるものとする。
FIG. 9 is a configuration diagram of the nucleic acid sequence designing apparatus 100 according to the second embodiment.
The configuration of the nucleic acid sequence design apparatus 100 in the second embodiment will be described with reference to FIG.
Here, a configuration different from the nucleic acid sequence designing apparatus 100 of FIG. 2 in the first embodiment will be described, and the other configurations are the same as those of FIG.

図9において、核酸配列設計装置100は、siRNA候補配列を記憶する機能阻害核酸配列記憶部183を備える。
機能阻害核酸配列記憶部183には、既に、実験等により一定の機能阻害効果が認められたsiRNA候補配列が記憶されている。
候補配列取得部200は、機能阻害核酸配列記憶部183から、siRNA候補配列を取得する。
In FIG. 9, the nucleic acid sequence design device 100 includes a function-inhibiting nucleic acid sequence storage unit 183 that stores siRNA candidate sequences.
The function-inhibiting nucleic acid sequence storage unit 183 already stores siRNA candidate sequences that have been confirmed to have a certain function-inhibiting effect through experiments or the like.
The candidate sequence acquisition unit 200 acquires a siRNA candidate sequence from the function-inhibiting nucleic acid sequence storage unit 183.

図10は、実施の形態2における核酸配列設計装置100の処理の流れを示す図である。
実施の形態2における核酸配列設計装置100が行うsiRNAの塩基配列設計方法の処理の流れを図10に基づいて説明する。
ここで、実施の形態1における図3と異なる処理について説明し、その他の処理は、図3と同様であるものとする。
FIG. 10 is a diagram showing a processing flow of the nucleic acid sequence designing apparatus 100 according to the second embodiment.
The flow of the process of the siRNA base sequence design method performed by the nucleic acid sequence design apparatus 100 according to the second embodiment will be described with reference to FIG.
Here, processing different from that in FIG. 3 in the first embodiment will be described, and other processing is assumed to be the same as that in FIG.

候補配列取得部200は、機能阻害核酸配列記憶部183からsiRNA候補配列を取得する(S603)。   The candidate sequence acquisition unit 200 acquires the siRNA candidate sequence from the function-inhibiting nucleic acid sequence storage unit 183 (S603).

S601、S602、S604、S605およびS606は、図3におけるS101、S102、S104、S105およびS106の処理と同様である。   Steps S601, S602, S604, S605, and S606 are the same as the processing of S101, S102, S104, S105, and S106 in FIG.

実施の形態2において、その他の核酸配列設計方法に関する内容は、上記実施の形態1と同様である。   In the second embodiment, the other contents relating to the nucleic acid sequence design method are the same as those in the first embodiment.

実施の形態3.
上記実施の形態1では、対象生物体と同種である、対象生物種のmRNAの塩基配列からsiRNAの塩基配列を取得する場合を説明した。
実施の形態3では、対象生物体のmRNAの塩基配列からsiRNAの塩基配列を取得する場合を説明する。
Embodiment 3 FIG.
In the first embodiment, the case has been described in which the base sequence of siRNA is obtained from the base sequence of mRNA of the target organism species that is the same species as the target organism.
In Embodiment 3, a case will be described in which the base sequence of siRNA is obtained from the base sequence of mRNA of a target organism.

図11は、実施の形態3における、核酸配列設計装置100の構成図である。
実施の形態3における核酸配列設計装置100の構成を図11に基づいて説明する。
ここで、上記実施の形態1における図2の核酸配列設計装置100と異なる構成を説明し、その他の構成は図2と同様であるものとする。
FIG. 11 is a configuration diagram of the nucleic acid sequence design device 100 according to the third embodiment.
The configuration of the nucleic acid sequence design apparatus 100 according to Embodiment 3 will be described with reference to FIG.
Here, a configuration different from the nucleic acid sequence designing apparatus 100 of FIG. 2 in the first embodiment will be described, and the other configurations are the same as those of FIG.

図11において、核酸配列設計装置100は、対象生物種の各遺伝子の塩基配列を、遺伝情報部分であるエクソンの塩基配列と、非遺伝情報部分であるイントロンの塩基配列とに分けて記憶する種別領域配列記憶部182を備える。   In FIG. 11, the nucleic acid sequence design device 100 stores the base sequence of each gene of the target species separately into the base sequence of an exon that is a genetic information part and the base sequence of an intron that is a non-genetic information part. An area array storage unit 182 is provided.

また、候補配列取得部200は、以下のものを備える。
対象生物体の標的遺伝子の塩基配列を取得する塩基配列取得部220。
種別領域配列記憶部182から標的遺伝子および非標的遺伝子のエクソンの塩基配列とイントロンの塩基配列とを取得する領域配列取得部230。
塩基配列取得部220が取得した対象生物体の標的遺伝子および非標的遺伝子と、領域配列取得部230が取得したエクソンの塩基配列およびイントロンの塩基配列との相同関係に基づいて、対象生物体の標的遺伝子および非標的遺伝子のmRNAの塩基配列を取得する情報配列取得部240。
The candidate sequence acquisition unit 200 includes the following.
A base sequence acquisition unit 220 that acquires a base sequence of a target gene of a target organism.
A region sequence acquisition unit 230 that acquires the base sequences of exons and introns of target genes and non-target genes from the type region sequence storage unit 182.
Based on the homology between the target gene and non-target gene of the target organism acquired by the base sequence acquisition unit 220 and the base sequence of the exon and intron acquired by the region sequence acquisition unit 230, the target of the target organism An information sequence acquisition unit 240 that acquires base sequences of mRNAs of genes and non-target genes.

塩基配列取得部220は、ジデオキシ法により対象生物体の標的遺伝子および非標的遺伝子の塩基配列を取得することができる。
まず、遺伝子をベクターに組み込んでベクターを増やすクローニング法、またはPCR法などにより標的遺伝子および非標的遺伝子を増幅する。
次に、増幅した標的遺伝子および非標的遺伝子から一本鎖の遺伝子を取得する。
次に、取得した一本鎖の遺伝子に対して、プライマーと、デオキシヌクレオチドまたはジデオキシヌクレオチドを取り込んだポリメラーゼとにより、相補鎖を合成する。
相補鎖はデオキシヌクレオチドにより伸長し、ジデオキシヌクレオチドにより伸長を停止し、A、T、G、Cの4種の塩基それぞれに対応するジデオキシヌクレオチドを用いることで、各塩基の各位置まで相補鎖が伸長した遺伝子を得る。
そして、長さの異なる各遺伝子は電荷の量が異なり、電気泳動を行うことにより、各遺伝子の移動度の違いから遺伝子の長さを区別し、その長さの位置に、用いたジデオキシヌクレオチドに対応する塩基が位置することがわかる。
The base sequence acquisition unit 220 can acquire the base sequences of the target gene and the non-target gene of the target organism by the dideoxy method.
First, a target gene and a non-target gene are amplified by a cloning method in which genes are incorporated into a vector to increase the vector, or a PCR method.
Next, a single-stranded gene is obtained from the amplified target gene and non-target gene.
Next, a complementary strand is synthesized from the obtained single-stranded gene with a primer and a polymerase incorporating deoxynucleotide or dideoxynucleotide.
Complementary strands are extended by deoxynucleotides, stopped by dideoxynucleotides, and by using dideoxynucleotides corresponding to each of the four types of bases A, T, G, and C, the complementary strands are extended to each position of each base. Get the gene.
Each gene having a different length has a different amount of charge, and electrophoresis is performed to distinguish the length of the gene from the difference in mobility of each gene. It can be seen that the corresponding base is located.

遺伝子長が1000bp程度かそれ以上の長さの場合は、塩基配列決定の精度を確保するために、遺伝子を幾つかの断片に分けて、各断片の塩基配列を取得し、取得した塩基配列を組み合わせて遺伝子全長の塩基配列を取得してもよい。   When the gene length is about 1000 bp or more, in order to ensure the accuracy of base sequence determination, the gene is divided into several fragments, the base sequence of each fragment is obtained, and the obtained base sequence is A base sequence of the full length of the gene may be obtained in combination.

ただし、塩基配列取得部220は、上記以外の方法により、対象生物体の標的遺伝子および非標的遺伝子の塩基配列を取得しても構わない。   However, the base sequence acquisition unit 220 may acquire the base sequences of the target gene and the non-target gene of the target organism by a method other than the above.

情報配列取得部240が行う対象生物体の標的遺伝子および非標的遺伝子のmRNAの塩基配列の取得処理について図12、図13、図14に基づいて、以下に説明する。   The process of acquiring the base sequences of the target gene and non-target gene mRNA of the target organism performed by the information sequence acquisition unit 240 will be described below with reference to FIGS. 12, 13, and 14.

図12は、実施の形態3における種別領域配列記憶部182の記憶内容を示す図である。
図12において、種別領域配列記憶部182は、遺伝子Aや遺伝子Bなどの各遺伝子に対して、各エクソンおよび各イントロンの領域の塩基配列を記憶する。
FIG. 12 is a diagram showing the contents stored in the type area array storage unit 182 in the third embodiment.
In FIG. 12, the type region sequence storage unit 182 stores the base sequence of each exon and each intron region for each gene such as gene A and gene B.

記憶するエクソンおよびイントロンの領域の塩基配列は、対象生物種においてDNAから転写されたmRNAから逆転写されたcDNAの塩基配列を取得し、エクソンに相当する領域を備えるcDNAの塩基配列と、エクソンおよびイントロンに相当する領域を備えるDNAの塩基配列とを比較することにより取得できる。   The base sequence of exon and intron regions to be memorized is obtained from the base sequence of cDNA reversely transcribed from mRNA transcribed from DNA in the target organism species, and the base sequence of cDNA comprising the region corresponding to exon, exon and It can be obtained by comparing with the base sequence of DNA having a region corresponding to an intron.

図13は、実施の形態3におけるmRNAの構造を示す図である。
図12における遺伝子Aについて、mRNAと、エクソンとイントロンとの関係を図13に基づいて説明する。
遺伝子Aは、第1から第nのエクソンおよびイントロンを備える。
エクソンは遺伝情報領域で、イントロンは非遺伝情報領域であり、遺伝子Aから転写したmRNAはエクソンに相当する遺伝情報を備える。
そして、mRNAのエクソンに相当する遺伝情報を示す塩基配列は、同一の生物種であっても生物体毎に異なる塩基部分を持つ。この異なる塩基、つまり1塩基の多型のことをSNP(Single Nucleotide Polymorphism)という。
遺伝子Aの場合は、GAACGとATGTGとの間の塩基が、AまたはGの入るSNP1であり、AAGCTとCGTTAとの間の塩基が、GまたはCの入るSNP2であり、ACCATとTTCAGとの間の塩基が、GまたはCの入るSNP3である。
FIG. 13 is a diagram showing the structure of mRNA in Embodiment 3.
Regarding gene A in FIG. 12, the relationship between mRNA, exon and intron will be described with reference to FIG.
Gene A comprises first to nth exons and introns.
Exons are genetic information regions, introns are non-genetic information regions, and mRNA transcribed from gene A has genetic information corresponding to exons.
And the base sequence which shows the genetic information equivalent to the exon of mRNA has a different base part for every organism even if it is the same organism species. This different base, that is, a polymorphism of one base is called SNP (Single Nucleotide Polymorphism).
In the case of gene A, the base between GAACG and ATGTG is SNP1 containing A or G, the base between AAGCT and CGTTA is SNP2 containing G or C, and between ACCAT and TTCAG Is SNP3 containing G or C.

つまり、同一の生物種であっても生物体毎に遺伝子およびmRNAの塩基配列は異なる。   That is, even in the same species, the base sequences of genes and mRNAs are different for each organism.

図14は、実施の形態3における対象生物体の標的遺伝子のmRNAの塩基配列の取得処理の流れを示す図である。
塩基配列取得部220が取得した対象生物体の標的遺伝子の塩基配列と、領域配列取得部230が種別領域配列記憶部182から取得した、対象生物種の標的遺伝子のエクソン領域とイントロン領域との塩基配列とに基づいて、情報配列取得部240が、対象生物体の標的遺伝子のmRNAの塩基配列を取得する処理の流れを、図14に基づいて説明する。
FIG. 14 is a diagram showing a flow of processing for obtaining the base sequence of mRNA of the target gene of the target organism in the third embodiment.
The base sequence of the target gene of the target organism acquired by the base sequence acquisition unit 220 and the base of the exon region and the intron region of the target gene of the target species acquired from the type region sequence storage unit 182 by the region sequence acquisition unit 230 Based on the sequence, the information sequence acquisition unit 240 will explain the flow of processing for acquiring the base sequence of the mRNA of the target gene of the target organism based on FIG.

塩基配列取得部220が取得した、対象生物種の標的遺伝子の塩基配列と、領域配列取得部230が種別領域配列記憶部182から取得した、対象生物種の標的遺伝子のエクソン領域とイントロン領域との塩基配列とを入力する(S701)。   The base sequence of the target gene of the target species acquired by the base sequence acquisition unit 220 and the exon region and the intron region of the target gene of the target species acquired from the type region sequence storage unit 182 by the region sequence acquisition unit 230 The base sequence is input (S701).

入力したエクソン領域とイントロン領域の塩基配列と相同する対象生物種の標的遺伝子の塩基配列部分を取得し、さらに、取得した対象生物種の標的遺伝子の塩基配列部分のうちのエクソンに相当する領域の塩基配列を取得する(S702)。
相同する配列の検索は、Smith−Waterman法などを使用する。
Obtain the base sequence part of the target gene of the target species that is homologous to the base sequence of the input exon region and intron region, and further, in the region corresponding to the exon in the base sequence part of the target gene of the target species A base sequence is acquired (S702).
The search for homologous sequences uses the Smith-Waterman method or the like.

取得したエクソンに相当する領域の塩基配列を結合する(S703)。   The base sequence of the region corresponding to the acquired exon is bound (S703).

結合した塩基配列中のTをUに置換する(S704)。   T in the bonded base sequence is replaced with U (S704).

置換して得られた塩基配列を、対象生物体の標的遺伝子のmRNAの塩基配列として出力する(S705)。   The base sequence obtained by the replacement is output as the base sequence of the mRNA of the target gene of the target organism (S705).

上記処理を非標的遺伝子に対して行うことで、対象生物体の非標的遺伝子のmRNAの塩基配列を取得することができる。   By performing the above process on the non-target gene, the base sequence of the mRNA of the non-target gene of the target organism can be obtained.

図15は、実施の形態3における核酸配列設計処理のデータの流れを示す図である。
実施の形態3における核酸配列設計処理のデータの流れを図15に基づいて説明する。
ここで、上記実施の形態1における図8と異なるデータの流れを説明し、その他のデータの流れは図8と同様であるものとする。
FIG. 15 is a diagram showing a data flow of the nucleic acid sequence design process in the third embodiment.
The data flow of the nucleic acid sequence design process in the third embodiment will be described with reference to FIG.
Here, a data flow different from that in FIG. 8 in the first embodiment will be described, and the other data flows are assumed to be the same as those in FIG.

種別領域配列記憶部182に記憶される対象生物種の遺伝子のエクソン領域およびイントロン領域の塩基配列と、対象生物体の遺伝子の塩基配列とに基づいて、標的遺伝子のmRNAの塩基配列と非標的遺伝子のmRNAの塩基配列とsiRNA候補配列とを取得する(S801)。   Based on the base sequence of the exon region and intron region of the gene of the target organism species stored in the type region sequence storage unit 182 and the base sequence of the gene of the target organism, the base sequence of the mRNA of the target gene and the non-target gene The base sequence of siRNA and the siRNA candidate sequence are obtained (S801).

S802とS803については、図8のS502とS503と同様である。   S802 and S803 are the same as S502 and S503 in FIG.

実施の形態3において、その他の核酸配列設計方法に関する内容は、上記実施の形態1と同様である。   In the third embodiment, the other contents relating to the nucleic acid sequence design method are the same as in the first embodiment.

実施の形態3における核酸配列設計装置100は、実施の形態2における図9と同様に機能阻害核酸配列記憶部183を備え、この機能阻害核酸配列記憶部183からsiRNA候補配列を取得しても構わない。   The nucleic acid sequence design apparatus 100 according to the third embodiment includes the function-inhibited nucleic acid sequence storage unit 183 as in FIG. 9 in the second embodiment, and may obtain siRNA candidate sequences from the function-inhibited nucleic acid sequence storage unit 183. Absent.

実施の形態3では、領域配列取得部230は、核酸配列設計装置100が備えた種別領域配列記憶部182から対象生物種の遺伝子のエクソン領域とイントロン領域との塩基配列を取得した。
ただし、核酸配列設計装置100が種別領域配列記憶部182を備えず、領域配列取得部230は、ネットワークを介して、対象生物種の遺伝子のエクソン領域とイントロン領域との塩基配列を取得してもよい。
対象生物種の遺伝子のエクソン領域とイントロン領域との塩基配列の取得元には、Ensemblが提供するデータベースなどがある。
In Embodiment 3, the region sequence acquisition unit 230 acquires the base sequences of the exon region and the intron region of the gene of the target species from the type region sequence storage unit 182 provided in the nucleic acid sequence design device 100.
However, the nucleic acid sequence design device 100 does not include the type region sequence storage unit 182, and the region sequence acquisition unit 230 acquires the base sequences of the exon region and the intron region of the gene of the target species via the network. Good.
Sources for obtaining the base sequences of the exon region and intron region of the gene of the target species include a database provided by Ensembl.

実施の形態3において、情報配列取得部240と塩基配列取得部220と領域配列取得部230とを備えることにより、対象生物体の各遺伝子のmRNAの塩基配列を取得することができる。
また、対象生物体の各遺伝子のmRNAの塩基配列に基づいて、siRNA候補配列を取得し、siRNAの塩基配列を設計することができる。
In Embodiment 3, by providing the information sequence acquisition unit 240, the base sequence acquisition unit 220, and the region sequence acquisition unit 230, the base sequence of mRNA of each gene of the target organism can be acquired.
Moreover, based on the base sequence of mRNA of each gene of the target organism, siRNA candidate sequences can be obtained and the base sequence of siRNA can be designed.

実施の形態4.
上記実施の形態3では、対象生物体の遺伝子の塩基配列と、対象生物種の遺伝子のエクソン領域およびイントロン領域の塩基配列とに基づいて、対象生物体のmRNAの塩基配列を取得する場合を説明した。
実施の形態4では、対象生物種の遺伝子の塩基配列と、対象生物体のSNPと、対象生物種の遺伝子のエクソン領域およびイントロン領域の塩基配列とに基づいて、対象生物体のmRNAの塩基配列を取得する場合を説明する。
Embodiment 4 FIG.
In the third embodiment, the case where the base sequence of mRNA of the target organism is acquired based on the base sequence of the gene of the target organism and the base sequence of the exon region and intron region of the gene of the target organism species is described. did.
In Embodiment 4, the base sequence of the mRNA of the target organism based on the base sequence of the gene of the target organism species, the SNP of the target organism species, and the base sequence of the exon region and intron region of the gene of the target organism species The case of acquiring the will be described.

図16は、実施の形態4における、核酸配列設計装置100の構成図である。
実施の形態4における核酸配列設計装置100の構成を図16に基づいて説明する。
ここで、上記実施の形態3における図11の核酸配列設計装置100と異なる構成を説明し、その他の構成は図11と同様であるものとする。
FIG. 16 is a configuration diagram of the nucleic acid sequence design device 100 according to the fourth embodiment.
The configuration of the nucleic acid sequence design apparatus 100 according to Embodiment 4 will be described with reference to FIG.
Here, a configuration different from the nucleic acid sequence designing apparatus 100 of FIG. 11 in the third embodiment will be described, and the other configurations are the same as those of FIG.

図16において、核酸配列設計装置100は、対象生物種の遺伝子の塩基配列を記憶する種別情報配列記憶部181を備える。   In FIG. 16, the nucleic acid sequence design device 100 includes a type information sequence storage unit 181 that stores a base sequence of a gene of a target species.

また、候補配列取得部200は、以下のものを備える。
種別情報配列記憶部181から対象生物種の遺伝子の塩基配列を取得する種別配列取得部210。
対象生物体のSNPを取得する異配列取得部250。
種別配列取得部210が取得した対象生物種の標的遺伝子および非標的遺伝子の塩基配列と、異配列取得部250が取得した対象生物体のSNPと、領域配列取得部230が取得した対象生物種の標的遺伝子および非標的遺伝子のエクソン領域およびイントロン領域の塩基配列とに基づいて、対象生物体の標的遺伝子および非標的遺伝子のmRNAの塩基配列を生成する塩基配列生成部260。
The candidate sequence acquisition unit 200 includes the following.
A type sequence acquisition unit 210 that acquires the base sequence of the gene of the target species from the type information sequence storage unit 181.
The different sequence acquisition part 250 which acquires SNP of a target organism.
The base sequences of the target and non-target genes of the target species acquired by the type sequence acquisition unit 210, the SNP of the target organism acquired by the different sequence acquisition unit 250, and the target species acquired by the region sequence acquisition unit 230 A base sequence generation unit 260 that generates the base sequences of the target gene and the non-target gene mRNA of the target organism based on the base sequences of the exon region and the intron region of the target gene and the non-target gene.

異配列取得部250は、ジェノタイピングにより、対象生物体のSNPを取得することができる。
SNPを含む遺伝子をPCR法により増幅し、この遺伝子をMALDI−TOF MSというタイプの質量分析計にかけることで、この遺伝子の質量を計測し、得られた質量によって、SNPの塩基がA、G、C、Tのどれであるかわかる。
A、G、C、Tは、それぞれ質量が異なるために、予めSNPがAであるとき、Gであるとき、Cであるとき、Tであるときの遺伝子の質量を計測しておくことでこの方法は可能となる。
The different sequence acquisition unit 250 can acquire the SNP of the target organism by genotyping.
A gene containing SNP is amplified by PCR, and the mass of this gene is measured by applying this gene to a mass spectrometer of the type called MALDI-TOF MS, and the base of SNP is A, G by the obtained mass. , C, or T.
Since A, G, C, and T have different masses, the mass of a gene when SNP is A, G, C, or T is measured in advance. A method is possible.

異配列取得部250が行うジェノタイピングは、MALDI−TOF MSを使用する方法に限らず、Invader法、TaqMan法、SnapShot法などでもよい。
また、異配列取得部250が対象生物体のSNPを取得する方法は、ジェノタイピングに限らずシークエンス法、SSCP法、マイクロアレイを使用する方法などでもよい。
The genotyping performed by the different sequence acquisition unit 250 is not limited to a method using MALDI-TOF MS, but may be an Invader method, a TaqMan method, a SnapShot method, or the like.
Moreover, the method by which the different sequence acquisition unit 250 acquires the SNP of the target organism is not limited to genotyping, and may be a sequence method, an SSCP method, a method using a microarray, or the like.

図17は、実施の形態4における塩基配列生成部260の塩基配列生成の処理概要を示す図である。
実施の形態4における、塩基配列生成部260が行う、対象生物体の遺伝子の塩基配列を生成する処理の概要を図17に基づいて説明する。
FIG. 17 is a diagram showing an outline of base sequence generation processing of the base sequence generation unit 260 in the fourth embodiment.
The outline of the process of generating the base sequence of the gene of the target organism performed by the base sequence generation unit 260 in the fourth embodiment will be described with reference to FIG.

異配列取得部250が取得した、対象生物体の遺伝子AのSNP1がG、SNP2がG、SNP3がCで、種別配列取得部210が種別情報配列記憶部820から取得した、対象生物種の遺伝子Aの塩基配列が、・・・GAACGxATGTG・・・AAGCTxCGTTA・・・ACCATxTTCAG・・・であるとする。
この場合、塩基配列生成部260は、対象生物体の遺伝子Aの塩基配列を・・・GAACGGATGTG・・・AAGCTGCGTTA・・・ACCATCTTCAG・・・として生成する。
SNP1 of gene A of the target organism acquired by the different sequence acquisition unit 250 is G, SNP2 is G, and SNP3 is C, and the gene of the target species acquired by the type sequence acquisition unit 210 from the type information sequence storage unit 820 The base sequence of A is assumed to be: GAACGxATTGTG ... AAGCTxCGTTA ... ACCATxTTCAG ...
In this case, the base sequence generation unit 260 generates the base sequence of the gene A of the target organism as... GAACGGATTGTG... AAGCTGCGTTA ... ACCATCTTCAG.

異配列取得部250が取得した、対象生物体の遺伝子AのSNP1がG、SNP2がC、SNP3がCで、種別配列取得部210が種別情報配列記憶部820から取得した、対象生物種の遺伝子Aの塩基配列が、・・・GAACGxATGTG・・・AAGCTxCGTTA・・・ACCATxTTCAG・・・であるとする。
この場合、塩基配列生成部260は、対象生物体の遺伝子Aの塩基配列を・・・GAACGGATGTG・・・AAGCTCCGTTA・・・ACCATCTTCAG・・・として生成する。
SNP1 of gene A of the target organism acquired by the different sequence acquisition unit 250 is G, SNP2 is C, SNP3 is C, and the gene of the target species acquired by the type sequence acquisition unit 210 from the type information sequence storage unit 820 The base sequence of A is assumed to be: GAACGxATTGTG ... AAGCTxCGTTA ... ACCATxTTCAG ...
In this case, the base sequence generation unit 260 generates the base sequence of the gene A of the target organism as ... GAACGGATTGTG ... AAGCTCCGTTA ... ACCATCTTCAG ...

塩基配列生成部260は、上記のようにして生成した、対象生物体の標的遺伝子および非標的遺伝子の塩基配列と、領域配列取得部230が取得した対象生物種の標的遺伝子および非標的遺伝子のエクソン領域およびイントロン領域の塩基配列とに基づいて、実施の形態3における情報配列取得部240と同様にして、対象生物体の標的遺伝子および非標的遺伝子のmRNAの塩基配列を取得する。   The base sequence generation unit 260 generates the target gene and non-target gene base sequences of the target organism and the target gene and non-target gene exons acquired by the region sequence acquisition unit 230 as described above. Based on the base sequence of the region and the intron region, the base sequences of the target gene and non-target gene mRNA of the target organism are acquired in the same manner as the information sequence acquisition unit 240 in the third embodiment.

図18は、実施の形態4における核酸配列設計処理のデータの流れを示す図である。
実施の形態4における核酸配列設計処理のデータの流れを図18に基づいて説明する。
ここで、上記実施の形態3における図15と異なるデータの流れを説明し、その他のデータの流れは図15と同様であるものとする。
FIG. 18 is a diagram showing a data flow of the nucleic acid sequence design process in the fourth embodiment.
The data flow of the nucleic acid sequence design process in the fourth embodiment will be described with reference to FIG.
Here, a data flow different from that in FIG. 15 in the third embodiment will be described, and the other data flows are assumed to be the same as those in FIG.

種別情報配列記憶部181に記憶される対象生物種の遺伝子の塩基配列と、種別領域配列記憶部182に記憶される対象生物種の遺伝子のエクソン領域およびイントロン領域の塩基配列と、対象生物体のSNPとに基づいて、標的遺伝子のmRNAの塩基配列と非標的遺伝子のmRNAの塩基配列とsiRNA候補配列とを取得する(S901)。   The base sequence of the gene of the target species stored in the type information sequence storage unit 181; the base sequence of the exon region and intron region of the gene of the target species stored in the type region sequence storage unit 182; and the base sequence of the target organism Based on the SNP, the base sequence of the target gene mRNA, the base sequence of the non-target gene mRNA, and the siRNA candidate sequence are obtained (S901).

S902とS903については、図8のS802とS803と同様である。   S902 and S903 are the same as S802 and S803 of FIG.

実施の形態4において、その他の核酸配列設計方法に関する内容は、上記実施の形態3と同様である。   In the fourth embodiment, the other contents relating to the nucleic acid sequence design method are the same as those in the third embodiment.

実施の形態4における核酸配列設計装置100は、上記実施の形態2における図9と同様に機能阻害核酸配列記憶部183を備え、この機能阻害核酸配列記憶部183からsiRNA候補配列を取得しても構わない。   The nucleic acid sequence design apparatus 100 according to the fourth embodiment includes the function-inhibited nucleic acid sequence storage unit 183 as in FIG. 9 in the second embodiment, and even if siRNA candidate sequences are acquired from the function-inhibited nucleic acid sequence storage unit 183. I do not care.

実施の形態4では、種別配列取得部210は、核酸配列設計装置100が備えた種別情報配列記憶部181から対象生物種の遺伝子の塩基配列を取得した。
ただし、核酸配列設計装置100が種別情報配列記憶部181を備えず、種別配列取得部210は、ネットワークを介して、対象生物種の遺伝子の塩基配列を取得してもよい。
In Embodiment 4, the type sequence acquisition unit 210 acquires the base sequence of the gene of the target species from the type information sequence storage unit 181 provided in the nucleic acid sequence design device 100.
However, the nucleic acid sequence design device 100 may not include the type information sequence storage unit 181, and the type sequence acquisition unit 210 may acquire the base sequence of the gene of the target organism species via a network.

実施の形態4において、異配列取得部250と塩基配列生成部260とを備えることにより、対象生物体の各遺伝子の塩基配列を取得する時間の短縮およびコストの削減を図ることができる。   In the fourth embodiment, by providing the different sequence acquisition unit 250 and the base sequence generation unit 260, it is possible to reduce the time and cost for acquiring the base sequence of each gene of the target organism.

実施の形態5.
上記実施の形態では、対象生物種または対象生物体の各遺伝子のmRNAの塩基配列とsiRNA候補配列とを取得し、取得したsiRNA候補配列の標的遺伝子に対する活性スコアと、取得したsiRNA候補配列の非標的遺伝子に対する影響スコアとを算出し、算出した活性スコアと影響スコアとに基づいて、siRNAの塩基配列を設計する核酸配列設計装置100について説明した。
実施の形態5では、機能阻害効果として活性スコアを算出する機能阻害効果算出装置600について説明する。
Embodiment 5. FIG.
In the above embodiment, the mRNA base sequence and siRNA candidate sequence of each gene of the target organism species or target organism are acquired, the activity score for the target gene of the acquired siRNA candidate sequence, and the non-simplification of the acquired siRNA candidate sequence. The nucleic acid sequence design apparatus 100 that calculates the influence score for the target gene and designs the base sequence of siRNA based on the calculated activity score and influence score has been described.
In the fifth embodiment, a function inhibition effect calculation device 600 that calculates an activity score as a function inhibition effect will be described.

図19は、実施の形態5における機能阻害効果算出装置600の構成図である。
実施の形態5における機能阻害効果算出装置600の構成を図19に基づいて説明する。
FIG. 19 is a configuration diagram of the function inhibition effect calculation device 600 according to the fifth embodiment.
The configuration of the function inhibition effect calculation device 600 according to Embodiment 5 will be described with reference to FIG.

機能阻害効果算出装置600は、以下のものを備える。
siRNAの塩基配列に対する阻害相関値を記憶する阻害相関値記憶部191。
機能阻害効果の算出対象であるsiRNAの塩基配列に対する活性スコアを算出する活性スコア算出部300。
活性スコア算出部300は、対象生物種または対象生物体の標的遺伝子のmRNAの塩基配列と、機能阻害効果の算出対象であるsiRNAの塩基配列とを入力し、入力したsiRNAの塩基配列に対する阻害相関値を、阻害相関値記憶部191から取得する。
さらに、入力したmRNAの塩基配列およびsiRNAの塩基配列と、取得した阻害相関値とに基づいて、活性スコアを算出する。
The function inhibition effect calculation device 600 includes the following.
An inhibition correlation value storage unit 191 that stores inhibition correlation values for siRNA base sequences.
An activity score calculation unit 300 that calculates an activity score for the base sequence of siRNA that is a target for calculating the function inhibition effect.
The activity score calculation unit 300 inputs the base sequence of the mRNA of the target gene of the target species or the target organism and the base sequence of the siRNA that is the target for calculating the function inhibition effect, and the inhibition correlation with the base sequence of the input siRNA. The value is acquired from the inhibition correlation value storage unit 191.
Furthermore, an activity score is calculated based on the inputted base sequence of mRNA and base sequence of siRNA and the obtained inhibition correlation value.

その他の内容について、活性スコア算出部300と阻害相関値記憶部191とは、上記実施の形態における活性スコア算出部300と阻害相関値記憶部191と同様である。   Regarding other contents, the activity score calculation unit 300 and the inhibition correlation value storage unit 191 are the same as the activity score calculation unit 300 and the inhibition correlation value storage unit 191 in the above embodiment.

実施の形態6.
上記実施の形態では、siRNAの塩基配列を設計する核酸配列設計装置100および機能阻害効果として活性スコアを算出する機能阻害効果算出装置600とについて説明した。
実施の形態6では、機能阻害影響度として影響スコアを算出する機能阻害影響度算出装置700について説明する。
Embodiment 6 FIG.
In the above embodiment, the nucleic acid sequence design device 100 that designs the base sequence of siRNA and the function inhibition effect calculation device 600 that calculates an activity score as the function inhibition effect have been described.
In the sixth embodiment, a function inhibition influence degree calculation device 700 that calculates an influence score as a function inhibition influence degree will be described.

図20は、実施の形態6における機能阻害影響度算出装置700の構成図である。
実施の形態6における機能阻害影響度算出装置700の構成を図20に基づいて説明する。
FIG. 20 is a configuration diagram of the function inhibition influence degree calculation device 700 according to the sixth embodiment.
The configuration of the function inhibition influence calculation device 700 according to the sixth embodiment will be described with reference to FIG.

機能阻害影響度算出装置700は、以下のものを備える。
遺伝子の重み付け情報値を記憶する遺伝子情報記憶部192。
機能阻害影響度の算出対象であるsiRNAの塩基配列に対する影響スコアを算出する影響スコア算出部400。
影響スコア算出部400は、対象生物種または対象生物体の非標的遺伝子のmRNAの塩基配列と、機能阻害影響度の算出対象であるsiRNAの塩基配列とを入力し、入力したmRNAの塩基配列に対応する非標的遺伝子の重み付け情報値を、遺伝子情報記憶部192から取得する。
さらに、入力したmRNAの塩基配列およびsiRNAの塩基配列と、取得した重み付け情報値とに基づいて、影響スコアを算出する。
The function inhibition influence degree calculation device 700 includes the following.
A gene information storage unit 192 that stores gene weighting information values.
An influence score calculation unit 400 that calculates an influence score for the base sequence of siRNA that is a calculation target of the function inhibition influence degree.
The influence score calculation unit 400 inputs the base sequence of the mRNA of the non-target gene of the target species or target organism and the base sequence of the siRNA that is the target of calculating the function inhibition influence level, and enters the base sequence of the input mRNA. The weighting information value of the corresponding non-target gene is acquired from the gene information storage unit 192.
Further, an influence score is calculated based on the inputted base sequence of mRNA and base sequence of siRNA and the obtained weighting information value.

その他の内容について、影響スコア算出部400と遺伝子情報記憶部192とは、上記実施の形態における影響スコア算出部400と遺伝子情報記憶部192と同様である。   Regarding other contents, the influence score calculation unit 400 and the gene information storage unit 192 are the same as the influence score calculation unit 400 and the gene information storage unit 192 in the above embodiment.

実施の形態7.
上記実施の形態6では、重み付け情報に基づいて、影響スコアを算出する機能阻害影響度算出装置700とについて説明した。
実施の形態7では、重み付け情報と阻害相関値とに基づいて影響スコアを算出する機能阻害影響度算出装置700について説明する。
Embodiment 7 FIG.
In the sixth embodiment, the function inhibition influence degree calculating device 700 that calculates the influence score based on the weighting information has been described.
In the seventh embodiment, a function inhibition influence calculation device 700 that calculates an influence score based on weighting information and an inhibition correlation value will be described.

図21は、実施の形態7における機能阻害影響度算出装置700の構成図である。
実施の形態7における機能阻害影響度算出装置700の構成を図21に基づいて説明する。
FIG. 21 is a configuration diagram of the function inhibition influence degree calculation device 700 according to the seventh embodiment.
The configuration of the function inhibition influence degree calculation device 700 according to the seventh embodiment will be described with reference to FIG.

機能阻害影響度算出装置700は、以下のものを備える。
遺伝子の重み付け情報値を記憶する遺伝子情報記憶部192。
siRNAの塩基配列に対する阻害相関値を記憶する阻害相関値記憶部191。
機能阻害影響度の算出対象であるsiRNAの塩基配列に対する影響スコアを算出する影響スコア算出部400。
影響スコア算出部400は、対象生物種または対象生物体の非標的遺伝子のmRNAの塩基配列と、機能阻害影響度の算出対象であるsiRNAの塩基配列とを入力する。
また、入力したmRNAの塩基配列に対応する非標的遺伝子の重み付け情報値を、遺伝子情報記憶部192から取得し、入力したsiRNAの塩基配列に対する阻害相関値を、阻害相関値記憶部191から取得する。
さらに、入力したmRNAの塩基配列およびsiRNAの塩基配列と、取得した重み付け情報値および阻害相関値とに基づいて、影響スコアを算出する。
The function inhibition influence degree calculation device 700 includes the following.
A gene information storage unit 192 that stores gene weighting information values.
An inhibition correlation value storage unit 191 that stores inhibition correlation values for siRNA base sequences.
An influence score calculation unit 400 that calculates an influence score for the base sequence of siRNA that is a calculation target of the function inhibition influence degree.
The influence score calculation unit 400 inputs the base sequence of the mRNA of the non-target gene of the target organism species or target organism and the base sequence of the siRNA that is the target of calculating the function inhibition influence level.
Further, the weighted information value of the non-target gene corresponding to the input mRNA base sequence is acquired from the gene information storage unit 192, and the inhibition correlation value for the input siRNA base sequence is acquired from the inhibition correlation value storage unit 191. .
Furthermore, an influence score is calculated based on the base sequence of the input mRNA and the base sequence of siRNA, and the obtained weighting information value and inhibition correlation value.

その他の内容について、影響スコア算出部400と遺伝子情報記憶部192と、阻害相関値記憶部191とは、上記実施の形態における影響スコア算出部400と遺伝子情報記憶部192と阻害相関値記憶部191と同様である。   Regarding other contents, the influence score calculation unit 400, the gene information storage unit 192, and the inhibition correlation value storage unit 191 are the same as the influence score calculation unit 400, the gene information storage unit 192, and the inhibition correlation value storage unit 191 in the above embodiment. It is the same.

図22は、上記実施の形態における核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700の外観を示す図である。
図22において、核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700は、システムユニット910、CRT(Cathode Ray Tube)表示装置901、キーボード(K/B)902、マウス903、コンパクトディスク装置(CDD)905、プリンタ装置906、スキャナ装置907を備え、これらはケーブルで接続されている。
さらに、核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700は、FAX機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク(LAN)942、ウェブサーバ941を介してインターネット940に接続されている。
FIG. 22 is a diagram showing the appearance of the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition influence degree calculation device 700 in the above embodiment.
In FIG. 22, the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition effect calculation device 700 are composed of a system unit 910, a CRT (Cathode Ray Tube) display device 901, a keyboard (K / B) 902, and a mouse 903. , A compact disk device (CDD) 905, a printer device 906, and a scanner device 907, which are connected by a cable.
Furthermore, the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition effect calculation device 700 are connected to the FAX machine 932 and the telephone 931 with a cable, and also include a local area network (LAN) 942, a web server 941. It is connected to the Internet 940 via

図23は、上記実施の形態における核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700のハードウェア構成図である。
図23において、核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700は、プログラムを実行するCPU(Central Processing Unit)911を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、CRT表示装置901、K/B902、マウス903、FDD(Flexible Disk Drive)904、磁気ディスク装置920、CDD905、プリンタ装置906、スキャナ装置907と接続されている。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920、光ディスク装置は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915は、FAX機932、電話器931、LAN942等に接続されている。
例えば、通信ボード915、K/B902、スキャナ装置907、FDD904などは、情報入力部の一例である。
また、例えば、通信ボード915、CRT表示装置901などは、出力部の一例である。
FIG. 23 is a hardware configuration diagram of the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition influence degree calculation device 700 in the above embodiment.
In FIG. 23, the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition influence degree calculation device 700 include a CPU (Central Processing Unit) 911 that executes a program. The CPU 911 includes a ROM 913, a RAM 914, a communication board 915, a CRT display device 901, a K / B 902, a mouse 903, an FDD (Flexible Disk Drive) 904, a magnetic disk device 920, a CDD 905, a printer device 906, and a scanner device 907 via a bus 912. Connected with.
The RAM 914 is an example of a volatile memory. The ROM 913, the FDD 904, the CDD 905, the magnetic disk device 920, and the optical disk device are examples of nonvolatile memories. These are examples of a storage device or a storage unit.
The communication board 915 is connected to a FAX machine 932, a telephone 931, a LAN 942, and the like.
For example, the communication board 915, the K / B 902, the scanner device 907, the FDD 904, and the like are examples of the information input unit.
Further, for example, the communication board 915, the CRT display device 901, and the like are examples of the output unit.

ここで、通信ボード915は、LAN942に限らず、直接、インターネット940、或いはISDN等のWAN(ワイドエリアネットワーク)に接続されていても構わない。直接、インターネット940、或いはISDN等のWANに接続されている場合、核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700は、インターネット940、或いはISDN等のWANに接続され、ウェブサーバ941は不用となる。
磁気ディスク装置920には、オペレーティングシステム(OS)921、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923は、CPU911、OS921、ウィンドウシステム922により実行される。
Here, the communication board 915 is not limited to the LAN 942 and may be directly connected to the Internet 940 or a WAN (Wide Area Network) such as ISDN. When directly connected to the Internet 940 or a WAN such as ISDN, the nucleic acid sequence design device 100, the function inhibition effect calculation device 600, and the function inhibition influence degree calculation device 700 are connected to the Internet 940 or a WAN such as ISDN. The web server 941 becomes unnecessary.
The magnetic disk device 920 stores an operating system (OS) 921, a window system 922, a program group 923, and a file group 924. The program group 923 is executed by the CPU 911, the OS 921, and the window system 922.

上記プログラム群923には、上記実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、上記実施の形態の説明において、「〜の判定結果」、「〜の計算結果」、「〜の処理結果」として説明するものが、「〜ファイル」として記憶されている。
また、上記実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータの入出力を示し、そのデータの入出力のためにデータは、磁気ディスク装置920、FD(Flexible Disk cartridge)、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)等のその他の記録媒体に記録される。あるいは、信号線やその他の伝送媒体により伝送される。
The program group 923 stores a program for executing a function described as “˜unit” in the description of the above embodiment. The program is read and executed by the CPU 911.
In the file group 924, what is described as “determination result”, “calculation result of”, and “processing result of” in the description of the above embodiment is stored as “˜file”.
In addition, the arrow portion of the flowchart described in the description of the above embodiment mainly indicates input / output of data, and for the input / output of the data, the data includes a magnetic disk device 920, an FD (Flexible Disk cartridge), an optical disk, It is recorded on other recording media such as CD (compact disc), MD (mini disc), DVD (Digital Versatile Disk). Alternatively, it is transmitted through a signal line or other transmission medium.

また、上記実施の形態の説明において「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、ハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。   Moreover, what is described as “˜unit” in the description of the above embodiment may be realized by firmware stored in the ROM 913. Alternatively, it may be implemented by software alone, hardware alone, a combination of software and hardware, or a combination of firmware.

また、上記実施の形態を実施するプログラムは、磁気ディスク装置920、FD、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)等のその他の記録媒体による記録装置を用いて記憶されても構わない。   The program for carrying out the above embodiment uses a recording device using other recording media such as a magnetic disk device 920, FD, optical disc, CD (compact disc), MD (mini disc), DVD (Digital Versatile Disk). May be stored.

従来技術におけるsiRNAの配列設計の処理の流れを示す図。The figure which shows the flow of a process of the arrangement | sequence design of siRNA in a prior art. 実施の形態1における核酸配列設計装置100の構成図。1 is a configuration diagram of a nucleic acid sequence design device 100 according to Embodiment 1. FIG. 実施の形態1における核酸配列設計装置100の処理の流れを示す図。FIG. 3 shows a processing flow of the nucleic acid sequence designing apparatus 100 according to the first embodiment. 実施の形態1における阻害相関値記憶部191の記憶内容を示す図。The figure which shows the memory content of the inhibition correlation value memory | storage part 191 in Embodiment 1. FIG. 実施の形態1における指標に基づく活性スコアの算出処理の流れを示す図。FIG. 5 is a diagram showing a flow of activity score calculation processing based on an index in the first embodiment. 実施の形態1における影響スコア算出処理の流れを示す図。FIG. 5 is a diagram showing a flow of influence score calculation processing in the first embodiment. 実施の形態1におけるsiRNAの塩基配列の決定処理の流れを示す図。FIG. 4 shows a flow of siRNA base sequence determination processing in the first embodiment. 実施の形態1における核酸配列設計処理のデータの流れを示す図。FIG. 3 shows a data flow of nucleic acid sequence design processing in Embodiment 1. 実施の形態2における核酸配列設計装置100の構成図。FIG. 3 is a configuration diagram of a nucleic acid sequence design device 100 according to a second embodiment. 実施の形態2における核酸配列設計装置100の処理の流れを示す図。The figure which shows the flow of a process of the nucleic acid sequence design apparatus 100 in Embodiment 2. FIG. 実施の形態3における、核酸配列設計装置100の構成図。FIG. 6 is a configuration diagram of a nucleic acid sequence design device 100 according to a third embodiment. 実施の形態3における種別領域配列記憶部182の記憶内容を示す図。FIG. 14 is a diagram showing storage contents of a type area array storage unit 182 in the third embodiment. 実施の形態3におけるmRNAの構造を示す図。FIG. 5 shows the structure of mRNA in Embodiment 3. 実施の形態3における対象生物体の標的遺伝子のmRNAの塩基配列の取得処理の流れを示す図。The figure which shows the flow of the acquisition process of the base sequence of mRNA of the target gene of the target organism in Embodiment 3. FIG. 実施の形態3における核酸配列設計処理のデータの流れを示す図。FIG. 10 shows a data flow of nucleic acid sequence design processing in Embodiment 3. 実施の形態4における、核酸配列設計装置100の構成図。FIG. 6 is a configuration diagram of a nucleic acid sequence design device 100 according to a fourth embodiment. 実施の形態4における塩基配列生成部260の塩基配列生成の処理概要を示す図。The figure which shows the process outline | summary of the base sequence production | generation of the base sequence production | generation part 260 in Embodiment 4. FIG. 実施の形態4における核酸配列設計処理のデータの流れを示す図。FIG. 10 shows a data flow of nucleic acid sequence design processing in Embodiment 4. 実施の形態5における機能阻害効果算出装置600の構成図。FIG. 10 is a configuration diagram of a function inhibition effect calculation device 600 according to a fifth embodiment. 実施の形態6における機能阻害影響度算出装置700の構成図。The block diagram of the function inhibition influence degree calculation apparatus 700 in Embodiment 6. FIG. 実施の形態7における機能阻害影響度算出装置700の構成図。FIG. 10 is a configuration diagram of a function inhibition influence degree calculation device 700 according to a seventh embodiment. 上記実施の形態における核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700の外観を示す図。The figure which shows the external appearance of the nucleic acid sequence design apparatus 100, the function inhibition effect calculation apparatus 600, and the function inhibition influence degree calculation apparatus 700 in the said embodiment. 上記実施の形態における核酸配列設計装置100、機能阻害効果算出装置600および機能阻害影響度算出装置700のハードウェア構成図。The hardware block diagram of the nucleic acid sequence design apparatus 100, the function inhibition effect calculation apparatus 600, and the function inhibition influence calculation apparatus 700 in the said embodiment.

符号の説明Explanation of symbols

100 核酸配列設計装置、181 種別情報配列記憶部、182 種別領域配列記憶部、183 機能阻害核酸配列記憶部、191 阻害相関値記憶部、192 遺伝子情報記憶部、200 候補配列取得部、210 種別配列取得部、220 塩基配列取得部、230 領域配列取得部、240 情報配列取得部、250 異配列取得部、260 塩基配列生成部、300 活性スコア算出部、400 影響スコア算出部、500 阻害配列決定部、600 機能阻害効果算出装置、700 機能阻害影響度算出装置、901 CRT表示装置、902 K/B、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 FAX機、940 インターネット、941 ウェブサーバ、942 LAN。   100 nucleic acid sequence design device, 181 type information sequence storage unit, 182 type region sequence storage unit, 183 function inhibition nucleic acid sequence storage unit, 191 inhibition correlation value storage unit, 192 gene information storage unit, 200 candidate sequence acquisition unit, 210 type sequence Acquisition unit, 220 base sequence acquisition unit, 230 region sequence acquisition unit, 240 information sequence acquisition unit, 250 different sequence acquisition unit, 260 base sequence generation unit, 300 activity score calculation unit, 400 influence score calculation unit, 500 inhibitory sequence determination unit , 600 function inhibition effect calculation device, 700 function inhibition effect calculation device, 901 CRT display device, 902 K / B, 903 mouse, 904 FDD, 905 CDD, 906 printer device, 907 scanner device, 910 system unit, 911 CPU, 912 bus, 913 ROM, 914 RA , 915 communication board, 920 a magnetic disk device, 921 OS, 922 Window system, 923 Program group, 924 File group, 931 telephone, 932 FAX machine, 940 Internet, 941 web server, 942 LAN.

Claims (36)

対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計装置において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、
候補配列取得部の取得した塩基配列に対して、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部と、
候補配列取得部の取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出部と、
活性スコア算出部が算出した活性スコアと、影響スコア算出部が算出した影響スコアとに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部と
を備えたことを特徴とする核酸配列設計装置。
In a nucleic acid sequence design apparatus for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition unit that inputs data on a gene of a target organism and acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
An activity score calculation unit that calculates an activity score indicating a degree of inhibition of the function of the gene by the base sequence with respect to the base sequence acquired by the candidate sequence acquisition unit;
The base sequence acquired by the candidate sequence acquisition unit, an impact score calculation unit that calculates an impact score indicating the degree of influence that inhibits the function of the non-target gene; and
Based on the activity score calculated by the activity score calculation unit and the influence score calculated by the influence score calculation unit, the base sequence is determined from the candidate of the base sequence acquired by the candidate sequence acquisition unit, and the determined base sequence is designed An apparatus for designing a nucleic acid sequence, comprising: an inhibitory sequence determination unit that outputs a base sequence.
対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計装置において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、
候補配列取得部の取得した塩基配列に対して、塩基配列を構成する残基の種類と、塩基配列中の位置とに基づいて、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部と、
活性スコア算出部が算出した活性スコアに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部と
を備えたことを特徴とする核酸配列設計装置。
In a nucleic acid sequence design apparatus for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition unit that inputs data on a gene of a target organism and acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
For the base sequence acquired by the candidate sequence acquisition unit, an activity score indicating the degree to which the base sequence inhibits the function of the gene is calculated based on the types of residues constituting the base sequence and the position in the base sequence An activity score calculating unit,
An inhibitory sequence determination unit that determines a base sequence from candidates of the base sequence acquired by the candidate sequence acquisition unit based on the activity score calculated by the activity score calculation unit and outputs the determined base sequence as a designed base sequence A nucleic acid sequence design apparatus characterized by the above.
上記核酸配列設計装置は、さらに、
塩基配列を構成する残基の種類と、塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部を備え、
上記活性スコア算出部は、阻害相関値記憶部に記憶される阻害相関値に基づいて、上記候補配列取得部が取得した塩基配列の活性スコアを算出することを特徴とする請求項1または請求項2記載の核酸配列設計装置。
The nucleic acid sequence design apparatus further comprises:
Inhibits the degree to which a function-inhibiting nucleic acid inhibits the function of a target gene when each residue is present at each position in the base sequence relative to the type of residue constituting the base sequence and the position in the base sequence An inhibition correlation value storage unit for storing the correlation value;
The activity score calculation unit calculates an activity score of a base sequence acquired by the candidate sequence acquisition unit based on an inhibition correlation value stored in an inhibition correlation value storage unit. 2. The nucleic acid sequence design apparatus according to 2.
上記阻害相関値記憶部が記憶する阻害相関値は、標的遺伝子に対する機能の阻害の有無が既知である機能阻害核酸を示す、既知核酸に基づくデータであり、
F(m,n)は、位置mに残基nが存在する場合の阻害相関値を示し、
Q(m,n)は、機能を阻害する既知核酸に対する、機能を阻害する既知核酸のうちで位置mに残基nが存在する割合を示し、
P(m,n)は、全既知核酸に対する、位置mに残基nが存在する割合を示し、
F(m,n)=log{Q(m,n)/P(m,n)}
で求められていることを特徴とする請求項3記載の核酸配列設計装置。
The inhibition correlation value stored by the inhibition correlation value storage unit is data based on a known nucleic acid, which indicates a function-inhibiting nucleic acid whose presence or absence of inhibition of the function against the target gene is known,
F (m, n) represents the inhibition correlation value when residue n is present at position m,
Q (m, n) represents the ratio of the known nucleic acid that inhibits function to the presence of residue n at position m in the known nucleic acid that inhibits function;
P (m, n) indicates the proportion of residue n at position m relative to all known nucleic acids,
F (m, n) = log {Q (m, n) / P (m, n)}
4. The nucleic acid sequence design apparatus according to claim 3, wherein
上記活性スコア算出部は、
塩基配列にグアニンとシトシンとの少なくともいずれかについて、4つ以上連続している個所の有無と、
塩基配列中のグアニンとシトシンの含量を示すGC含量と、
標的遺伝子に対する塩基配列の位置と、
非標的遺伝子と塩基配列との相同関係と
の少なくともいずれかに基づいて、上記候補配列取得部が取得した塩基配列の活性スコアを算出することを特徴とする請求項1または請求項2記載の核酸配列設計装置。
The activity score calculation unit
The presence or absence of four or more consecutive sites for at least one of guanine and cytosine in the base sequence;
GC content indicating the content of guanine and cytosine in the base sequence;
The position of the base sequence relative to the target gene;
The nucleic acid according to claim 1 or 2, wherein the activity score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on at least one of the homology between the non-target gene and the base sequence. Array design device.
対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計装置において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得部と、
候補配列取得部の取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出部と、
影響スコア算出部が算出した影響スコアに基づいて、候補配列取得部が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定部と
を備えたことを特徴とする核酸配列設計装置。
In a nucleic acid sequence design apparatus for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition unit that inputs data on a gene of a target organism and acquires a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
The base sequence acquired by the candidate sequence acquisition unit, an impact score calculation unit that calculates an impact score indicating the degree of influence that inhibits the function of the non-target gene; and
Based on the influence score calculated by the influence score calculation unit, the base sequence is determined from the candidate of the base sequence acquired by the candidate sequence acquisition unit, and the inhibition sequence determination unit outputs the determined base sequence as a designed base sequence A nucleic acid sequence design apparatus characterized by the above.
上記核酸配列設計装置は、さらに、
塩基配列を構成する残基の種類と、塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部を備え、
上記影響スコア算出部は、阻害相関値記憶部に記憶される阻害相関値に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項1または請求項6記載の核酸配列設計装置。
The nucleic acid sequence design apparatus further comprises:
The degree to which a function-inhibiting nucleic acid inhibits the function of a non-target gene when each residue is present at each position in the base sequence relative to the type of residue constituting the base sequence and the position in the base sequence. An inhibition correlation value storage unit for storing the inhibition correlation value;
The said influence score calculation part calculates the influence score of the base sequence which the said candidate sequence acquisition part acquired based on the inhibition correlation value memorize | stored in the inhibition correlation value memory | storage part. 6. The nucleic acid sequence design apparatus according to 6.
上記阻害相関値記憶部が記憶する阻害相関値は、非標的遺伝子に対する機能の阻害の有無が既知である機能阻害核酸を示す、既知核酸に基づくデータであり、
F(m,n)は、位置mに残基nが存在する場合の阻害相関値を示し、
Q(m,n)は、機能を阻害する既知核酸に対する、機能を阻害する既知核酸のうちで位置mに残基nが存在する割合を示し、
P(m,n)は、全既知核酸に対する、位置mに残基nが存在する割合を示し、
F(m,n)=log{Q(m,n)/P(m,n)}
で求められていることを特徴とする請求項7記載の核酸配列設計装置。
The inhibition correlation value stored by the inhibition correlation value storage unit is data based on a known nucleic acid, which indicates a function-inhibiting nucleic acid whose presence or absence of inhibition of the function against a non-target gene is known,
F (m, n) represents the inhibition correlation value when residue n is present at position m,
Q (m, n) represents the ratio of the known nucleic acid that inhibits function to the presence of residue n at position m in the known nucleic acid that inhibits function;
P (m, n) indicates the proportion of residue n at position m relative to all known nucleic acids,
F (m, n) = log {Q (m, n) / P (m, n)}
8. The nucleic acid sequence designing apparatus according to claim 7, wherein
上記影響スコア算出部は、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
上記阻害相関値記憶部に記憶される阻害相関値と
に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項7記載の核酸配列設計装置。
The impact score calculation unit
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
8. The nucleic acid sequence design device according to claim 7, wherein an influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on the inhibition correlation value stored in the inhibition correlation value storage unit.
上記影響スコア算出部は、
上記阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係と
に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項7記載の核酸配列設計装置。
The impact score calculation unit
The influence score of the base sequence acquired by the candidate sequence acquisition unit based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid The nucleic acid sequence design apparatus according to claim 7, wherein:
上記影響スコア算出部は、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
上記阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係と
に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項7記載の核酸配列設計装置。
The impact score calculation unit
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
The influence score of the base sequence acquired by the candidate sequence acquisition unit based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid The nucleic acid sequence design apparatus according to claim 7, wherein:
上記影響スコア算出部は、
非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項1または請求項6記載の核酸配列設計装置。
The impact score calculation unit
7. The influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid. Nucleic acid sequence design apparatus.
上記影響スコア算出部は、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
非標的遺伝子の塩基配列と機能阻害核酸の塩基配列との相同関係と
に基づいて、上記候補配列取得部が取得した塩基配列の影響スコアを算出することを特徴とする請求項1または請求項6記載の核酸配列設計装置。
The impact score calculation unit
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
The influence score of the base sequence acquired by the candidate sequence acquisition unit is calculated based on the homology between the base sequence of the non-target gene and the base sequence of the function-inhibiting nucleic acid. The nucleic acid sequence design apparatus described.
上記候補配列取得部は、
対象とする生物の属する生物種の遺伝子に関する塩基配列を記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、遺伝情報の塩基配列を示す遺伝情報配列を取得する種別配列取得部を備え、
上記候補配列取得部は、種別配列取得部が取得した遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする請求項1または請求項2または請求項6記載の核酸配列設計装置。
The candidate sequence acquisition unit
From the storage unit that stores the base sequence related to the gene of the species to which the target organism belongs, as a data related to the gene of the target organism, the type sequence acquisition unit that acquires the genetic information sequence indicating the base sequence of the genetic information,
The said candidate sequence acquisition part acquires the candidate of the base sequence of a function inhibition nucleic acid based on the genetic information sequence which the classification sequence acquisition part acquired, The claim 1 or Claim 2 or Claim 6 characterized by the above-mentioned. Nucleic acid sequence design device.
上記候補配列取得部は、さらに、
対象とする生物の遺伝子に関するデータとして標的遺伝子を入力し、
上記種別配列取得部が取得した塩基配列と、対象とする生物の標的遺伝子の塩基配列とで異なる部分の塩基配列を取得する異配列取得部と、
上記種別配列取得部が取得した塩基配列と、異配列取得部が取得した塩基配列とに基づいて塩基配列を生成する塩基配列生成部とを備え、
上記候補配列取得部は、塩基配列生成部が生成した塩基配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする請求項14記載の核酸配列設計装置。
The candidate sequence acquisition unit further includes:
Enter the target gene as data on the gene of the target organism,
A different sequence acquisition unit for acquiring a base sequence of a portion different from the base sequence acquired by the type sequence acquisition unit and the base sequence of a target gene of a target organism;
A base sequence generation unit that generates a base sequence based on the base sequence acquired by the type sequence acquisition unit and the base sequence acquired by the different sequence acquisition unit;
The nucleic acid sequence design apparatus according to claim 14, wherein the candidate sequence acquisition unit acquires a candidate for a base sequence of a function-inhibiting nucleic acid based on the base sequence generated by the base sequence generation unit.
上記候補配列取得部は、
対象とする生物の遺伝子に関するデータとして標的遺伝子を入力し、
対象とする生物の標的遺伝子から塩基配列を取得する塩基配列取得部と、
対象とする生物の属する生物種が持つ各遺伝子の塩基配列を、遺伝情報領域の塩基配列を示す遺伝情報領域配列と、非遺伝情報領域の塩基配列を示す非遺伝情報領域配列とに分けて記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得する種別領域配列取得部と、
塩基配列取得部が取得した塩基配列と、種別領域配列取得部が取得した遺伝情報領域配列および非遺伝情報領域配列との相同関係に基づいて、塩基配列取得部が取得した塩基配列から、遺伝情報領域配列を抽出し、抽出した遺伝情報領域配列に基づいて、遺伝情報の塩基配列を示す遺伝情報配列を取得する情報配列取得部とを備え、
上記候補配列取得部は、情報配列取得部が取得した遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得することを特徴とする請求項1または請求項2または請求項6記載の核酸配列設計装置。
The candidate sequence acquisition unit
Enter the target gene as data on the gene of the target organism,
A base sequence acquisition unit for acquiring a base sequence from a target gene of a target organism;
The base sequence of each gene possessed by the species to which the target organism belongs belongs to a genetic information region sequence indicating the base sequence of the genetic information region and a non-genetic information region sequence indicating the base sequence of the non-genetic information region. A type region sequence acquisition unit that acquires a genetic information region sequence and a non-genetic information region sequence for a target gene as data on a gene of a target organism from a storage unit that performs,
Based on the homology between the base sequence acquired by the base sequence acquisition unit and the genetic information region sequence and non-genetic information region sequence acquired by the type region sequence acquisition unit, genetic information is obtained from the base sequence acquired by the base sequence acquisition unit. An information sequence acquisition unit that extracts a region sequence and acquires a genetic information sequence indicating a base sequence of genetic information based on the extracted genetic information region sequence;
The said candidate sequence acquisition part acquires the candidate of the base sequence of a function inhibition nucleic acid based on the genetic information sequence which the information sequence acquisition part acquired, The claim 1 or Claim 2 or Claim 6 characterized by the above-mentioned. Nucleic acid sequence design device.
上記候補配列取得部は、
機能阻害核酸の塩基配列の候補を記憶する記憶部から、機能阻害核酸の塩基配列の候補を取得することを特徴とする請求項1または請求項2または請求項6記載の核酸配列設計装置。
The candidate sequence acquisition unit
The nucleic acid sequence design apparatus according to claim 1, 2 or 6, wherein a candidate of a base sequence of a function-inhibiting nucleic acid is obtained from a storage unit that stores a base sequence candidate of the function-inhibiting nucleic acid.
対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計方法において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、
候補配列取得工程で取得した塩基配列に対して、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程と、
候補配列取得工程で取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出工程と、
活性スコア算出工程で算出した活性スコアと、影響スコア算出工程で算出した影響スコアとに基づいて、候補配列取得工程で取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程と
を実行することを特徴とする核酸配列設計方法。
In a nucleic acid sequence design method for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition step of inputting data on a gene of a target organism and acquiring a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
An activity score calculating step for calculating an activity score indicating the degree to which the base sequence inhibits the function of the gene with respect to the base sequence acquired in the candidate sequence acquisition step;
An influence score calculation step of calculating an influence score indicating the degree of influence by which the base sequence acquired in the candidate sequence acquisition step inhibits the function of the non-target gene; and
Based on the activity score calculated in the activity score calculation step and the influence score calculated in the influence score calculation step, the base sequence was determined from the candidate of the base sequence acquired in the candidate sequence acquisition step, and the determined base sequence was designed A method for designing a nucleic acid sequence, comprising performing an inhibitory sequence determination step of outputting as a base sequence.
対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計方法において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、
候補配列取得工程で取得した塩基配列に対して、塩基配列を構成する残基の種類と、塩基配列中の位置とに基づいて、塩基配列が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程と、
活性スコア算出工程で算出した活性スコアに基づいて、候補配列取得工程が取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程と
を実行することを特徴とする核酸配列設計方法。
In a nucleic acid sequence design method for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition step of inputting data on a gene of a target organism and acquiring a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
For the base sequence acquired in the candidate sequence acquisition step, an activity score indicating the degree to which the base sequence inhibits the function of the gene is calculated based on the types of residues constituting the base sequence and the position in the base sequence An activity score calculating step,
Based on the activity score calculated in the activity score calculation step, the candidate sequence acquisition step determines a base sequence from the candidate of the base sequence acquired, and executes the inhibition sequence determination step of outputting the determined base sequence as a designed base sequence A method for designing a nucleic acid sequence, comprising:
対象とする生物の標的遺伝子の機能を阻害する機能阻害核酸の塩基配列を設計する核酸配列設計方法において、
対象とする生物の遺伝子に関するデータを入力し、入力した遺伝子に関するデータに基づいて、機能阻害核酸の塩基配列の候補を取得する候補配列取得工程と、
候補配列取得工程で取得した塩基配列が、非標的遺伝子の機能を阻害する影響度を示す影響スコアを算出する影響スコア算出工程と、
影響スコア算出工程で算出した影響スコアに基づいて、候補配列取得工程で取得した塩基配列の候補から塩基配列を決定し、決定した塩基配列を設計した塩基配列として出力する阻害配列決定工程と
を実行することを特徴とする核酸配列設計方法。
In a nucleic acid sequence design method for designing a base sequence of a function-inhibiting nucleic acid that inhibits the function of a target gene of a target organism,
A candidate sequence acquisition step of inputting data on a gene of a target organism and acquiring a candidate of a base sequence of a function-inhibiting nucleic acid based on the data on the input gene;
An influence score calculation step of calculating an influence score indicating the degree of influence by which the base sequence acquired in the candidate sequence acquisition step inhibits the function of the non-target gene; and
Based on the influence score calculated in the influence score calculation step, the base sequence is determined from the candidate of the base sequence acquired in the candidate sequence acquisition step, and the inhibition sequence determination step that outputs the determined base sequence as the designed base sequence is executed A method for designing a nucleic acid sequence, comprising:
請求項18または請求項19または請求項20記載の核酸配列設計方法をコンピュータに実行させる核酸配列設計プログラム。   21. A nucleic acid sequence design program for causing a computer to execute the nucleic acid sequence design method according to claim 18, 19 or 20. 機能阻害核酸が、対象とする生物の遺伝子の機能を阻害する度合いを算出する機能阻害効果算出装置において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、
機能阻害核酸の塩基配列を入力し、入力した機能阻害核酸の塩基配列と、阻害相関値記憶部に記憶される阻害相関値とに基づいて、入力した機能阻害核酸が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出部と
を備えたことを特徴とする機能阻害効果算出装置。
In the function inhibition effect calculating apparatus for calculating the degree of inhibition of the function of the gene of the target organism by the function-inhibiting nucleic acid,
When each residue is present at each position of the base sequence with respect to the types of residues constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid, the function-inhibiting nucleic acid An inhibition correlation value storage unit for storing the degree of inhibition of the function as an inhibition correlation value;
The degree to which the input function-inhibiting nucleic acid inhibits the function of the gene based on the input base sequence of the function-inhibiting nucleic acid and the inhibition correlation value stored in the inhibition correlation value storage unit. An activity score calculating unit that calculates an activity score indicating the function inhibition effect calculating device.
機能阻害核酸が、対象とする生物の遺伝子の機能を阻害する度合いを算出する機能阻害効果算出方法において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、
機能阻害核酸の塩基配列を入力し、入力した機能阻害核酸の塩基配列と、阻害相関値記憶工程で記憶された阻害相関値とに基づいて、入力した機能阻害核酸が遺伝子の機能を阻害する度合いを示す活性スコアを算出する活性スコア算出工程と
を実行することを特徴とする機能阻害効果算出方法。
In the function inhibition effect calculating method for calculating the degree of inhibition of the function of the gene of the target organism by the function-inhibiting nucleic acid,
When each residue is present at each position of the base sequence with respect to the types of residues constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid, the function-inhibiting nucleic acid An inhibition correlation value storing step of storing the degree of inhibition of the function as an inhibition correlation value;
The degree to which the input function-inhibiting nucleic acid inhibits the function of the gene based on the input base sequence of the function-inhibiting nucleic acid and the inhibition correlation value stored in the inhibition correlation value storing step. An activity score calculation step of calculating an activity score indicating the function inhibition effect calculation method.
請求項23記載の機能阻害効果算出方法をコンピュータに実行させる機能阻害効果算出プログラム。   A function inhibition effect calculation program for causing a computer to execute the function inhibition effect calculation method according to claim 23. 機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出装置において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
阻害相関値記憶部に記憶される阻害相関値と
に基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部と
を備えたことを特徴とする機能阻害影響度算出装置。
In the function inhibition influence calculation device for calculating the degree of inhibition of the function of the non-target gene of the target organism by the function-inhibiting nucleic acid,
A function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the type of residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storage unit for storing the degree of inhibition of gene function as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
An influence score calculation unit that calculates an influence score indicating a degree of inhibition of the function of the non-target gene based on the inhibition correlation value stored in the inhibition correlation value storage unit. The function inhibition influence degree calculation apparatus characterized by the above-mentioned.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出装置において、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係と
に基づいて、入力した機能阻害核酸が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部を備えたことを特徴とする機能阻害影響度算出装置。
In the function inhibition influence calculation device for calculating the degree of inhibition of the function of the non-target gene of the target organism by the function-inhibiting nucleic acid,
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
Based on the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, an impact score calculation unit is provided that calculates an influence score indicating the degree to which the input function-inhibiting nucleic acid inhibits the function of the non-target gene. The function inhibition influence degree calculation apparatus characterized by the above-mentioned.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出装置において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、
機能阻害核酸の塩基配列を入力し、
阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部と
を備えたことを特徴とする機能阻害影響度算出装置。
In the function inhibition influence calculation device for calculating the degree of inhibition of the function of the non-target gene of the target organism by the function-inhibiting nucleic acid,
A function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the type of residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storage unit for storing the degree of inhibition of gene function as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
Based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the base sequence of the input function-inhibiting nucleic acid determines the function of the non-target gene. A function inhibition influence degree calculation device comprising: an influence score calculation unit that calculates an influence score indicating a degree of inhibition.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出装置において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶部と、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
阻害相関値記憶部に記憶される阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係と
に基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出部と
を備えたことを特徴とする機能阻害影響度算出装置。
In the function inhibition influence calculation device for calculating the degree of inhibition of the function of the non-target gene of the target organism by the function-inhibiting nucleic acid,
The function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the types of residues constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storage unit for storing the degree of inhibition of gene function as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
Based on the inhibition correlation value stored in the inhibition correlation value storage unit and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the base sequence of the input function-inhibiting nucleic acid determines the function of the non-target gene. A function inhibition influence degree calculation device comprising: an influence score calculation unit that calculates an influence score indicating a degree of inhibition.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出方法において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
阻害相関値記憶工程で記憶された阻害相関値と
に基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程と
を実行することを特徴とする機能阻害影響度算出方法。
In the function inhibition influence calculation method for calculating the degree of inhibition of the function of a non-target gene of a target organism by a function-inhibiting nucleic acid,
A function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the type of residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storing step of storing the degree of inhibition of the function of the gene as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
Based on the inhibition correlation value stored in the inhibition correlation value storage step, an influence score calculation step of calculating an influence score indicating the degree to which the base sequence of the input function-inhibiting nucleic acid inhibits the function of the non-target gene is executed. The function inhibition influence degree calculation method characterized by this.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出方法において、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係と
に基づいて、入力した機能阻害核酸が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程を実行することを特徴とする機能阻害影響度算出方法。
In the function inhibition influence calculation method for calculating the degree of inhibition of the function of a non-target gene of a target organism by a function-inhibiting nucleic acid,
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
Based on the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, an impact score calculation step is performed to calculate an influence score indicating the degree to which the input function-inhibiting nucleic acid inhibits the function of the non-target gene. The function inhibition influence degree calculation method characterized by this.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出方法において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、
機能阻害核酸の塩基配列を入力し、
阻害相関値記憶工程で記憶された阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係とに基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程と
を実行することを特徴とする機能阻害影響度算出方法。
In the function inhibition influence calculation method for calculating the degree of inhibition of the function of a non-target gene of a target organism by a function-inhibiting nucleic acid,
A function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the type of residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storing step of storing the degree of inhibition of the function of the gene as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
Based on the inhibition correlation value stored in the inhibition correlation value storage step and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the base sequence of the input function-inhibiting nucleic acid determines the function of the non-target gene. The function inhibition influence degree calculation method characterized by performing the influence score calculation process which calculates the influence score which shows the degree to inhibit.
機能阻害核酸が、対象とする生物の非標的遺伝子の機能を阻害する度合いを算出する機能阻害影響度算出方法において、
機能阻害核酸の塩基配列を構成する残基の種類と、機能阻害核酸の塩基配列中の位置とに対して、各残基が塩基配列の各位置に存在する場合に、機能阻害核酸が非標的遺伝子の機能を阻害する度合いを阻害相関値として記憶する阻害相関値記憶工程と、
機能阻害核酸の塩基配列を入力し、
非標的遺伝子が機能阻害核酸により機能を阻害されない場合に、非標的遺伝子から発現する遺伝情報の量と、
非標的遺伝子の機能的な重要度と
の少なくともいずれかと、
阻害相関値記憶工程で記憶された阻害相関値と、非標的遺伝子と入力した機能阻害核酸の塩基配列との相同関係と
に基づいて、入力した機能阻害核酸の塩基配列が非標的遺伝子の機能を阻害する度合いを示す影響スコアを算出する影響スコア算出工程と
を実行することを特徴とする機能阻害影響度算出方法。
In the function inhibition influence calculation method for calculating the degree of inhibition of the function of a non-target gene of a target organism by a function-inhibiting nucleic acid,
A function-inhibiting nucleic acid is non-targeted when each residue is present at each position in the base sequence with respect to the type of residue constituting the base sequence of the function-inhibiting nucleic acid and the position in the base sequence of the function-inhibiting nucleic acid. An inhibition correlation value storing step of storing the degree of inhibition of the function of the gene as an inhibition correlation value;
Enter the base sequence of the function-inhibiting nucleic acid,
The amount of genetic information expressed from a non-target gene when the function of the non-target gene is not inhibited by the function-inhibiting nucleic acid;
At least one of functional importance of non-target genes,
Based on the inhibition correlation value stored in the inhibition correlation value storage step and the homology between the non-target gene and the base sequence of the input function-inhibiting nucleic acid, the base sequence of the input function-inhibiting nucleic acid determines the function of the non-target gene. The function inhibition influence degree calculation method characterized by performing the influence score calculation process which calculates the influence score which shows the degree to inhibit.
請求項29または請求項30または請求項31または請求項32記載の機能阻害影響度算出方法をコンピュータに実行させる機能阻害影響度算出プログラム。   A function inhibition influence degree calculation program for causing a computer to execute the function inhibition influence degree calculation method according to claim 29, claim 30, or claim 31 or claim 32. 上記候補配列取得部は、
対象とする生物の属する生物種の遺伝子に関する塩基配列を記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、遺伝情報の塩基配列を示す遺伝情報配列を標的遺伝子と非標的遺伝子とについて取得する種別配列取得部を備え、
上記候補配列取得部は、種別配列取得部が取得した標的遺伝子の遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、
上記影響スコア算出部は、
種別配列取得部が取得した非標的遺伝子の遺伝情報配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする請求項10または請求項11または請求項12または請求項13記載の核酸配列設計装置。
The candidate sequence acquisition unit
Obtains the genetic information sequence indicating the base sequence of the genetic information for the target gene and non-target gene from the storage unit that stores the base sequence related to the gene of the species to which the target organism belongs. A type array acquisition unit
The candidate sequence acquisition unit, based on the genetic information sequence of the target gene acquired by the type sequence acquisition unit, acquires a candidate for a base sequence of a function-inhibiting nucleic acid,
The impact score calculation unit
The influence score is calculated based on the homology between the genetic information sequence of the non-target gene acquired by the type sequence acquisition unit and the base sequence of the function-inhibiting nucleic acid acquired by the candidate sequence acquisition unit. Or the nucleic acid sequence design apparatus of Claim 11 or Claim 12 or Claim 13.
上記候補配列取得部は、さらに、
対象とする生物の遺伝子に関するデータとして標的遺伝子と非標的遺伝子とを入力し、
上記種別配列取得部が取得した標的遺伝子の塩基配列と、対象とする生物の標的遺伝子の塩基配列とで異なる部分の塩基配列と、上記種別配列取得部が取得した非標的遺伝子の塩基配列と、対象とする生物の非標的遺伝子の塩基配列とで異なる部分の塩基配列とを取得する異配列取得部と、
上記種別配列取得部が取得した標的遺伝子の塩基配列と、異配列取得部が取得した標的遺伝子の異なる部分の塩基配列とに基づいて対象とする生物の標的遺伝子の塩基配列を生成し、上記種別配列取得部が取得した非標的遺伝子の塩基配列と、異配列取得部が取得した非標的遺伝子の異なる部分の塩基配列とに基づいて対象とする生物の非標的遺伝子の塩基配列を生成する塩基配列生成部とを備え、
上記候補配列取得部は、塩基配列生成部が生成した標的遺伝子の塩基配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、
上記影響スコア算出部は、
塩基配列生成部が生成した非標的遺伝子の塩基配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする請求項34記載の核酸配列設計装置。
The candidate sequence acquisition unit further includes:
Enter target and non-target genes as data on the genes of the target organism,
The base sequence of the target gene acquired by the type sequence acquisition unit, the base sequence of the portion different from the base sequence of the target gene of the target organism, the base sequence of the non-target gene acquired by the type sequence acquisition unit, A different sequence acquisition unit for acquiring a base sequence of a portion different from the base sequence of a non-target gene of a target organism;
Generate the target gene base sequence of the target organism based on the base sequence of the target gene acquired by the type sequence acquisition unit and the base sequence of the different part of the target gene acquired by the different sequence acquisition unit, the type A base sequence that generates a base sequence of a non-target gene of a target organism based on a base sequence of a non-target gene acquired by a sequence acquisition unit and a base sequence of a different part of the non-target gene acquired by a different sequence acquisition unit A generator,
The candidate sequence acquisition unit acquires a candidate for a base sequence of a function-inhibiting nucleic acid based on the base sequence of the target gene generated by the base sequence generation unit,
The impact score calculation unit
The influence score is calculated based on the homology between the base sequence of the non-target gene generated by the base sequence generation unit and the base sequence of the function-inhibiting nucleic acid acquired by the candidate sequence acquisition unit. Nucleic acid sequence design apparatus.
上記候補配列取得部は、
対象とする生物の遺伝子に関するデータとして標的遺伝子と非標的遺伝子とを入力し、
対象とする生物の標的遺伝子から標的遺伝子の塩基配列を取得し、対象とする生物の非標的遺伝子から非標的遺伝子の塩基配列を取得する塩基配列取得部と、
対象とする生物の属する生物種が持つ各遺伝子の塩基配列を、遺伝情報領域の塩基配列を示す遺伝情報領域配列と、非遺伝情報領域の塩基配列を示す非遺伝情報領域配列とに分けて記憶する記憶部から、対象とする生物の遺伝子に関するデータとして、標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得し、非標的遺伝子に対する、遺伝情報領域配列と非遺伝情報領域配列とを取得する種別領域配列取得部と、
塩基配列取得部が取得した塩基配列と、種別領域配列取得部が取得した遺伝情報領域配列および非遺伝情報領域配列との相同関係に基づいて、塩基配列取得部が取得した塩基配列から、遺伝情報領域配列を抽出し、抽出した遺伝情報領域配列に基づいて、遺伝情報の塩基配列を示す遺伝情報配列を標的遺伝子と非標的遺伝子とについて取得する情報配列取得部とを備え、
上記候補配列取得部は、情報配列取得部が取得した標的遺伝子の遺伝情報配列に基づいて、機能阻害核酸の塩基配列の候補を取得し、
上記影響スコア算出部は、
情報配列取得部が取得した非標的遺伝子の遺伝情報配列と、上記候補配列取得部が取得した機能阻害核酸の塩基配列との相同関係に基づいて影響スコアを算出することを特徴とする請求項10または請求項11または請求項12または請求項13記載の核酸配列設計装置。
The candidate sequence acquisition unit
Enter target and non-target genes as data on the genes of the target organism,
A base sequence acquisition unit for acquiring a base sequence of a target gene from a target gene of a target organism, and acquiring a base sequence of the non-target gene from a non-target gene of the target organism;
The base sequence of each gene possessed by the species to which the target organism belongs belongs to a genetic information region sequence indicating the base sequence of the genetic information region and a non-genetic information region sequence indicating the base sequence of the non-genetic information region. A genetic information region sequence and a non-genetic information region sequence for the target gene as data relating to the gene of the target organism from the storage unit, and a genetic information region sequence and a non-genetic information region sequence for the non-target gene A type region array acquisition unit for acquiring
Based on the homology between the base sequence acquired by the base sequence acquisition unit and the genetic information region sequence and non-genetic information region sequence acquired by the type region sequence acquisition unit, genetic information is obtained from the base sequence acquired by the base sequence acquisition unit. A region sequence is extracted, and based on the extracted genetic information region sequence, an information sequence acquisition unit that acquires a genetic information sequence indicating a base sequence of genetic information for a target gene and a non-target gene,
The candidate sequence acquisition unit acquires a candidate for a base sequence of a function-inhibiting nucleic acid based on the genetic information sequence of the target gene acquired by the information sequence acquisition unit,
The impact score calculation unit
The influence score is calculated based on the homology between the genetic information sequence of the non-target gene acquired by the information sequence acquisition unit and the base sequence of the function-inhibiting nucleic acid acquired by the candidate sequence acquisition unit. Or the nucleic acid sequence design apparatus of Claim 11 or Claim 12 or Claim 13.
JP2004208067A 2004-07-15 2004-07-15 Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect Pending JP2006031308A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004208067A JP2006031308A (en) 2004-07-15 2004-07-15 Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004208067A JP2006031308A (en) 2004-07-15 2004-07-15 Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect

Publications (1)

Publication Number Publication Date
JP2006031308A true JP2006031308A (en) 2006-02-02

Family

ID=35897589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004208067A Pending JP2006031308A (en) 2004-07-15 2004-07-15 Apparatus, method, and program for designing nucleic acid array, apparatus, method, and program for calculating function impediment effect, and apparatus, method, and program for calculating degree of function impediment effect

Country Status (1)

Country Link
JP (1) JP2006031308A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004045543A2 (en) * 2002-11-14 2004-06-03 Dharmacon, Inc. Functional and hyperfunctional sirna
WO2004048566A1 (en) * 2002-11-22 2004-06-10 Bio-Think Tank Co., Ltd. Method of detecting target base sequence of rna interference, method of designing polynucleotide base sequence causing rna interference, method of constructing double-stranded polynucleotide, method of regulating gene expression, base sequence processing apparatus, program for running base sequence processing method on comp

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004045543A2 (en) * 2002-11-14 2004-06-03 Dharmacon, Inc. Functional and hyperfunctional sirna
WO2004048566A1 (en) * 2002-11-22 2004-06-10 Bio-Think Tank Co., Ltd. Method of detecting target base sequence of rna interference, method of designing polynucleotide base sequence causing rna interference, method of constructing double-stranded polynucleotide, method of regulating gene expression, base sequence processing apparatus, program for running base sequence processing method on comp

Similar Documents

Publication Publication Date Title
Boettger et al. Recurring exon deletions in the HP (haptoglobin) gene contribute to lower blood cholesterol levels
Dewannieux et al. LINE-mediated retrotransposition of marked Alu sequences
Kapranov et al. Genome-wide transcription and the implications for genomic organization
Beyret et al. piRNA biogenesis during adult spermatogenesis in mice is independent of the ping-pong mechanism
Hiller et al. Pre-mRNA secondary structures influence exon recognition
Pagani et al. Genomic variants in exons and introns: identifying the splicing spoilers
Sharon et al. A single-molecule long-read survey of the human transcriptome
Roy-Engel et al. Active Alu element “A-tails”: size does matter
Thompson et al. Decoding human regulatory circuits
Comeaux et al. Diverse cis factors controlling Alu retrotransposition: what causes Alu elements to die?
Gott Expanding genome capacity via RNA editing
Červenák et al. Identification of telomerase RNAs in species of the Yarrowia clade provides insights into the co-evolution of telomerase, telomeric repeats and telomere-binding proteins
Teng et al. A GDF15 3′ UTR variant, rs1054564, results in allele-specific translational repression of GDF15 by hsa-miR-1233-3p
Maas et al. Novel exon of mammalian ADAR2 extends open reading frame
Garg et al. Gene expression analysis in mitochondria from chagasic mice: alterations in specific metabolic pathways
Carreño-Gago et al. Identification and characterization of new RNASEH1 mutations associated with PEO syndrome and multiple mitochondrial DNA deletions
Marzec New insights into the function of mammalian Argonaute2
Filippenkov et al. Multi-step splicing of sphingomyelin synthase linear and circular RNAs
Trinklein et al. Integrated analysis of experimental data sets reveals many novel promoters in 1% of the human genome
Hense et al. Experimentally increased codon bias in the Drosophila Adh gene leads to an increase in larval, but not adult, alcohol dehydrogenase activity
Alvarez et al. Transposon clusters as substrates for aberrant splice-site activation
Shanmugam et al. Non-coding DNA–a brief review
Forconi et al. Transcriptional activity of transposable elements in coelacanth
Lin et al. Large-scale analysis of exonized mammalian-wide interspersed repeats in primate genomes
Zhang et al. Changes in snoRNA and snRNA abundance in the human, chimpanzee, macaque, and mouse brain

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100817