JP2008521909A - 短鎖干渉rna、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドの設計方法 - Google Patents
短鎖干渉rna、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドの設計方法 Download PDFInfo
- Publication number
- JP2008521909A JP2008521909A JP2007544454A JP2007544454A JP2008521909A JP 2008521909 A JP2008521909 A JP 2008521909A JP 2007544454 A JP2007544454 A JP 2007544454A JP 2007544454 A JP2007544454 A JP 2007544454A JP 2008521909 A JP2008521909 A JP 2008521909A
- Authority
- JP
- Japan
- Prior art keywords
- length
- sirna
- potential
- target
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/10—Applications; Uses in screening processes
- C12N2320/11—Applications; Uses in screening processes for the determination of target sites, i.e. of active nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Abstract
本発明は、siRNA、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを選択するための方法、装置、およびコンピュータープログラム製品に関する。特に、本発明は、中または低オフターゲット活性を有する、siRNA、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを選択するための方法に関する。
Description
本発明は、短鎖干渉RNA(siRNA)、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを設計するための方法、装置、およびコンピュータープログラム製品に関する。本発明はまた、siRNA、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドのオフターゲット効果を決定する方法にも関する。
本出願は、2005年1月25日出願の米国仮出願第60/647,193号および2004年12月2日出願の米国仮出願第60/632,831号の利益を請求する。あらゆる目的のために、米国仮出願第60/647,193号および米国仮出願第60/632,831号はを参照によりその全体を本明細書に組み込む。
RNA干渉は、様々な生物で観察される転写後過程であり、その干渉によって二本鎖RNA分子は、配列特異的に遺伝子サイレンシングを媒介する。RNA干渉は、一般的に約19〜22ヌクレオチド長である短鎖干渉RNA(siRNA)を使用し実施することができる。siRNAはとても短いので、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲット活性を有しうる。その結果、意図しない遺伝子がsiRNAによってサイレンスされうる。
アンチセンスポリヌクレオチド使用して、転写前後に遺伝子の発現を抑制することできる。しかし、アンチセンスポリヌクレオチドは、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲット活性を有する可能性がある。その結果、意図しない遺伝子が、アンチセンスポリヌクレオチドによって抑制されうる。
Lambertonら, Molecular Biotechnology, 24: 111-119 (2003) Biotechnology (N Y). 1992 Apr;10(4):413-7 Biotechnology (N Y). 1993 Sep;11(9):1026-30 Methods. 2001 Dec;25(4):402-8 Gene. 1990 Sep 1;93(1):125-8 Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505) Cell. 2003 Oct 17;115(2):199-208 Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7 Nat Biotechnol. 2004 Mar;22(3):326-30
Lambertonら, Molecular Biotechnology, 24: 111-119 (2003) Biotechnology (N Y). 1992 Apr;10(4):413-7 Biotechnology (N Y). 1993 Sep;11(9):1026-30 Methods. 2001 Dec;25(4):402-8 Gene. 1990 Sep 1;93(1):125-8 Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505) Cell. 2003 Oct 17;115(2):199-208 Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7 Nat Biotechnol. 2004 Mar;22(3):326-30
同じように、siRNAおよびアンチセンスポリヌクレオチドと同様に、特定の配列とハイブリッドを形成するように設計したポリヌクレオチドも、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲットのハイブリッド形成化活性を有しうる。その結果、ハイブリッド形成化ポリヌクレオチドは、意図しない配列とハイブリッド形成する可能性がある。
ある実施形態では、長さxのsiRNAを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAの配列分析を実施するステップ、および前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAの前記配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、長さxのsiRNAに対して予想されるオフターゲット遺伝子を同定する方法を提供する。ある実施形態では、その方法は、長さxのsiRNAを選択するステップ、データベースを選択するステップ、前記長さxのsiRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、前記長さxのsiRNAで前記データベースを走査するステップ、配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するステップ、および予想されるオフターゲット遺伝子を同定するステップを含む。
ある実施形態では、長さxのsiRNAを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するステップ、データベースを選択するステップ、少なくとも一個の長さxの潜在的siRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さxの潜在的siRNAで前記データベースを走査するステップ、配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するステップ、少なくとも一個の長さxの潜在的siRNAに対して予想されるオフターゲット遺伝子を同定するステップ、および前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、長さxのsiRNA用に加重表を作成する方法を提供する。ある実施形態では、その方法は、少なくとも1個の標的遺伝子に対して、少なくとも2個の長さxのsiRNAを作製するステップ、前記少なくとも1個の標的遺伝子に対して、前記少なくとも2個の長さxのsiRNAのそれぞれの活性レベルを決定するステップ、閾値活性レベルを選択するステップ、前記閾値活性レベルに減少値0を割り当てるステップ、前記閾値活性レベルより高い各々の異なる活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる活性レベルに、異なる負の減少値を割り当てるステップ、その活性レベルに従って長さxの各siRNAに減少値を割り当てるステップ、第1の位置にアデニン(A)を有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のアデニン(A)の加重因子の算出ステップ、第1の位置のアデニン(A)の加重因子の加重表への挿入ステップ、第1の位置のシトシン(C)、グアニン(G)、およびウリジン(U)について、前記算出ステップおよび前記挿入ステップの反復ステップ、少なくとも第2の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するステップを含み、それによって長さxのsiRNA用に加重表を作成する。ある実施形態では、少なくとも2つの長さxのsiRNAは、少なくとも100、少なくとも200、少なくとも500、または少なくとも1000の長さxのsiRNAである。
ある実施形態では、長さxのsiRNA用にオフターゲット加重表を作成する方法を提供する。ある実施形態では、その方法は、各siRNAが、オフターゲット遺伝子と比べて少なくとも1個のミスマッチを含む、少なくとも1個のオフターゲット遺伝子に対して少なくとも2個の長さxのsiRNAを作製するステップ、少なくとも1個のオフターゲット遺伝子に対して調整した、前記少なくとも2個の長さxのsiRNAのそれぞれの活性レベルを決定するステップ閾値調整した活性レベルを選択するステップ、前記閾値調整した活性レベルに減少値0を割り当てるステップ、前記閾値活性レベルより高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるステップ、その調整した活性レベルに従って、長さxの各siRNAに減少値を割り当てるステップ、第1の位置中にミスマッチを有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のミスマッチのオフターゲット加重因子の算出ステップ、第1の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップ、少なくとも第2の位置について前記算出ステップおよび前記挿入ステップを反復するステップを含み、それによって長さxのsiRNA用にオフターゲット加重表を作成する。
ある実施形態では、少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、および配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAの前記配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、コンピュータープログラム製品は、長さxのsiRNAに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さxのsiRNAに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、前記長さxのsiRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さxのsiRNAでデータベースを走査するためのコード、および配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのコードを含む。
ある実施形態では、コンピュータープログラム製品は、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析、および少なくとも一個の長さxの潜在的siRNAに対する一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析、および少なくとも一個の長さxの潜在的siRNAに対する一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、少なくとも一個の長さxの潜在的siRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さxの潜在的siRNAで前記データベースを走査するためのコード、および配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。ある実施形態では、第2の配列分析は、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、コンピュータープログラム製品は、長さxのsiRNA用に、加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さxのsiRNA用に加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、その活性レベルに従って長さxのsiRNAに減少値を割り当てるためのコード、第1の位置にアデニン(A)を有する長さxの各siRNAの減少値を平均化するステップを含む、第1のアデニン(A)の加重因子の算出ステップのためのコード、第1の位置のアデニン(A)の加重因子の加重表への挿入ステップのためのコード、第1の位置のシトシン(C)、グアニン(G)、およびウリジン(U)について、前記算出ステップおよび前記挿入ステップを反復するためのコード、少なくとも第2の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコードを含み、それによって長さxのsiRNA用に加重表を作成する。
ある実施形態では、コンピュータープログラム製品は、長さxのsiRNA用にオフターゲット加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さxのsiRNA用にオフターゲット加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード、選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、その調整した活性レベルに従って、長さxの各siRNAに減少値を割り当てるためのコード、第1の位置中にミスマッチを有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、第1の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、少なくとも第2の位置について前記算出ステップおよび前記挿入ステップを反復するためのコードを含み、それによって長さxのsiRNA用にオフターゲット加重表を作成する。
ある実施形態では、長さyのsiRNAを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するステップ前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するステップ、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するステップ、データベースを選択するステップ、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するステップ、第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するステップ、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するステップ、前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するステップ、および前記少なくとも1個の長さyの潜在的siRNAから長さyのsiRNAを選択するステップを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、その命令は、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するためのコード、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAでデータベースを走査するためのコード、第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置を提供する。ある実施形態では、その命令は、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ21のsiRNAを同定するためのコード、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAでデータベースを走査するためのコード、第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、長さyのsiRNAを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するステップ前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するステップ、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するステップ、データベースを選択するステップ、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するステップ、前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するステップであって、該一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップ、第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するステップ、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するステップ、前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するステップ、および前記少なくとも1個の長さyの潜在的siRNAから長さyのsiRNAを選択するステップを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、その命令は、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するためのコード、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するためのコード、前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
ある実施形態では、プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置を提供する。ある実施形態では、その命令は、xがyより短い、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ21のsiRNAを同定するためのコード、少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するためのコード、前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析は、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第1の配列分析は、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む。
本発明は、特定の方法、装置、またはシステムだけには限定されず、それらは当然様々なものであってよいことは理解されよう。さらに、本明細書で使用される用語は、単に特定の実施形態について記載することを目的とし、限定的な意図はないことも理解されるものとする。
本明細書および添付の特許請求の範囲で使用される単数形「a」、「an」、および「the」は、その内容が別段に明記されない限り複数の指示対象を含む。
特に明記しない限り、本明細書で使用される全ての技術的および科学的用語は、本発明が属する技術分野の通常の技術者が一般的に理解するものと同じ意味を有する。本明細書に記載したものと同様または同等の方法および物質も、本発明の試験を実施する際に使用することができる。本発明の記載および請求において、以下に述べた定義に従って以下の用語を使用する。
本明細書で使用する「siRNA」は、各鎖に12〜100のクレオチドを含む二本鎖RNA分子をさす。「siRNA」という用語は、2つの別々のRNA分子を含む二本鎖RNA、および1つのRNA分子を含む二本鎖RNAを含む。
ある実施形態では、siRNAの一端または両端は平滑末端であり、すなわちオーバーハングを持たない。ある実施形態では、siRNAは、一つまたは複数のオーバーハングを含む。本明細書で使用するオーバーハングとは、塩基対を形成していない、すなわち一本鎖の一つまたは複数の末端ヌクレオチドを含む配列である。オーバーハングは、5’オーバーハングまたは3’オーバーハングでありうる。5’オーバーハングは、塩基対を形成していない5’末端ヌクレオチド配列である。3’オーバーハングは、塩基対を形成していない3’末端ヌクレオチド配列である。ある実施形態では、siRNAは1個の5’オーバーハングを含む。ある実施形態では、siRNAは、2個の5’オーバーハングを含む。ある実施形態では、siRNAは1個の3’オーバーハングを含む。ある実施形態では、siRNAは2個の3’オーバーハングを含む。ある実施形態では、siRNAは、1個の5’オーバーハングと1個の3’オーバーハングを含む。ある実施形態では、オーバーハングは、1、2、3、4、または5個のヌクレオチドを含む。ある実施形態では、オーバーハングは5個を超えるヌクレオチドを含む。
siRNAは二本の鎖を含む。各siRNAは、一本のセンス鎖と一本のアンチセンス鎖を含む。本明細書で使用するsiRNAのセンス鎖は、オーバーハングの一部であるヌクレオチドを含まない。本明細書で使用するsiRNAのアンチセンス鎖は、オーバーハングの一部であるヌクレオチドを含まない。ある実施形態では、siRNAの一鎖は、センス鎖とセンス鎖末端に任意のオーバーハングも含む。ある実施形態では、siRNAの一鎖は、アンチセンス鎖とアンチセンス鎖末端に任意のオーバーハングも含む。
時にヘアピンsiRNAと称される単一RNA分子を含むsiRNAでは、反対鎖のヌクレオチドと塩基対を形成する鎖のヌクレオチド数によって、センス鎖またはアンチセンス鎖のヌクレオチド数を決定する。鎖の全ての塩基が必ずしも塩基対を形成している必要はなく、バルジ、オーバーハング、またはミスマッチが生じることがあることも理解されよう。従って、ヘアピンsiRNAの一鎖のヌクレオチド数には、そのヘアピンsiRNAの一本鎖リンカー部分のヌクレオチドは含まれない。その結果、本明細書で使用するように、ヘアピンsiRNAの二本鎖のヌクレオチドの合計は、そのヘアピンsiRNAを形成する単一RNA分子のヌクレオチドの総数と等しいか、それより少ない可能性がある(なぜなら、1本鎖RNA分子は、一本鎖リンカー部分の一部である一個または複数のヌクレオチドを含みうるからである)。ある実施形態では、ヘアピンsiRNAの一鎖は、ヘアピンsiRNAのセンス鎖と、ヘアピンsiRNAのループではないセンス鎖末端のいかなるオーバーハングも含む。ある実施形態では、ヘアピンsiRNAの一鎖は、ヘアピンsiRNAのアンチセンス鎖と、ヘアピンsiRNAのループではないアンチセンス鎖末端のいかなるオーバーハングも含む。従って、ある実施形態では、ヘアピンsiRNAのループ中のヌクレオチドは、ヘアピンsiRNAのどちらの鎖長にも含めない。
ある実施形態では、siRNAの一鎖は15〜150のヌクレオチドを含む。ある実施形態では、siRNAの一鎖は、15〜1000のヌクレオチドを含む。ある実施形態では、siRNAの一鎖は、15〜50のヌクレオチドを含む。ある実施形態では、siRNAの一鎖は、15〜30のヌクレオチドを含む。ある実施形態では、siRNAの一鎖は、17〜30のヌクレオチドを含む。ある実施形態では、siRNAの一鎖は、18、19、20、21、22、23、24、25、26、27、28、29、または30のヌクレオチドを含む。siRNAの二本の鎖は、同数のヌクレオチドを含みうるし、または異なる数のヌクレオチドを含みうる。ある実施形態では、siRNAの一鎖は、siRNAの他方の鎖よりもヌクレオチドを1、2、3、4、または5個多く含む。
本明細書で使用する「ハイブリッド形成化ポリヌクレオチド」は、選択した標的遺伝子の少なくとも一部に相補的な配列を有する、デオキシリボヌクレオチド、リボヌクレオチド、または両方から構成される一本鎖分子をさす。ある実施形態では、ハイブリッド形成化ポリヌクレオチドは、10、20、30、40、50、75、100、150、200、300、または500ヌクレオチド長である。「ハイブリッド形成化ポリヌクレオチド」は、「アンチセンスポリヌクレオチド」を含み、これはアンチセンス標的遺伝子を抑制することができるハイブリッド形成化ポリヌクレオチドである。
siRNAまたはハイブリッド形成化ポリヌクレオチドは、当技術分野で公知の任意の方法によって生成することができる。そのような方法には、それだけには限らないが、化学合成、細胞中で発現プラスミドからsiRNAまたはハイブリッド形成化ポリヌクレオチドを発現させる方法、およびin vitroでDNA分子からsiRNAまたはハイブリッド形成化ポリヌクレオチドを転写させる方法が含まれる。siRNAまたはハイブリッド形成化ポリヌクレオチドは、それだけには限らないが、siRNAまたはハイブリッド形成化ポリヌクレオチド、あるいはsiRNAまたはハイブリッド形成化ポリヌクレオチドをコードする発現ベクターの形質移入;siRNAまたはハイブリッド形成化ポリヌクレオチドを発現するウイルスによる感染;siRNAまたはハイブリッド形成化ポリヌクレオチドを発現するDNA配列の細胞ゲノム中への組込み;ならびにsiRNAまたはハイブリッド形成化ポリヌクレオチドあるいはsiRNA、アンチセンスポリヌクレオチド、またはハイブリッド形成化ポリヌクレオチドをコードする発現ベクターの微量注射を含む、当技術分野で公知の任意の方法によって細胞に導入することができ。形質移入方法には、それだけには限らないが、塩化セシウム形質移入、リポフェクション、電気穿孔法、および細胞膜の透過性を高める他の方法が含まれる。当業者は、細胞にsiRNAまたはハイブリッド形成化ポリヌクレオチドを導入するのに適当な方法を選択することができる。当業者は、細胞中でsiRNAまたはハイブリッド形成化ポリヌクレオチドを発現させるのに適当な発現ベクターまたはウイルスベクターもそのような発現を望むなら選択することができる。
ある実施形態では、一つのsiRNAまたはハイブリッド形成化ポリヌクレオチド中のヌクレオチドの全てはリボヌクレオチドである。ある実施形態では、一つのsiRNAまたはハイブリッド形成化ポリヌクレオチドは、一個または複数のデオキシヌクレオチドを含む。ある実施形態では、一つのsiRNAまたはハイブリッド形成化ポリヌクレオチドはデオキシヌクレオチドのみを含む。ある実施形態では、siRNAのセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、siRNAのアンチセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、センス鎖の一個または複数のヌクレオチド、およびsiRNAのアンチセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、siRNAはDNA:RNAハイブリッドでありうる。例えば、Lambertonら, Molecular Biotechnology, 24: 111-119 (2003)を参照のこと。ある実施形態では、siRNAのオーバーハングは、一個または複数のデオキシヌクレオチドを含みうる。ある実施形態では、siRNAのオーバーハングは、一個または複数の自然に存在しないヌクレオチドを含みうる。代表的な自然に存在しないヌクレオチドには、それだけには限らないが、ペプチド核酸(PNA)を形成するヌクレオチド、架橋した核酸(BNA)を形成するヌクレオチド、およびロックされた核酸(LNA)を形成するヌクレオチドが含まれる。
ある実施形態では、siRNAまたはハイブリッド形成化ポリヌクレオチドは、一個または複数のリボヌクレオチド誘導体を含みうる。使用が可能なリボヌクレオチド誘導体には、siRNAまたはアンチセンスポリヌクレオチドの活性に実質的に干渉しないあらゆる誘導体が含まれる。誘導体の活性が、自然発生のリボヌクレオチドだけから構成されたsiRNAまたはアンチセンスポリヌクレオチドの活性の少なくとも80%である場合、その誘導体は、アンチセンスポリヌクレオチド活性のsiRNAに「実質的に干渉」しない。そのような誘導体には、それだけには限らないが、一定の条件下でRNA分子を安定化させる誘導体、siRNAまたはアンチセンスポリヌクレオチドの活性を増大させる誘導体、およびsiRNAまたはハイブリッド形成化ポリヌクレオチドをより経済的に生成できるようにする誘導体が含まれる。ある種の代表的な誘導体には、それだけには限らないが、以下の一種または複数を有するsiRNAまたはハイブリッド形成化ポリヌクレオチドが含まれる:2’−アミノ−ブチリル−ピレン−ウリジン、2’−アミノ−シチジン、2’−アミノ−ウリジン、2’−デオキシ−ウリジン、2’−フルオロ−シチジン、2’−フルオロ−ウリジン、2,6−ジアミノプリン、2’−アミノ−シチジン、2−アミノプリン、4−チオ−ウリジン、5−アミノ−アリル−ウリジン、5−ブロモ−ウリジン、5−フルオロ−シチジン、5−フルオロ−ウリジン、5−ヨード−ウリジン、5−メチル−シチジン、5−アミノ−アリル−ウリジン、デオキシ−脱塩基、イノシン、MN、N3−メチル−ウリジン、プソイドウリジン、プリンリボヌクレオシド、リバビリン、リボ−チミジン、5’−アミノ−C12(12炭素リンカー)、5’−アミノ−C3(3−炭素リンカー)、5’−アミノ(5−原子リンカー)、5’−アミノ−C6(6−炭素リンカー)、5’−ビオチン、5’−Cy3、5’−Cy5、5’−ダブシル、5’−フルオレセイン、5’−リン酸エステル、5’−光切断ビオチン、5’−テトラクロロ−フルオレセイン、5’−チオール、3’−アミノ調節物質、3’−逆向き脱塩基、3’−逆向きデオキシチミジン、3’−ピューロマイシン、デオキシ−グアノシン、ジデオキシ−シチジン、3’ビオチン、3’−Cy3、3’−Cy5、3’−フルオレセイン、3’−LCビオチン、3’−LCLCビオチン、3’−TAMRA、5’−PEG−40K、5’−ピレン、3’−コレステロール、DNP、および/または5’−TAMRA−ヘキシルリンカー。ある種の代表的誘導体には、それだけには限らないが、一鎖または両鎖に第1のrN(rA,rU,rG,rC)を有するsiRNA、一鎖または両鎖に後続のrNを有するsiRNAまたはハイブリッド形成化ポリヌクレオチド、ならびに一鎖または両鎖にrW(rA,rU)および/またはrS(rC,rG)を有するsiRNAまたはハイブリッド形成化ポリヌクレオチドが含まれる。ある種の代表的誘導体には、それだけには限らないが、一個または複数のホスホロチオエート連鎖、18原子スペーサー(例えば、ヘキサエチレングリコール)、3−炭素リンカー、および/または9原子スペーサーを含むsiRNAまたはハイブリッド形成化ポリヌクレオチドも含まれる。
本明細書で使用する「標的遺伝子」は、siRNAのセンス鎖またはアンチセンス鎖と同一である配列を含むRNAコード配列をさす。「標的遺伝子」は、その標的遺伝子によってコードされているRNAもさす。「標的遺伝子」はさらに、siRNAのセンス鎖またはアンチセンス鎖と同一である配列を含むRNAもさし、その際、そのRNAはDNA分子からコードされていない。従って、「標的遺伝子」には、レトロウイルスRNA配列、および例えばDNA分子から転写されていない他のRNA配列が含まれる。本明細書で使用する「標的RNA」は、RNAコード配列から転写できまたは転写できないRNAであるが、siRNAのセンス鎖またはアンチセンス鎖と同じ配列を含むRNAをさす。従って、「標的RNA」は「標的遺伝子」のサブセットである。標的RNAには、レトロウイルスRNA配列、およびDNA分子から転写されていない他のRNA配列が含まれる。「標的RNA」は、RNAをコードするDNA配列から転写されたmRNAも含む。ある実施形態では、標的RNAは、分解がsiRNAによって媒介され、結果として標的RNAのレベルを減少させる分子である。ある実施形態では、標的RNAは、標的RNAの分解以外の任意の機序によって、発現がsiRNAによって抑制される分子である。ある実施形態では、標的遺伝子はsiRNAによって直接抑制されうる。
ある実施形態では、「アンチセンス標的遺伝子」は、アンチセンスポリヌクレオチド配列に相補的な配列を含むDNA配列またはRNA配列をさす。ある実施形態では、アンチセンスポリヌクレオチドは、RNAをコードするアンチセンス標的遺伝子からRNAが転写されるのを減少させる。ある実施形態では、アンチセンスポリヌクレオチドは、タンパク質をコードするアンチセンス標的RNAからタンパク質が発現されるのを減少させる。
本明細書で使用するsiRNAの「活性」または「活性レベル」は、細胞中で標的RNAのレベルを減少させるsiRNAの能力をさす。本明細書で使用する「高活性」は、定量的PCR(qPCR)アッセイによる定量で、標的RNAを80%以上減少させることをさす。本明細書で使用する「中活性」は、qPCRによる定量で標的RNAを50%〜80%減少させることをさす。本明細書で使用する「低活性」は、qPCRによる定量で標的RNAを50%未満で減少させることをさす。qPCRについては、例えば、Biotechnology (N Y). 1992 Apr;10(4):413-7、Biotechnology (N Y). 1993 Sep;11(9):1026-30、Methods. 2001 Dec;25(4):402-8、およびGene. 1990 Sep 1;93(1):125-8に記載されている。siRNA活性の他の定量方法は、当技術分野で公知であり、それだけには限らないが、タンパク質の発現の検出(それだけには限らないが、GFPまたはルシフェラーゼなどのマーカータンパク質の検出を含む)、ノーザンブロットを使用するRNAの検出、およびマイクロアレイを使用するRNAもしくはcDNAレベルの検出、bDNAを使用する検出、分子ビーコンを使用する検出、ならびに蛍光オリゴプローブを使用する検出が含まれる。
本明細書で使用するアンチセンスポリヌクレオチドの「アンチセンス活性」または「活性レベル」は、細胞中でアンチセンス標的遺伝子から転写されるRNAレベルを減少させ、または細胞中でアンチセンス標的RNAから発現するタンパク質レベルを減少させる、アンチセンスポリヌクレオチドの能力をさす。RNAレベルを定量する方法は、上述するように当技術分野で公知である。タンパク質レベルを定量する方法も当技術分野で公知であり、例えば、ウェスタンブロッティング、HPLC、薄層クロマトグラフィー、ニンヒドリンおよび他の染色技術、ブラッドフォードアッセイなどが含まれる。
本明細書で使用する「潜在的オフターゲット遺伝子」は、siRNAのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を、その遺伝子のコード鎖上およびその遺伝子の転写された領域中に含む遺伝子をさす。ある実施形態では、潜在的オフターゲット遺伝子配列は、siRNAのセンス鎖またはアンチセンス鎖と比較して1、2、3または4個のミスマッチを含む。本明細書で使用する「潜在的オフターゲットRNA」は、潜在的オフターゲット遺伝子から転写され、そしてsiRNAのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を含むmRNAをさす。
本明細書で使用する「潜在的アンチセンスオフターゲット遺伝子」は、その相補鎖がアンチセンスポリヌクレオチドに同一ではないが類似する配列を含むDNAまたはRNAをさす。ある実施形態では、潜在的アンチセンスオフターゲット遺伝子の相補鎖は、アンチセンスポリヌクレオチドと比べて1%、2%、5%、10%、15%、20%、25%、30%、40%、または50%のミスマッチを含む。
本明細書で使用する「同一ではないが類似する配列」は、参照配列に少なくとも80%同一である配列をさす。ある実施形態では、配列が、参照配列に少なくとも85%、または少なくとも90%、または少なくとも95%同一である場合、その配列は参照配列に「同一ではないが類似する」。ある実施形態では、配列が参照配列に少なくとも50%、または少なくとも60%、または少なくとも75%同一である場合、その配列は参照配列に「同一ではないが類似する」。ある実施形態では、参照配列が19ヌクレオチド長であるならば、配列が11/19、12/19、13/19、14/19、15/19、16/19、17/19、または18/19同一であるヌクレオチドを有する場合、配列はその参照配列に同一ではないが類似する。ある実施形態では、参照配列が19ヌクレオチド長であるならば、配列が11/19、12/19、13/19、14/19、または15/19同一であるヌクレオチドを有する場合、配列はその参照配列に同一ではないが類似する。
本明細書で使用する「予想されるオフターゲット遺伝子」は、潜在的オフターゲット遺伝子のサブセットをさす。予想されるオフターゲット遺伝子は、任意の数の選択した因子に基づき、特定のsiRNAがその遺伝子に対してオフターゲット活性を有すると予想される遺伝子のことである。本明細書で使用する「潜在的オフターゲットRNA」は、潜在的オフターゲット遺伝子から転写され、そしてsiRNAのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を含むmRNAをさす。従って、siRNAは、平均して、予想されるオフターゲットRNAではない潜在的オフターゲットRNAに対するよりも、予想されるオフターゲットRNAに対して高いオフターゲット活性を有すると予想される。
本明細書で使用する「予想されるアンチセンスオフターゲット遺伝子」は、潜在的アンチセンスオフターゲット遺伝子のサブセットをさす。予想されるアンチセンスオフターゲット遺伝子は、任意の数の選択した因子に基づき、その遺伝子に対して特定のアンチセンスポリヌクレオチドが、オフターゲットアンチセンス活性を有すると予想されるRNAまたはDNA遺伝子である。従って、アンチセンスポリヌクレオチドは、平均して、予想されるアンチセンスオフターゲット遺伝子ではない潜在的アンチセンスオフターゲット遺伝子に対するよりも、予想されるアンチセンスオフターゲット遺伝子に対して高いオフターゲットアンチセンス活性を有すると予想される。
本明細書で使用するsiRNAの「オフターゲット活性」は、細胞中で潜在的または予想されるオフターゲットRNAレベルを減少させるsiRNAの能力をさす。本明細書で使用する「高オフターゲット活性」は、定量的PCR(qPCR)アッセイによる定量で、一つまたは複数のオフターゲットRNAが80%以上減少することをさす。本明細書で使用する「中オフターゲット活性」は、qPCRによる定量で、一つまたは複数のオフターゲットRNAが35%〜80%減少することをさす。本明細書で使用する「低オフターゲット活性」は、qPCRによる定量で、一つまたは複数のオフターゲットRNAが35%未満減少することをさす。
本明細書で使用する、アンチセンスポリヌクレオチドの「オフターゲットアンチセンス活性」は、細胞中で潜在的または予想されるアンチセンスオフターゲット遺伝子のレベルを減少させるアンチセンスポリヌクレオチドの能力をさす。
本明細書で使用する、siRNAの「活性鎖」は、標的RNAまたはオフターゲットRNAと同一、または同一ではないが類似する配列を有するsiRNA鎖をさす。ある実施形態では、siRNAの一鎖は第1の標的遺伝子に対して活性であり、siRNAの他方の鎖は第2の標的遺伝子(または第1の標的遺伝子の第2の領域)に対して活性でありうる。従って、siRNAの一鎖は、第1の標的遺伝子に関して活性鎖であり、他方の鎖は、第2の標的遺伝子に関して活性鎖でありうる。
本発明は、一個または複数の標的遺伝子に対して活性を有するアンチセンスポリヌクレオチドを含む、siRNAおよびハイブリッド形成化ポリヌクレオチドを設計する方法を提供する。ある実施形態では、その方法は、標的遺伝子またはアンチセンス標的遺伝子に対して活性を有すると予想されるsiRNAまたはアンチセンスポリヌクレオチドを一個または複数選択するステップ、次いでその一個または複数の選択したsiRNAまたはアンチセンスポリヌクレオチドの、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子に対するオフターゲット活性またはアンチセンスオフターゲット活性を予測するステップを含む。
ある実施形態では、一個または複数の標的遺伝子またはアンチセンス標的遺伝子に対して活性を有すると予想される、一個または複数のsiRNAまたはアンチセンスポリヌクレオチドを選択するために、因子、例えば、siRNAまたはアンチセンスポリヌクレオチド中のGおよびCの割合、各位置の特異的なヌクレオチド、siRNA鎖またはアンチセンスポリヌクレオチドの3’および5’末端領域間の自由エネルギー差、siRNAまたはアンチセンスポリヌクレオチドの3’および5’末端領域のAおよびUヌクレオチド数、siRNA鎖またはアンチセンスポリヌクレオチドの3’および5’末端の比エネルギー、siRNAまたはアンチセンスポリヌクレオチドにかかる自由エネルギー平衡、siRNAまたはアンチセンスポリヌクレオチドの融解温度、ならびにsiRNAまたはアンチセンスポリヌクレオチド中のヌクレオチドの組合せを考慮する。ある実施形態では、所望の用途に向けて任意ハイブリッド形成化ポリヌクレオチドを選択するために同様に考慮することができる。
ある実施形態では、選択したsiRNAまたはアンチセンスポリヌクレオチドのオフターゲット活性またはオフターゲットアンチセンス活性は、選択したsiRNAのセンスおよび/またはアンチセンス鎖で、あるいはアンチセンスポリヌクレオチドでデータベースを走査して、選択したsiRNAまたはアンチセンスポリヌクレオチドに同一ではないが類似する配列を同定することによって予想する。ある実施形態では、予想されるオフターゲット遺伝子または予想されるアンチセンスオフターゲット遺伝子を同定するために、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子と、選択したsiRNAまたはアンチセンスポリヌクレオチドとの間のミスマッチの数および位置を考慮する。
配列分析系
ある場合には、無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して変数レベルの活性を有する。従って、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して低活性を有し、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して中活性を有し、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは標的配列に対して高活性を有しうる。
ある場合には、無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して変数レベルの活性を有する。従って、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して低活性を有し、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは、標的配列に対して中活性を有し、ある無作為に選択したsiRNAまたはアンチセンスポリヌクレオチドは標的配列に対して高活性を有しうる。
分かりやすくするために、siRNAの選択と関連して配列分析系を記載する。同様の方法を使用して、アンチセンスポリヌクレオチドまたは他のいかなるハイブリッド形成化ポリヌクレオチドも選択することができる。当業者ならば、アンチセンスポリヌクレオチドまたは他のハイブリッド形成化ポリヌクレオチドが関与する用途に、記載した方法を適応させることができる。
ある実施形態では、特定の標的遺伝子に対して中もしくは高活性を有する可能性が高いsiRNAを選択するために配列分析系を使用する。ある実施形態では、特定の標的遺伝子に対して高活性を有する可能性が高いsiRNAを選択するために配列分析系を使用する。配列分析系は、所望のレベルの活性を有する可能性が高いsiRNAを選択するために、各siRNAに適用する判定基準のコレクションを含む。判定基準のコレクション中のある判定基準によって、siRNAまたはオフターゲット遺伝子に割り当てる「値」を生成する。判定基準のコレクション中のある判定基準によって、siRNAまたはオフターゲット遺伝子の一個または複数のヌクレオチドに割り当てる「値」を生成する。いずれの場合にも値は数字でなくてもよい。ある実施形態では、値は状態の2値指標、すなわち、何かの有無であってよい。配列分析系には、本明細書に述べる判定基準の幾つかまたは全てを含めてよく、さらに使用者が選択した別の判定基準を含めてよい。ある実施形態では、配列分析系の判定基準および閾値を修正することによって、当業者は所望の閾値活性レベルを有するsiRNAを一個または複数選択することができる。
ある実施形態では、配列分析系を使用するため所望の標的遺伝子を選択する。所望の標的遺伝子は、RNAコード配列の一部またはRNAの一部であってよい。ある実施形態では、選択した標的遺伝子の中から、同一、または同一ではないが類似し、あるいは同一領域を有する、標的遺伝子領域を選択するによって、1つを超える標的遺伝子に対して活性を有するsiRNAを選択することができる。当業者ならば、例えば、配列を整列させるステップ、および配列の中から、同一、または同一ではないが類似し、あるいは同一領域を有する、領域を見出すステップによって、そのような標的遺伝子領域を選択することができる。次いで、その領域の一つまたは複数を配列分析系で使用することができる(分かりやすくするために、たとえその領域がコード配列の一部を表し、かつ/または複数のコード配列を表していても、配列分析系で使用する領域を「標的遺伝子」と呼ぶ)。領域に選択した標的遺伝子間の差が含まれていても、標的配列がそのような差を含むsiRNAは、潜在的siRNAのプールから排除することができる。
ある実施形態では、一度標的遺伝子を選択すれば、サイズ固定ウインドウでその標的遺伝子を走査して、標的配列に対してサイズ固定された潜在的なsiRNAを一個または複数同定する。ある実施形態では、サイズ固定ウインドウで標的遺伝子を走査して、標的配列に対してサイズ固定された潜在的なsiRNAを全て同定する。例えば、以下の配列には
5’ CGCCCTCTACGAACTCCAGTTA 3’[配列番号1]
19ヌクレオチドにサイズ固定された全ての潜在的なsiRNAを以下に示す。
5’ CGCCCTCTACGAACTCCAGTTA 3’[配列番号1]
19ヌクレオチドにサイズ固定された全ての潜在的なsiRNAを以下に示す。
5’ CGCCCUCUACGAACUCCAG 3’[配列番号2]
5’ GCCCUCUACGAACUCCAGU 3’[配列番号3]
5’ CCCUCUACGAACUCCAGUU 3’[配列番号4]
5’ CCUCUACGAACUCCAGUUA 3’[配列番号5]
従って、ある実施形態では、長さNのヌクレオチドの標的遺伝子およびXのヌクレオチドにサイズ固定されたウインドウの場合、その標的遺伝子には固定サイズXの(N−X+1)個の潜在的なsiRNAがある。その計算によって、各siRNAは第一鎖と完全に塩基対を形成する第2の鎖を有し、どちらの鎖にも非塩基対のオーバーハングはないと仮定される。もちろん、当業者であれば、第2鎖を改変して様々な長さのオーバーハングを作成し、標的遺伝子に対して潜在的siRNAの合計数を増大させることができるであろう。ある実施形態では、ウインドウは15〜150ヌクレオチドに固定される。ある実施形態では、ウインドウは15〜100ヌクレオチドに固定される。ある実施形態では、ウインドウは15〜50ヌクレオチドに固定される。ある実施形態では、ウインドウは16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、39、または50ヌクレオチドに固定される。
5’ GCCCUCUACGAACUCCAGU 3’[配列番号3]
5’ CCCUCUACGAACUCCAGUU 3’[配列番号4]
5’ CCUCUACGAACUCCAGUUA 3’[配列番号5]
従って、ある実施形態では、長さNのヌクレオチドの標的遺伝子およびXのヌクレオチドにサイズ固定されたウインドウの場合、その標的遺伝子には固定サイズXの(N−X+1)個の潜在的なsiRNAがある。その計算によって、各siRNAは第一鎖と完全に塩基対を形成する第2の鎖を有し、どちらの鎖にも非塩基対のオーバーハングはないと仮定される。もちろん、当業者であれば、第2鎖を改変して様々な長さのオーバーハングを作成し、標的遺伝子に対して潜在的siRNAの合計数を増大させることができるであろう。ある実施形態では、ウインドウは15〜150ヌクレオチドに固定される。ある実施形態では、ウインドウは15〜100ヌクレオチドに固定される。ある実施形態では、ウインドウは15〜50ヌクレオチドに固定される。ある実施形態では、ウインドウは16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、39、または50ヌクレオチドに固定される。
ある実施形態では、配列分析系は以下の判定基準の一つまたは複数を含む。ある実施形態では、siRNAを選択するための判定基準を多く使用するほど、配列分析系によって選択されるsiRNAの活性は平均して高くなる。
G/C判定基準
ある実施形態では、配列分析系はG/C判定基準を適用する。G/C判定基準によって潜在的なsiRNAのG/C塩基対含有量を考慮し、G/C値を生成する。ある実施形態では、G/C値は割合として表される。ある実施形態では、G/C塩基対含有量を考慮するために、G/C判定基準によってsiRNAの全塩基対に対するG/C塩基対割合を計算する。従って、ある実施形態では、siRNAのG/C塩基対含有量を計算する場合、非塩基対ヌクレオチドは考慮されない。例えば、先に述べた4つの潜在的siRNAで、siRNAのどれも非塩基対ヌクレオチドを含まない場合、配列番号2〜5のG/C含有量は、それぞれ、63.2%、57.9%、52.6%、および47.4%である。
ある実施形態では、配列分析系はG/C判定基準を適用する。G/C判定基準によって潜在的なsiRNAのG/C塩基対含有量を考慮し、G/C値を生成する。ある実施形態では、G/C値は割合として表される。ある実施形態では、G/C塩基対含有量を考慮するために、G/C判定基準によってsiRNAの全塩基対に対するG/C塩基対割合を計算する。従って、ある実施形態では、siRNAのG/C塩基対含有量を計算する場合、非塩基対ヌクレオチドは考慮されない。例えば、先に述べた4つの潜在的siRNAで、siRNAのどれも非塩基対ヌクレオチドを含まない場合、配列番号2〜5のG/C含有量は、それぞれ、63.2%、57.9%、52.6%、および47.4%である。
ある実施形態では、G/C含有量が30%〜65%のsiRNAがG/C判定基準にとって好都合がよい。ある実施形態では、G/C含有量が35%〜60%のsiRNAがG/C判定基準にとって好都合がよい。ある実施形態では、G/C含有量が40%〜55%のsiRNAがG/C判定基準にとって好都合がよい。ある実施形態では、G/C含有量が選択した範囲から外れるsiRNAはそれ以上考慮されない。ある実施形態では、G/C含有量が選択した範囲から外れるsiRNAも、依然として潜在的なsiRNAのリストに含めるが、G/C判定基準を満たすsiRNAをグループ分けし、またはそうでないにせよ順序付け、または同定して(例えば、各siRNAのG/C塩基対割合の指標を含めることによる)、それらをG/C判定基準を満たさないsiRNAと区別する。
加重値判定基準
ある実施形態では、配列分析系は加重値判定基準を適用する。加重値判定基準は、siRNAの各位置の特定のヌクレオチドの同一性を考慮し、加重値を生成する。ある実施形態では、加重値判定基準は各siRNAに加重表を当てはめる。加重表は、各位置の各潜在的ヌクレオチドに加重因子を割り当てる。従って、siRNAに加重表を当てはめた後、どのヌクレオチドがその位置にあるかに応じて、siRNAの各位置に特定の加重因子を当てはめる。ある実施形態では、配列分析系は、特定のsiRNAについての加重因子の全てを足してそのsiRNAの加重値を得る。
ある実施形態では、配列分析系は加重値判定基準を適用する。加重値判定基準は、siRNAの各位置の特定のヌクレオチドの同一性を考慮し、加重値を生成する。ある実施形態では、加重値判定基準は各siRNAに加重表を当てはめる。加重表は、各位置の各潜在的ヌクレオチドに加重因子を割り当てる。従って、siRNAに加重表を当てはめた後、どのヌクレオチドがその位置にあるかに応じて、siRNAの各位置に特定の加重因子を当てはめる。ある実施形態では、配列分析系は、特定のsiRNAについての加重因子の全てを足してそのsiRNAの加重値を得る。
ある実施形態では、加重表の作成方法は以下の通りである。一個または複数の標的遺伝子に対して、等しい長さの一連のsiRNAを作製する。その標的遺伝子に対して各siRNAの活性レベルを定量する。ある実施形態では、活性レベルは、qPCRによる定量されるように標的RNAの減少率として計算される。ある実施形態では、閾値活性レベルに減少値0が割り当てられ、その閾値を越える全活性レベルに正の減少値を割り当て、その閾値未満の全活性レベルに負の減少値を割り当てる。
ある実施形態では、siRNA中の各ヌクレオチドにsiRNA減少値を割り当てる(従って、各ヌクレオチドに同じ減少値が割り当てられる)。siRNAの様々な位置のヌクレオチドの一つまたは複数について、減少値に基づく加重因子を算出する。ある実施形態では、siRNAの様々な位置の4種のヌクレオチドのそれぞれについて加重因子を計算する。ある実施形態では、siRNAの位置のそれぞれの4種のヌクレオチドについて加重因子を計算する。ある実施形態では、加重因子は減少値の可変性の統計的手段である。ある実施形態では、加重因子は、例えば、平均(average)、平均(mean)、または他の統計手段であってよい。
ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも50のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも100のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも150のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも300のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも500のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも750のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも1000のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも2000のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも5000のsiRNAから得たデータを使用し加重表を編集する。ある実施形態では、追加のsiRNAの活性を試験し、その新規なデータを加重表計算に加えて加重表を正確なものにする。
ある実施形態では、加重値判定基準によって各siRNAに加重表を当てはめて、siRNAの各位置に加重因子を割り当てる。ある実施形態では、次いで、加重値判定基準により加重因子を合計して各siRNAの全加重値を得る。次いで、全加重値に従ってsiRNAを順序付けることができる。ある実施形態では、全加重値がある閾値未満のsiRNAを考察から排除する。
末端領域エネルギー判定基準
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用する。末端領域エネルギー判定基準は、siRNAの5’領域と3’領域の間の自由エネルギー差を考慮する。末端領域エネルギー判定基準によって、末端領域エネルギー値が生成される。ある実施形態では、siRNAの5’領域をsiRNAのセンス鎖の最初の3、4、5、6、または7ヌクレオチドとして定義する。ある実施形態では、siRNAの5’領域をsiRNAのセンス鎖の最初の5ヌクレオチドとして定義する。ある実施形態では、siRNAの3’領域をsiRNAのセンス鎖の最後の3、4、5、6、または7ヌクレオチドとして定義する。ある実施形態では、siRNAの3’領域をsiRNAのセンス鎖の最後の5ヌクレオチドとして定義する。ある実施形態では、5’領域と3’領域の自由エネルギーを、例えば、Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)、およびCell. 2003 Oct 17;115(2):199-208に記載の方法を使用し定量する。ある実施形態では、末端領域エネルギー判定基準には、自由エネルギーが5’領域よりも3’領域で低いsiRNAが好都合である。ある実施形態では、末端領域エネルギー値は、5’領域と3’領域のそれぞれの値を含みうる。ある実施形態では、末端領域エネルギー値は、3’および5’の両領域エネルギーを考慮する単一値を含みうる。その単一値は、それらの領域の実際のエネルギー、あるいは3’または5’領域のどちらのエネルギーが高いかの2値指標に関係しうる。
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用する。末端領域エネルギー判定基準は、siRNAの5’領域と3’領域の間の自由エネルギー差を考慮する。末端領域エネルギー判定基準によって、末端領域エネルギー値が生成される。ある実施形態では、siRNAの5’領域をsiRNAのセンス鎖の最初の3、4、5、6、または7ヌクレオチドとして定義する。ある実施形態では、siRNAの5’領域をsiRNAのセンス鎖の最初の5ヌクレオチドとして定義する。ある実施形態では、siRNAの3’領域をsiRNAのセンス鎖の最後の3、4、5、6、または7ヌクレオチドとして定義する。ある実施形態では、siRNAの3’領域をsiRNAのセンス鎖の最後の5ヌクレオチドとして定義する。ある実施形態では、5’領域と3’領域の自由エネルギーを、例えば、Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)、およびCell. 2003 Oct 17;115(2):199-208に記載の方法を使用し定量する。ある実施形態では、末端領域エネルギー判定基準には、自由エネルギーが5’領域よりも3’領域で低いsiRNAが好都合である。ある実施形態では、末端領域エネルギー値は、5’領域と3’領域のそれぞれの値を含みうる。ある実施形態では、末端領域エネルギー値は、3’および5’の両領域エネルギーを考慮する単一値を含みうる。その単一値は、それらの領域の実際のエネルギー、あるいは3’または5’領域のどちらのエネルギーが高いかの2値指標に関係しうる。
末端領域A/U判定基準
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用するよりも、またはその適用に加えて末端領域A/U判定基準を適用する。末端領域A/U判定基準は、siRNAの5’領域およびsiRNAの3’領域のA/U塩基対数を考慮し、末端領域A/U値を生成する。ある実施形態では、末端領域A/U判定基準には、5’領域に対して3’領域にA/U塩基対数が多いsiRNAが好都合である。ある実施形態では、末端領域A/U値は、5’領域と3’領域のそれぞれの値を含みうる。ある実施形態では、末端領域A/U値は、3’および5’の両領域のA/U塩基対数を考慮し、例えば、他方の数字から一方の数字を引くことによって単一値を含みうる。ある実施形態では、末端領域A/U値は、3’または5’領域のどちらがより多くA/U塩基対を有するかの2値指標でありうる。
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用するよりも、またはその適用に加えて末端領域A/U判定基準を適用する。末端領域A/U判定基準は、siRNAの5’領域およびsiRNAの3’領域のA/U塩基対数を考慮し、末端領域A/U値を生成する。ある実施形態では、末端領域A/U判定基準には、5’領域に対して3’領域にA/U塩基対数が多いsiRNAが好都合である。ある実施形態では、末端領域A/U値は、5’領域と3’領域のそれぞれの値を含みうる。ある実施形態では、末端領域A/U値は、3’および5’の両領域のA/U塩基対数を考慮し、例えば、他方の数字から一方の数字を引くことによって単一値を含みうる。ある実施形態では、末端領域A/U値は、3’または5’領域のどちらがより多くA/U塩基対を有するかの2値指標でありうる。
末端比エネルギー判定基準
ある実施形態では、配列分析系には末端比エネルギー判定基準を適用する。末端比エネルギー判定基準は、各siRNAのセンス鎖の5’末端および3’末端の比エネルギーを考慮し、末端比エネルギー値を生成する。ある実施形態では、末端比エネルギー判定基準は、各siRNAのセンス鎖の最初のヌクレオチドと最後のヌクレオチドの比エネルギーを考慮する。ある実施形態では、末端比エネルギー判定基準には、Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)、およびCell. 2003 Oct 17;115(2):199-208に記載されるような当技術分野で公知方法を使用し、比エネルギーが計算される。ある実施形態では、末端比エネルギー判定基準には、最初のヌクレオチドよりも最後のヌクレオチドの比エネルギーが小さいsiRNAが好都合である。ある実施形態では、末端比エネルギー値は、5’末端および3’末端のそれぞれについての値を含みうる。ある実施形態では、末端比エネルギー値は、3’および5’の両末端のエネルギーを考慮する単一値を含みうる。その単一値は、それらの末端の実際のエネルギー、あるいは3’または5’末端のどちらの比エネルギーが高いかの2値指標に関係しうる。
ある実施形態では、配列分析系には末端比エネルギー判定基準を適用する。末端比エネルギー判定基準は、各siRNAのセンス鎖の5’末端および3’末端の比エネルギーを考慮し、末端比エネルギー値を生成する。ある実施形態では、末端比エネルギー判定基準は、各siRNAのセンス鎖の最初のヌクレオチドと最後のヌクレオチドの比エネルギーを考慮する。ある実施形態では、末端比エネルギー判定基準には、Cell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)、およびCell. 2003 Oct 17;115(2):199-208に記載されるような当技術分野で公知方法を使用し、比エネルギーが計算される。ある実施形態では、末端比エネルギー判定基準には、最初のヌクレオチドよりも最後のヌクレオチドの比エネルギーが小さいsiRNAが好都合である。ある実施形態では、末端比エネルギー値は、5’末端および3’末端のそれぞれについての値を含みうる。ある実施形態では、末端比エネルギー値は、3’および5’の両末端のエネルギーを考慮する単一値を含みうる。その単一値は、それらの末端の実際のエネルギー、あるいは3’または5’末端のどちらの比エネルギーが高いかの2値指標に関係しうる。
エネルギープロフィール判定基準
ある実施形態では、配列分析系はエネルギープロフィール判定基準を適用する。エネルギープロフィール判定基準は、各siRNAの各位置の内部(自由)エネルギーを考慮し、エネルギープロフィール値を生成する。ある実施形態では、エネルギープロフィール判定基準は、Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7、およびCell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)に記載されているような当技術分野で公知方法に従ってsiRNAにかかる内部(自由)を計算する。ある実施形態では、エネルギープロフィール判定基準には、各位置の内部(自由)エネルギーが−7kcal/mol〜−11kcal/molであるsiRNAが好都合である。ある実施形態では、広いエネルギープロフィールよりも、狭いエネルギープロフィールの方が好都合である。ある実施形態では、一個または複数の既知の高活性siRNAのエネルギープロフィールに類似するエネルギープロフィールを有するsiRNAが好都合である。例えば、1、2、および3と番号を付した3個のsiRNAが図1に示す内部(自由)エネルギープロフィールを有する場合、siRNA3が好ましい。それらの標的遺伝子に対する活性をsiRNA1、2、および3について試験した場合、siRNA3は標的RNAを98%減少させたが、siRNA1および2は標的RNAを、それぞれ、16%および96%減少させた。標的遺伝子に比べて配列が乱れている負の対照siRNAの活性レベルは10%であった。
ある実施形態では、配列分析系はエネルギープロフィール判定基準を適用する。エネルギープロフィール判定基準は、各siRNAの各位置の内部(自由)エネルギーを考慮し、エネルギープロフィール値を生成する。ある実施形態では、エネルギープロフィール判定基準は、Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7、およびCell. 2003 Oct 17;115(2):209-16(誤植:Cell. 2003 Nov 14;115(4):505)に記載されているような当技術分野で公知方法に従ってsiRNAにかかる内部(自由)を計算する。ある実施形態では、エネルギープロフィール判定基準には、各位置の内部(自由)エネルギーが−7kcal/mol〜−11kcal/molであるsiRNAが好都合である。ある実施形態では、広いエネルギープロフィールよりも、狭いエネルギープロフィールの方が好都合である。ある実施形態では、一個または複数の既知の高活性siRNAのエネルギープロフィールに類似するエネルギープロフィールを有するsiRNAが好都合である。例えば、1、2、および3と番号を付した3個のsiRNAが図1に示す内部(自由)エネルギープロフィールを有する場合、siRNA3が好ましい。それらの標的遺伝子に対する活性をsiRNA1、2、および3について試験した場合、siRNA3は標的RNAを98%減少させたが、siRNA1および2は標的RNAを、それぞれ、16%および96%減少させた。標的遺伝子に比べて配列が乱れている負の対照siRNAの活性レベルは10%であった。
ある実施形態では、エネルギープロフィール値は、配列のヌクレオチドのそれぞれの値を含みうる。ある実施形態では、エネルギープロフィール値は、一つは配列の最高エネルギーを示し、一つは配列の最低エネルギーを示す2個の値を含みうる。ある実施形態では、エネルギープロフィール値は、配列が好ましいエネルギー範囲を超えるか、または超えないかの2値指標でありうる。
融解温度判定基準
ある実施形態では、配列分析系は融解温度判定基準を適用する。融解温度判定基準は、各siRNAの融解温度を考慮し、融解温度値を生成する。ある実施形態では、融解温度判定基準は、当技術分野で公知の任意の方法、例えば、Nat Biotechnol. 2004 Mar;22(3):326-30記載されている方法に従って、siRNAの融解温度を計算する。ある実施形態では、融解温度判定基準には、融解温度が高いsiRNAよりも、融解温度が低いsiRNAの方が好都合である。ある実施形態では、融解温度値は配列の融解温度として表される。
ある実施形態では、配列分析系は融解温度判定基準を適用する。融解温度判定基準は、各siRNAの融解温度を考慮し、融解温度値を生成する。ある実施形態では、融解温度判定基準は、当技術分野で公知の任意の方法、例えば、Nat Biotechnol. 2004 Mar;22(3):326-30記載されている方法に従って、siRNAの融解温度を計算する。ある実施形態では、融解温度判定基準には、融解温度が高いsiRNAよりも、融解温度が低いsiRNAの方が好都合である。ある実施形態では、融解温度値は配列の融解温度として表される。
G/Cストレッチ判定基準
ある実施形態では、配列分析系はG/Cストレッチ判定基準を適用する。G/Cストレッチ判定基準は、各siRNAが、連続的GおよびCヌクレオチドのストレッチを含むかどうかを考慮し、G/Cストレッチ値を生成する。ある実施形態では、G/Cストレッチ判定基準には、そのように4個以上の連続的Gおよび/またはCヌクレオチドのストレッチを含まないsiRNAが好都合である。例えば、配列AGGCGT、ACCCCA、TGGCGCAなどを含むsiRNAは、それぞれが、4個以上の連続的Gおよび/またはCヌクレオチドストレッチを有し、好ましくない。ある実施形態では、G/Cストレッチ値は、配列中の連続的Gおよび/またはCヌクレオチドの最高数として示される。ある実施形態では、配列が、4個以上の連続的Gおよび/またはCヌクレオチドのストレッチを含むか、含まないかの2値指標として、G/Cストレッチ値は示される。
ある実施形態では、配列分析系はG/Cストレッチ判定基準を適用する。G/Cストレッチ判定基準は、各siRNAが、連続的GおよびCヌクレオチドのストレッチを含むかどうかを考慮し、G/Cストレッチ値を生成する。ある実施形態では、G/Cストレッチ判定基準には、そのように4個以上の連続的Gおよび/またはCヌクレオチドのストレッチを含まないsiRNAが好都合である。例えば、配列AGGCGT、ACCCCA、TGGCGCAなどを含むsiRNAは、それぞれが、4個以上の連続的Gおよび/またはCヌクレオチドストレッチを有し、好ましくない。ある実施形態では、G/Cストレッチ値は、配列中の連続的Gおよび/またはCヌクレオチドの最高数として示される。ある実施形態では、配列が、4個以上の連続的Gおよび/またはCヌクレオチドのストレッチを含むか、含まないかの2値指標として、G/Cストレッチ値は示される。
判定基準加重因子
ある実施形態では、数種の判定基準は、siRNAの選択において他のものよりも重要であると考えられるので、配列分析系で使用される一つまたは複数の判定基準は、判定基準加重因子に従って加重される。ある実施形態では、判定基準加重因子は経験的に決定される。ある実施形態では、siRNAのコレクションを活性について試験する。判定基準加重因子を決定するために、任意の数のsiRNAを試験することができる。高活性、低中活性、および低活性を有するsiRNA数を同定する。次いで、本明細書に記載した判定基準を適用し、そのような判定基準内に収まるようなsiRNAを同定する。高活性を有し判定基準内に収まるsiRNAの相対量を算出する。同様に、低活性を有し判定基準内に収まるsiRNAの相対量を算出する。それらの相対量を比較することによって、そのような判定基準の加重因子が得られる。
ある実施形態では、数種の判定基準は、siRNAの選択において他のものよりも重要であると考えられるので、配列分析系で使用される一つまたは複数の判定基準は、判定基準加重因子に従って加重される。ある実施形態では、判定基準加重因子は経験的に決定される。ある実施形態では、siRNAのコレクションを活性について試験する。判定基準加重因子を決定するために、任意の数のsiRNAを試験することができる。高活性、低中活性、および低活性を有するsiRNA数を同定する。次いで、本明細書に記載した判定基準を適用し、そのような判定基準内に収まるようなsiRNAを同定する。高活性を有し判定基準内に収まるsiRNAの相対量を算出する。同様に、低活性を有し判定基準内に収まるsiRNAの相対量を算出する。それらの相対量を比較することによって、そのような判定基準の加重因子が得られる。
ある実施形態では、配列分析系で使用される各判定基準について判定基準加重因子を決定する。
ある実施形態では、配列分析系を適用することによって、予想されるそれらの標的遺伝子に対する活性に従って、ランク付けした潜在的なsiRNAのリストが得られる。しかし、siRNAの活性は、配列分析系のそれらのランクに対応しない可能性がある。ある実施形態では、上位10%にランク付けされたsiRNAのの平均活性は、下位10%にランク付けされたsiRNAの平均活性を超える。ある実施形態では、上位20%にランク付けされたsiRNAの平均活性は、下位20%にランク付けされたsiRNAの平均活性を超える。ある実施形態では、さらに分析するためにランク付けしたsiRNAのサブセットを選択する。ある実施形態では、さらに分析するためにランク付けしたsiRNAの少なくとも5、10、20、30、50、75、または100個を選択する。ある実施形態では、ランク付けしたsiRNAの全てをさらに分析する。
追加の標的判定基準
ある実施形態では、配列分析系は追加の標的判定基準を適用する。ある実施形態では、他の判定基準の後に配列分析系に追加の標的判定基準を適用する。ある実施形態では、配列分析系の他の判定基準後に追加の標的判定基準を適用する場合、追加の標的判定基準はsiRNAのサブセットに当てはめる。ある実施形態では、追加の標的判定基準はsiRNAの全てに当てはめる。
ある実施形態では、配列分析系は追加の標的判定基準を適用する。ある実施形態では、他の判定基準の後に配列分析系に追加の標的判定基準を適用する。ある実施形態では、配列分析系の他の判定基準後に追加の標的判定基準を適用する場合、追加の標的判定基準はsiRNAのサブセットに当てはめる。ある実施形態では、追加の標的判定基準はsiRNAの全てに当てはめる。
ある実施形態では、各siRNAと同一、または同一ではないが類似する配列を同定するために、選択したデータベースに対してsiRNAの全てまたはサブセットを走査して追加の標的値を生成する。siRNAのセンス鎖および/またはアンチセンス鎖を選択したデータベースに対して走査することができる。選択したデータベースに対してsiRNAを走査するために、長さXのsiRNAとデータベース中の長さXの各配列と比較する。従って、全ての潜在的なsiRNAを同定するために使用したウインドウに類似して、既知のsiRNA配列によってウインドウを定義しデータベースを走査するために使用する。データベース中の配列が、siRNA配列と同一、または同一ではないが類似する場合、その配列を含む遺伝子はヌクレオチドマッチ数と共にフラグ付けされる。例えば、17/19のヌクレオチドの閾値同一性レベルで、選択したデータベースに対して19個のヌクレオチドを有するsiRNAを走査することができる。この例では、走査によって、19/19のヌクレオチドが同一である配列を有する遺伝子が2個、18/19のヌクレオチドが同一である配列を有する遺伝子が7個、および17/19のヌクレオチドが同一である配列を有する遺伝子が40個明らかになる。
潜在的データベースには、それだけには限らないが、種属特異的データベース、cDNAデータベース、ゲノムデータベース、SNP含有データベース、スプライスバリアント含有データベース、組織特異的データベース、発生段階特異的データベース、mRNAデータベース、およびタンパク質データベース、ならびに上記のいずれかの組合せを含むデータベースが含まれる。従って、例えば、選択したデータベースは、全ての既知のスプライスバリアントおよびSNPを含むヒト胚の脳cDNAデータベースであってよい。そのようなデータベースは、ヒト胚の脳で発現する既知のRNAおよび既知のスプライスバリアントに対応するcDNA配列を含むであろう。データベースには、それらの特定のRNA中の全ての既知のSNPおよび既知のスプライスバリアントも含むであろう。当業者ならば、特定の用途に向けて適当なデータベースを選択することができる。
ある実施形態では、各siRNAの各鎖と選択したデータベースと比較して同一配列を同定する。同一配列が、元の選択した標的遺伝子以外の遺伝子中に見出されたならば、siRNAも同様にその第2の遺伝子に対して活性を有するであろう。siRNAのセンス鎖またはアンチセンス鎖と同一の配列を有する第2の遺伝子は、たとえその遺伝子が最初に選択した標的遺伝子ではなかったとしても標的遺伝子と考えられる。ある実施形態では、第1の標的遺伝子の発現と共に、第2の標的遺伝子の発現を減少させることが望ましくない場合、そのsiRNAを潜在的なsiRNAのリストから除去し、またはそうでないとしてもそのsiRNAをそれ以上考慮しない。
ある実施形態では、同一ではないが類似する配列を同定するために、各siRNAの各鎖と選択したデータベースと比較する。ある実施形態では、各siRNAに特定の同一性を有するデータベース中の配列数を定量する。例えば、データベース中の(X−1)/X(例えば18/19、19/20など)同一のヌクレオチドまたは(X−2)/X同一のヌクレオチドを有する配列数などを定量する。ある実施形態では、データベース中に(X−1)/X同一のヌクレオチドを有する配列があるsiRNAを潜在的なsiRNAのリストから除去し、またはそうでないとしてもそれ以上考慮しない。ある実施形態では、データベース中に(X−1)/X同一のヌクレオチドを有する配列があるsiRNAを、それらの配列に対してオフターゲット効果があるかどうか判定するためにそれらの配列に対して試験する。ある実施形態では、オフターゲット効果が見られた場合、それらのsiRNAをリストから除去し、またはそうでないとしてもそれ以上考慮しない。
ある実施形態では、追加の標的値は、選択したデータベース中に見出されたsiRNAと同一配列数を示す。ある実施形態では、追加の標的値はまた、選択したデータベースに見出されたsiRNAに同一ではないが類似する配列数を、各同一性レベルについて別々の数字で、すなわち、siRNAと(X−1)/Xヌクレオチド同一である配列数、siRNAと(X−2)/Xヌクレオチド同一である配列数で示す。ある実施形態では、追加の標的値は、siRNAと同一である最初の標的遺伝子の以外に、選択したデータベース中に追加の配列があるか否かを示す2値指標である。
オフターゲット予測系
ある実施形態では、オフターゲット予測系を使用し、siRNAまたはアンチセンスポリヌクレオチドのオフターゲット活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子を同定することによって、siRNAまたはアンチセンスポリヌクレオチドのオフターゲット活性またはオフターゲットアンチセンス活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子から、予想されるオフターゲット遺伝子または予想されるアンチセンスオフターゲット遺伝子を同定する。ある実施形態では、配列分析系で同定されたsiRNAまたはアンチセンスポリヌクレオチドの全てまたは一部のオフターゲット活性またはオフターゲットアンチセンス活性を定量する。
ある実施形態では、オフターゲット予測系を使用し、siRNAまたはアンチセンスポリヌクレオチドのオフターゲット活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子を同定することによって、siRNAまたはアンチセンスポリヌクレオチドのオフターゲット活性またはオフターゲットアンチセンス活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子から、予想されるオフターゲット遺伝子または予想されるアンチセンスオフターゲット遺伝子を同定する。ある実施形態では、配列分析系で同定されたsiRNAまたはアンチセンスポリヌクレオチドの全てまたは一部のオフターゲット活性またはオフターゲットアンチセンス活性を定量する。
分かりやすくするために、オフターゲット予測系をsiRNAと関連して記載する。同様の方法は、アンチセンスポリヌクレオチドまたは他のいかなるハイブリッド形成化ポリヌクレオチドにも使用することができる。当業者ならば、アンチセンスポリヌクレオチドまたは他のハイブリッド形成化ポリヌクレオチドが関与する用途に記載した方法を適応させることができる。
ある実施形態では、上述したようにデータベースを選択する。従って、例えば特異的組織でsiRNAを使用しようと考える場合、組織特異的データベースを選択してオフターゲット効果を予測することができる。あるいは、例えば、完全な種特異的データベースを使用して、任意のsiRNAについてオフターゲット効果を予想することができる。当業者ならば、siRNAについて意図した使用に従って、オフターゲット効果を分析するために適当なデータベースを選択することができる。
ある実施形態では、先に述べたように、潜在的オフターゲット遺伝子である、同一ではないが類似する配列を同定するために、その配列でデータベースを走査することによって、各siRNAの各鎖と選択したデータベースと比較する。ある実施形態では、各siRNAに特定の同一性を有する潜在的オフターゲット遺伝子を決定する。ある実施形態では、siRNAと(X−1)/X同一のヌクレオチドを有する潜在的オフターゲット遺伝子を同定する。ある実施形態では、siRNAと(X−2)/X同一のヌクレオチドを有する潜在的オフターゲット遺伝子を同定する。
一度潜在的オフターゲット遺伝子を同定したならば、オフターゲット予測系を使用し、各群[すなわち、(X−1)/X同一のヌクレオチドを有する潜在的オフターゲット遺伝子、(X−2)/X同一のヌクレオチドを有するオフターゲット遺伝子など]に属する潜在的オフターゲット遺伝子を分析して予想されるオフターゲット遺伝子を同定する。
ある実施形態では、オフターゲット予測系は、以下の判定基準の一つまたは複数を含む。ある実施形態では、オフターゲット予測系は、平均的に、系で使用する判定基準が多いほど、予想されるオフターゲット遺伝子の同定の正確性が高まる。
オフターゲット加重値判定基準
ある実施形態では、オフターゲット予測系はオフターゲット加重値判定基準を適用する。オフターゲット加重値判定基準は、分析しようとするsiRNAと潜在的オフターゲット遺伝子との間の一個または複数のミスマッチの位置を考慮する。ある実施形態では、オフターゲット加重値判定基準は、siRNAに、または潜在的オフターゲット遺伝子にオフターゲット加重表を当てはめる。
ある実施形態では、オフターゲット予測系はオフターゲット加重値判定基準を適用する。オフターゲット加重値判定基準は、分析しようとするsiRNAと潜在的オフターゲット遺伝子との間の一個または複数のミスマッチの位置を考慮する。ある実施形態では、オフターゲット加重値判定基準は、siRNAに、または潜在的オフターゲット遺伝子にオフターゲット加重表を当てはめる。
ある実施形態では、オフターゲット加重表は以下のように作成することができる。ある実施形態では、オフターゲット遺伝子と比べたsiRNAの様々な位置のミスマッチの全体的効果を決定する。一個または複数の標的遺伝子に対して、各siRNAが標的遺伝子と比べてsiRNAと同一ではないが類似する一連のsiRNAを作製する。標的遺伝子に対する各siRNAのオフターゲット活性レベルは、当技術分野で公知の方法によって決定する。ある実施形態では、各siRNAのオフターゲット活性レベルは、例えばqPCRによって定量した標的RNAの減少率として表される。調整した減少率(または調整した活性レベル)を得るために、減少率を調節することができる。
ある実施形態では、閾値調整した活性レベルに減少値0を割り当て、その閾値を越える全ての調整した活性レベルに正の減少値を割り当て、その閾値未満の全ての調整した活性レベルに負の減少値を割り当てる。例えば、標的RNA中の50%調整した減少(すなわち、50%調整した活性レベル)に減少値0を割り当て、100%調整した減少(すなわち、100%調整した活性レベル)に減少値100を割り当て、0%調整した減少(すなわち、0%調整した活性レベル)に減少値−100を割り当てる。従って、その例では、オフターゲットsiRNAが、完全にマッチしたsiRNAに比べて標的RNAを90%減少させたならば(すなわち90%調整した活性レベル)、オフターゲットsiRNAに減少値80を割り当て、オフターゲットsiRNAが、完全にマッチしたsiRNAに比べて標的RNAを40%減少させたならば(すなわち40%調整した活性レベル)、オフターゲットsiRNAに減少値−20を割り当てる。
ある実施形態では、標的遺伝子と比べたミスマッチ数に従ってミスマッチを有するsiRNAをソートする。ある実施形態では、次いで各siRNAでミスマッチの位置を同定し、各ミスマッチにsiRNAの減少値を割り当てる。次いで、一位置中の全てのミスマッチの減少値を合算し、次いでその位置にミスマッチを有するsiRNA数で割って加重因子を生成する。その結果、その位置のミスマッチによってsiRNAの活性が減少した場合、その位置の加重因子は低または負になる。従って、その位置のミスマッチは、siRNAのオフターゲット活性を減少させると予想される。そのような位置は、順次、保存された領域であると考えられる。あるいは、特定の位置のミスマッチがsiRNAの活性にほとんど影響を及ぼさない場合、その位置の加重因子は大数になる。その位置は、あまり保存されない領域であると予想される。というのは、ミスマッチが活性に対してほとんど影響を及ぼさないからである。
ある実施形態では、オフターゲット加重表は以下のように作成することができる。ある実施形態では、標的遺伝子配列または標的遺伝子配列と同一であるsiRNAを選択する(標的遺伝子配列を選択した場合、その長さは選択するsiRNAと同じである)。選択した標的遺伝子配列または選択したsiRNAで、以下のステップを実施することができるが、便宜上、siRNAを選択したものとしてステップについて記載する。ある実施形態では、siRNAのセンス鎖を使用して選択したデータベースを走査し、同一の標的遺伝子配列、および同一ではないが類似する、オフターゲット遺伝子配列を同定する。ある実施形態では、siRNAが19ヌクレオチドの場合、データベースを走査して、12以上、例えば、14以上、16以上の同一ヌクレオチドを有する配列を同定する。ある実施形態では、siRNAのアンチセンス鎖もデータベースの走査に使用される。ある実施形態では、潜在的オフターゲット遺伝子および追加の標的遺伝子を同定した後、潜在的オフターゲット遺伝子および/または追加のオフターゲット遺伝子の一つまたは複数に対してsiRNAの活性を定量する。様々な実施形態でqPCR、タンパク質の発現の検出(GFPまたはルシフェラーゼなどのマーカータンパク質の検出を含むがそれだけには限らない)、ノーザンブロットを使用するRNAの検出、およびマイクロアレイを使用するRNAまたはcDNAレベルの検出、ならびにbDNAを使用する検出を使用して、オフターゲット活性を定量することができる。ある実施形態では、オフターゲット活性を調整して調整した活性レベルを得る。
ある実施形態では、オフターゲット加重表は、siRNAの各位置のミスマッチの加重因子に加えて、siRNAの各位置のマッチの加重因子を含む。ある実施形態では、その位置にマッチを有する各siRNAの減少値を合算し、次いでその位置にマッチを有するsiRNA数で割って加重因子を生成することは除き、siRNAの各位置のマッチの加重因子をミスマッチの加重因子と同じように算出する。
ある実施形態では、閾値調整した活性レベルに減少値0を割り当て、その閾値を越える全ての調整した活性レベルに正の減少値を割り当て、その閾値未満の全ての調整した活性レベルに負の減少値を割り当てる。例えば、50%調整した活性レベルに減少値0を割り当て、100%調整した活性レベルに減少値100を割り当て、0%調整した活性レベルに減少値−100を割り当てる。従って、その例では、siRNAが、選択した標的遺伝子に対するその活性に比べて、オフターゲット遺伝子に対して90%の活性を有する場合、そのオフターゲット遺伝子に対するそのsiRNAに減少値80を割り当てる。また、そのオフターゲット遺伝子は、そのsiRNAについて減少値80を有すると言うことができる。さらに、siRNAが、選択した標的遺伝子に対するその活性に比べて、第2のオフターゲット遺伝子について40%であった場合、その第2のオフターゲット遺伝子についてそのsiRNAに減少値−20を割り当てる。また、そのsiRNAについて第2のオフターゲット遺伝子の減少値は−20であると言えよう。
ある実施形態では、選択したsiRNAと比べてミスマッチを有するオフターゲット遺伝子をミスマッチ数に従ってソートする。ある実施形態では、次いで、ミスマッチの位置を各オフターゲット遺伝子中で同定し、各ミスマッチにオフターゲット遺伝子の減少値を割り当てる。一位置の全てのミスマッチの減少値を合算し、次いで選択したsiRNAと比べたその位置のミスマッチを有するオフターゲット遺伝子数で割って加重因子を生成する。その結果、その位置のミスマッチが、その位置中にミスマッチを有するオフターゲット遺伝子について選択したsiRNAによって活性が減少した場合、その位置の加重因子は低または負になる。従って、その位置のミスマッチは、siRNAのオフターゲット活性を減少させると予想される。それらの位置は、順次、保存された領域である考えられる。あるいは、特定の位置のミスマッチが、その位置にミスマッチを有するオフターゲット遺伝子について選択したsiRNAの活性に対してほとんど影響を及ぼさない場合、その位置の加重因子は大数になる。その位置は、余り保存されない領域と予想される。ミスマッチが活性に対してほとんど影響を及ぼさないからである。
ある実施形態では、siRNA中のミスマッチは追加物である。従って、位置Aにミスマッチを有するsiRNAが、ミスマッチを有しないsiRNAに比べて活性で20%の減少を示し、位置Bにミスマッチを有するsiRNAが、ミスマッチを有しないsiRNAに比べて活性で10%減少を示した場合、位置AおよびBにミスマッチを有するsiRNAは、ミスマッチを有しないsiRNAに比べて活性で30%減少を示すと推定される。
ある実施形態では、オフターゲット加重値判定基準は、siRNAの一個または複数の位置のミスマッチの加重値に加えて、siRNAの一個または複数の位置のマッチの加重因子を含むオフターゲット加重表を適用する。ある実施形態では、各位置のマッチの加重因子を得るために、以下の方法を使用することができる。オフターゲット遺伝子と同一ではないが類似するsiRNAのコレクションをオフターゲット遺伝子に対する活性について試験する。高活性、中活性、および低活性に従ってsiRNAをグループ分けする。次いで、各位置でマッチするヌクレオチドに従ってsiRNAをグループ分けし、そのマッチするヌクレオチドが高、中、および低オフターゲット活性を有するsiRNAの割合を使用して、その位置のそのヌクレオチドのマッチの加重因子を得る。
ある実施形態では、複数のミスマッチの組合せについても同様に加重因子が得られる。
オフターゲット加重値判定基準は、選択したsiRNAによるデータベースの走査によって同定した潜在的オフターゲット遺伝子のそれぞれに、オフターゲット加重表を当てはめる。オフターゲット加重表は、その位置が選択したsiRNAと比べてマッチしまたはミスマッチするかどうかに従って、潜在的オフターゲット遺伝子の各位置に、マッチおよびミスマッチオフターゲット加重因子を割り当てる。ある実施形態では、オフターゲット加重値判定基準は、オフターゲット加重因子を合計して、各潜在的オフターゲット遺伝子のオフターゲット加重値を得る。
ある実施形態では、次いでオフターゲット加重値に従って潜在的オフターゲット遺伝子をソートする。ある実施形態では、オフターゲット加重値が高いことは、その潜在的オフターゲット遺伝子に対して選択したsiRNAの活性が高いと予想されることを示す。選択したsiRNAがそれに対してより高い活性を有すると予想される潜在的オフターゲット遺伝子は、予想されるオフターゲット遺伝子と称される。ある実施形態では、ある閾値を越えるオフターゲット加重値を有する潜在的オフターゲット遺伝子を予想されるオフターゲット遺伝子と考える。
ある実施形態では、ミスマッチ位置を使用してオフターゲット活性を予測する。ある実施形態では、潜在的オフターゲット遺伝子の第1のセグメントの一つまたは複数の位置にミスマッチを有する19merのsiRNAは、他の場所に同数のミスマッチを有する他のオフターゲット遺伝子と比較して、その潜在的オフターゲット遺伝子に対してオフターゲット活性が低いと予想される。
ある実施形態では、追加のsiRNAまたはアンチセンスポリヌクレオチドの実験の結果を考慮するために、配列分析系および/またはオフターゲット予測系を変化させることができる。従って、追加のデータが増えるにつれ、判定基準の各型を調節することができる。同様に、siRNAまたはアンチセンスポリヌクレオチドの活性およびオフターゲット活性の追加のデータが増えるにつれ、加重表を調節することができる。従って、より多くのデータを使用して加重表を編集し判定基準を調整するに従い、配列分析系およびオフターゲット予測系を経時的に改善することができる。ある実施形態では、より多くのデータを収容するために判定基準を調整するに従い、配列分析系およびオフターゲット予測系はより正確なものとなる。
ある実施形態では、配列分析系およびオフターゲット予測系を使用して、17、18、19、20、21、22、23、24、25、26、27、28、29、または30塩基対を有するsiRNAを選択することができる。長さxのsiRNAと共通して少なくともz個のヌクレオチドを有する(zはxに等しいかx以下)長さyの各siRNAと共に、長さxのsiRNA(xはyより短い)を選択する、配列分析系を使用し、長さyのsiRNAを選択する代表的方法は以下の通りである。上述したように、特定の標的遺伝子遺伝子に対して中もしくは高活性を有する可能性が高い長さxのsiRNAを選択するために、配列分析系を使用することができる。長さxの各siRNAについては、長さxのsiRNAと同様に少なくともz個のヌクレオチドを有する長さyの潜在的なsiRNAを全て同定する。次いで、長さyの各siRNAから作製することができる各21merのオフターゲット効果を決定する。次いで、長さyの各siRNAから作製することができる21merの全てオフターゲット効果を平均化し、最低平均オフターゲット効果を有する長さyのsiRNAを選択する。
例えば、以下のように、長さ19のsiRNAを選択する配列分析系を使用し、かつ長さ19のsiRNAと同様に、長さ27の各siRNAが19のヌクレオチド全てを含むという要件で、長さ27のsiRNAを選択することができる。まず、上述したように、配列分析系を使用して、特定の標的遺伝子に対して中もしくは高活性を有する可能性が高い19merのsiRNAを選択する。選択した各19merについては、その19merの全19のヌクレオチドを含むあらゆる潜在的27merを決定する。従って、各19merについては、以下の配列(大文字で示す)と以下の周囲配列(小文字に示す)を有する19merについて例示するように9個の潜在的27merがある。
agctagcacacagACTCCCCCCGAGAGGTCTTtttccggcatgcc(配列番号6)
その19merと同様に19個のヌクレオチドを含む全ての潜在的な27merは次のものである。
その19merと同様に19個のヌクレオチドを含む全ての潜在的な27merは次のものである。
1. gcacacagACTCCCCCCGAGAGGTCTT (配列番号7)
2. cacacagACTCCCCCCGAGAGGTCTTt (配列番号8)
3. acacagACTCCCCCCGAGAGGTCTTtt (配列番号9)
4. cacagACTCCCCCCGAGAGGTCTTttt (配列番号10)
5. acagACTCCCCCCGAGAGGTCTTtttc (配列番号11)
6. cagACTCCCCCCGAGAGGTCTTtttcc (配列番号12)
7. agACTCCCCCCGAGAGGTCTTtttccg (配列番号13)
8. gACTCCCCCCGAGAGGTCTTtttccgg (配列番号14)
9. ACTCCCCCCGAGAGGTCTTtttccggc (配列番号15)
次いで、各27merについては、その27merに含まれている全ての潜在的な19merを同定する。例えば、上記27mer番号1について以下の19merを同定する。
2. cacacagACTCCCCCCGAGAGGTCTTt (配列番号8)
3. acacagACTCCCCCCGAGAGGTCTTtt (配列番号9)
4. cacagACTCCCCCCGAGAGGTCTTttt (配列番号10)
5. acagACTCCCCCCGAGAGGTCTTtttc (配列番号11)
6. cagACTCCCCCCGAGAGGTCTTtttcc (配列番号12)
7. agACTCCCCCCGAGAGGTCTTtttccg (配列番号13)
8. gACTCCCCCCGAGAGGTCTTtttccgg (配列番号14)
9. ACTCCCCCCGAGAGGTCTTtttccggc (配列番号15)
次いで、各27merについては、その27merに含まれている全ての潜在的な19merを同定する。例えば、上記27mer番号1について以下の19merを同定する。
1A. gcacacagACTCCCCCCGA(配列番号16)
1B. cacacagACTCCCCCCGAG(配列番号17)
1C. acacagACTCCCCCCGAGA(配列番号18)
1D. cacagACTCCCCCCGAGAG(配列番号19)
1E. acagACTCCCCCCGAGAGG(配列番号20)
1F. cagACTCCCCCCGAGAGGT(配列番号21)
1G. agACTCCCCCCGAGAGGTC(配列番号22)
1H. gACTCCCCCCGAGAGGTCT(配列番号23)
1I. ACTCCCCCCGAGAGGTCTT(配列番号24)
次いで、オフターゲット予測系を使用して、それらの19merのそれぞれの予想されるオフターゲット効果を決定する。例えば、19merの1Aについては、19merの1Aのどちらかの鎖と19/19同一であるヌクレオチド、18/19同一であるヌクレオチド、17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有するオフターゲット遺伝子数を決定する。次いで、19/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、1.0によって増幅する。次いで、18/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.9によって増幅する。次いで、17/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.8によって増幅する。次いで、16/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.6によって増幅する。19mer 1Aの予想されるオフターゲット効果は、適当なオフターゲット増幅係数によって増幅した各同一性レベルを有するオフターゲット遺伝子数の合計である。従って、例えば、19merの1Aが19/19同一であるヌクレオチドを有するオフターゲット遺伝子を1個、18/19同一であるヌクレオチドを有するオフターゲット遺伝子を3個、17/19同一であるヌクレオチドを有するオフターゲット遺伝子を5個、および16/19同一であるヌクレオチドを有するオフターゲット遺伝子を27個を有する場合、予想されるオフターゲット効果は[(1×1.0)+(3×0.9)+(5×0.8)+(27×0.6)]であり、23.9である。
1B. cacacagACTCCCCCCGAG(配列番号17)
1C. acacagACTCCCCCCGAGA(配列番号18)
1D. cacagACTCCCCCCGAGAG(配列番号19)
1E. acagACTCCCCCCGAGAGG(配列番号20)
1F. cagACTCCCCCCGAGAGGT(配列番号21)
1G. agACTCCCCCCGAGAGGTC(配列番号22)
1H. gACTCCCCCCGAGAGGTCT(配列番号23)
1I. ACTCCCCCCGAGAGGTCTT(配列番号24)
次いで、オフターゲット予測系を使用して、それらの19merのそれぞれの予想されるオフターゲット効果を決定する。例えば、19merの1Aについては、19merの1Aのどちらかの鎖と19/19同一であるヌクレオチド、18/19同一であるヌクレオチド、17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有するオフターゲット遺伝子数を決定する。次いで、19/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、1.0によって増幅する。次いで、18/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.9によって増幅する。次いで、17/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.8によって増幅する。次いで、16/19同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、0.6によって増幅する。19mer 1Aの予想されるオフターゲット効果は、適当なオフターゲット増幅係数によって増幅した各同一性レベルを有するオフターゲット遺伝子数の合計である。従って、例えば、19merの1Aが19/19同一であるヌクレオチドを有するオフターゲット遺伝子を1個、18/19同一であるヌクレオチドを有するオフターゲット遺伝子を3個、17/19同一であるヌクレオチドを有するオフターゲット遺伝子を5個、および16/19同一であるヌクレオチドを有するオフターゲット遺伝子を27個を有する場合、予想されるオフターゲット効果は[(1×1.0)+(3×0.9)+(5×0.8)+(27×0.6)]であり、23.9である。
当業者ならば、オフターゲット遺伝子と19merとの間の同一性レベルのそれぞれについて適当な増幅係数を選択することができる。ある実施形態では、予想されるオフターゲット効果を計算する場合、特定の19merについて同定した各オフターゲット遺伝子のオフターゲット加重値を考慮する。限定しない例として、オフターゲット増幅係数に対して特定の割合の同一性を有するオフターゲット遺伝子数を増幅するのではなく、オフターゲット加重値を考慮する場合、選択した19merに対してその割合同一性を有するオフターゲット遺伝子の全てのオフターゲット加重値の合計をオフターゲット増幅係数によって増幅させることができる。
単一27merに対応する19merの全てにわたって予想されるオフターゲット効果を平均化して、その27merの平均予想オフターゲット効果を得る。各27mer用に、全19merを同定する過程およびその予想されるオフターゲット効果を決定する過程を次いで反復する。その結果、各27merに平均の予想されるオフターゲット効果を割り当てる。ある実施形態では、最低の平均の予想されるオフターゲット効果を有する27merを選択する。
ある実施形態では、長さ19のsiRNAを同定する配列分析系を使用して、27merを選択する場合、1、2、3、4、5、または6ヌクレオチドのバッファーが、19merコアの一端または両端に必要になるかもしれない。従って、限定しない例として、上述した例では、2個のヌクレオチドバッファーが19merコアの各末端に必要な場合、選択した19merを含む潜在的27merが5個あるはずである。それらの5個は、上記27mer番号3〜7である。さらに限定しない例として、2個のヌクレオチドバッファーが5’末端に必要であり、3個のヌクレオチドバッファーが3’末端に必要な場合、選択した19merを含む4個の潜在的27merがあると思われる。それらの4個は、上記27mer番号4〜7である。
前記の例は、決して本発明を制限しないものとする。任意の長さのsiRNAを選択する配列分析系を使用して、27を含むが、それだけには限らない任意の長さのsiRNAを同じように選択することができる。さらに、上述したように、配列分析系によって同定したsiRNAと、その一つのsiRNAの周囲で同定した異なるサイズのsiRNAとの間に共通する任意の数のヌクレオチドを必要とする系を設計することができる。加えて、当初のsiRNAコア配列の一端または両端のバッファーとして、任意の数のヌクレオチドを必要とする系を設計することもできる。
一般的に、本発明の実施形態は、一つまたは複数のコンピューターシステムによって保存され、または移送するデータを含む様々な工程を利用する。本発明の実施形態は、これらの操作を実行する装置にも関する。この装置は、必要な目的に向けて特別に構築することができ、あるいは装置はコンピュータープログラムおよび/またはコンピューターに保存されたデータ構造によって選択的に作動し、または再形成される汎用コンピューターであってよい。本明細書で示した方法は、本質的には、任意の特定のコンピューターまたは他の装置に関するものではない。特に、様々な汎用機で本明細書の教示に従って書かれたプログラムを使用することができ、あるいは汎用機は、必要な方法ステップを実行させるためより特化させた装置を構築するのにさらに好都合でありうる。様々なこれらの機器の特定の構造は、以下に示す記述から明らかである。
さらに、本発明の実施形態は、コンピューターが実行する様々な操作を実施するためのプログラム命令および/またはデータ(データ構造を含む)を含む、コンピューター読取り可能な媒体またはコンピュータープログラム製品に関する。コンピューター読取り可能な媒体の例には、それだけには限らないが、ハードディスク、フロッピーディスク、および磁気テープなどの磁気媒体;CD−ROMディスクなどの光学媒体、磁気光学媒体;読取専用メモリーデバイス(ROM)およびランダムアクセスメモリー(ラム)など、特別にプログラム命令を保存するように構成され実施される半導体メモリーデバイスおよびハードウェアデバイスが含まれる。本発明のデータおよびプログラム命令は、搬送波または他の輸送媒体に具体化することもできる。プログラム命令の例には、両マシンコード、例えばコンパイラによって生成されるコード、およびインタープリターを使用するコンピューターによって実行されるより高度なコードを含むファイルが含まれる。
特定の過程および装置に従って本発明を上に概略的に記載したが、本発明は非常に広範な適用性を有する。特に、本発明の態様は、任意の特定の種類の細胞過程に限定されず、事実、任意の細胞過程に適用することができ、その際、細胞に及ぼす治療効果への理解が望まれる。従って、いくつかの実施形態では、本発明の技術によって、多くの異なる種類または群の細胞、物質、細胞過程、および作用機序、ならびにあらゆる種類の遺伝子過程についての情報が提供されるであろう。当技術分野の通常の技術者ならば、前述の考察を考慮して他の変形形態、修正、および代替法を認識されよう。
さて、本発明について十分記載しているので、本発明の精神および範囲から逸脱することなく、かつ過度の実験をするなしに、等価物および条件の範囲内で本発明を実施できることは当業者よって理解されよう。さらに、本発明は、特定の実施形態および実施例を考慮して記載されているが、さらに修正を加えることも可能であると本発明者らは考えている。本願は、上記一般原理にかなう本発明のいかなる変形形態、使用、または適応も包含するものとする。
明細書は文献についての記述を含み、それらの参照文献は具体的に参照により本明細書に組み込まれる。添えて出願された添付物も、あらゆる目的において明白に参照により本明細書に組み込まれる。
本細書および実施例は、以下に記載の特許請求の範囲の単に詳細な代表例にすぎない。
Claims (51)
- 長さxのsiRNAを選択する方法であって、
標的遺伝子を選択するステップ、
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するステップ、
前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ
を含む方法。 - 少なくとも一個の長さxの潜在的siRNAの前記配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項1に記載の方法。
- 前記配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項2に記載の方法。
- 長さxのsiRNAに対して予想されるオフターゲット遺伝子を同定する方法であって、
長さxのsiRNAを選択するステップ、
データベースを選択するステップ、
前記長さxのsiRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、前記長さxのsiRNAで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するステップ、および
予想されるオフターゲット遺伝子を同定するステップ
を含む方法。 - 長さxのsiRNAを選択する方法であって、
標的遺伝子を選択するステップ、
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するステップ、
データベースを選択するステップ、
少なくとも一個の長さxの潜在的siRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さxの潜在的siRNAで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第2の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するステップ、および
少なくとも一個の長さxの潜在的siRNAに対して予想されるオフターゲット遺伝子を同定するステップ、
前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ
を含む方法。 - 少なくとも一個の長さxの潜在的siRNAについての第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項5に記載の方法。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項6に記載の方法。
- 長さxのsiRNA用に加重表を作成する方法であって、
少なくとも1個の標的遺伝子に対して、少なくとも2個の長さxのsiRNAを作製するステップ、
前記少なくとも1個の標的遺伝子に対して、前記少なくとも2個の長さxのsiRNAのそれぞれの活性レベルを決定するステップ、
閾値活性レベルを選択するステップ、
前記閾値活性レベルに減少値0を割り当てるステップ、
前記閾値活性レベルより高い各々の異なる活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる活性レベルに、異なる負の減少値を割り当てるステップ、
その活性レベルに従って長さxの各siRNAに減少値を割り当てるステップ、
第1の位置にアデニン(A)を有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のアデニン(A)の加重因子の算出ステップ、
第1の位置のアデニン(A)の加重因子の加重表への挿入ステップ、
第1の位置のシトシン(C)、グアニン(G)、およびウリジン(U)について、前記算出ステップおよび前記挿入ステップを反復するステップ、
少なくとも第2の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するステップ
を含み、それによって長さxのsiRNA用に加重表を作成する方法。 - 前記少なくとも2個の長さxのsiRNAが、少なくとも100個の長さxのsiRNAである、請求項8に記載の方法。
- 前記少なくとも2個の長さxのsiRNAが、少なくとも200個の長さxのsiRNAである、請求項8に記載の方法。
- 前記少なくとも2個の長さxのsiRNAが、少なくとも500個の長さxのsiRNAである、請求項8に記載の方法。
- 前記少なくとも2個の長さxのsiRNAが、少なくとも1000個の長さxのsiRNAである、請求項8に記載の方法。
- 長さxのsiRNA用にオフターゲット加重表を作成する方法であって、
各siRNAがオフターゲット遺伝子と比べて少なくとも1個のミスマッチを含むものであって、少なくとも1個のオフターゲット遺伝子に対して少なくとも2個の長さxのsiRNAを作製するステップ、
少なくとも1個のオフターゲット遺伝子に対して、前記少なくとも2個の長さxのsiRNAのそれぞれの調整活性レベルを決定するステップ、
閾値調整した活性レベルを選択するステップ、
前記閾値調整活性レベルに減少値0を割り当てるステップ、
前記閾値活性レベルより高い各々の異なる調整活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる調整活性レベルに、異なる負の減少値を割り当てるステップ、
その調整した活性レベルに従って、長さxの各siRNAに減少値を割り当てるステップ、
第1の位置中にミスマッチを有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のミスマッチのオフターゲット加重因子の算出ステップ、
第1の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップ、
少なくとも第2の位置について前記算出ステップおよび前記挿入ステップを反復するステップ
を含み、それによって長さxのsiRNA用にオフターゲット加重表を作成する方法。 - 少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、および
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード
を含むコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAの前記配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項14に記載のコンピュータープログラム製品。
- 前記配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項15に記載のコンピュータープログラム製品。
- 長さxのsiRNAに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
前記長さxのsiRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さxのsiRNAでデータベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析、および少なくとも一個の長さxの潜在的siRNAに対する一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード、
少なくとも一個の長さxの潜在的siRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さxの潜在的siRNAで前記データベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第2の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項18に記載のコンピュータープログラム製品。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項19に記載のコンピュータープログラム製品。
- 第2の配列分析が、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項19に記載のコンピュータープログラム製品。
- 長さxのsiRNA用に加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、
その活性レベルに従って長さxのsiRNAに減少値を割り当てるためのコード、
第1の位置にアデニン(A)を有する長さxの各siRNAの減少値を平均化するステップを含む、第1のアデニン(A)の加重因子の算出ステップのためのコード、
第1の位置のアデニン(A)の加重因子の加重表への挿入ステップのためのコード、
第1の位置のシトシン(C)、グアニン(G)、およびウリジン(U)について、前記算出ステップおよび前記挿入ステップを反復するためのコード、
少なくとも第2の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコード
を含み、それによって長さxのsiRNA用に加重表を作成するコンピュータープログラム製品。 - 長さxのsiRNA用にオフターゲット加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード
選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、
その調整した活性レベルに従って、長さxの各siRNAに減少値を割り当てるためのコード、
第1の位置中にミスマッチを有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、
第1の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、
少なくとも第2の位置について前記算出ステップおよび前記挿入ステップを反復するためのコード
を含み、それによって長さxのsiRNA用にオフターゲット加重表を作成するコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、および
配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAの配列分析を実施するためのコード
を含むコンピューター装置。 - 少なくとも一個の長さxの潜在的siRNAの前記配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項24に記載のコンピューター装置。
- 前記配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項24に記載のコンピューター装置。
- 長さxのsiRNAに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
前記長さxのsiRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さxのsiRNAでデータベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピューター装置。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析、および少なくとも一個の長さxの潜在的siRNAに対する一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード、
少なくとも一個の長さxの潜在的siRNAと、x/x同一であるヌクレオチドまたは(x−1)/x同一であるヌクレオチドまたは(x−2)/x同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さxの潜在的siRNAで前記データベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第2の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含む、コンピューター装置。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項28に記載のコンピューター装置。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項29に記載のコンピューター装置。
- 第2の配列分析が、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項28に記載のコンピューター装置。
- 長さxのsiRNA用に加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、
その活性レベルに従って長さxのsiRNAに減少値を割り当てるためのコード、
第1の位置にアデニン(A)を有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のアデニン(A)の加重因子の算出ステップのためのコード、
第1の位置のアデニン(A)の加重因子の加重表への挿入ステップのためのコード、
第1の位置のシトシン(C)、グアニン(G)、およびウリジン(U)について、前記算出ステップおよび前記挿入ステップを反復するためのコード、
少なくとも第2の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコード
を含み、それによって長さxのsiRNA用に加重表を作成するコンピューター装置。 - 長さxのsiRNA用にオフターゲット加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、
その調整した活性レベルに従って、長さxの各siRNAに減少値を割り当てるためのコード、
第1の位置中にミスマッチを有する長さxの各siRNAの減少値を平均化するステップを含む、第1の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、
第1の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、
少なくとも第2の位置について前記算出ステップおよび前記挿入ステップを反復するためのコード
を含み、それによって長さxのsiRNA用にオフターゲット加重表を作成するコンピューター装置。 - 長さyのsiRNAを選択する方法であって、
標的遺伝子を選択するステップ、
xはyより短い値であって、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するステップ、
前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するステップ、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するステップ、
データベースを選択するステップ、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するステップ、
第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するステップ、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するステップ、
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するステップ、
前記少なくとも1個の長さyの潜在的siRNAから長さyのsiRNAを選択するステップ
を含む方法。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項34に記載の方法。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項35に記載の方法。
- プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
xはyより短い値であり、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、
配列分析が、少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む、少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析を実施するためのコード、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するためのコード、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAでデータベースを走査するためのコード、
第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項37に記載のコンピュータープログラム製品。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項38に記載のコンピュータープログラム製品。
- プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
xはyより短い値であり、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ21のsiRNAを同定するためのコード、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAでデータベースを走査するためのコード、
第1の増幅係数によって19/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピューター装置。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項40に記載のコンピューター装置。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項41に記載のコンピューター装置。
- 長さyのsiRNAを選択する方法であって、
標的遺伝子を選択するステップ、
xはyより短い値であり、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するステップ、
前記少なくとも一個の長さxの潜在的siRNAから長さxのsiRNAを選択するステップ、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するステップ、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するステップ、
データベースを選択するステップ、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するステップであって、該一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップ、
第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するステップ、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するステップ、
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するステップ、
前記少なくとも1個の長さyの潜在的siRNAから長さyのsiRNAを選択するステップ
を含む方法。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項43に記載の方法。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項44に記載の方法。
- プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
xがyより短い値であり、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ19のsiRNAを同定するためのコード、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するためのコード、
前記一個または複数の潜在的オフターゲット遺伝子について行う第2の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、
第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピュータープログラム製品。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項46に記載のコンピュータープログラム製品。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項47に記載のコンピュータープログラム製品。
- プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
xはyより短い値であり、少なくとも一個の長さxの潜在的siRNAを同定するために、ウインドウサイズxでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さxの潜在的siRNAに加重値を割り当てるステップを含む第1の配列分析を、少なくとも一個の長さxの潜在的siRNAについて実施するためのコード、
前記長さxのsiRNAを含む少なくとも1個の長さyの潜在的siRNAを同定するためのコード、
前記少なくとも1個の長さyの潜在的siRNAの少なくとも1個の中に含まれている、少なくとも1個の長さ21のsiRNAを同定するためのコード、
少なくとも1個の長さ19のsiRNAと、19/19同一であるヌクレオチド、または18/19同一であるヌクレオチド、または17/19同一であるヌクレオチド、または16/19同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも1個の長さ19のsiRNAで前記データベースを走査するためのコード、
前記一個または複数の潜在的オフターゲット遺伝子について行う第1の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、
第1の増幅係数によって19/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第2の増幅係数によって18/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第3の増幅係数によって17/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第4の増幅係数によって16/19同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、
前記少なくとも1個の長さ19のsiRNAのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも1個の長さyの潜在的siRNAのそれぞれの中に含まれている、前記少なくとも1個の長さ19のsiRNAの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも1個の長さyの潜在的siRNAのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピューター装置。 - 少なくとも一個の長さxの潜在的siRNAについて行う第1の配列分析が、さらに、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項49に記載のコンピューター装置。
- 第1の配列分析が、さらに、加重値、G/C値、末端領域エネルギー値、末端領域A/U値、末端比エネルギー値、エネルギープロフィール値、融解温度値、G/Cストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さxの潜在的siRNAをソートするステップを含む、請求項50に記載のコンピューター装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63283104P | 2004-12-02 | 2004-12-02 | |
US64719305P | 2005-01-25 | 2005-01-25 | |
PCT/US2005/043266 WO2006060454A2 (en) | 2004-12-02 | 2005-11-29 | Methods of designing small interfering rnas, antisense polynucleotides, and other hybridizing polynucleotides |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008521909A true JP2008521909A (ja) | 2008-06-26 |
Family
ID=36565675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007544454A Pending JP2008521909A (ja) | 2004-12-02 | 2005-11-29 | 短鎖干渉rna、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドの設計方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060160110A1 (ja) |
JP (1) | JP2008521909A (ja) |
WO (1) | WO2006060454A2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007007317A1 (en) | 2005-07-07 | 2007-01-18 | Yissum Research Development Company Of The Hebrew University Of Jerusalem | Nucleic acid agents for downregulating h19, and methods of using same |
US8093369B2 (en) | 2005-10-11 | 2012-01-10 | Ben Gurion University Of The Negev Research And Development Authority Ltd. | Compositions for silencing the expression of VDAC1 and uses thereof |
EP2083272B1 (en) | 2006-09-19 | 2014-09-17 | Accural INC. | Cancer cell identification marker and cancer cell proliferation inhibitor |
CA2667971C (en) | 2006-11-01 | 2017-04-18 | Gary Weisinger | Adipocyte-specific constructs and methods for inhibiting platelet-type 12 lipoxygenase expression |
US20130012709A1 (en) | 2009-09-10 | 2013-01-10 | Centre National De La Recherche Scientifique | NOVEL INHIBITORS OF STEAROYL-CoA-DESATURASE-1 AND THEIR USES |
WO2011127136A1 (en) * | 2010-04-06 | 2011-10-13 | University Of Chicago | Composition and methods related to modification of 5-hydroxymethylcytosine (5-hmc) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9720148D0 (en) * | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
US6506559B1 (en) * | 1997-12-23 | 2003-01-14 | Carnegie Institute Of Washington | Genetic inhibition by double-stranded RNA |
US6222093B1 (en) * | 1998-12-28 | 2001-04-24 | Rosetta Inpharmatics, Inc. | Methods for determining therapeutic index from gene expression profiles |
WO2001075164A2 (en) * | 2000-03-30 | 2001-10-11 | Whitehead Institute For Biomedical Research | Rna sequence-specific mediators of rna interference |
TR200401292T3 (tr) * | 2000-12-01 | 2004-07-21 | Max@Planck@Gesellschaft�Zur�F�Rderung�Der�Wissenschaften | RNAÁgirişimineÁyolÁaçanÁküçükÁRNAÁmolekülleri |
AU2003234336A1 (en) * | 2002-05-03 | 2003-11-17 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and compositions for use in preparing sirnas |
AU2003260370B2 (en) * | 2002-08-05 | 2008-05-22 | Silence Therapeutics Gmbh | Further novel forms of interfering RNA molecules |
WO2004027030A2 (en) * | 2002-09-18 | 2004-04-01 | Isis Pharmaceuticals, Inc. | Efficient reduction of target rna’s by single- and double-stranded oligomeric compounds |
US20040192629A1 (en) * | 2002-11-04 | 2004-09-30 | University Of Massachusetts | Allele-specific RNA interference |
-
2005
- 2005-11-29 JP JP2007544454A patent/JP2008521909A/ja active Pending
- 2005-11-29 WO PCT/US2005/043266 patent/WO2006060454A2/en active Application Filing
- 2005-11-29 US US11/290,628 patent/US20060160110A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20060160110A1 (en) | 2006-07-20 |
WO2006060454A3 (en) | 2007-07-05 |
WO2006060454A2 (en) | 2006-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tafer et al. | RNAplex: a fast tool for RNA–RNA interaction search | |
Kampmann et al. | Next-generation libraries for robust RNA interference-based genome-wide screens | |
Kretschmer‐Kazemi Far et al. | The activity of siRNA in mammalian cells is related to structural target accessibility: a comparison with antisense oligonucleotides | |
Bernardo et al. | A microRNA guide for clinicians and basic scientists: background and experimental techniques | |
JP2007512808A5 (ja) | ||
Ivashchenko et al. | Prediction of miRNA binding sites in mRNA | |
JP2008521909A (ja) | 短鎖干渉rna、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドの設計方法 | |
Kircher et al. | Structural conservation versus functional divergence of maternally expressed microRNAs in the Dlk1/Gtl2 imprinting region | |
US8367320B2 (en) | Apoptosis inducing positive control for expression modulation experiments | |
Gong et al. | Integrated siRNA design based on surveying of features associated with high RNAi effectiveness | |
Watanabe et al. | Computational analysis of microRNA targets in Caenorhabditis elegans | |
Kretschmer-Kazemi Far et al. | Concepts to automate the theoretical design of effective antisense oligonucleotides | |
Jerome et al. | In vitro evolution of ribonucleases from expanded genetic alphabets | |
Vickers et al. | Targeting of repeated sequences unique to a gene results in significant increases in antisense oligonucleotide potency | |
Ulbricht et al. | One hundred million adenosine‐to‐inosine RNA editing sites: Hearing through the noise | |
Mainieri et al. | Retrotransposon gag-like 1 (RTL1) and the molecular evolution of self-targeting imprinted microRNAs | |
Song et al. | Predicting miRNA-mediated gene silencing mode based on miRNA-target duplex features | |
US8014956B2 (en) | MicroRNA precursors | |
Zhang et al. | Distribution bias of the sequence matching between exons and introns in exon joint and EJC binding region in C. elegans | |
US20150252365A1 (en) | Method for screening micrornas with gene silencing function at both levels of transcription and post-transcription | |
Bergauer et al. | Analysis of putative miRNA binding sites and mRNA 3′ ends as targets for siRNA-mediated gene knockdown | |
Gray et al. | Antisense DNA parameters derived from next-nearest-neighbor analysis of experimental data | |
Swarup | How to design a highly effective siRNA | |
CN101892236B (zh) | 靶向znf268基因的rna干扰表达载体构建及应用 | |
Varghese et al. | MicroRNA binding site scoring model |