JP2008521909A

JP2008521909A - 短鎖干渉ｒｎａ、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドの設計方法

Info

Publication number: JP2008521909A
Application number: JP2007544454A
Authority: JP
Inventors: ミズタニ，タカ; テラサキ，カズ
Original assignee: ビー−ブリッジインターナショナル，インコーポレーテッド
Priority date: 2004-12-02
Filing date: 2005-11-29
Publication date: 2008-06-26
Also published as: US20060160110A1; WO2006060454A3; WO2006060454A2

Abstract

本発明は、ｓｉＲＮＡ、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを選択するための方法、装置、およびコンピュータープログラム製品に関する。特に、本発明は、中または低オフターゲット活性を有する、ｓｉＲＮＡ、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを選択するための方法に関する。

Description

本発明は、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドを設計するための方法、装置、およびコンピュータープログラム製品に関する。本発明はまた、ｓｉＲＮＡ、アンチセンスポリヌクレオチド、および他のハイブリッド形成化ポリヌクレオチドのオフターゲット効果を決定する方法にも関する。

本出願は、２００５年１月２５日出願の米国仮出願第６０／６４７，１９３号および２００４年１２月２日出願の米国仮出願第６０／６３２，８３１号の利益を請求する。あらゆる目的のために、米国仮出願第６０／６４７，１９３号および米国仮出願第６０／６３２，８３１号はを参照によりその全体を本明細書に組み込む。

ＲＮＡ干渉は、様々な生物で観察される転写後過程であり、その干渉によって二本鎖ＲＮＡ分子は、配列特異的に遺伝子サイレンシングを媒介する。ＲＮＡ干渉は、一般的に約１９〜２２ヌクレオチド長である短鎖干渉ＲＮＡ（ｓｉＲＮＡ）を使用し実施することができる。ｓｉＲＮＡはとても短いので、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲット活性を有しうる。その結果、意図しない遺伝子がｓｉＲＮＡによってサイレンスされうる。

アンチセンスポリヌクレオチド使用して、転写前後に遺伝子の発現を抑制することできる。しかし、アンチセンスポリヌクレオチドは、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲット活性を有する可能性がある。その結果、意図しない遺伝子が、アンチセンスポリヌクレオチドによって抑制されうる。
Lambertonら, Molecular Biotechnology, 24: 111-119 (2003) Biotechnology (N Y). 1992 Apr;10(4):413-7 Biotechnology (N Y). 1993 Sep;11(9):1026-30 Methods. 2001 Dec;25(4):402-8 Gene. 1990 Sep 1;93(1):125-8 Cell. 2003 Oct 17;115(2):209-16（誤植：Cell. 2003 Nov 14;115(4):505） Cell. 2003 Oct 17;115(2):199-208 Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7 Nat Biotechnol. 2004 Mar;22(3):326-30

同じように、ｓｉＲＮＡおよびアンチセンスポリヌクレオチドと同様に、特定の配列とハイブリッドを形成するように設計したポリヌクレオチドも、細胞中で他の同一、または同一ではないが類似する配列に対してオフターゲットのハイブリッド形成化活性を有しうる。その結果、ハイブリッド形成化ポリヌクレオチドは、意図しない配列とハイブリッド形成する可能性がある。

ある実施形態では、長さｘのｓｉＲＮＡを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するステップ、および前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの前記配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、長さｘのｓｉＲＮＡに対して予想されるオフターゲット遺伝子を同定する方法を提供する。ある実施形態では、その方法は、長さｘのｓｉＲＮＡを選択するステップ、データベースを選択するステップ、前記長さｘのｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、前記長さｘのｓｉＲＮＡで前記データベースを走査するステップ、配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するステップ、および予想されるオフターゲット遺伝子を同定するステップを含む。

ある実施形態では、長さｘのｓｉＲＮＡを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するステップ、データベースを選択するステップ、少なくとも一個の長さｘの潜在的ｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さｘの潜在的ｓｉＲＮＡで前記データベースを走査するステップ、配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するステップ、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対して予想されるオフターゲット遺伝子を同定するステップ、および前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、長さｘのｓｉＲＮＡ用に加重表を作成する方法を提供する。ある実施形態では、その方法は、少なくとも１個の標的遺伝子に対して、少なくとも２個の長さｘのｓｉＲＮＡを作製するステップ、前記少なくとも１個の標的遺伝子に対して、前記少なくとも２個の長さｘのｓｉＲＮＡのそれぞれの活性レベルを決定するステップ、閾値活性レベルを選択するステップ、前記閾値活性レベルに減少値０を割り当てるステップ、前記閾値活性レベルより高い各々の異なる活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる活性レベルに、異なる負の減少値を割り当てるステップ、その活性レベルに従って長さｘの各ｓｉＲＮＡに減少値を割り当てるステップ、第１の位置にアデニン（Ａ）を有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のアデニン（Ａ）の加重因子の算出ステップ、第１の位置のアデニン（Ａ）の加重因子の加重表への挿入ステップ、第１の位置のシトシン（Ｃ）、グアニン（Ｇ）、およびウリジン（Ｕ）について、前記算出ステップおよび前記挿入ステップの反復ステップ、少なくとも第２の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するステップを含み、それによって長さｘのｓｉＲＮＡ用に加重表を作成する。ある実施形態では、少なくとも２つの長さｘのｓｉＲＮＡは、少なくとも１００、少なくとも２００、少なくとも５００、または少なくとも１０００の長さｘのｓｉＲＮＡである。

ある実施形態では、長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成する方法を提供する。ある実施形態では、その方法は、各ｓｉＲＮＡが、オフターゲット遺伝子と比べて少なくとも１個のミスマッチを含む、少なくとも１個のオフターゲット遺伝子に対して少なくとも２個の長さｘのｓｉＲＮＡを作製するステップ、少なくとも１個のオフターゲット遺伝子に対して調整した、前記少なくとも２個の長さｘのｓｉＲＮＡのそれぞれの活性レベルを決定するステップ閾値調整した活性レベルを選択するステップ、前記閾値調整した活性レベルに減少値０を割り当てるステップ、前記閾値活性レベルより高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるステップ、その調整した活性レベルに従って、長さｘの各ｓｉＲＮＡに減少値を割り当てるステップ、第１の位置中にミスマッチを有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のミスマッチのオフターゲット加重因子の算出ステップ、第１の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップ、少なくとも第２の位置について前記算出ステップおよび前記挿入ステップを反復するステップを含み、それによって長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成する。

ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、および配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの前記配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、コンピュータープログラム製品は、長さｘのｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さｘのｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、前記長さｘのｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さｘのｓｉＲＮＡでデータベースを走査するためのコード、および配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのコードを含む。

ある実施形態では、コンピュータープログラム製品は、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析、および少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析、および少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、少なくとも一個の長さｘの潜在的ｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さｘの潜在的ｓｉＲＮＡで前記データベースを走査するためのコード、および配列分析が、前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む、前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。ある実施形態では、第２の配列分析は、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、コンピュータープログラム製品は、長さｘのｓｉＲＮＡ用に、加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さｘのｓｉＲＮＡ用に加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、その活性レベルに従って長さｘのｓｉＲＮＡに減少値を割り当てるためのコード、第１の位置にアデニン（Ａ）を有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１のアデニン（Ａ）の加重因子の算出ステップのためのコード、第１の位置のアデニン（Ａ）の加重因子の加重表への挿入ステップのためのコード、第１の位置のシトシン（Ｃ）、グアニン（Ｇ）、およびウリジン（Ｕ）について、前記算出ステップおよび前記挿入ステップを反復するためのコード、少なくとも第２の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコードを含み、それによって長さｘのｓｉＲＮＡ用に加重表を作成する。

ある実施形態では、コンピュータープログラム製品は、長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備する。ある実施形態では、長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置。ある実施形態では、その命令は、選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード、選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、その調整した活性レベルに従って、長さｘの各ｓｉＲＮＡに減少値を割り当てるためのコード、第１の位置中にミスマッチを有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、第１の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、少なくとも第２の位置について前記算出ステップおよび前記挿入ステップを反復するためのコードを含み、それによって長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成する。

ある実施形態では、長さｙのｓｉＲＮＡを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するステップ前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するステップ、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するステップ、データベースを選択するステップ、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するステップ、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するステップ、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するステップ、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するステップ、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡから長さｙのｓｉＲＮＡを選択するステップを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、その命令は、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するためのコード、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡでデータベースを走査するためのコード、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置を提供する。ある実施形態では、その命令は、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ２１のｓｉＲＮＡを同定するためのコード、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡでデータベースを走査するためのコード、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、長さｙのｓｉＲＮＡを選択する方法を提供する。ある実施形態では、その方法は、標的遺伝子を選択するステップ、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するステップ前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するステップ、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するステップ、データベースを選択するステップ、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するステップ、前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するステップであって、該一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップ、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するステップ、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するステップ、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するステップ、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡから長さｙのｓｉＲＮＡを選択するステップを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品を提供する。ある実施形態では、その命令は、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するためのコード、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するためのコード、前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

ある実施形態では、プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置を提供する。ある実施形態では、その命令は、ｘがｙより短い、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ２１のｓｉＲＮＡを同定するためのコード、少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するためのコード、前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコードを含む。ある実施形態では、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析は、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む。ある実施形態では、第１の配列分析は、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む。

本発明は、特定の方法、装置、またはシステムだけには限定されず、それらは当然様々なものであってよいことは理解されよう。さらに、本明細書で使用される用語は、単に特定の実施形態について記載することを目的とし、限定的な意図はないことも理解されるものとする。

本明細書および添付の特許請求の範囲で使用される単数形「a」、「an」、および「the」は、その内容が別段に明記されない限り複数の指示対象を含む。

特に明記しない限り、本明細書で使用される全ての技術的および科学的用語は、本発明が属する技術分野の通常の技術者が一般的に理解するものと同じ意味を有する。本明細書に記載したものと同様または同等の方法および物質も、本発明の試験を実施する際に使用することができる。本発明の記載および請求において、以下に述べた定義に従って以下の用語を使用する。

本明細書で使用する「ｓｉＲＮＡ」は、各鎖に１２〜１００のクレオチドを含む二本鎖ＲＮＡ分子をさす。「ｓｉＲＮＡ」という用語は、２つの別々のＲＮＡ分子を含む二本鎖ＲＮＡ、および１つのＲＮＡ分子を含む二本鎖ＲＮＡを含む。

ある実施形態では、ｓｉＲＮＡの一端または両端は平滑末端であり、すなわちオーバーハングを持たない。ある実施形態では、ｓｉＲＮＡは、一つまたは複数のオーバーハングを含む。本明細書で使用するオーバーハングとは、塩基対を形成していない、すなわち一本鎖の一つまたは複数の末端ヌクレオチドを含む配列である。オーバーハングは、５’オーバーハングまたは３’オーバーハングでありうる。５’オーバーハングは、塩基対を形成していない５’末端ヌクレオチド配列である。３’オーバーハングは、塩基対を形成していない３’末端ヌクレオチド配列である。ある実施形態では、ｓｉＲＮＡは１個の５’オーバーハングを含む。ある実施形態では、ｓｉＲＮＡは、２個の５’オーバーハングを含む。ある実施形態では、ｓｉＲＮＡは１個の３’オーバーハングを含む。ある実施形態では、ｓｉＲＮＡは２個の３’オーバーハングを含む。ある実施形態では、ｓｉＲＮＡは、１個の５’オーバーハングと１個の３’オーバーハングを含む。ある実施形態では、オーバーハングは、１、２、３、４、または５個のヌクレオチドを含む。ある実施形態では、オーバーハングは５個を超えるヌクレオチドを含む。

ｓｉＲＮＡは二本の鎖を含む。各ｓｉＲＮＡは、一本のセンス鎖と一本のアンチセンス鎖を含む。本明細書で使用するｓｉＲＮＡのセンス鎖は、オーバーハングの一部であるヌクレオチドを含まない。本明細書で使用するｓｉＲＮＡのアンチセンス鎖は、オーバーハングの一部であるヌクレオチドを含まない。ある実施形態では、ｓｉＲＮＡの一鎖は、センス鎖とセンス鎖末端に任意のオーバーハングも含む。ある実施形態では、ｓｉＲＮＡの一鎖は、アンチセンス鎖とアンチセンス鎖末端に任意のオーバーハングも含む。

時にヘアピンｓｉＲＮＡと称される単一ＲＮＡ分子を含むｓｉＲＮＡでは、反対鎖のヌクレオチドと塩基対を形成する鎖のヌクレオチド数によって、センス鎖またはアンチセンス鎖のヌクレオチド数を決定する。鎖の全ての塩基が必ずしも塩基対を形成している必要はなく、バルジ、オーバーハング、またはミスマッチが生じることがあることも理解されよう。従って、ヘアピンｓｉＲＮＡの一鎖のヌクレオチド数には、そのヘアピンｓｉＲＮＡの一本鎖リンカー部分のヌクレオチドは含まれない。その結果、本明細書で使用するように、ヘアピンｓｉＲＮＡの二本鎖のヌクレオチドの合計は、そのヘアピンｓｉＲＮＡを形成する単一ＲＮＡ分子のヌクレオチドの総数と等しいか、それより少ない可能性がある（なぜなら、１本鎖ＲＮＡ分子は、一本鎖リンカー部分の一部である一個または複数のヌクレオチドを含みうるからである）。ある実施形態では、ヘアピンｓｉＲＮＡの一鎖は、ヘアピンｓｉＲＮＡのセンス鎖と、ヘアピンｓｉＲＮＡのループではないセンス鎖末端のいかなるオーバーハングも含む。ある実施形態では、ヘアピンｓｉＲＮＡの一鎖は、ヘアピンｓｉＲＮＡのアンチセンス鎖と、ヘアピンｓｉＲＮＡのループではないアンチセンス鎖末端のいかなるオーバーハングも含む。従って、ある実施形態では、ヘアピンｓｉＲＮＡのループ中のヌクレオチドは、ヘアピンｓｉＲＮＡのどちらの鎖長にも含めない。

ある実施形態では、ｓｉＲＮＡの一鎖は１５〜１５０のヌクレオチドを含む。ある実施形態では、ｓｉＲＮＡの一鎖は、１５〜１０００のヌクレオチドを含む。ある実施形態では、ｓｉＲＮＡの一鎖は、１５〜５０のヌクレオチドを含む。ある実施形態では、ｓｉＲＮＡの一鎖は、１５〜３０のヌクレオチドを含む。ある実施形態では、ｓｉＲＮＡの一鎖は、１７〜３０のヌクレオチドを含む。ある実施形態では、ｓｉＲＮＡの一鎖は、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、または３０のヌクレオチドを含む。ｓｉＲＮＡの二本の鎖は、同数のヌクレオチドを含みうるし、または異なる数のヌクレオチドを含みうる。ある実施形態では、ｓｉＲＮＡの一鎖は、ｓｉＲＮＡの他方の鎖よりもヌクレオチドを１、２、３、４、または５個多く含む。

本明細書で使用する「ハイブリッド形成化ポリヌクレオチド」は、選択した標的遺伝子の少なくとも一部に相補的な配列を有する、デオキシリボヌクレオチド、リボヌクレオチド、または両方から構成される一本鎖分子をさす。ある実施形態では、ハイブリッド形成化ポリヌクレオチドは、１０、２０、３０、４０、５０、７５、１００、１５０、２００、３００、または５００ヌクレオチド長である。「ハイブリッド形成化ポリヌクレオチド」は、「アンチセンスポリヌクレオチド」を含み、これはアンチセンス標的遺伝子を抑制することができるハイブリッド形成化ポリヌクレオチドである。

ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドは、当技術分野で公知の任意の方法によって生成することができる。そのような方法には、それだけには限らないが、化学合成、細胞中で発現プラスミドからｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを発現させる方法、およびin vitroでＤＮＡ分子からｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを転写させる方法が含まれる。ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドは、それだけには限らないが、ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチド、あるいはｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドをコードする発現ベクターの形質移入；ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを発現するウイルスによる感染；ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを発現するＤＮＡ配列の細胞ゲノム中への組込み；ならびにｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドあるいはｓｉＲＮＡ、アンチセンスポリヌクレオチド、またはハイブリッド形成化ポリヌクレオチドをコードする発現ベクターの微量注射を含む、当技術分野で公知の任意の方法によって細胞に導入することができ。形質移入方法には、それだけには限らないが、塩化セシウム形質移入、リポフェクション、電気穿孔法、および細胞膜の透過性を高める他の方法が含まれる。当業者は、細胞にｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを導入するのに適当な方法を選択することができる。当業者は、細胞中でｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドを発現させるのに適当な発現ベクターまたはウイルスベクターもそのような発現を望むなら選択することができる。

ある実施形態では、一つのｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチド中のヌクレオチドの全てはリボヌクレオチドである。ある実施形態では、一つのｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドは、一個または複数のデオキシヌクレオチドを含む。ある実施形態では、一つのｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドはデオキシヌクレオチドのみを含む。ある実施形態では、ｓｉＲＮＡのセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、ｓｉＲＮＡのアンチセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、センス鎖の一個または複数のヌクレオチド、およびｓｉＲＮＡのアンチセンス鎖の一個または複数のヌクレオチドはデオキシヌクレオチドである。ある実施形態では、ｓｉＲＮＡはＤＮＡ：ＲＮＡハイブリッドでありうる。例えば、Lambertonら, Molecular Biotechnology, 24: 111-119 (2003)を参照のこと。ある実施形態では、ｓｉＲＮＡのオーバーハングは、一個または複数のデオキシヌクレオチドを含みうる。ある実施形態では、ｓｉＲＮＡのオーバーハングは、一個または複数の自然に存在しないヌクレオチドを含みうる。代表的な自然に存在しないヌクレオチドには、それだけには限らないが、ペプチド核酸（ＰＮＡ）を形成するヌクレオチド、架橋した核酸（ＢＮＡ）を形成するヌクレオチド、およびロックされた核酸（ＬＮＡ）を形成するヌクレオチドが含まれる。

ある実施形態では、ｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドは、一個または複数のリボヌクレオチド誘導体を含みうる。使用が可能なリボヌクレオチド誘導体には、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドの活性に実質的に干渉しないあらゆる誘導体が含まれる。誘導体の活性が、自然発生のリボヌクレオチドだけから構成されたｓｉＲＮＡまたはアンチセンスポリヌクレオチドの活性の少なくとも８０％である場合、その誘導体は、アンチセンスポリヌクレオチド活性のｓｉＲＮＡに「実質的に干渉」しない。そのような誘導体には、それだけには限らないが、一定の条件下でＲＮＡ分子を安定化させる誘導体、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドの活性を増大させる誘導体、およびｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドをより経済的に生成できるようにする誘導体が含まれる。ある種の代表的な誘導体には、それだけには限らないが、以下の一種または複数を有するｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドが含まれる：２’−アミノ−ブチリル−ピレン−ウリジン、２’−アミノ−シチジン、２’−アミノ−ウリジン、２’−デオキシ−ウリジン、２’−フルオロ−シチジン、２’−フルオロ−ウリジン、２，６−ジアミノプリン、２’−アミノ−シチジン、２−アミノプリン、４−チオ−ウリジン、５−アミノ−アリル−ウリジン、５−ブロモ−ウリジン、５−フルオロ−シチジン、５−フルオロ−ウリジン、５−ヨード−ウリジン、５−メチル−シチジン、５−アミノ−アリル−ウリジン、デオキシ−脱塩基、イノシン、ＭＮ、Ｎ３−メチル−ウリジン、プソイドウリジン、プリンリボヌクレオシド、リバビリン、リボ−チミジン、５’−アミノ−Ｃ１２（１２炭素リンカー）、５’−アミノ−Ｃ３（３−炭素リンカー）、５’−アミノ（５−原子リンカー）、５’−アミノ−Ｃ６（６−炭素リンカー）、５’−ビオチン、５’−Ｃｙ３、５’−Ｃｙ５、５’−ダブシル、５’−フルオレセイン、５’−リン酸エステル、５’−光切断ビオチン、５’−テトラクロロ−フルオレセイン、５’−チオール、３’−アミノ調節物質、３’−逆向き脱塩基、３’−逆向きデオキシチミジン、３’−ピューロマイシン、デオキシ−グアノシン、ジデオキシ−シチジン、３’ビオチン、３’−Ｃｙ３、３’−Ｃｙ５、３’−フルオレセイン、３’−ＬＣビオチン、３’−ＬＣＬＣビオチン、３’−ＴＡＭＲＡ、５’−ＰＥＧ−４０Ｋ、５’−ピレン、３’−コレステロール、ＤＮＰ、および／または５’−ＴＡＭＲＡ−ヘキシルリンカー。ある種の代表的誘導体には、それだけには限らないが、一鎖または両鎖に第１のｒＮ（ｒＡ，ｒＵ，ｒＧ，ｒＣ）を有するｓｉＲＮＡ、一鎖または両鎖に後続のｒＮを有するｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチド、ならびに一鎖または両鎖にｒＷ（ｒＡ，ｒＵ）および／またはｒＳ（ｒＣ，ｒＧ）を有するｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドが含まれる。ある種の代表的誘導体には、それだけには限らないが、一個または複数のホスホロチオエート連鎖、１８原子スペーサー（例えば、ヘキサエチレングリコール）、３−炭素リンカー、および／または９原子スペーサーを含むｓｉＲＮＡまたはハイブリッド形成化ポリヌクレオチドも含まれる。

本明細書で使用する「標的遺伝子」は、ｓｉＲＮＡのセンス鎖またはアンチセンス鎖と同一である配列を含むＲＮＡコード配列をさす。「標的遺伝子」は、その標的遺伝子によってコードされているＲＮＡもさす。「標的遺伝子」はさらに、ｓｉＲＮＡのセンス鎖またはアンチセンス鎖と同一である配列を含むＲＮＡもさし、その際、そのＲＮＡはＤＮＡ分子からコードされていない。従って、「標的遺伝子」には、レトロウイルスＲＮＡ配列、および例えばＤＮＡ分子から転写されていない他のＲＮＡ配列が含まれる。本明細書で使用する「標的ＲＮＡ」は、ＲＮＡコード配列から転写できまたは転写できないＲＮＡであるが、ｓｉＲＮＡのセンス鎖またはアンチセンス鎖と同じ配列を含むＲＮＡをさす。従って、「標的ＲＮＡ」は「標的遺伝子」のサブセットである。標的ＲＮＡには、レトロウイルスＲＮＡ配列、およびＤＮＡ分子から転写されていない他のＲＮＡ配列が含まれる。「標的ＲＮＡ」は、ＲＮＡをコードするＤＮＡ配列から転写されたｍＲＮＡも含む。ある実施形態では、標的ＲＮＡは、分解がｓｉＲＮＡによって媒介され、結果として標的ＲＮＡのレベルを減少させる分子である。ある実施形態では、標的ＲＮＡは、標的ＲＮＡの分解以外の任意の機序によって、発現がｓｉＲＮＡによって抑制される分子である。ある実施形態では、標的遺伝子はｓｉＲＮＡによって直接抑制されうる。

ある実施形態では、「アンチセンス標的遺伝子」は、アンチセンスポリヌクレオチド配列に相補的な配列を含むＤＮＡ配列またはＲＮＡ配列をさす。ある実施形態では、アンチセンスポリヌクレオチドは、ＲＮＡをコードするアンチセンス標的遺伝子からＲＮＡが転写されるのを減少させる。ある実施形態では、アンチセンスポリヌクレオチドは、タンパク質をコードするアンチセンス標的ＲＮＡからタンパク質が発現されるのを減少させる。

本明細書で使用するｓｉＲＮＡの「活性」または「活性レベル」は、細胞中で標的ＲＮＡのレベルを減少させるｓｉＲＮＡの能力をさす。本明細書で使用する「高活性」は、定量的ＰＣＲ（ｑＰＣＲ）アッセイによる定量で、標的ＲＮＡを８０％以上減少させることをさす。本明細書で使用する「中活性」は、ｑＰＣＲによる定量で標的ＲＮＡを５０％〜８０％減少させることをさす。本明細書で使用する「低活性」は、ｑＰＣＲによる定量で標的ＲＮＡを５０％未満で減少させることをさす。ｑＰＣＲについては、例えば、Biotechnology (N Y). 1992 Apr;10(4):413-7、Biotechnology (N Y). 1993 Sep;11(9):1026-30、Methods. 2001 Dec;25(4):402-8、およびGene. 1990 Sep 1;93(1):125-8に記載されている。ｓｉＲＮＡ活性の他の定量方法は、当技術分野で公知であり、それだけには限らないが、タンパク質の発現の検出（それだけには限らないが、ＧＦＰまたはルシフェラーゼなどのマーカータンパク質の検出を含む）、ノーザンブロットを使用するＲＮＡの検出、およびマイクロアレイを使用するＲＮＡもしくはｃＤＮＡレベルの検出、ｂＤＮＡを使用する検出、分子ビーコンを使用する検出、ならびに蛍光オリゴプローブを使用する検出が含まれる。

本明細書で使用するアンチセンスポリヌクレオチドの「アンチセンス活性」または「活性レベル」は、細胞中でアンチセンス標的遺伝子から転写されるＲＮＡレベルを減少させ、または細胞中でアンチセンス標的ＲＮＡから発現するタンパク質レベルを減少させる、アンチセンスポリヌクレオチドの能力をさす。ＲＮＡレベルを定量する方法は、上述するように当技術分野で公知である。タンパク質レベルを定量する方法も当技術分野で公知であり、例えば、ウェスタンブロッティング、ＨＰＬＣ、薄層クロマトグラフィー、ニンヒドリンおよび他の染色技術、ブラッドフォードアッセイなどが含まれる。

本明細書で使用する「潜在的オフターゲット遺伝子」は、ｓｉＲＮＡのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を、その遺伝子のコード鎖上およびその遺伝子の転写された領域中に含む遺伝子をさす。ある実施形態では、潜在的オフターゲット遺伝子配列は、ｓｉＲＮＡのセンス鎖またはアンチセンス鎖と比較して１、２、３または４個のミスマッチを含む。本明細書で使用する「潜在的オフターゲットＲＮＡ」は、潜在的オフターゲット遺伝子から転写され、そしてｓｉＲＮＡのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を含むｍＲＮＡをさす。

本明細書で使用する「潜在的アンチセンスオフターゲット遺伝子」は、その相補鎖がアンチセンスポリヌクレオチドに同一ではないが類似する配列を含むＤＮＡまたはＲＮＡをさす。ある実施形態では、潜在的アンチセンスオフターゲット遺伝子の相補鎖は、アンチセンスポリヌクレオチドと比べて１％、２％、５％、１０％、１５％、２０％、２５％、３０％、４０％、または５０％のミスマッチを含む。

本明細書で使用する「同一ではないが類似する配列」は、参照配列に少なくとも８０％同一である配列をさす。ある実施形態では、配列が、参照配列に少なくとも８５％、または少なくとも９０％、または少なくとも９５％同一である場合、その配列は参照配列に「同一ではないが類似する」。ある実施形態では、配列が参照配列に少なくとも５０％、または少なくとも６０％、または少なくとも７５％同一である場合、その配列は参照配列に「同一ではないが類似する」。ある実施形態では、参照配列が１９ヌクレオチド長であるならば、配列が１１／１９、１２／１９、１３／１９、１４／１９、１５／１９、１６／１９、１７／１９、または１８／１９同一であるヌクレオチドを有する場合、配列はその参照配列に同一ではないが類似する。ある実施形態では、参照配列が１９ヌクレオチド長であるならば、配列が１１／１９、１２／１９、１３／１９、１４／１９、または１５／１９同一であるヌクレオチドを有する場合、配列はその参照配列に同一ではないが類似する。

本明細書で使用する「予想されるオフターゲット遺伝子」は、潜在的オフターゲット遺伝子のサブセットをさす。予想されるオフターゲット遺伝子は、任意の数の選択した因子に基づき、特定のｓｉＲＮＡがその遺伝子に対してオフターゲット活性を有すると予想される遺伝子のことである。本明細書で使用する「潜在的オフターゲットＲＮＡ」は、潜在的オフターゲット遺伝子から転写され、そしてｓｉＲＮＡのセンス鎖またはアンチセンス鎖に同一ではないが類似する配列を含むｍＲＮＡをさす。従って、ｓｉＲＮＡは、平均して、予想されるオフターゲットＲＮＡではない潜在的オフターゲットＲＮＡに対するよりも、予想されるオフターゲットＲＮＡに対して高いオフターゲット活性を有すると予想される。

本明細書で使用する「予想されるアンチセンスオフターゲット遺伝子」は、潜在的アンチセンスオフターゲット遺伝子のサブセットをさす。予想されるアンチセンスオフターゲット遺伝子は、任意の数の選択した因子に基づき、その遺伝子に対して特定のアンチセンスポリヌクレオチドが、オフターゲットアンチセンス活性を有すると予想されるＲＮＡまたはＤＮＡ遺伝子である。従って、アンチセンスポリヌクレオチドは、平均して、予想されるアンチセンスオフターゲット遺伝子ではない潜在的アンチセンスオフターゲット遺伝子に対するよりも、予想されるアンチセンスオフターゲット遺伝子に対して高いオフターゲットアンチセンス活性を有すると予想される。

本明細書で使用するｓｉＲＮＡの「オフターゲット活性」は、細胞中で潜在的または予想されるオフターゲットＲＮＡレベルを減少させるｓｉＲＮＡの能力をさす。本明細書で使用する「高オフターゲット活性」は、定量的ＰＣＲ（ｑＰＣＲ）アッセイによる定量で、一つまたは複数のオフターゲットＲＮＡが８０％以上減少することをさす。本明細書で使用する「中オフターゲット活性」は、ｑＰＣＲによる定量で、一つまたは複数のオフターゲットＲＮＡが３５％〜８０％減少することをさす。本明細書で使用する「低オフターゲット活性」は、ｑＰＣＲによる定量で、一つまたは複数のオフターゲットＲＮＡが３５％未満減少することをさす。

本明細書で使用する、アンチセンスポリヌクレオチドの「オフターゲットアンチセンス活性」は、細胞中で潜在的または予想されるアンチセンスオフターゲット遺伝子のレベルを減少させるアンチセンスポリヌクレオチドの能力をさす。

本明細書で使用する、ｓｉＲＮＡの「活性鎖」は、標的ＲＮＡまたはオフターゲットＲＮＡと同一、または同一ではないが類似する配列を有するｓｉＲＮＡ鎖をさす。ある実施形態では、ｓｉＲＮＡの一鎖は第１の標的遺伝子に対して活性であり、ｓｉＲＮＡの他方の鎖は第２の標的遺伝子（または第１の標的遺伝子の第２の領域）に対して活性でありうる。従って、ｓｉＲＮＡの一鎖は、第１の標的遺伝子に関して活性鎖であり、他方の鎖は、第２の標的遺伝子に関して活性鎖でありうる。

本発明は、一個または複数の標的遺伝子に対して活性を有するアンチセンスポリヌクレオチドを含む、ｓｉＲＮＡおよびハイブリッド形成化ポリヌクレオチドを設計する方法を提供する。ある実施形態では、その方法は、標的遺伝子またはアンチセンス標的遺伝子に対して活性を有すると予想されるｓｉＲＮＡまたはアンチセンスポリヌクレオチドを一個または複数選択するステップ、次いでその一個または複数の選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドの、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子に対するオフターゲット活性またはアンチセンスオフターゲット活性を予測するステップを含む。

ある実施形態では、一個または複数の標的遺伝子またはアンチセンス標的遺伝子に対して活性を有すると予想される、一個または複数のｓｉＲＮＡまたはアンチセンスポリヌクレオチドを選択するために、因子、例えば、ｓｉＲＮＡまたはアンチセンスポリヌクレオチド中のＧおよびＣの割合、各位置の特異的なヌクレオチド、ｓｉＲＮＡ鎖またはアンチセンスポリヌクレオチドの３’および５’末端領域間の自由エネルギー差、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドの３’および５’末端領域のＡおよびＵヌクレオチド数、ｓｉＲＮＡ鎖またはアンチセンスポリヌクレオチドの３’および５’末端の比エネルギー、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドにかかる自由エネルギー平衡、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドの融解温度、ならびにｓｉＲＮＡまたはアンチセンスポリヌクレオチド中のヌクレオチドの組合せを考慮する。ある実施形態では、所望の用途に向けて任意ハイブリッド形成化ポリヌクレオチドを選択するために同様に考慮することができる。

ある実施形態では、選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドのオフターゲット活性またはオフターゲットアンチセンス活性は、選択したｓｉＲＮＡのセンスおよび／またはアンチセンス鎖で、あるいはアンチセンスポリヌクレオチドでデータベースを走査して、選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドに同一ではないが類似する配列を同定することによって予想する。ある実施形態では、予想されるオフターゲット遺伝子または予想されるアンチセンスオフターゲット遺伝子を同定するために、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子と、選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドとの間のミスマッチの数および位置を考慮する。

配列分析系
ある場合には、無作為に選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドは、標的配列に対して変数レベルの活性を有する。従って、ある無作為に選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドは、標的配列に対して低活性を有し、ある無作為に選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドは、標的配列に対して中活性を有し、ある無作為に選択したｓｉＲＮＡまたはアンチセンスポリヌクレオチドは標的配列に対して高活性を有しうる。

分かりやすくするために、ｓｉＲＮＡの選択と関連して配列分析系を記載する。同様の方法を使用して、アンチセンスポリヌクレオチドまたは他のいかなるハイブリッド形成化ポリヌクレオチドも選択することができる。当業者ならば、アンチセンスポリヌクレオチドまたは他のハイブリッド形成化ポリヌクレオチドが関与する用途に、記載した方法を適応させることができる。

ある実施形態では、特定の標的遺伝子に対して中もしくは高活性を有する可能性が高いｓｉＲＮＡを選択するために配列分析系を使用する。ある実施形態では、特定の標的遺伝子に対して高活性を有する可能性が高いｓｉＲＮＡを選択するために配列分析系を使用する。配列分析系は、所望のレベルの活性を有する可能性が高いｓｉＲＮＡを選択するために、各ｓｉＲＮＡに適用する判定基準のコレクションを含む。判定基準のコレクション中のある判定基準によって、ｓｉＲＮＡまたはオフターゲット遺伝子に割り当てる「値」を生成する。判定基準のコレクション中のある判定基準によって、ｓｉＲＮＡまたはオフターゲット遺伝子の一個または複数のヌクレオチドに割り当てる「値」を生成する。いずれの場合にも値は数字でなくてもよい。ある実施形態では、値は状態の２値指標、すなわち、何かの有無であってよい。配列分析系には、本明細書に述べる判定基準の幾つかまたは全てを含めてよく、さらに使用者が選択した別の判定基準を含めてよい。ある実施形態では、配列分析系の判定基準および閾値を修正することによって、当業者は所望の閾値活性レベルを有するｓｉＲＮＡを一個または複数選択することができる。

ある実施形態では、配列分析系を使用するため所望の標的遺伝子を選択する。所望の標的遺伝子は、ＲＮＡコード配列の一部またはＲＮＡの一部であってよい。ある実施形態では、選択した標的遺伝子の中から、同一、または同一ではないが類似し、あるいは同一領域を有する、標的遺伝子領域を選択するによって、１つを超える標的遺伝子に対して活性を有するｓｉＲＮＡを選択することができる。当業者ならば、例えば、配列を整列させるステップ、および配列の中から、同一、または同一ではないが類似し、あるいは同一領域を有する、領域を見出すステップによって、そのような標的遺伝子領域を選択することができる。次いで、その領域の一つまたは複数を配列分析系で使用することができる（分かりやすくするために、たとえその領域がコード配列の一部を表し、かつ／または複数のコード配列を表していても、配列分析系で使用する領域を「標的遺伝子」と呼ぶ）。領域に選択した標的遺伝子間の差が含まれていても、標的配列がそのような差を含むｓｉＲＮＡは、潜在的ｓｉＲＮＡのプールから排除することができる。

ある実施形態では、一度標的遺伝子を選択すれば、サイズ固定ウインドウでその標的遺伝子を走査して、標的配列に対してサイズ固定された潜在的なｓｉＲＮＡを一個または複数同定する。ある実施形態では、サイズ固定ウインドウで標的遺伝子を走査して、標的配列に対してサイズ固定された潜在的なｓｉＲＮＡを全て同定する。例えば、以下の配列には
５’ ＣＧＣＣＣＴＣＴＡＣＧＡＡＣＴＣＣＡＧＴＴＡ３’［配列番号１］
１９ヌクレオチドにサイズ固定された全ての潜在的なｓｉＲＮＡを以下に示す。

５’ ＣＧＣＣＣＵＣＵＡＣＧＡＡＣＵＣＣＡＧ３’［配列番号２］
５’ ＧＣＣＣＵＣＵＡＣＧＡＡＣＵＣＣＡＧＵ３’［配列番号３］
５’ ＣＣＣＵＣＵＡＣＧＡＡＣＵＣＣＡＧＵＵ３’［配列番号４］
５’ ＣＣＵＣＵＡＣＧＡＡＣＵＣＣＡＧＵＵＡ３’［配列番号５］
従って、ある実施形態では、長さＮのヌクレオチドの標的遺伝子およびＸのヌクレオチドにサイズ固定されたウインドウの場合、その標的遺伝子には固定サイズＸの（Ｎ−Ｘ＋１）個の潜在的なｓｉＲＮＡがある。その計算によって、各ｓｉＲＮＡは第一鎖と完全に塩基対を形成する第２の鎖を有し、どちらの鎖にも非塩基対のオーバーハングはないと仮定される。もちろん、当業者であれば、第２鎖を改変して様々な長さのオーバーハングを作成し、標的遺伝子に対して潜在的ｓｉＲＮＡの合計数を増大させることができるであろう。ある実施形態では、ウインドウは１５〜１５０ヌクレオチドに固定される。ある実施形態では、ウインドウは１５〜１００ヌクレオチドに固定される。ある実施形態では、ウインドウは１５〜５０ヌクレオチドに固定される。ある実施形態では、ウインドウは１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、３９、または５０ヌクレオチドに固定される。

ある実施形態では、配列分析系は以下の判定基準の一つまたは複数を含む。ある実施形態では、ｓｉＲＮＡを選択するための判定基準を多く使用するほど、配列分析系によって選択されるｓｉＲＮＡの活性は平均して高くなる。

Ｇ／Ｃ判定基準
ある実施形態では、配列分析系はＧ／Ｃ判定基準を適用する。Ｇ／Ｃ判定基準によって潜在的なｓｉＲＮＡのＧ／Ｃ塩基対含有量を考慮し、Ｇ／Ｃ値を生成する。ある実施形態では、Ｇ／Ｃ値は割合として表される。ある実施形態では、Ｇ／Ｃ塩基対含有量を考慮するために、Ｇ／Ｃ判定基準によってｓｉＲＮＡの全塩基対に対するＧ／Ｃ塩基対割合を計算する。従って、ある実施形態では、ｓｉＲＮＡのＧ／Ｃ塩基対含有量を計算する場合、非塩基対ヌクレオチドは考慮されない。例えば、先に述べた４つの潜在的ｓｉＲＮＡで、ｓｉＲＮＡのどれも非塩基対ヌクレオチドを含まない場合、配列番号２〜５のＧ／Ｃ含有量は、それぞれ、６３．２％、５７．９％、５２．６％、および４７．４％である。

ある実施形態では、Ｇ／Ｃ含有量が３０％〜６５％のｓｉＲＮＡがＧ／Ｃ判定基準にとって好都合がよい。ある実施形態では、Ｇ／Ｃ含有量が３５％〜６０％のｓｉＲＮＡがＧ／Ｃ判定基準にとって好都合がよい。ある実施形態では、Ｇ／Ｃ含有量が４０％〜５５％のｓｉＲＮＡがＧ／Ｃ判定基準にとって好都合がよい。ある実施形態では、Ｇ／Ｃ含有量が選択した範囲から外れるｓｉＲＮＡはそれ以上考慮されない。ある実施形態では、Ｇ／Ｃ含有量が選択した範囲から外れるｓｉＲＮＡも、依然として潜在的なｓｉＲＮＡのリストに含めるが、Ｇ／Ｃ判定基準を満たすｓｉＲＮＡをグループ分けし、またはそうでないにせよ順序付け、または同定して（例えば、各ｓｉＲＮＡのＧ／Ｃ塩基対割合の指標を含めることによる）、それらをＧ／Ｃ判定基準を満たさないｓｉＲＮＡと区別する。

加重値判定基準
ある実施形態では、配列分析系は加重値判定基準を適用する。加重値判定基準は、ｓｉＲＮＡの各位置の特定のヌクレオチドの同一性を考慮し、加重値を生成する。ある実施形態では、加重値判定基準は各ｓｉＲＮＡに加重表を当てはめる。加重表は、各位置の各潜在的ヌクレオチドに加重因子を割り当てる。従って、ｓｉＲＮＡに加重表を当てはめた後、どのヌクレオチドがその位置にあるかに応じて、ｓｉＲＮＡの各位置に特定の加重因子を当てはめる。ある実施形態では、配列分析系は、特定のｓｉＲＮＡについての加重因子の全てを足してそのｓｉＲＮＡの加重値を得る。

ある実施形態では、加重表の作成方法は以下の通りである。一個または複数の標的遺伝子に対して、等しい長さの一連のｓｉＲＮＡを作製する。その標的遺伝子に対して各ｓｉＲＮＡの活性レベルを定量する。ある実施形態では、活性レベルは、ｑＰＣＲによる定量されるように標的ＲＮＡの減少率として計算される。ある実施形態では、閾値活性レベルに減少値０が割り当てられ、その閾値を越える全活性レベルに正の減少値を割り当て、その閾値未満の全活性レベルに負の減少値を割り当てる。

ある実施形態では、ｓｉＲＮＡ中の各ヌクレオチドにｓｉＲＮＡ減少値を割り当てる（従って、各ヌクレオチドに同じ減少値が割り当てられる）。ｓｉＲＮＡの様々な位置のヌクレオチドの一つまたは複数について、減少値に基づく加重因子を算出する。ある実施形態では、ｓｉＲＮＡの様々な位置の４種のヌクレオチドのそれぞれについて加重因子を計算する。ある実施形態では、ｓｉＲＮＡの位置のそれぞれの４種のヌクレオチドについて加重因子を計算する。ある実施形態では、加重因子は減少値の可変性の統計的手段である。ある実施形態では、加重因子は、例えば、平均（average）、平均（mean）、または他の統計手段であってよい。

ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも５０のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも１００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも１５０のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも３００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも５００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも７５０のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも１０００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも２０００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、一個または複数の標的遺伝子に対して、少なくとも５０００のｓｉＲＮＡから得たデータを使用し加重表を編集する。ある実施形態では、追加のｓｉＲＮＡの活性を試験し、その新規なデータを加重表計算に加えて加重表を正確なものにする。

ある実施形態では、加重値判定基準によって各ｓｉＲＮＡに加重表を当てはめて、ｓｉＲＮＡの各位置に加重因子を割り当てる。ある実施形態では、次いで、加重値判定基準により加重因子を合計して各ｓｉＲＮＡの全加重値を得る。次いで、全加重値に従ってｓｉＲＮＡを順序付けることができる。ある実施形態では、全加重値がある閾値未満のｓｉＲＮＡを考察から排除する。

末端領域エネルギー判定基準
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用する。末端領域エネルギー判定基準は、ｓｉＲＮＡの５’領域と３’領域の間の自由エネルギー差を考慮する。末端領域エネルギー判定基準によって、末端領域エネルギー値が生成される。ある実施形態では、ｓｉＲＮＡの５’領域をｓｉＲＮＡのセンス鎖の最初の３、４、５、６、または７ヌクレオチドとして定義する。ある実施形態では、ｓｉＲＮＡの５’領域をｓｉＲＮＡのセンス鎖の最初の５ヌクレオチドとして定義する。ある実施形態では、ｓｉＲＮＡの３’領域をｓｉＲＮＡのセンス鎖の最後の３、４、５、６、または７ヌクレオチドとして定義する。ある実施形態では、ｓｉＲＮＡの３’領域をｓｉＲＮＡのセンス鎖の最後の５ヌクレオチドとして定義する。ある実施形態では、５’領域と３’領域の自由エネルギーを、例えば、Cell. 2003 Oct 17;115(2):209-16（誤植：Cell. 2003 Nov 14;115(4):505）、およびCell. 2003 Oct 17;115(2):199-208に記載の方法を使用し定量する。ある実施形態では、末端領域エネルギー判定基準には、自由エネルギーが５’領域よりも３’領域で低いｓｉＲＮＡが好都合である。ある実施形態では、末端領域エネルギー値は、５’領域と３’領域のそれぞれの値を含みうる。ある実施形態では、末端領域エネルギー値は、３’および５’の両領域エネルギーを考慮する単一値を含みうる。その単一値は、それらの領域の実際のエネルギー、あるいは３’または５’領域のどちらのエネルギーが高いかの２値指標に関係しうる。

末端領域Ａ／Ｕ判定基準
ある実施形態では、配列分析系は、末端領域エネルギー判定基準を適用するよりも、またはその適用に加えて末端領域Ａ／Ｕ判定基準を適用する。末端領域Ａ／Ｕ判定基準は、ｓｉＲＮＡの５’領域およびｓｉＲＮＡの３’領域のＡ／Ｕ塩基対数を考慮し、末端領域Ａ／Ｕ値を生成する。ある実施形態では、末端領域Ａ／Ｕ判定基準には、５’領域に対して３’領域にＡ／Ｕ塩基対数が多いｓｉＲＮＡが好都合である。ある実施形態では、末端領域Ａ／Ｕ値は、５’領域と３’領域のそれぞれの値を含みうる。ある実施形態では、末端領域Ａ／Ｕ値は、３’および５’の両領域のＡ／Ｕ塩基対数を考慮し、例えば、他方の数字から一方の数字を引くことによって単一値を含みうる。ある実施形態では、末端領域Ａ／Ｕ値は、３’または５’領域のどちらがより多くＡ／Ｕ塩基対を有するかの２値指標でありうる。

末端比エネルギー判定基準
ある実施形態では、配列分析系には末端比エネルギー判定基準を適用する。末端比エネルギー判定基準は、各ｓｉＲＮＡのセンス鎖の５’末端および３’末端の比エネルギーを考慮し、末端比エネルギー値を生成する。ある実施形態では、末端比エネルギー判定基準は、各ｓｉＲＮＡのセンス鎖の最初のヌクレオチドと最後のヌクレオチドの比エネルギーを考慮する。ある実施形態では、末端比エネルギー判定基準には、Cell. 2003 Oct 17;115(2):209-16（誤植：Cell. 2003 Nov 14;115(4):505）、およびCell. 2003 Oct 17;115(2):199-208に記載されるような当技術分野で公知方法を使用し、比エネルギーが計算される。ある実施形態では、末端比エネルギー判定基準には、最初のヌクレオチドよりも最後のヌクレオチドの比エネルギーが小さいｓｉＲＮＡが好都合である。ある実施形態では、末端比エネルギー値は、５’末端および３’末端のそれぞれについての値を含みうる。ある実施形態では、末端比エネルギー値は、３’および５’の両末端のエネルギーを考慮する単一値を含みうる。その単一値は、それらの末端の実際のエネルギー、あるいは３’または５’末端のどちらの比エネルギーが高いかの２値指標に関係しうる。

エネルギープロフィール判定基準
ある実施形態では、配列分析系はエネルギープロフィール判定基準を適用する。エネルギープロフィール判定基準は、各ｓｉＲＮＡの各位置の内部（自由）エネルギーを考慮し、エネルギープロフィール値を生成する。ある実施形態では、エネルギープロフィール判定基準は、Proc Natl Acad Sci U S A. 1986 Dec;83(24):9373-7、およびCell. 2003 Oct 17;115(2):209-16（誤植：Cell. 2003 Nov 14;115(4):505）に記載されているような当技術分野で公知方法に従ってｓｉＲＮＡにかかる内部（自由）を計算する。ある実施形態では、エネルギープロフィール判定基準には、各位置の内部（自由）エネルギーが−７ｋｃａｌ／ｍｏｌ〜−１１ｋｃａｌ／ｍｏｌであるｓｉＲＮＡが好都合である。ある実施形態では、広いエネルギープロフィールよりも、狭いエネルギープロフィールの方が好都合である。ある実施形態では、一個または複数の既知の高活性ｓｉＲＮＡのエネルギープロフィールに類似するエネルギープロフィールを有するｓｉＲＮＡが好都合である。例えば、１、２、および３と番号を付した３個のｓｉＲＮＡが図１に示す内部（自由）エネルギープロフィールを有する場合、ｓｉＲＮＡ３が好ましい。それらの標的遺伝子に対する活性をｓｉＲＮＡ１、２、および３について試験した場合、ｓｉＲＮＡ３は標的ＲＮＡを９８％減少させたが、ｓｉＲＮＡ１および２は標的ＲＮＡを、それぞれ、１６％および９６％減少させた。標的遺伝子に比べて配列が乱れている負の対照ｓｉＲＮＡの活性レベルは１０％であった。

ある実施形態では、エネルギープロフィール値は、配列のヌクレオチドのそれぞれの値を含みうる。ある実施形態では、エネルギープロフィール値は、一つは配列の最高エネルギーを示し、一つは配列の最低エネルギーを示す２個の値を含みうる。ある実施形態では、エネルギープロフィール値は、配列が好ましいエネルギー範囲を超えるか、または超えないかの２値指標でありうる。

融解温度判定基準
ある実施形態では、配列分析系は融解温度判定基準を適用する。融解温度判定基準は、各ｓｉＲＮＡの融解温度を考慮し、融解温度値を生成する。ある実施形態では、融解温度判定基準は、当技術分野で公知の任意の方法、例えば、Nat Biotechnol. 2004 Mar;22(3):326-30記載されている方法に従って、ｓｉＲＮＡの融解温度を計算する。ある実施形態では、融解温度判定基準には、融解温度が高いｓｉＲＮＡよりも、融解温度が低いｓｉＲＮＡの方が好都合である。ある実施形態では、融解温度値は配列の融解温度として表される。

Ｇ／Ｃストレッチ判定基準
ある実施形態では、配列分析系はＧ／Ｃストレッチ判定基準を適用する。Ｇ／Ｃストレッチ判定基準は、各ｓｉＲＮＡが、連続的ＧおよびＣヌクレオチドのストレッチを含むかどうかを考慮し、Ｇ／Ｃストレッチ値を生成する。ある実施形態では、Ｇ／Ｃストレッチ判定基準には、そのように４個以上の連続的Ｇおよび／またはＣヌクレオチドのストレッチを含まないｓｉＲＮＡが好都合である。例えば、配列ＡＧＧＣＧＴ、ＡＣＣＣＣＡ、ＴＧＧＣＧＣＡなどを含むｓｉＲＮＡは、それぞれが、４個以上の連続的Ｇおよび／またはＣヌクレオチドストレッチを有し、好ましくない。ある実施形態では、Ｇ／Ｃストレッチ値は、配列中の連続的Ｇおよび／またはＣヌクレオチドの最高数として示される。ある実施形態では、配列が、４個以上の連続的Ｇおよび／またはＣヌクレオチドのストレッチを含むか、含まないかの２値指標として、Ｇ／Ｃストレッチ値は示される。

判定基準加重因子
ある実施形態では、数種の判定基準は、ｓｉＲＮＡの選択において他のものよりも重要であると考えられるので、配列分析系で使用される一つまたは複数の判定基準は、判定基準加重因子に従って加重される。ある実施形態では、判定基準加重因子は経験的に決定される。ある実施形態では、ｓｉＲＮＡのコレクションを活性について試験する。判定基準加重因子を決定するために、任意の数のｓｉＲＮＡを試験することができる。高活性、低中活性、および低活性を有するｓｉＲＮＡ数を同定する。次いで、本明細書に記載した判定基準を適用し、そのような判定基準内に収まるようなｓｉＲＮＡを同定する。高活性を有し判定基準内に収まるｓｉＲＮＡの相対量を算出する。同様に、低活性を有し判定基準内に収まるｓｉＲＮＡの相対量を算出する。それらの相対量を比較することによって、そのような判定基準の加重因子が得られる。

ある実施形態では、配列分析系で使用される各判定基準について判定基準加重因子を決定する。

ある実施形態では、配列分析系を適用することによって、予想されるそれらの標的遺伝子に対する活性に従って、ランク付けした潜在的なｓｉＲＮＡのリストが得られる。しかし、ｓｉＲＮＡの活性は、配列分析系のそれらのランクに対応しない可能性がある。ある実施形態では、上位１０％にランク付けされたｓｉＲＮＡのの平均活性は、下位１０％にランク付けされたｓｉＲＮＡの平均活性を超える。ある実施形態では、上位２０％にランク付けされたｓｉＲＮＡの平均活性は、下位２０％にランク付けされたｓｉＲＮＡの平均活性を超える。ある実施形態では、さらに分析するためにランク付けしたｓｉＲＮＡのサブセットを選択する。ある実施形態では、さらに分析するためにランク付けしたｓｉＲＮＡの少なくとも５、１０、２０、３０、５０、７５、または１００個を選択する。ある実施形態では、ランク付けしたｓｉＲＮＡの全てをさらに分析する。

追加の標的判定基準
ある実施形態では、配列分析系は追加の標的判定基準を適用する。ある実施形態では、他の判定基準の後に配列分析系に追加の標的判定基準を適用する。ある実施形態では、配列分析系の他の判定基準後に追加の標的判定基準を適用する場合、追加の標的判定基準はｓｉＲＮＡのサブセットに当てはめる。ある実施形態では、追加の標的判定基準はｓｉＲＮＡの全てに当てはめる。

ある実施形態では、各ｓｉＲＮＡと同一、または同一ではないが類似する配列を同定するために、選択したデータベースに対してｓｉＲＮＡの全てまたはサブセットを走査して追加の標的値を生成する。ｓｉＲＮＡのセンス鎖および／またはアンチセンス鎖を選択したデータベースに対して走査することができる。選択したデータベースに対してｓｉＲＮＡを走査するために、長さＸのｓｉＲＮＡとデータベース中の長さＸの各配列と比較する。従って、全ての潜在的なｓｉＲＮＡを同定するために使用したウインドウに類似して、既知のｓｉＲＮＡ配列によってウインドウを定義しデータベースを走査するために使用する。データベース中の配列が、ｓｉＲＮＡ配列と同一、または同一ではないが類似する場合、その配列を含む遺伝子はヌクレオチドマッチ数と共にフラグ付けされる。例えば、１７／１９のヌクレオチドの閾値同一性レベルで、選択したデータベースに対して１９個のヌクレオチドを有するｓｉＲＮＡを走査することができる。この例では、走査によって、１９／１９のヌクレオチドが同一である配列を有する遺伝子が２個、１８／１９のヌクレオチドが同一である配列を有する遺伝子が７個、および１７／１９のヌクレオチドが同一である配列を有する遺伝子が４０個明らかになる。

潜在的データベースには、それだけには限らないが、種属特異的データベース、ｃＤＮＡデータベース、ゲノムデータベース、ＳＮＰ含有データベース、スプライスバリアント含有データベース、組織特異的データベース、発生段階特異的データベース、ｍＲＮＡデータベース、およびタンパク質データベース、ならびに上記のいずれかの組合せを含むデータベースが含まれる。従って、例えば、選択したデータベースは、全ての既知のスプライスバリアントおよびＳＮＰを含むヒト胚の脳ｃＤＮＡデータベースであってよい。そのようなデータベースは、ヒト胚の脳で発現する既知のＲＮＡおよび既知のスプライスバリアントに対応するｃＤＮＡ配列を含むであろう。データベースには、それらの特定のＲＮＡ中の全ての既知のＳＮＰおよび既知のスプライスバリアントも含むであろう。当業者ならば、特定の用途に向けて適当なデータベースを選択することができる。

ある実施形態では、各ｓｉＲＮＡの各鎖と選択したデータベースと比較して同一配列を同定する。同一配列が、元の選択した標的遺伝子以外の遺伝子中に見出されたならば、ｓｉＲＮＡも同様にその第２の遺伝子に対して活性を有するであろう。ｓｉＲＮＡのセンス鎖またはアンチセンス鎖と同一の配列を有する第２の遺伝子は、たとえその遺伝子が最初に選択した標的遺伝子ではなかったとしても標的遺伝子と考えられる。ある実施形態では、第１の標的遺伝子の発現と共に、第２の標的遺伝子の発現を減少させることが望ましくない場合、そのｓｉＲＮＡを潜在的なｓｉＲＮＡのリストから除去し、またはそうでないとしてもそのｓｉＲＮＡをそれ以上考慮しない。

ある実施形態では、同一ではないが類似する配列を同定するために、各ｓｉＲＮＡの各鎖と選択したデータベースと比較する。ある実施形態では、各ｓｉＲＮＡに特定の同一性を有するデータベース中の配列数を定量する。例えば、データベース中の（Ｘ−１）／Ｘ（例えば１８／１９、１９／２０など）同一のヌクレオチドまたは（Ｘ−２）／Ｘ同一のヌクレオチドを有する配列数などを定量する。ある実施形態では、データベース中に（Ｘ−１）／Ｘ同一のヌクレオチドを有する配列があるｓｉＲＮＡを潜在的なｓｉＲＮＡのリストから除去し、またはそうでないとしてもそれ以上考慮しない。ある実施形態では、データベース中に（Ｘ−１）／Ｘ同一のヌクレオチドを有する配列があるｓｉＲＮＡを、それらの配列に対してオフターゲット効果があるかどうか判定するためにそれらの配列に対して試験する。ある実施形態では、オフターゲット効果が見られた場合、それらのｓｉＲＮＡをリストから除去し、またはそうでないとしてもそれ以上考慮しない。

ある実施形態では、追加の標的値は、選択したデータベース中に見出されたｓｉＲＮＡと同一配列数を示す。ある実施形態では、追加の標的値はまた、選択したデータベースに見出されたｓｉＲＮＡに同一ではないが類似する配列数を、各同一性レベルについて別々の数字で、すなわち、ｓｉＲＮＡと（Ｘ−１）／Ｘヌクレオチド同一である配列数、ｓｉＲＮＡと（Ｘ−２）／Ｘヌクレオチド同一である配列数で示す。ある実施形態では、追加の標的値は、ｓｉＲＮＡと同一である最初の標的遺伝子の以外に、選択したデータベース中に追加の配列があるか否かを示す２値指標である。

オフターゲット予測系
ある実施形態では、オフターゲット予測系を使用し、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドのオフターゲット活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子を同定することによって、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドのオフターゲット活性またはオフターゲットアンチセンス活性を予想する。ある実施形態では、潜在的オフターゲット遺伝子または潜在的アンチセンスオフターゲット遺伝子から、予想されるオフターゲット遺伝子または予想されるアンチセンスオフターゲット遺伝子を同定する。ある実施形態では、配列分析系で同定されたｓｉＲＮＡまたはアンチセンスポリヌクレオチドの全てまたは一部のオフターゲット活性またはオフターゲットアンチセンス活性を定量する。

分かりやすくするために、オフターゲット予測系をｓｉＲＮＡと関連して記載する。同様の方法は、アンチセンスポリヌクレオチドまたは他のいかなるハイブリッド形成化ポリヌクレオチドにも使用することができる。当業者ならば、アンチセンスポリヌクレオチドまたは他のハイブリッド形成化ポリヌクレオチドが関与する用途に記載した方法を適応させることができる。

ある実施形態では、上述したようにデータベースを選択する。従って、例えば特異的組織でｓｉＲＮＡを使用しようと考える場合、組織特異的データベースを選択してオフターゲット効果を予測することができる。あるいは、例えば、完全な種特異的データベースを使用して、任意のｓｉＲＮＡについてオフターゲット効果を予想することができる。当業者ならば、ｓｉＲＮＡについて意図した使用に従って、オフターゲット効果を分析するために適当なデータベースを選択することができる。

ある実施形態では、先に述べたように、潜在的オフターゲット遺伝子である、同一ではないが類似する配列を同定するために、その配列でデータベースを走査することによって、各ｓｉＲＮＡの各鎖と選択したデータベースと比較する。ある実施形態では、各ｓｉＲＮＡに特定の同一性を有する潜在的オフターゲット遺伝子を決定する。ある実施形態では、ｓｉＲＮＡと（Ｘ−１）／Ｘ同一のヌクレオチドを有する潜在的オフターゲット遺伝子を同定する。ある実施形態では、ｓｉＲＮＡと（Ｘ−２）／Ｘ同一のヌクレオチドを有する潜在的オフターゲット遺伝子を同定する。

一度潜在的オフターゲット遺伝子を同定したならば、オフターゲット予測系を使用し、各群［すなわち、（Ｘ−１）／Ｘ同一のヌクレオチドを有する潜在的オフターゲット遺伝子、（Ｘ−２）／Ｘ同一のヌクレオチドを有するオフターゲット遺伝子など］に属する潜在的オフターゲット遺伝子を分析して予想されるオフターゲット遺伝子を同定する。

ある実施形態では、オフターゲット予測系は、以下の判定基準の一つまたは複数を含む。ある実施形態では、オフターゲット予測系は、平均的に、系で使用する判定基準が多いほど、予想されるオフターゲット遺伝子の同定の正確性が高まる。

オフターゲット加重値判定基準
ある実施形態では、オフターゲット予測系はオフターゲット加重値判定基準を適用する。オフターゲット加重値判定基準は、分析しようとするｓｉＲＮＡと潜在的オフターゲット遺伝子との間の一個または複数のミスマッチの位置を考慮する。ある実施形態では、オフターゲット加重値判定基準は、ｓｉＲＮＡに、または潜在的オフターゲット遺伝子にオフターゲット加重表を当てはめる。

ある実施形態では、オフターゲット加重表は以下のように作成することができる。ある実施形態では、オフターゲット遺伝子と比べたｓｉＲＮＡの様々な位置のミスマッチの全体的効果を決定する。一個または複数の標的遺伝子に対して、各ｓｉＲＮＡが標的遺伝子と比べてｓｉＲＮＡと同一ではないが類似する一連のｓｉＲＮＡを作製する。標的遺伝子に対する各ｓｉＲＮＡのオフターゲット活性レベルは、当技術分野で公知の方法によって決定する。ある実施形態では、各ｓｉＲＮＡのオフターゲット活性レベルは、例えばｑＰＣＲによって定量した標的ＲＮＡの減少率として表される。調整した減少率（または調整した活性レベル）を得るために、減少率を調節することができる。

ある実施形態では、閾値調整した活性レベルに減少値０を割り当て、その閾値を越える全ての調整した活性レベルに正の減少値を割り当て、その閾値未満の全ての調整した活性レベルに負の減少値を割り当てる。例えば、標的ＲＮＡ中の５０％調整した減少（すなわち、５０％調整した活性レベル）に減少値０を割り当て、１００％調整した減少（すなわち、１００％調整した活性レベル）に減少値１００を割り当て、０％調整した減少（すなわち、０％調整した活性レベル）に減少値−１００を割り当てる。従って、その例では、オフターゲットｓｉＲＮＡが、完全にマッチしたｓｉＲＮＡに比べて標的ＲＮＡを９０％減少させたならば（すなわち９０％調整した活性レベル）、オフターゲットｓｉＲＮＡに減少値８０を割り当て、オフターゲットｓｉＲＮＡが、完全にマッチしたｓｉＲＮＡに比べて標的ＲＮＡを４０％減少させたならば（すなわち４０％調整した活性レベル）、オフターゲットｓｉＲＮＡに減少値−２０を割り当てる。

ある実施形態では、標的遺伝子と比べたミスマッチ数に従ってミスマッチを有するｓｉＲＮＡをソートする。ある実施形態では、次いで各ｓｉＲＮＡでミスマッチの位置を同定し、各ミスマッチにｓｉＲＮＡの減少値を割り当てる。次いで、一位置中の全てのミスマッチの減少値を合算し、次いでその位置にミスマッチを有するｓｉＲＮＡ数で割って加重因子を生成する。その結果、その位置のミスマッチによってｓｉＲＮＡの活性が減少した場合、その位置の加重因子は低または負になる。従って、その位置のミスマッチは、ｓｉＲＮＡのオフターゲット活性を減少させると予想される。そのような位置は、順次、保存された領域であると考えられる。あるいは、特定の位置のミスマッチがｓｉＲＮＡの活性にほとんど影響を及ぼさない場合、その位置の加重因子は大数になる。その位置は、あまり保存されない領域であると予想される。というのは、ミスマッチが活性に対してほとんど影響を及ぼさないからである。

ある実施形態では、オフターゲット加重表は以下のように作成することができる。ある実施形態では、標的遺伝子配列または標的遺伝子配列と同一であるｓｉＲＮＡを選択する（標的遺伝子配列を選択した場合、その長さは選択するｓｉＲＮＡと同じである）。選択した標的遺伝子配列または選択したｓｉＲＮＡで、以下のステップを実施することができるが、便宜上、ｓｉＲＮＡを選択したものとしてステップについて記載する。ある実施形態では、ｓｉＲＮＡのセンス鎖を使用して選択したデータベースを走査し、同一の標的遺伝子配列、および同一ではないが類似する、オフターゲット遺伝子配列を同定する。ある実施形態では、ｓｉＲＮＡが１９ヌクレオチドの場合、データベースを走査して、１２以上、例えば、１４以上、１６以上の同一ヌクレオチドを有する配列を同定する。ある実施形態では、ｓｉＲＮＡのアンチセンス鎖もデータベースの走査に使用される。ある実施形態では、潜在的オフターゲット遺伝子および追加の標的遺伝子を同定した後、潜在的オフターゲット遺伝子および／または追加のオフターゲット遺伝子の一つまたは複数に対してｓｉＲＮＡの活性を定量する。様々な実施形態でｑＰＣＲ、タンパク質の発現の検出（ＧＦＰまたはルシフェラーゼなどのマーカータンパク質の検出を含むがそれだけには限らない）、ノーザンブロットを使用するＲＮＡの検出、およびマイクロアレイを使用するＲＮＡまたはｃＤＮＡレベルの検出、ならびにｂＤＮＡを使用する検出を使用して、オフターゲット活性を定量することができる。ある実施形態では、オフターゲット活性を調整して調整した活性レベルを得る。

ある実施形態では、オフターゲット加重表は、ｓｉＲＮＡの各位置のミスマッチの加重因子に加えて、ｓｉＲＮＡの各位置のマッチの加重因子を含む。ある実施形態では、その位置にマッチを有する各ｓｉＲＮＡの減少値を合算し、次いでその位置にマッチを有するｓｉＲＮＡ数で割って加重因子を生成することは除き、ｓｉＲＮＡの各位置のマッチの加重因子をミスマッチの加重因子と同じように算出する。

ある実施形態では、閾値調整した活性レベルに減少値０を割り当て、その閾値を越える全ての調整した活性レベルに正の減少値を割り当て、その閾値未満の全ての調整した活性レベルに負の減少値を割り当てる。例えば、５０％調整した活性レベルに減少値０を割り当て、１００％調整した活性レベルに減少値１００を割り当て、０％調整した活性レベルに減少値−１００を割り当てる。従って、その例では、ｓｉＲＮＡが、選択した標的遺伝子に対するその活性に比べて、オフターゲット遺伝子に対して９０％の活性を有する場合、そのオフターゲット遺伝子に対するそのｓｉＲＮＡに減少値８０を割り当てる。また、そのオフターゲット遺伝子は、そのｓｉＲＮＡについて減少値８０を有すると言うことができる。さらに、ｓｉＲＮＡが、選択した標的遺伝子に対するその活性に比べて、第２のオフターゲット遺伝子について４０％であった場合、その第２のオフターゲット遺伝子についてそのｓｉＲＮＡに減少値−２０を割り当てる。また、そのｓｉＲＮＡについて第２のオフターゲット遺伝子の減少値は−２０であると言えよう。

ある実施形態では、選択したｓｉＲＮＡと比べてミスマッチを有するオフターゲット遺伝子をミスマッチ数に従ってソートする。ある実施形態では、次いで、ミスマッチの位置を各オフターゲット遺伝子中で同定し、各ミスマッチにオフターゲット遺伝子の減少値を割り当てる。一位置の全てのミスマッチの減少値を合算し、次いで選択したｓｉＲＮＡと比べたその位置のミスマッチを有するオフターゲット遺伝子数で割って加重因子を生成する。その結果、その位置のミスマッチが、その位置中にミスマッチを有するオフターゲット遺伝子について選択したｓｉＲＮＡによって活性が減少した場合、その位置の加重因子は低または負になる。従って、その位置のミスマッチは、ｓｉＲＮＡのオフターゲット活性を減少させると予想される。それらの位置は、順次、保存された領域である考えられる。あるいは、特定の位置のミスマッチが、その位置にミスマッチを有するオフターゲット遺伝子について選択したｓｉＲＮＡの活性に対してほとんど影響を及ぼさない場合、その位置の加重因子は大数になる。その位置は、余り保存されない領域と予想される。ミスマッチが活性に対してほとんど影響を及ぼさないからである。

ある実施形態では、ｓｉＲＮＡ中のミスマッチは追加物である。従って、位置Ａにミスマッチを有するｓｉＲＮＡが、ミスマッチを有しないｓｉＲＮＡに比べて活性で２０％の減少を示し、位置Ｂにミスマッチを有するｓｉＲＮＡが、ミスマッチを有しないｓｉＲＮＡに比べて活性で１０％減少を示した場合、位置ＡおよびＢにミスマッチを有するｓｉＲＮＡは、ミスマッチを有しないｓｉＲＮＡに比べて活性で３０％減少を示すと推定される。

ある実施形態では、オフターゲット加重値判定基準は、ｓｉＲＮＡの一個または複数の位置のミスマッチの加重値に加えて、ｓｉＲＮＡの一個または複数の位置のマッチの加重因子を含むオフターゲット加重表を適用する。ある実施形態では、各位置のマッチの加重因子を得るために、以下の方法を使用することができる。オフターゲット遺伝子と同一ではないが類似するｓｉＲＮＡのコレクションをオフターゲット遺伝子に対する活性について試験する。高活性、中活性、および低活性に従ってｓｉＲＮＡをグループ分けする。次いで、各位置でマッチするヌクレオチドに従ってｓｉＲＮＡをグループ分けし、そのマッチするヌクレオチドが高、中、および低オフターゲット活性を有するｓｉＲＮＡの割合を使用して、その位置のそのヌクレオチドのマッチの加重因子を得る。

ある実施形態では、複数のミスマッチの組合せについても同様に加重因子が得られる。

オフターゲット加重値判定基準は、選択したｓｉＲＮＡによるデータベースの走査によって同定した潜在的オフターゲット遺伝子のそれぞれに、オフターゲット加重表を当てはめる。オフターゲット加重表は、その位置が選択したｓｉＲＮＡと比べてマッチしまたはミスマッチするかどうかに従って、潜在的オフターゲット遺伝子の各位置に、マッチおよびミスマッチオフターゲット加重因子を割り当てる。ある実施形態では、オフターゲット加重値判定基準は、オフターゲット加重因子を合計して、各潜在的オフターゲット遺伝子のオフターゲット加重値を得る。

ある実施形態では、次いでオフターゲット加重値に従って潜在的オフターゲット遺伝子をソートする。ある実施形態では、オフターゲット加重値が高いことは、その潜在的オフターゲット遺伝子に対して選択したｓｉＲＮＡの活性が高いと予想されることを示す。選択したｓｉＲＮＡがそれに対してより高い活性を有すると予想される潜在的オフターゲット遺伝子は、予想されるオフターゲット遺伝子と称される。ある実施形態では、ある閾値を越えるオフターゲット加重値を有する潜在的オフターゲット遺伝子を予想されるオフターゲット遺伝子と考える。

ある実施形態では、ミスマッチ位置を使用してオフターゲット活性を予測する。ある実施形態では、潜在的オフターゲット遺伝子の第１のセグメントの一つまたは複数の位置にミスマッチを有する１９ｍｅｒのｓｉＲＮＡは、他の場所に同数のミスマッチを有する他のオフターゲット遺伝子と比較して、その潜在的オフターゲット遺伝子に対してオフターゲット活性が低いと予想される。

ある実施形態では、追加のｓｉＲＮＡまたはアンチセンスポリヌクレオチドの実験の結果を考慮するために、配列分析系および／またはオフターゲット予測系を変化させることができる。従って、追加のデータが増えるにつれ、判定基準の各型を調節することができる。同様に、ｓｉＲＮＡまたはアンチセンスポリヌクレオチドの活性およびオフターゲット活性の追加のデータが増えるにつれ、加重表を調節することができる。従って、より多くのデータを使用して加重表を編集し判定基準を調整するに従い、配列分析系およびオフターゲット予測系を経時的に改善することができる。ある実施形態では、より多くのデータを収容するために判定基準を調整するに従い、配列分析系およびオフターゲット予測系はより正確なものとなる。

ある実施形態では、配列分析系およびオフターゲット予測系を使用して、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、または３０塩基対を有するｓｉＲＮＡを選択することができる。長さｘのｓｉＲＮＡと共通して少なくともｚ個のヌクレオチドを有する（ｚはｘに等しいかｘ以下）長さｙの各ｓｉＲＮＡと共に、長さｘのｓｉＲＮＡ（ｘはｙより短い）を選択する、配列分析系を使用し、長さｙのｓｉＲＮＡを選択する代表的方法は以下の通りである。上述したように、特定の標的遺伝子遺伝子に対して中もしくは高活性を有する可能性が高い長さｘのｓｉＲＮＡを選択するために、配列分析系を使用することができる。長さｘの各ｓｉＲＮＡについては、長さｘのｓｉＲＮＡと同様に少なくともｚ個のヌクレオチドを有する長さｙの潜在的なｓｉＲＮＡを全て同定する。次いで、長さｙの各ｓｉＲＮＡから作製することができる各２１ｍｅｒのオフターゲット効果を決定する。次いで、長さｙの各ｓｉＲＮＡから作製することができる２１ｍｅｒの全てオフターゲット効果を平均化し、最低平均オフターゲット効果を有する長さｙのｓｉＲＮＡを選択する。

例えば、以下のように、長さ１９のｓｉＲＮＡを選択する配列分析系を使用し、かつ長さ１９のｓｉＲＮＡと同様に、長さ２７の各ｓｉＲＮＡが１９のヌクレオチド全てを含むという要件で、長さ２７のｓｉＲＮＡを選択することができる。まず、上述したように、配列分析系を使用して、特定の標的遺伝子に対して中もしくは高活性を有する可能性が高い１９ｍｅｒのｓｉＲＮＡを選択する。選択した各１９ｍｅｒについては、その１９ｍｅｒの全１９のヌクレオチドを含むあらゆる潜在的２７ｍｅｒを決定する。従って、各１９ｍｅｒについては、以下の配列（大文字で示す）と以下の周囲配列（小文字に示す）を有する１９ｍｅｒについて例示するように９個の潜在的２７ｍｅｒがある。

ａｇｃｔａｇｃａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃｃｇｇｃａｔｇｃｃ（配列番号６）
その１９ｍｅｒと同様に１９個のヌクレオチドを含む全ての潜在的な２７ｍｅｒは次のものである。

１．ｇｃａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴ（配列番号７）
２．ｃａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔ（配列番号８）
３．ａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔ（配列番号９）
４．ｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔ（配列番号１０）
５．ａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃ（配列番号１１）
６．ｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃｃ（配列番号１２）
７．ａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃｃｇ（配列番号１３）
８．ｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃｃｇｇ（配列番号１４）
９．ＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴｔｔｔｃｃｇｇｃ（配列番号１５）
次いで、各２７ｍｅｒについては、その２７ｍｅｒに含まれている全ての潜在的な１９ｍｅｒを同定する。例えば、上記２７ｍｅｒ番号１について以下の１９ｍｅｒを同定する。

１Ａ．ｇｃａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡ（配列番号１６）
１Ｂ．ｃａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧ（配列番号１７）
１Ｃ．ａｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡ（配列番号１８）
１Ｄ．ｃａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧ（配列番号１９）
１Ｅ．ａｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧ（配列番号２０）
１Ｆ．ｃａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴ（配列番号２１）
１Ｇ．ａｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣ（配列番号２２）
１Ｈ．ｇＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴ（配列番号２３）
１Ｉ．ＡＣＴＣＣＣＣＣＣＧＡＧＡＧＧＴＣＴＴ（配列番号２４）
次いで、オフターゲット予測系を使用して、それらの１９ｍｅｒのそれぞれの予想されるオフターゲット効果を決定する。例えば、１９ｍｅｒの１Ａについては、１９ｍｅｒの１Ａのどちらかの鎖と１９／１９同一であるヌクレオチド、１８／１９同一であるヌクレオチド、１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有するオフターゲット遺伝子数を決定する。次いで、１９／１９同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、１．０によって増幅する。次いで、１８／１９同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、０．９によって増幅する。次いで、１７／１９同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、０．８によって増幅する。次いで、１６／１９同一であるヌクレオチドを有するオフターゲット遺伝子数をオフターゲット増幅係数、例えば、０．６によって増幅する。１９ｍｅｒ１Ａの予想されるオフターゲット効果は、適当なオフターゲット増幅係数によって増幅した各同一性レベルを有するオフターゲット遺伝子数の合計である。従って、例えば、１９ｍｅｒの１Ａが１９／１９同一であるヌクレオチドを有するオフターゲット遺伝子を１個、１８／１９同一であるヌクレオチドを有するオフターゲット遺伝子を３個、１７／１９同一であるヌクレオチドを有するオフターゲット遺伝子を５個、および１６／１９同一であるヌクレオチドを有するオフターゲット遺伝子を２７個を有する場合、予想されるオフターゲット効果は［（１×１．０）＋（３×０．９）＋（５×０．８）＋（２７×０．６）］であり、２３．９である。

当業者ならば、オフターゲット遺伝子と１９ｍｅｒとの間の同一性レベルのそれぞれについて適当な増幅係数を選択することができる。ある実施形態では、予想されるオフターゲット効果を計算する場合、特定の１９ｍｅｒについて同定した各オフターゲット遺伝子のオフターゲット加重値を考慮する。限定しない例として、オフターゲット増幅係数に対して特定の割合の同一性を有するオフターゲット遺伝子数を増幅するのではなく、オフターゲット加重値を考慮する場合、選択した１９ｍｅｒに対してその割合同一性を有するオフターゲット遺伝子の全てのオフターゲット加重値の合計をオフターゲット増幅係数によって増幅させることができる。

単一２７ｍｅｒに対応する１９ｍｅｒの全てにわたって予想されるオフターゲット効果を平均化して、その２７ｍｅｒの平均予想オフターゲット効果を得る。各２７ｍｅｒ用に、全１９ｍｅｒを同定する過程およびその予想されるオフターゲット効果を決定する過程を次いで反復する。その結果、各２７ｍｅｒに平均の予想されるオフターゲット効果を割り当てる。ある実施形態では、最低の平均の予想されるオフターゲット効果を有する２７ｍｅｒを選択する。

ある実施形態では、長さ１９のｓｉＲＮＡを同定する配列分析系を使用して、２７ｍｅｒを選択する場合、１、２、３、４、５、または６ヌクレオチドのバッファーが、１９ｍｅｒコアの一端または両端に必要になるかもしれない。従って、限定しない例として、上述した例では、２個のヌクレオチドバッファーが１９ｍｅｒコアの各末端に必要な場合、選択した１９ｍｅｒを含む潜在的２７ｍｅｒが５個あるはずである。それらの５個は、上記２７ｍｅｒ番号３〜７である。さらに限定しない例として、２個のヌクレオチドバッファーが５’末端に必要であり、３個のヌクレオチドバッファーが３’末端に必要な場合、選択した１９ｍｅｒを含む４個の潜在的２７ｍｅｒがあると思われる。それらの４個は、上記２７ｍｅｒ番号４〜７である。

前記の例は、決して本発明を制限しないものとする。任意の長さのｓｉＲＮＡを選択する配列分析系を使用して、２７を含むが、それだけには限らない任意の長さのｓｉＲＮＡを同じように選択することができる。さらに、上述したように、配列分析系によって同定したｓｉＲＮＡと、その一つのｓｉＲＮＡの周囲で同定した異なるサイズのｓｉＲＮＡとの間に共通する任意の数のヌクレオチドを必要とする系を設計することができる。加えて、当初のｓｉＲＮＡコア配列の一端または両端のバッファーとして、任意の数のヌクレオチドを必要とする系を設計することもできる。

一般的に、本発明の実施形態は、一つまたは複数のコンピューターシステムによって保存され、または移送するデータを含む様々な工程を利用する。本発明の実施形態は、これらの操作を実行する装置にも関する。この装置は、必要な目的に向けて特別に構築することができ、あるいは装置はコンピュータープログラムおよび／またはコンピューターに保存されたデータ構造によって選択的に作動し、または再形成される汎用コンピューターであってよい。本明細書で示した方法は、本質的には、任意の特定のコンピューターまたは他の装置に関するものではない。特に、様々な汎用機で本明細書の教示に従って書かれたプログラムを使用することができ、あるいは汎用機は、必要な方法ステップを実行させるためより特化させた装置を構築するのにさらに好都合でありうる。様々なこれらの機器の特定の構造は、以下に示す記述から明らかである。

さらに、本発明の実施形態は、コンピューターが実行する様々な操作を実施するためのプログラム命令および／またはデータ（データ構造を含む）を含む、コンピューター読取り可能な媒体またはコンピュータープログラム製品に関する。コンピューター読取り可能な媒体の例には、それだけには限らないが、ハードディスク、フロッピーディスク、および磁気テープなどの磁気媒体；ＣＤ−ＲＯＭディスクなどの光学媒体、磁気光学媒体；読取専用メモリーデバイス（ＲＯＭ）およびランダムアクセスメモリー（ラム）など、特別にプログラム命令を保存するように構成され実施される半導体メモリーデバイスおよびハードウェアデバイスが含まれる。本発明のデータおよびプログラム命令は、搬送波または他の輸送媒体に具体化することもできる。プログラム命令の例には、両マシンコード、例えばコンパイラによって生成されるコード、およびインタープリターを使用するコンピューターによって実行されるより高度なコードを含むファイルが含まれる。

特定の過程および装置に従って本発明を上に概略的に記載したが、本発明は非常に広範な適用性を有する。特に、本発明の態様は、任意の特定の種類の細胞過程に限定されず、事実、任意の細胞過程に適用することができ、その際、細胞に及ぼす治療効果への理解が望まれる。従って、いくつかの実施形態では、本発明の技術によって、多くの異なる種類または群の細胞、物質、細胞過程、および作用機序、ならびにあらゆる種類の遺伝子過程についての情報が提供されるであろう。当技術分野の通常の技術者ならば、前述の考察を考慮して他の変形形態、修正、および代替法を認識されよう。

さて、本発明について十分記載しているので、本発明の精神および範囲から逸脱することなく、かつ過度の実験をするなしに、等価物および条件の範囲内で本発明を実施できることは当業者よって理解されよう。さらに、本発明は、特定の実施形態および実施例を考慮して記載されているが、さらに修正を加えることも可能であると本発明者らは考えている。本願は、上記一般原理にかなう本発明のいかなる変形形態、使用、または適応も包含するものとする。

明細書は文献についての記述を含み、それらの参照文献は具体的に参照により本明細書に組み込まれる。添えて出願された添付物も、あらゆる目的において明白に参照により本明細書に組み込まれる。

本細書および実施例は、以下に記載の特許請求の範囲の単に詳細な代表例にすぎない。

仮定上のｓｉＲＮＡ＃１、＃２、および＃３の３個の内部（自由）エネルギープロフィールを示す図である。それらのｓｉＲＮＡの各々は１９塩基対を含む。各グラフのｘ−軸はｓｉＲＮＡのヌクレオチのド位置であり、ｙ−軸は内部（自由）エネルギーである。例えば、ｓｉＲＮＡ＃１について、ヌクレオチド位置１および２の内部（自由）エネルギーは、それぞれ、約−９．２５であり、ヌクレオチド位置３の内部（自由）エネルギーは約−８．２５である。

Claims

長さｘのｓｉＲＮＡを選択する方法であって、
標的遺伝子を選択するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するステップ、
前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ
を含む方法。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡの前記配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項１に記載の方法。
前記配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項２に記載の方法。
長さｘのｓｉＲＮＡに対して予想されるオフターゲット遺伝子を同定する方法であって、
長さｘのｓｉＲＮＡを選択するステップ、
データベースを選択するステップ、
前記長さｘのｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、前記長さｘのｓｉＲＮＡで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するステップ、および
予想されるオフターゲット遺伝子を同定するステップ
を含む方法。
長さｘのｓｉＲＮＡを選択する方法であって、
標的遺伝子を選択するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するステップ、
データベースを選択するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さｘの潜在的ｓｉＲＮＡで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第２の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するステップ、および
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対して予想されるオフターゲット遺伝子を同定するステップ、
前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ
を含む方法。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについての第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項５に記載の方法。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項６に記載の方法。
長さｘのｓｉＲＮＡ用に加重表を作成する方法であって、
少なくとも１個の標的遺伝子に対して、少なくとも２個の長さｘのｓｉＲＮＡを作製するステップ、
前記少なくとも１個の標的遺伝子に対して、前記少なくとも２個の長さｘのｓｉＲＮＡのそれぞれの活性レベルを決定するステップ、
閾値活性レベルを選択するステップ、
前記閾値活性レベルに減少値０を割り当てるステップ、
前記閾値活性レベルより高い各々の異なる活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる活性レベルに、異なる負の減少値を割り当てるステップ、
その活性レベルに従って長さｘの各ｓｉＲＮＡに減少値を割り当てるステップ、
第１の位置にアデニン（Ａ）を有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のアデニン（Ａ）の加重因子の算出ステップ、
第１の位置のアデニン（Ａ）の加重因子の加重表への挿入ステップ、
第１の位置のシトシン（Ｃ）、グアニン（Ｇ）、およびウリジン（Ｕ）について、前記算出ステップおよび前記挿入ステップを反復するステップ、
少なくとも第２の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するステップ
を含み、それによって長さｘのｓｉＲＮＡ用に加重表を作成する方法。
前記少なくとも２個の長さｘのｓｉＲＮＡが、少なくとも１００個の長さｘのｓｉＲＮＡである、請求項８に記載の方法。
前記少なくとも２個の長さｘのｓｉＲＮＡが、少なくとも２００個の長さｘのｓｉＲＮＡである、請求項８に記載の方法。
前記少なくとも２個の長さｘのｓｉＲＮＡが、少なくとも５００個の長さｘのｓｉＲＮＡである、請求項８に記載の方法。
前記少なくとも２個の長さｘのｓｉＲＮＡが、少なくとも１０００個の長さｘのｓｉＲＮＡである、請求項８に記載の方法。
長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成する方法であって、
各ｓｉＲＮＡがオフターゲット遺伝子と比べて少なくとも１個のミスマッチを含むものであって、少なくとも１個のオフターゲット遺伝子に対して少なくとも２個の長さｘのｓｉＲＮＡを作製するステップ、
少なくとも１個のオフターゲット遺伝子に対して、前記少なくとも２個の長さｘのｓｉＲＮＡのそれぞれの調整活性レベルを決定するステップ、
閾値調整した活性レベルを選択するステップ、
前記閾値調整活性レベルに減少値０を割り当てるステップ、
前記閾値活性レベルより高い各々の異なる調整活性レベルに、異なる正の減少値を割り当て、かつ前記閾値活性レベルより低い各々の異なる調整活性レベルに、異なる負の減少値を割り当てるステップ、
その調整した活性レベルに従って、長さｘの各ｓｉＲＮＡに減少値を割り当てるステップ、
第１の位置中にミスマッチを有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のミスマッチのオフターゲット加重因子の算出ステップ、
第１の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップ、
少なくとも第２の位置について前記算出ステップおよび前記挿入ステップを反復するステップ
を含み、それによって長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成する方法。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、および
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード
を含むコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡの前記配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項１４に記載のコンピュータープログラム製品。
前記配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項１５に記載のコンピュータープログラム製品。
長さｘのｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
前記長さｘのｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さｘのｓｉＲＮＡでデータベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析、および少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さｘの潜在的ｓｉＲＮＡで前記データベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第２の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項１８に記載のコンピュータープログラム製品。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項１９に記載のコンピュータープログラム製品。
第２の配列分析が、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項１９に記載のコンピュータープログラム製品。
長さｘのｓｉＲＮＡ用に加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、
その活性レベルに従って長さｘのｓｉＲＮＡに減少値を割り当てるためのコード、
第１の位置にアデニン（Ａ）を有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１のアデニン（Ａ）の加重因子の算出ステップのためのコード、
第１の位置のアデニン（Ａ）の加重因子の加重表への挿入ステップのためのコード、
第１の位置のシトシン（Ｃ）、グアニン（Ｇ）、およびウリジン（Ｕ）について、前記算出ステップおよび前記挿入ステップを反復するためのコード、
少なくとも第２の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコード
を含み、それによって長さｘのｓｉＲＮＡ用に加重表を作成するコンピュータープログラム製品。
長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するためのプログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード
選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、
その調整した活性レベルに従って、長さｘの各ｓｉＲＮＡに減少値を割り当てるためのコード、
第１の位置中にミスマッチを有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、
第１の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、
少なくとも第２の位置について前記算出ステップおよび前記挿入ステップを反復するためのコード
を含み、それによって長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、および
配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡの配列分析を実施するためのコード
を含むコンピューター装置。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡの前記配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項２４に記載のコンピューター装置。
前記配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項２４に記載のコンピューター装置。
長さｘのｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
前記長さｘのｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、長さｘのｓｉＲＮＡでデータベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含むコンピューター装置。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析、および少なくとも一個の長さｘの潜在的ｓｉＲＮＡに対する一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡと、ｘ／ｘ同一であるヌクレオチドまたは（ｘ−１）／ｘ同一であるヌクレオチドまたは（ｘ−２）／ｘ同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも一個の長さｘの潜在的ｓｉＲＮＡで前記データベースを走査するためのコード、および
前記一個または複数の潜在的オフターゲット遺伝子にオフターゲット加重値を割り当てるステップを含む第２の配列分析を、前記一個または複数の潜在的オフターゲット遺伝子について実施するためのコード
を含む、コンピューター装置。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項２８に記載のコンピューター装置。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項２９に記載のコンピューター装置。
第２の配列分析が、さらに、前記一個または複数の潜在的オフターゲット遺伝子のオフターゲット加重値に従って、前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項２８に記載のコンピューター装置。
長さｘのｓｉＲＮＡ用に加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる活性レベルに、異なる負の減少値を割り当てるためのコード、
その活性レベルに従って長さｘのｓｉＲＮＡに減少値を割り当てるためのコード、
第１の位置にアデニン（Ａ）を有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のアデニン（Ａ）の加重因子の算出ステップのためのコード、
第１の位置のアデニン（Ａ）の加重因子の加重表への挿入ステップのためのコード、
第１の位置のシトシン（Ｃ）、グアニン（Ｇ）、およびウリジン（Ｕ）について、前記算出ステップおよび前記挿入ステップを反復するためのコード、
少なくとも第２の位置について前記算出ステップ、前記挿入ステップ、および前記反復ステップを反復するためのコード
を含み、それによって長さｘのｓｉＲＮＡ用に加重表を作成するコンピューター装置。
長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するためのプログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
選択した閾値活性レベルよりも高い各々の異なる調整した活性レベルに、異なる正の減少値を割り当てるためのコード、
選択した閾値活性レベルよりも低い各々の異なる調整した活性レベルに、異なる負の減少値を割り当てるためのコード、
その調整した活性レベルに従って、長さｘの各ｓｉＲＮＡに減少値を割り当てるためのコード、
第１の位置中にミスマッチを有する長さｘの各ｓｉＲＮＡの減少値を平均化するステップを含む、第１の位置のミスマッチのオフターゲット加重因子の算出ステップのためのコード、
第１の位置のミスマッチのオフターゲット加重因子の加重表への挿入ステップのためのコード、
少なくとも第２の位置について前記算出ステップおよび前記挿入ステップを反復するためのコード
を含み、それによって長さｘのｓｉＲＮＡ用にオフターゲット加重表を作成するコンピューター装置。
長さｙのｓｉＲＮＡを選択する方法であって、
標的遺伝子を選択するステップ、
ｘはｙより短い値であって、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するステップ、
前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するステップ、
データベースを選択するステップ、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するステップ、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するステップ、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡから長さｙのｓｉＲＮＡを選択するステップ
を含む方法。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項３４に記載の方法。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項３５に記載の方法。
プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
ｘはｙより短い値であり、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、
配列分析が、少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析を実施するためのコード、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するためのコード、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡでデータベースを走査するためのコード、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項３７に記載のコンピュータープログラム製品。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項３８に記載のコンピュータープログラム製品。
プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
ｘはｙより短い値であり、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ２１のｓｉＲＮＡを同定するためのコード、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡでデータベースを走査するためのコード、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する潜在的オフターゲット遺伝子数を増幅するためのコード、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピューター装置。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項４０に記載のコンピューター装置。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項４１に記載のコンピューター装置。
長さｙのｓｉＲＮＡを選択する方法であって、
標的遺伝子を選択するステップ、
ｘはｙより短い値であり、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘで前記標的遺伝子の少なくとも一部を走査するステップ、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するステップ、
前記少なくとも一個の長さｘの潜在的ｓｉＲＮＡから長さｘのｓｉＲＮＡを選択するステップ、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するステップ、
データベースを選択するステップ、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するステップ、
前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するステップであって、該一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップ、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するステップ、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するステップ、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡから長さｙのｓｉＲＮＡを選択するステップ
を含む方法。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項４３に記載の方法。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項４４に記載の方法。
プログラム命令を備えている機械読取り可能媒体を具備するコンピュータープログラム製品であって、前記命令が
ｘがｙより短い値であり、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ１９のｓｉＲＮＡを同定するためのコード、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するためのコード、
前記一個または複数の潜在的オフターゲット遺伝子について行う第２の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピュータープログラム製品。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項４６に記載のコンピュータープログラム製品。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項４７に記載のコンピュータープログラム製品。
プログラム命令を少なくとも一時的に保存するように構成されたメモリーデバイスを含むコンピューター装置であって、前記命令が
ｘはｙより短い値であり、少なくとも一個の長さｘの潜在的ｓｉＲＮＡを同定するために、ウインドウサイズｘでその標的遺伝子の少なくとも一部を走査するためのコード、
少なくとも一個の長さｘの潜在的ｓｉＲＮＡに加重値を割り当てるステップを含む第１の配列分析を、少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて実施するためのコード、
前記長さｘのｓｉＲＮＡを含む少なくとも１個の長さｙの潜在的ｓｉＲＮＡを同定するためのコード、
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡの少なくとも１個の中に含まれている、少なくとも１個の長さ２１のｓｉＲＮＡを同定するためのコード、
少なくとも１個の長さ１９のｓｉＲＮＡと、１９／１９同一であるヌクレオチド、または１８／１９同一であるヌクレオチド、または１７／１９同一であるヌクレオチド、または１６／１９同一であるヌクレオチドを有する一個または複数の潜在的オフターゲット遺伝子を同定するために、少なくとも１個の長さ１９のｓｉＲＮＡで前記データベースを走査するためのコード、
前記一個または複数の潜在的オフターゲット遺伝子について行う第１の配列分析を実施するためのコードであって、前記一個または複数の潜在的オフターゲット遺伝子のそれぞれにオフターゲット加重値を割り当てるステップを含むコード、
第１の増幅係数によって１９／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第２の増幅係数によって１８／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、第３の増幅係数によって１７／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅し、そして第４の増幅係数によって１６／１９同一であるヌクレオチドを有する前記潜在的オフターゲット遺伝子の全てに対してオフターゲット加重値の合計を増幅するためのコード、
前記少なくとも１個の長さ１９のｓｉＲＮＡのそれぞれの予想オフターゲット効果を決定するためのコード、および
前記少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれの中に含まれている、前記少なくとも１個の長さ１９のｓｉＲＮＡの全てに対して、前記予想オフターゲット効果を平均化するステップを含む、少なくとも１個の長さｙの潜在的ｓｉＲＮＡのそれぞれについて平均予想オフターゲット効果を決定するためのコード
を含むコンピューター装置。
少なくとも一個の長さｘの潜在的ｓｉＲＮＡについて行う第１の配列分析が、さらに、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される一つまたは複数の値を割り当てるステップを含む、請求項４９に記載のコンピューター装置。
第１の配列分析が、さらに、加重値、Ｇ／Ｃ値、末端領域エネルギー値、末端領域Ａ／Ｕ値、末端比エネルギー値、エネルギープロフィール値、融解温度値、Ｇ／Ｃストレッチ値、および追加の標的値から選択される少なくとも一つの値に従って、少なくとも一個の長さｘの潜在的ｓｉＲＮＡをソートするステップを含む、請求項５０に記載のコンピューター装置。