本発明は、mRNAのインビトロ転写の鋳型として最適化されたDNA配列を調製するための方法を提供することによって、この必要性に対処する。これらのDNA配列は、RNAポリメラーゼによる転写の早期終結を回避するために最適化されている。加えて、本発明はまた、その3’末端で1つ以上の終結シグナルを含む最適化されたDNA配列を調製するための方法も提供する。終結シグナルは、「ランオフ」転写を低減又は防止するため、これらの最適化されたDNA配列の使用は、二本鎖mRNA転写物の形成を最小限に抑える。
一態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化DNA配列を調製するための方法に関し、当該方法は、(a)タンパク質コード配列を含むDNA配列を提供することと、(b)DNA配列中の終結シグナルの存在を決定することであって、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を有し、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される、決定することと、(c)1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾することであって、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される、修飾することと、を含む。
いくつかの実施形態では、ステップb及びcは、コンピュータによって実施される。
いくつかの実施形態では、DNA配列は、5’UTRをコードする第1の核酸配列、及び/又は3’UTRをコードする第2の核酸配列を更に含む。
いくつかの実施形態では、DNA配列中の終結シグナルの3’の直近の5つのヌクレオチドは、3つ以上のTヌクレオチドを含まない。
いくつかの実施形態では、方法は、同じタンパク質配列をコードする野生型DNA配列と比較して、(a)mRNAプロセシング及び安定性に関連する要素、並びに/又は(b)翻訳若しくはタンパク質折り畳みに関連する要素を、最適化するためにDNA配列を修飾するステップを更に含み、修飾は、最適化されたDNA配列が生成される前に行われる。mRNA処理又は安定性に関連する要素には、隠れた(cryptic)スプライス部位、mRNA二次構造、mRNAの安定した自由エネルギー、反復配列、及びRNA不安定性モチーフが含まれ得る。翻訳又はタンパク質折り畳みに関連する要素は、コドン使用頻度バイアス、コドン適応性、内部Chi部位、リボソーム結合部位、未成熟ポリA(premature polyA)部位、シャイン-ダルガーノ配列、コドンコンテキスト、コドン-アンチコドン相互作用、及び翻訳休止部位(translational pause site)を含み得る。
いくつかの実施形態では、方法は、最適化されたDNA配列を合成するステップを更に含む。方法は、合成された最適化されたDNA配列を、インビトロ転写を使用するための核酸ベクターに挿入することを更に含んでもよい。核酸ベクターは、最適化されたDNA配列に作動可能に連結されたRNAポリメラーゼプロモーターを含み得、任意選択的に、RNAポリメラーゼは、SP6 RNAポリメラーゼ又はT7 RNAポリメラーゼである。いくつかの実施形態では、核酸ベクターは、プラスミドである。プラスミドは、インビトロ転写前に線状化されてもよい。
いくつかの実施形態では、本方法は、合成された最適化されたDNA配列をインビトロ転写で使用してmRNAを合成することを更に含む。mRNAは、SP6 RNAポリメラーゼによって合成されてもよい。SP6 RNAポリメラーゼは、天然由来のSP6 RNAポリメラーゼ又は組換えSP6ポリメラーゼであってもよい。組換えSP6ポリメラーゼは、タグ(例えば、his-タグ)を含んでもよい。いくつかの実施形態では、mRNAは、T7 RNAポリメラーゼによって合成される。
いくつかの実施形態では、この方法は、合成されたmRNAをキャッピング及び/又はテーリングする別個のステップを更に含む。いくつかの実施形態では、キャッピング及びテーリングは、インビトロ転写中に起こる。
いくつかの実施形態では、mRNAは、各NTPが1~10mMの範囲の濃度のNTP、0.01~0.5mg/mlの範囲の濃度のDNA鋳型、及び0.01~0.1mg/mlの範囲の濃度のSP6 RNAポリメラーゼを含む反応混合物で合成される。例えば、反応混合物は、5mMの濃度のNTP、0.1mg/mlの濃度のDNA鋳型、及び0.05mg/mlの濃度のSP6 RNAポリメラーゼを含んでもよい。NTPは、天然由来のNTPであってもよく、又は修飾NTPを含んでもよい。
いくつかの実施形態では、mRNAは、37~56℃の範囲の温度で合成されてもよい。
いくつかの実施形態では、コンピュータプログラムは、プログラムがコンピュータによって実行されるとき、コンピュータに、(a)タンパク質コード配列を含むDNA配列を受信させ、及び(b)本発明のインビトロ転写のための鋳型としてタンパク質をコードする最適化されたDNA配列を調製するための上記の方法のステップ(b)及び(c)を実施させる命令を含む。本発明はまた、本発明のコンピュータプログラムを記憶させたコンピュータ可読データキャリアを提供する。本発明は更に、本発明のコンピュータプログラムを搬送するデータキャリア信号を提供する。本発明は更に、本発明のインビトロ転写のための鋳型としてタンパク質をコードする最適化されたDNA配列を調製するための方法を実施するための手段を含む、データ処理システムを提供する。
別の態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化されたDNA配列を調製するための方法に関し、当該方法は、(a)タンパク質をコードするDNA配列を提供することと、(b)DNA配列の3’末端に1つ以上の終結シグナルを付加して、最適化されたDNA配列を提供することと、を含み、1つ以上の終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を含み、式中、X1、X2及びX3は独立して、A、C、T又はGから選択される。
いくつかの実施形態では、終結シグナルは、核酸配列5’-X1ATCTGTT-3’(配列番号2)を含む。
いくつかの実施形態では、X1が、Tである。いくつかの実施形態では、X1が、Cである。
いくつかの実施形態では、終結シグナルは、5’TTTTATCTGTTTTTTT-3’(配列番号3)、5’TTTTATCTGTTTTTTTTT-3’(配列番号4)、5’CGTTTTATCTGTTTTTTT-3’(配列番号5)、5’CGTTCCATCTGTTTTTTT-3’(配列番号6)、5’CGTTTTATCTGTTTGTTT-3’(配列番号7)、5’CGTTTTATCTGTTTGTTT-3’(配列番号8)、又は5’CGTTTTATCTGTTGTTTT-3’(配列番号9)から選択される。
いくつかの実施形態では、2つ以上、3つ以上、4つ以上の終結シグナルが、DNA配列の3’末端に付加される。
いくつかの実施形態では、タンパク質をコードするDNA配列は、5’UTRをコードする第1の核酸配列、及び/又は3’UTRをコードする第2の核酸配列を更に含み得る。DNA配列は、ポリAテールをコードする第3の核酸配列を更に含んでもよく、又は含んでいなくてもよい。
いくつかの実施形態では、タンパク質をコードするDNA配列は、リボザイムをコードするDNA配列を更に含まない。
いくつかの実施形態では、タンパク質をコードするDNA配列中の終結シグナルの3’の直近の5つのヌクレオチドが、3つ以上のTヌクレオチドを含まない。
いくつかの実施形態では、DNA配列は、2つ以上の終結シグナルを含み、該終結シグナルは、10塩基対以下、例えば5~10塩基対で区切られる。
いくつかの実施形態では、最適化されたDNA配列は、以下の配列:(a)5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-3’(配列番号10)又は(b)5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-(ZM)-X7ATCTX8TX9-3’(配列番号11)を含み、式中、X1、X2、X3、X4、X5、X6、X7、X8及びX9が独立して、A、C、T又はGから選択され、ZNは、N個のヌクレオチドのスペーサー配列を表し、及びZMは、M個のヌクレオチドのスペーサー配列を表し、それらの各々が独立してA、C、TのGから選択され、及び式中、N及び/又はMは独立して10以下である。いくつかの実施形態では、Nは、5、6、7、8、9又は10であり、かつ/又はMは、5、6、7、8、9、10である。いくつかの実施形態では、ZはTである。
いくつかの実施形態では、方法は、同じタンパク質配列をコードする野生型DNA配列と比較して、(a)mRNAプロセシング及び安定性に関連する要素、並びに/又は(b)翻訳若しくはタンパク質折り畳みに関連する要素を、最適化するためにDNA配列を修飾するステップを更に含み、修飾は、最適化されたDNA配列が生成される前に行われる。mRNA処理又は安定性に関連する要素には、隠れたスプライス部位、mRNA二次構造、mRNAの安定した自由エネルギー、反復配列、及びRNA不安定性モチーフが含まれ得る。翻訳又はタンパク質折り畳みに関連する要素は、コドン使用頻度バイアス、コドン適応性、内部Chi部位、リボソーム結合部位、未成熟ポリA部位、シャイン-ダルガーノ配列、コドンコンテキスト、コドン-アンチコドン相互作用、及び翻訳休止部位を含み得る。
いくつかの実施形態では、本方法は、最適化されたDNA配列を、インビトロ転写で使用するための核酸ベクターに挿入することを更に含んでもよい。
別の態様では、本発明は、インビトロ転写で使用するためのDNA配列に関し、5’から3’の順序で、(a)5’UTRと、(b)タンパク質コード配列と、(c)3’UTRと、(d)任意選択的にポリAテールをコードする核酸配列と、(e)終結シグナルと、を含み、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。いくつかの実施形態では。
いくつかの実施形態では、X1が、Tである。いくつかの実施形態では、X1が、Cである。
いくつかの実施形態では、DNA配列の終結シグナルは、5’TTTTATCTGTTTTTTT-3’(配列番号3)、5’TTTTATCTGTTTTTTTTT-3’(配列番号4)、5’CGTTTTATCTGTTTTTTT-3’(配列番号5)、5’CGTTCCATCTGTTTTTTT-3’(配列番号6)、5’CGTTTTATCTGTTTGTTT-3’(配列番号7)、5’CGTTTTATCTGTTTGTTT-3’(配列番号8)、又は5’CGTTTTATCTGTTGTTTT-3’(配列番号9)から選択される。
いくつかの実施形態では、DNA配列は、2つ以上の終結シグナル、例えば、2つ以上、3つ以上、又は4つ以上を含み得る。いくつかの実施形態では、終結シグナルは、10塩基対以下、例えば5~10塩基対で区切られる。
いくつかの実施形態では、DNA配列は、以下の配列:(a)5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-3’(配列番号10)又は(b)5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-(ZM)-X7ATCTX8TX9-3’(配列番号11)を含み、式中、X1、X2、X3、X4、X5、X6、X7、X8及びX9が独立して、A、C、T又はGから選択され、ZNは、N個のヌクレオチドのスペーサー配列を表し、及びZMは、M個のヌクレオチドのスペーサー配列を表し、それらの各々が独立してA、C、TのGから選択され、及び式中、N及び/又はMは独立して10以下である。いくつかの実施形態では、Nは、5、6、7、8、9又は10であり、かつ/又はMは、5、6、7、8、9又は10である。いくつかの実施形態では、ZはTである。
いくつかの実施形態では、終結シグナルは、DNA配列の5’UTR、タンパク質コード配列、及び3’UTRに存在しない。
いくつかの実施形態では、タンパク質をコードするDNA配列は、リボザイムをコードするDNA配列を更に含まない。
いくつかの実施形態では、DNA配列は、同じタンパク質配列をコードする野生型DNA配列と比較して、(a)mRNAプロセシング及び安定性に関連する要素、並びに/又は(b)翻訳若しくはタンパク質折り畳みに関連する要素を、最適化するために修飾される。
いくつかの実施形態では、本発明は、本発明のDNA配列を含む核酸ベクターを更に提供する。核酸ベクターは、最適化されたDNA配列に作動可能に連結されたRNAポリメラーゼプロモーターを含み得、任意選択的に、RNAポリメラーゼは、SP6 RNAポリメラーゼ又はT7 RNAポリメラーゼである。いくつかの実施形態では、核酸ベクターは、プラスミドである。
いくつかの実施形態では、本発明はまた、本発明のDNA配列又は核酸ベクターを含むインビトロ転写で使用するためのキットを提供する。キットは、NTP及びRNAを更に含み得る。
別の態様では、本発明は、mRNAの産生のための方法に関し、当該方法は、本発明の核酸ベクターを、NTP及びRNAポリメラーゼを含む反応混合物に添加することを含み、RNAポリメラーゼは、DNA配列をmRNA転写物に転写する。核酸ベクターはプラスミドであってもよく、インビトロ転写前に線状化されていてもよいし、そうでない場合もある。RNAポリメラーゼは、SP6 RNAポリメラーゼであってもよい。SP6 RNAポリメラーゼは、天然由来のSP6 RNAポリメラーゼ又は組換えSP6ポリメラーゼであってもよい。組換えSP6 RNAポリメラーゼは、タグ(例えば、his-タグ)を含んでもよい。あるいは、RNAポリメラーゼは、T7 RNAポリメラーゼであってもよい。
いくつかの実施形態では、mRNAの産生のための方法は、合成されたmRNAをキャッピング及び/又はテーリングする別個のステップを更に含む。いくつかの実施形態では、キャッピング及びテーリングは、インビトロ転写中に起こる。
いくつかの実施形態では、mRNAは、各NTPが1~10mMの範囲の濃度のNTP、0.01~0.5mg/mlの範囲の濃度のDNA鋳型、及び0.01~0.1mg/mlの範囲の濃度のSP6 RNAポリメラーゼを含む反応混合物で合成される。例えば、反応混合物は、5mMの濃度のNTP、0.1mg/mlの濃度のDNA鋳型、及び0.05mg/mlの濃度のSP6 RNAポリメラーゼを含んでもよい。NTPは、天然由来のNTPであってもよく、又は修飾NTPを含んでもよい。
いくつかの実施形態では、mRNAは、37~56℃の範囲の温度、例えば、50~52℃で合成されてもよい。
いくつかの実施形態では、mRNAの産生のための方法は、終結シグナルで終結するmRNA転写物の少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%を結果として生じ得る。終結部位は、(i)サイズが100ヌクレオチド未満の3’末端断片を生成するためのmRNAの消化、及び(ii)液体クロマトグラフィーによる3’末端断片の分析によって決定され得る。終結部位は、RNAシーケンシングによって決定されてもよい。
いくつかの実施形態では、RNAポリメラーゼは、T7 RNAポリメラーゼであり、mRNA転写物は、RNA二本鎖を実質的に含まない。mRNA転写物は、対照と比較して検出不可能なレベルのRNA二本鎖を含有してもよい。RNA二本鎖は、dsRNAに特異的に結合する抗体を用いて検出されてもよい。
本明細書に記載される任意の態様又は実施形態は、本明細書に開示される任意の他の態様又は実施形態と組み合わせることができる。本開示は、その詳細な説明と併せて記載されてきたが、前述の記載は、添付の特許請求の範囲によって定義される本開示の範囲を例示することを意図しており、限定するものではない。その他の態様、利点、及び修正は、以下の特許請求の範囲の範囲内にある。
本明細書に参照される特許及び科学文献は、当業者が利用可能な知識を確立する。本明細書に引用される全ての米国特許及び公開又は未公開の米国特許出願は、参照により組み込まれる。本明細書に引用される全ての米国特許及び公開又は未公開の米国特許出願は、参照により組み込まれる。本明細書に引用されるその他全ての公表された参考文献、文書、原稿及び科学文献は、参照により本明細書に組み込まれる。
本発明の他の特徴及び利点は、実施例を含む、図面及び以下の詳細な説明及び特許請求の範囲から明らかとなるであろう。
上記及び更なる特徴は、添付図面と併せて読む場合、以下の詳細な説明からより明確に理解されるであろう。図面は、単に例示を目的とするものであり、制限するためのものではない。
DNA鋳型配列におけるコンセンサスモチーフTATCTGTTを含む終結シグナルの意図しない存在は、SP6及びT7 RNAポリメラーゼによるインビトロ転写の早期終結をもたらし、所望される完全長mRNA転写物の収率が大幅に低下する、mRNA転写物の不均一な集団につながる可能性がある。本発明者らは、コンセンサス終結シグナルTATCTGTTの1位、6位、又は8位での単一の点変異が、インビトロ転写の早期終結を防止するのに十分であることを確認した。発明者らはまた、以前に同定されたコンセンサスモチーフTATCTGTTのそのようなバリアントが、インビトロ転写で使用するためのコドン最適化されたDNA鋳型配列に頻繁に存在することも発見した。更に、以前の研究では、コンセンサスモチーフTATCTGTTの3’の直近にあるTリッチ配列が転写の終結に必要であることが示唆されていたが(Kwon & Kang 1999,The Journal of Biological Chemistry,274:41,pp 29149-29155)、本発明者らは、これが終結シグナルの必須要素ではないことを実証した。本発明者の発見は、終結シグナルをスクリーニングし、それらをそのようなDNA鋳型配列から効果的に除去することを可能にする。
したがって、一態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化DNA配列を調製するための方法を対象とし、当該方法は、(a)タンパク質コード配列を含むDNA配列を提供すること、(b)DNA配列中の終結シグナルの存在を決定することを含み、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’を有し、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される、決定することと、(c)1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾することであって、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される、修飾することと、を含む。
SP6 RNAポリメラーゼは、T7 RNAポリメラーゼと比較して、不全型転写物(いわゆる「ショートマー」)が著しく低減したmRNAを合成するので、mRNAの大規模なインビトロ合成に比類なく好適である(WO2018/157153を参照)。更に、本発明者らは、T7 RNAポリメラーゼとは異なり、SP6 RNAポリメラーゼによって合成されるmRNA転写物が、分子内又は分子間二本鎖を形成せず、したがって、本質的に二本鎖mRNAを含まないことを本明細書に示す。
発明者らは、SP6 RNAポリメラーゼ又はT7 RNAポリメラーゼのいずれかを使用したときに、インビトロ合成中にmRNA転写物の非鋳型的な伸長(ランオフ転写)が起こることを発見した。mRNA転写物の末端に「ランオフ」配列が存在することは、様々な理由から問題となる可能性がある。例えば、得られたmRNA調製物の不均一性を増加させ、それゆえ、例えば、バッチ間変動のために、品質管理をより困難にする。「ランオフ」はまた、mRNAプロセシング及び安定性に関連する望ましくない要素をmRNA転写物に導入することもある。更に、少なくともT7 RNAポリメラーゼを用いるインビトロ転写プロセスに関して、転写の「ランオフ」は、RNA二本鎖の形成をもたらす。インビトロ合成によるmRNAの産生のための既存の方法を改善するために、本発明は、1つ以上の終結シグナルをDNA鋳型の3’末端に付加してmRNA転写物の非鋳型的な伸長を防止する方法及びDNA配列を提供する。発明者らは驚くべきことに、1つ以上の終結シグナルの付加が、RNAポリメラーゼによるそれに応じて修飾されたDNA鋳型の転写を終結させるのに非常に効果的であるため、インビトロ転写の前に、DNA鋳型を含むプラスミドを線状化する必要がなくなることを発見した。通常の制限酵素とのインキュベーションを含む線状化ステップの除去は、特に医薬品を製造するために大規模に行われた場合に、mRNAの産生において大幅なコスト削減をもたらすことができる。WO2017/009376及びWO2012/170443では、インビトロ合成によるRNAの産生のための鋳型として環状プラスミドが使用された。しかしながら、このDNA鋳型配列は、自己切断リボザイムをコードする配列と、複数の終結シグナルをコードする配列の両方を含んでいた。本発明者らは、終結配列のみの付加による、環状DNA鋳型からのインビトロ転写により、mRNA合成中に90%を超える終結効率を達成できることを初めて実証した。
したがって、更なる態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化DNA配列を調製するための方法を提供し、当該方法は、(a)タンパク質をコードするDNA配列を提供することと、(b)DNA配列の3’末端に1つ以上の終結シグナルを付加して、最適化されたDNA配列を提供することと、を含み、1つ以上の終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。本発明は、インビトロ転写で使用するためのDNA配列もまた提供し、5’から3’の順序で、(a)5’UTRと、(b)タンパク質コード配列と、(c)3’UTRと、(d)任意選択的にポリAテールをコードする核酸配列と、(e)終結シグナルと、を含み、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。更に、本発明は、典型的にはRNAポリメラーゼプロモーターに作動可能に連結されたDNA配列を含む核酸ベクター、及びRNAポリメラーゼが、DNA配列をmRNA転写物に転写する、mRNAの産生のための方法におけるこれらの核酸ベクターの使用を提供する。
本発明の様々な態様は、以下のセクションで詳細に記載される。セクションの使用は、本発明を限定することを意味しない。各セクションは、本発明の任意の態様に適用することができる。
DNA鋳型
様々な核酸鋳型が本発明で使用され得る。典型的には、完全に二本鎖であるか、又は二本鎖SP6プロモーター配列を有する大部分が一本鎖であるかのいずれかのDNA鋳型を使用することができる。
いくつかの実施形態では、合成された最適化されたDNA配列は、インビトロ転写の使用のために核酸ベクターに挿入される。いくつかの実施形態では、核酸ベクターは、プラスミドである。「プラスミド」又は「プラスミド核酸ベクター」という用語は、環状核酸分子、好ましくは人工核酸分子を指す。本発明との関連において、プラスミドDNAは、RNAをコードする配列及び/又は少なくとも1つのタンパク質、ポリペプチド又はペプチドをコードするオープンリーディングフレームを含む核酸配列など、所望の核酸配列を組み込み、又は保有するのに好適である。かかるプラスミドDNA構築物/ベクターは、発現ベクター、クローニングベクター、トランスファーベクターなどであってもよい。プラスミドDNAは、典型的には、mRNAのオープンリーディングフレーム及び5’-及び/又は3’UTRに対応する配列など、所望のmRNA転写物又はその一部に対応する(コードする)配列を含む。いくつかの実施形態では、所望のmRNA転写物に対応する配列は、ポリAテールがmRNA転写物に含まれるように、3’UTRの後にポリAテールをコードしてもよい。より典型的には、本発明との関連において、所望のmRNA転写物に対応する配列は、5’/3’UTR及びオープンリーディングフレームから構成される。本発明の後続の実施形態では、インビトロ転写中にDNAプラスミドから合成されたmRNA転写物は、ポリAテールを含有せず、ポリAテールを付加するためにmRNA転写物の合成後のプロセシングが必要とされる。
発現ベクターは、RNA、例えば、RNAインビトロ転写と呼ばれるプロセスにおけるmRNAなどの発現産物の産生に使用され得る。例えば、発現ベクターは、プロモーター配列、例えばT3、T7又はSP6 RNAポリメラーゼプロモーター配列などのRNAポリメラーゼプロモーター配列など、ベクターの配列ストレッチのRNAインビトロ転写に必要な配列を含んでもよい。
クローニングベクターは、典型的には、核酸配列をベクターに組み込む(挿入)ために使用され得るクローニング部位を含有するベクターである。クローニングベクターは、例えば、プラスミドベクター又はバクテリオファージベクターであってもよい。トランスファーベクターは、核酸分子を細胞又は生物体に導入するのに好適なベクターであり、例えばウイルスベクターである。本発明との使用に好適なプラスミドDNAベクターは、典型的には、多重クローニング部位、RNAポリメラーゼプロモーター配列、任意選択には抗生物質耐性因子などの選択マーカー、及び複製起点などのベクターの増殖に好適な配列を含む。特に、T3、T7及びSP6などのDNA依存性RNAポリメラーゼのプロモーターを含むプラスミドDNAベクター、又は発現ベクターが好適である。本発明を実施するための適切なプラスミドとしては、例えば、pUC19及びpBR322が挙げられる。
線状化プラスミドDNA(1つ以上の制限酵素を介して線状化)、線状化ゲノムDNA断片(制限酵素及び/又は物理的手段を介して)、PCR産物、及び/又は合成DNAオリゴヌクレオチドは、転写されるDNA配列の上流に(及び正しい向きで)二本鎖SP6プロモーターを含有する場合はSP6/T7 RNAポリメラーゼを用いた、又は、転写されるDNA配列の上流に(及び正しい向きで)二本鎖T7プロモーターを含有する場合はT7 RNAポリメラーゼを用いた、インビトロ転写の鋳型として使用することができる。
いくつかの実施形態では、線状化DNA鋳型は、平滑末端を有する。
本発明の特定の実施形態では、プラスミドDNAは、インビトロ転写のための線状化を必要としない。具体的には、本発明は、インビトロ転写のためのSP6/T7RNAポリメラーゼを使用して、プラスミドDNA(典型的にはスーパーコイル化される)などの環状核酸ベクターからmRNA転写物を作製することを初めて可能にする。
いくつかの実施形態では、DNA鋳型には、5’及び/又は3’非翻訳領域を含む。いくつかの実施形態では、5’非翻訳領域は、mRNAの安定性又は翻訳に影響を及ぼす1つ以上の要素、例えば、鉄応答要素を含む。いくつかの実施形態では、5’非翻訳領域は、約50~500ヌクレオチド長であり得る。
いくつかの実施形態では、3’非翻訳領域は、ポリアデニル化シグナル、細胞におけるmRNAの位置安定性に影響するタンパク質の結合部位、又はmiRNAの1つ以上の結合部位のうちの1つ以上を含む。いくつかの実施形態では、3’非翻訳領域は、50~500ヌクレオチド長以上であり得る。
例示的な3’及び/又は5’UTR配列は、センスmRNA分子の安定性を増加させるために、安定しているmRNA分子(例えば、グロビン、アクチン、GAPDH、チューブリン、ヒストン、又はクエン酸回路酵素)から誘導することができる。例えば、5’UTR配列は、ヌクレアーゼ耐性を改善する及び/又はポリヌクレオチドの半減期を改善するために、CMV前初期1(IE1)遺伝子の部分配列又はその断片を含み得る。ポリヌクレオチドを更に安定させるために、ヒト成長ホルモン(hGH)をコードする配列又はその断片の、ポリヌクレオチド(例えば、mRNA)の3’末端又は非翻訳領域への包含も企図される。概して、これらの修飾は、ポリヌクレオチドの安定性及び/又は薬物動態特性(例えば、半減期)を、それらの修飾されていない対応物と比較して改善し、例えば、そのようなポリヌクレオチドのインビボヌクレアーゼ消化に対する耐性を改善するために行われる修飾を含む。
配列最適化
本発明の一態様は、DNA鋳型内の終結配列を除去して、最適化されたDNA配列を調製することに関する。本方法は、特に、DNA配列中の終結シグナルの存在を決定するステップと、1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位、及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾するステップを含み、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される。終結シグナルは、DNA配列の任意の場所(例えば、タンパク質コード配列をコードする領域内、5’非翻訳領域をコードする領域内、及び/又は3’非翻訳領域をコードする領域内)で検出され得る。上記のステップは、コンピュータによって行われてもよい。DNA配列内の特定の核酸配列(例えば、本発明の終結シグナル)の存在を検出し、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存する核酸置換を同定するのに適したコンピュータプログラムは、当技術分野で周知である。
転写されるDNA配列は、より効率的な転写及び/又は翻訳を促進するために更に最適化されてもよい。例えばDNA配列は、シス調節エレメント(例えば、TATAボックス、終結シグナル、及びタンパク質結合部位)、人工組換え部位、Chi部位、CpGジヌクレオチド含量、ネガティブCpGアイランド、GC含量、ポリメラーゼのずれ部位、及び/若しくは転写に関連する他の要素に関して最適化することができ、DNA配列は、隠れたスプライス部位、mRNA二次構造、mRNAの安定した自由エネルギー、反復配列、RNA不安定性モチーフ、及び/若しくはmRNAの処理と安定性に関連する他の要素に関して最適化することができ、DNA配列は、コドン使用頻度バイアス、コドン適応性、内部Chi部位、リボソーム結合部位(例えば、IRES)、未成熟ポリA部位、シャイン-ダルガーノ(SD)配列、及び/若しくは翻訳に関連するその他の要素に関して最適化することができ、並びに/又はDNA配列は、コドンコンテキスト、コドン-アンチコドン相互作用、翻訳休止部位、及び/若しくはタンパク質折り畳みに関連する他の要素に関して最適化することができる。当技術分野で既知の最適化方法、例えば、US2011/0081708に記載されている、ThermoFisherによるGeneOptimizer及びOptimumGene(商標)が、本発明で使用されてもよく、その内容は参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態では、コドン最適化アルゴリズムを使用して、DNA配列を修飾し、より効率的な転写及び/又は翻訳を促進する。いくつかの実施形態では、コドン最適化アルゴリズムは、DNA配列中の終結シグナルの存在を決定する。いくつかの実施形態では、コドン最適化アルゴリズムは、1つ以上の核酸を置換することによってDNA配列を修飾し、必要に応じて、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するため1つ以上の置換核酸を選択してもよい。
特定の実施形態では、コドン最適化アルゴリズムは、DNA配列中の終結シグナルの存在を決定し、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’を有し、式中、X1、X2及びX3が独立して、A、C、T又はGから選択され、1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾し、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される。
コドン最適化アルゴリズムは、コドン適応指標(CAI)を最大化することによって配列を生成する。CAIは、参照遺伝子のセットからの配列の偏差を測定するためのコドン使用バイアスの数値スコアである。いくつかの実施形態では、参照セットの遺伝子は哺乳類遺伝子である。特定の実施形態では、参照セットの遺伝子はヒト遺伝子である。CAIは、典型的には、目的のタンパク質コドン配列中の全てのコドンの使用頻度に基づいて計算される。第1のステップでは、コドン最適化アルゴリズムは、入力タンパク質コドン配列を繰り返し修正し、最適なCAIを有する第1の出力配列を達成する。第2のステップでは、第1の出力配列は、転写又は翻訳レベルで遺伝子発現にマイナスの影響を与えることが知られている配列要素の存在について分析される。これには、本明細書に記載される終結シグナルが含まれる。こうした配列要素が同定された場合、コドン最適化アルゴリズムは、それらを除去するために第1の出力配列を修正し、それによって第2の出力配列を生成する。同じステップ又は後続するステップでは、第1の出力配列又は第2の出力配列も、以下のパラメータのうちの1つ以上について分析される:GC含量、コードされたmRNA転写物の安定した自由エネルギー、及びアウトオブフレームの開始コドンの存在。必要に応じて、第1又は第2の出力配列は、これらのパラメータのうちの1つ以上を最適化するように修正される。例えば、任意のアウトオブフレーム開始コドンは、適切なコドン置換によって除去されてもよい。GC含量が低い出力配列は、通常、GC含量が高い出力配列よりも、自由エネルギーの負の値が高い。自由エネルギーの最も負の値は、最も構造化され、それに応じて最も安定したmRNA転写物をもたらすと考えられる。したがって、いくつかの実施形態では、アルゴリズムは、更なるコドン置換によって第1又は第2の出力配列のGC含量を増加させる。
終結シグナルの標的挿入
本発明の別の態様は、インビトロ転写の鋳型として最適化されたDNA配列を調製するために、目的のタンパク質(例えば、治療用タンパク質)をコードするDNA配列の3’末端に、1つ以上の終結シグナルを含有させることに関する。mRNA転写物をコードするDNA配列の3’末端での1つ以上の終結シグナル(例えば、2つ又は3つの終結シグナル)の標的挿入により、インビトロ転写前の鋳型をコードするプラスミドの線状化の必要性を不要にすることができる。したがって、一態様では、本発明は、インビトロ転写で使用するためのDNA配列であって、5’から3’の順序で、
・5’UTRと、
・タンパク質コード配列と、
・3’UTRと、
・任意選択的に、ポリAテールをコードする核酸配列と、
-終結シグナルと、を含む、DNA配列に関する。
本発明によれば、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。一実施形態では、終結シグナルは、核酸配列5’-X1ATCTGTT-3’を含む。X1は、T又はCであってもよい。好適な終結は、5’--TTTTATCTGTTTTTTT-3’、5’--TTTTATCTGTTTTTTTTT-3’、5’--CGTTTTATCTGTTTTTTT-3’、5’--CGTTCCATCTGTTTTTTT-3’、5’--CGTTTTATCTGTTTGTTT-3’、5’--CGTTTTATCTGTTTGTTT-3’、又は5’--CGTTTTATCTGTTGTTTT-3’から選択され得る。
典型的には、DNA配列は、2つ以上の終結シグナル、例えば、2つ以上、3つ以上、又は4つ以上を含む。発明者らは、効果的な終結が発生するためには、終結シグナルは10塩基対以下で区切られ得、例えば5~10塩基対で区切られ得ることを示した。いくつかの実施形態では、DNA配列は、長さ30ヌクレオチドのヌクレオチド配列内に2つの終結シグナル(例えば、5’-X
1ATCTX
2TX
3-3’、式中、X
1、X
2及びX
3が独立して、A、C、T又はGから選択される)を含む。したがって、いくつかの実施形態では、本発明で使用するためのDNA配列は、その3’末端に以下の配列:5’-X
1ATCTX
2TX
3-(Z
N)-X
4ATCTX
5TX
6-3’を含み、式中、X
1、X
2、X
3、X
4、X
5及びX
6は独立して、A、C、T又はGから選択され、Z
Nが、N個のヌクレオチドのスペーサー配列を表し、その各々は独立してA、C、TのGから選択され、Nは10以下である。例えば、Nは、5、6、7、8、9、又は10とすることができる。ZはTであってもよい。いくつかの実施形態では、DNA配列は、以下の配列を含む:TTTTATCTGTTTTTTTTTTTTTATCTGTTTTTTTTT(配列番号12).他の実施形態では、DNA配列は、長さ50ヌクレオチドのヌクレオチド配列内に3つの終結シグナル(例えば、5’-X
1ATCTX
2TX
3-3’、式中、X
1、X
2及びX
3が独立して、A、C、T又はGから選択される)を含む。したがって、いくつかの実施形態では、本発明で使用するためのDNA配列は、その3’末端に以下の配列:5’-X
1ATCTX
2TX3-(Z
N)-X
4ATCTX
5TX
6-(Z
M)-X
7ATCTX
8TX
9-3’を含み、式中、X
1、X
2、X
3、X
4、X
5、X
6、X
7、X
8及びX
9が独立して、A、C、T又はGから選択され、Z
Nが、N個のヌクレオチドのスペーサー配列を表し、Z
Mが、M個のヌクレオチドのスペーサー配列を表し、それらの各々は独立してA、C、TのGから選択され、N及び/又はMは、10以下である。例えば、Nは、5、6、7、8、9、又は10とすることができる。Mは、5、6、7、8、9、又は10とすることができる。Zは、Tであってもよい。特定の実施形態では、DNA配列は、その3’末端に以下の配列を含む:
本明細書で示されるように、DNA配列の3’末端に連続して2つの終結シグナルを有することは、インビトロ転写の効果的な終結をもたらすことができる。本出願の例は、mRNA転写物をコードするDNA配列の3’末端に終結シグナルの3コピー以上が存在する場合、100%に近づく正しく終結されたmRNA転写物の収率に到達できることを更に実証する。特に、DNA配列の3’末端に3つ以上の終結シグナルを連続で付加することは、100%終結をもたらすことができる。この観察は、インビトロ転写を37℃で実行したときに行われた。
更に、本発明者らは、DNA配列の末端でのインビトロ転写の効果的な終結には、10ヌクレオチド(例えば、T)以下の間隔での配列(例えば、
)における2つ又は3つ(又はそれ以上)の終結シグナルの最小限の終結配列で、十分であることを示した。したがって、本発明で使用するDNA配列は、いかなる更なる終結シグナル及び/又は配列も含まない。本発明の最小限の終結配列を有するDNA配列は、3’末端のリボザイム配列又は代替的な終結シグナルを必要とせずに、正しく終結されたmRNA転写物を産生することができる。したがって、いくつかの実施形態では、DNA配列は、その3’末端にリボザイムをコードする更なる配列を含まない。加えて、又は代替的に、DNA配列は、クラスI終結シグナルを含まない。実際に、本明細書に開示される最小限の終結配列に加えて、インビトロ転写終結をもたらすために、他の終結シグナルは必要とされない。
本発明によれば、RNAポリメラーゼがDNA配列の3’末端に到達する前にインビトロ転写の早期終結を回避するために、5’UTR、タンパク質コード配列、及びDNA配列の3’UTRには終結シグナルは存在しない。
本明細書において、前述の段落に記載されるDNA配列を調製するための方法も提供される。方法は、(a)タンパク質をコードするDNA配列を提供することと、(b)DNA配列の3’末端に1つ以上の終結シグナルを付加してDNA配列を提供することとを含み、1つ以上の終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。いくつかの実施形態では、DNA配列の3’末端で付加される終結シグナルは、以下の配列を含む:TTTTATCTGTTTTTTTTTT(配列番号14)。
本出願の実施例は、2つ以上の終結シグナルの付加が、線状DNA鋳型及びスーパーコイルDNA鋳型の両方について、インビトロ転写中のmRNA転写物の望ましくない伸長の低下をもたらすことを実証する。したがって、いくつかの実施形態では、2つ以上、3つ以上、4つ以上の終結シグナルが、DNA配列の3’末端に付加される。いくつかの実施形態では、3’末端に付加される終結配列は、長さ30ヌクレオチドのヌクレオチド配列内に2つの終結シグナル(例えば、5’-X1ATCTX2TX3-3’、式中、X1、X2及びX3は独立して、A、C、T又はGから選択される)を含むか、又はそれからなる。いくつかの実施形態では、3’末端に付加される終結配列は、以下の配列:5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-3’を含むか、又はそれからなり、式中、X1、X2、X3、X4、X5、及びX6が独立して、A、C、T又はGから選択され、ZNは、N個のヌクレオチドのスペーサー配列を表し、その各々は独立してA、C、TのGから選択され、Nは10以下である。いくつかの実施形態では、終結配列は、以下の配列を含むか、又はそれらからなる:TTTTATCTGTTTTTTTTTTTTTATCTGTTTTTTTTT(配列番号12)。
いくつかの実施形態では、3’末端に付加される終結配列は、長さ50ヌクレオチドのヌクレオチド配列内に3つの終結シグナル(例えば、5’-X
1ATCTX
2TX
3-3’、式中、X
1、X
2及びX
3が独立して、A、C、T又はGから選択される)を含むか、又はからなる。いくつかの実施形態では、3つの終結シグナルが、DNA配列の3’末端に付加される。いくつかの実施形態では、3’末端に付加される終結配列は、以下の配列:5’-X
1ATCTX
2TX
3-(Z
N)-X
4ATCTX
5TX
6-(Z
M)-X
7ATCTX
8TX
9-3’を含むか、又はそれらからなり、式中、X
1、X
2、X
3、X
4、X
5、X
6、X
7、X
8及びX
9が独立して、A、C、T、又はGから選択され、Z
Nが、N個のヌクレオチドのスペーサー配列を表し、Z
Mが、M個のヌクレオチドのスペーサー配列を表し、それらの各々は独立してA、C、TのGから選択され、N及び/又はMは、10以下である。いくつかの実施形態では、終結配列は、以下の配列を含むか、又はそれらからなる:
SP6 RNAポリメラーゼ
SP6 RNAポリメラーゼは、SP6プロモーター配列に対して高い配列特異性を有するDNA依存性RNAポリメラーゼである。典型的には、このポリメラーゼは、そのプロモーターの下流にある一本鎖DNA又は二本鎖DNAのいずれかで、RNAの5’→3’インビトロ合成を触媒し、天然リボヌクレオチド及び/又は修飾リボヌクレオチドを重合転写物に組み込む。
バクテリオファージSP6 RNAポリメラーゼの配列は、最初に以下のアミノ酸配列を有するものとして記載されていた(GenBank:Y00105.1):
MQDLHAIQLQLEEEMFNGGIRRFEADQQRQIAAGSESDTAWNRRLLSELIAPMAEGIQAYKEEYEGKKGRAPRALAFLQCVENEVAAYITMKVVMDMLNTDATLQAIAMSVAERIEDQVRFSKLEGHAAKYFEKVKKSLKASRTKSYRHAHNVAVVAEKSVAEKDADFDRWEAWPKETQLQIGTTLLEILEGSVFYNGEPVFMRAMRTYGGKTIYYLQTSESVGQWISAFKEHVAQLSPAYAPCVIPPRPWRTPFNGGFHTEKVASRIRLVKGNREHVRKLTQKQMPKVYKAINALQNTQWQINKDVLAVIEEVIRLDLGYGVPSFKPLIDKENKPANPVPVEFQHLRGRELKEMLSPEQWQQFINWKGECARLYTAETKRGSKSAAVVRMVGQARKYSAFESIYFVYAMDSRSRVYVQSSTLSPQSNDLGKALLRFTEGRPVNGVEALKWFCINGANLWGWDKKTFDVRVSNVLDEEFQDMCRDIAADPLTFTQWAKADAPYEFLAWCFEYAQYLDLVDEGRADEFRTHLPVHQDGSCSGIQHYSAMLRDEVGAKAVNLKPSDAPQDIYGAVAQVVIKKNALYMDADDATTFTSGSVTLSGTELRAMASAWDSIGITRSLTKKPVMTLPYGSTRLTCRESVIDYIVDLEEKEAQKAVAEGRTANKVHPFEDDRQDYLTPGAAYNYMTALIWPSISEVVKAPIVAMKMIRQLARFAAKRNEGLMYTLPTGFILEQKIMATEMLRVRTCLMGDIKMSLQVETDIVDEAAMMGAAAPNFVHGHDASHLILTVCELVDKGVTSIAVIHDSFGTHADNTLTLRVALKGQMVAMYIDGNALQKLLEEHEVRWMVDTGIEVPEQGEFDLNEIMDSEYVFA(配列番号15)。
本発明に適したSP6 RNAポリメラーゼは、バクテリオファージSP6 RNAポリメラーゼと実質的に同じポリメラーゼ活性を有する任意の酵素であってもよい。したがって、いくつかの実施形態では、本発明に適したSP6 RNAポリメラーゼは、配列番号 15から修飾され得る。例えば、好適なSP6 RNAポリメラーゼは、1つ以上のアミノ酸置換、欠失、又は付加を含有してもよい。いくつかの実施形態では、好適なSP6 RNAポリメラーゼは、配列番号15と約99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、75%、70%、65%、又は60%同一又は相同であるアミノ酸配列を有する。いくつかの実施形態では、好適なSP6 RNAポリメラーゼは、(N末端、C末端、又は内部からの)トランケートタンパク質であり得るが、ポリメラーゼ活性は保持される。いくつかの実施形態では、好適なSP6 RNAポリメラーゼは融合タンパク質である。
いくつかの実施形態では、SP6 RNAポリメラーゼは、以下のヌクレオチド配列を有する遺伝子によってコードされる:ATGCAAGATTTACACGCTATCCAGCTTCAATTAGAAGAAGAGATGTTTAATGGTGGCATTCGTCGCTTCGAAGCAGATCAACAACGCCAGATTGCAGCAGGTAGCGAGAGCGACACAGCATGGAACCGCCGCCTGTTGTCAGAACTTATTGCACCTATGGCTGAAGGCATTCAGGCTTATAAAGAAGAGTACGAAGGTAAGAAAGGTCGTGCACCTCGCGCATTGGCTTTCTTACAATGTGTAGAAAATGAAGTTGCAGCATACATCACTATGAAAGTTGTTATGGATATGCTGAATACGGATGCTACCCTTCAGGCTATTGCAATGAGTGTAGCAGAACGCATTGAAGACCAAGTGCGCTTTTCTAAGCTAGAAGGTCACGCCGCTAAATACTTTGAGAAGGTTAAGAAGTCACTCAAGGCTAGCCGTACTAAGTCATATCGTCACGCTCATAACGTAGCTGTAGTTGCTGAAAAATCAGTTGCAGAAAAGGACGCGGACTTTGACCGTTGGGAGGCGTGGCCAAAAGAAACTCAATTGCAGATTGGTACTACCTTGCTTGAAATCTTAGAAGGTAGCGTTTTCTATAATGGTGAACCTGTATTTATGCGTGCTATGCGCACTTATGGCGGAAAGACTATTTACTACTTACAAACTTCTGAAAGTGTAGGCCAGTGGATTAGCGCATTCAAAGAGCACGTAGCGCAATTAAGCCCAGCTTATGCCCCTTGCGTAATCCCTCCTCGTCCTTGGAGAACTCCATTTAATGGAGGGTTCCATACTGAGAAGGTAGCTAGCCGTATCCGTCTTGTAAAAGGTAACCGTGAGCATGTACGCAAGTTGACTCAAAAGCAAATGCCAAAGGTTTATAAGGCTATCAACGCATTACAAAATACACAATGGCAAATCAACAAGGATGTATTAGCAGTTATTGAAGAAGTAATCCGCTTAGACCTTGGTTATGGTGTACCTTCCTTCAAGCCACTGATTGACAAGGAGAACAAGCCAGCTAACCCGGTACCTGTTGAATTCCAACACCTGCGCGGTCGTGAACTGAAAGAGATGCTATCACCTGAGCAGTGGCAACAATTCATTAACTGGAAAGGCGAATGCGCGCGCCTATATACCGCAGAAACTAAGCGCGGTTCAAAGTCCGCCGCCGTTGTTCGCATGGTAGGACAGGCCCGTAAATATAGCGCCTTTGAATCCATTTACTTCGTGTACGCAATGGATAGCCGCAGCCGTGTCTATGTGCAATCTAGCACGCTCTCTCCGCAGTCTAACGACTTAGGTAAGGCATTACTCCGCTTTACCGAGGGACGCCCTGTGAATGGCGTAGAAGCGCTTAAATGGTTCTGCATCAATGGTGCTAACCTTTGGGGATGGGACAAGAAAACTTTTGATGTGCGCGTGTCTAACGTATTAGATGAGGAATTCCAAGATATGTGTCGAGACATCGCCGCAGACCCTCTCACATTCACCCAATGGGCTAAAGCTGATGCACCTTATGAATTCCTCGCTTGGTGCTTTGAGTATGCTCAATACCTTGATTTGGTGGATGAAGGAAGGGCCGACGAATTCCGCACTCACCTACCAGTACATCAGGACGGGTCTTGTTCAGGCATTCAGCACTATAGTGCTATGCTTCGCGACGAAGTAGGGGCCAAAGCTGTTAACCTGAAACCCTCCGATGCACCGCAGGATATCTATGGGGCGGTGGCGCAAGTGGTTATCAAGAAGAATGCGCTATATATGGATGCGGACGATGCAACCACGTTTACTTCTGGTAGCGTCACGCTGTCCGGTACAGAACTGCGAGCAATGGCTAGCGCATGGGATAGTATTGGTATTACCCGTAGCTTAACCAAAAAGCCCGTGATGACCTTGCCATATGGTTCTACTCGCTTAACTTGCCGTGAATCTGTGATTGATTACATCGTAGACTTAGAGGAAAAAGAGGCGCAGAAGGCAGTAGCAGAAGGGCGGACGGCAAACAAGGTACATCCTTTTGAAGACGATCGTCAAGATTACTTGACTCCGGGCGCAGCTTACAACTACATGACGGCACTAATCTGGCCTTCTATTTCTGAAGTAGTTAAGGCACCGATAGTAGCTATGAAGATGATACGCCAGCTTGCACGCTTTGCAGCGAAACGTAATGAAGGCCTGATGTACACCCTGCCTACTGGCTTCATCTTAGAACAGAAGATCATGGCAACCGAGATGCTACGCGTGCGTACCTGTCTGATGGGTGATATCAAGATGTCCCTTCAGGTTGAAACGGATATCGTAGATGAAGCCGCTATGATGGGAGCAGCAGCACCTAATTTCGTACACGGTCATGACGCAAGTCACCTTATCCTTACCGTATGTGAATTGGTAGACAAGGGCGTAACTAGTATCGCTGTAATCCACGACTCTTTTGGTACTCATGCAGACAACACCCTCACTCTTAGAGTGGCACTTAAAGGGCAGATGGTTGCAATGTATATTGATGGTAATGCGCTTCAGAAACTACTGGAGGAGCATGAAGTGCGCTGGATGGTTGATACAGGTATCGAAGTACCTGAGCAAGGGGAGTTCGACCTTAACGAAATCATGGATTCTGAATACGTATTTGCCTAA(配列番号16)。
本発明においてSP6 RNAポリメラーゼをコードする好適な遺伝子は、配列番号16と約99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、又は80%同一又は相同であり得る。
本発明に適したSP6 RNAポリメラーゼは、例えば、Ambion、New England Biolabs(NEB)、Promega、及びRocheからの市販製品であってもよい。SP6は、本明細書に記載される配列番号15のアミノ酸配列、又は配列番号15のバリアントに従って、市販の供給源若しくは非市販の供給源から注文及び/又はカスタム設計されてもよい。SP6 RNAポリメラーゼは、標準忠実度のポリメラーゼであってもよく、又は、RNAポリメラーゼ活性を促進するために修飾された(例えば、SP6 RNAポリメラーゼ遺伝子の変異、又はSP6 RNAポリメラーゼ自体の翻訳後修飾)高忠実度/高効率/高能力のものであってもよい。こうした修飾SP6の例としては、AmbionのSP6 RNA Polymerase-Plus(商標)、NEBのHiScribe SP6、及びPromegaのRiboMAX(商標)及びRiboprobe(登録商標)システムが挙げられる。
いくつかの実施形態では、SP6 RNAポリメラーゼは、熱安定性である。特定の実施形態では、本発明で使用するためのSP6 RNAポリメラーゼのアミノ酸配列は、37℃~56℃の範囲の温度で酵素を活性化させる野生型SP6ポリメラーゼと比較して1つ以上の変異を含有する。いくつかの実施形態では、本発明で使用するためのSP6 RNAポリメラーゼは、50℃~52℃の最適温度で機能する。他の実施形態では、本発明で使用するためのSP6 RNAポリメラーゼは、50℃で少なくとも60分の半減期を有する。例えば、本発明で使用するのに特に好適なSP6 RNAポリメラーゼは、50℃で60分~120分(例えば、70分~100分、又は80分~90分)の半減期を有する。
いくつかの実施形態では、好適なSP6 RNAポリメラーゼは融合タンパク質である。例えば、SP6 RNAポリメラーゼは、酵素の単離、精製、又は溶解性を促進するための1つ以上のタグを含み得る。適切なタグは、N末端、C末端、及び/又は内部に配置され得る。好適なタグの非限定的な例としては、カルモジュリン結合タンパク質(CBP)、Fasciola hepatica 8-kDa抗原(Fh8)、FLAGタグペプチド、グルタチオン-S-トランスフェラーゼ(GST)、ヒスチジンタグ(例えば、ヘキサヒスチジンタグ(His6))、マルトース結合タンパク質(MBP)、N-利用物質(NusA)、低分子ユビキチン様修飾因子(SUMO)融合タグ、ストレプトアビジン結合ペプチド(STREP)、タンデムアフィニティ精製(TAP)、及びチオレドキシン(TrxA)が挙げられる。本発明では他のタグを使用することができる。これら及び他の融合タグは、例えば、Costa et al.Frontiers in Microbiology 5(2014):63及びPCT/US16/57044に記載されており、その内容は参照によりその全体が本明細書に組み込まれる。いくつかの実施形態では、Hisタグは、SP6のN末端に位置する。
SP6プロモーター
SP6 RNAポリメラーゼによって認識され得る任意のプロモーターが、本発明で使用され得る。典型的には、SP6プロモーターは、5’ATTTAGGTGACACTATAG-3’(配列番号17)を含む。SP6プロモーターのバリアントは、そのプロモーターに対するSP6の認識及び/又は結合を最適化するように発見及び/又は作製されている。非限定的なバリアントには、以下が含まれるが、これらに限定されない。5’-ATTTAGGGGACACTATAGAAGAG-3’、5’-ATTTAGGGGACACTATAGAAGG-3’、5’-ATTTAGGGGACACTATAGAAGGG-3’、5’-ATTTAGGTGACACTATAGAA-3’、5’-ATTTAGGTGACACTATAGAAGA-3’、5’-ATTTAGGTGACACTATAGAAGAG-3’、5’-ATTTAGGTGACACTATAGAAGG-3’、5’-ATTTAGGTGACACTATAGAAGGG-3’、5’-ATTTAGGTGACACTATAGAAGNG-3’、及び5’-CATACGATTTAGGTGACACTATAG-3’(配列番号18~配列番号27)。
更に、本発明に適したSP6プロモーターは、配列番号18~配列番号27のうちのいずれか1つと約95%、90%、85%、80%m、75%、又は70%同一又は相同であり得る。更に、本発明に好適なSP6プロモーターは、本明細書に記載されるプロモーター配列のいずれかに対して、5’及び/又は3’に1つ以上の追加のヌクレオチドを含み得る。
T7 RNAポリメラーゼ
T7 RNAポリメラーゼは、T7プロモーター配列に対して高い配列特異性を有するDNA依存性RNAポリメラーゼである。典型的には、このポリメラーゼは、そのプロモーターの下流にある一本鎖DNA又は二本鎖DNAのいずれかで、RNAの5’→3’インビトロ合成を触媒し、天然リボヌクレオチド及び/又は修飾リボヌクレオチドを重合転写物に組み込む。
いくつかの実施形態では、T7 RNAポリメラーゼは、熱安定性である。特定の実施形態では、本発明で使用するためのT7 RNAポリメラーゼのアミノ酸配列は、37℃~56℃の範囲の温度で酵素を活性化させる野生型T7ポリメラーゼと比較して1つ以上の変異を含有する。適切なRNAポリメラーゼの例は、NEBからのHi-T7(登録商標)RNAポリメラーゼである。いくつかの実施形態では、本発明で使用するためのT7 RNAポリメラーゼは、50℃~52℃の最適温度で機能する。他の実施形態では、本発明で使用するためのT7 RNAポリメラーゼは、50℃で少なくとも60分の半減期を有する。例えば、本発明で使用するのに特に好適なT7 RNAポリメラーゼは、50℃で60分~120分(例えば、70分~100分、又は80分~90分)の半減期を有する。
T7 プロモーター
T7 RNAポリメラーゼによって認識され得る任意のプロモーターが、本発明で使用され得る。典型的には、T7プロモーターは、5’-TAATACGACTCACTATAG-3’(配列番号28)を含む。
mRNA合成
本発明によるmRNAは、様々な既知の方法のうちのいずれかに従って合成され得る。様々な方法が、公開された米国特許出願第2018/0258423号に記載され、本発明の実施に使用され得、それら全てが参照により本明細書に組み込まれる。例えば、本発明によるmRNAは、インビトロ転写(IVT)を介して合成され得る。簡潔に述べると、IVTは多くの場合、プロモーターを含む線状状又は環状のDNA鋳型、リボヌクレオチド三リン酸のプール、DTT及びマグネシウムイオンを含み得る緩衝系、並びに適切なRNAポリメラーゼ(例えば、T3、T7、又はSP6 RNAポリメラーゼ)、DNAseI、ピロホスファターゼ、並びに/又はRNAse阻害剤を用いて行われる。正確な条件は、具体的な用途によって変動するであろう。
いくつかの実施形態では、好適な鋳型配列は、タンパク質、ポリペプチド又はペプチドをコードするDNA配列である。いくつかの実施形態では、好適な鋳型配列は、ヒト細胞における効率的な発現ために最適化されたコドンである。コドン最適化は、典型的にはペプチド、ポリペプチド、又はタンパク質をコードする天然型又は野生型の核酸配列を修飾して、可能な限り最高のG/C含量を達成し、コドンの使用を調整して、希少若しくは律速コドンを回避し、不安定化核酸配列若しくはモチーフを除去し、かつ/又はmRNAコードされたペプチド、ポリペプチド、若しくはタンパク質のアミノ酸配列を変化させることなく、休止部位又は終結配列を除去することを含む。いくつかの実施形態では、好適なタンパク質コード配列は、天然由来又は野生型の配列である。いくつかの実施形態では、好適なタンパク質コード配列は、そのアミノ酸配列に1つ以上の変異を含有するタンパク質、ポリペプチド又はペプチドをコードする。
本明細書に開示される方法は、mRNAの大規模産生に使用することができる。いくつかの実施形態では、本発明による方法は、単一バッチで少なくとも100mg、150mg、200mg、300mg、400mg、500mg、600mg、700mg、800mg、900mg、1g、5g、10g、25g、50g、75g、100g、250g、500g、750g、1kg、5kg、10kg、50kg、100kg、1000kg、又はそれ以上のmRNAを合成する。いくつかの実施形態では、本発明による方法は、単一バッチで少なくとも1kg、10kg又は100kgを合成する。本明細書で使用される場合、用語「バッチ」は、一度に合成される、例えば、単一の製造設定に従って産生される、mRNAの数量(quantity)又は量(amount)を指す。バッチは、1セットの条件下での連続合成のために、酵素の単回アリコート及び/又はDNA鋳型の単回アリコートを介して発生する、1回の反応で合成されたmRNAの量を指す場合がある。単一バッチで合成されたmRNAは、所望の量を達成するために組み合わされる異なる時点で合成されたmRNAを含まない。一般に、反応混合物は、RNAポリメラーゼ、DNA鋳型、及びRNAポリメラーゼ反応緩衝液(リボヌクレオチドを含む場合もあれば、又はリボヌクレオチドの添加を必要とする場合がある)を含む。DNA鋳型は線状状であってもよいが、本発明との関連ではより典型的には環状である。
本発明によれば、典型的には、産生されるmRNAの1グラム(g)当たり1~100mgのRNAポリメラーゼが使用される。いくつかの実施形態では、産生されるmRNAの1グラム当たり約1~90mg、1~80mg、1~60mg、1~50mg、1~40mg、10~100mg、10~80mg、10~60mg、10~50mgのRNAポリメラーゼが使用される。いくつかの実施形態では、約1グラムのmRNAを産生するために約5~20mgのRNAポリメラーゼが使用される。いくつかの実施形態では、約100グラムのmRNAを産生するために約0.5~2グラムのRNAポリメラーゼが使用される。いくつかの実施形態では、約1キログラムのmRNAのために約5~20グラムのRNAポリメラーゼが使用される。いくつかの実施形態では、少なくとも1グラムのmRNAを産生するために少なくとも5mgのRNAポリメラーゼが使用される。いくつかの実施形態では、少なくとも100グラムのmRNAを産生するために少なくとも500mgのRNAポリメラーゼが使用される。いくつかの実施形態では、少なくとも1キログラムのmRNAを産生するために少なくとも5グラムのRNAポリメラーゼが使用される。いくつかの実施形態では、産生されたmRNAの1グラム当たり約10mg、20mg、30mg、40mg、50mg、60mg、70mg、80mg、90mg、又は100mgのプラスミドDNAが使用される。いくつかの実施形態では、約1グラムのmRNAを産生するために約10~30mgのプラスミドDNAが使用される。いくつかの実施形態では、約100グラムのmRNAを産生するために約1~3グラムのプラスミドDNAが使用される。いくつかの実施形態では、約1キログラムのmRNAのために約10~30グラムのプラスミドDNAが使用される。いくつかの実施形態では、少なくとも1グラムのmRNAを産生するために少なくとも10mgのプラスミドDNAが使用される。いくつかの実施形態では、少なくとも100グラムのmRNAを産生するために少なくとも1グラムのプラスミドDNAが使用される。いくつかの実施形態では、少なくとも1キログラムのmRNAを産生するために少なくとも10グラムのプラスミドDNAが使用される。
いくつかの実施形態では、反応混合物中のRNAポリメラーゼの濃度は、約1~100nM、1~90nM、1~80nM、1~70nM、1~60nM、1~50nM、1~40nM、1~30nM、1~20nM、又は約1~10nMであり得る。特定の実施形態では、RNAポリメラーゼの濃度は、約10~50nM、20~50nM、又は30~50nMである。100~10000ユニット/mlのRNAポリメラーゼの濃度を使用することができ、例として、100~9000ユニット/ml、100~8000ユニット/ml、100~7000ユニット/ml、100~6000ユニット/ml、100~5000ユニット/ml、100~1000ユニット/ml、200~2000ユニット/ml、500~1000ユニット/ml、500~2000ユニット/ml、500~3000ユニット/ml、500~4000ユニット/ml、500~5000ユニット/ml、500~6000ユニット/ml、1000~7500ユニット/ml、及び2500~5000ユニット/mlの濃度を使用することができる。
反応混合物中の各リボヌクレオチド(例えば、ATP、UTP、GTP、及びCTP)の濃度は、約0.1mM~約10mMであり、例えば、約1mM~約10mM、約2mM~約10mM、約3mM~約10mM、約1mM~約8mM、約1mM~約6mM、約3mM~約10mM、約3mM~約8mM、約3mM~約6mM、約4mM~約5mMである。いくつかの実施形態では、各リボヌクレオチドは、反応混合物中、約5mMである。いくつかの実施形態では、反応に使用されるrNTP(例えば、ATP、GTP、CTP及びUTPの組み合わせ)の総濃度は、1mM~40mMの範囲である。いくつかの実施形態では、反応に使用されるrNTP(例えば、ATP、GTP、CTP及びUTPの組み合わせ)の総濃度は、1mM~30mM、又は1mM~28mM、又は1mM~25mM、又は1mM~20mMの範囲である。いくつかの実施形態では、総rNTPs濃度は、30mM未満である。いくつかの実施形態では、総rNTPs濃度は、25mM未満である。いくつかの実施形態では、総rNTPs濃度は、20mM未満である。いくつかの実施形態では、総rNTPs濃度は、15mM未満である。いくつかの実施形態では、総rNTPs濃度は、10mM未満である。
特定の実施形態では、反応混合物中の各rNTPの濃度が、所与のmRNA転写物をコードする核酸配列中の各核酸の頻度に基づいて最適化される。具体的には、そのような配列最適化反応混合物は、mRNA転写物中のこれらの4つの核酸(A、G、C及びU)の比率に対応する、4つのrNTP(例えば、ATP、GTP、CTP及びUTP)のそれぞれの比率を含む。
いくつかの実施形態では、開始ヌクレオチドは、インビトロ転写の開始前に反応混合物に加えられる。開始ヌクレオチドは、mRNA転写物の最初のヌクレオチド(+1位)に対応するヌクレオチドである。開始ヌクレオチドは、特に、RNAポリメラーゼの開始速度を増加させるために追加されてもよい。開始ヌクレオチドは、ヌクレオシド一リン酸、ヌクレオシド二リン酸、ヌクレオシド三リン酸であってもよい。開始ヌクレオチドは、モノヌクレオチド、ジヌクレオチド、又はトリヌクレオチドであり得る。mRNA転写物の最初のヌクレオチドがGである実施形態では、開始ヌクレオチドは典型的には、GTP又はGMPである。特定の実施形態では、開始ヌクレオチドはキャップ類似体である。キャップ類似体は、G[5’]ppp[5’]G、m7G[5’]ppp[5’]G、m3
2,2,7G[5’]ppp[5’]G、m2
7,3’-OG[5’]ppp[5’]G(3’-ARCA)、m2
7,2’-OGpppG(2’-ARCA)、m2
7,2’-OGppspG D1(β-S-ARCA D1)及びm2
7,2’-OGppspG D2(β-S-ARCA D2)から選択することができる。
特定の実施形態では、RNA転写物の最初のヌクレオチドは、Gであり、開始ヌクレオチドは、Gのキャップ類似体であり、対応するrNTPは、GTPである。このような実施形態では、キャップ類似体は、GTPと比較して、反応混合物中に過剰に存在する。いくつかの実施形態では、キャップ類似体は、約1mM~約20mM、約1mM~約17.5mM、約1mM~約15mM、約1mM~約12.5mM、約1mM~約10mM、約1mM~約7.5mM、約1mM~約5mM、又は約1mM~約2.5mMの範囲の初期濃度で添加される。
より典型的には、本発明との関連において、キャップ類似体などのキャップ構造は、mRNA転写物が合成された後にのみ、例えば、合成後プロセシングステップにおいて、インビトロ転写中に得られたmRNA転写物に付加される。典型的には、このような実施形態では、mRNA転写物は、キャップ構造が付加される前に(例えば、タンジェンシャルフロー濾過によって)最初に精製される。
RNAポリメラーゼ反応緩衝液は、典型的には、塩/緩衝剤、例えば、Tris、HEPES、硫酸アンモニウム、重炭酸ナトリウム、クエン酸ナトリウム、酢酸ナトリウム、リン酸カリウム、リン酸ナトリウム、塩化ナトリウム、及び塩化マグネシウムを含む。
反応混合物のpHは、約6~8.5、6.5~8.0、7.0~7.5の間であってもよく、いくつかの実施形態では、pHは7.5である。
DNA鋳型(例えば、上述のように、及び所望の量のRNAを提供するのに十分な量/濃度で)、RNAポリメラーゼ反応緩衝液、及びRNAポリメラーゼを組み合わせて、反応混合物を形成する。反応混合物を、約37℃~約56℃で、30分~6時間、例えば、約60~約90分間インキュベートする。いくつかの実施形態では、インキュベーションは、約37℃~約42℃で行われる。他の実施形態では、インキュベーションは、約43℃~約56℃、例えば、約50℃~約52℃で行われる。本明細書で実証されるように、インビトロ転写反応において得られた正確に終結したmRNA転写物の収率は、目的のmRNA転写物をコードするDNA配列の末端に本明細書に記載される1つ以上の終結シグナルを含めることによって、かつ約50℃~約52℃の温度でDNA配列を含む鋳型との反応を実行することによって、大幅に増加させることができる。
いくつかの実施形態では、好適なRNAポリメラーゼ反応緩衝液(約7.5の最終反応混合物pH)中の、約5mMのNTP、約0.05mg/mLのRNAポリメラーゼ、及び約0.1mg/mlのDNA鋳型を、約37℃~約42℃で60~90分間インキュベートする。他の実施形態では、好適なRNAポリメラーゼ反応緩衝液(約7.5の最終反応混合物pH)中の、約5mMのNTP、約0.05mg/mLのRNAポリメラーゼ、及び約0.1mg/mlのDNA鋳型を、50℃~約52℃で60~90分間インキュベートする。
いくつかの実施形態では、反応混合物は、RNAポリメラーゼ特異的プロモーター、RNAポリメラーゼ、RNase阻害剤、ピロホスファターゼ、29mMのNTP、10mMのDTT、及び反応緩衝液(10xの場合、800mMのHEPES、20mMのスペルミジン、250mMのMgCl2、pH7.7)とともに二本鎖DNA鋳型、並びにRNaseを含まない水で所望の反応体積にする十分な量(QS)を含有し、次いで、この反応混合物を37℃で60分間インキュベートする。次に、このポリメラーゼ反応をDNase I及びDNase I緩衝液(10xの場合、100mMのTris-HCl、5mMのMgCl2及び25mMのCaCl2、pH7.6)を添加することによりクエンチして、精製のための調製で二本鎖DNA鋳型の消化を促進した。この実施形態は、100グラムのmRNAを産生するのに十分であることが示されている。
いくつかの実施形態では、反応混合物は、1~10mMの範囲の濃度のNTP、0.01~0.5mg/mlの範囲の濃度のDNA鋳型、及び0.01~0.1mg/mlの範囲の濃度のRNAポリメラーゼを含み、例えば、反応混合物は、5mMの濃度のNTP、0.1mg/mlの濃度のDNA鋳型、及び0.05mg/mlの濃度のRNAポリメラーゼを含む。
ヌクレオチド
様々な天然由来の又は修飾されたヌクレオシドを使用して、本発明によるmRNAを産生してもよい。いくつかの実施形態では、本発明によるmRNA転写物は、天然ヌクレオシド(すなわち、アデノシン、グアノシン、シチジン、ウリジン)で合成される。他の実施形態では、本発明によるmRNA転写物は、天然ヌクレオシド(例えば、アデノシン、グアノシン、シチジン、ウリジン)並びに次のうちのいずれか:ヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5プロピニル-シチジン、C-5プロピニル-ウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニル-ウリジン、C5-プロピニル-シチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、O(6)-メチルグアニン、プソイドウリジン(例えば、N-1-メチル-プソイドウリジン)、2-チオウリジン及び2-チオシチジン)、化学修飾された塩基、生物学的に修飾された塩基(例えば、メチル化塩基)、介在塩基(intercalated base)、修飾された糖(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノース、及びヘキソース)、及び/若しくは修飾されたリン酸基(例えば、ホスホロチオエート及び5’-N-ホスホルアミダイト結合)を用いて、合成される。
いくつかの実施形態では、mRNAは、1つ以上の非標準的なヌクレオチド残基を含む。非標準的なヌクレオチド残基は、例えば、5-メチル-シチジン(「5mC」)、プソイドウリジン(「ψU」)、及び/又は2-チオ-ウリジン(「2sU」)を含み得る。このような残基及びそのmRNAへの組み込みについての考察については、例えば、米国特許第8,278,036号又はWO2011/012316を参照されたい。mRNAは、U残基の25%が2-チオ-ウリジンであり、C残基の25%が5-メチルシチジンであるRNAと定義される、RNAであってもよい。RNAの使用に関する教示は、米国特許出願公開第2012/0195936号及び国際公開第2011/012316号に開示されており、それら両方とも参照によりその全体が本明細書に組み込まれる。非標準的なヌクレオチド残基の存在は、mRNAを、同じ配列を有するが標準的な残基のみを含有する対照mRNAよりも、より安定かつ/又はより少ない免疫原性にすることができる。更なる実施形態では、mRNAは、イソシトシン、プソイドイソシトシン、5-ブロモウラシル、5-プロピニルウラシル、6-アミノプリン、2-アミノプリン、イノシン、ジアミノプリン、及び2-クロロ-6-アミノプリンシトシン、並びにこれらの修飾及び他の核酸塩基修飾の組み合わせから選択される1つ以上の非標準的なヌクレオチド残基を含み得る。いくつかの実施形態は、フラノース環又は核酸塩基への追加の修飾を更に含み得る。追加的な修飾は、例えば、糖修飾又は置換(例えば、2’-O-アルキル修飾、ロックド核酸(LNA)のうちの1つ以上)を含み得る。いくつかの実施形態では、RNAは、追加のポリヌクレオチド及び/又はペプチドポリヌクレオチド(PNA)と複合体化又はハイブリダイズされてもよい。糖修飾が2’-O-アルキル修飾であるいくつかの実施形態では、このような修飾には、2’-デオキシ-2’-フルオロ修飾、2’-O-メチル修飾、2’-O-メトキシエチル修飾、及び2’-デオキシ修飾を含み得るが、これらに限定されない。いくつかの実施形態では、これらの修飾のいずれかは、ヌクレオチドの0~100%で、例えば、構成ヌクレオチドの0%、1%、10%、25%、50%、75%、85%、90%、95%、又は100%超を個別に又は組み合わせて存在し得る。
合成mRNA
本発明は、高品質のインビトロ合成mRNAを提供する。例えば、本発明は、合成されたmRNAの均一性/均質性を提供する。特に、本発明の組成物は、実質的に完全長である複数のmRNA分子を含む。例えば、mRNA分子の少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%は、完全長mRNA分子である。そのような組成物は、完全長mRNA分子に対して「エンリッチである」と言われる。いくつかの実施形態では、本発明に従って合成されるmRNAは、実質的に完全長である。本発明の組成物は、先行技術のプロセス、すなわち、本発明による最適化されたDNA配列の使用を含むプロセスによって産生される組成物よりも、より大きいパーセンテージの完全長mRNA分子を有する。
本発明のいくつかの実施形態では、組成物又はバッチは、完全長mRNA分子ではないmRNA分子(すなわち、不全型若しくは不全の(aborted)転写物、又は早期終結転写物)を特異的に除去するステップなしに調製される。
いくつかの実施形態では、本発明により合成されるmRNA分子は、500、600、700、800、900、1000、2000、3000、4000、5000、10,000、又はそれ以上のヌクレオチド長であり、本発明にはその間の任意の長さを有するmRNAも含まれる。
合成後プロセシング
典型的には、5’キャップ及び/又は3’テールは、合成後に付加されてもよい。キャップの存在は、大半の真核細胞にみられるヌクレアーゼへの耐性を提供する上で重要である。「テール」の存在は、mRNAをエキソヌクレアーゼ分解から保護する役割を果たす。
5’キャップは、典型的には、以下のように付加される。最初に、RNA末端ホスファターゼが、5’ヌクレオチドから末端リン酸基のうちの1つを除去し、2つの末端リン酸を残す。次いで、グアノシン三リン酸(GTP)が、グアニリルトランスフェラーゼを介して末端リン酸に付加され、5’5’5三リン酸結合をもたらす。次いで、グアニンの7-窒素が、メチルトランスフェラーゼによってメチル化される。キャップ構造の例には、m7G(5’)ppp(5’)(2’OMeG)、m7G(5’)ppp(5’)(2’OMeA)、m7(3’OMeG)(5’)ppp(5’)(2’OMeG)、m7(3’OMeG)(5’)ppp(5’)(2’OMeA)、m7G(5’)ppp(5’(A,G(5’)ppp(5’)A、及びG(5’)ppp(5’)Gが挙げられるが、これらに限定されない。特定の実施形態では、キャップ構造は、m7G(5’)ppp(5’)(2’OMeG)である。追加のキャップ構造は、参照により本明細書に組み込まれる、米国特許出願第US2016/0032356号及び2017年2月27日に出願された米国仮特許出願第62/464,327号に記載されている。
テール構造は典型的に、ポリ(A)テール及び/又はポリ(C)テールを含む。mRNAの3’末端上のポリAテール又はポリCテールは、典型的には、少なくとも50個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも150個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも200個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも250個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも300個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも350個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも400個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも450個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも500個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも550個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも650個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも700個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも750個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも800個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも850個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも900個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、少なくとも950個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、又は少なくとも1kbのアデノシンヌクレオチド若しくはシトシンヌクレオチドをそれぞれ含む。いくつかの実施形態では、ポリAテール又はポリCテールはそれぞれ、約10~800個のアデノシンヌクレオチド又はシトシンヌクレオチド(例えば、約10~200個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~300個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~400個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~500個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~550個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約50~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約100~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約150~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約200~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約250~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約300~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約350~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約400~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約450~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約500~600個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~150個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約10~100個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、約20~70個のアデノシンヌクレオチド若しくはシトシンヌクレオチド、又は約20~60個のアデノシンヌクレオチド若しくはシトシンヌクレオチド)であり得る。いくつかの実施形態では、テール構造は、本明細書に記載の様々な長さを有するポリ(A)テール及びポリ(C)テールの組み合わせを含む。いくつかの実施形態では、テール構造は、少なくとも50%、55%、65%、70%、75%、80%、85%、90%、92%、94%、95%、96%、97%、98%、又は99%のアデノシンヌクレオチドを含む。いくつかの実施形態では、テール構造は、少なくとも50%、55%、65%、70%、75%、80%、85%、90%、92%、94%、95%、96%、97%、98%、又は99%のシトシンヌクレオチドを含む。
本明細書に記載されるように、5’キャップ及び/又は3’テールの添加は、キャッピング及び/又はテーリングなしでは、それらの早期に中止したmRNA転写物のサイズが検出するには小さすぎる場合があるため、インビトロ合成中に生成された不全型転写物の検出を容易にする。したがって、いくつかの実施形態では、5’キャップ及び/又は3’テールは、mRNAが純度(例えば、mRNA中に存在する不全型転写物のレベル)について試験される前に、合成mRNAに加えられる。いくつかの実施形態では、5’キャップ及び/又は3’テールは、本明細書に記載されるようにmRNAが精製される前に合成mRNAに付加される。いくつかの実施形態では、5’キャップ及び/又は3’テールは、本明細書に記載されるようにmRNAが精製された後に合成mRNAに付加される。
mRNAの精製
本発明に従って合成されたmRNAは、更なる精製を行うことなく使用され得る。特に、本発明に従って合成されたmRNAは、ショートマー(shortmer)を除去するステップなしに使用され得る。いくつかの実施形態では、本発明に従って合成されたmRNAは、更に精製されてもよい。本発明に従って合成されたmRNAを精製するために様々な方法を使用することができる。例えば、mRNAの精製は、遠心分離、濾過、及び/又はクロマトグラフィー法を使用して実行することができる。いくつかの実施形態では、合成されたmRNAは、エタノール沈殿若しくは濾過若しくはクロマトグラフィー、又はゲル精製若しくは任意の他の好適な手段により精製される。いくつかの実施形態では、mRNAは、HPLCにより精製される。いくつかの実施形態では、mRNAは、当業者に周知の標準的なフェノール:クロロホルム:イソアミルアルコール溶液で抽出される。いくつかの実施形態では、mRNAは、タンジェンシャルフロー濾過を使用して精製される。好適な精製方法には、US2016/0040154、US2015/0376220、2018年2月27日に出願された「METHODS FOR PURIFICATION OF MESSENGER RNA」と題されたPCT出願PCT/US18/19978、及び2018年2月27日に出願された「METHODS FOR PURIFICATION OF MESSENGER RNA」と題されたPCT出願PCT/US18/19954、2018年11月8日に出願された米国仮出願第62/757,612号、及び2019年8月26日に出願された米国仮出願第62/891,781号に記載されている方法が含まれ、それら全てが参照により本明細書に組み込まれ、本発明を実施するために使用することができる。
いくつかの実施形態では、mRNAは、キャッピング及び/又はテーリングの前に精製される。いくつかの実施形態では、mRNAは、キャッピングの前に精製される。いくつかの実施形態では、mRNAは、テーリングの前に精製される。いくつかの実施形態では、mRNAは、キャッピング及びテーリングの後に精製される。いくつかの実施形態では、mRNAは、キャッピング及びテーリングの前及び後の両方で精製される。
いくつかの実施形態では、mRNAは、遠心分離により、キャッピングとテーリングの前若しくは後のいずれか、又はキャッピングとテーリングの前及び後の両方で精製される。
いくつかの実施形態では、mRNAは、濾過により、キャッピングとテーリングの前若しくは後のいずれか、又はキャッピングとテーリングの前及び後の両方で精製される。
いくつかの実施形態では、mRNAは、タンジェンシャルフロー濾過(TFF)により、キャッピングとテーリングの前若しくは後のいずれか、又はキャッピングとテーリングの前及び後の両方で精製される。いくつかの実施形態では、mRNAは、透析、透析濾過、及び/又は限外濾過を含む更なる精製に供され得る。
いくつかの実施形態では、mRNAは、クロマトグラフィーにより、キャッピングとテーリングの前若しくは後のいずれか、又はキャッピングとテーリングの前及び後の両方で精製される。
mRNAの沈殿
インビトロ合成反応混合物などの不純な調製物中のmRNAは、2018年11月8日に出願された米国仮特許出願第62/757,612号、又は2019年8月26日に出願された米国仮特許出願第62/891,781号に記載される緩衝液及び好適な条件を使用して、沈殿させてもよく、本発明を実施するために、当該技術分野で既知の様々な精製方法に続いて使用されてもよい。本明細書で使用される場合、用語「沈殿」(又は任意の文法的に同等のもの)は、溶液中の不溶性物質(例えば、固体)の形成を指す。mRNAに関連して使用される場合、用語「沈殿」は、液体中のmRNAの不溶性又は固体形態の形成を指す。
典型的には、mRNA沈殿は変性状態を伴う。本明細書で使用される場合、「変性状態」という用語は、mRNAの天然立体構造の破壊を引き起こす可能性のある任意の化学的又は物理的状態を指す。分子の天然立体構造は通常、最も水溶性であるため、分子の二次構造及び三次構造を破壊すると、溶解性に変化が生じ、溶液からのmRNAの沈殿が生じる可能性がある。
例えば、不純な調製物からmRNAを沈殿させる適切な方法は、mRNAが沈殿するように、不純な調製物を変性試薬で処理することを伴う。本発明に適した変性試薬の例としては、塩化リチウム、塩化ナトリウム、塩化カリウム、塩化グアニジニウム、グアニジウムチオシアネート、グアニジウムイソチオシアネート、酢酸アンモニウム、及びそれらの組み合わせが挙げられるが、これらに限定されない。好適な試薬は、固体形態又は溶液で提供され得る。
いくつかの実施形態では、グアニジニウム塩は、mRNAを沈殿させるための変性緩衝液中で使用される。非限定的な例として、グアニジニウム塩には、塩化グアニジニウム、グアニジウムチオシアネート、又はグアニジウムイソチオシアネートが含まれ得る。グアニジニウムチオシアネート(GCSN)はまた、チオシアン酸グアニジンとも呼ばれ、mRNAを沈殿させるために使用され得る。グアニジニウム塩、例えばグアニジニウムチオシアネートは、変性反応に通常使用されるよりも高い濃度で使用することができ、結果として、実質的にタンパク質混入物を含まないmRNAをもたらす。いくつかの実施形態では、mRNA沈殿に適した溶液は、4M超の濃度のチオシアン酸グアニジンを含有する。
典型的な実施形態では、キャッピング及びテール化mRNA転写物を含む、mRNA転写物及び/又はキャッピング及び/又はテール化反応から生じる混合物を含有するインビトロ転写反応混合物は、mRNAが溶液から沈殿するように、グアニジウム塩などの変性剤(例えば、グアニジウムチオシアネート)の添加、続いて沈殿剤(例えば、100%のエタノール)の添加を含む精製プロセスに供される。得られたmRNA懸濁液を、タンジェンシャルフロー濾過(TFF)カラムに加える。
変性試薬に加えて、mRNA沈殿に適した溶液は、追加の塩、界面活性剤及び/又は緩衝剤を含み得る。例えば、好適な溶液は、ラウリルサルコシルナトリウム及び/又はクエン酸ナトリウムを更に含むことができる。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約5mMのクエン酸ナトリウムを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約10mMのクエン酸ナトリウムを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約20mMのクエン酸ナトリウムを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約25mMのクエン酸ナトリウムを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約30mMのクエン酸ナトリウムを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約50mMのクエン酸ナトリウムを含む。
いくつかの実施形態では、mRNA沈殿に適した緩衝液は、N-ラウリルサルコシン(サルコシル)などの界面活性剤を含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約0.01%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約0.05%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約0.1%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約0.5%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、1%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約1.5%のN-ラウリルサルコシンを含む。いくつかの実施形態では、mRNA沈殿に適した緩衝液は、約2%、約2.5%又は約5%のN-ラウリルサルコシンを含む。
いくつかの実施形態では、mRNA沈殿に適した溶液は、還元剤を含む。いくつかの実施形態では、還元剤は、ジチオスレイトール(DTT)、ベータ-メルカプトエタノール(b-ME)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、トリス(3-ヒドロキシプロピル)ホスフィン(THPP)、ジチオエリスリトール(DTE)、及びジチオブチルアミン(DTBA)から選択される。いくつかの実施形態では、還元剤は、ジチオスレイトール(DTT)である。
いくつかの実施形態では、DTTは、1mM超及び最大約200mMの最終濃度で存在する。いくつかの実施形態では、DTTは、2.5mM~100mMの最終濃度で存在する。いくつかの実施形態では、DTTは、5mM~50mMの最終濃度で存在する。いくつかの実施形態では、DTTは、約20mMの最終濃度で存在する。
タンパク質変性は、還元剤の存在下又は非存在下では、変性試薬の低濃度でさえも起こり得る。不純物を含有するmRNAを沈殿させるための変性溶液における高濃度のGSCNと高濃度のDTTとの組み合わせにより、純粋かつ実質的にタンパク質混入物を含まないmRNAが得られる。緩衝液中に沈殿したmRNAは、フィルターを介して処理することができる。いくつかの実施形態では、約5MのGSCN及び約10mMのDTTを含む緩衝液を使用した、単回沈殿に続く濾過後の溶離液は、検出可能なタンパク質不純物を有しない、高品質及び高純度のものである。更に、この方法は、フィルターを通した流体の流れの妨げを生じさせずに、約1グラム、又は約10グラム、又は約100グラム、又は500グラム、又は約1000グラム以上のmRNAを含む規模で、広範なmRNAの処理量で再現性がある。
いくつかの実施形態では、沈殿ステップのための緩衝液は、アルコールを更に含む。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液(GSCN及び還元剤、例えば、DTTを含む)、及びアルコール(例えば、100%エタノール)が、1:(5):(3)の体積比で存在する条件下で実施される。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液及びアルコール(例えば、100%エタノール)が、1:(3.5):(2.1)の体積比で存在する条件下で実施される。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液及びアルコール(例えば、100%エタノール)が、1:(4):(2)の体積比で存在する条件下で実施される。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液及びアルコール(例えば、100%エタノール)が、1:(2.8):(1.9)の体積比で存在する条件下で実施される。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液及びアルコール(例えば、100%エタノール)が、1:(2.3):(1.7)の体積比で存在する条件下で実施される。いくつかの実施形態では、沈殿は、mRNA、変性緩衝液及びアルコール(例えば、100%エタノール)が、1:(2.1):(1.5)の体積比で存在する条件下で実施される。
いくつかの実施形態では、相当量のmRNAの沈殿を許容する所望の温度で一定期間、本明細書に記載の1つ以上の変性試薬を用いて、不純物調製物をインキュベートすることが望ましい。例えば、不純な調製物と変性剤との混合物は、室温で、又は周囲温度で一定期間インキュベートされ得る。いくつかの実施形態では、好適なインキュベーション時間は、約2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、又は60分、又はそれ以上の時間である。いくつかの実施形態では、好適なインキュベーション時間は、約60、55、50、45、40、35、30、25、20、15、10、9、8、7、6、又は5分以下の時間である。いくつかの実施形態では、混合物は、室温で約5分間インキュベートされる。典型的には、「室温」又は「周囲温度」は、約20~25℃の範囲の温度、例えば、約20℃、21℃、22℃、23℃、24℃又は25℃を指す。いくつかの実施形態では、不純な調製物及び変性剤の混合物は、室温以上(例えば、約30~37℃、又は特に、約30℃、31℃、32℃、33℃、34℃、35℃、36℃若しくは37℃)又は室温以下(例えば、約15~20℃、又は特に、約15℃、16℃、17℃、18℃、19℃若しくは20℃)でインキュベートされ得る。インキュベーション期間は、インキュベーション温度に基づいて調整され得る。典型的には、高いインキュベーション温度は、より短いインキュベーション時間を必要とする。
あるいは又は追加的に、溶媒を使用してmRNA沈殿を促進し得る。好適な例示的な溶媒としては、イソプロピルアルコール、アセトン、メチルエチルケトン、メチルイソブチルケトン、エタノール、メタノール、デナトニウム、及びそれらの組み合わせが挙げられるが、これらに限定されない。例えば、溶媒(例えば、100%エタノール)を、変性試薬とともに、又は変性試薬の添加及び本明細書に記載されるインキュベーションの後に、不純な調製物に添加して、mRNA沈殿を更に強化及び/又は促進することができる。典型的には、好適な溶媒(例えば、100%エタノール)の添加後、混合物は、室温で別の時間インキュベートされ得る。典型的には、インキュベーション時間の好適な時間は、約2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、又は60分、又はそれ以上である。いくつかの実施形態では、好適なインキュベーション時間は、約60、55、50、45、40、35、30、25、20、15、10、9、8、7、6、又は5分以下の時間である。典型的には、混合物を、室温で約5分間インキュベートする。室温を上回る、又は下回る温度は、インキュベーション時間の適切な調整とともに使用され得る。あるいは、沈殿のため4℃又は-20℃でインキュベーションを行うこともできる。
いくつかの実施形態では、mRNAを精製する方法は、アルコールを含まない。したがって、いくつかの実施形態では、懸濁液中のmRNAの沈殿は、アルコール(例えば、100%エタノール)の代わりに1つ以上の両親媒性ポリマーを含む。多くの両親媒性ポリマーは、当該技術分野で公知である。いくつかの実施形態では、両親媒性ポリマーは、プルロニック、ポリビニルピロリドン、ポリビニルアルコール、ポリエチレングリコール(PEG)、又はそれらの組み合わせを含む。いくつかの実施形態では、両親媒性ポリマーは、以下のうちの1つ以上から選択される:PEGトリエチレングリコール、テトラエチレングリコール、PEG200、PEG300、PEG400、PEG600、PEG1,000、PEG1,500、PEG2,000、PEG3,000、PEG3,350、PEG4,000、PEG6,000、PEG8,000、PEG10,000、PEG20,000、PEG35,000、及びPEG40,000、又はそれらの組み合わせ。
いくつかの実施形態では、両親媒性ポリマーは、2種類以上の分子量のPEGポリマーの混合物を含む。例えば、いくつかの実施形態では、2、3、4、5、6、7、8、9、10、11、又は12個の分子量のPEGポリマーが、両親媒性ポリマーを構成する。したがって、いくつかの実施形態では、PEG溶液は、1つ以上のPEGポリマーの混合物を含む。いくつかの実施形態では、PEGポリマーの混合物は、別個の分子量を有するポリマーを含む。いくつかの実施形態では、mRNAを懸濁液中に沈殿させるには、PEGポリマーを含む。様々な種類のPEGポリマーが当該技術分野で認識され、その一部は別個の幾何学的形態を有する。例えば、好適なPEGポリマーは、線状、分岐状、Y字形状、又はマルチアーム形状を有するPEGポリマーを含む。いくつかの実施形態では、PEGは、別個の幾何学的形態うちの1つ以上のPEGを含む懸濁液中にある。いくつかの実施形態では、mRNAの沈殿は、PEG-6000を使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、PEG-400を使用してmRNAを沈殿させることで達成することができる。
他の実施形態では、mRNAを精製するアルコールを含まない方法は、トリエチレングリコール(TEG)でmRNAを沈殿させることを含む。いくつかの実施形態では、mRNAの沈殿は、トリエチレングリコールモノメチルエーテル(MTEG)を使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、tert-ブチル-TEG-O-プロピオネートを使用して、mRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-ジメタクリレートを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-ジメチルエーテルを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-ジビニルエーテルを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-モノブチルエーテルを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-メチルエーテルメタクリレートを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-モノデシルエーテルを使用してmRNAを沈殿させることで達成することができる。いくつかの実施形態では、mRNAの沈殿は、TEG-ジベンゾエートを使用して、mRNAを沈殿させることで達成することができる。これらのPEG又はTEGベースの試薬のうちの任意の1つを、GSCNと組み合わせて使用して、mRNAを沈殿させることができる。本発明に従って産生されたmRNAを精製するエタノールを含まない例示的方法は、GSCNとMTEGとの組み合わせを使用してmRNAを沈殿させる。
いくつかの実施形態では、懸濁液中でmRNAを沈殿させるには、PEGポリマーを含み、PEGポリマーは、PEG修飾脂質を含む。いくつかの実施形態では、PEG修飾脂質は、1,2-ジミリストイル-sn-グリセロール、メトキシポリエチレングリコール(DMG-PEG-2K)である。いくつかの実施形態では、PEG修飾脂質は、DOPA-PEGコンジュゲートである。いくつかの実施形態では、PEG修飾脂質は、ポロキサマー-PEGコンジュゲートである。いくつかの実施形態では、PEG修飾脂質は、DOTAPを含む。いくつかの実施形態では、PEG修飾脂質は、コレステロールを含む。
いくつかの実施形態では、mRNAは、前述のPEG又はTEG試薬のいずれかを含む懸濁液中で沈殿する。いくつかの実施形態では、PEG又はTEGは、約10重量/体積%~約100重量/体積%の濃度で懸濁液中にある。例えば、いくつかの実施形態では、PEG又はTEGは、懸濁液中に、約5重量/体積%、10重量/体積%、15重量/体積%、20重量/体積%、25重量/体積%、30重量/体積%、35重量/体積%、40重量/体積%、45重量/体積%、50重量/体積%、55重量/体積%、60重量/体積%、65重量/体積%、70重量/体積%、75重量/体積%、80重量/体積%、85重量/体積%、90重量/体積%、95重量/体積%、100重量/体積%の濃度、及びそれらの間の任意の値で存在する。
いくつかの実施形態では、懸濁液中でmRNAを沈殿させることは、約0.1~約5.0の総mRNA懸濁液体積に対するPEG又はTEGの体積:体積比を含む。例えば、いくつかの実施形態では、PEG又はTEGは、mRNA懸濁液中に、約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.25、1.5、1.75、2.0、2.25、2.5、2.75、3.0、3.25、3.5、3.75、4.0、4.25、4.5、4.75、5.0の体積:体積比で存在する。
いくつかの実施形態では、mRNA沈殿の反応体積には、(i)GSCN及び(ii)PEG又はTEGを含む。
mRNAの特性評価
mRNAの全長転写物、不全型転写物及び/又は早期終結した転写物は、当技術分野で利用可能な任意の方法を使用して検出及び定量化されてもよい。いくつかの実施形態では、合成されたmRNA分子は、ブロッティング、キャピラリー電気泳動、クロマトグラフィー、蛍光、ゲル電気泳動、HPLC、銀染色、分光法、紫外線(UV)、又はUPLC、又はそれらの組み合わせを使用して検出される。本発明には、当該技術分野で公知の他の検出方法が含まれる。いくつかの実施形態では、合成されたmRNA分子は、キャピラリー電気泳動による分離を伴うUV吸収分光法を使用して検出される。いくつかの実施形態では、mRNAは、ゲル電気泳動の前にグリオキサール染料によって最初に変性される(「グリオキサールゲル電気泳動」)。いくつかの実施形態では、合成mRNAは、キャッピング又はテーリング前に特性評価される。いくつかの実施形態では、合成mRNAは、キャッピング及びテーリング後に特性評価される。
いくつかの実施形態では、本明細書に開示される方法によって生成されるmRNAは、完全長mRNA以外、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.1%未満の不純物を含む。不純物は、IVT混入物質、例えば、タンパク質、酵素、遊離ヌクレオチド、及び/又はショートマーを含む。
いくつかの実施形態では、本発明に従って産生されるmRNAは、ショートマー又は不全型転写物を実質的に含まない。特に、本発明に従って産生されるmRNAは、キャピラリー電気泳動又はグリオキサールゲル電気泳動によって、検出不可能なレベルのショートマー又は不全型転写物を含有する。本明細書で使用される場合、用語「ショートマー」又は「不全型転写物」は、完全長よりも小さい任意の転写物を指す。いくつかの実施形態では、「ショートマー」又は「不全型転写物」は、長さが100ヌクレオチド未満、長さが90ヌクレオチド未満、長さが80ヌクレオチド未満、長さが70ヌクレオチド未満、長さが60ヌクレオチド未満、長さが50ヌクレオチド未満、長さが40ヌクレオチド未満、長さが30ヌクレオチド未満、長さが20ヌクレオチド未満、又は長さが10ヌクレオチド未満である。いくつかの実施形態では、5’-キャップ、及び/又は3’-ポリAテールを付加した後に、ショートマーを検出又は定量化する。
伸長mRNA転写物
いくつかの実施形態では、本明細書に開示される方法によって生成されたmRNA転写物の少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%が、終結シグナルで終結する。本明細書で使用される場合、「終結シグナルで終結する」とは、終結シグナルの3’末端の10ヌクレオチド、9ヌクレオチド、8ヌクレオチド、7ヌクレオチド、6ヌクレオチド、5ヌクレオチド、4ヌクレオチド、3ヌクレオチド、2ヌクレオチド、1ヌクレオチド、又は0ヌクレオチド内での転写の終結を指す。
ランオフ転写を検出するために、mRNA転写物を消化して短い3’末端断片を産生でき、これを液体クロマトグラフィー質量分析法(消化LC/MS)を用いて分析することができる。好適な3’末端断片は、100ヌクレオチド未満、例えば、90ヌクレオチド未満、80ヌクレオチド未満、70ヌクレオチド未満、60ヌクレオチド未満、50ヌクレオチド未満、40ヌクレオチドのサイズを有する。所望の長さの3’末端断片は、DNA/RNAハイブリッドが形成されるように、鋳型化されたmRNA転写物の3’末端に特異的にハイブリダイズするプローブオリゴヌクレオチドを提供することによって生成することができる。プローブオリゴヌクレオチドは、鋳型化されたmRNA転写物の3’末端の約5~約20ヌクレオチド内に結合してもよい。次いで、DNA/RNAハイブリッドをRNaseHで消化して、所望の長さの3’末端断片を得ることができる。3’末端断片は、RNAシーケンシングを使用して分析し、ランオフ配列の存在及び長さを決定することができる。RNAシーケンシングに好適な方法は、ナノポアシーケンシングである。
好適なプローブオリゴヌクレオチドは、修飾RNA-DNAギャップオリゴヌクレオチド(一般にギャップマーとも呼ばれる)である。典型的なギャップマー設計は、5’-ウィングに続いて、天然核酸であってもよく又はリン基(PS結合)中に硫黄イオンを含有してよい8~12個のデオキシ核酸モノマーのギャップ、続いて3’-ウィングから構成される。このようなRNA-DNA-RNA様構成には、通常、例えば2’-O-メチルリボースを含有することによって修飾されたRNAヌクレオチドを含有する。本明細書に開示されるRNA-DNAギャップオリゴヌクレオチドは、わずか3~5個のデオキシ核酸モノマー(典型的には4個のデオキシ核酸モノマー)のより短いギャップを有するため、この標準設計から外れる。これにより、鋳型化されたmRNA転写物の3’末端へのRNAse H消化の正確な標的化が可能となる。mRNA転写物への正確なアニーリングを確実にするために、RNA-DNAギャップオリゴヌクレオチドは、10~20ヌクレオチド長、例えば、約15~18ヌクレオチドである。修飾RNAヌクレオチドを含む5’及び3’のウィング配列は、同じ長さを有しない。いくつかの実施形態では、5’ウィング(例えば、4~6ヌクレオチドの長さを有する)は、3’ウィング(例えば、7~10ヌクレオチドの長さを有する)よりも短い。他の実施形態では、5’ウィング(例えば、7~10ヌクレオチドの長さを有する)は、3’ウィング(例えば、4~6ヌクレオチドの長さを有する)よりも長い。
タンパク質発現
T7 RNAポリメラーゼで合成されたmRNA転写物には、通常、所望の転写物よりもより長いRNA及びより短いRNAが混入している(WO2018/157153を参照されたい)。伸長された配列は、終結シグナル後の鋳型にコードされたmRNA転写物の末端でのヌクレオチドの非鋳型的付加によって生成されると考えられる。追加のヌクレオチドは、一般に「ランオフ」と呼ばれる。ランオフの3’末端が、それ自体又は第2のmRNA分子に結合して、それぞれ伸長可能な分子内二重鎖又は分子間二重鎖を形成するのに十分な相補性を有する場合、更なる伸長が起こり得る(Gholamalipour et al.2018,Nucleic Acids Research 46:18,pp 9253-9263)。二本鎖RNA(dsRNA)が細胞に入ると、ウイルス侵入者として感知される。これは、オリゴアデニル酸シンテターゼ(OAS)、RNA特異的アデノシンデアミナーゼ(ADAR)、及びRNA活性化タンパク質キナーゼ(PKR)などのdsRNA依存性酵素の活性化につながり、タンパク質合成の阻害をもたらす(Baiersdorfer et al.2019,Molecular Therapy:Nucleic Acids,15:26-35)。
本発明の実施例は、本発明によるmRNAの合成が、線状DNA鋳型及びスーパーコイルDNA鋳型の両方からのmRNA転写物の望ましくない伸長を防止することを実証する。その3’末端の望ましくない伸長なしに、T7 RNAポリメラーゼを使用して合成されたmRNAを含む、本発明に従って合成されたmRNAは、dsRNAを本質的に含まない(dsRNAに特異的なモノクローナル抗体を用いて(例えば、ドットブロットアッセイを使用することによって)決定することができる)。したがって、対象に投与されたときにdsRNA依存性酵素を活性化しない。したがって、本発明により合成されたmRNAは、より効率的なタンパク質翻訳をもたらす。
いくつかの実施形態では、本発明に従って合成されたmRNAは、細胞内にトランスフェクトされると、先行技術プロセス、特にT7又はT3RNAポリメラーゼを用いるプロセスを使用して合成された同量のmRNAと比較して、例えば、少なくとも2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、500倍、1000倍、又はそれ以上まで増加したタンパク質発現をもたらす。
いくつかの実施形態では、本発明に従って合成されたmRNAは、細胞内にトランスフェクトされると、先行技術プロセス、特にT7又はT3RNAポリメラーゼを用いるプロセスを使用して合成された同量のmRNAと比較して、例えば、少なくとも2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍、500倍、1000倍、又はそれ以上まで増加したmRNAによってコードされたタンパク質活性をもたらす。
本発明を使用して任意のmRNAを合成することができる。いくつかの実施形態では、mRNAは、1つ以上の天然由来ペプチドをコードする。いくつかの実施形態では、mRNAは、1つ以上の修飾又は非天然ペプチドをコードする。
いくつかの実施形態では、mRNAは、細胞内タンパク質をコードする。いくつかの実施形態では、mRNAは、サイトゾルタンパク質をコードする。いくつかの実施形態では、mRNAは、アクチン細胞骨格に関連するタンパク質をコードする。いくつかの実施形態では、mRNAは、原形質膜に関連するタンパク質をコードする。一部の特定の実施形態では、mRNAは、膜貫通タンパク質をコードする。一部の特定の実施形態では、mRNAは、イオンチャネルタンパク質をコードする。いくつかの実施形態では、mRNAは、核周囲タンパク質をコードする。いくつかの実施形態では、mRNAは、核タンパク質をコードする。いくつかの特定の実施形態では、mRNAは、転写因子をコードする。いくつかの実施形態では、mRNAは、シャペロンタンパク質をコードする。いくつかの実施形態では、mRNAは、細胞内酵素をコードする(例えば、mRNAは、尿素サイクル又はリソソーム蓄積代謝異常に関連する酵素をコードする)。いくつかの実施形態では、mRNAは、細胞代謝、DNA修復、転写及び/又は翻訳に関与するタンパク質をコードする。いくつかの実施形態では、mRNAは、細胞外タンパク質をコードする。いくつかの実施形態では、mRNAは、細胞外基質と関連するタンパク質をコードする。いくつかの実施形態では、mRNAは、分泌タンパク質をコードする。特定の実施形態では、本発明の組成物及び方法で使用されるmRNAは、1つ以上の標的細胞によって、周囲の細胞外液中に排泄又は分泌される機能性タンパク質又は酵素を発現させるために使用され得る(例えば、ホルモン及び/又は神経伝達物質をコードするmRNA)。
本発明は、対象、例えば、ヒト対象、又はヒト対象の細胞、又は治療されてヒト対象に送達される細胞への送達又はその治療に使用するための目的とするペプチド又はポリペプチドをコードする完全長mRNA分子が豊富な治療用組成物を産生するための方法を提供する。
したがって、ある特定の実施形態では、本発明は、対象の肺又は肺細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、嚢胞性線維症膜コンダクタンス制御因子(CFTR)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ATP結合カセットサブファミリーAメンバー3タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ダイニン軸糸中間鎖1タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための産生を提供する。ある特定の実施形態では、本発明は、ダイニン軸糸重鎖5(DNAH5)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アルファ-1-アンチトリプシンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、フォークヘッドボックスP3(FOXP3)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、1つ以上のサーファクタントタンパク質、例えば、サーファクタントAタンパク質、サーファクタントBタンパク質、サーファクタントCタンパク質、及びサーファクタントDタンパク質のうちの1つ以上をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の肝臓又は肝臓細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。このようなペプチド及びポリペプチドは、尿素サイクル障害に関連するもの、リソソーム貯蔵障害に関連するもの、グリコーゲン貯蔵障害に関連するもの、アミノ酸代謝障害に関連するもの、脂質代謝若しくは線維性障害に関連するもの、メチルマロン酸血症に関連するもの、又は任意の他の代謝性障害に関連するものを含めることができ、それらに対し豊富な完全長mRNAで肝臓又は肝臓細胞への送達又は治療することで治療的利益が得られる。
ある特定の実施形態では、本発明は、尿素サイクル障害に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、オルニチントランスカルバミラーゼ(OTC)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アルギノコハク酸シンテターゼ1タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、カルバモイルリン酸シンテターゼIタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アルギノコハク酸リアーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アルギナーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、リソソーム貯蔵障害に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アルファ-ガラクトシダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、グルコセレブロシダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、イズロン酸-2-スルファターゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、イズロニダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、N-アセチル-アルファ-D-グルコサミニダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヘパランN-スルファターゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ガラクトサミン-6スルファターゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ベータ-ガラクトシダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、リソソームリパーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、アリールスルファターゼB(N-アセチルガラクトサミン-4-スルファターゼ)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、転写因子EB(TFEB)をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、グリコーゲン貯蔵障害に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、酸アルファ-グルコシダーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、グルコース-6-ホスファターゼ(G6PC)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、肝臓グリコーゲンホスホリラーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、筋ホスホグリセリン酸ムターゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、グリコーゲン脱分岐酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、アミノ酸代謝に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、フェニルアラニンヒドロキシラーゼ酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、グルタリル-CoAデヒドロゲナーゼ酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、プロピオニル-CoAカルボキシラーゼ酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、オキサラーゼ(oxalase)アラニン-グリオキシルアミノトランスフェラーゼ酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、脂質代謝又は線維性障害に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、mTOR阻害剤をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ATPaseリン脂質輸送8B1(ATP8B1)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、1つ以上のNF-カッパB阻害剤、例えば、I-カッパBアルファ、インターフェロン関連発生制御因子1(IFRD1)、及びサーチュイン1(SIRT1)のうちの1つ以上をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、PPAR-ガンマタンパク質又は活性バリアントをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、メチルマロン酸血症に関連するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。例えば、ある特定の実施形態では、本発明は、メチルマロニルCoAムターゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、メチルマロニルCoAエピメラーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、肝臓への送達又はその治療が治療的利益を提供することができる完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ATP7Bタンパク質、別名、ウィルソン病タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ポルホビリノーゲンデアミナーゼ酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、第VIII因子、第IX因子、第VII因子、及び第X因子等の1つ又は複数の凝固酵素をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヒトヘモクロマトーシス(HFE)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の心臓血管構造又は心臓血管細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、血管内皮成長因子Aタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、レラキシンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、骨形成タンパク質-9タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、骨形成タンパク質-2受容体タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の筋肉又は筋肉細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ジストロフィンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、フラタキシンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、対象の心筋又は心筋細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、筋肉組織又は筋肉細胞におけるカリウムチャネル及びナトリウムチャネルの一方又は両方を調節するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、筋肉組織又は筋肉細胞におけるKv7.1チャネルを調節するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、筋肉組織又は筋肉細胞におけるNav1.5チャネルを調節するタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の神経系又は神経系細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。例えば、ある特定の実施形態では、本発明は、生存運動ニューロン1タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。例えば、ある特定の実施形態では、本発明は、生存運動ニューロン2タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、フラタキシンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ATP結合カセットサブファミリーDメンバー1(ABCD1)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、CLN3タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の血液若しくは骨髄又は血液若しくは骨髄細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ベータ-グロビンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ブルトンチロシンキナーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、1つ又は複数の凝固酵素、例えば、第VIII因子、第IX因子、第VII因子、及び第X因子をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の腎臓又は腎臓細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、IV型コラーゲンアルファ5鎖(COL4A5)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象の眼又は眼細胞への送達又はその治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ATP結合カセットサブファミリーAメンバー4(ABCA4)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、レチノスキシンタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、網膜色素上皮特異的65kDa(RPE65)タンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、290kDa中心体タンパク質(CEP290)をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象又は対象の細胞用のワクチンの送達又はそれでの治療に使用するためのペプチド又はポリペプチドをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。例えば、ある特定の実施形態では、本発明は、ウイルスなどの感染病原体由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、インフルエンザウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、呼吸器合胞体ウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、狂犬病ウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、サイトメガロウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ロタウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、A型肝炎ウイルス、B型肝炎ウイルス、又はC型肝炎ウイルスなどの肝炎ウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヒトパピローマウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、単純ヘルペスウイルス1型又は単純ヘルペスウイルス2型などの単純ヘルペスウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヒト免疫不全ウイルス1型又はヒト免疫不全ウイルス2型などのヒト免疫不全ウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヒトメタニューモウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ヒトパラインフルエンザウイルス1型、ヒトパラインフルエンザウイルス2型、又はヒトパラインフルエンザウイルス3型などのヒトパラインフルエンザウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、マラリアウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、ジカウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、チクングニヤウイルス由来の抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、対象のがんに関連する抗原又は対象のがん細胞から特定された抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、対象自身のがん細胞から決定された抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための、すなわち、個別化がんワクチンを提供するための方法を提供する。ある特定の実施形態では、本発明は、変異KRAS遺伝子から発現した抗原をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、抗体は、二重特異性抗体であり得る。ある特定の実施形態では、抗体は、融合タンパク質の一部であり得る。ある特定の実施形態では、本発明は、OX40に対する抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、VEGFに対する抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、組織壊死因子アルファに対する抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、CD3に対する抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、CD19に対する抗体をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、免疫調節因子をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、インターロイキン12をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、インターロイキン23をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、インターロイキン36ガンマをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、1つ以上のインターフェロン遺伝子刺激因子(STING)タンパク質の構成的に活性なバリアントをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
ある特定の実施形態では、本発明は、エンドヌクレアーゼをコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、Cas 9タンパク質などのRNAガイドDNAエンドヌクレアーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、メガヌクレアーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、転写活性化因子様エフェクターヌクレアーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。ある特定の実施形態では、本発明は、亜鉛フィンガーヌクレアーゼタンパク質をコードする完全長mRNAが豊富な治療用組成物を産生するための方法を提供する。
脂質ナノ粒子
本発明に従って合成されたmRNAは、任意の方法を使用してインビボタンパク質産生のために製剤化され、送達されてもよい。いくつかの実施形態では、mRNAは、ナノ粒子などの輸送ビヒクル内に封入される。とりわけ、このような封入の目的の1つは、多くの場合、核酸を分解する酵素若しくは化学物質、及び/又は核酸の急速な排出を引き起こす系又は受容体を含み得る環境から核酸を保護することである。したがって、いくつかの実施形態では、好適な送達ビヒクルは、その中に含まれるmRNAの安定性を強化することができ、及び/又は標的細胞若しくは標的組織へのmRNAの送達を容易にする。いくつかの実施形態では、ナノ粒子は、例えば、リポソームを含む、脂質系ナノ粒子であってもよく、又はポリマー系ナノ粒子であってもよい。いくつかの実施形態では、ナノ粒子は、約40~100nm未満の直径を有してもよい。ナノ粒子は、少なくとも1μg、10μg、100μg、1mg、10mg、100mg、1g、又はそれ以上のmRNAを含み得る。
いくつかの実施形態では、輸送ビヒクルは、リポソーム小胞、又は標的細胞及び組織への核酸の輸送を促進するための他の手段である。適切な輸送ビヒクルには、限定されるものではないが、リポソーム、ナノリポソーム、セラミド含有ナノリポソーム、プロテオリポソーム、ナノ粒子、カルシウムリン-ケイ酸塩ナノ粒子、リン酸カルシウムナノ粒子、二酸化ケイ素ナノ粒子、ナノ結晶性粒子、半導体ナノ粒子、ポリ(D-アルギニン)、ナノデンドリマー、デンプンベースの送達システム、ミセル、エマルション、ニオソーム、プラスミド、ウイルス、リン酸カルシウムヌクレオチド、アプタマー、ペプチド及び他のベクタータグを含む。また、好適な輸送ビヒクルとして、バイオナノカプセル及び他のウイルスキャプシドタンパク質アセンブリの使用も企図される。(Hum.Gene Ther.2008 September;19(9):887-95)。
リポソームは、1つ以上のカチオン性脂質、1つ以上の非カチオン性脂質、1つ以上のステロール系脂質、又は1つ以上のPEG修飾脂質を含み得る。リポソームは、脂質の3つ以上の別個の成分、ステロール系カチオン性脂質である脂質の1つの別個の成分を含み得る。いくつかの実施形態では、ステロール系カチオン性脂質は、イミダゾールコレステロールエステル又は「ICE」脂質である(WO 2011/068810を参照されたい、当該文献は参照によりその全体が組み込まれる)。いくつかの実施形態では、ステロール系カチオン性脂質は、脂質ナノ粒子(例えば、リポソーム)中の総脂質の70%以下(例えば、65%以下及び60%以下)を構成する。
好適な脂質の例としては、例えば、ホスファチジル化合物(例えば、ホスファチジルグリセロール、ホスファチジルコリン、ホスファチジルセリン、ホスファチジルエタノールアミン、スフィンゴ脂質、セレブロシド、及びガングリオシド)が挙げられる。
いくつかの実施形態では、カチオン性脂質の非限定的例には、C12-200、MC3、DLinDMA、DLinkC2DMA、cKK-E12、ICE(イミダゾール系)、HGT5000、HGT5001、OF-02、DODAC、DDAB、DMRIE、DOSPA、DOGS、DODAP、DODMA及びDMDMA、DODAC、DLenDMA、DMRIE、CLinDMA、CpLinDMA、DMOBA、DOcarbDAP、DLinDAP、DLincarbDAP、DLinCDAP、KLin-K-DMA、DLin-K-XTC2-DMA、及びHGT4003、又はこれらの組み合わせが挙げられる。
非カチオン性脂質の非限定的な例としては、セラミド、セファリン、セレブロシド、ジアシルグリセロール、1,2-ジパルミトイル-sn-グリセロ-3-ホスホリルグリセロールナトリウム塩(DPPG)、1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン(DSPE)、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン(DSPC)、1,2-ジパルミトイル-sn-グリセロ-3-ホスホコリン(DPPC)、1,2-ジオレイル-sn-グリセロ-3-ホスホエタノールアミン(DOPE)、1,2-ジエルコイル-sn-グリセロ-3-ホスホエタノールアミン(DEPE)、1,2-ジオレイル-sn-グリセロ-3-ホスホチジルコリン(DOPC)、1,2-ジパルミトイル-sn-グリセロ-3-ホスホエタノールアミン(DPPE)、1,2-ジミリストイル-sn-グリセロ-3-ホスホエタノールアミン(DMPE)、及び1,2-ジオレオイル-sn-グリセロ-3-ホスホ-(1’-rac-グリセロール)(DOPG)、1-パルミトイル-2-オレオイル-ホスファチジルエタノールアミン(POPE)、1-パルミトイル-2-オレオイル-sn-グリセロ-3-ホスホコリン(POPC)、1-ステアロイル-2-オレオイル-ホスファチジルエタノールアミン(SOPE)、スフィンゴミエリン、又はそれらの組み合わせが挙げられる。
いくつかの実施形態では、PEG修飾脂質は、長さがC6-C20のアルキル鎖を有する脂質に共有結合された長さ最大5kDaのポリ(エチレン)グリコール鎖を含み得る。PEG修飾脂質の非限定的な例としては、DMG-PEG、DMG-PEG2K、C8-PEG、DOG PEG、セラミドPEG、及びDSPE-PEG、又はそれらの組み合わせが挙げられる。
また、単独で、又は他の移送ビヒクルと組み合わせて、移送ビヒクルとしてのポリマーの使用も企図される。好適なポリマーとして、例えば、ポリアクリレート、ポリアルキシアノアクリレート、ポリラクチド、ポリラクチド-ポリグリコリドコポリマー、ポリカプロラクトン、デキストラン、アルブミン、ゼラチン、アルギネート、コラーゲン、キトサン、シクロデキストリン、及びポリエチレンイミンが挙げられ得る。ポリマー系ナノ粒子は、ポリエチレンイミン(PEI)、例えば分岐PEIを含んでもよい。
典型的には、本発明によるリポソームの脂質部分は、3つ又は4つの脂質成分のいずれかからなる。本発明による4成分リポソームは一般に以下の脂質成分を有する:カチオン性脂質(典型的には、cKK-E12又は環状アミノ酸系脂質などのイオン化可能カチオン性脂質)、非カチオン性脂質(例えば、DOPE又はDEPE)、コレステロール系脂質(例えば、コレステロール)、及びPEG修飾脂質(例えば、DMG-PEG2K)を。本発明による3成分リポソームは一般に、以下の脂質成分を有する:ステロール系脂質(例えば、ICE又は他のイミダゾール系コレステロール誘導体)、非カチオン性脂質(例えば、DOPE又はDEPE)、及びPEG修飾脂質(例えば、DMG-PEG2K)。
本発明に関連する追加の教示は、以下のうちの1つ以上に記載される:WO2011/068810、WO2012/075040、US15/294,249、US62/421,021及びUS15/809,680、並びに2017年2月27日に本出願人により出願された、「METHODS FOR PURIFITATION OF MESSENGER RNA」、「NOVEL CODON-OPTIMIZED CFTR SEQUENCE」、及び「METHODS FOR PURIFICATION OF MESSENGER RNA」と題された関連出願、これらの各々はその全体が参照により組み込まれる。
本発明の組成物で使用するためのリポソーム移送ビヒクルは、当該技術分野において現在公知である様々な技術により調製することができる。例えば、多重層ベシクル(MLV)は、適切な溶媒に脂質を溶解することにより、選択された脂質を好適な容器又は器の内壁に堆積させ、次いで、溶媒を蒸発させて器の内側に薄膜を残すか、又は噴霧乾燥させることなどによる、従来技術に従って調製され得る。続いて、水相を渦動運動させながら器に添加し、その結果として、MLVを形成することができる。次に、単層ベシクル(ULV)を、多重層ベシクルのホモジナイゼーション、超音波処理、又は押出により形成することができる。加えて、単層ベシクルを、界面活性剤除去技術により形成することができる。
様々な方法が公開された米国特許出願2011/0244026、公開された米国特許出願2016/0038432、公開された米国特許出願2018/0153822、公開された米国特許出願2018/0125989、及び2019年7月23日に出願された米国仮特許出願62/877,597に記載されており、そうした方法を使用して本発明を実施することができ、これらの全ては参照により本明細書に組み込まれる。本明細書で使用される場合、プロセスAとは、US2016/0038432に記載されるように、最初に脂質を脂質ナノ粒子に予め形成することなく、mRNAを脂質の混合物と混合することによってmRNAを封入する従来的な方法を指す。本明細書で使用される場合、プロセスBは、米国特許出願2018/0153822に記載されるように、予め形成された脂質ナノ粒子をmRNAと混合することによってメッセンジャーRNA(mRNA)を封入するプロセスを指す。
所望のmRNAをリポソーム内に組み込むプロセスは、「担持させる(loading)」と称されることが多い。例示的な方法は、Lasic,et al. FEBS Lett.,312:255-258,1992に記載されており、この文献は参照によって本明細書に組み込まれる。リポソーム組み込まれたmRNAは、リポソームの内部空間、つまりリポソームの二分子膜内に完全に若しくは部分的に位置するか、又はリポソーム膜の外表面と会合し得る。mRNAのリポソーム内への組み込みは本明細書において「封入」とも称され、そこで、核酸がリポソームの内部空間内に完全に包含される。mRNAを、例えばリポソームなどの移送ビヒクル内に組み込む目的はしばしば、核酸を分解する酵素若しくは化学物質、及び/又は核酸の急速排出をもたらす系若しくは受容体を含み得る環境から核酸を保護することである。したがって、いくつかの実施形態では、好適な送達ビヒクルは、その中に含まれるmRNAの安定性を強化することができ、及び/又は標的細胞若しくは標的組織へのmRNAの送達を容易にする。
医薬組成物
本明細書に記載される様々なプロセスを組み合わせて、本明細書に記載されるプロセスによって鋳型化されたように忠実に転写される最適化されたDNA配列を提供することによって、dsRNAを本質的に含まない、並びにショートマー配列及びロングマー(longmer)配列の混入のない優れた品質のmRNA転写物が提供される。本明細書に記載される精製プロセス(特に、本明細書に記載されるmRNAを精製するための沈殿ベースのエタノールを含まない方法)を使用した、そのようなmRNA転写物の効率的な回収は、同じ優れた特性を有する非常に純粋なmRNA転写物をもたらす。予め形成された脂質ナノ粒子を精製されたmRNAと混合することによって(例えば、上述のプロセスBを使用することによって)、これらのmRNA転写物を封入することは、非常に高い封入効率(例えば、90%超)をもたらすことができる。これらの様々な処理ステップを組み合わせる最終的な結果は、mRNAを標的細胞に送達して、mRNAがコードするペプチド、ポリペプチド、又はタンパク質の最大発現を達成するのに極めて効率的である医薬品である。
したがって、いくつかの実施形態では、本発明は、以下のステップを含む医薬組成物を調製するための方法を提供する:
a)タンパク質コード配列を含むDNA配列を提供するステップと、
b)以下によりDNA配列を最適化するステップであって、
i)DNA配列中の終結シグナルの存在を決定することであって、終結シグナルが、以下の核酸配列:5’-X1ATCTX2TX3-3’を有し、式中、X1、X2及びX3が独立して、A、C、T若しくはGから選択される、決定することと、1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾することであって、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される、修飾することと、並びに/又は
ii)タンパク質コード配列の3’末端に1つ以上の終結シグナルを付加することであって、1つ以上の終結シグナルが、以下の核酸配列:X1ATCTX2TX3-3’を含み、式中、X1、X2及びX3は独立してA、C、T若しくはGから選択される、付加することと、により、最適化するステップと、
c)ステップ(b)の最適化されたDNA鋳型からのインビトロ転写によってmRNAを合成するステップと、
d)ステップ(c)で調製物からmRNAを沈殿させるステップと、
e)ステップ(d)の沈殿したmRNAを含む不純な調製物を、タンジェンシャルフロー濾過によって精製するステップと、
f)ステップ(e)の精製されたmRNAを、1つ以上のカチオン性脂質、1つ以上の非カチオン性脂質、1つ以上のステロール系脂質、又は1つ以上のPEG修飾脂質を含むリポソームに封入するステップ。
いくつかの実施形態では、方法は、ステップ(e)の後に実行される別個のキャッピング反応及びテーリング反応を含む。これらの実施形態では、ステップ(d)及び(e)は、キャッピング反応及びテーリング反応の後に繰り返される。いくつかの実施形態では、不純物調製物を精製することには、エタノールを含まない方法を含む。いくつかの実施形態では、封入は、精製されたmRNAを予め形成された脂質ナノ粒子と混合することが含まれる。いくつかの実施形態では、ステップ(f)に続いて製剤化ステップが行われる。製剤化ステップには、緩衝液交換が含まれ得る。いくつかの実施形態では、製剤化ステップには、mRNAを封入するリポソームの凍結乾燥が含まれる。
本明細書に記載の方法及び材料と同様又は同等の方法及び材料を、本発明の実施又は試験に使用することができるが、好適な方法及び材料を以下に記載する。本明細書で言及された全ての刊行物、特許出願、特許、及びその他の参考文献は、参照によりその全体が組み込まれる。本明細書に引用される参考文献は、請求される発明の先行技術であるとは認められない。更に、材料、方法、及び実施例は例示のみであり、限定することを意図していない。
実施例1:T7及びSP6 RNAポリメラーゼを使用したmRNA合成の例示的な実験設計
本実施例は、T7及びSP6 RNAポリメラーゼに基づくmRNA合成、トランスフェクション、及びそれらの特性評価のための例示的な条件を示す。
メッセンジャーRNA材料
RNAポリメラーゼプロモーターに作動可能に連結された対象タンパク質コード配列をコードするDNA配列を有するプラスミドを、制限酵素で線状化し、精製した。mRNA転写物を、精製され線状化されたプラスミドからのインビトロ転写により合成した。T7転写反応は、1×T7転写緩衝液(80mM HEPES pH8.0、2mMスペルミジン、及び25mM MgCl2、最終pH7.7を有する)、10mM DTT、7.25mMの各ATP、GTP、CTP、及びUTP、RNAse阻害剤、ピロホスファターゼ、並びにT7 RNAポリメラーゼから構成された。SP6反応は、5mMの各NTP、約0.05mg/mLのSP6 RNAポリメラーゼDNA、及び約0.1mg/mLの鋳型DNAを含み、転写緩衝液の他の成分は変化させた。反応を、37℃で60~90分間(別段の記載がない限り)行った。DNAseIを添加して反応を停止させ、更に15分間、37℃でインキュベートした。インビトロ転写されたmRNAを、製造業者の推奨に従って、Qiagen RNA maxiカラムを使用して精製した。
前述のインビトロ転写ステップからの精製mRNA転写物を、GTP(1.25mM)、S-アデノシルメチオニン、RNAse阻害剤、2’-O-メチルトランスフェラーゼ、及びグアニリルトランスフェラーゼの一部分で処理し、反応緩衝液(10x、500mMのトリス-HCl(pH7.5)、60mMのKCl、10mMのMgCl2)と混合した。合わせた溶液を、37℃で30~90分間、一定時間インキュベートした。完了後、ATP(2.0mM)、ポリAポリメラーゼ、及びテーリング反応緩衝液(10×、500mMのTris-HCl(pH7.5)、2.5MのNaCl、100mMのMgCl2)のアリコートを添加し、全反応混合物を、37℃で20~45分間更にインキュベートした。完了したら、最終反応混合物をクエンチし、適宜精製した。
アガロースゲル電気泳動:
1%のアガロースゲルを、50mlのTAE緩衝液中、0.5gのアガロースを使用して調製した。1~2μgのRNAを、2xのグリオキサルゲルローディング色素又は2xのホルムアミドゲルローディング色素で処理し、アガロースゲルに装填し、130Vで30分間又は60分間泳動した。
キャピラリー電気泳動(CE)
標準感度RNA分析キット(15nt)をAdvanced Analyticalから購入し、12本のキャピラリーアレイを備えたフラグメントアナライザー機器(Advanced Analytical)でのキャピラリー電気泳動の実行で使用した。ゲルプライミング時に、300ngの全RNAを希釈マーカーと、1:11(RNA:マーカー)の比率で混合し、96ウェルプレートにウェル当たり24μLを装填した。分子量インジケータラダーは、2μLの標準感度RNAラダーを22μLの希釈マーカーと混合することによって調製した。試料注入は5.0kV、4秒で、試料分離は8.0kV、40.0分で行った。各試料の蛍光ベースのエレクトロフェログラムを、ProSize 2ソフトウェア(Advanced Analytical)を介して処理し、試料中に存在する断片の集計されたサイズ(bp)及び存在量(ng/μl)を生成した。
消化液クロマトグラフィー質量分析法(LC/MS)
プローブオリゴヌクレオチドをmRNA転写物にアニーリングし、続いてRNase H及びシュリンプアルカリホスファターゼにより消化した。消化反応は、1x RNase H緩衝液(NEB)、RNase H(NEB)、シュリンプアルカリホスファターゼ(NEB)、アニールされたmRNA、及びプローブオリゴヌクレオチドから構成されていた。消化反応を、37℃で40分間行った。
mRNA断片の解析を、UHPLC-QTOFシステム(Agilent社)を用いて実施した。移動相Aは、100mMのヘキサフルオロイソプロパノール及び8.6mMのトリエチルアミン、pH8.3から構成され、移動相Bは100%のMeOHであった。Agilent InfinityLab C18 2.1x100mmカラムを、50℃で0.5mL/分の流量で全ての分析に使用した。移動相Bの5%~23%の勾配を12分間にわたって適用し、続いて、50%の移動相Bで2分間の洗浄ステップを行い、RNA断片を溶出した。全ての質量スペクトルを、400~3200m/zのスキャン範囲にわたって負イオンモードで、以下のMS設定を用いて取得した:乾燥ガス流量、13L/分;ガス温度、350℃;ネブライザー圧力、10psi;キャピラリー電圧、3750V。試料データを、MassHunter Acquisitionソフトウェア(Agilent)を使用して取得した。
RNAシーケンシング
10~15塩基の3’バーコード配列、続いて25~40AのポリAストレッチを含み、3’末端と5’末端の両方にリン酸基を有し、それぞれmRNA転写物へのライゲーションを可能にし、自己ライゲーションを防止する、オリゴを設計した。まず、mRNA転写物の5’末端へのオリゴのライゲーションを防止するために、mRNA転写物をrSAPで処理して、その5’リン酸基を除去した。T4 RNAリガーゼを使用して、オリゴをmRNA転写物にライゲーションし、HO-mRNA転写物-バーコード-ポリA-PO4構築物を得た。第2のrSAP処理ステップは、Nanoporeシーケンシング(MinION、Oxford Nanopore)の準備において、上記構築物から3’リン酸を除去した。
Nanoporeシーケンシングについては、HO-mRNA転写物-バーコード-ポリA-OH構築物を、シーケンシングアダプターにアニーリング及びライゲーションし、製造業者のプロトコルに従ってつながれた後、Nanopore細胞チップに装填した。装填されると、試料は、3’~5’方向にナノ細孔を通して引かれた。シーケンシングの完了後、バーコードの一部を含有する読み取りを解析し、その領域に続く塩基を収集して分析した。
実施例2:rrnBターミネーターt1シグナルの存在は、mRNA転写物の早期終結を引き起こす
本実施例は、対象のタンパク質コード配列のコドン最適化DNA配列における終結シグナルの意図しない存在が、どのようにインビトロ転写の早期終結をもたらし、その結果、完全長タンパク質コード配列をその一部のみが含む、mRNA転写物の不均一な集団を生じさせるかを示している。
RNAポリメラーゼプロモーターに作動可能に連結された対象のコドン最適化タンパク質コード配列(mRNA-1)をコードするDNA配列を有するプラスミドを、実施例1に記載されるようなSP6 RNAポリメラーゼを使用するmRNA転写物のインビトロ転写に使用した。mRNA転写物のサイズを、キャピラリー電気泳動(CE)により評価した(図1)。完全長mRNA-1転写物の長さは約1900ヌクレオチドであった。mRNA-1転写物のおおよそ45%は、約900ヌクレオチドの長さのトランケートされた転写物であった(図1)。
E.coli rrnBターミネーターt1シグナルコンセンサス配列TATCTGTTの存在は、SP6及びT7 RNAポリメラーゼの両方の一次停止又は終結を引き起こすと報告されている(Kwon & Kang 1999,The Journal of Biological Chemistry,274:41,pp 29149-29155、Sohn & Kang,2005,PNAS,102:1,pp.75-80)。mRNA-1タンパク質コード配列の分析により、それにはヌクレオチド796で始まるコンセンサスrrnBターミネーターt1シグナルが含まれていることが分かった。
野生型rrnBターミネーターt1シグナルでは、コンセンサス配列TATCTGTTの直後にGTTTGTCGTG配列が続く。バリアントrrnB1ターミネーターt1シグナル配列の終結効率を評価する際に、Kwon & Kang(同書)は、試験されたバリアントターミネーターt1シグナルのうちの1つを除く全てにおいて、TATGTCTTコンセンサス配列の3’の直近の5ヌクレオチドに少なくとも3つのT塩基を含めた。この領域が削除された場合、0%の終結効率が観察され、この下流のTリッチ配列が、rrnBターミネーターt1シグナルでの終結に必要であることを示唆する。しかしながら、mRNA-1中のコンセンサスrrnBターミネーターt1シグナルに続いて、下流Tリッチ配列(代わりに、
配列番号29内に見出される)が続かず、これが終結配列の必須要素ではないことを実証している。
本実施例は、mRNA構築物中のrrnBターミネーターt1シグナルコンセンサス配列の存在が、Tリッチ配列の非存在下であっても、mRNA転写物の早期終結を引き起こし、所望の完全長mRNA転写物の収率の大幅な低下をもたらし得ることを示す。
実施例3:rrnB終結t1シグナルのバリアントもまた、mRNA転写物の早期終結をもたらす
本実施例は、コンセンサス配列に対して1位、6位、又は8位の点変異を有するrrnBターミネーターt1シグナルの存在も、インビトロ転写中の早期終結をもたらすことを示す。
実施例2からのmRNA-1タンパク質コード配列のバリアントを作製し、そこでTATCTGTTコンセンサス終結シグナル配列を単一位置で変異させて、rrnB終結t1シグナル内のどのヌクレオチドが転写終結に必須であるかを決定した(以下の表1を参照)。
バリアントを、SP6 RNAポリメラーゼを使用するインビトロ転写に使用した。mRNA転写物のサイズを、実施例1に記載されるようにキャピラリー電気泳動により決定した。約1900ヌクレオチドで観察されるバンドは、完全長mRNA-1構築物を表す。約900ヌクレオチドのバンドが観察され、mRNA転写物は、バリアント終結シグナルでの早期終結のためにトランケートされた。この実験の結果は、CEによるmRNA転写物の定量から生成されたデジタルゲル画像に示され(図2)、表1に要約されている。
mRNA-1バリアントは、1位、6位、又は8位のヌクレオチドの同一性がコンセンサス配列と比較して変化していた場合でも、依然としてトランケートされたmRNA転写物をもたらした。しかしながら、2、3、4、5、又は7位のヌクレオチドが変異していた場合、トランケーションは観察されなかった。したがって、タンパク質コード配列を有するDNA配列内の終結シグナルをスクリーニングする場合、コンセンサス配列と、1位、6位、及び8位の点変異を有する配列バリアントの両方が、インビトロ転写の早期終結を避けるために考慮されるべきである。
TATCTGTTコンセンサス終結シグナル配列の第4位のCがGで置換された場合、終結は発生しないことが以前に知られていた(Sohn & Kang,2005,PNAS,102:1,pp.75-80)。2、3、4、5、又は7位の残基のいずれかが、その位置に天然に存在しないヌクレオチドで置換された場合、トランケーションが観察されなかったという所見は、DNA配列によってコードされるタンパク質コード配列を変更することなく、終結シグナルを除去するためのより大きな柔軟性を提供する。
実施例4:rrnBターミネーターt1シグナルは、mRNA転写物の早期終結を引き起こす
本実施例は、SP6 RNAポリメラーゼを使用したインビトロ転写によって産生されるmRNA転写物における早期終結部位が、rrnBターミネーターt1シグナルのインシリコスクリーニングによって予測され得ることを示す。
実施例3で決定されたように、1位、6位、又は8位でこの配列とは異なる、E.coli rrnBターミネーターt1シグナルコンセンサス配列TATCTGTT又はバリアント配列の存在について、コドン最適化タンパク質コード配列を有する様々なDNA配列をインシリコでスクリーニングした。この解析は、ポリメラーゼがこれらの終結シグナルで早期終結したときに産生されるであろうトランケートされたmRNA転写物のサイズを予測するために実施された(以下の表2を参照)。
正確性についてインシリコ予測を試験するために、コドン最適化タンパク質コード配列をSP6/T7 RNAポリメラーゼを使用してインビトロで転写し、mRNA転写物の実際のサイズを、実施例1に記載されるように、キャピラリー電気泳動(CE)によって決定した。トランケートされたmRNA転写物の実際のサイズは、インシリコ解析によって予測されるサイズと比較した(表2を参照)。
mRNA転写物のトランケーションは、同定された全てのターミネーターシグナルで観察された。rrnBターミネーターt1シグナルの同定に基づくトランケートされたmRNA転写物の予測サイズは、トランケートされたmRNA転写物の実験的に決定されたサイズと良好に相関した。
実施例5:SP6 RNAポリメラーゼによって産生されるmRNA転写物は、二重鎖RNAを含有しない
本実施例は、T7 RNAポリメラーゼによって合成されるmRNA転写物とは異なり、SP6 RNAポリメラーゼのmRNA転写物が、RNA二本鎖を含有することを示す。
T7 RNAポリメラーゼで合成されたmRNA転写物には、通常、所望の転写物よりもより長いRNA及びより短いRNAが混入している(WO2018/157153を参照されたい)。非常に短い転写物は、一般的に「ショートマー」と呼ばれ、典型的には、インビトロ転写mRNAの広範な精製によって除去される必要がある。
伸長された配列は、終結シグナル後の鋳型にコードされたmRNA転写物の末端でのヌクレオチドの非鋳型的付加によって生成されると考えられる。追加のヌクレオチドは、一般に「ランオフ」と呼ばれる。ランオフの3’末端が、それ自体又は第2のmRNA分子に結合して、それぞれ伸長可能な分子内二重鎖又は分子間二重鎖を形成するのに十分な相補性を有する場合、更なる伸長が起こり得る(Gholamalipour et al.2018,Nucleic Acids Research 46:18,pp 9253-9263)。
mRNA転写物は、実施例1に記載されるように、SP6 RNAポリメラーゼ又はT7 RNAポリメラーゼのいずれかを使用した、4つの異なる鋳型プラスミドからのインビトロ転写によって生成された。各鋳型プラスミドは、同じタンパク質をコードするmRNA転写物をコードした。RNA二本鎖の存在は、Baiersdorfer et al.2019,Molecular Therapy:Nucleic Acids,15:26-35に記載されているように、抗dsRNAモノクローナル抗体J2を使用して実行されるドットブロット分析によって検出された。
ドット当たり200ngの全mRNAに相当する、インビトロ転写されたmRNAの各サンプル2μlを、正に荷電したナイロン膜上にスポットした。dsRNAの対照サンプルを、ドット当たり2ng及び25ngでスポットした。dsRNAの検出については、膜を抗dsRNAマウスモノクローナル抗体J2とインキュベートした。検出には、西洋わさびペルオキシダーゼにコンジュゲートされた抗マウスIgG抗体を使用した。得られたドットブロットを図3に示す。この図から分かるように、SP6 RNAポリメラーゼで合成されたmRNA転写物では二本鎖RNAは検出されなかったが、T7 RNAポリメラーゼで調製されたサンプルでは多量の二本鎖RNAが検出された。
SP6RNAポリメラーゼによって合成されたmRNA転写物は、分子内二重鎖又は分子間二重鎖を形成しない。
実施例6:T7 RNAポリメラーゼ及びSP6 RNAポリメラーゼによって産生されるmRNA転写物は、非鋳型的な伸長によって伸長される
本実施例は、T7及びSP6 RNAポリメラーゼの両方によって合成されるmRNA転写物が、「ランオフ」転写によって伸長されることを実証する。
インビトロ転写のためのSP6 RNAポリメラーゼの使用は、T7 RNAポリメラーゼで一般的に観察されるmRNA転写物におけるショートマーの形成を回避する(WO2018/157153を参照されたい)。SP6RNAポリメラーゼによって合成されるmRNA転写物は、通常は、より均質なサイズであるようである。
T7 RNAポリメラーゼと同様にSP6 RNAポリメラーゼが、終結シグナル(ランオフ転写)に遭遇した後、非鋳型媒介様式でmRNA転写物を伸長し続けるかどうかを決定するために、鋳型化された配列によってコードされるmRNA転写物の3’末端に結合するプローブオリゴヌクレオチドのセットを設計した。プローブオリゴヌクレオチドは、Integrated DNA Technologies(Coralville、IA)によって合成されたRNA-DNAギャップオリゴヌクレオチドであった。それらの配列及び糖修飾を表3に示す。2’-O-メチルリボース修飾RNAヌクレオチドは、対応する塩基の前に「m」で示され、DNAヌクレオチドは斜体で示される。
RNaseHを添加してDNA/RNAハイブリッドを消化し、鋳型化配列の3’のmRNA転写物の断片のみを残した。mRNA転写物の3’末端消化産物のサイズを、実施例1に記載されるように、液体クロマトグラフィー質量分析法(LC/MS)によって決定した。試験された6つのオリゴヌクレオチドのうち、プローブオリゴヌクレオチド#1は、予想される最長の3’消化産物(CAUCAAGCU)を生じさせ、更なる実験のために選択された。
結果を図4Aに示す。SP6 mRNA転写物が鋳型化された配列の末端で終了した(すなわち、ランオフ伸長がなかった場合)場合、プローブオリゴヌクレオチド#1を用いて、9ヌクレオチド3’消化産物(CAUCAAGCU)が得られた。この消化産物の同一性は、実施例1に記載されるように、質量分析によって確認された。質量分析分析の結果を図4Bに示す。mRNA産物のランオフ伸長が発生したところで、より長い3’消化産物が得られた。
T7 RNAポリメラーゼを用いて実験を繰り返した。SP6及びT7 RNAポリメラーゼにより転写されたmRNAの3’消化産物のLC/MS分析の結果を、図5Aで比較する。ランオフ伸長によって3’に付加された塩基の数は、T7 RNAポリメラーゼ及びSP6 RNAポリメラーゼmRNA転写物をシーケンシングすることによっても決定された(図5B)。SP6 RNAポリメラーゼによって合成されたmRNA転写物は、T7 RNAポリメラーゼによって合成されたmRNA転写物と比較して短いランオフ配列を有したが、追加のランオフ配列のない場合のmRNA転写物のパーセンテージも低かった。
これらのデータは、インビトロで合成されたmRNA転写物の非鋳型的な伸長が、SP6 RNAポリメラーゼ及びT7 RNAポリメラーゼの両方を使用した場合に起こることを実証している。
実施例7:3’末端に終結シグナルを含めることで、線状化プラスミドから合成されたmRNA転写物の望ましくない伸長を防ぐ
本実施例は、mRNA転写物をコードするDNA配列の3’末端に1つ以上の終結シグナルを付加することが、線状化プラスミドから転写されたmRNAの望ましくない伸長を減少させることを示す。
mRNA転写物(mRNA-12)をコードするDNA配列は、標準的な分子生物学手順を使用してプラスミド内に挿入することによりSP6 RNAポリメラーゼに作動可能に連結された。得られたプラスミドを、事前の線状化の有無に関わらず、インビトロ転写に使用した。転写開始部位から880bp下流で配列特異的制限酵素でプラスミドを切断することによって、線状化を実行した。図6Aに示すように、線状化プラスミドは、実施例1に記載されるようなキャピラリー電気泳動によって決定されるように、単一の879nt長のmRNA転写物を生じた。
終結配列の挿入が、DNA配列の末端で転写の効果的な終結をもたらすかどうかを決定するために、2つの修飾プラスミドを調製した。プラスミド1には、mRNA転写物をコードするDNA配列の3’末端に単一のrrnB終結t1シグナル
が含まれていた。プラスミド2には、DNA配列の3’末端に同じ終結シグナルの2コピーを含有していた
非修飾プラスミド及び修飾プラスミド1及び2は、線状化され、SP6 RNAポリメラーゼを使用したインビトロ転写の鋳型として使用され、mRNA転写物のサイズを、実施例1に記載されるように、キャピラリー電気泳動によって決定した。
図6Bに示すように、プラスミド1は、長さ796ntのより短いmRNA転写物を産生し、新たに付加された終結配列で終結が起こったことを示す。しかしながら、終結シグナルは、第1のピークに近い第2のピークによって証明されるように、ポリメラーゼの停止に完全には有効ではなく、RNAポリメラーゼが終結シグナルで直接終結せず、代わりに転写を終結する前に短い距離の間転写を続ける事例が比較的多いことを示唆している。この第2のピークは、プラスミド2から生成されるmRNA転写物に対して目に見えず(図6Cを参照)、わずか10塩基対で区切られたタンデムでの2つの終結シグナルの含有が、mRNA転写物の望ましくない伸長を防ぐのに効率的であったことを実証した。
実施例8:3’末端に終結シグナルを含めると、スーパーコイルドプラスミドDNAから合成されたmRNA転写物の望ましくない伸長が防止される
本実施例は、mRNA転写物をコードするDNA配列の3’末端に1つ以上の終結シグナルを付加することで、インビトロ転写の前に環状核酸ベクターを線状化する必要がなくなることを示している。
mRNA転写物をコードするDNA配列の3’末端に終結シグナルが含まれる場合に、線状化が必要かどうかを決定するために、インビトロ転写の前にプラスミドの線状化をすることなく、実施例7の実験を繰り返した。スーパーコイル化プラスミドDNAを、未修飾プラスミドのインビトロ転写に使用した場合、得られたmRNA転写物のキャピラリー電気泳動中に、複数の新しいピークが見られた(図7A)。最大のピーク(全mRNA転写物の約55%を表す)は、約3126nt~約3230ntの長さのmRNA転写物に対応した。プラスミドのヌクレオチド配列のより綿密な検査により、mRNA転写物をコードするDNAシーケンシングの下流の終結シグナル(CATCTATT)が同定された。ヌクレオチド配列解析に基づいて、mRNA転写物の予測されるサイズは、3306ntであると予想されるため、約3126nt~約3230ntで観察されたピークサイズと良好に相関した。この観察は、RNAポリメラーゼが、プラスミド骨格内に既に存在する終結シグナルに遭遇するまで、スーパーコイル化プラスミドDNAを転写し続けたことを示しており、その時点で転写は終結し、所望されるmRNA転写をコードするDNA配列の末端に終結シグナルを含有させることにより、インビトロ転写の前にプラスミド線状化の必要がなくなることが偶然にも確認された。更に大きな転写物に対応する複数のより小さなピークの存在は、反応混合物中のRNAポリメラーゼの少なくとも一部が、反応が終結する前にプラスミド鋳型を複数回転写することを示唆する。対照的に、プラスミド1を鋳型として使用した場合、終結シグナルTATCTGTTの存在により、転写のより効果的な終結をもたらし、mRNA転写物の約70%が約792ntのサイズを有する(図7B)。二つのTATCTGTT終結シグナルをタンデムでわずか10塩基対で区切られたプラスミド2を用いると、正しく終結されたmRNA転写物のパーセンテージは更に約95%まで改善された(図7C)。
本実施例は、mRNA転写物をコードするDNA配列の3’末端に1つ以上の終結シグナルが存在することにより、mRNA合成が主にDNA配列の末端で終結されるので、鋳型を含むプラスミドの線状化の必要性がなくなることを示す。mRNA転写物の長さを考えると、ランオフ転写は、終結シグナルの存在によっても防止されると考えられる。特に、わずか10塩基対で区切られた2つのコンセンサス終結シグナルを含めることで、非常に効率的な転写終結に至り、ランオフ転写が防止され、プラスミド線状化の必要性をなくすことができる。
実施例9:37℃を超える温度でのインビトロ転写は、終結を改善する
本実施例は、インビトロ転写反応が37℃を超える温度で実行される場合、1つ以上の終結シグナルで終結する可能性が高くなることを示す。
正しく終結したmRNA転写物のパーセンテージが更に改善され得るかを決定するために、実施例8に記述された実験をプラスミド2で反復したが、異なる温度で行った。SP6 RNAポリメラーゼを使用し、温度は別として、実施例1に記載されるものと同一の反応条件で、スーパーコイル化プラスミド2をインビトロ転写反応の鋳型として使用した。得られたmRNA転写物のサイズは、実施例1にも記載されるように、キャピラリー電気泳動によって決定された。
ブロックヒーターに置かれたエッペンドルフ管中でインビトロ転写反応を実行することによって反応温度を制御した。図8Aに示すように、以前に使用した37℃の温度では、スーパーコイル化プラスミド2から得られたmRNA転写物の92%~95%が正しく終結した。インビトロ転写反応が実行された温度が43℃、50℃、又は55℃に上昇するにつれて、正しく終結されたプラスミドのパーセンテージは更に増加した。正しく終結されたmRNA転写物の収率は、50℃でピークに達した。図8Bに示すように、その温度で、プラスミド2から得られたmRNA転写物の99.7%が正しく終結した。50℃では最小限の分解しか観察されなかった。
1つ以上の終結シグナルを有するスーパーコイル化プラスミドを使用し、37℃を超える温度でインビトロ転写反応を実行することにより、プラスミド線状化を必要とせずに正しく終結されたmRNA転写物の収率を最大化する反応条件が得られた。
実施例10:3’末端に3つ以上の終結シグナルを含有させることで、37℃で正しく終結されたmRNA転写物が得られる
本実施例は、mRNA転写物をコードするDNA配列の3’末端に3コピー以上の終結シグナルが存在する場合、インビトロ転写が37℃で実行されるときに、100%に近い正しく終結されたmRNA転写物の収率に到達できることを示す。これにより、反応を実施する前に環状核酸ベクターを線状化する必要なく、従来の条件下でインビトロ転写反応を実施することができる。
鋳型DNAプラスミドへの3つ以上の終結シグナルの挿入の効果を調査するために、mRNA-12をコードする更に修飾されたプラスミドを調製した。プラスミド1及び2を、実施例7に記載されるように調製した。プラスミド3は、mRNA転写物をコードするDNA配列の3’末端に3つのrrnB終結t1シグナルのコピーを含有し、以下の終結配列を作成した:
プラスミド1及び2の終結配列は、mRNA-12のタンパク質コード領域の直後に挿入されたが、プラスミド3の終結配列は、3’UTR領域の後に挿入された。したがって、プラスミド3がインビトロ転写のDNA鋳型として使用される場合、正しく終結された転写物は、プラスミド1又は2が使用される場合に生成されるもの(約780ヌクレオチド長)よりも長い(約880ヌクレオチド長)。
実施例9の実験(DNAプラスミドの線状化なし、37℃及び50℃で実行されるインビトロ転写)を、未修飾プラスミド、及び修飾プラスミド1、2及び3に対して繰り返した。反応温度は、サーモサイクラーに置かれたエッペンドルフ管中でインビトロ転写反応を実行することによって制御された。
実施例8のように、37℃での未修飾プラスミドのインビトロ転写について観察された最大のピークは、長さ約3119ntのmRNA転写物に対応した(図9A)。これは、RNAポリメラーゼが、プラスミド骨格中に既に存在する終結シグナルに遭遇するまで、スーパーコイル化プラスミドDNAを転写し続け、その時点で転写は終結したことを、再度示すものである。インビトロ転写を50℃で行ったとき、分解が観察され、37℃転写反応の同等のピークと比較して約3099ntの長さのmRNA転写物に対応する、より小さなピークにつながった(図9B)。
プラスミド1を鋳型として使用した場合、終結シグナルの存在が、それぞれ37℃及び50℃で実行された転写反応について完全長mRNA-12転写物に対応するサイズを有する約62%及び約74%のmRNA転写物で、転写のより効果的な終結をもたらした(図(9C及び9D)。二つの終結シグナルをタンデムで含むプラスミド2では、正しく終結されたmRNA-12転写物のパーセンテージが更に増加し、それぞれ37℃及び50℃で実行された転写反応に対して約90%及び約93%に達した(図9E及び9F)。正しく終結された転写物の割合は、3つの終了シグナルをタンデムで含むプラスミド3について更に増加し、37℃で実施された転写反応では100%に近づく収率、及び50℃では>99.0%の収率に達した(図9G及び9H)。未修飾プラスミドについては、DNA鋳型としてプラスミド1、2又は3を使用して50℃で実行された転写反応について、mRNA転写物の著しい分解が観察された。この実験で50℃で行われた反応で著しい分解が観察されたが、実施例9に記載された実験では観察されなかったという事実は、実施例9の反応温度が一貫して50℃に維持されていない可能性があることを示唆している。(例えば、エッペンドルフ管の一部が、加熱ブロック自体よりもはるかに低い温度を有する周囲空気に曝露されるため)。これは、37℃を超える温度での分解を最小限に抑えるために、反応条件を最適化する必要がある場合があることを示唆している。
本実施例は、mRNA転写物をコードするDNA配列の3’末端で終結シグナルの数を増やすことにより、mRNA合成が主にDNA配列の末端で終結するため、鋳型を含むプラスミドの線状化の必要性がなくなることを更に確認する。また、1つ又は2つの終結シグナルが直列に含まれていた場合、正しく終結されたmRNA転写物の収率は、転写反応をより高い温度で行うことによって改善され得るが、mRNA分解を最小限に抑えるよう注意する必要があることも示す。3つ以上の終結シグナルを直列に含めることにより、正しく終結されたmRNA転写物の収率が100%に近くに到達することができ、転写反応が37℃で実行されるときに、このようなDNAプラスミド鋳型に対し終結効率を最大化できることが示される。
実施例11:3’終結シグナルを有するスーパーコイル化プラスミドDNAから転写されたmRNAは、インビトロで効果的に発現する
本実施例は、3’終結シグナルを有するスーパーコイル化プラスミドDNAから転写されたmRNAと、線状化プラスミドから転写されたmRNAについて、同等のレベルのタンパク質発現を達成できることを示す。したがって、本実施例は、3’終結シグナルを含めることで、インビトロ転写前に環状核酸ベクターを線状化させる必要性がなくなるという更なる証拠を提供する。
タンパク質発現レベルは、実施例10に記載される、スーパーコイル化プラスミド3(mRNA転写物をコードするDNA配列の3’末端に3コピーのrrnB終結t1シグナルを含有する)からのインビトロ転写によって調製されたmRNA-12転写物について、及び線状化されていないプラスミド(終結シグナルを含有しない)からのインビトロ転写によって調製された同等のmRNA-12転写物について、決定された。
タンパク質発現レベルを、無細胞翻訳系(CFTS)を使用して評価した。CFTSは、細胞培養の維持又はトランスフェクション剤の使用を必要とせずに、ハイスループット様式でmRNA構築物の発現をスクリーニングするための有用なツールである。CFTSのコア成分は、HeLa細胞から生成された細胞質抽出物であり、タンパク質を発現するために必要な機構を含む(Mikami et al.2005,Protein Expression and Purification,46,348-357)。補助的反応成分、主にMg2+及びK+レベルの調整を介して、目的のタンパク質に対してタンパク質発現が最適化される。本実施例で使用されるCFTS反応条件及び成分は、mRNA-12転写物によってコードされるタンパク質の発現のために最適化されている。
2つの別個のCFTS反応混合物を、各mRNA-12転写物に対して調製した。CFTS反応混合物は、65μLの反応体積中に、325fmolのmRNA-12転写物、40%(v/v)のHeLa細胞質抽出物(20mg/ml総タンパク質量)、27mMのHEPES(pH7.5)、140mMのKOAc、1.2mMのMg(OAc)2、16mMのKCl、RNAse阻害剤(1U/μL)、1mMのDTT、1.2mMのATP、125μgのGTP、30μMのアミノ酸混合物、300μMのスペルミジン、18mMのクレアチンホスファターゼ、60μg/mLのクレアチンキナーゼ、及び90μg/mLの子牛肝tRNAを含む。
反応混合物を、25℃で2時間インキュベートした。この後、タンパク質発現レベルがELISAにより決定されるまで、反応混合物を、-80℃で保存した。この分析の結果を図10に示す。図10は、スーパーコイル化プラスミド3から転写されたmRNA-12について、線状化されていないプラスミドから転写されたmRNA-12よりも、同等又は更にわずかに高いレベルのタンパク質発現を達成できることを示す。
これらのデータは、終結配列の付加が、それに応じて修飾されたDNA鋳型のRNAポリメラーゼによる転写を終結させるのに有効であり、その結果インビトロ転写の前にDNA鋳型を含むプラスミドを線状化する必要がもはやないという本発明者らの発見を裏付けるものである。したがって、3’終結シグナルを有するスーパーコイル化DNA鋳型から産生されたmRNAは、mRNAを作製するための既存のプロセスにおいて、線状化プラスミドから提供されるmRNAを置き換えることができる。
プラスミド線状化ステップは、典型的には制限酵素とのインキュベーションを伴う。したがって、このステップを除去することにより、特に医薬品としてmRNAを製造するために大規模に行われる場合に、mRNAの生産における大幅なコスト削減をもたらすことができる。
均等物
当業者は、日常的な実験作業を越えない手法を使用して、本明細書に記載される本発明の特定の実施形態の多くの均等物を認識するか、又は確認できるものとなる。本発明の範囲は、上記の記載を限定することを意図しないが、むしろ以下の特許請求の範囲に記述されるとおりである。
Duet al.(2009,Biotechnol.Biogen.,104(6):1189-1196)は、T7 phiターミネーターの大きなサイズ(100bp)と非効率が問題であると考え、代わりに、各々8塩基対で区切られた1~3個の水胞性口内炎ウイルス(vsv)クラスII終結シグナル(TATCTGTTAGTTTTTTTC(配列番号36))をタンデムで含めることによって、環状DNA鋳型からの転写中の終結効率を改善することを試みた。その結果、単一のvsv終結シグナルを使用した場合、終結効率は53~62%に過ぎないことが判明した。2~3個のvsvターミネーターを使用した場合、終了効率は65~75%に増加した。
したがって、一態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化DNA配列を調製するための方法を対象とし、当該方法は、(a)タンパク質コード配列を含むDNA配列を提供すること、(b)DNA配列中の終結シグナルの存在を決定することを含み、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を有し、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される、決定することと、(c)1つ以上の終結シグナルが存在する場合、当該終結シグナルの2位、3位、4位、5位及び7位のうちのいずれか1つにおいて、1つ以上の核酸を他の3つの核酸のうちのいずれか1つで置換して最適化されたDNA配列を生成することによって、DNA配列を修飾することであって、必要に応じて、1つ以上の置換核酸が、タンパク質コード配列によってコードされるタンパク質のアミノ酸配列を保存するために選択される、修飾することと、を含む。
したがって、更なる態様では、本発明は、インビトロ転写のための鋳型としてタンパク質をコードする最適化DNA配列を調製するための方法を提供し、当該方法は、(a)タンパク質をコードするDNA配列を提供することと、(b)DNA配列の3’末端に1つ以上の終結シグナルを付加して、最適化されたDNA配列を提供することと、を含み、1つ以上の終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。本発明は、インビトロ転写で使用するためのDNA配列もまた提供し、5’から3’の順序で、(a)5’UTRと、(b)タンパク質コード配列と、(c)3’UTRと、(d)任意選択的にポリAテールをコードする核酸配列と、(e)終結シグナルと、を含み、終結シグナルは、以下の核酸配列:5’-X1ATCTX2TX3-3’(配列番号1)を含み、式中、X1、X2及びX3が独立して、A、C、T又はGから選択される。更に、本発明は、典型的にはRNAポリメラーゼプロモーターに作動可能に連結されたDNA配列を含む核酸ベクター、及びRNAポリメラーゼが、DNA配列をmRNA転写物に転写する、mRNAの産生のための方法におけるこれらの核酸ベクターの使用を提供する。
本出願の実施例は、2つ以上の終結シグナルの付加が、線状DNA鋳型及びスーパーコイルDNA鋳型の両方について、インビトロ転写中のmRNA転写物の望ましくない伸長の低下をもたらすことを実証する。したがって、いくつかの実施形態では、2つ以上、3つ以上、4つ以上の終結シグナルが、DNA配列の3’末端に付加される。いくつかの実施形態では、3’末端に付加される終結配列は、長さ30ヌクレオチドのヌクレオチド配列内に2つの終結シグナル(例えば、5’-X1ATCTX2TX3-3’(配列番号1)、式中、X1、X2及びX3は独立して、A、C、T又はGから選択される)を含むか、又はそれからなる。いくつかの実施形態では、3’末端に付加される終結配列は、以下の配列:5’-X1ATCTX2TX3-(ZN)-X4ATCTX5TX6-3’(配列番号10)を含むか、又はそれからなり、式中、X1、X2、X3、X4、X5、及びX6が独立して、A、C、T又はGから選択され、ZNは、N個のヌクレオチドのスペーサー配列を表し、その各々は独立してA、C、TのGから選択され、Nは10以下である。いくつかの実施形態では、終結配列は、以下の配列を含むか、又はそれらからなる:TTTTATCTGTTTTTTTTTTTTTATCTGTTTTTTTTT(配列番号12)。
いくつかの実施形態では、好適なSP6 RNAポリメラーゼは融合タンパク質である。例えば、SP6 RNAポリメラーゼは、酵素の単離、精製、又は溶解性を促進するための1つ以上のタグを含み得る。適切なタグは、N末端、C末端、及び/又は内部に配置され得る。好適なタグの非限定的な例としては、カルモジュリン結合タンパク質(CBP)、Fasciola hepatica 8-kDa抗原(Fh8)、FLAGタグペプチド、グルタチオン-S-トランスフェラーゼ(GST)、ヒスチジンタグ(例えば、ヘキサヒスチジンタグ(His6)(配列番号38))、マルトース結合タンパク質(MBP)、N-利用物質(NusA)、低分子ユビキチン様修飾因子(SUMO)融合タグ、ストレプトアビジン結合ペプチド(STREP)、タンデムアフィニティ精製(TAP)、及びチオレドキシン(TrxA)が挙げられる。本発明では他のタグを使用することができる。これら及び他の融合タグは、例えば、Costa et al.Frontiers in Microbiology 5(2014):63及びPCT/US16/57044に記載されており、その内容は参照によりその全体が本明細書に組み込まれる。いくつかの実施形態では、Hisタグは、SP6のN末端に位置する。