JP2019518478A

JP2019518478A - バーコードを付けたコンビナトリアルライブラリーを生成する方法

Info

Publication number: JP2019518478A
Application number: JP2019519616A
Authority: JP
Inventors: ライアンティー．ギル，; アンドリューガースト，; ターニャエリザベスワーネッケリプスコム，; マルセロコリカバッサロ，; ラムジーイブラヒムゼイトーン，
Original assignee: University of Colorado
Current assignee: University of Colorado
Priority date: 2016-06-24
Filing date: 2017-06-23
Publication date: 2019-07-04
Also published as: WO2017223538A9; US20170369870A1; AU2017280353A1; AU2017280353B2; CN109688820A; WO2017223538A1; EP3474669A4; EP3474669B1; US20230227810A1; CA3029254A1; CN109688820B; US20180230460A1; EP3474669A1; US20180230461A1; US10017760B2; US11584928B2; US20190194650A1; LT3474669T; ES2915562T3; US10294473B2

Abstract

追跡可能な遺伝子バリアントライブラリーのための方法および組成物が本明細書で提供される。反復的操作のための方法および組成物が本明細書でさらに提供される。多重操作のための方法および組成物が本明細書でさらに提供される。核酸誘導型ヌクレアーゼを使用して編集および追跡可能な操作された配列および細胞を濃縮するための方法および組成物が本明細書でさらに提供される。複雑な表現型を最適化および探究するための高度に複雑なコンビナトリアル操作戦略を可能にするための方法および組成物が本明細書で提供される。

Description

相互参照
本出願は、２０１６年６月２４日に出願された米国仮出願番号第６２／３５４，５１６号、２０１６年７月２７日に出願された米国仮出願番号第６２／３６７，３８６号、および２０１７年４月１０日に出願された米国仮出願番号第６２／４８３，９３０号に基づく優先権を主張しており、各々の内容は、本明細書によってそれらの全体が参考として援用される。

連邦政府によって支援された研究に関する陳述
本開示は、エネルギー庁による契約番号ＤＥ−ＳＣ０００８８１２の下、合衆国政府の支援によってなされた。

配列表
本出願は、表５に配列リストを含む。

開示の背景
タンパク質のアミノ酸構造とその全体的な機能の関係を理解することには、生物学者および技術者にとって大きな実用的、臨床的、および科学的重要性があり続けている。指向性進化法は、強力な操作および発見ツールであり得るが、ランダムかつ多くの場合にコンビナトリアルであるという変異の性質により、それらの個々の影響を定量することは難しく、したがって、さらなる操作は課題である。個々の残基または飽和変異誘発の寄与のより系統的な分析は、タンパク質全体に関しては依然として多大な労力および時間を要するものであり、単純に、標準の方法を使用して妥当な時間尺度で多数のタンパク質、例えば代謝経路または多タンパク質複合体などを並行して編集することは可能ではない。

開示の要旨
ｉ）ａ）改変された第１の標的核酸配列；ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；およびｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列を含む第１のドナー核酸；ならびにｉｉ）ａ）改変された第１の標的核酸配列に対応するバーコード；およびｂ）第２の標的核酸の一部と相補的な第２のスペーサー領域を含む第２のガイド核酸配列を含む第２のドナー核酸を含む組成物が本明細書に開示される。改変された第１の標的核酸配列が、対応する改変されていない第１の標的核酸と比較して、少なくとも１つの挿入された、欠失した、または置換された核酸を含む組成物がさらに開示される。第１のガイド核酸および第２のガイド核酸が核酸誘導型ヌクレアーゼに適合する組成物がさらに開示される。核酸誘導型ヌクレアーゼがＩＩ型またはＶ型Ｃａｓタンパク質である組成物がさらに開示される。核酸誘導型ヌクレアーゼがＣａｓ９ホモログまたはＣｐｆ１ホモログである組成物がさらに開示される。第２のドナー核酸が第２のＰＡＭ変異を含む組成物がさらに開示される。第２のドナー核酸配列がスクリーニング可能または選択可能なマーカーをオンまたはオフにするための調節配列または変異を含む組成物がさらに開示される。第２のドナー核酸配列が独特のランディング部位を標的とする組成物がさらに開示される。

ゲノム操作の方法であって、ａ）細胞の集団をポリヌクレオチドと接触させるステップであって、各細胞が、第１の標的核酸、第２の標的核酸、および核酸誘導型ヌクレアーゼを含み、ポリヌクレオチドが、１）ｉ）改変された第１の標的核酸配列；ｉｉ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；ｉｉｉ）第１の標的核酸の一部と相補的なスペーサー領域を含み、核酸誘導型ヌクレアーゼに適合する、第１のガイド核酸配列を含む編集カセット；ならびに２）ｉ）改変された第１の標的核酸配列に対応するバーコード；およびｉｉ）第２の標的核酸の一部と相補的な第２のスペーサー領域を含み、核酸誘導型ヌクレアーゼに適合する、第２のガイド核酸配列を含むレコーダーカセットを含む、ステップと、ｂ）第１のガイド核酸配列、第２のガイド核酸配列、および核酸誘導型ヌクレアーゼに、第１の標的核酸および第２の標的核酸内でゲノム編集を創出させるステップとを含む方法が本明細書に開示される。ｃ）バーコードの一部について配列決定するステップであって、それにより、ステップａ）において第１の標的核酸内に挿入された改変された第１の標的核酸を同定するステップをさらに含む方法がさらに開示される。核酸誘導型ヌクレアーゼがＣＲＩＳＰＲヌクレアーゼである方法がさらに開示される。ＰＡＭ変異が核酸誘導型ヌクレアーゼによって認識されない方法がさらに開示される。核酸誘導型ヌクレアーゼがＩＩ型またはＶ型Ｃａｓタンパク質である方法がさらに開示される。核酸誘導型ヌクレアーゼがＣａｓ９ホモログまたはＣｐｆ１ホモログである方法がさらに開示される。レコーダーカセッが核酸誘導型ヌクレアーゼによって認識されない第２のＰＡＭ変異をさらに含む方法がさらに開示される。

選択可能な反復的遺伝子操作の方法であって、ａ）核酸誘導型ヌクレアーゼを含む細胞を、レコーダーカセットを含むポリヌクレオチドと接触させるステップであって、前記レコーダーカセットが、ｉ）操作の前のラウンド中に組み入れられた独特のランディング部位内に組み換えられる核酸配列であって、独特のバーコードを含む核酸配列；およびｉｉ）独特のランディング部位を標的とする核酸誘導型ヌクレアーゼに適合するガイドＲＮＡを含む、ステップと、ｂ）核酸誘導型ヌクレアーゼに独特のランディング部位を編集させるステップであって、それにより、独特のバーコードを独特のランディング部位に組み入れるステップとを含む方法が本明細書に開示される。核酸配列がスクリーニング可能または選択可能なマーカーの転写をオンまたはオフにする調節配列をさらに含む方法がさらに開示される。核酸配列が核酸誘導型ヌクレアーゼに適合しないＰＡＭ変異をさらに含む方法がさらに開示される。核酸配列がその後の操作ラウンドのための第２の独特のランディング部位をさらに含む方法がさらに開示される。ポリヌクレオチドが、ａ）改変された第１の標的核酸配列；ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；およびｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列を含む編集カセットをさらに含み、独特のバーコードが、改変された第１の標的核酸に対応し、その結果、改変された標的核酸を独特のバーコードによって同定することができる方法がさらに開示される。

ｉ）ａ）改変された第１の標的核酸配列；ｂ）変異プロトスペーサー隣接モチーフ（ＰＡＭ）配列；およびｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列を含む第１のドナー核酸；ならびにｉｉ）ａ）レコーダー配列；およびｂ）第２の標的核酸の一部と相補的な第２のスペーサー領域を含む第２のガイド核酸配列を含む第２のドナー核酸を含む組成物が本明細書で提供される。一部の態様では、第１のドナー核酸と第２のドナー核酸は、共有結合により連結しているか、または単一の核酸分子上に含まれる。改変された第１の標的核酸が５’ホモロジーアームおよび３’ホモロジーアームを含む組成物がさらに提供される。５’ホモロジーアームおよび３’ホモロジーアームが、第１のスペーサー領域と相補的なプロトスペーサーに隣接する核酸配列と相同である組成物がさらに提供される。改変された第１の標的核酸配列が、対応する改変されていない第１の標的核酸と比較して、少なくとも１つの挿入された、欠失した、または置換された核酸を含む組成物がさらに提供される。第１のｇＲＮＡ核酸誘導型がヌクレアーゼと適合し、それにより、第１の標的核酸のヌクレアーゼ媒介性切断が容易になる組成物がさらに提供される。核酸誘導型ヌクレアーゼが、ＩＩ型またはＶ型Ｃａｓタンパク質などのＣａｓタンパク質である組成物がさらに提供される。核酸誘導型ヌクレアーゼがＣａｓ９またはＣｐｆ１である組成物がさらに提供される。核酸誘導型ヌクレアーゼがＭＡＤ２またはＭＡＤ７である組成物がさらに提供される。核酸誘導型ヌクレアーゼが操作された酵素または非天然酵素である組成物がさらに提供される。核酸誘導型ヌクレアーゼがＣａｓ９またはＣｐｆ１に由来する操作された酵素または非天然酵素である組成物がさらに提供される。核酸誘導型ヌクレアーゼが、Ｃａｓ９またはＣｐｆ１のいずれかに対して８０％未満の相同性を有する操作された酵素または非天然酵素である組成物がさらに提供される。変異ＰＡＭ配列が核酸誘導型ヌクレアーゼによって認識されない組成物がさらに提供される。レコーダー配列がバーコードを含む組成物がさらに提供される。レコーダー配列がスクリーニング可能または選択可能なマーカーの断片を含む組成物がさらに提供される。レコーダー配列が、改変された第１の標的核酸配列を特異的に同定するものである独特の配列を含む組成物がさらに提供される。レコーダー配列が、編集された細胞を選択または濃縮することができる独特の配列を含む組成物がさらに提供される。第１のドナー核酸は、本明細書に開示されている編集カセットなどのカセットであってよい。第２のドナー核酸は、本明細書に開示されているレコーディングカセットなどのカセットであってよい。第１のドナー核酸と第２のドナー核酸は、単一のカセット上に含まれていてよい。第１のドナー核酸と第２のドナー核酸は、共有結合により連結していてよい。これらの例のいずれにおいても、カセットまたはドナー核酸のエレメントは連続していてもよく連続していなくてもよい。

第１の改変された配列；第１の変異プロトスペーサー隣接モチーフ（ＰＡＭ）；第１のレコーダー配列であって、その配列によって第１の改変された配列が一意的に同定される、第１のレコーダー配列を含み、第１の改変された配列と第１のレコーダー配列が少なくとも１ｂｐ離れている、操作された染色体またはポリ核酸を含む細胞が本明細書で提供される。第１の改変された配列と第１のレコーダー配列が少なくとも１００ｂｐ離れている細胞がさらに提供される。第１の改変された配列と第１のレコーダー配列が少なくとも５００ｂｐ離れている細胞がさらに提供される。第１の改変された配列と第１のレコーダー配列が少なくとも１ｋｂｐ離れている細胞がさらに提供される。第１のレコーダー配列がバーコードである細胞がさらに提供される。第１の改変された配列がコード配列内にある細胞がさらに提供される。第１の改変された配列が、改変されていない配列と比較して、少なくとも１つの挿入された、欠失した、または置換されたヌクレオチドを含む細胞がさらに提供される。第２の改変された配列；第２の変異ＰＡＭ；および第２のレコーダー配列であって、その配列によって第２の改変された配列が一意的に同定される、第２のレコーダー配列をさらに含み、第２の改変された配列と第２のレコーダー配列が少なくとも１ｋｂ離れている、細胞がさらに提供される。第１のレコーダー配列と第２のレコーダー配列が１００ｂｐ未満離れている細胞がさらに提供される。第２のレコーダー配列がバーコードである細胞がさらに提供される。第２の改変された配列がコード配列内にある細胞がさらに提供される。第２の改変された配列が、改変されていない配列と比較して、少なくとも１つの挿入された、欠失した、または置換されたヌクレオチドを含む細胞がさらに提供される。第１のレコーダー配列と第２のレコーダー配列が互いに隣接するか、または重複しており、それにより、複合レコーダー配列が生成される細胞がさらに提供される。複合レコーダー配列が選択可能またはスクリーニング可能なマーカーを含む細胞がさらに提供される。複合レコーダー配列が、それにより細胞を濃縮または選択することができる選択可能またはスクリーニング可能なマーカーを含む細胞がさらに提供される。

ゲノム操作の方法であって、ａ）細胞の集団に複数のポリヌクレオチドを導入するステップであって、各細胞が、第１の標的核酸、第２の標的核酸、およびターゲティング可能なヌクレアーゼを含み、各ポリヌクレオチドが、ｉ）改変された第１の標的核酸配列；ｉｉ）変異プロトスペーサー隣接モチーフ（ＰＡＭ）配列；ｉｉｉ）第１の標的核酸の一部と相補的なガイド配列を含む第１のガイド核酸配列；および（ｉｖ）レコーダー配列を含む、ステップと、ｂ）改変された第１の標的核酸配列を第１の標的核酸内に挿入するステップと、ｃ）レコーダー配列を第２の標的核酸内に挿入するステップと、ｄ）第１の標的核酸を、変異ＰＡＭ配列を含まない細胞内のターゲティング可能なヌクレアーゼによって切断するステップであって、それにより、挿入された改変された第１の標的核酸配列を含む細胞を濃縮するステップとを含む方法が本明細書で提供される。レコーダー配列が、改変された第１の標的核酸に連結している方法がさらに提供される。各ポリヌクレオチドが、第２の変異ＰＡＭ配列をさらに含む方法がさらに提供される。各ポリヌクレオチドが、第２の標的核酸の一部と相補的なガイド配列を含む第２のガイド核酸配列をさらに含む方法がさらに提供される。レコーダー配列が、レコーダー配列について配列決定した際に改変された第１の標的核酸を特異的に同定するものである独特の配列を含む方法がさらに提供される。ｅ）レコーダー配列について配列決定するステップであって、それにより、ステップｂ）において第１の標的核酸内に挿入された改変された第１の標的核酸を同定するステップをさらに含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、第１の標的核酸を、第１のガイド核酸配列の転写産物と複合体を形成したヌクレアーゼによって切断することを含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、相同組換え修復（ｈｏｍｏｌｏｇｙ−ｄｉｒｅｃｔｅｄｒｅｐａｉｒ）をさらに含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、相同組換えをさらに含む方法がさらに提供される。ポリヌクレオチドが、第２の標的核酸の一部と相補的なスペーサー領域を含む第２のガイド核酸配列をさらに含む方法がさらに提供される。レコーダー配列を挿入するステップが、第２の標的核酸を、第２のガイド核酸配列の転写産物と複合体を形成したヌクレアーゼによって切断することを含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、相同組換え修復をさらに含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、相同組換えをさらに含む方法がさらに提供される。ターゲティング可能なヌクレアーゼがＣａｓタンパク質である方法がさらに提供される。Ｃａｓタンパク質がＩＩ型またはＶ型Ｃａｓタンパク質である方法がさらに提供される。Ｃａｓタンパク質がＣａｓ９またはＣｐｆ１である方法がさらに提供される。ターゲティング可能なヌクレアーゼが核酸誘導型ヌクレアーゼである方法がさらに提供される。ターゲティング可能なヌクレアーゼがＭＡＤ２またはＭＡＤ７である方法がさらに提供される。変異ＰＡＭ配列がターゲティング可能なヌクレアーゼによって認識されない方法がさらに提供される。ターゲティング可能なヌクレアーゼが、操作されたターゲティング可能なヌクレアーゼである方法がさらに提供される。変異ＰＡＭ配列が、操作されたターゲティング可能なヌクレアーゼによって認識されない方法がさらに提供される。第２の複数のポリヌクレオチドをステップｄ）により濃縮された細胞を含む第２の細胞の集団に導入するステップであって、第２の細胞の集団内の各細胞が、第３の核酸、第４の標的核酸、およびターゲティング可能なヌクレアーゼを含むステップをさらに含む方法がさらに提供される。第２のポリヌクレオチドのそれぞれが、ｉ）改変された第３の標的核酸配列；ｉｉ）第３の変異プロトスペーサー隣接モチーフ（ＰＡＭ）配列；ｉｉｉ）第３の標的核酸の一部と相補的なスペーサー領域を含む第３のガイド核酸配列；および（ｉｖ）第２のレコーダー配列を含む方法がさらに提供される。各第２のポリヌクレオチドが、第４の変異ＰＡＭ配列をさらに含む方法がさらに提供される。各第２のポリヌクレオチドが、第４の標的核酸の一部と相補的なガイド配列を含む第４のガイド核酸配列をさらに含む方法がさらに提供される。ａ）改変された第３の標的核酸配列を第３の標的核酸内に挿入するステップと、ｂ）第２のレコーダー配列を第４の標的核酸内に挿入するステップと、ｃ）第３の標的核酸を第２の変異ＰＡＭ配列を含まない細胞内のヌクレアーゼによって切断するステップであって、それにより、挿入された改変された第３の標的核酸配列を含む細胞を濃縮するステップとをさらに含む方法がさらに提供される。第４の標的核酸が第２の標的核酸に隣接している方法がさらに提供される。挿入された第１のレコーダー配列が第２のレコーダー配列に隣接しており、したがって、第１および第２のレコーダー配列についての配列決定情報を単一の配列決定読み取りから得ることができる方法がさらに提供される。単一の配列読み取り内の第１および第２のレコーダー配列からの配列情報を得るステップであって、それにより、それぞれ第１および第３の標的核酸に挿入された改変された第１および第３の標的核酸配列を同定するステップをさらに含む方法がさらに提供される。

操作された細胞を同定する方法であって、ａ）細胞を提供するステップであって、各細胞が、第１の標的核酸、第２の標的核酸、およびターゲティング可能なヌクレアーゼを含む、ステップと、ｂ）細胞に、１）ｉ）改変された標的核酸配列；ｉｉ）変異プロトスペーサー隣接モチーフ（ＰＡＭ）配列；およびｉｉｉ）第１の標的核酸の一部と相補的な第１のガイド配列を含む第１のガイド核酸配列を含む第１のドナー核酸；ならびに２）ｉ）改変された標的核酸配列に対応するレコーダー配列；およびｉｉ）第２の標的核酸の一部と相補的な第２のガイド配列を含む第２のガイド核酸配列を含む第２のドナー核酸を含むポリヌクレオチドを導入ステップと、ｃ）第１の標的核酸を、変異ＰＡＭ配列を含まない細胞内のヌクレアーゼによって切断するステップであって、それにより、改変された標的核酸配列を含む細胞を濃縮するステップと、ｄ）ステップａ）〜ｃ）を、ステップｃ）において濃縮された細胞を次のラウンドのステップａ）の細胞として使用して少なくとも１回繰り返すステップであって、各ラウンドのレコーダー配列を前のラウンドのレコーダー配列に隣接させて組み込むステップであって、それにより、複数の追跡可能なバーコードを含むレコード配列アレイを生成するステップと、ｅ）レコード配列について配列決定するステップであって、それにより、改変された標的核酸の所望の組合せを含む操作された細胞を同定するステップとを含む方法が本明細書で提供される。第２のドナー核酸が第２の変異ＰＡＭ配列をさらに含む方法がさらに提供される。レコード配列アレイについて配列決定するステップが、単一の配列決定読み取り内の複数のレコーダー配列のそれぞれについての配列情報を得ることを含む方法がさらに提供される。ステップａ）〜ｃ）を少なくとも１回繰り返す方法がさらに提供される。ステップａ）〜ｃ）を少なくとも２回繰り返す方法がさらに提供される。レコーダー配列がバーコードである方法がさらに提供される。第１のドナー核酸と第２のドナー核酸が共有結合により連結している方法がさらに提供される。第１のドナー核酸は、本明細書に開示されている編集カセットなどのカセットであってよい。第２のドナー核酸は、本明細書に開示されているレコーディングカセットなどのカセットであってよい。第１のドナー核酸と第２のドナー核酸は、単一のカセット上に含まれていてよい。第１のドナー核酸と第２のドナー核酸は、共有結合により連結していてよい。これらの例のいずれにおいても、カセットまたはドナー核酸のエレメントは連続していてもよく連続していなくてもよい。

操作された細胞を同定する方法であって、ａ）細胞を提供するステップであって、各細胞が、第１の標的核酸、第２の標的核酸、およびターゲティング可能なヌクレアーゼを含む、ステップと、ｂ）細胞に、１）ｉ）改変された標的核酸配列；ｉｉ）変異プロトスペーサー隣接モチーフ（ＰＡＭ）配列；およびｉｉｉ）第１の標的核酸の一部と相補的な第１のガイド配列を含む第１のガイド核酸配列を含む第１のドナー核酸；ならびに２）ｉ）改変された標的核酸配列に対応するマーカー断片；およびｉｉ）第２の標的核酸の一部と相補的な第２のガイド配列を含む第２のガイド核酸配列を含む第２のドナー核酸を含むポリヌクレオチドを導入するステップと、ｃ）第１の標的核酸を、変異ＰＡＭ配列を含まない細胞内のヌクレアーゼによって切断するステップであって、それにより、改変された標的核酸配列を含む細胞を濃縮するステップと、ｄ）ステップａ）〜ｃ）を、ステップｃ）において濃縮された細胞を次のラウンドのステップａ）の細胞として使用して、少なくとも１回繰り返すステップであって、各ラウンドのマーカー断片を前のラウンドのマーカー断片に隣接させて組み込むステップであって、それにより、完全なマーカーを生成するステップと、ｅ）完全なマーカーを含む細胞を同定するステップであって、それにより、改変された標的核酸の所望の組合せを含む操作された細胞を同定するステップとを含む方法が本明細書で提供される。第２のドナー核酸が第２の変異ＰＡＭ配列をさらに含む方法がさらに提供される。完全なマーカーが選択可能なマーカーを含む方法がさらに提供される。選択可能なマーカーが抗生物質抵抗性マーカーまたは栄養要求性マーカーを含む方法がさらに提供される。完全なマーカーがスクリーニング可能なレポーターを含む方法がさらに提供される。スクリーニング可能なレポーターが蛍光レポーターを含む方法がさらに提供される。スクリーニング可能なレポーターが遺伝子を含む方法がさらに提供される。スクリーニング可能なレポーターがプロモーターまたは調節エレメントを含む方法がさらに提供される。プロモーターまたは調節エレメントが、スクリーニング可能なまたは選択可能なエレメントの転写をオンまたはオフにする方法がさらに提供される。スクリーニング可能なレポーターが、当該エレメントを含むコロニーの特性を、当該エレメントを含まないコロニーと比較して変化させるスクリーニング可能なまたは選択可能なエレメントを含む方法がさらに提供される。第１のドナー核酸は、本明細書に開示されている編集カセットなどのカセットであってよい。第２のドナー核酸は、本明細書に開示されているレコーディングカセットなどのカセットであってよい。第１のドナー核酸と第２のドナー核酸は、単一のカセット上に含まれていてよい。第１のドナー核酸と第２のドナー核酸は、共有結合により連結していてよい。これらの例のいずれにおいても、カセットまたはドナー核酸のエレメントは連続していてもよく連続していなくてもよい。

ゲノム操作の方法であって、ａ）細胞の集団にポリヌクレオチドを導入するステップであって、各細胞が、第１の標的核酸、第２の標的核酸、およびターゲティング可能なヌクレアーゼを含み、ポリヌクレオチドが、ｉ）改変された第１の標的核酸配列；ｉｉ）変異ヌクレアーゼ認識配列；ｉｉｉ）レコーダー配列を含む、ステップと、ｂ）改変された第１の標的核酸配列を第１の標的核酸内に挿入するステップと、ｃ）レコーダー配列を第２の標的核酸内に挿入するステップと、ｄ）目的の表現型を選択するステップとを含む方法が本明細書で提供される。ポリヌクレオチドが第２の変異ヌクレアーゼ認識部位をさらに含む方法がさらに提供される。目的の表現型を選択するステップが、第１の標的核酸を、変異ヌクレアーゼ認識配列を含まない細胞内のヌクレアーゼによって切断するステップであって、それにより、挿入された改変された第１の標的核酸配列を含む細胞を濃縮することを含む方法がさらに提供される。目的の表現型を選択するステップが、第２の標的核酸を、第２の変異ヌクレアーゼ認識配列を含まない細胞内のヌクレアーゼによって切断するステップであって、それにより、挿入された改変された第１の標的核酸配列を含む細胞を濃縮することを含む方法がさらに提供される。レコーダー配列が、改変された第１の標的核酸に連結している方法がさらに提供される。レコーダー配列が、レコーダー配列について配列決定した際に改変された第１の標的核酸を特異的に同定するものである独特の配列を含む方法がさらに提供される。ｅ）レコーダー配列について配列決定するステップであって、それにより、ステップｂ）において第１の標的核酸内に挿入された改変された第１の標的核酸を同定するステップをさらに含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが相同組換え修復を含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが相同組換えを含む方法がさらに提供される。ヌクレアーゼがＣａｓタンパク質である方法がさらに提供される。ポリヌクレオチドが、第１の標的核酸の一部と相補的なガイド配列を含む第１のガイド核酸配列をさらに含む方法がさらに提供される。改変された第１の標的核酸配列を挿入するステップが、第１の標的核酸を、第１のガイド核酸配列の転写産物と複合体を形成したヌクレアーゼによって切断することを含む方法がさらに提供される。ポリヌクレオチドが、第２の標的核酸の一部と相補的なガイド配列を含む第２のガイド核酸配列をさらに含む方法がさらに提供される。レコーダー配列を挿入するステップが、第２の標的核酸を、第２のガイド核酸配列の転写産物と複合体を形成したヌクレアーゼによって切断することを含む方法がさらに提供される。改変された第１の標的核酸配列またはレコーダー配列を挿入するステップが相同組換え修復を含む方法がさらに提供される。改変された第１の標的核酸配列またはレコーダー配列を挿入するステップが相同組換えを含む方法がさらに提供される。変異ヌクレアーゼ認識配列が、ターゲティング可能なヌクレアーゼによって認識されない変異ＰＡＭ配列を含む方法がさらに提供される。Ｃａｓタンパク質がＩＩ型またはＶ型Ｃａｓタンパク質である方法がさらに提供される。ターゲティング可能なヌクレアーゼがＭＡＤ２である方法がさらに提供される。変異ＰＡＭ配列がＭＡＤ２によって認識されない方法がさらに提供される。ターゲティング可能なヌクレアーゼがＭＡＤ７である方法がさらに提供される。変異ＰＡＭ配列がＭＡＤ７によって認識されない方法がさらに提供される。Ｃａｓタンパク質がＣａｓ９である方法がさらに提供される。変異ＰＡＭ配列がＣａｓ９によって認識されない方法がさらに提供される。Ｃａｓタンパク質がＣｐｆ１である方法がさらに提供される。変異ＰＡＭ配列がＣｐｆ１によって認識されない方法がさらに提供される。ヌクレアーゼがアルゴノートヌクレアーゼである方法がさらに提供される。表現型を選択する前に第１の標的核酸の一部と相補的なガイド配列を含むガイドＤＮＡオリゴヌクレオチドを導入するステップをさらに含む方法がさらに提供される。変異ヌクレアーゼ認識配列がアルゴノートヌクレアーゼによって認識されない変異標的隣接配列を含む方法がさらに提供される。ヌクレアーゼがジンクフィンガーヌクレアーゼである方法がさらに提供される。変異ヌクレアーゼ認識配列がジンクフィンガーヌクレアーゼによって認識されない方法がさらに提供される。ヌクレアーゼが転写活性化因子様エフェクターヌクレアーゼ（ＴＡＬＥＮ）である方法がさらに提供される。変異ヌクレアーゼ認識配列がＴＡＬＥＮによって認識されない方法がさらに提供される。

参照による組み込み
本明細書において言及される全ての刊行物および特許出願は、個々の刊行物または特許出願が具体的にかつ個別に参照により組み込まれることが示されたのと同程度に参照により本明細書に組み込まれる。

図１Ａ〜１Ｃは、標的設計、プラスミド設計、およびプラスミドライブラリー生成を含む遺伝子操作ワークフローの例を示す図である。

図２Ａ〜２Ｄは、開示される操作方法を使用した実験の例についての検証データを示すグラフである。

図３Ａ〜３Ｃは、編集カセットおよびレコーディングカセットを含むプラスミド、ならびに組み入れられた編集または変異を同定するためのバーコードの下流の配列決定を含む追跡可能な遺伝子操作ワークフローの例を示す図である。

図３Ｄ〜３Ｅは、各ラウンドにおいて異なる編集カセットおよび独特のバーコード（ＢＣ）を有するレコーダーカセットを用いる操作の繰り返しラウンド、その後の、各ラウンドにおける操作ステップが上首尾であることを確認するための選択および追跡を含む、追跡可能な遺伝子操作ワークフローの例を示す図である。図３Ｄ〜３Ｅは、各ラウンドにおいて異なる編集カセットおよび独特のバーコード（ＢＣ）を有するレコーダーカセットを用いる操作の繰り返しラウンド、その後の、各ラウンドにおける操作ステップが上首尾であることを確認するための選択および追跡を含む、追跡可能な遺伝子操作ワークフローの例を示す図である。

図４Ａ〜４Ｂは、編集カセットを含むプラスミドを使用した標的変異およびＰＡＭ変異の組み入れの例を示す図である。

図５Ａ〜５Ｂは、標的変異およびＰＡＭ変異を第１の標的配列に組み入れるために設計された編集カセット、ならびにバーコード配列を第２の標的配列に組み入れるために設計されたレコーディングカセットを含むプラスミドの例を示す図である。図５Ｂは、編集カセットおよびレコーダーカセットの組み入れならびに操作された細菌細胞の選択を検証するデータの例を示す。図５Ａ〜５Ｂは、標的変異およびＰＡＭ変異を第１の標的配列に組み入れるために設計された編集カセット、ならびにバーコード配列を第２の標的配列に組み入れるために設計されたレコーディングカセットを含むプラスミドの例を示す図である。図５Ｂは、編集カセットおよびレコーダーカセットの組み入れならびに操作された細菌細胞の選択を検証するデータの例を示す。

図６は、反復的操作ワークフローの例を示す図である。

図７Ａ〜７Ｂは、コンビナトリアル操作のためのプラスミドキュアリングワークフローの例および前記ワークフローを使用した実験の例の検証を示す図である。図７Ａ〜７Ｂは、コンビナトリアル操作のためのプラスミドキュアリングワークフローの例および前記ワークフローを使用した実験の例の検証を示す図である。

図８Ａ〜８Ｂは、標的設計、プラスミド設計、およびプラスミドライブラリー生成を含む遺伝子操作ワークフローの例を示す図である。

図９Ａ〜９Ｄは、遺伝子操作実験の例についての検証データを示すグラフである。

図１０Ａ〜１０Ｆは、遺伝子操作実験からのデータセットの例を示す図である。

図１１Ａ〜１１Ｃは、設計および遺伝子操作実験からのデータセットの例を示す図である。

図１２Ａ〜１２Ｆは、遺伝子操作実験の設計の例を示す図である。図１２Ａ〜１２Ｆは、遺伝子操作実験の設計の例を示す図である。

図１３Ａ〜１３Ｄは、遺伝子操作によって行われる、設計された編集の例を示す図である。

図１４Ａ〜１４Ｂは、遺伝子操作実験の設計の例を示す図である。

図１５Ａ〜１５Ｄは、Ｃａｓ９編集効率の制御の例を示す図である。

図１６Ａ〜１６Ｅは、Ｅ．ｃｏｌｉにおけるｄｓＤＮＡ切断の毒性の例を示す図である。図１６Ａ〜１６Ｅは、Ｅ．ｃｏｌｉにおけるｄｓＤＮＡ切断の毒性の例を示す図である。

図１６Ｆ〜１６Ｈは、低コピー数および高いコピー数のＣａｓ９発現プラスミドを用いた形質転換および生存アッセイの例、ならびに編集および記録効率を示す図である。図１６Ｆ〜１６Ｈは、低コピー数および高いコピー数のＣａｓ９発現プラスミドを用いた形質転換および生存アッセイの例、ならびに編集および記録効率を示す図である。

図１７Ａ〜１７Ｄは、遺伝子欠失のための遺伝子操作戦略の例を示す図である。

図１８Ａ〜１８Ｂは、ガイド核酸および直鎖状ｄｓＤＮＡカセットの同時形質転換による編集効率の制御の例を示す図である。

図１９Ａ〜１９Ｄは、ライブラリークローニング分析の例および統計値を示す図である。

図２０Ａ〜２０Ｂは、リコンビニアリングされた集団の編集カセット追跡の精度の例を示すグラフである。

図２１は、Ｍ９最小培地におけるｆｏｌＡ変異の成長特性の例を示すグラフである。

図２２Ａ〜２２Ｃは、最小培地におけるｆｏｌＡ編集カセットの濃縮プロファイルの例を示す図である。

図２３Ａ〜２３Ｆは、溶媒および抗生物質耐性の改善に関する同定されたａｃｒＢ変異の検証の例を示す図である。図２３Ａ〜２３Ｆは、溶媒および抗生物質耐性の改善に関する同定されたａｃｒＢ変異の検証の例を示す図である。

図２４Ａ〜２４Ｄは、変異バリアント評価分析の例を示すグラフである。

図２５は、エリスロマイシン選択によって同定された変異の再構築の例を示すグラフである。

図２６Ａ〜２６Ｂは、フルフラールまたは熱耐性についてのＣｒｐＳ２８Ｐ変異の検証の例を示す図である。

図２７Ａ〜２７Ｃは、編集およびバーコード相関試験の例を示す図である。図２７Ａ〜２７Ｃは、編集およびバーコード相関試験の例を示す図である。

図２８は、選択可能な記録戦略の例を示す図である。

図２９は、選択可能な記録戦略の例を示す図である。

図３０Ａ〜３０Ｂは、選択可能な記録実験からのデータを示す図である。図３０Ａ〜３０Ｂは、選択可能な記録実験からのデータを示す図である。

図３１Ａ〜３１Ｂは、実験例からの種々の核酸誘導型ヌクレアーゼの編集および形質転換効率を示すグラフである。

図３２は、種々のガイド核酸を用いたＭＡＤ２ヌクレアーゼの編集効率を示すグラフである。

図３３は、種々のガイド核酸を用いたＭＡＤ７ヌクレアーゼの編集効率を示すグラフである。

開示の詳細な説明
本発明の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本発明から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の発明の実施形態に対する種々の代替を、本発明の実施において使用することができることが理解されるべきである。

複雑な表現型を最適化および探究するための高度に複雑なコンビナトリアル操作戦略を可能にするための方法および組成物が本明細書で提供される。基礎研究およびバイオテクノロジーで興味深い多くの表現型は、遠位の遺伝子座において生じる変異の組合せの結果である。例えば、がんは、多くの場合、単一の染色体編集ではなく多数のホールマーク遺伝子機能に影響を及ぼす変異に関連付けられる。同様に、継続的な操作の試みの標的である多くの代謝および調節プロセスでは、目的の表現型アウトプットをもたらすために協同して作用する多くのタンパク質の活性が必要とされる。本明細書に開示されている方法および組成物は、多くの部位における変異による影響に関する迅速な構築および正確な報告を並行してもたらすことができるので、そのような機能の迅速な操作およびプロトタイピングのやり方をもたらすことができる。

本明細書に記載の方法および組成物は、原核細胞、真核細胞、または古細菌細胞を含めた、ＣＲＩＳＰＲもしくはアルゴノートなどの、核酸誘導型ヌクレアーゼ系、またはＴＡＬＥＮ、ＺＦＮ、もしくはメガヌクレアーゼなどの他のターゲティング可能なヌクレアーゼ系が機能する（例えば、ＤＮＡを標的化および切断する）ことができる任意の細胞型において実行または使用することができる。細胞は、Ｅｓｃｈｅｒｉｃｈｉａｓｐｐ．（例えば、Ｅ．ｃｏｌｉ）などの細菌細胞であってよい。細胞は、酵母細胞、例えば、Ｓａｃｃｈａｒｏｍｙｃｅｓｓｐｐ．などの真菌細胞であってよい。細胞は、ヒト細胞であってよい。細胞は、藻類細胞、植物細胞、昆虫細胞、またはヒト細胞を含めた哺乳動物細胞であってよい。それに加えてまたはその代わりに、本明細書に記載の方法は、ｉｎｖｉｔｒｏにおいて、またはＣＲＩＳＰＲもしくはアルゴノートなどの、核酸誘導型ヌクレアーゼ系、またはＴＡＬＥＮ、ＺＦＮ、もしくはメガヌクレアーゼなどの他のヌクレアーゼ系が機能する（例えば、ＤＮＡを標的化および切断する）ことができる無細胞系において実行することができる。

遺伝子操作のための組成物および方法が本明細書に開示される。追跡可能なまたは反復的遺伝子操作に適した方法および組成物が開示される。開示されている方法および組成物では、全ゲノム規模で一ヌクレオチド分解能での忠実度が高く、追跡可能な、多重化されたゲノム編集を可能にするための、大規模に多重化されたオリゴヌクレオチド合成およびクローニングを使用することができる。
追跡可能なプラスミド

方法および組成物を、忠実度が高く追跡可能な編集を例えば一ヌクレオチド分解能で実施するために使用することができ、また、編集を全ゲノム規模でまたはエピソーム核酸分子に対して実施するために使用することができる。大規模に多重化されたオリゴヌクレオチド合成および／またはクローニングを、編集のために、ＣＲＩＳＰＲ系、ＭＡＤ２系、ＭＡＤ７系、または他の核酸誘導型ヌクレアーゼ系などのターゲティング可能なヌクレアーゼ系と組み合わせて使用することができる。

本明細書で使用される場合、「カセット」とは、多くの場合、単一分子ポリヌクレオチドを指す。カセットは、ＤＮＡを含み得る。カセットは、ＲＮＡを含み得る。カセットは、ＤＮＡとＲＮＡの組合せを含み得る。カセットは、天然に存在しないヌクレオチドまたは改変されたヌクレオチドを含み得る。カセットは、一本鎖であってよい。カセットは、二本鎖であってよい。カセットは、単一分子として合成されてよい。カセットは、他のカセット、オリゴヌクレオチド、または他の核酸分子からアセンブルされてよい。カセットは、１つまたは複数のエレメントを含み得る。そのようなエレメントとしては、非限定的な例として、編集配列、レコーダー配列、ガイド核酸、プロモーター、調節エレメント、変異ＰＡＭ配列、ホモロジーアーム、プライマー部位、リンカー領域、独特のランディング部位、カセット、および本明細書に開示されている任意の他のエレメントのいずれかのうちの１つまたは複数を挙げることができる。そのようなエレメントは、任意の順序または組合せであってよい。任意の２つまたはそれよりも多くのエレメントは連続していてもよく連続していなくてもよい。カセットは、より大きなポリ核酸に含まれていてよい。そのようなより大きなポリ核酸は、プラスミドまたはウイルスベクターなど、直鎖状であっても環状であってもよい。カセットは、合成されたカセットであってよい。カセットは、追跡可能なカセットであってよい。

カセットは、多重操作方法および追跡可能な操作方法を含めた、本明細書に開示されている任意の方法または組成物において使用するために設計することができる。例示的なカセットでは、２つまたはそれよりも多くのエレメント、例えば、１）使用者により指定されるゲノム内の標的配列を標的化するように設計されたガイド核酸（例えば、ｇＲＮＡまたはｇＤＮＡ）と２）本明細書に開示されている編集配列および／またはレコーダー配列などをカップリングすることができる（例えば、図１Ｂおよび図５Ａ）。編集配列およびガイド核酸を含むカセットは、編集カセットと称することができる。編集配列を含むカセットは、編集カセットと称することができる。レコーダー配列およびガイド核酸を含むカセットは、レコーダーカセットと称することができる。レコーダー配列を含むカセットは、レコーダーカセットと称することができる。好ましい実施形態では、編集カセットおよびレコーダーカセットを細胞に同時に送達する。さらに、編集カセットおよびレコーダーカセットは、共有結合により連結していてよい。さらに、これらのエレメントは、多重化オリゴヌクレオチド合成によって一緒に合成することができる。

カセットは、１つまたは複数のガイド核酸および編集カセットを連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸および編集カセットは連続している。他の例では、１つまたは複数のガイド核酸および編集カセットは連続していない。他の例では、２つまたはそれよりも多くのガイド核酸および編集カセットは連続していない。

カセットは、１つまたは複数のガイド核酸、編集カセット、およびレコーダーカセットを連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸、編集カセット、およびレコーダーカセットは連続している。他の例では、２つまたはそれよりも多くのガイド核酸、編集カセット、およびレコーダーカセットは連続している。他の例では、１つまたは複数のガイド核酸、編集カセット、およびレコーダーカセットは連続していない。他の例では、２つまたはそれよりも多くのガイド核酸、編集カセット、およびレコーダーカセットは連続していない。

カセットは、１つまたは複数のガイド核酸、１つまたは複数の編集カセット、および１つまたは複数のレコーダーカセットを連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸、１つまたは複数の編集カセット、および１つまたは複数のレコーダーカセットは連続している。他の例では、２つまたはそれよりも多くのガイド核酸、２つまたはそれよりも多くの編集カセット、および２つまたはそれよりも多くのレコーダーカセットは連続している。他の例では、１つまたは複数のガイド核酸、１つまたは複数の編集カセット、および１つまたは複数のレコーダーカセットは連続していない。他の例では、２つまたはそれよりも多くのガイド核酸、２つまたはそれよりも多くの編集カセット、および２つまたはそれよりも多くのレコーダーカセットは連続していない。

カセットは、１つまたは複数のガイド核酸および編集配列を連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸および編集配列は連続している。他の例では、１つまたは複数のガイド核酸および編集配列は連続していない。他の例では、２つまたはそれよりも多くのガイド核酸および編集配列は連続していない。

カセットは、１つまたは複数のガイド核酸、編集配列、およびレコーダー配列を連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸、編集配列、およびレコーダー配列は連続している。他の例では、２つまたはそれよりも多くのガイド核酸、編集配列、およびレコーダー配列は連続している。他の例では、１つまたは複数のガイド核酸、編集配列、およびレコーダー配列は連続していない。他の例では、２つまたはそれよりも多くのガイド核酸、編集配列、およびレコーダー配列は連続していない。

カセットは、１つまたは複数のガイド核酸、１つまたは複数の編集配列、および１つまたは複数のレコーダー配列を連続したポリヌクレオチドとして含み得る。他の例では、１つまたは複数のガイド核酸、１つまたは複数の編集配列、および１つまたは複数のレコーダー配列は連続している。他の例では、２つまたはそれよりも多くのガイド核酸、２つまたはそれよりも多くの編集配列、および２つまたはそれよりも多くのレコーダー配列は連続している。他の例では、１つまたは複数のガイド核酸、１つまたは複数の編集配列、および１つまたは複数のレコーダー配列は連続していない。他の例では、２つまたはそれよりも多くのガイド核酸、２つまたはそれよりも多くの編集配列、および２つまたはそれよりも多くのレコーダー配列は連続していない。

編集カセットは、編集配列を含み得る。編集配列は、同義または非同義変異などの変異、およびホモロジーアーム（ＨＡ）を含み得る。編集配列は、同義または非同義変異などの変異、および、核酸誘導型ヌクレアーゼ媒介性二本鎖切断の部位において標的配列との相同組換えが起こるように設計されたホモロジーアーム（ＨＡ）を含み得る（例えば、図１Ｂ）。

レコーダーカセットは、レコーダー配列を含み得る。レコーダー配列は、バーコードまたはマーカーなどの追跡可能な配列、およびホモロジーアーム（ＨＡ）を含み得る。レコーダー配列は、バーコードまたはマーカーなどの追跡可能な配列、および核酸誘導型ヌクレアーゼ媒介性二本鎖切断の部位において染色体との相同組換えが起こるように設計されたホモロジーアーム（ＨＡ）を含み得る（例えば、図１Ｂ）。

カセットは、鎖の切断ならびに細胞において選択的に濃縮および／または追跡することができる設計された修復を誘導するために必要な機構（例えば、本明細書に開示されているターゲティング可能なヌクレアーゼ、ガイド核酸、編集カセット、および／またはレコーダーカセット）をコードし得る。細胞は、真核細胞、古細菌細胞、原核細胞、またはＥ．ｃｏｌｉなどの微生物などの任意の細胞であってよい（例えば、図２Ａ〜２Ｄ）。

カセットは、編集カセットを含み得る。カセットは、レコーダーカセットを含み得る。カセットは、ガイド核酸および編集カセットを含み得る。カセットは、ガイド核酸およびレコーダーカセットを含み得る。カセットは、ガイド核酸、編集カセット、およびレコーダーカセットを含み得る。カセットは、２つのガイド核酸、編集カセット、およびレコーダーカセットを含み得る。カセットは、２つよりも多くのガイド核酸、１つまたは複数の編集カセット、および１つまたは複数のレコーダーカセットを含み得る。カセットのこれらのエレメントは、共有結合により連結していてよい。カセットのこれらのエレメントは連続していてよい。カセットのこれらのエレメントは連続していてよい。

カセットは、編集配列を含み得る。カセットは、レコーダー配列を含み得る。カセットは、ガイド核酸および編集配列を含み得る。カセットは、ガイド核酸およびレコーダー配列を含み得る。カセットは、ガイド核酸、編集配列、およびレコーダー配列を含み得る。カセットは、２つのガイド核酸、編集配列、およびレコーダー配列を含み得る。カセットは、２つよりも多くのガイド核酸、１つまたは複数の編集配列、および１つまたは複数のレコーダー配列を含み得る。カセットのこれらのエレメントは、共有結合により連結していてよい。カセットのこれらのエレメントは連続していてよい。カセットのこれらのエレメントは連続していてよい。

単一のゲノム編集は、配列決定技術、例えば、ショートリード配列決定技術（例えば、図１Ｃ）、ロングリード配列決定技術、または当技術分野で公知の任意の他の配列決定技術を使用して追跡することができる。

一部の実施形態では、形質転換が起こると、各編集カセットにより、形質転換された細胞内で設計された遺伝子改変が生じる。一部の例では、編集カセットは、編集カセットにより導入された遺伝子変異のバーコードとしてトランスに作用し得、複雑な集団におけるこの変異の頻度を経時的におよび多くの異なる成長条件にわたって追跡することを可能にすることができる（例えば、図２Ａ〜２Ｄおよび図１Ｃ）。

一部の例では、レコーディングカセットにより、マーカーまたはバーコード配列などの設計された追跡可能な配列が、形質転換される細胞内に挿入される。一部の例では、レコーダーカセットは、染色体変異のバーコードとしてシスに作用し得、複雑な集団におけるこの変異の頻度を経時的におよび多くの異なる成長条件にわたって追跡することを可能にすることができる。

本明細書で提供される方法は、設計されたゲノム変異のシスおよび／またはトランス追跡をもたらすことにより、ゲノムワイドな多様性をマッピングするための試料の調製およびカバレッジの深度を単純化し、ゲノム規模での操作のための強力なツールをもたらす（例えば、図１Ｃ）。

複数のカセットをカセットのライブラリーにプールすることができる。カセットのライブラリーは、少なくとも２つのカセットを含み得る。カセットのライブラリーは、５個から百万個までのカセットを含み得る。カセットのライブラリーは、少なくとも百万個のカセットを含み得る。カセットのライブラリーは、任意の数のカセットを含み得ることが理解されるべきである。

カセットのライブラリーは、プール内の他のカセットと比較して共通するエレメントおよび共通しないまたは独特のエレメントの任意の組合せを有するカセットを含み得る。例えば、カセットのライブラリーは、共通するプライミング部位または共通するホモロジーアームを含むと同時に、共通しないまたは独特のバーコードも含有し得る。共通のエレメントは、カセットのライブラリー内のカセットの複数、大多数、または全てに共有されてよい。共通しないエレメントは、カセットのライブラリー内のカセットの複数、少数、または亜集団に共有されてよい。独特のエレメントは、カセットのライブラリー内のカセットの１つ、数個、または亜集団に共有されてよく、したがって、独特のエレメントにより、カセットの１つ、数個、もしくは亜集団を同定する、またはカセットのライブラリー内の他のカセットから区別することができる。そのような共通するものと共通しないものの組合せは、本明細書に開示されている多重化技法にとって有利である。

本明細書に開示されているカセットにより、設計された遺伝子改変を生じさせること、または設計されたマーカーまたはバーコード配列を高効率で、形質転換される細胞に挿入することができる。多くの例において、効率は５０％を超える。一部の例では、効率は、１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、または１００％である（例えば、図３２Ａ、３２Ｂ、および３３）。

一部の例では、形質転換、編集、および／または記録効率は、核酸誘導型ヌクレアーゼなどの、本明細書に開示されている１つまたは複数の構成成分の発現を調節することによって上昇させることができる。構成成分を調節するための方法は、本明細書に開示されており、当技術分野で公知である。そのような方法は、核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲ酵素などの、主題の系の構成成分を、実験計画に応じて低または高コピープラスミド上に発現させるステップを含み得る。

カセットを生成するための方法および組成物が本明細書に開示される。カセットは、本明細書に開示されているカセットを含み得る。例えば、カセットは、本明細書に開示されている編集カセットおよび／またはレコーダーカセットの任意の組合せを含み得る。そのようなカセットは、より大きなポリ核酸分子上に含まれていてよい。そのようなより大きなポリ核酸分子は、例えば、プラスミドまたはウイルスベクターなど、直鎖状であっても環状であってもよい。

編集カセットは、標的核酸配列と比べた変異を含み得る。編集カセットは、所望の変異または編集配列に隣接する標的配列と相同な配列を含み得る。編集カセットは、細胞または細胞の集団内の核酸の標的配列を認識する、またはそれとハイブリダイズし、細胞の核酸の標的配列と相同であり、標的配列に対する少なくとも１つのヌクレオチドの変異、または所望の変異を含む領域を含み得る。

編集カセットは、標的配列に対する第１の変異を含む第１の編集配列を含み得る。第１の変異は、非編集標的配列と比較して少なくとも１つのヌクレオチドの挿入、欠失、または置換などの変異を含み得る。変異は、コード領域または非コード領域に組み入れることができる。

編集カセットは、標的配列に対する第２の変異を含む第２の編集配列を含み得る。第２の変異は、ＰＡＭ配列が変異するまたは他のやり方でサイレンシングされ、その結果、対応する核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼが標的配列を切断することができなくなるように設計することができる。そのような場合では、ＰＡＭのこの変異またはサイレンシングは、第１の編集配列が取り込まれている形質転換体を選択するための方法としての機能を果たし得る。

一部の例では、編集カセットは、少なくとも２つの変異を含み、ここで、１つの変異は、ＰＡＭ変異である。一部の例では、ＰＡＭ変異は、第２の編集カセットに存在し得る。そのような第２の編集カセットは、カセット内の他のエレメントと共有結合により連結していてよく、また、連続していても連続していなくてもよい。

編集カセットは、場合によってプロモーターに作動可能に連結した遺伝子をコードするｇＲＮＡなどのガイド核酸を含み得る。ガイド核酸は、編集配列が組み入れられる標的核酸配列とハイブリダイズするように設計することができる。

レコーディングカセットは、レコーディング配列を含み得る。レコーダー配列は、バーコーディング配列、または他のスクリーニング可能または選択可能なマーカーまたはその断片を含み得る。レコーディング配列は、レコーダーカセット内に含まれていてよい。レコーダーカセットは、標的核酸配列内の挿入部位と相同な領域を含んでよく、したがって、レコーディング配列が相同組換えまたは相同性駆動型修復（ｈｏｍｏｌｏｇｙ−ｄｒｉｖｅｎｒｅｐａｉｒ）系によって組み入れられる。レコーディングカセットの組み入れ部位は、編集カセットによって編集される標的核酸と同じＤＮＡ分子上に含まれていてよい。レコーダー配列は、バーコード、独特のＤＮＡ配列、および／または選択可能もしくはスクリーニング可能なエレメントもしくはマーカーの完全なコピーもしくは断片を含み得る。

レコーダーカセットは、標的配列と比べた変異を含み得る。変異は、ＰＡＭ配列が変異するまたは他のやり方でサイレンシングされ、その結果、対応する核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼが標的配列を切断することができなくなるように設計することができる。そのような場合では、ＰＡＭ部位のこの変異またはサイレンシングは、第１のレコーディング配列が取り込まれている形質転換体を選択するための方法としての機能を果たし得る。レコーダーカセットは、ＰＡＭ変異を含み得る。ＰＡＭ変異は、ＰＡＭ部位が変異するまたは他のやり方でサイレンシングされ、その結果、対応するＣＲＩＳＰＲヌクレアーゼが標的配列を切断することができなくなるように設計することができる。そのような場合では、ＰＡＭ部位のこの変異またはサイレンシングは、レコーダー配列が取り込まれている形質転換体を選択するための方法としての機能を果たし得る。

レコーダーカセットは、ｇＲＮＡをコードする遺伝子などのガイド核酸を含み得る。プロモーターは、核酸誘導型ヌクレアーゼを所望の標的配列にターゲティングすることができるガイド核酸をコードする核酸配列に作動可能に連結していてよい。ガイド核酸は、標的部位内の独特の部位を標的とし得る。一部の場合では、ガイド核酸は、操作の前のラウンドで組み入れられた独特のランディング部位を標的とする。一部の場合では、ガイド核酸は、操作の前のラウンドにおいてレコーダーカセットによって組み入れられた独特のランディング部位を標的とする。

レコーダーカセットは、バーコードを含み得る。バーコードは、対応する変異をバーコードに基づいて同定することができるような独特のバーコードまたは比較的独特なものであってよい。一部の例では、バーコードは、天然には見出されない、天然に存在しない配列である。大多数の例では、編集カセット内の所望の変異とバーコードの組合せは、天然に存在せず、天然には見出されない。バーコードは、任意のヌクレオチド数の長さであってよい。バーコードは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、または３０ヌクレオチドを超える長さであってよい。一部の場合では、バーコードは、３０ヌクレオチドを超える長さである。バーコードは、縮重オリゴヌクレオチド合成によって生成することができる。バーコードは、合理的に設計することもでき、使用者が指定することもできる。

レコーダーカセットは、ランディング部位を含み得る。ランディング部位は、連続的な操作ラウンドのためのレコーダーカセットの標的部位としての機能を果たし得る。ランディング部位は、ＰＡＭを含み得る。ランディング部位は、独特の配列であってよい。ランディング部位は、少なくとも約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０ヌクレオチドの長さであってよい。一部の場合では、ランディング部位は、５０ヌクレオチドを超える長さである。

レコーダーカセットは、選択可能なもしくはスクリーニング可能なマーカー、または選択可能もしくはスクリーニング可能なマーカーをオンもしくはオフにする調節配列もしくは変異を含み得る。そのような場合では、選択可能なマーカーをオンまたはオフにすることは、それぞれ、操作の繰り返しラウンドの選択または対抗選択に使用することができる。調節配列の例としてはリボソーム結合性部位（ＲＢＳ）が挙げられるが、他のそのような調節配列が構想される。選択可能またはスクリーニング可能なマーカーをオンにする変異は、宿主転写機構によって認識される任意の可能性のある開始コドンを含み得る。選択可能またはスクリーニング可能なマーカーをオフにする変異は、開始コドンを欠失させる変異または中途終止コドンもしくは読み枠シフト変異を挿入する変異を含む。

レコーダーカセットは、レコーダー配列が組み入れられる標的部位を標的とするガイド核酸、ガイドＲＮＡによって使用されるＰＡＭをサイレンシングするためのＰＡＭ変異、編集カセットに対応するバーコード、操作のその後のラウンドのレコーダーカセットのランディング部位として機能する独特の部位、スクリーニング可能または選択可能なマーカーをオンまたはオフにする調節配列または変異のうちの１つまたは複数を含んでよく、これらの１つまたは複数のエレメントには、ガイドＲＮＡにより標的とされる切断された標的部位へのこれらの１つまたは複数のエレメントの組換えが促進されるように設計されたホモロジーアームが隣接する。

レコーダーカセットは、第１のホモロジーアーム、ＰＡＭ変異、バーコード、独特のランディング部位、スクリーニング可能または選択可能なマーカーに対する調節配列または変異、第２のホモロジーアーム、およびガイドＲＮＡを含み得る。第１のホモロジーアームは上流のホモロジーアームであってよい。第２のホモロジーアームは下流のホモロジーアームであってよい。ホモロジーアームは、ガイドＲＮＡにより標的とされる切断部位に隣接する配列と相同であってよい。

カセットは、２つの別個の標的核酸配列を標的とするように設計された２つのガイド核酸を含み得る。いずれの場合でも、ガイド核酸は、単一のｇＲＮＡまたはｃｒＲＮＡおよびｔｒＲＮＡ配列からなるキメラｇＲＮＡを含んでよく、あるいは、ｇＲＮＡは分離されたｃｒＲＮＡおよびｔｒＲＮＡを含み得る、または、ガイド核酸はｃｒＲＮＡを含み得る。他の例では、ガイド核酸を追跡可能なポリ核酸または編集カセットを含むプラスミドおよび／またはレコーダーカセットと同時に導入することができる。これらの場合には、ガイド核酸は、別々のプラスミド上にコードさせることもでき、ＲＮＡ形態で、当技術分野で周知の送達方法によって送達することもできる。

カセットは、選択されたガイド核酸と共に機能する、核酸誘導型ヌクレアーゼ、例えばＣＲＩＳＰＲヌクレアーゼなどをコードする遺伝子を含み得る。核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼ遺伝子は、別々のプラスミド上にもたらすことができる。核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼは、追跡可能なポリ核酸またはプラスミドが導入される宿主生物体のゲノムまたはエピソームプラスミド上にもたらすことができる。これらの例のいずれにおいても、核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼ遺伝子は、構成的または誘導性プロモーターに作動可能に連結していてよい。適切な構成的および誘導性プロモーターの例は当技術分野で周知である。核酸誘導型ヌクレアーゼまたはＣＲＩＳＰＲヌクレアーゼは、当技術分野で周知の送達系を使用してｍＲＮＡまたはポリペプチドとしてもたらすことができる。そのようなｍＲＮＡまたはポリペプチド送達系としては、これらに限定されないが、ナノ粒子、ウイルスベクター、または他の細胞透過技術を挙げることができる。

カセットは、例えば、レコーダーカセット内に含まれるものなどの、選択可能またはスクリーニング可能なマーカーを含み得る。例えば、レコーダーカセットは、対応する編集カセットの遺伝子変異と一意的に相関付けることができるまたはそのような遺伝子変異と同定可能に相関付けることができ、したがって、バーコードについて配列決定することにより、編集カセットにより導入された対応する遺伝子変異を同定することが可能になる、追跡可能な核酸配列などのバーコードを含み得る。他の例では、レコーダーカセットは、抗生物質抵抗性遺伝子、栄養要求性マーカー、蛍光タンパク質、または他の公知の選択可能もしくはスクリーニング可能なマーカーをコードする遺伝子の完全なコピーまたは断片を含み得る。
追跡可能なプラスミドライブラリー

追跡可能なライブラリーは、本明細書に開示されている複数のカセットを含み得る。追跡可能なライブラリーは、本明細書に開示されているカセットを含む複数の追跡可能なポリ核酸またはプラスミドを含み得る。本明細書に開示されているレコーダー配列またはレコーダーカセットを含むカセット、ポリヌクレオチド、またはプラスミドは、追跡可能なカセット、ポリヌクレオチド、またはプラスミドと称することができる。本明細書に開示されている編集配列または編集カセットを含むカセット、ポリヌクレオチド、またはプラスミドは、追跡可能なカセット、ポリヌクレオチド、またはプラスミドと称することができる。

一部の場合では、カセット内に含まれる所与のマーカーまたはバーコード配列に対応する編集配列を決定するために配列決定される別個の編集カセットとレコーダーカセットの組合せが、追跡可能なライブラリー内に存在する。したがって、編集およびレコーダー配列が標的配列内に組み入れられたら、レコーダー配列について配列決定することによって組み入れられた編集を決定することができる。レコーダー配列またはバーコードについて配列決定することにより、配列決定の時間および費用を有意に削減することができる。

ライブラリーサイズは、実験設計に依存し得る。例えば、目的のタンパク質内の各アミノ酸を編集することが目的であれば、ライブラリーサイズは、目的のタンパク質内のアミノ酸の数（Ｎ）に依存し得、完全飽和ライブラリー（各位置において全部で２０種のアミノ酸または天然に存在しないアミノ酸）は１９（またはそれよりも多く）×Ｎの規模になり、アラニン−マッピングライブラリーは１×Ｎの規模になる。したがって、１，０００よりも多くのアミノ酸の非常に大きなタンパク質のスクリーニングでさえ、現在の多重化オリゴ合成能（例えば、１２０，０００オリゴ）を考えれば扱いやすいものであり得る。活性スクリーニングに加えてまたはその代わりに、より一般的な性質を、開発されたハイスループットなスクリーニングおよび選択を用い、本明細書に開示されているライブラリーを使用して効率的に試験することができる。ライブラリーを、１個、少なくとも１個、２個、３個、４個、５個、６個、７個、８個、９個、１０個など、最大で標的タンパク質内のアミノ酸の総数を含めた、標的タンパク質内の任意の数のアミノ酸が変異するように設計することができることは容易に理解されるはずである。さらに、触媒として活性なアミノ酸、またはタンパク質間相互作用に関与するものなどの選択されたアミノ酸を標的とすることができる。変異の標的とされた各アミノ酸を、任意の数の代替のアミノ酸、例えば、任意の他の天然のまたは天然に存在しないアミノ酸またはアミノ酸類似体などに変異させることができる。一部の例では、標的とされたアミノ酸を全て同じアミノ酸、例えばアラニンなどに変異させる。他の場合では、標的とされたアミノ酸を、独立に、任意の他のアミノ酸に、任意の組合せまたは順列で変異させる。

追跡可能なライブラリーは、個々の目的の残基または配列内の追跡可能な変異を含み得る。追跡可能なライブラリーは、特注の合成オリゴヌクレオチドアレイを使用して生成することができる。追跡可能なプラスミドは、当技術分野で公知の任意のクローニングまたはアセンブリ方法を使用して生成することができる。例えば、ＣＲＥＡＴＥ−レコーダープラスミドを、化学合成、ギブソン・アセンブリ、ＳＬＩＣ、ＣＰＥＣ、ＰＣＡ、ライゲーションフリークローニング、他のｉｎｖｉｔｒｏオリゴアセンブリ技法、従来のライゲーションに基づくクローニング、またはそれらの任意の組合せによって生成することができる。

バーコードなどのレコーダー配列は、ｉｎｓｉｌｉｃｏにおいて、標的コドンにおける縮重変異を用いて標準のコードによって設計することができる。縮重変異は、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、または３０よりも多くの核酸残基を含み得る。一部の例では、縮重変異は、１５の核酸残基（Ｎ１５）を含み得る。

レコーダーおよび／または編集配列を所望の場所に相同組換えまたは相同性駆動型修復によって組み入れることを可能にするために、レコーダー配列および／または編集配列にホモロジーアームを付加することができる。ホモロジーアームは、合成、ｉｎｖｉｔｒｏアセンブリ、ＰＣＲ、または当技術分野で公知の他の方法によって付加することができる。例えば、ホモロジーアームは、オーバーラップオリゴ伸長、ギブソン・アセンブリ、または本明細書に開示されている任意の他の方法によってアセンブルすることができる。ホモロジーアームをレコーダーおよび／または編集配列の両末端に付加し、それにより、当該配列に２つの別個のホモロジーアーム、例えば、５’ホモロジーアームおよび３’ホモロジーアームを隣接させることができる。

同じ５’および３’ホモロジーアームを複数の別個のレコーダー配列に付加し、それにより、それぞれが同じスペーサー標的または標的とされる挿入部位を有する独特のレコーダー配列のライブラリーを生成することができる。同じ５’および３’ホモロジーアームを複数の別個の編集配列に付加し、それにより、それぞれが同じスペーサー標的または標的とされる挿入部位を有する独特の編集配列のライブラリーを生成することができる。代替の例では、異なるまたは種々の５’または３’ホモロジーアームを複数のレコーダー配列または編集配列に付加することができる。

隣接するホモロジーアームを含むレコーダー配列ライブラリーをベクター骨格にクローニングすることができる。一部の例では、レコーダー配列およびホモロジーアームをレコーダーカセットにクローニングする。レコーダーカセットは、一部の場合では、所望のレコーダー配列挿入部位を標的とするように操作されたガイド核酸またはｇＲＮＡをコードする核酸配列をさらに含み得る。多くの場合、ＣＲＩＳＰＲ／Ｃａｓ媒介性切断部位に隣接する核酸配列は、レコーダーカセット内に含まれるホモロジーアームと相同であるまたは実質的に相同である。

隣接するホモロジーアームを含む編集配列ライブラリーをベクター骨格にクローニングすることができる。一部の例では、編集配列およびホモロジーアームを編集カセットにクローニングする。編集カセットは、一部の場合では、所望の編集配列挿入部位を標的とするように操作されたガイド核酸またはｇＲＮＡをコードする核酸配列をさらに含み得る。多くの場合、ＣＲＩＳＰＲ／Ｃａｓ媒介性切断部位に隣接する核酸配列は、編集カセット内に含まれるホモロジーアームと相同であるまたは実質的に相同である。

全遺伝子または全ゲノム編集ライブラリーをベクター骨格にサブクローニングすることができる。一部の場合では、ベクター骨格は、本明細書に開示されているレコーダーカセットを含む。編集配列ライブラリーを第２の部位に挿入またはアセンブルして、バーコードを固定された遺伝子座に埋め込むと同時に編集ライブラリーを多種多様な使用者により規定される部位に組み込むことができるコンピテントな追跡可能なプラスミドを生成することができる。

最初にレコーダー配列および／またはカセットをベクター骨格にアセンブルまたは挿入し、その後、編集配列および／またはカセットを挿入することができる。他の場合では、最初に編集配列および／またはカセットをベクター骨格に挿入またはアセンブルし、その後、レコーダー配列および／またはカセットを挿入することができる。他の場合では、レコーダー配列および／またはカセットならびに編集配列および／またはカセットを同時にベクターに挿入またはアセンブルすることができる。他の場合では、レコーダー配列および／またはカセットならびに編集配列および／またはカセットを、同じカセット上に含めた後、ベクターに同時に挿入またはアセンブルする。他の場合では、レコーダー配列および／またはカセットならびに編集配列および／またはカセットを連結した後、ベクターに同時に挿入またはアセンブルする。他の場合では、レコーダー配列および／またはカセットならびに編集配列および／またはカセットを共有結合により連結した後、ベクターに同時に挿入またはアセンブルする。これらの場合のいずれにおいても、追跡可能なプラスミドまたはプラスミドライブラリーを生成することができる。

本明細書に開示される１つまたは複数のエレメントを含むカセットまたは核酸分子を合成することができる。例えば、編集カセットおよびガイド核酸を含む核酸分子を合成することができる。編集カセットおよびレコーダーカセットを含む核酸分子を合成することができる。編集カセット、ガイド核酸、およびレコーダーカセットを含む核酸分子を合成することができる。編集カセット、レコーダーカセット、および２つのガイド核酸を含む核酸分子を合成することができる。レコーダーカセットおよびガイド核酸を含む核酸分子を合成することができる。レコーダーカセットを含む核酸分子を合成することができる。編集カセットを含む核酸分子を合成することができる。これらの場合のいずれにおいても、ガイド核酸は、場合によって、プロモーターに作動可能に連結していてよい。これらの場合のいずれにおいても、核酸分子は、１つまたは複数のバーコードをさらに含み得る。

合成されたカセットまたは合成された核酸分子は、当技術分野で公知の任意のオリゴヌクレオチド合成方法を使用して合成することができる。例えば、カセットをアレイに基づくオリゴヌクレオチド合成によって合成することができる。そのような例では、オリゴヌクレオチドの合成後、オリゴヌクレオチドをアレイから切断することができる。アレイからオリゴヌクレオチドを切断することにより、オリゴヌクレオチドのプールを創出することができる。

多重化合成および生成のためにソフトウェアおよび自動化方法を使用することができる。例えば、ソフトウェアおよび自動化を使用して、１０種、１０^２種、１０^３種、１０^４種、１０^５種、１０^６種、またはそれよりも多くのカセット、例えば追跡可能なカセットなどを創出することができる。自動化方法により、追跡可能なプラスミドを迅速に生成することができる。追跡可能なカセットを、最小のステップを伴うワークフローによって処理して、正確に定義された全ゲノムライブラリーを作製することができる。

前述のエレメントのいずれかの１つまたは複数の組合せを含めた、レコーダー配列、編集配列、ガイド核酸、および任意選択のバーコードの本明細書に開示されている任意の組合せを含む２つまたはそれよりも多くの核酸分子またはプラスミドを含む、追跡可能なカセットライブラリーなどのカセットライブラリーを生成することができる。例えば、そのようなライブラリーは、少なくとも２、３、４、５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、１０００、１５００、２０００、２５００、３０００、３５００、４０００、４５００、５０００、５５００、６０００、６５００、７０００、７５００、８０００、８５００、９０００、９５００、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９、１０^１０、またはそれよりも多くの本開示の核酸分子またはプラスミドを含み得る。そのようなライブラリーは、上に特定の数が明示的に列挙されていなくても、任意の数の核酸分子またはプラスミドを含み得ることが理解されるべきである。

各カセットに含まれるレコーダー配列と編集配列の対を決定するために、カセットまたはカセットライブラリーについて配列決定することができる。他の場合では、ライブラリー生成プロセスの間に公知のレコーダー配列と公知の編集配列を対にする。共通する核酸分子またはプラスミド上に含まれるレコーダー配列と編集配列の関連を決定する他の方法は、編集配列をレコーダー配列の同定または配列決定によって同定することができるように構想される。

Ｅ．ｃｏｌｉと他の生物体／細胞株の間でシャトルされる編集されたエピソームのライブラリーを追跡するための方法および組成物が本明細書で提供される。ライブラリーは、プラスミド、細菌人工染色体（ＢＡＣ）、酵母人工染色体（ＹＡＣ）、合成染色体、またはウイルスもしくはファージゲノム上に含まれていてよい。これらの方法および組成物を使用して、Ｅ．ｃｏｌｉなどの宿主生物体におけるポータブルのバーコードが付されたライブラリーを生成することができる。そのような生物体におけるライブラリー生成により、相同組換えを実施するための確立された技法の利点がもたらされ得る。バーコードが付されたプラスミドライブラリーについて１つの部位において深層配列決定して、ライブラリーカバレッジの深度の劇的な改善を可能にするプラスミドの残りの部分を標的とする変異による多様性を追跡することができる（例えば、図３Ａ）。
追跡可能な操作方法

追跡可能な操作ワークフローの例を図３Ａに示す。各プラスミドは、標的ＤＮＡ内の部位が編集されるように設計されたレコーダーカセットをコードし得る（例えば、図３Ａ、黒色のカセット）。標的とされる部位は、機能的に中性の部位であってもよく、スクリーニング可能または選択可能なマーカー遺伝子であってもよい。レコーダーカセットのホモロジーアーム（ＨＡ）は、リコンビニアリングの間にレコーディング部位に挿入されるレコーダー配列を含有し得る（例えば、図３Ｂ）。リコンビニアリングは、核酸誘導型ヌクレアーゼ媒介性ＤＮＡ切断などのＤＮＡ切断、および相同組換えによる修復を含み得る。レコーダー配列は、バーコード、独特のＤＮＡ配列、またはスクリーニング可能もしくは選択可能なマーカーの完全なコピーもしくは断片を含み得る。一部の例では、レコーダー配列は、１５ヌクレオチドである。レコーダー配列は、１０ヌクレオチド未満、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８８、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００ヌクレオチド、または２００よりも多くのヌクレオチドを含み得る。

多重化クローニング手法により、レコーダーカセットをプラスミド内の少なくとも１つの編集カセット（例えば、図３Ａ、緑色のカセット）と共有結合によりカップリングして、独特のレコーダーカセットと編集カセットの組合せを有する追跡可能なプラスミドライブラリーを生成することができる。この追跡可能なライブラリーについて配列決定してレコーダー／編集マッピングを生成することができ、これを使用して編集ライブラリーを標的ＤＮＡの大きなセグメントにわたって追跡することができる（例えば、図３Ｃ）。レコーダーおよび編集配列は、同じポリヌクレオチド上に含まれていてよく、この場合、これらは両方が同じ組換え事象によって、ゲノムまたはプラスミドなどの標的核酸配列に組み入れられる。他の例では、レコーダーおよび編集配列は、同じ追跡可能なプラスミド内の別々のカセット上に含まれていてよく、この場合、レコーダーおよび編集配列は、別々の組換え事象によって、同時にまたは逐次的に標的核酸配列に組み入れられる。

特異的に設計された、追跡可能な変異のライブラリーを創出するために、多重化オリゴヌクレオチド合成とリコンビニアリングを組み合わせる方法が本明細書で提供される。スクリーニングおよび／または選択、その後のハイスループットな配列決定および／またはバーコードマイクロアレイ法により、目的の表現型をもたらす変異の迅速なマッピングを可能にすることができる。

本明細書に開示されている方法および組成物を使用して、標的核酸配列における操作事象を同時に操作し、追跡することができる。

追跡可能なプラスミドは、ｉｎｖｉｔｒｏアセンブリまたはクローニング技法を使用して生成することができる。例えば、ＣＲＥＡＴＥ−レコーダープラスミドを、化学合成、ギブソン・アセンブリ、ＳＬＩＣ、ＣＰＥＣ、ＰＣＡ、ライゲーションフリークローニング、他のｉｎｖｉｔｒｏオリゴアセンブリ技法、従来のライゲーションに基づくクローニング、またはそれらの任意の組合せを使用して生成することができる。

追跡可能なプラスミドは、少なくとも１つのレコーディング配列、例えばバーコードなど、および少なくとも１つの編集配列を含み得る。ほとんどの場合、レコーディング配列は、操作事象を記録および追跡するために使用される。編集配列はそれぞれ、所望の編集を標的核酸配列に組み入れるために使用することができる。所望の編集は、標的核酸配列の挿入、欠失、置換、または変化を含む。一部の例では、１つまたは複数のレコーディング配列および編集配列は、追跡可能なプラスミド内に含まれる単一のカセット上に含まれ、したがって、同じ操作事象によって標的核酸配列に組み入れられる。他の例では、レコーディングおよび編集配列は、追跡可能なプラスミド内の別々のカセット上に含まれ、したがって、それぞれが別個の操作事象によって標的核酸に組み入れられる。一部の例では、追跡可能なプラスミドは、２つまたはそれよりも多くの編集配列を含む。例えば、１つの編集配列を使用してＰＡＭ配列を変化させるまたはサイレンシングすることができると同時に、第２の編集配列を使用して別個の配列に変異を組み入れることができる。

レコーダー配列は、編集配列挿入部位から分離された部位に挿入することができる。挿入されたレコーダー配列は、編集配列から１ｂｐまたは任意の塩基対の数だけ分離されていてよい。例えば、分離距離は、約１ｂｐ、１０ｂｐ、５０ｂｐ、１００ｂｐ、５００ｂｐ、１ｋｐ、２ｋｂ、５ｋｂ、１０ｋｂ、またはそれを超える距離であってよい。分離距離は、任意の別個の整数の塩基対であってよい。２つの挿入部位を分離する塩基対の数の限定は、挿入が行われるゲノム、染色体、またはポリヌクレオチドのサイズによって限定され得ることは容易に理解されるはずである。一部の例では、分離の最大距離は、標的核酸またはゲノムのサイズに依存する。

レコーダー配列は、編集配列に隣接させて、または編集配列の近傍に挿入することができる。例えば、レコーダー配列は、編集配列が挿入されるオープンリーディングフレームの外側に挿入することができる。レコーダー配列は、編集配列が挿入されているオープンリーディングフレームに隣接する非翻訳領域に挿入することができる。レコーダー配列は、機能的に中性または非機能性の部位に挿入することができる。レコーダー配列は、スクリーニング可能または選択可能なマーカー遺伝子に挿入することができる。

一部の例では、標的核酸配列は、ゲノム、人工染色体、合成染色体、またはエピソームプラスミド内に含まれる。種々の例では、標的核酸配列は、ｉｎｖｉｔｒｏにあってもｉｎｖｉｖｏにあってもよい。標的核酸配列がｉｎｖｉｖｏにある場合、ＣＲＥＡＴＥ−レコーダープラスミドを宿主生物体に形質転換、トランスフェクション、コンジュゲーション、微粒子銃、ナノ粒子、細胞透過技術、または他の公知のＤＮＡ送達のための方法、またはそれらの任意の組合せによって導入することができる。そのような例では、宿主生物体は、真核生物、原核生物、細菌、古細菌、酵母、または他の真菌であり得る。

操作事象は、リコンビニアリング、非相同末端結合、相同組換え、または相同性駆動型修復を含み得る。一部の例では、操作事象をｉｎｖｉｔｒｏまたはｉｎｖｉｖｏで実施する。

本明細書に記載の方法は、原核および真核細胞を含めた、核酸誘導型ヌクレアーゼ系が機能する（例えば、ＤＮＡを標的化および切断する）ことができる任意の細胞型において実行することもでき、ｉｎｖｉｔｒｏにおいて実行することもできる。一部の実施形態では、細胞は、Ｅｓｃｈｅｒｉｃｈｉａｓｐｐ．（例えば、Ｅ．ｃｏｌｉ）などの細菌細胞である。他の実施形態では、細胞は、酵母細胞、例えば、Ｓａｃｃｈａｒｏｍｙｃｅｓｓｐｐ．などの真菌細胞である。他の実施形態では、細胞は、藻類細胞、植物細胞、昆虫細胞、またはヒト細胞を含めた哺乳動物細胞である。

一部の例では、細胞は、組換え生物体である。例えば、細胞は、非ネイティブな核酸誘導型ヌクレアーゼ系を含み得る。それに加えてまたはその代わりに、細胞は、組換え系機構を含み得る。そのような組換え系としては、ラムダレッド組換え系、Ｃｒｅ／Ｌｏｘ、ａｔｔＢ／ａｔｔＰ、または他のインテグラーゼ系を挙げることができる。適切な場合には、追跡可能なプラスミドは、選択された組換え系が正確にかつ効率的に機能するために必要な相補的な構成成分または機構を有してよい。

ゲノム編集のための方法は、（ａ）少なくとも１つの編集カセットおよび少なくとも１つのガイド核酸をコードするベクターを第１の細胞の集団に導入するステップであって、それにより、当該ベクターを含む第２の細胞の集団を作製するステップと、（ｂ）第２の細胞の集団を、核酸誘導型ヌクレアーゼが発現するまたは維持される条件下で維持するステップであって、核酸誘導型ヌクレアーゼが、ベクター上、第２のベクター上、第２の細胞の集団の細胞のゲノム上にコードされている、または他のやり方で細胞に導入され、その結果、ＤＮＡ切断および編集カセットの組み入れがもたらされるステップと、（ｃ）生存細胞を得るステップとを含み得る。そのような方法は、場合によって、（ｄ）第２の細胞の集団の少なくとも１つの細胞内の標的ＤＮＡ分子について配列決定して、少なくとも１つのコドンの変異を同定するステップをさらに含み得る。

ゲノム編集のための方法は、（ａ）本明細書に開示されているＰＡＭ変異を含む少なくとも１つの編集カセットおよび少なくとも１つのガイド核酸をコードするベクターを第１の細胞の集団に導入するステップであって、それにより、当該ベクターを含む第２の細胞の集団を作製するステップと、（ｂ）第２の細胞の集団を、核酸誘導型ヌクレアーゼが発現するまたは維持される条件下で維持するステップであって、核酸誘導型ヌクレアーゼが、ベクター上、第２のベクター上、第２の細胞の集団の細胞のゲノム上にコードされている、または他のやり方で細胞に導入され、その結果、ＤＮＡ切断、編集カセットの組み入れ、およびＰＡＭ変異を含む第２の細胞の集団の細胞は生存可能であるが、ＰＡＭ変異を含まない第２の細胞の集団の細胞の死がもたらされるステップと、（ｃ）生存細胞を得るステップとを含み得る。そのような方法は、場合によって、（ｄ）第２の細胞の集団の少なくとも１つの細胞内の標的ＤＮＡについて配列決定して、少なくとも１つのコドンの変異を同定するステップをさらに含み得る。

追跡可能なゲノム編集のための方法は、（ａ）少なくとも１つの編集カセット、少なくとも１つのレコーダーカセット、および少なくとも２つのｇＲＮＡをコードするベクターを第１の細胞の集団に導入するステップであって、それにより、当該ベクターを含む第２の細胞の集団を作製するステップと、（ｂ）第２の細胞の集団を、核酸誘導型ヌクレアーゼが発現するまたは維持される条件下で維持するステップであって、核酸誘導型ヌクレアーゼが、ベクター上、第２のベクター上、第２の細胞の集団の細胞のゲノム上にコードされている、または他のやり方で細胞に導入され、その結果、ＤＮＡ切断ならびに編集およびレコーダーカセットの組み入れがもたらされるステップと、（ｃ）生存細胞を得るステップとを含み得る。そのような方法は、場合によって、（ｄ）第２の細胞の集団の少なくとも１つの細胞内の標的ＤＮＡ分子のレコーダー配列について配列決定して、少なくとも１つのコドンの変異を同定するステップをさらに含み得る。

追跡可能なプラスミドが、ＰＡＭ部位がサイレンシングされるように設計された編集カセットを含む一部の例では、追跡可能なゲノム編集のための方法は、（ａ）少なくとも１つの編集カセット、レコーダーカセット、および少なくとも２つのｇＲＮＡをコードするベクターを第１の細胞の集団に導入するステップであって、それにより、当該ベクターを含む第２の細胞の集団を作製するステップと、（ｂ）第２の細胞の集団を、核酸誘導型ヌクレアーゼが発現するまたは維持される条件下で維持するステップであって、核酸誘導型ヌクレアーゼが、ベクター上、第２のベクター上、第２の細胞の集団の細胞のゲノム上にコードされている、または他のやり方で細胞に導入され、その結果、ＤＮＡ切断、編集カセットおよびレコーダーカセットの組み入れ、ならびにＰＡＭ変異を含む第２の細胞の集団の細胞は生存可能であるが、ＰＡＭ変異を含まない第２の細胞の集団の細胞の死がもたらされるステップと、（ｃ）生存細胞を得るステップとを含み得る。そのような方法は、場合によって、（ｄ）第２の細胞の集団の少なくとも１つの細胞内の標的ＤＮＡのレコーダー配列について配列決定して、少なくとも１つのコドンの変異を同定するステップをさらに含み得る。そのような方法は、第２のＰＡＭ変異を含むレコーダーカセットもさらに含み得、したがって、細胞死を免れるために、両方のＰＡＭが編集カセットＰＡＭ変異およびレコーダーカセットＰＡＭ変異によってサイレンシングされなければならない。

一部の例では、形質転換効率を、リコンビニアリング手順の検証およびＣＦＵ／ｎｇの算出を可能にする非ターゲティングガイド核酸対照を使用することによって決定する。一部の場合では、絶対的な効率を、各形質転換プレート上のコロニーの総数を計数することによって、例えば、ｇａｌＫ対照に由来する赤色コロニーおよび白色コロニーの両方を計数することによって得る。一部の例では、相対的な効率を、対照（例えば、ｇａｌＫ対照）に由来する全てのコロニーのうちの上首尾の形質転換体（例えば、白色コロニー）の総数によって算出する。

本開示の方法は、例えば、コンビナトリアルライブラリーを生成する効率、規模、費用、および／またはそのようなライブラリー生成の精度の、１０００×よりも大きな改善をもたらすことができる。

本開示の方法は、ゲノムまたはコンビナトリアルライブラリーの生成の効率の、例えば、１０×よりも大きな、５０×よりも大きな、１００×よりも大きな、２００×よりも大きな、３００×よりも大きな、４００×よりも大きな、５００×よりも大きな、６００×よりも大きな、７００×よりも大きな、８００×よりも大きな、９００×よりも大きな、１０００×よりも大きな、１１００×よりも大きな、１２００×よりも大きな、１３００×よりも大きな、１４００×よりも大きな、１５００×よりも大きな、１６００×よりも大きな、１７００×よりも大きな、１８００×よりも大きな、１９００×よりも大きな、２０００×よりも大きな、またはそれよりも大きな改善をもたらすことができる。

本開示の方法は、ゲノムまたはコンビナトリアルライブラリーの生成の規模の、例えば、１０×よりも大きな、５０×よりも大きな、１００×よりも大きな、２００×よりも大きな、３００×よりも大きな、４００×よりも大きな、５００×よりも大きな、６００×よりも大きな、７００×よりも大きな、８００×よりも大きな、９００×よりも大きな、１０００×よりも大きな、１１００×よりも大きな、１２００×よりも大きな、１３００×よりも大きな、１４００×よりも大きな、１５００×よりも大きな、１６００×よりも大きな、１７００×よりも大きな、１８００×よりも大きな、１９００×よりも大きな、２０００×よりも大きな、またはそれよりも大きな改善をもたらすことができる。

本開示の方法は、ゲノムまたはコンビナトリアルライブラリーの生成の費用の、例えば、１０分の１よりも大きな、５０分の１よりも大きな、１００分の１よりも大きな、２００分の１よりも大きな、３００分の１よりも大きな、４００分の１よりも大きな、５００分の１よりも大きな、６００分の１よりも大きな、７００分の１よりも大きな、８００分の１よりも大きな、９００分の１よりも大きな、１０００分の１よりも大きな、１１００分の１よりも大きな、１２００分の１よりも大きな、１３００分の１よりも大きな、１４００分の１よりも大きな、１５００分の１よりも大きな、１６００分の１よりも大きな、１７００分の１よりも大きな、１８００分の１よりも大きな、１９００分の１よりも大きな、２０００分の１よりも大きな、またはそれよりも大きな低減をもたらすことができる。

本開示の方法は、ゲノムまたはコンビナトリアルライブラリー生成の精度の、例えば、１０×よりも大きな、５０×よりも大きな、１００×よりも大きな、２００×よりも大きな、３００×よりも大きな、４００×よりも大きな、５００×よりも大きな、６００×よりも大きな、７００×よりも大きな、８００×よりも大きな、９００×よりも大きな、１０００×よりも大きな、１１００×よりも大きな、１２００×よりも大きな、１３００×よりも大きな、１４００×よりも大きな、１５００×よりも大きな、１６００×よりも大きな、１７００×よりも大きな、１８００×よりも大きな、１９００×よりも大きな、２０００×よりも大きな、またはそれよりも大きな改善をもたらすことができる。
コンビナトリアル操作の反復的追跡

操作の繰り返しラウンドのための方法および組成物が本明細書に開示される。単一細胞レベルでの追跡可能な操作をいくつかの段階的な操作サイクルで実行することを可能にする反復的操作戦略が本明細書に開示される（例えば、図３Ｄまたは図６）。これらの開示されている方法および組成物により、複雑な遺伝子型空間を有効に構築および探究することができる検索に基づく技術を可能にすることができる。反復的および繰り返し的という用語は、互換的に使用することができる。

コンビナトリアル操作方法は、多数ラウンドの操作を含み得る。本明細書に開示されている方法は、２ラウンドまたはそれよりも多くの操作を含み得る。例えば、方法は、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、または３０ラウンドよりも多くの操作を含み得る。

一部の例では、操作の各ラウンドの間に、新しいレコーダー配列、例えばバーコードなどが標的部位内の同じまたは近傍の遺伝子座に組み入れられ（例えば、図３Ｄ、緑色の棒または図６、黒色の棒）、したがって、ゲノム全体を通してコンビナトリアル多様性を構築するための多数の操作サイクル後に（例えば、図３Ｅ、緑色の棒または図６、灰色の棒）、各コンビナトリアル遺伝子型を再構築するため、各ラウンドからの操作された編集が標的部位に組み入れられたことを確認するために、レコーディング遺伝子座のＰＣＲ、または同様の反応を使用することができる。

操作の連続的なラウンドを選択するための方法が本明細書に開示される。選択は、編集カセットによって組み入れられたＰＡＭ変異により行うことができる。選択は、レコーダーカセットによって組み入れられたＰＡＭ変異により行うことができる。選択は、スクリーニング可能な、選択可能な、または対抗選択可能なマーカーを使用して行うことができる。選択は、操作の前のラウンドによって組み入れられた編集またはレコーディングのための部位を標的とし、それにより、操作の両方のラウンドまたは前の全てのラウンドに由来する、編集およびレコーダー配列が首尾よく組み入れられたバリアントを選択することによって行うことができる。

これらの遺伝子型の定量化を、大集団に対するコンビナトリアルな変異による影響を理解するためおよびエピスタシスなどの重要な生物現象を調査するために使用することができる。

段階的な編集およびコンビナトリアルな追跡は、本明細書に開示されている反復的ベクター系を使用して実行することができる。これらの反復的ベクター系を使用して、形質転換手順を迅速に進めることができる（例えば、図７Ａ）。一部の例では、これらの系は、直交性の複製開始点、抗生物質マーカー、およびｇＲＮＡを含有する２つまたはそれよりも多くのプラスミドからなる。各ベクター内のｇＲＮＡは、核酸誘導型ヌクレアーゼ媒介性切断による破壊に対する他の耐性マーカーの１つを標的とするように設計することができる。これらの系は、一部の例では、抗生物質選択圧が、前のプラスミドが除去され、次のラウンドの操作されたゲノムの濃縮が駆動されるように切り換わる形質転換を実施するために使用することができる。形質転換ループを通じて２回またはそれよりも多くの継代を実施することができる、または言い換えれば、多数ラウンドの操作を実施することができる。必要なレコーディングカセットおよび編集カセットの本明細書に開示されている反復的ベクターへの導入を、各形質転換ステップにおける高効率での同時のゲノム編集およびプラスミドキュアリングに使用することができる。

一部の例では、本明細書に開示されている反復的ベクター系は、２種、３種、４種、５種、６種、７種、８種、９種、１０種、または１０種より多くの独特のプラスミドを含む。一部の例では、反復的ベクター系では、特定のプラスミドを、前のラウンドおよび後のラウンドにおいて別個のプラスミドが使用されるのであれば、１回よりも多く使用することができる。

本明細書に開示されている反復的方法および組成物を使用して、標的化されたゲノムまたはプラスミドにおける選択可能またはスクリーニング可能なエレメントの機能を回復させることができる。選択可能またはスクリーニング可能なエレメントとしては、抗生物質抵抗性遺伝子、蛍光遺伝子、独特のＤＮＡ配列またはウォーターマーク、または他の公知のレポーター、スクリーニング可能な、または選択可能な遺伝子を挙げることができる。一部の例では、操作の連続的なラウンドそれぞれは選択可能またはスクリーニング可能なエレメントの断片を組み入れることができ、したがって、操作ラウンドの最後には、選択可能またはスクリーニング可能なエレメント全体が標的ゲノムまたはプラスミドに組み入れられている。そのような例では、断片の全て、したがって、所望の対応する変異の全てが首尾よく組み入れられたゲノムまたはプラスミドのみを選択またはスクリーニングすることができる。このように、選択またはスクリーニングされた細胞は、操作の繰り返しラウンドの１回１回で編集を組み入れたものが濃縮される。

反復的方法を使用して、操作の連続的なラウンドそれぞれで選択可能またはスクリーニング可能なマーカーをオンの位置とオフの位置で、またはオフの位置とオンの位置で切り換えることができる。そのような方法を使用することにより、例えば、たった１つのスクリーニング可能または選択可能なマーカーの使用が必要になることにより、入手可能な選択可能またはスクリーニング可能なマーカーの保存が可能になる。さらに、短い調節配列または開始コドンまたは非開始コドンを使用して、スクリーニング可能または選択可能なマーカーをオンおよびオフにすることができる。そのような短い配列は、合成されたカセットなどのカセットまたはポリヌクレオチド内に容易に適合させることができる。

本明細書に開示されている方法および組成物を使用して操作の１回または複数回のラウンドを実施することができる。一部の例では、操作の各ラウンドを使用して、前のラウンドの編集と比べて独特の編集を組み入れる。操作の各ラウンドにより、独特のレコーディング配列を組み入れることができる。操作の各ラウンドにより、操作の前のラウンドで使用したＣＲＥＡＴＥプラスミドの除去またはキュアリングをもたらすことができる。一部の例では、操作の各ラウンドのレコーディング配列の上首尾の組み入れにより、完全かつ機能的な、スクリーニング可能または選択可能なマーカーまたは独特の配列組合せがもたらされる。

バーコードまたはスクリーニング可能もしくは選択可能なマーカーなどのレコーディング配列を含む独特のレコーダーカセットを操作の各ラウンドで挿入し、それにより、実施された編集または操作ステップの組合せを示すレコーダー配列を生成することができる。連続的なレコーディング配列を互いに隣接させて挿入することができる。連続的なレコーディング配列を互いとの近傍に挿入することができる。連続的な配列を互いから少し離して挿入することができる。

連続的な配列を互いから少し離して挿入することができる。例えば、連続的なレコーダー配列を挿入し、０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、または１００ｂｐよりも大きく離すことができる。一部の例では、連続的なレコーダー配列は、約１０、５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、５５０、６００、６５０、７００、７５０、８００、８５０、９００、９５０、１０００、１１００、１２００、１３００、１４００、１５００、または１５００ｂｐよりも大きく離れている。

連続的なレコーダー配列を任意の所望の塩基対の数だけ離すことができ、これは、挿入される連続的なレコーダー配列の数、標的核酸もしくは標的ゲノムのサイズ、および／または所望の最終的なレコーダー配列の設計に依存し、それにより限定され得る。例えば、収集されたレコーダー配列が機能的なスクリーニング可能または選択可能なマーカーである場合、連続的なレコーディング配列を互いと近傍におよび同じ読み枠内に挿入することができる。収集されたレコーダー配列が配列決定によって同定されるバーコードの独特のセットであり、コード配列エレメントを有さない場合には、連続的なレコーダー配列を、任意の所望の塩基対の数だけそれらを離して挿入することができる。これらの場合には、分離距離は、使用される配列決定技術および読み取り長の限界に依存し得る。

一部の例では、レコーダーカセットは、操作の次のラウンドのレコーダーカセットの標的部位として使用されるランディング部位を含む。そのような方法を使用することにより、前のラウンドのレコーダーカセットが首尾よく組み入れられ、それにより、今の操作ラウンドのための標的部位がもたらされれば、連続的なラウンドのレコーダーカセットを標的部位にのみ導入することができる（例えば、図２８）。
ガイド核酸

ガイド核酸は、適合する、核酸誘導型ヌクレアーゼと複合体を形成することができ、かつ、標的配列とハイブリダイズし、それにより、ヌクレアーゼを標的配列に導くことができる。ガイド核酸と複合体を形成することができる主題の核酸誘導型ヌクレアーゼは、ガイド核酸に適合する核酸誘導型ヌクレアーゼと称することができる。同様に、核酸誘導型ヌクレアーゼと複合体形成することができるガイド核酸は、核酸誘導型ヌクレアーゼに適合するガイド核酸と称することができる。

ガイド核酸は、ＤＮＡであってよい。ガイド核酸は、ＲＮＡであってよい。ガイド核酸は、ＤＮＡとＲＮＡの両方を含み得る。ガイド核酸は、改変されたまたは天然に存在しないヌクレオチドを含み得る。ガイド核酸がＲＮＡを含む場合では、ＲＮＡガイド核酸は、本明細書に開示されているプラスミド、直鎖状構築物、または編集カセットなどのポリヌクレオチド分子上のＤＮＡ配列によりコードされてよい。

ガイド核酸は、ガイド配列を含み得る。ガイド配列は、標的ポリヌクレオチド配列に対して、標的配列にハイブリダイズし、複合体を形成した核酸誘導型ヌクレアーゼの標的配列への配列特異的結合を導くのに十分な相補性を有するポリヌクレオチド配列である。ガイド配列とその対応する標的配列の相補性の程度は、適切なアラインメントアルゴリズムを使用して最適にアラインメントした場合、約５０％もしくはそれよりも大きい、約６０％もしくはそれよりも大きい、約７５％もしくはそれよりも大きい、約８０％もしくはそれよりも大きい、約８５％もしくはそれよりも大きい、約９０％もしくはそれよりも大きい、約９５％もしくはそれよりも大きい、約９７．５％もしくはそれよりも大きい、約９９％もしくはそれよりも大きい、またはそれよりも大きい。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して決定することができる。一部の実施形態では、ガイド配列は、約５ヌクレオチドもしくはそれを超える、約１０ヌクレオチドもしくはそれを超える、約１１ヌクレオチドもしくはそれを超える、約１２ヌクレオチドもしくはそれを超える、約１３ヌクレオチドもしくはそれを超える、約１４ヌクレオチドもしくはそれを超える、約１５ヌクレオチドもしくはそれを超える、約１６ヌクレオチドもしくはそれを超える、約１７ヌクレオチドもしくはそれを超える、約１８ヌクレオチドもしくはそれを超える、約１９ヌクレオチドもしくはそれを超える、約２０ヌクレオチドもしくはそれを超える、約２１ヌクレオチドもしくはそれを超える、約２２ヌクレオチドもしくはそれを超える、約２３ヌクレオチドもしくはそれを超える、約２４ヌクレオチドもしくはそれを超える、約２５ヌクレオチドもしくはそれを超える、約２６ヌクレオチドもしくはそれを超える、約２７ヌクレオチドもしくはそれを超える、約２８ヌクレオチドもしくはそれを超える、約２９ヌクレオチドもしくはそれを超える、約３０ヌクレオチドもしくはそれを超える、約３５ヌクレオチドもしくはそれを超える、約４０ヌクレオチドもしくはそれを超える、約４５ヌクレオチドもしくはそれを超える、約５０ヌクレオチドもしくはそれを超える、約７５ヌクレオチドもしくはそれを超える、またはそれを超える長さである。一部の実施形態では、ガイド配列は、約７５ヌクレオチド未満、約５０ヌクレオチド未満、約４５ヌクレオチド未満、約４０ヌクレオチド未満、約３５ヌクレオチド未満、約３０ヌクレオチド未満、約２５ヌクレオチド未満、約２０ヌクレオチド未満の長さである。ガイド配列は、１０〜３０ヌクレオチド長であることが好ましい。ガイド配列は１５〜２０ヌクレオチドの長さであってよい。ガイド配列は１５ヌクレオチドの長さであってよい。ガイド配列は１６ヌクレオチドの長さであってよい。ガイド配列は１７ヌクレオチドの長さであってよい。ガイド配列は１８ヌクレオチドの長さであってよい。ガイド配列は１９ヌクレオチドの長さであってよい。ガイド配列は２０ヌクレオチドの長さであってよい。

ガイド核酸は、足場配列を含み得る。一般に、「足場配列」は、ターゲティング可能なヌクレアーゼ複合体の形成を促進するのに十分な配列を有する任意の配列を含み、ここで、ターゲティング可能なヌクレアーゼ複合体は、核酸誘導型ヌクレアーゼならびに足場配列およびガイド配列を含むガイド核酸を含む。ターゲティング可能なヌクレアーゼ複合体の形成を促進するのに十分な足場配列内の配列は、足場配列内の２つの配列領域、例えば二次構造の形成に関与する１つまたは２つの配列領域などの長さに沿ってある程度の相補性を含み得る。一部の場合では、１つまたは２つの配列領域は、同じポリヌクレオチド上に含まれるまたはコードされる。一部の場合では、１つまたは２つの配列領域は、別々のポリヌクレオチド上に含まれるまたはコードされる。最適なアラインメントは、任意の適切なアラインメントアルゴリズムによって決定することができ、１つまたは２つの配列領域のいずれか内の自己相補性などの二次構造をさらに説明することができる。一部の実施形態では、１つまたは２つの配列領域間の、２つのうちの短い方の長さに沿った相補性の程度は、最適にアラインメントした場合、約２５％もしくはそれを超える、約３０％もしくはそれを超える、約４０％もしくはそれを超える、約５０％もしくはそれを超える、約６０％もしくはそれを超える、約７０％もしくはそれを超える、約８０％もしくはそれを超える、約９０％もしくはそれを超える、約９５％もしくはそれを超える、約９７．５％もしくはそれを超える、約９９％もしくはそれを超える、またはそれよりも高い。一部の実施形態では、２つの配列領域の少なくとも一方は、約５ヌクレオチドもしくはそれを超える、約６ヌクレオチドもしくはそれを超える、約７ヌクレオチドもしくはそれを超える、約８ヌクレオチドもしくはそれを超える、約９ヌクレオチドもしくはそれを超える、約１０ヌクレオチドもしくはそれを超える、約１１ヌクレオチドもしくはそれを超える、約１２ヌクレオチドもしくはそれを超える、約１３ヌクレオチドもしくはそれを超える、約１４ヌクレオチドもしくはそれを超える、約１５ヌクレオチドもしくはそれを超える、約１６ヌクレオチドもしくはそれを超える、約１７ヌクレオチドもしくはそれを超える、約１８ヌクレオチドもしくはそれを超える、約１９ヌクレオチドもしくはそれを超える、約２０ヌクレオチドもしくはそれを超える、約２５ヌクレオチドもしくはそれを超える、約３０ヌクレオチドもしくはそれを超える、約４０ヌクレオチドもしくはそれを超える、約５０ヌクレオチドもしくはそれを超える、またはそれを超える長さである。

主題のガイド核酸の足場配列は、二次構造を含み得る。二次構造は、シュードノット領域を含み得る。一部の例では、ガイド核酸と核酸誘導型ヌクレアーゼの適合性は、ガイドＲＮＡのシュードノット領域内またはそれに隣接する配列によって少なくとも部分的に決定される。一部の場合では、ガイド核酸の核酸誘導型ヌクレアーゼに対する結合カイネティクスは、一部において、足場配列内の二次構造によって決定される。一部の場合では、ガイド核酸の核酸誘導型ヌクレアーゼに対する結合カイネティクスは、一部において、足場配列内の核酸配列によって決定される。

本発明の態様では、「ガイド核酸」という用語は、１）標的配列にハイブリダイズすることができるガイド配列および２）本明細書に記載の核酸誘導型ヌクレアーゼと相互作用するまたは複合体を形成することができる足場配列を含むポリヌクレオチドを指す。

ガイド核酸と、核酸誘導型ヌクレアーゼは、この２つのエレメントが、標的配列を切断することができる機能的なターゲティング可能なヌクレアーゼ複合体を形成することができれば、適合し得る。多くの場合、適合するガイド核酸に対する適合する足場配列は、ネイティブな核酸誘導型ヌクレアーゼ遺伝子座に隣接する配列をスキャンすることによって見出すことができる。言い換えれば、ネイティブな核酸誘導型ヌクレアーゼは、対応する適合するガイド核酸または足場配列の近傍にあるゲノム上にコードされ得る。

核酸誘導型ヌクレアーゼは、ヌクレアーゼが内在する宿主内には見出されないガイド核酸に適合し得る。そのような直交性のガイド核酸は、経験的試験によって決定することができる。直交性のガイド核酸は、異なる細菌種に由来するものであってもよく、合成されたまたは他のやり方で操作されて天然に存在しないものであってもよい。

共通する核酸誘導型ヌクレアーゼに適合する直交性のガイド核酸は、１つまたは複数の共通する特徴を含み得る。共通する特徴は、シュードノット領域の外側の配列を含み得る。共通する特徴は、シュードノット領域を含み得る。共通する特徴は、一次配列または二次構造を含み得る。

ガイド核酸は、ガイド配列を、ガイド配列が標的配列と相補的であり、それにより、ガイド配列と標的配列のハイブリダイゼーションが可能になるように変化させることにより、所望の標的配列を標的とするように操作することができる。操作されたガイド配列を有するガイド核酸は、操作されたガイド核酸と称することができる。操作されたガイド核酸は、多くの場合、天然に存在せず、天然には見出されない。
さらなる方法

定向ゲノム進化を実施する／ＤＮＡまたはＲＮＡ、例えば、ゲノムＤＮＡまたはエピソームＤＮＡなどの標的配列に変化（欠失、置換、付加）を生じさせるために、核酸誘導型ヌクレアーゼなどのヌクレアーゼを使用する、ゲノム操作のための方法が本明細書に開示される。適切なヌクレアーゼとしては、例えば、ＲＮＡをガイドとするヌクレアーゼ、例えば、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、もしくはＭＡＤ７など、ＤＮＡをガイドとするヌクレアーゼ、例えば、アルゴノートなど、または他のヌクレアーゼ、例えば、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、もしくはメガヌクレアーゼなどを挙げることができる。ヌクレアーゼ遺伝子は、任意の供給源から、例えば、細菌、古細菌、原核生物、真核生物、またはウイルスなどから得ることができる。例えば、Ｃａｓ９遺伝子は、細菌Ｓ．ｐｙｏｇｅｎｅｓなどの、対応するＩＩ型ＣＲＩＳＰＲ系を有する細菌から得ることができる（配列番号１１０）。ヌクレアーゼの核酸配列および／またはアミノ酸配列を、天然に存在するヌクレアーゼの配列に対して変異させることができる。変異は、例えば、１つまたは複数の挿入、欠失、置換または前述のうちの２つもしくは３つの任意の組合せであってよい。一部の場合では、得られる変異したヌクレアーゼは、天然に存在するヌクレアーゼと比べて増強されたまたは低下したヌクレアーゼ活性を有してよい。一部の場合では、得られる変異したヌクレアーゼは、天然に存在するヌクレアーゼと比べてヌクレアーゼ活性を有さなくてよい。

核酸誘導型ヌクレアーゼ媒介性ゲノム編集のための方法が本明細書で提供される。一部の開示されている方法は、編集カセットに由来する定向変異をゲノム、エピソーム核酸分子、または単離された核酸分子に直接組み入れるカセットライブラリーの生成に依拠する二段階構築プロセスを含み得る。一部の例では、カセットライブラリー構築の第１の段階の間に、合理的に設計された編集カセットを、標的ＤＮＡ配列にハイブリダイズするまたはそれを標的とするガイド核酸（例えば、ガイドＲＮＡ）を有する細胞に同時に入れて形質転換することができる。一部の例では、ガイド核酸は、ＲＮＡ分子として導入される、またはＤＮＡ分子上にコードされる。

編集カセットは、ＰＡＭ部位の欠失または変異と、隣接する核酸配列内の１つまたは複数の所望のコドンまたは核酸残基の変異とがカップリングされるように設計することができる。欠失または変異したＰＡＭ部位は、一部の場合では、もはや選択された核酸誘導型ヌクレアーゼによって認識され得ない。一部の例では、例えば、２つ、３つ、４つ、またはそれよりも多くのＰＡＭなど、少なくとも１つのＰＡＭまたは１つよりも多くのＰＡＭを欠失または変異させることができる。

本明細書に開示されている方法により、単一の形質転換でカセットライブラリー全体の生成を可能にすることができる。カセットライブラリーは、一部の場合では、組換え染色体の増幅によって、例えば、ＰＣＲ反応によって、編集カセットに由来する合成特徴またはプライミング部位を使用して検索することができる。一部の例では、第２のＰＡＭ欠失または変異を同時に組み入れる。この手法により、コドン標的化変異とＰＡＭ欠失を直接共有結合によりカップリングすることができる。

一部の例では、カセットライブラリーを構築するための第２の段階がある。第２の段階の間に、目的のＰＡＭ欠失／変異および標的化変異、例えば、１つまたは複数のコドン内の１つまたは複数のヌクレオチドなどの１つまたは複数のヌクレオチドの所望の変異などを有するＰＣＲ増幅されたカセットライブラリーを、ナイーブな細胞に同時に入れて形質転換することができる。細胞は、真核細胞、古細菌細胞、または原核細胞であってよい。カセットライブラリーを、ガイド核酸またはそれをコードするプラスミドで同時形質転換して、合理的に設計されたタンパク質ライブラリーを発現する細胞の集団を生成することができる。ライブラリーを、ｇＲＮＡ、キメラｇＲＮＡ、スプリットｇＲＮＡ、またはｃｒＲＮＡおよびｔｒＲＮＡセットなどのガイド核酸で同時形質転換することができる。カセットライブラリーは、複数のカセットを含んでよく、各カセットは、編集カセットおよびガイド核酸を含む。カセットライブラリーは、複数のカセットを含んでよく、各カセットは、編集カセット、レコーダーカセットおよび２つのガイド核酸を含む。

一部のターゲティング可能なヌクレアーゼ系では、ガイド核酸により、標的配列の選択をガイドすることができる。本明細書で使用される場合、標的配列とは、ｉｎｖｉｔｒｏもしくはｉｎｖｉｖｏにおける、または細胞もしくは細胞の集団の核酸における、少なくとも１つのヌクレオチドの変異、例えば、少なくとも１つのコドン内の少なくとも１つのヌクレオチドの変異などが望まれる任意の遺伝子座を指す。標的配列は、例えば、ゲノム遺伝子座、標的ゲノム配列、または染色体外の遺伝子座であり得る。ガイド核酸は、ガイドＤＮＡと称されるＤＮＡ分子、またはガイドＲＮＡと称されるＲＮＡ分子として発現させることができる。ガイド核酸は、標的領域の領域と相補的なガイド配列を含み得る。ガイド核酸は、適合する核酸誘導型ヌクレアーゼと相互作用することができ、場合によって二次構造を形成することができる足場配列を含み得る。ガイド核酸は、核酸誘導型ヌクレアーゼが標的部位に動員されるように機能し得る。ガイド配列は、標的部位の上流の領域と相補的であってよい。ガイド配列は、標的部位の少なくとも一部分と相補的であってよい。ガイド配列は、標的部位と完全に相補的（１００％相補的）であってもよく、ヌクレアーゼに特異的にハイブリダイズする／それをガイドし、動員するのに十分に標的部位と相補的であれば、１つまたは複数のミスマッチを含んでもよい。適切な核酸誘導型ヌクレアーゼは、非限定的な例として、ＣＲＩＳＰＲヌクレアーゼ、Ｃａｓ９またはＣｐｆ１などのＣａｓヌクレアーゼ、ＭＡＤ２、およびＭＡＤ７を含む。

一部のＣＲＩＳＰＲ系では、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡまたはスペーサーを含有するＲＮＡ）およびトランス活性化ＣＲＩＳＰＲＲＮＡ（ｔｒａｃｒＲＮＡまたはｔｒＲＮＡ）により、標的配列の選択をガイドすることができる。本明細書で使用される場合、標的配列とは、ｉｎｖｉｔｒｏもしくはｉｎｖｉｖｏにおける、または細胞もしくは細胞の集団の核酸における、少なくとも１つのヌクレオチドの変異、例えば、少なくとも１つのコドン内の少なくとも１つのヌクレオチドの変異などが望まれる任意の遺伝子座を指す。標的配列は、例えば、ゲノム遺伝子座、標的ゲノム配列、または染色体外の遺伝子座であり得る。ｔｒａｃｒＲＮＡおよびｃｒＲＮＡは、単一ガイドＲＮＡと称される単一のキメラＲＮＡ分子、ガイドＲＮＡ、またはｇＲＮＡとして発現させることができる。ｇＲＮＡの核酸配列は、標的領域の領域と相補的な、第１の領域とも称される第１の核酸配列、および、ステムループ構造を形成し、ＣＲＩＳＰＲヌクレアーゼが標的領域に動員されるように機能する、第２の領域とも称される第２の核酸配列を含む。ｇＲＮＡの第１の領域は、標的ゲノム配列の上流の領域と相補的であってよい。ｇＲＮＡの第１の領域は、標的領域の少なくとも一部分と相補的であってよい。ｇＲＮＡの第１の領域は、標的ゲノム配列と完全に相補的（１００％相補的）であってもよく、Ｃａｓ９またはＣｐｆ１などのＣＲＩＳＰＲヌクレアーゼと特異的にハイブリダイズする／それをガイドするおよび動員するのに十分に標的ゲノム配列と相補的であれば、１つまたは複数のミスマッチを含んでもよい。

ガイド配列またはｇＲＮＡの第１の領域は、少なくとも１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、または少なくとも３０ヌクレオチドの長さであってよい。ガイド配列またはｇＲＮＡの第１の領域は、少なくとも２０ヌクレオチドの長さであってよい。

足場配列またはｇＲＮＡの第２の核酸配列によって形成することができるステムループ構造は、少なくとも５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、または１００ヌクレオチドの長さであってよい。ステムループ構造は、８０〜９０または８２〜８５ヌクレオチドの長さであってよい。ステムループ構造を形成する足場配列またｇＲＮＡの第２の領域は８３ヌクレオチドの長さであってよい。

本明細書に開示されている方法を使用して第１の細胞に導入されるカセットのガイド核酸は、第２の細胞に導入される第２のカセットのガイド核酸と同じであってよい。１つよりも多くのガイド核酸を第１の細胞の集団および／または第２の細胞の集団に導入することができる。１つよりも多くのガイド核酸は、１つよりも多くの標的領域に相補的なガイド配列を含み得る。

本明細書に開示されている方法は、オリゴヌクレオチドを使用するステップを含み得る。そのようなオリゴヌクレオチドは、多くの供給源から得ることができるまたはそれに由来するものであってよい。例えば、オリゴヌクレオチドは、非相同ランダム組換え（ＮＲＲ）によって多様化された核酸ライブラリーに由来するものであってよく、そのようなライブラリーは、ＮＲＲライブラリーと称される。オリゴヌクレオチドは、例えば、アレイに基づく合成または他の公知の化学合成方法によって合成することができる。オリゴヌクレオチドの長さは、オリゴヌクレオチドを得るのに使用される方法に依存し得る。オリゴヌクレオチドは、およそ５０〜２００ヌクレオチド、７５〜１５０ヌクレオチド、または８０〜１２０ヌクレオチドの間の長さであってよい。オリゴヌクレオチドは任意の整数、例えば、５１、５２、５３、５４、２０１、２０２などを含め、約１０、２０、３０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００ヌクレオチド、またはそれを超える長さであってよい。オリゴヌクレオチドは、任意の整数、例えば、１０１、２０３、１００１、２００１、２０１０などを含め、約１００、２００、３００、４００、５００、６００、７００、８００、９００、１０００、１２５０、１５００、１７５０、２０００ヌクレオチド、またはそれを超える長さであってよい。

オリゴヌクレオチドおよび／または他の核酸分子を組み合わせてまたはアセンブルして、カセットを生成することができる。そのようなカセットは、（ａ）細胞の核酸の標的領域と相同であり、標的領域と比べて少なくとも１つのヌクレオチドまたは１つのコドンの所望の変異を含む領域、および（ｂ）プロトスペーサー隣接モチーフ（ＰＡＭ）変異を含み得る。ＰＡＭ変異は、ＰＡＭの配列を、核酸誘導型ヌクレアーゼ系またはＣＲＩＳＰＲヌクレアーゼ系によって認識されなくなるように変異させる１つまたは複数のヌクレオチドの任意の挿入、欠失または置換であってよい。そのようなＰＡＭ変異を含む細胞は、ヌクレアーゼ媒介性死滅に対して「免疫性である」といえる。標的領域の配列と比べた所望の変異は、１つまたは複数のヌクレオチドの挿入、欠失、および／または置換であってよい。一部の例では、１つまたは複数のヌクレオチドの挿入、欠失、および／または置換は、標的領域の少なくとも１つのコドンにおけるものである。あるいは、（ａ）細胞の核酸の標的領域と相同であり、標的領域と比べて少なくとも１つのヌクレオチドまたは１つのコドンの所望の変異を含む領域、（ｂ）プロトスペーサー隣接モチーフ（ＰＡＭ）変異、および場合によって（ｃ）細胞の核酸の第２の標的領域と相同であり、レコーダー配列を含む領域を含むカセットを単一の合成で合成することができる。

本明細書に開示されている方法は、細菌および古細菌を含めた任意の原核生物、または酵母、哺乳動物、およびヒト遺伝子を含めた任意の真核生物、または任意のウイルス粒子に由来する任意の目的の標的核酸分子に適用することができる。核酸モジュールは、非コード核酸配列、遺伝子、ゲノム、染色体、プラスミド、エピソーム核酸分子、人工染色体、合成染色体、またはウイルス核酸であってよい。

ドナー株ライブラリーの回収効率を評価するための方法が本明細書に開示されている。回収効率は、ＰＣＲ産物の存在または選択された標的遺伝子座を対象とするプライマーを用いて得られるアンプリコンもしくはＰＣＲ産物のサイズもしくは配列の変化に基づいて検証することができる。プライマーは、ドナー核酸分子に含有される内在性配列または異種配列とハイブリダイズするように設計することができる。例えば、ＰＣＲプライマーは、異種配列とハイブリダイズするように設計することができ、したがって、ドナー核酸が組み入れられた場合にのみＰＣＲが可能になる。回収されたライブラリーからのＰＣＲ産物の配列決定により、ｄｓＤＮＡカセットまたはドナー配列に由来する異種配列または合成プライミング部位を約９０〜１００％の効率で組み入れることができることが示される。他の例では、効率は、約５％、１０％、２０％、３０％、４０％、５０％、６０％、７０％、７５％、８０％、８５％、９０％、９５％、９９％または１００％であり得る。

一部の場合では、本明細書に開示されている方法の最終的な編集効率を改善する能力を、ドナー構築相の間の変異の喪失を防ぐために、野生型ドナー株への移入前に遺伝子欠損株におけるカセット構築を行うことによって評価することができる。それに加えてまたはその代わりに、開示されている方法の効率は、必須の遺伝子を標的とすることによって評価することができる。必須の遺伝子には、ウイルス粒子、細胞、または生物体の生存または複製に必要な任意の遺伝子が含まれ得る。一部の例では、必須の遺伝子として、ｄｘｓ、ｍｅｔＡ、およびｆｏｌＡが挙げられる。必須の遺伝子は、記載されているガイド核酸設計戦略を使用して有効に標的とされている。他の適切な必須の遺伝子は当技術分野で周知である。

核酸誘導型ヌクレアーゼのレベルを調節することによって編集効率を上昇させる方法が本明細書で提供される。これは、高コピー数プラスミドまたは低コピー数プラスミドなどのコピー制御プラスミドを使用することによって行うことができる。細胞当たり約１０００コピーを有し得る高コピー数プラスミドとは対照的に、低コピー数プラスミドは、細胞当たり約２０またはそれ未満のコピーを有し得るプラスミドであってよい。高コピー数プラスミドおよび低コピー数プラスミドは当技術分野で周知であり、プラスミドを高または低コピー数と特徴付けるために細胞当たりの正確なプラスミドコピーが分かっている必要はないことが理解される。

一部の場合では、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７などの、核酸誘導型ヌクレアーゼの発現レベルの低下により、形質転換、編集、および／または記録効率を上昇させることができる。一部の場合では、核酸誘導型ヌクレアーゼの発現レベルの低下を、核酸誘導型ヌクレアーゼを低コピー数プラスミド上に発現させることによって行う。

一部の場合では、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７などの、核酸誘導型ヌクレアーゼの発現レベルの上昇により、形質転換、編集、および／または記録効率を上昇させることができる。一部の場合では、核酸誘導型ヌクレアーゼの発現レベルの上昇を、核酸誘導型ヌクレアーゼを高コピー数プラスミド上に発現させることによって行う。

タンパク質の発現レベルを調節する他の方法も構想され、当技術分野で公知である。そのような方法としては、誘導性もしくは構成的プロモーターを使用すること、エンハンサーもしくは他の発現調節エレメントを発現プラスミドに組み入れること、ＲＮＡｉ、ａｍｉＲＮＡｉ、または他のＲＮＡサイレンシング技法を使用して転写レベルを調節すること、目的のタンパク質を分解ドメインと融合すること、または当技術分野で公知の任意の他の方法が挙げられる。

変異体ライブラリーを生成するための方法が本明細書で提供される。一部の例では、変異体ライブラリーを有効に構築し、リコンビニアリング後１〜３時間以内に検索することができる。一部の例では、リコンビニアリング後０．５、１、２、３、４、５、６、７、８、９、１０、１２、または２４時間以内に変異体ライブラリーを構築する。一部の例では、リコンビニアリング後および／またはリコンビニアリングによる構築後０．５、１、２、３、４、５、６、７、８、９、１０、１２、２４、３６、または４８時間以内に変異体ライブラリーを検索することができる。

本明細書に開示されている一部の方法を、追跡可能な、高精度のゲノム編集に使用することができる。一部の例では、本明細書に開示されている方法により、編集カセットおよびガイド核酸の両方、ならびに場合によってレコーダーカセットおよび第２のガイド核酸をコードする単一のカセットを使用した高効率の編集／変異を実現することができる。あるいは、単一のベクターが編集カセットをコードしてよく、ガイド核酸は逐次的にまたは同時にもたらされる。本明細書に開示されている方法は、アレイに基づくＤＮＡ合成などの並行ＤＮＡ合成と共に使用される場合、何百または何千もの高精度の編集／変異の単一ステップでの生成をもたらすことができる。変異は、細胞または生物体のゲノムまたはゲノムの切片の配列決定ではなく、ベクター上の編集カセットの配列決定によってマッピングすることができる。

本明細書に開示されている方法には、タンパク質およびゲノム操作適用において、ならびに実験室進化実験において同定された変異などの変異の再構築において、広範な有用性があり得る。一部の例では、本明細書に開示される方法および組成物により、所望の変異およびＰＡＭ変異を含めることができる編集カセットとガイド核酸をコードする遺伝子を単一のベクター上で組み合わせることができる。

一部の例では、追跡可能な変異体ライブラリーを単一の形質転換または単一の反応で生成することができる。

本明細書に開示されている方法は、所望の変異およびＰＡＭ変異を含む編集カセットを含むカセットを細胞または細胞の集団に導入するステップを含み得る。一部の実施形態では、カセットまたはベクターが導入される細胞は、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７などの、核酸誘導型ヌクレアーゼも含む。一部の実施形態では、核酸誘導型ヌクレアーゼをコードする遺伝子またはｍＲＮＡを細胞または細胞の集団に同時に、逐次的に、または続けて導入する。核酸誘導型ヌクレアーゼおよびガイド核酸を含むターゲティング可能なヌクレアーゼ系の細胞または細胞集団における発現を活性化することができ、したがって、ガイド核酸により、核酸誘導型ヌクレアーゼをｄｓＤＮＡ切断が起こる標的領域に動員する。

一部の例では、いかなる特定の理論にも制約されることなく、標的配列と相補的な編集カセットの相同領域により、ＰＡＭおよび標的配列の１つまたは複数のコドンが変異する。ＰＡＭ変異が組み込まれなかった細胞の集団の細胞は、核酸誘導型ヌクレアーゼ媒介性ｄｓＤＮＡ切断に起因して、編集されていない細胞死を受け得る。一部の例では、ＰＡＭ変異が組み込まれた細胞の集団の細胞は細胞死を受けず、生存可能なままであり、選択的に濃縮されて存在量が高くなる。生存細胞を得ることができ、追跡可能なまたは標的化変異のライブラリーをもたらすことができる。

一部の例では、いかなる特定の理論にも制約されることなく、標的配列と相補的なレコーダーカセットの相同領域により、ＰＡＭが変異し、バーコードが標的配列に導入される。ＰＡＭ変異が組み込まれなかった細胞の集団の細胞は、核酸誘導型ヌクレアーゼ媒介性ｄｓＤＮＡ切断に起因して、編集されていない細胞死を受け得る。一部の例では、ＰＡＭ変異が組み込まれた細胞の集団の細胞は細胞死を受けず、生存可能なままであり、選択的に濃縮されて存在量が高くなる。生存細胞を得ることができ、追跡可能な変異のライブラリーをもたらすことができる。

核酸誘導型ヌクレアーゼをコードする別々のベクターまたはｍＲＮＡを細胞または細胞の集団に導入することができる。ベクターまたはｍＲＮＡの細胞または細胞の集団への導入は、当技術分野で公知の任意の方法または技法を使用して実施することができる。例えば、ベクターを、化学的形質転換および電気穿孔を含めた形質転換、形質導入ならびに粒子衝撃などの標準のプロトコールによって導入することができる。それに加えてまたはその代わりに、ｍＲＮＡを、本明細書に開示されている形質転換などの標準のプロトコールによって、および／または細胞透過性ペプチドもしくはナノ粒子を伴う技法によって導入することができる。

編集カセットは、（ａ）細胞または細胞の集団内の核酸の標的領域を認識し（それとハイブリダイズし）、細胞の核酸の標的領域と相同であり、標的領域と比べて少なくとも１つのコドンに存在し得る、少なくとも１つのヌクレオチドの所望の変異と称される変異を含む領域、および（ｂ）プロトスペーサー隣接モチーフ（ＰＡＭ）変異を含み得る。一部の例では、編集カセットは、バーコードも含む。バーコードは、対応する変異をバーコードに基づいて同定することができるような独特のバーコードまたは比較的独特なものであってよい。ＰＡＭ変異は、ＰＡＭの配列を変異させ、したがって、変異したＰＡＭ（ＰＡＭ変異）が選択された核酸誘導型ヌクレアーゼ系によって認識されないようにする１つまたは複数のヌクレオチドの任意の挿入、欠失または置換であってよい。例えばＰＡＭ変異などを含む細胞は、核酸誘導型ヌクレアーゼ媒介性死滅に対して「免疫性である］といえる。標的領域の配列と比べた所望の変異は、１つまたは複数のヌクレオチドの挿入、欠失、および／または置換であってよく、標的領域の少なくとも１つのコドンであってよい。一部の実施形態では、ＰＡＭ変異と所望の変異の間の距離は、編集カセット上で、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、４０、５０、６０、７０、８０、９０、または１００ヌクレオチドである。一部の実施形態では、ＰＡＭ変異は、編集カセットの終わりから少なくとも９ヌクレオチドのところに位置する。一部の実施形態では、所望の変異は、編集カセットの終わりから少なくとも９ヌクレオチドのところに位置する。

所望の変異は、標的配列の配列と比べた核酸配列の挿入であってよい。標的配列に挿入される核酸配列は、任意の長さであってよい。一部の実施形態では、挿入される核酸配列は、少なくとも１、２、３、４、５、１０、２０、３０、４０、５０、１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、５５０、６００、６５０、７００、７５０、８００、８５０、９００、９５０、１０００、１１００、１２００、１３００、１４００、１５００、１６００、１７００、１８００、１９００、または少なくとも２０００ヌクレオチドの長さである。標的配列に核酸配列が挿入される実施形態では、編集カセットは、少なくとも１０、１５、２０、２５、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、または少なくとも６０ヌクレオチドの長さであり、標的配列と相同な領域を含む。ホモロジーアームまたは相同領域は、間の任意の整数を含め、約１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００ヌクレオチド、またはそれを超える長さであってよい。ホモロジーアームまたは相同領域は、２００ヌクレオチドを超える長さであってよい。

バーコードは、対応する変異をバーコードに基づいて同定することができるような独特のバーコードまたは比較的独特なものであってよい。一部の例では、バーコードは、天然には見出されない、天然に存在しない配列である。大多数の例では、編集カセット内の所望の変異とバーコードの組合せは、天然に存在せず、天然には見出されない。バーコードは、任意のヌクレオチド数の長さであってよい。バーコードは、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０または３０ヌクレオチドを超える長さであってよい。一部の場合では、バーコードは、３０ヌクレオチドを超える長さである。

編集カセットまたはレコーダーカセットは、ガイド核酸をコードする遺伝子の少なくとも一部分、および場合によってコードされるガイド核酸に作動可能に連結したプロモーターを含み得る。一部の実施形態では、ガイド核酸をコードする遺伝子の一部分は、標的配列と相補的なガイド核酸の部分をコードする。標的配列と相補的なガイド核酸の部分、またはガイド配列は、少なくとも１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、または少なくとも３０ヌクレオチドの長さであってよい。一部の実施形態では、ガイド配列は、２４ヌクレオチドの長さである。一部の実施形態では、ガイド配列は、１８ヌクレオチドの長さである。

一部の実施形態では、編集カセットまたはレコーダーカセットは、少なくとも２つのプライミング部位をさらに含む。プライミング部位は、カセットを例えばＰＣＲによって増幅するために使用することができる。一部の実施形態では、ガイド配列の一部をプライミング部位として使用する。

記載されている方法において使用するための編集カセットまたはレコーダーカセットは、多くの供給源から得ることができるまたはそれに由来するものであってよい。例えば、カセットは、例えば、アレイに基づく合成、多重化合成、多重並行合成、ＰＣＲアセンブリ、ｉｎｖｉｔｒｏアセンブリ、ギブソン・アセンブリ、または当技術分野で公知の任意の他の合成方法によって合成することができる。一部の実施形態では、編集カセットまたはレコーダーカセットを、例えば、アレイに基づく合成、多重化合成、多重並行合成、ＰＣＲアセンブリ、ｉｎｖｉｔｒｏアセンブリ、ギブソン・アセンブリ、または当技術分野で公知の任意の他の合成方法によって合成する。編集カセットまたはレコーダーカセットの長さは、前記カセットを得るのに使用される方法に依存し得る。

編集カセットは、およそ５０〜３００ヌクレオチド、７５〜２００ヌクレオチド、または８０〜１２０ヌクレオチドの間の長さであってよい。一部の実施形態では、編集カセットは、５０クレオチドから１Ｍｂの間の任意のばらばらの長さであってよい。

レコーダーカセットは、およそ５０〜３００ヌクレオチド、７５〜２００ヌクレオチド、または８０〜１２０ヌクレオチドの間の長さであってよい。一部の実施形態では、レコーダーカセットは、５０クレオチドから１Ｍｂの間の任意のばらばらの長さであってよい。

本明細書に開示されている方法は、編集カセットおよびレコーダーカセットを得るステップおよび追跡可能なプラスミドまたはベクターを構築するステップも伴い得る。ベクターを構築する方法は当業者には公知であり、カセットをベクター骨格にライゲーションするステップを伴い得る。一部の例では、プラスミド構築を、ｉｎｖｉｔｒｏにおけるＤＮＡアセンブリ方法、オリゴヌクレオチドアセンブリ、ＰＣＲに基づくアセンブリ、ＳＬＩＣ、ＣＰＥＣ、または当技術分野で周知の他のアセンブリ方法によって行う。一部の実施形態では、ベクターの構築前に、カセットまたはカセットのサブセット（プール）を例えばＰＣＲによって増幅することができる。

核酸誘導型ヌクレアーゼをコードするポリヌクレオチドを含む細胞または細胞の集団を、ヌクレアーゼが発現する条件下で維持または培養することができる。核酸誘導型ヌクレアーゼの発現は、制御されてもよく、構成的にオンになっていてもよい。本明細書に記載の方法は、ヌクレアーゼの発現が活性化され、その結果、ヌクレアーゼ、例えば、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７が産生される条件下で細胞を維持するステップを伴い得る。核酸誘導型ヌクレアーゼが発現する特定の条件は、ヌクレアーゼの発現を調節するために使用されるプロモーターの性質などの因子に依存し得る。核酸誘導型ヌクレアーゼの発現は、アラビノースなどのインデューサー分子の存在下で誘導することができる。核酸誘導型ヌクレアーゼをコードするＤＮＡを含む細胞または細胞の集団がインデューサー分子の存在下にあると、ヌクレアーゼの発現が起こり得る。ＣＲＩＳＰＲ−ヌクレアーゼの発現は、リプレッサー分子の存在下で抑制され得る。核酸誘導型ヌクレアーゼをコードするＤＮＡを含む細胞または細胞の集団がヌクレアーゼの発現を抑制する分子の不在下にあると、ヌクレアーゼの発現が起こり得る。

生存可能なままの細胞または細胞の集団を、核酸誘導型ヌクレアーゼ媒介性死滅の結果として編集されていない細胞死を受ける細胞から得るまたは分離することができ、これは例えば、細胞の集団を培養表面に広げ、生存細胞を成長させることによって行うことができ、次いで、これらは評価のために利用可能である。

細胞のゲノムまたはゲノムの大きな部分について配列決定することを必要とせずに変異を同定するための方法が本明細書に開示される。当該方法は、編集カセット、レコーダーカセット、またはバーコードについて配列決定して、１つまたは複数のコドンの変異を同定するステップを伴い得る。編集カセットの配列決定は、ベクターの構成成分として実施することもでき、ベクターから分離し、場合によって増幅した後に実施することもできる。配列決定は、例えばサンガーシーケンシングまたは次世代シーケンシング法によって、当技術分野で公知の任意の配列決定方法を使用して実施することができる。

本明細書に記載の一部の方法は、原核および真核細胞を含め、ターゲティング可能なヌクレアーゼ系が機能する、またはＤＮＡを標的とし、切断することができる任意の細胞型において実行することができる。一部の実施形態では、細胞は、Ｅｓｃｈｅｒｉｃｈｉａｓｐｐ．、例えば、Ｅ．ｃｏｌｉなどの細菌細胞である。他の実施形態では、細胞は、酵母細胞、例えば、Ｓａｃｃｈａｒｏｍｙｃｅｓｓｐｐ．などの真菌細胞である。他の実施形態では、細胞は、藻類細胞、植物細胞、昆虫細胞、またはヒト細胞を含めた哺乳動物細胞である。

「ベクター」は、細胞に送達するまたは細胞において発現させる所望の配列または配列を含む、種々の核酸のいずれかである。所望の配列は、例えば制限およびライゲーションによって、または当技術分野で公知の組換えもしくはアセンブリ方法によってベクターに含めることができる。ベクターは、一般にはＤＮＡで構成されるが、ＲＮＡベクターも利用可能である。ベクターとしては、これらに限定されないが、プラスミド、フォスミド、ファージミド、ウイルスゲノム、人工染色体、および合成核酸分子が挙げられる。

本明細書に開示されている方法において有用なベクターは、本明細書に記載の少なくとも１つの編集カセット、ｇＲＮＡをコードする少なくとも１つの遺伝子、ならびに場合によってプロモーターおよび／またはバーコードを含み得る。１つよりも多くの編集カセット、例えば、２種、３種、４種、５種、６種、７種、８種、９種、１０種またはそれよりも多くの編集カセットをベクターに含めることができる。１つよりも多くの編集カセットは、異なる標的領域を標的とするように設計することができ、例えば、それぞれが異なる標的領域と相同な少なくとも１つの領域を含有する異なる編集カセットが存在してよい。他の例では、各編集カセットは、同じ標的領域を標的とするが、各編集カセットは、標的領域と比べた異なる所望の変異を含む。他の例では、複数の編集カセットは、同じ標的領域を標的とする編集カセットと異なる標的領域を標的とする編集カセットの組合せを含み得る。各編集カセットは、同定用バーコードを含み得る。その代わりにまたはそれに加えて、ベクターは、１種よりも多くのｇＲＮＡ、例えば、２種、３種、４種、５種、６種、７種、８種、９種、１０種またはそれよりも多くのｇＲＮＡをコードする１つまたは複数の遺伝子を含み得る。１種よりも多くのｇＲＮＡは、異なる標的領域の一部と相補的な領域を含有してよく、例えば、異なるｇＲＮＡが存在する場合、そのそれぞれが、異なる標的領域の一部と相補的であってよい。他の例では、１種よりも多くのｇＲＮＡは、それぞれ同じ標的領域を標的としてよい。他の例では、１種よりも多くのｇＲＮＡは、同じ標的領域を標的とするｇＲＮＡと異なる標的領域を標的とするｇＲＮＡの組合せであってよい。

ガイド核酸の一部をコードする遺伝子を含むカセットを、ガイド核酸の別の部分をコードするベクターにライゲーションまたはアセンブルすることができる。ライゲーションまたはアセンブルすると、カセットに由来するガイド核酸の部分とガイド核酸の他の部分が機能的なガイド核酸を形成し得る。プロモーターと、ガイド核酸をコードする遺伝子を作動可能に連結することができる。

一部の実施形態では、方法は、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７などの、核酸誘導型ヌクレアーゼをコードする第２のベクターの導入を伴う。ベクターは、核酸誘導型ヌクレアーゼをコードする遺伝子に作動可能に連結した１つまたは複数のプロモーターをさらに含み得る。

本明細書で使用される場合、「作動可能に」連結したとは、ｇＲＮＡをコードする遺伝子またはＣＲＩＳＰＲヌクレアーゼをコードする遺伝子などの遺伝子をコードするＤＮＡの転写に影響を及ぼすまたはそれを調節するプロモーターを意味し得る。

プロモーターは、ベクターが導入される細胞内に存在するプロモーターなどのネイティブなプロモーターであってよい。プロモーターは、誘導性または抑制可能なプロモーターであってよく、例えば、プロモーターを、ガイド核酸をコードする遺伝子または核酸誘導型ヌクレアーゼをコードする遺伝子などの遺伝子の誘導性または抑制可能な転写が可能になるように調節することができる。分子の存在または非存在によって調節されるそのようなプロモーターは、それぞれインデューサーまたはリプレッサーと称することができる。ガイド核酸または核酸誘導型ヌクレアーゼを発現させるために必要なプロモーターの性質は、種または細胞型に基づいて変動し得、当業者によって認識され得る。

核酸誘導型ヌクレアーゼをコードする別々のベクターを、細胞または細胞の集団に、本明細書に開示されている追跡可能なプラスミドの導入の前にまたはそれと同時に導入することができる。核酸誘導型ヌクレアーゼをコードする遺伝子を細胞または細胞の集団のゲノムに組み込むこともでき、遺伝子をエピソームとして維持することもできる。核酸誘導型ヌクレアーゼをコードするＤＮＡを細胞のゲノムに、追跡可能なプラスミドの導入前、または追跡可能なプラスミドの導入後に組み込むことができる。一部の例では、核酸誘導型ヌクレアーゼをコードするＤＮＡなどの核酸分子を、ゲノムに組み込まれたＤＮＡから発現させることができる。一部の実施形態では、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、またはＭＡＤ７をコードする遺伝子を細胞のゲノムに組み込む。

本明細書に記載の方法において有用なベクターまたはカセットは、２つまたはそれよりも多くのプライミング部位をさらに含み得る。一部の実施形態では、隣接するプライミング部位の存在により、ベクターまたはカセットの増幅が可能になる。

一部の実施形態では、カセットまたはベクターは、１種または複数の核局在化配列（ＮＬＳ）、例えば、約１種もしくはそれよりも多く、約２種もしくはそれよりも多く、約３種もしくはそれよりも多く、約４種もしくはそれよりも多く、約５種もしくはそれよりも多く、約６種もしくはそれよりも多く、約７種もしくはそれよりも多く、約８種もしくはそれよりも多く、約９種もしくはそれよりも多く、約１０種もしくはそれよりも多く、またはそれよりも多くのＮＬＳを含む、核酸誘導型ヌクレアーゼをコードする。一部の実施形態では、操作されたヌクレアーゼは、アミノ末端またはその近傍に、約１種もしくはそれよりも多く、約２種もしくはそれよりも多く、約３種もしくはそれよりも多く、約４種もしくはそれよりも多く、約５種もしくはそれよりも多く、約６種もしくはそれよりも多く、約７種もしくはそれよりも多く、約８種もしくはそれよりも多く、約９種もしくはそれよりも多く、約１０種もしくはそれよりも多く、またはそれよりも多くのＮＬＳを含み、カルボキシ末端またはその近傍に、約１種もしくはそれよりも多く、約２種もしくはそれよりも多く、約３種もしくはそれよりも多く、約４種もしくはそれよりも多く、約５種もしくはそれよりも多く、約６種もしくはそれよりも多く、約７種もしくはそれよりも多く、約８種もしくはそれよりも多く、約９種もしくはそれよりも多く、約１０種もしくはそれよりも多く、またはそれよりも多くのＮＬＳを含む、あるいはこれらの組合せを含む（例えば、アミノ末端に１種または複数のＮＬＳおよびカルボキシ末端に１種または複数のＮＬＳ）。１種よりも多くのＮＬＳが存在する場合、それぞれを他のＮＬＳとは独立して選択することができ、したがって、単一のＮＬＳが１つよりも多くのコピー内に存在してよく、かつ／または１つもしくは複数のコピー内に存在する１つもしくは複数の他のＮＬＳとの組合せで存在してよい。本発明の好ましい実施形態では、操作されたヌクレアーゼは、最大で６種のＮＬＳを含む。一部の実施形態では、ＮＬＳは、ＮＬＳの最も近傍のアミノ酸が、ＮまたはＣ末端からポリペプチド鎖に沿って約１、２、３、４、５、１０、１５、２０、２５、３０、４０、５０、またはそれよりも多くのアミノ酸の範囲内であれば、ＮまたはＣ末端に近いとみなされる。ＮＬＳの非限定的な例としては、アミノ酸配列ＰＫＫＫＲＫＶ（配列番号１１１）を有するＳＶ４０ウイルスラージＴ−抗原のＮＬＳに由来するＮＬＳ配列；ヌクレオプラスミン（例えば、配列ＫＲＰＡＡＴＫＫＡＧＱＡＫＫＫＫ（配列番号１１２）を有するヌクレオプラスミンバイパータイトＮＬＳ）由来のＮＬＳに由来するＮＬＳ配列；アミノ酸配列ＰＡＡＫＲＶＫＬＤ（配列番号１１３）またはＲＱＲＲＮＥＬＫＲＳＰ（配列番号１１４）を有するｃ−ｍｙｃＮＬＳに由来するＮＬＳ配列；配列ＮＱＳＳＮＦＧＰＭＫＧＧＮＦＧＧＲＳＳＧＰＹＧＧＧＧＱＹＦＡＫＰＲＮＱＧＧＹ（配列番号１１５）を有するｈＲＮＰＡ１Ｍ９ＮＬＳに由来するＮＬＳ配列；インポーチン−アルファ由来のＩＢＢドメインの配列ＲＭＲＩＺＦＫＮＫＧＫＤＴＡＥＬＲＲＲＲＶＥＶＳＶＥＬＲＫＡＫＫＤＥＱＩＬＫＲＲＮＶ（配列番号１１１６）に由来するＮＬＳ配列；筋腫Ｔタンパク質の配列ＶＳＲＫＲＰＲＰ（配列番号１１７）およびＰＰＫＫＡＲＥＤ（配列番号１１５）に由来するＮＬＳ配列；ヒトｐ５３の配列ＰＱＰＫＫＫＰＬ（配列番号１１９）に由来するＮＬＳ配列；マウスｃ−ａｂｌＩＶの配列ＳＡＬＩＫＫＫＫＫＭＡＰ（配列番号１２０）に由来するＮＬＳ配列；インフルエンザウイルスＮＳ１の配列ＤＲＬＲＲ（配列番号１２１）およびＰＫＱＫＫＲＫ（配列番号１２２）に由来するＮＬＳ配列；肝炎ウイルスデルタ抗原の配列ＲＫＬＫＫＫＩＫＫＬ（配列番号１２３）に由来するＮＬＳ配列；マウスＭｘ１タンパク質の配列ＲＥＫＫＫＦＬＫＲＲ（配列番号１２４）に由来するＮＬＳ配列；ヒトポリ（ＡＤＰ−リボース）ポリメラーゼの配列ＫＲＫＧＤＥＶＤＧＶＤＥＶＡＫＫＫＳＫＫ（配列番号１２５）に由来するＮＬＳ配列；ならびにステロイドホルモン受容体（ヒト）グルココルチコイドの配列ＲＫＣＬＱＡＧＭＮＬＥＡＲＫＴＫＫ（配列番号１２６）に由来するＮＬＳ配列が挙げられる。

一般に、１種または複数のＮＬＳは、真核細胞の核内への核酸誘導型ヌクレアーゼの検出可能な量での蓄積を駆動するのに十分な強度のものである。一般に、核局在化活性の強度は、ＮＬＳの数、使用される特定のＮＬＳ（複数可）、またはこれらの因子の組合せから引き出すことができる。核内への蓄積の検出は、任意の適切な技法によって実施することができる。例えば、検出可能なマーカーを、核酸誘導型ヌクレアーゼと融合させることがき、したがって、例えば、核の場所を検出するための手段（例えば、ＤＡＰＩなどの核に特異的な染色）と組み合わせて、細胞内の場所を可視化することができる。細胞核を細胞から単離することもでき、次いで、その内容物を、免疫組織化学、ウエスタンブロット、または酵素活性アッセイなどの、タンパク質を検出するための任意の適切なプロセスによって分析することができる。核内の蓄積は、例えば、核酸誘導型ヌクレアーゼ複合体の形成の影響につてのアッセイ（例えば標的配列におけるＤＮＡ切断もしくは変異についてのアッセイ、またはターゲティング可能なヌクレアーゼ複合体の形成および／もしくは核酸誘導型ヌクレアーゼ活性による影響を受ける遺伝子発現活性の変化についてのアッセイ）によって、核酸誘導型ヌクレアーゼもしくはターゲティング可能なヌクレアーゼ複合体に曝露していない、または１種もしくは複数のＮＬＳを欠く核酸誘導型ヌクレアーゼに曝露した対照と比較して間接的に決定することもできる。
ＰｒｏＳＡＲ

本明細書に開示されている方法は、数種から数百種までの遺伝子配列またはタンパク質を同時に操作することができる。これらの方法により、単一の実験において、多くのまたは全ての可能性のある残基変化を、所望のタンパク質の集合にわたって、個々の目的のタンパク質の一部としてまたは経路の一部として、目的の形質にマッピングすることを可能にすることができる。この手法は、少なくとも以下：ｉ）特定の生化学的経路内のもしくは同様の反応を触媒する任意の数の目的のタンパク質についての任意の数の残基変化、またはｉｉ）特定のレギュロンを有する任意の数の目的のタンパク質の調節部位内の任意の数の残基、またはｉｉｉ）健康状態を処置するために使用される生物学的作用物質の任意の数の残基のマッピングのために使用することができる。

一部の実施形態では、本明細書に記載の方法は、１種または複数の標的タンパク質の任意の数の残基、例えば、１つもしくは複数、または全ての残基などに影響を及ぼす１種または複数の標的遺伝子の遺伝的変異を同定するステップを含む。これらの実施形態によると、本明細書に開示されている組成物および方法により、２種またはそれよりも多くの標的タンパク質または形質に寄与するタンパク質の並行分析が可能になる。記載されている単一の実験による多数のタンパク質の並行分析により、例えば、真核生物または原核生物による副産物を産生させるため、真核生物による副産物、例えば、増殖因子などの生物学的作用物質、または原核生物において抗体などを産生させるための優れた系の同定、改変および設計を容易にすることができる。疾患の分析および処置に使用される関連する生物製剤を、製造者および消費者のコストを減らすと同時に、産生時間を短縮し、品質を向上させ得るこれらの遺伝子工学により操作された環境で産生することができる。

本明細書に開示されている一部の実施形態は、遺伝子または遺伝子セグメントの遺伝的変異を試験するために有用な構築物を含み、ここで、遺伝子または遺伝子セグメントは、タンパク質を生成することができる。バーコードなどの追跡可能な作用物質と連結した、標的タンパク質の任意の数の残基、例えば１つ、２つ、２つよりも多く、または全ての残基改変に対する構築物を生成することができる。標的タンパク質の遺伝子の遺伝的変異を示すバーコードは、遺伝子のオープンリーディングフレームの外側に位置してよい。一部の実施形態では、そのようなバーコードは、遺伝子から何百または何千塩基も離れたところに位置してよい。本明細書では、これらの方法をｉｎｖｉｖｏにおいて実施することができることが意図されている。一部の例では、そのような構築物は、本明細書に開示されている追跡可能なポリ核酸またはプラスミドを含む。

本明細書に記載の構築物を使用して、１つの標的タンパク質、１つよりも多くの標的タンパク質または形質に寄与する標的タンパク質の全ての残基変化を包含する遺伝的変異の包括的なライブラリーをコンパイルすることができる。ある特定の実施形態では、本明細書に開示されているライブラリーを使用して、例えば、化学薬品、バイオ燃料、生物学的作用物質、医薬品、またはバイオマス、または生物学的製剤などの副産物を産生させるための、非選択的な系と比較して改善された単一のまたは多数のタンパク質系を創出するための、品質が改善されたタンパク質を選択することができる。
タンパク質配列と活性の関係（ＰｒｏＳＡＲ）のマッピング

タンパク質のアミノ酸構造とその全体的な機能の関係を理解することには、生物学者および技術者にとって大きな実用的、臨床的、および科学的意義があり続けている。指向性進化法は、強力な操作および発見ツールであり得るが、ランダムかつ多くの場合にコンビナトリアルであるという変異の性質により、それらの個々の影響を定量することは難しく、したがって、さらなる操作は課題である。個々の残基または飽和変異誘発の寄与に関するより系統的な分析は、タンパク質全体について依然として多大な労力および時間を要するものであり、単純に、標準の方法を使用して妥当な時間尺度で多数のタンパク質、例えば代謝経路または多タンパク質複合体などについて並行してより系統的な分析を行うことは不可能である。

ウイルス、微生物、または真核生物のゲノムにおける遺伝子の一部または全部の役割を、バーコードが付されたオリゴヌクレオチドの混合物を使用して迅速かつ効率的に試験するために使用することができる方法が本明細書で提供される。一部の実施形態では、これらの組成物および方法を使用して、タンパク質の構造と活性の関係（ＰｒｏＳＡＲ）を包括的にマッピングするための強力な新しい技術を開発することができる。

本明細書に開示されている方法および組成物を使用すると、多重化カセット合成をリコンビニアリングと組み合わせて、１種または複数の目的の遺伝子にわたって並行した、特異的に設計されバーコードが付された変異の変異体ライブラリーを創出することができる。スクリーニングおよび／または選択、その後のハイスループットな配列決定および／またはバーコードマイクロアレイ法により、タンパク質配列と活性の関係（ＰｒｏＳＡＲ）の迅速なマッピングを可能にすることができる。一部の実施形態では、系統的なＰｒｏＳＡＲマッピングにより、機能および／または活性および／または安定性などの改善のための個々のアミノ酸変異を解明することができる。

方法を繰り返して、機能、活性、または安定性をコンビナトリアルに改善することができる。カセットは、オリゴヌクレオチド合成によって生成することができる。多重化オリゴヌクレオチド合成の既存の能力は、リコンビニアリングと組み合わせて、アレイ当たり１２０，０００を超えるオリゴヌクレオチドに到達し得ることを考慮して、本明細書に開示されている方法の規模を拡大して、単一の実験において数十種から数百種までのタンパク質の変異体ライブラリーを構築することができる。一部の例では、本明細書に開示されている方法によって生成された変異体ライブラリーによって少なくとも１種、２種、３種、４種、５種、６種、７種、８種、９種、１０種、１５種、２５種、５０種、７５種、１００種、１５０種、２００種、２５０種、３００種、４００種、５００種、６００種、７００種、８００種、９００種、１０００種、またはそれよりも多くのタンパク質を部分的に、または完全に網羅することができる。

いくつかの異なるタンパク質についてのバーコードが付された置換ライブラリーを同時に構築するための戦略が本明細書に開示される。既存の多重化ＤＮＡ合成技術を使用すると、開示されている通り、１種または複数のタンパク質構築物についての部分的なまたは完全な置換ライブラリーは、１種または数百種のタンパク質に関して同時に、バーコードが付されていてもよく、所望であればバーコードが付されていなくてもよい。一部の例では、そのようなライブラリーは、本明細書に開示されている追跡可能なプラスミドを含む。

本明細書の一部の実施形態は、任意のタンパク質の分析および構造／機能／安定性ライブラリー構築に、活性に関する対応するスクリーニングまたは選択と共に適用される。カセットライブラリーサイズは、目的のタンパク質内のアミノ酸の数（Ｎ）に依存し得、各位置において全部で２０種のアミノ酸および場合によって天然に存在しないアミノ酸を含む完全飽和ライブラリーは１９（またはそれよりも多く）×Ｎの規模になりアラニン−マッピングライブラリーは１×Ｎの規模になる。したがって、一部の例では、１，０００よりも多くのアミノ酸の非常に大きなタンパク質のスクリーニングでさえ、アレイ当たり少なくとも１２０，０００オリゴという現在の多重化オリゴ合成能を考えれば扱いやすいものであり得る。

活性スクリーニングに加えてまたはその代わりに、開発されたハイスループットなスクリーニングおよび選択を用いたより一般的な性質を、本明細書に開示されている方法およびカセットを使用して効率的に試験することができる。例えば、普遍的なタンパク質フォールディングおよび溶解性のレポーターを、細胞質、ペリプラズム、および内膜において発現させるために操作することができる。一部の例では、タンパク質ライブラリーを、種々の形質の発現に必要な残基変化を同定するために、異なる温度、異なる基質または補因子などの異なる条件下でスクリーニングすることができる。他の実施形態では、残基を一度に１つずつ分析することができるので、熱安定性、環境圧力に対する抵抗性、または機能性もしくは産生の増大もしくは低減などの特定の形質に重要な残基における変異を触媒活性などの種々の他の形質に重要な変異と多重化リコンビニアリングによって組み合わせて、多形質最適化のためのコンビナトリアルライブラリーを創出することができる。

本明細書に開示されている方法により、１種または複数の標的タンパク質の包括的なｉｎｖｉｖｏにおける変異ライブラリーの創出および／または評価をもたらすことができる。これらの手法をレコーダーカセットまたはバーコーディング技術によって拡張して、タンパク質内の任意の数の残基またはあらゆる残基についての追跡可能な変異ライブラリーを生成することができる。この手法は、選択される技術に応じて、ｉｎｖｉｖｏにおいて機能するように拡張された、１種または数種から数百種までのタンパク質に対して同時に機能することができるタンパク質配列と活性の関係のマッピング方法に基づき得る。例えば、これらの方法により、単一の実験において、任意の数の、大多数の、または全ての可能性のある残基変化を、所望のタンパク質の集合にわたって、個々の目的のタンパク質の一部としてまたは経路の一部として、目的の形質にマッピングすることを可能にする。

一部の例では、これらの手法を、少なくとも以下ｉ）リコペン産生などの特定の生化学的経路内の、もしくは、所望の効果を生じるもしくは産物を産生する有用な経路のデヒドロゲナーゼもしくは他の酵素などの同様の反応を触媒する任意の数のもしくは全てのタンパク質についての任意の数のもしくは全ての残基変化、またはｉｉ）熱ショック応答などの特定の調節機構を有する任意の数のもしくは全てのタンパク質の調節部位内の任意の数のもしくは全ての残基、またはｉｉｉ）インスリン、増殖因子（ＨＣＧ）、抗がん生物学的製剤、もしくは欠損集団に対する補充用タンパク質などの、健康状態を処置するために使用される生物学的作用物質の任意の数のもしくは全ての残基のマッピングのために使用することができる。

ゲノム的に操作された生物体または系を設計するための１つまたは複数の複合スコアを生成するために、種々のインプットパラメータに関連するスコアを割り当てることができる。これらのスコアは、生物体または所定の産生のための生物体の設計、形質（複数可）の選択に関するので、遺伝子または遺伝子遺伝子座の遺伝的変異の質を反映し得る。ある特定の生物体または系を、バイオリファイニング（ｂｉｏｒｅｆｉｎｉｎｇ）、作物、木、イネ科植物、作物残渣、もしくは森林残留物などのバイオマス、バイオ燃料産生、ならびに化合物を生成し、使用するための、生物的変換、発酵、化学変換および触媒作用の使用、バイオ医薬品産生および生物学的産生のための改善された生物体の必要性に基づいて設計することができる。ある特定の実施形態では、これは、微生物の成長または産生を本明細書に開示されている遺伝子操作方法によって調節することによって実現することができる。

タンパク質をコードする遺伝子の本明細書に開示されている方法による遺伝子操作を使用して、所望の表現型をもたらすことができ、これらに限定されないが、所望の表現型の変化を伴う所望の遺伝子変化をもたらす、ｉ）新しい遺伝子材料の導入、ｉｉ）遺伝子挿入、既存の遺伝子材料の破壊または除去、ならびに、ｉｉｉ）点変異などの遺伝子材料の変異、またはｉ、ｉｉ、およびｉｉｉの任意の組合せを含めた多数の技法によって実現することができる、所望の遺伝子変化を行うことができる。変異は、これらに限定されないが、ＰＣＲによるエラープローンまたは定向変異誘発、変異誘発株、およびランダム変異誘発を含めたものに加えて、定向であってもランダムであってもよい。変異は、本明細書に開示されている追跡可能なプラスミドおよび方法を使用して組み入れることができる。

開示されている方法は、高次の改変を微生物のゲノムまたは標的タンパク質に挿入し、蓄積させるために使用することができる；例えば、１種を超える、５種を超える、１０種を超える、１５種を超える、２０種を超える、２５種を超える、３０種を超える、４０種を超える、５０種を超える、６０種を超える、７０種を超える、８０種を超える、９０種を超える、１００種を超える、１５０種を超える、２００種を超える、２５０種を超える、３００種を超える、またはそれよりも多くの標的化改変を伴うゲノムのライブラリーを生成するための、高効率での、同じゲノム内の多数の異なる部位特異的変異が記載されている。一部の例では、これらの変異は、調節モジュール、調節エレメント、タンパク質コード領域、または非コード領域内のものである。タンパク質コーディング改変としては、これらに限定されないが、アミノ酸の変化、コドン最適化、および翻訳調整を挙げることができる。

一部の例では、単一の生体細胞に試薬を共送達するための方法が提供される。当該方法は、一般に、２つまたはそれよりも多くのカセットの付着または連結、その後の、連結したカセットの単一細胞への送達を伴う。一般に、本明細書で提供される方法は、２つまたはそれよりも多くのカセットの単一細胞への送達を伴う。多くの場合、個々の細胞それぞれが２つまたはそれよりも多くのカセットを受け取ることが望ましい。試薬送達の伝統的な方法は、多くの場合、非効率的かつ／または相反する可能性があり、これにより、一部の細胞がただ１つのカセットを受け取る状況が導かれる。本明細書で提供される方法は、細胞集団内の大多数の細胞がそれぞれ２つまたはそれよりも多くのカセットを受け取るように、試薬送達の効率および／または一貫性を改善することができる。例えば、細胞集団内の細胞の５０％よりも多く、５５％よりも多く、６０％よりも多く、６５％よりも多く、７０％よりも多く、７５％よりも多く、８０％よりも多く、８５％よりも多く、９０％よりも多く、９５％よりも多く、９６％よりも多く、９７％よりも多く、９８％よりも多く、９９％よりも多くが２つまたはそれよりも多くのカセットを受け取ることができる。

２つまたはそれよりも多くのカセットは、当技術分野における任意の公知の方法によって連結することができ、一般に、選択される方法は、カセットの化学的性質に見合うものになる。一般に、２つまたはそれよりも多くのカセットは共有結合によって連結される（すなわち、共有結合により連結される）が、水素結合、イオン結合、および金属結合などの他の型の非共有結合性の化学結合が構想される。このように、編集カセットおよびレコーダーカセットを連結し、単一細胞に送達することができる。次いで、既知の編集をその細胞についての既知のレコーダーまたはバーコード配列と関連付ける。

一例では、２つまたはそれよりも多くのカセットは、２つまたはそれよりも多くの核酸などの核酸である。核酸は、ＲＮＡ、ＤＮＡ、または両方の組合せであってよく、任意の数の化学的に改変されたヌクレオチドまたはヌクレオチド類似体を含有してよい。一部の場合では、２つまたはそれよりも多くのＲＮＡカセットを、単一細胞への送達のために連結する。他の場合では、２つまたはそれよりも多くのＤＮＡカセットを、単一細胞への送達のために連結する。さらに他の場合では、ＤＮＡカセットとＲＮＡカセットを、単一細胞への送達のために連結する。核酸は、ゲノムＲＮＡ、相補ＤＮＡ（ｃＤＮＡ）、または化学的にもしくは酵素的に合成されたＤＮＡに由来するものであってよい。

カセットは、最大で全長タンパク質をコードするまたは調節性の遺伝子エレメントまで３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、約１１０、約１２０、約１３０、約１４０、約１５０、約１６０、約１７０、約１８０、約１９０、約２００、約２１０、約２２０、約２３０、約２４０、約２５０、約２７５、約３００、約３２５、約３５０、約３７５、約４００、約４２５、約４５０、約４７５、約５００、約５２５、約５５０、約５７５、約６００、約６２５、約６５０、約６７５、約７００、約７２５、約７５０、約７７５、約８００、約８２５、約８５０、約８７５、約９００、約９２５、約９５０、約９７５、約１０００、約１１００、約１２００、約１３００、約１４００、約１５００、約１７５０、約２０００、約２５００、約３０００、約４０００、約５０００、約６０００、約７０００、約８０００、約９０００、約１０，０００ヌクレオチド残基またはそれを超える長さであってよい。

２つまたはそれよりも多くのカセットを直鎖状核酸分子上で連結することもでき、プラスミドまたは環状核酸分子上で連結することもできる。２つまたはそれよりも多くのカセットを互いと直接連結することもでき、１つまたは複数のヌクレオチドスペーサーまたはリンカーによって分離することもできる。

２つまたはそれよりも多くのカセットを直鎖状カセット上で共有結合により連結することもでき、プラスミドまたは環状核酸分子上で共有結合により連結することもできる。２つまたはそれよりも多くのカセットを互いと直接共有結合により連結することもでき、１つまたは複数のヌクレオチドスペーサーまたはリンカーによって分離することもできる。

任意の数および種類のカセットを共送達のために連結することができる。例えば、２つまたはそれよりも多くのカセットは、核酸、脂質、タンパク質、ペプチド、小分子、またはそれらの任意の組合せを含み得る。２つまたはそれよりも多くのカセットは、連結に適する本質的に任意のカセットであってよい。

好ましい例では、２つまたはそれよりも多くのカセットを共有結合により（例えば、化学結合により）連結する。共有結合による連結は、２つまたはそれよりも多くのカセットが単一細胞に共送達されることを確実にするために役立ち得る。一般に、２つまたはそれよりも多くのカセットを、細胞への送達前に共有結合により連結する。２つまたはそれよりも多くの分子を共有結合により連結する任意の方法を利用することができ、使用される方法は、少なくとも部分的に、連結されるカセットの型によって決定されることが理解されるべきである。

一部の例では、単一の生体細胞に試薬を共送達するための方法が提供される。当該方法は、一般に、２つまたはそれよりも多くのカセットの共有結合による付着または連結、その後の、共有結合により連結したカセットの単一細胞への送達を伴う。提供される方法は、個々の細胞が２つまたはそれよりも多くのカセットを受け取ることを確実にするために役立ち得る。試薬送達の任意の公知の方法は、連結したカセットを細胞に送達するために利用することができ、送達されるカセットの化学的性質に少なくとも部分的に依存する。試薬送達方法の非限定的な例としては、形質転換、リポフェクション、電気穿孔、トランスフェクション、ナノ粒子などを挙げることができる。

種々の実施形態では、カセット、または単離されたドナー、または編集核酸を細胞または微生物に導入して、細胞または微生物の一面、例えば、本明細書に開示されている微生物の生存または成長を変化させるまたは調節することができる。単離された核酸は、ゲノムＲＮＡ、相補ＤＮＡ（ｃＤＮＡ）、化学的にまたは酵素的に合成されたＤＮＡに由来してよい。それに加えてまたはその代わりに、単離された核酸は、捕捉用プローブ、プライマー、標識された検出用オリゴヌクレオチド、またはＤＮＡアセンブリ用の断片に有用であり得る。

「核酸」は、一本鎖および／または二本鎖分子、ならびにＤＮＡ、ＲＮＡ、化学修飾された核酸および核酸類似体を含み得る。核酸は、最大で全長タンパク質をコードするまたは調節性遺伝子エレメントまで、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００、約１１０、約１２０、約１３０、約１４０、約１５０、約１６０、約１７０、約１８０、約１９０、約２００、約２１０、約２２０、約２３０、約２４０、約２５０、約２７５、約３００、約３２５、約３５０、約３７５、約４００、約４２５、約４５０、約４７５、約５００、約５２５、約５５０、約５７５、約６００、約６２５、約６５０、約６７５、約７００、約７２５、約７５０、約７７５、約８００、約８２５、約８５０、約８７５、約９００、約９２５、約９５０、約９７５、約１０００、約１１００、約１２００、約１３００、約１４００、約１５００、約１７５０、約２０００、約２５００、約３０００、約４０００、約５０００、約６０００、約７０００、約８０００、約９０００、約１０，０００またはそれを超えるヌクレオチド残基の長さであってよいことが意図されている。

単離された核酸は、当技術分野で公知の任意の方法によって、例えば、標準の組換え方法、アセンブリ方法、合成技法、またはこれらの組合せを使用して作出することができる。一部の実施形態では、核酸をクローニング、増幅、アセンブル、または他のやり方で構築することができる。

核酸は、好都合に、リシンリボスイッチの一部に加えて配列を含み得る。例えば、１つまたは複数のエンドヌクレアーゼ制限部位を含むマルチクローニング部位を付加することができる。核酸を、核酸のクローニングのために、ベクター、アダプター、またはリンカーに付着させることができる。核酸の単離を補助するそれらの機能を最適化するため、または細胞への核酸の導入を改善するために、そのようなクローニングおよび配列に追加的な配列を付加することができる。クローニングベクター、発現ベクター、アダプター、およびリンカーの使用は当技術分野において周知である。

単離された核酸は、当技術分野で公知の任意の数のクローニング方法論を使用して、細胞、細菌、または他の供給源から得ることができる。一部の実施形態では、ストリンジェントな条件下で生物体または細胞の他のオリゴヌクレオチドまたは核酸に選択的にハイブリダイズするオリゴヌクレオチドプローブ。核酸ライブラリーを構築するための方法は公知であり、任意のそのような公知の方法を使用することができる。

細胞のゲノムＤＮＡ、ＲＮＡ、またはｃＤＮＡを、同定された目的の遺伝子エレメントの存在について、プローブを使用し、１つまたは複数の配列に基づいてスクリーニングすることができる。種々の程度のストリンジェンシーのハイブリダイゼーションをアッセイに使用することができる。

核酸ハイブリダイゼーションのための高ストリンジェンシー条件は当技術分野で周知である。例えば、条件は、約５０℃〜約７０℃の温度で約０．０２Ｍ〜約０．１５ＭのＮａＣｌによってもたらされるものなどの低塩および／または高温条件を含み得る。所望のストリンジェンシーの温度およびイオン強度は、一部において、特定の核酸（複数可）の長さ、標的配列（複数可）の長さおよびヌクレオチド含有量、核酸（複数可）の電荷組成によって、およびハイブリダイゼーション混合物中のホルムアミド、塩化テトラメチルアンモニウムまたは他の溶媒（複数可）の存在または濃度によって決定されることが理解される。核酸は、標的配列と完全に相補的であってもよく、１つまたは複数のミスマッチを示してもよい。

目的の核酸を、種々の公知の増幅技法を使用して増幅することもできる。例えば、ポリメラーゼ連鎖反応（ＰＣＲ）技術を使用して、標的配列をＤＮＡ、ＲＮＡ、またはｃＤＮＡから直接増幅することができる。ＰＣＲおよび他のｉｎｖｉｔｒｏ増幅方法は、例えば、核酸配列をクローニングするため、試料中の標的核酸の存在を検出するためのプローブとして使用するための核酸を作出するため、核酸配列決定のため、または他の目的のためにも有用であり得る。

単離された核酸は、ホスホトリエステル法などの方法による直接化学合成によって、または自動合成機を使用して調製することができる。化学合成では、一般に、一本鎖オリゴヌクレオチドが生成する。これを、相補配列とのハイブリダイゼーションによって、または、一本鎖を鋳型として使用し、ＤＮＡポリメラーゼを用いた重合によって二本鎖ＤＮＡに変換することができる。

本明細書において意図されている標的タンパク質の活性を同定、単離、精製、使用およびアッセイするための、当技術分野で公知の任意の方法が意図されている。本明細書において意図されている標的タンパク質は、ヒトの状態を処置するためまたはヒトもしくは非ヒト哺乳動物の疾患に関与するプロセス（例えば、酵素などの経路の一部）を調節するために使用されるタンパク質薬剤を含む。抗体または抗体断片の選択および産生で知られている任意の方法も意図されている。それに加えてまたはその代わりに、標的タンパク質は、ウイルス、細胞、または生物体における経路またはプロセスに関与するタンパク質または酵素であり得る。
ターゲティング可能な核酸切断系

本明細書で提供される一部の方法は、特異的な核酸配列の切断を、部位特異的、ターゲティング可能、および／または操作されたヌクレアーゼまたはヌクレアーゼ系を使用して標的化するステップを含む。そのようなヌクレアーゼにより、ゲノムまたは核酸分子内の所望の場所に二本鎖切断（ＤＳＢ）を創出することができる。他の例では、ヌクレアーゼにより、一本鎖切断を創出することができる。一部の場合では、２種のヌクレアーゼを使用し、そのそれぞれにより一本鎖切断を生成する。

１つまたは複数の二本鎖切断または一本鎖切断を、細胞の内在性機構を使用して相同組換え（ＨＲ）および非相同末端結合（ＮＨＥＪ）の天然のプロセスによって修復することができる。それに加えてまたはその代わりに、内在性または異種性組換え機構を使用して、誘導された切断（複数可）を修復することができる。

ジンクフィンガーヌクレアーゼ（ＺＦＮ）、転写活性化因子様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、操作されたホーミングエンドヌクレアーゼ、ならびに、Ｃａｓ９もしくはＣＰＦ１などのＣＲＩＳＰＲ／Ｃａｓ、および／またはアルゴノート系などのＲＮＡまたはＤＮＡをガイドとするエンドヌクレアーゼなどの操作されたヌクレアーゼが、本発明の方法のいくつかの実施に特に適する。それに加えてまたはその代わりに、ｃ２ｃ２ヌクレアーゼを含むＣＲＩＳＰＲ／Ｃａｓ系などのＲＮＡ標的化系を使用することができる。

本明細書に開示されている方法は、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、Ｖ型、またはＶＩ型ＣＲＩＳＰＲ系などのＣＲＩＳＰＲ系を使用して標的核酸を切断するステップを含み得る。ＣＲＩＳＰＲ／Ｃａｓ系は、多タンパク質系であっても単一のエフェクタータンパク質系であってもよい。多タンパク質またはクラス１ＣＲＩＳＰＲ系として、Ｉ型、ＩＩＩ型、およびＩＶ型系が挙げられる。あるいは、クラス２系として、単一のエフェクター分子が挙げられ、ＩＩ型、ＶＩ型、およびＶＩ型が含まれる。

本明細書に開示されている方法において使用されるＣＲＩＳＰＲ系は、単一または多数のエフェクタータンパク質を含み得る。エフェクタータンパク質は、１つまたは多数のヌクレアーゼドメインを含み得る。エフェクタータンパク質は、ＤＮＡを標的とするものであってもＲＮＡを標的とするものであってもよく、ＤＮＡまたはＲＮＡは、一本鎖であっても二本鎖であってもよい。エフェクタータンパク質は、二本鎖または一本鎖切断を生成することができる。エフェクタータンパク質は、ヌクレアーゼドメインに変異を含み得、それにより、ニッカーゼタンパク質が生成される。エフェクタータンパク質は、１つまたは複数のヌクレアーゼドメインに変異を含み得、それにより、標的配列に結合することはできるが、それを切断することはできない、触媒として機能しないヌクレアーゼが生成される。ＣＲＩＳＰＲ系は、単一のまたは多数の、ガイドとなるＲＮＡを含み得る。ｇＲＮＡは、ｃｒＲＮＡを含み得る。ｇＲＮＡは、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡ配列を有するキメラＲＮＡを含み得る。ｇＲＮＡは、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡを別々に含み得る。標的核酸配列は、プロトスペーサー隣接モチーフ（ＰＡＭ）またはプロトスペーサー隣接部位（ＰＦＳ）を含み得る。ＰＡＭまたはＰＦＳは、標的またはプロトスペーサー部位に対して３’側にあっても５’側にあってもよい。標的配列の切断により、平滑末端、３’突出部、または５’突出部が生成し得る。

ｇＲＮＡは、スペーサー配列を含み得る。スペーサー配列は、標的配列またはプロトスペーサー配列と相補的であってよい。スペーサー配列は、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、または３６ヌクレオチドの長さであってよい。一部の例では、スペーサー配列は、１０ヌクレオチド未満または３６ヌクレオチドを超える長さであってよい。

ｇＲＮＡは、反復配列を含み得る。一部の場合では、反復配列は、ｇＲＮＡの二本鎖部分の一部である。反復配列は、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、または５０ヌクレオチドの長さであってよい。一部の例では、スペーサー配列は１０ヌクレオチド未満または５０ヌクレオチドを超える長さであってよい。

ｇＲＮＡは、１つまたは複数の合成のヌクレオチド、天然に存在しないヌクレオチド、改変を伴うヌクレオチド、デオキシリボヌクレオチド、またはそれらの任意の組合せを含み得る。それに加えてまたはその代わりに、ｇＲＮＡは、ヘアピン、リンカー領域、一本鎖領域、二本鎖領域、またはそれらの任意の組合せを含み得る。それに加えてまたはその代わりに、ｇＲＮＡは、シグナル伝達またはレポーター分子を含み得る。

ＣＲＩＳＰＲヌクレアーゼは、細胞内で内因的にまたは組換えによって発現させることができる。ＣＲＩＳＰＲヌクレアーゼは、染色体上、染色体外に、またはプラスミド、合成染色体、もしくは人工染色体上にコードされるものであってよい。ＣＲＩＳＰＲヌクレアーゼは、細胞にポリペプチドまたはポリペプチドをコードするｍＲＮＡとしてもたらすまたは送達することができる。そのような例では、ポリペプチドまたはｍＲＮＡを、当技術分野で公知の標準の機構によって、例えば、細胞透過性ペプチド、ナノ粒子、またはウイルス粒子を使用することによって送達することができる。

ｇＲＮＡは、細胞内の遺伝子ＤＮＡによりコードされるものであってもエピソームＤＮＡによりコードされるものであってもよい。一部の例では、ｇＲＮＡを、ＣＲＩＳＰＲヌクレアーゼを発現する細胞にもたらすまたは送達することができる。ｇＲＮＡは、ＣＲＩＳＰＲヌクレアーゼと同時にまたは逐次的にもたらすまたは送達することができる。ガイドＲＮＡは、化学的に合成すること、ｉｎｖｉｔｒｏで転写させること、または当技術分野で公知の標準のＲＮＡ生成技法を使用して他のやり方で生成することができる。

ＣＲＩＳＰＲ系は、ＩＩ型ＣＲＩＳＰＲ系、例えば、Ｃａｓ９系であってよい。ＩＩ型ヌクレアーゼは、一部の場合ではＲｕｖＣおよびＨＮＨヌクレアーゼドメインを含む単一のエフェクタータンパク質を含み得る。一部の場合では、機能的なＩＩ型ヌクレアーゼは、２つまたはそれよりも多くのポリペプチドを含んでよく、そのそれぞれが、ヌクレアーゼドメインまたはその断片を含む。標的核酸配列は、３’プロトスペーサー隣接モチーフ（ＰＡＭ）を含み得る。一部の例では、ＰＡＭは標的核酸に対して５’にあってよい。ガイドＲＮＡ（ｇＲＮＡ）は単一のキメラｇＲＮＡを含んでよく、当該キメラｇＲＮＡはｃｒＲＮＡ配列とｔｒａｃｒＲＮＡ配列の両方を含有する。あるいは、ｇＲＮＡは、２つのＲＮＡのセット、例えば、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡを含み得る。ＩＩ型ヌクレアーゼは、二本鎖切断を生成することができ、それにより、一部の場合では、２つの平滑末端が創出される。一部の場合では、ＩＩ型ＣＲＩＳＰＲヌクレアーゼを、ニッカーゼになるように操作し、したがって、当該ヌクレアーゼにより、一本鎖切断のみが生成される。そのような場合では、２つの別個の核酸配列をｇＲＮＡにより標的とすることができ、したがって、ニッカーゼによって２つの一本鎖切断が生成される。一部の例では、２つの一本鎖切断により二本鎖切断が有効に創出される。ＩＩ型ニッカーゼを使用して２つの一本鎖切断を生成する一部の場合では、得られる核酸遊離末端は、平滑末端であるか、３’突出部を有するか、または５’突出部を有するものであり得る。一部の例では、ＩＩ型ヌクレアーゼは、触媒として機能しないものであってよく、したがって、標的配列に結合するが、それを切断しない。例えば、ＩＩ型ヌクレアーゼは、ＲｕｖＣドメインおよびＨＮＨドメインの両方に変異を有してよく、それにより、どちらのヌクレアーゼドメインも非機能性になる。ＩＩ型ＣＲＩＳＰＲ系は、３つの亜型、すなわち、ＩＩ−Ａ型、ＩＩ−Ｂ型、またはＩＩ−Ｃ型のうちの１つであってよい。

ＣＲＩＳＰＲ系は、Ｖ型ＣＲＩＳＰＲ系、例えば、Ｃｐｆ１、Ｃ２ｃ１、またはＣ２ｃ３システムであってよい。Ｖ型ヌクレアーゼは、一部の場合では単一のＲｕｖＣヌクレアーゼドメインを含む単一のエフェクタータンパク質を含み得る。他の場合では、機能的Ｖ型ヌクレアーゼは、２つまたはそれよりも多くのポリペプチドを分割するＲｕｖＣドメインを含む。そのような場合では、標的核酸配列は、５’ＰＡＭまたは３’ＰＡＭを含み得る。ガイドＲＮＡ（ｇＲＮＡ）は、例えばＣｐｆ１を用いる場合など、単一のｇＲＮＡまたは単一のｃｒＲＮＡを含み得る。一部の場合では、ｔｒａｃｒＲＮＡは必要ない。Ｃ２ｃ１を使用するなどの他の例では、ｇＲＮＡは、ｃｒＲＮＡ配列およびｔｒａｃｒＲＮＡ配列の両方を含有する単一のキメラｇＲＮＡを含んでもよく、または２つのＲＮＡのセット、例えば、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡを含んでもよい。Ｖ型ＣＲＩＳＰＲヌクレアーゼは、二本鎖切断を生成することができ、これにより、一部の場合では、５’突出部が生成する。一部の場合では、Ｖ型ＣＲＩＳＰＲヌクレアーゼを、ニッカーゼになるように操作し、したがって、当該ヌクレアーゼにより、一本鎖切断のみが生成される。そのような場合では、２つの別個の核酸配列をｇＲＮＡにより標的とすることができ、したがって、ニッカーゼによって２つの一本鎖切断が生成される。一部の例では、２つの一本鎖切断により二本鎖切断が有効に創出される。Ｖ型ニッカーゼを使用して２つの一本鎖切断を生成する一部の場合では、得られる核酸遊離末端は、平滑末端であるか、３’突出部を有するか、または５’突出部を有するものであり得る。一部の例では、Ｖ型ヌクレアーゼは、触媒として機能しないものであってよく、したがって、標的配列に結合するが、それを切断しない。例えば、Ｖ型ヌクレアーゼは、ＲｕｖＣドメインに変異を有してよく、それにより、ヌクレアーゼドメインが非機能性になる。

ＣＲＩＳＰＲ系は、ＶＩ型ＣＲＩＳＰＲ系、例えば、Ｃ２ｃ２系であってよい。ＶＩ型ヌクレアーゼは、ＨＥＰＮドメインを含み得る。一部の例では、ＶＩ型ヌクレアーゼは、２つまたはそれよりも多くのポリペプチドを含み、そのそれぞれが、ＨＥＰＮヌクレアーゼドメインまたはその断片を含む。そのような場合では、標的核酸配列は、一本鎖ＲＮＡなどのＲＮＡであってよい。ＶＩ型ＣＲＩＳＰＲ系を使用する場合、標的核酸は、プロトスペーサー隣接部位（ＰＦＳ）を含み得る。ＰＦＳは、標的またはプロトスペーサー配列に対して３’側にあっても５’側にあってもよい。ガイドＲＮＡ（ｇＲＮＡ）は、単一のｇＲＮＡまたは単一のｃｒＲＮＡを含み得る。一部の場合では、ｔｒａｃｒＲＮＡは必要ない。他の例では、ｇＲＮＡは、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡ配列の両方を含有する単一のキメラｇＲＮＡを含んでもよく、または２つのＲＮＡのセット、例えば、ｃｒＲＮＡおよびｔｒａｃｒＲＮＡを含んでもよい。一部の例では、ＶＩ型ヌクレアーゼは、触媒として機能しないものであってよく、したがって、標的配列に結合するが、それを切断しない。例えば、ＶＩ型ヌクレアーゼは、ＨＥＰＮドメインに変異を有してよく、それにより、ヌクレアーゼドメインが非機能性になる。

本開示において使用するための、核酸誘導型ヌクレアーゼを含めた適切なヌクレアーゼの非限定的な例としては、Ｃ２ｃ１、Ｃ２ｃ２、Ｃ２ｃ３、Ｃａｓ１、Ｃａｓ１Ｂ、Ｃａｓ２、Ｃａｓ３、Ｃａｓ４、Ｃａｓ５、Ｃａｓ６、Ｃａｓ７、Ｃａｓ８、Ｃａｓ９（Ｃｓｎ１およびＣｓｘ１２としても公知）、Ｃａｓ１０、Ｃｐｆ１、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｃ１、Ｃｓｃ２、Ｃｓａ５、Ｃｓｎ２、Ｃｓｍ２、Ｃｓｍ３、Ｃｓｍ４、Ｃｓｍ５、Ｃｓｍ６、Ｃｍｒ１、Ｃｍｒ３、Ｃｍｒ４、Ｃｍｒ５、Ｃｍｒ６、Ｃｓｂ１、Ｃｓｂ２、Ｃｓｂ３、Ｃｓｘ１７、Ｃｓｘ１４、Ｃｓｘ１００、Ｃｓｘ１６、ＣｓａＸ、Ｃｓｘ３、Ｃｓｘ１、Ｃｓｘ１５、Ｃｓｆ１、Ｃｓｆ２、Ｃｓｆ３、Ｃｓｆ４、そのホモログ、そのオルソログ、またはその改変バージョンが挙げられる。適切な核酸誘導型ヌクレアーゼは、これらに限定されないが、Ｔｈｉｏｍｉｃｒｏｓｐｉｒａ、Ｓｕｃｃｉｎｉｖｉｂｒｉｏ、Ｃａｎｄｉｄａｔｕｓ、Ｐｏｒｐｈｙｒｏｍｏｎａｓ、Ａｃｉｄｏｍｏｎｏｃｏｃｃｕｓ、Ｐｒｅｖｏｔｅｌｌａ、Ｓｍｉｔｈｅｌｌａ、Ｍｏｒａｘｅｌｌａ、Ｓｙｎｅｒｇｉｓｔｅｓ、Ｆｒａｎｃｉｓｅｌｌａ、Ｌｅｐｔｏｓｐｉｒａ、Ｃａｔｅｎｉｂａｃｔｅｒｉｕｍ、Ｋａｎｄｌｅｒｉａ、Ｃｌｏｓｔｒｉｄｉｕｍ、Ｄｏｒｅａ、Ｃｏｐｒｏｃｏｃｃｕｓ、Ｅｎｔｅｒｏｃｏｃｃｕｓ、Ｆｒｕｃｔｏｂａｃｉｌｌｕｓ、Ｗｅｉｓｓｅｌｌａ、Ｐｅｄｉｏｃｏｃｃｕｓ、Ｃｏｒｙｎｅｂａｃｔｅｒ、Ｓｕｔｔｅｒｅｌｌａ、Ｌｅｇｉｏｎｅｌｌａ、Ｔｒｅｐｏｎｅｍａ、Ｒｏｓｅｂｕｒｉａ、Ｆｉｌｉｆａｃｔｏｒ、Ｅｕｂａｃｔｅｒｉｕｍ、Ｓｔｒｅｐｔｏｃｏｃｃｕｓ、Ｌａｃｔｏｂａｃｉｌｌｕｓ、Ｍｙｃｏｐｌａｓｍａ、Ｂａｃｔｅｒｏｉｄｅｓ、Ｆｌａｖｉｉｖｏｌａ、Ｆｌａｖｏｂａｃｔｅｒｉｕｍ、Ｓｐｈａｅｒｏｃｈａｅｔａ、Ａｚｏｓｐｉｒｉｌｌｕｍ、Ｇｌｕｃｏｎａｃｅｔｏｂａｃｔｅｒ、Ｎｅｉｓｓｅｒｉａ、Ｒｏｓｅｂｕｒｉａ、Ｐａｒｖｉｂａｃｕｌｕｍ、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓ、Ｎｉｔｒａｔｉｆｒａｃｔｏｒ、Ｍｙｃｏｐｌａｓｍａ、Ａｌｉｃｙｃｌｏｂａｃｉｌｌｕｓ、Ｂｒｅｖｉｂａｃｉｌｕｓ、Ｂａｃｉｌｌｕｓ、Ｂａｃｔｅｒｏｉｄｅｔｅｓ、Ｂｒｅｖｉｂａｃｉｌｕｓ、Ｃａｒｎｏｂａｃｔｅｒｉｕｍ、Ｃｌｏｓｔｒｉｄｉａｒｉｄｉｕｍ、Ｃｌｏｓｔｒｉｄｉｕｍ、Ｄｅｓｕｌｆｏｎａｔｒｏｎｕｍ、Ｄｅｓｕｌｆｏｖｉｂｒｉｏ、Ｈｅｌｃｏｃｏｃｃｕｓ、Ｌｅｐｔｏｔｒｉｃｈｉａ、Ｌｉｓｔｅｒｉａ、Ｍｅｔｈａｎｏｍｅｔｈｙｏｐｈｉｌｕｓ、Ｍｅｔｈｙｌｏｂａｃｔｅｒｉｕｍ、Ｏｐｉｔｕｔａｃｅａｅ、Ｐａｌｕｄｉｂａｃｔｅｒ、Ｒｈｏｄｏｂａｃｔｅｒ、Ｓｐｈａｅｒｏｃｈａｅｔａ、Ｔｕｂｅｒｉｂａｃｉｌｌｕｓ、およびＣａｍｐｙｌｏｂａｃｔｅｒを含む属の生物体に由来するものであってよい。そのような属の生物体の種は、本明細書において他で論じられているものであってよい。適切な核酸誘導型ヌクレアーゼは、これらに限定されないが、Ｆｉｒｍｉｃｕｔｅ、Ａｃｔｉｎｏｂａｃｔｅｒｉａ、Ｂａｃｔｅｒｏｉｄｅｔｅｓ、Ｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｓｐｉｒｏｃｈａｔｅｓ、およびＴｅｎｅｒｉｃｕｔｅｓを含む界内の属または未分類属の生物体に由来するものであってよい。適切な核酸誘導型ヌクレアーゼは、これらに限定されないが、Ｅｒｙｓｉｐｅｌｏｔｒｉｃｈｉａ、Ｃｌｏｓｔｒｉｄｉａ、Ｂａｃｉｌｌｉ、Ａｃｔｉｎｏｂａｃｔｅｒｉａ、Ｂａｃｔｅｒｏｉｄｅｔｅｓ、Ｆｌａｖｏｂａｃｔｅｒｉａ、Ａｌｐｈａｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｂｅｔａｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｇａｍｍａｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｄｅｌｔａｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｅｐｓｉｌｏｎｐｒｏｔｅｏｂａｃｔｅｒｉａ、Ｓｐｉｒｏｃｈａｅｔｅｓ、およびＭｏｌｌｉｃｕｔｅｓを含む門内の属または未分類の属の生物体に由来するものであってよい。適切な核酸誘導型ヌクレアーゼは、これらに限定されないが、Ｃｌｏｓｔｒｉｄｉａｌｅｓ、Ｌａｃｔｏｂａｃｉｌｌａｌｅｓ、Ａｃｔｉｎｏｍｙｃｅｔａｌｅｓ、Ｂａｃｔｅｒｏｉｄａｌｅｓ、Ｆｌａｖｏｂａｃｔｅｒｉａｌｅｓ、Ｒｈｉｚｏｂｉａｌｅｓ、Ｒｈｏｄｏｓｐｉｒｉｌｌａｌｅｓ、Ｂｕｒｋｈｏｌｄｅｒｉａｌｅｓ、Ｎｅｉｓｓｅｒｉａｌｅｓ、Ｌｅｇｉｏｎｅｌｌａｌｅｓ、Ｎａｕｔｉｌｉａｌｅｓ、Ｃａｍｐｙｌｏｂａｃｔｅｒａｌｅｓ、Ｓｐｉｒｏｃｈａｅｔａｌｅｓ、Ｍｙｃｏｐｌａｓｍａｔａｌｅｓ、およびＴｈｉｏｔｒｉｃｈａｌｅｓを含む目内の属または未分類の属の生物体に由来するものであってよい。適切な核酸誘導型ヌクレアーゼは、これらに限定されないが、Ｌａｃｈｎｏｓｐｉｒａｃｅａｅ、Ｅｎｔｅｒｏｃｏｃｃａｃｅａｅ、Ｌｅｕｃｏｎｏｓｔｏｃａｃｅａｅ、Ｌａｃｔｏｂａｃｉｌｌａｃｅａｅ、Ｓｔｒｅｐｔｏｃｏｃｃａｃｅａｅ、Ｐｅｐｔｏｓｔｒｅｐｔｏｃｏｃｃａｃｅａｅ、Ｓｔａｐｈｙｌｏｃｏｃｃａｃｅａｅ、Ｅｕｂａｃｔｅｒｉａｃｅａｅ、Ｃｏｒｙｎｅｂａｃｔｅｒｉｎｅａｅ、Ｂａｃｔｅｒｏｉｄａｃｅａｅ、Ｆｌａｖｏｂａｃｔｅｒｉｕｍ、Ｃｒｙｏｍｏｏｒｐｈａｃｅａｅ、Ｒｈｏｄｏｂｉａｃｅａｅ、Ｒｈｏｄｏｓｐｉｒｉｌｌａｃｅａｅ、Ａｃｅｔｏｂａｃｔｅｒａｃｅａｅ、Ｓｕｔｔｅｒｅｌｌａｃｅａｅ、Ｎｅｉｓｓｅｒｉａｃｅａｅ、Ｌｅｇｉｏｎｅｌｌａｃｅａｅ、Ｎａｕｔｉｌｉａｃｅａｅ、Ｃａｍｐｙｌｏｂａｃｔｅｒａｃｅａｅ、Ｓｐｉｒｏｃｈａｅｔａｃｅａｅ、Ｍｙｃｏｐｌａｓｍａｔａｃｅａｅ、Ｐｉｓｃｉｒｉｒｉｃｋｅｔｔｓｉａｃｅａｅ、およびＦｒａｎｃｉｓｅｌｌａｃｅａｅを含む科内の属または未分類の属の生物体に由来するものであってよい。

本開示の方法、系、および組成物における使用に適した他の核酸誘導型ヌクレアーゼとしては、例えば、これらに限定されないが、Ｔｈｉｏｍｉｃｒｏｓｐｉｒａｓｐ．ＸＳ５、Ｅｕｂａｃｔｅｒｉｕｍｒｅｃｔａｌｅ、Ｓｕｃｃｉｎｉｖｉｂｒｉｏｄｅｘｔｒｉｎｏｓｏｌｖｅｎｓ、ＣａｎｄｉｄａｔｕｓＭｅｔｈａｎｏｐｌａｓｍａｔｅｒｍｉｔｕｍ、ＣａｎｄｉｄａｔｕｓＭｅｔｈａｎｏｍｅｔｈｙｌｏｐｈｉｌｕｓａｌｖｕｓ、Ｐｏｒｐｈｙｒｏｍｏｎａｓｃｒｅｖｉｏｒｉｃａｎｉｓ、Ｆｌａｖｏｂａｃｔｅｒｉｕｍｂｒａｎｃｈｉｏｐｈｉｌｕｍ、Ａｃｉｄｏｍｏｎｏｃｏｃｃｕｓｓｐ．、ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＣＯＥ１、ＰｒｅｖｏｔｅｌｌａｂｒｅｖｉｓＡＴＣＣ１９１８８、Ｓｍｉｔｈｅｌｌａｓｐ．ＳＣＡＤＣ、Ｍｏｒａｘｅｌｌａｂｏｖｏｃｕｌｉ、Ｓｙｎｅｒｇｉｓｔｅｓｊｏｎｅｓｉｉ、Ｂａｃｔｅｒｏｉｄｅｔｅｓｏｒａｌｔａｘｏｎ２７４、Ｆｒａｎｃｉｓｅｌｌａｔｕｌａｒｅｎｓｉｓ、ＬｅｐｔｏｓｐｉｒａｉｎａｄａｉｓｅｒｏｖａｒＬｙｍｅｓｔｒ．１０、Ａｃｉｄｏｍｏｎｏｃｏｃｃｕｓｓｐ．結晶構造（５Ｂ４３）、Ｓ．ｍｕｔａｎｓ、Ｓ．ａｇａｌａｃｔｉａｅ、Ｓ．ｅｑｕｉｓｉｍｉｌｉｓ、Ｓ．ｓａｎｇｕｉｎｉｓ、Ｓ．ｐｎｅｕｍｏｎｉａ；Ｃ．ｊｅｊｕｎｉ、Ｃ．ｃｏｌｉ；Ｎ．ｓａｌｓｕｇｉｎｉｓ、Ｎ．ｔｅｒｇａｒｃｕｓ；Ｓ．ａｕｒｉｃｕｌａｒｉｓ、Ｓ．ｃａｒｎｏｓｕｓ；Ｎ．ｍｅｎｉｎｇｉｔｉｄｅｓ、Ｎ．ｇｏｎｏｒｒｈｏｅａｅ；Ｌ．ｍｏｎｏｃｙｔｏｇｅｎｅｓ、Ｌ．ｉｖａｎｏｖｉｉ；Ｃ．ｂｏｔｕｌｉｎｕｍ、Ｃ．ｄｉｆｆｉｃｉｌｅ、Ｃ．ｔｅｔａｎｉ、Ｃ．ｓｏｒｄｅｌｌｉｉ；Ｆｒａｎｃｉｓｅｌｌａｔｕｌａｒｅｎｓｉｓ１、Ｐｒｅｖｏｔｅｌｌａａｌｂｅｎｓｉｓ、ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＭＣ２０１７１、Ｂｕｔｙｒｉｖｉｂｒｉｏｐｒｏｔｅｏｃｌａｓｔｉｃｕｓ、ＰｅｒｅｇｒｉｎｉｂａｃｔｅｒｉａｂａｃｔｅｒｉｕｍＧＷ２０１１＿ＧＷＡ２＿３３＿１０、ＰａｒｃｕｂａｃｔｅｒｉａｂａｃｔｅｒｉｕｍＧＷ２０１１＿ＧＷＣ２＿４４＿１７、Ｓｍｉｔｈｅｌｌａｓｐ．ＳＣＡＤＣ、Ａｃｉｄａｍｉｎｏｃｏｃｃｕｓｓｐ．ＢＶ３Ｌ６、ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＭＡ２０２０、ＣａｎｄｉｄａｔｕｓＭｅｔｈａｎｏｐｌａｓｍａｔｅｒｍｉｔｕｍ、Ｅｕｂａｃｔｅｒｉｕｍｅｌｉｇｅｎｓ、Ｍｏｒａｘｅｌｌａｂｏｖｏｃｕｌｉ２３７、Ｌｅｐｔｏｓｐｉｒａｉｎａｄａｉ、ＬａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍＮＤ２００６、Ｐｏｒｐｈｙｒｏｍｏｎａｓｃｒｅｖｉｏｒｉｃａｎｉｓ３、Ｐｒｅｖｏｔｅｌｌａｄｉｓｉｅｎｓ、Ｐｏｒｐｈｙｒｏｍｏｎａｓｍａｃａｃａｅ、Ｃａｔｅｎｉｂａｃｔｅｒｉｕｍｓｐ．ＣＡＧ：２９０、Ｋａｎｄｌｅｒｉａｖｉｔｕｌｉｎａ、ＣｌｏｓｔｒｉｄｉａｌｅｓｂａｃｔｅｒｉｕｍＫＡ００２７４、Ｌａｃｈｎｏｓｐｉｒａｃｅａｅｂａｃｔｅｒｉｕｍ３−２、Ｄｏｒｅａｌｏｎｇｉｃａｔｅｎａ、ＣｏｐｒｏｃｏｃｃｕｓｃａｔｕｓＧＤ／７、ＥｎｔｅｒｏｃｏｃｃｕｓｃｏｌｕｍｂａｅＤＳＭ７３７４、Ｆｒｕｃｔｏｂａｃｉｌｌｕｓｓｐ．ＥＦＢ−Ｎ１、Ｗｅｉｓｓｅｌｌａｈａｌｏｔｏｌｅｒａｎｓ、Ｐｅｄｉｏｃｏｃｃｕｓａｃｉｄｉｌａｃｔｉｃｉ、Ｌａｃｔｏｂａｃｉｌｌｕｓｃｕｒｖａｔｕｓ、Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓ、Ｌａｃｔｏｂａｃｉｌｌｕｓｖｅｒｓｍｏｌｄｅｎｓｉｓ、およびＦｉｌｉｆａｃｔｏｒａｌｏｃｉｓＡＴＣＣ３５８９６などの生物体に由来するものが挙げられる。

本明細書に開示されている方法のいずれかにおいて使用するための適切なヌクレアーゼとしては、これらに限定されないが、表１に列挙されている配列を有するヌクレアーゼ、または表１に列挙されているヌクレアーゼのいずれかに対して少なくとも１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、もしくは９９％の配列同一性を有するホモログが挙げられる。

本明細書に開示されている一部の方法では、アルゴノート（Ａｇｏ）系を使用して標的核酸配列を切断することができる。Ａｇｏタンパク質は、原核生物、真核生物、または古細菌に由来するものであってよい。標的核酸は、ＲＮＡであってもＤＮＡであってもよい。ＤＮＡ標的は、一本鎖であっても二本鎖であってもよい。一部の例では、標的核酸は、プロトスペーサー隣接モチーフまたはプロトスペーサー隣接配列と同等の配列などの特定の標的隣接配列を必要としない。Ａｇｏタンパク質により、二本鎖切断または一本鎖切断を創出することができる。一部の例では、Ａｇｏタンパク質が一本鎖切断を形成する場合、２つのＡｇｏタンパク質を組み合わせて使用して二本鎖切断を生成することができる。一部の例では、Ａｇｏタンパク質は、１つ、２つ、またはそれよりも多くのヌクレアーゼドメインを含む。一部の例では、Ａｇｏタンパク質は、１つ、２つ、またはそれよりも多くの触媒ドメインを含む。Ａｇｏタンパク質の１つまたは複数のヌクレアーゼまたは触媒ドメインを変異させ、それにより、一本鎖切断を生成することができるニッカーゼタンパク質を生成することができる。他の例では、Ａｇｏタンパク質の１つまたは複数のヌクレアーゼまたは触媒ドメインにおける変異により、標的核酸に結合することはできるが、それを切断することはできない触媒として機能しないＡｇｏタンパク質を生成する。

Ａｇｏタンパク質は、ガイドとなる核酸によって標的核酸配列にターゲティングすることができる。多くの例では、ガイドとなる核酸は、ガイドＤＮＡ（ｇＤＮＡ）である。ｇＤＮＡは、５’リン酸化末端を有してよい。ｇＤＮＡは、一本鎖であっても二本鎖であってもよい。一本鎖ｇＤＮＡは、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、または５０ヌクレオチドの長さであってよい。一部の例では、ｇＤＮＡは、１０ヌクレオチド未満の長さであってよい。一部の例では、ｇＤＮＡは、５０ヌクレオチドを超える長さであってよい。

アルゴノート媒介性切断により、平滑末端、５’突出部、または３’突出部が生成し得る。一部の例では、切断の間または切断後に１つまたは複数のヌクレオチドが標的部位から取り除かれる。

アルゴノートタンパク質は、細胞内で内因的にまたは組換えによって発現させることができる。アルゴノートは、染色体上、染色体外に、またはプラスミド、合成染色体、もしくは人工染色体上にコードされるものであってよい。それに加えてまたはその代わりに、アルゴノートタンパク質は、細胞にポリペプチドまたはポリペプチドをコードするｍＲＮＡとしてもたらすまたは送達することができる。そのような例では、ポリペプチドまたはｍＲＮＡを、当技術分野で公知の標準の機構によって、例えば、細胞透過性ペプチド、ナノ粒子、またはウイルス粒子を使用することによって送達することができる。

ガイドＤＮＡは、細胞内の遺伝子またはエピソームＤＮＡによってもたらすことができる。一部の例では、ｇＤＮＡを細胞内のＲＮＡまたはｍＲＮＡから逆転写する。一部の例では、ｇＤＮＡを、Ａｇｏタンパク質を発現する細胞にもたらすまたは送達することができる。ガイドＤＮＡは、Ａｇｏタンパク質と同時にもたらすまたは送達することもでき、逐次的にもたらすまたは送達することもできる。ガイドＤＮＡは、化学的に合成、アセンブル、または、当技術分野で公知の標準のＤＮＡ生成技法を使用して他のやり方で生成することができる。ガイドＤＮＡは、ゲノムＤＮＡ、エピソームＤＮＡ分子、単離された核酸分子、または任意の他の核酸分子の供給源から切断、放出、または他のやり方で得ることができる。

一部の例では、クロマチン−リモデリング酵素と連結した、核酸誘導型ヌクレアーゼ（例えば、Ｃａｓ９、Ｃｐｆ１、ＭＡＤ２、もしくはＭＡＤ７）またはＤＮＡをガイドとするヌクレアーゼ（例えば、Ａｇｏ）などのヌクレアーゼを含む組成物が提供される。理論に束縛されることを望むものではないが、本明細書に記載のヌクレアーゼ融合タンパク質により、高度に構造化されたＤＮＡの領域への接近可能性の改善をもたらすことができる。核酸誘導型ヌクレアーゼに連結することができるクロマチン−リモデリング酵素の非限定的な例としては、ヒストンアセチルトランスフェラーゼ（ＨＡＴ）、ヒストン脱アセチル化酵素（ＨＤＡＣ）、ヒストンメチルトランスフェラーゼ（ＨＭＴ）、クロマチンリモデリング複合体、および転写活性化因子様（Ｔａｌ）エフェクタータンパク質を挙げることができる。ヒストン脱アセチル化酵素としては、ＨＤＡＣ１、ＨＤＡＣ２、ＨＤＡＣ３、ＨＤＡＣ４、ＨＤＡＣ５、ＨＤＡＣ６、ＨＤＡＣ７、ＨＤＡＣ８、ＨＤＡＣ９、ＨＤＡＣ１０、ＨＤＡＣ１１、ｓｉｒｔｕｉｎ１、ｓｉｒｔｕｉｎ２、ｓｉｒｔｕｉｎ３、ｓｉｒｔｕｉｎ４、ｓｉｒｔｕｉｎ５、ｓｉｒｔｕｉｎ６およびｓｉｒｔｕｉｎ７を挙げることができる。ヒストンアセチルトランスフェラーゼとしては、ＧＣＮ５、ＰＣＡＦ、Ｈａｔ１、Ｅｌｐ３、Ｈｐａ２、Ｈｐａ３、ＡＴＦ−２、Ｎｕｔ１、Ｅｓａ１、Ｓａｓ２、Ｓａｓ３、Ｔｉｐ６０、ＭＯＦ、ＭＯＺ、ＭＯＲＦ、ＨＢＯ１、ｐ３００、ＣＢＰ、ＳＲＣ−１、ＡＣＴＲ、ＴＩＦ−２、ＳＲＣ−３、ＴＡＦＩＩ２５０、ＴＦＩＩＩＣ、Ｒｔｔ１０９およびＣＬＯＣＫを挙げることができる。ヒストンメチルトランスフェラーゼとしては、ＡＳＨ１Ｌ、ＤＯＴ１Ｌ、ＥＨＭＴ１、ＥＨＭＴ２、ＥＺＨ１、ＥＺＨ２、ＭＬＬ、ＭＬＬ２、ＭＬＬ３、ＭＬＬ４、ＭＬＬ５、ＮＳＤ１、ＰＲＤＭ２、ＳＥＴ、ＳＥＴＢＰ１、ＳＥＴＤ１Ａ、ＳＥＴＤ１Ｂ、ＳＥＴＤ２、ＳＥＴＤ３、ＳＥＴＤ４、ＳＥＴＤ５、ＳＥＴＤ６、ＳＥＴＤ７、ＳＥＴＤ８、ＳＥＴＤ９、ＳＥＴＤＢ１、ＳＥＴＤＢ２、ＳＥＴＭＡＲ、ＳＭＹＤ１、ＳＭＹＤ２、ＳＭＹＤ３、ＳＭＹＤ４、ＳＭＹＤ５、ＳＵＶ３９Ｈ１、ＳＵＶ３９Ｈ２、ＳＵＶ４２０Ｈ１、およびＳＵＶ４２０Ｈ２を挙げることができる。クロマチン−リモデリング複合体としては、ＳＷＩ／ＳＮＦ、ＩＳＷＩ、ＮｕＲＤ／Ｍｉ−２／ＣＨＤ、ＩＮＯ８０およびＳＷＲ１を挙げることができる。

一部の例では、ヌクレアーゼは、野生型ヌクレアーゼである。他の場合では、ヌクレアーゼは、操作されたキメラヌクレアーゼである。本明細書に開示されている操作されたキメラヌクレアーゼは、１つまたは複数の断片またはドメインを含んでよく、当該断片またはドメインは、核酸誘導型ヌクレアーゼなどのヌクレアーゼ、本明細書に開示されている属、種、または他の系統学的群の生物体のオルソログのものであってよい；断片は異なる種のヌクレアーゼオルソログに由来するものであることが有利である。操作されたキメラヌクレアーゼは、少なくとも２種の異なるヌクレアーゼに由来する断片またはドメインで構成されるものであってよい。操作されたキメラヌクレアーゼは、少なくとも２つの異なる種に由来する断片またはドメインで構成されるものであってよい。操作されたキメラヌクレアーゼは、少なくとも２種、３種、４種、５種、６種、７種、８種、９種、１０種、またはそれよりも多くの異なるヌクレアーゼまたは異なる種に由来する断片またはドメインで構成されるものであってよい。一部の場合では、１種のヌクレアーゼまたは種に由来する１つよりも多くの断片またはドメイン、ここで、１つよりも多くの断片またはドメインは、第２のヌクレアーゼまたは種に由来する断片またはドメインによって分離している。一部の例では、操作されたキメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する２つの断片を含む。一部の例では、操作されたキメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する３つの断片を含む。一部の例では、操作されたキメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する４つの断片を含む。一部の例では、操作されたキメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する５つの断片を含む。

ヌクレアーゼ融合タンパク質を細胞内で組換えによって発現させることができる。ヌクレアーゼ融合タンパク質は、染色体上、染色体外に、またはプラスミド、合成染色体、もしくは人工染色体上にコードされるものであってよい。ヌクレアーゼおよびクロマチン−リモデリング酵素を別々に操作し、次いで、共有結合により連結した後、細胞に送達することができる。ヌクレアーゼ融合タンパク質は、細胞にポリペプチドまたはポリペプチドをコードするｍＲＮＡとしてもたらすまたは送達することができる。そのような例では、ポリペプチドまたはｍＲＮＡを、当技術分野で公知の標準の機構によって、例えば、細胞透過性ペプチド、ナノ粒子、またはウイルス粒子を使用することによって送達することができる。
ターゲティングされたヌクレアーゼの細胞周期依存性発現

一部の例では、細胞周期依存性ヌクレアーゼを含む組成物が提供される。細胞周期依存性ヌクレアーゼは、一般に、細胞周期のＧ１期に、ターゲティングされたヌクレアーゼの分解、および、細胞周期のＧ２／Ｍ期に、ターゲティングされたヌクレアーゼの発現を導く酵素と連結した、本明細書に記載のターゲティングされたヌクレアーゼを含む。そのような細胞周期依存性発現により、例えば、相同組換え修復（ＨＤＲ）が最も活性である（例えば、Ｇ２／Ｍ期の）細胞におけるヌクレアーゼの発現が偏り得る。一部の場合では、ヌクレアーゼを、細胞周期のＧ１期に活発に分解され、細胞周期のＧ２／Ｍ期に活発に発現するものなどの、細胞周期調節タンパク質と共有結合させる。非限定的な例では、細胞周期調節タンパク質は、ジェミニン（Ｇｅｍｉｎｉｎ）である。細胞周期調節タンパク質の他の非限定的な例としては、サイクリンＡ、サイクリンＢ、Ｈｓｌｌ、Ｃｄｃ６、Ｆｉｎｌ、ｐ２１およびＳｋｐ２を挙げることができる。

一部の例では、ヌクレアーゼは、野生型ヌクレアーゼである。

他の場合では、ヌクレアーゼは、操作されたヌクレアーゼである。操作されたヌクレアーゼは、天然に存在しないものであってよい。

天然に存在しないターゲティング可能なヌクレアーゼおよび天然に存在しないターゲティング可能なヌクレアーゼ系は、これらの難題および限定の多くに対処することができる。

天然に存在しないターゲティング可能なヌクレアーゼ系が本明細書に開示される。そのようなターゲティング可能なヌクレアーゼ系は、上記の難題の１つまたは複数に取り組むために操作され、操作されたヌクレアーゼ系と称することができる。操作されたヌクレアーゼ系は、操作された核酸誘導型ヌクレアーゼなどの操作されたヌクレアーゼ、操作されたガイド核酸、前記ヌクレアーゼをコードする操作されたポリヌクレオチド、または前記ガイド核酸をコードする操作されたポリヌクレオチドなどの１つまたは複数を含み得る。操作されたヌクレアーゼ、操作されたガイド核酸、および操作されたヌクレアーゼまたは操作されたガイド核酸をコードする操作されたポリヌクレオチドは、天然には存在せず、天然には見出されない。これらのエレメントの１つまたは複数を含む操作されたヌクレアーゼ系は天然に存在しないということになる。

天然に存在しないヌクレアーゼ系を得るために行うことができる操作の型の非限定的な例は以下の通りである。操作は、異種宿主細胞などの宿主細胞における発現を容易にするまたは発現を改善するためのコドン最適化を含み得る。発現または送達を容易にするために、操作によりヌクレアーゼのサイズまたは分子量を低減することができる。ＰＡＭ特異性を変化させるためまたは認識されるＰＡＭの範囲を広げるために、操作によりＰＡＭ選択を変化させることができる。操作により、ターゲティング可能なヌクレアーゼ系の安定性、処理能力、特異性、または効率を変化させる、増大させる、または低減することができる。操作により、タンパク質安定性を変化させる、増大させる、または低減することができる。操作により、核酸スキャニングの処理能力を変化させる、増大させる、または低減することができる。操作により、標的配列特異性を変化させる、増大させる、または低減することができる。操作により、ヌクレアーゼ活性を変化させる、増大させる、または低減することができる。操作により、編集効率を変化させる、増大させる、または低減することができる。操作により、形質転換効率を変化させる、増大させる、または低減することができる。操作により、ヌクレアーゼまたはガイド核酸の発現を変化させる、増大させる、または低減することができる。

本明細書に開示されている天然に存在しない核酸配列の例としては、Ｅ．ｃｏｌｉなどの細菌における発現についてコドン最適化された配列（例えば、配列番号４１〜６０）、酵母などの単細胞真核生物における発現についてコドン最適化された配列（例えば、配列番号１２７〜１４６）、ヒト細胞などの多細胞真核生物における発現についてコドン最適化された配列（例えば、配列番号１４７〜１６６）、本明細書に開示されている任意の配列のクローニングもしくは発現のために使用されるポリヌクレオチド（例えば、配列番号６１〜８０）、異種プロモーターもしくは核局在化シグナルもしくは他の異種エレメントに作動可能に連結した、核酸配列を含むプラスミド（例えば、配列番号２１〜４０）、操作されたもしくはコドン最適化された核酸配列から生成されるタンパク質（例えば、配列番号１〜２０）、または配列番号８４〜１０７のうちのいずれか１つを含む操作されたガイド核酸が挙げられる。そのような天然に存在しない核酸配列は、合成オリゴヌクレオチドまたはｄＮＴＰから増幅させる、クローニングする、アセンブルする、合成する、生成すること、または当業者に公知の方法を使用して他のやり方で得ることができる。

本明細書に開示されている天然に存在しない核酸配列のさらなる例としては、Ｅ．ｃｏｌｉなどの細菌における発現についてコドン最適化された配列（例えば、配列番号１６８）、酵母などの単細胞真核生物における発現についてコドン最適化された配列（例えば、配列番号１６９）、ヒト細胞などの多細胞真核生物における発現についてコドン最適化された配列（例えば、配列番号１７０）、本明細書に開示されている任意の配列のクローニングもしくは発現のために使用されるポリヌクレオチド（例えば、配列番号１７１）、異種プロモーターもしくは核局在化シグナルもしくは他の異種エレメントに作動可能に連結した、核酸配列を含むプラスミド（例えば、配列番号１６７）、操作されたもしくはコドン最適化された核酸配列から生成されるタンパク質（例えば、配列番号１０８〜１１０）、または本明細書に開示されている任意のターゲティング可能なヌクレアーゼに適合する操作されたガイド核酸が挙げられる。そのような天然に存在しない核酸配列は、合成オリゴヌクレオチドまたはｄＮＴＰから増幅させる、クローニングする、アセンブルする、合成する、生成すること、または当業者に公知の方法を使用して他のやり方で得ることができる。

ガイド核酸は、ＤＮＡであってよい。ガイド核酸は、ＲＮＡであってよい。ガイド核酸は、ＤＮＡとＲＮＡの両方を含み得る。ガイド核酸は、改変されたまたは天然に存在しないヌクレオチドを含み得る。ガイド核酸がＲＮＡを含む場合では、ＲＮＡガイド核酸は、本明細書に開示されているプラスミド、直鎖状構築物、または編集カセットなどのポリヌクレオチド分子上のＤＮＡ配列によりコードされるものであってよい。

核酸誘導型ヌクレアーゼは、ヌクレアーゼが内在する宿主内には見出されないガイド核酸に適合し得る。そのような直交性のガイド核酸は、経験的試験によって決定することができる。直交性のガイド核酸は、異なる細菌種に由来するものであってよくまたは合成されたもしくは他のやり方で操作されて天然に存在しないものであってよい。

共通する核酸誘導型ヌクレアーゼに適合する直交性のガイド核酸は、１つまたは複数の共通する特徴を含み得る。共通する特徴は、シュードノット領域の外側の配列を含み得る。共通する特徴は、シュードノット領域を含み得る（例えば、１７２〜１８１）。共通する特徴は、一次配列または二次構造を含み得る。

ガイド核酸は、ガイド配列を、ガイド配列が標的配列と相補的であり、それにより、ガイド配列と標的配列のハイブリダイゼーションが可能になるように変化させることにより、所望の標的配列を標的とするように操作することができる。操作されたガイド配列を有するガイド核酸は、操作されたガイド核酸と称することができる。操作されたガイド核酸は、多くの場合、天然に存在せず、天然には見出されない。

他の例では、ヌクレアーゼは、キメラヌクレアーゼである。キメラヌクレアーゼは、操作されたヌクレアーゼであってよい。本明細書に開示されているキメラヌクレアーゼは、１つまたは複数の断片またはドメインを含んでよく、当該断片またはドメインは、核酸誘導型ヌクレアーゼなどのヌクレアーゼ、属、種、または他の系統学的群の生物体のオルソログのものであってよい；断片は異なる種のヌクレアーゼオルソログに由来するものであることが有利である。キメラヌクレアーゼは、少なくとも２種の異なるヌクレアーゼに由来する断片またはドメインで構成され得る。キメラヌクレアーゼは、少なくとも２つの異なる種に由来する断片またはドメインで構成され得る。キメラヌクレアーゼは、少なくとも２種、３種、４種、５種、６種、７種、８種、９種、１０種、またはそれよりも多くの異なるヌクレアーゼまたは異なる種に由来する断片またはドメインで構成され得る。一部の場合では、１種のヌクレアーゼまたは種に由来する１つよりも多くの断片またはドメイン、ここで、１つよりも多くの断片またはドメインは、第２のヌクレアーゼまたは種に由来する断片またはドメインによって分離している。一部の例では、キメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する２つの断片を含む。一部の例では、キメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する３つの断片を含む。一部の例では、キメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する４つの断片を含む。一部の例では、キメラヌクレアーゼは、それぞれが異なるタンパク質またはヌクレアーゼに由来する５つの断片を含む。

（実施例１）
ＣＲＥＡＴＥ−プラスミドおよびライブラリー
図１Ａ〜Ｃは、ＣＲＩＳＰＲＥｎＡｂｌｅｄＴｒａｃｋａｂｌｅｇｅｎｏｍｅＥｎｇｉｎｅｅｒｉｎｇ（ＣＲＥＡＴＥ）設計およびワークフローの概要の例を示す。図１Ａは、プログラムによるゲノム改変の焦点をゲノム全体にわたって重要なアミノ酸残基またはプロモーターを標的にすることを可能にするＣＲＥＡＴＥ方法論の例を示す。したがって、そのようなライブラリーにより、多種多様なゲノム標的の配列／活性関係を並行して系統的に評価することが可能になる。図１Ｂは、Ｅ．ｃｏｌｉゲノムにおける特定の遺伝子座を標的とするために、ホモロジーアーム（ＨＡ）およびガイドＲＮＡ（ｇＲＮＡ）配列の両方をコードするように設計したＣＲＥＡＴＥカセットの例を示す。同義のＰＡＭ変異によって選択的に濃縮して、配列をＣａｓ９による切断からレスキューし、高度に効率的な変異誘発を可能にすることができる特定のコドン変異（標的コドン）を導入するために、１００ｂｐのホモロジーアームを設計した。Ｐ１およびＰ２部位（黒色）は、多くのライブラリーの多重化増幅、クローニングおよび配列決定を並行して行うことを可能にする一般的なプライミング部位としての機能を果たす。プロモーター（Ｊ２３１１９、緑色）は、ｇＲＮＡの発現を駆動する構成的プロモーターである。ｇａｌＫ遺伝子座内の残基１４５に終止コドンを導入するためのＨＡ設計の詳細な例も図１Ｂの下部に示されている。上の配列は野生型ゲノム配列を示し、ＰＡＭ（ＣＣＧ；その逆相補物はＣＧＧであり、これは、Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９によって認識される）および標的コドン（ＴＡＴ、Ｙをコードする）が強調表示されている。ＨＡ設計により、ＰＡＭ部位（ＣｇＧ、その逆相補物はＣＣＧであり、これは、Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９によって認識されない）に「サイレントスカー（ｓｉｌｅｎｔｓｃａｒ）」が導入され、コドン１４５に一ヌクレオチドＴＡＴ＞ＴＡＡ変異が導入される（ＳＴＯＰがもたらされる）。この設計戦略を、ゲノム全体にわたってコード領域に対してプログラムにより実行した。図１Ｃは、ＣＲＥＡＴＥワークフローの例の概要を示す。ＣＲＥＡＴＥカセットを、大きなオリゴプール（個々のライブラリーメンバー１０^４〜１０^６種）として送達されるマイクロアレイ上に合成する。並行クローニングおよびリコンビニアリングにより、一部の場合では、２３日でこれらのプールをゲノムライブラリーに加工することが可能になった。変異体ライブラリーの選択またはスクリーニング後に、ＣＲＥＡＴＥプラスミドのディープシーケンシングを使用して、何千もの高精度の全ゲノム変異の適応度を追跡することができる。
（実施例２）
ＣＲＥＡＴＥプラスミドの検証

図２Ａ〜Ｄは、形質転換および編集効率に対するＣａｓ９活性の影響の例を示す。ｇａｌＫ遺伝子のコドン１４５を標的とするｇａｌＫ１２０／１７ＣＲＥＡＴＥカセット（１２０ｂｐのＨＡおよび１７ｂｐのＰＡＭ／コドン間隔）または対照非標的化ｇＲＮＡベクターを、ｄＣａｓ９（例えば、図２Ａの左側の棒のセット）またはＣａｓ９（例えば、図２Ａの右側の棒のセット）プラスミドと一緒にｐＳＩＭ５を有する細胞に入れて形質転換した。ｐＳＩＭ５プラスミドは、ラムダレッド組換え機構を有する。アラビノースの添加によって切断活性の制御を可能にするために、ｃａｓ９遺伝子をｐＢＡＤプロモーターの制御下でｐＢＴＢＸ−２骨格にクローニングした。各ベクターの形質転換効率が濃い灰色の棒で示されている。組換え細胞の総数（薄い灰色の棒）を、マッコンキー寒天上での赤色／白色コロニースクリーニングに基づいて算出した。プレートに基づくスクリーニングにより白色コロニーが検出不可能であった場合、編集効率を１０^４と仮定した。Ｃａｓ９バックグラウンドに入れて形質転換したＣＲＥＡＴＥカセットについては、非標的化ｇＲＮＡ対照と比較して、形質転換効率の１０^２分の１の低下も観察された。

図２Ｂは、編集効率に対するＣＲＥＡＴＥカセットＨＡの長さおよびＰＡＭ／コドン間隔の特徴付けの例を示す。全てのカセットを、ＰＡＭを、標的コドンおよび可変性のホモロジーアームの長さ（ＨＡ、底部）からの示されている距離（ＰＡＭ／コドン、下部）で使用し、遺伝子内のコドン１４５にＴＡＡ停止が導入されるように設計した。濃い灰色および薄い灰色の棒は、ｐＢＡＤプロモーターの下、０．２％アラビノースを使用したＣａｓ９の非誘導性または誘導性発現に対応する。大多数の場合、編集効率は、誘導による影響を受けないと思われ、これにより、漏出性（ｌｅａｋｙ）発現に起因する少量のＣａｓ９が高効率の編集のために十分であることが示唆される。

図２Ｃは、ＣＲＥＡＴＥリコンビニアリング反応からのゲノム遺伝子座の配列決定からのデータの例を示す。図２ＢのｇａｌＫカセットをＨＡの長さおよびＰＡＭコドン間隔に応じて標識する。示されている他の遺伝子座は、多重化ライブラリークローニング反応から単離されたカセットであった。棒グラフ（図２Ｃ）は、各ＣＲＥＡＴＥカセットを用いたリコンビニアリング後のゲノムコロニー配列決定によって各遺伝子型が観察された回数を示す。下部の＋および標識は、各クローンにおける、２つの関連する部位における設計された変異の有無を示す。円形の挿入図は、Ｅ．ｃｏｌｉゲノム上の各遺伝子の相対的な位置を示す。

図２Ｄは、ＣＲＥＡＴＥプラスミドの多重化クローニングからのライブラリーカバレッジの例を示す。各バリアントのディープシーケンシング計数がそれらのゲノム上の位置に対して示されている。挿入図は、ライブラリー全体についてのこれらのプラスミド計数のヒストグラムを示す。分布は、低平均計数に関して予測されるポアソン分布に従う。
（実施例３）
追跡可能なエピソームＤＮＡライブラリーを操作するために使用されるＣＲＥＡＴＥ−レコーディング

図３Ａは、追跡可能なエピソームＤＮＡライブラリーを生成するために使用される方法の概要の例を示す。ＣＲＥＡＴＥレコーダープラスミドによる形質転換により、標的ＤＮＡの改変が２つの部位で生成される。１つの編集は、所望の標的遺伝子（灰色）に生じ、特定の操作の目的を試験するために設計されたコドンまたはプロモーター変異が導入される。第２の編集は、機能的に中性の部位を標的とし、１５ヌクレオチドのバーコード（ＢＣ、黒色）を導入する。これらのライブラリーを単一のＣＲＥＡＴＥプラスミド上にカップリングすることにより、標的ＤＮＡが両方の部位において編集され、各独特のバーコードを使用して、プラスミドの残り全体を通して編集を追跡することができる。

図２Ｂは、ＣＲＥＡＴＥバーコード設計の例を示す。重複するオリゴから縮重ライブラリーを構築し、ＣＲＥＡＴＥベクターの別々の部位にクローニングして、デザイナー編集ライブラリーにカップリングすることができるＣＲＥＡＴＥレコーダーカセットのライブラリーを作出する。

図２Ｃは、例示的なＣＲＥＡＴＥ記録マッピング戦略を示す。標的ＤＮＡ（左側）およびＣＲＥＡＴＥプラスミドの両方のディープシーケンシングにより、各編集カセットをバーコード配列によって一意的に割り当てることが可能になることによって単純な配列マッピング戦略が可能になる。これは、各バーコード（したがって、編集）の相対的な適応度を選択またはスクリーニングプロセス中に追跡することを可能にし、また、標準のベクターを使用して異なる生物体間でシャトルすることができる。
（実施例４）
エピソームＤＮＡのＣＲＥＡＴＥ媒介性編集

本明細書に開示されている方法および組成物を使用して、ＣＲＥＡＴＥプロセスに使用されるｃａｓ９遺伝子の重要な残基を変異させた（例えば、図４Ａ〜４Ｂ）。Ｃａｓ９タンパク質にＲ１３３５Ｋ変異が生じるようにカセットを設計した。このカセットをＣＲＥＡＴＥプラスミドにクローニングし、ｐＳＩＭ５およびＸ２−Ｃａｓ９ベクターを有するＭＧ１６５５Ｅ．ｃｏｌｉに入れて形質転換した。ｐＳＩＭ５ベクターは、ラムダレッド組換え機構を含む。Ｘ２−Ｃａｓ９ベクターは、アラビノース誘導性Ｃａｓ９発現カセットを含む。Ｃａｓ９発現を誘導するために０．４％アラビノースを補充したＬＢ中に３時間回収した後、細胞をＸ２−Ｃａｓ９およびＣＲＥＡＴＥプラスミドの両方の複製に対する選択圧を維持する抗生物質を含有する寒天上にプレーティングした。ランダムなクローンのコロニーＰＣＲにより、ＣＲＥＡＴＥプラスミドに由来する設計された編集がＸ２−Ｃａｓ９プラスミドに効率的に移入されたことが明らかになった（例えば、図４Ｂ）。配列決定したクローンのうち、１００％がＸ２Ｃａｓ９にサイレントＰＡＭ変異を含有し、６／１４（４３％）は所望のコーディング編集も含有した。これは、ＣＲＥＡＴＥを使用するプラスミドに基づく編集が、以前のゲノム操作の試みと比較して、プラスミド標的により高いコピー数が付随したにもかかわらず、頑強なものであることの最初の実証である。
（実施例５）
Ｅ．ｃｏｌｉゲノムのＣＲＥＡＴＥ媒介性編集および追跡−二重のカセット

ゲノムとの関連での記録戦略の性能を試験するために、Ｅ．ｃｏｌｉゲノムにおける２つの遠位のゲノム遺伝子座を編集する能力を試験した（例えば、図５Ａ）。これを行うために、１５ヌクレオチドのバーコードがｇａｌＫ遺伝子座に埋め込まれるように設計したＣＲＥＡＴＥレコーディングカセットライブラリーをクローニングした。クローニング後、数種の独特のバーコードを単離し、抗生物質トリメトプリムに対する耐性を付与することが本発明者らの以前のＣＲＥＡＴＥ試験によって同定されたＦ１５３Ｒ変異がジヒドロ葉酸レダクターゼ（ＤＨＦＲ）／ｆｏｌＡ遺伝子に組み入れられるように設計した第２の編集カセットをクローニングした。以前に記載されたプロトコールに従った、二重ＣＲＥＡＴＥレコーディングベクターの形質転換後のＥ．ｃｏｌｉ株の遺伝子型決定により、図５Ａのデータがもたらされた。バーコーディングの効率（１００％）は、標的ゲノム編集（８０〜９０％）よりも高く、これにより、編集されたゲノムを追跡できることが保証される。赤色・白色コロニースクリーニングによって決定したところ、観察された形質転換された集団のうち、コロニーの＞８０％が、ｇａｌＫ遺伝子座にバーコード編集を含有した（例えば、図５Ｂ）。バーコードが付されたコロニーから、コロニーの８５％でＤＨＦＲＦ１５３Ｒ変異もコードされることが見出され、これにより、バーコードとコドン編集の間の強力な追跡が得られたことが示される。図５Ｂは、２連の実験における、編集され、かつ／またはバーコードが付されたコロニーの総数（ＣＦＵ）を示す。編集されたＣＦＵ数は、図５Ａのデータをプレート上のＣＦＵの総数に外挿することによって算出した。バーコードが付されたＣＦＵ数は、ｇａｌＫスクリーニングにおいて白色コロニーの数を計数することによって算出した（バーコードが組み込まれた部位）。これらのデータから、バーコードが付されたコロニーの大多数が、設計されたゲノム編集を含有したことが示される。
（実施例６）
コンビナトリアル操作のためのプラスミドキュアリング

図６は、コンビナトリアルなゲノム操作および追跡の例を示す。３種の反復的ＣＲＥＡＴＥプラスミドを使用し、そのそれぞれが、このシリーズの他のマーカーのうちの１種を標的とするｇＲＮＡを有する（Ｔの線によって示される）。各形質転換の間に、編集およびバーコードがゲノムに組み入れられ、前のＣＲＥＡＴＥプラスミドがキュアリングされる。このように迅速な繰り返し形質転換を実施して、改善された表現型を検索するための、変異の定義された組合せまたはコンビナトリアルライブラリーのいずれかを構築することができる。レコーディング部位は、集団にわたって組合せの適応度を追跡することを可能にするショートリード配列決定技術と適合する。そのような手法により、遺伝子エピスタシスの迅速な調査および基礎研究に関連するまたは商業的な生物学的適用のための表現型の最適化が可能になる。

図３Ｄおよび図３Ｅは、コンビナトリアルなゲノム操作の別の例を示す。操作の各ラウンドにより、編集カセット（図３Ｄの青色の長方形）をゲノム内の標的配列（青色の星印）に組み入れ、レコーダーカセット（図３Ｄの緑色の長方形）をゲノムの異なる標的配列（図３Ｄの中央のパネル中の緑色のダッシュ）に組み入れる。本実施例では、各レコーダー配列は、１５ヌクレオチドのバーコードを含む。図３Ｄの右側のパネルに示されている通り、編集カセットを挿入する場所にかかわらず、レコーダー配列をそれぞれ最後のレコーダー配列に隣接させて挿入する。各レコーダーカセットにより、ＰＡＭ部位を同時に欠失させることができる。操作の各ラウンドの完了後、操作された細胞を選択することができ、次いで、挿入されたレコーダーカセットの全てを含むレコーダー領域について配列決定することにより、挿入された変異を追跡することができる。出発プラスミドライブラリーについて配列決定することにより、各編集カセットをレコーダーカセット内の１つまたは複数の独特のバーコードと連結するまたはそれに付随させることができる。各レコーダーカセットは付随する編集カセットに対応するので、次いで、編集カセットによって組み入れられた変異をレコーダーカセットの配列、またはレコーダーカセット内のバーコードの配列によって追跡または同定することができる。図３Ｅにおいて実証されている通り、レコーダーカセットまたはレコーダーカセット内のバーコードの全てについて配列決定することにより、挿入された変異のそれぞれを同定し、追跡することができる。挿入されたレコーダー配列は、レコーダー部位、レコーダーアレイ、またはバーコードアレイと称することができる。結果として、操作の反復的ラウンドの後、バーコードアレイまたはレコーダー部位について配列決定することにより、当該株におけるゲノム編集事象の履歴を追跡することが可能になる。レコーダーカセットを例えば図３Ｄに示されている順序で挿入する場合、バーコードアレイまたはレコーダー部位により、変異が挿入された順序ならびに変異がどのようなものであるかを同定することができる。
（実施例７）
繰り返しＣＲＥＡＴＥ−レコーディング操作事象を使用した反復的操作

図７Ａに示されている反復的操作の例をプラスミドキュアリングに使用して、前のベクターの排除に関して当該設計が非常に効率的であることを実証した（図７Ｂ）。各ＣＲＥＡＴＥプラスミドは、示されている抗生物質（Ｔｒｉｍｅｔｈ：トリメトプリム、Ｃａｒｂ：カルベニシリン、Ｔｅｔ：テトラサイクリン）に基づいて正に選択することができ、かつ、他の抗生物質マーカーのうちの１種を標的とするｇＲＮＡを含有する。例えば、ｒｅＣＲＥＡＴＥ１プラスミドは、カルベニシリンに関して選択することができ、かつ、破壊のためにトリメトプリム抵抗性遺伝子を選択的に標的とするｇＲＮＡをコードする。一連のｃａｒｂ／テトラサイクリン／トリメトプリム抗生物質マーカーを通過するものには、最大で３つの標的化編集を選択的に組み入れることが可能である。レコーディング機能は、図５に例示されている通り実行されるが、本明細書では簡単にするために省略する。

図７Ｂは、ＣＲＥＡＴＥ操作の繰り返しラウンドからのデータの例を示す。段階的な一連の形質転換を、Ｘ２ｃａｓ９（ｋａｎ）およびｒｅＣＲＥＡＴＥ１ベクターで形質転換された細胞を用いて開始した。スポットプレーティングの結果から、キュアリングが各形質転換ステップにおいて９９．９９％有効であることが示され、これにより、形質転換の各ラウンドにおける高度に効率的な操作が保証される。各形質転換ステップにおける効率の高い同時のゲノム編集およびプラスミドキュアリングは、本明細書に開示されている反復的ベクターに必要なレコーディングおよび編集ＣＲＥＡＴＥカセットを導入することによって実現された（例えば、図７Ｂ）。
（実施例８）
ＣＲＥＡＴＥ設計およびワークフロー

ＣＲＩＳＰＲＥｎＡｂｌｅｄＴｒａｃｋａｂｌｅｇｅｎｏｍｅＥｎｇｉｎｅｅｒｉｎｇ（ＣＲＥＡＴＥ）設計ワークフローの概要の例を図８Ａ〜８Ｂに示す。図８Ａは、タンパク質操作のために設計されたＣＲＥＡＴＥカセットの解剖学的構造の例を示す。カセットは、スペーサー（赤色）を、ガイドＲＮＡ（ｇＲＮＡ）配列の一部およびゲノムの切断部位における相同組換えを鋳型にし得るデザイナーホモロジーアーム（ＨＡ）と共にコードする。タンパク質操作の目的に関して、ＨＡを、変異を指定のコドンまたは標的部位（ＴＳ、青色）に、配列をＣａｓ９による切断からレスキューし、高度に効率的な変異誘発を可能にするために、同義のＰＡＭ変異（ＳＰＭ、赤色）の近傍に、系統的にカップリングするように設計する。プライミング部位（Ｐ１およびＰ２、黒色）を、大規模並列処理のアレイに基づく合成に由来する特定のサブプールの多重化増幅およびクローニングが可能になるように設計する。構成的プロモーター（緑色）は、ｇＲＮＡの発現を駆動する。図８Ａは、ｇａｌＫ遺伝子座内の残基１４５に終止コドンを導入するためのＨＡ設計の詳細な例をさらに示す。上の配列はｗｔゲノムを示し、ＰＡＭおよびＴＳコドンが強調表示されている。翻訳配列は、得られる変異体が標的部位に単一の非同義の変異を含有することを例示するために示されている。図８Ｂは、ＣＲＥＡＴＥワークフローの概要の例を示す。ＣＲＥＡＴＥオリゴをマイクロアレイ上に合成し、大きなプール（１０^４〜１０^６種の個々のライブラリーメンバー）として送達する。これらのカセットを増幅し多重にクローニングし、これで設計をサブプールすることができる。Ｃａｓ９を発現する細胞にＣＲＥＡＴＥプラスミドが導入された後、変異がゲノムに高効率で移行する。ディープシーケンシングによる選択前の各プラスミドの頻度（ｆｉ、ｔ１）および選択後の各プラスミドの頻度（ｆｉ、ｔ２）の測定により、各ＣＲＥＡＴＥカセットについての濃縮スコア（Ｅｉ）がもたらされる。これらのスコアにより、適応するバリアントを、最大一ヌクレオチドまたはアミノ酸の分解能で、何千もの遺伝子座について並行して迅速に同定することが可能になる。
（実施例９）
ＣＲＥＡＴＥ設計の検証

図９Ａは、スペーサーおよびｇａｌＫ（ｇａｌＫ＿Ｙ１４５＊＿１２０／１７）にターゲティングされる１２０ｂｐのＨＡを有するカセットを使用して測定した、形質転換および編集効率に対するＣａｓ９活性の影響の例を示す。このＣＲＥＡＴＥベクターによって生じる総形質転換体（ＴＴ、白色）が白色で示されており、組換え体の総数（ＴＲ）が濃い青色で示されている。ＴＲは、編集効率とＴｔの積として算出される。アスタリスクは、プレートに基づくスクリーニングによって組換え体を観察することができなかった実験を示す。図９Ｂは、編集効率に対するＣＲＥＡＴＥカセットＨＡの長さおよびＰＡＭ／コドン間隔の特徴付けの例を示す。全てのカセットを、ＰＡＭを、標的コドンおよび可変性のホモロジーアームの長さ（ＨＡ、底部）からの示されている距離（ＰＡＭ／コドン、下部）で使用し、遺伝子内のコドン１４５にＴＡＡ停止が導入されるように設計した。白色および青色の棒は、ｐＢＡＤプロモーターの下、０．２％アラビノースを使用したＣａｓ９の非誘導性または誘導性発現に対応する。大多数の場合、編集効率は、誘導による影響を受けないと思われ、これにより、漏出性発現に起因する少量のＣａｓ９が高効率の編集のために十分であることが示唆される。図９Ｃは、ゲノム遺伝子座について配列決定することによるオリゴ由来のカセットについての編集効率の決定の例を示す。参照として図９Ａおよび９ＢのｇａｌＫ＿Ｙ１４５＊＿１２０／１７カセットが白色で示されている。棒グラフは、各ＣＲＥＡＴＥカセットを用いたリコンビニアリング後のゲノムコロニー配列決定によって各遺伝子型が観察された回数を示す。円形の挿入図は、Ｅ．ｃｏｌｉゲノム上の各遺伝子の相対的な位置を示す。図９Ｄは、ＳＰＭとＴＳの距離（図８Ａにおいて例証されている）が編集効率（正確な編集／サンプリングされた総配列）と強力に相関することを示す。図９Ｂの４４ｂｐのｇａｌＫカセットおよび５９ｂｐのｇａｌＫカセットはこの分析では省略した。示されているエラーバーは、示されている実験のＮ＝３の独立した反復実験から導かれたものである。
（実施例１０）
必須の染色体遺伝子のスキャニング飽和変異誘発

図１０Ａ〜１０Ｃは、ＣＲＥＡＴＥを使用して、ＴＭＰへの抵抗性を付与することができる変異を同定するためのｆｏｌＡ遺伝子の完全なスキャニング飽和変異誘発ライブラリーを生成した例を示す。２回の選択試験からの計数重み付けされた平均濃縮スコアが残基の関数としてプロットされている（右側）。非同義の変異をコードするカセットが灰色で示されており、同義の変異をコードするカセットが黒色で示されている。濃縮スコアが１．８よりも大きいカセットが赤色で強調表示されており、以前報告された部位に影響を及ぼす変異が参照のために標識されている。破線は、濃縮値を示し、これは、信頼区間のブートストラッピングによって決定される通り、同義のデータセットとは有意に異なる（ｐ＜０．０５）。これらの値が参照のためにヒストグラムとして示されている（中央）。ＤＨＦＲ抵抗性に有意に影響を及ぼすと思われる変異が右端で赤色の球体として強調表示されている。図１０Ｄ〜１０Ｆは、示されているＴＭＰ濃度の範囲（右側に示されている）でのｗｔ（左側）Ｆ１５３Ｗ（中央）およびＦ１５３Ｒ（右側）バリアントの成長分析の例を示す。
（実施例１１）
熱耐性遺伝子型のＡＬＥ変異セットおよびフォワード操作の再構築

図１１Ａは、４２．２℃、最小培地条件で成長するＣＲＥＡＴＥライブラリーについての濃縮スコアのゲノムプロットの例を示す。最も内側のプロットは、上位２０種の代表についての、標識を用いた選択前のプラスミドライブラリーの計数を例示する。外側の円は、最小培地中、高温（４２．２℃）で成長させた後のプールされたライブラリーバリアントの適応度を示す。棒には、ｌｏｇ２濃縮に応じて色が付されている。青色の棒は、有害な変異を表し、赤色の棒は、有意に濃縮された変異を表し、灰色の棒は、このアッセイでは中性だと思われる変異を示す。２０種の最も濃縮されたバリアントが参照のために標識されており、ＡＬＥ由来のバリアントに対応する標識は赤色である。図１１Ｂは、４２．２℃の成長条件下における、全てのライブラリーバリアント（灰色）、ＡＬＥ由来の変異体（赤色）および同義の変異体（黒色）の濃縮スコアのヒストグラムを示す。灰色の破線は、同義の集団と比較した有意な濃縮スコアを示す。ヒストグラムは、計数閾値（括弧内に示されている数字）を通るバリアントの総数の割合として正規化されている。この実験によってサンプリングされた独特の非同義ＡＬＥカセット２５１種のうち２３１種が、有意な成長利益をもたらすと思われることに留意されたい。図１１Ｃは、変異の濃縮をｗｔからの変異距離に基づいて示す。２および３ヌクレオチド（ｎｔ）転移が必要な変異は、ＡＬＥ手法では極めて稀であるまたは存在しないが、プールされたライブラリー選択（Ｃｒｐ調節因子を標的とする）による２種の最も濃縮されたクローンが２ヌクレオチド置換を必要とすることに注目し、右端に強調表示した。
（実施例１２）
抗生物質抵抗性および耐性の試験のためのアミノ酸置換のゲノム規模マッピング

図１２Ａは、エリスロマイシンの存在下（外側）およびリファンピシンの存在下（中央）でのライブラリーバリアントの濃縮（ｌｏｇ２）のゲノムプロットの例を示す。最内側のプロットは、参照のためにインプットプラスミドの計数分布を例示する。クローニングおよび標識は図１１Ａ〜１１Ｃの通りである。図１２Ｂは、個々のアミノ酸レベルでのＣＲＥＡＴＥ変異マッピングを示す。ＲＮＡポリメラーゼβサブユニット（ｒｐｏＢ）のアミノ酸Ｉ５７２、Ｓ５３１およびＬ５３３（赤色）にかさのある側鎖を導入するＣＲＥＡＴＥカセットは、全ゲノムを標的とするライブラリーからのリファンピシンの存在下で高度に濃縮される。図１１Ｃは、参照として示されているその同族ＤＮＡ標的と結合したＭａｒＡ転写因子の領域を拡大したものを示す（ＰＤＢＩＤ１ＢＬ０）。ｗｔＱ８９残基は、この側鎖とＤＮＡの間の好ましくない立体および静電相互作用に起因してＤＮＡ結合界面から突出している。選択によって同定されたＱ８９Ｎ置換は、Ｈ−ドナーを導入し、側鎖を短縮し、したがって、この残基とＤＮＡ骨格の間で増殖性Ｈ結合が生じ得る。そのような相互作用には、より強力なＤＮＡ結合および下流の抵抗性遺伝子の誘導が有利である可能性が高い。図１２Ｄは、それぞれ１０ｇ／Ｌの酢酸または２ｇ／Ｌのフルフラールを用いた全ゲノムを標的とするライブラリーの濃縮プロットを示す。色付けは図１１Ａと同じである。図１２Ｅは、遺伝子レベルでのＣＲＥＡＴＥマッピングにより、遺伝子レベルにおける傾向が明らかになることを示す。図１２Ｅに示されているフルフラール選択と同じく、図１２Ｆに示されている通り、酢酸における強力な濃縮ｆｉｓｍｅｔＡおよびｆａｄＲを標的とする変異により、これらの遺伝子の酢酸耐性における重要な役割が示唆される。
（実施例１３）
ＣＲＥＡＴＥにより柔軟な設計戦略が可能になった

ＣＲＥＡＴＥ戦略に適合する設計の例の図解が図１３Ａ〜１３Ｄに示されている。図１３Ａは、サイレントコドン手法がとられるタンパク質操作適用を示す（上、図８Ａ〜８Ｂも参照されたい）。この変異戦略により、ＤＮＡ結合、タンパク質間相互作用、触媒作用、またはアロステリック調節などの特徴を変化させるための重要なタンパク質領域の標的化変異誘発が可能になる。ＤＮＡ結合飽和変異誘発の図解の上に、この試験のために設計された、全体的な転写因子Ｆｉｓに対して設計されたライブラリーが例示されている。図１３Ｂは、ヌクレオチドの置き換えまたは組み込みカセットにより破壊することができる指定の転写開始部位（ＴＳＳ）の近傍にあるプロモーター変異ＰＡＭ部位を示す。この試験において使用されるこの設計手順を単純化するために、コンセンサスＣＡＰまたはＵＰエレメントを、これらの変異が近位の遺伝子に対して有し得る可能性のある影響を考慮に入れずに、ＴＳＳに対して固定された場所における組み込みのために設計した。図１３Ｃは、リボソーム結合性部位（ＲＢＳ）の変異誘発のためのカセット設計の例を示す。図１３Ｄは、単純な欠失設計の例を示す。ａ点およびｂ点は、遺伝子欠失遺伝子座における２つの部位間の距離を例示するために含まれる。全ての場合において、カセット設計により標的化ＰＡＭを破壊して、設計された変異体の選択的な濃縮が可能になる。
（実施例１４）
リコペン経路の操作

図１４Ａ〜１４Ｂは、Ｅ．ｃｏｌｉにおいて、リコペンの前駆体であるＤＭＡＰＰ経路に行った編集を示す。１１種の遺伝子のＯＲＦに対して編集を行った。活性を改善するために８つの編集を設計し、競合する酵素の活性を低下させるために３つの編集を設計した。リコペン経路内でおよそ１０，０００バリアントを構築し、スクリーニングした。
（実施例１５）
Ｃａｓ９編集効率の制御

図１５は、Ｃａｓ９編集制御実験を示す。ＣＲＥＡＴＥプラスミドと標的ゲノムの間の相同組換えの効率を評価するために、ＣＲＥＡＴＥｇａｌＫ＿１２０／１７オフカセット（下部に赤色で示されている関連する編集）を異なるバックグラウンドに入れて形質転換した。赤色コロニーは編集されていない（ｗｔ）ゲノムバリアントを表し、白色コロニーは編集されたバリアントを表す。ｐＳＩＭ５のみまたはｐＳＩＭ５／Ｘ２およびｄＣａｓ９プラスミドを含有する細胞の形質転換では、白色コロニーの欠如によって示される通り、検出可能な組換えは示されなかった。活性なＣａｓ９の存在下では（右のＸ２−Ｃａｓ９）、高効率の編集（＞８０％）が観察され、これにより、高効率の編集およびライブラリーカバレッジを実現するためにはｄｓＤＮＡ切断が必要であることが示される。
（実施例１６）
Ｅ．ｃｏｌｉにおけるｇＲＮＡｄｓＤＮＡ切断の毒性

図１６Ａ〜１６Ｃは、Ｅ．ｃｏｌｉにおける二本鎖破壊生成の毒性を試験する実験を示す。ｇａｌＫ（スペーサー配列ＴＴＡＡＣＴＴＴＧＣＧＴＡＡＣＡＡＣＧＣ）またはｆｏｌＡ（スペーサー配列ＧＴＡＡＴＴＴＴＧＴＡＴＡＧＡＡＴＴＴＡ）を標的とするｇＲＮＡを用いた対照実験において観察されたＥ．ｃｏｌｉにおける単一のｇＲＮＡ切断の毒性。修復鋳型の不在下では、ｇＲＮＡによる強力な死滅が観察される。一本鎖ドナーオリゴの同時形質転換の際に１０^３〜１０^４のレスキュー効率が観察され、これにより、この毒性を緩和するためには相同な修復鋳型が必要であることが示される。ｂ）多数のＣＲＥＡＴＥ編集の毒性。左側および棒グラフの下部に標的化部位が図で例示されている。編集なし（左端、標的部位なし）に基づいて形質転換効率を推定するために非標的化ｇＲＮＡ対照を使用した。ｆｏｌＡ（緑色）またはｇａｌＫ（赤色）またはこの２つの組合せを標的とするＣＲＥＡＴＥカセット。同じプラスミドから発現する追加のｇＲＮＡを有するＥ．ｃｏｌｉにおける倍加的毒性に注目されたい。このシナリオでは、各部位に対して相同修復が存在し、これにより、オフターゲットのｇＲＮＡ切断が高度に致死的になることが示唆される。これらのデータから、ＣＲＥＡＴＥカセットによるオフターゲットの切断がライブラリー構築相の初期に集団から選択的に除去されることが示唆される。

図１６Ｄ〜１６Ｅは、別のそのような細胞生存アッセイからのデータを示す。編集カセットは、ｆｏｌＡ遺伝子の温度感受性をもたらすＦ１５３Ｒ変異を含有した。レコーダーカセットは、マッコンキー寒天プレート上でのコロニーのスクリーニングを可能にする、ｇａｌＫ遺伝子を破壊するように設計した１５ヌクレオチドのバーコードを含有した。本実施例では、２カ所の切断を生成することにより、ゼロまたは１カ所の切断を生成するのと比較して細胞生存が低減した。

図１６Ｆは、Ｃａｓ９を発現する低コピー数プラスミド（Ｅｃ２３）とＣａｓ９を発現する高コピー数プラスミド（ＭＧ）を比較する形質転換および生存アッセイからのデータを示す。別個の編集カセットを有する異なるベクターを使用して、異なる遺伝子標的部位（ｆｏｌＡ、ｌａｃＺ、ｘｙｌＡ、およびｒｈａＡ）を標的とした。レコーダーカセットを、ｇａｌＫ遺伝子内の異なる配列、部位Ｓ１、Ｓ２、またはＳ３のいずれかを標的とするように設計した。使用した反復的ベクターは、他のベクターと比較して異なるベクター骨格を有し、また、前のラウンドベクターの細胞をキュアリングする繰り返し操作のために設計された３−ベクター系の一部である。データから、より低いＣａｓ９発現（Ｅｃ２３ベクター）により生存および／または形質転換効率が上昇することが示される。２カ所のゲノムの切断（編集カセットおよびレコーディングカセット）を受けた細胞では、Ｃａｓ９発現の低減により、形質転換効率が数桁上昇した。

図１６Ｇは、Ｃａｓ９を発現する低コピー数プラスミド（Ｅｃ２３）で形質転換された細胞およびＣａｓ９を発現する高コピー数プラスミド（ＭＧ）で形質転換された細胞における編集効率と記録効率の相関を示す。編集および記録効率はｃａｓ９の高発現（ＭＧ）および低発現（Ｅｃ２３）で同様であった。Ｅｃ２３では、より多くのコロニーがもたらされ、生存がより良好であった（図１６Ｅに示されている通り）と同時に、高効率の二重編集（編集カセットおよびレコーダーカセットの組み入れ）が維持された。
（実施例１７）
遺伝子欠失のためのＣＲＥＡＴＥ戦略

図１７Ａ〜Ｄは、遺伝子欠失のためのＣＲＥＡＴＥ戦略の例を示す。図１７Ａは、ｇａｌＫＯＲＦから１００ｂｐを欠失させるためのカセット設計の例を示す。ＨＡを、相同性領域が指定の間隔で組み換えられるように設計し、ＣＲＥＡＴＥＨＡの５０ｂｐ側それぞれが指定の部位（青色）で組み換えられるように設計した。ＰＡＭ／スペーサーの場所（赤色）は、ホモロジーアームの一方の近位であり、組換えの間に欠失し、それにより、欠失したセグメントの選択可能な濃縮が可能になる。図１７Ｂは、このカセットを用いてリコンビニアリングされたクローンに由来する染色体ＰＣＲアンプリコンの電気泳動を示す。図１７Ｃは、ａ）と同様の７００ｂｐ欠失のための設計を示す。図１７Ｄは、図１７Ｂ）と同様の７００ｂｐ欠失カセットのコロニーＰＣＲを示す。図１７Ｂおよび１７Ｄのアスタリスクは、設計された欠失を有すると思われるコロニーを示す。一部のクローンはｗｔおよび欠失サイズの両方に関するバンドを有すると思われ、これにより、コロニーの一部ではリコンビニアリングの３時間後にプレーティングした際の染色体分離が不完全であることが示されることに留意されたい。
（実施例１８）
ｇＲＮＡおよび直鎖状ｄｓＤＮＡカセットの同時形質転換による編集効率の制御

図１８は、直鎖状ｄｓＤＮＡＰＣＲアンプリコンおよびｇＲＮＡとの同時形質転換を使用した編集効率に対するＰＡＭ距離の影響を示す。左側は、下流のｇａｌＫＰＡＭ部位を標的とするｇＲＮＡで同時形質転換した、一方の側に二重（ＴＡＡＴＡＡ）終止コドン（アスタリスク）および他方の側にｇａｌＫ遺伝子のすぐ下流のＰＡＭ変異（灰色の四角）を含有するＰＣＲアンプリコンを使用した実験の図である。組換えのための十分な相同性を確実にするために、変異がアンプリコンの末端から４０ｎｔになるようにプライマーを設計した。これらの実験からのデータを赤色／白色コロニースクリーニングによって得た。データへの線形当てはめが下部に示されている。アッセイ対照として含めた、ＰＡＭ変異のみが存在するカセットはＧａｌＫ不活化の率が非常に低いことが観察された。これらの実験を、二本鎖ＤＮＡ鋳型を用いた高効率の編集を可能にするためにｍｕｔＳ遺伝子がノックアウトされたＥ．ｃｏｌｉのＢＷ２５１１３株において実施した。ＭＧ１６５５におけるこの手法では、活性なｍｕｔＳ対立遺伝子に起因して高効率の編集は実現されなかった。
（実施例１９）
ライブラリークローニング分析および統計値

図１９Ａは、読み取りと標的設計配列の間のミスマッチの総数に応じて示された、クローニング後のプラスミドライブラリーの例からの読み取りを示す。大多数のプラスミドは、正確な設計にマッチする。しかし、このクローニングされた集団で観察された多数の４塩基対インデル／ミスマッチ変異体がある。図１９Ｂは、プラスミドプールについての変異プロファイルのカセットの位置の関数としてのプロットを示す。ホモロジーアーム（ＨＡ）の中心近傍で変異の頻度の増大が観察され、これにより、この領域の配列決定または合成における小さな誤差による偏りが示される。これは、ｇＲＮＡ内にスペーサーエレメントと相補的な配列が存在することに起因するものと疑われる。図１９Ｃは、本試験において設計されたＣＲＥＡＴＥカセットについてのＰＡＭとコドンの間の距離のヒストグラムを示す。大多数（＞９５％）が図９Ａ〜９Ｄにおいて試験された設計の制約内であった。同義のＰＡＭ変異がより近傍内に存在しない場合には、６０ｂｐを超える小さな画分を作出した。図１９Ｄは、ＣＲＥＡＴＥプラスミドの多重化クローニングによるライブラリーカバレッジを示す。各バリアントのディープシーケンシング計数がそれらのゲノム上の位置に対して示されている。挿入図は、クローニングされたライブラリー内の示されているプラスミド計数を有するバリアントの数のヒストグラムを示す。
（実施例２０）
リコンビニアリングされた集団のＣＲＥＡＴＥカセット追跡の精度

図２０Ａは、Ｃａｓ９曝露前（ｘ軸）およびＣａｓ９バックグラウンドの形質転換の３時間後のプラスミド集団におけるＣＲＥＡＴＥカセット読み取り頻度の相関プロットを示す。図２０Ｂは、一晩で回収後の複製リコンビニアリング反応間の相関プロットを示す。灰色の線は、参照として完全な相関の線を示す。Ｒ２およびｐ値を、データに対する線形当てはめから、ＰｙｔｈｏｎＳｃｉＰｙ統計値パッケージを使用して算出した。各複製実験について計数閾値５をデータに適用して、各データセットからノイズを除去した。
（実施例２１）
Ｍ９最小培地におけるｆｏｌＡ変異の成長特性

図２１は、Ｍ９最小培地におけるｆｏｌＡ変異の成長特性を示す。Ｆ１５３Ｒは正常な成長特性を維持すると思われるが、一方、Ｆ１５３Ｗ変異の成長速度は、これらの条件下で有意に遅く、これにより、同じ部位におけるこれらの２つのアミノ酸置換が、おそらくこのタンパク質の安定性／ダイナミクスにおいて引き起こされた異なる変化に起因して、生物体の適応度に対して全く異なる影響を有することが示唆される。
（実施例２２）
最小培地におけるｆｏｌＡＣＲＥＡＴＥカセットの濃縮プロファイル

図２２は、最小培地におけるｆｏｌＡＣＲＥＡＴＥカセットの濃縮プロファイルを示す。同義のＨＡをコードするカセットが黒色で示されており、非同義のカセットが灰色で示されており、破線は、ブートストラップ分析から推定される同義の集団平均と比較してｐ＜０．０５の有意性を有する濃縮スコアを示す。タンパク質配列内の各位置における各変異体カセットについての観察された濃縮スコアが左側に示されており、総バリアントの画分としてのこれらの濃縮スコアのヒストグラムが右側に示されている。２つの集団は、大きく類似していると思われる。参照のために高度に有害な保存された残基が青色で示されている。
（実施例２３）
溶媒および抗生物質耐性の改善に関して新規に同定されたａｃｒＢ変異の検証

図２３Ａの左側は、ＡｃｒＢ流出ポンプの全体的な概要を示す。基質がペリプラズム空間内の開口部を通ってポンプに進入し、ＡｃｒＢ／ＡｃｒＡ／ＴｏｌＣ複合体を介して外膜を渡って細胞外空間に押し出される。ライブラリーの標的とされる残基が参照のために青色の球体によって強調表示されており、赤色のドットは、濃縮されたバリアントの多くが密集する領域を示す。右側は、イソブタノールにおける濃縮された変異が同定され（赤色および青緑色の球体）、おそらくペリプラズム空間からの溶質輸送に影響を及ぼす中心の漏斗に接するループ−へリックスモチーフを引き伸ばしたものである。Ｔ６０位を標的とする変異体（青緑色の球体）もエリスロマイシンの存在下で濃縮された。図２３Ｂは、イソブタノールに対する耐性のためのＮ７０ＤおよびＤ７３Ｌ変異の確認を示す。特に、Ｎ７０Ｄ変異により、最終的なＯＤが有意な程度まで改善されると思われる。再構築された株を、蓋付きの１．５ｍＬエッペンドルフチューブ中、４８時間のインキュベーション後に最終的なＯＤについて測定した。エラーバーはＮ＝３の試験から導かれたものであり、ｐ値は片側Ｔ検定から導かれたものである。図２３Ｃは、振とう９６ウェルプレート中、阻害性濃度のエリスロマイシン（２００μｇ／ｍＬ）およびイソブタノール（１．２％）で観察されたＡｃｒＢＴ６０Ｎ変異体の成長の改善を示し、これにより、この変異により、多くの化合物に対するこのポンプの流出活性が増強され得ることが示される。これらの実験のために、ＣＲＥＡＴＥカセット設計を個々に合成し、クローニングし、配列検証した後に、Ｅ．ｃｏｌｉＭＧ１６５５にリコンビニアリングして変異を再構築し、ゲノム改変についてコロニーＰＣＲによって配列検証して遺伝子型−表現型関連性を確認した。
（実施例２４）
新規の適応性遺伝子型をサンプリングするための合理的な変異誘発の利益

図２４Ａ〜２４Ｄは、５００μｇ／ｍＬのリファンピシン（図２４Ａ）、５００μｇ／ｍＬのエリスロマイシン（図２４Ｂ）、１０ｇ／Ｌの酢酸（図２４Ｃ）、および２ｇ／Ｌのフルフラール（図２４Ｄ）を伴うＣＲＥＡＴＥ実験において検出されたバリアントの数を示す。自然進化系またはエラープローンＰＣＲは、一ヌクレオチド多型（例えば、１ｎｔ変異、赤色）のサンプリングに向かって高度に偏るが、これらのヒストグラムにより、稀なまたは容易にアクセス可能でない変異（２および３ｎｔ、それぞれ緑色および青色）を同定することができる合理的設計手法の潜在的な利点が例示される。例えば、適応度が最も高い溶液はリファンピシン、エリスロマイシンおよびフルフラール選択において種々の程度でこれらの稀な変異に偏ると思われる。これらの結果から、ＣＲＥＡＴＥなどの手順により、コンピュータによる手法を使用してタンパク質操作の指向性進化法を改善するのとほとんど同じように、変異を改善する適応度のより迅速かつ詳細な分析が可能になるはずであることが示される。
（実施例２５）
エリスロマイシン選択によって同定された変異の再構築

図２５は、２００μｇ／ｍＬのエリスロマイシンの存在下で４８時間インキュベートし、最終的なＯＤ測定値を評価した後の、蓋付きの１．５ｍＬエッペンドルフチューブ中、０．５ｍＬで成長させた再構築された株を示す。エラーバーはＮ＝３の試験から導かれたものである。測定値の各セットに対して片側Ｔ検定を実施してｐ値を決定し、これにより、成長利益の有意性が示された。
（実施例２６）
フルフラールまたは熱耐性についてのＣｒｐＳ２８Ｐ変異の検証

図２６Ａは、Ｃｒｐ調節タンパク質の結晶構造を示し、フルフラール選択によって同定されたバリアントが赤色で強調表示されている（ＰＤＢＩＤ３Ｎ４Ｍ）。この調節因子のサイクリックＡＭＰ結合性部位（ａａ．２８〜３０、６５）付近の残基を標的とするいくつかのＣＲＥＡＴＥ設計が最小培地中フルフラールまたは熱耐性に対する選択で高度に濃縮され、これにより、これらの変異により、最小培地中、種々のストレス条件下でのＥ．ｃｏｌｉ成長が増強され得ることが示唆される。図２６Ｂは、Ｍ９培地中、２ｇ／Ｌのフルフラール選択で同定されたＣｒｐＳ２８Ｐ変異体の検証を示す。この変異体を、実施例２３においてＡｃｒＢＴ６０Ｓについて記載されている通り再構築した。
（実施例２７）
一ヌクレオチド分解能でのゲノム規模での配列と活性の関係のマッピング

ＤＮＡ合成および配列決定の進歩により、実験室時間尺度でゲノム改変を合理的にプログラムするためのますます複雑な試みが動機付けられている。そのような試みの実現には、多数の変異体設計を正確にかつ効率的に生成するだけでなく、これらの変異の影響を同様のスループットでマッピングすることによる、デザイン・ビルド・テストフォワード・エンジニアリング（ｄｅｓｉｇｎ−ｂｕｉｌｄ−ｔｅｓｔｆｏｒｗａｒｄ−ｅｎｇｉｎｅｅｒｉｎｇ）サイクルにわたる戦略が必要である。ＣＲＩＳＰＲＥｎＡｂｌｅｄＴｒａｃｋａｂｌｅｇｅｎｏｍｅＥｎｇｉｎｅｅｒｉｎｇ（ＣＲＥＡＴＥ）は、高度に効率的なＣＲＩＳＰＲ編集と大規模並列処理によるオリゴマー合成をカップリングして、全ゲノム規模での追跡可能な高精度の編集を可能にする。これは、標的化ガイドＲＮＡと、ゲノムにわたる遺伝子座を編集し、それらの表現型への影響を追跡するために系統的に設計することができる合理的にプログラム可能な相同修復カセットを連結する合成カセットを使用して実現することができる。本発明者らは、部位飽和変異誘発、合理的なタンパク質操作、完全な残基置換ライブラリーおよび前の適応性実験室進化実験の再構築にわたる適用のための配列−活性関係の並行マッピングにより、ゲノム操作に対するＣＲＥＡＴＥの柔軟性および使いやすさを実証した。

ＣＲＥＡＴＥカセット設計の検証

本発明者らの操作の目的を実現するために、編集効率を最大にするとともに複雑な設計プロセスを容易に実行可能なワークフローに変換するためのいくつかの重要な設計考察を考慮に入れた。例えば、各ＣＲＥＡＴＥカセットを、染色体切断部位に合理的な変異を導入する標的化ガイドＲＮＡ（ｇＲＮＡ）およびホモロジーアーム（ＨＡ）の両方が含まれるように設計する（例えば、図８Ａ）。ＨＡは、修復後のＣａｓ９による切断を抑止するために設計された同義のＰＡＭ変異とカップリングした目的のゲノム編集の両方をコードする（例えば、図８Ｂ）。この配置により、所望の編集をＣａｓ９によって高レベルまで選択的に濃縮できることだけでなく、切断をガイドするために必要な配列とＨＲが合成の間に共有結合によりカップリングし、したがって、形質転換の間に同じ細胞に同時に送達されることも確実になる。Ｅ．ｃｏｌｉにおけるＣＲＩＳＰＲに基づく選択の高効率の編集によりまた、ＣＲＥＡＴＥプラスミドとゲノム配列の強力な相関も確実になり、プラスミド配列がトランス作用性バーコードまたはゲノム編集の代理としての機能を果たすことも可能になるはずである（例えば、図８Ｃ）。異なる選択圧下でのプラスミドの頻度の変化が、それらの関連するゲノム編集と相関があると仮定すると、それにより、多くの遺伝子座における的確なゲノム改変の影響を、単純な下流の配列決定手法を使用して並行してモニターして、濃縮された遺伝子型を以前のゲノム追跡方法論と同様に集団規模でマッピングすることが可能になる。

この概念を試験するために、まず、１２０ｂｐのＨＡを使用し、単一の点変異を導入してコドン１４５をＴＡＴからＴＡＡ終止コドンに変換することにより（例えば、図８Ｂ）ｇａｌＫ遺伝子が不活化されるように設計したＣＲＥＡＴＥカセットを使用した対照実験を実施した。Ｃａｓ９およびヌクレアーゼ欠損ｄＣａｓ９対照を使用したこのカセットの編集効率を、赤色／白色コロニースクリーニングアッセイを使用して評価した（例えば、図８Ａ〜Ｂ、図１５Ａ〜１５Ｃ）。これらの実験により、組換えが活性な酵素の不在下では観察されないので（例えば、図１５Ａ〜１５Ｄ）、環状二本鎖プラスミドと染色体の間のＨＲがＣａｓ９による切断に強力に依存することも示された。これは、複製フォークのラギング鎖においてオリゴヌクレオチドが高効率でアニーリングする一本鎖リコンビニアリング手法とは対照的である。Ｃａｓ９はまた、Ｅ．ｃｏｌｉにおけるｄｓＤＮＡ切断の毒性に起因して全体的な形質転換効率に不利な影響を及ぼす（例えば、図９Ａ〜９Ｄ）。この毒性は、ＣＲＥＡＴＥを同じ細胞内の２つの部位で同時に実施する場合にさらに悪化する（例えば、図１６Ａ〜１６Ｅ）；このことは、有効な非相同末端結合経路が存在しないことと組み合わせると、リコンビニアリングされたライブラリー内でオフターゲットの編集事象は稀であるはずという事実を強力に支持する。さらに、毒性によりライブラリー構築のサイズおよびカバレッジが限定されるが、本発明者らは、観察されたＤＮＡ１μｇ当たり１０^４〜１０^５種のバリアント（例えば、図９Ａ）は、現在のオリゴ合成能（注文当たり１０^４〜５のオリゴ）に適合する規模であることに注目する。したがって、ＣＲＥＡＴＥ合成オリゴ設計を使用すると、ゲノム内の任意の場所で約１０^５またはそれよりも多くのデザイナー変異を同時に生成し、そのような変異を標的化された表現型に正確にマッピングすることができると予測した。

ＣＲＥＡＴＥカセット設計の変化が編集効率にどのように影響するかをさらに特徴付けるために、ＨＡの長さ（８０〜１２０ｂｐ）およびＰＡＭ−コドン／ＴＳ間の距離（１７〜５９ｂｐ）を変動させた（例えば、図９Ｂ）。Ｃａｓ９の誘導により、これらのカセットバリアントの全てが、高効率のＨＲを支持することができることが明らかになった。Ｃａｓ９誘導の不在下でも高効率の変換が観察され、これにより、誘導性プロモーターの漏れに起因するＣａｓ９の低レベルの発現が切断およびＨＲを駆動するのに十分であることが示される（例えば、図９Ｂ）。本発明者らの意図する設計にマッチする編集を検証するために、ランダムに選択したクローンの染色体について配列決定し、７１％（２７／３８）がＣＲＥＡＴＥ設計との完全なマッチを含有するが、２６％（１０／３８）はＰＡＭ編集のみを含有し、残りの３％（１／３８）は、ｗｔエスケーパーであると思われることが見出された。設計の柔軟性に関する追加の試験として、異なるサイズの欠失を導入する欠失カセット（例えば、図１７Ａ〜１７Ｄ）を使用して同様の実験を実施し、同様の効率（＞７０％）が観察され、これにより、同じ設計の自動化および追跡能が種々の設計目的に容易に拡張されるはずであることが示される（例えば、図１３Ａ〜１３Ｄ）。

ハイスループットな設計および多重化ライブラリー構築

ＣＲＥＡＴＥプロセスを全ゲノム適用の規模にするために、目的の標的部位（ＴＳ）に最も近いＰＡＭ配列を系統的に同定し、それを改変して同義のＰＡＭ変異を創出するための上記の基準を考慮に入れる、カセット設計を自動化するためのカスタムソフトウェアを開発した。この設計ソフトウェアは、Ｅ．ｃｏｌｉに関して実行することができる、ウェブに基づく設計ツール一式の一部であり、他の生物体ならびにＣＲＩＳＰＲ−Ｃａｓ系の拡張セットに関してさらに開発中である。このソフトウェアプラットフォームにより、ライブラリー構築のためにバッチで実施することができる並行化されたアレイに基づくオリゴ合成および単純な相同性に基づくクローニング方法と適合する形式での、ゲノムライブラリーのハイスループットな合理的設計が可能になる（例えば、図８Ｂ）。

この設計ソフトウェアを使用して、伝統的な方法による活性マッピングのための配列決定では時間がかかり、法外に費用がかかる適用の範囲で、合計５２，３５６種のＣＲＥＡＴＥカセットを生成した。簡単に述べると、ライブラリー設計は、１）その染色体に関連して必須の遺伝子の変異ランドスケープ全体をマッピングするためのｆｏｌＡ遺伝子の完全飽和、２）Ｅ．ｃｏｌｉにおける広範囲の耐性および表現型の産生に関係付けられる３５種の包括的な調節因子、流出ポンプおよび代謝酵素における機能的な残基の飽和変異誘発、３）熱耐性に関する最近の適応実験室進化（ＡＬＥ）試験によって同定された非同義の変異の完全なセットの再構築、ならびに４）ＵＰエレメントまたはＣＡＰ結合エレメントがレギュロンＤＢにアノテートされた転写開始部位に組み入れられるように設計したプロモーター操作ライブラリー（例えば、図１３Ａ〜１３Ｄ）を含んだ。

異なる遺伝子座における編集効率をさらに特徴付けるために、プールされたオリゴライブラリーを増幅し、並行してクローニングし、単一のバリアントのサブセットを単離した（例えば、図９Ｃ）。ＣＲＥＡＴＥプラスミドを用いた形質転換後のゲノム遺伝子座の増幅および配列決定により、編集効率が平均７０％であり（７つの異なる遺伝子座でサンプリングされた１４４クローンのうち１０６クローン）、ｍｅｔＡ＿Ｖ２０Ｌカセットの３０％からｒｐｏＨ＿Ｖ１７９Ｈカセットの１００％までにわたることが明らかになった。興味深いことに、各カセットについての編集効率の差異は、ＰＡＭと標的コドンの間の距離と高度に相関し（例えば、図９Ｄ）、これも、直鎖ＤＮＡ鋳型の標的化変異を有効に導入する能力に影響を及ぼすと思われる特徴である（例えば、図１８Ａ〜１８Ｂ）。この関係により、その後のＣＲＥＡＴＥ設計では、ＰＡＭ選択基準を最適化することにより編集効率が容易に上昇するはずであることが示唆される。本発明者らは、編集効率の差異が、生物体の適応度に対する一部の変異の有害な影響を反映し得ること（ｍｅｔＡは、大多数の培地条件において必須の遺伝子と考えられる）、および特定のタンパク質について観察することができる変異の数には上限があり得ることにも注目する。最後に、これらのデータは、目的の染色体変異体を濃縮する任意の特定の選択またはスクリーニングステップの外で得られ、したがって、この手法の変異ライブラリーを構築する能力を実証する。

多重化合成およびクローニング手順の忠実度をさらに特徴付けるために、プールされたライブラリーに対してディープシーケンシングを実施した（例えば、図１９Ａ〜Ｄ）。クローニングされたＣＲＥＡＴＥカセットライブラリーの５９４，９９８の総読み取りから、５５０，１５２（９２％）が品質フィルタリングを通過し、設計データベースに対するヒットを生じた。これらのうち、可能性のある独特のバリアントの３４，２９１（６５％）について完全なマッチが観察され、この最初のプールに入らなかった多くのカセットが後の選択で観察され、これにより、クローニング段階で大多数の意図された設計空間を容易に包含できることが示唆されることに注目する。これらの読み取りの深度分析により、品質フィルターを通過する読み取りの４６％がそれらの意図された設計に正確にマッチし、残りは、主に設計された変異部位の近傍のＨＡ領域に１〜４ｂｐのインデルまたはミスマッチを含有することが明らかになった（例えば、図１９Ａ）。この領域における変異の偏りにより、カセットのＨＡおよびｇＲＮＡ部分の繰り返しスペーサーエレメントが、配列決定または合成に悪影響を及ぼす二次構造を形成し得ることが示唆される（例えば、図１９Ｂ）。これらのバリアント設計は、ＣＲＥＡＴＥプラスミド−バーコーディング戦略によって容易に同定されること、および、一部の場合では、生成されたライブラリーにこの付加された多様性があることが望ましい可能性があることに注目する。クローニングされたプールからのバリアントの頻度とリコンビニアリング後に一晩で回収した後のバリアントの頻度の間、ならびにリコンビニアリング反復実験間に有意な（ｐ＜０．０５）相関も観察された（例えば、図２０Ａ〜２０Ｂ）。これらの結果から、よく表されるバリアントは、本発明者らの方法論により、単一の遺伝子座で実施される以前のＣＲＩＳＰＲに基づく飽和変異誘発手順と同様の精度で容易に追跡されるはずであることが示唆される。

ＣＲＥＡＴＥに基づくタンパク質操作

単一の遺伝子レベルでのタンパク質操作のためのＣＲＥＡＴＥ方法論の頑強性を試験するために、必須のｆｏｌＡ遺伝子のディープスキャニング変異誘発を実施した。この遺伝子は、テトラヒドロ葉酸の産生ならびにピリミジン、プリンおよび核酸の生合成に関与するジヒドロ葉酸レダクターゼ（ＤＨＦＲ）酵素をコードする。ＤＨＦＲは、抗生物質または化学療法薬として使用される抗生物質トリメトプリム（ＴＭＰ）および他の葉酸代謝拮抗薬の主要な標的でもある。ＤＨＦＲの機能および抗生物質抵抗性に関する構造的および生化学的データが豊富であることにより、ＤＨＦＲは当該手法を検証するための理想的なモデルになる。

ＤＨＦＲ酵素の２〜１５８のあらゆるコドンが飽和するように設計したＣＲＥＡＴＥライブラリーをＥ．ｃｏｌｉＭＧ１６５５にリコンビニアリングし、一晩で回収した。回収後、約１０^９個の細胞（飽和培養物１ｍＬ）を、阻害性ＴＭＰ濃度を含有する培地に移し、４８時間成長させた。次いで、得られたプラスミド集団について配列決定して、ＴＭＰ抵抗性を付与することができる単一のアミノ酸置換のレベルで情報を捕捉する本発明者らの能力を評価した（例えば、図１０Ａ〜１０Ｂ）。変異の影響についてのブートストラップされた信頼区間を、本実験に含めた１５８の同義の変異に関する濃縮データを使用して導き出した（例えば、図１０Ａ〜１０Ｂ）。この基準を使用して、タンパク質内の４９のａａ位を包含する７４の置換（設計空間の２．３％）について有意な（Ｐ＜０．０５）レベルの濃縮が観察された。必須の酵素のこの変異柔軟性の程度は、反直観的に見える可能性があるが、これは、この酵素がその進化的最適に達していないという、および、多くの変異により内在性酵素活性の増強またはこの酵素の動的フォールディングランドスケープの変化によってＴＭＰ耐性を改善することができるという以前の結論を支持する。

これらの結果により、合理的な変異誘発戦略を使用して、適応度が改善されたバリアントの変異空間により深くプロービングしているという事実も支持される。例えば、Ｆ１５３位において７つの有意に濃縮された置換が観察され（例えば、図１０Ａ〜１０Ｂ）、これらのうち、以前にエラープローンＰＣＲおよび適応実験室進化（ＡＬＥ）によって同定されたものはなかった。これらの特定の変異を検証するために、以前に文献で報告されておらず、また、この位置で測定された濃縮規模が大きな範囲にわたるＦ１５３ＲおよびＦ１５３Ｗバリアントを再構築した（例えば、図１０Ｄ〜１０Ｆ）。高度に濃縮されたＦ１５３Ｒ変異体は大きな範囲のＴＭＰ濃度で急速に成長するが、一方、Ｆ１５３Ｗ変異体は選択に使用された中等度のＴＭＰ濃度でのみ成長を示すことが確認され、これは、それらのそれぞれの濃縮スコアと一致した（例えば、図１０Ａ〜１０Ｆ）。さらに、ＣＲＥＡＴＥを使用して同定された７つの変異のうち６つが、ｗｔＴＴＴコドンを観察されたアミノ酸のうちの１つに変換するために２ヌクレオチドの変化を必要とする（Ｉ：１ｎｔ、Ｗ：２ｎｔ、Ｄ：２ｎｔ、Ｒ：２ｎｔ、Ｐ：２ｎｔ、Ｍ：２ｎｔ、Ｈ：２ｎｔ）。Ｆ１５３ＲおよびＦ１５３Ｗ変異はまた、別個のやり方でネイティブな酵素活性に影響を及ぼすと思われ（例えば、図２１）、これは、これらの置換により、この酵素の酵素的サイクルが別個の様式で変化することによって耐性が付与され得ることを意味する。

ＴＭＰ抵抗性を付与する置換のマッピングに加えて、ＤＨＦＲのネイティブな活性に影響を及ぼす置換を同定することも試みた。これを行うために、Ｍ９中で一晩成長させた後の各プラスミドバリアントの頻度を比較した（例えば、図２２Ａ〜２２Ｃ）。この場合、同義および非同義の変異セットのどちらでも同様の全体的な濃縮プロファイルが観察され、非常に少ない変異が成長に対して有意な影響を及ぼすことが観察された。この予想外の結果により、より深い配列決定の深度および／または低適応度バリアントに高い信頼度を割り当てる代替の選択戦略の必要性が示唆される。

タンパク質操作適用の別の検証として、Ｅ．ｃｏｌｉにおいてＡｃｒＢ多剤流出ポンプを標的とする４，２４０種のバリアントライブラリーを生成した（例えば、図２３Ａ〜２３Ｆ）。このタンパク質は、次世代バイオ燃料として探求されており、多数の操作の試みの動機付けとなっている、抗生物質、化学的変異原、および短鎖アルコールを含めた多種多様な化学物質を移出するプロトン交換ポンプとして作用する。ライブラリーを、内部チャンバー、基質をＡｃｒＢ／ＡｃｒＡ／ＴｏｌＣ複合体の外膜構成成分にチャネルで通す出口の漏斗、ならびにイソブタノールおよびより長鎖のアルコールに対する耐性を付与する変異が同定されている膜貫通ドメインの重要な領域を標的とするように設計した（例えば、図２３Ａ〜２３Ｃ）。次いで、ＡｃｒＢＣＲＥＡＴＥライブラリーをＦｏｌＡライブラリーと同一に構築し、ライブラリーを１．２％イソブタノールの存在下で成長させた。配列決定により、有意に濃縮された、中心の流出漏斗に隣接するループ−へリックスモチーフに対する多数の変異が同定され、これにより、この下部構造により、流出活性の増強を操作するための新規の標的がもたらされ得ることが示唆される。ＡｃｒＢＮ７０ＤおよびＤ７３Ｌ変異の再構築により、これらの変異の、この溶媒ストレスの存在下で全体的な成長を増強する能力も確認された（例えば、図２３Ｄ）。

大規模適応試験からの遺伝子型適応度の並行評価

次に、本発明者らの試みを単一のタンパク質規模から拡大し、ゲノム規模でＣＲＥＡＴＥの使用を検証することを試みた。これを行うために、前のＥ．ｃｏｌｉ熱耐性の適応実験室進化試験から得られた変異を再構築し、マッピングすることを選んだ。ＡＬＥは、広範囲の環境ストレス要因に応答した細菌の適応を試験するためのツールとして広範囲にわたって使用されている。しかし、大多数の場合、ゲノムは多数の変異を受け、それにより、問題の表現型に対する各変異の寄与を評価することが難しくなっている。ここで、ＣＲＥＡＴＥライブラリーを、ＴｅｎａｉｌｌｏｎらのＡＬＥ実験からの６４５種の非同義の変異体全てを含むように設計し、構築し、次いで、このライブラリーを最小培地中、４２．２℃で成長選択に供した。同義のＰＡＭ変異から生じる可能性があるあらゆる可能性のある影響を評価するために、このライブラリーの設計に重複性を含め、したがって、各標的コドンを２つの異なるＰＡＭ変異にカップリングして、非同義の変異それぞれについて４倍の設計重複性をもたらした。較正のために、ＡＬＥライブラリーを、ライブラリーを標的とするタンパク質と共にプールして、ベンチマークとしての非ＡＬＥ由来ライブラリーからの相対的な濃縮比較を可能にした（例えば、図１１Ａ〜１１Ｃ）。本実験における５０，０００よりも多くのカセットのうち、ＡＬＥ由来ライブラリーから、最小の計数閾値を上回る４０５種のカセットが観察され、２５２種が独特のバリアントに属するものであった（例えば、図１１Ｂ）。これらの３４６種のカセット（２３１の非同義の変化をコードする）は同義の対照と比較して有意に濃縮され（例えば、図１１Ｂ）、これにより、サンプリングされた変異の９２％（２３１／２５２）により有意な選択的成長利点が個々の染色体変異として付与されることが示唆され、これは、適応成長中のそれらの固定と一致する。さらに、本発明者らは、追加のＣＲＥＡＴＥライブラリーに由来する１４１種の変異も有意に濃縮され、これらの標的化残基のうちの８６種が、炭素代謝の中心的な調節因子であるＣｒｐのｃＡＭＰ結合性部位またはその周囲にあることを見出した。そのような多数のＣｒｐ変異体の同定は、以前の所見と一致して、熱耐性におけるＣｒｐの役割を高度に示唆するものである。

各変異体について、ｗｔコドンを他の１９種のアミノ酸のそれぞれに変換するために必要な変異の数も算出した（例えば、図１１Ｃ）。ｆｏｌＡと同様に、本発明者らは、ｃｒｐＳ２８ＰおよびＬ３０Ｙ変異などの高度に影響の大きい変異には、一ヌクレオチド置換よりも多くが必要であり、したがって、実験室時間尺度の下での自然進化系では容易に得られないまたは極めて稀であることを見出した。実際、これは、本発明者らが実施した選択の多くにわたって繰り返されるテーマであると思われ（例えば、図２４Ａ〜２４Ｄ）、これにより、ゲノム操作適用のための、合成ＤＮＡに駆動される検索戦略の価値が再度強調される。

全ゲノム規模での選択可能な高精度の編集のハイスループットなマッピング

ゲノム規模でのマッピングおよび探究のための方法をさらに検証するために、全ゲノムを標的とするライブラリーを、バイオプロダクションに関連する抗生物質または溶媒を用いて挑戦した（例えば、図１２Ａ〜１２Ｆ）。ＲＮＡポリメラーゼによる転写を阻害する抗生物質であるリファンピシンを用いて実施した選択の場合では、（例えば、図１２Ａ、内側の円）、原子分解能マッピングのためのＣＲＥＡＴＥ手法の頑強性を強調するいくつかの濃縮されたバリアントが観察された。例えば、上位５０のヒットのうち１０のヒットで、リファンピシン結合性部位の一部を形成するバリアントを含めた、ＲＮＡポリメラーゼβサブユニット（ｒｐｏＢによりコードされる）の残基Ｉ５７２、Ｌ５３３およびＳ５３１に対する変異が同定された（例えば、図１２Ｂ）。濃縮されたバリアント７種のうち６種において、データから、７リファンピシン結合を立体的に妨げるために、かさのある置換が必要であることが示唆される。β−サブユニット変異に加えて、リファンピシン選択により、ｍａｒＲノックアウトに起因する過剰発現がＥ．ｃｏｌｉにおける多数の抗生物質抵抗性（ＭＡＲ）表現型の十分に試験されている態様であるＭａｒＡ転写活性化因子に対するいくつかの変異が濃縮された。ＭａｒＡのＤＮＡ結合結晶構造では、Ｑ８９はＤＮＡ骨格の近傍に位置するが、他の可能性のある回転異性体とＤＮＡ骨格上の最も近傍のリン酸基の間の立体的衝突に起因して溶液中に向けられる（例えば、図１２Ｃ）。この選択によって同定されたＭａｒＡＱ８９ＮおよびＱ８９Ｄ変異のモデリングにより、側鎖を単一の炭素単位だけ短縮することにより、新しいタンパク質−ＤＮＡＨ結合相互作用が可能になり、それにより、全体的なＭＡＲ誘導応答が改善できることが示唆される。

これらの結果を、翻訳に干渉する抗生物質と比較するために、別のラウンドの選択をエリスロマイシンの存在下で実施した（例えば、外側の円、図１２Ａ）。この選択からの濃縮プロファイルにより、以前にこの抗生物質に対する抵抗性に関係付けられた遺伝子座が再度強調された。例えば、この薬物のペリプラズム空間からの主要な移出体として作用するＡｃｒＢ流出ポンプに対する４つの異なる変異の強力な濃縮が観察された（例えば、図１２Ａ）。興味深いことに、バリアントの１つ（ＡｃｒＢＴ６０Ｎ）が、イソブタノール選択から同定された同じ残基に現れる（例えば、図２３Ａ〜２３Ｆ）。他の変異と同様に、再構築により、これらの変異のうち少なくとも２つ（例えば、図２３Ｅ〜２３ＦのＴ６０Ｎおよび図２５のＤ７３Ｌ）は、エリスロマイシンならびにイソブタノールの両方に対する耐性を有意に改善できることが検証され、これにより、このモチーフにより、広範な耐性表現型に関する有用な操作標的がもたらされ得るという観念がさらに支持される。ＡｃｒＢに加えて、多数のｓｏｘＲおよびｒｐｏＳ変異体の濃縮も観察され、これらはどちらも、以前にストレス耐性に関係付けられており、また、一般的な抗生物質抵抗性表現型である。全体で、有意に濃縮された変異３４１種のうち１３６種（４０％）がＲｐｏＢ、ＭａｒＡ、ＭａｒＲ、ＳｏｘＲ、ＡｃｒＢ、またはｄｘｓタンパク質内で同定されたことが観察され、そのそれぞれが以前に抗生物質抵抗性遺伝子として広範囲にわたって検証されている。

最後に、工業的な発酵条件下で細菌の成長を阻害し、したがって、多くの株の操作の試みの標的であるセルロース系加水分解産物の一般的な構成成分であるフルフラールまたは酢酸を使用して選択を実施した（例えば、図１２Ｄ〜１２Ｆ）。高酢酸濃度の存在下では（１０ｇ／Ｌ、例えば、内側のプロット、図１２Ｄ）、上位１００種の変異が、それぞれｆｉｓ、ｆａｄＲ、ｒｈｏおよびｆｎｒ遺伝子を標的とするカセットにより優性であった（例えば、図１２Ｅ）。Ｆｉｓ、ＦｎｒおよびＦａｄＲ調節因子は全て、主要な酢酸利用遺伝子ａｃｓの転写調節に関与し、細胞が酢酸を有効に除去することを可能にする、いわゆる「酢酸スイッチ」に関係付けられる。これらの調節因子のノックアウトにより、酢酸利用経路の構成的発現および酢酸成長表現型の改善が導かれ、これにより、本試験において同定された変異（例えば、図１２Ｅ〜１２Ｆ）により、それらのそれぞれのタンパク質標的を不安定化することによってこれらの調節機能が阻害される可能性が高いことが示唆される。

酢酸の弱酸耐性とは対照的に、成長阻害濃度のフルフラール（２ｇ／Ｌ）の存在下で得られた濃縮プロファイルは有意に異なり、酸化ストレス応答調節因子ｒｐｏＳを標的とする変異が最も頻繁に観察された（例えば、図１２Ｆ）。フルフラールによる成長阻害は、酸化ストレスの防止および細胞成長の同化経路の重要な補助因子である細胞のＮＡＤＰＨプールの枯渇によって起こると考えられている。本発明者らの発見と一致して、以前のＲｐｏＳに関する試験により、そのような栄養分が枯渇したシナリオでは不活性対立遺伝子が有利であることが実証されている。興味深いことに、４２．２℃での選択で観察されたものと同じｃｒｐの変異のいくつかも観察され（例えば、図１１Ａおよび１１Ｃ）、再構築の際に、ＣｒｐＳ２８Ｐ変異体により、フルフラールの存在下での成長を実質的に改善できることが確認された（例えば、図２６Ａ〜２６Ｂ）。この選択が、水素化物イオンをＮＡＤＨからＮＡＤＰ＋に移行させて同化作用のための十分なプールを維持する膜結合トランスヒドロゲナーゼであるＰｎｔＡトランスヒドロゲナーゼのバリアントについて一意的に濃縮されることも見出した。したがって、基質結合性の裂け目の極めて近傍でのＩ２５８Ａの変異により、ＮＡＤＰＨ生成の増強が付与され得る。

集合的に、これらの選択により、既知の関連性をマッピングする能力が実証されること、ならびに新規の変異を目的の形質に迅速にマッピングすることに関するこの方法の力が強調されることによってＣＲＥＡＴＥ戦略が検証される。機能変異の喪失を主に同定する他の大多数の機能的なゲノミクス技術とは対照的に、そのような広範な規模のスキャニング変異誘発を実施する能力により、機能変異の新規獲得も同定することができる、より一般的なゲノム検索のドアが開かれることに留意することも重要である。

この研究において、本発明者らは、ＣＲＥＡＴＥにより、何万ものアミノ酸およびプロモーター変異を単一の実験で並行マッピングすることが可能になることを実証した。一部の実施例では、＞５０，０００の全ゲノム変異の構築、選択、およびマッピング（例えば、図１１Ａ〜１１Ｃおよび１２Ａ〜１２Ｆ）を単一の研究者が１〜２週間で実現することができ、合成生物学の現行の最先端の方法と比べて、経済的側面、スループット、および標的規模に数桁の改善がもたらされる。重要なことに、ライブラリーバリアントの濃縮を追跡する能力により、数十の遺伝子座に限られる、より複雑な下流の配列決定手法とは対照的に、単一のプライマーのセットだけを使用する単純なＰＣＲに基づくワークフローによる活性マッピングのための多重化配列決定が可能になる。さらに、ＣＲＥＡＴＥは、コード領域またはプロモーターにおける一ヌクレオチドまたはアミノ酸レベルのバリエーションの影響をマッピングする能力により、追跡可能な多重化リコンビニアリング（ＴＲＭＲ）または遺伝子分解能分析に限られるＴｎ−ｓｅｑ手法などの以前のハイスループットなゲノムの技術よりも相当に多様性の大きな設計目的のセットに取り組むことが可能になる。そのような能力により、ＣＲＥＡＴＥの繰り返しラウンドを実行して設計により駆動されるゲノム操作を実施し、広範囲の大望に対処し得るワークフローを含めた、遺伝子機能を解読し、細胞形質を操作するための新しいパラダイムが可能になる。

とりわけ、以前の手法とのさらなる違いとして、この研究において報告された高効率の変異誘発（例えば、図９Ａ〜９Ｄ）は、１桁の改善だけでなく、ネイティブなＤＮＡ修復経路が全てインタクトである野生型ＭＧ１６５５株においても実現された。大多数の以前報告されたＥ．ｃｏｌｉにおけるリコンビニアリングの試みでは、変異誘発を１〜３０％の効率で実現するためにミスマッチ修復遺伝子または化学修飾されたオリゴヌクレオチドの欠失が必要な一本鎖オリゴ操作が使用されている。プラスミドに基づく相同組換え基質とＣａｓ９によるｄｓＤＮＡ切断の組合せにより、これらの要件が回避されると思われ（例えば、図１３Ａ〜１３Ｄおよび図９Ａ〜９Ｄ）、これにより、集団規模で効率的な編集および追跡を実施するためのＣａｓ９およびλ−ＲＥＤ遺伝子の外側の特殊化された遺伝子改変の必要が排除される（例えば、図９Ａ〜９Ｄ）。この事実は、ＣＲＩＳＰＲ編集の広範な有用性と並んで、ＣＲＥＡＴＥ手法がＳａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅおよび高効率の形質転換プロトコールが利用可能な他の組換えにより生成された細菌などの広範囲の微生物に容易にポートされることを示唆する。ＣＲＥＡＴＥ戦略はまた、設計および追跡のために同様の自動化手法を使用する広範囲のＣＲＩＳＰＲ／Ｃａｓ系とも適合するべきである。しかし、この方法論を高等真核生物に拡張するには、非相同末端結合を克服するための戦略ならびに安定に再現され得る代替の追跡系を開発する必要がある。

ＣＲＥＡＴＥ戦略により、多重化オリゴ合成の組み込み、ＣＲＩＳＰＲ−ＣＡＳ編集、およびハイスループットな配列決定による活性マッピングおよび指向性進化法のための配列決定の合理化された手法がもたらされる。
（実施例２８）
一ヌクレオチド分解能でのゲノム規模での配列と活性の関係のマッピングのさらなる例

プラスミドバーコードのゲノム編集への相反するマッピングの可能性のある影響

本発明者らは、最初のＣＲＥＡＴＥライブラリーが、プラスミドバーコードとゲノム編集の間に低信頼度マッピング（主にＣＲＥＡＴＥカセットにおけるＰＡＭと標的変異の間の距離によって説明される、図２ｄ参照）を有すると予測した設計を含んだことを注記する。以下に、プラスミド追跡によりゲノムバリアントに関する誤った結論が導かれ得る場合の一部において生じる可能性がある種々のシナリオを記載する。これらのシナリオの評価において留意すべきいくつかの事項として、ｉ）プラスミドカセットによるゲノム編集に対する機能的影響は最小であるまたは全くないはずであること、ｉｉ）ゲノム遺伝子座はＷＴ配列または本発明者らが配列決定によって得た編集カセットに由来する配列のいずれかのみであること、およびｉｉｉ）多数の部位における（例えば、図１６Ａ〜１６Ｅ）または編集−修復鋳型の添加の不在下で実施した場合のＣＲＩＳＰＲ−Ｃａｓ編集の毒性を考慮すると、オフサイトの編集は非常に可能性が低いことが挙げられる。最後に、本発明者らは、反復実験およびより進んだディープシーケンシングの使用によっても、これらの問題に対処できることに注目する。

適応度の高いバリアントの追跡（陽性濃縮追跡）

ゲノム改変（したがって、関連するプラスミド）に関して強力な選択的利点が存在する場合、単に、選択後に、染色体に編集を有する細胞を観察する。したがって、これは、特に、選択時間が短い場合に、大抵が真陽性であり、したがって、集団をスイープする複製誤差に起因するランダムな変異の可能性が限定される。この現象により、改変およびｗｔ適応度のコンボリューションを表す濃縮プロファイルに起因して、変異の真の適応度に関して定量的な過小評価が導かれる可能性があるが、偽陽性は生じない。さらに、反復実験および／またはより長い選択の使用によっても、この潜在的な問題に対処し、適応度に対する変異の影響に関する誤った結論を排除することができる。

適応度の低いバリアントの追跡の（陰性濃縮追跡）

コードされる変異が陰性適応度寄与を有するが、ＰＡＭのみまたは改変されていない染色体に関連付けられる場合、特に、より長い選択時間に関して、変異体の適応度が不正確に過大評価され、ｗｔに近いと仮定される（例えば、図２２Ａ〜２２Ｃを参照されたい）。しかし、ディープシーケンシング手法はいずれも、選択後のそのような変異に関する情報の欠如に起因する同様の限定およびこれらのシナリオにおける統計値の計数に関連する問題に対処するものであるにちがいない。さらに、本発明者らは、このシナリオが、編集されていない画分（約３０％）内の真に陰性である適応度変異体のサブセット（歴史的指向性進化法およびＡＬＥデータに基づいて、１０〜２０％であるはずである）にのみ関連すること、ならびに多数の反復形質転換において編集されていない画分に留まることに注目する。言い換えれば、ＷＴ適応度で時々現れる特定の変異体において不一致が観察される場合に、反復形質転換によって検出および／または対処することができるのは小さな百分率（４〜５％）のシナリオである。

不完全なカバレッジ

最初の集団内にバリアントが存在しない場合（形質転換効率が低いことおよび編集効率が低いことの両方に起因して）、いくつかのシナリオが生じ得る。上記の点により暗示される通り、変異が有益である場合に、適応度の利点を付与するものではないと誤って結論付けられる可能性があり、変異が真に有害である場合にも、中性の適応度スコアに不正確に割り当てられる可能性がある。これは、この研究において時に生じると思われ、また、反復測定に関連する誤差および適応度の低いバリアントを同義の対照から区別する本発明者らの能力の両方に影響を及ぼす。しかし、新規のおよび以前検証された変異を容易に同定する本発明者らの能力によって証明される通り、これらの問題にもかかわらず、有益な変異体を同定する本発明者らの能力は頑強である。Ｃａｓ９の毒性を克服することおよびリコンビニアリング効率を改善することによってこれに取り組むための戦略は、そのような問題がほとんど排除される見込みを保持する。さらに、反復実験の数を増やす、配列決定の深度を増大させる、かつ／または、より大きな規模の形質転換を実施することによってライブラリーカバレッジを改善することも、これらの問題に取り組むために役立ち得る。

オフターゲットのｇＲＮＡ切断

オフターゲットのｇＲＮＡ切断は、Ｅ．ｃｏｌｉでは、そのゲノムのサイズが比較的小さく（４Ｍｂ）、したがって、ＣＲＥＡＴＥカセットに対する相同性領域がない（標的化されない）ことに起因して稀なはずである。さらに、Ｃａｓ９の存在下でのｇＲＮＡの毒性（例えば、図９Ａ）により、Ｅ．ｃｏｌｉではｄｓＤＮＡ切断に起因して細胞生存が損なわれることが確実になる。Ｅ．ｃｏｌｉに導入される追加の切断はそれぞれ、相同な修復鋳型が各切断部位にもたらされる場合であっても、倍加的な毒性の影響を招くと思われる（例えば、図１６Ａ〜１６Ｅ）。この毒性の影響は、２つの部位を標的とするが、単一のＨＡのみを含有する単一のｇＲＮＡによるオフターゲットの切断事象の場合にそうなるように、ガイドＨＲに対する修復鋳型が存在しないことによってさらに悪化する（例えば、図１６Ａ〜１６Ｅ）。

ランダムなオフターゲットの変異誘発（進化）

オフターゲットの変異に起因してＣＲＥＡＴＥバリアントが強力に濃縮される確率は、高度に起こりそうになくても、２つの因子：１）上で述べられた理由による毒性の影響および２）特に選択の多数の反復実験においてＣＲＥＡＴＥの変異誘発率と比較してＭＧ１６５５の変異率が低いまたは他の変異修復能力が高い株に起因する。プラスミドプールをナイーブな親バックグラウンドに移行し戻し、適応度を改善するＣＲＥＡＴＥプラスミドの最初の集団からの濃縮を迅速に検証できることも検証した。反復実験データと同様に、これにより、各ＣＲＥＡＴＥプラスミドを本発明者らの分析に干渉するバックグラウンド変異の潜在性からデカップリングすることが可能になる。これらの因子により、本発明者らの分析中になされる仮定が単純化され、その妥当性は、本研究の間に同定された外部および内部で検証された遺伝子型の両方により支持される。

同義の変異の可能性のある影響

同義の変異（例えば、ＰＡＭ領域内）により、表現型に予想外の影響が付与され得る。これをいくつかの様式で制御した。あらゆる実験において、同義の変異のライブラリーからなる内部標準を含め（各コドンに１／２０または総インプットの５％）、そのそれぞれから異なるＰＡＭとコドンの組合せがサンプリングされ、したがって、多くの同義の変化の濃縮プロファイルを測定することによって遺伝子に対して有し得る可能性のある影響の範囲に関する知識がもたらされる。研究により示唆される通り、この集団を対照として使用して、有意な適応度の変化を単一のアミノ酸の分解能で正確に同定することができる。この影響を、本明細書に記載のＡＬＥ試験のために行ったものと同様の、部位を多数のＰＡＭ変異とカップリングさせる重複性のサンプリング手法を利用することによって制御することもできる。

ＣＲＥＡＴＥライブラリー設計の考察

種々の設計原理を、本明細書に開示されているいくつかの研究に記載されているライブラリーを標的とする遺伝子において実行した。例えば、ｆｏｌＡライブラリー（３１４０種のカセット）を、完全な単一の部位飽和変異誘発および配列活性のための不偏の探索的ライブラリーになるように設計した。しかし、大多数の遺伝子については、標的タンパク質に対する機能的影響を有する可能性が最も高い部位（例えば、ＤＮＡ結合性部位、活性部位、以前の選択によって変異ホットスポットであると同定された領域）の多様性に焦点を当てるように選択することにより、興味深い遺伝子型の確率を最大にしようとした。これらのライブラリー設計に含めた部位は、Ｅｃｏｃｙｃ（ｂｉｏｃｙｃ．ｏｒｇ／）、Ｕｎｉｐｒｏｔ（ｕｎｉｐｒｏｔ．ｏｒｇ／）、およびＰＤＢ（ｒｃｓｂ．ｏｒｇ／ｐｄｂ）を含めたデータベースに寄託された情報、ならびに指向性進化法手法を使用して目的の残基または領域を同定した関連する文献引用に基づいて選択した。ＵｎｉｐｒｏｔおよびＥｃｏｃｙｃデータベースでは、変異による影響および各タンパク質の重要なドメインを示す、手動で精選された配列特徴がもたらされる。リガンドまたはＤＮＡ結合性部位をモデリングするのに十分な構造情報が存在する場合、関連する結晶構造をＰｙｍｏｌにローディングし、手動の残基選択を行い、数値一覧としてエクスポートした。プロモーターライブラリーに関しては、転写開始部位に対するこれらの部位の間隔およびＣＲＰ結合性部位（転写開始部位に対して−７２から−４０の間に位置するＡＡＡＴＧＴＧＡｔｃｔａｇａＴＣＡＣＡＴＴＴ）またはＲＮＡポリメラーゼのアルファサブユニットを直接動員するＵＰエレメント（ＡＡＡＡＴＴＴＴＴＴＴＴＣＡＡＡＡＧＴＡ−転写開始部位から６０）のいずれかの正準認識配列を考慮に入れた。これらの配列を、タンパク質標的化のために設計された自動化ＣＲＥＡＴＥ設計ソフトウェアのバリエーションを使用して、レギュロンＤＢにおける公的に入手可能な転写開始部位アノテーションに対してこれらの位置に組み込むように設計した（例えば、図１３Ａ〜１３Ｄ）。これらのカセットは、遺伝子量の影響および適応度に対する調節を評価する意図で作出した。最後に、高温（例えば、４２．２℃）での成長に１年間適応させた後、１１５種の単離株の完全なゲノムについて配列決定した包括的なＡＬＥ実験によって同定された１９７種の遺伝子を標的とする６４５種の非同義の変異の全てを再構築するためのライブラリーを設計した。全体で、５２，３５６種のオリゴマーを設計し、４８，０８０種は３５種の遺伝子にわたって２４０４のコドン位置を飽和させることを意図したものであり、２，５５０種のオリゴは、ＡＬＥ変異、３７９種のＵＰプロモーター変異体および７７２種のＣＡＰプロモーター変異を同時の配列と活性の関係のマッピングを可能にする様式で再生させるために作出した。

カセット設計および自動化原理

ｇａｌＫを用いた対照実験（例えば、図９Ａ〜９Ｄ）および現行の最大の商業的合成の長さの制約（Ａｇｉｌｅｎｔからの２００ｂｐ）に基づいて、各ＣＲＥＡＴＥカセットについての一般的な設計を開発した（例えば、図８Ａ〜８Ｂ）。

ＣＲＥＡＴＥカセットの設計を、カスタムＰｙｔｈｏｎスクリプトを使用して自動化した。基本アルゴリズムにより、遺伝子配列、標的残基の一覧、およびコドンの一覧をインプットとして取得する。遺伝子配列を、対応するスペーサー配列を有する入手可能な全てのＰＡＭ部位について検索する。次いで、この一覧を標的化されるコドン位置の相対的近傍に応じて選別する。最初の一覧内の各ＰＡＭ部位について、アルゴリズムにより、同じくＰＡＭ部位を直接破壊する、インフレームで作出することができる同義の変異が確認され、この条件がアルゴリズムに適合する場合には、指定のコドン変化の作出および付随的なスペーサーを有する完全なＣＲＥＡＴＥカセットの設計を進行させ、各インプットコドンおよび位置についてそれぞれ繰り返す。各ＰＡＭ変異について、次のＰＡＭ部位に進む前に、可能性のある全ての同義のコドン置換を確認する。本試験におけるコドン飽和ライブラリーに関して、Ｅ．ｃｏｌｉ使用統計値に応じて、設計されたアミノ酸置換それぞれについて最も頻度の高いコドンを選択する（ｇｅｎｓｃｒｉｐｔ．ｃｏｍ／ｃｇｉ−ｂｉｎ／ｔｏｏｌｓ／ｃｏｄｏｎ＿ｆｒｅｑ＿ｔａｂｌｅ）。ラップトップコンピュータでスクリプトを急速に実行することができ、それを使用してこれらのライブラリーの完全な設計を＜１０分で生成した。この試験において使用するアルゴリズムは、時には選択可能な変異マーカーとしてＰＡＭのみを使用して、可能性のある最も保存的な変異が作出されるように設計した。

プラスミド

Ｘ２−ｃａｓ９の広範な宿主域ベクターを、ゲノムＳ．ｐｙｏｇｅｎｅｓＤＮＡ由来のｃａｓ９遺伝子をｐＢＴＢＸ２骨格（Ｌｕｃｉｇｅｎ）に入れ増幅することによって構築した。このベクターのベクターマップおよび配列ならびにｇａｌＫ＿Ｙ１４５＊＿１２０／１７ＣＲＥＡＴＥカセットが以下の場所で提供される：ｂｅｎｃｈｌｉｎｇ．ｃｏｍ／ｓ／３ｃ９４１ｊ／ｅｄｉｔ；ｂｅｎｃｈｌｉｎｇ．ｃｏｍ／ｓ／ｘＲＢＤｗｃＭｙ／ｅｄｉｔ。

この研究の一部で実施された編集実験では、Ｘ２−ｃａｓ９ベクターをｐＳＩＭ５ベクター（ｒｅｄｒｅｃｏｍｂｉｎｅｅｒｉｎｇ．ｎｃｉｆｃｒｆ．ｇｏｖ／ｓｔｒａｉｎｓ−− ｐｌａｓｍｉｄｓ．ｈｔｍｌ）と組み合わせて使用して、報告した効率を実現した。

ＣＲＥＡＴＥライブラリーのリコンビニアリング

ＣＲＥＡＴＥプラスミドライブラリーを、温度感受性ｐＳＩＭ５プラスミド（ラムダレッド）、および、ｐＢＴＢＸ−２骨格にクローニングされたＳ．ｐｙｏｇｅｎｅｓゲノムＤＮＡに由来する誘導性ｃａｓ９遺伝子（Ｘ２ｃａｓ９、例えば、図１５Ａ〜１５Ｄ）を含有する広宿主域のプラスミドを有する野生型Ｅ．ｃｏｌｉＭＧ１６５５株に入れて形質転換することによってゲノムライブラリーを調製した。ｐＳＩＭ５を４２℃で１５分にわたって誘導し、その後、氷上で１５分にわたって冷却した。細胞を最初の培養物体積の１／５のｄｄＨ２Ｏで３回洗浄した（例えば、５０ｍＬの培養物については１０ｍＬでの洗浄）。電気穿孔後、細胞をＬＢ＋０．４％アラビノース中に回収してＣａｓ９を誘導した。細胞をスポットプレーティングの１〜２時間前に回収して、ライブラリーカバレッジを決定し、ＬＢ＋０．４％アラビノース＋５０μｇ／ｍＬのカナマイシン＋１００μｇ／ｍＬのカルベニシリン中に一晩で回収するために１０×体積に移した。飽和した一晩培養物をペレット化し、ＬＢ５ｍＬに再懸濁させた。１ｍＬを使用してグリセロールストックを作出し、他の１ｍＬを適切な選択培地で洗浄した後、選択を進行させた。

ｇａｌＫを用いた対照実験のために、この位置における単一の点変異および標的化されたＰＡＭ部位を消滅させる同義の変異を作出するための第２の点変異を伴う、Ｙ１４５（ＴＡＴ）が終止コドン（ＴＡＡ）に変換されるように設計したＣＲＥＡＴＥカセットを使用した（例えば、図８Ｂおよび図１３Ａ〜１３Ｄ）。編集効率（例えば、図１３Ａ〜１３Ｄおよび図９Ａ〜９Ｂ）を、以前に記載されている通り、１％ガラクトースを補充したマッコンキー寒天上での赤色／白色プレートに基づくスクリーニングを使用して推定した。

選択手順

一晩で回収した後、細胞を、ペレット化することによって採取し、新鮮な選択培地に再懸濁させた。全ての選択を振とうフラスコ中で実施し、最初のＯＤ６００を０．１として接種した。各選択について、培養物が定常期に達した後、培地体積の１／１００を移すことによって３段階希釈（標的条件での成長速度に応じて４８〜９６時間）を行った。最初の適応から低炭素利用可能性を模倣するために、Ｍ９培地＋０．２％グルコース中、４２℃での選択を実施した。ストリンジェントな選択を確実にするために、ＬＢ＋５００μｇ／ｍＬのリファンピシンまたはエリスロマイシン中、抗生物質による選択を行った。Ｍ９＋０．４％グルコースおよび１０ｇ／Ｌの酢酸（非緩衝）または２ｇ／Ｌのフルフラールのいずれかの中で溶媒選択を実施した。選択物を、最終的な培養物１ｍＬをペレット化することによって採取し、細胞ペレットをＴＥ緩衝液１００μＬ中で煮沸して、プラスミドおよびゲノムＤＮＡの両方をさらなる所望の分析のために保存した。

ライブラリー調製および配列決定

ＣＲＥＡＴＥプラスミドからの単一の増幅ステップおよびバーコードを使用した実験読み取りの割り当てを可能にするために、カスタムＩｌｌｕｍｉｎａ適合プライマーを設計した。ＣＲＥＡＴＥカセットを、Ｐｈｕｓｉｏｎ（ＮＥＢ）ポリメラーゼを用い、６０℃でのアニーリングおよび１：３０分の伸長時間を使用した２０サイクルのＰＣＲを使用して、煮沸した細胞溶解物のプラスミド配列から直接増幅した。クローニング手順と同様に、過剰数のＰＣＲサイクル（例えば、＞２５〜３０）を実行した場合に観察された変異の蓄積およびＣＲＥＡＴＥカセットの組み換えを防止するために、最小数のＰＣＲサイクルを維持した。増幅した断片を検証し、１％アガロースゲル電気泳動によって定量し、各試料についての所望の読み取り深度に応じてプールした。プールされたライブラリーを、ＱｉａｑｕｉｃｋＰＣＲ清浄化キットを使用して清浄化し、標準のＩｌｌｕｍｉｎａ調製キットを使用してＮＧＳのために処理した。Ｉｌｌｕｍｉｎａ配列決定および試料の調製を、プライマーを用いて実施した。

ハイスループットな配列決定の予備処理および計数の生成

ペアエンドＩｌｌｕｍｉｎａ配列決定読み取りを、最大３つのミスマッチの許容度でｇｏｌａｙバーコード指数に応じて選別し、次いで、ｕｓｅａｒｃｈ−ｆａｓｔｑ＿ｍｅｒｇｅアルゴリズムを使用して統合した。次いで、選別された読み取りを、設計されたＣＲＥＡＴＥカセットのデータベースに対して、ｕｓｅａｒｃｈ＿ｇｌｏｂａｌアルゴリズムを同一性閾値９０％で使用してマッチングし、各読み取りについて最大６０の可能性のあるヒットを可能にした。得られたヒットを、パーセント同一性に応じてさらに選別し、最良にマッチするＣＲＥＡＴＥカセット設計を最終的なカットオフを最初の設計に対する９８％同一性として使用して読み取りの割り当てを行った。この読み取りの割り当て戦略は、設計された遺伝子型間の相関を同定しようとするものであり、したがって、実験手順の間に生じる可能性がある変異に起因して生じる他の重要な特徴が見落とされる可能性があることに留意するべきである。この手法は、データ解析を単純化するため、ならびに「フォワード」設計およびアノテーション手順および意味のある遺伝学的現象を正確に同定するその能力を評価するために取られた。

データ解析および適応度の算出

濃縮スコア（または絶対的な適応度スコア）を、以下の方程式を使用してｌｏｇ２濃縮スコアとして算出した：
（式中、Ｆ_ｘ，ｆは、最終時点におけるカセットＸの頻度であり、Ｆ_ｘ，ｉは、カセットＸの最初の頻度であり、Ｗは各バリアントの絶対的な適応度である）。頻度は、各バリアントについての読み取り計数を、フィルタリングで失われたものを含めた総実験計数で割ることによって決定した。各選択を２連で実施し、２回の測定の計数重み付け平均を使用して、各変異の平均適応度スコアを以下の通り推定した：

これらのスコアを使用して、調査した種々の選択圧下での各変異の適応度寄与を順位付けし、評価した。全ての選択について、平均成長速度の複合尺度として、同義の変異体の全てについての絶対的な適応度スコアの平均を取得した。絶対的な濃縮スコアは、変異体の濃縮が野生型値の少なくとも＋／−２＊σ（例えば、正規分布を仮定してｐ＝０．０５）であれば、有意であるとみなした。これらの数値を導き出すために、本試験において報告した各選択に関して２回の反復実験を実施し、各分析に含めるために、反復実験にわたってカットオフ閾値１０を適用した。

本発明者らの設計で標的化されたあらゆるコドンは、内部実験対照をもたらすために同義のバリアントも含んだ。したがって、タンパク質標的化カセットの５％は、カスタムＰｙｔｈｏｎブートストラッピングスクリプトを使用して変異の影響についての信頼区間を推定することを可能にする同義の変異をコードした。各実験についての濃縮データを、２００００を置き換えて再サンプリングして、９５％信頼区間の推定を得、それを使用して、本原稿に示されている各分析について濃縮スコアの統計的有意性を推定した。

変異体の再構築および成長測定

ＡｃｒＢＴ６０ＮおよびＣｒｐＳ２８ＰおよびＦｏｌＡＦ１５３Ｒ／ＷＣＲＥＡＴＥカセットを、別々のｇｂｌｏｃｋｓとしてＩＤＴに注文し、クローニングし、配列検証した。各カセットをＭＧ１６５５に入れて形質転換し、コロニースクリーニングして、設計されたゲノム編集を有するクローンを同定した。次いで、これらの株（例えば、図２１および図２２Ａ〜２２Ｃ）を、示されている通り、プールされたライブラリー選択から成長条件に供した。各条件について、６００ｎｍにおける吸光度が測定されるように設定した９６ウェルプレートリーダー中、１００μＬで、成長曲線を３連で取得した。プレートを覆い、空のウェルに水を添加して成長中の蒸発を低減した。

ソフトウェアおよび図の生成

Ｃｉｒｃｏｓｖ０．６７を使用して円形プロットを生成した。Ｐｙｔｈｏｎ２．７でｍａｔｐｌｏｔｌｉｂプロッティングライブラリーを使用してプロットを生成し、ＡｄｏｂｅＩｌｌｕｓｔｒａｔｏｒＣＳ５を使用して図を作成した。ＰｒｏＤｙＰｙｔｈｏｎパッケージおよびＰｆａｍａｃｃｅｓｓｉｏｎＰＦ００１８６ｒｅｐｒｅｓｅｎｔａｔｉｖｅｐｒｏｔｅｏｍｅａｌｉｇｎｍｅｎｔＲＰ３５を使用してＦｏｌＡについてのエントロピースコア（図１０Ａ）を決定した。

タンパク質ライブラリーおよび適応度の高い変異に関する図を、ＰｙＭｏｌＭｏｌｅｃｕｌａｒＧｒａｐｈｉｃｓＳｙｓｔｅｍ、Ｓｃｈｒｏｄｉｎｇｅｒ、ＬＬＣを使用して作成した。以下は、図の生成に使用したタンパク質およびＰＤＢである：ＡｃｒＢ（３Ｗ９Ｈ、４Ｋ７Ｑ、３ＡＯＣ）、Ｆｉｓ（３ＪＲ９）、Ｉｈｆ（１ＩＨＦ）、ＲＮＡポリメラーゼ（４ＫＭＵ、４ＩＧＣ）、Ｃｒｐ（３Ｎ４Ｍ）、ＭａｒＡ（１ＢＬＯ）、およびＳｏｘＲ（２ＺＨＧ）。
（実施例２９）
編集−バーコード相関の試験

Ｃａｓ９−ｐＳＩＭ５二重ベクターである、低コピー数プラスミド（Ｅｃ２３）を発現する株を、異なる遺伝子編集カセット（ｌａｃＺ、ｘｙｌＡ、およびｒｈａＡ）ならびに異なるバーコードおよび挿入部位（ｇａｌＫ部位１、ｇａｌＫ部位２、およびｇａｌＫ部位３）を有するレコーダーカセットを使用して試験した（図２７Ａに要約されている）。可能性のある転帰が図２７Ｂに示されている。選択前には、全ての編集／バーコード／ＷＴの組合せが可能である。選択後には、編集細胞を、この実験計画においてバーコード付けされているか否かにかかわらず濃縮することができる。

形質転換物を、遺伝子編集を含有する細胞の濃縮を可能にする選択培地にプレーティングした。各組合せ形質転換からの３０コロニーについて配列決定して、それらが所望のバーコードを含有するかどうかを決定した。

図２７Ｃは、配列決定データからの結果を示す。編集／バーコード組合せのうちの２つが試験したコロニーの１００％で見出され（３０／３０コロニー）、他の編集／バーコード組合せ形質転換は、試験したコロニーのおよそ９７％で見出された（２９／３０コロニー）。適正に操作されなかった単一のコロニーは、遺伝子編集を含有したが、バーコードは含有しなかった。

全体的に、試験したコロニー９０種のうち８９種が、設計された遺伝子編集およびバーコードを有する。
（実施例３０）
選択可能なレコーディング

バーコードを選択しない場合、対応する遺伝子編集が組み入れられ、選択されたとしても、それはバーコードが付されていない細胞の濃縮を可能にする。図２８は、編集カセットの組み入れの選択に加えて、レコーディング事象（例えば、レコーダーカセットによるバーコードの組み入れ）を選択し、それにより、編集されかつバーコードが付された細胞の回収効率を上昇させる戦略の例を示す。

図２８に示されている通り、配列Ｓ０、Ｓ１、Ｓ２などは、次のラウンドのレコーダーカセットに付随するガイドＲＮＡにより標的とされるように設計されている。示されている例では、操作の第１ラウンドにおいて、選択可能なマーカーをオンにするために必要なＰＡＭ変異、バーコード、Ｓ１部位、および調節エレメントを標的領域のＳ０部位に組み入れる。これにより、ＴｅｔＲ選択可能なマーカーがオンになり、第１ラウンドＰＡＭ部位が欠失したＳ１部位を有する、バーコードが付された変異バリアントの濃縮が可能になる。操作の第２ラウンドにおいて、第２のＰＡＭ変異を含む新しいレコーダーカセット、第２のバーコード、Ｓ２部位、および選択可能なマーカーをオフにする変異を前のラウンドからのＳ１部位に組み入れる。これにより、第２のバーコードおよびＳ２部位が組み入れられたバリアントの対抗選択が可能になる。その後のラウンドを続けて、選択可能なマーカーをオンの状態とオフの状態の間で反転させ、選択または対抗選択をそれぞれ使用して所望のバリアントを濃縮する。各ラウンドからのレコーダーカセットを、前のラウンドで組み入れられた独特の配列（例えば、Ｓ０、Ｓ１など）に組み入れられるように設計する。これにより、バーコーディングの最後のラウンドが上首尾になり、したがって、所望の操作ステップの全てが最終産物に含有されることが確実になる。各ステップにおけるＰＡＭ変異の組み入れも、改変されていないＰＡＭ配列を有する細胞は、ＣＲＩＳＰＲ酵素切断から逃れられないために死滅するので、所望のバーコードが付されたバリアントが選択されることを確実にするのに役立つ。

この戦略では、操作の各ラウンドから操作された編集の全てを含有する所望のバリアントを単離する効率を上昇させるために多数の方法を使用する。各ラウンドで組み入れられたＰＡＭ変異、選択可能マーカースイッチ、および独特のランディング部位は、効率を別々に上昇させるだけでなく、一緒になっても効率を上昇させる。これらのツールは、各レコーディングラウンドの選択を可能にし、高度に活性なレコーディングガイドＲＮＡの設計を可能にする。等しい間隔をあけた（または設計に応じて、等しい間隔をあけていない）バーコードのアレイを生成し、ゲノム全体を通していずれの対応する編集が組み入れられたかを決定するためにバーコードアレイについて配列決定することなどの下流の分析を容易にする。

図２９は、上記の選択可能なレコーダー戦略を試験するための実験計画を示す。編集カセットおよびレコーダーカセットを含有するプラスミド（ｐＲＥＣ１）を細胞に入れて形質転換した。編集カセットは、非標的化編集カセット、または変異（ＴＳではない）もしくは温度感受性変異（ＴＳ）を標的遺伝子に組み入れた変異のいずれかを含有した。レコーダーカセットを、最初にｔｅｔＲ選択可能なマーカーがオフになった標的遺伝子のＳ０部位に組み入れるために設計した。レコーダーカセットは、Ｓ０ＰＡＭ部位が欠失したＰＡＭ変異、第１のバーコード（ＢＣ１）、その後の操作ラウンドのための、レコーディングカセットが組み入れられる独特のＳ１部位、およびＴｅｔＲ選択可能なマーカーをオンにする補正変異も含有した。Ｓ０部位内のＰＡＭ部位を標的とするレコーダーカセット上のガイドＲＮＡ（Ｓ０−ｇＲＮＡ）により、ＣＲＩＳＰＲ酵素、この場合はＣａｓ９が、Ｓ０部位を切断することが可能になる。レコーダーカセットを切断されたＳ０部位に組み換える。ＰＡＭ変異が組み入れられ、これは、Ｓ０−ｇＲＮＡがもはやＳ０部位を標的とすることができないことを意味し、それにより、ＷＴ細胞が死滅し、バーコードを受け取った細胞が濃縮される。ＴｅｔＲ選択可能なマーカーもオンになり、それにより、バーコードが付されたバリアントのさらなる選択が可能になる。

図３０Ａおよび３０Ｂのデータは、上で記載され、図２９に示されている実験からの結果を示す。形質転換および操作ラウンドから回収されたＴｅｔ抵抗性コロニーのうち、１６種を配列決定し、全てが、設計されたバーコードを含有することが決定された（図３０Ａ）。図３０Ｂは、レコーダー標的部位を含有しない対照細胞（非標的）はＴｅｔの存在下で生存しなかったが、標的部位を含有する細胞では、ＴｅｔＲがオンになったことにより証明される通り、首尾よくバーコードが付され、これにより当該細胞がＴｅｔ含有培地で選択されることが可能になったことを示す。Ｔｅｔ抵抗性コロニーは、ＴｅｔＲ遺伝子がオンになったゲノムの部位において確認された。これらのデータから、選択可能なレコーディングが上首尾であったことが示された。
（実施例３１）
ＭＡＤヌクレアーゼの発現

ＭＡＤ１−ＭＡＤ２０の野生型核酸配列は、それぞれ配列番号２１〜４０を含む。これらのＭＡＤヌクレアーゼを、Ｅ．ｃｏｌｉにおける発現についてコドン最適化し、コドン最適化された配列はそれぞれ配列番号４１〜６０として列挙されている（表２に要約）。コドン最適化されたＭＡＤ１−ＭＡＤ２０を、構成的または誘導性プロモーター（例えば、Ｔ７プロモーター配列番号８３、またはｐＢＡＤプロモーター配列番号８１もしくは配列番号８２）および任意選択の６×−Ｈｉｓタグを含む発現構築物にクローニングした。生成したＭＡＤ１−ＭＡＤ２０発現構築物はそれぞれ配列番号６１〜８０として提供される。
（実施例３２）
ＭＡＤ２およびＭＡＤ７ヌクレアーゼ

ＭＡＤ２およびＭＡＤ７ヌクレアーゼは、本明細書に開示されている方法において使用することができる核酸誘導型ヌクレアーゼである。ヌクレアーゼＭａｄ２（配列番号２）およびＭａｄ７（配列番号７）をクローニングし、細胞に入れて形質転換する。ｇａｌＫ遺伝子の標的部位を変異させるために設計した編集カセットを、変異を用いて設計し、これにより、首尾よく編集されるコロニーの白色／赤色スクリーニングが可能になる。編集カセットは、ｇａｌＫを標的とするように設計したガイド核酸もコードした。編集カセットを、ＭＡＤ２、ＭＡＤ７、またはＣａｓ９を発現するＥ．ｃｏｌｉ細胞に入れて形質転換した。図３１Ａは、Ｃａｓ９と比較したＭａｄ２およびＭａｄ７の編集効率を示す（配列番号１１０）。図３１Ｂは、細胞生存率によって証明される形質転換効率を示す。本実施例では、ＭＡＤ２およびＭＡＤ７と共に使用したガイド核酸は、足場−１２配列およびｇａｌＫを標的とするガイド配列を含んだ。Ｃａｓ９と共に使用したガイド核酸は、Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９と適合する配列を含んだ。

図３２および表３は、ＭＡＤ２ヌクレアーゼを使用した遺伝子編集のさらなる例を示す。本実験では、異なるガイド核酸配列を試験した。ガイド核酸のガイド配列は、上記の通りｇａｌＫ遺伝子を標的とした。ガイド核酸の足場配列は、示されている通り種々の試験される配列のうちの１つであった。足場−５、足場−１０、足場−１１、および足場−１２を伴うガイド核酸がＭＡＤ２との機能的な複合体を形成することができた。

図３３および表４は、ＭＡＤ７ヌクレアーゼを使用した遺伝子編集のさらなる例を示す。本実験では、異なるガイド核酸配列を試験した。ガイド核酸のガイド配列は、上記の通りｇａｌＫ遺伝子を標的とした。ガイド核酸の足場配列は、示されている通り種々の試験される配列のうちの１つであった。足場−１０、足場−１１、および足場−１２を伴うガイド核酸（例えば、図３１Ａ）がＭＡＤ７との機能的な複合体を形成することができた。アミノ酸配列が表２で提供され、足場配列が表３および表４で提供される。表３および表４は、ｇａｌＫ標的遺伝子を変異させるために使用した編集カセットにおいて設計された変異も提供される。

ＭＡＤ２、ＭＡＤ７、および他のＭＡＤヌクレアーゼのさらなる詳細および特徴付けは、それぞれの全体が本明細書に組み込まれる、米国特許出願第１５／６３１，９８９号、２０１７年６月２３日出願、および米国特許出願第１５／６３２，００１号、２０１７年６月２３日出願に記載されている。

本発明の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本発明から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の発明の実施形態に対する種々の代替を、本発明の実施において使用できることが理解されるべきである。以下の特許請求の範囲により本発明の範囲が定義され、それによって、これらの特許請求の範囲の範囲内の方法および構造ならびにそれらの等価物が包含されるものとする。

参照による組み込み
本明細書において言及される全ての刊行物および特許出願は、個々の刊行物または特許出願が具体的にかつ個別に参照により組み込まれることが示されたのと同程度に参照により本明細書に組み込まれる。
特定の実施形態では、例えば以下の項目が提供される。
（項目１）
ｉ）ａ）改変された第１の標的核酸配列；
ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；および
ｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列
を含む第１のドナー核酸；ならびに
ｉｉ）ａ）前記改変された第１の標的核酸配列に対応するバーコード；および
ｂ）第２の標的核酸の一部と相補的な第２のスペーサー領域を含む第２のガイド核酸配列
を含む第２のドナー核酸
を含む組成物。
（項目２）
前記改変された第１の標的核酸配列が、対応する改変されていない第１の標的核酸と比較して、少なくとも１つの挿入された、欠失した、または置換された核酸を含む、項目１に記載の組成物。
（項目３）
前記第１のガイド核酸および第２のガイド核酸が、核酸誘導型ヌクレアーゼに適合する、項目１に記載の組成物。
（項目４）
前記核酸誘導型ヌクレアーゼが、ＩＩ型またはＶ型Ｃａｓタンパク質である、項目３に記載の組成物。
（項目５）
前記核酸誘導型ヌクレアーゼが、Ｃａｓ９ホモログまたはＣｐｆ１ホモログである、項目３に記載の組成物。
（項目６）
前記第２のドナー核酸が、第２のＰＡＭ変異を含む、項目１に記載の組成物。
（項目７）
前記第２のドナー核酸配列が、スクリーニング可能または選択可能なマーカーをオンまたはオフにするための調節配列または変異を含む、項目１に記載の組成物。
（項目８）
前記第２のドナー核酸配列が、独特のランディング部位を標的とする、項目１に記載の組成物。
（項目９）
ゲノム操作の方法であって、
ａ）細胞の集団をポリヌクレオチドと接触させるステップであって、各細胞が、第１の標的核酸、第２の標的核酸、および核酸誘導型ヌクレアーゼを含み、
前記ポリヌクレオチドが、
１）ｉ）改変された第１の標的核酸配列；
ｉｉ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；
ｉｉｉ）前記第１の標的核酸の一部と相補的なスペーサー領域を含み、前記核酸誘導型ヌクレアーゼに適合する、第１のガイド核酸配列
を含む編集カセット；ならびに
２）ｉ）前記改変された第１の標的核酸配列に対応するバーコード；および
ｉｉ）前記第２の標的核酸の一部と相補的な第２のスペーサー領域を含み、前記核酸誘導型ヌクレアーゼに適合する、第２のガイド核酸配列
を含むレコーダーカセット
を含む、ステップと、
ｂ）前記第１のガイド核酸配列、前記第２のガイド核酸配列、および前記核酸誘導型ヌクレアーゼに、前記第１の標的核酸および前記第２の標的核酸内でゲノム編集を創出させるステップと
を含む方法。
（項目１０）
ｃ）前記バーコードの一部について配列決定するステップであって、それにより、ステップａ）において前記第１の標的核酸内に挿入された改変された第１の標的核酸を同定するステップをさらに含む、項目９に記載の方法。
（項目１１）
前記核酸誘導型ヌクレアーゼが、ＣＲＩＳＰＲヌクレアーゼである、項目９に記載の方法。
（項目１２）
前記ＰＡＭ変異が、前記核酸誘導型ヌクレアーゼによって認識されない、項目９に記載の方法。
（項目１３）
前記核酸誘導型ヌクレアーゼが、ＩＩ型またはＶ型Ｃａｓタンパク質である、項目９に記載の方法。
（項目１４）
前記核酸誘導型ヌクレアーゼが、Ｃａｓ９ホモログまたはＣｐｆ１ホモログである、項目９に記載の方法。
（項目１５）
前記レコーダーカセットが、前記核酸誘導型ヌクレアーゼによって認識されない第２のＰＡＭ変異をさらに含む、項目９に記載の方法。
（項目１６）
選択可能な反復的遺伝子操作の方法であって、
ａ）核酸誘導型ヌクレアーゼを含む細胞を、レコーダーカセットを含むポリヌクレオチドと接触させるステップであって、前記レコーダーカセットが、
ｉ）操作の前のラウンド中に組み入れられた独特のランディング部位内に組み換えられる核酸配列であって、独特のバーコードを含む核酸配列；および
ｉｉ）前記独特のランディング部位を標的とする前記核酸誘導型ヌクレアーゼに適合するガイドＲＮＡ
を含む、ステップと、
ｂ）前記核酸誘導型ヌクレアーゼに前記独特のランディング部位を編集させるステップであって、それにより、前記独特のバーコードを前記独特のランディング部位に組み入れるステップと
を含む方法。
（項目１７）
前記核酸配列が、スクリーニング可能または選択可能なマーカーの転写をオンまたはオフにする調節配列をさらに含む、項目１６に記載の方法。
（項目１８）
前記核酸配列が、前記核酸誘導型ヌクレアーゼに適合しないＰＡＭ変異をさらに含む、項目１６に記載の方法。
（項目１９）
前記核酸配列が、その後の操作ラウンドのための第２の独特のランディング部位をさらに含む、項目１６に記載の方法。
（項目２０）
前記ポリヌクレオチドが、
ａ）改変された第１の標的核酸配列；
ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；および
ｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列
を含む編集カセットをさらに含み、
前記独特のバーコードが、前記改変された標的核酸を前記独特のバーコードによって同定することができるように、前記改変された第１の標的核酸に対応する、項目１６に記載の方法。

Claims

ｉ）ａ）改変された第１の標的核酸配列；
ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；および
ｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列
を含む第１のドナー核酸；ならびに
ｉｉ）ａ）前記改変された第１の標的核酸配列に対応するバーコード；および
ｂ）第２の標的核酸の一部と相補的な第２のスペーサー領域を含む第２のガイド核酸配列
を含む第２のドナー核酸
を含む組成物。
前記改変された第１の標的核酸配列が、対応する改変されていない第１の標的核酸と比較して、少なくとも１つの挿入された、欠失した、または置換された核酸を含む、請求項１に記載の組成物。
前記第１のガイド核酸および第２のガイド核酸が、核酸誘導型ヌクレアーゼに適合する、請求項１に記載の組成物。
前記核酸誘導型ヌクレアーゼが、ＩＩ型またはＶ型Ｃａｓタンパク質である、請求項３に記載の組成物。
前記核酸誘導型ヌクレアーゼが、Ｃａｓ９ホモログまたはＣｐｆ１ホモログである、請求項３に記載の組成物。
前記第２のドナー核酸が、第２のＰＡＭ変異を含む、請求項１に記載の組成物。
前記第２のドナー核酸配列が、スクリーニング可能または選択可能なマーカーをオンまたはオフにするための調節配列または変異を含む、請求項１に記載の組成物。
前記第２のドナー核酸配列が、独特のランディング部位を標的とする、請求項１に記載の組成物。
ゲノム操作の方法であって、
ａ）細胞の集団をポリヌクレオチドと接触させるステップであって、各細胞が、第１の標的核酸、第２の標的核酸、および核酸誘導型ヌクレアーゼを含み、
前記ポリヌクレオチドが、
１）ｉ）改変された第１の標的核酸配列；
ｉｉ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；
ｉｉｉ）前記第１の標的核酸の一部と相補的なスペーサー領域を含み、前記核酸誘導型ヌクレアーゼに適合する、第１のガイド核酸配列
を含む編集カセット；ならびに
２）ｉ）前記改変された第１の標的核酸配列に対応するバーコード；および
ｉｉ）前記第２の標的核酸の一部と相補的な第２のスペーサー領域を含み、前記核酸誘導型ヌクレアーゼに適合する、第２のガイド核酸配列
を含むレコーダーカセット
を含む、ステップと、
ｂ）前記第１のガイド核酸配列、前記第２のガイド核酸配列、および前記核酸誘導型ヌクレアーゼに、前記第１の標的核酸および前記第２の標的核酸内でゲノム編集を創出させるステップと
を含む方法。
ｃ）前記バーコードの一部について配列決定するステップであって、それにより、ステップａ）において前記第１の標的核酸内に挿入された改変された第１の標的核酸を同定するステップをさらに含む、請求項９に記載の方法。
前記核酸誘導型ヌクレアーゼが、ＣＲＩＳＰＲヌクレアーゼである、請求項９に記載の方法。
前記ＰＡＭ変異が、前記核酸誘導型ヌクレアーゼによって認識されない、請求項９に記載の方法。
前記核酸誘導型ヌクレアーゼが、ＩＩ型またはＶ型Ｃａｓタンパク質である、請求項９に記載の方法。
前記核酸誘導型ヌクレアーゼが、Ｃａｓ９ホモログまたはＣｐｆ１ホモログである、請求項９に記載の方法。
前記レコーダーカセットが、前記核酸誘導型ヌクレアーゼによって認識されない第２のＰＡＭ変異をさらに含む、請求項９に記載の方法。
選択可能な反復的遺伝子操作の方法であって、
ａ）核酸誘導型ヌクレアーゼを含む細胞を、レコーダーカセットを含むポリヌクレオチドと接触させるステップであって、前記レコーダーカセットが、
ｉ）操作の前のラウンド中に組み入れられた独特のランディング部位内に組み換えられる核酸配列であって、独特のバーコードを含む核酸配列；および
ｉｉ）前記独特のランディング部位を標的とする前記核酸誘導型ヌクレアーゼに適合するガイドＲＮＡ
を含む、ステップと、
ｂ）前記核酸誘導型ヌクレアーゼに前記独特のランディング部位を編集させるステップであって、それにより、前記独特のバーコードを前記独特のランディング部位に組み入れるステップと
を含む方法。
前記核酸配列が、スクリーニング可能または選択可能なマーカーの転写をオンまたはオフにする調節配列をさらに含む、請求項１６に記載の方法。
前記核酸配列が、前記核酸誘導型ヌクレアーゼに適合しないＰＡＭ変異をさらに含む、請求項１６に記載の方法。
前記核酸配列が、その後の操作ラウンドのための第２の独特のランディング部位をさらに含む、請求項１６に記載の方法。
前記ポリヌクレオチドが、
ａ）改変された第１の標的核酸配列；
ｂ）第１のプロトスペーサー隣接モチーフ（ＰＡＭ）変異；および
ｃ）第１の標的核酸の一部と相補的な第１のスペーサー領域を含む第１のガイド核酸配列
を含む編集カセットをさらに含み、
前記独特のバーコードが、前記改変された標的核酸を前記独特のバーコードによって同定することができるように、前記改変された第１の標的核酸に対応する、請求項１６に記載の方法。