JP2024513236A

JP2024513236A - 複雑なゲノム領域を解析するための方法およびシステム

Info

Publication number: JP2024513236A
Application number: JP2023561289A
Authority: JP
Inventors: ガンターシャラー，
Original assignee: アールピーアールディーダイアグノスティックス，エルエルシー
Priority date: 2021-04-06
Filing date: 2022-04-05
Publication date: 2024-03-22
Also published as: EP4320266A1; AU2022255315A1; CA3216210A1; US20240209442A1; WO2022216711A1; CN117441026A

Abstract

複雑なゲノム領域を解析（例えば、配列決定、遺伝子型決定、構造解析）するための改善された方法が本明細書に提示される。一部の場合では、方法は、目的のゲノム領域をゲノムＤＮＡから切り出すための、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のガイドＲＮＡの対および内側のガイドＲＮＡの対の使用を伴う。方法は、目的の遺伝子領域を配列決定するための、ロングリードシーケンシングの使用をさらに伴う。一部の場合では、方法は、無増幅である。

Description

相互参照
本出願は、その全体が参照により本明細書に組み込まれる２０２１年４月６日出願の米国仮出願第６３／１７１，３８７号の利益を主張するものである。

配列表
本出願は、ＡＳＣＩＩフォーマットで電子的に提出されており、その全体が参照により本明細書に組み込まれる、配列表を含む。前記ＡＳＣＩＩコピーは、２０２２年４月５日に作成されたもので、名称は５７３１２－７０２＿６０１＿ＳＬ．ｔｘｔ、サイズは１０９，６５２バイトである。

背景
遺伝的変異は薬物適用に対する応答に影響を及ぼす可能性があるので、薬理遺伝学（ＰＧｘ）は個別化された薬物応答の決定を可能にする精密医療の構成要素である。ＰＧｘの利益としては、費用および薬物有害反応（ＳＡＤＲ）のリスクの低減、ならびに薬効の改善が挙げられる。現在多数のＰＧｘ遺伝子が試験されているが、シトクロムＰ４５０２Ｄ６（ＣＹＰ２Ｄ６）の診断的価値が極めて大きく、これは、全薬物の２５％に至るまでがＣＹＰ２Ｄ６によって活性化または代謝されるからである。これらの薬物としては、がん薬物、オピオイドアゴニスト、ならびに、いくつかの抗うつ薬および抗不安薬剤が挙げられる。ＣＹＰ２Ｄ６酵素はＣＹＰ２Ｄ６遺伝子によってコードされ、遺伝的変異により酵素機能の低下または完全な喪失が引き起こされる可能性がある。ＣＹＰ２Ｄ６は肝臓において主に発現され、肝臓での薬物代謝およびクリアランスの主要な一因である。ＣＹＰ２Ｄ６の遺伝的変異を正しく診断することに伴う問題はＳＡＤＲが発生するリスクに直接影響を及ぼし得る。ＮＩＨＣｌｉｎｉｃａｌＰｈａｒｍａｃｏｇｅｎｅｔｉｃｓＩｍｐｌｅｍｅｎｔａｔｉｏｎＣｏｎｓｏｒｔｉｕｍ（ＣＰＩＣ）は現在、ＣＹＰ２Ｄ６の臨床試験を支持するエビデンスに関連する５８種の薬物をリストアップしており、それにより、ＣＹＰ２Ｄ６は上位遺伝子のうちの１つになっている。米国だけでＣＹＰ２Ｄ６の試験は２０１９年には＄５２２Ｍの市場であり、年間の成長率は６～８％であると推定される。

現時点で、ＣＹＰ２Ｄ６に関して、高頻度のコピー数変異を含め、１００を超える薬理遺伝学的な関連性のある変更（＊スター対立遺伝子ハプロタイプとも称される）が記載されている。さらに、近接する高度に相同な（９４％同一まで）偽遺伝子（ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８）との遺伝子融合物およびハイブリッドにより変異体コーリングが複雑になる。米国では、約１３％の人がＣＹＰ２Ｄ６構造変異体を有し、これらの変異体は、当該遺伝子に関連する全ての変異のうちの７％を表す。これらの特色により、現行の試験プラットフォームを用いた遺伝子解析が複雑になり、希少なまたは複雑なハプロタイプの多くが正確に解析されない。多くのグループによる研究により、現在使用されている市販の遺伝子型決定プラットフォームでは、ＣＹＰ２Ｄ６の誤った特徴付けが生じやすいことが実証されている。これにより、間違った割り当てが導かれ、その結果、間違った投薬が推奨される。遺伝子の配列決定も、ショートリードに基づく場合（ＮＧＳ）または鋳型の長さに基づく場合（サンガーシーケンシング）に同様に妨害される。構造全体をより精密に決定するために標的化増幅、コピー数解析、および長距離ＰＣＲを組み合わせる多数の方法が開発されているが、これらの方法は、複雑なワークフロー、時間要件、および全体的な費用に起因して、常套的な臨床試験には適さない。

概要
複雑なゲノム領域を正確にかつ費用効果を大きく解析するための改善された方法およびシステムに対して満たされていない必要性が存在する。本開示は、この満たされていない必要性に合致する。

本開示の一態様では、目的のゲノム領域を解析（例えば、配列決定、遺伝子型決定、構造解析）する方法であって、ａ）目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ）（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップであって、それにより、目的のゲノム領域を含む第１の切り出された断片を生成する、ステップと、ｂ）第１の切り出された断片をＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップであって、それにより、目的のゲノム領域を含む第２の切り出された断片を生成する、ステップと、ｃ）第２の切り出された断片内に含有される目的のゲノム領域を解析するステップとを含む、方法が提供される。一部の場合では、ａ）のＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対が、第１の切り出された断片の５’末端および３’末端と会合し、それをブロックする。一部の場合では、方法は、ｂ）の前に、ａ）の産物を１種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムＤＮＡが消化され、第１の切り出された断片は消化されない、ステップをさらに含む。一部の場合では、１種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される。一部の場合では、外側のｇＲＮＡの対は、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡとを含む。一部の場合では、第１の外側のｇＲＮＡは、ゲノムＤＮＡに存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第２の外側のｇＲＮＡは、ゲノムＤＮＡに存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第１のヌクレオチド配列と第２のヌクレオチド配列は異なる。一部の場合では、第１のヌクレオチド配列と第２のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第１のヌクレオチド配列、第２のヌクレオチド配列、またはその両方は、ゲノムＤＮＡ内の、目的のゲノム領域から最大約１００キロベース長のところに存在する。一部の場合では、内側のｇＲＮＡの対は、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡとを含む。一部の場合では、第１の内側のｇＲＮＡは、ゲノムＤＮＡに存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第２の内側のｇＲＮＡは、ゲノムＤＮＡに存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第３のヌクレオチド配列と第４のヌクレオチド配列は異なる。一部の場合では、第３のヌクレオチド配列と第４のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第３のヌクレオチド配列および第４のヌクレオチド配列は、ゲノムＤＮＡ上の、第１のヌクレオチド配列および第２のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する。一部の場合では、第２の切り出された断片は、第１の切り出された断片よりも短い塩基長である。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域を配列決定することを含む。一部の場合では、ゲノムＤＮＡは、約１０μｇまたはそれよりも多い量で提供される。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域についての構造解析を実施することを含む。一部の場合では、方法は、ｂ）の前に、第１の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、ｃ）の前に、第２の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ｃ）の前に、第２の切り出された断片の５’末端、３’末端、またはその両方に１つまたは複数のアダプターを付着させるステップをさらに含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼまたはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４Ａ、およびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は、複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、目的の遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、目的の遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、第１の切り出された断片の長さは、少なくとも約０．０６キロベースである。一部の場合では、第１の切り出された断片の長さは、最大約２００キロベースである。一部の場合では、第２の切り出された断片の長さは、少なくとも約０．０２キロベースである。一部の場合では、第２の切り出された断片の長さが、最大約１９９．９８キロベースである。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。一部の場合では、目的のゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座である。一部の場合では、解析するステップは、ＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定することを含む。一部の場合では、方法は、遺伝的変異に基づいて、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨する。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、治療薬の投薬量を変更する。一部の場合では、外側のｇＲＮＡの対、内側のｇＲＮＡの対、またはその両方は、配列番号１～４１８のいずれか１つから選択される。

別の態様では、目的のゲノム領域を解析するためのキットであって、ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；ｂ）ｉ）ゲノムＤＮＡ内の目的のゲノム領域の上流に存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の外側のｇＲＮＡと、ｉｉ）ゲノムＤＮＡ内の目的のゲノム領域の下流に存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の外側のｇＲＮＡとを含む、外側のｇＲＮＡの対；ｃ）ｉｉｉ）ゲノムＤＮＡ内の目的のゲノム領域の上流に存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の内側のｇＲＮＡと、ｉｖ）ゲノムＤＮＡ内の目的のゲノム領域の下流に存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の内側のｇＲＮＡとを含む、内側のｇＲＮＡの対、を含み、第３のヌクレオチド配列および第４のヌクレオチド配列が、ゲノムＤＮＡ上の、第１のヌクレオチド配列および第２のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する、キットが提供される。一部の場合では、キットは、１種または複数種のエキソヌクレアーゼをさらに含む。一部の場合では、１種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、目的のゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含むゲノム遺伝子座である。一部の場合では、第１の外側のガイドＲＮＡ、第１の内側のガイドＲＮＡ、またはその両方は、配列番号３～１２、１７～２６、６８～７７、８２～２１４、および３４４～４１８のいずれか１つのヌクレオチド配列を含む。一部の場合では、第２の外側のガイドＲＮＡ、第２の内側のガイドＲＮＡ、またはその両方は、配列番号１、２、１３～１６、２７～６７、７８～８１、および２１５～３４３のいずれか１つのヌクレオチド配列を含む。一部の場合では、キットは、入れ子状ＣＲＩＳＰＲ反応にキットを使用するための指示をさらに含む。一部の場合では、キットは、目的のゲノム領域をゲノムＤＮＡから切り出すためにキットを使用するための指示をさらに含む。

一態様では、目的のゲノム領域を解析する方法であって、（ａ）目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣｌｕｓｔｅｒｅｄＲｅｇｕｌａｒｌｙＩｎｔｅｒｓｐａｃｅｄＳｈｏｒｔＰａｌｉｎｄｒｏｍｉｃＲｅｐｅａｔ）（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、それにより、切り出された目的のゲノム領域を生成する、ステップと、（ｂ）目的のゲノム領域を含むゲノムＤＮＡを単離するステップと、（ｃ）切り出された目的のゲノム領域を解析するステップとを含み、ＤＮＡ増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、切り出された目的のゲノム領域を配列決定することを含む。一部の場合では、解析するステップは、切り出された目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、切り出された目的の領域についての構造解析を実施することを含む。一部の場合では、（ｂ）の単離するステップは（ａ）の接触させるステップの前に実施される。一部の場合では、（ｂ）の単離するステップは（ａ）の接触させるステップの後に実施される。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、異なるヌクレオチド配列は目的のゲノム領域に隣接する。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼにより、目的のゲノム領域が、目的のゲノム領域に隣接するゲノム部位において切断される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、切り出された目的のゲノム領域の長さは少なくとも１０キロベースである。一部の場合では、切り出された目的のゲノム領域の長さは最大２５０キロベースである。一部の場合では、単離するステップは、高分子量ＤＮＡを単離することを含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも５０キロベースである。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ａ）の前に、ゲノムＤＮＡを脱リン酸化するステップをさらに含む。一部の場合では、脱リン酸化するステップは、ゲノムＤＮＡをホスファターゼで処理することを含む。一部の場合では、ホスファターゼはエビアルカリホスファターゼである。一部の場合では、方法は、脱リン酸化するステップの後に、ゲノムＤＮＡをターミナルトランスフェラーゼ（ＴｄＴ）で処理することをさらに含む。一部の場合では、方法は、切り出された目的のゲノム領域の末端にテールを付加する（ｅｎｄ－ｔａｉｌｉｎｇ）ステップをさらに含む。一部の場合では、末端にテールを付加するステップは、切り出された目的のゲノム領域の遊離の３’末端に１つまたは複数のアデノシンヌクレオチドを付加することを含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供される。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。

別の態様では、長さが少なくとも１０キロベースである目的の複雑なゲノム領域を解析する方法であって、（ａ）目的の複雑なゲノム領域を含むゲノムＤＮＡを提供するステップと、（ｂ）目的の複雑なゲノム領域を含む高分子量ＤＮＡを単離するステップと、（ｃ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域に隣接するステップと、（ｄ）目的の複雑なゲノム領域を解析するステップとを含み、ＤＮＡ増幅を伴わない、方法が提供される。一部の場合では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、（ｂ）の単離するステップは（ｃ）の接触させるステップの前に実施される。一部の場合では、（ｂ）の単離するステップは（ｃ）の接触させるステップの後に実施される。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも７５％の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、目的の複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して、ａ）の前に断片化も消化も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大２５０キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳）または固形組織試料である。一部の場合では、生体試料は、診断用試料である。

別の態様では、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を解析する方法であって、（ａ）当該遺伝子座を含むゲノムＤＮＡを提供するステップと、（ｂ）当該遺伝子座をゲノムＤＮＡから切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座に隣接する、ステップと、（ｃ）当該遺伝子座を解析するステップとを含む方法が提供される。一部の場合では、解析するステップは、当該遺伝子座を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、解析するステップは、当該遺伝子座を遺伝子型決定することを含む。一部の場合では、解析するステップは、当該遺伝子座の構造解析を実施することを含む。一部の場合では、方法は、ｃ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離することをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～４１８からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された遺伝子座の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。

さらに別の態様では、対象におけるＣＹＰ２Ｄ６の遺伝的変異を同定する方法であって、（ａ）対象から得たゲノムＤＮＡを含む生体試料を提供するステップと、（ｂ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、（ｃ）当該遺伝子座のロングリードシーケンシングを実施するステップと、（ｄ）対象のＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定するステップとを含む方法が提供される。一部の場合では、方法は、遺伝的変異に基づいて、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して処置または代替処置を推奨するステップをさらに含む。一部の場合では、方法は、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、対象に対して代替処置を推奨するステップをさらに含む。一部の場合では、方法は、同定するステップに基づいて、対象に対して治療薬のある投薬量を推奨するステップをさらに含む。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、方法は、治療薬の投薬量を変更するステップをさらに含む。一部の場合では、方法は、ｃ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離することをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも４０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座に隣接する。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～４１８からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳）または固形組織試料である。

さらに別の態様では、（ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；（ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに（ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含む組成物が提供される。一部の場合では、第１のガイドＲＮＡは、配列番号１、２、または１３～１６からなる群より選択されるヌクレオチド配列を含む。一部の場合では、第２のガイドＲＮＡは、配列番号３～１２または１７～２６からなる群より選択されるヌクレオチド配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。

さらに別の態様では、ＣＹＰ２Ｄ６を遺伝子型決定するためのキットであって、（ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；（ｂ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の上流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１のガイドＲＮＡ（ｇＲＮＡ）；ならびに（ｃ）ゲノムＤＮＡ内に存在するＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座の下流のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２のガイドＲＮＡ（ｇＲＮＡ）を含むキットが提供される。一部の場合では、第１のガイドＲＮＡは、配列番号１、２、または１３～１６からなる群より選択されるヌクレオチド配列を含む。一部の場合では、第２のガイドＲＮＡは、配列番号３～１２または１７～２６からなる群より選択されるヌクレオチド配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。

さらに別の態様では、目的の複雑なゲノム領域を解析するためのシステムであって、（ａ）（ｉ）目的の複雑なゲノム領域を含むゲノムＤＮＡから高分子量ＤＮＡを単離するステップと、（ｉｉ）目的の複雑なゲノム領域を切り出すために、ゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップであって、２つまたはそれよりも多くのｇＲＮＡが、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列が、目的の複雑なゲノム領域に隣接するステップと、（ｉｉｉ）目的の複雑なゲノム領域を解析して、データを生成するステップとを含み、ＤＮＡ増幅を伴わない、方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能に（ｏｐｅｒａｂｌｙ）カップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子型である。一部の場合では、出力は、目的の複雑なゲノム領域の遺伝子配列である。一部の場合では、出力は、目的の複雑なゲノム領域の構造解析である。一部の場合では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、（ｉ）の単離するステップを（ｉｉ）の接触させるステップの前に実施する。一部の場合では、（ｉ）の単離するステップを（ｉｉ）の接触させるステップの後に実施する。一部の場合では、高分子量ＤＮＡの長さは少なくとも１０キロベースである。一部の場合では、目的の複雑なゲノム領域は、標的遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも７５％の配列同一性を有する。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む。一部の場合では、目的の複雑なゲノム領域は、ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、目的の複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的の複雑なゲノム領域は、高度に多型の遺伝子座である。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡをａ）の前に制限酵素消化に供さない。一部の場合では、目的の複雑なゲノム領域の長さは最大２５０キロベースである。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。

さらに別の態様では、対象のＣＹＰ２Ｄ６の遺伝的変異を同定するためのシステムであって、（ａ）（ｉｉ）ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座を切り出すために、対象から得たゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのｇＲＮＡと接触させるステップと、（ｉｉｉ）当該遺伝子座のロングリードシーケンシングを実施して、配列決定データを生成するステップとを含む方法により生成された配列決定データを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、配列決定データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は、ＣＹＰ２Ｄ６の遺伝的変異を同定するものである。一部の場合では、出力は、ＣＹＰ２Ｄ６の機能の低下、喪失、または増大を同定するものである。一部の場合では、レポートは、遺伝的変異に基づいて、対象に対して処置を推奨するものである。一部の場合では、レポートは、遺伝的変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。一部の場合では、レポートは、遺伝的変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、ＣＹＰ２Ｄ６によって活性化または代謝される治療薬である。一部の場合では、方法は、（ｉｉ）の前に、当該遺伝子座を含む高分子量ＤＮＡを単離するステップをさらに含む。一部の場合では、高分子量ＤＮＡの長さは少なくとも４０キロベースである。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは、それぞれ、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、異なるヌクレオチド配列は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座に隣接する。一部の場合では、２つまたはそれよりも多くのｇＲＮＡは配列番号１～２６からなる群より選択されるヌクレオチド配列を含む。一部の場合では、遺伝子座の長さは少なくとも４０キロベースである。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ａ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ａ）の前に制限酵素消化に供さない。一部の場合では、方法は、切り出された目的のゲノム領域の一方の末端または両方の末端に１つまたは複数の配列決定アダプターをライゲーションするステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。

別の態様では、目的のゲノム領域を解析するためのシステムであって、（ａ）（ｉ）目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップであって、それにより、目的のゲノム領域を含む第１の切り出された断片を生成する、ステップと、（ｉｉ）第１の切り出された断片をＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップであって、それにより、目的のゲノム領域を含む第２の切り出された断片を生成する、ステップと、（ｉｉｉ）第２の切り出された断片内に含有される目的のゲノム領域を解析するステップとを含む方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。一部の場合では、出力はレポートである。一部の場合では、出力は目的のゲノム領域の遺伝子型である。一部の場合では、出力は、目的のゲノム領域の遺伝子配列である。一部の場合では、出力は、目的のゲノム領域の構造解析である。一部の場合では、解析するステップは、目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、目的のゲノム領域の構造解析を実施することを含む。一部の場合では、解析するステップは、目的のゲノム領域を配列決定することを含む。一部の場合では、配列決定することは、ロングリードシーケンシングを含む。一部の場合では、ロングリードシーケンシングは、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む。一部の場合では、（ｉ）のＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対が、第１の切り出された断片の５’末端および３’末端と会合し、それをブロックする。一部の場合では、方法は、（ｉｉ）の前に、（ｉ）の産物を１種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムＤＮＡが消化され、第１の切り出された断片は消化されない、ステップをさらに含む。一部の場合では、１種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される。一部の場合では、外側のｇＲＮＡの対は、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡとを含む。一部の場合では、第１の外側のｇＲＮＡは、ゲノムＤＮＡに存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第２の外側のｇＲＮＡは、ゲノムＤＮＡに存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第１のヌクレオチド配列と第２のヌクレオチド配列は異なる。一部の場合では、第１のヌクレオチド配列と第２のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第１のヌクレオチド配列、第２のヌクレオチド配列、またはその両方は、ゲノムＤＮＡ内の、目的のゲノム領域から最大約１００キロベース長のところに存在する。。一部の場合では、内側のｇＲＮＡの対は、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡとを含む。一部の場合では、第１の内側のｇＲＮＡは、ゲノムＤＮＡに存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、第２の内側のｇＲＮＡは、ゲノムＤＮＡに存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一部の場合では、第３のヌクレオチド配列と第４のヌクレオチド配列は異なる。一部の場合では、第３のヌクレオチド配列と第４のヌクレオチド配列は、目的のゲノム領域に隣接する。一部の場合では、第３のヌクレオチド配列および第４のヌクレオチド配列は、ゲノムＤＮＡ上の、第１のヌクレオチド配列および第２のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する。一部の場合では、第２の切り出された断片は、第１の切り出された断片よりも短い塩基長である。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域を配列決定することを含む。一部の場合では、ゲノムＤＮＡは、約１０μｇまたはそれよりも多い量で提供される。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域を遺伝子型決定することを含む。一部の場合では、解析するステップは、第２の切り出された断片内に含有される目的のゲノム領域についての構造解析を実施することを含む。一部の場合では、方法は、（ｉｉ）の前に、第１の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、（ｉｉｉ）の前に、第２の切り出された断片を単離するステップをさらに含む。一部の場合では、方法は、ＤＮＡ増幅を伴わない。一部の場合では、方法は、（ｉｉｉ）の前に、第２の切り出された断片の５’末端、３’末端、またはその両方に１つまたは複数のアダプターを付着させるステップをさらに含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼまたはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである。一部の場合では、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１からなる群より選択される。一部の場合では、クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄからなる群より選択される。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、Ｃａｓ９またはその変異体である。一部の場合では、Ｃａｓ９は、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である。一部の場合では、Ｃａｓ９変異体は、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む。一部の場合では、ゲノムＤＮＡに対して（ｉ）の前に断片化も消化もせん断も行わない。一部の場合では、ゲノムＤＮＡを（ｉ）の前に制限酵素消化に供さない。一部の場合では、目的のゲノム領域は、複雑なゲノム領域である。一部の場合では、複雑なゲノム領域は、目的の遺伝子および１つまたは複数のその偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、目的の遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む。一部の場合では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、高度に多型の遺伝子座である。一部の場合では、第１の切り出された断片の長さは、少なくとも約０．０６キロベースである。一部の場合では、第１の切り出された断片の長さは、最大約２００キロベースである。一部の場合では、第２の切り出された断片の長さは、少なくとも約０．０２キロベースである。一部の場合では、第２の切り出された断片の長さが、最大約１９９．９８キロベースである。一部の場合では、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない。一部の場合では、方法は、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法（ｒａｍｉｆｉｃａｔｉｏｎａｍｐｌｉｆｉｃａｔｉｏｎｍｅｔｈｏｄ）のいずれも伴わない。一部の場合では、ゲノムＤＮＡは、生体試料で提供されるまたは得られる。一部の場合では、生体試料は、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物（ｇｌａｎｄｕｌａｒｓｅｃｒｅｔｉｏｎ）、眼内液（ｏｃｕｌａｒｆｌｕｉｄ）、母乳）または固形組織試料を含む。一部の場合では、生体試料は、診断用試料である。一部の場合では、目的のゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座である。一部の場合では、解析するステップは、ＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定することを含む。一部の場合では、出力は、遺伝的変異に基づいた、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有することの同定を含む。一部の場合では、出力は、同定に基づいた、対象に対する処置または代替処置の推奨を含む。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、出力は、対象に対する代替処置の推奨をさらに含む。一部の場合では、出力は、同定に基づいた、対象に対する治療薬のある投薬量の推奨をさらに提供するものである。一部の場合では、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、出力は、治療薬の投薬量を変更するための推奨をさらに含む。一部の場合では、外側のｇＲＮＡの対、内側のｇＲＮＡの対、またはその両方は、配列番号１～４１８のいずれか１つから選択されるｇＲＮＡを含む。

参照による組込み
本明細書において言及されている全ての刊行物、特許および特許出願は、個々の刊行物、特許、または特許出願が、具体的にかつ個々に参照により組み込まれることが示されたものと同じく参照により本明細書に組み込まれる。

本開示の新規の特色は、添付の特許請求の範囲において詳細に記載されている。本開示の原理が利用される例示的な実施形態が記載されている以下の詳細な説明および付属図を参照することにより、本開示の特色および利点のよりよい理解が得られよう。

図１は、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を示す。パネルＡは、ＣＹＰ２Ｄ６遺伝子の単一コピーを含有する参照遺伝子座のＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８に対する配向を示す。完全なＣＹＰ２Ｄ６欠失（パネルＢ）、重複（パネルＣ）、および５’（パネルＤ）または３’（パネルＥ）のいずれかのＣＹＰＤ６／ＣＹＰＤ７ハイブリッド対立遺伝子の存在を含めたＣＹＰ２Ｄ６遺伝子コピー数変異の複雑さを例示する構造変異体の代表的な例。そのような配置での重複した遺伝子は、多くの場合、１．６ｋｂの長いスペーサー配列を含むＣＹＰ２Ｄ７様下流領域を有する。５’－３’の配向は参照配列（ＮＧ＿００８３７６．３）に対して示されている。

図２は、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を単離し、配列決定する方法を示すフローチャートの非限定的な例を示す。

図３は、本明細書に提示される実施形態によるゲノムＤＮＡ抽出の比較の非限定的な例を示す。レーンＡは改変された高分子量プロトコールを用いてリンパ芽球様細胞株（ＬＣＬ）細胞から抽出された５０ｎｇのｇＤＮＡ（＞５０ｋｂ）であり、レーンＢはＭａｘｗｅｌｌＲａｐｉｄＳａｍｐｌｅＣｏｎｃｅｎｔｒａｔｏｒ（ＲＳＣ）を用いて抽出された５０ｎｇのｇＤＮＡ（約１０～４８ｋｂ）であり、レーンＣは５０ｎｇのｇＤＮＡ対照（Ｃｏｒｉｅｌｌ；約１０ｋｂ～５０ｋｂ）であり、レーンＤはラムダファージＤＮＡ（約５０ｋＤａ；ＮＥＢ）であり、レーンＥはＨＩＮＤＩＩＩラムダファージ消化物である。

図４Ａおよび図４Ｂは、本明細書に提示される実施形態によるＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの設計および検証の非限定的な例を示す。図４Ａは、対立遺伝子ＣＹＰ２Ｄ６およびハイブリッド対立遺伝子を捕捉するために必要なＣＲＩＳＰＲカット部位の概略図を示す。図４Ｂは、標的部位のＣＲＩＳＰＲＣｕｔＸＬ－ＰＣＲアンプリコンを示す。試料ＡにはｓｇＲＮＡを伴わないＣａｓ９を加え、試料ＢにはｓｇＲＮＡ＿１を伴うＣａｓ９を加え、試料ＣにはｓｇＲＮＡ＿２を伴うＣａｓ９を加えた。

図５Ａおよび図５Ｂは、本開示の実施形態によるゲノムＤＮＡ上のＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの効率の非限定的な例を示す。図５Ａは、ＣＹＰ２Ｄ６の上流および下流の領域のｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物のゲル画像を示す。レーンＣは対照である。図５Ｂは、陰性対照に対して正規化した、未カットｇＤＮＡのパーセンテージを示す。＊＝Ｐ値＜０．０１０。

図６は、本開示の実施形態によるＸＬ－ＰＣＲおよびＮＧＳに基づく解析手法のＮＧＳアラインメントの非限定的な例を示す。

図７Ａ～７Ｃは、本開示の実施形態によるＣＹＰ２Ｄ６遺伝子座の代替のＣＲＩＳＰＲ／Ｃａｓ９設計手法に伴う問題の非限定的な例を示す。カット部位がはさみで示されている。Ｘは、Ａ対立遺伝子に示されている設計によりＢ～Ｅ対立遺伝子配置での望ましくないカットが生じる対立遺伝子を表す。同上。同上。

図８は、ＣＹＰ２Ｄ６遺伝子座の包括的な標的設計の非限定的な例を示す。カット部位がはさみで示されている。チェックマークは、Ａ対立遺伝子に示されている設計により、Ｂ～Ｅ対立遺伝子配置でオンターゲットのカットのみが生じる対立遺伝子を表す。

図９Ａ～９Ｃは、ＣＹＰ２Ｄ６遺伝子座を標的とするｓｇＲＮＡの設計および検証の非限定的な例を示す。図９Ａは、対立遺伝子ＣＹＰ２Ｄ６およびハイブリッド対立遺伝子を捕捉するための標的に対する必要なカット部位の概略図を示す。図９Ｂおよび図９Ｃは、標的部位のＣＲＩＳＰＲＣｕｔＸＬ－ＰＣＲアンプリコンを示す。試料ＡにはｓｇＲＮＡを伴わないＣａｓ９を加え、試料ＢにはｓｇＲＮＡ＿１を伴うＣａｓ９を加え、試料ＣにはｓｇＲＮＡ＿２を伴うＣａｓ９を加えた。同上。

図１０は、本開示の実施形態による単離された高分子量ＤＮＡの非限定的な例を示す。ラムダ対照およびＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅからの予め抽出されたＤＮＡと比較した、ＬＣＬ細胞ペレットから抽出された高分子量ゲノムＤＮＡ１００ｎｇの２％ＤＮＡアガロースゲル。

図１１Ａおよび図１１Ｂは、本明細書に開示される実施形態による配列決定実行カバレッジの非限定的な例を示す。同上。

図１２Ａおよび図１２Ｂは、本明細書に開示される実施形態による配列アラインメントサイズの非限定的な例を示す。同上。

図１３は、本明細書に開示される実施形態によるアラインメントプロットの非限定的な例を示す。１２１×カバレッジの標的化される捕捉領域が達成された。囲み枠はＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７の概略である。

図１４は、本明細書に開示される実施形態によるｓｇＲＮＡ特異性を示すＳａｓｈｉｍｉプロットの非限定的な例を示す。このプロットは、２つの配列決定実行についてアラインメントされた領域を示す。上部のアラインメントは、目的の領域（ＲＯＩ）（ｃｈｒ２２：４２，１２２，１１５－４１，１６１，３２０）が捕捉されるように設計されたｓｇＲＮＡを使用した実行からの配列データを示す。下部のアラインメントは、同じＤＮＡ試料に対して、逆の鎖を標的とするｓｇＲＮＡを使用して実施した富化を示す。

図１５は、本明細書に開示される実施形態による複数の複雑な構造配置についてのｓｇＲＮＡ特異性を示すＳａｓｈｉｍｉプロットの非限定的な例を示す。このプロットは、４つの配列決定実行についてアラインメントされた領域を示す。実行からの配列データは、目的の領域（ＲＯＩ）（ｃｈｒ２２：４２，１２２，１１５－４１，１６１，３２０）が捕捉されるように設計されたｓｇＲＮＡを使用したものであり、４つの異なる構造的事象：（１）１つの対立遺伝子におけるＣＹＰ２Ｄ６の欠失；（２）１つの対立遺伝子におけるＣＹＰ２Ｄ６とのタンデムなハイブリッド対立遺伝子；（３）１つの対立遺伝子における重複事象；ならびに（４）１つの対立遺伝子におけるＣＹＰ２Ｄ６の欠失および第２の対立遺伝子におけるＣＹＰ２Ｄ６の重複を含む。

図１６は、本明細書に提示される実施形態に従ったコンピュータシステムの非限定的な例を示す。

図１７は、本明細書に提示される実施形態に従って複雑な目的のゲノム領域を解析するための入れ子状富化手法の非限定的な例を示す。

図１８は、複雑な目的のゲノム領域を解析するための入れ子状富化手法を使用した場合のＲＯＩについての非限定的な代表的な倍数変化（ｆｏｌｄｃｈａｎｇｅ）データを示す。この図に示されている通り、ＤＮＡ消化およびその後の第２の内側のｇＲＮＡを用いたＣＲＩＳＰＲ反応の前に異なる外側のｇＲＮＡの対を使用して入れ子状富化を実施することにより、内側のｇＲＮＡのみを受けた試料と比較して、下流の適用のためのＲＯＩの有意な富化が生じた。

詳細な説明
目的のゲノム領域（ＲＯＩ）（例えば、ゲノムＤＮＡ由来）を解析するための方法が本明細書に開示される。目的の領域は、例えば、複雑な（例えば、高度に複雑な）ゲノム領域であり得る。複雑なゲノム領域は、例えば、高度に多型の領域、標的遺伝子および標的遺伝子に対して高い配列相同性を有する１つまたは複数の偽遺伝子を含む領域、１つまたは複数の反復エレメント、１つまたは複数の逆位、１つまたは複数の挿入、１つまたは複数の重複、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾンを含む領域などを含み得る。本明細書に提示される方法は、一般に、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび２つまたはそれよりも多くのガイドＲＮＡ（ｇＲＮＡ）を使用して目的の領域をゲノムＤＮＡから切り出すことを伴う。

一態様では、本開示は、複雑な目的のゲノム領域を富化し、解析するための入れ子状富化手法を提供する。入れ子状富化手法は、一般に、ＣＲＩＳＰＲ関連エンドヌクレアーゼを外側のｇＲＮＡの対（例えば、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡ）および／または内側のｇＲＮＡの対（例えば、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡ）と組み合わせて使用することを伴う。方法は、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対を使用して目的のゲノム領域を含有するゲノムＤＮＡから断片を切り出して、目的のゲノム領域を含む第１の切り出された断片を生成することを伴う。方法は、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対を使用して第１の切り出された断片からより小さな断片を切り出して、目的のゲノム領域を含む第２の切り出された断片を生成することをさらに含む。一部の場合では、方法は、１種または複数種のエキソヌクレアーゼを用いてバックグラウンドＤＮＡを消化することをさらに伴う。

本明細書に提示される方法は、目的のゲノム領域（例えば、第２の断片上に位置する）を解析すること（例えば、例えばロングリードシーケンシング法によって配列決定することによって、遺伝子型決定することによって、構造解析を実施することによって）をさらに含む。ＣＹＰ２Ｄ６遺伝子座（例えば、標的遺伝子であるＣＹＰ２Ｄ６、ならびに偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）を解析する方法が本明細書にさらに提示される。有利に、一部の実施形態では、方法は、ＤＮＡ増幅の使用を伴わない（例えば、無増幅）。方法により、複雑な（例えば、高度に複雑な）ゲノム領域の配列決定の正確度を改善する（例えば、配列決定の誤り率を低下させる）ことができ（例えば、伝統的な方法と比較して）、かつ／または、複雑な（例えば、高度に複雑な）ゲノム領域の配列決定のための時間を短縮することができ（例えば、伝統的な方法と比較して）、かつ／または、複雑なゲノム（例えば、高度に複雑な）領域（例えば、伝統的な方法と比較して）の配列決定の費用を低減することができる。さらに、本明細書に提示される方法により、標準的なＣＲＩＳＰＲに基づく手法よりも高度な出発材料（例えば、より高度な量のゲノムＤＮＡ）を使用することが可能になり得る。本明細書に提示される方法を実施するためのシステム、ならびに、目的のゲノム領域（例えば、ＣＹＰ２Ｄ６遺伝子座（例えば、ＣＹＰ２Ｄ６遺伝子座をゲノムＤＮＡから切り出すための））を切り出すＣＲＩＳＰＲ関連エンドヌクレアーゼおよび２種またはそれよりも多くのｇＲＮＡを含む組成物およびキットがさらに本明細書に提示される。

本明細書および添付の特許請求の範囲において使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」、および「その（ｔｈｅ）」は、文脈により明確に別段の規定がなされない限り、複数の指示対象を包含する。特許請求の範囲はいかなる必要に応じた要素も排除されるように起草され得ることにも留意する。したがって、この記述は、特許請求の範囲の要素の列挙に関連して、例えば「単に（ｓｏｌｅｌｙ）」、「のみ（ｏｎｌｙ）」などの排他的な用語の使用、または、「否定的な」限定の使用の前提としての機能を果たすものとする。

ある特定の範囲または数は、本明細書では、「約」という用語が先行する数値で提示される。「約」という用語は、本明細書では、この用語が指す数のプラスまたはマイナス１％、２％、３％、４％、または５％を意味するように使用される。本明細書で使用される場合、「対象」および「個体」という用語は互換的に使用され、哺乳動物（例えば、ヒトまたは非ヒト動物）を含めた任意の動物であり得る。

本明細書で使用される場合、「ＣＹＰ２Ｄ６」という用語は、ＣＹＰ２Ｄ６遺伝子または任意のその構造変異体または単一遺伝子コピー変異体を指し得る。ＣＹＰ２Ｄ６の構造変異体は、遺伝子融合物、近接する高度に相同な偽遺伝子（例えば、ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８）とのハイブリッド、コピー数変異（ＣＮＶ）、遺伝子重複および増殖（ｍｕｌｔｉｐｌｉｃａｔｉｏｎ）、タンデムリピート、および再配列を含み得る。ＣＹＰ２Ｄ６構造変異体の１つの例は、ＣＹＰ２Ｄ６のエクソン９にＣＹＰ２Ｄ７由来配列が存在することである（「エクソン９変換」と称される）。単一遺伝子コピー変異体は、一塩基多型（ＳＮＰ）またはヌクレオチドの挿入もしくは欠失（インデル）を包含し得る。ＣＹＰ２Ｄ６の対立遺伝子は、これだけに限定されないが、＊１、＊１ｘＮ、＊２、＊２ｘＮ、＊２Ａ、＊２ＡｘＮ、＊３５、＊３５ｘＮ、＊９、＊９ｘＮ、＊１０、＊１０ｘＮ、＊１７、＊１７ｘＮ、＊２９、＊２９ｘＮ、＊３６－＊１０、＊３６－＊１０ｘＮ、＊３６ｘＮ－＊１０、＊３６ｘＮ－＊１０ｘＮ、＊４１、＊４１ｘＮ、＊３、＊３ｘＮ、＊４、＊４ｘＮ、＊４Ｎ、＊５、＊６、＊６ｘＮ、＊３６、および＊３６ｘＮのいずれか１つを含めた構造変異体または単一遺伝子コピー変異体であり得る。一部の場合では、ＣＹＰ２Ｄ６の各対立遺伝子は、異なる構造変異体または単一遺伝子コピー変異体である。一部の場合では、ＣＹＰ２Ｄ６の各対立遺伝子は同一である。

「ＣＹＰ２Ｄ６遺伝子座」という用語は、本明細書で使用される場合、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含むゲノム領域を指す。ヒトでは、ＣＹＰ２Ｄ６遺伝子座は２２番染色体上に見いだされる。一部の実施形態では、本明細書に提示される方法は、ＣＹＰ２Ｄ６遺伝子座（例えば、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）の一部分または全体を解析すること（例えば、配列決定すること、遺伝子型決定すること、構造解析を実施すること）を伴う。一部の実施形態では、本明細書に提示される方法は、ＣＹＰ２Ｄ６遺伝子座（例えば、ＣＹＰ２Ｄ６遺伝子、ならびに高度に相同な偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む）の一部分または全体をゲノムＤＮＡから切り出すこと（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよびＣＹＰ２Ｄ６遺伝子座に隣接するゲノム配列を標的とする２つまたはそれよりも多くのｇＲＮＡを使用することによって）を伴う。

本明細書で使用される場合、「ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系」という用語は、ガイドＲＮＡ（ｇＲＮＡ）とＣＲＩＳＰＲ関連エンドヌクレアーゼ（Ｃａｓタンパク質）とを含む複合体を指す。「ＣＲＩＳＰＲ」という用語は、クラスター化された規則的な配置の短い回文配列リピートおよびその関連する系を指し得る。ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系は、クラス１またはクラス２ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系であり得る。ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系は、Ｉ型、ＩＩ型、ＩＩＩ型、ＩＶ型、Ｖ型、またはＶＩ型ＣＲＩＳＰＲ／Ｃａｓヌクレアーゼ系であり得る。ｇＲＮＡは、Ｃａｓタンパク質と相互作用して、Ｃａｓタンパク質のヌクレアーゼ活性を標的配列に方向付けることができる。標的配列は、「プロトスペーサー」および「プロトスペーサー隣接モチーフ」（ＰＡＭ）を含み得、どちらのドメインもＣａｓに媒介される活性（例えば、切断）に必要であり得る。ｇＲＮＡは、プロトスペーサーの逆の鎖上の結合部位と対合（またはそれとハイブリダイズ）して、Ｃａｓを標的配列に方向付ける。ＰＡＭ部位は、Ｃａｓタンパク質によって認識される短い配列を指し得、一部の場合では、Ｃａｓタンパク質活性に必要であり得る。

本明細書で使用される場合、「Ｃａｓ」または「Ｃａｓタンパク質」という用語は、エンドヌクレアーゼ活性を有するＣＲＩＳＰＲ／Ｃａｓ系のタンパク質またはＣＲＩＳＰＲ／Ｃａｓ系に由来するタンパク質を指す。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書で使用される場合、Ｃａｓタンパク質である。Ｃａｓタンパク質は、天然に存在するＣａｓタンパク質、天然に存在しないＣａｓタンパク質、またはそれらの断片であり得る。一部の場合では、Ｃａｓタンパク質は、天然に存在するＣａｓタンパク質の変異体（例えば、天然に存在するＣａｓタンパク質と比べて１つまたは複数のアミノ酸置換、挿入、欠失などを有する）である。一部の場合では、Ｃａｓタンパク質はクラスＩＣａｓタンパク質であり、非限定的な例として、Ｃａｓ３、Ｃａｓ８ａ、Ｃａｓ５、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃａｓ１０、Ｃｓｘ１１、Ｃｓｘ１０、およびＣｓｆ１が挙げられる。一部の場合では、Ｃａｓタンパク質はクラスＩＩＣａｓタンパク質であり、非限定的な例として、Ｃａｓ９、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ａ（Ｃｐｆ１）、Ｃａｓ１２ｂ（Ｃ２ｃ１）、Ｃａｓ１２ｃ（Ｃ２ｃ３）、Ｃａｓ１３ａ（Ｃ２ｃ２）、Ｃａｓ１３ｂ、Ｃａｓ１３ｃ、およびＣａｓ１３ｄが挙げられる。一部の場合では、Ｃａｓタンパク質はＣａｓ９である。一部の場合では、Ｃａｓタンパク質はＣａｓ１２ａである。

「ガイドＲＮＡ」または「ｇＲＮＡ」という用語は、本明細書では互換的に使用され、一般に、Ｃａｓタンパク質に結合し、Ｃａｓタンパク質の標的ポリヌクレオチド（例えば、ＤＮＡ）内の特定の位置へのターゲティングを補助することができるＲＮＡ分子（または集合的にＲＮＡ分子の群）を指す。ガイドＲＮＡは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）セグメント、および、必要に応じて、トランス活性化ｃｒＲＮＡ（ｔｒａｃｒＲＮＡ）セグメントを含み得る。「ｃｒＲＮＡ」という用語は、本明細書で使用される場合、ポリヌクレオチド標的化ガイド配列、ステム配列、および必要に応じて５’突出配列を含むＲＮＡ分子またはその一部を指し得る。ｃｒＲＮＡは結合部位に結合することができる。「ｔｒａｃｒＲＮＡ」という用語は、本明細書で使用される場合、タンパク質結合セグメント（例えば、タンパク質結合セグメントは、ＣＲＩＳＰＲ関連タンパク質、例えばＣａｓ９と相互作用することが可能である）を含むＲＮＡ分子またはその一部を指し得る。「ガイドＲＮＡ」という用語は、単一ガイドＲＮＡ（ｓｇＲＮＡ）を指し得、ここで、ｃｒＲＮＡセグメントと必要に応じたｔｒａｃｒＲＮＡセグメントは同じＲＮＡ分子内に位置する。「ガイドＲＮＡ」という用語は、集合的に、２つまたはそれよりも多くのＲＮＡ分子の群も指し得、ここで、ｃｒＲＮＡとｔｒａｃｒＲＮＡは別々のＲＮＡ分子内に位置する。

「ロングリードシーケンシング」という用語（「第３世代シーケンシング」とも称される）は、本明細書で使用される場合、一般に、第２世代シーケンシングよりも実質的に長いシーケンシングリード（＞１０，０００ｂｐ）を生成することが可能な任意の配列決定法を指す。一部の実施形態では、本明細書に提示される方法は、ロングリードシーケンシングの使用（例えば、目的の複雑なゲノム領域を遺伝子型決定するため）を伴う。ロングリードシーケンシング系の非限定的な例としては、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｙ、Ｑｕａｎｔａｐｏｒｅ、Ｓｔｒａｔｏｓ、およびＨｅｌｉｃｏｓによって開発されたものが挙げられる。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（ＳＭＲＴ）（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓによって開発されたもの）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｙによって開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の場合では、ロングリードシーケンシングは、現在開発中であるか、または今後開発されるあらゆるロングリードシーケンシング法または系（例えば、第３世代シーケンシング法または系）を包含する。

「核酸増幅」という用語は、本明細書で使用される場合、一般に、単一の核酸分子から標的核酸（例えば、ＤＮＡ）の多数のコピーを生成する任意の方法を指す。標的核酸は、ＤＮＡの場合もあり（例えば、ＤＮＡ増幅）、ＲＮＡの場合もある（例えば、ＲＮＡ増幅）。核酸増幅は、ポリメラーゼ連鎖反応（ＰＣＲ）およびありとあらゆるその変形形態または改変、ならびに、例えば、これだけに限定されないが、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）などの代替的な型の核酸増幅法を含む。本開示の種々の態様では、本明細書に提示される方法は、核酸（例えば、ＤＮＡ）増幅の使用を伴わない（例えば、無増幅）。

本開示の方法

本明細書の開示は、一般に、目的のゲノム領域（例えば、複雑な目的のゲノム領域）を富化し、解析（例えば、配列決定、遺伝子型決定、構造解析）するための入れ子状富化手法を提供する。種々の態様では、方法は、目的のゲノム領域（例えば、複雑な目的のゲノム領域）を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップであって、それにより、目的のゲノム領域を含む第１の切り出された断片を生成する、ステップを含む。種々の態様では、方法は、第１の切り出された断片をＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップであって、それにより、目的のゲノム領域を含む第２の（例えば、より小さな）切り出された断片を生成する、ステップをさらに含む。種々の態様では、方法は、目的のゲノム領域（例えば、第２の切り出された断片内に存在する）を解析（例えば、配列決定、遺伝子型決定、構造解析）するステップをさらに含む。

種々の態様では、方法は、目的のゲノム領域（例えば、複雑な目的のゲノム領域）を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップを伴う。外側のｇＲＮＡの対は、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡとを含み得る。

第１の外側のｇＲＮＡと第２の外側のｇＲＮＡは、ゲノムＤＮＡ内に存在するヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一般に、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡは、ゲノムＤＮＡ内に存在する異なるヌクレオチド配列と実質的に相補的である。第１の外側のｇＲＮＡ配列と第２の外側のｇＲＮＡ配列は、それらが、目的のゲノム領域に隣接するヌクレオチド配列と実質的に相補的になるように選択される。例えば、第１の外側のｇＲＮＡは目的のゲノム領域の上流のヌクレオチド配列と実質的に相補的であり得、第２の外側のｇＲＮＡは目的のゲノム領域の下流のヌクレオチド配列と実質的に相補的であり得る、またはその逆であり得る。一般に、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させるステップにより、目的のゲノム領域（例えば、複雑な目的のゲノム領域）を含有するゲノムＤＮＡの断片（例えば、第１の切り出された断片）が切り出される。

第１の外側のｇＲＮＡと第２の外側のｇＲＮＡは、目的のゲノム領域から最大約３０キロベースの塩基長（例えば、上流および／または下流）のところにあるヌクレオチド配列（例えば、ゲノムＤＮＡ内に存在する）と実質的に相補的であり得る。例えば、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡは、目的のゲノム領域から少なくとも約５キロベース、少なくとも約１０キロベース、少なくとも約１５キロベース、少なくとも約２０キロベース、少なくとも約２５キロベース、またはそれよりも長い塩基長（例えば、上流および／または下流）のところにあるヌクレオチド配列（例えば、ゲノムＤＮＡ内に存在する）と実質的に相補的であり得る。

理論に束縛されることを望むものではないが、第１の断片が切り出された後、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対は第１の切り出された断片の５’末端および３’末端と会合したまま、それをブロックすると考えられる。有利なことに、この特色を使用して、バックグラウンドゲノムＤＮＡを除去することができる。好ましい一実施形態では、第１の切り出された断片（および残りのゲノムＤＮＡ）を１種または複数種のエキソヌクレアーゼと接触させる。１種または複数種のエキソヌクレアーゼにより、バックグラウンドＤＮＡを消化することが可能であるが、一方、ブロックされた断片はインタクトなまま残される。１種または複数種のエキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択することができる。

種々の態様では、方法は、第１の切り出された断片（例えば、目的のゲノム領域を含有する）を、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップをさらに含む。一部の場合では、接触させるステップを、本明細書に記載の通り、第１の切り出された断片（および残りのゲノムＤＮＡ）を１種または複数種のエキソヌクレアーゼと接触させた後に行う。内側のｇＲＮＡの対は、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡとを含み得る。

第１の内側のｇＲＮＡと第２の内側のｇＲＮＡは、第１の切り出された断片（例えば、本明細書に記載の通り、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させるステップによって生成される）内に存在するヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む。一般に、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡは、第１の切り出された断片（例えば、本明細書に記載の通り、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させるステップによって生成される）に存在する異なるヌクレオチド配列と実質的に相補的である。第１の内側のｇＲＮＡ配列と第２の内側のｇＲＮＡ配列は、それらが、目的のゲノム領域に隣接するヌクレオチド配列と実質的に相補的になるように選択される。例えば、第１の内側のｇＲＮＡは目的のゲノム領域の上流のヌクレオチド配列と実質的に相補的であり得、第２の内側のｇＲＮＡは目的のゲノム領域の下流のヌクレオチド配列と実質的に相補的であり得る、またはその逆であり得る。一般に、目的のゲノム領域を含有する第１の切り出された断片（例えば、本明細書に記載の通り、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させるステップによって生成される）をＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させることにより、目的のゲノム領域を含有する第２の断片（例えば、第２の切り出された断片）が切り出される。

第１の内側のｇＲＮＡと第２の内側のｇＲＮＡは、目的のゲノム領域から約０．０６キロベースから約２００キロベースまでの塩基長（例えば、上流および／または下流）のところにあるヌクレオチド配列（例えば、第１の切り出された断片内に存在する）と実質的に相補的であり得る。一般に、内側のｇＲＮＡの対は、入れ子状であり、したがって、外側のｇＲＮＡの対よりも目的のゲノム領域に近い塩基長のところにあるヌクレオチド配列と実質的に相補的である。言い換えると、内側のｇＲＮＡの対を本明細書に記載のＣＲＩＳＰＲ関連エンドヌクレアーゼと併せて使用すると、それにより、第１の切り出された断片からより小さな断片（例えば、第２の切り出された断片）が切り出される。第２の切り出された断片は、目的のゲノム領域（例えば、その全体）を含むことが好ましい。

種々の態様では、方法は、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを単離するステップを伴う。一部の実施形態では、方法は、高分子量ゲノムＤＮＡを富化させることを伴う。一部の実施形態では、高分子量ゲノムＤＮＡは、少なくとも約１０キロベースの長さである。例えば、高分子量ゲノムＤＮＡは、少なくとも約１０キロベースの長さ、少なくとも約１５キロベースの長さ、少なくとも約２０キロベースの長さ、少なくとも約３０キロベースの長さ、少なくとも約３５キロベースの長さ、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さである、またはそれよりも長い。一部の実施形態では、高分子量ゲノムＤＮＡを単離するステップにより、インタクトな目的のゲノム領域全体が試料中に含有されることを確実にする。一部の実施形態では、高分子量ゲノムＤＮＡの単離および／または富化を、第１のＣＲＩＳＰＲ反応の前（例えば、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させる前）に実施する。一部の実施形態では、高分子量ゲノムＤＮＡの単離および／または富化を、第１のＣＲＩＳＰＲ反応を実施した後（例えば、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させた後）に実施する。

種々の態様では、方法は、高分子量ゲノムＤＮＡを単離するための任意の方法を伴う。高分子量ゲノムＤＮＡを単離するための方法の非限定的な例としては、ＮｕｃｌｅｏＢｏｎｄ（登録商標）ＧｅｎｏｍｉｃＤＮＡａｎｄＲＮＡｐｕｒｉｆｉｃａｔｉｏｎｓｙｓｔｅｍ（ＴａｋａｒａＢｉｏ製）、およびＮａｎｏｂｉｎｄＣＢＢＢｉｇＤＮＡｋｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ製）が挙げられる。

一部の態様では、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの前に実施することができる。他の態様では、目的のゲノム領域を含むゲノムＤＮＡを単離するステップを、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよびガイドＲＮＡと接触させるステップの後（例えば、目的のゲノム領域をゲノムＤＮＡから切り出された後）に実施することができる。

種々の態様では、方法に使用するゲノムＤＮＡの出発量は、ＣＲＩＳＰＲに基づく手法において一般に使用されるものよりも多い。一部の場合では、本明細書に提示されるいずれかの方法において使用されるゲノムＤＮＡの出発量は、少なくとも約１μｇ（例えば、少なくとも約５μｇ、少なくとも約１０μｇ、少なくとも約２０μｇ、少なくとも約５０μｇ、少なくとも約１００μｇ、少なくとも約５００μｇ、またはそれよりも多い）である。

種々の態様では、目的のゲノム領域は複雑なゲノム領域または高度に複雑なゲノム領域である。一部の場合では、目的のゲノム領域は高度に多型のゲノム領域である。一部の場合では、目的のゲノム領域は多数の反復エレメントまたは領域を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する（例えば、標的遺伝子に対して少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれよりも高い配列同一性を有する）１つまたは複数の追加的な遺伝子を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の標的遺伝子、および標的遺伝子に対して高い配列同一性を有する（例えば、標的遺伝子に対して少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％、またはそれよりも高い配列同一性を有する）１つまたは複数の偽遺伝子を含有する。一部の場合では、目的のゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。一部の場合では、目的のゲノム領域は、伝統的な方法によって（例えば、ショートリードシーケンシング法によって）正確に解析することが一般に難しいまたは難易度が高いゲノム領域である。

一部の場合では、目的の複雑なゲノム領域は、少なくとも約１０キロベースの長さである。例えば、目的のゲノム領域は、少なくとも約１０キロベースの長さ、少なくとも約１５キロベースの長さ、少なくとも約２０キロベースの長さ、少なくとも約２５キロベースの長さ、少なくとも約３０キロベースの長さ、少なくとも約３５キロベースの長さ、少なくとも約４０キロベースの長さ、少なくとも約４５キロベースの長さ、少なくとも約５０キロベースの長さ、少なくとも約５５キロベースの長さ、少なくとも約６０キロベースの長さ、少なくとも約６５キロベースの長さ、少なくとも約７０キロベースの長さ、少なくとも約７５キロベースの長さ、少なくとも約８０キロベースの長さ、少なくとも約８５キロベースの長さ、少なくとも約９０キロベースの長さ、少なくとも約９５キロベースの長さ、少なくとも約１００キロベースの長さ、少なくとも約１１０キロベースの長さ、少なくとも約１２０キロベースの長さ、少なくとも約１３０キロベースの長さ、少なくとも約１４０キロベースの長さ、少なくとも約１５０キロベースの長さ、少なくとも約１６０キロベースの長さ、少なくとも約１７０キロベースの長さ、少なくとも約１８０キロベースの長さ、少なくとも約１９０キロベースの長さ、少なくとも約２００キロベースの長さ、少なくとも約２１０キロベースの長さ、少なくとも約２２０キロベースの長さ、少なくとも約２３０キロベースの長さ、少なくとも約２４０キロベースの長さ、または少なくとも約２５０キロベースの長さであり得る。一部の態様では、目的のゲノム領域は、約１０キロベースの長さよりも長い。一部の態様では、目的のゲノム領域は、約２５０キロベースの長さよりも短い。

ＣＲＩＳＰＲ関連エンドヌクレアーゼは、本明細書に記載の任意のＣＲＩＳＰＲ関連エンドヌクレアーゼであり得る。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼは、クラスＩまたはクラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼである。ＣａｓＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０およびＣｓｆ１が挙げられる。クラスＩＩＣＲＩＳＰＲ関連エンドヌクレアーゼの非限定的な例としては、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃおよびＣａｓ１３ｄが挙げられる。一部の場合では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓタンパク質またはポリペプチドである。一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ１２ａタンパク質またはポリペプチドである。

一部の実施形態では、ＣＲＩＳＰＲ関連エンドヌクレアーゼはＣａｓ９タンパク質またはポリペプチドである。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは、細菌種Ｓｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓに由来する。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは野生型Ｃａｓ９アミノ酸配列と同一のアミノ酸配列を有する。他の場合では、Ｃａｓ９タンパク質またはポリペプチドは野生型Ｃａｓ９アミノ酸配列と比べて改変されたアミノ酸配列を有する。一部の場合では、Ｃａｓ９タンパク質またはポリペプチドは１つまたは複数の突然変異（例えば、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて）を有する。一部の場合では、１つまたは複数の突然変異は置換、欠失、または挿入である。Ｃａｓ９タンパク質またはポリペプチドは、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて少なくとも約５０％の配列同一性を有するアミノ酸配列を有し得る。例えば、Ｃａｓ９タンパク質またはポリペプチドは、野生型Ｃａｓ９タンパク質またはポリペプチドと比べて少なくとも約５０％、少なくとも約５５％、少なくとも約６０％、少なくとも約６５％、少なくとも約７０％、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、または少なくとも約９９％の配列同一性を有し得る。一部の場合では、Ｃａｓ９変異体は、野生型Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９と比べて１つまたは複数の点突然変異を含み得る。例えば、Ｃａｓ９変異体は、野生型Ｓ．ｐｙｏｇｅｎｅｓＣａｓ９と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される点突然変異を含み得る。

種々の態様では、方法は、ｇＲＮＡ（例えば、外側のｇＲＮＡの対および／または内側のｇＲＮＡの対）の使用を伴う。ｇＲＮＡは、ＣＲＩＳＰＲＲＮＡ（ｃｒＲＮＡ）または単一ガイドＲＮＡ（ｓｇＲＮＡ）であり得る。一部の実施形態では、ｇＲＮＡは、標的ヌクレオチド配列と相補的または実質的に相補的なヌクレオチド配列を含み、したがって、ｇＲＮＡは、標的ヌクレオチド配列に結合し、ＣＲＩＳＰＲ複合体を所望のカット部位に方向付けることが可能である。一部の実施形態では、ｇＲＮＡ（例えば、内側のｇＲＮＡ、外側のｇＲＮＡ）のそれぞれが異なる標的ヌクレオチド配列に結合する。一部の実施形態では、ｇＲＮＡのうちの少なくとも１つが目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、ｇＲＮＡのうちの少なくとも１つが目的のゲノム領域の下流の領域と相補的または実質的に相補的である。例えば、外側のｇＲＮＡのうちの少なくとも一方が目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、外側のｇＲＮＡのうちの少なくとも一方が目的のゲノム領域の下流の領域と相補的または実質的に相補的である。同様に、内側のｇＲＮＡのうちの少なくとも一方が目的のゲノム領域の上流の領域と相補的または実質的に相補的であり、内側のｇＲＮＡのうちの少なくとも一方が目的のゲノム領域の下流の領域と相補的または実質的に相補的である。一部の実施形態では、ｇＲＮＡ対（例えば、内側のｇＲＮＡの対、外側のｇＲＮＡの対）は、目的のゲノム領域に隣接する標的配列に結合する。一般に、ｇＲＮＡは、それぞれが目的のゲノム領域の外側のゲノム配列を標的とするように設計され、したがって、接触させること（例えば、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対または内側のｇＲＮＡの対と）により、目的のゲノム領域の全体が切り出される。

種々の態様では、方法は、目的のゲノム領域を解析するステップをさらに含む。一部の場合では、解析するステップは、目的のゲノム領域を遺伝子型決定することを含む。遺伝子型決定は、目的のゲノム領域の遺伝学的構成の差異を、目的のゲノム領域の配列を調査するための１つまたは複数のアッセイを使用すること、そして一部の場合では配列と別の配列（例えば、参照配列）と比較することによって同定するプロセスを含み得る。遺伝子型決定は、これだけに限定されないが、ＤＮＡ配列決定、制限断片長多型同定（ＲＦＬＰＩ）、ランダム増幅多型検出（ＲＡＰＤ）、増幅断片長多型検出（ＡＦＬＰＤ）、ポリメラーゼ連鎖反応（ＰＣＲ）、対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）プローブ、およびＤＮＡマイクロアレイまたはビーズへのハイブリダイゼーションを含めた任意の公知の方法によって実施することができる。一部の場合では、解析するステップは、目的のゲノム領域についての構造解析を実施することを含む。

一部の場合では、解析するステップは、目的のゲノム領域を配列決定することを含む。一部の場合では、配列決定は、ロングリードシーケンシング法（例えば、第３世代シーケンシング法）である。ロングリードシーケンシング法は、ショートリードシーケンシング法（例えば、第２世代シーケンシング法）よりも実質的に長いシーケンシングリードを生成することが可能な任意の配列決定法であってよい。一部の場合では、ロングリードシーケンシング法は、少なくとも１０，０００キロベースのシーケンシングリードを生成することが可能なシーケンシング法である。一部の場合では、ロングリードシーケンシング法は、単一分子リアルタイムシーケンシング（例えば、ＳＭＲＴシーケンシング、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）である。一部の場合では、ロングリードシーケンシング法は、ナノポアシーケンシング（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓにより開発されたＭｉｎＩＯＮ、ＧｒｉｄＩＯＮ、およびＰｒｏｍｅｔｈＩＯＮ）である。一部の態様では、配列決定の前に、方法は、目的のゲノム領域の末端にアダプター（例えば、配列決定アダプター）をライゲーションするステップをさらに伴う。方法は、一部の場合では、末端にテールを付加するステップ、脱リン酸化ステップなどを含めた、配列決定適用に適した任意の他の加工処理法を伴い得る。

種々の態様では、本明細書に提示される方法は、無増幅である（例えば、核酸増幅（例えば、ＤＮＡ増幅）ステップを伴わない）。一部の場合では、本明細書に提示される方法は、ポリメラーゼ連鎖反応（ＰＣＲ）を伴わない。一部の場合では、本明細書に提示される方法は、等温増幅を伴わない。一部の場合では、本明細書に提示される方法は、ループ媒介性等温増幅（ＬＡＭＰ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、鎖置換増幅（ＳＤＡ）、多重置換増幅（ＭＤＡ）、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、および分岐増幅法（ＲＡＭ）のいずれの１つも伴わない。核酸増幅技法により、多くの場合、配列決定鋳型に誤りが導入される。有利に、本明細書に提示される方法では、配列決定鋳型に誤りが導入される可能性がある核酸増幅法の使用を回避する。

種々の態様では、方法は、ゲノムＤＮＡの断片化も、せん断も、消化も伴わない。一部の場合では、方法は、ゲノムＤＮＡを、例えば制限酵素で消化することを伴わない。言い換えれば、方法は、せん断も消化も断片化も行われていないゲノムＤＮＡに対して直接実施される。他の場合では、方法は、エキソヌクレアーゼを用いた消化を伴う（例えば、本明細書に記載の通り、バックグラウンドゲノムＤＮＡを除去するために例えば、ゲノムＤＮＡをＣＲＩＳＰＲ関連エンドヌクレアーゼおよび外側のｇＲＮＡの対と接触させた後に）。

種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する１つまたは複数の偽遺伝子を含む。一部の場合では、１つまたは複数の偽遺伝子は、標的遺伝子に対して少なくとも約７５％（例えば、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有し得る。特定の一態様では、遺伝子座は、標的遺伝子であるＣＹＰ２Ｄ６、ならびに偽遺伝子であるＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８を含む。

種々の態様では、複雑なゲノム領域は、標的遺伝子、および標的遺伝子に対して高い配列同一性を有する１つまたは複数の追加的な遺伝子を含む。一部の場合では、１つまたは複数の追加的な遺伝子は、標的遺伝子に対して少なくとも約７５％（例えば、少なくとも約７５％、少なくとも約８０％、少なくとも約８５％、少なくとも約９０％、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有し得る。特定の一態様では、遺伝子座は、遺伝子ＣＹＰ２Ｃ８、ＣＹＰ２Ｃ９、ＣＹＰ２Ｃ１８、およびＣＹＰ２Ｃ１９を含む。一部の場合では、遺伝子座は、一般に、伝統的な方法によって（例えば、ショートリードシーケンシング法によって）正確に配列決定することが難しいまたはその難易度が高いものである。

種々の態様では、複雑なゲノム領域は、高度に多型の遺伝子座である。種々の態様では、複雑なゲノム領域は、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む。

一部の場合では、ｇＲＮＡのうちの少なくとも１つ（例えば、第１の外側のｇＲＮＡ、第２の外側のｇＲＮＡ、第１の内側のｇＲＮＡ、および第２の内側のｇＲＮＡのうちの少なくとも１つ）は、以下の表１に提示される任意のヌクレオチド配列（例えば、配列番号１～４１８）によるヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つ（例えば、第１の外側のｇＲＮＡ、第２の外側のｇＲＮＡ、第１の内側のｇＲＮＡ、および第２の内側のｇＲＮＡのうちの少なくとも１つ）は、以下の表１に提示される任意のヌクレオチド配列（例えば、配列番号１～４１８）に対して少なくとも約９０％（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有するヌクレオチド配列を含む。一部の実施形態では、ｇＲＮＡの対に関して、第１のｇＲＮＡを、ゲノムＤＮＡ上に存在するＣＹＰ２Ｄ６の上流のヌクレオチド配列と相補的または実質的に相補的になるように選択し、第２のｇＲＮＡを、ゲノムＤＮＡ上に存在するＣＹＰ２Ｄ８の下流のヌクレオチド配列と相補的または実質的に相補的になるように選択する。表１に、本開示において使用することができる（例えば、ＣＹＰ２Ｄ６遺伝子座の全体を含有するゲノムＤＮＡの断片を切り出すために）ｇＲＮＡの非限定的な一覧を、ＣＹＰ２Ｄ６遺伝子座に対する位置（例えば、ＣＹＰ２Ｄ６の上流またはＣＹＰ２Ｄ８の下流）と共に提示する。一部の場合では、第１のｇＲＮＡは、配列番号１、２、１３～１６、２７～６７、７８～８１、および２１５～３４３のいずれか１つのヌクレオチド配列、または配列番号１、２、１３～１６、２７～６７、７８～８１、および２１５～３４３のいずれか１つに対して少なくとも９０％の配列同一性（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）を有するヌクレオチド配列を含む。一部の場合では、第２のｇＲＮＡは、配列番号３～１２、１７～２６、６８～７７、８２～２１４、３４４～４１８のいずれか１つのヌクレオチド配列、または配列番号３～１２、１７～２６、６８～７７、８２～２１４、および３４４～４１８のいずれか１つに対して少なくとも９０％の配列同一性（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）を有するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｃｒＲＮＡである。一部の場合では、ｇＲＮＡのうちの少なくとも１つはｓｇＲＮＡである。
表1. ガイドRNA配列

種々の態様では、方法は、ＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定することをさらに含む。一部の場合では、遺伝的変異は、ＣＹＰ２Ｄ６における薬理遺伝学的に関連性のある変異である（例えば、スター対立遺伝子ハプロタイプ）。一部の場合では、遺伝的変異は、ＣＹＰ２Ｄ６の構造変異である。一部の場合では、遺伝的変異に基づいて、対象を、ＣＹＰ２Ｄ６機能の低下または喪失を有すると同定する。一部の場合では、対象を、ＣＹＰ２Ｄ６機能の増大または獲得を有すると同定する。

種々の態様では、方法は、同定するステップに基づいて、対象に対して処置を推奨するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、対象を処置するステップをさらに含む。種々の態様では、方法は、同定するステップに基づいて、代替処置を推奨するステップを伴う。種々の態様では、方法は、同定するステップに基づいて、薬物のある投薬量を推奨するステップを伴う。種々の態様では、方法は、対象に投与される薬物（例えば、ＣＹＰ２Ｄ６によって活性化または代謝される）の投薬量を変更するステップ（または投薬量の変更を推奨するステップ）を伴う。一部の場合では、薬物（または治療薬）は、ＣＹＰ２Ｄ６によって活性化または代謝される薬物である。

組成物およびキット

一態様では、（ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；（ｂ）（ｉ）ゲノムＤＮＡ内の目的のゲノム領域の上流に存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の外側のｇＲＮＡと、（ｉｉ）ゲノムＤＮＡ内の前記目的のゲノム領域の下流に存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の外側のｇＲＮＡとを含む外側のｇＲＮＡの対；（ｃ）（ｉｉｉ）ゲノムＤＮＡ内の前記目的のゲノム領域の上流に存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の内側のｇＲＮＡと、（ｉｖ）ゲノムＤＮＡ内の前記目的のゲノム領域の下流に存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の内側のｇＲＮＡとを含む内側のｇＲＮＡの対、を含む組成物およびキットであって、第３のヌクレオチド配列および第４のヌクレオチド配列が、ゲノムＤＮＡ上の、第１のヌクレオチド配列および第２のヌクレオチド配列よりも目的のゲノム領域に近い塩基長のところに存在する、組成物およびキットが本明細書に提示される。

一部の場合では、組成物および／またはキットは、エキソヌクレアーゼをさらに含む。エキソヌクレアーゼは、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、およびエキソヌクレアーゼＶＩＩＩからなる群より選択することができる。

一部の場合では、目的のゲノム領域は、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座である。一部の場合では、ｇＲＮＡのうちの少なくとも１つ（例えば、第１の内側のｇＲＮＡ、第２の内側のｇＲＮＡ、第１の外側のｇＲＮＡ、および第２の外側のｇＲＮＡのうちの少なくとも１つ）は、表１に提示されるいずれかのヌクレオチド配列（例えば、配列番号１～４１８）によるヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つ（例えば、第１の内側のｇＲＮＡ、第２の内側のｇＲＮＡ、第１の外側のｇＲＮＡ、および第２の外側のｇＲＮＡのうちの少なくとも１つ）は、表１に提示されるいずれかのヌクレオチド配列（例えば、配列番号１～４１８）に対して少なくとも約９０％（例えば、少なくとも約９１％、少なくとも約９２％、少なくとも約９３％、少なくとも約９４％、少なくとも約９５％、少なくとも約９６％、少なくとも約９７％、少なくとも約９８％、少なくとも約９９％）の配列同一性を有するヌクレオチド配列を含む。一部の場合では、ｇＲＮＡのうちの少なくとも１つは、ｃｒＲＮＡである。一部の場合では、ｇＲＮＡのうちの少なくとも１つは、ｓｇＲＮＡである。一部の場合では、第１の外側のガイドＲＮＡ、第１の内側のガイドＲＮＡ、またはその両方は、配列番号３～１２、１７～２６、６８～７７、８２～２１４、および３４４～４１８のいずれか１つのヌクレオチド配列を含む。一部の場合では、第２の外側のガイドＲＮＡ、第２の内側のガイドＲＮＡ、またはその両方は、配列番号１、２、１３～１６、２７～６７、７８～８１、および２１５～３４３のいずれか１つのヌクレオチド配列を含む。

一部の態様では、キットは、本明細書に提示されるいずれかの方法にキットを使用するための指示をさらに含む。一部の場合では、キットは、入れ子状ＣＲＩＳＰＲ反応（例えば、本明細書に記載の通り）にキットを使用するための指示をさらに含む。一部の場合では、キットは、目的のゲノム領域をゲノムＤＮＡから切り出すための方法（例えば、本明細書に記載の通り）にキットを使用するための指示をさらに含む。一部の場合では、キットは、ＣＹＰ２Ｄ６遺伝子座をゲノムＤＮＡから切り出すための方法（例えば、本明細書に記載の通り）にキットを使用するための指示をさらに含む。

対象および生体試料

対象は、遺伝子解析のための生体試料を提供することができる。生体試料は、対象によって生成された任意の物質であってよい。一般に、生体試料は、対象から取得された任意の組織または対象によって生成された任意の物質である。生体試料は、例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳などの体液であり得る。生体試料は、細胞および／または固形組織（例えば、頬組織（例えば、頬スワブから）、糞便、皮膚、毛髪、器官組織など）であり得る。一部の場合では、生体試料は、固形腫瘍または固形腫瘍の生検材料である。一部の場合では、生体試料は、ホルマリン固定された、パラフィン包埋（ＦＦＰＥ）組織試料である。生体試料は、ゲノムＤＮＡを含む任意の生体試料であってよい。

生体試料を対象から引き出すことができる。対象は、哺乳動物、爬虫類、両生類、トリ、または魚であり得る。哺乳動物は、ヒト、類人猿、オランウータン、サル、チンパンジー、ウシ、ブタ、ウマ、齧歯類、鳥類、爬虫類、イヌ、ネコ、または他の動物であり得る。爬虫類は、トカゲ、ヘビ、ワニ、海カメ（ｔｕｒｔｌｅ）、クロコダイル、および陸カメ（ｔｏｒｔｏｉｓｅ）であり得る。両生類は、ヒキガエル、カエル、イモリ、およびサンショウウオであり得る。トリの例としては、これだけに限定されないが、アヒル、ガチョウ、ペンギン、ダチョウ、およびフクロウが挙げられる。魚の例としては、これだけに限定されないが、ナマズ、ウナギ、サメ、およびメカジキが挙げられる。対象はヒトであることが好ましい。対象は疾患または状態を有し得る。対象に治療薬を処方することができる。治療薬は、ＣＹＰ２Ｄ６によって活性化および／または代謝される治療薬であり得る。

本開示のシステム

本明細書に提示される方法を実施するためのシステムが本明細書にさらに提示される。一態様では、（ａ）本明細書に記載の任意の方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；および（ｂ）少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサを含むシステムが提供される。

種々の態様では、出力はレポートである。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子型である。種々の態様では、出力は、目的の複雑なゲノム領域の遺伝子配列である。種々の態様では、出力は、目的の複雑なゲノム領域の構造解析である。種々の態様では、解析するステップは、目的の複雑なゲノム領域を遺伝子型決定することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域の構造解析を実施することを含む。種々の態様では、解析するステップは、目的の複雑なゲノム領域を配列決定することを含む。

種々の態様では、出力は、ＣＹＰ２Ｄ６の遺伝的変異を同定するものである。種々の態様では、出力は、ＣＹＰ２Ｄ６の機能の低下、喪失、または増大を同定するものである。種々の態様では、レポートは、遺伝的変異に基づいて、対象に対して処置を推奨するものである。種々の態様では、レポートは、遺伝的変異に基づいて、対象に対して治療薬のある投薬量を推奨するものである。種々の態様では、レポートは、遺伝的変異に基づいて、治療薬の投薬量を変更することを推奨するものである。一部の場合では、治療薬は、ＣＹＰ２Ｄ６によって活性化または代謝される治療薬である。

本開示は、本明細書に記載の方法を実施するための、コンピュータに基づくシステムをさらに提供する。一部の態様では、システムを、本明細書に提示される方法によって生成されたデータを解析するために使用することができる。システムは、１つまたは複数のクライアントコンポーネントを含み得る。１つまたは複数のクライアントコンポーネントは、ユーザーインタフェースを含み得る。システムは、１つまたは複数のサーバーコンポーネントを含み得る。サーバーコンポーネントは、１つまたは複数のメモリ位置を含み得る。１つまたは複数のメモリ位置は、データ入力を受け取るように構成することができる。データ入力は、配列決定データを含み得る。配列決定データは、対象由来の核酸試料（例えば、ゲノムＤＮＡ）から生成することができる。本開示のシステムでの使用に適した配列決定データの非限定的な例は記載されている。システムは、１つまたは複数のコンピュータプロセッサをさらに含み得る。１つまたは複数のコンピュータプロセッサを１つまたは複数のメモリ位置に作動可能にカップリングすることができる。１つまたは複数のコンピュータプロセッサを、スクリーン上に表示するための出力を生成するようにプログラムすることができる。出力は１つまたは複数のレポートを含み得る。

本明細書に記載のシステムは、１つまたは複数のクライアントコンポーネントを含み得る。１つまたは複数のクライアントコンポーネントは、１つまたは複数のソフトウェアコンポーネント、１つまたは複数のハードウェアコンポーネント、またはこれらの組合せを含み得る。１つまたは複数のクライアントコンポーネントは、１つまたは複数のサーバーコンポーネントを通じて１つまたは複数のサービスにアクセス可能である。１つまたは複数のクライアントコンポーネントによりネットワークを通じて１つまたは複数のサービスにアクセス可能である。ネットワークは、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信したイントラネットおよび／もしくはエクストラネットであり得る。ネットワークは、一部の場合では、電気通信および／またはデータネットワークである。ネットワークは１つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワークは、一部の場合では、コンピュータシステムの補助により、ピアツーピアネットワークをインプリメントすることができ、それにより、コンピュータシステムとカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。

システムは、１つまたは複数のメモリ位置（例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ）、電子記憶装置（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース（例えば、ネットワークアダプター）、ならびに、キャッシュ、他のメモリ、データ記憶および／または電子ディスプレイアダプターなどの周辺機器を含み得る。メモリ、記憶装置、インターフェースおよび周辺機器は、マザーボードなどの通信バスを通じてＣＰＵと通信する。記憶装置は、データを記憶させるためのデータ記憶装置（またはデータリポジトリ）であり得る。一実施例では、１つまたは複数のメモリ位置に受け取った配列決定データを記憶させることができる。

システムは、１つまたは複数のコンピュータプロセッサを含み得る。１つまたは複数のコンピュータプロセッサは、例えば、記憶されたデータにアクセスするために、１つまたは複数のメモリ位置に作動可能にカップリングすることができる。１つまたは複数のコンピュータプロセッサは、機械により実行可能なコードをインプリメントして、本明細書に記載の方法を実施することが可能である。

機械により実行可能なまたは機械により可読のコードは、ソフトウェアの形式で提供することができる。使用中、コードをプロセッサによって実行することができる。一部の場合では、コードを記憶装置から検索し、プロセッサからすぐにアクセスできるようにメモリに記憶させることができる。一部の状況では、電子記憶装置を除外することができ、機械により実行可能な命令をメモリに記憶させる。

コードは、プリコンパイルし、コードの実行のために適合させたプロセッサを有する機械で使用するために構成することもでき、実行時間中にコンパイルすることもでき、実行時間中に解釈実行することもできる。コードは、コードをプリコンパイル様式で、都度コンパイル様式で、または解釈実行様式で実行することが可能になるように選択することができるプログラミング言語で供給することができる。

コンピュータシステムなどの本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械（もしくはプロセッサ）により実行可能なコードおよび／または機械可読媒体の１種で実施または具体化される関連データの形式の「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、コンピュータ、プロセッサなど、または関連するそのモジュールの有形メモリ、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための命令をもたらすことに関与する任意の媒体を指す。

したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えば図に示されているデータベースなどをインプリメントするために使用することができる任意のコンピュータ（複数可）のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル；コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、無線周波数（ＲＦ）および赤外（ＩＲ）データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー（登録商標）ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データもしくは命令を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび／またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、１つまたは複数の命令の１つまたは複数のシーケンスをプロセッサに実行のために伝えることに関与し得る。

本明細書に開示されるシステムは、１つまたは複数の電子ディスプレイを含み得る、またはそれと通信し得る。電子ディスプレイは、コンピュータシステムの一部であってもよく、コンピュータシステムに直接またはネットワークを通じてカップリングしていてもよい。コンピュータシステムは、本明細書に開示される種々の特色および機能性を提供するためのユーザーインタフェース（ＵＩ）を含み得る。ＵＩの例としては、限定することなく、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブに基づくユーザーインタフェースが挙げられる。ＵＩにより、ユーザーがそれによって本明細書に記載の方法およびシステムを利用することができる相互作用ツールをもたらすことができる。例として、本発明で構想されるＵＩは、健康管理実践者がそれによって遺伝学的試験を注文し、試験される遺伝学的変異体の一覧をカスタマイズし、レポートを受け取り、閲覧することができる、ウェブに基づくツールであり得る。

本明細書に開示される方法は、生物医学的データベース、ゲノムデータベース、生物医学的レポート、疾患レポート、症例対照解析、および１つもしくは複数のデータベースからのデータおよび／もしくは情報に基づいた希少な変異体発見解析、１つもしくは複数のアッセイ、１つもしくは複数のデータもしくは結果、１つもしくは複数のアッセイに基づくもしくはそれから引き出される１つもしくは複数の出力、１つもしくは複数のデータもしくは結果に基づくもしくはそれから引き出される１つもしくは複数の出力、またはこれらの組合せを含み得る。

本明細書に記載の通り、１つまたは複数のコンピュータプロセッサにより、機械により実行可能なコードをインプリメントして本開示の方法を実施することができる。機械により実行可能なコードは、任意の数のオープンソースまたはクローズドソースソフトウェアを含み得る。機械により実行可能なコードをインプリメントして、データ入力を解析することができる。データ入力は、１つまたは複数の配列決定反応により生成された配列決定データであり得る。コンピュータプロセッサを少なくとも１つのメモリ位置に作動可能にカップリングすることができる。コンピュータプロセッサにより、少なくとも１つのメモリ位置からデータ（例えば、配列決定データ）にアクセスすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データを参照配列にマッピングすることができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、配列決定データから遺伝学的変異体の存在または非存在を決定することができる。一部の場合では、コンピュータプロセッサにより、機械により実行可能なコードをインプリメントして、スクリーン上に表示するための出力（例えば、レポート）を生成することができる。

機械により実行可能なコードは、１つまたは複数のアルゴリズムを含み得る。１つまたは複数のアルゴリズムを使用して本開示の方法をインプリメントすることができる。

本開示のシステムは、１つまたは複数のコンピュータシステムを含み得る。図１６は、例えば、データを受け取ること、および前記データに基づいて出力を生成することなど、本開示の方法をインプリメントするようにプログラムされたまたは他のやり方で構成されたコンピュータシステム（本明細書では「システム」とも）１６０１を示す。システム１６０１は、シングルコアプロセッサもしくはマルチコアプロセッサであってもよく、並行処理のための複数のプロセッサであってもよい中央処理装置（ＣＰＵ、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも）１６０５を含む。システム１６０１はまた、メモリ１６１０（例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ）、電子記憶装置１６１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース１６２０（例えば、ネットワークアダプター）、ならびにキャッシュ、他のメモリ、データ記憶および／または電子ディスプレイアダプターなどの周辺機器１６２５を含む。メモリ１６１０、記憶装置１６１５、インターフェース１６２０および周辺機器１６２５は、ＣＰＵ１６０５とマザーボードなどの通信バス（実線）を通じて通信する。記憶装置１６１５は、データを記憶させるためのデータ記憶装置（またはデータリポジトリ）であり得る。システム１６０１はコンピュータネットワーク（「ネットワーク」）１６３０に通信インターフェース１６２０の補助により作動可能に（ｏｐｅｒａｔｉｖｅｌｙ）カップリングしている。ネットワーク１６３０は、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信するイントラネットおよび／もしくはエクストラネットであり得る。ネットワーク１６３０は、一部の場合では、電気通信および／またはデータネットワークである。ネットワーク１６３０は１つまたは複数のコンピュータサーバーを含んでよく、それにより、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる。ネットワーク１６３０は、一部の場合では、システム１６０１の補助により、ピアツーピアネットワークをインプリメントすることが可能であり、それにより、システム１６０１とカップリングしたデバイスをクライアントまたはサーバーとして機能させることを可能にすることができる。

システム１６０１は処理システム１６４０と通信する。処理システム１６４０は、例えば、配列決定データを参照配列にマッピングすることまたは分類を遺伝学的変異体に割り当てることなど、本明細書に開示される方法をインプリメントするように構成することができる。処理システム１６４０は、システム１６０１とネットワーク１６３０を通じて、または直接（例えば、有線、無線）接続によって通信させることができる。処理システム１６４０は、核酸配列解析などの解析のために構成され得る。

本明細書に記載の方法およびシステムは、システム１６０１の電子記憶位置、例えば、メモリ１６１０または電子記憶装置１６１５などに記憶された機械（またはコンピュータプロセッサ）実行可能なコード（またはソフトウェア）によってインプリメントすることができる。使用中、コードをプロセッサ１６０５によって実行することができる。一部の実施例では、コードを記憶装置１６１５から検索し、プロセッサ１６０５からすぐにアクセスできるようにメモリ１６１０に記憶させることができる。一部の状況では、電子記憶装置１６１５を除外することができ、機械により実行可能な命令をメモリ１６１０に記憶させる。

本明細書に提示されるシステムおよび方法の態様は、プログラミングで具体化することができる。当該技術の種々の態様は、一般には機械（もしくはプロセッサ）により実行可能なコードおよび／または機械可読媒体の１種で実施もしくは具体化される関連データの形式で「製品」または「製造品」と考えることができる。機械により実行可能なコードは、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体は、コンピュータ、プロセッサなど、または関連するそのモジュールの有形メモリ、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得、これらにより、ソフトウェアプログラミングのために任意の時点で非一時的記憶を提供することができる。ソフトウェアの全部または一部は、時々、インターネットまたは種々の他の電気通信ネットワークを通じて通信することができる。そのような通信により、例えば、ソフトウェアを１つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサに、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにローディングすることが可能になる。したがって、ソフトウェアエレメントを担持することができる別の型の媒体として、ローカルデバイス間の物理的なインターフェースを横断して、有線および光通信線ネットワークを通じて、および種々のエアリンクを通じて使用されるものなどの光波、電波および電磁波が挙げられる。有線または無線リンク、光リンクなどの、そのような波を運ぶ物理的要素もまた、ソフトウェアを担持する媒体とみなすことができる。本明細書で使用される場合、非一時的に制限される場合を除き、有形「記憶」媒体、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための命令をもたらすことに関与する任意の媒体を指す。

したがって、コンピュータで実行可能なコードなどの機械可読媒体は、これだけに限定されないが、有形記憶媒体、搬送波媒体または物理的伝送媒体を含めた多くの形態をとり得る。非揮発性記憶媒体としては、例えば、光学または磁気ディスク、例えば、例えばデータベースなどをインプリメントするために使用することができる任意のコンピュータ（複数可）のストレージデバイスのいずれかなどが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル；コンピュータシステム内のバスを含むワイヤを含めた銅線および光ファイバーが挙げられる。搬送波伝送媒体は、無線周波数（ＲＦ）および赤外（ＩＲ）データ通信中に生じるものなどの、電気シグナルもしくは電磁気シグナル、または音波もしくは光波の形態をとり得る。したがって、コンピュータ可読媒体の一般形態としては、例えば、フロッピー（登録商標）ディスク、フレシキブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データもしくは命令を伝達する搬送波、そのような搬送波を輸送するケーブルもしくはリンク、またはコンピュータによりプログラミングコードおよび／またはデータを読み取ることが可能な任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くは、１つまたは複数の命令の１つまたは複数のシーケンスをプロセッサに実行のために伝えることに関与し得る。

コンピュータシステム１６０１は、ユーザーインタフェース（ＵＩ）を含む電子ディスプレイを含み得る、またはそれと通信し得る。ＵＩの例としては、限定することなく、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブに基づくユーザーインタフェースが挙げられる。

一部の実施形態では、システム１６０１は、視覚的情報をユーザーに提供するためのディスプレイを含む。一部の実施形態では、ディスプレイはブラウン管（ＣＲＴ）である。一部の実施形態では、ディスプレイは液晶ディスプレイ（ＬＣＤ）である。さらなる実施形態では、ディスプレイは薄膜トランジスタ液晶ディスプレイ（ＴＦＴ－ＬＣＤ）である。一部の実施形態では、ディスプレイは有機発光ダイオード（ＯＬＥＤ）ディスプレイである。種々のさらなる実施形態では、ＯＬＥＤディスプレイはパッシブマトリックスＯＬＥＤ（ＰＭＯＬＥＤ）またはアクティブマトリックスＯＬＥＤ（ＡＭＯＬＥＤ）ディスプレイである。一部の実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに別の実施形態では、ディスプレイは本明細書に開示されるものなどのデバイスの組合せである。ディスプレイは、１つまたは複数の生物医学的レポートが本明細書に記載の方法によって生成されたらそれをエンドユーザーに提供することができるものである。

一部の実施形態では、システム１６０１は、ユーザーから情報を受け取る入力デバイスを含む。一部の実施形態では、入力デバイスはキーボードである。一部の実施形態では、入力デバイスは、非限定的な例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラ、またはスタイラスを含めたポインティングデバイスである。一部の実施形態では、入力デバイスはタッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他の音入力を捕捉するためのマイクロホンである。他の実施形態では、入力デバイスは、動きまたは視覚的入力を捕捉するためのビデオカメラである。さらに別の実施形態では、入力デバイスは、本明細書に開示されるものなどのデバイスの組合せである。

システム１６０１は、１つまたは複数のデータベースを含んでもよく、それと作動可能にカップリングすることもできる。データベースは、ゲノムデータベース、プロテオミクスデータベース、薬理ゲノミクスデータベース、生物医学的データベース、および科学的データベースを含み得る。データベースは公的に利用可能なデータベースであり得る。その代わりにまたはそれに加えて、データベースは所有権のあるデータベースを含み得る。データベースは市販のデータベースであり得る。データベースとしては、これだけに限定されないが、ＭｅｎｄｅｌＤＢ、ＰｈａｒｍＧＫＢ、Ｖａｒｉｍｅｄ、Ｒｅｇｕｌｏｍｅ、ｃｕｒａｔｅｄＢｒｅａｋＳｅｑｊｕｎｃｔｉｏｎｓ、ＯｎｌｉｎｅＭｅｎｄｅｌｉａｎＩｎｈｅｒｉｔａｎｃｅｉｎＭａｎ（ＯＭＩＭ）、ＨｕｍａｎＧｅｎｏｍｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ（ＨＧＭＤ）、ＮＣＢＩｄｂＳＮＰ、ＮＣＢＩＲｅｆＳｅｑ、ＧＥＮＣＯＤＥ、ＧＯ（ｇｅｎｅｏｎｔｏｌｏｇｙ）、およびＫｙｏｔｏＥｎｃｙｃｌｏｐｅｄｉａｏｆＧｅｎｅｓａｎｄＧｅｎｏｍｅｓ（ＫＥＧＧ）が挙げられる。

データを、データのユーザーと同じ国を含む地理的な位置で生成し、かつ／またはそこから伝送することができる。データを、例えば、１つの国の地理的な位置で生成し、かつ／またはそこから伝送することができ、データのユーザーは異なる国に存在していてよい。一部の場合では、本開示のシステムによってアクセスしたデータを複数の地理的な位置のうちの１カ所からユーザーに伝送することができる。データを、例えば、ネットワーク、安全なネットワーク、安全でないネットワーク、インターネット、またはイントラネットにより、複数の地理的な位置の間で行き来するように伝送することができる。

以下の実施例は、本開示の種々の実施形態を例示する目的で提示され、本開示をどのようにも限定することを意図するものではない。本実施例は、本明細書に記載の方法と共に、現在の代表的な好ましい実施形態であり、例示であり、本開示の実施形態の範囲を限定することを意図するものではない。特許請求の範囲によって定義される本開示の主旨に包含される実施例における変化および他の使用が当業者には想起されよう。

（実施例１）

ＣＹＰ２Ｄ６および臨床試験

ＣＹＰ２Ｄ６遺伝子構造：ＣＹＰ２Ｄ６は、小さな遺伝子（４３８２ｂｐ）であり、９つのエクソンを有する。しかし、この高度に多型の遺伝子座の遺伝子解析は、図１に示されている通り、高度に類似した非機能性のＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８偽遺伝子が遺伝子座内に存在することに起因して難しい。ＣＹＰ２Ｄ６とＣＹＰ２Ｄ７の類似性および大きなリピート領域の存在により、遺伝子欠失および遺伝子重複だけでなく、３’ＣＹＰ２Ｄ７と５’ＣＹＰ２Ｄ６または３’ＣＹＰ２Ｄ６と５’ＣＹＰ２Ｄ７のいずれかを含有する複雑な遺伝子ハイブリッドも生じている。現在、これらの構造変異の存在を検出するために多数の試験アッセイが求められている。

現行の試験用プラットフォーム：ＣＹＰ２Ｄ６を解析するための一般的な方法の１つは、長距離の対立遺伝子特異的ＰＣＲ産物の配列解析によるものである。簡単に述べると、対立遺伝子特異的プライマーを使用して、標的化される領域を増幅する。ＰＣＲ産物において見いだされる一塩基変異体（ＳＮＶ）はその対立遺伝子のハプロタイプを表す。対立遺伝子特異的アンプリコンは、重複した遺伝子コピーならびにＣＹＰ２Ｄ６－２Ｄ７およびＣＹＰ２Ｄ７－２Ｄ６ハイブリッド遺伝子からも生じ得る。つい最近、ＣＹＰ２Ｄ６ハプロタイプをより正確に特徴付けるために、単一分子リアルタイム（ＳＭＲＴ）シーケンシングまたはナノポアシーケンシングなどのロングリードシーケンシング技術も使用されている；しかし、ＣＹＰ２Ｄ６のロングリードシーケンシングのためのライブラリー生成が依然として限定されている。配列決定のためのＣＹＰ２Ｄ６鋳型を生成するために現在使用されているＸＬ－ＰＣＲ反応は、生成することができる産物のサイズに限界があり、プライマー特異的であり、また、複雑なハイブリッドまたは多くの公知のＣＮＶは、その変異が以前に特徴付けられており、目的の試料中に存在することが分かっている場合を除いて捕捉されない。

要約すると、ＣＹＰ２Ｄ６は、全ての処方薬の約２５％の代謝に直接関与する高度に多型の遺伝子である。コピー数の変化を含めたこの遺伝子の遺伝的変異は、患者の薬物代謝状態に直接影響を及ぼし得る。コピー数を含む正確な遺伝子型は極めて重要であり、現行の方法体系ではこの遺伝子領域の複雑さを十分にアッセイすることができない。

ＣＲＩＳＰＲ／Ｃａｓ９技術および部位特異的アダプターライゲーションをロングリードシーケンシングと組み合わせて利用して、ＣＹＰ２Ｄ６解析のための診断品質の方法体系を開発するための方法が本明細書で提唱される。この手法では、単一の、試料にとらわれないＣＲＩＳＰＲ切断ステップを利用して、ロングリードシーケンシングのためのＣＹＰ２Ｄ６遺伝子座全体を単離する。この方法体系により、一塩基多型（ＳＮＰ）およびＣＮＶの両方を正確に検出すること、ならびに、可能性のある最も正確な、フェージングされたＣＹＰ２Ｄ６遺伝子型および代謝型（ｍｅｔａｂｏｌｉｚｅｒ）の状態を割り当てることが可能になる。

ｉｎｖｉｔｒｏおよびｉｎｖｉｖｏのどちらにおいても、ＣＲＩＳＰＲ技術を使用して、目的のゲノム領域（ＲＯＩ）を標的とし、それを切り出すことができる。簡単に述べると、ＣＲＩＳＰＲ－Ｃ関連タンパク質９（Ｃａｓ９）が、合成的に生成された標的特異的ガイドＲＮＡ（ｓｇＲＮＡ）と複合体を形成すると、ガイドＲＮＡの標的特異的配列に対して相補性を有する配列において二本鎖カットが創出される。ＲＯＩの両末端の配列を標的とするようにｓｇＲＮＡを設計することにより、ＣＲＩＳＰＲ－Ｃａｓ９を使用して、数メガベースの長さに至るまでであり得るＤＮＡを切り出すことができる。

ロングリードシーケンシング：ショートリード次世代シーケンシング（ＮＧＳ）の開発によりヒト遺伝学が改革されたが、限界が十分に認識されている。単離されたＨＭＷＤＮＡ断片のロングリードシーケンシングでは、フェージング情報を得ること、小さな構造変異を同定すること、および、タンデムリピートを含めた、ゲノムの高度に複雑な領域をより良好にアセンブルすることが可能になるので、最近注目を浴びている。ＤＮＡ断片を標的特異的に単離するためのＣＲＩＳＰＲ技術の使用により、ロングリードシーケンシングのためにゲノムの関連性のある領域を標的とするための革新的かつ優れた手法がもたらされる。

ＧｅＴ－ＲＭコホート：ＣＹＰ２Ｄ６遺伝子構造を系統的に特徴付けるための主要な取り組みの一部として、アッセイ開発、検証、品質管理および技能試験のためのよく特徴付けられた参照材料の最先端のセットを確立するためにＣＹＰ２Ｄ６遺伝子型決定データが提供された。この取り組みは、ＧｅｎｅｔｉｃＴｅｓｔｉｎｇＲｅｆｅｒｅｎｃｅＭａｔｅｒｉａｌｓＣｏｏｒｄｉｎａｔｉｏｎＰｒｏｇｒａｍ（ＧｅＴ－ＲＭ）ａｔｔｈｅＣｅｎｔｅｒｓｆｏｒＤｉｓｅａｓｅＣｏｎｔｒｏｌａｎｄＰｒｅｖｅｎｔｉｏｎ－ｂａｓｅｄＧｅｎｅｔｉｃＴｅｓｔｉｎｇＲｅｆｅｒｅｎｃｅＭａｔｅｒｉａｌＣｏｏｒｄｉｎａｔｉｏｎＰｒｏｇｒａｍ，ｔｈｅＣｏｒｉｅｌｌＩｎｓｔｉｔｕｔｅｆｏｒＭｅｄｉｃａｌＲｅｓｅａｒｃｈ、ならびに他のＰＧｘコミュニティメンバーとの共同研究で行われた。この研究の一部として、複雑な構造配置および／または希少なＣＹＰ２Ｄ６遺伝子型を含有するいくつかの試料に対してＰｈａｒｍａｃｏｓｃａｎ（商標）に基づくＣＹＰ２Ｄ６遺伝子型決定を提供した。このデータをＸＬ－ＰＣＲに基づくＮＧＳ解析と併せて使用して、これらの試料について現行の解析方法体系で可能な最も正確な遺伝子型を決定した。全ての細胞株およびコンセンサス遺伝子型決定に関する情報およびアノテーションデータにより、提唱された新しい配列決定および解析手法の検証の基礎が築かれる。

研究設計および方法

目的１（方法の開発）：（ａ）後の、ゲノムヒトＤＮＡ（例えば、血液試料）におけるサイズ解析（例えば、ゲル）のためのＣＹＰ２Ｄ６－Ｄ７ゲノム遺伝子座を含有する高分子量ＤＮＡセグメントを創出するための特定のＣＲＩＳＰＲ／Ｃａｓ９方法体系の最適化。（ｂ）標的化される領域の単離／富化および配列決定のためのＸＬ－ライブラリーの生成。（ｃ）ＣＹＰ２Ｄ６－Ｄ７ゲノム遺伝子座のゲノム変異体の長い鋳型の配列決定のためのＮＧＳ手法の確立（例えば、ＰａｃＢｉｏ、ＭｉｎＩＯＮ）。提唱されたワークフローの概略が図２に示されている。

ＨＭＷＤＮＡの単離：ＲＯＩ（ＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７）の通常の長さは２８～３５ｋｂである。下流の解析のためにＲＯＩ全体がインタクトであることを確実にするために、ＮｕｃｌｅｏＢｏｎｄ（登録商標）ＧｅｎｏｍｉｃＤＮＡａｎｄＲＮＡｐｕｒｉｆｉｃａｔｉｏｎｓｙｓｔｅｍを使用してプロトコールを開発して高分子量ｇＤＮＡ（最大７０ｋｂ）を単離した。改変プロトコールにより、他の方法体系を用いた場合に観察される１０ｋｂ～５０ｋｂの範囲と比較して、５０ｋｂを超える分子量のｇＤＮＡを抽出することが可能になる（図３）。

高度に特異的なｓｇＲＮＡの設計および検証：ＣＹＰ２Ｄ６遺伝子座の複雑で高度に多型の性質に起因して、従来のＰＣＲおよびアレイに基づく技術では、ＣＮＶ解析およびＳＮＰ解析の両方を実施するために多数のアッセイが必要である。ＣＹＰ２Ｄ６遺伝子のみを標的とするＣＲＩＳＰＲＣａｓ９手法では、Ｄ６／Ｄ７ハイブリッド対立遺伝子またはＣＹＰ２Ｄ６重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。この限定を克服するために、ＣＹＰ２Ｄ６およびＣＹＰ２Ｄ７の両方を包含する領域に隣接する独特の配列を同定した。これらの独特の領域を標的とするｓｇＲＮＡを設計することにより、１つのＣＲＩＳＰＲ／Ｃａｓ９切断反応を実施して、ＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７領域全体を単離した（図４Ａ）。

ｓｇＲＮＡの特異性および有効性を確認するために、標的化されるｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物をｇＤＮＡから生成した。ＸＬ－ＰＣＲ産物を、Ｃａｓ９と一緒に、ｓｇＲＮＡは伴わずにインキュベートしたか（図４Ｂ、試料Ａ）、またはＣａｓ９および異なるｓｇＲＮＡと一緒にインキュベートした（図４Ｂ、試料ＢおよびＣ）。Ｃａｓ９およびｓｇＲＮＡと一緒にインキュベートした全てのＰＣＲ産物が切断されて、予測されたサイズのＤＮＡ断片が生じたが、異なるｓｇＲＮＡにより異なる程度の切断効率が示された。

ゲノムＤＮＡ内のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座のカット：ｓｇＲＮＡは、オフターゲット認識部位を含有し得るｇＤＮＡに高い効率および特異性で結合しなければならない。ＣＲＩＳＰＲのカット効率および特異性を調べるために、ゲノムＤＮＡをＣａｓ９と一緒に、ｓｇＲＮＡは伴わずにインキュベートしたか（陰性対照）、または、Ｃａｓ９ならびにＣＹＰ２Ｄ６の５’およびＣＹＰ２Ｄ７の３’をカットする２種のｓｇＲＮＡのプールと一緒にインキュベートした。予測される切断部位それぞれに隣接するプライマーを用いてＰＣＲ反応を実施した。ｓｇＲＮＡが正しい結合部位に結合し、切断が起こった場合、ＰＣＲ産物の減少が予想される。実際に、これが観察される（図５Ａ、図５Ｂ）。ｓｇＲＮＡ結合部位の内側のプライマーを使用したＣＹＰ２Ｄ６遺伝子座に対するＰＣＲも実施して、ＣＹＰ２Ｄ６遺伝子内でＣａｓ９媒介性オフターゲット切断が起こるかどうかを決定した。ＣＹＰ２Ｄ６内のオフターゲット切断のエビデンスは認められなかった（図５Ａ、図５Ｂ）。

要約すると、ＸＬ－ＰＣＲおよびゲノムＤＮＡの調査により、Ｃａｓ９－ｓｇＲＮＡ複合体により、標的化されたＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座の両側が高い効率でカットされ、遺伝子座内の著しいオフターゲット活性は伴わないことが実証された。切断により予測された２８ｋｂの断片が創出され、これを、富化後、下流のロングリードＮＧＳのために利用することができる。

（実施例２）
ＣＲＩＳＰＲ／Ｃａｓ９方法体系のさらなる最適化

他のｓｇＲＮＡおよびＣａｓ酵素を開発し、試験した。上記の通り試験するｓｇＲＮＡを同定および設計するために標準のソフトウェアを使用する。目的は、ＲＯＩにおいて高い効率および特異性で切断を行うｓｇＲＮＡを得ることである。より短いＤＮＡ断片が選好されるが、それでもなお、ＲＯＩ全体が含有される。より短い断片には、配列決定および処理費用が低減するという利益があり得る。ＣＲＩＳＰＲＣａｓ１２ａ酵素を用いた同じ領域の切断も試みる。Ｃａｓ１２ａエンドヌクレアーゼは、Ｃａｓ９と同様に機能するが、異なるＰＡＭ配列要件（ＴＴＴＶ）を有し、切断後に５’付着突出を生じさせる。対照的に、Ｃａｓ９では平滑末端が生じる。これは後のステップで重要である。

（実施例３）
ゲノムＤＮＡ内のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座の富化

概念実証として、上記のＣＹＰ２Ｄ６の５’およびＣＹＰ２Ｄ７の３’の切断部位を標的とするＣａｓ９－ｓｇＲＮＡを用いてｇＤＮＡ５μｇをカットした。切断されたＤＮＡをＢｌｕｅＰｉｐｐｅｎ（ＳａｇｅＳｃｉｅｎｃｅ）機器で、１～５０ｋｂの範囲のサイズ選択を可能にする０．７５％アガロースゲルカセットを使用して泳動した。溶出した試料が所望のＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７遺伝子座を含有することを、ＰＣＲを使用して確認した。このゲルに基づく手法では、ＨＭＷ試料の単離が可能になるが、一方で、時間（ＢｌｕｅＰｉｐｐｅｎの実行当たり約１０～１２時間）、試料数が限られること（実行当たり４～５試料）、材料が著しく減少すること／回収が不良であること、および試料当たりの費用が高いこと（約＄５０．００）を含めたいくつかの欠点が存在する。

これらの限定を克服するために、標的を富化させるためのいくつかの手法を試験する。これにより、様々な方法の長所と短所を同定すること、およびさらなる臨床試験開発のための最も適切な手法を最終的に同定することが可能になる。これは、臨床診断検査開発のための典型的な手法である。以下のロングリードシーケンシングの考察は、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ（ＯＮＴ）シーケンシングを指すが、プロトコールはいずれも、ＰａｃＢｉｏシーケンシング要件に合うようにわずかな改変で適合させることができる。

方法１：標的の無増幅富化

ＤＮＡの調製：この無増幅ライブラリー調製法は、ＤＮＡ試料の脱リン酸化および３’末端キャップ形成、その後、ＣＲＩＳＰＲ処理および部位特異的ＯＮＴアダプターライゲーションを伴う。第１のステップにおいて、ｇＤＮＡを、ＤＮＡ断片の５’末端からリン酸基を除去するエビアルカリホスファターゼ、および、単一のチミジンジデオキシヌクレオチドを３’末端に付加するターミナルトランスフェラーゼで処理する。このステップにより、ｇＤＮＡ末端をライゲーション不能にすることが確実になる。次いで、ＤＮＡをＣＲＩＳＰＲＣａｓ９：ｇＲＮＡ複合体で処理し、その結果、平滑末端化した約２８～３５ｋｂのＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７断片が生じる（詳細については前の段落を参照されたい）。この後、ＤＮＡポリメラーゼを用いてアデノシンヌクレオチドをＤＮＡの遊離の３’末端（例えば、ｄｄＴＴＰでキャップ形成されていない末端）に付加する「Ａテール付加」ステップを行う。最後に、チミジン突出を有するＯＮＴアダプターをＤＮＡに付加する。ＣＲＩＳＰＲ－Ｃａｓ９による切断によって生じたＤＮＡ末端は相補的な３’突出および５’リン酸基を有する唯一の末端であるので、このＤＮＡ末端のみがアダプターにライゲーションする。

配列決定：得られたライブラリーをＯＮＴ機器で直接配列決定する。この方法によって生成されたＤＮＡライブラリーの量ではＯＮＴシーケンシングの難易度が高いことが判明した場合、これは、試料を配列決定の前に多重化することによって、および／または入力ｇＤＮＡの量を増加させることによって克服することができる。さらに、試料をエキソヌクレアーゼで処理し（ＯＮＴアダプターはエキソヌクレアーゼＩＩＩおよびラムダエキソヌクレアーゼに対して抵抗性である）、その結果、全てのバックグラウンドＤＮＡの分解をもたらすことにより、バックグラウンドを低減することができる。

方法２：ｉｎｖｉｔｒｏ転写を使用した富化

理論的根拠：前の手法で十分なＤＮＡを生成することができなかった場合、またはバックグラウンドＤＮＡが過剰に存在する場合、ｉｎｖｉｔｒｏ転写（ＩＶＴ）による標的化増幅という代替手法を評価する。ＩＶＴにはＰＣＲに対する利点がいくつかある。（１）転写により誤りが伝播する可能性がより低い。（２）転写により、最長距離ＰＣＲ産物のサイズよりも長い２０～３０ｋｂもの長さのＲＮＡ分子を産生させることができる。

ＤＮＡの調製：ＣＲＩＳＰＲによる切断後、ＤＮＡをエキソヌクレアーゼで処理して付着末端を生成し、Ｔ７プロモーターおよびＣＹＰ２６－ＣＹＰ２Ｄ７遺伝子座の付着末端に相補的な突出を含有する二本鎖ＤＮＡ断片を標的断片とライゲーションする。ＤＮＡポリメラーゼおよびＤＮＡリガーゼを使用してギャップを埋め、あらゆるニックをふさぐ。ファージＴ７ＲＮＡポリメラーゼにより約２０ｋｂもの長さの転写物を産生させることができる。プロモーターは約２８ｋｂの遺伝子座の両末端にライゲーションするので、遺伝子座の末端のプロモーターからＴ７ＲＮＡポリメラーゼによって産生される最長転写物は、領域全体を網羅するのに十分に長くなり得る。しかし、Ｔ７産物の大部分は一般には４ｋｂ未満の長さである。最近発見されたＳｙｎ５シアノファージＲＮＡポリメラーゼは、３０ｋｂもの長さの転写物を産生することができる。Ｓｙｎ５プロモーターをＴ７プロモーターと一緒に試験する。

ｉｎｖｉｔｒｏ転写：Ｔ７ＲＮＡポリメラーゼおよびＳｙｎ５ＲＮＡポリメラーゼを用いてＩＶＴを実施する。前者の酵素は市販されているが、後者の酵素は本発明者らの研究室で発現させ、精製したものである。長いＲＮＡ転写物を産生させるために最適化された市販のＴ７ＲＮＡポリメラーゼＩＶＴキットがいくつか存在する。以前の研究により、ヒトゲノムにランダムに挿入されたＴ７プロモーター配列によりＩＶＴの間に５ｋｂよりも大きなＲＮＡ転写物がかなりの分率で産生されることが示されている。全ＲＮＡ収量、大きな転写物（＞１５ｋｂ）の割合および誤り率が、いずれのポリメラーゼおよびＩＶＴ法がより優れた選択肢であるかの決定において重要な因子である。広範囲の長さのＲＮＡ転写物が産生される可能性があるので、ＳＰＲＩビーズを使用して最も大きな転写物を選択することができる。ＲＮＡをＯＮＴ機器で直接配列決定する。

方法３：ｉｎｖｉｔｒｏ転写のためのプロモーターの多部位への導入

理論的根拠：上記の手法が不十分である場合、Ｔ７またはＳｙｎ５プロモーターを標的化される領域にわたって多数の部位に挿入する。この手法の潜在的な問題は、遺伝子座の断片化により、変異体をＣＹＰ２Ｄ７またはＣＹＰ２Ｄ６に一義的に割り当てること（遺伝子と偽遺伝子は約９４％の配列同一性を共有するため）、およびフェージング情報を引き出すことの難易度が高くなることである。この限定を克服するために、多数の付着挿入部位を使用して重複する断片を生成する。

プロモーターの導入：ＣＲＩＳＰＲによる切断は、遺伝子座内のＲＯＩに隣接する部位および規則正しく間隔のあいた（約１０ｋｂ）離れた部位において起こる。切断はそれぞれ異なる標的部位のセットを用いる２つの別々の反応で行われ、したがって、配列決定後に、得られた重複する断片を使用してリードを繋ぎ合わせることができる。エキソヌクレアーゼ処理、プロモーターを含有するアダプターのライゲーション、ＩＶＴ、およびｃＤＮＡ合成は上に記載されている。プロモーターを含有するアダプターは、プロモーターのすぐ下流に短い固定された配列を含有する。ｃＤＮＡ合成を実施した際にはこの固定された配列に対する相補性を有するプライマーが逆転写（ＲＴ）に使用される。ＩＶＴによって産生されたＲＮＡが２つの挿入部位間の長さにわたる場合、この配列に特異的なＲＴプライマーにより同じ領域にわたるｃＤＮＡ分子が選択される。

潜在的な代替法：必要であれば、各ＩＶＴ産物の始めに固定された配列を使用する長距離ＰＣＲを数サイクル使用して、挿入部位にわたるｃＤＮＡ分子を選択的に増幅することができる。

潜在的な代替法：ＯＮＴによるＲＮＡの配列決定には、大量のＲＮＡが必要である。必要であれば、転写開始から遠い部位（１５～２０ｋｂ）にアニーリングするプライマーを用いてｃＤＮＡ合成を実施して、長い転写物を選択する。相当な割合のシーケンシングリードが標的遺伝子座にマッピングされない場合、アダプターの非標的部位とのライゲーションの防止を試みる。ＣＲＩＳＰＲ処理前のｇＤＮＡの脱リン酸化、およびｇＤＮＡの末端にいわゆる「ダンベル」アダプターでキャップ形成することが２つの可能性のある選択肢である。

（実施例４）
変異体の長い鋳型配列決定のためのＮＧＳ手法の確立

方法：現在のところ、潜在的な診断検査の開発に適用できる主要な市販のプラットフォームが２つ存在する。ＰａｃＢｉｏは、ロングリードシーケンシングのための最初の最も優れた技術であるが、付随する費用が甚大である。つい最近、費用効果が大きな潜在的に実行可能なプラットフォームとしてナノポアシーケンシング技術が登場した。ＯｘｆｏｒｄＮａｎｏｐｏｒｅ（ＯＮＴ）はプラットフォームとして、スループット、費用および正確度に関して成熟を続けている。したがって、これらの利点を鑑みて、ＯＮＴに焦点が当てられている。それにもかかわらず、提唱された方法体系および方法は、主にプラットフォームによらず、現行の２つのまたは今後のロングリードプラットフォームのいずれにも合うように改変することができる。配列決定実行をＯｘｆｏｒｄＮａｎｏｐｏｒｅＭｉｎＩＯＮで実施することができる。

目的２（検証）：（ａ）ロングリード配列アラインメントのための現行のソフトウェアおよびプラットフォームを使用して配列解析を実施して、変異体コーリング、ＣＮＶ解析およびフェージングを実施する。（ｂ）ＣＹＰ２Ｄ６－Ｄ７ロングリード配列解析結果を配列／コピー数変異と比較し、コンセンサス遺伝子型決定およびアノテーションの結果をＧｅｔ－ＲＭプロジェクトからの結果と共に特徴付けて、性能特性およびさらなる診断検査開発に向けたガイダンスを推定する。各方法の実現性を、時間対効果および費用対効果、必要なステップの最小化ならびに結果の質に関して試験し、比較する。包括的な目的は、ＣＹＰ２Ｄ６遺伝子全体の単離、富化、および配列決定に最も適した方法を選択することである。

検証のための試料の選択：試料調製法が開発されたら、既知の遺伝子型およびハプロタイプを有する追加的な試料の拡張セットを解析する。拡張データセットに対してプラットフォームを評価するために、重複、ハイブリッド、選択された欠失、および複雑な再配列などの複雑な構造を有する試料を含める。試料は、ＧｅＴ－ＲＭプロジェクト（上の「ＴｈｅＧｅＴ－ＲＭコホート」を参照されたい）から選択される。これらの細胞株およびデータにより、新規のロングリード配列データを現行の絶対的基準と対照して評価することが可能になるので、独特のリソースがもたらされる。この提唱のために、これらの細胞株のサブセットは、ＬＣＬ細胞株から取得された。細胞株リポジトリ由来のおよび既存の共同研究による他の関連性のある変異体およびハプロタイプを特徴付けるための追加的な試料を得る。追加的な試料を用いて方法体系をさらに検証するために、全ゲノム配列決定を含め、広範囲にわたって特徴付けられているＮＩＳＴＣｏｒｉｅｌｌコホート由来の追加的な細胞株を利用する。さらに、全血および唾液を含めた、典型的な診断用検体を代表する追加的な試料型を取得する。重複、欠失、ハイブリッドおよびタンデム配置を表す全部で４８の細胞株をこの目的での配列決定のために選択する。解析を２連で、合計９６の配列決定された試料について行う。

変異体コーリング、ＣＮＶコーリング、およびフェージング：ロングリードＯＮＴデータのために特別に開発されたソフトウェアパッケージを使用する。Ｃｌａｉｒは、変異体の型、接合性、代替対立遺伝子および挿入／欠失の長さを予測するためのマルチタスク５層畳み込みニューラルネットワークモデルであるＣｌａｉｒｖｏｙａｎｔｅに対する最新のアップデートである。最近開発された追加的なパッケージはＭｅｇａｌｏｄｏｎである。Ｍｅｇａｌｏｄｏｎの機能性は、情報量の多いニューラルネットワーク塩基コーリングを参照配列に繋げることに重点が置かれている。Ｎａｎｏｐｏｒｅ技術の性能特性が最近Ｂｏｗｄｅｎらによって標準の参照試料を使用した全ゲノム配列決定について評価された。８２×カバレッジでのコンセンサス正確度は９９．９％であったが、データからはこのプラットフォームの現行の限定もいくつか示されている。提唱されているのはほんの小さな標的化される領域を配列決定することであるので、また、領域を極めて深く配列決定する能力を考慮すると、現行の解析プラットフォームにより、標的化される配列の十分に正確なデータが生じることが予想される。今後のソフトウェア開発もモニタリングし、新しい方法が利用可能になり次第、それを利用する。

コンセンサスデータとの比較：データをＧｅＴ－ＲＭコンセンサス結果（全てのプラットフォームからの結果、ならびに専門家チームによる変異体の精査に基づく）と比較する。ハプロタイプコーリングＳＮＰおよびＣＮＶについての一致を決定し、ハイブリッドハプロタイプの配列の特色を同定する能力を評価し、代謝型の状態を決定するための一致を測定する。次に、追加的な変異体をＧｅＴ－ＲＭプロジェクトからの遺伝子型決定データと比較する。データをフェージング情報（例えば、決定されたハプロタイプ）と併せて解析して、フェージングされた遺伝子型決定データが結果と一致するかどうかを決定する。なぜなら、これにより、非帰属フェージング情報がもたらされるからである。最後に、配列決定単独で同定される任意の追加的な変異体を同定する。ＣＹＰ２Ｄ６とその偽遺伝子の間の配列類似性に関する探索的配列比較も実施する。

予測される問題：問題の１つは、配列決定プラットフォームの全体的な正確度に関する。最初の手法は、極めて深く配列決定することである。この手法により、非系統的な配列決定の誤りを決定することは可能になるはずであるが、プラットフォームの技術的制約に起因する固有の誤りを決定することはより難しい。ＣＹＰ２Ｄ６参照試料のコンセンサスデータとの比較により、この影響を推定することが可能になる。さらに、ＯＮＴプラットフォームおよび改善された配列解析方法に関するさらなるベンチマーク試験により、ロングリードデータについての配列アノテーションが増大することが予測される。

今後の方向：薬理遺伝学においては、ＣＹＰ２Ｄ６は最も広く試験されている遺伝子の１つとして突出しているが、一方で、現行の試験技術を使用した解析の技術的難易度が高い。最終目的は、不完全であり誤りを生じやすい現行のプラットフォームから置き換えることが可能な統一的な臨床試験法を開発することである。本出願は、ＣＲＩＳＰＲに基づく配列標的化、革新的な断片富化およびロングリードシーケンシングが実行可能な手法であることの概念実証としての機能を果たす。

（実施例５）

解析のための特定のゲノム遺伝子座の標的化

この手法では、ＰＣＲまたはオリゴヌクレオチドハイブリダイゼーションなどの伝統的な方法と比較して、目的の領域（ＲＯＩ）のみの標的化されたカットを行うためにＣＲＩＳＰＲ／ＣＡＳ９系と遺伝子座特異的ガイドＲＮＡを使用する。富化領域選択およびｓｇＲＮＡ設計の新規の手法により、高度に類似した偽遺伝子および反復領域を含む遺伝子座全体を捕捉することが可能になる。そのような領域の例が図１に示されている。

現行の問題

反復領域（例えば、ＲＥＰ６など）を含み、近接する偽遺伝子と高い配列類似性を共有するＣＹＰ２Ｄ６などの高度に多型の遺伝子に対する一般的なＤＮＡ抽出方法体系および配列決定手法には多くの欠点がある。これらの問題としては、ＰＣＲにより導入される誤り、ＰＣＲで捕捉可能なサイズの限定、オフターゲットアレイハイブリダイゼーション、多数のアッセイが必要なこと（例えば、配列決定＋ｑＰＣＲを用いたＣＮＶ解析）、オフターゲットアラインメント、変異体フェージングの欠如ならびに金銭的負担および時間的負担が大きいことが挙げられる。図６では、ＮＧＳにより配列決定された伝統的に調製されたライブラリー６例のＩＧＶアラインメントが強調されている。これらのライブラリー（Ａ～Ｆ）はＣＹＰ２Ｄ６長距離ＰＣＲ（ＸＬ－ＰＣＲ）アンプリコンから生成された。アンプリコンを、ＮＧＳ解析の前に断片化（１００～３００ｂｐ）、アダプターライゲーション、およびＰＣＲ増幅に供した。この手法にはいくつかの限定がある。第１に、ＣＹＰ２Ｄ６について示されている通り、各試料中のＣＹＰ２Ｄ６遺伝子を増幅するために、ＣＹＰ２Ｄ６のコピー数の状態およびハイブリッド対立遺伝子が存在するか否かがＸＬ－ＰＣＲの前に分かっていなければならない。正常な対立遺伝子、重複対立遺伝子、欠失対立遺伝子およびハイブリッド対立遺伝子それぞれに対して特異的なプライマーを使用しなければならない。これにはＮＧＳの前に追加的なコピー数アッセイを実施する必要がある。さらに、ＸＬ－ＰＣＲ増幅時間は一般には標的アンプリコンの長さ１ｋｂ当たり０．５～１時間である。

ショートリード配列データの解析は、フェージング能力の低下によっても妨害され、また、高度に類似した偽遺伝子または相同な領域（例えば、図１に示されている通り、ＣＹＰ２Ｄ６と９４％類似したＣＹＰ２Ｄ７偽遺伝子）とのオフターゲットアラインメントを起こしやすい。さらに、同じ遺伝子の異なるハプロタイプは、偽遺伝子との類似性のレベルが異なり得、変異体を正しくアラインメントすることができない。

ＰＣＲフリーライブラリーには、従来のＰＣＲに基づく手法と比べて著しい利益がある。ＰＣＲフリーライブラリーではＰＣＲ由来の配列の誤りが導入される潜在性が取り除かれ、最大ＰＣＲ産物サイズの現行の限定が克服される。ＸＬ－ＰＣＲ反応時間が除かれ、これは著しい時間の短縮を表し、また、この手法ではヘテロ接合性変異体フェージングおよびコピー数変異（ＣＮＶ）の検出が可能になる。

ｓｇＲＮＡの設計

上記の通り、ＣＹＰ２Ｄ６遺伝子座の複雑で高度に多型の性質に起因して、従来のＰＣＲおよびアレイに基づく技術では、ＣＮＶ解析およびＳＮＰ解析の両方のために多数のアッセイを実施する必要がある。抽出および試料の取扱いの間のＤＮＡせん断に起因して、富化のためのインタクトな標的領域の量を最大にするために、目的の遺伝子を捕捉するために直感的に最小の可能性のあるＣＲＩＳＰＲ／Ｃａｓ９標的領域を選択する。しかし、ＣＹＰ２Ｄ６遺伝子のみを標的とするＣＲＩＳＰＲ／Ｃａｓ９手法では、検出される対立遺伝子の少なくとも２０％を構成する、Ｄ６／Ｄ７ハイブリッド対立遺伝子またはＣＹＰ２Ｄ６重複事象などの構造変異を含有する対立遺伝子を捕捉することができない。妥当なガイドＲＮＡ設計のための高度に複雑な要件の例が図７Ａ～７Ｃに示されている。

第１の設計の限定は、Ｃａｓ９複合体をＲＯＩにターゲティングするためのＲＮＡをＣＹＰ２Ｄ６遺伝子自体の近くに設計することができないことである。これには、２つの主要な理由がある。第１の理由は、ＣＹＰ２Ｄ６に隣接するＣＹＰ２Ｄ７と同一ではない独特の配列の部位が限定されていることである。そのような独特の配列の部位は、十分に機能せず重要なプロモーター領域の変異を捕捉することができない反復領域を含有する。第２の理由は、ＣＹＰ２Ｄ６ＣＮＶまたはＤ６／Ｄ７もしくはＤ７／Ｄ６ハイブリッド対立遺伝子が存在する場合、追加的なカットが生じ、正確なＣＮＶ解析および配列アラインメントができなくなることである（図７Ａ）。ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８の付近をカットする手法の同様の限定がそれぞれ図７Ｂおよび図７Ｃに示されている。

これらの限定を克服するために、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７およびＣＹＰ２Ｄ８のいずれも包含する領域に隣接する、それでもなお長距離配列解析のための妥当なサイズのカット断片を生成する独特の配列を同定した。これらの独特の領域を標的とするｓｇＲＮＡを設計することにより、１つのＣＲＩＳＰＲ／Ｃａｓ９切断反応を実施して、ＣＹＰ２Ｄ６／ＣＹＰ２Ｄ７／ＣＹＰ２Ｄ８領域全体を単離する（図８）。さらに、下流の適用に応じて、設計は、ｓｇＲＮＡがＲＯＩの５’末端を標的とするものであるのかまたは３’末端を標的するものであるのかに応じて正しい鎖（＋または－）を標的とするものでなければならない。試験されるｓｇＲＮＡ配列の非限定的な例を以下の表２に示す。ＣＹＰ２Ｄ６は－鎖にコードされるが、ガイドＲＮＡの位置（上流または下流）は＋鎖に対して参照される。染色体上の位置が低い配列はさらに上流であるとみなされ、染色体上の位置が高い配列は下流であるとみなされる。
表2. ガイドRNA配列

ｓｇＲＮＡの性能解析および検証

ｓｇＲＮＡの特異性および有効性を確認するために、標的化されるｓｇＲＮＡ結合部位を含有するＸＬ－ＰＣＲ産物をｇＤＮＡから生成した。ＸＬ－ＰＣＲ産物を、Ｃａｓ９＋ｓｇＲＮＡなし（もしくはオフターゲットｓｇＲＮＡ）またはＣａｓ９＋目的のｓｇＲＮＡと一緒にインキュベートした。図９Ａは、多数の反応時点における２つの異なるｓｇＲＮＡ（Ｔ＿１およびＴ＿２）のカット効率を示す代表的なアガロースゲルを示す。Ｃａｓ９およびｓｇＲＮＡと一緒にインキュベートした全てのＰＣＲ産物が切断されて、予測されたサイズのＤＮＡ断片が生じたが、異なるｓｇＲＮＡでは異なる程度の切断効率が示された。

ＸＬ－ＰＣＲアンプリコンの切断効率の決定後、ゲノムＤＮＡに対する切断効率を解析した。これは、特異的なｓｇＲＮＡを用いたＣａｓ媒介性カットを実施し、次いで、カットされたＤＮＡに対して定量的ＰＣＲ反応を実施することによって行った。予測されるｓｇＲＮＡ標的カット部位の両側に対してプライマーを設計した。Ｃａｓ９反応または未カット対照のいずれかからの総ゲノムＤＮＡ１００ｎｇに対してＰＣＲ反応を実行した。ＤＮＡが妥当な部位で切断された場合、未カット対照試料（例えば、オフターゲット領域に対するｓｇＲＮＡを使用したＣａｓ９反応）で生成されるＰＣＲ産物の量と比較してＰＣＲ産物の減少が観察される。図９Ｂおよび図９Ｃに示されている通り、この手法を使用して、ｓｇＲＮＡによりゲノムＤＮＡ内の所望のＲＯＩを標的化することができたかどうかを決定し、そのカットの効率を決定した。ＣＹＰ２Ｄ６遺伝子全体のＸＬ－ＰＣＲにより、カットと未カット対照の間に差異は示されなかった。これにより、反応にわたってカット部位において観察されたＰＣＲ産物の量の減少がＤＮＡのランダムなカットに起因するのではなく、これらの特定の領域の標的化Ｃａｓ９媒介性カットに起因することが示される。

高分子量（ＨＭＷ）ＤＮＡの単離

長いセグメント（≧５０ｋｂ）の高分子量ゲノム（ＨＭＷ）ＤＮＡの単離により、ＰＣＲ増幅を伴わずに配列決定ライブラリーを生成することが可能になる。図１０に示されている通り、ＨＭＷＤＮＡを所内でリンパ芽球細胞（１８９５９および１９２１３）からＮａｎｏｂｉｎｄＣＣＢＤｉｇＤＮＡｋｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ、ＭａｄｉｓｏｎＷｉ）を使用して抽出した。抽出されたＤＮＡを２％アガロースゲルに泳動し、サイズをラムダＨＩＮＤＩＩＩラダー（上のバンド、２３．１ｋｂ）、ラムダＤＮＡ（４８．５ｋｂ）、およびＣｏｒｒｉｅｌＩｎｓｔｉｔｕｔｅから取得した以前に抽出されたゲノムＤＮＡ（代替の方法体系によって抽出されたもの）と比較した。所内で抽出したＤＮＡのサイズは他の方法体系によって抽出されたＤＮＡよりも有意に大きく（例としてＣｏｒｉｅｌｌｇＤＮＡ１８９９６）、大多数の実行が４８．５ｋｂのラムダＤＮＡを上回った。高分子量ＤＮＡのさらなる富化をＳｈｏｒｔＲｅａｄＥｌｉｍｉｎａｔｏｒＫｉｔ（Ｃｉｒｃｕｌｏｍｉｃｓ、ＭａｄｉｓｏｎＷｉ）を用いて行った。

ＣＲＩＳＰＲ／Ｃａｓ９富化およびライブラリー調製

上記のｓｇＲＮＡを用いたＣＲＩＳＰＲ／Ｃａｓ９富化をＮａｎｏｐｏｒｅＣａｓ媒介性プロトコール（ＶＮＲ＿９０８４＿ｖ１０９＿ｒｅｖＫ＿０４Ｄｅｃ２０１８）の改変バージョンを使用して実施した。プロセスに使用するｓｇＲＮＡの体積および濃度の改変を行って最適な結果を達成した（具体的にはｓｇＲＮＡ当たり３３．３μｌのｓｇＲＮＡ（３μＭ））。アンプリコンを使用し、ライゲーションプロトコール（ＳＱＫ－ＬＳＫ１０９）によってアダプターをライゲーションし、配列決定のための調製されたライブラリーにＭｉｎＩＯＮ配列決定プラットフォーム（ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＵＫ）を実行し、データ解析を実施した。

概念実証

ＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７－ＣＹＰ２Ｄ８領域全体（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７）を富化させるｓｇＲＮＡを利用した配列決定により、３つの重要な事柄が確認される：（１）このｓｇＲＮＡ設計により標的領域全体が首尾よく捕捉されること、（２）この戦略によりＲＯＩ全体をオフターゲットリードと比べて有意に富化させることが可能になること、および（３）この方法によりＲＯＩ全体（約４０ｋｂ）を首尾よくロングリード配列決定する能力がもたらされること。

図１１Ａに示されている通り、ゲノム全体で、標的化されるＲＯＩを含有する２２番染色体（ｃｈｒ２２）についてのみ著しい配列富化が観察された。他の全てのゲノム領域では最小のカバレッジが示された。ｃｈｒ２２のさらなる解析により、ＲＯＩを含有する領域のみが富化され、＞１０×カバレッジを有することが見いだされた（図１１Ｂ）。全部で、ｃｈｒ２２にマッピングされた１７６リードのうち１２１リードがＲＯＩとアラインメントされる全長リードであった（６８．７５％）。全ての２２番染色体リードについてのリード当たりの平均正確度および同一性が図１１Ｂに示されている。

実行アラインメントおよび時間

アラインメントされたリード長のメジアンは約３９．３５ｋｂ（図１２Ａ）であり、これにより、標的設計サイズの配列決定およびアラインメントが上首尾であったことが示される。注目すべきことに、アラインメントされたリードの全てがｍｉｎＩＯＮでの配列決定の最初の２．５時間のうちに捕捉された（図１２Ｂ）。これにより、本明細書に記載の方法を使用した配列決定時間を標準のロングリードシーケンシング実行時間よりも著しく短縮することができることが示される。これにはターンアラウンドタイムおよび機器のスループットの結果の両方に関して大きな価値がある。

ＩＧＶ解析

配列データアラインメントのさらなるＩＧＶ解析により、シーケンスリードが正しいゲノム位置（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７）にアラインメントされ、ＲＯＩ全体にわたって均一な深さおよびカバレッジを有することが示された。図１３は、標的ＣＹＰ２Ｄ６領域にアラインメントされる１２１の３８．５ｋｂのリードのＩＧＶアラインメントを示す。この手法の特異性をさらに精査するために、逆のＤＮＡ鎖（＋または－）の標的領域におけるｓｇＲＮＡ富化を実施し、配列データアラインメントを元の鎖設計でのｓｇＲＮＡ富化と比較した。図１４に示されている通り、ｓｇＲＮＡ鎖標的に応じてＣＹＰ２Ｄ６－ＣＹＰ２Ｄ７－ＣＹＰ２Ｄ８領域（ｃｈｒ２２：４２，１２２，１１５－４２，１６１，３１７－図の上部のアラインメントに示されている）または隣接領域（図の下部のアラインメントに示されている）のいずれかのＲＯＩにおいて１００％の配列富化が生じた。設計に応じて隣接するオフターゲット領域との重複は観察されなかった。これにより、この手法の２つの極めて重要な点が実証される：（１）本発明者らの設計ＲＯＩ内で著しいオフターゲットカットは生じないこと、および（２）富化手法によりＲＯＩの著しいせん断は導かれないこと。

図１５は、複数の複雑な構造配置についてのｓｇＲＮＡ特異性を示すＳａｓｈｉｍｉプロットを示す。このプロットは、４つの配列決定実行についてアラインメントされた領域を示す。実行からの配列データは、目的の領域（ＲＯＩ）（ｃｈｒ２２：４２，１２２，１１５－４１，１６１，３２０）が捕捉されるように設計されたｓｇＲＮＡを使用したものであり、４つの異なる構造的事象：（１）１つの対立遺伝子におけるＣＹＰ２Ｄ６の欠失；（２）１つの対立遺伝子におけるＣＹＰ２Ｄ６とのタンデムなハイブリッド対立遺伝子；（３）１つの対立遺伝子における重複事象；ならびに（４）１つの対立遺伝子におけるＣＹＰ２Ｄ６の欠失および第２の対立遺伝子におけるＣＹＰ２Ｄ６の重複、を含む。このデータは、上流にＣＹＰ２Ｄ６様またはＣＹＰ２Ｄ７様領域を有するもの、および下流にＣＹＰ２Ｄ６様またはＣＹＰ２Ｄ７様領域を有するものを含めたＣＹＰ２Ｄ６ＣＮＶまたはＤ６／Ｄ７またはＤ７／Ｄ６ハイブリッド対立遺伝子を含む組換えの全ての配向についてＲＯＩの構造的変異の富化が上首尾であったことを表すものである。存在する構造的変異にかかわらずＣＹＰ２Ｄ６の上流の領域とＣＹＰ２Ｄ８の下流の領域の間でオフターゲットのカットは生じず、これにより、図７に記載されている設計の限界が克服され、図８に記載されている手法が確認された。

（実施例６）
目的のゲノム領域を富化させるための入れ子状ＣＲＩＳＰＲ－Ｃａｓ９法

本実施例では、入れ子状ＣＲＩＳＰＲ－Ｃａｓ９手法を使用して、（例えば、複雑な）目的のゲノム領域を富化させる。この手法には、（１）目的の領域に対する富化の特異性の増大；および（２）ＲＯＩの全体的な富化を増大させるための入力ＤＮＡ材料の容量の増大を含め、現行の手法に勝る多くの利点がある。図１７に、本明細書に記載の入れ子状富化を実施するための概略図の例を提示する。

本実施例では、下流での使用のために望まれる量のゲノムＤＮＡを使用してＣＲＩＳＰＲ－Ｃａｓ９反応を実施する。ガイドＲＮＡの外側のセットを、標的とする目的の領域（例えば、ＣＹＰ２Ｄ６遺伝子座）の最大３０ｋｂ下流および上流になるように設計する。Ｃａｓ９－ガイドＲＮＡ複合体により目的のゲノム領域がゲノムＤＮＡからカットされ、目的の領域を含有する切り出されたＤＮＡ断片の末端がブロックされる。次いで、エキソヌクレアーゼ消化を実施し、保護されていないＤＮＡ（例えば、目的の領域を含有しないＤＮＡ）を消化する。目的のゲノム領域を含有するＤＮＡ断片の末端はエキソヌクレアーゼ消化から保護されるので（例えば、結合したＣａｓ９－ガイドＲＮＡ複合体に起因する立体的な障害によって）、目的の領域を含有する切り出されたＤＮＡ断片はインタクトなまま残される。このステップにより、目的の領域の追加的な富化が可能になり、それにより、特異性、およびＣａｓに基づく富化プロトコールの間に一般に使用されるよりも多くの量のゲノムＤＮＡ（例えば、＞１０μｇ）を使用できる能力が増大する。

エキソヌクレアーゼ消化の実施後、富化された大きな消化されなかった断片を、ロングリードシーケンシングに適したサイズの所望の目的の領域を標的とするガイドＲＮＡの内側のセットを使用するＣＲＩＳＰＲ－Ｃａｓ９反応に使用する。このステップにより、第１の富化プロトコールにさらなる特異性が付加され、下流のライブラリー生成のための目的の領域の末端が増える。

入れ子状ＣＲＩＳＰＲ－Ｃａｓ９手法の効率が、２つの代表的なｓｇＲＮＡのセットについて図１８に示されている。図１８に示されている通り、内側のｇＲＮＡカット部位の１０ｋｂ上流（セット１）または２０ｋｂ上流（セット２）のいずれかに位置する２つの代表的な外側のｇＲＮＡのセットを使用して最初の富化を実施した。未カット試料には外側のｇＲＮＡ富化を行わなかった。次いで、同じ内側のｇＲＮＡのセットをセット１、セット２、および未カット試料に使用し、ライブラリーを上記の通り調製した。図１８に示されている通り、未カットに対して観察された倍数富化（ｆｏｌｄｅｎｒｉｃｈｍｅｎｔ）は、セット２についてはおよそ１．７倍、セット１についてはおよそ３．４倍であった。

本開示の好ましい実施形態が本明細書において示され、記載されているが、そのような実施形態が単に例として提供されていることは当業者には明白であろう。当業者は、本開示から逸脱することなく多数の変形、変化および置換をすぐに思いつくであろう。本明細書に記載の本開示の実施形態に対する種々の代替を本開示の実施形態の実施に使用することができることが理解されるべきである。以下の請求項により本開示の範囲が規定されること、ならびに、それにより、これらの請求項の範囲内に入る方法および構造およびそれらの均等物が包含されることが意図されている。

Claims

目的のゲノム領域を解析（例えば、配列決定、遺伝子型決定、構造解析）する方法であって、
ａ）前記目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第１の切り出された断片を生成する、ステップと、
ｂ）前記第１の切り出された断片を、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第２の切り出された断片を生成する、ステップと、
ｃ）前記第２の切り出された断片内に含有される前記目的のゲノム領域を解析するステップと
を含む、方法。
ａ）の前記ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび前記外側のｇＲＮＡの対が前記第１の切り出された断片の５’末端および３’末端と会合し、それをブロックする、請求項１に記載の方法。
ｂ）の前に、ａ）の産物を１種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムＤＮＡが消化され、前記第１の切り出された断片は消化されない、ステップをさらに含む、請求項２に記載の方法。
前記１種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される、前記請求項のいずれか一項に記載の方法。
前記外側のｇＲＮＡの対が、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡとを含む、前記請求項のいずれか一項に記載の方法。
前記第１の外側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第２の外側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項５に記載の方法。
前記第１のヌクレオチド配列と前記第２のヌクレオチド配列が、異なる、請求項６に記載の方法。
前記第１のヌクレオチド配列と前記第２のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項７に記載の方法。
前記第１のヌクレオチド配列、前記第２のヌクレオチド配列、またはその両方が、前記ゲノムＤＮＡ内の、前記目的のゲノム領域から最大約１００キロベース長のところに存在する、請求項８に記載の方法。
前記内側のｇＲＮＡの対が、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡとを含む、前記請求項のいずれか一項に記載の方法。
前記第１の内側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第２の内側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項１０に記載の方法。
前記第３のヌクレオチド配列と前記第４のヌクレオチド配列が、異なる、請求項１１に記載の方法。
前記第３のヌクレオチド配列と前記第４のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項１２に記載の方法。
前記第３のヌクレオチド配列および前記第４のヌクレオチド配列が、前記ゲノムＤＮＡ上の、前記第１のヌクレオチド配列および前記第２のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、請求項６から９までまたは１１から１３までのいずれか一項に記載の方法。
前記第２の切り出された断片の塩基長が、前記第１の切り出された断片よりも短い、前記請求項のいずれか一項に記載の方法。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域を配列決定することを含む、請求項１に記載の方法。
前記ゲノムＤＮＡが、約１０μｇまたはそれよりも多い量で提供される、前記請求項のいずれか一項に記載の方法。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域を遺伝子型決定することを含む、前記請求項のいずれか一項に記載の方法。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域についての構造解析を実施することを含む、前記請求項のいずれか一項に記載の方法。
ｂ）の前に、前記第１の切り出された断片を単離するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
ｃ）の前に、前記第２の切り出された断片を単離するステップをさらに含む、前記請求項のいずれか一項に記載の方法。
ＤＮＡ増幅を伴わない、前記請求項のいずれか一項に記載の方法。
ｃ）の前に、前記第２の切り出された断片の５’末端、３’末端、またはその両方に１つまたは複数のアダプターを付着させるステップをさらに含む、前記請求項のいずれか一項に記載の方法。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼまたはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、前記請求項のいずれか一項に記載の方法。
前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０およびＣｓｆ１からなる群より選択される、請求項２４に記載の方法。
前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃおよびＣａｓ１３ｄからなる群より選択される、請求項２４に記載の方法。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、前記請求項のいずれか一項に記載の方法。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、前記請求項のいずれか一項に記載の方法。
前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項２８に記載の方法。
前記Ｃａｓ９変異体が、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む、請求項２８または２９に記載の方法。
前記ゲノムＤＮＡに対してａ）の前に断片化も消化もせん断も行わない、前記請求項のいずれか一項に記載の方法。
前記ゲノムＤＮＡをａ）の前に制限酵素消化に供さない、前記請求項のいずれか一項に記載の方法。
前記目的のゲノム領域が、複雑なゲノム領域である、前記請求項のいずれか一項に記載の方法。
前記複雑なゲノム領域が、目的の遺伝子および１つまたは複数のその偽遺伝子を含む、請求項３３に記載の方法。
前記１つまたは複数の偽遺伝子が、前記目的の遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む、請求項３４に記載の方法。
前記複雑なゲノム領域が、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項３３のいずれか一項に記載の方法。
前記目的のゲノム領域が、高度に多型の遺伝子座である、前記請求項のいずれか一項に記載の方法。
前記第１の切り出された断片の長さが、少なくとも約０．０６キロベースである、前記請求項のいずれか一項に記載の方法。
前記第１の切り出された断片の長さが、最大約２００キロベースである、前記請求項のいずれか一項に記載の方法。
前記第２の切り出された断片の長さが、少なくとも約０．０２キロベースである、前記請求項のいずれか一項に記載の方法。
前記第２の切り出された断片の長さが、最大約１９９．９８キロベースである、前記請求項のいずれか一項に記載の方法。
前記配列決定することが、ロングリードシーケンシングを含む、前記請求項のいずれか一項に記載の方法。
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項４２に記載の方法。
前記方法は、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、前記請求項のいずれか一項に記載の方法。
多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項４４に記載の方法。
前記ゲノムＤＮＡが、生体試料で提供されるまたは得られる、前記請求項のいずれか一項に記載の方法。
前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳）または固形組織試料を含む、請求項４６に記載の方法。
前記生体試料が、診断用試料である、請求項４７に記載の方法。
前記目的のゲノム領域が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座である、前記請求項のいずれか一項に記載の方法。
前記解析するステップが、ＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定することを含む、請求項４９に記載の方法。
前記遺伝的変異に基づいて、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定するステップをさらに含む、請求項５０に記載の方法。
前記同定するステップに基づいて、前記対象に対して処置または代替処置を推奨するステップをさらに含む、請求項５１に記載の方法。
前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、前記対象に対して代替処置を推奨する、請求項５１に記載の方法。
前記同定するステップに基づいて、前記対象に対して治療薬のある投薬量を推奨するステップをさらに含む、請求項５１に記載の方法。
前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、治療薬の投薬量を変更する、請求項５１に記載の方法。
前記外側のｇＲＮＡの対、前記内側のｇＲＮＡの対、またはその両方が、配列番号１～４１８のいずれか１つから選択されるｇＲＮＡを含む、前記請求項のいずれか一項に記載の方法。
目的のゲノム領域を解析するためのキットであって、
ａ）クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼ；
ｂ）
ｉ）ゲノムＤＮＡ内の前記目的のゲノム領域の上流に存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の外側のｇＲＮＡと、
ｉｉ）ゲノムＤＮＡ内の前記目的のゲノム領域の下流に存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の外側のｇＲＮＡと
を含む外側のｇＲＮＡの対
ｃ）
ｉｉｉ）ゲノムＤＮＡ内の前記目的のゲノム領域の上流に存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第１の内側のｇＲＮＡと、
ｉｖ）ゲノムＤＮＡ内の前記目的のゲノム領域の下流に存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む第２の内側のｇＲＮＡと
を含む内側のｇＲＮＡの対
を含み、前記第３のヌクレオチド配列および前記第４のヌクレオチド配列が、前記ゲノムＤＮＡ上の、前記第１のヌクレオチド配列および前記第２のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、
キット。
１種または複数種のエキソヌクレアーゼをさらに含む、請求項５７に記載のキット。
前記１種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される、請求項５８に記載のキット。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１またはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項５７から５９までのいずれか一項に記載のキット。
前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０およびＣｓｆ１からなる群より選択される、請求項６０に記載のキット。
前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃおよびＣａｓ１３ｄからなる群より選択される、請求項６０に記載のキット。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項５７から６２までのいずれか一項に記載のキット。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項５７から６３までのいずれか一項に記載のキット。
前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項６４に記載のキット。
前記Ｃａｓ９変異体が、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む、請求項６４または６５に記載のキット。
前記目的のゲノム領域が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含むゲノム遺伝子座である、請求項５７から６６までのいずれか一項に記載のキット。
前記第１の外側のガイドＲＮＡ、前記第１の内側のガイドＲＮＡ、またはその両方が、配列番号３～１２、１７～２６、６８～７７、８２～２１４、および３４４～４１８のいずれか１つのヌクレオチド配列を含む、請求項６７に記載のキット。
前記第２の外側のガイドＲＮＡ、前記第２の内側のガイドＲＮＡ、またはその両方が、配列番号１、２、１３～１６、２７～６７、７８～８１、および２１５～３４３のいずれか１つのヌクレオチド配列を含む、請求項６７または６８に記載のキット。
入れ子状ＣＲＩＳＰＲ反応に前記キットを使用するための指示をさらに含む、請求項５７から６９までのいずれか一項に記載のキット。
前記目的のゲノム領域をゲノムＤＮＡから切り出すために前記キットを使用するための指示をさらに含む、請求項５７から７０までのいずれか一項に記載のキット。
目的のゲノム領域を解析するためのシステムであって、
（ａ）
（ｉ）前記目的のゲノム領域を含むゲノムＤＮＡを、クラスター化された規則的な配置の短い回文配列リピート（ＣＲＩＳＰＲ）関連エンドヌクレアーゼおよび外側のガイドＲＮＡ（ｇＲＮＡ）の対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第１の切り出された断片を生成する、ステップと、
（ｉｉ）前記第１の切り出された断片を、ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび内側のｇＲＮＡの対と接触させるステップであって、それにより、前記目的のゲノム領域を含む第２の切り出された断片を生成する、ステップと、
（ｉｉｉ）前記第２の切り出された断片内に含有される前記目的のゲノム領域を解析するステップと
を含む方法により生成されたデータを含むデータ入力を受け取るように構成された少なくとも１つのメモリ位置；ならびに、
（ｂ）前記少なくとも１つのメモリ位置に作動可能にカップリングしたコンピュータプロセッサであって、前記データに基づいて出力を生成するようにプログラムされている、コンピュータプロセッサ
を含むシステム。
前記出力が、レポートである、請求項７２に記載のシステム。
前記出力が、前記目的のゲノム領域の遺伝子型である、請求項７２または７３に記載のシステム。
前記出力が、前記目的のゲノム領域の遺伝子配列である、請求項７２または７３に記載のシステム。
前記出力が、前記目的のゲノム領域の構造解析である、請求項７２または７３に記載のシステム。
前記解析するステップが、前記目的のゲノム領域を遺伝子型決定することを含む、請求項７２から７６までのいずれか一項に記載のシステム。
前記解析するステップが、前記目的のゲノム領域の構造解析を実施することを含む、請求項７２から７７までのいずれか一項に記載のシステム。
前記解析するステップが、前記目的のゲノム領域を配列決定することを含む、請求項７２から７８までのいずれか一項に記載のシステム。
前記配列決定することが、ロングリードシーケンシングを含む、請求項７９に記載のシステム。
前記ロングリードシーケンシングが、単一分子リアルタイムシーケンシングまたはナノポアシーケンシングを含む、請求項８０に記載のシステム。
（ｉ）の前記ＣＲＩＳＰＲ関連エンドヌクレアーゼおよび前記外側のｇＲＮＡの対が、前記第１の切り出された断片の５’末端および３’末端と会合し、それをブロックする、請求項７２から８１までのいずれか一項に記載のシステム。
（ｉｉ）の前に、（ｉ）の産物を１種または複数種のエキソヌクレアーゼと接触させるステップであって、その結果、バックグラウンドゲノムＤＮＡが消化され、前記第１の切り出された断片は消化されない、ステップをさらに含む、請求項８２に記載のシステム。
前記１種または複数種のエキソヌクレアーゼが、エキソヌクレアーゼＩ、エキソヌクレアーゼＩＩ、エキソヌクレアーゼＩＩＩ、エキソヌクレアーゼＩＶ、エキソヌクレアーゼＶ、エキソヌクレアーゼＶＩ、エキソヌクレアーゼＶＩＩ、エキソヌクレアーゼＶＩＩＩ、およびこれらの任意の組合せからなる群より選択される、請求項７２から８３までのいずれか一項に記載のシステム。
前記外側のｇＲＮＡの対が、第１の外側のｇＲＮＡと第２の外側のｇＲＮＡとを含む、請求項７２から８４までのいずれか一項に記載のシステム。
前記第１の外側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第１のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第２の外側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第２のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項８５に記載のシステム。
前記第１のヌクレオチド配列と前記第２のヌクレオチド配列が、異なる、請求項８６に記載のシステム。
前記第１のヌクレオチド配列と前記第２のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項８７に記載のシステム。
前記第１のヌクレオチド配列、前記第２のヌクレオチド配列、またはその両方が、前記ゲノムＤＮＡ内の、前記目的のゲノム領域から最大約１００キロベース長のところに存在する、請求項８８に記載のシステム。
前記内側のｇＲＮＡの対が、第１の内側のｇＲＮＡと第２の内側のｇＲＮＡとを含む、請求項７２から８９までのいずれか一項に記載のシステム。
前記第１の内側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第３のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含み、前記第２の内側のｇＲＮＡが、前記ゲノムＤＮＡ内に存在する第４のヌクレオチド配列と実質的に相補的なヌクレオチド配列を含む、請求項９０に記載のシステム。
前記第３のヌクレオチド配列と前記第４のヌクレオチド配列が、異なる、請求項９１に記載のシステム。
前記第３のヌクレオチド配列と前記第４のヌクレオチド配列が、前記目的のゲノム領域に隣接する、請求項９２に記載のシステム。
前記第３のヌクレオチド配列および前記第４のヌクレオチド配列が、前記ゲノムＤＮＡ上の、前記第１のヌクレオチド配列および前記第２のヌクレオチド配列よりも前記目的のゲノム領域に近い塩基長のところに存在する、請求項９１から９３までのいずれか一項に記載のシステム。
前記第２の切り出された断片の塩基長が、前記第１の切り出された断片よりも短い、請求項７２から９４までのいずれか一項に記載のシステム。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域を配列決定することを含む、請求項７２から９５までのいずれか一項に記載のシステム。
前記ゲノムＤＮＡが、約１０μｇまたはそれよりも多い量で提供される、請求項７２から９６までのいずれか一項に記載のシステム。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域を遺伝子型決定することを含む、請求項７２から９７までのいずれか一項に記載のシステム。
前記解析するステップが、前記第２の切り出された断片内に含有される前記目的のゲノム領域についての構造解析を実施することを含む、請求項７２から９８までのいずれか一項に記載のシステム。
（ｉｉ）の前に、前記第１の切り出された断片を単離するステップをさらに含む、請求項７２から９９までのいずれか一項に記載のシステム。
（ｉｉｉ）の前に、前記第２の切り出された断片を単離するステップをさらに含む、請求項７２から１００までのいずれか一項に記載のシステム。
前記方法が、ＤＮＡ増幅を伴わない、請求項７２から１０１までのいずれか一項に記載のシステム。
（ｉｉｉ）の前に、前記第２の切り出された断片の５’末端、３’末端、またはその両方に１つまたは複数のアダプターを付着させるステップをさらに含む、請求項７２から１０２までのいずれか一項に記載のシステム。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼまたはクラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼである、請求項７２から１０３までのいずれか一項に記載のシステム。
前記クラス１ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ３、Ｃａｓ５、Ｃａｓ８ａ、Ｃａｓ８ｂ、Ｃａｓ８ｃ、Ｃａｓ１０ｄ、Ｃｓｅ１、Ｃｓｅ２、Ｃｓｙ１、Ｃｓｙ２、Ｃｓｙ３、ＧＳＵ００５４、Ｃａｓ１０、Ｃｓｍ２、Ｃｍｒ５、Ｃｓｘ１１、Ｃｓｘ１０およびＣｓｆ１からなる群より選択される、請求項１０４に記載のシステム。
前記クラス２ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９、Ｃａｓ１２ａ、Ｃｓｎ２、Ｃａｓ４、Ｃａｓ１２ｂ、Ｃａｓ１２ｃ、Ｃａｓ１３ａ、Ｃａｓ１３ｂ、Ｃａｓ１３ｃおよびＣａｓ１３ｄからなる群より選択される、請求項１０４に記載のシステム。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、野生型ＣＲＩＳＰＲ関連エンドヌクレアーゼに対して少なくとも８０％の配列同一性を有するアミノ酸配列を含む、請求項７２から１０６までのいずれか一項に記載のシステム。
前記ＣＲＩＳＰＲ関連エンドヌクレアーゼが、Ｃａｓ９またはその変異体である、請求項７２から１０７までのいずれか一項に記載のシステム。
前記Ｃａｓ９が、ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）である、請求項１０８に記載のシステム。
前記Ｃａｓ９変異体が、野生型ＳｔｒｅｐｔｏｃｏｃｃｕｓｐｙｏｇｅｎｅｓＣａｓ９（ｓｐＣａｓ９）と比べて、Ｒ７８０Ａ、Ｋ８１０Ａ、Ｋ８４８Ａ、Ｋ８５５Ａ、Ｈ９８２Ａ、Ｋ１００３Ａ、Ｒ１０６０Ａ、Ｄ１１３５Ｅ、Ｎ４９７Ａ、Ｒ６６１Ａ、Ｑ６９５Ａ、Ｑ９２６Ａ、Ｌ１６９Ａ、Ｙ４５０Ａ、Ｍ４９５Ａ、Ｍ６９４ＡおよびＭ６９８Ａからなる群より選択される１つまたは複数の点突然変異を含む、請求項１０８または１０９に記載のシステム。
前記ゲノムＤＮＡに対して（ｉ）の前に断片化も消化もせん断も行わない、請求項７２から１１０までのいずれか一項に記載のシステム。
前記ゲノムＤＮＡを（ｉ）の前に制限酵素消化に供さない、請求項７２から１１１までのいずれか一項に記載のシステム。
前記目的のゲノム領域が、複雑なゲノム領域である、請求項７２から１１２までのいずれか一項に記載のシステム。
前記複雑なゲノム領域が、目的の遺伝子および１つまたは複数のその偽遺伝子を含む、請求項１１３に記載のシステム。
前記１つまたは複数の偽遺伝子が、前記目的の遺伝子に対して少なくとも７５％の配列同一性を有するヌクレオチド配列を含む、請求項１１４に記載のシステム。
前記複雑なゲノム領域が、１つまたは複数の反復領域、１つまたは複数の重複、１つまたは複数の挿入、１つまたは複数の逆位、１つまたは複数のタンデムリピート、１つまたは複数のレトロトランスポゾン、またはこれらの任意の組合せを含む、請求項１１３に記載のシステム。
前記目的のゲノム領域が、高度に多型の遺伝子座である、請求項７２から１１６までのいずれか一項に記載のシステム。
前記第１の切り出された断片の長さが、少なくとも約０．０６キロベースである、請求項７２から１１７までのいずれか一項に記載のシステム。
前記第１の切り出された断片の長さが、最大約２００キロベースである、請求項７２から１１８までのいずれか一項に記載のシステム。
前記第２の切り出された断片の長さが、少なくとも約０．０２キロベースである、請求項７２から１１９までのいずれか一項に記載のシステム。
前記第２の切り出された断片の長さが、最大約１９９．９８キロベースである、請求項７２から１２０までのいずれか一項に記載のシステム。
前記方法が、ポリメラーゼ連鎖反応（ＰＣＲ）または等温増幅のいずれも伴わない、請求項７２から１２１までのいずれか一項に記載のシステム。
前記方法が、多重置換増幅（ＭＤＡ）、鎖置換増幅（ＳＤＡ）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ループ媒介性等温増幅、ローリングサークル増幅（ＲＣＡ）、リガーゼ連鎖反応（ＬＣＲ）、ヘリカーゼ依存性増幅、または分岐増幅法のいずれも伴わない、請求項１２２に記載のシステム。
前記ゲノムＤＮＡが、生体試料で提供されるまたは得られる、請求項７２から１２３までのいずれか一項に記載のシステム。
前記生体試料が、体液（例えば、血液（例えば、全血、血漿、血清）、尿、唾液、骨髄、脊髄液、喀痰、腹水、リンパ液、胸膜液、羊水、精液、膣液、汗、便、腺分泌物、眼内液、母乳）または固形組織試料を含む、請求項１２４に記載のシステム。
前記生体試料が、診断用試料である、請求項１２４に記載のシステム。
前記目的のゲノム領域が、ＣＹＰ２Ｄ６、ＣＹＰ２Ｄ７、およびＣＹＰ２Ｄ８を含む遺伝子座である、請求項７２から１２６までのいずれか一項に記載のシステム。
前記解析するステップが、ＣＹＰ２Ｄ６の１つまたは複数の遺伝的変異を同定することを含む、請求項１２７に記載のシステム。
前記出力が、前記遺伝的変異に基づいた、対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有することの同定を含む、請求項１２８に記載のシステム。
前記出力が、前記同定に基づいた前記対象に対する処置または代替処置の推奨を含む、請求項１２９に記載のシステム。
前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、前記出力が、前記対象に対する代替処置の推奨をさらに含む、請求項１２９に記載のシステム。
前記出力が、前記同定に基づいた前記対象に対する治療薬のある投薬量の推奨をさらに提供するものである、請求項１２９に記載のシステム。
前記対象がＣＹＰ２Ｄ６機能の低下、喪失、または増大を有すると同定された場合、前記出力が、治療薬の投薬量を変更するための推奨をさらに含む、請求項１２９に記載のシステム。
前記外側のｇＲＮＡの対、前記内側のｇＲＮＡの対、またはその両方が、配列番号１～４１８のいずれか１つから選択されるｇＲＮＡを含む、請求項７２から１３３までのいずれか一項に記載のシステム。