JP2023508774A

JP2023508774A - 核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用

Info

Publication number: JP2023508774A
Application number: JP2022564692A
Authority: JP
Inventors: ▲趙▼丁丁; ▲冒▼燕; 孔令印; 梁波
Original assignee: Suzhou Basecare Medical Device Co Ltd
Current assignee: Suzhou Basecare Medical Device Co Ltd
Priority date: 2020-10-14
Filing date: 2021-04-15
Publication date: 2023-03-03
Anticipated expiration: 2041-04-15
Also published as: CN111961707A; JP7429072B2; WO2022077885A1; US20230250421A1; AU2021359279A1; CN111961707B; CA3162685A1; EP4060051A1; EP4060051A4

Abstract

本発明は、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析におけるその使用に関する。第１のエンドヌクレアーゼおよび第２のエンドヌクレアーゼの組合せにより酵素切断を行い、一定の断片範囲内のＤＮＡ配列を捕捉した後、捕捉した特定の配列に対してシーケンシングを行い、ゲノムの平均シーケンシング深さが３×以上である場合、全ゲノム範囲内にＳＮＰ分析を行い、家族サンプル連鎖分析により胚の均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効ＳＮＰサイトおよびその深さを確保し、ハプロタイプの構築に利用可能なＳＮＰサイトの数を向上させることができる。さらに、極めて低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分のＳＮＰおよびｉｎｄｅｌｓを取得することができ、ＳＮＰに対してマルチＰＣＲプライマーを設計する必要がないので、必要なデータ量および検出コストを大幅に低下させることができる。【選択図】図１

Description

本発明は、分子生物学の分野に関し、特に、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用に関する。

簡略化ゲノムシーケンシングとは、種の全ゲノムシーケンシング手法を十分に示すように、制限エンドヌクレアーゼでゲノムＤＮＡを切断し、指定の部分に対してハイスループットシーケンシングを用いて、大量の遺伝多型タグ配列を得る方法である。当該方法は、ゲノムの複雑度を低減させ、実施過程がシンプルで、コストを節約することができるとともに、参照ゲノムに依存することなく、全ゲノムにおける遺伝多型タグを取得することができるため、分子標記の開発、遺伝マップの構築、遺伝子／ＱＴＬマッピング、全ゲノム関連分析、集団遺伝分析および分子育種分野に広く適用されている。しかし、既存の簡略化ゲノムシーケンシングは、捕捉可能なＳＮＰ数が少ない（一般的に、２０万個よりも少ない）と共に、そのライブラリー構築手順が比較的複雑であり、末端修復やｄＡテール追加などの煩雑なライブラリー構築手順が必要であるか、或いはＰｉｐｐｉｎまたはゲル回収などによりフラグメント分取を行う必要がある。また、そのライブラリー構築方法は、兼用性が低く、ある１つのシーケンシングプラットホームのみに対して展開することができないので、複数種のハイスループットシーケンシングプラットホームを柔軟に兼用することができない。上記原因を総合すると、簡略化ゲノムシーケンシングが生殖補助分野に適用・普及されることは、少ない。

胚移植前遺伝学的検査（ＰｒｅｉｍｐｌａｎｔａｔｉｏｎＧｅｎｅｔｉｃＴｅｓｔｉｎｇ、ＰＧＴ）とは、体外受精した胚を移植する前に、胚の遺伝物質を取り出して分析し、異常があるか否かを判断し、健康な胚を選定して移植することにより、遺伝病の遺伝を防止する方法を指す。現在、ＰＧＴの過程において、よく用いられる技術的手段には、蛍光インサイチュハイブリダイゼーション（ＦＩＳＨ：ＦｌｕｏｒｅｓｃｅｎｃｅＩｎ－ＳｉｔｕＨｙｂｒｉｄｉｚａｔｉｏｎ）、ＳＮＰ全ゲノムマイクロアレイチップ（ＳＮＰ－ａｒｒａｙ）およびハイスループットシーケンシング（ＮＧＳ）などが含まれる。ハイスループットシーケンシング技術に基づく検出方法は、体外受精した胚が３～５日発育した際に、８細胞期における卵割球細胞または胚盤胞期（ｂｌａｓｔｏｃｙｓｔ）における栄養層細胞を取り出し、単細胞全ゲノム増幅を行ってゲノムＤＮＡを得た後、シーケンシングライブラリーを構築してシーケンシングを行い、シーケンシング結果に基づいて後続の分析を行うものである。

しかしながら、胚が遺伝病を保有する情況を取得するために、通常、ライブラリーを構築する際に、遺伝病遺伝子の上流・下流に緊密に連鎖したＳＮＰサイトに対してマルチプライマーを設計して増幅を行う。有効ＳＮＰサイトおよびそのシーケンシング深さを確保するためには、多くのデータを取得する必要があるので、検出に時間がかかり、コストが高い。そして、異なる遺伝病に対して、毎回、独立してマルチＳＮＰサイト増幅プライマーを再設計する必要がある。そして、マルチプライマーに対して検証試験および最適化を行う必要がある。実際に胚を検出する前に、家族（夫、妻、および発端者を含む）の事前試験を行う必要があり、事前試験結果に基づいて十分な有効ＳＮＰサイトを取得することができる場合のみ、胚サンプルの検出を展開することができる。このような従来方法は、検出周期全体が長すぎ、失敗のリスクが高く、臨床適用および普及に不利である。それと同時に、遺伝病遺伝子の上流・下流における少量のＳＮＰサイトのみを捕獲してシーケンシングすることができることに起因して、相同組み換えによる分析エラーが極めて発生しやすい。

従って、全ゲノムシーケンシングに必要なデータ量を減少させることができ、ＳＮＰに対してマルチプライマーを設計する必要がない核酸ライブラリーの構築方法を提供する必要がある。

核酸ライブラリーの構築方法であって、
ターゲットヒトサンプルのゲノムＤＮＡを取得するステップと、
第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せを用いて前記ゲノムＤＮＡを切断して高密度酵素切断産物を得るステップであって、前記第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均１Ｍｂセグメント当たり、２０００～５０００の酵素切断部位を提供し、且つヒトゲノムの消化断片の両端に２～５ｎｔの付着末端を生成することができるものであるステップと、
前記酵素切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第１のエンドヌクレアーゼの切断による付着末端と相補性の第１のリンカーと、前記第２のエンドヌクレアーゼの切断による付着末端と相補性の第２のリンカーと、を含むステップと、
前記連結産物から２００ｂｐ～４００ｂｐの断片を選別して取得するステップと、
最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてＰＣＲ増幅を行って、シーケンシングライブラリーを得るステップと
を含む、核酸ライブラリーの構築方法。

そのうちの一実施形態において、前記第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ＭｂｏＩとＮｓｐＩ、ＢｆａＩとＴａｑＩ、またはＭｂｏＩとＭｓｐＩである。

そのうちの一実施形態において、前記第１のリンカーの配列は、配列番号１および配列番号２に示され、前記第２のリンカーの配列は、配列番号３および配列番号４に示されている。

そのうちの一実施形態において、前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第１のリンカーと相補ペアリング可能な上流プライマーと、前記第２のリンカーと相補ペアリング可能であり、且つｂａｒｃｏｄｅ配列を有する下流プライマーと、を含む。

そのうちの一実施形態において、前記上流プライマーの配列は、配列番号５に示され、前記下流プライマーの配列は、配列番号６に示されている。

そのうちの一実施形態において、前記切断ステップにおいて、前記第１のエンドヌクレアーゼと前記第２のエンドヌクレアーゼの体積比が１：（０．８～１．２）である。

そのうちの一実施形態において、磁気ビーズ分取の方法を用いて前記ライゲーション生成物から選別して２００ｂｐ～４００ｂｐの断片を取得する。

そのうちの一実施形態において、前記ゲノムＤＮＡを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるＤＮＡを全ゲノム増幅するステップを含む。

そのうちの一実施形態において、前記シーケンシングライブラリーの濃度を測定するステップをさらに含む。

本発明は、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法をさらに提供する。当該方法は、上記核酸ライブラリーの構築方法を用いて、胚サンプルおよび当該胚サンプルの親の少なくとも一人のシーケンシングライブラリーを構築し、次にシーケンシングを行い、シーケンシング結果に基づいて当該胚サンプルの染色体を分析するステップを含む。

そのうちの一実施形態において、前記分析ステップは、具体的に、染色体構造変異の分析、および染色体異数性変異の分析を含む。

本発明に係る核酸ライブラリーの構築方法は、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断し、そうすることで、当該第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ヒトゲノムの平均１Ｍｂセグメント当たり２０００～５０００の酵素切断部位を提供することができ、酵素切断部位の分布は均一であり、９５％超のゲノムウィンドウをカバーし、酵素切断断片は主に１００ｂｐ～６００ｂｐに分布し、酵素切断断片の両端に２～５ｎｔの付着末端が生成される。ランダム法による酵素切断と異なる点は、断片化だけでなく、指向的に捕捉するために、我々は、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せを用いて全ゲノムにおける所定領域（１０％～２０％）のみに対して酵素切断を行った後、選別により必要なサイズの捕捉した断片を取得してシーケンシングを行う。こうすることで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法は、データ量（２０Ｍ、４０Ｍ、８０Ｍ）の低い第２世代シーケンシングにより、９０万個以上のＳＮＰサイト、１５万以上のｉｎｄｅｌ（インデルマーカー）を取得することができ、そのうち、１０×シーケンシング深さ超のＳＮＰサイトが５０万個以上である。本発明は、簡略化ゲノムシーケンシング技術を基に、優位なエンドヌクレアーゼの組合せを選別して全ゲノムタイピングのための十分な有効ＳＮＰサイトを取得しながら、特定のシーケンシングリンカーおよび磁気ビーズ法分取手法を用いてライブラリー構築手順を簡略化し、マルチプライマーを設計して捕捉したＳＮＰに対して胚移植前遺伝学分析を行う必要がない技術体系を確立し、全ゲノムシーケンシングに必要なデータ量を低下させ、一回の試験において染色体構造異常の分析と、染色体異数性異常の分析を同時に行うことができる。

本発明の一実施形態における核酸ライブラリーの構築方法の原理の模式図である。本発明の一実施形態におけるシーケンシングリンカーの構造の模式図である。実施例１における５４８１１０１Ｅ胚の検出結果の散布図（正倍数体）である。実施例１における５４８１１０２Ｅ胚の検出結果の散布図（正倍数体）である。実施例１における５４８１１０３Ｅ胚の検出結果の散布図（正倍数体）である。実施例１における５４８１１０４Ｅ胚の検出結果の散布図（ｄｅｌ（８）（ｐ２３．３ｐ２３．１）、ｄｕｐ（１４）（ｑ２３．２ｑ３２．３３））である。実施例１における５４８１１０５Ｅ胚の検出結果の散布図（ｄｅｌ（８）（ｐ２３．３ｐ２３．１）、ｄｕｐ（１４）（ｑ２３．２ｑ３２．３３））である。実施例１における各胚の８番染色体均衡型転座の分析結果である。実施例１における各胚の１４番染色体均衡型転座の分析結果である。実施例２における細胞株の検出結果の散布図（ｄｅｌ（８）－５．２Ｍ）である。

以下、本発明を理解しやすくするために、本発明についてより詳細に説明し、本発明のより好ましい実施例を示す。しかしながら、本発明は、多くの異なる形態で実現することができ、本明細書に記載される実施例に制限されない。逆に、これらの実施例は、本発明に開示される内容に対する理解がより徹底的且つ包括的になるように提供される。

別途定義されない限り、本明細書に用いられる全ての技術用語及び科学用語は、本発明の技術分野に属する当業者が通常理解できるものと同じ意味を有する。本明細書の開示において使用する用語は、単に具体的な実施形態を説明するためのものに過ぎず、本発明を限定するものではない。本明細書に用いられる用語「および／または」は、１つまたは複数の関連する挙げられた項目のいずれか一項、およびあらゆる組合せを含む。

用語についての解釈
染色体とは、細胞核を構成する基本的な物質であり、遺伝子の担体である。染色体構造異常とは、染色体または染色分体が断裂－再交換または互換メカニズムによって染色体異常（ｃｈｒｏｍｏｓｏｍｅａｂｅｒｒａｔｉｏｎ）および染色分体異常（ｃｈｒｏｍａｔｉｄａｂｅｒｒａｔｉｏｎ）を発生することを指す。染色体相互転座は、最もよく見られる染色体構造異常であり、主に非相同染色体同士が互いに染色体断片を交換することを指す。

均衡型転座とは、２本の非相同染色体がそれぞれ断裂およびスプライシング異常を発生して構造上で再転座した染色体を２本形成することを指し、相互転座およびロシュ転座を含む。染色体均衡型転座に既存の遺伝子の総数が保留されるので、均衡型転座保有者個体には、明らかな病気表現型がないが、生殖障害が多く存在する。主に、均衡型転座の保有者が減数分裂時に不均衡配偶子を発生する可能性があるため、ある１つの遺伝物質が低減または増加して遺伝物質のバランスを破壊することを引き起こし、最終に、奇形胎児または不妊不稔を引き起こす。理論的には、２本の染色体均衡型転座の保有者は減数分裂においてテトラッドを形成することができ、その分離形態に応じて生成可能な配偶子のタイプは多様であり、一般的に２：２分離および１：３分離によって少なくとも１８種の異なる配偶子を生成することができ、また、４：０分離によって１０種の配偶子を生成することができることが認められる。研究によれば、４：０の確率はいずれも小さく、よく見られる分離形態は２：２分離であることが示される。非相同染色体のロシュ転座保有者による６種の配偶子のうち、１／６が正常な配偶子であり、１／６が携帯型であり、４／６が異常な配偶子である。均衡型転座患者が正常な人と繁殖する場合、配偶子の分離タイプによれば、胚において染色体正倍数体、不均衡型転座によるモノソミーまたはトリソミー、均衡型転座保有者などの出願を生じる。染色体異数性は、原因不明の流産、奇形胎児、不妊不稔および死胎を引き起こす要因である。

ＦＩＳＨ技術とは、蛍光標識プローブによってインサイチュで検体サンプルの核酸配列のハイブリダイゼーションを行い、蛍光顕微鏡によるＤＮＡ観察によって染色体の構造および数の分析を行う方法である。胚細胞の特定の染色体に対してＦＩＳＨプローブハイブリダイゼーション検出を行うことにより、蛍光顕微鏡下で検出する染色体に転座およびコピー数多型が発生するか否かを観察することができる。ＦＩＳＨ技術は、迅速で高感度といった利点を有するが、その限界は、スループットが低いことにある。蛍光顕微鏡は、現在、５種の異なる染色体プローブの蛍光信号のみを同時に観察することができるので、より多くの数の染色体を分析するためには、２回以上のハイブリダイゼーションが必要である。単細胞に対して複数回のハイブリダイゼーションを行うことは、エラー率を増加させる場合があるので、ＦＩＳＨは、有限な染色体のみに対して検出を行うことができ、すべての染色体異数性を検出することはできない。

ＳＮＰアレイ（ＳＮＰａｒｒａｙ）は、大量のＳＮＰサイトを含有する高密度マイクロアレイチップであり、大多数のＳＮＰチップは、６０万以上のＳＮＰを検出することができる。アレルヘテロ接合体の信号強度割合を分析することにより、染色体全体のコピー数多型を検出することができるだけでなく、家族全ゲノム範囲内のＳＮＰ連鎖分析により、均衡型転座携帯胚および正常な胚を区別することができる。ＳＮＰアレイに基づく検出技術は、正常な胚と均衡型転座保有胚とを区別するための使用実績がある。しかし、当該技術には既知変異の固定されたプローブが用いられ、変更可能性および柔軟性が低く、ある複雑な領域においてはハイブリダイゼーション後のサイトが少なく、ハイブリダイゼーション後のバックグラウンドの干渉がタイピングに失敗するリスクをもたらす。胚サンプルの検出において、ＣＮＶは低い感度で検出され、１０Ｍ以下のＣＮＶを検出することはできず、キメラに対する検出効果が良くない。

一ヌクレオチド多型（ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍ、ＳＮＰ）とは、主にゲノムレベルでの単一ヌクレオチドの変異によるＤＮＡ配列多型を指す。ハプロタイプ（Ｈａｐｌｏｔｙｐｅ）とは、１本の染色体の特定の領域における、互いに関連し、全体として後代に遺伝する傾向にある複数の一ヌクレオチド多型の組合せを指し、一倍体型または単位型とも呼ばれている。シーケンシング深さとは、たとえば一実施形態において、シーケンシング深さが１０００Ｘであれば、特定のＰＣＲ増幅産物が１０００回シーケンシングされることを表す。

ＰＧＴ－ＳＲは、胚染色体に逆転、均衡型転座およびロシュ転座が存在するか否かの検出を標的とするものであり、元のＰＧＤのうちの一部に相当する。そのうち、ＳＲとは、「ｃｈｒｏｍｏｓｏｍａｌｓｔｒｕｃｔｕｒａｌｒｅａｒｒａｎｇｅｍｅｎｔｓ（染色体構造異常）」を指す。ＰＧＴ－Ａは、胚染色体に異数性が存在するか否かを検出する技術であり、元のＰＧＳに相当する。そのうち、Ａとは、「ａｎｅｕｐｌｏｉｄｙ（異数性）」を指す。ＰＧＴ－Ｍは、ある単一遺伝子病を引き起こし得る突然変異遺伝子を胚が保有するか否かの検出を標的とするものであり、元のＰＧＤの一部に相当する。そのうち、Ｍとは、「ｍｏｎｏｇｅｎｉｃ／ｓｉｎｇｌｅｇｅｎｅｄｅｆｅｃｔｓ（単一遺伝子病または欠陥）」を指す。

本発明の一実施形態における核酸ライブラリーの構築方法は、以下のステップＳ１～Ｓ５を含む。

Ｓ１：標的ヒトサンプルのゲノムＤＮＡを取得する。

Ｓ２：第１のエンドヌクレアーゼおよび第２のエンドヌクレアーゼの組合せを用いてゲノムＤＮＡを切断して高密度酵素切断産物を得る。当該第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均１Ｍｂセグメント当たり、２０００～５０００の酵素切断部位を提供し、その酵素切断断片の両端に２～５ｎｔの付着末端を生成する。

Ｓ３：酵素切断産物とシーケンシングリンカーとを連結して、連結産物を得る。シーケンシングリンカーは、第１のエンドヌクレアーゼの切断による付着末端と相補性の第１のリンカーと、第２のエンドヌクレアーゼの切断による付着末端と相補性の第２のリンカーと、を含む

Ｓ４：連結産物から２００ｂｐ～４００ｂｐの断片を選別して取得する。

Ｓ５：ハイスループットシーケンシングプラットホーム汎用プライマーを用いてＰＣＲ増幅を行って、シーケンシングライブラリーを得る。

本発明に係る核酸ライブラリーの構築方法は、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断する。そのうち、当該第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ヒトゲノムにおいて平均１Ｍｂセグメント当たり、２０００～５０００の酵素切断部位を提供することができ、酵素切断部位の分布が均一であり、９５％超のゲノムウィンドウをカバーし、酵素切断断片が主に１００ｂｐ～６００ｂｐに分布し、酵素切断断片の両端に２～５ｎｔの付着末端を生成することができる。我々は断片化だけでなく、標的化した捕捉のために、ランダム法酵素切断ではなく、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せを用いて全ゲノムの所定領域（１０％～２０％）のみに対して酵素切断を行った後、選別により必要なサイズの断片を捕捉してシーケンシングを行うことで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法により、データ量（２０Ｍ、４０Ｍ、８０Ｍ）の低い第２世代シーケンシングを用いて、９０万個以上のＳＮＰサイト、１５万以上のｉｎｄｅｌ（インデルマーカー）を取得することができ、そのうち、１０×シーケンシング深さ超えのＳＮＰサイトが５０万個以上である。

そのため、本発明に係る核酸ライブラリーの構築方法は、ゲノムの平均シーケンシング深さが３×以上である場合、全ゲノム範囲内にＳＮＰ分析を行い、家族サンプル連鎖分析によって胚均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効ＳＮＰサイトおよびその深さを確保し、ハプロタイプに利用可能なＳＮＰサイトの数を向上させて、低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分なＳＮＰおよびｉｎｄｅｌｓを取得し、ＳＮＰに対してマルチＰＣＲプライマーを設計する必要がなく、必要なデータ量および検出コストを低下させることができる。それと同時に、ＣＮＶおよびキメラに対する検出能力が明らかに向上し、５Ｍ以上のＣＮＶおよび３０％以上のキメラ異常を検出することができる。

１つの具体的な例示において、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ＭｂｏＩとＮｓｐＩ、ＢｆａＩとＴａｑＩ、またはＭｂｏＩとＭｓｐＩであるが、これらに限定されない。

１つの具体的な例示において、表１に示すように、第１のリンカーの配列は、配列番号１および配列番号２に示され、第２のリンカーの配列は、配列番号３および配列番号４に示されている。ここで、華大のシーケンシングプラットホームの２つのリンカーにおいてそれぞれＣＡＴＧおよびＧＡＴＣの付着末端が追加されることで、ＮｓｐＩおよびＭｂｏＩ酵素切断による付着末端と相補可能である。改良用の従来のリンカー配列は、サーモフィッシャー、Ｉｌｌｕｍｉｎａ、華大のなどのシーケンシングプラットホームにおけるリンカー配列を含むがこれらに限定されず、追加した付着末端配列は、異なるエンドヌクレアーゼに応じて調整可能であることを理解すべきである。

１つの具体的な例示において、ハイスループットシーケンシングプラットホーム汎用プライマーは、第１のリンカーと相補ペアリング可能な上流プライマーと、第２のリンカーと相補ペアリング可能であり、ｂａｒｃｏｄｅ配列を有する下流プライマーとを含む。このように、ＰＣＲライブラリー増幅の過程で、特定のｂａｒｃｏｄｅ情報を導入することができる。検体のＤＮＡ分子が複数の試験サンプルに由来する場合、シーケンシング過程においてサンプルを区別するために、各サンプルに異なるタグ配列（ｂａｒｃｏｄｅ）が追加されてもよいので、複数のサンプルに対してシーケンシングを同時に行うことを実現する。

１つの具体的な例示において、表２に示すように、上流プライマーの配列は、配列番号５に示され、下流プライマーの配列は、配列番号６に示されている。それは、上記華大のシーケンシングプラットホームにおける２つのリンカーに対する汎用プライマーである。異なるシーケンシングリンカーを用いる場合、汎用プライマーの配列は必要に応じて調節可能であることを理解すべきである。

好ましくは、切断ステップにおいて、第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの体積比は、１：（０．８～１．２）である。

１つの具体的な例示において、磁気ビーズ分取方法により、連結産物から２００ｂｐ～４００ｂｐの断片を選別して取得する。磁気ビーズは、ＡＭＰｕｒｅＸＰ磁気ビーズであることが好ましい。

１つの具体的な例示において、ゲノムＤＮＡを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるＤＮＡに対して全ゲノム増幅を行うステップを含む。

１つの具体的な例示において、核酸ライブラリーの構築方法は、シーケンシングライブラリーの濃度を測定するステップを含む。

本発明の一実施形態における簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法は、上記核酸ライブラリーの構築方法により胚サンプルおよび当該胚サンプルの少なくとも１方の親（たとえば父親サンプルおよび母親サンプル）のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて胚サンプルの染色体を分析するステップを含む。

当該検出方法は、検出対象が生きている人体または動物体を対象とするのではなく、子宮に移植されていない胚であり、その検出結果が両親の病気診断結果にも関係しないので、病気の診断および治療方法に属しないことを理解すべきである。また、当該方法は、死亡した胚サンプルを検出するなどの病気診断および治療を目的としない使用に用いられてもよい。

好ましくは、両親のサンプルは、末梢血ゲノムＤＮＡ、精液ＤＮＡ、口腔粘膜細胞ＤＮＡおよび細胞全ゲノム増幅産物から選ばれる１種または複数種である。各サンプルにおけるＤＮＡ含有量は、５００ｎｇよりも大きいことが好ましい。

１つの具体的な例示において、分析ステップは、具体的に、分析染色体構造変異、分析染色体異数性変異、分析単一遺伝子遺伝病および／または分析コピー数多型などを含む。

１つの具体的な例示において、家族遺伝歴がある均衡型転座家族に対して、上記核酸ライブラリーの構築方法を用いて、均衡型転座保有者夫婦、転座保有者の親族の少なくとも１人、および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシングによる全ゲノム配列に対してＳＮＰ分析を行い、夫婦のうちの転座保有者においてヘテロ接合であり、他方においてホモ接合であり、且つ、転座保有者の親族においてホモ接合であるＳＮＰサイトを有効ＳＮＰサイトとして選定する。すべてのサンプルの有効ＳＮＰサイトを分析し、すべてのサンプルのハプロタイプマップを構築することで、転座保有者の異常な染色分体を確定する。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における１～５Ｍ範囲内のハプロタイプに基づき、胚に異常の染色分体が携帯されるか否かを判断することで、胚に均衡型転座が携帯されるか否かを確定する。

シーケンシングデータに対して全ゲノムＣＮＶ分析を行うこともできる。分析方法は、単細胞を増幅した後、ＤＮＡシーケンシングによって得た塩基配列とヒトゲノム標準配列ｈｇ１９をＢＷＡソフトウェアによって比較し、シーケンシングによって得た各塩基配列の染色体における正確な座位を確定する。品質が低く、染色体に多重マッチングされるか、染色体に完全にマッチングしていない塩基配列を除去し、シーケンシングデータの精度および各塩基配列の位置決めの一意性を確保する。染色体全体を１００ｋｂ断片サイズの非重複領域に区画して、１００ｋｂウィンドウ当たりに得た一意のマッチング配列の数を算出する。ＧＣ含有量のズレの校正を行い、ウィンドウを合併し、ウィンドウデータを均一化する。参照データと比較することにより、ｌｏｇ２ＲＲを算出し、ＣＢＳによって断裂サイトを算出し、コピー数を算出し、アノテーションによって最終結果を作製する。

１つの具体的な例示において、新たに発病した均衡型転座保有者家族に対して、上記核酸ライブラリーの構築方法により、均衡型転座保有者夫婦および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行う。まず、胚に対して全ゲノムＣＮＶ分析を行い、分析方法は、上述した通りである。均衡型転座により染色体コピー数多型を引き起こした胚Ｅ１を選別して、シーケンシングによる全ゲノム配列に対してＳＮＰ分析を行い、夫婦のうちの一方である転座保有者においてヘテロ接合であり、他方においてホモ接合であるＳＮＰサイトを有効ＳＮＰサイトとして選定し、すべてのサンプルの有効ＳＮＰサイトを分析し、すべてのサンプルのハプロタイプマップを構築する。分離定律に基づき、Ｅ１胚は、必然的に親から異常の染色分体を遺伝するため、転座保有者の異常の染色分体を確定することができる。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における１～５Ｍ範囲内のハプロタイプに基づき、他の胚が異常な染色分体を保有するか否かを判断することで、胚が均衡型転座を保有するか否かを確定する。

本発明に係る移植前胚染色体分析方法は、異なる病気に対してマルチＰＣＲプライマーを設計する必要がなく、全ゲノムから十分なＳＮＰサイトおよびｉｎｄｅｌサイトを取得することができ、２３対の染色体の異数性の選別を同時に完成することができる。ターゲット遺伝子が位置する染色体全体がカバーされることにより、相同組み換えの分析に対する影響を低減させ、家族分析によって胚染色体構造異常を効果的に分析する成功率が高く、指定のロシュ転座および相互転座家族のうちの正常な胚および保有者胚に適用することができる。

以下は、具体的な実施例である。

実施例１均衡型転座遺伝家族胚の検出
染色体均衡型転座保有者のいる家族（チップ検出結果により確認されたもの）を１組動員し、当該家族は補助生殖を受けた。家族情報を表３に示す。均衡型転座保有者、妻、および保有者へと均衡型転座が遺伝した親の末梢血サンプル（合計３つの血液サンプル）をそれぞれ５ｍＬ回収し、ＥＤＴＡ抗凝固採血チューブに保存した。同時に、当該夫婦の５つの胚生検サンプルの全ゲノム増幅後の生成物を取得した。家族ゲノムＤＮＡは、全血抽出キットで抽出した。本発明に係る方法により、胚移植前染色体均衡型転座分析を行った。

原理は、図１に示される。まず、１グループのエンドヌクレアーゼを用いてゲノムにおける特定の酵素切断部位を識別し、ゲノムＤＮＡに対してゲノム切断を行い、ゲノムＤＮＡを一定の配列の断片に断裂させ、断裂した断片の両端には、エンドヌクレアーゼによる切断によって付着末端構造を形成した。２種のエンドヌクレアーゼの切断による付着末端と相補性のシーケンシングリンカーを設計し、リンカーと切断されたゲノム配列とを連結し、ＰＣＲ増幅によりシーケンシングライブラリーを形成する。構築したシーケンシングライブラリーに対して特定長さの断片の富化を行った後、シーケンサーでシーケンシングを行った。各サンプルに必要なシーケンシングデータは、８Ｇｂ以上である。シーケンシングリンカー構造は、図２に示すように、酵素切断断片付着末端と相補な配列、および異なるシーケンシングプラットホームの最初のシーケンシングリンカー配列を含む。

１．酵素切断
胚サンプルに対してＱＩＡＧＥＮＲＥＰＬＩ－ｇＳｉｎｇｌｅＣｅｌｌＫｉｔまたはＴａＫａＲａＰｉｃｏＰＬＥＸＳｉｎｇｌｅＣｅｌｌＷＧＡｋｉｔで全ゲノム増幅を行った。５００ｎｇのＤＮＡを用意して水を１７μＬまで添加した。表４に応じて酵素切断混合液Ｍｉｘ１を調製し、３μＬの酵素切断混合液Ｍｉｘ１をサンプル添加し、ガンで均一に通気して混合し、短時間の遠心分離に付した。

遠心分離したＤＮＡをＰＣＲ装置に設置した。ＰＣＲ装置の設定プログラムは、表５に示される。

２．リンカー連結
本実施例は、華大のシーケンシングプラットホームの２つのリンカーを採用した。
リンカー１：５’－ＧＡＡＣＧＡＣＡＴＧＧＣＴＡＣＧＡＴＣＣＧＡＣＴＴＣＡＴＧ－３’および５’－ＡＡＧＴＣＧＧＡＴＣＧＴＡＧＣＣＡＴＧＴＣＧＴＴＣ－３’
リンカー２：５’－ＧＡＴＣＡＡＧＴＣＧＧＡＧＧＣＣＡＡＧＣＧＧＴＣＴＴＡＧＧＡＡＧＡＣＡＡ－３’および５’－ＴＴＧＴＣＴＴＣＣＴＡＡＧＡＣＣＧＣＴＴＧＧＣＣＴＣＣＧＡＣＴＴ－３’

表６に応じてリンカー混合液Ｍｉｘ２を調製した。５μＬのリンカー混合液Ｍｉｘ２を酵素切断されたＤＮＡに添加して、ガンで均一に通気して混合し、短時間の遠心分離に付した。

遠心分離されたＤＮＡをＰＣＲ装置に設置した。ＰＣＲ装置の設定プログラムは、表７に示される。

表８に応じて、リガーゼ混合液Ｍｉｘ３を調製した。５μＬのリガーゼ混合液Ｍｉｘ３を上記リンカーＤＮＡに添加し、（ボルテックスによる混合なしで）ガンで均一に通気して混合し、短時間の遠心分離に付した。

遠心分離されたＤＮＡをＰＣＲ装置に設置した。ＰＣＲ装置の設定プログラムは、表９に示される。

３．断片の選別
水を１００μＬまで添加した後、ＡＭＰｕｒｅＸＰ磁気ビーズを６０μＬ添加し、ガンで均一に通気して混合した。室温で５分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを新たなＥＰチューブに移し、ＡＭＰｕｒｅＸＰ磁気ビーズを２０μＬ添加した。室温で５分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。２００μＬの８０％アルコールで洗浄した。室温で乾燥させた後、２２μＬのＬｏｗＴＥで溶出した。

４．濃度の測定
２μＬのサンプルを抽出してＱｕｂｉｔ濃度測定を行った。

５．ＰＣＲ増幅
１０ｎｇの選別した断片に対してＰＣＲ増幅を行い、ライブラリーを得た。表１０に応じてＰＣＲ反応混合液Ｍｉｘ４を調製した。
ＰＣＲプライマー：Ｆ：５’－ＧＡＡＣＧＡＣＡＴＧＧＣＴＡＣＧＡ－３’
Ｒ：５’－ＴＧＴＧＡＧＣＣＡＡＧＧＡＧＴＴＧ（ｂａｒｃｏｄｅ）ＴＴＧＴＣＴＴＣＣＴＡＡＧＡＣＣＧＣ－３’

断片を選別したサンプルの２０μＬをＰＣＲチューブに添加した。２８．７５μＬのＰＣＲ反応混合液Ｍｉｘ４を添加した後、ｂａｒｃｏｄｅ含有特異性プライマーを１．２５μＬ添加し、混合して短時間の遠心分離に付した。ＰＣＲ装置において、そのプログラム設定は、表１１に示される。

６．ライブラリーの精製
反応が完了した後、短時間の遠心分離に付した。ＡＭＰｕｒｅＸＰ磁気ビーズを５０μＬ添加し、ガンで均一に通気して混合した。室温で５分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。２００μＬの８０％アルコールによる洗浄を１回繰り返し、室温で磁気ビーズを乾燥させ、４０μＬのＬｏｗＴＥで磁気ビーズを再懸濁し、ＤＮＡを溶出した。

７．濃度の測定
２μＬのサンプルを抽出してＱｕｂｉｔ濃度測定を行った。

８．シーケンサーによるシーケンシング
次世代シーケンシングのために、リンカーのタイプに応じてプラットホームを選択した。本実施例では、華大のシーケンシングプラットホームでシーケンシングを行った。

９．データ分析
シーケンシングによるシーケンシングデータのデータ分析を行い、参照ゲノムとの比較を行った。バリエーションの同定を通じてデータからＳＮＰサイトを得た。遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判断して、均衡型転座保有者胚または正常な胚を区別する。

１０．検出の性能
５Ｍ以上の欠失を検出することができると共に、指定の均衡型転座家族のうちの（ロシュ転座と相互転座）胚の遺伝の情況を検出することができる。

１１．検出結果
図３～７は、それぞれ５個の胚サンプルのＰＧＴ－Ａ検出結果である。図８は、各胚の８番染色体の均衡型転座分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル（男性の母親）、５４８１１０１Ｅ胚、５４８１１０２Ｅ胚、５４８１１０３Ｅ胚、５４８１１０４Ｅ胚および５４８１１０５Ｅ胚である。図９は、各胚の１４番染色体上の均衡型転座の分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル（男性の母親）、５４８１１０１Ｅ胚、５４８１１０２Ｅ胚、５４８１１０３Ｅ胚、５４８１１０４Ｅ胚および５４８１１０５Ｅ胚である。

被験者である男性が転座保有者であり、転座に関連する染色体は、８番および１４番染色体である、すなわち、男性は１本の正常な８番染色分体、１本の正常な１４番染色分体および２本の転座した染色分体（８ｐ２３および１４ｑ２４転座）を含む。男性の母親の検出結果に基づき、母親から２本の転座した染色分体が男性に遺伝し、父親から正常な１本の８番染色分体および１本の１４番染色分体が遺伝したと推定した。男性の母親の８番および１４番染色分体の色は、男性と同じ異常を示す色（青色）であり、逆に、男性の他の１本の染色分体の色は正常な色（赤色）である。胚染色体コピー数多型検出結果から分かるように、５４８１１０１Ｅ番胚が均衡型転座保有者であり、５４８１１０２Ｅ番胚が均衡型転座保有者であり、５４８１１０３Ｅ番胚が均衡型転座保有者であり、５４８１１０４Ｅ番胚が８番および１４番染色体にコピー数多型を発生しているため、非均衡型転座型胚であり、５４８１１０５Ｅ番胚が８番および１４番染色体にコピー数多型を発生しているため、非均衡型転座型胚である。

実施例２
染色体異数性を有する細胞株サンプル（５細胞）の詳細を表１２に示した。ＭＤＡ法による全ゲノム増幅を行った。

実施例１における方法に基づいて検出した。細胞株のＰＧＴ－Ａデータ分析結果を図１０に示す。検出結果から分かるように、当該方法は５Ｍの異常欠失を検出することができる。

比較例１
本比較例１では、ＳＮＰ－アレイチップ（Ｋａｒｙｏｍａｐｐｉｎｇ遺伝子チップ）技術を用いて実施例１の胚サンプルを検出した。

実施例１および比較例１における各染色体の有効データを比較した。下記表１３に、５４８１１０５Ｅ番の胚を例として、各染色体の有効座位を比較した。表からは、実施例１における有効座位のデータ（胚サンプル）がチップからのデータよりも多いことが示される。

実施例３
本実施例における方法は、エンドヌクレアーゼの組合せがそれぞれＢｆａＩとＴａｑＩ、またはＭｂｏＩとＭｓｐＩであること以外は、実施例１と基本的に同様である。同様にデータ量が低い場合に十分なＳＮＰサイトおよびｉｎｄｅｌサイトを取得することができ、遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判定して、均衡型転座保有者胚であるか、または正常な胚であるかを区別する。

比較例２
本比較例２は、ＮｓｐＩとＴａｑＩの組合せを用いてゲノムＤＮＡに対して酵素切断を行う以外、他のステップは実施例１と同様である。

実施例１および比較例２における各染色体の有効データを比較した。下記表１４に、５４８１１０５Ｅ番の胚を例として、各染色体の有効座位を比較した。表は、比較例２におけるエンドヌクレアーゼの組合せに対する有効座位のデータ（胚サンプル）が、実施例１におけるエンドヌクレアーゼの組合せに対するそれよりも明らかに低いことが示され、本発明におけるエンドヌクレアーゼの組合せが任意選択可能ではないことが示されている。

上記実施形態の各技術的特徴は、任意に組み合わせることができる。説明を簡単にするために、上記実施形態における各技術的特徴の全ての組合可能な形態については記載されていないが、これら技術的特徴の組み合わせに矛盾がない限り、本明細書に記載の範囲とみなされるべきである。

以上、前記実施例は、本発明のいくつかの実施形態の例示にすぎず、その説明は、具体的且つ詳細であるが、本発明の範囲を限定するものではないと理解すべきである。当業者であれば、本発明の思想から逸脱しない前提で、いくつかの変形及び改良を行うことができ、これらはすべて本発明の保護範囲に属することを指摘すべきである。したがって、本発明の保護範囲は、請求の範囲により決定されるべきである。

Ｓ１：標的ヒトサンプルのゲノムＤＮＡを取得する。

以下は、具体的な実施例である。

配列番号１：リンカー
配列番号２：リンカー
配列番号３：リンカー
配列番号４：リンカー
配列番号５：プライマー
配列番号６：プライマー

Claims

標的となるヒトに由来するサンプルからゲノムＤＮＡを取得するステップと、
第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せを用いて前記ゲノムＤＮＡを切断して高密度酵素切断産物を得るステップであって、前記第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均１Ｍｂセグメント当たり、２０００～５０００の酵素切断部位を生成し、酵素切断断片の両端に２～５ｎｔの付着末端を生成することができるステップと、
前記酵素の切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第１のエンドヌクレアーゼの切断による付着末端と相補性の第１のリンカーと、前記第２のエンドヌクレアーゼの切断による付着末端と相補性の第２のリンカーと、を含むステップと、
前記連結産物から２００ｂｐ～４００ｂｐの断片を選別して取得するステップと、
最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてＰＣＲ増幅を行って、シーケンシングライブラリーを得るステップと
を含む、ことを特徴とする核酸ライブラリーの構築方法。
前記第１のエンドヌクレアーゼと第２のエンドヌクレアーゼの組合せは、ＭｂｏＩとＮｓｐＩ、ＢｆａＩとＴａｑＩ、またはＭｂｏＩとＭｓｐＩである、ことを特徴とする請求項１に記載の核酸ライブラリーの構築方法。
前記第１のリンカーの配列は、配列番号１および配列番号２に示され、前記第２のリンカーの配列は、配列番号３および配列番号４に示されている、ことを特徴とする請求項１に記載の核酸ライブラリーの構築方法。
前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第１のリンカーと相補性の上流プライマーと、前記第２のリンカーと相補性であり、且つｂａｒｃｏｄｅ配列を有する下流プライマーと、を含む、ことを特徴とする請求項１に記載の核酸ライブラリーの構築方法。
前記上流プライマーの配列は、配列番号５に示され、前記下流プライマーの配列は、配列番号６に示されている、ことを特徴とする請求項４に記載の核酸ライブラリーの構築方法。
前記切断するステップにおいて、前記第１のエンドヌクレアーゼと前記第２のエンドヌクレアーゼの体積比が１：（０．８～１．２）である、ことを特徴とする請求項１に記載の核酸ライブラリーの構築方法。
磁気ビーズ分取の方法を用いて前記連結産物から２００ｂｐ～４００ｂｐの断片を選別して取得する、ことを特徴とする請求項１～６のいずれか一項に記載の核酸ライブラリーの構築方法。
前記ゲノムＤＮＡを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるＤＮＡを全ゲノム増幅するステップを含む、ことを特徴とする請求項１～６のいずれか一項に記載の核酸ライブラリーの構築方法。
前記シーケンシングライブラリーの濃度を測定するステップをさらに含む、ことを特徴とする請求項１～６のいずれか一項に記載の核酸ライブラリーの構築方法。
請求項１～９のいずれか一項に記載の核酸ライブラリーの構築方法を用いて、胚サンプルおよび前記胚サンプルのうちの少なくとも１種の親のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて前記胚サンプルの染色体を分析するステップを含む、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法。
前記分析するステップは、具体的に、染色体構造異常の分析、および染色体異数性異常の分析を含む、ことを特徴とする請求項１０に記載の移植前胚染色体構造異常分析方法。