JP2023508774A - 核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 - Google Patents

核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 Download PDF

Info

Publication number
JP2023508774A
JP2023508774A JP2022564692A JP2022564692A JP2023508774A JP 2023508774 A JP2023508774 A JP 2023508774A JP 2022564692 A JP2022564692 A JP 2022564692A JP 2022564692 A JP2022564692 A JP 2022564692A JP 2023508774 A JP2023508774 A JP 2023508774A
Authority
JP
Japan
Prior art keywords
sequencing
endonuclease
constructing
nucleic acid
linker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022564692A
Other languages
English (en)
Other versions
JP7429072B2 (ja
Inventor
▲趙▼丁丁
▲冒▼燕
孔令印
梁波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Basecare Medical Device Co Ltd
Original Assignee
Suzhou Basecare Medical Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Basecare Medical Device Co Ltd filed Critical Suzhou Basecare Medical Device Co Ltd
Publication of JP2023508774A publication Critical patent/JP2023508774A/ja
Application granted granted Critical
Publication of JP7429072B2 publication Critical patent/JP7429072B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析におけるその使用に関する。第1のエンドヌクレアーゼおよび第2のエンドヌクレアーゼの組合せにより酵素切断を行い、一定の断片範囲内のDNA配列を捕捉した後、捕捉した特定の配列に対してシーケンシングを行い、ゲノムの平均シーケンシング深さが3×以上である場合、全ゲノム範囲内にSNP分析を行い、家族サンプル連鎖分析により胚の均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効SNPサイトおよびその深さを確保し、ハプロタイプの構築に利用可能なSNPサイトの数を向上させることができる。さらに、極めて低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分のSNPおよびindelsを取得することができ、SNPに対してマルチPCRプライマーを設計する必要がないので、必要なデータ量および検出コストを大幅に低下させることができる。【選択図】図1

Description

本発明は、分子生物学の分野に関し、特に、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用に関する。
簡略化ゲノムシーケンシングとは、種の全ゲノムシーケンシング手法を十分に示すように、制限エンドヌクレアーゼでゲノムDNAを切断し、指定の部分に対してハイスループットシーケンシングを用いて、大量の遺伝多型タグ配列を得る方法である。当該方法は、ゲノムの複雑度を低減させ、実施過程がシンプルで、コストを節約することができるとともに、参照ゲノムに依存することなく、全ゲノムにおける遺伝多型タグを取得することができるため、分子標記の開発、遺伝マップの構築、遺伝子/QTLマッピング、全ゲノム関連分析、集団遺伝分析および分子育種分野に広く適用されている。しかし、既存の簡略化ゲノムシーケンシングは、捕捉可能なSNP数が少ない(一般的に、20万個よりも少ない)と共に、そのライブラリー構築手順が比較的複雑であり、末端修復やdAテール追加などの煩雑なライブラリー構築手順が必要であるか、或いはPippinまたはゲル回収などによりフラグメント分取を行う必要がある。また、そのライブラリー構築方法は、兼用性が低く、ある1つのシーケンシングプラットホームのみに対して展開することができないので、複数種のハイスループットシーケンシングプラットホームを柔軟に兼用することができない。上記原因を総合すると、簡略化ゲノムシーケンシングが生殖補助分野に適用・普及されることは、少ない。
胚移植前遺伝学的検査(Preimplantation Genetic Testing、PGT)とは、体外受精した胚を移植する前に、胚の遺伝物質を取り出して分析し、異常があるか否かを判断し、健康な胚を選定して移植することにより、遺伝病の遺伝を防止する方法を指す。現在、PGTの過程において、よく用いられる技術的手段には、蛍光インサイチュハイブリダイゼーション(FISH:Fluorescence In - Situ Hybridization)、SNP全ゲノムマイクロアレイチップ(SNP-array)およびハイスループットシーケンシング(NGS)などが含まれる。ハイスループットシーケンシング技術に基づく検出方法は、体外受精した胚が3~5日発育した際に、8細胞期における卵割球細胞または胚盤胞期(blastocyst)における栄養層細胞を取り出し、単細胞全ゲノム増幅を行ってゲノムDNAを得た後、シーケンシングライブラリーを構築してシーケンシングを行い、シーケンシング結果に基づいて後続の分析を行うものである。
しかしながら、胚が遺伝病を保有する情況を取得するために、通常、ライブラリーを構築する際に、遺伝病遺伝子の上流・下流に緊密に連鎖したSNPサイトに対してマルチプライマーを設計して増幅を行う。有効SNPサイトおよびそのシーケンシング深さを確保するためには、多くのデータを取得する必要があるので、検出に時間がかかり、コストが高い。そして、異なる遺伝病に対して、毎回、独立してマルチSNPサイト増幅プライマーを再設計する必要がある。そして、マルチプライマーに対して検証試験および最適化を行う必要がある。実際に胚を検出する前に、家族(夫、妻、および発端者を含む)の事前試験を行う必要があり、事前試験結果に基づいて十分な有効SNPサイトを取得することができる場合のみ、胚サンプルの検出を展開することができる。このような従来方法は、検出周期全体が長すぎ、失敗のリスクが高く、臨床適用および普及に不利である。それと同時に、遺伝病遺伝子の上流・下流における少量のSNPサイトのみを捕獲してシーケンシングすることができることに起因して、相同組み換えによる分析エラーが極めて発生しやすい。
従って、全ゲノムシーケンシングに必要なデータ量を減少させることができ、SNPに対してマルチプライマーを設計する必要がない核酸ライブラリーの構築方法を提供する必要がある。
核酸ライブラリーの構築方法であって、
ターゲットヒトサンプルのゲノムDNAを取得するステップと、
第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて前記ゲノムDNAを切断して高密度酵素切断産物を得るステップであって、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、且つヒトゲノムの消化断片の両端に2~5ntの付着末端を生成することができるものであるステップと、
前記酵素切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、前記第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含むステップと、
前記連結産物から200bp~400bpの断片を選別して取得するステップと、
最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得るステップと
を含む、核酸ライブラリーの構築方法。
そのうちの一実施形態において、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIである。
そのうちの一実施形態において、前記第1のリンカーの配列は、配列番号1および配列番号2に示され、前記第2のリンカーの配列は、配列番号3および配列番号4に示されている。
そのうちの一実施形態において、前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第1のリンカーと相補ペアリング可能な上流プライマーと、前記第2のリンカーと相補ペアリング可能であり、且つbarcode配列を有する下流プライマーと、を含む。
そのうちの一実施形態において、前記上流プライマーの配列は、配列番号5に示され、前記下流プライマーの配列は、配列番号6に示されている。
そのうちの一実施形態において、前記切断ステップにおいて、前記第1のエンドヌクレアーゼと前記第2のエンドヌクレアーゼの体積比が1:(0.8~1.2)である。
そのうちの一実施形態において、磁気ビーズ分取の方法を用いて前記ライゲーション生成物から選別して200bp~400bpの断片を取得する。
そのうちの一実施形態において、前記ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAを全ゲノム増幅するステップを含む。
そのうちの一実施形態において、前記シーケンシングライブラリーの濃度を測定するステップをさらに含む。
本発明は、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法をさらに提供する。当該方法は、上記核酸ライブラリーの構築方法を用いて、胚サンプルおよび当該胚サンプルの親の少なくとも一人のシーケンシングライブラリーを構築し、次にシーケンシングを行い、シーケンシング結果に基づいて当該胚サンプルの染色体を分析するステップを含む。
そのうちの一実施形態において、前記分析ステップは、具体的に、染色体構造変異の分析、および染色体異数性変異の分析を含む。
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断し、そうすることで、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムの平均1Mbセグメント当たり2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布は均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片は主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端が生成される。ランダム法による酵素切断と異なる点は、断片化だけでなく、指向的に捕捉するために、我々は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムにおける所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの捕捉した断片を取得してシーケンシングを行う。こうすることで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法は、データ量(20M、40M、80M)の低い第2世代シーケンシングにより、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超のSNPサイトが50万個以上である。本発明は、簡略化ゲノムシーケンシング技術を基に、優位なエンドヌクレアーゼの組合せを選別して全ゲノムタイピングのための十分な有効SNPサイトを取得しながら、特定のシーケンシングリンカーおよび磁気ビーズ法分取手法を用いてライブラリー構築手順を簡略化し、マルチプライマーを設計して捕捉したSNPに対して胚移植前遺伝学分析を行う必要がない技術体系を確立し、全ゲノムシーケンシングに必要なデータ量を低下させ、一回の試験において染色体構造異常の分析と、染色体異数性異常の分析を同時に行うことができる。
本発明の一実施形態における核酸ライブラリーの構築方法の原理の模式図である。 本発明の一実施形態におけるシーケンシングリンカーの構造の模式図である。 実施例1における5481101E胚の検出結果の散布図(正倍数体)である。 実施例1における5481102E胚の検出結果の散布図(正倍数体)である。 実施例1における5481103E胚の検出結果の散布図(正倍数体)である。 実施例1における5481104E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。 実施例1における5481105E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。 実施例1における各胚の8番染色体均衡型転座の分析結果である。 実施例1における各胚の14番染色体均衡型転座の分析結果である。 実施例2における細胞株の検出結果の散布図(del(8)-5.2M)である。
以下、本発明を理解しやすくするために、本発明についてより詳細に説明し、本発明のより好ましい実施例を示す。しかしながら、本発明は、多くの異なる形態で実現することができ、本明細書に記載される実施例に制限されない。逆に、これらの実施例は、本発明に開示される内容に対する理解がより徹底的且つ包括的になるように提供される。
別途定義されない限り、本明細書に用いられる全ての技術用語及び科学用語は、本発明の技術分野に属する当業者が通常理解できるものと同じ意味を有する。本明細書の開示において使用する用語は、単に具体的な実施形態を説明するためのものに過ぎず、本発明を限定するものではない。本明細書に用いられる用語「および/または」は、1つまたは複数の関連する挙げられた項目のいずれか一項、およびあらゆる組合せを含む。
用語についての解釈
染色体とは、細胞核を構成する基本的な物質であり、遺伝子の担体である。染色体構造異常とは、染色体または染色分体が断裂-再交換または互換メカニズムによって染色体異常(chromosome aberration)および染色分体異常(chromatid aberration)を発生することを指す。染色体相互転座は、最もよく見られる染色体構造異常であり、主に非相同染色体同士が互いに染色体断片を交換することを指す。
均衡型転座とは、2本の非相同染色体がそれぞれ断裂およびスプライシング異常を発生して構造上で再転座した染色体を2本形成することを指し、相互転座およびロシュ転座を含む。染色体均衡型転座に既存の遺伝子の総数が保留されるので、均衡型転座保有者個体には、明らかな病気表現型がないが、生殖障害が多く存在する。主に、均衡型転座の保有者が減数分裂時に不均衡配偶子を発生する可能性があるため、ある1つの遺伝物質が低減または増加して遺伝物質のバランスを破壊することを引き起こし、最終に、奇形胎児または不妊不稔を引き起こす。理論的には、2本の染色体均衡型転座の保有者は減数分裂においてテトラッドを形成することができ、その分離形態に応じて生成可能な配偶子のタイプは多様であり、一般的に2:2分離および1:3分離によって少なくとも18種の異なる配偶子を生成することができ、また、4:0分離によって10種の配偶子を生成することができることが認められる。研究によれば、4:0の確率はいずれも小さく、よく見られる分離形態は2:2分離であることが示される。非相同染色体のロシュ転座保有者による6種の配偶子のうち、1/6が正常な配偶子であり、1/6が携帯型であり、4/6が異常な配偶子である。均衡型転座患者が正常な人と繁殖する場合、配偶子の分離タイプによれば、胚において染色体正倍数体、不均衡型転座によるモノソミーまたはトリソミー、均衡型転座保有者などの出願を生じる。染色体異数性は、原因不明の流産、奇形胎児、不妊不稔および死胎を引き起こす要因である。
FISH技術とは、蛍光標識プローブによってインサイチュで検体サンプルの核酸配列のハイブリダイゼーションを行い、蛍光顕微鏡によるDNA観察によって染色体の構造および数の分析を行う方法である。胚細胞の特定の染色体に対してFISHプローブハイブリダイゼーション検出を行うことにより、蛍光顕微鏡下で検出する染色体に転座およびコピー数多型が発生するか否かを観察することができる。FISH技術は、迅速で高感度といった利点を有するが、その限界は、スループットが低いことにある。蛍光顕微鏡は、現在、5種の異なる染色体プローブの蛍光信号のみを同時に観察することができるので、より多くの数の染色体を分析するためには、2回以上のハイブリダイゼーションが必要である。単細胞に対して複数回のハイブリダイゼーションを行うことは、エラー率を増加させる場合があるので、FISHは、有限な染色体のみに対して検出を行うことができ、すべての染色体異数性を検出することはできない。
SNPアレイ(SNP array)は、大量のSNPサイトを含有する高密度マイクロアレイチップであり、大多数のSNPチップは、60万以上のSNPを検出することができる。アレルヘテロ接合体の信号強度割合を分析することにより、染色体全体のコピー数多型を検出することができるだけでなく、家族全ゲノム範囲内のSNP連鎖分析により、均衡型転座携帯胚および正常な胚を区別することができる。SNPアレイに基づく検出技術は、正常な胚と均衡型転座保有胚とを区別するための使用実績がある。しかし、当該技術には既知変異の固定されたプローブが用いられ、変更可能性および柔軟性が低く、ある複雑な領域においてはハイブリダイゼーション後のサイトが少なく、ハイブリダイゼーション後のバックグラウンドの干渉がタイピングに失敗するリスクをもたらす。胚サンプルの検出において、CNVは低い感度で検出され、10M以下のCNVを検出することはできず、キメラに対する検出効果が良くない。
一ヌクレオチド多型(single nucleotide polymorphism、SNP)とは、主にゲノムレベルでの単一ヌクレオチドの変異によるDNA配列多型を指す。ハプロタイプ(Haplotype)とは、1本の染色体の特定の領域における、互いに関連し、全体として後代に遺伝する傾向にある複数の一ヌクレオチド多型の組合せを指し、一倍体型または単位型とも呼ばれている。シーケンシング深さとは、たとえば一実施形態において、シーケンシング深さが1000Xであれば、特定のPCR増幅産物が1000回シーケンシングされることを表す。
PGT-SRは、胚染色体に逆転、均衡型転座およびロシュ転座が存在するか否かの検出を標的とするものであり、元のPGDのうちの一部に相当する。そのうち、SRとは、「chromosomal structural rearrangements(染色体構造異常)」を指す。PGT-Aは、胚染色体に異数性が存在するか否かを検出する技術であり、元のPGSに相当する。そのうち、Aとは、「aneuploidy(異数性)」を指す。PGT-Mは、ある単一遺伝子病を引き起こし得る突然変異遺伝子を胚が保有するか否かの検出を標的とするものであり、元のPGDの一部に相当する。そのうち、Mとは、「monogenic/single gene defects(単一遺伝子病または欠陥)」を指す。
本発明の一実施形態における核酸ライブラリーの構築方法は、以下のステップS1~S5を含む。
S1:標的ヒトサンプルのゲノムDNAを取得する。
S2:第1のエンドヌクレアーゼおよび第2のエンドヌクレアーゼの組合せを用いてゲノムDNAを切断して高密度酵素切断産物を得る。当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、その酵素切断断片の両端に2~5ntの付着末端を生成する。
S3:酵素切断産物とシーケンシングリンカーとを連結して、連結産物を得る。シーケンシングリンカーは、第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含む
S4:連結産物から200bp~400bpの断片を選別して取得する。
S5:ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得る。
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断する。そのうち、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムにおいて平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布が均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片が主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端を生成することができる。我々は断片化だけでなく、標的化した捕捉のために、ランダム法酵素切断ではなく、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムの所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの断片を捕捉してシーケンシングを行うことで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法により、データ量(20M、40M、80M)の低い第2世代シーケンシングを用いて、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超えのSNPサイトが50万個以上である。
そのため、本発明に係る核酸ライブラリーの構築方法は、ゲノムの平均シーケンシング深さが3×以上である場合、全ゲノム範囲内にSNP分析を行い、家族サンプル連鎖分析によって胚均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効SNPサイトおよびその深さを確保し、ハプロタイプに利用可能なSNPサイトの数を向上させて、低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分なSNPおよびindelsを取得し、SNPに対してマルチPCRプライマーを設計する必要がなく、必要なデータ量および検出コストを低下させることができる。それと同時に、CNVおよびキメラに対する検出能力が明らかに向上し、5M以上のCNVおよび30%以上のキメラ異常を検出することができる。
1つの具体的な例示において、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIであるが、これらに限定されない。
1つの具体的な例示において、表1に示すように、第1のリンカーの配列は、配列番号1および配列番号2に示され、第2のリンカーの配列は、配列番号3および配列番号4に示されている。ここで、華大のシーケンシングプラットホームの2つのリンカーにおいてそれぞれCATGおよびGATCの付着末端が追加されることで、NspIおよびMboI酵素切断による付着末端と相補可能である。改良用の従来のリンカー配列は、サーモフィッシャー、Illumina、華大のなどのシーケンシングプラットホームにおけるリンカー配列を含むがこれらに限定されず、追加した付着末端配列は、異なるエンドヌクレアーゼに応じて調整可能であることを理解すべきである。
Figure 2023508774000002
1つの具体的な例示において、ハイスループットシーケンシングプラットホーム汎用プライマーは、第1のリンカーと相補ペアリング可能な上流プライマーと、第2のリンカーと相補ペアリング可能であり、barcode配列を有する下流プライマーとを含む。このように、PCRライブラリー増幅の過程で、特定のbarcode情報を導入することができる。検体のDNA分子が複数の試験サンプルに由来する場合、シーケンシング過程においてサンプルを区別するために、各サンプルに異なるタグ配列(barcode)が追加されてもよいので、複数のサンプルに対してシーケンシングを同時に行うことを実現する。
1つの具体的な例示において、表2に示すように、上流プライマーの配列は、配列番号5に示され、下流プライマーの配列は、配列番号6に示されている。それは、上記華大のシーケンシングプラットホームにおける2つのリンカーに対する汎用プライマーである。異なるシーケンシングリンカーを用いる場合、汎用プライマーの配列は必要に応じて調節可能であることを理解すべきである。
Figure 2023508774000003
好ましくは、切断ステップにおいて、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの体積比は、1:(0.8~1.2)である。
1つの具体的な例示において、磁気ビーズ分取方法により、連結産物から200bp~400bpの断片を選別して取得する。磁気ビーズは、AMPure XP磁気ビーズであることが好ましい。
1つの具体的な例示において、ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAに対して全ゲノム増幅を行うステップを含む。
1つの具体的な例示において、核酸ライブラリーの構築方法は、シーケンシングライブラリーの濃度を測定するステップを含む。
本発明の一実施形態における簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法は、上記核酸ライブラリーの構築方法により胚サンプルおよび当該胚サンプルの少なくとも1方の親(たとえば父親サンプルおよび母親サンプル)のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて胚サンプルの染色体を分析するステップを含む。
当該検出方法は、検出対象が生きている人体または動物体を対象とするのではなく、子宮に移植されていない胚であり、その検出結果が両親の病気診断結果にも関係しないので、病気の診断および治療方法に属しないことを理解すべきである。また、当該方法は、死亡した胚サンプルを検出するなどの病気診断および治療を目的としない使用に用いられてもよい。
好ましくは、両親のサンプルは、末梢血ゲノムDNA、精液DNA、口腔粘膜細胞DNAおよび細胞全ゲノム増幅産物から選ばれる1種または複数種である。各サンプルにおけるDNA含有量は、500ngよりも大きいことが好ましい。
1つの具体的な例示において、分析ステップは、具体的に、分析染色体構造変異、分析染色体異数性変異、分析単一遺伝子遺伝病および/または分析コピー数多型などを含む。
1つの具体的な例示において、家族遺伝歴がある均衡型転座家族に対して、上記核酸ライブラリーの構築方法を用いて、均衡型転座保有者夫婦、転座保有者の親族の少なくとも1人、および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの転座保有者においてヘテロ接合であり、他方においてホモ接合であり、且つ、転座保有者の親族においてホモ接合であるSNPサイトを有効SNPサイトとして選定する。すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築することで、転座保有者の異常な染色分体を確定する。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、胚に異常の染色分体が携帯されるか否かを判断することで、胚に均衡型転座が携帯されるか否かを確定する。
シーケンシングデータに対して全ゲノムCNV分析を行うこともできる。分析方法は、単細胞を増幅した後、DNAシーケンシングによって得た塩基配列とヒトゲノム標準配列hg19をBWAソフトウェアによって比較し、シーケンシングによって得た各塩基配列の染色体における正確な座位を確定する。品質が低く、染色体に多重マッチングされるか、染色体に完全にマッチングしていない塩基配列を除去し、シーケンシングデータの精度および各塩基配列の位置決めの一意性を確保する。染色体全体を100kb断片サイズの非重複領域に区画して、100kbウィンドウ当たりに得た一意のマッチング配列の数を算出する。GC含有量のズレの校正を行い、ウィンドウを合併し、ウィンドウデータを均一化する。参照データと比較することにより、log2RRを算出し、CBSによって断裂サイトを算出し、コピー数を算出し、アノテーションによって最終結果を作製する。
1つの具体的な例示において、新たに発病した均衡型転座保有者家族に対して、上記核酸ライブラリーの構築方法により、均衡型転座保有者夫婦および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行う。まず、胚に対して全ゲノムCNV分析を行い、分析方法は、上述した通りである。均衡型転座により染色体コピー数多型を引き起こした胚E1を選別して、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの一方である転座保有者においてヘテロ接合であり、他方においてホモ接合であるSNPサイトを有効SNPサイトとして選定し、すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築する。分離定律に基づき、E1胚は、必然的に親から異常の染色分体を遺伝するため、転座保有者の異常の染色分体を確定することができる。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、他の胚が異常な染色分体を保有するか否かを判断することで、胚が均衡型転座を保有するか否かを確定する。
本発明に係る移植前胚染色体分析方法は、異なる病気に対してマルチPCRプライマーを設計する必要がなく、全ゲノムから十分なSNPサイトおよびindelサイトを取得することができ、23対の染色体の異数性の選別を同時に完成することができる。ターゲット遺伝子が位置する染色体全体がカバーされることにより、相同組み換えの分析に対する影響を低減させ、家族分析によって胚染色体構造異常を効果的に分析する成功率が高く、指定のロシュ転座および相互転座家族のうちの正常な胚および保有者胚に適用することができる。
以下は、具体的な実施例である。
実施例1 均衡型転座遺伝家族胚の検出
染色体均衡型転座保有者のいる家族(チップ検出結果により確認されたもの)を1組動員し、当該家族は補助生殖を受けた。家族情報を表3に示す。均衡型転座保有者、妻、および保有者へと均衡型転座が遺伝した親の末梢血サンプル(合計3つの血液サンプル)をそれぞれ5mL回収し、EDTA抗凝固採血チューブに保存した。同時に、当該夫婦の5つの胚生検サンプルの全ゲノム増幅後の生成物を取得した。家族ゲノムDNAは、全血抽出キットで抽出した。本発明に係る方法により、胚移植前染色体均衡型転座分析を行った。
Figure 2023508774000004
原理は、図1に示される。まず、1グループのエンドヌクレアーゼを用いてゲノムにおける特定の酵素切断部位を識別し、ゲノムDNAに対してゲノム切断を行い、ゲノムDNAを一定の配列の断片に断裂させ、断裂した断片の両端には、エンドヌクレアーゼによる切断によって付着末端構造を形成した。2種のエンドヌクレアーゼの切断による付着末端と相補性のシーケンシングリンカーを設計し、リンカーと切断されたゲノム配列とを連結し、PCR増幅によりシーケンシングライブラリーを形成する。構築したシーケンシングライブラリーに対して特定長さの断片の富化を行った後、シーケンサーでシーケンシングを行った。各サンプルに必要なシーケンシングデータは、8Gb以上である。シーケンシングリンカー構造は、図2に示すように、酵素切断断片付着末端と相補な配列、および異なるシーケンシングプラットホームの最初のシーケンシングリンカー配列を含む。
1.酵素切断
胚サンプルに対してQIAGEN REPLI-g Single Cell KitまたはTaKaRa PicoPLEX Single Cell WGA kitで全ゲノム増幅を行った。500ngのDNAを用意して水を17μLまで添加した。表4に応じて酵素切断混合液Mix1を調製し、3μLの酵素切断混合液Mix1をサンプル添加し、ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000005
遠心分離したDNAをPCR装置に設置した。PCR装置の設定プログラムは、表5に示される。
Figure 2023508774000006
2.リンカー連結
本実施例は、華大のシーケンシングプラットホームの2つのリンカーを採用した。
リンカー1:5’-GAACGACATGGCTACGATCCGACTTCATG-3’および5’-AAGTCGGATCGTAGCCATGTCGTTC-3’
リンカー2:5’-GATCAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA-3’および5’-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’
表6に応じてリンカー混合液Mix2を調製した。5μLのリンカー混合液Mix2を酵素切断されたDNAに添加して、ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000007
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表7に示される。
Figure 2023508774000008
表8に応じて、リガーゼ混合液Mix3を調製した。5μLのリガーゼ混合液Mix3を上記リンカーDNAに添加し、(ボルテックスによる混合なしで)ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000009
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表9に示される。
Figure 2023508774000010
3.断片の選別
水を100μLまで添加した後、AMPure XP磁気ビーズを60μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを新たなEPチューブに移し、AMPure XP磁気ビーズを20μL添加した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールで洗浄した。室温で乾燥させた後、22μLのLow TEで溶出した。
4.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
5.PCR増幅
10ngの選別した断片に対してPCR増幅を行い、ライブラリーを得た。表10に応じてPCR反応混合液Mix4を調製した。
PCRプライマー:F: 5’-GAACGACATGGCTACGA-3’
R: 5’-TGTGAGCCAAGGAGTTG(barcode) TTGTCTTCCTAAGACCGC-3’
Figure 2023508774000011
断片を選別したサンプルの20μLをPCRチューブに添加した。28.75μLのPCR反応混合液Mix4を添加した後、barcode含有特異性プライマーを1.25μL添加し、混合して短時間の遠心分離に付した。PCR装置において、そのプログラム設定は、表11に示される。
Figure 2023508774000012
6.ライブラリーの精製
反応が完了した後、短時間の遠心分離に付した。AMPure XP磁気ビーズを50μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールによる洗浄を1回繰り返し、室温で磁気ビーズを乾燥させ、40μLのLow TEで磁気ビーズを再懸濁し、DNAを溶出した。
7.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
8.シーケンサーによるシーケンシング
次世代シーケンシングのために、リンカーのタイプに応じてプラットホームを選択した。本実施例では、華大のシーケンシングプラットホームでシーケンシングを行った。
9.データ分析
シーケンシングによるシーケンシングデータのデータ分析を行い、参照ゲノムとの比較を行った。バリエーションの同定を通じてデータからSNPサイトを得た。遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判断して、均衡型転座保有者胚または正常な胚を区別する。
10.検出の性能
5M以上の欠失を検出することができると共に、指定の均衡型転座家族のうちの(ロシュ転座と相互転座)胚の遺伝の情況を検出することができる。
11.検出結果
図3~7は、それぞれ5個の胚サンプルのPGT-A検出結果である。図8は、各胚の8番染色体の均衡型転座分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。図9は、各胚の14番染色体上の均衡型転座の分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。
被験者である男性が転座保有者であり、転座に関連する染色体は、8番および14番染色体である、すなわち、男性は1本の正常な8番染色分体、1本の正常な14番染色分体および2本の転座した染色分体(8p23および14q24転座)を含む。男性の母親の検出結果に基づき、母親から2本の転座した染色分体が男性に遺伝し、父親から正常な1本の8番染色分体および1本の14番染色分体が遺伝したと推定した。男性の母親の8番および14番染色分体の色は、男性と同じ異常を示す色(青色)であり、逆に、男性の他の1本の染色分体の色は正常な色(赤色)である。胚染色体コピー数多型検出結果から分かるように、5481101E番胚が均衡型転座保有者であり、5481102E番胚が均衡型転座保有者であり、5481103E番胚が均衡型転座保有者であり、5481104E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚であり、5481105E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚である。
実施例2
染色体異数性を有する細胞株サンプル(5細胞)の詳細を表12に示した。MDA法による全ゲノム増幅を行った。
Figure 2023508774000013
実施例1における方法に基づいて検出した。細胞株のPGT-Aデータ分析結果を図10に示す。検出結果から分かるように、当該方法は5Mの異常欠失を検出することができる。
比較例1
本比較例1では、SNP-アレイチップ(Karyomapping遺伝子チップ)技術を用いて実施例1の胚サンプルを検出した。
実施例1および比較例1における各染色体の有効データを比較した。下記表13に、5481105E番の胚を例として、各染色体の有効座位を比較した。表からは、実施例1における有効座位のデータ(胚サンプル)がチップからのデータよりも多いことが示される。
Figure 2023508774000014
実施例3
本実施例における方法は、エンドヌクレアーゼの組合せがそれぞれBfaIとTaqI、またはMboIとMspIであること以外は、実施例1と基本的に同様である。同様にデータ量が低い場合に十分なSNPサイトおよびindelサイトを取得することができ、遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判定して、均衡型転座保有者胚であるか、または正常な胚であるかを区別する。
比較例2
本比較例2は、NspIとTaqIの組合せを用いてゲノムDNAに対して酵素切断を行う以外、他のステップは実施例1と同様である。
実施例1および比較例2における各染色体の有効データを比較した。下記表14に、5481105E番の胚を例として、各染色体の有効座位を比較した。表は、比較例2におけるエンドヌクレアーゼの組合せに対する有効座位のデータ(胚サンプル)が、実施例1におけるエンドヌクレアーゼの組合せに対するそれよりも明らかに低いことが示され、本発明におけるエンドヌクレアーゼの組合せが任意選択可能ではないことが示されている。
Figure 2023508774000015
上記実施形態の各技術的特徴は、任意に組み合わせることができる。説明を簡単にするために、上記実施形態における各技術的特徴の全ての組合可能な形態については記載されていないが、これら技術的特徴の組み合わせに矛盾がない限り、本明細書に記載の範囲とみなされるべきである。
以上、前記実施例は、本発明のいくつかの実施形態の例示にすぎず、その説明は、具体的且つ詳細であるが、本発明の範囲を限定するものではないと理解すべきである。当業者であれば、本発明の思想から逸脱しない前提で、いくつかの変形及び改良を行うことができ、これらはすべて本発明の保護範囲に属することを指摘すべきである。したがって、本発明の保護範囲は、請求の範囲により決定されるべきである。
本発明は、分子生物学の分野に関し、特に、核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用に関する。
簡略化ゲノムシーケンシングとは、種の全ゲノムシーケンシング手法を十分に示すように、制限エンドヌクレアーゼでゲノムDNAを切断し、指定の部分に対してハイスループットシーケンシングを用いて、大量の遺伝多型タグ配列を得る方法である。当該方法は、ゲノムの複雑度を低減させ、実施過程がシンプルで、コストを節約することができるとともに、参照ゲノムに依存することなく、全ゲノムにおける遺伝多型タグを取得することができるため、分子標記の開発、遺伝マップの構築、遺伝子/QTLマッピング、全ゲノム関連分析、集団遺伝分析および分子育種分野に広く適用されている。しかし、既存の簡略化ゲノムシーケンシングは、捕捉可能なSNP数が少ない(一般的に、20万個よりも少ない)と共に、そのライブラリー構築手順が比較的複雑であり、末端修復やdAテール追加などの煩雑なライブラリー構築手順が必要であるか、或いはPippinまたはゲル回収などによりフラグメント分取を行う必要がある。また、そのライブラリー構築方法は、兼用性が低く、ある1つのシーケンシングプラットホームのみに対して展開することができないので、複数種のハイスループットシーケンシングプラットホームを柔軟に兼用することができない。上記原因を総合すると、簡略化ゲノムシーケンシングが生殖補助分野に適用・普及されることは、少ない。
胚移植前遺伝学的検査(Preimplantation Genetic Testing、PGT)とは、体外受精した胚を移植する前に、胚の遺伝物質を取り出して分析し、異常があるか否かを判断し、健康な胚を選定して移植することにより、遺伝病の遺伝を防止する方法を指す。現在、PGTの過程において、よく用いられる技術的手段には、蛍光インサイチュハイブリダイゼーション(FISH:Fluorescence In - Situ Hybridization)、SNP全ゲノムマイクロアレイチップ(SNP-array)およびハイスループットシーケンシング(NGS)などが含まれる。ハイスループットシーケンシング技術に基づく検出方法は、体外受精した胚が3~5日発育した際に、8細胞期における卵割球細胞または胚盤胞期(blastocyst)における栄養層細胞を取り出し、単細胞全ゲノム増幅を行ってゲノムDNAを得た後、シーケンシングライブラリーを構築してシーケンシングを行い、シーケンシング結果に基づいて後続の分析を行うものである。
しかしながら、胚が遺伝病を保有する情況を取得するために、通常、ライブラリーを構築する際に、遺伝病遺伝子の上流・下流に緊密に連鎖したSNPサイトに対してマルチプライマーを設計して増幅を行う。有効SNPサイトおよびそのシーケンシング深さを確保するためには、多くのデータを取得する必要があるので、検出に時間がかかり、コストが高い。そして、異なる遺伝病に対して、毎回、独立してマルチSNPサイト増幅プライマーを再設計する必要がある。そして、マルチプライマーに対して検証試験および最適化を行う必要がある。実際に胚を検出する前に、家族(夫、妻、および発端者を含む)の事前試験を行う必要があり、事前試験結果に基づいて十分な有効SNPサイトを取得することができる場合のみ、胚サンプルの検出を展開することができる。このような従来方法は、検出周期全体が長すぎ、失敗のリスクが高く、臨床適用および普及に不利である。それと同時に、遺伝病遺伝子の上流・下流における少量のSNPサイトのみを捕獲してシーケンシングすることができることに起因して、相同組み換えによる分析エラーが極めて発生しやすい。
従って、全ゲノムシーケンシングに必要なデータ量を減少させることができ、SNPに対してマルチプライマーを設計する必要がない核酸ライブラリーの構築方法を提供する必要がある。
核酸ライブラリーの構築方法であって、
ターゲットヒトサンプルのゲノムDNAを取得するステップと、
第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて前記ゲノムDNAを切断して高密度酵素切断産物を得るステップであって、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、且つヒトゲノムの消化断片の両端に2~5ntの付着末端を生成することができるものであるステップと、
前記酵素切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、前記第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含むステップと、
前記連結産物から200bp~400bpの断片を選別して取得するステップと、
最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得るステップと
を含む、核酸ライブラリーの構築方法。
そのうちの一実施形態において、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIである。
そのうちの一実施形態において、前記第1のリンカーの配列は、配列番号1および配列番号2に示され、前記第2のリンカーの配列は、配列番号3および配列番号4に示されている。
そのうちの一実施形態において、前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第1のリンカーと相補ペアリング可能な上流プライマーと、前記第2のリンカーと相補ペアリング可能であり、且つbarcode配列を有する下流プライマーと、を含む。
そのうちの一実施形態において、前記上流プライマーの配列は、配列番号5に示され、前記下流プライマーの配列は、配列番号6に示されている。
そのうちの一実施形態において、前記切断ステップにおいて、前記第1のエンドヌクレアーゼと前記第2のエンドヌクレアーゼの体積比が1:(0.8~1.2)である。
そのうちの一実施形態において、磁気ビーズ分取の方法を用いて前記ライゲーション生成物から選別して200bp~400bpの断片を取得する。
そのうちの一実施形態において、前記ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAを全ゲノム増幅するステップを含む。
そのうちの一実施形態において、前記シーケンシングライブラリーの濃度を測定するステップをさらに含む。
本発明は、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法をさらに提供する。当該方法は、上記核酸ライブラリーの構築方法を用いて、胚サンプルおよび当該胚サンプルの親の少なくとも一人のシーケンシングライブラリーを構築し、次にシーケンシングを行い、シーケンシング結果に基づいて当該胚サンプルの染色体を分析するステップを含む。
そのうちの一実施形態において、前記分析ステップは、具体的に、染色体構造変異の分析、および染色体異数性変異の分析を含む。
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断し、そうすることで、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムの平均1Mbセグメント当たり2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布は均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片は主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端が生成される。ランダム法による酵素切断と異なる点は、断片化だけでなく、指向的に捕捉するために、我々は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムにおける所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの捕捉した断片を取得してシーケンシングを行う。こうすることで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法は、データ量(20M、40M、80M)の低い第2世代シーケンシングにより、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超のSNPサイトが50万個以上である。本発明は、簡略化ゲノムシーケンシング技術を基に、優位なエンドヌクレアーゼの組合せを選別して全ゲノムタイピングのための十分な有効SNPサイトを取得しながら、特定のシーケンシングリンカーおよび磁気ビーズ法分取手法を用いてライブラリー構築手順を簡略化し、マルチプライマーを設計して捕捉したSNPに対して胚移植前遺伝学分析を行う必要がない技術体系を確立し、全ゲノムシーケンシングに必要なデータ量を低下させ、一回の試験において染色体構造異常の分析と、染色体異数性異常の分析を同時に行うことができる。
本発明の一実施形態における核酸ライブラリーの構築方法の原理の模式図である。 本発明の一実施形態におけるシーケンシングリンカーの構造の模式図である。 実施例1における5481101E胚の検出結果の散布図(正倍数体)である。 実施例1における5481102E胚の検出結果の散布図(正倍数体)である。 実施例1における5481103E胚の検出結果の散布図(正倍数体)である。 実施例1における5481104E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。 実施例1における5481105E胚の検出結果の散布図(del(8)(p23.3p23.1)、dup(14)(q23.2q32.33))である。 実施例1における各胚の8番染色体均衡型転座の分析結果である。 実施例1における各胚の14番染色体均衡型転座の分析結果である。 実施例2における細胞株の検出結果の散布図(del(8)-5.2M)である。
以下、本発明を理解しやすくするために、本発明についてより詳細に説明し、本発明のより好ましい実施例を示す。しかしながら、本発明は、多くの異なる形態で実現することができ、本明細書に記載される実施例に制限されない。逆に、これらの実施例は、本発明に開示される内容に対する理解がより徹底的且つ包括的になるように提供される。
別途定義されない限り、本明細書に用いられる全ての技術用語及び科学用語は、本発明の技術分野に属する当業者が通常理解できるものと同じ意味を有する。本明細書の開示において使用する用語は、単に具体的な実施形態を説明するためのものに過ぎず、本発明を限定するものではない。本明細書に用いられる用語「および/または」は、1つまたは複数の関連する挙げられた項目のいずれか一項、およびあらゆる組合せを含む。
用語についての解釈
染色体とは、細胞核を構成する基本的な物質であり、遺伝子の担体である。染色体構造異常とは、染色体または染色分体が断裂-再交換または互換メカニズムによって染色体異常(chromosome aberration)および染色分体異常(chromatid aberration)を発生することを指す。染色体相互転座は、最もよく見られる染色体構造異常であり、主に非相同染色体同士が互いに染色体断片を交換することを指す。
均衡型転座とは、2本の非相同染色体がそれぞれ断裂およびスプライシング異常を発生して構造上で再転座した染色体を2本形成することを指し、相互転座およびロシュ転座を含む。染色体均衡型転座に既存の遺伝子の総数が保留されるので、均衡型転座保有者個体には、明らかな病気表現型がないが、生殖障害が多く存在する。主に、均衡型転座の保有者が減数分裂時に不均衡配偶子を発生する可能性があるため、ある1つの遺伝物質が低減または増加して遺伝物質のバランスを破壊することを引き起こし、最終に、奇形胎児または不妊不稔を引き起こす。理論的には、2本の染色体均衡型転座の保有者は減数分裂においてテトラッドを形成することができ、その分離形態に応じて生成可能な配偶子のタイプは多様であり、一般的に2:2分離および1:3分離によって少なくとも18種の異なる配偶子を生成することができ、また、4:0分離によって10種の配偶子を生成することができることが認められる。研究によれば、4:0の確率はいずれも小さく、よく見られる分離形態は2:2分離であることが示される。非相同染色体のロシュ転座保有者による6種の配偶子のうち、1/6が正常な配偶子であり、1/6が携帯型であり、4/6が異常な配偶子である。均衡型転座患者が正常な人と繁殖する場合、配偶子の分離タイプによれば、胚において染色体正倍数体、不均衡型転座によるモノソミーまたはトリソミー、均衡型転座保有者などの出願を生じる。染色体異数性は、原因不明の流産、奇形胎児、不妊不稔および死胎を引き起こす要因である。
FISH技術とは、蛍光標識プローブによってインサイチュで検体サンプルの核酸配列のハイブリダイゼーションを行い、蛍光顕微鏡によるDNA観察によって染色体の構造および数の分析を行う方法である。胚細胞の特定の染色体に対してFISHプローブハイブリダイゼーション検出を行うことにより、蛍光顕微鏡下で検出する染色体に転座およびコピー数多型が発生するか否かを観察することができる。FISH技術は、迅速で高感度といった利点を有するが、その限界は、スループットが低いことにある。蛍光顕微鏡は、現在、5種の異なる染色体プローブの蛍光信号のみを同時に観察することができるので、より多くの数の染色体を分析するためには、2回以上のハイブリダイゼーションが必要である。単細胞に対して複数回のハイブリダイゼーションを行うことは、エラー率を増加させる場合があるので、FISHは、有限な染色体のみに対して検出を行うことができ、すべての染色体異数性を検出することはできない。
SNPアレイ(SNP array)は、大量のSNPサイトを含有する高密度マイクロアレイチップであり、大多数のSNPチップは、60万以上のSNPを検出することができる。アレルヘテロ接合体の信号強度割合を分析することにより、染色体全体のコピー数多型を検出することができるだけでなく、家族全ゲノム範囲内のSNP連鎖分析により、均衡型転座携帯胚および正常な胚を区別することができる。SNPアレイに基づく検出技術は、正常な胚と均衡型転座保有胚とを区別するための使用実績がある。しかし、当該技術には既知変異の固定されたプローブが用いられ、変更可能性および柔軟性が低く、ある複雑な領域においてはハイブリダイゼーション後のサイトが少なく、ハイブリダイゼーション後のバックグラウンドの干渉がタイピングに失敗するリスクをもたらす。胚サンプルの検出において、CNVは低い感度で検出され、10M以下のCNVを検出することはできず、キメラに対する検出効果が良くない。
一ヌクレオチド多型(single nucleotide polymorphism、SNP)とは、主にゲノムレベルでの単一ヌクレオチドの変異によるDNA配列多型を指す。ハプロタイプ(Haplotype)とは、1本の染色体の特定の領域における、互いに関連し、全体として後代に遺伝する傾向にある複数の一ヌクレオチド多型の組合せを指し、一倍体型または単位型とも呼ばれている。シーケンシング深さとは、たとえば一実施形態において、シーケンシング深さが1000Xであれば、特定のPCR増幅産物が1000回シーケンシングされることを表す。
PGT-SRは、胚染色体に逆転、均衡型転座およびロシュ転座が存在するか否かの検出を標的とするものであり、元のPGDのうちの一部に相当する。そのうち、SRとは、「chromosomal structural rearrangements(染色体構造異常)」を指す。PGT-Aは、胚染色体に異数性が存在するか否かを検出する技術であり、元のPGSに相当する。そのうち、Aとは、「aneuploidy(異数性)」を指す。PGT-Mは、ある単一遺伝子病を引き起こし得る突然変異遺伝子を胚が保有するか否かの検出を標的とするものであり、元のPGDの一部に相当する。そのうち、Mとは、「monogenic/single gene defects(単一遺伝子病または欠陥)」を指す。
本発明の一実施形態における核酸ライブラリーの構築方法は、以下のステップS1~S5を含む。
S1:標的ヒトサンプルのゲノムDNAを取得する。
S2:第1のエンドヌクレアーゼおよび第2のエンドヌクレアーゼの組合せを用いてゲノムDNAを切断して高密度酵素切断産物を得る。当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供し、その酵素切断断片の両端に2~5ntの付着末端を生成する。
S3:酵素切断産物とシーケンシングリンカーとを連結して、連結産物を得る。シーケンシングリンカーは、第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含む
S4:連結産物から200bp~400bpの断片を選別して取得する。
S5:ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得る。
本発明に係る核酸ライブラリーの構築方法は、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せにより、全ゲノムを酵素切断する。そのうち、当該第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノムにおいて平均1Mbセグメント当たり、2000~5000の酵素切断部位を提供することができ、酵素切断部位の分布が均一であり、95%超のゲノムウィンドウをカバーし、酵素切断断片が主に100bp~600bpに分布し、酵素切断断片の両端に2~5ntの付着末端を生成することができる。我々は断片化だけでなく、標的化した捕捉のために、ランダム法酵素切断ではなく、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて全ゲノムの所定領域(10%~20%)のみに対して酵素切断を行った後、選別により必要なサイズの断片を捕捉してシーケンシングを行うことで、データ量が同様である場合、より高いシーケンシング深さ、より多くの有効情報を取得することができる。本発明に係る核酸ライブラリーの構築方法により、データ量(20M、40M、80M)の低い第2世代シーケンシングを用いて、90万個以上のSNPサイト、15万以上のindel(インデルマーカー)を取得することができ、そのうち、10×シーケンシング深さ超えのSNPサイトが50万個以上である。
そのため、本発明に係る核酸ライブラリーの構築方法は、ゲノムの平均シーケンシング深さが3×以上である場合、全ゲノム範囲内にSNP分析を行い、家族サンプル連鎖分析によって胚均衡型転座などの検出を行う。当該方法は、全ゲノムシーケンシングに必要なデータ量を低減させながら、有効SNPサイトおよびその深さを確保し、ハプロタイプに利用可能なSNPサイトの数を向上させて、低いシーケンシングデータ量で、全ゲノムをカバーする、ハプロタイプを分析可能な十分なSNPおよびindelsを取得し、SNPに対してマルチPCRプライマーを設計する必要がなく、必要なデータ量および検出コストを低下させることができる。それと同時に、CNVおよびキメラに対する検出能力が明らかに向上し、5M以上のCNVおよび30%以上のキメラ異常を検出することができる。
1つの具体的な例示において、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIであるが、これらに限定されない。
1つの具体的な例示において、表1に示すように、第1のリンカーの配列は、配列番号1および配列番号2に示され、第2のリンカーの配列は、配列番号3および配列番号4に示されている。ここで、華大のシーケンシングプラットホームの2つのリンカーにおいてそれぞれCATGおよびGATCの付着末端が追加されることで、NspIおよびMboI酵素切断による付着末端と相補可能である。改良用の従来のリンカー配列は、サーモフィッシャー、Illumina、華大のなどのシーケンシングプラットホームにおけるリンカー配列を含むがこれらに限定されず、追加した付着末端配列は、異なるエンドヌクレアーゼに応じて調整可能であることを理解すべきである。
Figure 2023508774000026
1つの具体的な例示において、ハイスループットシーケンシングプラットホーム汎用プライマーは、第1のリンカーと相補ペアリング可能な上流プライマーと、第2のリンカーと相補ペアリング可能であり、barcode配列を有する下流プライマーとを含む。このように、PCRライブラリー増幅の過程で、特定のbarcode情報を導入することができる。検体のDNA分子が複数の試験サンプルに由来する場合、シーケンシング過程においてサンプルを区別するために、各サンプルに異なるタグ配列(barcode)が追加されてもよいので、複数のサンプルに対してシーケンシングを同時に行うことを実現する。
1つの具体的な例示において、表2に示すように、上流プライマーの配列は、配列番号5に示され、下流プライマーの配列は、配列番号6に示されている。それは、上記華大のシーケンシングプラットホームにおける2つのリンカーに対する汎用プライマーである。異なるシーケンシングリンカーを用いる場合、汎用プライマーの配列は必要に応じて調節可能であることを理解すべきである。
Figure 2023508774000027
好ましくは、切断ステップにおいて、第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの体積比は、1:(0.8~1.2)である。
1つの具体的な例示において、磁気ビーズ分取方法により、連結産物から200bp~400bpの断片を選別して取得する。磁気ビーズは、AMPure XP磁気ビーズであることが好ましい。
1つの具体的な例示において、ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAに対して全ゲノム増幅を行うステップを含む。
1つの具体的な例示において、核酸ライブラリーの構築方法は、シーケンシングライブラリーの濃度を測定するステップを含む。
本発明の一実施形態における簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法は、上記核酸ライブラリーの構築方法により胚サンプルおよび当該胚サンプルの少なくとも1方の親(たとえば父親サンプルおよび母親サンプル)のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて胚サンプルの染色体を分析するステップを含む。
当該検出方法は、検出対象が生きている人体または動物体を対象とするのではなく、子宮に移植されていない胚であり、その検出結果が両親の病気診断結果にも関係しないので、病気の診断および治療方法に属しないことを理解すべきである。また、当該方法は、死亡した胚サンプルを検出するなどの病気診断および治療を目的としない使用に用いられてもよい。
好ましくは、両親のサンプルは、末梢血ゲノムDNA、精液DNA、口腔粘膜細胞DNAおよび細胞全ゲノム増幅産物から選ばれる1種または複数種である。各サンプルにおけるDNA含有量は、500ngよりも大きいことが好ましい。
1つの具体的な例示において、分析ステップは、具体的に、分析染色体構造変異、分析染色体異数性変異、分析単一遺伝子遺伝病および/または分析コピー数多型などを含む。
1つの具体的な例示において、家族遺伝歴がある均衡型転座家族に対して、上記核酸ライブラリーの構築方法を用いて、均衡型転座保有者夫婦、転座保有者の親族の少なくとも1人、および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの転座保有者においてヘテロ接合であり、他方においてホモ接合であり、且つ、転座保有者の親族においてホモ接合であるSNPサイトを有効SNPサイトとして選定する。すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築することで、転座保有者の異常な染色分体を確定する。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、胚に異常の染色分体が携帯されるか否かを判断することで、胚に均衡型転座が携帯されるか否かを確定する。
シーケンシングデータに対して全ゲノムCNV分析を行うこともできる。分析方法は、単細胞を増幅した後、DNAシーケンシングによって得た塩基配列とヒトゲノム標準配列hg19をBWAソフトウェアによって比較し、シーケンシングによって得た各塩基配列の染色体における正確な座位を確定する。品質が低く、染色体に多重マッチングされるか、染色体に完全にマッチングしていない塩基配列を除去し、シーケンシングデータの精度および各塩基配列の位置決めの一意性を確保する。染色体全体を100kb断片サイズの非重複領域に区画して、100kbウィンドウ当たりに得た一意のマッチング配列の数を算出する。GC含有量のズレの校正を行い、ウィンドウを合併し、ウィンドウデータを均一化する。参照データと比較することにより、log2RRを算出し、CBSによって断裂サイトを算出し、コピー数を算出し、アノテーションによって最終結果を作製する。
1つの具体的な例示において、新たに発病した均衡型転座保有者家族に対して、上記核酸ライブラリーの構築方法により、均衡型転座保有者夫婦および夫婦による胚に対してシーケンシングライブラリーを構築した後、シーケンシングを行う。まず、胚に対して全ゲノムCNV分析を行い、分析方法は、上述した通りである。均衡型転座により染色体コピー数多型を引き起こした胚E1を選別して、シーケンシングによる全ゲノム配列に対してSNP分析を行い、夫婦のうちの一方である転座保有者においてヘテロ接合であり、他方においてホモ接合であるSNPサイトを有効SNPサイトとして選定し、すべてのサンプルの有効SNPサイトを分析し、すべてのサンプルのハプロタイプマップを構築する。分離定律に基づき、E1胚は、必然的に親から異常の染色分体を遺伝するため、転座保有者の異常の染色分体を確定することができる。均衡型転座の断裂サイトが所在する領域を位置決めし、断裂サイトの上流および下流における1~5M範囲内のハプロタイプに基づき、他の胚が異常な染色分体を保有するか否かを判断することで、胚が均衡型転座を保有するか否かを確定する。
本発明に係る移植前胚染色体分析方法は、異なる病気に対してマルチPCRプライマーを設計する必要がなく、全ゲノムから十分なSNPサイトおよびindelサイトを取得することができ、23対の染色体の異数性の選別を同時に完成することができる。ターゲット遺伝子が位置する染色体全体がカバーされることにより、相同組み換えの分析に対する影響を低減させ、家族分析によって胚染色体構造異常を効果的に分析する成功率が高く、指定のロシュ転座および相互転座家族のうちの正常な胚および保有者胚に適用することができる。
以下は、具体的な実施例である。
実施例1 均衡型転座遺伝家族胚の検出
染色体均衡型転座保有者のいる家族(チップ検出結果により確認されたもの)を1組動員し、当該家族は補助生殖を受けた。家族情報を表3に示す。均衡型転座保有者、妻、および保有者へと均衡型転座が遺伝した親の末梢血サンプル(合計3つの血液サンプル)をそれぞれ5mL回収し、EDTA抗凝固採血チューブに保存した。同時に、当該夫婦の5つの胚生検サンプルの全ゲノム増幅後の生成物を取得した。家族ゲノムDNAは、全血抽出キットで抽出した。本発明に係る方法により、胚移植前染色体均衡型転座分析を行った。
Figure 2023508774000028
原理は、図1に示される。まず、1グループのエンドヌクレアーゼを用いてゲノムにおける特定の酵素切断部位を識別し、ゲノムDNAに対してゲノム切断を行い、ゲノムDNAを一定の配列の断片に断裂させ、断裂した断片の両端には、エンドヌクレアーゼによる切断によって付着末端構造を形成した。2種のエンドヌクレアーゼの切断による付着末端と相補性のシーケンシングリンカーを設計し、リンカーと切断されたゲノム配列とを連結し、PCR増幅によりシーケンシングライブラリーを形成する。構築したシーケンシングライブラリーに対して特定長さの断片の富化を行った後、シーケンサーでシーケンシングを行った。各サンプルに必要なシーケンシングデータは、8Gb以上である。シーケンシングリンカー構造は、図2に示すように、酵素切断断片付着末端と相補な配列、および異なるシーケンシングプラットホームの最初のシーケンシングリンカー配列を含む。
1.酵素切断
胚サンプルに対してQIAGEN REPLI-g Single Cell KitまたはTaKaRa PicoPLEX Single Cell WGA kitで全ゲノム増幅を行った。500ngのDNAを用意して水を17μLまで添加した。表4に応じて酵素切断混合液Mix1を調製し、3μLの酵素切断混合液Mix1をサンプル添加し、ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000029
遠心分離したDNAをPCR装置に設置した。PCR装置の設定プログラムは、表5に示される。
Figure 2023508774000030
2.リンカー連結
本実施例は、華大のシーケンシングプラットホームの2つのリンカーを採用した。
リンカー1:5’-GAACGACATGGCTACGATCCGACTTCATG-3’および5’-AAGTCGGATCGTAGCCATGTCGTTC-3’
リンカー2:5’-GATCAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA-3’および5’-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’
表6に応じてリンカー混合液Mix2を調製した。5μLのリンカー混合液Mix2を酵素切断されたDNAに添加して、ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000031
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表7に示される。
Figure 2023508774000032
表8に応じて、リガーゼ混合液Mix3を調製した。5μLのリガーゼ混合液Mix3を上記リンカーDNAに添加し、(ボルテックスによる混合なしで)ガンで均一に通気して混合し、短時間の遠心分離に付した。
Figure 2023508774000033
遠心分離されたDNAをPCR装置に設置した。PCR装置の設定プログラムは、表9に示される。
Figure 2023508774000034
3.断片の選別
水を100μLまで添加した後、AMPure XP磁気ビーズを60μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを新たなEPチューブに移し、AMPure XP磁気ビーズを20μL添加した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールで洗浄した。室温で乾燥させた後、22μLのLow TEで溶出した。
4.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
5.PCR増幅
10ngの選別した断片に対してPCR増幅を行い、ライブラリーを得た。表10に応じてPCR反応混合液Mix4を調製した。
PCRプライマー:F: 5’-GAACGACATGGCTACGA-3’
R: 5’-TGTGAGCCAAGGAGTTG(barcode) TTGTCTTCCTAAGACCGC-3’
Figure 2023508774000035
断片を選別したサンプルの20μLをPCRチューブに添加した。28.75μLのPCR反応混合液Mix4を添加した後、barcode含有特異性プライマーを1.25μL添加し、混合して短時間の遠心分離に付した。PCR装置において、そのプログラム設定は、表11に示される。
Figure 2023508774000036
6.ライブラリーの精製
反応が完了した後、短時間の遠心分離に付した。AMPure XP磁気ビーズを50μL添加し、ガンで均一に通気して混合した。室温で5分間置いて、マグネットスタンドに置いた。液体が透明になったら、上澄みを除去した。200μLの80%アルコールによる洗浄を1回繰り返し、室温で磁気ビーズを乾燥させ、40μLのLow TEで磁気ビーズを再懸濁し、DNAを溶出した。
7.濃度の測定
2μLのサンプルを抽出してQubit濃度測定を行った。
8.シーケンサーによるシーケンシング
次世代シーケンシングのために、リンカーのタイプに応じてプラットホームを選択した。本実施例では、華大のシーケンシングプラットホームでシーケンシングを行った。
9.データ分析
シーケンシングによるシーケンシングデータのデータ分析を行い、参照ゲノムとの比較を行った。バリエーションの同定を通じてデータからSNPサイトを得た。遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判断して、均衡型転座保有者胚または正常な胚を区別する。
10.検出の性能
5M以上の欠失を検出することができると共に、指定の均衡型転座家族のうちの(ロシュ転座と相互転座)胚の遺伝の情況を検出することができる。
11.検出結果
図3~7は、それぞれ5個の胚サンプルのPGT-A検出結果である。図8は、各胚の8番染色体の均衡型転座分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。図9は、各胚の14番染色体上の均衡型転座の分析結果である。男性の母親を参照サンプルとして、マップにおけるハプロタイプ分析は、左から右の順に、男性、女性、参照サンプル(男性の母親)、5481101E胚、5481102E胚、5481103E胚、5481104E胚および5481105E胚である。
被験者である男性が転座保有者であり、転座に関連する染色体は、8番および14番染色体である、すなわち、男性は1本の正常な8番染色分体、1本の正常な14番染色分体および2本の転座した染色分体(8p23および14q24転座)を含む。男性の母親の検出結果に基づき、母親から2本の転座した染色分体が男性に遺伝し、父親から正常な1本の8番染色分体および1本の14番染色分体が遺伝したと推定した。男性の母親の8番および14番染色分体の色は、男性と同じ異常を示す色(青色)であり、逆に、男性の他の1本の染色分体の色は正常な色(赤色)である。胚染色体コピー数多型検出結果から分かるように、5481101E番胚が均衡型転座保有者であり、5481102E番胚が均衡型転座保有者であり、5481103E番胚が均衡型転座保有者であり、5481104E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚であり、5481105E番胚が8番および14番染色体にコピー数多型を発生しているため、非均衡型転座型胚である。
実施例2
染色体異数性を有する細胞株サンプル(5細胞)の詳細を表12に示した。MDA法による全ゲノム増幅を行った。
Figure 2023508774000037
実施例1における方法に基づいて検出した。細胞株のPGT-Aデータ分析結果を図10に示す。検出結果から分かるように、当該方法は5Mの異常欠失を検出することができる。
比較例1
本比較例1では、SNP-アレイチップ(Karyomapping遺伝子チップ)技術を用いて実施例1の胚サンプルを検出した。
実施例1および比較例1における各染色体の有効データを比較した。下記表13に、5481105E番の胚を例として、各染色体の有効座位を比較した。表からは、実施例1における有効座位のデータ(胚サンプル)がチップからのデータよりも多いことが示される。
Figure 2023508774000038
実施例3
本実施例における方法は、エンドヌクレアーゼの組合せがそれぞれBfaIとTaqI、またはMboIとMspIであること以外は、実施例1と基本的に同様である。同様にデータ量が低い場合に十分なSNPサイトおよびindelサイトを取得することができ、遺伝マップを構築することにより、胚染色体の構造に異常があるか否かを判定して、均衡型転座保有者胚であるか、または正常な胚であるかを区別する。
比較例2
本比較例2は、NspIとTaqIの組合せを用いてゲノムDNAに対して酵素切断を行う以外、他のステップは実施例1と同様である。
実施例1および比較例2における各染色体の有効データを比較した。下記表14に、5481105E番の胚を例として、各染色体の有効座位を比較した。表は、比較例2におけるエンドヌクレアーゼの組合せに対する有効座位のデータ(胚サンプル)が、実施例1におけるエンドヌクレアーゼの組合せに対するそれよりも明らかに低いことが示され、本発明におけるエンドヌクレアーゼの組合せが任意選択可能ではないことが示されている。
Figure 2023508774000039
上記実施形態の各技術的特徴は、任意に組み合わせることができる。説明を簡単にするために、上記実施形態における各技術的特徴の全ての組合可能な形態については記載されていないが、これら技術的特徴の組み合わせに矛盾がない限り、本明細書に記載の範囲とみなされるべきである。
以上、前記実施例は、本発明のいくつかの実施形態の例示にすぎず、その説明は、具体的且つ詳細であるが、本発明の範囲を限定するものではないと理解すべきである。当業者であれば、本発明の思想から逸脱しない前提で、いくつかの変形及び改良を行うことができ、これらはすべて本発明の保護範囲に属することを指摘すべきである。したがって、本発明の保護範囲は、請求の範囲により決定されるべきである。
配列番号1: リンカー
配列番号2: リンカー
配列番号3: リンカー
配列番号4: リンカー
配列番号5: プライマー
配列番号6: プライマー

Claims (11)

  1. 標的となるヒトに由来するサンプルからゲノムDNAを取得するステップと、
    第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せを用いて前記ゲノムDNAを切断して高密度酵素切断産物を得るステップであって、前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、ヒトゲノム上の平均1Mbセグメント当たり、2000~5000の酵素切断部位を生成し、酵素切断断片の両端に2~5ntの付着末端を生成することができるステップと、
    前記酵素の切断産物とシーケンシングリンカーを連結して、連結産物を得るステップであって、前記シーケンシングリンカーは、前記第1のエンドヌクレアーゼの切断による付着末端と相補性の第1のリンカーと、前記第2のエンドヌクレアーゼの切断による付着末端と相補性の第2のリンカーと、を含むステップと、
    前記連結産物から200bp~400bpの断片を選別して取得するステップと、
    最後に、ハイスループットシーケンシングプラットホーム汎用プライマーを用いてPCR増幅を行って、シーケンシングライブラリーを得るステップと
    を含む、ことを特徴とする核酸ライブラリーの構築方法。
  2. 前記第1のエンドヌクレアーゼと第2のエンドヌクレアーゼの組合せは、MboIとNspI、BfaIとTaqI、またはMboIとMspIである、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
  3. 前記第1のリンカーの配列は、配列番号1および配列番号2に示され、前記第2のリンカーの配列は、配列番号3および配列番号4に示されている、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
  4. 前記ハイスループットシーケンシングプラットホーム汎用プライマーは、前記第1のリンカーと相補性の上流プライマーと、前記第2のリンカーと相補性であり、且つbarcode配列を有する下流プライマーと、を含む、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
  5. 前記上流プライマーの配列は、配列番号5に示され、前記下流プライマーの配列は、配列番号6に示されている、ことを特徴とする請求項4に記載の核酸ライブラリーの構築方法。
  6. 前記切断するステップにおいて、前記第1のエンドヌクレアーゼと前記第2のエンドヌクレアーゼの体積比が1:(0.8~1.2)である、ことを特徴とする請求項1に記載の核酸ライブラリーの構築方法。
  7. 磁気ビーズ分取の方法を用いて前記連結産物から200bp~400bpの断片を選別して取得する、ことを特徴とする請求項1~6のいずれか一項に記載の核酸ライブラリーの構築方法。
  8. 前記ゲノムDNAを取得するステップは、卵割期または胚盤胞期まで発育した胚から細胞を取得し、細胞におけるDNAを全ゲノム増幅するステップを含む、ことを特徴とする請求項1~6のいずれか一項に記載の核酸ライブラリーの構築方法。
  9. 前記シーケンシングライブラリーの濃度を測定するステップをさらに含む、ことを特徴とする請求項1~6のいずれか一項に記載の核酸ライブラリーの構築方法。
  10. 請求項1~9のいずれか一項に記載の核酸ライブラリーの構築方法を用いて、胚サンプルおよび前記胚サンプルのうちの少なくとも1種の親のシーケンシングライブラリーを構築した後、シーケンシングを行い、シーケンシング結果に基づいて前記胚サンプルの染色体を分析するステップを含む、簡略化ゲノムシーケンシングに基づく移植前胚染色体構造異常分析方法。
  11. 前記分析するステップは、具体的に、染色体構造異常の分析、および染色体異数性異常の分析を含む、ことを特徴とする請求項10に記載の移植前胚染色体構造異常分析方法。
JP2022564692A 2020-10-14 2021-04-15 核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用 Active JP7429072B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011094180.6 2020-10-14
CN202011094180.6A CN111961707B (zh) 2020-10-14 2020-10-14 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用
PCT/CN2021/087503 WO2022077885A1 (zh) 2020-10-14 2021-04-15 一种核酸文库构建方法及其在植入前胚胎染色体结构异常分析中的应用

Publications (2)

Publication Number Publication Date
JP2023508774A true JP2023508774A (ja) 2023-03-03
JP7429072B2 JP7429072B2 (ja) 2024-02-07

Family

ID=73387596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022564692A Active JP7429072B2 (ja) 2020-10-14 2021-04-15 核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用

Country Status (7)

Country Link
US (1) US20230250421A1 (ja)
EP (1) EP4060051A4 (ja)
JP (1) JP7429072B2 (ja)
CN (1) CN111961707B (ja)
AU (1) AU2021359279A1 (ja)
CA (1) CA3162685A1 (ja)
WO (1) WO2022077885A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114220482A (zh) * 2021-12-02 2022-03-22 苏州贝康医疗器械有限公司 跨断点进行染色体微缺失分析的方法、装置、设备及存储介质
CN114507728B (zh) * 2022-03-03 2024-03-22 苏州贝康医疗器械有限公司 一种捕获引物及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030190634A1 (en) * 1999-01-06 2003-10-09 Francis Barany Accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001088189A2 (en) * 2000-05-15 2001-11-22 Keygene N.V. Microsatellite-aflp®
CN1995384A (zh) * 2006-01-06 2007-07-11 王铸钢 一种快速方便转基因插入位点鉴定技术
CN102634506B (zh) * 2012-04-06 2014-02-26 湖南杂交水稻研究中心 一种黏性末端接头应用于侧翼序列分离的方法
CN104232626A (zh) * 2013-06-13 2014-12-24 深圳华大基因科技有限公司 简化基因组测序文库中条码物及其设计方法
EP3174980A4 (en) * 2014-08-01 2018-01-17 Dovetail Genomics, LLC Tagging nucleic acids for sequence assembly
CN104711362A (zh) * 2015-03-27 2015-06-17 苏州贝康医疗器械有限公司 一种利用囊胚期胚胎细胞进行胚胎染色体异常检测的方法
CN106566872B (zh) * 2015-10-13 2018-08-14 中国农业大学 基于测序基因分型技术的猪snp标记位点的分析方法
CN105696088B (zh) * 2015-11-11 2018-05-01 中国科学院昆明植物研究所 一种双酶切简化基因组二代测序文库构建方法及配套试剂盒
US20210108263A1 (en) * 2017-03-20 2021-04-15 Celula China Med-Technology Co., Ltd. Methods and Compositions for Preparing Sequencing Libraries
CN108148830A (zh) * 2017-12-22 2018-06-12 上海美吉生物医药科技有限公司 一种简化代表性单细胞全基因组建库方法及其应用
CN110628891B (zh) * 2018-06-25 2024-01-09 深圳华大智造科技股份有限公司 一种对胚胎进行基因异常筛查的方法
CN109486811B (zh) * 2018-09-25 2021-07-27 华大数极生物科技(深圳)有限公司 双端分子标签接头及其用途和带有该接头的测序文库
CN110283892B (zh) * 2019-06-10 2023-03-21 浙江海洋大学 基于简化基因组测序技术的褐菖鲉基因筛选和挖掘方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030190634A1 (en) * 1999-01-06 2003-10-09 Francis Barany Accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BMC GENOMICS, vol. 14:11, JPN6023026163, 2013, pages 1 - 12, ISSN: 0005093428 *

Also Published As

Publication number Publication date
CN111961707A (zh) 2020-11-20
JP7429072B2 (ja) 2024-02-07
WO2022077885A1 (zh) 2022-04-21
US20230250421A1 (en) 2023-08-10
AU2021359279A1 (en) 2022-07-14
CN111961707B (zh) 2021-01-15
CA3162685A1 (en) 2022-04-21
EP4060051A1 (en) 2022-09-21
EP4060051A4 (en) 2023-12-20

Similar Documents

Publication Publication Date Title
US7303880B2 (en) Microdissection-based methods for determining genomic features of single chromosomes
US6291182B1 (en) Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
US20200291456A1 (en) High-throughput genotyping by sequencing low amounts of genetic material
US11111540B2 (en) Assessment of risk of aneuploidy
CN110628891A (zh) 一种对胚胎进行基因异常筛查的方法
JP7429072B2 (ja) 核酸ライブラリーの構築方法、およびその移植前胚染色体構造異常分析における使用
Pei et al. Identifying balanced chromosomal translocations in human embryos by Oxford nanopore sequencing and breakpoints region analysis
JP2000041687A (ja) 対立遺伝子変異の並行スクリ―ニングのための方法
CN114457143B (zh) 一种构建cnv检测文库的方法及cnv检测方法
Zhang et al. Current status and recent advances in preimplantation genetic testing for structural rearrangements
CN113355401A (zh) 一种基于ngs的cnv分析检测脑胶质瘤染色体的方法
Wu et al. Progress in the detection of human genome structural variations
US11814682B2 (en) Method for preimplantation genetic screening of embryos for detection of structural rearrangements
US20240076741A1 (en) Method for preimplantation genetic screening of embryos for detection of structural rearrangements
Zhou et al. Massively parallel sequencing on human cleavage-stage embryos to detect chromosomal abnormality
Girardi Development and Validation of Innovative Technologies for Highly Accurate and Cost-Effective Preimplantation Genetic Testing: Technical and Clinical Perspectives
CN116665774A (zh) 一种家系全基因组单体型连锁分析方法、装置、存储介质和设备
Treff et al. Pre-implantation Genetic Testing
Klaassens et al. Genome-Wide oligonucleotide-Based Array Comparative Genome Hybridization Analysis of Non-isolated Congenital Diaphragmatic Hernia
Brickell DNA probes in human diseases
Edwards et al. Mutation and Polymorphism Detection
Srivastava et al. Low-Pass Genome Sequencing: A Good Option for Detecting Copy Number Variations

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220628

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230925

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240119

R150 Certificate of patent or registration of utility model

Ref document number: 7429072

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150