JP2020532999A - 非侵襲性の移植前遺伝子診断のためのシステムおよび方法 - Google Patents

非侵襲性の移植前遺伝子診断のためのシステムおよび方法 Download PDF

Info

Publication number
JP2020532999A
JP2020532999A JP2020514609A JP2020514609A JP2020532999A JP 2020532999 A JP2020532999 A JP 2020532999A JP 2020514609 A JP2020514609 A JP 2020514609A JP 2020514609 A JP2020514609 A JP 2020514609A JP 2020532999 A JP2020532999 A JP 2020532999A
Authority
JP
Japan
Prior art keywords
genomic
genome
sequence
fragment
genomic fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020514609A
Other languages
English (en)
Inventor
サンティアゴ ムンネ−ブランコ,
サンティアゴ ムンネ−ブランコ,
ドゥルティ アショックバイ ババリヤ,
ドゥルティ アショックバイ ババリヤ,
アルン プラサド マノハラン,
アルン プラサド マノハラン,
ダガン ウェルズ,
ダガン ウェルズ,
Original Assignee
クーパーゲノミクス, インコーポレイテッド
クーパーゲノミクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クーパーゲノミクス, インコーポレイテッド, クーパーゲノミクス, インコーポレイテッド filed Critical クーパーゲノミクス, インコーポレイテッド
Publication of JP2020532999A publication Critical patent/JP2020532999A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

胚候補中のゲノムの特徴を識別するためのシステムが開示される。システムはゲノミクス配列決定装置と演算装置とディスプレイとを備え、ゲノム配列決定装置は胚候補に由来する連結されたゲノム断片から配列情報を取得するように構成され、連結されたゲノム断片はゲノムリンカーセグメントと胚候補からのゲノム断片とを含む。演算装置はゲノム配列決定装置に通信可能に接続され、配列アラインメントエンジンとゲノムの特徴識別エンジンとを備える。配列アラインメントエンジンは連結されたゲノム断片のゲノムリンカーセグメント部分と関連する配列情報を差し引き、ゲノム断片配列を参照ゲノムにアラインさせるように構成され、ゲノムの特徴識別エンジンはアラインされたゲノム断片配列中のゲノムの特徴を識別するように構成される。ディスプレイは演算装置に通信可能に接続され、識別されたゲノムの特徴を含む報告を表示するように構成される。

Description

分野
本明細書に開示されている実施形態は、一般的には、人工授精手技での移植前における胚の非侵襲性遺伝子スクリーニングおよび/または診断のためのシステムおよび方法を対象とする。より具体的には、遺伝子異常/欠陥のリスクが最低であり、および子宮着床成功の確率が最高である、胚の選択において臨床医を補助することができる、非侵襲性移植前スクリーニングおよび/または診断システムおよび方法に対する要求が存在する。
背景
人工授精(IVF)は、生殖補助技術であり、高齢出産年齢の女性、妊娠が困難なカップルにとって、および代理母出産を容易にするための手段として、ますます一般的になっている。受精の過程は、卵を抽出すること、精子試料を回収すること、次いで、研究室で卵と精子を手作業で組み合わせることを含む。次いで、出産まで胚を保有するために、ホストの子宮に胚が移植される。
IVF手技は高価であり、患者に対して著しい心理的/肉体的負担を課し得るので、移植前における胚の遺伝子スクリーニングが、IVF手技を受けている患者にとってますます一般的となっている。胚中の遺伝子異常を診断し、移入の生存率(すなわち、胚移植生存率)をスクリーニングする現行の方法は胚の生検を必要とし、胚の生検は胚の品質に影響を与えることがあり、ひどく高価で、時間がかかることがある特殊な研究室技術を必要とする。
このため、胚の生検に対する必要性を回避し、このため、移植される前の胚に対する安全性を実質的に増大させる、胚を遺伝学的にスクリーニングするための非侵襲性遺伝子スクリーニングおよび/または診断(NIPGS)システムおよび方法に対する要求が存在する。
要旨
一態様において、人工授精(IVF)移植のための胚候補中のコピー数変動を決定するための方法が開示されている。1つの胚候補が、複数の胚から単離される。この胚候補は、実質的にDNAを含まない培地中でインキュベートされる。培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌されたゲノム断片を含む。複数のゲノムリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。連結されたゲノム断片は、増幅容器中で増幅される。配列情報が、増幅された連結されたゲノム断片から取得される。配列情報は、参照ゲノムに対してアラインされる(マッピングされる)。参照ゲノム上の染色体上の位置にアラインされたゲノム断片配列読み取りデータ(read)の頻度が頻度閾値から逸脱するときに、胚候補中で、コピー数変動が識別される。
別の態様において、胚候補中のゲノムの特徴を識別するための方法が開示されている。1つの胚候補が、複数の胚候補から単離される。この胚候補は、実質的にDNAを含まない培地中でインキュベートされる。培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌された1つ以上のゲノム断片を含む。複数のゲノムリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。連結されたゲノム断片は、増幅容器中で増幅される。配列情報が、連結されたゲノム断片から取得される。配列情報は、参照ゲノムに対してアラインされる。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
さらに別の態様において、胚候補中のゲノムの特徴を識別するためのシステムが開示されている。システムは、ゲノミクス配列決定装置と、演算装置と、ディスプレイとを備える。
ゲノム配列決定装置は、胚候補に由来する連結されたゲノム断片から配列情報を取得するように構成されている。連結されたゲノム断片はそれぞれ、少なくとも1つのゲノムリンカーセグメントと胚候補からの少なくとも1つのゲノム断片とを含む。
演算装置はゲノム配列決定装置に通信可能に接続されており、配列アラインメントエンジンとゲノムの特徴識別エンジンとを備える。配列アラインメントエンジンは、連結されたゲノム断片のゲノムリンカーセグメント部分と関連する配列情報を差し引き、ゲノム断片配列を参照ゲノムにアラインさせるように構成されている。ゲノムの特徴識別エンジンは、アラインされたゲノム断片配列中のゲノムの特徴を識別するように構成されている。ディスプレイは、演算装置に通信可能に接続されており、識別されたゲノムの特徴を含む報告を表示するように構成されている。
さらに別の態様において、組織試料中のゲノムの特徴を識別するための方法が開示されている。少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータが受領される。連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分が差し引かれる。連結されたゲノム断片配列読み取りデータは、参照ゲノムにアラインされる(マッピングされる)。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
さらに別の態様において、組織試料中のゲノムの特徴を識別するための方法をコンピュータに実行させるためのプログラムがその中に保存されている非一時的なコンピュータ読み取り可能な媒体が提供される。少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータが受領される。連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分が差し引かれる。連結されたゲノム断片配列読み取りデータは、参照ゲノムにアラインされる(マッピングされる)。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
本明細書に開示されている原理およびその利点のさらに完全な理解のために、ここで、添付の図面と合わせて以下の記述を参照する。
図1は、本開示のいくつかの実施形態にしたがう、胚の非侵襲性移植前遺伝子スクリーニングに対するワークフローを例示する。
図2は、本開示のいくつかの実施形態にしたがう、短いゲノム断片を増幅するための増幅プロトコールを図示する例示的なフローチャートである。
図3は、本開示のいくつかの実施形態にしたがう、連結された断片の形成を例示する。
図4は、様々な実施形態にしたがう、コンピュータシステムを例示するブロック図である。
図5は、様々な実施形態にしたがう、胚の非侵襲性移植前遺伝子スクリーニングのためのシステムの模式図である。
図6は、様々な実施形態にしたがい、連結された断片読み取りデータが参照ゲノムにマッピングされる方法の図示である。
図7は、様々な実施形態にしたがい、様々な種類のゲノムの特徴を識別するためにゲノム断片読み取りデータをアラインするための方法を示す例示的なフローチャートである。
図8は、様々な実施形態にしたがい、胚候補中のコピー数変動を決定するための方法を示すフローチャートである。
図9は、様々な実施形態にしたがい、胚候補中のゲノムの特徴を識別する方法を示すフローチャートである。
図10は、様々な実施形態にしたがい、連結されたゲノム断片読み取りデータからのゲノムの特徴を識別するための方法を示すフローチャートである。
図面は必ずしも正確な比率で描かれているわけではなく、図面中の物体も、互いとの関連で、必ずしも正確な比率で描かれているわけではないことが理解されるべきである。図面は、本明細書に開示されている装置、システムおよび方法の様々な実施形態に対して明確さと理解をもたらすことを目的とする描写である。可能な限り、同一のまたは同様の部分を表すために、図面全体を通じて同一の参照番号が使用される。さらに、図面は、本教示の範囲を限定することを決して目的とするものではないことが理解されるべきである。
詳細な説明
本明細書は、本開示の例示的な実施形態および応用を記載する。しかしながら、本開示は、これらの例示的な実施形態および応用に、または例示的な実施形態および応用が作動するもしくは本明細書に記載されている様式に限定されない。さらに、図面は、簡略化されたまたは部分的な図を示すことがあり得、図面中の要素の大きさは、強調され、またはその他比例していないことがあり得る。さらに、「上」、「に付着された」、「に接続された」、「に結合された」などの用語または類似の用語が本明細書において使用される場合、ある要素が別の要素の上に直接存在し、別の要素に直接付着され、接続され、もしくは結合されているかどうかに、またはある要素と別の要素の間に1つもしくはそれを超える介在する要素が存在するかどうかに関わらず、ある要素(例えば、材料、層、基材など)は、別の要素の「上」に存在し、別の要素に付着され、接続され、もしくは結合されることができる。さらに、要素のリスト(例えば、要素a、b、c)が参照される場合、このような参照は、列記された要素自体の任意の1つ、列記された要素の全てに満たないあらゆる組み合わせ、および/または列記された要素の全ての組み合わせを含むものとする。本明細書中の節の区切りは参照の容易のためのものに過ぎず、論述されている要素のいずれの組み合わせも限定しない。
別段の定義が為されていなければ、本明細書に記載されている本教示に関連して使用される科学用語および技術用語は、当業者によって一般的に理解されている意味を有するものとする。さらに、文脈によって別段の要求がされていなければ、単数形の用語は複数を含むものとし、複数形の用語は単数を含むものとする。一般的に、本明細書に記載されている、細胞および組織培養、分子生物学ならびにタンパク質およびオリゴヌクレオチドまたはポリヌクレオチド化学およびハイブリダイゼーションと関連して使用される命名法およびこれらの技術は、周知のものであり、一般的に本分野において使用されるものである。例えば、核酸精製および調製、化学的分析、組換え核酸およびオリゴヌクレオチド合成のための標準的技術が使用される。酵素的反応および精製技術は、製造業者の仕様に従って、または本分野で一般的に達成されるように、または本明細書に記載されているように行われる。本明細書に記載されている技術および手技は、一般に、本分野において周知の慣用的な方法に従って、ならびに本明細書を通じて引用および論述されている様々な一般的およびより具体的な参考文献に記載されているとおりに実施される。例えば、Sambrookら、Molecular Cloning:A Laboratory Manual(Third ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2000)を参照されたい。関連して使用される命名法ならびに本明細書に記載されている研究室手技および技術は、本分野において周知であり、一般的に使用されるものである。
「次世代配列決定」(NGS(next generation sequencing))という用語は、伝統的なサンガーおよびキャピラリー電気泳動をベースとするアプローチと比べて、増加した処理量を有する、例えば、何十万もの相対的に小さな配列読み取りデータを一度に生成する能力を有する配列決定技術を表す。次世代配列決定技術のいくつかの例には、合成による配列決定、ライゲーションによる配列決定およびハイブリダイゼーションによる配列決定が含まれるが、これらに限定されない。より具体的には、IlluminaのMISEQ、HISEQおよびNEXTSEQ SystemsならびにLife Technologies CorpのPersonal Genome Machine(PGM)およびSOLiD Sequencing Systemは、全ゲノムまたは標的とされたゲノムの大規模平行配列決定を提供する。SOLiD Systemおよび付随するワークフロー、プロトコール、化学などは、「Reagents,Methods,and Libraries for Bead−Based Sequencing」の名称で、国際出願日が2006年2月1日のPCT公開WO2006/084132号、2010年8月31日に出願され、「Low−Volume Sequencing System and Method of Use」という名称の米国特許出願第12/873,190号、および2010年8月31日に出願された、「Fast−Indexing Filter Wheel and Method of Use」という名称の米国特許出願第12/873,132号にさらに詳しく記載されており、これらの出願の各々の全体が、その参照によって、本明細書に組み込まれている。
「配列決定動作」という用語は、少なくとも1つの生体分子(例えば、核酸分子)に関連する何らかの情報を決定するために実施される配列決定実験のいずれかの工程または部分を表す。
本明細書において使用される場合、「ゲノムの特徴」という用語は、何らかの注釈付けられた機能を有するゲノム領域(例えば、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなど)、または、変異、組換え/乗り換えもしくは遺伝的浮動によって、特定の種もしくは特定の種内の部分集団に対して参照された場合に変化を受けている(DNAまたはRNA中の)単一またはグループの遺伝子を表す遺伝子/ゲノムバリアント(例えば、一塩基多型/変異体、挿入/欠失配列、コピー数変動、反転など)を表すことができる。
ゲノムバリアントは、アレイをベースとする方法(例えば、DNAマイクロアレイなど)、リアルタイム/デジタル/定量的PCR機器法および全核酸または標的とする核酸の配列決定システム(例えば、NGSシステム,Capillary Electrophoresisシステムなど)を含むが、これらに限定されない様々な技術を用いて識別することができる。核酸配列決定を用いて、単一塩基解像度で、カバレッジデータを取得することが可能である。
DNA(デオキシリボ核酸)は、A(アデニン)、T(チミン)、C(シトシン)およびG(グアニン)の4種類のヌクレオチドからなるヌクレオチドの鎖であり、そのRNA(リボ核酸)は、A、U(ウラシル)、GおよびCの4種類のヌクレオチドから構成される。ヌクレオチドのある対は、相補的な様式で、互いに特異的に結合する(相補的塩基対形成と呼ばれる。)。すなわち、アデニン(A)はチミン(T)と対形成し(ただし、RNAの場合には、アデニン(A)はウラシル(U)と対形成する。)、シトシン(C)はグアニン(G)と対形成する。第一の核酸鎖が、第一の鎖中のヌクレオチドに相補的であるヌクレオチドから構成される第二の核酸鎖に結合すると、2つの鎖は結合して二本鎖を形成する。本明細書において使用される「核酸配列決定データ」、「核酸配列決定情報」、「核酸配列」、「ゲノム配列」、「遺伝子配列」または「断片配列」または「核酸配列読み取りデータ」は、DNAまたはRNAの分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、断片など)中のヌクレオチド塩基(例えば、アデニン、グアニン、シトシンおよびチミン/ウラシル)の順序を示すあらゆる情報またはデータを表す。本教示は、キャピラリー電気泳動、マイクロアレイ、ライゲーションをベースとするシステム、ポリメラーゼをベースとするシステム、ハイブリダイゼーションをベースとするシステム、直接または間接的なヌクレオチド識別システム、パイロシークエンシング、イオンまたはpHをベースとする検出システム、電子署名をベースとするシステムなどを含むがこれらに限定されない、あらゆる利用可能な様々な技法、プラットフォームまたは技術を用いて得られる配列情報を想定することが理解されるべきである。
「ポリヌクレオチド」、「核酸」または「オリゴヌクレオチド」は、ヌクレオシド間結合によって連結されたヌクレオシド(デオキシリボヌクレオシド、リボヌクレオシドまたはこれらの類縁体を含む。)の直鎖ポリマーを表す。典型的には、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。通常、オリゴヌクレオチドのサイズは、数個の単量体単位、例えば、3〜4個から数百個の単量体単位までの範囲である。別段の記載がなければ、オリゴヌクレオチドなどのポリヌクレオチドが、「ATGCCTG」のような文字の列によって表されている場合には常に、ヌクレオチドは、左から右に、5’−>3’の順序であり、「A」はデオキシアデノシンを表し、「C」はデオキシシチジンを表し、「G」はデオキシグアノシンを表し、および「T」はチミジンを表すことが理解されるであろう。文字A、C、GおよびTは、本分野において標準的であるように、塩基それ自体、ヌクレオシドまたは塩基を含むヌクレオチドを表すために使用され得る。
「断片ライブラリー」という用語は、1またはそれを超える断片が配列決定鋳型として使用される、核酸断片の集合物を表す。断片ライブラリーは、例えば、より大きな核酸をより小さな断片に切断または剪断することによって生成され得る。断片ライブラリーは、哺乳動物または細菌の核酸などの、天然に存在する核酸から生成され得る。合成断片ライブラリーを作製するために、類似の大きさの合成核酸配列を含むライブラリーを生成することもできる。
様々な実施形態において、配列アライン法は、断片配列を参照配列または別の断片配列にアラインすることができる。断片配列は、断片ライブラリー、ペアードエンドライブラリー、メイトペアライブラリー、連結された断片ライブラリー、または、例えば、RNA、DNAおよびタンパク質をベースとする配列情報などの核酸配列情報によって反映もしくは表され得る別の種類のライブラリーから取得することができる。一般的には、断片配列の長さは、参照配列の長さより実質的に短くすることができる。断片配列および参照配列は、それぞれ、シンボルの配列を含むことができる。断片配列と参照配列のアラインは、断片配列のシンボルと参照配列のシンボルとの間に限られた数のミスマッチを含むことができる。一般的に、断片配列と参照配列の間のミスマッチの数を最小化するために、断片配列は参照配列の一部にアラインすることができる。
特定の実施形態において、断片配列と参照配列のシンボルは、生体分子の組成を表すことができる。例えば、シンボルは、RNAもしくはDNAなどの核酸中のヌクレオチドの同一性またはタンパク質中のアミノ酸の同一性に対応することができる。いくつかの実施形態において、シンボルは、生体分子のこれらの部分構成要素と直接の相関を有することができる。例えば、各シンボルは、ポリヌクレオチドの単独の塩基を表すことができる。他の実施形態において、各シンボルは、ポリヌクレオチドの2つの隣接する塩基など、生体分子の2つまたはそれを超える隣接する部分構成要素を表すことができる。さらに、シンボルは、隣接する部分構成要素の重複する組または隣接する部分構成要素の別個の組を表すことができる。例えば、各シンボルがポリヌクレオチドの2つの隣接する塩基を表す場合、重複する組を表す2つの隣接するシンボルは、ポリヌクレオチド配列の3つの塩基に対応することができるのに対して、異なる組を表す2つの隣接するシンボルは、4つの塩基の配列を表すことができる。さらに、シンボルは、ヌクレオチドなどの部分構成要素に直接対応することができ、またはカラーコールもしくは部分構成要素の他の間接的指標に対応することができる。例えば、シンボルは、特定のヌクレオチドフローに対する組込みまたは非組込みに対応することができる。
様々な実施形態において、コンピュータプログラム製品は、断片配列の近接する部分を選択するための指示、参照配列に対して近接部分の少なくとも1つのマッチを生成する近似鎖マッチング(approximate string matching)法を用いて、断片配列の近接部分を参照配列にマッピングするための指示を含むことができる。
様々な実施形態において、核酸配列分析のためのシステムは、データ分析ユニットを含むことができる。データ分析ユニットは、配列決定機器から断片配列を取得し、参照配列を取得し、断片配列の近接する部分を選択し、および参照配列に対して近接部分の少なくとも1つのマッチを生成する近似鎖マッピング法を用いて、断片配列の近接部分を参照配列にマッピングするように設計することができる。
本明細書において使用される「実質的に」は、所期の目的のために作動するのに十分なことを意味する。このため、「実質的に」という用語は、当業者によって予想され得るが、総合的な成績に感知できるほどに影響を及ぼさないような、絶対的なまたは完全な状態、寸法、測定、結果などからの軽微な、重大でない変動を許容する。数値または数値として表すことができるパラメータもしくは特徴に関して使用される場合、「実質的に」は、10%以内を意味する。
「ones」という用語は、1を超えるを意味する。
本明細書において使用される「複数」という用語は、2、3、4、5、6、7、8、9、10またはそれを超えるであり得る。
本明細書において使用される「細胞」という用語は、「生物の細胞」という用語と互換的に使用される。生物の細胞の非限定的な例には、真核生物細胞、植物細胞、哺乳動物細胞、爬虫類細胞、鳥類細胞、魚類細胞などの動物細胞、原核生物細胞、細菌細胞、真菌細胞、原生動物細胞など、筋肉、軟骨、脂肪、皮膚、肝臓、肺、神経組織などの組織から解離された細胞、T細胞、B細胞、ナチュラルキラー細胞、マクロファージなどの免疫学的細胞、胚(例えば、接合体)、卵母細胞、卵子、精子細胞、ハイブリドーマ、培養された細胞、細胞株からの細胞、癌細胞、感染された細胞、形質移入および/または形質転換された細胞、レポーター細胞などが含まれる。哺乳動物細胞は、例えば、ヒト、マウス、ラット、ウマ、ヤギ、ヒツジ、ウシ、霊長類などからのものであり得る。
図1は、本開示のいくつかの実施形態にしたがう、胚の非侵襲性移植前遺伝子スクリーニングに対するワークフロー100を例示する。ここに図示されているように、IVF移植のための胚候補104は、胚のプールから単離され、遺伝子スクリーニング分析を妨害し得るDNA106またはその他のポリヌクレオチドを実質的に含まない培地を含む試料ホルダー中で、ある期間インキュベートすることができる。試料ホルダーのいくつかの例には、試験管、ピペットチューブ、ペトリ皿または複数区画/ウェルプレート内のウェル/区画が含まれ得るが、これらに限定されない。様々な実施形態において、実質的に一定の容量の培地を試料ホルダー中に維持するために、試料ホルダーへの連続的培地供給ラインを用いて「新鮮な」培養培地106が導入され、「古い」培養培地106が試料ホルダーから継続的に除去される(および採取される)継続的培養系中で、胚候補104をインキュベートすることもできる。
インキュベートの間に、ゲノム断片は、DNAを含まない周囲の培地中へ、定期的に、胚によって分泌され、および/または胚から流出される。このワークフローにおいて使用することができる、DNAを含まない培地の例は、The Cooper CompaniesのORIGIO SEQUENTIAL BLAST(商標)培養培地である。いくつかの実施形態において、胚は、最低約18時間、培養培地中でインキュベートすることができる。他の実施形態において、胚は、約18時間〜約144時間、培養培地中でインキュベートすることができる。ワークフロー100を用いた遺伝子スクリーニング分析を実行できるようにするために、十分な量のゲノム断片が胚によって分泌され、および/または胚から流出されるのに必要される長さの期間、DNAを含まない培地中で胚をインキュベートすることができることが理解されるべきである。いくつかの実施形態において、胚が単離され、DNAを含まない培地中でインキュベートされるときに、胚は発育の胚盤胞段階にある。他の実施形態において、胚が単離され、DNAを含まない培地中でインキュベートされるときに、胚は、発育の多細胞前胚盤胞段階にある。
閾値量のゲノム断片がDNAを含まない培地中に分泌されまたは流出され得るのに必要な期間、胚がインキュベートされた後には、インキュベート培地の一部が別個の増幅容器に移され、増幅容器において、断片は、その後のゲノム配列分析用の短いゲノム断片を増幅するために特別に作られた増幅プロトコール108を経る。いくつかの実施形態において、増幅プロトコール108は、多重置換増幅(MDA(multiple displacement amplification))をベースとする全ゲノム増幅(WGA(whole genome amplification))技術を使用する。MDAは、少量のDNAを増幅する上で効率的であることが示されている非PCRベースのDNA増幅技術である。MDAは、ランダムなプライマーを用いた標的DNAのプライミングおよび所定の試料中の実質的に全DNAを増幅するための鎖置換φ29ポリメラーゼ(またはそれと同等のもの)の使用に依存する。PCRをベースとしたWGA法と比べて、MDAは、何桁も増幅バイアスを低減し、より長いゲノム断片を生成し、より良好なゲノムのカバー範囲を示す。他の実施形態において、増幅プロトコール108は、複数アニーリングとルーピングをベースとする増幅サイクル(MALBAC(multiple annealing and looping−based amplification cycle))をベースとするWGA技術を使用する。MALBAC増幅技術は、アンプリコンが相補的な末端を有し、したがって、ループを形成して、DNAが指数関数的に複製されないようにする特殊なプライマーを使用する。これは、元のゲノムDNAのみの増幅をもたらす。その結果、この調節された増幅は、増幅バイアスを低下させることができ、その延長として、人為産物の産生を低下させることができ、単離された胚候補に対する偽陽性および偽陰性変異コールの発生率を低下させることができる。
しかしながら、当該技術が、ワークフロー100を用いて実行されるべき遺伝子スクリーニング分析のために配列決定されるのに十分な品質および/または量のゲノム断片を生成する限り、あらゆる種類のWGA技術を増幅プロトコール108において使用できることが理解されるべきである。
(単離された胚104からの)ゲノム断片が十分な量まで増幅された後、ゲノム断片はNGSまたは同等なゲノム配列決定システムを用いて配列決定される110。配列決定ワークフローは、何百、何千または何百万の核酸配列読み取りデータ(すなわち、配列読み取りデータ)を与えるために核酸配列決定装置上で断片が配列決定される110ことから開始することができる。参照ゲノムに対してゲノム断片配列がアラインされ(マッピングされ)114、胚104のゲノム中に存在する1またはそれを超えるゲノムの特徴116を識別するのを補助するために、1またはそれを超える二次的分析ツール/パイプラインが使用されるゲノムデータ分析パイプライン112を用いて、次いで、ゲノム断片配列情報は処理されることができる。いくつかの実施形態において、ゲノムの特徴116は、挿入/欠失(INDEL)、コピー数変動(CNV)、一塩基多型(SNP)、重複、反転、転座などのゲノムバリアントであり得る。他の実施形態において、ゲノムの特徴116は、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなどの何らかの注釈付けられた機能を有するゲノム領域であり得る。さらに別の実施形態において、ゲノムの特徴116は、遺伝子発現および活性に影響を及ぼすことができる、ゲノム上の後成的変化(例えば、メチル化、アセチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、シトルリン化など)であり得る。
いくつかの実施形態において、参照ゲノムはヒトゲノムである。他の実施形態において、参照ゲノムは、胚が由来する動物種のゲノムである。しかしながら、参照ゲノムは、いずれの具体的な動物種とも関連しないが、特定の分析/用途のために作製されている、人工的に作製されたゲノムであり得ることが理解されるべきである。
ゲノムの特徴116が識別された後、分析パイプライン112は、単離胚104が有するまたはそのリスクがある遺伝性のまたは非遺伝性の遺伝子状態に関する情報を提供する遺伝子診断報告118を生成することができる。
様々な実施形態において、「ブランク」または対照試料が、ワークフロー100全体を通じて、胚候補104と並べて実行される。すなわち、(胚104をインキュベートするために使用されなかった)DNAを含まない培地の一部は、ワークフロー100の全ての工程および過程を通じて実行される。ブランク試料を分析することから得られた結果は、胚のゲノム中に識別されたゲノムの特徴が配列決定の際の増幅および/または体系的誤差(systemic error)の人為的結果でないことを確保するための対照として役割を果たすことができる。
図2は、本開示のいくつかの実施形態にしたがう、短いゲノム断片を増幅するための増幅プロトコール200を図示する例示的なフローチャートである。
ここに図示されているように、(胚をインキュベートしている培地の一部中の)ゲノム断片202は、連結された断片208の形成を触媒する条件で、酵素204およびゲノムリンカーセグメント206と組み合わされる。ライゲーション反応は、約16〜18時間(一晩のインキュベート)、(撹拌せずに)室温で実施される。ライゲーション反応混合物は、約7.5のpHおよび約20℃の温度〜約25℃の温度で、50mM Tris HCl、10mM MgCl、1mM ATPおよび10mM DTTを含む緩衝液中に1ユニットのDNAリガーゼからなる。得られた連結された断片208は元のゲノム断片202より長く、これは、プロトコール200でゲノム断片が後に増幅されるときに、(ゲノム断片202を個別に増幅することと比較すると)増幅エラーを低減するのに役立つ。
連結は、多重置換増幅によってDNAを等温性に増幅する、φ29酵素を用いた増幅に最適である長い鋳型(すなわち、連結された断片)を与えることができる。φ29酵素は、短い断片(すなわち、約30塩基対より短いアンプリコン)を効率的におよび/または正確に増幅することができず、このことは、検証実験において実証されており、このため、胚によって培養培地中に押出されたDNAの短い断片の全体を捕捉するために、我々は長い連結された断片を作製することが妥当である。さらに、連結は、Sureplexシステム(Illumina)、MALBACおよびDOP PCRなどのその他の全ゲノム増幅戦略によって首尾よく増幅するために十分な鋳型を作製する上でも役立つ。増幅の誤りのこの低下は、短いゲノム断片にとって特に重要である。一般に、増幅の誤りを減らすことは、ゲノム断片が後に配列決定され、分析されるときに、ゲノムの特徴の識別の正確性を向上させる。いくつかの実施形態において、ゲノム断片は、約30塩基対(bp)〜約800bpの長さを有する短いゲノム断片である。他の実施形態において、ゲノム断片は、約150bp〜約400bpの長さを有する短いゲノム断片である。さらに他の実施形態において、ゲノム断片は、約1000bp未満の長さを有する短いゲノム断片である。
ゲノムリンカーセグメント206は、既知の長さおよびヌクレオチド配列の、本質的に人工的に作製された二本鎖「結合した」オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメント206は、約30〜1000bpの長さである。他の実施形態において、ゲノムリンカーセグメント206は、約30bp〜約500bpの長さである。さらに他の実施形態において、ゲノムリンカーセグメント206は、約50bp〜約150bpである。いくつかの実施形態において、ゲノムリンカーセグメント206は、ホモポリマーオリゴヌクレオチドセグメントである。他の実施形態において、ゲノムリンカーセグメント206は、ヘテロポリマーオリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメント206は、平滑末端化された二本鎖オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノム断片202は、ゲノムリンカーセグメント206に連結される前に、酵素的に平滑末端化される。
ゲノムリンカーセグメント206にゲノム断片202を連結して、連結されたゲノム断片208を形成するために、原核生物および真核生物の酵素(すなわち、リガーゼ)の様々な種類を使用することができる。ここで使用することができるリガーゼのいくつかの例には、T3、T4、T7またはリガーゼ1が含まれるがこれらに限定されない。
連結された断片がそれらの容器(例えば、ウェル、ピペットチューブなど)中で形成された後に、連結された断片は、MDA、MALBACなどのWGA技術を用いて、サーマルサイクラー(または類似の装置)上で増幅210することができる。
図3は、本開示のいくつかの実施形態にしたがう、連結された断片の形成を例示する。ここに図示されているように、ゲノムリンカーセグメント308の導入および連結された断片312を形成するためのリガーゼ310を用いたゲノムリンカーセグメント308のライゲーションの前に、3’または5’オーバーハング(すなわち、対形成していないヌクレオチド)306を充填または除去するために、まず、ゲノム断片302は、平滑末端化酵素を用いて平滑末端化される。すなわち、使用される平滑末端化酵素は、オーバーハングを消化する(除去する)ためのエキソヌクレアーゼ活性を示し、またはオーバーハング上の欠落した相補的塩基を合成する(充填する)ためのポリメラーゼ活性を示すことができる。使用することができる平滑末端化酵素のいくつかの例には、DNAポリメラーゼIクレノウ断片、T4DNAポリメラーゼおよびマングビーンヌクレアーゼが含まれるが、これらに限定されない。例示的な実施形態において、dsDNAの連結された断片を平滑末端化するために使用される平滑末端化試薬混合物は、(3’−>5’エキソヌクレアーゼ活性および5’−>3’ポリメラーゼ活性を有する)T4DNAポリメラーゼおよび(その後のライゲーション反応のために必要な、平滑末端化されたDNAの5’末端のリン酸化を補助する)T4ポリヌクレオチドキナーゼを含む。
ゲノム断片302の5’および3’末端を平滑末端化306した後、ゲノム断片302をゲノムリンカーセグメント308に連結するために、DNAリガーゼを導入することができる。ライゲーション310の間、リガーゼ−アデニレートおよびDNA−アデニレート中間体を伴うヌクレオチジル転移工程を介して、DNAリガーゼは5’および3’ポリヌクレオチド末端を塞ぐ。DNAリガーゼは、ATP依存性DNAリガーゼ(EC6.5.1.1)およびNAD(+)依存性DNAリガーゼ(EC6.5.1.2)という2つの一般的なカテゴリーに属する。NAD(+)依存性DNAリガーゼは細菌(およびいくつかのウイルス)中のみに見出されるのに対して、ATP依存性DNAリガーゼは遍在している。
ATP依存性DNAリガーゼは、DNAリガーゼI、II、IIIおよびIVという4つのクラスに分類することができる。DNAリガーゼIは、DNAの連続鎖を形成するために岡崎断片を連結し、DNAリガーゼIIは分裂していない細胞中のみに見出される、DNAリガーゼIIIの選択的にスプライシングされた形態であり、DNAリガーゼIIIは塩基除去修復に関与し、DNAリガーゼIVは、非相同末端結合(NHEJ)によるDNA二本鎖切断の修復に関与する。全てのリガーゼのうち、平滑末端化された二本鎖DNAライゲーションを促進するのにとりわけ非常に適している2種類の原核生物のリガーゼおよび1種類の真核生物のリガーゼ:原核生物のDNAリガーゼ(T3およびT4)および真核生物のDNAリガーゼ(リガーゼ1)が存在する。
いくつかの実施形態において、T4DNAリガーゼは、このプロトコールために、平滑末端ライゲーション過程310において使用される。バクテリオファージT4DNAリガーゼは、ATPをエネルギー源として必要とする、約68,000ダルトンの分子量を有する単一のポリペプチドである。最大活性pH範囲は、約7.5〜約8.0である。Mg++イオンの存在が好ましく、最適な濃度は約10mMである。T4DNAリガーゼは、粘着および平滑末端化された断片を連結する特有の能力を有する。T4DNAリガーゼは、1)ATPとの反応による酵素−アデニリレート形成、2)アデニリル化されたDNAを生成するための5リン酸化されたポリヌクレオチドへのアデニリル転移および3)AMPの放出を伴うホスホジエステル結合形成という3段階で、ゲノム断片302およびゲノムリンカーセグメント308中の並置された5’および3’末端間のホスホジエステル結合形成を触媒する。例示的な実施形態において、ライゲーション反応は、約7.5のpHおよび約23℃の温度で、50mM Tris HCl、10mM MgCl、1mM ATPおよび10mM DTTからなる緩衝液中の1ユニットのT4DNAリガーゼを用いて実施することができる。T4リガーゼ、平滑末端化されたDNAおよびリンカーセグメントを含む反応混合物は、撹拌なしに、16〜18時間インキュベートすることができる。リンカーセグメントの濃度は、約1pg〜約1ngの範囲とすることができる。
ゲノム断片302がゲノムリンカーセグメント308に連結されたら、連結された断片312が形成する。いくつかの実施形態において、連結された断片312は、少なくとも1つのゲノムリンカーセグメント308に連結されている少なくとも1つのゲノム断片302を含む。他の実施形態において、連結された断片312は、2つまたはそれを超えるゲノム断片302および少なくとも1つのゲノムリンカーセグメント308を含み、これにより、少なくとも1つのゲノム断片302は、ゲノムリンカーセグメント308の各末端に連結される。しかしながら、連結された断片312は、組み合わせが配列決定およびそれに続くゲノムの特徴の分析という目的に適している限り、ゲノム断片312とゲノムリンカーセグメント308の本質的にあらゆる組み合わせを有することができることが理解されるべきである。
連結された断片312の形成後、連結された断片312は、(PicoPlex、MDA、MALBAC、DOPlifyなどの)WGA増幅技術313を用いて増幅され、続いて、NGS(または同等の)ゲノム配列決定システム316を用いて配列決定される。
コンピュータ装備されたシステム
図4は、本教示の実施形態が実装され得る、コンピュータシステム400を例示するブロック図である。本教示の様々な実施形態において、コンピュータシステム400は、バス402または情報を通信するための他の通信機構と、情報を処理するための、バス402と連結されたプロセッサ404とを含むことができる。様々な実施形態において、コンピュータシステム400は、プロセッサ404によって実行されるべき指示を決定するための、バス402に連結された、ランダムアクセスメモリ(RAM)406またはその他の動的記憶装置とすることができるメモリを含むこともできる。プロセッサ404によって実行されるべき指示の実行中の一時的変数またはその他の中間情報を保存するために、メモリを使用することもできる。様々な実施形態において、コンピュータシステム400は、プロセッサ404に対する静的情報および指示を保存するための、バス402に連結されたリードオンリーメモリ(ROM)408またはその他の静的記憶装置をさらに含むことができる。情報および指示を保存するために、磁気ディスクまたは光ディスクなどの記憶装置410が供され、バス402に連結されることができる。
様々な実施形態において、コンピュータシステム400は、コンピュータユーザに情報を表示するために、バス402を介して、陰極線管(CRT(cathode ray tube))または液晶ディスプレイ(LCD(liquid crystal display))などのディスプレイ412に連結することができる。プロセッサ404に情報および命令選択を通信するために、英数字およびその他のキーを含む入力装置414をバス402に連結することができる。別の種類のユーザ入力装置は、プロセッサ404に指示情報および命令選択を通信するためのおよびディスプレイ412上でのカーソルの動きを調節するための、マウス、トラックボールまたはカーソル指示キーなどのカーソルコントロール416である。この入力装置414は、典型的には、装置が平面中の位置を識別することを可能にする第一の軸(すなわち、x)および第二の軸(すなわち、y)という2つの軸に2つの自由度を有する。しかしながら、3次元の(x、yおよびz)カーソルの動きを可能にする入力装置414も本明細書において想定されることが理解されるべきである。
本教示のある種の実施と合致して、メモリ406中に含まれる1つまたはそれを超える指示の1つまたはそれを超える列を実行しているプロセッサ404に応答して、結果はコンピュータシステム400によって与えられることができる。このような指示は、記憶装置410などの、別のコンピュータ読み取り可能な媒体またはコンピュータ読み取り可能な記憶媒体からメモリ406中に読み取られることができる。メモリ406中に含まれる指示の列の実行は、プロセッサ404に本明細書に記載された過程を実行させることができる。あるいは、本教示を実施するためのソフトウェア指示に代えてまたはソフトウェア指示と組み合わせて、配線によって接続された回路を使用することができる。このため、本教示の実施は、ハードウェア回路とソフトウェア回路のいずれかの特定の組み合わせに限定されない。
本明細書において使用される「コンピュータ読み取り可能な媒体」(例えば、データ保存、データストレージなど)または「コンピュータ読み取り可能な記憶媒体」という用語は、実行のためにプロセッサ404に指示を与えることに関与するあらゆる媒体を表す。このような媒体は、不揮発性媒体、揮発性媒体および伝送媒体を含むがこれらに限定されない、多くの形態を取ることができる。不揮発性媒体の例には、記憶装置410などの、光、ソリッドステート、磁気ディスクが含まれ得るが、これらに限定されない。揮発性媒体の例には、メモリ406などの動的メモリが含まれ得るが、これらに限定されない。伝送媒体の例には、バス402を備えるワイヤなど、同軸ケーブル、銅線および光ファイバーが含まれ得るが、これらに限定されない。
コンピュータ読み取り可能な媒体の一般的な形態には、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、またはあらゆる他の磁気媒体、CD−ROM、あらゆる他の光学媒体、パンチカード、穿孔テープ、穴のパターンを有するいずれかの他の物理的媒体、RAM、PROMおよびEPROM、FLASH(登録商標)−EPROM、あらゆる他のメモリチップもしくはメモリカートリッジまたはコンピュータがそこから読み取ることができるあらゆる他の有形媒体が含まれる。
コンピュータ読み取り可能な媒体に加えて、実行のためにコンピュータシステム400のプロセッサ404に1またはそれを超える指示の列を与えるために、通信装置またはシステム中に含まれる伝送媒体上の信号として、指示またはデータを与えることができる。例えば、通信装置は、指示およびデータを示す信号を有するトランシーバーを含み得る。指示およびデータは、1またはそれを超えるプロセッサに本明細書中の開示に概説された機能を実施させるように構成される。データ通信伝送接続の代表的な例には、電話モデム接続、広域ネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続などが含まれ得るが、これらに限定されない。
本明細書に記載されている方法、フローチャート、図表および付随する開示は、スタンドアロン機器として、またはクラウドコンピューティングネットワークのような共有されたコンピュータ処理リソースの分散型ネットワーク上で、コンピュータシステム400を用いて実施することができることを理解すべきである。
図5は、様々な実施形態にしたがう、胚500の非侵襲性移植前遺伝子スクリーニングのためのシステムの模式図である。ここに図示されているように、システム500は、ゲノム配列決定システム502と、演算装置504と、ディスプレイ/クライアントターミナル510とを含む。
様々な実施形態において、演算装置504は、「配線接続」物理的ネットワーク接続(例えば、インターネット、LAN、WAN、VPNなど)またはワイヤレスネットワーク接続(例えば、Wi−Fi、WLANなど)のいずれかであり得るネットワーク接続を介して、ゲノム配列決定システム502に通信可能に接続され得る。様々な実施形態において、演算装置504は、ワークステーション、大型汎用コンピュータ、分散型コンピューティングノード(「クラウドコンピューティング」または分散型ネットワーキングシステムの一部)、パーソナルコンピュータ、モバイル機器などであり得る。様々な実施形態において、ゲノム配列決定システム504は、核酸配列決定装置(例えば、NGS、キャピラリー電気泳動システムなど)、リアルタイム/デジタル/定量的PCR機器、マイクロアレイスキャナなどであり得る。しかしながら、ゲノム配列決定システム504は、ゲノム断片を含む試料から核酸配列データを生成することができる本質的にあらゆる種類の機器であり得ることが理解されるべきである。
ゲノム配列決定システム502の様々な実施形態は、ライゲーションをベースとする方法、合成による配列決定、単一分子法、ナノポア配列決定およびその他の配列決定技術を含む様々な配列決定法を実施するために使用することができることが、当業者によって理解されるであろう。ライゲーション配列決定は、単一のライゲーション技術を含むことができ、または単一の一次核酸配列鎖上の配列中で複数のライゲーションが行われるライゲーション技術を変えることができる。合成による配列決定には、色素標識されたヌクレオチドの取り込み、鎖終結、イオン/プロトン配列決定、ピロリン酸配列決定などが含まれ得る。単一分子技術には、配列決定反応を停止もしくは遅延させる必要なしに、取り込みの間に核の種類の正体が決定される連続的配列決定、または取り込まれたヌクレオチドの正体を決定するために配列決定反応が停止される交互配列が含まれ得る。
様々な実施形態において、ゲノム配列決定システム502は、ポリヌクレオチドまたはオリゴヌクレオチドなどの核酸の配列を決定することができる。核酸は、DNAまたはRNAを含むことができ、ssDNAおよびRNAなどの一本鎖であり得、またはdsDNAもしくはRNA/cDNA対などの二本鎖であり得る。様々な実施形態において、核酸は、断片ライブラリー、メイトペアライブラリー、クロマチン免疫沈降(ChIP)断片などを含むことができ、またはこれらに由来することができる。特定の実施形態において、ゲノム配列決定機器502は、単一の核酸分子からまたは実質的に同一の核酸分子の群から配列情報を取得することができる。
様々な実施形態において、ゲノム配列決定システム502は、.fasta、.csfasta、.xsq、seq.txt、qseq.txt、.fastq、.sff、prb.txt、.sms、srsおよび/または.qvを含むが、これらに限定されない様々な異なる出力データファイル形式/フォーマットで核酸配列決定読み取りデータデータ(ゲノム配列情報)を出力することができる。
分析演算装置504は、配列読み取りデータアラインメントエンジン506およびゲノムの特徴識別エンジン508を収容するように構成されることができる。読み取りデータアラインメントエンジン506は、ゲノム配列システム502によって生成されたゲノム断片配列情報を受領し、ゲノム断片配列を参照ゲノムにアラインする(マッピングする)ように設計することができる。断片配列をアラインするために使用することができる公に利用可能な配列アラインソフトウェアの例には、BLAT、BLAST、Bowtie、BWA、drFAST LAST、MOSAIK、NEXTGENMAPなどが含まれる。断片配列がアラインされたら、ゲノムの特徴識別エンジン508は、アラインされた配列上のゲノムの特徴を識別するように設計することができる。すなわち、ゲノムの特徴識別エンジン508は、アラインされた配列中のゲノムの特徴を識別するために、様々な公的(例えば、RefGeneデータベース(UCSC)、Alternative Splicingデータベース(EBI)、dbSNPデータベース(NCBI)、Genomic Structural Variationデータベース(NCBI)、GENCODEデータベース(UCSC)、PolyPhenデータベース(ハーバード)、SIFTデータベース(NCBI)、3000 Genomes Projectデータベース、Database of Genomic Variantsデータベース(EBI)、Biomartデータベース(EBI)、Gene Ontologyデータベース(公共)、BioCyc/HumanCycデータベース、KEGGパスウェイデータベース、Reactomeデータベース、Pathway Interactionデータベース(NIH)、Biocartaデータベース、PANTHERデータベースなど)および私的なデータベースに通信可能に接続(例えば、分析演算装置504へのネットワーク接続、分析演算装置504に対してローカルであるデータベースストレージへのシリアルバス接続、分析演算装置504に接続された周辺記憶装置への周辺機器接続など)することができる。
いくつかの実施形態において、ゲノムの特徴は、挿入/欠失(INDEL)、コピー数変動(CNV)、一塩基多型(SNP)、重複、反転、転座などのゲノムバリアントであり得る。他の実施形態において、ゲノムの特徴は、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなどの何らかの注釈付けられた機能を有するゲノム領域であり得る。さらに別の実施形態において、ゲノムの特徴は、遺伝子発現および活性に影響を及ぼすことができる、ゲノム上の後成的変化(例えば、メチル化、アセチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、シトルリン化など)であり得る。
読み取りデータアラインメントエンジン506およびゲノムの特徴識別エンジン508の機能は、ハードウェア、ファームウェア、ソフトウェアまたはこれらのあらゆる組み合わせとして実施され得ることを理解すべきである。さらに、図5に図示されている様々なエンジンは、具体的なアプリケーションまたはシステム構造の要求に応じて、単一のエンジン、コンポーネントまたはモジュールへ統合し、またはまとめることができる。さらに、様々な実施形態において、読み取りデータアラインメントエンジン506およびゲノムの特徴識別エンジン508は、具体的なアプリケーションまたはシステム構造によって必要とされる場合、さらなるエンジンまたはコンポーネントを含むことができる。
ゲノムの特徴が識別された後、結果は、演算装置504に通信可能に接続されたディスプレイまたはクライアントターミナル510上に表示され得る。様々な実施形態において、クライアントターミナル510は、シン・クライアント演算装置であり得る。様々な実施形態において、クライアントターミナル510は、配列アラインメントエンジン506および/またはゲノムの特徴識別エンジン508の動作を調節するために使用することができるウェブブラウザ(例えば、INTERNET EXPLORER(商標)、FIREFOX(商標)、SAFARI(商標)など)を有するパーソナル演算装置であり得る。すなわち、クライアントターミナル510は、配列アラインメントエンジン506の動作を調節するためのブラウザを用いて、配列アラインメントエンジン506にアクセスすることができる。例えば、具体的なアプリケーションの要求に応じて、配列アライン基準またはロジックは修正することができる。同様に、クライアントターミナル510は、アラインされた配列中のゲノムの特徴を識別し、または生成された要約報告を修正するために使用されるデータベース源(例えば、RefGeneデータベース(UCSC)、Alternative Splicingデータベース(EBI)、dbSNPデータベース(NCBI)、Genomic Structural Variationデータベース(NCBI)、GENCODEデータベース(UCSC)、PolyPhenデータベース(ハーバード)、SIFTデータベース(NCBI)、3000 Genomes Projectデータベース、Database of Genomic Variantsデータベース(EBI)、Biomartデータベース(EBI)、Gene Ontologyデータベース(公共)、BioCyc/HumanCycデータベース、KEGGパスウェイデータベース、Reactomeデータベース、Pathway Interactionデータベース(NIH)、Biocartaデータベース、PANTHERデータベースなど)を調節するためのブラウザを用いて、ゲノムの特徴識別エンジン508にアクセスすることができる。
図6は、様々な実施形態にしたがい、連結された断片読み取りデータを参照ゲノムにマッピングされる方法の図示である。先述されているように、連結された断片は、候補胚が(その中でインキュベートされた培地中に)分泌または流出させたゲノム断片と既知の長さおよびヌクレオチド(塩基)配列の人工的に作製された二本鎖「結合した(conjoint)」オリゴヌクレオチドセグメント(すなわち、ゲノムリンカーセグメント)の両方から構成される。したがって、図6に図示されているように、連結された断片読み取りデータ602は、人工的に合成されたゲノムリンカーセグメント604と胚試験培地から得られるゲノム断片606の両方の配列読み取りデータから構成される。
BLAT、BLAST、BWA、Bowtie、drFAST LAST、MOSAIK、NEXTGENMAPなどが含まれるが、これらに限定されないあらゆる数の公的に利用な配列アライメントツールを用いて、連結された断片読み取りデータ602は、参照ゲノム610にアラインされる(マッピングされる)608。いくつかの実施形態において、配列アライメントツールのパラメータは、短い断片配列読み取りデータアラインを収容するように修正される。いくつかの実施形態において、短いゲノム断片読み取りデータは、約30塩基対(bp)〜約800bpの長さを有する。他の実施形態において、短いゲノム断片読み取りデータは、約150bp〜約400bpの長さを有する。さらに他の実施形態において、短いゲノム断片読み取りデータは、約1000bp未満の長さを有する。
いくつかの実施形態において、ゲノムリンカーセグメント配列読み取りデータは、約30〜1000bpの長さである。他の実施形態において、ゲノムリンカーセグメント配列読み取りデータは、約30bp〜約500bpの長さである。さらに他の実施形態において、ゲノムリンカーセグメント配列読み取りデータは、約50bp〜約150bpである。いくつかの実施形態において、ゲノムリンカーセグメント配列読み取りデータは、ホモポリマー配列である。他の実施形態において、ゲノムリンカーセグメント配列読み取りデータは、ヘテロポリマーオリゴヌクレオチド配列である。
いくつかの実施形態において、ゲノムリンカーセグメント配列読み取りデータは天然に存在しないので、参照ゲノムへの連結された断片読み取りデータのアライン中に、アルゴリズムによって除去される。すなわち、アライメントツールは、ゲノムリンカーセグメントと関連する既知の配列を差し引き、連結された断片読み取りデータのゲノム断片部分と関連する配列を参照ゲノムにアラインするに過ぎない。
いくつかの実施形態において、アライメントツールは、各ゲノム断片配列読み取りデータに対して参照ゲノム上の最長の合致するアライン位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインを選択する。すなわち、ゲノム断片配列読み取りデータ上の塩基の最長の連続する配列が参照ゲノムに合致するアライン場所。他の実施形態において、アライメントツールは、連続的であるか否かに関わらず、ゲノム断片配列読み取りデータからの塩基の最大数が合致する参照ゲノム上の位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインを選択する。
いくつかの実施形態において、参照ゲノム上の複数の場所に等しく良好にアラインするゲノム断片配列読み取りデータ情報は自動的に捨てられ、ゲノムの特徴(例えば、SNP、CNV、インデルなど)の識別には使用されない。
図7は、様々な実施形態にしたがい、ゲノムの特徴の様々な種類を識別するために、連結されたゲノム断片配列読み取りデータをアラインするための方法を示す例示的なフローチャートである。ここに図示されているように、連結されたゲノム断片配列読み取りデータ702は、まず、参照ゲノム704にアラインされる。BLAT、BLAST、BWA、Bowtie、drFAST LAST、MOSAIK、NEXTGENMAPなどが含まれるが、これらに限定されないあらゆる数の公に利用可能な配列アライメントツールを用いて、アラインが為される。上述されているように、連結されたゲノム断片読み取りデータは、人工的に合成されたゲノムリンカーセグメントと検査試料(例えば、組織、胚など)から得られたゲノム断片の両方の配列読み取りデータである。
いくつかの実施形態において、ゲノムリンカーセグメントは(ヒトゲノム中に)天然に存在しないので、参照ゲノムへの連結された断片読み取りデータのアライン中に、アルゴリズムによって除去される。すなわち、アライメントツールは、ゲノムリンカーセグメントと関連する既知の配列を差し引き、連結された断片読み取りデータのゲノム断片部分と関連する配列を参照ゲノムにアラインするに過ぎない。
アライメントツールは、アラインスコアおよびゲノム断片読み取りデータに対して複数のアラインが存在するかどうかを含むがこれらに限定されない一組のパラメータまたは因子706に基づいて、各ゲノム断片配列読み取りデータに対する最良のアラインを選択する。いくつかの実施形態において、ゲノム断面読み取りデータアラインに対するアラインスコアは、マッチ基準(例えば、参照ゲノムに合致するゲノム断片配列読み取りデータの連続する多数の塩基、参照ゲノムに合致するゲノム断片配列読み取りデータからの塩基の絶対数、配列間のパーセント配列同一性およびゲノム中でのその合致など)、ミスマッチ基準およびギャップペナルティの関数として、(式1を用いて)計算することができる。式1の構成物のうち、アライン中のミスマッチおよびギャップは、総アラインスコアからペナルティを課される。
式1:アラインスコア=f(マッチ基準)−f(ミスマッチ基準)−f(ギャップペナルティ)
いくつかの実施形態において、参照ゲノム上の複数の場所に等しく良好にアラインする(例えば、同じアラインスコアを有するなど)ゲノム断片配列読み取りデータは自動的に捨てられ、ゲノムの特徴の識別には使用されない。
ゲノム断片配列読み取りデータ702が参照ゲノムにアラインされた後、アラインされた配列708上のゲノムの特徴を識別するために、様々な分析ツールまたはコーラーを使用することができる。様々な実施形態において、これらのツールまたはコーラーは、ゲノムの特徴を識別するために、様々な公的な(例えば、RefGeneデータベース(UCSC)、Alternative Splicingデータベース(EBI)、dbSNPデータベース(NCBI)、Genomic Structural Variationデータベース(NCBI)、GENCODEデータベース(UCSC)、PolyPhenデータベース(ハーバード)、SIFTデータベース(NCBI)、3000 Genomes Projectデータベース、Database of Genomic Variantsデータベース(EBI)、Biomartデータベース(EBI)、Gene Ontologyデータベース(公共)、BioCyc/HumanCycデータベース、KEGGパスウェイデータベース、Reactomeデータベース、Pathway Interactionデータベース(NIH)、Biocartaデータベース、PANTHERデータベースなど)および/または私的なデータベースにアクセスするように設計することができる。
いくつかの実施形態において、ゲノムの特徴は、挿入/欠失(INDEL)、コピー数変動(CNV)、一塩基多型(SNP)、重複、反転、転座などのゲノムバリアントであり得る。他の実施形態において、ゲノムの特徴は、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなどの何らかの注釈付けられた機能を有するゲノム領域であり得る。さらに別の実施形態において、ゲノムの特徴は、遺伝子発現および活性に影響を及ぼすことができる、ゲノム上の後成的変化(例えば、メチル化、アセチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、シトルリン化など)であり得る。
様々な実施形態において、SNPは、ハプロタイプ710の局所的デノボアセンブリ(de−novo assembly)を介して呼び出すことができる。様々な実施形態において、異数性(aneuploiday)は、異数性コーラー714を用いて呼び出すことができる。様々な実施形態において、コピー数バリアントCNV(Copy Number Variant))は、修正されたCNVコーラー712を用いて識別することができる。修正されたCNVコーラーは、正常な試料に対する標準化によって、生物的変動と技術的変動を識別するように設計することができる。技術的変動は、技術におけるバイアスに起因して起こり得る、例えば、ゲノム中のいくつかの領域は、高GC含量バイアス(すなわち、領域中のGおよびC塩基の割合ならびに領域にマッピングされる断片の数)、増幅バイアス、リンカーライゲーションなどのために、配列決定されたときにより多いまたはより少ない読み取りデータを有することができ、そのため、本当のCNV欠失または重複でなく、単に実験上の人為現象である。他方、生物学的変動は、ゲノム中の実際のCNV欠失/重複によるものである。例えば、検査されている試料(例えば、組織、胚など)のゲノム領域(すなわち、染色体上の位置)がCNV欠失を有する場合、その領域中により少ない読み取りデータを有し、ゲノムがCNV重複を有する場合、その領域中により多くの読み取りデータを有することを意味する。様々な実施形態において、技術的変動からのバイアスを除去し、「本当の」生物学的変動を「偽の」技術的変動と識別することを可能にするために、サーキュラー・バイナリー・セグメンテーション(CBS)をベースとするアルゴリズムが適用され、内挿された一変量平滑化モデルを用いてスプライン標準化が行われる。
すなわち、ある試料の領域を以前に検査された全ての他の試料と比較するために、標準化が行われる。技術的変動が存在すれば、試料検査バッチ内の全ての試料(すなわち、増幅および配列決定ワークフロー工程を一緒に通過する試料)に影響を及ぼし、試料のバッチ内の1つの試料だけに影響を及ぼすのではないという論理である。試料が、同じ試料バッチの他の試料中にも見られる、領域中の読み取りデータの量の低下を示す場合には、技術的変動であったと結論付けるのが安全である。しかしながら、低下が、試料バッチ中のある試料中でのみ見られ、同じ試料バッチ中の別の試料中では見られない場合には、生物学的変動である可能性が極めて高い。この比較は、全ての試料が同一の尺度に標準化されている場合にのみ行うことができる。これを行うために、目的の遺伝子領域は、通例、約100bpの多くの小さな区間に分割され、各領域に対して、試料の平均深度(すなわち、アラインされた読み取りデータの量)が計算される。個別の区間が変動を示すとしても、各領域中の著しい変動のみが検出可能であるようにより小さな誤差を除去するように、スプライン標準化が領域に対する円滑化を行った。次いで、主成分分析(PCA)などの技法を用いて有意性を測定することによって、CNVを識別することができる。
様々な実施形態において、CBSアルゴリズムは、試料中のCNVに対して、開始および終了位置を識別するように構成されている。すなわち、CBSアルゴリズムは、試料を通じて複数のパスを実行し、第一のパスでは、アルゴリズムは、試料全体を検索し、読み取りデータ深度の統計的に有意な変化が起こったと思われる(開始、終了)位置タプルのリストを編纂する。これらのタプルのうち、最も劇的な変化を含むタプルがCNVとして識別され、次いで、このタプルの両側の試料2個に対してアルゴリズムが再帰的に再適用される。現在評価されている試料のいずれの部分にも、統計的に有意な読み取りデータ深度の変化が起こらないときに、アルゴリズムが終結する。
換言すれば、全ての小さな区画について、CBSアルゴリズムはその区画の前および後の区画を比較し、両方が同じ低下/増加を示せば、次の区画に移動する。変動の境界では、一方の側はシグナルを有するが、他方の側は有さず、これは、境界を画するのに役立つ。
様々な実施形態において、CNVに関して検査されている試料のゲノム中のゲノム領域(すなわち、染色体上の位置)のスプライン標準化の間に、所定の試料に対する読み取りデータを深度によって分割して、各ゲノム領域に対して低い、平均および深い読み取りデータ深度を何が構成するかを確かめるために、分位関数(quantiling function)が使用される。次いで、バッチ中の全ての試料にわたって、ゲノム中の各ゲノム領域で中央値読み取りデータ深度を得るために同じ手法が繰り返される。
特定の試料に対して、低い、平均、深いなどによって、これらの読み取りデータ深度を分割する分断点がx軸上にプロットされ、試料全体の中央値に対して読み取りデータ深度を分割する分断点がy軸上にプロットされる。次いで、これらの(x、y)値は曲線で内挿される。
次に、特定の試料に対して、当該試料中の特定の領域に対する読み取りデータ深度が、x軸上のその領域に対応する曲線上の高さを見ることによって、曲線に対して評価される。これを行うことによって、試料全体の中央値と比較したときに、例えば、低カバレッジ領域の大きな百分率を有する試料は、その低カバリッジ領域の上方部分が平均のカバレッジであるとして再解釈されるように修正されるであろう。次に、試料が、他の試料中にも見られる、領域中の読み取りデータの低下を示す場合、技術的変動として分類することができるが、低下がある試料中でのみ見られ、バッチ中の他の試料中には見られない場合、生物学的変動として分類することができる。これは、特定領域での試料の読み取りデータ深度を、バッチ中の全ての試料にわたるその同じ領域での中央値読み取りデータ深度によって除することによって明らかにされる。
図8は、様々な実施形態にしたがい、胚候補中のコピー数変動を決定するための方法を示すフローチャートである。本明細書に図示されているように、方法800は、胚候補中のコピー数変動を識別するための例示的ワークフローを詳述する。工程802では、複数の受精した胚から胚候補が単離され、容器中に配置される。例えば、胚候補は、それぞれがIVF移植のための候補であり得る複数の受精した胚から単離することができる。いくつかの実施形態において、胚候補は胚形成の胚盤胞段階にある。いくつかの実施形態において、胚候補はヒト胚である。
典型的には、単離された胚候補が誤った検査結果をもたらし得るゲノム物質で汚染されないことを確保するために、単離工程802は、慣用の無菌技術を用いて、または無菌フード(hood)中で行われる。
工程804では、胚候補は実質的にDNAを含まない培地中でインキュベートされる。典型的には、コピー数変動分析が方法800を用いて実施されるためのDNAを含まない培地に、十分な量のDNA断片(すなわち、ゲノム断片)が胚候補から分泌または流出するために(人工授精移植のために胚候補をなお生き続けさせながら)必要とされる長さの期間にわたって、胚がインキュベートされる。いくつかの実施形態において、胚は、最低約18時間、培養培地中でインキュベートすることができる。他の実施形態において、胚は、約18時間〜約144時間、培養培地中でインキュベートすることができる。このワークフローにおいて使用することができる、DNAを含まない培地の例は、The Cooper CompaniesのORIGIO SEQUENTIAL BLAST(商標)培養培地である。様々な実施形態において、誤った分析結果または増幅中の人為産物形成の機会を可能な限り低くするために、培地は、単にDNAだけではなく、オリゴヌクレオチドを実質的に含まないことができる。
工程806では、培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌された1つまたはそれを超えるゲノム断片(すなわち、DNA断片)を含む。使用することができる増幅容器の例には、試験管、ピペットチューブ、ペトリ皿または複数区画/ウェルプレート内のウェル/区画が含まれるが、これらに限定されない。
工程808では、複数のリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと(胚候補からの)少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。典型的には、培地から得られるゲノム断片は、「短い」ゲノム断片と考えられる。いくつかの実施形態において、短いゲノム断片は、約30塩基対(bp)〜約800bpの長さを有する。他の実施形態において、短いゲノム断片は、約150bp〜約400bpの長さを有する。さらに他の実施形態において、短いゲノム断片は、約1000bp未満の長さを有する。
ゲノムリンカーセグメントは、既知の長さおよびヌクレオチド配列の、本質的に人工的に作製された二本鎖「結合した」オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメントは、約30〜1000bpの長さである。他の実施形態において、ゲノムリンカーセグメントは、約30bp〜約500bpの長さである。さらに他の実施形態において、ゲノムリンカーセグメントは、約50bp〜約150bpである。いくつかの実施形態において、ゲノムリンカーセグメントは、ホモポリマーオリゴヌクレオチドセグメントである。他の実施形態において、ゲノムリンカーセグメントは、ヘテロポリマーオリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメントは、平滑末端化された二本鎖オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノム断片は、ゲノムリンカーセグメントに連結される前に、上で先述された方法を用いて、酵素的に平滑末端化される。
ゲノムリンカーセグメントにゲノム断片を連結して、連結されたゲノム断片を形成するために、様々な種類の原核生物および真核生物の酵素(すなわち、リガーゼ)を使用することができる。ここで使用することができるリガーゼのいくつかの例には、T3、T4、T7またはリガーゼ1が含まれるがこれらに限定されない。
工程810では、連結されたゲノム断片は、増幅容器中で増幅される。様々な実施形態において、連結されたゲノム断片は、MDA、MALBACなどのWGA技術を用いて、サーマルサイクラー(または類似の装置)上で増幅される。
連結された断片はインキュベート培地から単離された元のゲノム断片より著しく長いので、(ゲノム断片を個別的に増幅することと比べると)増幅エラーは著しく低下される。
工程812では、増幅された連結されたゲノム断片からの配列情報は、NGSまたは同等のゲノム配列決定システム上で、連結された断片を配列決定することから取得される。いくつかの実施形態において、配列情報は、(胚候補から単離されたゲノム断片から得られる)ゲノム断片配列読み取りデータと(工程810での増幅前に、人工的に作製され、ゲノム断片に連結された)ゲノムリンカーセグメント配列読み取りデータの両方を含む。
工程814では、配列情報は、公に利用可能なまたは所有の配列アライメントツールを用いて、参照ゲノムに対してアラインされる。断片配列をアラインするために使用することができる公に利用可能な配列アライメントツールの例には、BLAT、BLAST、BWA、Bowtie、drFAST LAST、MOSAIK、NEXTGENMAPなどが含まれるが、これらに限定されない。いくつかの実施形態において、ゲノムリンカーセグメントは天然に存在しないので、それらの対応する配列読み取りデータは、参照ゲノムへの配列情報のアライン中に、アルゴリズムによって除去される。すなわち、アライメントツールは、ゲノムリンカーセグメントと関連する既知の配列を差し引き、連結された断片読み取りデータのゲノム断片部分と関連する配列を参照ゲノムにアラインするに過ぎない。
いくつかの実施形態において、アライメントツールは、各ゲノム断片配列読み取りデータに対して参照ゲノム上の最長の合致するアラインメント位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインメントを選択する。すなわち、ゲノム断片配列読み取りデータ上の塩基の最長の連続する配列が参照ゲノムに合致するアラインメント場所。他の実施形態において、アライメントツールは、連続的であるか否かに関わらず、ゲノム断片配列読み取りデータからの塩基の最大数が合致する参照ゲノム上の位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインメントを選択する。いくつかの実施形態において、参照ゲノム上の複数の場所に等しく良好にアラインするゲノム断片配列読み取りデータは自動的に捨てられ、使用されない。
工程816では、参照ゲノム上の染色体上の位置にアラインされたゲノム断片配列読み取りデータの頻度が頻度閾値から逸脱するときに、胚候補のゲノム中のコピー数変動が識別される。様々な実施形態において、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値(すなわち、正常なゲノム中の断片アラインメント頻度)を下回るときに、逸脱が発生する。すなわち、検査されている試料(例えば、組織、胚など)の染色体上の位置がCNV欠失を有する場合、正常なゲノム中より、当該位置においてより少ない読み取りデータ(すなわち、アラインされた読み取りデータの頻度)を有するであろう。様々な実施形態において、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を上回るときに、逸脱が発生する。すなわち、染色体上の位置がCNV重複を有する場合、正常なゲノム中より、当該領域中により多い読み取りデータを有することを意味する。
図9は、様々な実施形態にしたがい、胚候補中のゲノムの特徴を識別する方法を示すフローチャートである。本明細書に図示されているように、方法900は、胚候補中のゲノムの特徴を識別するための例示的なワークフローを詳述する。工程902において、1つの胚候補が、複数の胚候補から単離される。例えば、胚候補は、それぞれがIVF移植のための候補であり得る複数の受精した胚から単離することができる。いくつかの実施形態において、胚候補は胚形成の胚盤胞段階にある。いくつかの実施形態において、胚候補はヒト胚である。
工程904では、胚候補は実質的にDNAを含まない培地中でインキュベートされる。典型的には、方法900を用いてコピー数変動分析を実施するためのDNAを含まない培地に、十分な量のDNA断片(すなわち、ゲノム断片)が胚候補から分泌または流出するために(人工授精移植のために胚候補をなお生き続けさせながら)必要とされる長さの期間にわたって、胚がインキュベートされる。このワークフローにおいて使用することができる、DNAを含まない培地の例は、The Cooper CompaniesのORIGIO SEQUENTIAL BLAST(商標)培養培地である。様々な実施形態において、誤った分析結果または増幅中の人為産物形成の機会を可能な限り低くするために、培地は、単にDNAだけではなく、オリゴヌクレオチドを実質的に含まないことができる。
工程906では、培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌された1つまたはそれを超えるゲノム断片(すなわち、DNA断片)を含む。使用することができる増幅容器の例には、試験管、ピペットチューブ、ペトリ皿または複数区画/ウェルプレート内のウェル/区画が含まれるが、これらに限定されない。
工程908では、複数のリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。典型的には、培地から単離されるゲノム断片は、「短い」ゲノム断片と考えられる。いくつかの実施形態において、短いゲノム断片は、約30塩基対(bp)〜約800bpの長さを有する。他の実施形態において、短いゲノム断片は、約150bp〜約400bpの長さを有する。さらに他の実施形態において、短いゲノム断片は、約1000bp未満の長さを有する。
ゲノムリンカーセグメントは、既知の長さおよびヌクレオチド配列の、本質的に人工的に作製された二本鎖「結合した」オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメントは、約30〜約1000bpの長さである。他の実施形態において、ゲノムリンカーセグメントは、約30bp〜約500bpの長さである。さらに他の実施形態において、ゲノムリンカーセグメントは、約50bp〜約150bpである。いくつかの実施形態において、ゲノムリンカーセグメントは、ホモポリマーオリゴヌクレオチドセグメントである。他の実施形態において、ゲノムリンカーセグメントは、ヘテロポリマーオリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノムリンカーセグメントは、平滑末端化された二本鎖オリゴヌクレオチドセグメントである。いくつかの実施形態において、ゲノム断片は、ゲノムリンカーセグメントに連結される前に、上で先述された方法を用いて、酵素的に平滑末端化される。
ゲノムリンカーセグメントにゲノム断片を連結して、連結されたゲノム断片を形成するために、様々な種類の原核生物および真核生物の酵素(すなわち、リガーゼ)を使用することができる。ここで使用することができるリガーゼのいくつかの例には、T3、T4、T7またはリガーゼ1が含まれるがこれらに限定されない。
工程910では、連結されたゲノム断片は、増幅容器中で増幅される。様々な実施形態において、連結されたゲノム断片は、MDA、MALBACなどのWGA技術を用いて、サーマルサイクラー(または類似の装置)上で増幅される。
工程912では、増幅された連結されたゲノムの特徴からの配列情報は、NGSまたは同等のゲノム配列決定システム上で、連結された断片を配列決定することから取得される。いくつかの実施形態において、配列情報は、(胚候補から単離されたゲノム断片から得られる)ゲノム断片配列読み取りデータと(工程910での増幅前に、人工的に作製され、ゲノム断片に連結された)ゲノムリンカーセグメント配列読み取りデータの両方を含む。
工程914では、配列情報は、公に利用可能なまたは所有の配列アライメントツールを用いて、参照ゲノムに対してアラインされる。断片配列をアラインするために使用することができる公に利用可能な配列アライメントツールの例には、BLAT、BLAST、BWA、Bowtie、drFAST LAST、MOSAIK、NEXTGENMAPなどが含まれるが、これらに限定されない。いくつかの実施形態において、ゲノムリンカーセグメントは天然に存在しないので、それらの対応する配列読み取りデータは、参照ゲノムへの配列情報のアライン中に、アルゴリズムによって除去される。すなわち、アライメントツールは、ゲノムリンカーセグメントと関連する既知の配列を差し引き、連結された断片読み取りデータのゲノム断片部分と関連する配列を参照ゲノムにアラインするに過ぎない。
いくつかの実施形態において、アライメントツールは、各ゲノム断片配列読み取りデータに対して参照ゲノム上の最長の合致するアラインメント位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインメントを選択する。すなわち、ゲノム断片配列読み取りデータ上の塩基の最長の連続する配列が参照ゲノムに合致するアラインメント場所。他の実施形態において、アライメントツールは、連続的であるか否かに関わらず、ゲノム断片配列読み取りデータからの塩基の最大数が合致する参照ゲノム上の位置を決定することによって、各ゲノム断片配列読み取りデータに対して最良のアラインメントを選択する。いくつかの実施形態において、参照ゲノム上の複数の場所に等しく良好にアラインするゲノム断片配列読み取りデータは自動的に捨てられ、使用されない。
工程916では、様々な公に利用可能なまたは専売のゲノムの特徴分析ツールまたはコーラーを用いて、アラインされたゲノム断片配列上にゲノムの特徴が識別される。様々な実施形態において、これらのツールまたはコーラーは、ゲノムの特徴を識別するために、様々な公的な(例えば、RefGeneデータベース(UCSC)、Alternative Splicingデータベース(EBI)、dbSNPデータベース(NCBI)、Genomic Structural Variationデータベース(NCBI)、GENCODEデータベース(UCSC)、PolyPhenデータベース(ハーバード)、SIFTデータベース(NCBI)、3000 Genomes Projectデータベース、Database of Genomic Variantsデータベース(EBI)、Biomartデータベース(EBI)、Gene Ontologyデータベース(公共)、BioCyc/HumanCycデータベース、KEGGパスウェイデータベース、Reactomeデータベース、Pathway Interactionデータベース(NIH)、Biocartaデータベース、PANTHERデータベースなど)および/または私的なデータベースにアクセスするように設計することができる。
いくつかの実施形態において、ゲノムの特徴は、挿入/欠失(INDEL)、コピー数変動(CNV)、一塩基多型(SNP)、重複、反転、転座などのゲノムバリアントであり得る。他の実施形態において、ゲノムの特徴は、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなどの何らかの注釈付けられた機能を有するゲノム領域であり得る。さらに別の実施形態において、ゲノムの特徴は、遺伝子発現および活性に影響を及ぼすことができる、ゲノム上の後成的変化(例えば、メチル化、アセチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、シトルリン化など)であり得る。
図10は、様々な実施形態にしたがい、連結されたゲノム断片配列読み取りデータからのゲノムの特徴を識別するための方法を示すフローチャートである。本明細書に図示されているように、方法1000は、増幅され、NGSまたは同等のゲノム配列決定システム上でその後配列決定された(組織試料から抽出されたゲノム断片に人工的なゲノムリンカーセグメントを連結することによって作製された)連結された断片から得られたゲノム断片配列読み取りデータ上のゲノムの特徴を識別するための例示的なワークフローを詳述する。工程1002では、ゲノム断片の塩基配列情報を決定するように構成されたゲノム配列決定システムによって生成されたゲノム配列情報(配列読み取りデータ)を分析するために、指示(ソフトウェアまたはハードウェア)がプログラムされた演算装置/サーバ上で、少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片読み取りデータが受領される。
ゲノムリンカーセグメントは人工的に作製されているので、その長さおよび塩基配列は既知である(isn known)。いくつかの実施形態において、ゲノムリンカーセグメント読み取りデータは、約30〜約1000bpの長さである。他の実施形態において、ゲノムリンカーセグメント読み取りデータは、約30bp〜約500bpの長さである。さらに他の実施形態において、ゲノムリンカーセグメント読み取りは、約50bp〜約150bpである。いくつかの実施形態において、ゲノムリンカーセグメント読み取りデータは、ホモポリマー配列である。他の実施形態において、ゲノムリンカーセグメント読み取りデータは、ヘテロポリマー配列である。
工程1004では、工程1006において、連結されたゲノム断片配列読み取りデータが参照ゲノムにアラインされる前に、連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分が差し引かれる。すなわち、ゲノムリンカーセグメントと関連する既知の配列は、まず、連結されたゲノム断片配列読み取りデータから差し引かれ、次いで、連結された断片読み取りデータのゲノム断片部分のみが参照ゲノムにアラインされる。
工程1008では、様々な公に利用可能なまたは専売のゲノムの特徴分析ツールまたはコーラーを用いて、アラインされたゲノム断片配列上でゲノムの特徴が識別される。様々な実施形態において、これらのツールまたはコーラーは、ゲノムの特徴を識別するために、様々な公的な(例えば、RefGeneデータベース(UCSC)、Alternative Splicingデータベース(EBI)、dbSNPデータベース(NCBI)、Genomic Structural Variationデータベース(NCBI)、GENCODEデータベース(UCSC)、PolyPhenデータベース(ハーバード)、SIFTデータベース(NCBI)、3000 Genomes Projectデータベース、Database of Genomic Variantsデータベース(EBI)、Biomartデータベース(EBI)、Gene Ontologyデータベース(公共)、BioCyc/HumanCycデータベース、KEGGパスウェイデータベース、Reactomeデータベース、Pathway Interactionデータベース(NIH)、Biocartaデータベース、PANTHERデータベースなど)および/または私的なデータベースにアクセスするように設計することができる。
いくつかの実施形態において、ゲノムの特徴は、挿入/欠失(INDEL)、コピー数変動(CNV)、一塩基多型(SNP)、重複、反転、転座などのゲノムバリアントであり得る。他の実施形態において、ゲノムの特徴は、遺伝子、タンパク質コード配列、mRNA、tRNA、rRNA、反復配列、逆方向反復、miRNA、siRNAなどの何らかの注釈付けられた機能を有するゲノム領域であり得る。さらに別の実施形態において、ゲノムの特徴は、遺伝子発現および活性に影響を及ぼすことができる、ゲノム上の後成的変化(例えば、メチル化、アセチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、シトルリン化など)であり得る。
実験の結果
以下の例示的な例は、本明細書に記載されているソフトウェアアプリケーション、システムおよび方法の代表的な実施形態であり、決して限定することを意図していない。
表1に示されているように、旧来の胚栄養外胚葉生検法と上に開示された胚培養培地法の新規非侵襲性試料採取の両方を用いて、染色体異常(すなわち、CNV)に対して26個の胚を分析した。試料は、直ちに分析されたか、または−20℃〜−80℃の範囲の温度条件で保存されたかのいずれかであった。
ILLUMINAのVERISEQ(商標)PGSワークフローおよび分析を用いて、それぞれの伝統的な胚生検のDNAを分析した。それぞれの各胚のためのIVF培養培地を、新規増幅法を用いる非侵襲性分析に供し、ILLUMINA NGS配列決定装置上で配列決定し、特注のバイオインフォマティクスパイプラインを用いて、それらの染色体コピー数を計算した。結果は、産業で受容された栄養外胚葉生検法と上に開示されている非侵襲性胚培養培地法との間で、異数性(aneupoloidy)(染色体異常)および正倍数性(正常な遺伝子構成)において高い一致を明確に示している。さらに、それぞれの各試料にわたって比較された24個の染色体のそれぞれに対して、高い一致率が存在した。
本明細書に記載されている方法論は、用途に応じて、様々な手段によって実施され得る。例えば、これらの方法論は、ハードウェア、ファームウェア、ソフトウェアまたはこれらのあらゆる組み合わせで実施され得る。ハードウェア実装については、処理ユニットは、1つまたはそれを超える特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子機器、本明細書に記載されている機能を実行するために構成されたその他の電子ユニットまたはこれらの組み合わせ内に実装され得る。
様々な実施形態において、本教示の方法は、C、C++、Pythonなどの従来のプログラミング言語で書かれた、ファームウェアおよび/またはソフトウェアプログラムおよびアプリケーションとして実装され得る。ファームウェアおよび/またはソフトウェアとして実装される場合、本明細書に記載された実施形態は、コンピュータに上記方法を実行させるためのプログラムがその中に記憶されている非持続性コンピュータ読み取り可能な媒体上に実装することができる。本明細書に記載されている様々なエンジンは、プロセッサ404がこれらのエンジンによって与えられた分析および決定を実行し、メモリ構成要素406/4008/410および入力装置414を介して与えられたユーザ入力のいずれか1つまたはこれらの組み合わせによって与えられる指示を受ける、図4のコンピュータシステム400などのコンピュータシステム上に与えることができることが理解されるべきである。
本教示は様々な実施形態とともに記載されているが、本教示がこのような実施形態に限定されることは意図されない。反対に、本教示は、当業者によって理解されるように、様々な代替物、改変物および均等物を包含する。
さらに、様々な実施形態を記述する際に、本明細書は、特定の工程の順序として方法および/または過程を提示し得る。しかしながら、方法または過程が本明細書に記載されている工程の具体的な順序に依存しない程度まで、方法または過程は、記載されている具体的な工程の順序に限定されるべきではない。当業者が理解可能であるように、工程の他の順序が可能であり得る。したがって、本明細書に記載されている工程の具体的な順番は、特許請求の範囲に対する限定として解釈されるべきではない。さらに、方法および/または過程を対象とする請求項は、記載された順番でのそれらの工程の実施に限定されるべきではなく、当業者は、順序が変動され得、様々な実施形態の精神および範囲内にとどまり得ることを容易に理解できる。
本明細書に記載されている実施形態は、携帯用機器(hand−held devices)、マイクロプロセッサシステム、マイクロプロセッサをベースとするまたはプログラム可能な家庭用電気製品、小型コンピュータ(minicomputers)、大型汎用コンピュータ(mainframe computers)などを含む他のコンピュータシステム構成を用いて実施することができる。実施形態は、ネットワークを通じてつながれている遠隔処理装置によって作業が実行される分散コンピューティング環境中でも実施することができる。
本明細書に記載されている実施形態は、コンピュータシステム中に保存されたデータを伴うコンピュータによって実行される様々な作業を使用することができることも理解すべきである。これらの作業は、物理量の物理的操作を必要とする作業である。必ずではないが、通常、これらの量は、保存され、伝達され、統合され、比較され、およびその他操作されることが可能な電気または磁気信号の形態を取る。さらに、実施される操作は、生成する、識別する、決定するまたは比較するなどの用語でしばしば表される。
本明細書に記載されている実施形態の一部を形成する作業のいずれもが、有用な機械作業である。本明細書に記載されている実施形態は、これらの作業を実行するための機器または装置に関する。本明細書に記載されているシステムおよび方法は、必要とされる目的のために特別に構築することができ、またはコンピュータ中に保存されているコンピュータプログラムによって、選択的に起動または設定される汎用コンピュータであり得る。特に、様々な汎用機器は本明細書中の教示に従って記述されたコンピュータプログラムとともに使用され得、または必要とされる作業を実行するためのより特殊化された装置を構築することがより便利であり得る。
ある種の実施形態は、コンピュータ読み取り可能な媒体上のコンピュータ読み取り可能なコードとして具体化されることもできる。コンピュータ読み取り可能な媒体は、データを保存することができるあらゆるデータ記憶装置であり、データはその後コンピュータシステムによって読み取られることができる。コンピュータ読み取り可能な媒体の例には、ハードドライブ、ネットワーク接続ストレージ(NAS)、読み出し専用メモリ、ランダムアクセスメモリ、CD−ROM、CD−R、CD−RW、磁気テープおよびその他の光学的、フラッシュメモリおよび非光学的データ記憶装置が含まれる。コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能なコードが分散型様式で保存および実行されるように、ネットワークに接続されたコンピュータシステム上に分散されることもできる。
選択された実施形態の列挙
実施形態1。人工授精(IVF)移植のための胚候補中のコピー数変動を決定するための方法が提供され、開示されている。1つの胚候補が、複数の胚から単離される。この胚候補は、実質的にDNAを含まない培地中でインキュベートされる。培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌されたゲノム断片を含む。複数のゲノムリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。連結されたゲノム断片は、増幅容器中で増幅される。配列情報が、増幅された連結されたゲノム断片から取得される。配列情報は、参照ゲノムに対してアラインされる(マッピングされる)。参照ゲノム上の染色体上の位置にアラインされたゲノム断片配列読み取りデータの頻度が頻度閾値から逸脱するときに、胚候補中で、コピー数変動が識別される。
実施形態2。前記連結されたゲノム断片配列を前記参照ゲノムにアラインさせる前に、前記連結されたゲノム断片配列から前記ゲノムリンカーセグメントに関連する配列情報を差し引くことをさらに含む、実施形態1に記載の方法。
実施形態3。各染色体上の位置にアラインされたゲノム断片配列読み取りデータの前記頻度を標準化すること、および各染色体上の位置に対して頻度閾値を決定することをさらに含む、実施形態2に記載の方法。
実施形態4。前記識別された頻度閾値からの前記識別された逸脱が技術的バイアスに起因するかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、実施形態3に記載の方法。
実施形態5。前記標準化が、スプライン標準化法を用いて実施される、実施形態3に記載の方法。
実施形態6。ゲノム断片末端を前記ゲノムリンカーセグメントに連結する前に、改変されたポリメラーゼを用いて、前記ゲノム断片末端を平滑末端化することをさらに含む、実施形態1に記載の方法。
実施形態7。前記改変されたポリメラーゼがクレノウT4DNAポリメラーゼである、実施形態6に記載の方法。
実施形態8。前記リガーゼ酵素が、T3、T4またはT7原核生物DNAリガーゼの1つである、実施形態1に記載の方法。
実施形態9。前記胚候補がヒト胚である、実施形態1に記載の方法。
実施形態10。前記胚候補が胚盤胞である、実施形態1に記載の方法。
実施形態11。前記頻度閾値が、正常な染色体にマッピングされるゲノム断片読み取りデータの頻度である、実施形態1に記載の方法。
実施形態12。胚候補中のゲノムの特徴を識別するための方法が提供され、開示されている。1つの胚候補が、複数の胚候補から単離される。この胚候補は、実質的にDNAを含まない培地中でインキュベートされる。培地の一部が増幅容器に移され、前記培地の一部は、胚候補から流出または分泌されたさらに1つのゲノム断片を含む。複数のゲノムリンカーセグメントとリガーゼ酵素は、少なくとも1つのゲノムリンカーセグメントと単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、増幅容器に添加される。連結されたゲノム断片は、増幅容器中で増幅される。配列情報が、連結されたゲノム断片から取得される。配列情報は、参照ゲノムに対してアラインされる。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
実施形態13。前記連結されたゲノム断片配列を前記参照ゲノムにアラインさせる前に、前記連結されたゲノム断片配列から前記ゲノムリンカーセグメントに関連する配列情報を差し引くことをさらに含む、実施形態12に記載の方法。
実施形態14。ゲノム断片末端をゲノムリンカーセグメントに連結する前に、改変されたポリメラーゼを用いて、前記ゲノム断片末端を平滑末端化することをさらに含む、実施形態12に記載の方法。
実施形態15。前記改変されたポリメラーゼがクレノウT4DNAポリメラーゼである、実施形態14に記載の方法。
実施形態16。前記リガーゼ酵素が、T3、T4またはT7原核生物DNAリガーゼの1つである、実施形態12に記載の方法。
実施形態17。前記胚候補がヒト胚である、実施形態12に記載の方法。
実施形態18。前記胚候補が胚盤胞である、実施形態12に記載の方法。
実施形態19。前記ゲノムの特徴が一塩基多型である、実施形態12に記載の方法。
実施形態20。前記ゲノムの特徴がインデルである、実施形態12に記載の方法。
実施形態21。前記ゲノムの特徴が反転である、実施形態12に記載の方法。
実施形態22。胚候補中のゲノムの特徴を識別するためのシステムが提供される。システムは、ゲノミクス配列決定装置と、演算装置と、ディスプレイとを備える。
前記ゲノム配列決定装置は、胚候補に由来する連結されたゲノム断片から配列情報を取得するように構成されている。連結されたゲノム断片はそれぞれ、少なくとも1つのゲノムリンカーセグメントと胚候補からの少なくとも1つのゲノム断片とを含む。
前記演算装置はゲノム配列決定装置に通信可能に接続されており、配列アラインメントエンジンとゲノムの特徴識別エンジンとを備える。配列アラインメントエンジンは、連結されたゲノム断片のゲノムリンカーセグメント部分と関連する配列情報を差し引き、ゲノム断片配列を参照ゲノムにアラインさせるように構成されている。ゲノムの特徴識別エンジンは、アラインされたゲノム断片配列中のゲノムの特徴を識別するように構成されている。ディスプレイは、演算装置に通信可能に接続されており、識別されたゲノムの特徴を含む報告を表示するように構成されている。
実施形態23。前記ゲノムの特徴がコピー数変動である、実施形態22に記載のシステム。
実施形態24。前記ゲノムの特徴識別エンジンが、参照ゲノム上の各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化し、各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定し、および前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置(positon)に対してコピー数変動コールを作るように、さらに構成されている、実施形態23に記載のシステム。
実施形態25。前記識別された頻度閾値からの前記識別された逸脱が技術的バイアスに起因するかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用するように、前記ゲノムの特徴識別エンジンが、さらに構成されている、実施形態24に記載のシステム。
実施形態26。前記標準化が、スプライン標準化法を用いて実施される、実施形態24に記載のシステム。
実施形態27。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を下回るときに発生する、実施形態24に記載のシステム。
実施形態28。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を上回るときに発生する、実施形態24に記載のシステム。
実施形態29。前記胚候補がヒト胚である、実施形態22に記載のシステム。
実施形態30。前記胚候補が胚盤胞である、実施形態22に記載のシステム。
実施形態31。前記ゲノムの特徴が一塩基多型である、実施形態22に記載のシステム。
実施形態32。前記ゲノムの特徴がインデルである、実施形態22に記載のシステム。
実施形態33。前記ゲノムの特徴が反転である、実施形態22に記載のシステム。
実施形態34。前記ゲノムリンカーセグメント配列が既知の配列である、実施形態22に記載のシステム。
実施形態35。組織試料中のゲノムの特徴を識別するための方法が提供され、開示されている。少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータが受領される。連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分が差し引かれる。連結されたゲノム断片配列読み取りデータは、参照ゲノムにアラインされる(マッピングされる)。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
実施形態36。参照ゲノム上の1を超える場所にマッピングされる連結されたゲノム断片配列読み取りデータを削除することをさらに含む、実施形態35に記載の方法。
実施形態37。前記ゲノムの特徴がコピー数変動である、実施形態35に記載の方法。
実施形態38。各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化すること、各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定すること、および前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置(positon)に対してコピー数変動コールを作ることをさらに含む、実施形態37に記載の方法。
実施形態39。前記頻度閾値からの識別された逸脱が技術的バイアスに起因して識別されているかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、実施形態38に記載の方法。
実施形態40。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を下回るときに発生する、実施形態38に記載の方法。
実施形態41。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を上回るときに発生する、実施形態38に記載の方法。
実施形態42。前記組織試料が胚組織である、実施形態35に記載の方法。
実施形態43。前記組織試料が胚盤胞である、請求項35に記載の方法。
実施形態44。前記ゲノムの特徴が一塩基多型である、請求項35に記載の方法。
実施形態45。前記ゲノムの特徴がインデルである、請求項35に記載の方法。
実施形態46。前記ゲノムの特徴が反転である、請求項35に記載の方法。
実施形態47。組織試料中のゲノムの特徴を識別するための方法をコンピュータに実行させるためのプログラムがその中に保存されている非一時的なコンピュータ読み取り可能な媒体が提供される。少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータが受領される。連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分が差し引かれる。連結されたゲノム断片配列読み取りデータは、参照ゲノムにアラインされる(マッピングされる)。ゲノムの特徴は、アラインされたゲノム断片配列上に識別される。
実施形態48。参照ゲノム上の1を超える場所にマッピングされる連結されたゲノム断片配列読み取りデータを削除することをさらに含む、実施形態47に記載の方法。
実施形態49。ゲノムの特徴がコピー数変動である、実施形態47に記載の方法。
実施形態50。前記ゲノムの特徴がインデルである、実施形態47に記載の方法。
実施形態51。前記ゲノムの特徴が反転である、実施形態47に記載の方法。
実施形態52。各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化すること、各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定すること、および前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置(positon)に対してコピー数変動コールを作ることをさらに含む、実施形態49に記載の方法。
実施形態53。前記頻度閾値からの識別された逸脱が技術的バイアスに起因して識別されているかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、実施形態52に記載の方法。
実施形態54。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を下回るときに発生する、実施形態52に記載の方法。
実施形態55。逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を上回るときに発生する、実施形態52に記載の方法。
実施形態56。前記組織試料が胚組織である、実施形態47に記載の方法。
実施形態57。前記組織試料が胚盤胞である、実施形態47に記載の方法。
実施形態58。前記ゲノムの特徴が一塩基多型である、実施形態47に記載の方法。
実施形態59。前記ゲノムの特徴がインデルである、実施形態47に記載の方法。
実施形態60。前記ゲノムの特徴が反転である、実施形態47に記載の方法。

Claims (60)

  1. 人工授精(IVF)移植のための胚候補中のコピー数変動を決定するための方法であって、
    複数の胚から胚候補を単離すること、
    実質的にDNAを含まない培地中で前記胚候補をインキュベートすること、
    前記培地の一部であって前記胚候補から流出または分泌されたゲノム断片を含む前記培地の一部を増幅容器に移すこと、
    少なくとも1つのゲノムリンカーセグメントと前記単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、複数のゲノムリンカーセグメントとリガーゼ酵素とを前記増幅容器に添加すること、
    前記増幅容器中の前記連結されたゲノム断片を増幅すること、
    前記増幅された連結されたゲノム断片から配列情報を取得すること、
    前記配列情報を参照ゲノムに対してアラインさせること、および
    前記参照ゲノム上の染色体上の位置にアラインされたゲノム断片配列読み取りデータの頻度が頻度閾値から逸脱しているときに、前記胚候補中のコピー数変動を識別すること
    を含む、方法。
  2. 前記連結されたゲノム断片配列を前記参照ゲノムにアラインさせる前に、前記連結されたゲノム断片配列から前記ゲノムリンカーセグメントに関連する配列情報を差し引くことをさらに含む、請求項1に記載の方法。
  3. 各染色体上の位置にアラインされたゲノム断片配列読み取りデータの前記頻度を標準化すること、および
    各染色体上の位置に対して頻度閾値を決定すること
    をさらに含む、請求項2に記載の方法。
  4. 前記識別された頻度閾値からの識別された逸脱が技術的バイアスに起因するかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、請求項3に記載の方法。
  5. 前記標準化が、スプライン標準化法を用いて実施される、請求項3に記載の方法。
  6. ゲノム断片末端をゲノムリンカーセグメントに連結する前に、改変されたポリメラーゼを用いて、前記ゲノム断片末端を平滑末端化することをさらに含む、請求項1に記載の方法。
  7. 前記改変されたポリメラーゼがクレノウT4DNAポリメラーゼである、請求項6に記載の方法。
  8. 前記リガーゼ酵素が、T3、T4またはT7原核生物DNAリガーゼの1つである、請求項1に記載の方法。
  9. 前記胚候補がヒト胚である、請求項1に記載の方法。
  10. 前記胚候補が胚盤胞である、請求項1に記載の方法。
  11. 前記頻度閾値が、正常な染色体にマッピングされるゲノム断片読み取りデータの頻度である、請求項1に記載の方法。
  12. 胚候補中のゲノムの特徴を識別するための方法であって、
    複数の胚候補から1つの胚候補を単離すること、
    実質的にDNAを含まない培地中で前記胚候補をインキュベートすること、
    前記培地の一部であって前記胚候補から流出または分泌されたさらに1つのゲノム断片を含む前記培地の一部を増幅容器に移すこと、
    少なくとも1つのゲノムリンカーセグメントと前記単離された胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片の形成を触媒する条件で、複数のゲノムリンカーセグメントとリガーゼ酵素とを前記増幅容器に添加すること、
    前記増幅容器中の前記連結されたゲノム断片を増幅すること、
    前記連結されたゲノム断片から配列情報を取得すること、
    前記配列情報を参照ゲノムに対してアラインさせること、および
    前記アラインされたゲノム断片配列上のゲノムの特徴を識別すること
    を含む、方法。
  13. 前記連結されたゲノム断片配列を前記参照ゲノムにアラインさせる前に、前記連結されたゲノム断片配列から前記ゲノムリンカーセグメントに関連する配列情報を差し引くことをさらに含む、請求項12に記載の方法。
  14. ゲノム断片末端をゲノムリンカーセグメントに連結する前に、改変されたポリメラーゼを用いて、前記ゲノム断片末端を平滑末端化することをさらに含む、請求項12に記載の方法。
  15. 前記改変されたポリメラーゼがクレノウT4DNAポリメラーゼである、請求項14に記載の方法。
  16. 前記リガーゼ酵素が、T3、T4またはT7原核生物DNAリガーゼのうちの1つである、請求項12に記載の方法。
  17. 前記胚候補がヒト胚である、請求項12に記載の方法。
  18. 前記胚候補が胚盤胞である、請求項12に記載の方法。
  19. 前記ゲノムの特徴が一塩基多型である、請求項12に記載の方法。
  20. 前記ゲノムの特徴がインデルである、請求項12に記載の方法。
  21. 前記ゲノムの特徴が反転である、請求項12に記載の方法。
  22. 胚候補中のゲノムの特徴を識別するためのシステムであって、
    胚候補に由来する連結されたゲノム断片であって、それぞれが少なくとも1つのゲノムリンカーセグメントと前記胚候補からの少なくとも1つのゲノム断片とを含む連結されたゲノム断片から配列情報を取得するように構成されたゲノム配列決定装置と、
    前記連結されたゲノム断片の前記ゲノムリンカーセグメント部分と関連する配列情報を差し引き、前記ゲノム断片配列を参照ゲノムにアラインさせるように構成された配列アラインメントエンジンと、
    前記アラインされたゲノム断片配列中のゲノムの特徴を識別するように構成されたゲノムの特徴識別エンジンと
    を備える、前記ゲノム配列決定装置に通信可能に接続された演算装置と、ならびに
    前記演算装置に通信可能に接続され、および前記識別されたゲノムの特徴を含む報告を表示するように構成されたディスプレイと
    を備える、システム。
  23. 前記ゲノムの特徴がコピー数変動である、請求項22に記載のシステム。
  24. 前記ゲノムの特徴識別エンジンが、
    参照ゲノム上の各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化し、
    各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定し、および
    前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置に対してコピー数変動コールを作るように、
    さらに構成されている、請求項23に記載のシステム。
  25. 前記ゲノムの特徴識別エンジンが、
    前記識別された頻度閾値からの識別された逸脱が技術的バイアスに起因しているかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用するように、
    さらに構成されている、請求項24に記載のシステム。
  26. 前記標準化が、スプライン標準化法を用いて実施される、請求項24に記載のシステム。
  27. 逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を下回るときに発生する、請求項24に記載のシステム。
  28. 逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を上回るときに発生する、請求項24に記載のシステム。
  29. 前記胚候補がヒト胚である、請求項22に記載のシステム。
  30. 前記胚候補が胚盤胞である、請求項22に記載のシステム。
  31. 前記ゲノムの特徴が一塩基多型である、請求項22に記載のシステム。
  32. 前記ゲノムの特徴がインデルである、請求項22に記載のシステム。
  33. 前記ゲノムの特徴が反転である、請求項22に記載のシステム。
  34. 前記ゲノムリンカーセグメント配列が既知の配列である、請求項22に記載のシステム。
  35. 組織試料中のゲノムの特徴を識別するための方法であって、
    少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータを受領すること、
    前記連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分を差し引くこと、
    前記連結されたゲノム断片配列読み取りデータを参照ゲノムにアラインすること、および
    前記アラインされたゲノム断片配列上のゲノムの特徴を識別すること
    を含む、方法。
  36. 参照ゲノム上の1を超える場所にマッピングされる連結されたゲノム断片配列読み取りデータを削除することをさらに含む、請求項35に記載の方法。
  37. 前記ゲノムの特徴がコピー数変動である、請求項35に記載の方法。
  38. 各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化すること、
    各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定すること、および
    前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置(positon)に対してコピー数変動コールを作ること
    をさらに含む、請求項37に記載の方法。
  39. 前記頻度閾値からの前記識別された逸脱が技術的バイアスに起因して識別されているかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、請求項38に記載の方法。
  40. 逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を下回るときに発生する、請求項38に記載の方法。
  41. 逸脱が、染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を上回るときに発生する、請求項38に記載の方法。
  42. 前記組織試料が胚組織である、請求項35に記載の方法。
  43. 前記組織試料が胚盤胞である、請求項35に記載の方法。
  44. 前記ゲノムの特徴が一塩基多型である、請求項35に記載の方法。
  45. 前記ゲノムの特徴がインデルである、請求項35に記載の方法。
  46. 前記ゲノムの特徴が反転である、請求項35に記載の方法。
  47. 組織試料中のゲノムの特徴を識別するための方法をコンピュータに実行させるためのプログラムがその中に保存されている非一時的なコンピュータ読み取り可能な媒体であって、前記方法が、
    少なくとも1つのゲノムリンカーセグメント配列と組織試料からの少なくとも1つのゲノム断片配列とを含む連結されたゲノム断片配列読み取りデータを受領すること、
    前記連結されたゲノム断片配列読み取りデータのゲノムリンカーセグメント配列部分を差し引くこと、
    前記連結されたゲノム断片配列読み取りデータを参照ゲノムにアラインすること、および
    前記アラインされたゲノム断片配列上のゲノムの特徴を識別すること
    を含む、媒体。
  48. 参照ゲノム上の1を超える場所にマッピングされる連結されたゲノム断片配列読み取りデータを削除することをさらに含む、請求項47に記載の方法。
  49. 前記ゲノムの特徴がコピー数変動である、請求項47に記載の方法。
  50. 前記ゲノムの特徴がインデルである、請求項47に記載の方法。
  51. 前記ゲノムの特徴が反転である、請求項47に記載の方法。
  52. 各染色体上の位置にアラインされたゲノム断片配列の頻度を標準化すること、
    各染色体上の位置に対して、コピー数変動コールを作るために、ゲノム断片配列アラインメント頻度閾値を決定すること、および
    前記頻度閾値から逸脱するゲノム断片配列アラインメント頻度を有する各染色体上の位置に対してコピー数変動コールを作ること
    をさらに含む、請求項49に記載の方法。
  53. 前記頻度閾値からの前記識別された逸脱が技術的バイアスに起因して識別されているかどうかを決定するために、サーキュラー・バイナリー・セグメンテーション(CBS)分析を適用することをさらに含む、請求項52に記載の方法。
  54. 逸脱が、前記染色体上の位置にアラインされたゲノム断片配列の頻度が前記頻度閾値を下回るときに発生する、請求項52に記載の方法。
  55. 逸脱が、前記染色体上の位置にアラインされたゲノム断片配列の頻度が頻度閾値を上回るときに発生する、請求項52に記載の方法。
  56. 前記組織試料が胚組織である、請求項47に記載の方法。
  57. 前記組織試料が胚盤胞である、請求項47に記載の方法。
  58. 前記ゲノムの特徴が一塩基多型である、請求項47に記載の方法。
  59. 前記ゲノムの特徴がインデルである、請求項47に記載の方法。
  60. 前記ゲノムの特徴が反転である、請求項47に記載の方法。

JP2020514609A 2017-09-07 2018-09-07 非侵襲性の移植前遺伝子診断のためのシステムおよび方法 Pending JP2020532999A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762555466P 2017-09-07 2017-09-07
US62/555,466 2017-09-07
PCT/US2018/049976 WO2019051244A1 (en) 2017-09-07 2018-09-07 SYSTEMS AND METHODS FOR NON-EFFRACTIVE PREIMPLANTATORY GENETIC DIAGNOSIS

Publications (1)

Publication Number Publication Date
JP2020532999A true JP2020532999A (ja) 2020-11-19

Family

ID=63684601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020514609A Pending JP2020532999A (ja) 2017-09-07 2018-09-07 非侵襲性の移植前遺伝子診断のためのシステムおよび方法

Country Status (8)

Country Link
US (1) US20210062256A1 (ja)
EP (1) EP3679156A1 (ja)
JP (1) JP2020532999A (ja)
KR (1) KR20200060410A (ja)
AU (1) AU2018327337A1 (ja)
CA (1) CA3074689A1 (ja)
SG (1) SG11202003557YA (ja)
WO (1) WO2019051244A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022537442A (ja) * 2019-06-21 2022-08-25 クーパーサージカル・インコーポレイテッド ヒト胚におけるコピー数変異を検証するために単一ヌクレオチド変異の密度を使用するシステム、コンピュータプログラム製品及び方法
JP2023025739A (ja) * 2021-08-11 2023-02-24 医療法人浅田レディースクリニック 胚培養用ディッシュおよびこのディッシュを用いた染色体解析用胚培養液の採取方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020061637A1 (en) * 2018-09-27 2020-04-02 Monash Ivf Group Limited Dna from cell-free medium
CN112582022B (zh) * 2020-07-21 2021-11-23 序康医疗科技(苏州)有限公司 用于无创胚胎移植优先级评级的系统和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2272983A1 (en) 2005-02-01 2011-01-12 AB Advanced Genetic Analysis Corporation Reagents, methods and libraries for bead-based sequencing
EP2958574A4 (en) * 2013-01-23 2016-11-02 Reproductive Genetics And Technology Solutions Llc COMPOSITIONS AND METHODS FOR GENETIC ANALYSIS OF EMBRYOS
JP6765960B2 (ja) * 2013-06-18 2020-10-07 アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル 胚の品質を決定するための方法
CN115433769A (zh) * 2015-08-12 2022-12-06 香港中文大学 血浆dna的单分子测序
GB2541904B (en) * 2015-09-02 2020-09-02 Oxford Nanopore Tech Ltd Method of identifying sequence variants using concatenation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022537442A (ja) * 2019-06-21 2022-08-25 クーパーサージカル・インコーポレイテッド ヒト胚におけるコピー数変異を検証するために単一ヌクレオチド変異の密度を使用するシステム、コンピュータプログラム製品及び方法
JP2023025739A (ja) * 2021-08-11 2023-02-24 医療法人浅田レディースクリニック 胚培養用ディッシュおよびこのディッシュを用いた染色体解析用胚培養液の採取方法
JP7377842B2 (ja) 2021-08-11 2023-11-10 医療法人浅田レディースクリニック 胚培養用ディッシュ

Also Published As

Publication number Publication date
EP3679156A1 (en) 2020-07-15
SG11202003557YA (en) 2020-05-28
AU2018327337A1 (en) 2020-04-30
CA3074689A1 (en) 2019-03-14
WO2019051244A1 (en) 2019-03-14
US20210062256A1 (en) 2021-03-04
KR20200060410A (ko) 2020-05-29

Similar Documents

Publication Publication Date Title
US11866777B2 (en) Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11981891B2 (en) High-throughput single-cell sequencing with reduced amplification bias
Gupta et al. Next generation sequencing and its applications
CN104963000B (zh) 一种快速构建单细胞dna测序文库的方法和试剂盒
JP2020532999A (ja) 非侵襲性の移植前遺伝子診断のためのシステムおよび方法
US20230005568A1 (en) Method of correcting amplification bias in amplicon sequencing
US20180305683A1 (en) Multiplexed tagmentation
US20200190510A1 (en) Methods and compositions for addressing inefficiencies in amplification reactions
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
JP7446343B2 (ja) ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法
US20200399701A1 (en) Systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos
WO2019046644A1 (en) SYSTEMS AND METHODS FOR DETECTION OF NOVO MUTATIONS IN HUMAN EMBRYOS
WO2024054517A1 (en) Methods and compositions for analyzing nucleic acid
WO2023158739A2 (en) Methods and compositions for analyzing nucleic acid
Deleye Massively parallel sequencing in preimplantation and prenatal genetic diagnosis