JP2021530203A - 試料同一性保証のための方法およびシステム - Google Patents

試料同一性保証のための方法およびシステム Download PDF

Info

Publication number
JP2021530203A
JP2021530203A JP2020571427A JP2020571427A JP2021530203A JP 2021530203 A JP2021530203 A JP 2021530203A JP 2020571427 A JP2020571427 A JP 2020571427A JP 2020571427 A JP2020571427 A JP 2020571427A JP 2021530203 A JP2021530203 A JP 2021530203A
Authority
JP
Japan
Prior art keywords
sequencing
allelic
sample
dna
nucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020571427A
Other languages
English (en)
Inventor
ヤン ディン
セルゲイ バタロフ
Original Assignee
レディ チルドレンズ ホスピタル リサーチ センター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by レディ チルドレンズ ホスピタル リサーチ センター filed Critical レディ チルドレンズ ホスピタル リサーチ センター
Publication of JP2021530203A publication Critical patent/JP2021530203A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本開示は、対立遺伝子型決定を含む遺伝子解析のための方法、ならびにそのような解析を実装するためのシステムを提供する。

Description

関連出願の相互参照
本出願は、米国特許法第119条(e)の下で、2018年6月29日に出願された、米国特許仮出願第62/692,366号の優先権の利益を主張し、その全体内容が、参照によりその全体において本明細書に組み込まれる。
配列表の組み込み
添付の配列表のデータは、本明細書において、参照により本出願に組み込まれる。添付の配列表テキストファイルRADY_1WO_Sequence_Listing.txtは、2019年6月25日に作成され、8kbである。ファイルは、Windows OSを使用しているコンピュータでMicrosoft Wordを使用してアクセスすることができる。
発明の分野
本発明は、概して、遺伝子解析に関し、より具体的には、試料同一性を確実にするための対立遺伝子型決定のための方法およびシステムに関する。
次世代配列決定(NGS)プラットフォームを使用する全ゲノム配列決定(WGS)、全エクソーム配列決定(WES)、および標的遺伝子パネル配列決定は、複数の手順ステップを伴う複雑なプロセスである。NGSにおけるプロセス中の試料交換または汚染は、偽陽性バリアント検出および遺伝子型誤分類をもたらし得る。プロセス全体の試料同一性の保証は、重要な品質管理コンポーネントである。正しい試料同一性を確実にするプロセスは、配列決定施設の課題である。
現在、いくつかのNGS施設は、アレイベースの遺伝子型決定を実施し、一塩基多型(SNP)を使用して、NGSデータから呼び出される遺伝子型プロファイリングと、アレイベースの遺伝子型データ(SNPマイクロアレイ)から呼び出される遺伝子型プロファイリングとの間の一致を取得している。特定のプロセスに関連する、または関連しないエラーは、アレイベース遺伝子型決定において発生し得、SNPアレイデータとNGSデータとの間の不整合な遺伝子型呼び出しをもたらし得ることが知られている。一方、NGSの深度カバレッジは、NGSデータからのSNP呼び出し、特に低マイナー対立遺伝子頻度(MAF)SNPに影響を与える。NGSパネル配列決定のために、カスタム設計されたアレイワークフローは、NGSパネルデータとSNPマイクロアレイデータとの間の一致を最適化するように、作成されなければならない。ワークフローは、完了するのに2〜3日を必要とする。追加的に、比較的試料量が少ない研究所では、初期計測、コストの修正、および人員配置モデルを開発する必要があり得る。
正しい試料同一性を保証するための改善された方法は、遺伝子解析を実施するときに、必要とされる。
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法およびシステムを提供する。本方法は、正しい試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。
したがって、一態様において、本発明は、遺伝子解析を実施するための方法を提供する。本方法は、
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
実施形態において、本方法は、対立遺伝子プロファイリング一致表を生成することをさらに含む。一実施形態において、本方法は、第1の対立遺伝子型および第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを含む。
様々な実施形態において、遺伝子配列決定は、全ゲノム配列決定(WGS)または急速全ゲノム配列決定(rWGS)または全エクソーム配列決定(WES)、次世代配列(NGS)、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む。
配列決定が、WESまたは標的遺伝子パネル配列決定を含む実施形態において、これらの用途において対立遺伝子型決定を可能にする、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを有するパネルが、利用される。
したがって、本発明は、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを有するパネルをさらに提供する。実施形態において、各オリゴヌクレオチドは、約50〜120ヌクレオチドの長さである。一実施形態において、各オリゴヌクレオチドは、約50ヌクレオチド以上の長さである。一実施形態において、各オリゴヌクレオチドは、120ヌクレオチド以下の長さである。
一実施形態において、本発明は、本開示の方法を実施するように構成されている遺伝子解析システムを提供する。システムは、(a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)少なくとも1つのプロセッサによって実行され、本開示の方法、例えば、対立遺伝子型を決定して、対立遺伝子プロファイリング一致表を生成し、そして、第1の対立遺伝子型および第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することを実施するように構成されている、解析コンポーネントと、を含む。
別の実施形態において、本発明は、本発明の方法を実施するためのシステムを提供する。システムは、少なくとも1つのプロセッサと、非一時的メモリとを有するコントローラを含む。コントローラは、本明細書に記載される方法のプロセスのうちの1つ以上を実施するように構成されている。
さらに別の実施形態において、本発明は、コンピュータプログラムで符号化された非一時的なコンピュータ可読格納媒体を提供する。プログラムは、1つ以上のプロセッサによって実行されるときに、1つ以上のプロセッサに、本開示の方法を実装する動作を実施させる、命令を含む。
また別の実施形態において、本発明は、コンピューティングシステムを提供する。システムは、メモリと、メモリに結合された1つ以上のプロセッサとを含み、1つ以上のプロセッサは、本開示の方法を実装する動作を実施するように構成される。
発明の詳細な説明
本発明は、複数の対立遺伝子型決定技術の組み合わせを含む、試料同一性を確実にするための革新的な方法に基づく。本開示の方法論は、試料同一性を保証して、異なる試料間の潜在的な交差汚染を検出するために、GlobalFiler(商標)PCR増幅キットによって、およびLobSTR(商標)ソフトウェアを使用してNGSによって生成されたSTR(短鎖縦列反復)対立遺伝子プロファイリングの一致を比較することを含む。
GlobalFiler(商標)パネルは、ヒトゲノム内の24の位置の対立遺伝子状態の決定、ならびに2つ以上の試料の汚染(混合)の事象の特定を可能にする。WGSまたはWESまたはNGSパネル上の計算ワークフロー(配列番号1〜41のオリゴヌクレオチドがプールダウンプローブ設計に含まれている)データセットは、コンピュータ上での(in silico)STR推論ソフトウェア(lobSTR(商標)など)を使用して、ヒトゲノム内の同じ24の位置の対立遺伝子状態の独立した決定を可能にする。24の位置のうち18以上が一致しているならば2つの試料は同じ個体由来であったという統計的枠組みは、いかなる合理的な疑いも排除する(1/1,000,000,000,000,000未満の誤差の確率)ことを可能にするものである。
STRによって予測された対立遺伝子型プロファイリングと、WGSまたはWESによって予測された対立遺伝子型プロファイリングとの間の一致は、高い一貫性がある。GlobalFiler(商標)を使用したSTR遺伝子型決定は、高精度および高感度で一貫した遺伝子座プロファイリングを生成することができる。ワークフローは、比較的シンプルかつ簡単であり、実験室の技術者は4〜6時間以内に完了させる。STR反応を設定することは、マイクロアレイほど大きなバッチセットを必要としない。さらに、バッチ中の比較的小さな試料セットにより、試薬は失われない。
本組成物および方法を記載する前に、本発明は、記載される特定の方法および実験条件に限定されず、そのような組成物、方法および条件は、変動し得ることを理解されたい。また、本明細書で使用される用語は、特定の実施形態を記載することのみを目的としており、本発明の範囲は、添付の特許請求の範囲にのみ限定されるため、限定することを意図するものではないことも理解されたい。
本明細書および添付の特許請求の範囲で使用されるように、単数形「a」、「an」、および「the」は、文脈が明示的に別段の指示に示さない限り、複数形の参照を含む。したがって、例えば、「方法」への参照は、この開示などを読むと当業者に明らかになるであろう、本明細書に記載されるタイプの1つ以上の方法、および/またはステップを含む。
別段の定義がない限り、本明細書で使用される全ての技術用語および科学用語は、本発明が属する当業者によって一般に理解される意味と同じ意味を有する。本明細書に記載されるものと類似または同等の任意の方法および材料は、本発明の実践または試験に使用されることができるが、好ましい方法および材料は、ここに記載される。
方法
本発明は、対立遺伝子型決定を介して遺伝子解析を行うための方法を提供する。本方法は、試料同一性を確実にするために、異なるタイプの対立遺伝子型決定技術の組み合わせを利用する。
したがって、一態様において、本発明は、遺伝子解析を実施するための方法を提供する。本方法は、
(a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
(b)遺伝子配列決定を介して試料の第2の対立遺伝子型を決定することと、
(c)第1の対立遺伝子型と第2の対立遺伝子型との間の対立遺伝子一致を決定することと、を含む。
本開示の方法は、対立遺伝子型を生成するための遺伝子配列決定を企図する。
配列決定は、当該技術分野で既知の任意の方法によって行われ得る。配列決定方法は、Maxam−Gilbert配列決定に基づく技法、鎖終了に基づく技法(chain−termination−based techniques)、ショットガン配列決定、架橋PCR配列決定、単一分子リアルタイム配列決定、イオン半導体配列決定(Ion Torrent(商標)配列決定)、ナノポア配列決定、パイロシークエンス(454)、合成による配列決定、ライゲーションによる配列決定(SOLiD(商標)配列決定)、電子顕微鏡による配列決定、ジデオキシ配列決定反応(Sanger法)、大規模並列配列決定、ポロニー配列決定、およびDNAナノボール配列決定を含むが、これらに限定されない。いくつかの実施形態において、配列決定は、プライマーをテンプレートにハイブリダイズしてテンプレート/プライマー二本鎖を形成すること、ポリメラーゼがテンプレート依存的な様式でプライマーにヌクレオチドを付加するのを可能にする条件下で、検出可能に標識されたヌクレオチドの存在下で二本鎖をポリメラーゼ酵素と接触させること、組み込まれた標識ヌクレオチドからのシグナルを検出すること、少なくとも1回、接触および検出ステップを連続的に繰り返すことを含み、組み込まれた標識ヌクレオチドの連続検出は、核酸の配列を決定する。いくつかの実施形態において、配列決定は、対の末端リードを取得することを含む。
いくつかの実施形態において、核酸の配列決定は、全ゲノム配列決定(WGS)、急速WGS、全エクソーム配列決定(WES)、標的遺伝子パネル配列決定、次世代配列決定(NGS)、またはそれらの任意の組み合わせを使用して実施される。いくつかの実施形態において、標的配列決定が実施されており、DNAまたはRNA配列決定のいずれかであり得る。標的配列決定は、全ゲノムのサブセットに対するものであり得る。いくつかの実施形態において、標的配列決定は、イントロン、エクソン、非コード配列、またはそれらの組み合わせに対するものである。DNAは、大規模並列配列決定であるNGSプラットフォームを使用して配列決定される。NGS技術は高スループット配列情報を提供し、目的の配列に整列する各配列リードがカウント可能であるという点で、デジタル定量情報を提供する。特定の実施形態において、クローン増幅されたDNAテンプレートまたは単一のDNA分子は、フローセル内で(例えば、国際公開第WO2014/015084号に記載されるように)大規模並列様式で配列決定される。高スループット配列情報に加えて、NGSは、各配列リードがカウント可能であり、個々のクローナルDNAテンプレートまたは単一のDNA分子を表すという点で、定量的情報を提供する。NGSの配列決定技術は、パイロシークエンス、可逆的ダイターミネーターを用いた合成による配列決定、オリゴヌクレオチドプローブライゲーションによる配列決定、およびイオン半導体配列決定を含む。個々の試料由来のDNAを個別に配列決定することができ(すなわち、単一配列決定)、または複数の試料由来のDNAをプールして、一回の配列決定ランでインデックス化ゲノム分子として配列決定して(すなわち、多重配列決定)、最大数億リードのDNA配列を生成することができる。市販のプラットフォームに、例えば、合成による配列決定、イオン半導体配列決定、パイロシークエンス、可逆的ダイターミネーター配列決定、ライゲーションによる配列決定、単一分子配列決定、ハイブリダイゼーションによる配列決定、およびナノポア配列決定のためのプラットフォームを含む。実施形態において、本開示の方法論は、Illumina,Inc(HiSeq(商標)X10、HiSeq(商標)1000、HiSeq(商標)2000、HiSeq(商標)2500、HiSeq(商標)4000、NovaSeq(商標)5000、NovaSeq(商標)6000、Genome Analyzers(商標)、MiSeq(商標)システム)、Applied Biosystems Life Technologies(ABI PRISM(商標)配列検出システム、SOLiD(商標)システム、Ion PGM(商標)シーケンサー、イオンProton(商標)シーケンサーなどのシステムを利用する。
「ポリヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」という用語は、同義に使用される。これらは、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはその誘導体のいずれかの任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知または未知の任意の機能を実施し得る。ポリヌクレオチドは、一本鎖もしくは多本鎖(例えば、一本鎖、二本鎖、および三重らせん)であり得、修飾ヌクレオチドまたは塩基もしくはそれらの誘導体を含む、デオキシリボヌクレオチド、リボヌクレオチド、および/またはデオキシリボヌクレオチドもしくはリボヌクレオチドの誘導体もしくは修飾形態を含有する。遺伝子コードが縮重しているため、2つ以上のコドンは、特定のアミノ酸をコードするために使用され得、本発明は、特定のアミノ酸配列をコードするポリヌクレオチドを包含する。ヌクレアーゼ耐性を増加させる修飾(例えば、デオキシ、2’−O−Me、ホスホロチオエートなど)を含む使用条件下でポリヌクレオチドが所望の官能性を保持する限り、任意のタイプの修飾ヌクレオチドまたはヌクレオチド誘導体が使用され得る。標識は、検出または捕捉、例えば、放射性もしくは非放射性標識またはアンカー、例えば、ビオチンの目的のために組み込まれ得る。ポリヌクレオチドという用語はまた、ペプチド核酸(PNA)も含む。ポリヌクレオチドは、天然に存在し得るか、または非天然に存在し得る。ポリヌクレオチドは、RNA、DNA、またはその両方、および/または修飾形態および/またはそれらの誘導体を含有し得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。1つ以上のホスホジエステル結合は、代替の連結基によって置き換えられ得る。これらの代替の連結基は、リン酸塩が、P(O)S(「チオエート」)、P(S)S(「ジチオエート」)、(O)NR(「アミデート」)、P(O)R、P(O)OR’、COまたはCH(「ホルムアセタール」)で置き換えられる実施形態を含むが、これらに限定されず、各RまたはR’は、独立して、H、または任意にエーテル(−−O−−)連結、アリール、アルケニル、シクロアルキル、シクロアルケニル、もしくはアラルジルを含有する、置換もしくは非置換アルキル(1〜20C)である。以下は、ポリヌクレオチドの非限定的な例である:遺伝子または遺伝子断片のコード領域または非コード領域、遺伝子間DNA、結合解析から定義される遺伝子座(遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、短い干渉RNA(siRNA)、短いヘアピンRNA(shRNA)、マイクロRNA(miRNA)、小ヌクレオラールRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、アダプター、およびプライマー。ポリヌクレオチドは、メチル化ヌクレオチドおよびヌクレオチド誘導体などの修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造への修飾は、ポリマーの組立の前または後に得られ得る。ヌクレオチドの配列は、非ヌクレオチドコンポーネントによって中断され得る。ポリヌクレオチドは、標識コンポーネント、タグ、反応性部分、または結合パートナーとのコンジュゲーションなどにより、重合後にさらに修飾され得る。特に明記しない限り、ポリヌクレオチド配列は、提供される場合、5’〜3’方向に列挙される。
実施形態において、配列決定は、オリゴヌクレオチドのパネルの使用を含む。例えば、パネルは、配列決定が、WESまたは標的遺伝子パネル配列決定を含む場合に、有用である。
したがって、本発明は、1つ以上のオリゴヌクレオチドを有するパネルを提供する。実施形態において、オリゴヌクレオチドは、表Iに示すように、配列番号1〜41から選択される1つ以上のオリゴヌクレオチドを含む。
Figure 2021530203
本発明のポリヌクレオチド、例えば、本発明のパネルのオリゴヌクレオチドは、任意の好適な長さのDNAまたはRNA分子であり得る。例えば、当業者は、標的遺伝子パネルで利用されるオリゴヌクレオチドに好適な長さを理解するだろう。かかる分子は、典型的には、約50〜150、50〜140、50〜130、50〜120、50〜110、50〜100、50〜100、50〜90、50〜80、50〜70、または50〜60ヌクレオチドの長さである。例えば、分子は、約50、55、60、65、70、75、80、85、90、95、100、105、110、115、または120ヌクレオチドの長さであり得る。かかるポリヌクレオチドは、少なくとも約50ヌクレオチド、少なくとも約55ヌクレオチド、少なくとも約60ヌクレオチド、少なくとも約65ヌクレオチド、少なくとも約70ヌクレオチド、少なくとも約75ヌクレオチド、少なくとも約80ヌクレオチド、少なくとも約85ヌクレオチド、少なくとも約90ヌクレオチド、少なくとも約95ヌクレオチド、少なくとも約100ヌクレオチド、少なくとも約110ヌクレオチド、少なくとも約120ヌクレオチドまたは120ヌクレオチド超を含む、少なくとも約50〜約120ヌクレオチド以上を含み得る。
本明細書で使用される場合、「ポリペプチド」は、アミノ酸から構成され、当業者によってタンパク質として認識される組成物を指す。アミノ酸残基のための従来の1文字または3文字のコードは、本明細書で使用される。「ポリペプチド」および「タンパク質」は、本明細書では、任意の長さのアミノ酸のポリマーを指すように同義に使用される。ポリマーは、直鎖状、または分岐状であり得、修飾アミノ酸を含み得、非アミノ酸によって中断され得る。この用語はまた、天然にまたは介入によって修飾されたアミノ酸ポリマー、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、または任意の他の操作もしくは修飾、例えば、標識コンポーネントとのコンジュゲーションも包含する。また、定義には、例えば、アミノ酸(例えば、非天然アミノ酸、合成アミノ酸などを含む)の1つ以上の誘導体を含有するポリペプチド、ならびに当該技術分野で既知の他の修飾も含まれる。
本明細書で使用される場合、本明細書で「試料」という用語は、核酸を含有するか、または核酸を含有すると推定される任意の物質を指す。試料は、被験者から得られた生体試料であり得る。核酸は、RNA、DNA、例えば、ゲノムDNA、ミトコンドリアDNA、ウイルスDNA、合成DNA、またはRNAから逆転写されたcDNAであることができる。核酸試料中の核酸は、概して、ハイブリダイズされたプライマーの伸長のためのテンプレートとして仕える。いくつかの実施形態において、生体試料は、生体流体試料である。流体試料は、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液(cavity rinse)、排泄物、または器官洗浄液(organ rinse)であり得る。流体試料は、実質的に細胞を含まない液体試料(例えば、血漿、血清、汗、尿、および涙)であることができる。他の実施形態において、生体試料は、固体生体試料、例えば、排泄物または組織生検、例えば、腫瘍生検である。試料はまた、インビトロ細胞培養成分(細胞培養培地中の細胞の成長から生じる条件付き培地、組換え細胞、および細胞コンポーネントを含むが、これらに限定されない)を含むことができる。いくつかの実施形態において、試料は、複数の供給源由来の核酸の混合物である生体試料であり、すなわち、1つの生体試料に2つ以上の寄与因子、例えば、2つ以上の個体が存在する。一実施形態において、生体試料は、乾燥した血斑である。
本発明において、被験者は、典型的にはヒトであるが、イヌ、ネコ、ウサギ、ウシ、鳥、ラット、ウマ、ブタ、またはサルを含むが、これらに限定されない、そのゲノム上にメチル化マークを有する任意の種であることができる。
コンピュータシステム
本発明は、機能的コンポーネントおよび様々な処理ステップの観点から部分的に記載される。そのような機能的コンポーネントおよび処理ステップは、指定された機能を実施して、様々な結果を達成するように構成されている任意の数のコンポーネント、動作、および技術によって実現され得る。例えば、本発明は、様々な機能を実行し得る、様々な生物学的試料、バイオマーカー、要素、材料、コンピュータ、データソース、格納システムおよび媒体、情報収集技術およびプロセス、データ処理基準、統計解析、回帰解析などを用い得る。追加的に、本発明は、遺伝子解析に関連して記載されているが、本発明は、任意の数の用途、環境、およびデータ解析と併せて実践され得、本明細書に記載されるシステムは、本発明のための単なる例示的な用途である。
本発明の様々な態様による遺伝子解析の方法は、例えば、コンピュータシステム上で動作するコンピュータプログラムを使用して、任意の好適な方法で実装され得る。本発明の様々な態様に従った、例示的な遺伝子解析システムは、コンピュータシステム、例えば、プロセッサおよびランダムアクセスメモリ、例えば、リモートアクセス可能なアプリケーションサーバ、ネットワークサーバ、パーソナルコンピュータまたはワークステーションを含む、従来のコンピュータシステムと併せて実装され得る。コンピュータシステムはまた、大量格納システムおよびユーザインターフェース、例えば、従来のモニタ、キーボード、およびトラッキングデバイスなどの追加のメモリデバイスまたは情報格納システムを適切に含む。しかしながら、コンピュータシステムは、任意の好適なコンピュータシステムおよび関連する機器を含み得、任意の好適な様式で構成され得る。一実施形態において、コンピュータシステムは、スタンドアロンシステムを含む。別の実施形態において、コンピュータシステムは、サーバおよびデータベースを含むコンピュータのネットワークの一部である。
遺伝子情報を受信、処理、および解析するために必要とされるソフトウェアは、単一のデバイスに実装され得るか、または複数のデバイスに実装され得る。ソフトウェアは、情報の格納および処理がユーザに対して遠隔で行われるように、ネットワークを介してアクセス可能であり得る。本発明の様々な態様による遺伝子解析システムおよびその様々な要素は、データ収集、処理、および/または解析などの遺伝子解析を容易にするための機能および動作を提供する。本遺伝子解析システムは、試料に関連する情報を維持して、解析を容易にする。例えば、本実施形態において、コンピュータシステムは、ゲノムに関連する情報を受信、格納、検索、解析、および報告し得る、コンピュータプログラムを実行する。コンピュータプログラムは、生データを処理し、補足データを生成するための処理モジュール、ならびに生データおよび補足データを解析して遺伝子解析を実施するための解析モジュールなどの、様々な機能または動作を実施する複数のモジュールを含み得る。
遺伝子解析システムによって実施される手順は、遺伝子解析を容易にするための任意の好適なプロセスを含み得る。一実施形態において、遺伝子解析システムは、対立遺伝子の一致を決定するように構成される。
遺伝子解析システムはまた、様々な追加のモジュールおよび/または個々の機能を提供し得る。例えば、遺伝子解析システムは、例えば、処理および解析機能に関連する情報を提供するための、報告機能を含み得る。遺伝子解析システムはまた、アクセスを制御して、他の管理機能を実施するなどの、様々な管理および管理機能を提供し得る。
以下の実施例は、本発明の利点および特徴をさらに例示するために提供されるが、本発明の範囲を限定することを意図しない。この実施例は、使用され得るものの典型であるが、当業者に既知の他の手順、方法論、または技術は、代替的に、使用され得る。
実施例I
NGS WGS試料同一性保証
以下の方法論は、試料同一性を決定するために利用される。
ステップ1.STR増幅ワークフロー
1.ThermoFisher GlobalFiler(商標)PCR増幅キットを用いて、ゲノムDNAまたは血斑(1.2mm)を使用してSTR PCR増幅を設定する。
2.AB Veriti(商標)PCRマシンを使用してサイクリングを実行する。
3.AB Genetic Analyzer(商標)で電気泳動を設定する。
4.GeneMapper(商標)ソフトウェアを使用して、STR対立遺伝子プロファイリングを生成する。
5.STR対立遺伝子プロファイリングを報告する。
STR増幅ワークフローの結果:24対の数字−現在、個々のDNAのデジタル指紋を含む、対立遺伝子型としても知られている。
追加的に、試料がDNAを含有しない、非ヒトDNAを含有する、または2つ以上の個々のDNAを含有する場合、警告フラグが立ち得る。
ステップ2.WGSまたはWESワークフロー(ステップ1と並行して実施され得る)
1.同じ試料(または同じ個体由来の別の試料)を使用して、PCRを含まないIllumina WGS(商標)ライブラリ(WGS(商標)ライブラリは、生体認証マーカーDNA断片を自然に含む)を作製する。代替的に、またはそれに追加的に、同じ試料(または同じ個体由来の別の試料)を使用して、溶液捕捉標的アプローチを使用して、IDT xGEN(商標)WESプローブ、ミトコンドリアパネル、および/または表Iに示されるカスタム生体認証マーカープローブと結合した市販のKAPAHyper(商標)バーコード化ペアエンドライブラリを使用してWES(商標)ライブラリを作製する。表Iのカスタム生体認証マーカープローブは、WES(商標)ライブラリのバイオマーカーの近辺で試料DNAを捕捉する。
2.HiSeq(商標)2500もしくは4000、またはNovaSeq(商標)6000、または他のハイスループットシーケンサ上で試料をロードする。
3.脱多重化、マッピング、および診断バリアント呼び出しを含む、配列決定後解析を実施する。
4.(lobSTR(商標)などの、特殊なソフトウェアを使用して)STR対立遺伝子プロファイルを計算的に決定する。
5.WGSデータによって呼び出されるSTRを報告する。
WGSワークフローからの結果:少なくとも21対の数字(および追加のN/D(「未定」)呼び出し)−個々のDNAの独立したデジタル指紋を含む対立遺伝子型。
追加的に、試料がDNAを含有しない、非ヒトDNAを含有する、または2つ以上の個々のDNAを含有する場合、警告フラグが立ち得る。
ステップ3.GlobalFiler(商標)によって呼び出されて、WGSまたはWESまたはパネル配列決定によって呼び出されるSTR対立遺伝子プロファイリングを使用して一致を生成する。
過去の試料から統計的に導き出された推論(ならびに前述のワークフローの両方の広範な科学的検証)を使用して、その後、2つの対立遺伝子型が同じ個体に由来し、個々のDNAの処理中に偶発的なスワップ、混合物、または他の干渉が発生しないことを保証する可能性がある。これは、ステップ2で産生される臨床遺伝子診断が意図される個体のためであることを保証する。
以下に示される対立遺伝子プロファイリング一致表は、本明細書に記載される方法を使用して生成される。
Figure 2021530203
コア生体認証DNA捕捉試薬配列は、表Iに示されるように合成されて、遺伝子標的配列パネル(WESを含む)DNA捕捉試薬に添加され得る。いくつかの実施形態において、より長いDNA試薬配列は、上に示されるコアDNA配列を取り囲む、参照ヒトゲノム配列を使用して、設計されることができる。一実施形態において、IDT xGEN(商標)エクソーム研究パネルv1.0とIDT xGEN(商標)ロックダウンカスタムプローブを使用して、長さ120のオリゴヌクレオチドは、上記の表Iに示されるコア生体認証DNA捕捉試薬配列を含む配列が使用される。
本発明は、上記の実施例を参照して記載されてきたが、修正および変形は、本発明の趣旨および範囲内に包含されることを理解されたい。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。

Claims (21)

  1. (a)短鎖縦列反復(STR)増幅を介して試料の第1の対立遺伝子型を決定することと、
    (b)遺伝子配列決定を介して前記試料の第2の対立遺伝子型を決定することと、
    (c)前記第1の対立遺伝子型と前記第2の対立遺伝子型との間の対立遺伝子一致を決定することと
    を含む、方法。
  2. (c)が、対立遺伝子プロファイリング一致表を生成することを含む、請求項1に記載の方法。
  3. 前記第1の対立遺伝子型および前記第2の対立遺伝子型が単一の対象のものであるかどうかを決定するために統計的確率を計算することをさらに含む、請求項1に記載の方法。
  4. 前記被験者が、ヒトである、請求項3に記載の方法。
  5. 前記第1の対立遺伝子型が、GeneMapper(商標)を介して生成される、請求項1に記載の方法。
  6. 前記第2の対立遺伝子型が、lobSTR(商標)を介して生成される、請求項1に記載の方法。
  7. 前記試料が、生体試料である、請求項1に記載の方法。
  8. 前記試料が、全血、血漿、血清、腹水、脳脊髄液、汗、尿、涙、唾液、口腔試料、腔洗浄液(cavity rinse)、排泄物、器官洗浄液(organ rinse)、毛または皮膚である、請求項1に記載の方法。
  9. 前記試料が、血液である、請求項1に記載の方法。
  10. 遺伝子配列決定が、全ゲノム配列決定(WGS)、急速全ゲノム配列決定(rWGS)、全エクソーム配列決定(WES)、次世代配列(NGS)、標的遺伝子パネル配列決定、またはそれらの組み合わせを含む、請求項1に記載の方法。
  11. WESまたは標的遺伝子パネル配列決定が、配列番号1〜41からなる群から選択される1つ以上のオリゴヌクレオチドを有するパネルを含む、請求項10に記載の方法。
  12. 各オリゴヌクレオチドが、約50〜120ヌクレオチドの長さである、請求項11に記載の方法。
  13. 各オリゴヌクレオチドが、50ヌクレオチド以上の長さである、請求項11に記載の方法。
  14. 各オリゴヌクレオチドが、120ヌクレオチド以下の長さである、請求項11に記載の方法。
  15. (a)および(b)が、並行して実施される、請求項1に記載の方法。
  16. 配列番号1〜41からなる群から選択される1つ以上のオリゴヌクレオチドを含む、パネル。
  17. 各オリゴヌクレオチドが、約50〜120ヌクレオチドの長さである、請求項16に記載のパネル。
  18. 各オリゴヌクレオチドが、50ヌクレオチド以上の長さである、請求項16に記載のパネル。
  19. 各オリゴヌクレオチドが、120ヌクレオチド以下の長さである、請求項16に記載のパネル。
  20. (a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)前記少なくとも1つのプロセッサによって実行され、(i)前記配列情報から対立遺伝子型を決定し、(ii)対立遺伝子プロファイリング一致表を生成し、そして、(iii)第1の対立遺伝子型および第2の対立遺伝子型が単一の対象由来であるかどうかを決定するために統計的確率を計算するように、構成されている、解析コンポーネントと、を備える、遺伝子解析システム。
  21. (a)メモリに動作可能に接続されている少なくとも1つのプロセッサと、(b)DNA試料中のDNAのPCR増幅から生成された配列情報を含むDNA解析情報を受信するように構成されている受信機コンポーネントと、(c)前記少なくとも1つのプロセッサによって実行され、請求項1に記載の(a)〜(c)を実施するように構成されている、解析コンポーネントと、を備える、遺伝子解析システム。
JP2020571427A 2018-06-29 2019-06-28 試料同一性保証のための方法およびシステム Pending JP2021530203A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862692366P 2018-06-29 2018-06-29
US62/692,366 2018-06-29
PCT/US2019/039859 WO2020006431A1 (en) 2018-06-29 2019-06-28 Method and system for sample identity assurance

Publications (1)

Publication Number Publication Date
JP2021530203A true JP2021530203A (ja) 2021-11-11

Family

ID=68987607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020571427A Pending JP2021530203A (ja) 2018-06-29 2019-06-28 試料同一性保証のための方法およびシステム

Country Status (6)

Country Link
US (1) US20200005894A1 (ja)
EP (1) EP3815091A4 (ja)
JP (1) JP2021530203A (ja)
AU (1) AU2019291926A1 (ja)
IL (1) IL279770A (ja)
WO (1) WO2020006431A1 (ja)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011207544A1 (en) * 2010-01-19 2012-09-06 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
US20140163900A1 (en) * 2012-06-02 2014-06-12 Whitehead Institute For Biomedical Research Analyzing short tandem repeats from high throughput sequencing data for genetic applications
WO2014015084A2 (en) * 2012-07-17 2014-01-23 Counsyl, Inc. System and methods for detecting genetic variation
US9181583B2 (en) * 2012-10-23 2015-11-10 Illumina, Inc. HLA typing using selective amplification and sequencing
KR101533792B1 (ko) * 2015-02-24 2015-07-06 대한민국 Ngs 기반 인간 객체의 상염색체 분석방법
EP4407622A2 (en) * 2015-07-14 2024-07-31 Personal Genome Diagnostics Inc. Neoantigen analysis
WO2017070497A1 (en) * 2015-10-21 2017-04-27 Dana-Farber Cancer Institute, Inc. Methods and compositions for use of driver mutations in cll
KR101667526B1 (ko) * 2015-12-30 2016-10-19 대한민국 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법
US20170226594A1 (en) * 2016-02-08 2017-08-10 Wafa Ali Rashed Altayari Short tandem repeat (str) dna fingerprint method and kit
US10822647B2 (en) * 2016-07-12 2020-11-03 Biodynamics S.R.L. Methods for using long ssDNA polynucleotides as primers (superprimers) in PCR assays

Also Published As

Publication number Publication date
US20200005894A1 (en) 2020-01-02
EP3815091A1 (en) 2021-05-05
WO2020006431A1 (en) 2020-01-02
IL279770A (en) 2021-03-01
AU2019291926A1 (en) 2021-02-18
EP3815091A4 (en) 2022-03-23

Similar Documents

Publication Publication Date Title
Kumar et al. Next-generation sequencing and emerging technologies
Goodwin et al. Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome
Liu et al. Interrogating the “unsequenceable” genomic trinucleotide repeat disorders by long-read sequencing
Chen et al. RNA editome in rhesus macaque shaped by purifying selection
EP3631018B1 (en) Methods to detect large rearrangements in brca1/2
Li et al. Quality control of RNA-seq experiments
CN108138227A (zh) 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差
JP7171709B2 (ja) 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法
KR20190112843A (ko) 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
Barone et al. HLA-genotyping of clinical specimens using Ion Torrent-based NGS
CN113614246A (zh) 用于鉴别肿瘤模型的方法和组合物
US20150344977A1 (en) Method And System For Detection Of An Organism
US20160319347A1 (en) Systems and methods for detection of genomic variants
JP2020532999A (ja) 非侵襲性の移植前遺伝子診断のためのシステムおよび方法
CN114657261B (zh) 一种与绵羊胸椎数相关的snp分子标记、引物组、试剂盒及检测方法和应用
EP1889924B1 (en) Method of designing probes for detecting target sequence and method of detecting target sequence using the probes
JP7532396B2 (ja) パートナー非依存性遺伝子融合検出のための方法
JP2022537442A (ja) ヒト胚におけるコピー数変異を検証するために単一ヌクレオチド変異の密度を使用するシステム、コンピュータプログラム製品及び方法
JP2021530203A (ja) 試料同一性保証のための方法およびシステム
JP7446343B2 (ja) ゲノム倍数性を判定するためのシステム、コンピュータプログラム及び方法
US20190373871A1 (en) Method for assaying genetic variants
US20040126800A1 (en) Regulatory single nucleotide polymorphisms and methods therefor
WO2024010809A2 (en) Methods and systems for detecting recombination events
CN118186097A (zh) 降解检材个体识别的snp复合体系
Liharska et al. Transcriptomics: Approaches to Quantifying Gene Expression and Their Application to Studying the Human Brain

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210304

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305