JP6623400B2 - 染色体異数性を測定するためのキット、装置及び方法 - Google Patents

染色体異数性を測定するためのキット、装置及び方法 Download PDF

Info

Publication number
JP6623400B2
JP6623400B2 JP2018509952A JP2018509952A JP6623400B2 JP 6623400 B2 JP6623400 B2 JP 6623400B2 JP 2018509952 A JP2018509952 A JP 2018509952A JP 2018509952 A JP2018509952 A JP 2018509952A JP 6623400 B2 JP6623400 B2 JP 6623400B2
Authority
JP
Japan
Prior art keywords
chromosome
coverage
value
fragment
copy number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018509952A
Other languages
English (en)
Other versions
JP2018514234A5 (ja
JP2018514234A (ja
Inventor
チョンジアン チェン
チョンジアン チェン
ジュンビン リアン
ジュンビン リアン
ザオリン シュアン
ザオリン シュアン
ダウェイ リ
ダウェイ リ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Annoroad Gene Technology Beijing co ltd
Zhejiang Annoroad Bio Technology Co Ltd
Original Assignee
Annoroad Gene Technology Beijing co ltd
Zhejiang Annoroad Bio Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Annoroad Gene Technology Beijing co ltd, Zhejiang Annoroad Bio Technology Co Ltd filed Critical Annoroad Gene Technology Beijing co ltd
Publication of JP2018514234A publication Critical patent/JP2018514234A/ja
Publication of JP2018514234A5 publication Critical patent/JP2018514234A5/ja
Application granted granted Critical
Publication of JP6623400B2 publication Critical patent/JP6623400B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明はバイオ医薬分野に属し、具体的に言えば、染色体異数性を測定するためのキット、装置及び方法に係る。
胎児遊離DNA(cff−DNA)は1997年にLoによって発見されてから二十数年になるが、この発見は非侵襲性の出産前診断方法(NIPT)に可能性を提供している。非侵襲性の出産前診断の方法は主に以下の二つの優位性がある:第一に、NIPTは流産のリスクを負うことがなく、臨床上において羊水検査及び臍帯穿刺(Cordocentesis)などの侵襲的方式によって行われる染色体核型分析は1/2000の流産リスクがあり、研究により早すぎる臍帯穿刺は胎児の位置の傾斜をもたらす可能性がある。もう一方で、NIPTは最も早い場合は妊娠8週目で測定を行うことができ、より早期にリスクを判定することができ、中絶が妊婦にもたらすリスクを低減させることができる。
これらのメリットにより、非侵襲の出産前関連の研究法は日進月歩であり、応用の範囲はますます広くなり、現在の方法例えばNIPT胎児染色体異数性検出、NIPT胎児単一遺伝子障害検出、NIPT胎児(Copy Number Variation,CNV)検出、NIPT胎児全ゲノム測定、NIPT胎児親子鑑定などがある。
現在、すべてのNIPT応用において、応用がもっとも広く比較的最も成熟しているのは胎児染色体異数性検出である。胎児染色体に対する異数性検出の多くのアルゴリズムにおいて、Chuiが2008年に発明したハイスループットシーケンシング(MPS)法は臨床的に適用されるものであり、頑健性を示している。ダウン症候群について、偽陽性率(FPR)は0.443%に、偽陰性率(FNR)は0.004%にまで低下する。エドワーズ症候群について、FPRは0.22%、FNRは0.025%である。
前記方法は非常に低いエラー率に達しているものの、判定ミスのリスクは依然存在する。そのため、現在の方法に対して改善を行い、測定のエラー率をできるだけ低下させる必要がある。
本出願の主な目的は染色体異数性を検出するキット、装置及び方法を提供することで、検出の偽陽性率を低下させることである。
前記目的を実現するために、本出願は一方では、染色体異数性を検出する方法を提供するものであり、該方法は以下のステップを含む:妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得る、前記シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各染色体の補正前カバレッジを得る、前記検出対象妊婦の各ウインドウ中の固有の配列の数量に対してZ検定を行い、Zcnv値を得て、さらに前記Zcnv値の大小に基づいて検出対象妊婦のコピー数異常染色体フラグメントを得る、前記検出対象妊婦のコピー数異常染色体フラグメントはシークエンスデータにおける300Kb以上のフラグメントであり、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントであり、検出対象妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響を利用することにより、各染色体の補正前カバレッジに対して補正を行い、これにより各染色体の補正後カバレッジを得る、及び各染色体の補正後カバレッジを用いて各染色体に対してZ検定を行い、Zaneu値を得て、さらにZaneu値の絶対値が3と等しくもしくはそれより大きいか否かによって前記染色体が異数性を有するかを判定する、前記Zaneu値の絶対値が3と等しくもしくはそれより大きい場合、前記染色体は異数性を有する、そのうち、前記検出対象妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響はパラメータαによって示され、胎児が母体のコピー数異常染色体フラグメントを遺伝している場合、パラメータαの計算式は式(1)に示す通りである:
胎児が母体のコピー数異常染色体フラグメントを遺伝していない場合、パラメータαの計算式は式(2)に示す通りである:
式(1)及び(2)において、mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである;nは検出対象妊婦の前記コピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントの出現する回数である;式(2)において、fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり且つ仮に胎児遊離DNAの濃度fが50%未満であり、さらに
を用いて、各染色体の補正前カバレッジに対して補正を行う、そのうち
は各記染色体の補正前カバレッジを示し、x'は各染色体の補正後染色体カバレッジを示すものである。
さらに、シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する形でカバレッジを計算することで、各染色体の補正前カバレッジを得る。
さらに、それぞれのウインドウのサイズは100Kbであり、且つ隣り合う二つのウインドウ間の重複度は50%である。
さらに、検出対象妊婦の各ウインドウ中の固有の配列の数量に対してZ検定を行い、Zcnv値を得て、さらにZcnv値に基づいて検出対象妊婦のコピー数異常染色体フラグメントを得るステップにおいて、前記シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計する、各染色体のGC含有量とマッピング率に基づいて各ウインドウの固有の配列の数量について計算を行い、各ウインドウの単一配列の数量の補正前カバレッジを得る、及び各ウインドウの固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得て、さらにZcnv値の大小により検出対象妊婦がコピー数異常染色体フラグメントを有するか否かを判定する、シークエンスデータ中に300Kb以上のフラグメントが存在し、且つ前記300Kb以上のフラグメント中のすべてのウインドウのうち80%以上のウインドウにおける固有の配列の数量のZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さい場合、300Kb以上のフラグメントが検出対象妊婦のコピー数異常染色体フラグメントであると判定する。
さらに、各染色体の補正後カバレッジを用いて各染色体に対してZ検定を行い、Zaneu値を得るステップにおいて、Zaneu値は
に従って計算され、そのうち、
はLOESSアルゴリズムによるものであり、既知の陰性サンプル群によって得られる補正前カバレッジであり、sは陰性サンプル群における
の標準偏差である。
前記目的を実現するために、本出願は一方において、染色体異数性を検出する装置を提供し、該装置は以下のモジュールを含む:シークエンスデータ取得モジュール、第一カバレッジ計算モジュール、Zcnv値計算モジュール、コピー数異常染色体フラグメント検索モジュール、コピー数異常染色体フラグメント認定モジュール、α第一計算モジュール、α第二計算モジュール、補正モジュール、第二カバレッジ計算モジュール、Zaneu値判定モジュール、染色体異数性認定モジュール。前記シークエンスデータ取得モジュールは、妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得るためのものであり、前記第一カバレッジ計算モジュールは、シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各染色体の補正前カバレッジを得るためのものであり、前記Zcnv値計算モジュールは、検出対象妊婦のウインドウ中の固有の配列の数量のZcnv値を計算するためのものであり、前記コピー数異常染色体フラグメント検索モジュールは、前記シークエンスデータ中において300Kb以上のフラグメントを検索するものであり、且つ前記300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントであり、コピー数異常染色体フラグメント認定モジュールは、シークエンスデータにおける検索により得られる300Kb以上のフラグメントで且つすべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントを検出対象妊婦のコピー数異常染色体フラグメントとして認定するものであり、α第一計算モジュールは、胎児が母体のコピー異常フラグメントを遺伝している場合、式(1)に示される計算式に従ってパラメータαを計算するものであり、そのうち、前記パラメータαは妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響である。
mはコピー数異常染色体フラグメントが存在する染色体の有効長さであり、単位はMbである;nは妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントの出現する回数である、α第二計算モジュールは、胎児が母体のコピー数異常の染色体を遺伝していない場合において、式(2)に示す計算式に従って前記パラメータαを計算するものであり、
mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである;nは検出対象妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦の前記コピー数異常染色体フラグメントの出現する回数である、fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり且つ仮に胎児遊離DNAの濃度fが50%未満であり、補正モジュールは、
を用いて、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得るものであり、そのうち、
は各染色体の補正前カバレッジを示し、x'は各染色体の補正後染色体カバレッジを示している、第二カバレッジ計算モジュールは、各染色体の補正後カバレッジを用いて各染色体のZaneu値を計算するものであり、Zaneu値判定モジュールは、Zaneu値の絶対値が3と等しくもしくはそれより大きいかを判定するものであり、染色体異数性認定モジュールは、Zaneu値の絶対値が3と等しくもしくはそれより大きい場合、染色体が異数性を有すると認定するものである。
さらに、第一カバレッジ計算モジュールは、シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する染色体ウインドウ分割サブモジュール、同じサイズのウインドウの形でカバレッジを計算することで、各染色体の補正前カバレッジを得る第一カバレッジ計算サブモジュールを含む。
染色体ウインドウ分割サブモジュールにおいて、それぞれのウインドウのサイズは100Kbであり、且つ隣り合う二つのウインドウの間の重複度は50%である。
さらに、固有の配列計算モジュールは、固有の配列統計ユニット、固有の配列カバレッジ計算ユニット、固有の配列cnv値計算ユニットを備え、固有の配列統計ユニットは、シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計するためのものであり、固有の配列カバレッジ計算ユニットは、各染色体のGC含有量及びマッピング率に基づいて各ウインドウの固有の配列の数量について計算を行い、ウインドウの固有の配列の数量の補正前カバレッジを得るためのものであり、固有の配列cnv値計算ユニットは、各ウインドウの固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得るためのものである。
さらに、第二カバレッジ計算モジュールにおいて、Zaneu
に従って計算され、そのうち、
はLOESSアルゴリズムにより、既知の陰性サンプル群から得られるカバレッジ値であり、sは陰性サンプル群における
の標準偏差である。
本発明はもう一方において、染色体異数性を検出するためのキットを提供し、該キットは検出試薬及び検出機器、第一カバレッジ計算機器、Zcnv値計算機器、コピー数異常染色体フラグメント検索機器、コピー数異常染色体フラグメント認定機器、α第一計算機器、α第二計算機器、補正機器、第二カバレッジ計算機器、Zaneu値判定機器、染色体異数性認定機器を備え、検出試薬及び検出機器は、検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得るためのものであり、第一カバレッジ計算機器は、シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各染色体の補正前カバレッジを得るためのものであり、Zcnv値計算機器は、検出対象妊婦の前記ウインドウ中の固有の配列の数量を用いてZ検定を行い、Zcnv値を得るためのものであり、コピー数異常染色体フラグメント検索機器は、シークエンスデータ中において300Kb以上のフラグメントを検索するものであり、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントであり、コピー数異常染色体フラグメント認定機器は、Zcnv値の大小により検出対象妊婦のコピー数異常染色体フラグメントを得るためのものであり、α第一計算機器は、胎児が母体の前記コピー異常フラグメントを遺伝している場合、式(1)に示される計算式に従ってパラメータαを計算するものであり、そのうち、パラメータαは妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響である、
mはコピー数異常染色体フラグメントが存在する染色体の有効長さであり、単位はMbである;nは検出対象妊婦の前記コピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントの出現する回数である、α第二計算機器は、胎児が母体のコピー数異常の染色体を遺伝していない場合において、式(2)に示す計算式に従ってパラメータαを計算するものであり、
mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである;nは検出対象妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントの出現する回数である、fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり且つ仮に胎児遊離DNAの濃度fが50%未満であり、補正機器は、
を用いて、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得るものであり、そのうち、
は各染色体の補正前カバレッジを示し、x'は各染色体の補正後染色体カバレッジを示している、
第二カバレッジ計算機器は、各染色体の補正後カバレッジを用いて各染色体のZaneu値を計算するものであり、
aneu値判定機器は、Zaneu値の絶対値が3と等しくもしくはそれより大きいか否かを判定するものであり、
染色体異数性認定機器は、Zaneu値の絶対値が3と等しくもしくはそれより大きい場合、染色体が異数性を有すると認定するものである。
さらに、第一カバレッジ計算機器は、シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割するための染色体ウインドウ分割部材、同じサイズのウインドウの形でカバレッジを計算し、各染色体の補正前カバレッジを得る第一カバレッジ計算部材を含む。
さらに、染色体ウインドウ分割部材において、ウインドウのサイズは100Kbであり、且つ隣り合う二つのウインドウの間の重複度は50%である。
さらに、固有の配列cnv値計算機器は、シークエンスデータ中の各配列のシークエンス深度により、各ウインドウの固有の配列の数量を統計する固有の配列統計部材、染色体のGC含有量とマッピング率を用いて各前記固有の配列の数量について計算を行い、各ウインドウの前記固有の配列の数量の補正前カバレッジを得る固有の配列カバレッジ計算部材、
各ウインドウの前記固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得る固有の配列cnv値計算部材を含む。さらに、第二カバレッジ計算機器において、Zaneu
に従って計算され、そのうち、
はLOESSアルゴリズムにより、既知の陰性サンプル群により得られる補正前カバレッジであり、sは陰性サンプル群における
の標準偏差である。
本出願の技術構成を用いて、母体染色体上に存在する特定サイズのコピー数異常染色体フラグメントをスクリーニングし、さらに染色体に異数性が存在するかを判定し、該母体のコピー数異常染色体フラグメントによる各染色体のカバレッジに対する影響を除去することにより、各染色体の補正後のカバレッジを得て、本出願の補正後のカバレッジの計算及び判定により得られた染色体異数性の結果はより正確である。
本出願の一部となる図面を用いて本出願に対してさらに理解を深め、本出願の例示的実施例及びその説明を本出願の解釈に用いるが、これらは本出願を不当に限定するものではない。図面は以下の通りである。
本出願の典型的な実施形態における染色体異数性を測定する方法のフロー模式図である。 本出願の典型的な実施形態における染色体異数性の検出装置の構造模式図である。 図3A、図3B及び図3Cはそれぞれ本出願の実施例1の13号染色体、18号染色体及び21号染色体異数性検出の補正結果の模式図である。 本出願の実施例2のサンプルEK01875及びBD01462の21号染色体上における異数性の補正結果の模式図である。 本出願の実施例3のサンプルEK01875の21号染色体の異数性検出の補正結果の模式図である。 本出願の実施例4のサンプルBD01462の21号染色体異数性検出の補正結果である。
説明すべきことは、矛盾しない前提下において、本出願の実施例及び実施例中の特徴は互いに組み合わせることができる。以下において実施例を参照しながら本出願を説明する。
本出願中において、ZcnvまたはZaneuは統計学中のZ検定の計算値であり、大量サンプル(即ちサンプル容量が30より多い)の平均値差異性検出に用いられる方法である。それは標準正規分布の理論により差異発生の確率を推測することで、二つの平均数の差異が顕著かを比較するものである。
マッピング率とはウインドウ内のシーケンス配列をゲノム参照配列上にマッピングした場合の比率である。シーケンス配列は同時にゲノム参照配列上の複数の位置にマッピングでき、唯一の配列ではない可能性があり、そのためウインドウ内のマッピング率は単一配列のマッピング率より大きいものである。
説明しておきたいことは、本出願の出願人は従来の方法を用いて大量に分析を行ったところ、少なくとも以下三種類のNIPT判定ミスに繋がる可能性が存在することを発見した。
まず、Loは1998年にcff−DNAが胎盤に由来することを発見しているが、これは胎盤モザイク(confined placental mosaicism:CPM))が出現した際、我々はNIPTの結果により胎児の状況を正確に予測することができず、結果が正確性を失いやすいことを意味している。次に、妊婦自身に一定のCNVが存在する場合、MPSに基づいてカバレッジを統計することにより、Z値に変換する方法は正確性に欠ける。妊婦に重複フラグメントが存在する場合、染色体上にマッピングした場合対応する固有の配列数が多くなり、カバレッジの向上によりZ値が大きくなり、偽陽性のリスクが大きくなる。逆に、妊婦にフラグメントの欠失が存在する場合、Z値が低下し、偽陰性のリスクが大きくなる。以前の研究でもわかるように、胎盤にモザイク(CPM)が出現し及び妊婦コピー数フラグメント異常(CNV)が出現することは、偽陽性判定の重要な原因となる。最後に、染色体カバレッジの計算またはGC含有量を利用したカバレッジ補正プロセスにはデータ変動が生じ、これにより誤差が生じる場合がある。
そのため、前記判定ミスの原因に対して総合的に分析した上で、本出願は染色体異数性を測定する方法を提供し、図1に示すように、該方法は以下のステップを含む:検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行い、すべての染色体を含むシークエンスデータを得る。シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各染色体の補正前カバレッジを得る。検出対象妊婦の各ウインドウにおける固有の配列の数量のZcnv値について計算を行い、さらにZcnvデータの大小により検出対象妊婦のコピー数異常染色体フラグメントを得る。検出対象妊婦のコピー数異常染色体フラグメントとは、シークエンスデータ中の300Kb以上のフラグメントである。さらに300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいのである。検出対象妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響を利用して、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る。及び各染色体の補正後カバレッジを用いて、各染色体のZaneu値を計算し、さらにZaneu値の絶対値が3と等しいかそれより大きいかによって染色体が異数性を有するかを判定する。Zaneu値の絶対値が3と等しいかそれより大きい場合、染色体は異数性である。そのうち、検出対象妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響をパラメータαで表示し、胎児が母体のコピー数異常染色体フラグメントを遺伝した場合、パラメータαの計算式は式(1)に示す通りである:
胎児が母体のコピー数異常染色体フラグメントを遺伝していない場合、パラメータαの計算式は式(2)に示す通りである:
式(1)及び式(2)において、mはコピー数異常染色体フラグメントが所在する染色体の有効長さを示すものであり、単位はMbである。nは検出対象妊婦のコピー数異常染色体フラグメントの長さを示し、単位はMbである。cnは妊婦のコピー数異常染色体フラグメントの出現する回数である。式(2)において、fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり、且つ仮に胎児遊離DNAの濃度fが50%未満の場合、
を利用して、各染色体のカバレッジに対して補正を行い、そのうち、
は各染色体の補正前カバレッジであり、x'は各染色体の補正後の染色体カバレッジである。
本出願の前記方法は、従来技術と同じように、シークエンスデータ中の母体にコピー数異常染色体フラグメントを直接除去して考慮しないではなく、母体染色体上に存在する特定サイズのコピー数異常染色体フラグメントをスクリーニングし、さらに染色体に異数性が存在するか否かを判定する際において、コピー数異常染色体フラグメントの各染色体のカバレッジに対する影響を除き、これにより染色体補正後のカバレッジを得て、これにより本出願の方法により測定される染色体異数性の結果はより正確である。
本出願の前記方法において、前記検出対象妊婦由来の末梢血の遊離DNAに含まれる胎児遊離DNAの濃度fの計算方法は本分野の通常の計算方法である。例えば、胎児が男性で、且つコピー数異常染色体フラグメントがX染色体にある場合、胎児遊離DNAの濃度は
によって計算され、そのうち、
はX染色体上のウインドウ平均固有の配列及びすべてのウインドウ平均固有の配列の比であり、コピー数異常染色体フラグメントが21、18または13号染色体にある場合、胎児遊離DNAの濃度は
によって計算され、そのうち、
は21、18または13号染色体のウインドウの平均固有の配列数及びすべてのウインドウの平均固有の配列数の比である。胎児が女性である場合、妊婦由来の末梢血の遊離DNAに対して特定遺伝子のメチル化測定を行う。その原理は以下である:特定の遺伝子の妊婦DNA中及び胎児DNA中におけるメチル化の形は異なるものである。例えば、胎児と胎盤由来のRASSF1A(3号染色体上)遺伝子は高度にメチル化されたものであり、母体自身由来のRASSF1A遺伝子は非メチル化されたものであり、メチル化感受性酵素、例えHhaI、BstUI(30U)及びHpaIIを用いてcffDNAを処理することで、非メチル化の遺伝子は消化されるが、メチル化された遺伝子は消化されなく、これによりQ−PCRによって胎児cffDNAの含有量の測定を行うことができる。具体的なステップは以下の文献を参照できる:PLOS ONE 9:71−7(2014),Quantification of Cell−Free DNA in Normal and Complicated Pregnancies:Overcoming Biological and Technical Issues。
本出願の前記方法において、各染色体の補正前カバレッジに対して計算を行う場合、染色体をウインドウに分割する形で計算を行うことで、相対的に安定的な染色体カバレッジを得ることができる。そのため、本出願の好ましい実施例において、シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する形でカバレッジを計算し、これにより染色体の補正前カバレッジを得る。
本出願のさらに好しい実施例において、ウインドウに分割した形でカバレッジを計算し、それぞれのウインドウのサイズは100Kbであり、且つ隣り合う二つのウインドウ間の重複度は50%である。それぞれのウインドウのサイズを100Kbに制御してさらに隣り合う二つのウインドウ間の重複度を50%に制御することで、相対的に安定的な染色体カバレッジが得られるだけでなく、さらにウインドウ間の重複度を向上させることでコピー数異常染色体フラグメントの正確度を向上させることができ、これにより妊婦コピー数異常染色体フラグメントの検出効率を向上させることができる。
本出願の前記方法において、通常のコピー数異常染色体フラグメントを計算する方法とステップに基づいて、シークエンスデータ品質または検出精度の違いにより、適宜コピー数異常染色体フラグメントが満たす条件を調整することで得られるようにする。本出願の好ましい実施例において、検出対象妊婦の各ウインドウ中の固有の配列数のZcnv値に対して計算を行い、さらにZcnv値により妊婦のコピー数異常染色体フラグメントを得るステップは以下を含む:シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計する。各染色体のGC含有量及びマッピング率に基づいて各ウインドウの固有の配列の数量について計算を行い、各ウインドウの固有の配列の数量の補正前カバレッジを得る。及び各ウインドウの固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得て、さらにZcnv値の大小のフラグメントにより検出対象妊婦がコピー数異常染色体フラグメントを有するか判定する。シークエンスデータ中に300Kb以上のフラグメントが存在し、且つ300Kb以上のフラグメント中のすべてのウインドウのうち80%以上のウインドウの固有の配列の数量のZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さい場合、300Kb以上のフラグメントは検出対象妊婦のコピー数異常染色体フラグメントとする。
本出願の前記各ウインドウの固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得るステップにおいて、標準化処理は各ウインドウの固有の配列の数量の補正値に対して、(x−u)/sd(x−u)を行い、そのうちxが補正後の値で、uはxの平均値であり、sdは標準偏差である。前記検出対象妊婦のコピー数異常染色体フラグメントを測定するステップにおいて、「少なくとも300Kbの領域及び該領域中の80%のウインドウのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さい」という条件に設定することで、本出願の前記検出ステップは信頼度の高い妊婦コピー数異常染色体フラグメントを検出することができ、さらにこれらのコピー数異常染色体フラグメントを利用してその所在する染色体のZcnv値に対して補正を行うことで、妊婦のコピー数異常染色体フラグメントの測定結果のエラーにより偽陰性の判定となることを回避できる。
本出願の前記方法において、各染色体の補正後カバレッジを用いて各染色体に対してZ検出を行い、Zaneu値を得るステップにおいて、Zaneu値は
によって計算され、そのうち、
はLOESSアルゴリズムにより、既知の陰性サンプル群により得られるカバレッジであり、sは陰性サンプル群における
の標準偏差である。前記式の計算により得られる補正後のZaneu値は染色体異数性をより正確に反応することができ、これにより測定結果はより正確となる。
本出願のもう一つの典型的な実施形態において、染色体異数性を検出する装置を提供し、図2に示すように、該装置は以下のモジュールを含む:シークエンスデータ測定モジュール:検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行い、これにより染色体のシークエンスデータが得られる。第一カバレッジ計算モジュール:シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、これにより各染色体の補正前カバレッジが得られる。Zcnv値計算モジュール:検出対象妊婦の各ウインドウ中の固有の配列の数量のZcnv値に対して計算を行う。コピー数異常染色体フラグメント検索モジュール:シークエンスデータ中において300Kb以上のフラグメントを検索するものであり、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいものである。コピー数異常染色体フラグメント決定モジュール:シークエンスデータから検索により得られる300Kb以上のフラグメントですべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントを検出対象妊婦のコピー数異常染色体フラグメントとする。α第一計算モジュール:胎児が母体のコピー数異常染色体フラグメントを遺伝している状況において、式(1)に示す計算式によりパラメータαを計算し、そのうち、パラメータαは妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響である。mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである。nは妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである。cnは妊婦のコピー数異常染色体フラグメントが出現する回数である。
α第二計算モジュール:胎児が母体のコピー数異常染色体を遺伝していない場合、式(2)に示す計算式でパラメータαを計算し、mはコピー数異常染色体フラグメントの染色体における有効長さであり、単位はMbである。nは妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである。cnは妊婦のコピー数異常染色体フラグメントの出現回数である。fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり、且つ胎児遊離DNAの濃度fは50%未満である。
補正モジュール:
を用いて、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る、そのうち、
は染色体の補正前カバレッジを示し、x'は各染色体の補正後の染色体カバレッジを示している。第二カバレッジ計算モジュール:各染色体の補正後カバレッジを用いて各染色体のZaneu値を得る。Zaneu値判定モジュール:Zaneu値の絶対値が3と等しいかそれより大きいかを判定する。染色体異数性認定モジュール:Zaneu値の絶対値が3と等しいかそれより大きい場合において、染色体が異数性を有すると認定する。
本出願の前記装置において、コピー数異常染色体フラグメント検索モジュール、コピー数異常染色体フラグメント認定モジュール及び補正モジュールを追加し、本出願は母体の染色体上に存在する少なくとも300Kbの領域で該領域中の80%のウインドウのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントをスクリーニングすることにより本出願の前記装置は信頼できる妊婦コピー数異常染色体フラグメントを検出し、さらにこれらのコピー数異常染色体フラグメントをその所在する染色体のZ検定値に対して補正を行い、さらに妊婦のコピー数異常染色体フラグメントの検出結果の間違いによって偽陰性の判定となることを回避できる。補正モジュールにより、該コピー数異常染色体フラグメントの各染色体のカバレッジに対する影響について補正を行い、これにより本出願の染色体異数性認定モジュールにより染色体異数性の認定結果をより正確にする。本出願の前記装置の補正モジュールにおいて、パラメータαの計算式中の胎児濃度は本分野の通常の計算方法であり、具体的には前記の通りであり、ここでは詳しく説明しない。
説明しなければならないことは、本出願の前記モジュールは装置の一部として一つの計算端末で稼働することができ、該計算機端末が提供するプロセッサにより前記シークエンスデータ検出モジュール、第一カバレッジ計算モジュール、固有の配列計算モジュール、コピー数異常染色体フラグメント検索モジュール、コピー数異常染色体フラグメント認定モジュール、α第一計算モジュール、α第二計算モジュール、補正モジュール、第二カバレッジ計算モジュール及び染色体異数性認定モジュールにより実現する技術構成であり、明らかにわかるように該計算機端末はハードウェアが実現する設備であり、プロセッサはプログラムを実行するためのハードウェア装置である。且つ本出願が提供する前記各機能性サブモジュールは移動端末、計算機端末または類似の計算装置中で稼働でき、記録媒体の一部として記憶することもできる。
本出願の前記装置において、前記第一カバレッジ計算モジュールは本分野の通常の計算モジュールに基づいて、シークエンスデータの違いにより適宜調整することで得られるものである。本出願の好ましい実施例において、前記第一カバレッジ計算モジュールは以下を含む:染色体ウインドウ分割サブモジュール:シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する;第一カバレッジ計算サブモジュール:同じサイズのウインドウの形でカバレッジを計算し、これにより各染色体の補正前カバレッジを得る。本出願の染色体ウインドウ分割サブモジュール及び第一カバレッジ計算サブモジュールの第一カバレッジ計算モジュールを用いて同じサイズのウインドウに分割する形で計算を行い、これにより比較的安定的なカバレッジを得ることができる。
本出願のより好ましい実施例において、前記染色体ウインドウ分割サブモジュールにおいて、それぞれのウインドウの大きさは100Kbであり、且つ隣り合う二つのウインドウの間の重複度は50%である。それぞれのウインドウを100Kbの大きさに分割する形で計算する計算モジュールは比較的安定的なカバレッジを得ることができ、もう一方ではウインドウ間のカバレッジを向上することでコピー数異常染色体フラグメントの精密度を向上させ、さらには妊婦のコピー数異常染色体フラグメントの検出効率を向上させることができる。
本出願の前記装置において、固有の配列計算モジュールは通常の計算モジュールで得ることができる。本出願の好ましい実施例において、前記固有の配列計算モジュールはさらに以下を含む:固有の配列統計ユニット:シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計する;固有の配列のカバレッジ計算ユニット:各染色体のGC含有量及びマッピング率に基づいて各ウインドウの固有の配列の数量について補正を行い、各ウインドウの固有の配列の数量の補正値を得る;固有の配列cnv値計算ユニット:各ウインドウの固有の配列の数量の補正値に対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得る。
本出願の前記固有の配列の計算モジュールは、まず固有の配列統計ユニットにより、シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計し、それから固有の配列カバレッジ計算ユニットを実行し、各染色体のGC含有量とマッピング率に基づいて各ウインドウの固有の配列の数量について計算を行い、各ウインドウの固有の配列の数量の補正前カバレッジを得て、それから固有の配列cnv値計算サブユニットを実行し、各ウインドウの固有の配列の数量の補正前カバレッジについて標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得る。前記ユニットは本分野の通常の計算ユニットに基づいて適宜調整したものであり、これはコピー数異常染色体フラグメント検索モジュールで検索及びコピー数異常染色体フラグメント認定モジュールで認定を行う根拠及び前提であり、これは検出対象サンプル中の母体DNAコピー数異常染色体フラグメントの存在の正確な認定に根拠を提供している。
本出願の前記装置において、第二カバレッジ計算モジュールにおいて、Zaneu
によって計算され、そのうち、
はLOESSアルゴリズムによるもので、既知の陰性サンプル群により得られる補正前のカバレッジであり、sは陰性サンプル群における
の標準偏差である。前記式の計算により得られる補正後のZaneu値はより正確に染色体異数性を反映することができ、これにより検出結果はより正確である。
本出願のもう一つの典型的な実施形態において、さらに染色体異数性を検出するキットを提供し、キットは以下を含む:シークエンスデータ取得機器:検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシークエンシングを行い、これによりすべての染色体を含むシークエンスデータを得る;第一カバレッジ計算機器:シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、これにより各染色体の補正前カバレッジを得る;Zcnv値計算機器:検出対象妊婦の各ウインドウ中の単一配列の数量のZcnv値に対して計算を行う;コピー数異常染色体フラグメント検索機器:シークエンスデータ中において300Kb以上のフラグメントを検索し、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントであり、コピー数異常染色体フラグメント認定機器:シークエンスデータ中から検索される300Kb以上のフラグメントで且つすべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントは検出対象妊婦のコピー数異常染色体フラグメントである;α第一計算機器:胎児が母体のコピー数異常染色体フラグメントを遺伝している場合において、式(1)に示される計算式でパラメータαを計算し、そのうち、パラメータαは妊婦のコピー数異常染色体フラグメントの各染色体の補正前カバレッジに対する影響である;mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである;nは妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントが出現する回数である;
α第二計算機器:胎児が母体のコピー数異常染色体を遺伝していない場合、式(2)に示されるようにパラメータαを計算し、mはコピー数異常染色体フラグメントが所在する染色体の有効長さであり、単位はMbである;nは妊婦のコピー数異常染色体フラグメントの長さであり、単位はMbである;cnは妊婦のコピー数異常染色体フラグメントの出現する回数である;fは検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度を示し且つ仮に胎児遊離DNAの濃度fは50%未満である;
補正機器:
を用いて各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る、そのうち、
は各染色体の補正前カバレッジを示し、x'は各染色体の補正後の染色体カバレッジを示す;第二カバレッジ計算機器:各染色体の補正後カバレッジを用いて各染色体のZaneu値を得る;Zaneu値判定機器:Zaneu値の絶対値が3と等しいかそれより大きいかを判定する;染色体異数性第一認定機器:Zaneu値の絶対値が3と等しいかそれより大きい場合、染色体が異数性を有すると認定する。
本出願の前記キットは、コピー数異常染色体フラグメント検索機器、コピー数異常染色体フラグメント認定機器及び補正機器を追加し、本出願は母体染色体上に存在する少なくとも300Kbの領域で且つ該領域中の80%のウインドウのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントであり、これにより本出願の前記キットは信頼できる妊婦コピー数異常染色体フラグメントを検出することができ、さらにこれらのコピー数異常染色体フラグメントを用いてその所在する染色体のZcnv値に対して補正を行うことで、妊婦のコピー数異常染色体フラグメントの測定結果の間違いにより偽陰性となる判定を回避できる。補正機器により該コピー数異常染色体フラグメントの各染色体のカバレッジに対する影響に対して補正を行い、これにより本出願の染色体異数性認定機器により染色体異数性の認定結果をより正確にする。本出願の前記キットの補正機器において、パラメータαの計算式中の胎児濃度は本分野の通常の計算方法であり、具体的には前記の通りであり、ここでは再度説明しない。
説明したいことは、本出願の前記部材、部品は機器の一部として一つの計算端末で稼働することができ、該計算機端末が提供するプロセッサを用いて前記シークエンスデータ検出機器、第一カバレッジ計算機器、固有の配列計算機器、コピー数異常染色体フラグメント検索機器、コピー数異常染色体フラグメント認定機器、α第一計算機器、α第二計算機器、補正機器、第二カバレッジ計算機器及び染色体異数性認定機器により実現する技術構成であり、明らかなように、該計算機端末はハードウェアで実現する設備であり、プロセッサはプログラムの実行に用いるハードウエアキットである。さらに、本出願が提供する前記各機能サブ機器は移動端末、計算機端末または類似の演算キット中で実行でき、記憶媒体の一部としても記憶することもできる。
本出願の前記キットにおいて、前記第一カバレッジ計算機器は、本分野の通常の計算機器に、シークエンスデータの違いにより適切に調整することで得られるものである。本出願の好ましい実施例において、前記第一カバレッジ計算機器は以下を含む:染色体ウインドウ分割サブ機器:シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する;第一カバレッジ計算サブ機器:同じサイズのウインドウの形でカバレッジを計算することで、各染色体の補正前カバレッジを得る。本出願の染色体ウインドウ分割サブ機器及び第一カバレッジ計算サブモジュールの第一カバレッジ計算モジュールを同じサイズのウインドウに分割する形で計算を行うことで、比較的安定的なカバレッジを得ることに有利である。
本出願のさらなる実施例において、前記染色体ウインドウ分割サブモジュールにおいて、それぞれのウインドウの大きさは100Kbであり、且つ隣り合う二つのウインドウの間の重複度は50%である。それぞれのウインドウを100Kbの大きさに分割する形で計算を行う計算機器は相対的に安定的なカバレッジを得ることができ、もう一方ではウインドウ間のカバレッジを増加させることでコピー数異常染色体フラグメントの精密度を向上させることができ、これにより妊婦コピー数異常染色体フラグメントの検出効率を向上させることができる。
本出願の前記キットにおいて、固有の配列計算機器は通常の計算機器を用いることで得られる。本出願の好ましい実施例において、前記固有の配列計算機器は以下を含む:固有の配列統計ユニット:シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計する;固有の配列のカバレッジ計算ユニット:各染色体のGC含有量及びマッピング率に基づいて各ウインドウの固有の配列の数量について計算を行い、各ウインドウの固有の配列の数量の補正前カバレッジを得る;固有の配列cnv値計算モジュール:各ウインドウの固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの固有の配列のZcnv値を得る。
本出願の前記固有の配列計算機器は、まず固有の配列統計ユニットを稼働させることで、シークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計でき、それから固有の配列カバレッジ計算モジュールを実行し、各染色体のGC含有量とマッピング率に基づいて各ウインドウの固有の配列の数量に対して補正を行い、各ウインドウの固有の配列の数量の補正値を得て、それから固有の配列cnv値計算サブユニットを実行し、各ウインドウの固有の配列の数量の補正値に対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得る。前記ユニットは本分野の通常の計算及び補正ユニットに基づいて適切に調整を行うものであり、コピー数異常染色体フラグメント検索装置に対して検索及びコピー数異常染色体フラグメント認定機器について認定する根拠と前提であり、正確に検出対象サンプル中の母体DNAコピー数異常染色体フラグメントの存在に根拠を提供する。
本出願の前記キットにおいて、第二カバレッジ計算機器において、Zaneu値は
によって計算され、そのうち、
はLOESSアルゴリズムであり、陰性サンプル群により得られる補正前カバレッジであり、sは陰性サンプル群における
の標準差である。前記式の計算により得られる補正後のZaneu値は、より正確に染色体異数性を反映することができ、検出結果はより正確である。
以下に具体的な実施例を参照しながら本出願の有益な効果について説明する。
本出願の妊婦コピー数異常染色体フラグメント補正における染色体異数性検出に対する補正効果を測定するために、本実施例はポアソン分布に基づいて妊婦のシミュレーションデータを生成し、該シミュレーションデータにおいて、それぞれ単独に13、18及び21号染色体に定量のコピー数異常染色体フラグメントを添加し、コピー数異常染色体フラグメントのサイズは0.5Mb〜5Mb、歩長は0.25Mbである。それから、コピー数異常染色体フラグメントを含むシミュレーションデータ中に3種類の異なる濃度の健常人DNA(5%、10%、15%)をそれぞれ混入する。全体のプロセスは異なる胎児濃度下において、異なるコピー数異常染色体フラグメントサイズの13、18及び21号染色体カバレッジに対する影響をシミュレーションするものであり、さらにこれにより妊婦のコピー数異常染色体フラグメントの染色体異数性検出の補正効果を検出する。すべての計算は、胎児が妊婦コピー数異常染色体フラグメントを遺伝していない仮定下で行われたものである。
測定結果は図3A、3B及び3Cを参照する。前記3つの図において、横の座標はサンプルが所在する妊婦コピー数異常染色体フラグメントのサイズであり、縦座標はこのサンプルの染色体Z値である。図中の実線が示すのは補正前の染色体Z値であり、点線は妊婦コピー数異常染色体フラグメントの補正後の染色体カバレッジの計算によるZ値であり、即ちZaneu値である。四角形、円形及び三角形はそれぞれ該サンプルの胎児濃度が5%、10%及び15%であることを示している。
図3A、3B及び3Cから明らかに分かるように、直接染色体カバレッジでZ値を計算する場合、妊婦のコピー数異常染色体フラグメントの向上により、サンプルのZ値も大きくなる。21号染色体を例として、10%胎児濃度下において、妊婦に3Mbの21号染色体上の重複が存在するであれば、仮に胎児が21トリソミー症候群患児でなくでも、以前のカバレッジで計算されたZ値は3より大きく、陽性と判定されてしまう。図中の点線は、即ち本出願の方法で補正した後のカバレッジで計算された染色体のZ値であり、即ちZaneu値であり、いずれも0のベースライン附近に安定している。これは、各種状況下において、本出願の妊婦コピー数異常染色体フラグメントを用いたものにより補正した染色体異数倍の検出方法は極めて有効である。
さらに本出願の思想により提供した検出方法、検出装置及びキットは実際の患者例のサンプル中において染色体異数倍を測定する効果であり、さらに本出願の検出方法、検出装置及びキットを用いてそれぞれ以下の患者例サンプルを検出することができ、具体的には実施例2及び実施例3である。
6615件の検出対象妊婦由来の末梢血遊離DNAサンプルに対してハイスループットシーケンシングを行い、各サンプルにすべての染色体が含まれているシークエンスデータを得た。
各サンプルのシークエンスデータ中の各配列のシークエンス深度に基づいて、各ウインドウの固有の配列の数量を統計する。各染色体のGC含有量及びマッピング率に基づいて各ウインドウの固有の配列の数量に対して補正を行い、各ウインドウの固有の配列の数量の補正値を得る。各ウインドウの固有の配列の数量の補正値に対して標準化処理を行い、各ウインドウの固有の配列の数量のZcnv値を得て、さらにZcnv値の大小に基づいて検出対象妊婦がコピー数異常染色体フラグメントを有するかについて判定する。シークエンスデータ中には300Kb以上のフラグメントが存在し、且つ300Kb以上のフラグメント中のすべてのウインドウのうち80%以上のウインドウの固有の配列の数量のZcnv値は4と等しいかそれより大きく、または−4と等しいかそれより小さい場合、300Kb以上のフラグメントは検出対象妊婦のコピー数異常染色体フラグメントであると考える。
検出対象妊婦のコピー数異常染色体フラグメントを用いて各染色体の補正前カバレッジの影響αを利用して、さらに
を利用して、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る;そのうち、
は各染色体の補正前カバレッジであり、x'は各染色体の補正後染色体カバレッジである;そのうち、検出対象妊婦のコピー数異常染色体フラグメントの各染色体に対する補正前カバレッジの影響は、パラメータαを用いて式(1)または(2)によって計算される; 各染色体の補正後カバレッジを用いて各染色体のZaneu値を計算し、具体的には式
の計算によりZaneu値を得て、さらにZaneu値の絶対値が3と等しいかそれより大きいことで染色体が異数性を有するかを判定する;Zaneu値の絶対値が3と等しいかそれより大きい場合、染色体は異数性を有する;Zaneu値の絶対値が3未満の場合、染色体は異数性を有しない;
本出願の前記検出方法によりサンプルEK01875及びBD01462の21号染色
体上に存在する妊婦コピー数異常染色体フラグメントを発見し、さらにこの二つのサンプ
ルを以前の陽性の結果から陰性の結果に補正し、具体的な結果は図4を参照すること。
図4の左図(カラー図面参照)は現在の検出方法によって検出されるすべてのサンプルの21号染色体のZ値統計図であり、これから分かるように陰性サンプルのZ値はほとんど3未満であり、正規分布に近い。図中の円形はサンプルEK01875であり、Z値は4.66である。三角形はサンプルBD01462であり、Z値は3.87である。
図4における右図は本出願の検出方法によって検出することで得られる21号染色体のZ値統計図であり、この場合のサンプルEK01875はZaneu=2.36で、サンプルBD01462はZaneu=1.83である。
本出願の染色体異数性の検出装置を用いて前記サンプルの添加を行い(サンプルEK01875、妊婦年齢29歳、妊娠約18週)、該装置は以下を含む:
シークエンスデータ検出モジュール:検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシークエンシングを行い、これによりすべての染色体のシークエンスデータを得る;第一カバレッジ計算モジュール:シークエンスデータ中のすべての染色体のウインドウに分割する形でカバレッジを計算することで、各染色体の補正前カバレッジを得る;Zcnv値計算モジュール:検出対象妊婦の各ウインドウ中の固有の配列の数量のZcnv値に対して計算を行う;コピー数異常染色体フラグメント検索モジュール:シークエンスデータ中において300Kb以上のフラグメントを検索し、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントが、Zcnvが4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントである。
コピー数異常染色体フラグメント認定モジュール:シークエンスデータ中から検索することで得られる300Kb以上のフラグメントで、且つすべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントを、検出対象妊婦のコピー数異常染色体フラグメントと認定する。
α第一計算モジュール:胎児が母体のコピー数異常染色体フラグメントを遺伝している場合、式(1)に示す計算式でパラメータαを計算する;
α第二計算モジュール:胎児が母体のコピー数異常の染色体を遺伝していない場合、式(2)に示す計算式でパラメータαを計算する;
補正モジュール:
を用いて、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る;
第二カバレッジ計算モジュール:各染色体の補正後カバレッジで各染色体のZaneu値を計算する;
aneu値判定モジュール:Zaneu値の絶対値が3と等しいかそれより大きいかの判定に用いる;
染色体異数性認定モジュール:Zaneu値の絶対値が3と等しいかそれより大きい場合、染色体が異数性を有すると認定する。
本出願の前記染色体異数性を検出する装置を用いて分析した後、妊婦は21号染色体上に850Kbの重複が存在することを検出した。図5に示すように、コピー数に重複が存在する領域はそれぞれ500Kbの21q22.11(32361194bp〜32861193bp)及び350Kbの21q22.12(37261194bp〜37611193bp)であり、コピー数はいずれも3である。
それから、従来技術中のAffymetrix CytoScan 750k SNPチップを用いて該妊婦の染色体コピー異常フラグメントの結果に対して検証を行い、同じように、21q22.11(32399114bp〜32811202bp)領域と21q22.12(37292432bp〜37602701bp)において、コピー数は3であると検出した。
これから分かるように、チップ検出結果の位置と本出願の装置により検出される位置はほとんど百パーセントマッチする。本出願の装置において、妊婦コピー数異常染色体フラグメントの該染色体カバレッジ計算に対する影響のパラメータα値は1.012であり、染色体が異数性を有するかを示すZ値は元の4.66から2.36に補正され、これにより判定結果は陰性となる。
本出願の染色体異数性を検出するキットを用いて前記サンプル(サンプルBD01462、妊婦年齢24歳、妊娠約24週)を添加して検出を行い、該キットは以下を含む:
シークエンスデータ検出試薬及び機器:検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシークエンシングを行い、これによりすべての染色体を含むシークエンスデータを得る;
第一カバレッジ計算機器:シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、これにより各染色体の補正前カバレッジを得る;
固有の配列計算機器:検出対象妊婦の各ウインドウにおける固有の配列の数量のZcnvについて計算を行う;
コピー数異常染色体フラグメント検索機器:シークエンスデータ中で300Kb以上のフラグメントを検索し、且つ300Kb以上のフラグメントにおいて、すべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントである。
コピー数異常染色体フラグメント認定機器:シークエンスデータ中から検索により得られる300Kb以上のフラグメントで且つすべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さいフラグメントを検出対象妊婦のコピー数異常染色体フラグメントと認定する。
α第一計算機器:胎児が母体のコピー数異常染色体フラグメント遺伝している場合、式(1)に示す計算式でパラメータαを計算する。
α第二計算機器:胎児が母体のコピー数異常染色体フラグメントの染色体を遺伝していない場合、式(2)に示す計算式に従ってパラメータαを計算する。
補正機器:
を用いて、各染色体の補正前カバレッジに対して補正を行い、各染色体の補正後カバレッジを得る;
第二カバレッジ計算機器:各染色体の補正後カバレッジを用いて各染色体のZaneu値を計算する;
aneu値判定機器:Zaneu値の絶対値が3と等しいかそれより大きいかを判定する;
染色体異数性認定機器:Zaneu値の絶対値が3と等しいかそれより大きい場合、染色体が異数性を有すると判定する。
本出願の前記検出キットを用いて検出分析した後、図6に示すように、妊婦が21号染色体上に全部で700Kbの重複が存在し、領域は21q23.1(28911194bp〜29611930)であり、コピー数は3であると検出した。
同じように、Affymetrix CytoScan 750k SNPチップ検証結果が示すように、21q21.3(28973792bp〜29542400)に重複が存在する。
検出されるコピー数は4であるが、本出願の検出結果と異なって、該結果の位置と本出願のキットによって検出される位置はほとんど百パーセントマッチするものであり、同じように本出願の検出方法の正確性を示している。本出願のキット中の妊婦コピー数異常染色体フラグメントの該染色体のカバレッジ計算の影響パラメータαの値は1.009であり、染色体が異数性を有するかを示すZ値は元の3.87から1.83に補正され、このため判定結果は陰性である。
以上の記載から分かるように、本出願の前記実施例は以下の技術効果を実現している:本出願は妊婦自身のコピー数異常染色体フラグメントの染色体異数性を計算する際の影響を考慮して、従来技術おけるシークエンスデータ中の母体中のコピー数異常染色体フラグメントを直接除去して考慮しないという考え方に基づいて、創造的に母体染色体上に存在する特定の大きさのコピー数異常染色体フラグメントの染色体異数性に対する影響をパラメータαで示し、さらにパラメータαにより各染色体のカバレッジに対して補正を行い、これによりコピー数異常染色体フラグメントの異数性に対する判定の影響を低減できるのであって、該コピー数異常染色体フラグメントの存在を無視することのではない。本出願の方法によって検出することで得られる染色体異数性の結果はより正確である。
本出願の方法、装置またはキットは、ほとんど妊婦のコピー数異常染色体フラグメントの影響を受けないNIPT胎児染色体異数性に影響されない検出方法を提供し、これにより検出の制度を向上させ、大規模使用に適している。
明らかなように、当業者は以下のように理解すべきである。前記の本出願のモジュール、部品またステップは通用の計算装置によって実現され、これらは単一の計算装置に集中することもできるが、複数の計算装置からなるネットワークに分布することもでき、また、これらは計算装置の実行できるプログラムコードによっても実現することもでき、このため、これらを記憶装置中に記憶して計算装置によって実行でき、またはこれらをそれぞれの集積回路モジュールにして、またはこれら中の複数のモジュールまたはステップを単一の集積回路モジュールにすることで実現することもできる。このようにすることで、本出願はいかなる特定のハードウェア及びソフトウェアの組み合わせに制限されるものではない。
以上は本出願の好ましい実施例に過ぎず、本出願を制限するものではない。当業者にとって、本出願は各種変更及び変化を有することができる。本出願の趣旨の原則に背かないであれば、いかなる修正、均等的な置換、改善も、いずれも本出願の保護範囲に含まれるものである。

Claims (15)

  1. 胎児の染色体異数性を検出する方法であって、
    検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得ること;
    前記シークエンスデータ中のすべての染色体をウインドウに分割することにより、該染色体のカバレッジを計算し、前記染色体の各々の補正前カバレッジを得ること;
    前記検出対象妊婦の各ウインドウ中に含まれる固有の配列の数量に対してZ検定を行ってZcnv値を得、さらに得られたZcnv値の大きさに基づいて前記検出対象妊婦のコピー数異常染色体フラグメントを得ること
    ここで、前記検出対象妊婦のコピー数異常染色体フラグメントは前記シークエンスデータ中の300Kb以上の長さを有するフラグメントであって当該フラグメントに含まれるすべてのウインドウのうち80%以上のウインドウのZcnv値以上であるか、または−4以下であるフラグメントであり
    前記検出対象妊婦のコピー数異常染色体フラグメントによる前記染色体の補正前カバレッジに対する影響を利用することにより、各染色体の補正前カバレッジに対して補正を行い、これにより各染色体の補正後カバレッジを得ること;及び
    染色体の補正後カバレッジを用いて各染色体検定を行うことによりZaneu値を得、さらにZaneu値の絶対値が3以上であるか否かによって前記染色体が異数性を有するか否かを判定することを含むことを特徴とし
    ここで、前記Zaneu値の絶対値が3以上である場合、前記染色体は異数性を有すると判定され
    ここで、前記検出対象妊婦のコピー数異常染色体フラグメントによる前記染色体の補正前カバレッジに対する影響は以下のパラメータαによって示され
    前記式(2)において、mは前記コピー数異常染色体フラグメントが存在する染色体の有効配列長でって、単位はMbで表され;nは前記検出対象妊婦の前記コピー数異常染色体フラグメントの長さであって、単位はMbで表され;cnは前記妊婦の前記コピー数異常染色体フラグメントの出現する回数であ
    前記式(2)において、fは前記検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度でありつ前記胎児遊離DNAの濃度f50%未満であり、
    ここで、前記染色体の補正前カバレッジに対する補正は、
    を用いて行われ
    式中、
    は各前記染色体の補正前カバレッジを示し、x'は各前記染色体の補正後染色体カバレッジを示すものである、方法。
  2. 前記シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する形でカバレッジを計算することで、前記染色体の補正前カバレッジを得ることを特徴とする、請求項1に記載の方法。
  3. それぞれの前記ウインドウのサイズは100Kbであり、且つ隣り合う二つの前記ウインドウ間の重複度は50%であることを特徴とする、請求項2に記載の方法。
  4. 前記検出対象妊婦の各ウインドウに含まれる固有の配列の数量に対してZ検定を行ってZcnv値を得、さらに得られたZcnv値の大きさに基づいて前記検出対象妊婦のコピー数異常染色体フラグメントを得るステップにおいて
    前記染色体のGC含有量とマッピング率に基づいて前記ウインドウの前記固有の配列の数量について計算を行い、各前記ウインドウの前記固有の配列の数量の補正前カバレッジを得ること、及び
    前記ウインドウの前記固有の配列の数量の補正前カバレッジに対して標準化処理を行い、前記ウインドウの前記固有の配列の数量のZcnv値を得て、さらに前記Zcnv値の大小により前記検出対象妊婦が前記コピー数異常染色体フラグメントを有するか否かを判定すること
    前記シークエンスデータ中に300Kb以上のフラグメントが存在し、且つ前記300Kb以上のフラグメント中のすべてのウインドウのうち80%以上のウインドウにおける前記固有の配列の数量のZcnv値が4と等しいかそれより大きく、または−4と等しいかそれより小さい場合、300Kb以上のフラグメントが前記検出対象妊婦のコピー数異常染色体フラグメントであると判定することを含むことを特徴とする、請求項1に記載の方法。
  5. 前記染色体の補正後カバレッジを用いて各前記染色体に対してZ検定を行い、Zaneu値を得るステップにおいて、前記Zaneu値は
    に従って計算され、そのうち、
    はLOESSアルゴリズムによるものであり、既知の陰性サンプル群によって得られる補正前カバレッジであり、sは陰性サンプル群における
    の標準偏差であることを特徴とする、請求項1に記載の方法。
  6. 胎児の染色体異数性を検出する装置であって、シークエンスデータ取得モジュール、第一カバレッジ計算モジュール、Zcnv値計算モジュール、コピー数異常染色体フラグメント検索モジュール、コピー数異常染色体フラグメント認定モジュール、α計算モジュール、補正モジュール、第二カバレッジ計算モジュール、Zaneu値判定モジュール、染色体異数性認定モジュールを備え、前記シークエンスデータ取得モジュールは、妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得るためのものであり、前記第一カバレッジ計算モジュールは、前記シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各前記染色体の補正前カバレッジを得るためのものであり、
    前記Zcnv値計算モジュールは、前記検出対象妊婦の前記ウインドウに含まれる固有の配列の数量のZcnv値を計算するためのものであり、
    前記コピー数異常染色体フラグメント検索モジュールは、前記シークエンスデータ中において300Kb以上のフラグメントであって、且つすべてのウインドウのうち80%以上のウインドウの染色体フラグメントのZcnv値は4以上であるか、または−4以下であるフラグメントを検索するものであり、
    前記コピー数異常染色体フラグメント認定モジュールは、前記シークエンスデータにおける検索により得られる前記300Kb以上のフラグメントで且つすべてのウインドウのうち80%以上のウインドウの染色体フラグメントのZcnv値が4以上であるか、または−4以下であるフラグメントを検出対象妊婦のコピー数異常染色体フラグメントとして認定するものであり、
    α計算モジュールは、式)に示される計算式に従ってパラメータαを計算するものであり、前記パラメータαは妊婦のコピー数異常染色体フラグメントの各前記染色体の補正前カバレッジに対する影響であり、
    前記式(2)において、mは前記コピー数異常染色体フラグメントが所在する染色体の有効配列長であり、単位はMbである;nは前記検出対象妊婦の前記コピー数異常染色体フラグメントの長さであり、単位はMbである;cnは前記妊婦の前記コピー数異常染色体フラグメントの出現する回数である、fは前記検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度でありつ前記胎児遊離DNAの濃度f50%未満であり、前記補正モジュールは、
    を用いて、各前記染色体の補正前カバレッジに対して補正を行い、各前記染色体の補正後カバレッジを得るものであり、そのうち、
    は各染色体の補正前カバレッジを示し、x'は各前記染色体の補正後染色体カバレッジを示している、前記第二カバレッジ計算モジュールは、各前記染色体の補正後カバレッジを用いて各染色体のZaneu値を計算するものであり、前記Zaneu値判定モジュールは、前記Zaneu値の絶対値が3と等しくもしくはそれより大きいかを判定するものであり、前記染色体異数性認定モジュールは、前記Zaneu値の絶対値が3と等しくもしくはそれより大きい場合、前記染色体が異数性を有すると認定するものであることを特徴とする、前記装置。
  7. 前記第一カバレッジ計算モジュールは、前記シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割する染色体ウインドウ分割サブモジュール、
    前記同じサイズのウインドウの形でカバレッジを計算することで、各前記染色体の補正前カバレッジを得る第一カバレッジ計算サブモジュールを含むことを特徴とする、請求項6に記載の装置。
  8. 前記染色体ウインドウ分割サブモジュールにおいて、それぞれの前記ウインドウのサイズは100Kbであり、且つ隣り合う二つの前記ウインドウの間の重複度は50%である、請求項7に記載の装置。
  9. Zcnv値計算モジュールは、固有の配列カバレッジ計算ユニット、固有の配列Zcnv値計算ユニットを備え、前記固有の配列カバレッジ計算ユニットは、前記各染色体のGC含有量及びマッピング率に基づいて各前記ウインドウの前記固有の配列の数量について計算を行い、前記ウインドウの前記固有の配列の数量の補正前カバレッジを得るためのものであり、前記固有の配列Zcnv値計算ユニットは、各前記ウインドウの前記固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各前記ウインドウの前記固有の配列の数量のZcnv値を得るためのものであることを特徴とする、請求項6に記載の装置。
  10. 前記第二カバレッジ計算モジュールにおいて、
    前記Zaneuは
    に従って計算され、そのうち、
    はLOESSアルゴリズムにより、既知の陰性サンプル群から得られるカバレッジの値であり、sは陰性サンプル群における
    の標準偏差であることを特徴とする、請求項6に記載の装置。
  11. 胎児の染色体異数性を検出するためのキットであり、検出試薬及び検出機器、第一カバレッジ計算機器、Zcnv値計算機器、コピー数異常染色体フラグメント検索機器、コピー数異常染色体フラグメント認定機器、α計算機器、補正機器、第二カバレッジ計算機器、Zaneu値判定機器、染色体異数性認定機器を備え、前記検出試薬及び検出機器は、検出対象妊婦由来の末梢血遊離DNAに対してハイスループットシーケンシングを行うことで、すべての染色体を含むシークエンスデータを得るためのものであり、前記第一カバレッジ計算機器は、前記シークエンスデータ中のすべての染色体をウインドウに分割する形でカバレッジを計算し、各前記染色体の補正前カバレッジを得るためのものであり、
    前記Zcnv値計算機器は、前記検出対象妊婦の前記ウインドウに含まれる固有の配列の数量を用いてZ検定を行い、Zcnv値を得るためのものであり、
    前記コピー数異常染色体フラグメント検索機器は、前記シークエンスデータ中において300Kb以上のフラグメントであって、且つすべてのウインドウのうち80%以上のウインドウ中の染色体フラグメントのZcnv値は4以上であるか、または−4以下であるフラグメントを検索するものであり、
    前記コピー数異常染色体フラグメント認定機器は、前記Zcnv値の大小により前記検出対象妊婦のコピー数異常染色体フラグメントを得るためのものであり、
    前記α計算機器は、式)に示される計算式に従ってパラメータαを計算するものであり、そのうち、前記パラメータαは妊婦のコピー数異常染色体フラグメントの各前記染色体の補正前カバレッジに対する影響である、
    mは前記コピー数異常染色体フラグメントが所在する染色体の有効配列長であり、単位はMbである;nは前記検出対象妊婦の前記コピー数異常染色体フラグメントの長さであり、単位はMbである;cnは前記妊婦の前記コピー数異常染色体フラグメントの出現する回数である、fは前記検出対象妊婦由来の末梢血遊離DNAに含まれる胎児遊離DNAの濃度であり且つ前記胎児遊離DNAの濃度f50%未満であり、前記補正機器は、
    を用いて、各前記染色体の補正前カバレッジに対して補正を行い、各前記染色体の補正後カバレッジを得るものであり、そのうち、
    は各前記染色体の補正前カバレッジを示し、x'は各前記染色体の補正後染色体カバレッジを示している、前記第二カバレッジ計算機器は、各前記染色体の補正後カバレッジを用いて各染色体のZaneu値を計算するものであり、前記Zaneu値判定機器は、前記Zaneu値の絶対値が3と等しくもしくはそれより大きいか否かを判定するものであり、前記染色体異数性認定機器は、前記Zaneu値の絶対値が3と等しくもしくはそれより大きい場合、前記染色体が異数性を有すると認定するものであることを特徴とする、前記キット。
  12. 前記第一カバレッジ計算機器は、前記シークエンスデータ中のすべての染色体を同じサイズのウインドウに分割するための染色体ウインドウ分割部材、前記同じサイズのウインドウの形でカバレッジを計算し、各前記染色体の補正前カバレッジを得る第一カバレッジ計算部材を含むことを特徴とする、請求項11に記載のキット。
  13. 前記染色体ウインドウ分割部材において、前記ウインドウのサイズは100Kbであり、且つ隣り合う二つの前記ウインドウの間の重複度は50%であることを特徴とする、請求項12に記載のキット。
  14. 前記固有の配列Zcnv値計算機器は、前記染色体のGC含有量とマッピング率を用いて各前記固有の配列の数量について計算を行い、各前記ウインドウの前記固有の配列の数量の補正前カバレッジを得る固有の配列カバレッジ計算部材、及び、各前記ウインドウの前記固有の配列の数量の補正前カバレッジに対して標準化処理を行い、各ウインドウの前記固有の配列の数量のZcnv値を得る固有の配列Zcnv値計算部材を含むことを特徴とする、請求項11に記載のキット。
  15. 前記第二カバレッジ計算機器において、Zaneuは
    に従って計算され、そのうち、
    はLOESSアルゴリズムにより、既知の陰性サンプル群により得られる補正前カバレッジであり、sは陰性サンプル群における
    の標準偏差であることを特徴とする、前記請求項11に記載のキット。
JP2018509952A 2015-05-06 2015-05-06 染色体異数性を測定するためのキット、装置及び方法 Active JP6623400B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/078422 WO2016176847A1 (zh) 2015-05-06 2015-05-06 检测染色体非整倍性的试剂盒、装置和方法

Publications (3)

Publication Number Publication Date
JP2018514234A JP2018514234A (ja) 2018-06-07
JP2018514234A5 JP2018514234A5 (ja) 2019-10-17
JP6623400B2 true JP6623400B2 (ja) 2019-12-25

Family

ID=57217322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018509952A Active JP6623400B2 (ja) 2015-05-06 2015-05-06 染色体異数性を測定するためのキット、装置及び方法

Country Status (5)

Country Link
US (1) US20180201990A1 (ja)
EP (1) EP3293270B1 (ja)
JP (1) JP6623400B2 (ja)
SG (1) SG11201709141YA (ja)
WO (1) WO2016176847A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180190384A1 (en) * 2017-01-05 2018-07-05 Clear Genetics, Inc. Automated genetic test counseling
CN112397148B (zh) * 2019-08-23 2023-10-03 武汉希望组生物科技有限公司 序列比对方法、序列校正方法及其装置
WO2021074382A1 (en) * 2019-10-16 2021-04-22 Stilla Technologies Determination of nucleic acid sequence concentrations
CN110993024B (zh) * 2019-12-20 2023-08-22 北京科迅生物技术有限公司 建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置
CN112037846A (zh) * 2020-07-14 2020-12-04 广州市达瑞生物技术股份有限公司 一种cffDNA非整倍体检测方法、系统、储存介质以及检测设备
CN114171118B (zh) * 2021-11-15 2024-09-27 成都凡迪医疗器械有限公司 用于无创基因检测的数据处理方法和装置
CN114792548B (zh) * 2022-06-14 2022-09-09 北京贝瑞和康生物技术有限公司 校正测序数据、检测拷贝数变异的方法、设备和介质
CN115132271B (zh) * 2022-09-01 2023-07-04 北京中仪康卫医疗器械有限公司 一种基于批次内校正的cnv检测方法
CN117095747B (zh) * 2023-08-29 2024-04-30 广东省农业科学院水稻研究所 一种基于线性泛基因组和人工智能模型检测群体倒位或转座子端点基因型的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011365507A1 (en) * 2011-04-14 2013-05-02 Verinata Health, Inc. Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
WO2014040206A1 (zh) * 2012-09-12 2014-03-20 深圳华大基因研究院 利用基因组测序片段检测拷贝数变异的方法
US10482994B2 (en) * 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10319463B2 (en) * 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
CN104789466B (zh) * 2015-05-06 2018-03-13 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
CN104789686B (zh) * 2015-05-06 2018-09-07 浙江安诺优达生物科技有限公司 检测染色体非整倍性的试剂盒和装置

Also Published As

Publication number Publication date
EP3293270A4 (en) 2018-03-28
WO2016176847A1 (zh) 2016-11-10
EP3293270A1 (en) 2018-03-14
EP3293270B1 (en) 2019-09-25
SG11201709141YA (en) 2017-12-28
US20180201990A1 (en) 2018-07-19
JP2018514234A (ja) 2018-06-07

Similar Documents

Publication Publication Date Title
JP6623400B2 (ja) 染色体異数性を測定するためのキット、装置及び方法
JP2018514234A5 (ja)
US11168370B2 (en) Detecting mutations for cancer screening
CN108573125B (zh) 一种基因组拷贝数变异的检测方法及包含该方法的装置
KR101795124B1 (ko) 복제 수 변이를 검측하기 위한 방법 및 시스템
CN104789466B (zh) 检测染色体非整倍性的试剂盒和装置
CN110268044B (zh) 一种染色体变异的检测方法及装置
JP2014507158A5 (ja)
CN104789686A (zh) 检测染色体非整倍性的试剂盒和装置
TWI767888B (zh) 藉由母體血漿dna之淺深度測序以準確定量胎兒dna含量
WO2019213811A1 (zh) 检测染色体非整倍性的方法、装置及系统
KR101678962B1 (ko) 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
CN116013419A (zh) 检测染色体拷贝数变异的方法
CN107622183B (zh) 一种基于多重指标的胎儿染色体倍性检测分析方法
CN114420208B (zh) 一种用于鉴定核酸样本中cnv的方法和装置
WO2024140881A1 (zh) 胎儿dna浓度的确定方法及装置
WO2016176846A1 (zh) 检测染色体非整倍性的试剂盒、装置和方法
WO2024011929A1 (zh) 检测胎儿染色体非整倍体异常的方法、装置及存储介质
TWI546689B (zh) 用以偵測染色體的非整倍性的方法及其非暫態機器可讀媒體
CN107109324B (zh) 确定胎儿核酸含量的方法和装置
CN108229099B (zh) 数据处理方法、装置、存储介质及处理器
WO2019213810A1 (zh) 检测染色体非整倍性的方法、装置及系统
JP7332695B2 (ja) 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定
CN113710818A (zh) 病毒相关联的癌症风险分层
Choo-Wosoba et al. hsegHMM: hidden Markov model-based allele-specific copy number alteration analysis accounting for hypersegmentation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180322

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180404

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180507

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190515

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20190520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190614

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190802

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20190905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20191029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20191029

R150 Certificate of patent or registration of utility model

Ref document number: 6623400

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350