JP2015502749A - 遺伝子変異の検出方法 - Google Patents

遺伝子変異の検出方法 Download PDF

Info

Publication number
JP2015502749A
JP2015502749A JP2014546264A JP2014546264A JP2015502749A JP 2015502749 A JP2015502749 A JP 2015502749A JP 2014546264 A JP2014546264 A JP 2014546264A JP 2014546264 A JP2014546264 A JP 2014546264A JP 2015502749 A JP2015502749 A JP 2015502749A
Authority
JP
Japan
Prior art keywords
window
gene mutation
sequence
detecting
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014546264A
Other languages
English (en)
Other versions
JP5993029B2 (ja
Inventor
チェン、シェンペイ
ツァン、チュンレイ
チェン、ファン
シェ、ウェイウェイ
パン、シャオユー
ワン、ジェン
ワン、ジュン
ヤン、ファンミン
ツァン、シューチン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Genomics Co Ltd
Original Assignee
BGI Diagnosis Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Diagnosis Co Ltd filed Critical BGI Diagnosis Co Ltd
Publication of JP2015502749A publication Critical patent/JP2015502749A/ja
Application granted granted Critical
Publication of JP5993029B2 publication Critical patent/JP5993029B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、遺伝子変異の検出方法を開示した。当該遺伝子変異の検出方法は、テスト試料からシークエンシング対象となる配列を獲得するステップと、前記シークエンシング対象となる配列と参考ゲノム配列とを対比するステップと、前記参考ゲノム配列をウィンドウに分割して、各ウィンドウまでに対比されたシークエンシング対象となる配列の数を統計して、前記シークエンシング対象となる配列の数に基づいて、各ウィンドウの統計量を得るステップと、1段の参考ゲノム配列に対して、その上のすべてのウィンドウの統計量が該段参考ゲノム配列上での変化に基づいて、遺伝子変異部位を獲得するステップと、を含む。【選択図】図1

Description

本発明は、遺伝子変異の検出分野に関する。特にコピー数多型、例えば微小欠失/微細重複及び異数性の検出に関する。
コピー数多型(Copy number variation, CNV)とは、DNA断片の範囲がkbからMbまでの亜ミクロ変異であって、コピー数の増加又は減少として表される。コピー数多型と病気との関係に関する研究は、既に長い歴史を持っている。若干の胚係変異コピー数多型(即ち、両親ともなく、胎児自身の変異により発生したコピー数多型である)に対して、断片が大きくなるほど先天異常を発生しやすくなる見方がある。例えば、染色体異数性(aneuploidy)病気(例えばT21、T18等)と染色体微小欠失/微細重複症候群のいずれも公認されている胚係変異コピー数多型に係わる病気である。
人間染色体微小欠失/微細重複症候群(microdeletion/microduplication syndromes)は、人間染色体に小さな断片の欠失又は重複が発生すること、即ちDNA断片コピー数多型により、引き起こされた表現型が複雑、多変の病気類型である。囲産児と新生児において発病率が比較的高く、深刻な病気と異常になり、例えば、先天性心疾患又は心奇形、深刻な成長遅延、外見又は肢体奇形などに繋がる。また、微小欠失症候群は、ダウン症候群とX染色体脆い症候群以外に、知能の発達が遅れることを引き起こす主な原因の一つである「Knight SJL (ed): Genetics of Mental Retardation. Monogr Hum Genet. Basel, Karger, 2010, vol 18, pp 101-113 (DOI: 10.1159/000287600)」。近年、出生欠陥発病率の統計において一位になる先天性心疾患、遺伝カウンセリング診断診察の前列に入る知能低下、脳性麻痺及び先天性聴覚障害のいずれも微小欠失症候群に係わる。よく見られる微小欠失症候群は、22q11微小欠失症候群、猫鳴き症候群、Angelman症候群、AZF欠失等を含む。
各微小欠失症候群の発病率が低いであっても、その中に比較的に一般的な22q11微小欠失症候群、猫鳴き症候群、Angelman症候群、Miller-Dieker症候群等の発生率は、それぞれ1:4000(生きている新生児)、1:50000、1:10000、1:12000であるが、臨床検査技術の制限のため、大量の微小欠失症候群患者は、産前スクリーニングや産前診断で検出されることができず、赤ちゃんが生まれて数ヶ月後、更に数年後に典型的な臨床表徴に現れた後でさえ、原因をバックトラックする時に、検出技術の制限のため、病因を診断することもできない(https:/ / decipher.sanger.ac.uk / syndromes)。一部の微小欠失症候群が根治することができないため、生後数月内又は数年内に亡くなり、家族や社会に深刻な精神的負担と経済負担をもたらす。不完全な統計によると、世界の「アンジェルマン症候群」(Angelman症候群)の患者は、1.5万人に達し、他の種類の染色体微小欠失症候群患者数も、年々増加している。従って、孕前に臨床擬似患者や良くない妊娠出産に関する経験がある両親に対して染色体微小欠失/微細重複の検査を行うことは、遺伝カウンセリングや臨床の意思決定の根拠を提供することに有利であり、妊娠中に初期産前診断を行うことは、患児の出産を有効に防ぐ、又は患児に生後の治療方案の根拠を提供することができる「Bretelle F、et al.Prenatal and postnatal diagnosis of 22q11.2 deletion syndrome . Eur J Med Genet . 2010 Nov-Dec;53(6):367-70」。
しかしながら、この類型の病気の染色体変異レベルが小さいため、従来の臨床方法、例えば、染色体核型分析方法等(その解像度は、10M以上である)を用いて検出することができない「Malcolm S.Microdeletion and microduplication syndromes . Prenat Diagn . 1996 Dec;16(13):1213-9」。現在、微小欠失/微細重複症候群に対する産前診断は、主に羊水穿刺又は他の組織侵入の方法を採用して分子診断を行う。現在、侵襲的な分子診断方法は、主に高解像度の染色体核型分析、FISH(蛍光in situ ハイブリダイゼーション)、Array CGH(比較ゲノムハイブリダイゼーション)、MLPA法及びPCR方法等がある。その中に、遺伝学診断は、FISH検査を黄金基準として、大部分の染色体断片欠失を有効に検出することができる。しかしながら、侵襲的サンプリングは、一定の手術又は細胞培養が必要であるため、時間効率と資源消耗の角度から見ると、診断指標とするのは適合であるが、普及される臨床スクリーニングの方法とするのは適合ではない。
微小欠失/微細重複症候群の非侵襲的なスクリーニング方法においても、いくつかを試してみた。例えば、2011年11月に発表された非侵襲的な胎児微小欠失症候群検出の研究において、研究者は母の妊娠中血漿に対してディープシークエンスを行って、約2.43億のシークエンシング短い配列(short reads)を生じされ、胎児が12p11.22から 12p12.1までの一つの4Mbぐらいの微小欠失を検出した「David Peters、et al.Noninvasive Prenatal Diagnosis of a Fetal Microdeletion Syndrome . N Engl J Med 2011;365:1847-1848」。しかしながら、このような大量なデータを生じたことは、資源消耗から見ても、時間効率から見ても、臨床の使用に適合しない。
上記の内容から分かるように、現在、染色体微小欠失/微細重複症候群に対する産前検査方法において、可能な普及される臨床スクリーニングの方法は、未だにないことが分かる。本分野は新たな信頼性がある胎児コピー数多型スクリーニング方法が必要であって、既知の遺伝子部位に対して鑑定し、未知の遺伝子部位に対して発見的な探求を行う。
また、高性能シークエンシング技術の発展、及びシークエンシングのコストの降下につれて、シークエンシング技術が産前スクリーニング方面における研究は、高性能シークエンシングを通じて染色体コピー数多型や異数性等の遺伝子変異、特に胎児異数性染色体変異に対するスクリーニング、分析をますます広い範囲に応用させている。
遺伝子変異検査を行うために、本発明は、コピー数多型と異数性等の遺伝子変異の検出に用いることができ、ハイスループット、高特異性、正確に位置確定できる高性能シークエンシング技術に基づく遺伝子変異スクリーニングを行う方法を提案した。本発明の方法は、テスト試料を獲得してDNAを抽出すること、高性能シークエンシングにより獲得されたデータに対して分析を行って、検出結果を得ることを含む。
本発明による遺伝子変異の検出方法は、以下のステップを含む:
1)試料からシークエンシング対象となる配列を獲得するステップ。例えば、前記シークエンシング対象となる配列断片の長さが25-100ntとすることができ、前記シークエンシング対象となる配列断片の数が少なくとも百万本とすることができる。
2)前記シークエンシング対象となる配列と参考ゲノム配列とを比較するステップ。
3)前記参考ゲノム配列をウィンドウに分割して、各ウィンドウまでに対比されたシークエンシング対象となる配列の数を統計し、前記シークエンシング対象となる配列の数に基づき各ウィンドウの統計量を得る。
4)1段の参考ゲノム配列に対して、その上にすべてのウィンドウの統計量が該段参考ゲノム配列上での変化に基づき、両側ウィンドウの統計量が顕著な変化を発生した位置を獲得し、これらの位置は、テスト試料の遺伝子変異部位が参考ゲノム配列上での位置である。
一つの実施形態において、前記遺伝子変異部位は、前記統計量が増加から減少に変更する転換点と次の転換点との中間部位であり、且つ二つの遺伝子変異部位の間に少なくとも50、好ましいのは70、より好ましいのは100、最も好ましいのは100個ウィンドウの長さを有する。上記の部位、転換点、中間部位は、統計量に対応するウィンドウに対応する染色体の位置を指し、ウィンドウの起点、中点、終点等の任意の位置を用いて代表されることができる。
一つの具体的な実施例において、本発明の方法は更に下記のステップを含む。
5)遺伝子変異部位に対してスクリーニングを行って、スクリーニングされた遺伝子変異部位を得る。
例えば、上記のステップ5)は、以下の通りである。
各遺伝子変異部位が前遺伝子変異部位および後遺伝子変異部位のそれぞれとの間にある2段配列に対して、前記2段配列が包含するウィンドウの統計量からなる二つの数値群れの差異を統計して、その差異の顕著性値が最大且つ予め設定された閾値より大きい遺伝子変異部位を除いて、すべての遺伝子変異部位の差異顕著性値が予め設定された閾値より小さくなるまで、前記工程を繰り返すようにする。
前記差異の顕著性は、例えば、ランレングス検定により行われ、ランレングス検定による顕著性値が最大且つ予め設定された閾値より大きい遺伝子変異部位を除く、すべての遺伝子変異部位のランレングス検査による顕著性値が予め設定された閾値より小さくなるまで、前記工程を繰り返す。
一つの実施例において、上記のステップ5)において使用される予め設定された閾値は、以下のステップにより獲得することができる。
a)対照試料でテスト試料を代わって、本発明の方法により遺伝子変異部位を得る。
b)各遺伝子変異部位が前遺伝子変異部位及び後遺伝子変異部位のそれぞれとの間にある2段配列に対して、それらが包含するウィンドウの統計量からなる二つの数値群れの差異を統計して、前記差異が最も顕著ではない遺伝子変異部位を除く。
c)残りの突破点候補の数は期待値のNcと等しくなるまで上記ステップb)を重複する、即ちNc=Lc/T、Lcは、ゲノム配列の長さであり、理論極限精度Tは、理論上に検出できる断片の大きさである。ウィンドウの大きさの平均値がWであり、ウィンドウのスライドの長さがSであり、ランレングス検査の各グループウィンドウの数がNである場合に、理論極限精度T=W+S*Nである。残りのすべての突破点候補の顕著性値において、最小値が前記顕著性閾値である。
本発明は、もう一種類の遺伝子変異の検出方法を提供する。以下のステップを含む。
1)本発明の方法により、1段の参考ゲノム配列上での遺伝子変異部位を得る。
2)前記遺伝子変異部位間の断片に対して信頼確定を行う。
本発明の一つの実施例において、上記のステップ2)の信頼選択のステップは、以下の通りである。
i)ウィンドウの統計量の分布モデルに通じて、統計量の確率の分布を計算し、そして閾値を設定する。
ii)スクリーニングされた遺伝子変異部位間の断片におけるウィンドウの統計量の平均値をと前記閾値とを比較して、比較された結果により遺伝子部位間の断片が異常であるか否かを確定する。
本発明のもう一つの実施例において、上記のステップ2)の信頼選択のステップは、以下の通りである。
i)ウィンドウの統計量の分布モデルに通じて、統計量の確率分布を計算し、そして第一閾値と第二閾値を設定する。
ii)スクリーニングされた遺伝子変異部位間の断片におけるウィンドウの統計量の平均値と前記第一閾値と第二閾値とを比較して、
断片のウィンドウの統計量が第一閾値より小さい場合、該断片は断片欠失であり、第二閾値より大きい場合、該断片は断片重複である。
その中に、累積確率が0.1以下である、好ましいのは0.01以下である、より好ましいのは0,05である部位の統計量の値を第一閾値とし、及び/または累積確率が0.9以上である、好ましいのは0.99以上である、より好ましいのは0.95である部位の統計量の値を前記第二閾値とする。
本発明は、またコンピュータ可読媒体を提供し、当該コンピュータ可読媒体は一連の実行可能なコードを積載し、そのコードより本発明の遺伝子の検出方法を執行することができる。
本発明は、胎児の遺伝子変異の検出方法を提供しており、下記の工程を含む。
胎児核酸を含む母体試料を獲得するステップと、
母体試料に対してシークエンシングを行うステップと
請求項1-16項が記載のいずれかの方法を用いて、遺伝子変異を検出するステップとを含む、胎児の遺伝子変異の検出方法。
本発明の一つの実施例において、前記母体試料は、母体末梢血である。
現在の遺伝子変異の検査方法と比較して、本発明が優れている所は、以下の通りである。
(1)臨床可能性:5Mぐらいのシークエンシングデータのみを使用することにより、5MbぐらいのCNV断片を検出することができる。既に公開された方法は243Mに近いのを使用したため、本発明の方法がデータによる発生したコストと時間を大幅に減少する。
(2)拡張可能性:シークエンシングの量を増加する以外に、本発明は、対照群の数量を拡大することに通じて、精度を増大することにより、最初のDNAの量に対する圧力を軽減することができる。
(3)より安定し、より全面的であること:既に公開された文章において、自身の詳細な操作を明確に指すことがないが、本発明はデータ群れの補正、断片化条件好ましいなど各方面を設計する。
本発明の一つの実施例は染色体に対して遺伝子変異分析を行う簡単なフローチャートである。 S67の染色体の数字の核型図である。 S10の染色体の数字の核型図である。 S14の染色体の数字の核型図である。 S18の染色体の数字の核型図である。 S49の染色体の数字の核型図である。 S55の染色体の数字の核型図である。 S82の染色体の数字の核型図である。 S103の染色体の数字の核型図である。
本発明の実施例により、テスト試料は、核酸を含む試料であって、核酸の種類が特に制限されず、デオキシリボ核酸(DNA)とすることができ、リボ核酸(RNA)とすることもでき、DNAが好ましい。本分野の当業者は、RNAについて、一般的な手段によりそれを対応する配列を有するDNAに転換して、後続の検出と分析を行うことができると理解することができる。また、テスト試料の属性も特に制限されない。本発明のいくつかの実施例により、ゲノムDNA試料を採用することができ、ゲノムDNAの一部をテスト試料として採用することもできる。本発明の実施例により、テスト試料の出所は特に制限されない。本発明の例示により、妊婦サンプルをテスト試料として採用することができ、よってその中から胎児の遺伝情報を含む核酸試料を抽出することができ、さらに胎児の遺伝情報と生理状態に対して検査と分析を行うことができる。本発明の実施例により、使用できる妊婦サンプルの例示は、妊婦末梢血、妊婦尿、妊婦子宮頸の流し胎児の栄養膜の細胞、妊婦の子宮頸の粘液、胎児の有核赤血球を含むが、これに限らない。発明者は、上記の妊婦サンプルに対して核酸試料を抽出することにより、胎児ゲノムにおける遺伝子変異に対して有効に分析を行うことができ、胎児に対するロスレスの産前診断又は検査を実現することを発見する。本発明が非侵襲的胎児遺伝子変異検査を行うことができることは、優越であるが、例えば前記試料が妊婦の末梢血である、本発明の方法が侵襲的な検査にも適用する、例えば前記試料が胎児の臍帯血から得ることができ、前記組織が胎盤組織又は絨毛膜組織とすることができ、前記細胞が未育成又は育成した羊水細胞、絨毛組細胞とすることができる。本発明において、待測被験者と正常被験者は同じ種類である。同時に、本発明の変異検出は、必ずしも病気の診断又はそれと関連する目的に用いる、多態性の存在のため、いくつかの相対参考ゲノムの変異の存在が疾病リスク又は健康状況を代表していないが、純粋に遺伝多態性科学研究の用途とすることができる。
本発明において、対照試料はテスト試料に対するものである。例えば、病気検査に関連する方法において、対照試料は正常な試料を指す。例えば、本発明の一つの実施形態において、テスト試料は母体末梢血であり、対応する対照試料は正常胎児の正常母の末梢血である。
本発明の実施例により、テスト試料から核酸試料を抽出する方法と設備も、特に制限されず、商品化された核酸抽出キットを採用して行うことができる。
本発明の方法において、前記ウィンドウに同様な参照ユニークリード数(reference unique reads)reference unique reads)を有する。参照ユニークリードとは、ユニークリードを有する染色体断片を指す、このような断片は単一染色体の位置に明確的に定位することができ、染色体のユニークリードを参考することは公開された染色体参考ゲノム配列、例えばhg18又はhg19に基づいて構築を行うことができる。参照ユニークリードを獲得する過程は、一般的に、参考ゲノムを任意の固定の長さ配列にカットし、これらの配列を参考ゲノムに対比し、唯一に参考ゲノムに対比配列をユニークリードと選択する。前記固定の長さは、シークエンシング機械がシークエンシングした結果の配列の長さにより決定され、具体的に平均の長さを参考することができる。異なるシークエンシング機械より得られたシークエンシング結果の長さは異なる、具体的な毎回のシークエンシングがシークエンシング結果の長さは異なる可能性もあり、該長さの選択は一定な主観と経験の要素が存在する。
本発明の一つの実施例において、ユニークリードを参考することの長さの選択は、シークエンシング結果の実際の配列の長さにより行われる、例えば25-100bp、illumina / Solexaシステムについて、例えば50bpを選択することにより、各ウィンドウに含まれるユニークリードを参考することの数は80万- 90万に制御する。本発明の方法において、前記ウィンドウの間に重なりがある又は重なりがなしとすることができる。本発明の一つの実施例において、隣接するウィンドウ間の距離は、1kb-100kbであり、5kb-20kbが好ましい、10kbがより好ましい。この距離は、試料中に胎児DNAの豊富度により調整することができる。調整の原理は、各ウィンドウが一つの統計量及び一つの染色体の位置と対応する、即ちウィンドウの距離は測定の精度を決定することを意味する。精度が高いほど、母体出所の背景も高くなり、遺伝子変異の出所を区別しやすくなくなる。
本発明の方法において、前記統計量は、シークエンシング対象となる配列の数自身とすることができるが、誤差修正(例えばGC修正)及び/又はデータ標準化を経過した統計量が好ましい。その目的は、統計量が統計学の通常分布、例えば正規又は標準正規分布に満足させ、統計量に対する後続の統計分析を行うことを便利にすることにある。本発明の一つの実施例において、すべてのウィンドウの平均シークエンシング対象となる配列の数と相対して標準化処理を行う。本発明の一つの実施例において、標準化は、以下Z値を求める過程を含む。一つの実施形態において、前記統計量は、ウィンドウまでに対比したシークエンシング対象となる配列の数に対して標準化処理を行うことにより得られた正規分布に近似に満たす統計量である。一つの実施形態において、前記標準化は、ウィンドウまでに対比した平均シークエンシング対象となる配列の数に基づくものである。一つの実施形態において、前記統計量は、標準正規分布に近似に満たす統計量である。
本発明において、シークエンシング対象となる配列は、シークエンシング機械が出力した配列の断片を指す。即ちreadsであり、約25-100ntが好ましい。
本発明において、前記DNA分子の獲得は、塩析法、カラムクロマトグラフィー、磁性ビーズ法、SDS法等の通常のDNA抽出方法を採用することができ、磁性ビーズ法を採用することが好ましい。磁性ビーズ法とは、血液、組織又は細胞が細胞ライセートとプロティナーゼKとの反応を経て裸のDNA分子を得られ、特異性の磁性ビーズを利用してDNA分子に対して可逆性の親和吸着を行い、リンス液で蛋白質、脂質等の不純物を洗浄した後、清浄液で磁性ビーズからDNA分子を溶離させる。磁性ビーズは、本分野において公知的なものであり、市場、例えばTiangenから購入することができる。
本発明において、一般的な情況の下に、試料から獲得したDNA分子に対して直接にシークエンシングと後続ステップを行うことは、既に本発明の目的を実現することができ、抽出したDNAが処理せずに後続ステップに使われることができる。いくつかの好ましい実施形態において、電気泳動のメインバンドが50-700 bpで集中し、100 - 500bpが好ましい、150-300bpがより好ましい、特に約200bpサイズに集中する断片のみに対して研究を行うことができる。本発明のいくつかのより好ましい実施形態において、DNA分子を電気泳動メインバンドが一定の大きさに集中する断片、例えば50-700 bpであり、100 - 500bpが好ましい、150-300bpがより好ましい、特に200bp近くの断片にしてから、後続ステップを行うことができる。前記DNA分子のランダムカット処理は、中断酵素、フォギング、超音波、又はHydroShear法を採用することができる。超音波法を採用することが好ましい、例えばCovaris会社のS-seriesである(AFA技術に基づいて、センサーより釈放した音響エネルギー/機械エネルギーがDNA試料を通過する時、溶解ガスが気泡を形成する。そのエネルギーが取り除かされた後に、気泡が破裂してDNA分子をカットする能力を発生する。一定のエネルギー強度や時間間隔等の条件を設置することに通じて、DNA分子を一定の範囲内の大きさにカットすることができる。例えば、具体的な原理と方法はCovaris会社のS-series明細書を参照することができる)。
本発明において、前記突破点又は突破点候補(breakpoint)は、潜在又は存在する遺伝子変異部位であり、恒例により、該部位が参考ゲノム上での位置として表現される。本発明において、遺伝子変異部位と突破点との二つの概念は、特定の情況の下に相互変換することができ、表現の違いのみであって、異なる段階で潜在又は確定的に存在する遺伝子変異が参考ゲノム上での位置を表現することが可能である。
本発明において、テスト試料からシークエンシング対象となる配列を獲得することは、シークエンシング方法を採用して行うことができる、前記シークエンシングはいずれのシークエンシング方法に通じて行うことができ、ジデオキシチェーン中止法を含むが、これに限らない。ハイスループットのシークエンシング方法が好ましく、第2世代のシークエンシング技術又は単分子シークエンシング技術を含むが、これに限らない。
前記第2世代のシークエンシングプラットフォーム(Metzker ML . Sequencing technologies-the next generation . Nat Rev Genet . 2010 Jan;11(1):31-46)は、Illumina-Solexa(GATM、HiSeq2000TM等)、ABI-Solid及びRoche-454(ピロリン酸シークエンシング)のシークエンシングプラットフォームを含むが、これに限らない。単分子シークエンシングプラットフォーム(技術)は、Helicos会社の真実単分子シークエンシング技術(True Single Molecule DNA sequencing)、Pacific Biosciences会社の単分子リアルタイムシークエンシング(single molecule real-time(SMRTTM)、及びOxford Nanopore Technologies会社のナノホールシークエンシング技術等(Rusk、Nicole(2009-04-01). Cheap Third-Generation Sequencing . Nature Methods 6(4):2446(4)を含むが、これに限らない。
シークエンシングの類型は、single-end(単方向)シークエンシングとPair-end(双方向)シークエンシングとすることができ、シークエンシングの長さは、50bp、90bp、又は100bpとすることができる。本発明の一つの実施形態において、前記シークエンシングプラットフォームは、Illumina / Solexaであり、シークエンシング類型は、Pair-endシークエンシングであり、双方向の位置関係を持つ100bpサイズのDNA配列分子を得る。
本発明の一つの実施形態において、シークエンシングのシークエンシング深さは、検出する胎児染色体変異断片の大きさにより確定され、シークエンシング深さが高いほど、検出感度が高くなり、即ち検出できる欠失と重複の断片が小さくなる。シークエンシング深さは1-30×とすることができ、即ち総計データ量はヒトゲノムの長さの1-30倍であり、例えば、本発明の一つの実施形態において、シークエンシング深さは0.1×、即ち2倍(2.5×108bp)である。
テストされるDNA分子が複数の試料から得られる時に、各試料は異なるタグ配列を付けられることができ、シークエンシング過程中に試料の区分を行うことに用いられる(Micah Hamady、Jeffrey J Walker、J Kirk Harris et al . Error-correcting barcoded primers forpyrosequencing hundreds of samples in multiplex . Nature Methods、2008、March、Vol.5 No.3)。よって、同時に複数の試料に対するシークエンシングを行うことが実現される。タグ配列は異なる配列を区別するためであるが、タグ配列を付けられるDNA分子の他の機能に影響しない。タグ配列の長さは、4-12bpとすることができる。
本発明の一つの実施例において、前記ヒトゲノム参考配列は、NCBIデータベースにおけるヒトゲノム参考配列である。本発明の一つの実施形態において、前記ヒトゲノム配列は、NCBIデータベースにおけるバージョン36(hg18;NCBI Build 36)のヒトゲノム参考配列である。
本発明において、前記対比は、間違いなし対比とすることができるし、ミスマッチ1塩基の基の対比とすることもできる。配列対比は、いかなる配列対比プログラム、例えば本分野の当業者が獲得できる短いオリゴヌクレオチド分析バッグ(Short Oligonucleotide Analysis Package、SOAP)とBWA対比(Burrows-Wheeler Aligner)を通じて行い、シークエンシング対象となる配列と参考ゲノム序配列とを対比してシークエンシング対象となる配列が参考ゲノム上での位置を得られる。配列対比を行うことは、プログラムが提供するデフォルトのパラメータを用いて行うことができ、又は、本分野の当業者より必要に応じてパラメータに対して選択を行う。本発明の一つの実施形態において、採用する対比ソフトウェアは、SOAPaligner / soap2である。
本発明において、前記ソフトウェアアルゴリズムは、深セン華大遺伝子研究院が開発した胎児コピー数多型の検出に対する一連のプログラムであり、FCAPSと総称する。それは、新世代シークエンシング技術より発生したデータを通じて、テスト試料と対照の集合とをデータの補正を行い、標準化及び断片化を行い、胎児コピー数多型の程度と大きさを試算する。
本発明の方法のいくつかの具体的な実施形態において、ステップ1)のテスト試料からシークエンシング対象となる配列を獲得することについて:Tiangen DP327-02 Kitマニュアルによりテスト試料と対照試料から血漿DNAを抽出した後に、修正したIllumina / Solexaの標準的なデータベース構築の流れによりデータベースの構築を行う。全ゲノムシークエンシング文庫を構築する詳細について、シークエンシング機器のメーカー、例えばIllumina会社が提供する規程を参照することができる。例えば、Illumina会社のMultiplexing Sample Preparation Guide(Part # 1005361;Feb 2010)又はPaired-End SamplePrep Guide(Part # 1005063;Feb 2010)を参照して、それを本文に合併する。この過程において、200bpに集中するDNA分子の両端がシークエンシング用コネクターに加えられ、各試料が異なるタグ配列を加えられることにより、一回のシークエンシングにより得られたデータにおいて複数の試料のデータを区分されることができ、第2世代のシークエンシング方法のIllumina / Solexaシークエンシング(他のシークエンシング方法、例えばABI / SOLiDを用いて同様又は近似な効果に達することができる)を利用して、各試料が一定の大きさの断片のシークエンシング対象となる配列を得る。
本発明の方法のいくつかの具体的な実施形態において、ステップ2)の対比について:本発明方法のステップ1)のシークエンシング対象となる配列とNCBIデータベースにおける標準ヒトゲノム配列とをSOAP2対比を行い、シークエンシングしたDNA配列がゲノム上での位置情報を得る。重複配列がCNV分析に対する妨害を避けるために、ヒトゲノム参考配列と唯一対比するシークエンシング対象となる配列(reads)のみを選択して、後続の分析を行う。
本発明の方法のいくつかの具体的な実施形態において、ステップ3)のウィンドウを分割して、そしてウィンドウの統計量を獲得することは、以下のステップを含む:
a)テスト試料と対照試料について、ゲノム参考配列上に長さがwであるウィンドウを開き、各ウィンドウのGC含有量を計算し、そして各ウィンドウ上に落ちる相対シークエンシング対象となる配列断片の数を計算する。b)上記のテスト試料の相対シークエンシング対象となる配列断片の数を対照試料の相対シークエンシング対象となる配列断片数に対して補正、且つ標準化を行う。
本発明の方法のいくつかの具体的な実施形態において、対照試料集に基づいてテスト試料に対してGC補正を行う:シークエンシングロットの間/内に一定のGC偏向性が存在するため、ゲノム中の高GC又は低GC区域にコピー数偏差を発生させる、対照試料集に基づいてシークエンシングデータに対してGC補正を行うことにより得られる各ウィンドウにおける補正後の相対シークエンシング対象となる配列の数を得ることは、この偏向性を取り除き、コピー数多型の検出精度を高めることができる。各ウィンドウにおける補正後の相対シークエンシング対象となる配列の数に対して標準化を行う:妊娠母の血漿を用いて胎児のコピー数多型を検出する、母のDNA背景の影響のため、胎児の変異が突出され難い、従って標準化を通じて母のDNA背景の騒音を低減し、胎児のコピー数多型の信号を拡大する。本発明の一つの実施形態において、前記GC補正は、以下のステップを含む:a)テスト試料を対照試料に代わり、本発明の方法により各ウィンドウまでに対比したシークエンシング対象となる配列を得て、そして各ウィンドウの相対シークエンシング対象となる配列の数を計算する。b)各ウィンドウまでに対比したシークエンシング対象となる配列のGC含有量と前記ウィンドウの相対シークエンシング対象となる配列の数との関数関係を得る。c)各ウィンドウについて、テスト試料が該ウィンドウ内に対比したシークエンシング対象となる配列のGC含有量と上記の関数関係を利用して、テスト試料の該ウィンドウの相対シークエンシング対象となる配列の数に対して補正を行い、該ウィンドウの補正した相対シークエンシング対象となる配列の数を得る。
本発明の方法のいくつかの具体的な実施形態において、ステップ3)のウィンドウを分割して、そしてウィンドウの統計量を獲得することは、以下のステップを含む:
a)テスト試料と対照試料の相対シークエンシング対象となる配列の数を計算する:
テスト試料と対照試料について、ヒトゲノム参考配列上に長さがwであるウィンドウを開き、本発明の方法のステップ2)における各ウィンドウ上に落ちるシークエンシング対象となる配列の数ri,jを統計し、その中に添字iとjがそれぞれウィンドウ番号と試料番号を代表する、そして各ウィンドウのGC含有量GCi,jを計算し、相対シークエンシング対象となる配列の数
Figure 2015502749
を計算し、その中に平均シークエンシング対象となる配列の数は、
Figure 2015502749
である。
b)データ修正と標準化:(1)GC含有量が横軸であり、相対シークエンシング対象となる配列の数Rが縦軸である座標係において、対照試料のRi,jとGCi,jをリニアフィットして、スロープaiと切片biを得る。
(2)テスト試料の各ウィンドウについて、補正した相対シークエンシング対象となる配列の数
Figure 2015502749
を計算する。
(3)テスト試料の各ウィンドウについて、統計量Zi,jを計算する:
Figure 2015502749
、式中、
Figure 2015502749

Figure 2015502749

本発明の方法のいくつかの具体的な実施形態において、ステップ4)においてテスト試料の遺伝子変異部位が参考ゲノム配列上での位置を得ることは、以下のステップを通じて行う:
(1)初期化:各ウィンドウの端点に対して、該端点の前後ウィンドウの統計量Zの変化傾向が変化を発生し、且つ該端点と前の前後ウィンドウの統計量Zの変化傾向が変わる点との間の距離は少なくともn個ウィンドウ(nが整数10-500であり、50-300が好ましい、例えば100)である場合、該端点が突破点候補(Breakpoint)である。例えば、前後ウィンドウの統計量Zが増加から減少へ変化する時の転換点と次の同様の転換点との間の中点は、突破点候補であり、又は前後ウィンドウの統計量Zが減少から増加へ変化する時の転換点と次の同様の転換点との間の中点は、突破点候補bk(k=1、2、…、s、sが >0の整数)である。
(2)最適反復: 1段のゲノム配列のコピー数多型又は異数性を研究するために、該段のゲノム配列のすべての配列を並べた突破点候補をBc={b1,b2,...,bs}と記する。各突破点候補bkは左右面2つの断片が存在する。前記断片は、即ち前の突破点から該突破点までのエリア及び該突破点から次の突破点までのエリアである。この2つの断片におけるすべてのウィンドウのZi,jに対して検査を行うことにより(例えば、ランレングス検査を行う:非パラメータ検査であり、2つのグループ元素が混合後の分布均一状態を利用して、この二つのグループの差異の顕著性を評価する)得られたp値(pk)を「bkが突破点としての顕著性」とし、pk最大の突破点候補を取り除く、すべてのp値が該ゲノム配列の終止p値(pfinal)より小さいまで、このステップを重複する。
(3)終止p値の獲得:テスト中に、別の対照試料をテスト試料として上記のa)からc)(1)までのステップを行う。1段のゲノム配列について、該段ゲノム配列のすべての配列を並べた突破点候補をBc={b1,b2,...,bs}と記する。各突破点候補bkは左右面2つのウィンドウが存在する。この2つのウィンドウにおけるすべてのZi,jに対してランレングス検査を行うことにより得られたp値(pk)を「bkが突破点としての顕著性」とする。pk最大の突破点候補を取り除き、突破点候補の数が期待値Nc(Nc=Lc/T、Lcはゲノム配列cの長さであり、T(理論極限精度)は理論上に検出できる断片の大きさである。ウィンドウの大きさがWであり、ウィンドウのスライドの長さがSであり、ランレングス検査の各グループの数がNである時に、理論極限精度T=W+S*N)と等しいまで、その左右2つのウィンドウを合併する。該突破点候補集合において、最小のp値は該ゲノム配列の終止p値(pfinal)である。
本発明の方法のいくつかの具体的な実施形態において、前記遺伝子変異部位の間の断片に対して信頼確定を行うステップは以下の通りである。参考ゲノム配列上に遺伝子変異部位の間の断片に対して、該断片におけるZi,jの平均値を計算して、
Figure 2015502749
と記する。断片の
Figure 2015502749
は-1.28より小さい場合、該断片が断片欠失であり、1.28より大きい場合、該断片が断片重複である。
本発明において、ランレングス検査は非パラメータ検査であり、2つのグループが混合後、2つのグループ内の元素の分布均一状況により、この2つのグループを評価する顕著性のP値を得る。http:/ / support.sas.com / kb / 33 / 092.htmlを参考することができる。
本発明において、対照試料をテスト試料として実験する時に、実際においてシークエンシング又は実験により全ゲノムにおいて異なる断片上の対比されたシークエンシング断片の数に差異を引き起こすため、検査を行う過程に、これらの差異が区分されてきて、ただ突破点両端の断片がまだ変異の程度に達していない。検査が始まる時に、突破点候補はこれらの差異を顕著に区別することができないため、N値を定義する必要があり、突破点数がN値である時に、実験がこれらの差異を比較的にうまく区分することができるように保証する。更に、それにより得られた閾値を用いてテスト試料を検査する時により正確的になる。
本発明において、
Figure 2015502749
値の閾値の確定について、対照試料をステップa)とb)によって統計して、各ウィンドウ中のZ値が正規分布に満たすことになる。- 1.28と1.28は、それぞれ該正規分布中に累計確率が0.05と0.95の分位点である。本分野の当業者は必要により、
Figure 2015502749
値の絶対値がより大きい又はより小さい値を選択して、それぞれ正規分布中に累計確率がより大きい又はより小さいと対応することができるが、- 1.28と1.28は、発明者が本発明に対して大量の実験を通じて確定した最適な閾値であり、該2つの値以外に絶対値がより大きい閾値は、検査結果の中の偽陰/偽陽性率を増加する。
本発明の方法の応用において、例えば適用群衆に対して非侵襲胎児CNVスクリーニングを行うことは、遺伝カウンセリングと臨床の意思決定の根拠を提供することに有利する。産前診断を行うことは、患者の出生を有効的に防ぐことができる。本発明の適用群衆は、すべての健康妊婦とすることができ、適用群衆の例示は、本発明のみを説明することに用いるが、本発明の範囲を限定することではない。
以下では、実施例と結びつき、本発明の実施形態に対して詳細な説明を行う。しかしながら、本分野の当業者は、下記の実施例が本発明のみを説明することに用いるが、本発明の範囲を限定するものと見られるべきではないと理解になる。
実施例において具体的な条件を明記されていないものは、通常の条件又はメーカーが提案する条件に従う。使用される試薬又は機器のメーカーが明記されていないものは、いずれも市場から獲得できる通常の製品である。以下の括弧内には各試薬又はキットのメーカー品番である。使用されるシークエンシング用カプラとタグ配列の出所は、Illumina会社のMultiplexing Sample Preparation Oligonutide Kitである。
実施例一、1例の妊婦血漿に対して胎児大断片コピー数多型の検出を行なった。また、9例の妊婦血漿に対して胎児異数性変異の検出を行なった。
DNAの抽出
TiangenDP327-02Kit操作の流れに従って、上記の8例の血漿試料(試料番号は表1を参照)のDNAを抽出し、抽出されたDNAを改正後のIllumina / Solexa標準データベース構築流れに従ってデータベースを構築し、メインバンドが200bpに集中するDNA分子の両端にシークエンシング用コネクターを加え、各試料が異なるタグ配列を加えられてから、flowcell表面に相補継手とハイブリダイゼーションをした。flowcell表面を通じて一層の一本鎖プライマーを接続しており、DNA断片が一本鎖に変わった後に、チップ表面のプライマー塩基と相互補完することを通じて一端がチップ上に「固定」される。もう一方の端は(5’又は3’」)近くの別のプライマーとランダムに補完、「固定」されて「橋(bridge)」になった。30回繰り返し増幅して、各単分子は約1000倍の増幅を得られて、モノクローナルDNAクラスターになった。その後、IlluminaHiseq2000上にダブル末端シークエンシングを通じて、長さは約50bpのDNA断片配列を得た。
具体的には、上記の血漿試料から得られた約10ngのDNAに対して、改正後のIllumina / Solexa標準の流れに従ってデータベースを構築した。具体的な流れは、製品明細書を参照する(http:/ / www.illumina.com /より提供されるIllumina / Solexa標準データベース構築明細書)。2100Bioanalyzer(Agilent)を経て、DNA文庫の大きさ及び挿入断片が約200bpであることを確定し、精確的にQPCRを定量した後、コンピュータシークエンシングを行なった。
シークエンシング
本実施例において、上記の10例の血漿から得られたDNA試料に対して、Illumina / Solexa公式に発表されたClusterStationとHiseq2000(PEsequencing)明細書に従って操作を行って、各試料に約0.36Gのデータ量を獲得させてからコンピューターシークエンシングを行い、各試料が前記タグ配列により区分した。対比ソフトSOAP2(soap.genomics.org.cnから得る)を利用して、シークエンシングにより得られたDNA配列とNCBIデータベースにおけるバージョン36(hg18;NCBIBuild36)のヒトゲノム参考配列とを間違いなく対比を行って、シークエンシングするDNA配列が前記ゲノム上での位置付けを得た。
データ分析
a)テスト試料に対して相対シークエンシング対象となる配列の数を計算した。唯一対比配列を参考することの長さが50bpを選択し、唯一対比配列を参考することの数を統計し、ヒトゲノム参考配列を同様な参考唯一配列の数(84万)を有するウィンドウに分割し、すべてのウィンドウの大きさの平均値が1Mbであり、隣接するウィンドウの距離がS=10kbであった。上記のステップ2における各ウィンドウ上に落ちる実際のシークエンシング対象となる配列の数ri,jを統計し、その中に添字iとjがそれぞれウィンドウ番号と試料番号を代表し、そして各ウィンドウのGC含有量GCi,jを計算し、相対シークエンシング対象となる配列の数
Figure 2015502749
を計算し、その中に平均シークエンシング対象となる配列の数は、
Figure 2015502749
であった。
b)データ修正と標準化:
(1)GC含有量が横軸であり、相対シークエンシング対象となる配列の数Rが縦軸である座標係において、対照試料のRi,jとGCi,jをリニアフィットして、スロープaiと切片biを得た。
(2)テスト試料の各ウィンドウについて、補正した相対シークエンシング対象となる配列の数
Figure 2015502749
を計算した。
(3)テスト試料の各ウィンドウについて、標準化の相対シークエンシング対象となる配列の数Zi,jを計算した:
Figure 2015502749
、式中、
Figure 2015502749

Figure 2015502749

c)ウィンドウの合併
(1)初期化:参考ゲノム配列上の各ウィンドウの起点位置を統計量Zの位置として記録した。参考ゲノム上での染色体の位置と対応して、Z値は変化の傾向があった。Z値の転換点(即ち、Z値が増加傾向から減少傾向へ転換する、又は減少傾向から増加傾向へ転換する臨界点)が対応する位置を見つけた。いずれかの染色体に対して、最初のウィンドウの起点から順次に距離が少なくとも100個ウィンドウの位置を選択し、これらの位置を突破点候補bk(k=1、2、…、s、sが >0の整数)(Breakpoint)と記した。
(2)最適反復:ゲノムのいずれかの染色体のコピー数多型分析又は異数性を研究するために(本実施例は1-22番号のヒト染色体のみを研究する)、各染色体のすべての配列を並べた突破点候補をBc={b1,b2,...,bs}と記した。各突破点候補bkは、左右面2つの断片が存在した。前記断片は、即ち前の突破点から該突破点までのエリア及び該突破点から次の突破点までのエリアであった。この2つの断片におけるすべてのZi,jに対してランレングス検査を行って得られたp値(pk)を「bkが突破点としての顕著性」とし、pk最大の突破点候補を取り除く、すべてのp値が該染色体の終止p値(pfinal)より小さいまで、このステップを重複した。
(3)終止p値の獲得:テスト中に、対照試料をテスト試料として上記のa)からc)(1)までのステップを行なった。染色体cについて、第c条の染色体のすべての配列を並べた突破点候補をBc={b1,b2,...,bs}と記した。各突破点候補bkのいずれも、左右面2つのウィンドウが存在する。この2つのウィンドウにおけるすべてのZi,jに対してランレングス検査を行って得られたp値(pk)を「bkが突破点としての顕著性」とした。突破点候補の数が期待値Nc(Nc=Lc/T、Lcは染色体の長さであり、理論極限精度T=2Mb)と等しいまで、最も顕著ではない突破点候補を取り除いた。該突破点候補集合において、最小のp値は該染色体の終止p値(pfinal)であった。下記の表を参照した。
実施例において使用される関連数値
Figure 2015502749
d)ウィンドウを合併した後の断片フィルタ:ウィンドウを合併した後の断片に対して更に濾過を行うために、該断片におけるZi,jの平均値を計算して、
Figure 2015502749
と記した。断片の
Figure 2015502749
が- 1.28より小さい又は1.28より大きい場合、該断片はコピー数多型であった。結果は表1を参照した。
4)結果可視化、図2を参照する。
Figure 2015502749
以下では、本発明のCNV分析結果とCGHチップ結果とを比較した。比較の結果は、下記の表2を参照した。CGHチップ結果は、Human Genome CGH Microarray Kit、(Agilent Technologies Inc.)を用いた。
プロバイダーの方案に従って獲得し、次のステップを簡単に記載した。
待測見本と同じ性別の健康な人のDNA又は男女健康な人の混合DNAを参照DNAとして採用した。 Cy3、Cy5フルオレセインを利用して参照DNAと待測DNAに対してそれぞれマークを付けてから、プローブとハイブリダイゼーションさせた。待測DNAと参照DNA蛍光強度との比は1である場合、待測DNAと参照DNAとの量が等しいと理解でき、比は1に等しくない場合、待測DNAが欠失又は増幅を有すると表明した。異なる類型のArray CGHの解像度は、マイクロアレイ上にプローブの間隔と長さ次第であった。流れは以下の通りである:Gバンディング染色体検査後に残された細胞培養液を集めて待測見本と対照見本とのゲノムDNAを抽出した。純化が測量待ちの見本及び参照の見本に対して異なる蛍光表記を行い、その後、見本と非特異ハイブリダイゼーションを遮断したCot-1 DNAと混合、変性、プリアニーリング、マイクロアレイとハイブリダイゼーションし、最後に、マイクロアレイ標的特異性と結合していないDNAを溶離して、更にスキャンとソフトウェア分析を通じて各マイクロアレイ標的上での2種類の蛍光信号の強度比を得て、待測見本ゲノムDNAと参照見本ゲノムDNAが対応する配列又はゲノム上でのコピー数の変化を反映した。
Figure 2015502749
以下では、本発明のCNV分析結果と標準核型分析結果とを比較した。比較の結果は、下記の表3を参照した。標準核型分析のステップは、以下の通りであった。
(1)穿刺により得られた羊水を5分間遠心してから(回転速度が800〜1 000回転/分である)、接種カバー内に接種を行なった。まず上澄み液を吸出して他の検査のため保留した。遠心チューブ内に0.5ml羊水及び瀋殿された羊水細胞を残った。瀋殿された胎児の剥離細胞及び羊膜細胞を均一に混ぜて細胞懸濁液になった。3つの培養液が入っている培養瓶内に接種した。
(2)培養瓶を炭酸ガスインキュベーターに入れた。
(3)接種5〜7日後、羊水内の活力がある細胞が瓶の底に貼りつけて、成長し始また。倒立顕微鏡(inverted microscope)を用いて細胞の成長情況を観察した。既に壁に貼った場合、培養液を交換して、3〜5mlの新鮮な培養液を加入し、以後2〜3日毎に液を一回交換した。壁に貼ってある細胞は上皮細胞、繊維細胞及び羊水細胞があり、これは形態が上皮細胞と繊維細胞との間にある細胞であった。上記3種類の細胞のいずれもクローンを形成した。もし生長状態は良好であれば、接種11〜14日後、瓶の底に十数個の大作のクローンがあり、肉眼でも瓶の底に綿チップ状のクローンを見え、その細胞核が大きくて丸かった。この時に製片又は収穫(harvest)と言うのを準備することができた。収穫について一日をかかれば、新鮮な培養液を交換すべきであり、核分裂を増やした。
(4)収獲:培養してから平均14〜20日後に収穫した。培養瓶に0.04ng(毫微克)/ミリリットルのコルヒチン(Colchicine)を加入して、細胞を分裂中に停止させて、5〜15時間を培養した。倒立顕微鏡で複数の細胞核分裂を見える、その細胞核が丸く大きくて、真珠のように明るくて、相互に接続した。コルヒチンの量は、各実験室より異なることができた。
(5)消化(trypsinize):培養瓶内の培養液を遠心チューブ内に注ぎ、培養瓶の底に0.5mlの0.02%EDTAトリプシン消化液又は0.5ml の0.15%のプロティナーゼ(Pronase)を入れて、ガラス長曲がるストローで瓶底の細胞クローンを軽く吹き付けて、倒立顕微鏡の下でクローン細胞が既に漂う時に、遠心チューブに吸入し、更に0.5〜1mlのHank氏液を用いて洗浄し、そして長いストローでまだ漂いてない細胞を引き続き吹き付けて、すっかり落ちさせた後に、遠心チューブ内に注いた。800〜1 000回転/分の速度で5分間を遠心し、澄み液を吸い出して、細胞を予備とした。
(6)低張:上記の遠心チューブと細胞内にそっと4ml の37℃の0.075M KCl液を加入して、指で管底を軽く弾く又は鋭いストローで瀋殿の細胞をそっと吹き付けて、37℃の水浴内に16分間を置く(各実験室が自分の経験より低張時間を設計してもいい)、5分間を遠心してから、上澄み液を吸出して、管壁に沿って新鮮な固定液にそっと点滴して(メタノール:氷酢酸=3:1)、細胞が均一に広がれるように指で管底を軽く叩いて、15分間固定した後に遠心し、固定液を交換し、第2回目に30分間を固定した後に一晩を静置した。
(7)吹片:遠心してから上澄み液を吸出して、0.5mlを残って細胞懸濁液を作った、又は上澄み液を全部吸出して、0.5mlの新たに配合した固定液を加入し、細長いガラス管で気をつけて吹き付けた後に一滴を吸出して、氷水から取り出したガラス片に点滴し、そっと吹き広がって、ガラス片が空気に置いて乾燥した後に、顕微鏡で染色体の分散情況を観察して、吹き続けた。乾燥したガラス片がGiemsaを用いて直接に染色することができた。
(8)分帯:染色体の形態が良好である場合、Giemsa帯を作ることができた。G帯と略称した。まず、65℃でガラス片を1時間焼いて、又は37℃で24時間焼いて、室温の下にガラス片を0.25%のトリプシン液に20〜25秒入れてから、生理食塩水に2回入れて、2%のGiemsa液に5〜10分間入れた後に取り出して流水で洗い流して、空気乾燥した後に、顕微鏡で染色体を観察して、核型分析を行うことができた。
Figure 2015502749
本発明の具体的な実施方法は既に詳細な説明をされたが、本分野の当業者は以下のように理解することになる。既に公開されたすべての教導に従って、それらの細部に対して様々な修正又は切り替えをすることができるが、これらの変更は、いずれも本発明の保護範囲内にある。本発明の全部の範囲は、添付のクレーム及びいかなる同様な物より与えられる。

Claims (19)

  1. 1)テスト試料からシークエンシング対象となる配列を獲得するステップと、
    2)前記シークエンシング対象となる配列と参考ゲノム配列とを対比するステップと、
    3)前記参考ゲノム配列をウィンドウに分割して、各ウィンドウまでに対比されたシークエンシング対象となる配列の数を統計して、前記数に基づいて、各ウィンドウの統計量を得るステップと、
    4)1段の参考ゲノム配列に対して、その上のすべてのウィンドウの統計量が該段参考ゲノム配列上での変化に基づいて、両側ウィンドウの統計量は顕著な変化が発生する位置を獲得し、これらの位置はテスト試料の遺伝子変異部位が参考ゲノム配列上での位置であるとするステップと、
    を含むことを特徴とする遺伝子変異の検出方法。
  2. 5)遺伝子変異部位に対してスクリーニングを行って、スクリーニングされた後の遺伝子変異部位を獲得するステップを更に含む請求項1に記載の遺伝子変異の検出方法。
  3. 前記シークエンシング対象となる配列断片の長さは、25−100ntであり、好ましいのは35−100ntである請求項1又は2に記載の遺伝子変異の検出方法。
  4. 前記シークエンシング対象となる配列断片の数は、少なくとも1百万条である請求項1又は2に記載の遺伝子変異の検出方法。
  5. 前記ウィンドウは、同様な参照ユニークリード数(reference unique reads)を有する請求項1又は2に記載の遺伝子変異の検出方法。
  6. 前記ウィンドウの間に重なりがある又は重なりがない請求項1又は2に記載の遺伝子変異の検出方法。
  7. 前記統計量は、ウィンドウまでに対比されたシークエンシング対象となる配列の数に対して標準化処理を行った後に得られた正規分布に適合する統計量である請求項1又は2に記載の遺伝子変異の検出方法。
  8. 前記標準化は、すべてのウィンドウまでに対比された平均シークエンシング対象となる配列の数であるに請求項7に記載の遺伝子変異の検出方法。
  9. 前記遺伝子変異部位は、前記統計量が増加から減少に変更する転換点と次の同様な転換点との間の中間部位であり、且つ2つの遺伝子変異部位の間に、少なくとも50、好ましいのは70以上、より好ましいのは100以上、最も好ましいのは100個のウィンドウの長さを有する請求項1又は2に記載の遺伝子変異の検出方法。
  10. 前記ステップ5)は、
    各遺伝子変異部位が前遺伝子変異部位及び後遺伝子変異部位のそれぞれとの間にある2段配列に対して、前記2段配列が包含するウィンドウの統計量からなる二つの数値群れの差異を統計して、その差異の顕著性値が最大且つ予め設定された閾値より大きくなる遺伝子変異部位を除いて、すべての遺伝子変異部位の差異顕著性値が予め設定された閾値より小さいまで、前記工程を繰り返すようにすることである請求項2に記載の遺伝子変異の検出方法。
  11. 前記差異の顕著性はランレングス検査によって行われ、ランレングス検査の顕著性値が最大かつ予め設定された閾値より大きくなる遺伝子変異部位を除いて、すべての遺伝子変異部位のランレングス検査の顕著性値が予め設定された閾値より小さいまで、前記工程を繰り返すこととする請求項10に記載の遺伝子変異の検出方法。
  12. a)対照試料でテスト試料を代わって、請求項1の方法により遺伝子変異部位を得るステップと、
    b)各遺伝子変異部位が前遺伝子変異部位および後遺伝子変異部位のそれぞれとの間にある2段配列に対して、それらが包含するウィンドウの統計量からなる二つの数値群れの差異を統計して、前記差異が最も顕著ではない遺伝子変異部位を除くステップと、
    c)残りの突破点候補の数は期待値のNcと等しくなるまで上記のステップb)を重複する、即ちNc=Lc/T、Lcは、ゲノム配列の長さであり、理論極限精度Tは、理論上に検出できる断片の大きさである。ウィンドウの大きさの平均値がWであり、ウィンドウのスライドの長さがSであり、ランレングス検査の各グループウィンドウの数がNである場合に、理論極限精度T=W+S * Nである。残りのすべての突破点候補の顕著性値の中に、最小値は前記顕著性の閾値であるステップと、
    を通じて前記予め設定された閾値を獲得する請求項10又は11に記載の遺伝子変異の検出方法。
  13. 1)請求項1−10のいずれか1項に記載の方法により、1段の参考ゲノム配列上の遺伝子変異部位を得るステップと、
    2)前記遺伝子変異部位間の断片に対して信頼確定を行うステップと、
    を含むことを特徴とする遺伝子変異の検出方法。
  14. 前記ステップ2)は、
    i)ウィンドウの統計量の分布モデルに通じて、統計量の確率の分布を計算し、そして閾値を設定し、
    ii)スクリーニングされた遺伝子変異部位間の断片におけるウィンドウの統計量の平均値と前記閾値とを比較して、比較された結果により遺伝子部位間の断片が異常であるか否かを確定することである請求項13に記載の遺伝子変異の検出方法。
  15. 前記ステップ2)は、
    i)ウィンドウの統計量の分布モデルに通じて、統計量の確率分布を計算し、そして第一閾値と第二閾値を設定し、
    ii)スクリーニングされた遺伝子変異部位間の断片におけるウィンドウの統計量の平均値と前記第一閾値と第二閾値とを比較して、
    断片におけるウィンドウの統計量が第一閾値より小さい場合、該断片は断片欠失であり、第二閾値より大きい場合、該断片は断片重複であることである請求項14に記載の遺伝子変異の検出方法。
  16. 累積確率が0.05である部位の統計量の値を前記第一閾値とし、及び/又は、累積確率が0.95である部位の統計量の値を前記第二閾値とする請求項15に記載の遺伝子変異の検出方法。
  17. コンピュータ可読媒体であって、前記コンピュータ可読媒体が一連の実行可能コードを積載し、請求項1−16のいずれかに記載の方法を執行することができることを特徴とするコンピュータ可読媒体。
  18. 胎児核酸を含む母体試料を獲得するステップと、
    母体試料に対してシークエンシングを行うステップと、
    請求項1−16のいずれかに記載の方法により、遺伝子変異を検出するステップと、
    を含むことを特徴とする胎児の遺伝子変異の検出方法。
  19. 前記母体試料は、母体末梢血である請求項18に記載の遺伝子変異の検出方法。
JP2014546264A 2011-12-31 2011-12-31 遺伝子変異の検出方法 Active JP5993029B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/002244 WO2013097062A1 (zh) 2011-12-31 2011-12-31 一种遗传变异检测方法

Publications (2)

Publication Number Publication Date
JP2015502749A true JP2015502749A (ja) 2015-01-29
JP5993029B2 JP5993029B2 (ja) 2016-09-14

Family

ID=48696161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014546264A Active JP5993029B2 (ja) 2011-12-31 2011-12-31 遺伝子変異の検出方法

Country Status (9)

Country Link
US (1) US20140370504A1 (ja)
EP (1) EP2772549B8 (ja)
JP (1) JP5993029B2 (ja)
CN (1) CN104204220B (ja)
DK (1) DK2772549T3 (ja)
ES (1) ES2741966T3 (ja)
HU (1) HUE047193T2 (ja)
PL (1) PL2772549T3 (ja)
WO (1) WO2013097062A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201404079SA (en) * 2012-01-20 2014-10-30 Bgi Diagnosis Co Ltd Method and system for determining whether copy number variation exists in sample genome, and computer readable medium
US20160154931A1 (en) 2013-07-17 2016-06-02 Bgi Genomics Co., Limited Method and device for detecting chromosomal aneuploidy
KR102429186B1 (ko) 2013-10-21 2022-08-03 베리나타 헬스, 인코포레이티드 사본수 변동을 결정함에 있어서 검출의 감수성을 향상시키기 위한 방법
CN103993069B (zh) * 2014-03-21 2020-04-28 深圳华大基因科技服务有限公司 病毒整合位点捕获测序分析方法
CA2950596C (en) * 2014-05-30 2023-10-31 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations
CN105734120B (zh) * 2014-12-11 2020-11-27 天津华大基因科技有限公司 检测性发育相关基因变异的方法和试剂盒
EP3502273B1 (en) 2014-12-12 2020-07-08 Verinata Health, Inc. Cell-free dna fragment
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
CN107480470B (zh) * 2016-06-08 2020-08-11 广州华大基因医学检验所有限公司 基于贝叶斯与泊松分布检验的已知变异检出方法和装置
CN106367512A (zh) * 2016-09-22 2017-02-01 上海序康医疗科技有限公司 一种鉴定样本中肿瘤负荷的方法和系统
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
CN110462063B (zh) * 2017-05-23 2023-06-23 深圳华大生命科学研究院 一种基于测序数据的变异检测方法、装置和存储介质
CN109097457A (zh) * 2017-06-20 2018-12-28 深圳华大智造科技有限公司 确定核酸样本中预定位点突变类型的方法
CN107312850A (zh) * 2017-07-19 2017-11-03 华东医药(杭州)基因科技有限公司 一种pcr无效扩增的检测方法
CN109979529B (zh) * 2017-12-28 2021-01-08 北京安诺优达医学检验实验室有限公司 Cnv检测装置
CN108410970A (zh) * 2018-03-12 2018-08-17 博奥生物集团有限公司 一种单细胞基因组拷贝数变异的检测方法及试剂盒
CN109086571B (zh) * 2018-08-03 2019-08-23 国家卫生健康委科学技术研究所 一种单基因病遗传变异智能解读及报告的方法和系统
CN109920485B (zh) * 2018-12-29 2023-10-31 浙江安诺优达生物科技有限公司 对测序序列进行变异模拟的方法及其应用
CN111139303B (zh) * 2020-01-03 2022-07-05 西北农林科技大学 一种山羊cadm2基因cnv标记辅助检测生长性状的方法及其应用
CN113436683A (zh) * 2020-03-23 2021-09-24 北京合生基因科技有限公司 筛选候选插入片段的方法和系统
CN111429966A (zh) * 2020-04-23 2020-07-17 长沙金域医学检验实验室有限公司 基于稳健线性回归的染色体拷贝数变异判别方法及装置
CN113299342B (zh) * 2021-06-17 2024-03-15 苏州贝康医疗器械有限公司 基于芯片数据的拷贝数变异检测方法及检测装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2313520B1 (en) * 2008-07-04 2014-08-27 Decode Genetics EHF Copy number variations predictive of risk of schizophrenia
CN101555528B (zh) * 2008-09-28 2015-05-27 南京市妇幼保健院 一种染色体22q11.2区微缺失、微重复的测定方法
WO2010042716A1 (en) * 2008-10-08 2010-04-15 The Children's Hospital Of Philadelphia Genetic alterations associated with type i diabetes and methods of use thereof for diagnosis and treatment
US8954337B2 (en) * 2008-11-10 2015-02-10 Signature Genomic Interactive genome browser
WO2010057132A1 (en) * 2008-11-14 2010-05-20 The Children's Hospital Of Philadelphia Genetic alterations associated with schizophrenia and methods of use thereof for the diagnosis and treatment of the same
WO2010075459A1 (en) * 2008-12-22 2010-07-01 Celula, Inc. Methods and genotyping panels for detecting alleles, genomes, and transcriptomes

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JPN6015035090; Genome Research, 2009, Vol. 19, No. 9, pp. 1586-1592 *
JPN6015035092; The New England Journal of Medicine, 2011.11.10, Vol. 365, No. 19, pp. 1847-1848 *
JPN6015035095; Nature Methods, 2009, Vol. 6, No. 1, pp. 99-103 *
JPN6015035098; PLoS One, 2011.07.06, Vol. 6, No. 7, e21791 *
JPN6015035100; Prenatal Diagnosis, 2013, Vol. 33, No. 6, pp. 584-590 *
JPN6016013075; BMC Genomics, 2011.04.12, Vol.12, No.184, doi: 10.1186/1471-2164-12-184 *

Also Published As

Publication number Publication date
WO2013097062A1 (zh) 2013-07-04
CN104204220A (zh) 2014-12-10
DK2772549T3 (da) 2019-08-19
US20140370504A1 (en) 2014-12-18
PL2772549T3 (pl) 2019-12-31
EP2772549A1 (en) 2014-09-03
EP2772549B1 (en) 2019-07-31
HUE047193T2 (hu) 2020-04-28
EP2772549B8 (en) 2019-09-11
EP2772549A4 (en) 2015-03-18
ES2741966T3 (es) 2020-02-12
CN104204220B (zh) 2017-06-06
JP5993029B2 (ja) 2016-09-14

Similar Documents

Publication Publication Date Title
JP5993029B2 (ja) 遺伝子変異の検出方法
JP7168247B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
TWI730973B (zh) 游離dna(cell-free dna)之片段化模式分析
KR102147626B1 (ko) 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의 진단 방법
KR101795124B1 (ko) 복제 수 변이를 검측하기 위한 방법 및 시스템
US20140274745A1 (en) Method for detecting micro-deletion and micro-repetition of chromosome
AU2012380221B2 (en) Method, system and computer readable medium for determining base information in predetermined area of fetus genome
JP2015534807A (ja) 胎児の染色体異数性を検出するための非侵襲的方法
CN106661609B (zh) 用于预测先天性心脏缺陷的方法
CN105555970B (zh) 同时进行单体型分析和染色体非整倍性检测的方法和系统
CN112126677B (zh) 耳聋单倍型基因突变无创检测方法
WO2015035555A1 (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
KR20210138556A (ko) 짧은 탠덤 반복 영역에서의 변이를 결정하기 위한 서열-그래프 기반 툴
JP2014530629A (ja) 染色体の微細欠失及び微細重複を検出する方法
US11869630B2 (en) Screening system and method for determining a presence and an assessment score of cell-free DNA fragments
CN111321210B (zh) 一种无创产前检测胎儿是否患有遗传疾病的方法
TW202237856A (zh) 使用尿液及其他dna特徵之方法
WO2024076469A1 (en) Non-invasive methods of assessing transplant rejection in pregnant transplant recipients
JP2015517317A (ja) 双子の類型を鑑定する方法とシステム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160818

R150 Certificate of patent or registration of utility model

Ref document number: 5993029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250