JP6839268B2 - 体細胞コピー数多型検出 - Google Patents
体細胞コピー数多型検出 Download PDFInfo
- Publication number
- JP6839268B2 JP6839268B2 JP2019515874A JP2019515874A JP6839268B2 JP 6839268 B2 JP6839268 B2 JP 6839268B2 JP 2019515874 A JP2019515874 A JP 2019515874A JP 2019515874 A JP2019515874 A JP 2019515874A JP 6839268 B2 JP6839268 B2 JP 6839268B2
- Authority
- JP
- Japan
- Prior art keywords
- sequencing
- baseline
- interest
- region
- bins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title description 24
- 230000000392 somatic effect Effects 0.000 title description 5
- 238000012163 sequencing technique Methods 0.000 claims description 182
- 238000000034 method Methods 0.000 claims description 127
- 239000000523 sample Substances 0.000 claims description 123
- 238000010606 normalization Methods 0.000 claims description 83
- 239000012472 biological sample Substances 0.000 claims description 40
- 108090000623 proteins and genes Proteins 0.000 claims description 38
- 230000008859 change Effects 0.000 claims description 12
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 10
- 206010028980 Neoplasm Diseases 0.000 claims description 6
- 230000008685 targeting Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 4
- 230000007717 exclusion Effects 0.000 claims description 3
- 239000013074 reference sample Substances 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims 15
- 210000001082 somatic cell Anatomy 0.000 claims 1
- 238000007482 whole exome sequencing Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 18
- 150000007523 nucleic acids Chemical class 0.000 description 12
- 238000012937 correction Methods 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 108020004707 nucleic acids Proteins 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 210000002593 Y chromosome Anatomy 0.000 description 5
- 230000006399 behavior Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 3
- 108700020462 BRCA2 Proteins 0.000 description 2
- 102000052609 BRCA2 Human genes 0.000 description 2
- 101150008921 Brca2 gene Proteins 0.000 description 2
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 2
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 description 2
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 description 2
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 2
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 2
- -1 MET Chemical compound 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000007427 paired t-test Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100028072 Fibroblast growth factor 4 Human genes 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 101001060274 Homo sapiens Fibroblast growth factor 4 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000022602 disease susceptibility Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Electrotherapy Devices (AREA)
- Soil Working Implements (AREA)
- Image Processing (AREA)
Description
本出願は、すべての目的で引用により本明細書に組み入れられる、2016年9月22日出願の「SOMATIC COPY NUMBER VARIATION DETECTION」と題する米国特許仮出願番号第62/398,354号及び2017年1月17日出願の「SOMATIC COPY NUMBER VARIATION DETECTION」と題する米国特許仮出願番号62/447,065号に対する優先権を主張する。
1.ビン/エキソン選択110:トレーニングする正常サンプル(例えば、FFPE正常サンプル)のセットから、各ビンについてメジアン、メジアン絶対偏差(median absolute deviation)、GC含量及びサイズを計算する(図7参照)。次いで、低いメジアン、大きいMAD、極端なGC含量及び小さいサイズを有するビンをマニフェスト・ファイル内で不良ビンとしてマークする。このステップで影響を受けるビンの割合はわずかである(〜5%)。例えば、図6に示すように、用いられるフィルタリングパラメータは、
メジアン>0.25
CV:(0,2)
GC:(0.25,0.8)
標的サイズ:>20bp
である。
2.ベースライン又は正常サンプル(例えば、FFPE正常サンプル)からのベースライン生成112:異なる組織型由来のサンプル又は異なるDNA品質を有するサンプルは、極めて異なるベースライン挙動を有し得る。したがって、ベースライン効果を補正するために複数のベースラインが用いられる。一例において、各組織型由来の4−5個の正常FFPEサンプルを用いて、各ビンについてメジアン挙動を決定して、異なる組織型を表す。ベースラインを生成するために、階層的クラスタリングを用いて、正常サンプルポピュレーションにおける、複数の根底にあるカバレッジを反映する代表グループを同定する。図8参照。クラスタリングを、サンプル品質と相関させる。ひとたびクラスタが同定されると、各ビンについてのメジアン値を用いてベースライン・ファイルを作成し、これがその後の正規化に用いられる。すなわち、各クラスタ内のメジアン・ビン・カウントをベースラインとして採用する。クラスタリング法を用いることによって、正常サンプルにおける最も「代表的」な挙動が下流の正規化のために用いられる。
1.ベースライン補正116:新たなサンプルに対して、そのビン・カウントをベースラインの線形結合:Y〜c1+c2+c3としてモデル化する。新たなサンプルにおける潜在的なCNVゆえに、最初に外れ値がYから除去され、外れ値が除去された値に基づいて線形モデルが構築される。特定の実施形態において、外れ値はマスクされる。他の実施形態において、極端な外れ値のみが除去され又はマスクされる。次いで、Yと線形モデル予測との比がベースライン補正値として用いられる。3標準偏差を上回る又は下回るビン・カウントが外れ値とみなされる。
Lm(Y[good.idx]〜c1[good.idx]+c2[good.idx]+c3[good.idx])
Y_new〜Y/predict(lm,data=ALL)
2.ステップ1の後、GCバイアスを除去するためのロバストloess回帰118。
3.各遺伝子について、そのメジアン・ビン値をゲノム・メジアンと比較することによって、その倍率変化124を計算する。追加の統計量、例えば各遺伝子についてのt−統計量126を決定することもできる。
60:シーケンシング装置
62:サンプル処理装置
64:コンピュータ
200:グラフィカル・ユーザ・インタフェース
Claims (36)
- コンピュータによって実行される、コピー数を正規化する方法であって、
ユーザからシーケンシング要求を受けて、生物学的サンプル内の1つ以上の注目領域をシーケンシングするステップと、
前記生物学的サンプルと適合しない複数のベースライン生物学的サンプル由来の前記1つ以上の注目領域から、ベースライン・シーケンシング・データを取得するステップと、
前記ベースライン・シーケンシング・データを用いて、前記1つ以上の注目領域のうちの注目領域についての少なくとも1つのコピー数ベースラインを含む、コピー数正規化情報を決定するステップと、
前記コピー数正規化情報を前記ユーザに提供するステップと、
を含むことを特徴とする方法。 - 前記ベースライン・シーケンシング・データが、複数のビンの各ビンについてのシーケンシング・リードカウントを代表するデータを含み、前記複数のビンの各ビンは、それぞれの注目領域に関連付けられることを特徴とする請求項1に記載の方法。
- 前記ベースライン・シーケンシング・データを取得するステップが、標的化シーケンシング・パネルを用いることを含み、前記複数のビンは、前記標的化シーケンシング・パネルにおける前記注目領域に対応する配列を用いて定められることを特徴とする請求項2に記載の方法。
- 前記ベースライン・シーケンシング・データを取得するステップが、全ゲノムシーケンシング・データを取得することを含むことを特徴とする請求項2に記載の方法。
- 前記シーケンシング・リードカウントが、各ビンに対応する前記ベースライン・シーケンシング・データにおける個々のシーケンシング・リードの数の尺度であることを特徴とする請求項2に記載の方法。
- 前記複数のビンの各ビンについて、メジアン・シーケンシング・リードカウント、メジアン絶対偏差、GC含量、及びサイズのうちの1つ以上を決定するステップを含むことを特徴とする請求項3に記載の方法。
- 前記コピー数正規化情報を決定するステップの前に、前記ベースライン・シーケンシング・データから、低メジアン、大きいメジアン配列カバレッジ絶対偏差、所定の範囲外のGC含量、又はサイズ閾値を下回るサイズのうちの1つ以上を有する、前記複数のビンからのビンを排除又はマスクするステップを含み、前記コピー数正規化情報が、前記排除又はマスクするステップ後に残ったビンのみを用いて決定されるようにすることを特徴とする請求項6に記載の方法。
- 前記ビンを排除又はマスクするステップが、メジアン配列カバレッジ・カウントが0.25未満のビンを排除又はマスクすることを含むことを特徴とする請求項7に記載の方法。
- 前記ビンを排除又はマスクするステップが、閾値を上回る絶対偏差を有するメジアン配列カバレッジを有するビンを排除又はマスクすることを含むことを特徴とする請求項7に記載の方法。
- 前記ビンを排除又はマスクするステップが、GC含量が25%未満又は80%より大きいビンを排除又はマスクすることを含むことを特徴とする請求項7に記載の方法。
- 前記ビンを排除又はマスクするステップが、標的サイズが20塩基未満のビンを排除又はマスクすることを含むことを特徴とする請求項7に記載の方法。
- 前記コピー数ベースラインを決定するために、各ビンについて前記ベースライン・シーケンシング・データをクラスタリングするステップを含み、前記コピー数ベースラインは、前記注目領域に関連付けられた前記複数のビンのビン毎のメジアン・シーケンシング・リードカウントから生成されることを特徴とする請求項2に記載の方法。
- 前記複数のビンの追加のビンについてコピー数ベースラインを決定するステップを含むことを特徴とする請求項12に記載の方法。
- 前記生物学的サンプルは個体由来のサンプルであり、複数のベースライン・サンプルは異なる個体由来のサンプルであることを特徴とする請求項1に記載の方法。
- 前記生物学的サンプルは個体の腫瘍組織由来であり、複数のベースライン・サンプルはその個体由来ではない正常組織由来であることを特徴とする請求項1に記載の方法。
- 前記ユーザから前記生物学的サンプルのシーケンシング・データを受け取り、前記シーケンシング・データが前記注目領域における前記コピー数ベースラインからの変動を含むことを判定するステップを含むことを特徴とする請求項1に記載の方法。
- 前記変動の指標を生成し、前記指標を前記ユーザに提供するステップを含むことを特徴とする請求項16に記載の方法。
- 前記指標が、前記注目領域についての前記コピー数ベースラインに対する、前記生物学的サンプルのコピー数における倍率変化であることを特徴とする請求項17に記載の方法。
- 前記シーケンシング・データが前記注目領域における前記コピー数ベースラインからの変動を含むことを判定するステップの前に、前記シーケンシング・データにおける外れ値ビンをマスクするステップを含むことを特徴とする請求項16に記載の方法。
- 前記外れ値ビンをマスクするステップの後、GCバイアスを排除するために前記シーケンシング・データに対してloess回帰を適用するステップを含むことを特徴とする請求項19に記載の方法。
- 前記外れ値ビンをマスクするステップの後、前記シーケンシング・データを曲線にフィッティングするステップを含むことを特徴とする請求項19に記載の方法。
- 前記シーケンシング・データが、エキソーム・シーケンシング・パネルを用いて取得されることを特徴とする請求項19に記載の方法。
- 前記コピー数ベースラインを前記ユーザに提供するステップが、前記ユーザに対する適合サンプルを模倣し、かつ適合サンプルを用いて生成されたものではない、仮説的基準サンプルを代表する情報を提供することを含むことを特徴とする請求項1に記載の方法。
- コンピュータによって実行される、コピー数多型を検出する方法であって、
生物学的サンプルから、それぞれの複数の注目領域についての複数の生シーケンシング・リードカウントを含むシーケンシング・データを取得するステップと、
領域依存カバレッジ・バイアスを除去するために前記シーケンシング・データを正規化するステップと、
を含み、前記正規化するステップは、
各注目領域について、前記生物学的サンプルの領域内の1つ以上のビンの生シーケンシング・リードカウントとベースライン・メジアン・シーケンシング・リードカウントとを比較して、前記注目領域内の1つ以上のビンについてのベースライン補正シーケンシング・リードカウントを生成することを含み、ここで前記注目領域内の1つ以上のビンについての前記ベースライン・メジアン・シーケンシング・リードカウントは、前記生物学的サンプルと適合しない複数のベースライン・サンプル由来であり、各注目領域についてのベースライン・シーケンシング・データの最も代表的な部分のみから決定されたものであり、
前記ベースライン補正シーケンシング・リードカウントからGCバイアスを除去して、各注目領域についての正規化シーケンシング・リードカウントを生成することを含み、
前記方法は、各注目領域内の前記1つ以上のビンの前記正規化シーケンシング・リードカウントに基づいて、各注目領域内のコピー数多型を判定するステップをさらに含むことを特徴とする方法。 - 各注目領域が単一のビンを含むことを特徴とする請求項24に記載の方法。
- 各注目領域が複数のビンを含み、前記ベースライン・メジアン・シーケンシング・リードカウントが前記複数のビンにわたるメジアンであることを特徴とする請求項24に記載の方法。
- 適合した生物学的サンプルからシーケンシング・データを取得するステップを含まないことを特徴とする請求項24に記載の方法。
- 前記方法がコントロールフリーであることを特徴とする請求項24に記載の方法。
- 各注目領域内の前記コピー数多型に基づいて前記生物学的サンプルの臨床的状態を判定するステップを含むことを特徴とする請求項24に記載の方法。
- 前記生物学的サンプルが体細胞サンプルであり、前記臨床的状態が腫瘍又は正常の指定を含むことを特徴とする請求項29に記載の方法。
- 各注目領域についての前記ベースライン・メジアン・シーケンシング・リードカウントが前記ベースライン・シーケンシング・データのクラスタリングによって決定されることを特徴とする請求項24に記載の方法。
- 第1の注目領域についての第1のベースライン・メジアン配列カバレッジ・カウントが、前記複数のベースライン・サンプルの第1のサブセットに由来し、第2の注目領域についての第2のベースライン・メジアン配列カバレッジ・カウントが、前記第1のサブセットとは異なる前記複数のベースライン・サンプルの第2のサブセットに由来することを特徴とする請求項24に記載の方法。
- 前記シーケンシング・データを正規化するステップの前に、前記シーケンシング・データから外れ値ビンを除去又はマスクするステップを含むことを特徴とする請求項32に記載の方法。
- 前記シーケンシング・データを正規化するステップが、前記外れ値ビンを除去又はマスクするステップの後、前記シーケンシング・データにloess回帰を適用して前記シーケンシング・データを曲線にフィッティングすることを含むことを特徴とする請求項33に記載の方法。
- 前記領域依存カバレッジ・バイアスが、GCバイアス、PCRバイアス、又はDNA品質バイアスのうちの1つ以上を含むことを特徴とする請求項24に記載の方法。
- コンピュータによって実行される、標的化シーケンシング・パネルを査定する方法であって、
標的化シーケンシング・パネルに対して、それぞれの複数の遺伝子の部分に対応する第1の複数の標的をゲノム内で同定するステップと、
前記第1の複数の標的の各々のGC含量を判定するステップと、
前記第1の複数の標的のうち所定の範囲外のGC含量を有する標的を排除して、前記第1の複数の標的より小さい第2の複数の標的を得るステップと、
前記排除の後、個々の遺伝子が、その個々の遺伝子の部分に対応する標的を所定の数のより少なく有する場合、前記個々の遺伝子内で追加の標的を同定するステップと、
前記追加の標的を前記第2の複数の標的に追加して、第3の複数の標的を得るステップと、
前記第3の複数の標的に対して特異的なプローブを含むシーケンシング・パネルを提供するステップと
を含むことを特徴とする方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662398354P | 2016-09-22 | 2016-09-22 | |
US62/398,354 | 2016-09-22 | ||
US201762447065P | 2017-01-17 | 2017-01-17 | |
US62/447,065 | 2017-01-17 | ||
PCT/US2017/052766 WO2018057770A1 (en) | 2016-09-22 | 2017-09-21 | Somatic copy number variation detection |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019537095A JP2019537095A (ja) | 2019-12-19 |
JP6839268B2 true JP6839268B2 (ja) | 2021-03-03 |
Family
ID=60002106
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019515874A Active JP6839268B2 (ja) | 2016-09-22 | 2017-09-21 | 体細胞コピー数多型検出 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230207048A1 (ja) |
EP (1) | EP3516564A1 (ja) |
JP (1) | JP6839268B2 (ja) |
KR (2) | KR102711907B1 (ja) |
CN (2) | CN110024035B (ja) |
AU (2) | AU2017332381A1 (ja) |
CA (3) | CA3213915A1 (ja) |
MX (1) | MX2019003344A (ja) |
NZ (1) | NZ751798A (ja) |
RU (1) | RU2768718C2 (ja) |
WO (1) | WO2018057770A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9476095B2 (en) | 2011-04-15 | 2016-10-25 | The Johns Hopkins University | Safe sequencing system |
EP3447495B2 (en) | 2012-10-29 | 2024-03-13 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
WO2017027653A1 (en) | 2015-08-11 | 2017-02-16 | The Johns Hopkins University | Assaying ovarian cyst fluid |
CA3072195A1 (en) | 2017-08-07 | 2019-04-04 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
WO2019209884A1 (en) | 2018-04-23 | 2019-10-31 | Grail, Inc. | Methods and systems for screening for conditions |
CN109920485B (zh) * | 2018-12-29 | 2023-10-31 | 浙江安诺优达生物科技有限公司 | 对测序序列进行变异模拟的方法及其应用 |
WO2021114139A1 (zh) * | 2019-12-11 | 2021-06-17 | 深圳华大基因股份有限公司 | 一种基于血液循环肿瘤dna的拷贝数变异检测方法和装置 |
CN110993022B (zh) * | 2019-12-20 | 2023-09-05 | 北京优迅医学检验实验室有限公司 | 检测拷贝数扩增的方法和装置及建立检测拷贝数扩增的动态基线的方法和装置 |
CN113192555A (zh) * | 2021-04-21 | 2021-07-30 | 杭州博圣医学检验实验室有限公司 | 一种通过计算差异等位基因测序深度检测二代测序数据smn基因拷贝数的方法 |
CN113823353B (zh) * | 2021-08-12 | 2024-02-09 | 上海厦维医学检验实验室有限公司 | 基因拷贝数扩增检测方法、装置及可读介质 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
AU6846698A (en) | 1997-04-01 | 1998-10-22 | Glaxo Group Limited | Method of nucleic acid amplification |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
DK3363809T3 (da) | 2002-08-23 | 2020-05-04 | Illumina Cambridge Ltd | Modificerede nukleotider til polynukleotidsekvensering |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
US20110059865A1 (en) | 2004-01-07 | 2011-03-10 | Mark Edward Brennan Smith | Modified Molecular Arrays |
EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
JP4990886B2 (ja) | 2005-05-10 | 2012-08-01 | ソレックサ リミテッド | 改良ポリメラーゼ |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
WO2008062855A1 (en) * | 2006-11-21 | 2008-05-29 | Akita Prefectural University | A method of detecting defects in dna microarray data |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP2653861B1 (en) | 2006-12-14 | 2014-08-13 | Life Technologies Corporation | Method for sequencing a nucleic acid using large-scale FET arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
JP5709840B2 (ja) * | 2009-04-13 | 2015-04-30 | キヤノン ユー.エス. ライフ サイエンシズ, インコーポレイテッドCanon U.S. Life Sciences, Inc. | 動的シグナルの相関分析による、パターン認識、機械学習、および自動遺伝子型分類の迅速な方法 |
AU2011207561B2 (en) * | 2010-01-19 | 2014-02-20 | Verinata Health, Inc. | Partition defined detection methods |
WO2011139901A1 (en) * | 2010-04-29 | 2011-11-10 | Esoterix Genetic Laboratories, Llc | Gc wave correction for array-based comparative genomic hybridization |
US8725422B2 (en) * | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
DK2764459T3 (da) * | 2011-10-06 | 2021-08-23 | Sequenom Inc | Fremgangsmåder og processer til ikke-invasiv bedømmelse af genetiske variationer |
EP2844771A4 (en) * | 2012-05-04 | 2015-12-02 | Complete Genomics Inc | METHOD FOR DETERMINING THE ABSOLUTE GENOME-WIDE COPY COUNTER CHANGES OF COMPLEX TUMORS |
US20150094210A1 (en) * | 2012-05-14 | 2015-04-02 | Bgi Diagnosis Co., Ltd. | Method, system and computer readable medium for determining base information in predetermined area of fetus genome |
AU2013204536A1 (en) * | 2012-07-20 | 2014-02-06 | Verinata Health, Inc. | Detecting and classifying copy number variation in a cancer genome |
CA2883901C (en) * | 2012-09-04 | 2023-04-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US20140371078A1 (en) * | 2013-06-17 | 2014-12-18 | Verinata Health, Inc. | Method for determining copy number variations in sex chromosomes |
ES2968644T3 (es) * | 2013-10-04 | 2024-05-13 | Sequenom Inc | Métodos y procedimientos para la evaluación no invasiva de variaciones genéticas |
CA2928185C (en) * | 2013-10-21 | 2024-01-30 | Verinata Health, Inc. | Method for improving the sensitivity of detection in determining copy number variations |
EP3149640B1 (en) | 2014-05-30 | 2019-09-04 | Sequenom, Inc. | Chromosome representation determinations |
US10318704B2 (en) * | 2014-05-30 | 2019-06-11 | Verinata Health, Inc. | Detecting fetal sub-chromosomal aneuploidies |
CN105760712B (zh) * | 2016-03-01 | 2019-03-26 | 西安电子科技大学 | 一种基于新一代测序的拷贝数变异检测方法 |
-
2017
- 2017-09-21 CA CA3213915A patent/CA3213915A1/en active Pending
- 2017-09-21 EP EP17778119.2A patent/EP3516564A1/en active Pending
- 2017-09-21 RU RU2019111924A patent/RU2768718C2/ru active
- 2017-09-21 KR KR1020227022321A patent/KR102711907B1/ko active IP Right Grant
- 2017-09-21 WO PCT/US2017/052766 patent/WO2018057770A1/en unknown
- 2017-09-21 MX MX2019003344A patent/MX2019003344A/es unknown
- 2017-09-21 CA CA3037917A patent/CA3037917C/en active Active
- 2017-09-21 KR KR1020197011535A patent/KR102416441B1/ko active IP Right Grant
- 2017-09-21 CN CN201780070781.3A patent/CN110024035B/zh active Active
- 2017-09-21 US US16/333,933 patent/US20230207048A1/en active Pending
- 2017-09-21 JP JP2019515874A patent/JP6839268B2/ja active Active
- 2017-09-21 CA CA3214358A patent/CA3214358A1/en active Pending
- 2017-09-21 CN CN202311358695.6A patent/CN117352050A/zh active Pending
- 2017-09-21 AU AU2017332381A patent/AU2017332381A1/en not_active Abandoned
- 2017-09-21 NZ NZ751798A patent/NZ751798A/en unknown
-
2021
- 2021-01-12 AU AU2021200154A patent/AU2021200154B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CA3213915A1 (en) | 2018-03-29 |
US20230207048A1 (en) | 2023-06-29 |
KR102416441B1 (ko) | 2022-07-04 |
WO2018057770A1 (en) | 2018-03-29 |
RU2019111924A3 (ja) | 2020-10-22 |
KR20220098812A (ko) | 2022-07-12 |
AU2021200154B2 (en) | 2022-12-15 |
AU2021200154A1 (en) | 2021-03-18 |
CN110024035B (zh) | 2023-11-14 |
EP3516564A1 (en) | 2019-07-31 |
RU2768718C2 (ru) | 2022-03-24 |
MX2019003344A (es) | 2019-09-04 |
CA3214358A1 (en) | 2018-03-29 |
KR102711907B1 (ko) | 2024-09-27 |
CN117352050A (zh) | 2024-01-05 |
JP2019537095A (ja) | 2019-12-19 |
CA3037917C (en) | 2024-05-28 |
CA3037917A1 (en) | 2018-03-29 |
AU2017332381A1 (en) | 2019-04-18 |
NZ751798A (en) | 2022-02-25 |
RU2019111924A (ru) | 2020-10-22 |
KR20190058556A (ko) | 2019-05-29 |
CN110024035A (zh) | 2019-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6839268B2 (ja) | 体細胞コピー数多型検出 | |
US10975445B2 (en) | Integrated machine-learning framework to estimate homologous recombination deficiency | |
CN103201744B (zh) | 用于估算全基因组拷贝数变异的方法 | |
Bravo et al. | Model-based quality assessment and base-calling for second-generation sequencing data | |
KR102356323B1 (ko) | 서열 변이체 콜에 대한 검증방법 및 시스템 | |
CN107229841B (zh) | 一种基因变异评估方法及系统 | |
CN111304303B (zh) | 微卫星不稳定的预测方法及其应用 | |
KR102667912B1 (ko) | 미세부수체 불안정성을 결정하기 위한 시스템 및 방법 | |
US20190348149A1 (en) | Validation methods and systems for sequence variant calls | |
KR20160022374A (ko) | 유전적 변이의 비침습 평가를 위한 방법 및 프로세스 | |
JP2019080501A (ja) | 品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料 | |
US6502039B1 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
EP1190366B1 (en) | Mathematical analysis for the estimation of changes in the level of gene expression | |
Markham et al. | Predicting response to immune checkpoint blockade in NSCLC with tumour-only RNA-seq | |
CN115762630A (zh) | 一种利用单核苷酸多态性判断拷贝数变异的方法和系统 | |
Khojasteh Lakelayeh | Quality filtering and normalization for microarray-based CGH data | |
Bergemann | Image analysis and signal extraction from cDNA microarrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6839268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |