CN109390034A - 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 - Google Patents
一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 Download PDFInfo
- Publication number
- CN109390034A CN109390034A CN201811097661.5A CN201811097661A CN109390034A CN 109390034 A CN109390034 A CN 109390034A CN 201811097661 A CN201811097661 A CN 201811097661A CN 109390034 A CN109390034 A CN 109390034A
- Authority
- CN
- China
- Prior art keywords
- baf
- value
- cnv
- normal tissue
- copy number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于经过获取BAF值步骤、确定BAF值的条件步骤,再根据公式得到所需要正常组织含量和肿瘤拷贝数值。本发明中检测方法用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。
Description
技术领域
本发明属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法。
背景技术
实体肿瘤的组织样本中,绝大多数情况下都含有一些正常组织,这是在活检取样过程中一个经常遇到的问题。在癌症的临床基因检测中,就有必要知道其正常组织的含量。同时,正常组织的含量的多少也会影响对肿瘤的拷贝数(Copy Number Variants, CNV)的计算。这是一个所有临床基因检测实验室需要解决的困难。
DNA拷贝数的变化(CNV)是癌症的一个主要治病原因,因此成为基因检测的一个重要指标。CNV目前的常用检测平台和金标准是基因芯片(microarray)。随着DNA二代测序(NGS)在基因组学领域的广泛应用,直接从NGS数据获得CNV结果已经逐渐在科研和临床检测中使用,并有最终取代基因芯片的势头。不论使用基因芯片还是NGS,CNV的计算都是来自于两种数据,log2Ratio和B-Allele Frequency(BAF)。log2Ratio用于计算CNV片段,BAF则用于计算杂合体的缺失( Loss of heterozygosity, LOH)和等位基因的失衡(AllelicImbalance)。
发明内容
针对上述问题,本发明提供一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。
解决以上技术问题的本发明中的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
,
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
此时,。
优化方案中,所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
本发明提出一种精确简便的新算法解决这个难题,这将会对实体肿瘤的基因检测及科研带来积极的作用。本发明利用基因芯片或DNA测序(NGS)数据中的B-AlleleFrequency(BAF)值对肿瘤组织中正常组织含量和肿瘤拷贝数(CNV)进行简单方便的检测计算。另外,BAF比log2Ratio对变化更加敏感,这比单纯使用log2Ratio的算法更有价值。
附图说明
下面结合附图及具体实施方式对本发明做更进一步详细说明:
图1为本发明中肿瘤CNV和BAF的案例图
图2为本发明中肿瘤组织中不同正常组织含量对在CNV一个缺失时BAF带分布的影响图
图3为本发明中用CNV缺失片段的BAF值图
图4为本发明中CNV重复区域的nt出现多个可能值时结果图
具体实施方式
下面结合具体实施方式对本发明进行进一步说明:
实施例1
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
,
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
此时,。
实施例2
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要值:
a)当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
,
(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 –c),nA和nB分别是等位基因A和B的CNV 值);
b)当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:(Total Copy Number),
其中,nt为总拷贝数;
此时,。
所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
试验一
如图1是一个肿瘤CNV和BAF的案例。
图中上半部是log2Ratio在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的log2Ratio值,由此计算出CNV片段值。log2Ratio零值基线(log2Ratio =0)代表CNV的正常值(CN = 2),CNV值大于零的片段代表CNV重复(CN Gain),CNV值小于零的片段则代表CNV缺失(CN Loss)。图中的高于或低于零值基线的阈值线分别决定CNV重复或缺失的数目。高于第一条CNV重复阈值线(从零值基线算起)CNV重复为1(CN Gain = 1,总CN值为3),高于第二条CNV重复阈值线表示CNV重复为2 或更多(CN Gain >= 2,总CN值 >=4);低于第一条CNV缺失阈值线(从零值基线算起)CNV缺失为1(CN Loss = 1,总CN值为1),低于第二条CNV缺失阈值线表示CNV缺失为2(CN Loss = 2,总CN值 = 0)。
图1中的下半部是BAF在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的BAF值,由此显示出BAF带(BAF Band),进而决定该区域是LOH还是AllelicImbalance。BAF带是以0.5中线呈镜像对称分布。当CNV片段正常时(CN = 2,log2Ratio =0),相对的BAF显示3条带(BAF = 0, 0.5,1.0),如图中整个第2染色体;当CNV片段重复时,相对的BAF显示4条带(上下两条带表示纯合,BAF = 0 或1;中间两条带表示杂合),如图中整个第5染色体;当CNV片段缺失为1时(CN Loss = 1),相对的BAF只有表示纯合的上下两条带,BAF = 0 或1),如图中的X染色体;当CNV片段缺失为2时(CN Loss = 2),由于两个等位基因区域都缺失,探针的信号与背景信号相同,相对的BAF就会呈现杂乱无章的分布,图中没有这种例子显示。
但是,当肿瘤组织中混有正常组织时,CNV重复和缺失相对的BAF带的分布将会受到影响。显著的变化是CNV缺失也会让BAF呈现4条带,而不是两条带,如图中的第3染色体。CNV重复虽然还是显示4条BAF带,但BAF带值将会与纯肿瘤组织的情形时不同,log2Ratio值也会相对低一些。这使得对数据的分析变得复杂起来。然而,正是由于BAF带型出现了不同的分布,也给计算正常组织在肿瘤组织中的含量和准确计算肿瘤的CNV值带来了希望。
试验二
图2中显示肿瘤组织中不同正常组织含量对在CNV一个缺失时BAF带分布的影响。左边是纯正常组织,BAF显示3条带,右边是纯肿瘤组织,BAF显示2条带,中间三例分别显示10%,50%,75%的肿瘤组织(90%,50%,25%的正常组织)时的BAF 4条带的分布。由此可见,不同的正常组织含量实际上只影响代表杂合体的BAF两个中间带,当肿瘤组织含量增加时(正常组织含量相应降低时),两条BAF中间带的间距增大。
当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
(公式1)
注:BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 )。
当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB = 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化。
定义:nt为总拷贝数(Total Copy Number)
(公式2),
此时:
(公式3)
将公式1,2,3用于实践,如图3中所示。
如图3显示,无论用CNV缺失片段的BAF值(BAF = 0.33)而使用公式1或用CNV重复片段的BAF值(BAF = 0.40)而使用公式2,该案例都得到肿瘤组织的含量为0.5或50%。
从公式2或3可以看出,当处理CNV重复(CN Gain)时,c与nt是相互关联的。nt值可能是3,4或更大值,这样c也会相应有不同的值。
如图4右边CNV重复的区域,c和nt有两个解。但比较左边CNV缺失区域的c值,并参考CNV重复的log2Ratio值(logR = 0.36),只有c = 0.471和nt = 4才是正确答案。
因此,当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值,最终得到满意的结果。
以上显示和描述了本发明的基本原理和主要特征以及本发明的优点,上述实施例和说明书所描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都将落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。
Claims (2)
1.一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:
(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;
(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;
(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:
当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),
,
其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0 < BAF < 0.5 );c是肿瘤组织的含量(正常组织含量因此是 1 – c),nA 和nB分别是等位基因A和B的CNV 值;
当肿瘤组织的CNV重复时(CN Gain >=1),
假定nB= 1,只有nA重复,这样下端的BAF一条带(0 < BAF < 0.5 )就反映了nA的变化;
定义:(Total Copy Number),
其中,nt为总拷贝数;
此时,。
2.根据权利要求1所示的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811097661.5A CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811097661.5A CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109390034A true CN109390034A (zh) | 2019-02-26 |
CN109390034B CN109390034B (zh) | 2021-07-27 |
Family
ID=65418874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811097661.5A Active CN109390034B (zh) | 2018-09-20 | 2018-09-20 | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109390034B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110106063A (zh) * | 2019-05-06 | 2019-08-09 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
CN112980961A (zh) * | 2021-05-11 | 2021-06-18 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650312A (zh) * | 2016-12-29 | 2017-05-10 | 安诺优达基因科技(北京)有限公司 | 一种用于循环肿瘤dna拷贝数变异检测的装置 |
CN106676178A (zh) * | 2017-01-19 | 2017-05-17 | 北京吉因加科技有限公司 | 一种评估肿瘤异质性的方法及系统 |
US20170342500A1 (en) * | 2014-12-19 | 2017-11-30 | Danmarks Tekniske Universitet | Method for identification of tissue or organ localization of a tumour |
CN107423534A (zh) * | 2016-05-24 | 2017-12-01 | 郝柯 | 基因组拷贝数变异的检测方法和系统 |
CN108319813A (zh) * | 2017-11-30 | 2018-07-24 | 臻和(北京)科技有限公司 | 循环肿瘤dna拷贝数变异的检测方法和装置 |
-
2018
- 2018-09-20 CN CN201811097661.5A patent/CN109390034B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170342500A1 (en) * | 2014-12-19 | 2017-11-30 | Danmarks Tekniske Universitet | Method for identification of tissue or organ localization of a tumour |
CN107423534A (zh) * | 2016-05-24 | 2017-12-01 | 郝柯 | 基因组拷贝数变异的检测方法和系统 |
CN106650312A (zh) * | 2016-12-29 | 2017-05-10 | 安诺优达基因科技(北京)有限公司 | 一种用于循环肿瘤dna拷贝数变异检测的装置 |
CN106676178A (zh) * | 2017-01-19 | 2017-05-17 | 北京吉因加科技有限公司 | 一种评估肿瘤异质性的方法及系统 |
CN108319813A (zh) * | 2017-11-30 | 2018-07-24 | 臻和(北京)科技有限公司 | 循环肿瘤dna拷贝数变异的检测方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110106063A (zh) * | 2019-05-06 | 2019-08-09 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
CN110106063B (zh) * | 2019-05-06 | 2022-07-08 | 臻和精准医学检验实验室无锡有限公司 | 基于二代测序的用于神经胶质瘤1p/19q联合缺失检测的系统 |
CN112980961A (zh) * | 2021-05-11 | 2021-06-18 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
CN112980961B (zh) * | 2021-05-11 | 2021-08-27 | 上海思路迪医学检验所有限公司 | 联合检测snv、cnv和fusion变异的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109390034B (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Adie et al. | Speeding disease gene discovery by sequence based candidate prioritization | |
Zhao et al. | Single-cell RNA-seq reveals a distinct transcriptome signature of aneuploid hematopoietic cells | |
CN109033749A (zh) | 一种肿瘤突变负荷检测方法、装置和存储介质 | |
US20090318310A1 (en) | DNA Sequence Assembly Methods of Short Reads | |
CN111968701A (zh) | 检测指定基因组区域体细胞拷贝数变异的方法和装置 | |
CN111304308A (zh) | 一种审核高通量测序基因变异检测结果的方法 | |
CN115394357B (zh) | 用于判断样本配对或污染的位点组合及其筛选方法和应用 | |
CN109390034A (zh) | 一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法 | |
CN108268752B (zh) | 一种染色体异常检测装置 | |
Elhaik et al. | Comparative testing of DNA segmentation algorithms using benchmark simulations | |
Chen et al. | Comprehensive assessment of somatic copy number variation calling using next-generation sequencing data | |
Hijikata et al. | Exome-wide benchmark of difficult-to-sequence regions using short-read next-generation DNA sequencing | |
Adewoye et al. | Human CCL3L1 copy number variation, gene expression, and the role of the CCL3L1-CCR5 axis in lung function | |
Zhu et al. | Phosphohistone H3 (pHH3) is a prognostic and epithelial to mesenchymal transition marker in diffuse gliomas | |
Strope et al. | Xenomake: a pipeline for processing and sorting xenograft reads from spatial transcriptomic experiments | |
Wilmott et al. | Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes | |
CN105969656B (zh) | 一种单细胞外显子测序肿瘤体细胞突变检测及分析平台 | |
Gaiti et al. | Single-cell multi-omics defines the cell-type specific impact of splicing aberrations in human hematopoietic clonal outgrowths | |
US20070134706A1 (en) | Gene information display method and apparatus | |
Xie et al. | Fast evolutionary turnover and overlapping variances of sex-biased gene expression patterns defy a simple binary classification of sexes | |
CN114694745A (zh) | 预测免疫疗效的方法、装置、计算机设备和存储介质 | |
Hsu et al. | A mpli V ar: Mutation Detection in High‐Throughput Sequence from Amplicon‐Based Libraries | |
Gebetsberger et al. | State-of-the-art targeted high-throughput sequencing for detecting inherited platelet disorders | |
Doğan et al. | Statistical tests for neutrality | |
Chen et al. | Identification of tumor microenvironment‐based genes associated with acquired resistance to EGFR Tyrosine Kinase Inhibitor in Lung Adenocarcinoma |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |