WO2018148903A1

WO2018148903A1 - 泌尿系统肿瘤的辅助诊断方法

Info

Publication number: WO2018148903A1
Application number: PCT/CN2017/073778
Authority: WO
Inventors: 高芳芳; 薄世平; 梁覃斯; 任军
Original assignee: 上海亿康医学检验所有限公司
Priority date: 2017-02-16
Filing date: 2017-02-16
Publication date: 2018-08-23

Abstract

一种泌尿系统肿瘤的辅助诊断方法，用Malbac-L扩增方法对所述待测样本进行扩增，并基于全基因组混乱度评分（WGAS）的数值对泌尿系统肿瘤进行辅助诊断和/或预后评估。

Description

泌尿系统肿瘤的辅助诊断方法

技术领域

本发明涉及医学领域，具体地，涉及泌尿系统肿瘤的辅助诊断方法。

背景技术

传统的肿瘤诊断方法包括影像、手术病理、活检等，但是这种检测在某些方面存在着不足：

1、忽视了肿瘤病灶的异质性。今天我们已经逐渐认识到肿瘤本身是很复杂的组成，有肿瘤细胞、间质细胞、肿瘤细胞外基质(ECM)，甚至还有免疫细胞等参与到肿瘤的发展，如果传统诊疗只针对肿瘤细胞，那么肯定会遇到很大的麻烦；

2、忽视了肿瘤的转移环节。我们能通过影像方法找到肿瘤的原发灶以及转移灶，但是肿瘤细胞是如何从原发灶到转移灶，这个环节我们还缺乏足够的认识，更没有很好的手段去阻断这个过程。

液体活检的检测方法，可以捕获到进入血液的其它肿瘤细胞或DNA，从而可以作为一种肿瘤诊断方法，并且这种方法是一种非介入式的检测方法，并且可重复性的抽取样本进行检测。

当前世界上液体活检技术有三个主要的分支，即循环肿瘤细胞(CTC)、循环肿瘤DNA(ctDNA)以及外泌体(exosome)。

CTC检测为最早应用于临床的液体活检技术。CTC的计数可用于判断预后以及复发检测；对CTC进行单细胞测序，可指导肿瘤用药、掌握癌症的动态变化，及时调整治疗方案；从血液中分离出来的活体CTC，还可进行进一步培养，用于构建肿瘤研究模型。但是由于CTC的特殊性，即稀有性、异质性和结构的复杂性，CTC检测的技术难度较高，市面上能完整提供CTC检测技术及服务的供应商数量不多，而且每家的技术都有所区别。

相对于CTC检测，ctDNA检测的研究历程是十分曲折的。早在1948年已在正常人体血液中检测到游离DNA片段，即cfDNA；紧接着是1973年发现疾病患者血液中的DNA水平要高于正常人，这就意味着可以通过血液中简单的DNA分析可以做初步的疾病筛查；但是直到2013年，研究人员开发出灵敏度极高的基因检测技术，使检测血液中微量DNA的突变成为可能，至此依托于基因检测的体液活检才成为了现实。

但由于技术限制，ctDNA的应用尚停留在作为组织样本的补充，进行靶向基因检测的初级阶段。而通过循环肿瘤DNA进行早期预警及术后评估等应用由于需要大量的临床数据作为支持，并且受制于检测技术的稳定性，尚未有成熟的产品投入临床市场。

而外泌体则是介于两者之间，在数量上多于CTC，更易富集；在形式上，分泌小泡能够有效保护核酸类物质，克服了ctDNA在血液中容易降解的问题。外泌体携带的信息多样化，其中的蛋白质和核酸，均可用于癌症的早诊、复发监测、抗药性监测等相关方面的分析。但是，目前外泌体活检扔更多地还处于实验室科研水平。

因此，本领域迫切需要开发一种可高效、准确的对肿瘤(尤其是泌尿系统肿瘤)进行辅助诊断和/或预后评估的方法。

发明内容

本发明的目的在于提供一种可高效、准确的对肿瘤(尤其是泌尿系统肿瘤)进行辅助诊断和/或预后评估的方法。

在本发明第一方面，提供了一种泌尿系统肿瘤的辅助诊断方法，所述方法包括步骤：

(i)提供一待测样本；

(ii)对所述待测样本进行Malbac-L扩增、测序，从而获得所述样本的基因组序列；

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对，从而获得基因组序列在参考基因组上的位置信息；

(iv)将所述的参考基因组分成M个区域片段，其中每个区域片段为一个窗口b，计算每个窗口b的拷贝数；

(v)对步骤(iv)的每个窗口b进行Z检验，从而计算每个窗口b的Z值；

(vi)根据步骤(v)所得到的Z值，计算全基因组混乱度评分(WGAS，Whole genomic abnormality score)；和

(vii)基于全基因组混乱度评分(WGAS)，从而对泌尿系统肿瘤进行辅助诊断和/或预后评估。

在另一优选例中，在步骤(ii)中，对所述待测样本无需提取其中DNA,直接进行Malbac-L扩增、测序，从而获得所述样本的基因组序列。

在另一优选例中，在步骤(ii)中，可提取所述待测样本中的DNA,进行Malbac-L扩增、测序，从而获得所述样本的基因组序列。

在另一优选例中，所述参考基因组可以是连续的，也可以是不连续的。

在另一优选例中，所述参考基因组包括全基因组。

在另一优选例中，所述参考基因组指该物种(如人)所有染色体的全长、单条或多条染色体的全长、单条或多条染色体的一部分、或其组合。

在另一优选例中，所述参考基因组的覆盖率达到全基因组的50％以上，较佳地，60％以上，更佳地，70％以上，更佳地，80％以上，最佳地，95％以上。

在另一优选例中，所述样本来自待检测个体。

在另一优选例中，所述待检测个体为人或非人哺乳动物。

在另一优选例中，所述样本为固体样本或液体样本。

在另一优选例中，所述样本包括体液样本。

在另一优选例中，所述样本选自下组：血液、血浆、组织间隙液、淋巴液、脑脊液、尿液、唾液、房水、精液、胃肠道分泌液、或其组合。

在另一优选例中，所述样本选自下组：血液、尿液、或其组合。

在另一优选例中，所述样本选自以下组织的样品：膀胱、肾、尿道、输尿管、或其组合。

在另一优选例中，所述样本选自下组：游离的循环肿瘤细胞(CTC)、细胞外游离DNA(cfDNA)、外泌体、或其组合。

在另一优选例中，所述样本含有源自泌尿系统的细胞或所述细胞的核酸成分。

在另一优选例中，所述细胞包括正常细胞、癌细胞、或其组合。

在另一优选例中，所述泌尿系统肿瘤选自下组：膀胱癌、肾癌、尿道癌、肾盂输尿管癌、或其组合。

在另一优选例中，所述Malbac-L扩增的具体方法参见申请号为CN201610264059.0的中国专利申请。

在另一优选例中，所述测序选自下组：单端测序、双端测序、或其组合。

在另一优选例中，所述步骤(iv)还包括校正每个窗口b的拷贝数，计算每个窗口b校正后的拷贝数的步骤。

在另一优选例中，所述校正方法选自下组：Loess校正、权重法、残差法、或其组合。

在另一优选例中，根据基因组序列在参考基因组上的位置信息，统计落到每个窗口b的序列数目、碱基分布、参考基因组的碱基分布。

在另一优选例中，根据每个窗口b的序列及碱基含量，校正每个窗口b的拷贝数。

在另一优选例中，用下述公式计算每个窗口b的Z值：

其中，i为1至M的任意正整数；M为参考基因组分成的窗口的总数量，其中M为≥50的正整数，较佳地，50≤M≤10⁵，更佳地，100≤M≤10⁵，最佳地，200≤M≤10⁵；x_i为所述待测样本在第i个窗口b_i检测的拷贝数值；b_i为第i个窗口。

在另一优选例中，所述正常对照样本指同一物种的正常人的同类样本。

在另一优选例中，用下述公式计算全基因组混乱度评分：

其中，m_b为排序在第m％的窗口，p_b为排序在第p％的窗口，m为30-98，较佳地，40-97，更佳地，60-96，最佳地，80-95，最佳地，95，p为80-100，较佳地，85-100，更佳地，90-100，最佳地，100，且p-m≥2(较佳地，≥5，更佳地，≥10，更佳地，≥15，最佳地，≥20)。

在另一优选例中，所述计算全基因组混乱度评分之前，包括如下步骤：

(a)根据参考基因组序列特征去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域，去除基因组上着丝粒、端粒、随体、异染色质附近L长度的区域，L为小于3M的任何长度；或

(b)根据样本的拷贝数特征去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域。

在另一优选例中，所述步骤(v)之前还包括如下步骤：

(iv1)根据步骤(iv)的每个窗口b的拷贝数，计算正常对照样本中每个窗口b的变异系数CV_i；和

(iv2)将所述CV_i从小到大排序，去除最大的前n％的窗口，其中，n为大于0，小于等于5的任意数值，较佳地，n＝1、2、2.5、3、3.1、4、4.2或5。

在另一优选例中，所述变异系数CV_i用下述公式进行计算：

其中，μ_i为正常对照样本在窗口b_i的拷贝数的算术平均值，用如下公式计算：

其中，j为1至N的任意正整数；N为正常对照样本的总数量，其中N为≥30的正整数，较佳地，30≤N≤10⁸，更佳地，50≤N≤10⁷，最佳地，100≤N≤10⁴；X_j指第j个正常对照样本在所述窗口b_i检测的拷贝数值；

σ_i为正常对照样本在所述窗口b_i的拷贝数的标准差，用如下公式计算：

式中，N、j、X_j、μ_i和σ_i的定义如上。

在本发明第二方面，提供了一种泌尿系统辅助诊断设备，包括：

Malbac-L扩增单元(设备或模块)；

测序单元(设备或模块)；和

全基因组混乱度评分单元(设备或模块)；其中，所述全基因组混乱度评分单元(设备或模块)用于执行本发明第一方面中步骤(iii)-(vi)的任务，并输出所得到的全基因组混乱度评分结果。

在另一优选例中，所述装置还包括样品预处理单元(设备或模块)。

在另一优选例中，所述预处理单元(设备或模块)用于对待测样本进行沉淀处理、和/或裂解处理。

在另一优选例中，所述待测样本为细胞样本。

在另一优选例中，所述测序单元(设备或模块)包括二代测序仪和/或三代测序仪。

在本发明第三方面，提供了一种泌尿系统基因检测方法，包括：

(i)提供一待测样本；

(vii)将步骤(vi)所得到的全基因组混乱度评分(WGAS)作为泌尿系统基因检测结果。

在另一优选例中，所述方法为非治疗性和非诊断性的。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1显示了本发明的快速无创肿瘤检测方法的原理图。

图2显示了膀胱癌患者组织样本与尿液样本染色体拷贝数检测的一致性。

图3显示了膀胱癌患者、正常人以及非肿瘤泌尿系病变病人的尿液样本混乱度评分结果。

具体实施方式

本发明人通过广泛而深入的研究，首次建立了一种有效且可提高泌尿系统肿瘤检测灵敏性和通用性的辅助诊断和/或预后评估的方法，具体地，用Malbac—L扩增方法对所述待测样本进行扩增，并基于全基因组混乱度评分(WGAS)的数值对泌尿系统肿瘤的辅助诊断和/或预后评估。在此基础上，本发明人完成了本发明。

术语

如本文所用，术语“拷贝数变异(Copy Number Variations，CNV)”是指样本基因组染色体或染色体片段拷贝数异常，包括但不限于染色体非整倍体、缺失、重复，大于1000bp碱基的微缺失、微重复。

如本文所用，术语“全基因组混乱度值(Whole Genomic Abnormality Score， WGAS)”是根据样本基因组染色体或染色体片段拷贝数异常计算得到的分值，分值检测范围包括但不限于全基因组、特定的染色体、染色体片段、特定基因。

如本文所用，术语“Z值(Z-score)”也叫标准分值(standard score),是一个数值与平均数的差再除以标准差的过程。用公式表示为：

Z score＝(x-μ)/σ

其中x为某一具体数值，μ为算术平均值，σ为标准差；Z值代表着原始数值和参考平均值之间的距离，是以标准差为单位计算。

如本文所用，术语“部分缓解(PR,partial response)”指靶病灶最大径之和减少≥30％，至少维持4周。

如本文所用，术语“疾病进展(PD,progressive disease)”指靶病灶最大径之和至少增加≥20％，或出现新病灶。

如本文所用，术语“系统”、“设备”为相同含义。

在本发明中，所述突变位点没有特别限制，可以是已知的位点，也可以是将来鉴定出的与肿瘤(优选膀胱癌)相关的位点。

如本文所用，术语“单元”、“设备”、“模块”可互换使用。

参考基因组

在本发明中，以人为例，所述参考基因组可以是全基因组，也可以是部分基因组。并且，所述参考基因组可以是连续的，也可以是不连续的。当所述参考基因组为部分基因组时，所述参考基因组的总覆盖率(F)为全基因组的50％以上，较佳地，较佳地，60％以上，更佳地，70％以上，更佳地，80％以上，最佳地，95％以上，其中，所述总覆盖率(F)指参考基因组占全基因组的百分比。

在一优选实施方式中，所述参考基因组为全基因组。

在一优选实施方式中，所述参考基因组为该物种(如人)所有染色体的全长、单条或多条染色体的全长、单条或多条染色体的一部分、或其组合。

Malbac-L扩增方法

在本发明中，所述的Malbac-L扩增的具体方法参见申请号为201610264059.0的专利申请。

简而言之，该Malbac-L扩增方法的扩增阶段分为预扩增与扩增阶段，预扩增阶段，引物5’端拥有一段固定序列，中间为一定长度的随机序列，如B、D、H、V或其组合，3’端拥有不同长度的特定序列(如GGG，CCC，TTT，AAA，TGGG、GTTT、TNTNG或GTGG中的一种或多种)。在较低温度下该引物可以较均匀的结合到模板上。扩增起始阶段，会产生长短不一的半扩增子，经过几个循环，产物的两端分别带有固定碱基序列及其互补序列，形成全扩增子。全扩增子的固定碱基序列及其互补序列可以形成发卡结构从而阻止进一步的扩增发生。在扩增阶段，添加引物混合物，引物的3端与预扩增阶段的固定序列互补，5端与测序平台所需碱基一致，预扩增阶段产生的全扩增子在此阶段被大量的扩增。扩增产物经过回收后可直接进行上机测序。(参见图1)

测序

在本发明中，可用常规的测序技术和平台进行测序。测序平台不受特别限制，其中第二代测序平台包括(但不限于)：Illumina公司的GA、GAII、GAIIx、HiSeq1000/2000/2500/3000/4000、X Ten、X Five、NextSeq500/550、MiSeq、MiSeqDx、MiSeq FGx、MiniSeq；Applied Biosystems的SOLiD；Roche的454FLX；Thermo Fisher Scientific(Life Technologies)的Ion Torrent、Ion PGM、Ion Proton I/II；华大基因的BGISEQ1000、BGISEQ500、BGISEQ100；博奥生物集团的BioelectronSeq 4000；中山大学达安基因股份有限公司的DA8600；贝瑞和康的NextSeq CN500；紫鑫药业旗下子公司中科紫鑫的BIGIS；华因康基因HYK-PSTAR-IIA。

第三代单分子测序平台包括(但不限于)：Helicos BioSciences公司的HeliScope系统，Pacific Bioscience的SMRT系统，Oxford Nanopore Technologies的GridION、MinION。测序类型可为单端(Single End)测序或双端(Paired End)测序，测序长度可为30bp、40bp、50bp、100bp、300bp等大于30bp的任意长度，测序深度可为基因组的0.01、0.02、0.1、1、5、10、30倍等大于0.01的任意倍数。

在本发明中，优选Illumina公司的HiSeq2500高通量测序平台，测序类型为单端(Single End)测序，测序长度41bp，测序数据量为5M。

数据处理

在本发明中，数据处理通常包括以下步骤：

(a)对待测样本的基因组进行核酸提取、测序，以获得基因组序列；

(b)将所述样本的基因组序列比对到参考基因组，得到序列在参考基因组上的位置；

(c)将参考基因组分成一定长度的窗口，计算每个窗口b的拷贝数；

(d)对每个窗口b进行Z检验，计算每个窗口的Z值；和

(e)计算全基因组混乱度评分(WGAS)。

其中，在步骤(a)中，具体还包括：所述待测样本的类型为体液，体液可以是血液、组织间隙液(简称组织液或细胞间液)、淋巴液、脑脊液、尿液、唾液，检测目标为体液中含有的DNA，DNA具体存在于游离的循环肿瘤细胞(CTC)、细胞外游离DNA(cfDNA)、外泌体等。所述待测样本DNA的提取方式包括(但不限于)：柱式提取、磁珠提取。对样本进行文库构建，采用高通量测序平台，对样本进行测序。

其中，在步骤(b)中，具体还包括：将测序结果去掉接头及低质量数据，比对到参考基因组。参考基因组可为全基因组、任意染色体、染色体的一部分。参考基因组通常选择已被公认确定的序列，如人的基因组可为NCBI或UCSC的hg18(GRCh18)、hg19(GRCh37)、hg38(GRCh38)，或任意一条染色体及染色体的一部分。比对软件可用任何一种免费或商业软件，如BWA(Burrows-Wheeler Alignment tool)、SOAPaligner/soap2(Short Oligonucleotide Analysis Package)、Bowtie/Bowtie2。将序列比对到参考基因组，得到序列在基因组上的位置。可以选择在基因组上唯一比对的序列，去除基因组上多处比对的序列，消除重复序列对拷贝数计算带来的误差。

其中，在步骤(c)中，具体还包括：将基因组分成一定长度的窗口，根据测的数据量，窗口长度也可以为100bp-3,000,000bp(3M)范围内相同或不同的整数。窗口的数量可以是1,000-30,000,000范围内的任意整数。根据测的序列在基因组上的位置，统计落到每个窗口的序列数目、碱基分布、参考基因组的碱基分布。根据每个窗口的序列及碱基GC含量，校正每个窗口的拷贝数，校正方法包括但不限于Loess校正，计算每个窗口校正后的拷贝数。

其中，在步骤(d)中，具体还包括：取N(N为不少于30的自然数)个正常人的样本，同样的提取、建库、测序条件，重复上述步骤(a)-(c)，作为参考数据集。对于每个窗口b_i，都对应N个正常拷贝数值。

计算正常对照样本拷贝数的算术平均值μ_i，算术平均值μ_i计算公式为：

计算正常对照样本拷贝数的标准差σ_i，标准差的计算公式为：

X₁,X₃,X₃,......X_j为正常样本的拷贝数值。

计算待检测样本每个窗口b_i的Z值，Z值的计算公式为：

x_i为窗口b_i检测的拷贝数值。

其中，在步骤(e)中，具体还包括：在整个基因组、某条染色体、染色体片段或基因周围存在高重复区域，如近着丝粒、端粒、随体、异染色质等区域。首先去除高重复区域，以消除对混乱度计算的影响。

在一优选实施方式中，去除的方法包括(但不限于)：

a.根据参考基因组序列特征去除

去除基因组上着丝粒、端粒、随体、异染色质等高通量测序测不到的区域，去除基因组上着丝粒、端粒、随体、异染色质附近L长度的区域，L可以为小于3M的任何长度；或

b.根据正常样本的拷贝数特征去除

对于每个窗口bi，计算正常对照样本在这个窗口的变异系数CV_i(Coefficient of Variation)，CV_i计算公式为：

μ_i为正常对照样本拷贝数的算术平均值，σ_i为正常对照样本拷贝数的标准差。

CV从小到大排序，去除最大的前n％的窗口，n可以为大于0，小于等于5的任意数值。

其中，在步骤(e)中，具体还包括全基因组混乱度评分(WGAS)的计算方式：

首先确定混乱度的检测范围，检测范围包括但不限于整个基因组、特定染色体、特定染色体片段或特定的基因等1M到基因组长度(如人的基因组约3G)范围内的任意值。在混乱度检测范围内，去除重复序列影响的窗口的Z值取绝对值，Z值绝对值从小到大排序，并将排好序的Z值绝对值平均分配到0％-100％范围内，其中Z值绝对值最小值被分配至0％，Z值绝对值的最大值被分配给100％。计算对应于第m％到第p％范围内的各窗口Z值绝对值的累计值，其中，m为30-98，较佳地，40-97，更佳地，60-96，最佳地，80-95，最佳地，95；p为80-100，较佳地，85-100，更佳地，90-100，最佳地，100，且p-m≥2(较佳地≥5，更佳地≥10，更佳地≥15，最佳地≥20)，所述的累计值即为全基因组混乱度评分(WGAS)，计算公式为：

m_b为排序在第m％的窗口，p_b为排序在第p％的窗口。用WGAS的值鉴定体液中肿瘤负荷。

全基因组混乱度评分(WGAS)

根据样本全基因组染色体或染色体片段拷贝数异常计算得到的分值，分值检测范围包括但不限于全基因组、特定的染色体、染色体片段、特定基因。

对泌尿系统肿瘤的辅助诊断和/或预后评估的方法

在本发明中，还提供了一种对泌尿系统肿瘤的辅助诊断和/或预后评估的方法，所述方法包括步骤：

(i)提供一待测样本；

(v)对步骤(iv)的每个窗口b进行Z检验，从而计算每个窗口b的Z值；和

(vii)基于全基因组混乱度评分(WGAS)，从而对泌尿系统肿瘤的辅助诊断和/或预后评估。

泌尿系统辅助诊断设备

在本发明中，还提供了一种泌尿系统辅助诊断设备，包括：

Malbac-L扩增单元(设备或模块)；

测序单元(设备或模块)；和

一种泌尿系统基因检测方法

在本发明中，还提供了一种泌尿系统基因检测方法，包括步骤：

(i)提供一待测样本；

本发明的主要优点包括：

(i)本发明旨在减少肿瘤检测诊断的操作步骤，提高无创性肿瘤检测诊断的通量，降低检测成本，提高检测诊断的灵敏度。

(ii)本发明进行基因拷贝数检测的方法省略了DNA提取过程，与现有二代测序技术相比简化了操作步骤，并且由于本发明可实现单细胞水平上的基因拷贝数检测，所以可以实现对低起始量样本的检测。

(iii)本发明用Malbac-L扩增方法所得到的扩增产物只能来源于原始的模板，所以构建的文库更可充分反映样本中基因拷贝数变化，检测灵敏度更高。

(iv)本发明首次将Malbac-L扩增技术与基因组混乱度评分(WGAS)结合，可有效且准确的对泌尿系统肿瘤进行辅助诊断或预后评估。

下面结合具体实施例，进一步陈述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。

除非有特别说明，否则实施例所用的材料均为市售产品。

实施例1：膀胱癌患者组织样本与尿液样本染色体非整倍体检测

膀胱癌患者组织样本与尿液样本分别进行文库构建，上机测序，数据分析，测序结果进行比较。组织样本建库方式为基因组DNA提取后常规打断建库。尿液样本为本发明中使用方法，具体如下：

1.组织样本：

1.1组织gDNA提取：本实施例中组织样本基因组DNA提取方式为柱式提取，试剂盒为通用型柱式基因组DNA提取试剂盒，提取的基因组DNA使用Qubit进行定量。

1.2文库构建：取500ng基因组DNA，将DNA打断至平均片段长度200bp，打断仪为Covaris DNA打断仪。二代测序快速DNA建库试剂盒NGS Fast DNA Library Prep Set for Illumina进行文库构建，文库纯化回收后进行QPCR定量。

1.3上机测序：使用半导体测序法，测序仪DA8600。

2.尿液样本

2.1获取尿液沉淀

收集正常人和获自医院的膀胱癌肿瘤病人的尿液样本10ml，以晨尿中段尿为优先选择，尿液进行离心，500rpm，4度离心10min，收集沉淀，沉淀使用200ul 1×PBS洗涤2次，最后100ul 1×PBS重悬。

2.2尿液沉淀裂解

对于1中获取的重悬的尿液沉淀取5ul加入5ul裂解液(pH为7.4的Tris-Cl 40mM，EDTA 1mM，KCl 15mM以及3％的Triton X-100)进行裂解，裂解方式为通过加入蛋白酶K进行酶裂解，程序如下：

2.3 2.2中裂解液进行第一次线性扩增

线性扩增试剂包括：引物混合物1(包括：5’-GAGGTGTGATGGADDDDDGGG-3’(SEQ ID NO.:1),5’-GAGGTGTGATGGADDDDDTTT-3’(SEQ ID NO.:2))、dNTPs、具有热耐受和链置换性质的DNA聚合酶以及线性扩增反应缓冲液。

线性扩增程序：

最后低温保温。

2.4 2.3中的第一次扩增产物进行第二次指数扩增

指数扩增试剂包括：引物混合物2(5’-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTAACGATGAGGTGTGATGGA-3’(SEQ ID NO.:3)；5’-CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATGAGGTGTGATGGA-3’(SEQ ID NO.:4))、dNTPs，具有热耐受和链置换性质的DNA聚合酶以及指数扩增反应缓冲液。

指数扩增热循环程序：

最后低温保温。

上述步骤完成后即完成了文库构建，文库纯化后-20℃保存。

2.4上机测序

用QPCR方法检测文库的浓度，通过公式计算文库稀释倍数，利用桥式PCR方法生成测序Cluster，形成测序模板。利用边合成边测序平台对构建好的测序模板进行测序，最终获取每个DNA片段的碱基序列。

文库稀释倍数的计算公式如下：稀释倍数＝Pooling文库浓度(nM)×1000,上机浓度。

2.5数据分析

测序获得的DNA片段的碱基序列定位到人类基因组参考图谱，通过与大量正常样本构成的参考集对比，获得染色体拷贝数的信息。

将组织样本与尿液样本染色体拷贝数信息进行对比。

二代测序数据结果表明，在A样本中，组织样本常规检测方法(图2的A1)与快速无创伤肿瘤检测方法(图2的A2)均能检出多条染色体异常；而在B样本中，组织样本常规检测方法(图2的B1)与快速无创伤肿瘤检测方法(图2的B2)均未见明显的染色体异常，提示染色体正常。

上述结果表明，组织样本常规检测方法与快速无创伤肿瘤检测方法对泌尿系统肿瘤(尤其是膀胱癌)患者的检测结果基本一致。

实施例2：尿液样本全基因组混乱度评分(WGAS)

收集膀胱癌患者，正常人以及非肿瘤泌尿系病变病人的尿液样本，各10ml，以晨尿中段尿为优先选择，尿液进行离心，500rpm，4度离心10min，收集沉淀，沉淀使用200ul 1×PBS洗涤2次，最后100ul 1×PBS重悬。

收集的样本进行裂解，第一次线性扩增以及第二次指数扩增，边合成边测序平台进行测序，具体同实施例一中尿液样本操作步骤。

测序样本的基因组序列比对到参考基因组，得到序列在参考基因组上的位置。将参考基因组分成一定长度的窗口，对每个窗口的拷贝数进行Z检验，根据每个窗口的Z值对全基因组混乱度进行评分(WGAS)。每个样本全基因组混乱度的评分结果如图3所示。

结果表明，使用本发明的方法可以将膀胱癌病人与非膀胱癌病人的样本进行有效区分，进一步证实了本发明的非侵入性检测方法作为膀胱癌辅助诊断的有效性。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

一种泌尿系统肿瘤的辅助诊断方法，其特征在于，所述方法包括步骤：

(i)提供一待测样本；

(ii)对所述待测样本进行Malbac-L扩增、测序，从而获得所述样本的基因组序列；

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对，从而获得基因组序列在参考基因组上的位置信息；

(iv)将所述的参考基因组分成M个区域片段，其中每个区域片段为一个窗口b，计算每个窗口b的拷贝数；

(v)对步骤(iv)的每个窗口b进行Z检验，从而计算每个窗口b的Z值；

(vi)根据步骤(v)所得到的Z值，计算全基因组混乱度评分(WGAS，Whole genomic abnormality score)；和

(vii)基于全基因组混乱度评分(WGAS)，从而对泌尿系统肿瘤进行辅助诊断和/或预后评估。
如权利要求1所述的方法，其特征在于，所述样本选自下组：血液、血浆、组织间隙液、淋巴液、脑脊液、尿液、唾液、房水、精液、胃肠道分泌液、或其组合。
如权利要求1所述的方法，其特征在于，所述步骤(iv)还包括校正每个窗口b的拷贝数，计算每个窗口b校正后的拷贝数的步骤。
如权利要求1所述的方法，其特征在于，用下述公式计算全基因组混乱度评分：

其中，m_b为排序在第m％的窗口，p_b为排序在第p％的窗口，m为30-98，较佳地，40-97，更佳地，60-96，最佳地，80-95，最佳地，95，p为80-100，较佳地，85-100，更佳地，90-100，最佳地，100，且p-m≥2(较佳地，≥5，更佳地，≥10，更佳地，≥15，最佳地，≥20)。
如权利要求1所述的方法，其特征在于，所述步骤(v)之前还包括如下步骤：

(iv1)根据步骤(iv)的每个窗口b的拷贝数，计算正常对照样本中每个窗口b 的变异系数CV_i；和

(iv2)将所述CV_i从小到大排序，去除最大的前n％的窗口，其中，n为大于0，小于等于5的任意数值，较佳地，n＝1、2、2.5、3、3.1、4、4.2或5。
一种泌尿系统辅助诊断设备，其特征在于，包括：

Malbac-L扩增单元；

测序单元；和

全基因组混乱度评分单元；其中，所述全基因组混乱度评分单元用于执行权利要求1中步骤(iii)-(vi)的任务，并输出所得到的全基因组混乱度评分结果。
如权利要求6所述的设备，其特征在于，所述设备还包括样品预处理单元。
如权利要求7所述的设备，其特征在于，所述样品预处理单元用于对待测样本进行沉淀处理、和/或裂解处理。
如权利要求6所述的设备，其特征在于，所述测序单元包括二代测序仪和/或三代测序仪。
一种泌尿系统基因检测方法，其特征在于，包括：

(i)提供一待测样本；

(ii)对所述待测样本进行Malbac-L扩增、测序，从而获得所述样本的基因组序列；

(iii)将步骤(ii)获得的基因组序列与参考基因组进行比对，从而获得基因组序列在参考基因组上的位置信息；

(iv)将所述的参考基因组分成M个区域片段，其中每个区域片段为一个窗口b，计算每个窗口b的拷贝数；

(v)对步骤(iv)的每个窗口b进行Z检验，从而计算每个窗口b的Z值；

(vi)根据步骤(v)所得到的Z值，计算全基因组混乱度评分(WGAS，Whole genomic abnormality score)；和

(vii)将步骤(vi)所得到的全基因组混乱度评分(WGAS)作为泌尿系统基因检测结果。