WO2013040758A1

WO2013040758A1 - 膀胱移行细胞癌易感性的相关基因及其预测方法和系统

Info

Publication number: WO2013040758A1
Application number: PCT/CN2011/079905
Authority: WO
Inventors: 吴汉杰; 宋卢挺; 侯勇; 李甫强; 李英睿; 王俊; 杨焕明
Original assignee: 深圳华大基因科技有限公司; 深圳华大基因研究院
Priority date: 2011-09-20
Filing date: 2011-09-20
Publication date: 2013-03-28
Also published as: CN103827313B; CN103827313A

Abstract

提供了一组分离的基因、预测对象膀胱移行细胞癌易感性的方法、预测对象膀胱移行细胞癌易感性的系统和试剂盒，其中该分离的一组基因分别包含SEQ ID NO：1—10所示的核苷酸序列。借助这些分离的基因，能够有效地预测对象膀胱移行细胞癌易感性。

Description

膀胱移行细胞癌易感性的相关基因及其预测方法和系统技术领域

本发明涉及生物医学领域。具体而言，涉及膀胱移行细胞癌易感性相关基因及其预测方法和系统。更具体地，本发明涉及一组分离预测对象膀胱移行细胞癌的基因组 DNA、预测对象膀胱移行细胞癌易感性的方法、预测对象膀胱移行细胞癌易感性的系统。背景技术

肿瘤是一种与基因突变密切相关的疾病，因此很多科学家都希望能够借助人类基因计划（ Human Genome Project ) 的开展来促进肿瘤研究的发展。其中，膀胱癌泛指各种出自蓄尿器官膀胱的恶性肿瘤，也就是膀胱存在大量增殖而不受管制的异常细胞。膀胱癌在中国其发病率和死亡率均占泌尿系肿瘤的首位。其组织病例类型以移行上皮细胞癌（transitional cell carcinoma,筒称 TCC)为主，约占 90% ; 其次为鳞状细胞癌（ squamous cellcarcinoma, SCO , 占 5%。罹患膀胱癌最主要的危险因子是来自基因的影响，另外吸烟、长期接触某种染料（含苯胺（aniline )成份者，如纺织厂员工就可能接触到）、汽油或其他化学物质者也有较高的风险。

然而，目前针对膀胱移行细胞癌易感性的预测还有待改进。发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。

本发明是基于发明人的下列发现而完成的：发明人通过对膀胱移行细胞癌细胞进行单细胞测序，并在大量同癌种样本进行验证，发现某些特定的基因的突变的组合与膀胱移行细胞癌的发病有着密切关系。

为此，本发明的一个方面提出了一组分离的基因，这些基因与膀胱移行细胞癌的发病具有高关联性。根据本发明的实施例，这些分离的基因分别包含 SEQ ID NO: 1-10所示的核苷酸序列。具体地， SEQ ID NO: 1-10所示的核苷酸序列构成的基因，分别对应人基因 ASTN1、 ATM, TMBIM4、 HECTD1、 IGDCC3/PU C, COL6A3、 DHX57、 NIPBL、 CFTR、以及 KIAA1958的突变体。借助这些分离的基因作为参照，能够有效地预测对象是否易感膀胱移行细胞癌。

根据本发明的一个方面，本发明提出了上述分离的基因的用途。根据本发明的实施例，提供了上述一组分离的基因在预测对象膀胱移行细胞癌易感性的用途。由此，可以借助上述一组分离的基因，能够预测对象膀胱移行细胞癌的易感性。根据本发明的另一个方面，本发明提供了一种预测对象膀胱移行细胞癌易感性的方法。根据本发明的实施例，该方法包括下列步骤：从所述对象提取单细胞；对所述单细胞的基因组进行分析，以便获得所述单细胞的基因组信息；以及基于所述单细胞的基因组信息中包含上面所述的一组分离的基因，判断所述对象对于膀胱移行细胞癌是易感性的。通过将对象的单细胞基因组进行分析，可以得知对象的细胞中的上述基因是否发生了特定的突变，从而可以预测对象对于膀胱移行细胞癌是否易感。借助根据本发明的实施例的方法，能够有效地预测对象是否易感膀胱移行细胞癌。由此，可以有针对性地采取预防措施，避免相关癌症的发生。

根据本发明的又一个方面，本发明还提供了一种预测对象膀胱移行细胞癌易感性的系统。根据本发明的实施例，该系统包括：单细胞分离装置，所述单细胞提取装置用于从对象样品中分离单细胞；基因组扩增装置，所述基因组扩增装置与所述单细胞分离装置相连，并且用于从所述单细胞扩增基因组；基因组测序装置，所述基因组测序装置与所述基因组扩增装置相连，并且用于对所述单细胞基因组进行测序，以便获得所述单细胞的基因组信息；比对装置，所述比对装置与所述基因组测序装置相连，所述比对装置内预存有对照序列信息，所述对照序列信息为上面所述的一组分离的基因的序列信息，所述对比装置用于将所述单细胞的基因组信息与所述对照序列信息进行比对，以便基于所述单细胞的基因组信息中包含根据上面所述的一组分离的基因，判断所述对象对于膀胱移行细胞癌是易感性的。借助根据本发明实施例的该系统，能够有效地实施根据本发明实施例的预测对象膀胱移行细胞癌易感性的方法，从而有效地预测对象是否易感膀胱移行细胞癌。由此，可以有针对性地采取预防措施，避免相关癌症的发生。

根据本发明的又一方面，本发明还提出了一种用于预测对象膀胱移行细胞癌易感性的试剂盒，根据本发明的实施例，该试剂盒含有适于检测前面所述的一组分离的基因的试剂。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。附图说明

本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：方法的流程示意图；以及

图 2显示了根据本发明实施例的预测对象膀胱移行细胞癌易感性的系统的示意图。具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

本发明是基于发明人的下列发现而完成的：发明人通过对膀胱移行细胞癌细胞进行单细胞测序，并在大量同癌种样本中进行验证，发现某些特定的基因的突变的组合与膀胱移行细胞癌的发病有着密切关系。膀胱癌的发生发展是一个十分复杂的过程。研究膀胱癌的分子遗传学基础，是希望它能给平常检测、临床诊断、个性化针对治疗、愈后病情追踪等方面提供筒便可行的方法。但病人个体的差异性、不同发展阶段相关生物分子事件发生的交叉性等，都给这项工作带来极大的困难。运用单个分子遗传学的变化来诊断该病显然是不可能而且不科学的。发明人应用现代分子生物学技术（全基因组扩增技术、外显子捕获技术、测序技术等）对受检者样本的基因序列进行分析，将其中体细胞突变率高的基因与从大量膀胱移行细胞癌疾病测序中得到的相关基因（或基因位点）进行比较，从而可以对受检者罹患膀胱移行细胞癌疾病的风险作出判断。

易感基因

本发明的一个方面提出了一组分离的基因，这些基因与膀胱移行细胞癌的发病具有高关联性，在本文中将这些基因称为易感基因。根据本发明的实施例，这些分离的基因分别由 SEQ ID NO: 1-10所示的核苷酸序列构成。在本文中所使用的术语 "基因"应作广义理解，其是指在基因组中的任何一段特定的核酸序列，其可以是外显子区序列，也可以是内含子序列，也可以是非编码区以及调控区域和目前还不知道其实际功能的区域，因而在本发明中术语 "基因" 可以与 "寡核苷酸" 互换使用。

具体地，根据本发明实施例的一组分离的基因分别由 SEQ ID NO: 1-10所示的核苷酸序列构成的基因，其分别对应人基因 ASTN1、 ATM, TMBIM4、 HECTD1、 IGDCC3/PU C, COL6A3、 DHX57、 NIPBL、 CFTR、以及 KIAA1958 的突变体。通过生物信息学比对可知， SEQ ID NO: 1-10所示的核苷酸序列与人类正常 ASTN1、 ATM, TMBIM4、 HECTD1、 IGDCC3/PU C, COL6A3、 DHX57、 NIPBL、 CFTR、以及 KIAA 1958 (例如，可以参照最新人类基因组序列数据库 Hgl9 ) 的序列相比，均仅有以下位点的突变：

表 1

SEQ ID 基因名基因 ID 突变位点置换情况 NO:

1 ASTN1 ENSG00000152092 染色体 1 , 第 G/T, S69突

175400230位变为终止密码子

2 ATM ENSG00000149311 染色体 11 ,第 G/C, D140H

107611693位

3 TMBIM4 ENSG00000155957 染色体 12,第 G/A, S247L

64818125位

4 HECTD1 ENSG00000092148 染色体 14,第 G/C

30678890位

5 IGDCC3/PU C ENSG00000174498 染色体 15,第 G/A, R428C

63410917位

6 COL6A3 ENSG00000163359 染色体 2, 第 C/G ,

237914310位 R2663T

7 DHX57 ENSG00000163214 染色体 2, 第 G/A, Q1272

38887207位突变为终止密码子

8 NIPBL ENSG00000164190 染色体 5, 第 G/A ,

37036306位 D1127N

9 CFTR ENSG00000001626 染色体 7, 第 C/T, S1178L

117054876位

10 KIAA1958 ENSG00000165185 染色体 9, 第 C/T, S184L

114376732位

关于上述基因的详细描述，本领域技术人员可以根据基因 ID, 登录 Ensembl 数据库获得。在此不再赘述。发明人惊奇地发现，上述突变基因无论在单细胞测序结果或者在大量癌症样本的基因组测序结果中均存在。为此，申请人从基因组中分离了这些突变基因的序列，即分别为 SEQ ID NO: 1-10所示核苷酸序列构成的基因。其中， SEQ ID NO : 1 表示的是人类基因组染色体 1 上 175400153-175400435的序列； SEQ ID NO: 2表示的是人类基因组染色体 11 上 107611607-107611771的序列； SEQ ID NO 3表示的是人类基因组染色体 12上 64818007-64818213的序列； SEQ ID NO 4表示的是人类基因组染色体 14上 30678849-30678954的序列； SEQ ID NO 5表示的是人类基因组染色体 15上 63410803-63411050的序列； SEQ ID NO 6表示的是人类基因组染色体 2上 237913834-237914532的序列； SEQ ID NO: 7表示的是人类基因组染色体 2上 38887205-38887339的序列； SEQ ID NO: 8表示的是人类基因组染色体 5 上 37036232-37036429的序列； SEQ ID NO: 9表示的是人类基因组染色体 7 上 117054812-117055060的序列；以及 SEQ ID NO: 10表示的是人类基因组染色体 9上 114376182-114377352。

可以将这些突变的基因作为对照，将受检者的膀胱组织单细胞基因组进行检测，如果确定受检者的单细胞基因组中包含了这些突变的基因，则可以预测该受检者已经罹患，或者在将来有比较高的风险罹患膀胱移行细胞癌。需要说明的是，这里所使用的术语 "预测"，应做广义理解，既可以是通过结合其他参数判断受检者已经患有相关疾病，也可以是判断受检者对于相关疾病是高风险的。发明人发现，如果受检者携带上述易感基因，则他面临的膀胱移行细胞癌的风险要比其他人大得多。所以，通过借助上述易感基因检测实现相关癌症的易感预测，测出膀胱移行细胞癌易感性的受检者，在平时的生活中，就应该格外注意避免那些诱发膀胱癌疾病的因素，从而最大限度地避免相关疾病的发生。

根据本发明的实施例，发明人发现这些基因在人膀胱移行细胞癌中的体细胞突变比率超过了 3%。根据国际癌症基因组协会（ICGC )的定义，若一个基因在 3%的癌症样品中发生了体细胞突变，即可表明该基因与该癌种的发生、发育有相当高的关联性。发明人发现，可以利用这些基因用于对对象膀胱移行细胞癌易感性进行预测，为此，本发明提出了上述一组分离的基因在预测对象膀胱移行细胞癌易感性的用途。通过将上述一组分离的基因用于预测膀胱移行细胞癌易感性，可以显著提高预测膀胱移行细胞癌易感性的效率。预测对象膀胱移行细胞癌易感性的方法

根据本发明的另一个方面，本发明提供了一种预测对象膀胱移行细胞癌易感性的方法。根据本发明的实施例，参考图 1 , 该方法包括下列步骤：

S100: 从所述对象提取单细胞。根据本发明的实施例，可以用于预测膀胱移行细胞癌的对象的单细胞来源不受特别限制。根据本发明的一些示例，所预测的对象是人。由此，可以通过提取人的单细胞对人是否易感膀胱移行细胞癌做出有效地判断。根据本发明的一些具体示例，可以从人的血液、尿液、或者组织中提取的，优选，从受检者的膀胱组织中提取的单细胞，由此能够在早期即可对膀胱移行细胞癌做出有效地预测。另外，基于根据本发明实施例的预测方法，采用的是单细胞，因而对受检者没有任何显著的创伤，可以容易地以已知的方法提取单细胞。这与之前需要从受检者体内提取大量生物样本之后进行分析的常规检验有着显著的区别。

S200: 对所述单细胞的基因组进行分析，以便获得所述单细胞的基因组信息。根据本发明的实施例，对单细胞的基因组进行分析的方法和设备不受特别限制。根据本发明的一些实施例，通过采用下列步骤对单细胞的基因组进行分析，获得该单细胞的基因组信息。

具体地，首先通过碱性裂解对所分离的单细胞进行裂解，例如通过将单细胞置于碱性裂解液中，优选地，采用由下面成分组成的碱性裂解液：称取

0.02244克 KOH和 101 升的 1M DTT溶液，加入到 2毫升的去核酸污染水中，振荡混匀即成 ALB碱性裂解液。随后于超净工作台内使用 0.2微米孔径的滤器过滤溶液， 4°C保存可供一周内使用。单细胞采集后转移至 1.5微升的 ALB 溶液中，以 65 °C孵育 10分钟即可裂解细胞。发明人发现，通过采用上述碱性裂解液能够有效地裂解单细胞，并且释放出该单细胞的基因组，从而提高后续对单细胞基因组进行扩增、测序的效率，进而提高预测方法的效率。接下来，根据本发明的实施例，在获得单细胞的基因组之后，为了能够更有效地对单细胞的基因组进行测序检验，可以在进行测序之前，对所获得的单细胞的基因组进行扩增。根据本发明的具体示例，可以通过采用 Phi29 DNA聚合酶，对单细胞的基因组进行扩增。发明人发现，利用该扩增条件能够有效地对单细胞的基因组进行扩增，进而能够提高后续测序和预测的效率。在对基因组进行扩增之后，可以根据基因组测序的方法选定特定的方法建立基因组的测序文库，这可以根据所采用的测序技术的使用说明书来完成，在此不再赘述。根据本发明的实施例，可以采用的测序技术不受特别限制。根据本发明的一些示例，可以采用选自 Hiseq2000、 SOLiD、 454、和单分子测序装置的至少一种对所述单细胞的基因组进行测序。由此，本领域技术人员知道采用何种手段建立与这些测序技术相应的测序文库，并进行有效的高通量测序。本发明的发明人发现基于这些第二代测序技术的高效、高精度的性质，可以实现对样本基因组信息的高效、高精度检测，能够非常灵敏地对样本基因组信息进行检测，从而进一步提高预测易感性的效率。这里所使用的术语 "高通量" 是指可以同时对大量的核酸进行测序检测，术语 "深度" 是指可以对基因组上某一位点进行重复多次检测，当然，本领域技术人员能够预见的是，未来可以采用其他更先进的测序技术。在将经过扩增的单细胞基因组进行建库和测序之后，可以得到多个测序数据，这些测序数据构成了所提取单细胞的基因组信息。接下来，可以通过对所得到的基因组信息进行分析来预测膀胱移行细胞癌的易感性。

S300: 确定所获得的单细胞的基因组信息中是否包含有特定的基因，即前面所详细描述的易感基因。根据本发明的实施例，可以任何常规的方法确定所得到的基因组信息中是否含有特定的基因，即本发明的发明人所发现的由 SEQ ID NO: 1-10所示的核苷酸序列构成的基因。根据本发明的具体示例，可以将所得到的多个测序结果，甚至大量测序结果与本发明人所分离的易感基因进行比对，来确定在测序结果中特定基因是否存在所述突变。例如，可以采用 SOAPsnp软件完成相关比对和突变位点的发现。

S400: 基于 S300步骤中所确定的结果，来判断对象是否对于相关的癌症具有易感性，即是否易感膀胱移行细胞癌。当通过比对，确认在测序结果中相关易感基因发生所述突变时，可以预测该对象易感膀胱移行细胞癌。由此，通过借助根据本发明实施例的预测方法，可以有效地通过借助上述易感基因检测实现相关癌症的易感预测，测出膀胱移行细胞癌易感性的受检者，在平时的生活中，就应该格外注意避免那些诱发膀胱癌疾病的因素，从而最大限度地避免相关疾病的发生。

预测对象膀胱移行细胞癌易感性的系统

根据本发明又一方面，本发明提供了一种预测对象膀胱移行细胞癌易感性的系统。参考图 2, 该系统包括：单细胞分离装置 100、基因组扩增装置 200、基因组测序装置 300以及比对装置 400。

单细胞提取装置 100用于从对象样品中分离单细胞。本领域技术人员可以理解，可以采用任何已知的单细胞设备作为单细胞提取装置 100。

根据本发明的实施例，可以采用下列三种单细胞分离方法和设备：微流控芯片技术，把样品制备、反应、分离、检测等实验室单元技术集成在一块微米尺度的芯片上，能够在短时间内分析大量的生物分子，准确获取样品中的大量信息，从而达到高灵敏快速检测、样品消耗量少、高通量输出以及可在线自动化操作的目的；定量分 ί斤和分选的技术:、可以快速测量、存、悬浮在液体中的分散细胞的一系列重要的生物物理、生物化学方面的特征参量，并可以根据预选的参量范围把指定的细胞亚群从中分选出来；

口吸管操作分离技术，在倒置显微镜视野下使用口吸管吸取和排放含有细胞的液体，细胞从一个液滴转移到另一个液滴，达到逐步稀释的目的，最终实现一次吸排液体获取单个细胞。

基因组扩增装置 200与单细胞分离装置 100相连，可以从单细胞分离装置 100接收分离的单细胞，并且能够从单细胞中扩增基因组，从而可以将基因组并且用于从所述单细胞分离基因组后续基因组测序以及信息分析。本领域技术人员可以理解，可以采用任何已知的基因组分离设备，例如可以采用设置有碱性裂解液的容器，将单细胞置于该裂解液中进行处理，从而可以释放出基因组。

基因组测序装置 300与基因组扩增装置 200相连，以便可以从基因组扩增装置 200接收分离的基因组，并对其进行测序。根据本发明的具体示例，基因组测序装置 300可以包括任何常规的测序所需要的组件，例如文库构建组件以及测序仪器。本领域技术人员可以根据所选用的测序平台，来确定基因组测序装置 300所包括的具体组成部件。通过将所得到基因组进行测序，可以获得单细胞的基因组信息。根据本发明的实施例，基因组测序装置 300 包括选自 Hiseq2000、 SOLiD、 454装置中至少一种。其优点，在前面已经详细描述，在此不再赘述。

比对装置 400与基因组测序装置 300相连，并且在比对装置 400内预存有对照序列信息，这些对照序列信息与上面所描述的一组易感基因的序列相对应。这里所使用的术语 "对应" 是指，通过将测序结果与对照序列信息进行比对，在通过相应的数据处理后，可以推导出测序结果中是否存在相应的易感基因突变位点，对应的含义既可以是与易感基因的序列相同，也可以是与易感基因的突变位点序列相同，甚至是可以通过已知的有限次运算能够得到易感基因序列的序列。因而，通过判断在基因组测序结果中是否包含易感基因的相应突变位点，可以预测对象对于膀胱移行细胞癌是否是易感性的。

试剂盒

根据本发明的又一方面，本发明提出了一种用于预测对象膀胱移行细胞癌易感性的试剂盒。根据本发明的实施例，该试剂盒含有适于检测根据本发明实施例的一组分离的基因（包含 SEQ ID NO: 1-10的基因）的试剂。根据本发明的实施例，适于应用于本发明的试剂的类型并不受特别限制。根据本发明的一个实施例，可以采用能够分别与本发明所分离的一组基因的每一种的突变位点特异性结合的探针。探针的类型并不受特别限制，可以是抗体，可以能够与基因上一段特定序列互补的寡核苷酸，这里所提到的特定序列包含突变位点。

为了方便理解，下面提供具体的实施例，对本发明的技术方案进行解释，需要说明的是，这些实施例仅仅是为了说明目的，而不以任何方式限制本发明的范围。除非特别说明，实施例中未注明具体条件的，均为按照常规条件或制造商建议的条件进行。下列实施例中，所用试剂或仪器未注明生产厂商的，均为可以通过市购获得的常规产品。

实施例 1 : 膀胱癌样品收集和单个癌细胞获取

经签署病人知情同意书，一位 57岁的男性病人于北京大学深圳医院施行外科切除手术取得肿瘤样品。样品经临床医生确定为侵入浅肌型的尿道上皮肿瘤。据进一步的样品生理和病理检查发现，该肿瘤样品是移行细胞膀胱癌，根据世界卫生组织 2004年的分类方法，为膀胱癌阶段 Π (Τ₂Ν。Μ₀)。

所取的实质瘤样品大小为 l-2mm³, 样品经切除离体后马上置于 -80°C干冰中保存，运输到研究地点后使用 37°C水浴快速解冻至冰块完全消失。使用手术刀切碎样品，加入 I型和 IV型胶原酶消化组织。消化后使用滤网清除肉眼可见的成块组织，得到细胞悬浮液。用不含 Ca²⁺和 Mg²⁺离子的 PBS緩沖液重复洗涤细胞悬浮液，最终重悬于 50 升的 PBS溶液中。

在倒置显微镜下，使用口吸管操作系统从膀胱癌细胞悬浮液中分离出单个细胞。把玻璃吸管在火焰上加热软化，施加外力拉成极细的中空管体后连接上医用橡皮管，即可制作出分离单个细胞用的口吸管，操作员可通过控制自身的吸气和呼气吸排液体。单细胞分离操作全程在倒置显微镜上操作，镜下实时观察细胞的状态和移动。在分离用培养亚中滴加含有 PBS (磷酸盐緩沖液） +BSA (牛血清白蛋白）的液滴（ 3微升 ), 随后在任意一液滴中加入 1微升的细胞悬浮液。先在显微镜下使用口吸管从有细胞悬液的液滴中吸取少量液体（约 0.5- 1 微升），接着，将口吸管移动到空白液滴时排出液体，这样即可得到目标区域中的细胞，类似稀释的过程。如此类推，从该液滴中吸取少量细胞到另一个空白液滴中，逐步稀释含有目的细胞的液体，最终实现在一个液滴中得到单个细胞。单个细胞被转移到含有预冷碱性细胞裂解液 ALB溶液的 PCR管中，在热循环仪上以 65 °C孵育 lOmin, 细胞裂解，基因组被释放到裂解液中。收集同样体积的未分离过细胞的 PBS+BSA液滴作为扩增反应的阴性对照。实施例 2: 全基因组扩增以及测序

全基因组扩增通过使用 Giagen公司的 REPLI-g Mini Kit来实现。该试剂盒利用从枯草芽孢杆菌 Bacillus suMlis ")噬菌体 phi29中克隆出的嗜温 DNA聚合酶（以下筒称 Phi29 酶）和抗外切酶的六碱基随机寡核苷酸引物进行等温 DNA扩增。由于 Phi29酶具有链置换的特性，所以该全基因组扩增方法称作多重置换扩增（以下筒称 MDA )。 MDA技术是利用随机引物在多个位点与模板 DNA退火， Phi29 DNA聚合酶在 DNA的多个位点同时起始复制。它沿着 DNA 模板合成 DNA , 同时取代模板的互补链，被置换的互补链又成为新的模板来进行扩增。根据试剂盒的操作规程，包含细胞基因组的扩增体系在 30°C恒温条件下孵育 16个小时，再升温至 65 °C 10分钟终止反应。

MDA 完成后使用 Invitrogen Life Science 公司的 Qubit^TM Quantitation Platform试剂盒测量全基因组扩增后的样品浓度，以测试 MDA是否成功。试剂盒 Quant-iT™ assays含有高敏感性荧光染料，能够特定结合到 DNA双链中，避免反应体系中蛋白质、单链核酸等杂质干扰浓度的测定。只有浓度达到 30ng/ 微升的样品才会被选择进行后续的管家基因检测，预估扩增的覆盖度。

随后以分布在 10条染色体上的高丰度管家基因作为目标产物，针对基因中的保守序列设计上下游引物， WGA产物作起始模板引发 PCR反应。相关染色体上的管家基因引物如下表。若有 8条或以上目的条带在电泳图上有呈现，则表明该细胞的大部分基因组得到扩增。只有同时通过浓度检测和管家基因 PCR检测的样品才会被安排后续的全基因组和全外显子建库、上机测序。

染色基因编码基因全名引物序列

体

1 PRDX6 过氧化物氧还酶 6 5' CTTGCTTCACTCCATCAGA 3'

5' CATCATCGGAAAACAGAC 3'

2 RPL37a 核糖体蛋白 L37a 5' AGTTTAGGTCAGCCTCTTAG 3'

5' GGACTTTACCGTGACAGC 3' 4 ADD1 内 ^: 蛋白 TACCAGCCTGACTAGGTACAG

( Adducin ) 1 (α)

GTCCTCCCAAGTCGGTGT 3'

13 ARHGEF7 Rho 鸟嘌呤核苷酸 AGTAGCCTTTCTCGTTTG 3'

交换因子（GEF) 7 CACCACCTCCCTCCAATAGT 3'

14 EIF2B2 真核细胞翻译启动 GCACCTTCCTACATCTAC 3'

因子 2B, 亚基 2β, TAAGAGGCTCCAAAATCAAC 39kDa

16 PSMD7 蛋白酶体 16S 亚 AAAGTCGCCACAGGCAAGC 3' 基，非 ATP酶， 7 CGTAGCACCACAGCAAG 3'

17 PSMB6 蛋白酶体亚基 β型 GGGTATGATGGTAAGGCAGTC

6

AGGATTCAGGCGGGTGGT 3'

18 MC2R 黑皮质素 2受体 TGCCAAGTGCCAGAATAG 3'

CTCAGAACTGGCTTGTTAGAT

19 BCAT2 支链氨基转移酶 >' GGAATCAGAGCCCACGAGT 3'

( Branched chain >' TATCCTTGACCGCACGAC 3' aminotransgerase )2

21 ΑΤΡ50 ATP 合成酶， H+ >' GCACCACCAAGCCCTAAC 3' 转运，线粒体 F1复 >' TCTCCGCGATGGACACTC 3' 合物， 0亚基

备注：在上表中所列出的 20条引物，自上而下，分别对应序列表中 SEQ ID NO: 11-30 所示的核苷酸序列。

接下来，通过 Agilent商业化的 SureSelect人全外显子 50Mb序列捕获试剂盒捕获人类基因组外显子序列。然后，再结合 Hiseq2000高通量测序技术，直接解读人类外显子信息。目前 SureSelect产品可用于在单个试管中捕获从小于 200 Kb 到大于 50 Mb 大小范围内的靶向序列，几乎覆盖了所有人类外显子区域，相对于传统的 PCR方法该方法极大的提高了对于人类基因组中外显子区域的研究效率，并显著降低了研究成本。

外显子捕获过程包括： DNA样品被随即打断成 500bp左右的短片段序列， DNA 片段末端修复后将一对接头（linker )连接在每个片段的两端；将 DNA 片段杂交到 Sureselect人全外显子 50Mb序列捕获试剂中，将外显子区域的片段富集；将富集到的 DNA片段洗脱下来并进行 LM-PCR检测。

文库构建选择 Pair-end策略，对于使用 Hiseq2000测序而言，由于序列捕获所用的连接物（linker ) 不同于测序用接头（adaptor ), 所以我们选择将捕获的外显子片段末端修复、自连后再片段化，末端修复后加 A, 加 Hiseq2000测序用接头建库测序。我们将每一个捕获后的文库单独进行测序，确保每一个样品含有至少 30X的覆盖度。经过测序我们最终每个细胞平均捕获了 38Mb的人类基因组，覆盖人类基因组 1.22%的区域，符合 CCDS外显子，表明在每个文库中都扩增到了 DNA中的外显子区域。

实施例 3: 确定易感基因

构建的外显子文库测序工作完成后，原始的下机数据 fastq.文件通过初步处理，在去除污染数据、低质量数据和 adaptor后，输入 SOAP软件进行序列组装。

经过 SOAP处理后，可以得到测序数据中能够比对到参考序列上的深度和覆盖度、并将所得序列按照染色体分别排布。在去除前期 PCR 实验和后期桥式束状扩增产生的重复序列后，对数据取唯一值，即保留只能比对到参考序列的唯一位置的某条序列，得到 chr*.soap文件。

对该文件运行 SOAPsnp软件来辨别出各个样品与参考序列在相对应位点上的突变位点，得到 chr*.cns文件。随后设定过滤参数值分别是 q值>20, 测序深度 >=6X, P值 >0.05 , 被去除的重复序列 <2条，对 ens文件进行以上过滤后得到 chr*genotype文件。在 genotype文件中，若位点跟参考序列具有相同的碱基型，则将位点的基因型定义为 missing, 将发生 missing事件 >30%的位点删除，得到高置信度体细胞突变结果，定义为 *.hcsm。将 *.hcsm位于 CDS编码序列区域上的位点保留，得到 *.hcsmCDS。

通过 *.hcsmCDS文件同时从体细胞突变中得到相关位点的基因型信息，得到 chr*.genotype文件， ^据这可以实现 driver基因的预测。从 chr*. genotype 中亦可发现 SNP突变导致非同义突变的位点，统计出发生某个突变的细胞数，并对这些突变的位点进行 KEGG注释，或者是 GO分析。

最后通过对单细胞的突变率结果和 88例膀胱癌分析结果整合，我们得到突变率在两者中都达到 3%的突变基因，即前面表 1 中所列出的基因，在此不再赘述。

在本说明书的描述中，参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示例"、 "具体示例"、或 "一些示例" 等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

权利要求书

1、一组分离的基因，所述分离的基因分别包含 SEQ ID NO: 1-10所示的核苷酸序列。

2、权利要求 1 所述的一组分离的基因在预测对象膀胱移行细胞癌易感性的用途。

3、一种预测对象膀胱移行细胞癌易感性的方法，其特征在于，包括下列步骤：

从所述对象提取单细胞；

对所述单细胞的基因组进行分析，以便获得所述单细胞的基因组信息；以及

基于所述单细胞的基因组信息中包含根据权利要求 1所述的一组分离的基因，判断所述对象对于膀胱移行细胞癌是易感性的。

4、根据权利要求 1所述的方法，其特征在于，所述对象是人。

5、根据权利要求 4所述的方法，其特征在于，所述单细胞是从人的血液、尿液、或者组织中提取的。

6、根据权利要求 3所述的方法，其特征在于，对所述单细胞的基因组进行分析进一步包括：

通过碱裂解从所述单细胞提取基因组，以便获得所述单细胞的基因组；利用 Phi29 DNA聚合酶，对所述单细胞的基因组进行扩增；

将经过扩增的所述单细胞的基因组进行建库和测序，以便获得多个测序数据，所述多个测序数据构成所述单细胞的基因组信息。

7、根据权利要求 6所述的方法，其特征在于，利用选自 Hiseq2000、 SOLiD、 454、和单分子测序装置的至少一种对所述单细胞的基因组进行测序。

8、根据权利要求 6所述的方法，其特征在于，进一步包括：

将所述多个测序数据与权利要求 1 所述的一组分离的基因进行比对，以便确定所述单细胞的基因组信息中是否包含根据权利要求 1所述的一组分离的基因的突变体。

9、一种预测对象膀胱移行细胞癌易感性的系统，其特征在于，包括：单细胞分离装置，所述单细胞提取装置用于从对象样品中分离单细胞；基因组分离装置，所述基因组分离装置与所述单细胞分离装置相连，并且用于从所述单细胞分离基因组；

基因组测序装置，所述基因组测序装置与所述基因组分离装置相连，并且用于对所述分离的基因组进行测序，以便获得所述单细胞的基因组信息；以及比对装置，所述比对装置与所述基因组测序装置相连，所述比对装置内预存有对照序列信息，所述对照序列信息为权利要求 1所述的一组分离的基因的序列信息，所述对比装置用于将所述单细胞的基因组信息与所述对照序列信息进行比对，以于所述单细胞的基因组信息中包含根据权利要求 1所述的一组分离的基因，判断所述对象对于膀胱移行细胞癌是易感性的。

10、根据权利要求 9所述的系统，其特征在于，进一步包括：

输出装置，所述输出装置与所述比对装置相连，以便输出预测结果。

11、根据权利要求 8所述的系统，其特征在于，

所述基因组测序装置包括选自 HISEQ2000、 SOLiD、 454、和单分子测序装置的至少一种。

12、一种用于预测对象膀胱移行细胞癌易感性的试剂盒，其特征在于，含有：

适于检测权利要求 1所述的一组分离的基因的试剂。

13、根据权利要求 12所述的试剂盒，其特征在于，所述试剂为探针。