CN104894271B - 一种检测基因融合的方法及装置 - Google Patents

一种检测基因融合的方法及装置 Download PDF

Info

Publication number
CN104894271B
CN104894271B CN201510317371.7A CN201510317371A CN104894271B CN 104894271 B CN104894271 B CN 104894271B CN 201510317371 A CN201510317371 A CN 201510317371A CN 104894271 B CN104894271 B CN 104894271B
Authority
CN
China
Prior art keywords
sequence
fusion form
fusion
comparison
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510317371.7A
Other languages
English (en)
Other versions
CN104894271A (zh
Inventor
蒋智
曹志生
李宗文
张广鑫
张兰英
孟雪红
王玉梅
尹静妮
谭泽民
曹银川
吴晓朦
潘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN NOVOGENE BIOLOGICAL INFORMATION TECHNOLOGY Co Ltd
Original Assignee
TIANJIN NOVOGENE BIOLOGICAL INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN NOVOGENE BIOLOGICAL INFORMATION TECHNOLOGY Co Ltd filed Critical TIANJIN NOVOGENE BIOLOGICAL INFORMATION TECHNOLOGY Co Ltd
Priority to CN201510317371.7A priority Critical patent/CN104894271B/zh
Publication of CN104894271A publication Critical patent/CN104894271A/zh
Application granted granted Critical
Publication of CN104894271B publication Critical patent/CN104894271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种检测基因融合的方法及装置。其中,该方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对;S42,判断S41所得到的数据是否符合分析需求;S43,检测已知融合形式。本方法具有灵敏度高,特异性好且较为经济的优势。

Description

一种检测基因融合的方法及装置
技术领域
本发明涉及生物学领域,具体而言,涉及一种检测基因融合的方法及装置。
背景技术
基因突变是指基因组DNA分子发生的突然的、可遗传的变异现象(genemutation)。从分子水平上看,基因突变是指基因在结构上发生碱基对组成或排列顺序的改变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但这种稳定性是相对的。在一定的条件下基因也可以从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点上,突然出现了一个新基因,代替了原有基因,这个基因叫做突变基因。于是后代的表现中也就突然地出现祖先从未有的新性状。
基因突变是生物进化的重要因素之一,所以研究基因突变除了本身的理论意义以外还有广泛的生物学意义。基因突变为遗传学研究提供突变型,为育种工作提供素材,所以它还有科学研究和生产上的实际意义。
有的基因突变是由于染色体发生结构变异形成。在自然条件或人为因素的影响下,染色体发生的结构变异主要有:缺失、重复、倒位和易位,其中,基因融合也是染色体发生结构变异的一种。所谓融合基因,是指将两个或多个基因的编码区首尾相连,置于同一套调控序列(包括启动子、增强子、核糖体结合序列、终止子等)控制之下,构成的嵌合基因。
目前常用的检测融合检测方法均是基于DNA水平进行高通量测序,利用CREST、breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融合形式。
发明内容
本发明旨在提供一种检测基因融合的方法及装置,以解决现有技术中的检测基因融合的方法不能准确定位到融合断点及融合形式的技术问题。
为了实现上述目的,根据本发明的一个方面,提供了一种检测基因融合的方法。该方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;S42,判断S41所得到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤S1,S2,S3和S41;S43,检测已知融合形式:判读融合形式的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
进一步地,S41中的比对软件采用的是TMAP比对软件,建立比对结果索引文件采用的软件是samtools软件。
进一步地,构建测序文库是否成功以五个管家基因的测序序列数的检出情况作为标准。
进一步地,S42具体包括:利用比对软件比对管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求,重复步骤S1,S2,S3和S41;否则符合分析需求,进行S43。
进一步地,比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。
进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0.12;第三阈值为20条。
根据本发明的另一方面,提供了一种检测基因融合的装置。该装置包括:cDNA获取模块,用于提取待检测样本RNA,将RNA进行反转录,得到cDNA;测序文库构建模块,用于在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;测序模块,用于通过高通量的方法对测序文库进行测序,得到融合形式的序列;融合形式检测模块,用于检测融合形式的序列;融合形式检测模块进一步包括以下子模块:比对子模块,用于比对软件将测序模块得到的融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;数据分析子模块,用于判断比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将数据输入已知融合形式检测子模块;已知融合形式检测子模块,用于检测已知融合形式:判读融合形式的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
进一步地,比对子模块中的比对软件采用的是TMAP比对软件,建立比对结果的索引文件采用的软件是samtools软件。
进一步地,测序文库构建模块中测序文库是否成功以五个管家基因的测序序列数的检出情况作为标准。
进一步地,比对子模块进一步用于利用比对软件比对管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求。
进一步地,比对子模块中比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。
进一步地,第一阈值为大于等于10个核苷酸;第二阈值为0.12;第三阈值为20条。
基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一实施例的检测基因融合的方法的流程示意图;以及
图2示出了根据本发明一实施例的检测基因融合的结果示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
目前,常用的检测融合检测方法均是基于DNA水平进行高通量测序,如利用CREST、breakdancer软件等进行染色体结构变异的检测,但不能准确定位到融合断点及融合形式。针对现有技术中的上述不足,本发明提供了以下技术方案。
根据本发明一种典型的实施方式,提供一种检测基因融合的方法。该方法包括以下步骤:S1,提取待检测样本RNA,将RNA进行反转录,得到cDNA;S2,在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;S3,通过高通量的方法对测序文库进行测序,得到融合形式的序列;S4,检测融合形式的序列;S4具体包括:S41,利用比对软件将S3得到的融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立index(比对结果索引文件);S42,判断S41所得到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤S1,S2,S3和S41;S43,检测已知融合形式:判读融合形式的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
其中,S42的判断标准是测序结果中的序列数(reads数)达到一定量,是对总量的限制;S43中判断标准是具体到每一条序列数是否符合标准,是对具体的序列数进行的限制。
基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
根据本发明一种典型的实施方式,在构建RNA文库时,使用扩增子库中包含的PCR引物进行了PCR反应,样品中包含的极为微量的RNA融合序列得到了扩增,使得反映在最后结果中该融合的序列数较高,从而使本方法具有较高的灵敏度。
其中,扩增子(amplicon)库是针对特定的融合形式设计出相应的PCR引物,并将这部分PCR引物与对照基因上设计的PCR引物组合在一起形成扩增子(amplicon)库。
本发明中的比对,可采用的软件如Bwa,tophat,bowtie,根据本发明一种典型的实施方式,S41中的比对软件采用的是TMAP(torrent mapper,4.2版本)比对软件,建立index采用的软件是samtools软件。
优选的,构建测序文库时以五个管家基因作为比对标准,测量建库过程是否正确,管家基因相当于阳性对照。
根据本发明一种典型的实施方式,S42具体包括:利用比对软件比对管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求,重复步骤S1,S2,S3和S41;否则符合分析需求,进行S43。此步是为了对测序的结果进行一定的限制,管家基因总是会有一定的表达量,因此即便是未检出融合,管家基因一般也会有较高的测序量。若管家基因的测序结果较低,说明建库过程或者测序过程可能有误。
根据本发明一种典型的实施方式,比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。这是由于当使用例如Proton平台在测序时会将序列末端测序质量较差的部分剪切掉,这将会导致测序的reads较参考序列更短一些。在进行序列计数时,为了考虑这部分序列,同时会因为非特异性比对造成序列数目升高,在统计序列数目时,序列在参考序列的断点两侧都至少有10个碱基的比对。
根据本发明一种典型的实施方式,第一阈值为大于等于10个核苷酸;第二阈值为0.12;第三阈值为20条,第四阈值为大于等于20个核苷酸。
根据本发明一种典型的实施方式,提供了一种检测基因融合的装置。该装置包括:cDNA获取模块,用于提取待检测样本RNA,将RNA进行反转录,得到cDNA;测序文库构建模块,用于在已知的融合基因的断点两侧设计引物,以cDNA为模板扩增出融合形式的序列,构建测序文库;测序模块,用于通过高通量的方法对测序文库进行测序,得到融合形式的序列;融合形式检测模块,用于检测融合形式的序列;融合形式检测模块进一步包括以下子模块:比对子模块,用于比对软件将测序模块得到的融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;数据分析子模块,用于判断比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将数据输入已知融合形式检测子模块;已知融合形式检测子模块,用于检测已知融合形式:判读融合形式的序列的比对质量是否足够高,判读比对融合形式的序列到断点两侧在参考序列中的长度是否满足第一阈值,判读比对融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果融合形式的序列同时满足上述三个条件,则判读该条融合形式的序列支持该已知融合形式,否则该条融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式。
本方法具有灵敏度高,特异性好且较为经济的优势。
优选的,比对子模块中的比对软件采用的是TMAP比对软件,建立比对结果的索引文件采用的软件是samtools软件。
根据本发明一种典型的实施方式,测序文库构建模块中测序文库是否成功以五个管家基因的测序序列数的检出情况作为标准。
根据本发明一种典型的实施方式,比对子模块进一步用于利用比对软件比对管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求。
根据本发明一种典型的实施方式,比对子模块中比对管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。
优选的,第一阈值为大于等于10个核苷酸;第二阈值为0.12;第三阈值为20条。
下面将结合实施例进一步说明本发明的有益效果。
实施例1
1)待检的样本是H2228 ALK融合细胞系,利用荧光定量计(Qubit)进行定量,其浓度为18.2ng/ul;反转录的条件为:42℃保持30min;然后升温至85℃保持5min;最后10℃保温,对RNA进行反转录,得到cDNA,反转录体系配置如表1。
表1
试剂 体积
反转录酶 1μl
反转录反应液 2μl
RNA 7ul(10ng)
2)cDNA扩增子库中包含了针对ALK和ROS1基因融合而设计的7对引物,详细信息如下表:
Figure GDA0000755349120000061
cDNA扩增cDNA的扩增体系配置见表2,进行多重PCR扩增,得到目的片段,基本步骤如下:先在99℃预变性2min,其次在99℃变性15s,然后在60℃退火延伸4min;重复变性及退火延伸过程30次;最后在10℃保温,结束反应。
表2
引物混合物2 4μl
酶混合液2 4μl
无核酸酶水 2ul
反转录产物 10ul
cDNA扩增产物需要进行引物的部分消化。消化的反应体系为:20ul扩增产物+2ulFuPa酶反应液;消化的反应条件为:先在50℃消化10min;然后在55℃消化10min;再在60℃消化20min;最后在10℃下保温,结束消化过程。
3)将上述消化后的cDNA扩增产物进行连接接头,首先在22℃保持30min,其次在72℃保持10min;最后在10℃保温的条件下进行接头连接步骤;接头连接体系详见表3。
表3
试剂 体积
接头P1 1μl
带标签的接头A 1μl
样品 22ul
连接反应液 4ul
连接酶 2ul
其中,带标签的接头A序列如SEQ ID NO:1和SEQ ID NO:2所示:
SEQ ID NO:15:5'CCATCTCATCCCT*G*CGTGTCTCCGACTCAGCTAAGGTAACGAT 3'
SEQ ID NO:16:3'CGCACAGAGGCTGAGTCGATTCCATTGCTA 5'
接头P1序列如SEQ ID NO:3和SEQ ID NO:4所示:
SEQ ID NO:17:5'CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT 3'
SEQ ID NO:18:3'T*T*GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA5'。其中CTAAGGTAAC为Barcode序列;*表示硫代磷酸酯键。
4)将上述接头连接后的PCR扩增产物进行磁珠纯化,然后利用qPCR定量,将产物稀释到100pM进行乳液PCR。其中,乳液PCR反应的体系配置见下表5所示,在One touch 2仪器上选择Proton:Ion PI Template OT2 200 kit V3后进行乳液PCR,得到用于高通量测序的文库,最后进行模板富集。
表5
试剂 体积
乳液PCR反应液 1920ul
乳液PCR酶混合液 120ul
ISP微珠 100ul
文库 10ul
250ul
5)在DA8600基因测序仪上进行测序,测序平台得到的电信号转化将basecalling转化为碱基序列,过滤掉低质量的碱基序列,结果以bam文件格式存储(文件名:.bam)。
图1示出了实施例1的检测融合形式流程示意图。
首先将捕获测序的结果(非比对文件)比对到panel所对应的参考序列上得到比对文件,并使用samtools工具建立index,比对的结果作为基因融合检测程序(LPFtools)的输入文件。LPFtools打开比对的结果文件,并依次分析每一条比对的结果。对于一条比对结果,首先判断其是否明显支持基因融合,判断的标准有比对质量是否足够高,是否跨过panel设计的断点,并且在断点的两端的比对长度超过阈值(默认为10nt)。如满足上述条件则判断为该条序列支持融合,并将该形式的融合序列支持数加1。最终根据每种形式的融合序列支持数判断样品中是否发生该种形式的融合。
检测融合形式的序列,具体步骤详见下:
第一部分:数据质控。
步骤1:利用TMAP比对软件将高通量测序序列比对到已知融合形式的参考序列上,然后根据比对的位置进行排序,并用samtools软件建立index;
步骤2:通过control gene判断数据是否符合分析需求。为了从数据的角度来判断建库是否异常,一般会在试剂盒设计时加入control gene,一般选择的是管家基因(house-keeping gene)。由于是RNA水平的测序,测序得到的一条序列会涵盖两个外显子,所以统计比对到管家基因的序列时只计算比对到不同外显子的长度至少20nt的序列。如果五个control gene测得的总序列数少于20,000条,则说明该样本测得的数据量太少,不能进行后续分析。如果出现两个或两个以上的control gene测得的序列数目为0,则说明建库或者样本有异常,建议重新建库。
第二部分:检测融合突变,可检测特定类型的融合突变:
试剂盒中针对明确断点而设计引物的融合形式(称为已知融合形式),这种融合形式可以从COSMIC数据库中找到明确的参考序列。
步骤3:依次分析步骤1得到的每条序列的比对结果。首先判读该序列的比对质量是否足够高;其次判读比对到断点两侧的参考序列的长度是否满足阈值(默认为10nt);然后判读每侧比对的序列中错配(mismatch)碱基的比例是否小于阈值(默认为0.12)。如果序列同时满足上述三个条件,则判读该条序列支持该已知融合形式,否则该序列不支持该已知融合形式,将该序列输出到另一个bam文件中。如果支持该已知融合形式的序列总数大于阈值(默认为20),则判断该样本中存在这种已知融合形式。
6)H2228 ALK融合细胞系检查结果为表6:
表6
Figure GDA0000755349120000081
图2:该发明的整体流程中判断序列数是否支持某种融合形式。
图2中表示的序列数1-4是否能够通过判断,其中序列数1和序列数2明显支持panel之中的amplicon1,而序列数3-序列数4虽然跨过断点但是有一端的长度较短,因此不能判断他们是否明显的支持融合。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:
基因融合的DNA水平上可以表现出很多种形式,若要采用基于DNA的方法进行基因融合的分析,对测序序列数的覆盖度要求很大,测序的成本将会大大的增加。发明提供了一种基于RNA的分析技术,由于DNA在转录时往往会在固定的位置进行剪接,即便DNA水平上断点的位置可能会发生变化,在RNA水平上将会仅仅存在少量的剪接形式。针对这些少量的剪接形式设计PCR引物之后,即可对融合基因进行大规模扩增,即便是微弱的融合信号在经过扩增之后都能检出明显的融合信号。因此当需要检测已知形式的融合时,相比于基于DNA的融合检测方法,本方法具有灵敏度高,特异性好且较为经济的优势。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Figure GDA0000755349120000121
Figure GDA0000755349120000131

Claims (6)

1.一种用于非疾病诊断的检测基因融合的方法,其特征在于,包括以下步骤:
S1,提取待检测样本RNA,将所述RNA进行反转录,得到cDNA;
S2,在已知的融合基因的断点两侧设计引物,以所述cDNA为模板扩增出融合形式的序列,构建测序文库;
S3,通过高通量的方法对所述测序文库进行测序,得到所述融合形式的序列;
S4,检测所述融合形式的序列;
所述S4具体包括:
S41,利用比对软件将所述S3得到的所述融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;
S42,判断所述S41所得到的数据是否符合分析需求,如果符合分析需求,进行S43,如果不符合分析需求,重复步骤S1,S2,S3和S41;
S43,检测已知融合形式:判读所述融合形式的序列的比对质量是否足够高,判读比对所述融合形式的序列到断点两侧在所述参考序列中的长度是否满足第一阈值,判读比对所述融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果所述融合形式的序列同时满足上述三个条件,则判读该条所述融合形式的序列支持该已知融合形式,否则该条所述融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的所述融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式;
所述第一阈值为大于等于10个核苷酸;所述第二阈值为0.12;所述第三阈值为20条;
构建所述测序文库是否成功以五个管家基因的测序序列数的检出情况作为标准;所述S42具体包括:利用比对软件比对所述管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求,重复步骤S1,S2,S3和S41;否则符合分析需求,进行S43。
2.根据权利要求1所述的方法,其特征在于,所述S41中的比对软件采用的是TMAP比对软件,建立所述比对结果索引文件采用的软件是samtools软件。
3.根据权利要求1所述的方法,其特征在于,比对所述管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。
4.一种检测基因融合的装置,其特征在于,包括:
cDNA获取模块,用于提取待检测样本RNA,将所述RNA进行反转录,得到cDNA;
测序文库构建模块,用于在已知的融合基因的断点两侧设计引物,以所述cDNA为模板扩增出融合形式的序列,构建测序文库,所述测序文库构建模块中所述测序文库是否成功以五个管家基因的测序序列数的检出情况作为标准;
测序模块,用于通过高通量的方法对所述测序文库进行测序,得到所述融合形式的序列;
融合形式检测模块,用于检测所述融合形式的序列;
所述融合形式检测模块进一步包括以下子模块:
比对子模块,用于比对软件将所述测序模块得到的所述融合形式的序列与相应的融合形式的参考序列相比对,并根据比对的位置进行排序,然后建立比对结果的索引文件;
数据分析子模块,用于判断所述比对子模块所得到的数据是否符合分析需求,如果符合分析需求,将所述数据输入已知融合形式检测子模块;所述比对子模块进一步用于利用比对软件比对所述管家基因,如果五个管家基因测得的总序列数少于20,000条,或出现两个或两个以上的管家基因测得的序列数目为0,则不符合分析需求;
已知融合形式检测子模块,用于检测已知融合形式:判读所述融合形式的序列的比对质量是否足够高,判读比对所述融合形式的序列到断点两侧在所述参考序列中的长度是否满足第一阈值,判读比对所述融合形式的序列每侧的序列中错配碱基的比例是否小于第二阈值,如果所述融合形式的序列同时满足上述三个条件,则判读该条所述融合形式的序列支持该已知融合形式,否则该条所述融合形式的序列不支持该已知融合形式,如果支持该已知融合形式的所述融合形式的序列总数大于第三阈值,则判断该样本中存在该已知融合形式;
所述第一阈值为大于等于10个核苷酸;所述第二阈值为0.12;所述第三阈值为20条。
5.根据权利要求4所述的装置,其特征在于,所述比对子模块中的比对软件采用的是TMAP比对软件,建立所述比对结果的索引文件采用的软件是samtools软件。
6.根据权利要求4所述的装置,其特征在于,所述比对子模块中比对所述管家基因的序列时计算比对到不同外显子的长度至少20个核苷酸序列。
CN201510317371.7A 2015-06-10 2015-06-10 一种检测基因融合的方法及装置 Active CN104894271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510317371.7A CN104894271B (zh) 2015-06-10 2015-06-10 一种检测基因融合的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510317371.7A CN104894271B (zh) 2015-06-10 2015-06-10 一种检测基因融合的方法及装置

Publications (2)

Publication Number Publication Date
CN104894271A CN104894271A (zh) 2015-09-09
CN104894271B true CN104894271B (zh) 2020-02-21

Family

ID=54027222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510317371.7A Active CN104894271B (zh) 2015-06-10 2015-06-10 一种检测基因融合的方法及装置

Country Status (1)

Country Link
CN (1) CN104894271B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2796501T3 (es) * 2015-10-10 2020-11-27 Guardant Health Inc Métodos y aplicaciones de la detección de fusión de genes en el análisis de ADN sin células
CN105543380B (zh) * 2016-01-27 2019-03-15 北京诺禾致源科技股份有限公司 一种检测基因融合的方法及装置
CN107038349B (zh) * 2016-02-03 2020-03-31 深圳华大生命科学研究院 确定重排前v/j基因序列的方法和装置
CN106815491B (zh) * 2016-12-29 2021-11-16 浙江安诺优达生物科技有限公司 一种用于检测ffpe样本基因融合的装置
CN106845150B (zh) * 2016-12-29 2021-11-16 浙江安诺优达生物科技有限公司 一种用于检测循环肿瘤dna样本基因融合的装置
CN108256295B (zh) * 2016-12-29 2021-10-22 安诺优达基因科技(北京)有限公司 一种用于检测基因融合的装置
CN106676182B (zh) * 2017-02-07 2020-08-14 北京诺禾致源科技股份有限公司 一种低频率基因融合的检测方法及装置
CN107437002A (zh) * 2017-04-28 2017-12-05 首度生物科技(苏州)有限公司 一种快速检测融合基因的方法
CN107267646A (zh) * 2017-08-02 2017-10-20 广东国盛医学科技有限公司 一种基于下一代测序的多基因融合检测方法
CN111118112A (zh) * 2018-10-30 2020-05-08 浙江大学 一种高通量基因表达谱检测试剂盒
CN112626206A (zh) * 2019-09-24 2021-04-09 深圳华大智造科技有限公司 一种rna融合基因检测方法和试剂盒
CN111243669B (zh) * 2020-01-20 2021-02-09 至本医疗科技(上海)有限公司 用于确定rna基因融合的方法、电子设备和计算机存储介质
CN115927564B (zh) * 2022-09-29 2023-09-12 杭州联川基因诊断技术有限公司 一种检测生物样本中基因融合的引物组合、试剂盒及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102234681A (zh) * 2010-04-20 2011-11-09 广东省人民医院 一种检测基因融合的方法
CN103074444A (zh) * 2013-02-25 2013-05-01 苏州晶因生物科技有限公司 组织相容性抗原决定簇基因高通量测序的hla基因分型方法
CN103343392A (zh) * 2013-07-03 2013-10-09 中山大学 mRNA3’末端文库及其构建、测序方法和用途
CN103853937A (zh) * 2013-11-27 2014-06-11 上海丰核信息科技有限公司 高通量测序数据后期处理方法
CN103993069A (zh) * 2014-03-21 2014-08-20 深圳华大基因科技服务有限公司 病毒整合位点捕获测序分析方法
CN104131008A (zh) * 2014-07-24 2014-11-05 深圳华大基因医学有限公司 Dna标签、pcr引物及其应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102234681A (zh) * 2010-04-20 2011-11-09 广东省人民医院 一种检测基因融合的方法
CN103074444A (zh) * 2013-02-25 2013-05-01 苏州晶因生物科技有限公司 组织相容性抗原决定簇基因高通量测序的hla基因分型方法
CN103343392A (zh) * 2013-07-03 2013-10-09 中山大学 mRNA3’末端文库及其构建、测序方法和用途
CN103853937A (zh) * 2013-11-27 2014-06-11 上海丰核信息科技有限公司 高通量测序数据后期处理方法
CN103993069A (zh) * 2014-03-21 2014-08-20 深圳华大基因科技服务有限公司 病毒整合位点捕获测序分析方法
CN104131008A (zh) * 2014-07-24 2014-11-05 深圳华大基因医学有限公司 Dna标签、pcr引物及其应用

Also Published As

Publication number Publication date
CN104894271A (zh) 2015-09-09

Similar Documents

Publication Publication Date Title
CN104894271B (zh) 一种检测基因融合的方法及装置
Liu et al. Hi-TOM: a platform for high-throughput tracking of mutations induced by CRISPR/Cas systems
JP5972448B2 (ja) コピー数変異を検出する方法及びシステム
CN108300716B (zh) 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法
CN111052249B (zh) 确定预定染色体保守区域的方法、确定样本基因组中是否存在拷贝数变异的方法、系统和计算机可读介质
CN105219766A (zh) 一种三轮扩增的多重pcr方法
CN106282353A (zh) 一种利用发夹引物进行多重pcr的方法
CN105734048A (zh) 一种基因组DNA的PCR-free测序文库制备方法
CN110607356B (zh) 一种基因组编辑检测方法、试剂盒及应用
CN108103164B (zh) 一种利用多重荧光竞争性pcr检测拷贝数变异的方法
US20210102246A1 (en) Genetic test for detecting congenital adrenal hyperplasia
KR20170133270A (ko) 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도
CN110468189B (zh) 基于单样本二代测序检测样本体细胞变异的方法及装置
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
Sukser et al. Assessment of Illumina® Human mtDNA Genome assay: workflow evaluation with development of analysis and interpretation guidelines
CN109825552A (zh) 一种用于对目标区域进行富集的引物及方法
Chen et al. BisQC: an operational pipeline for multiplexed bisulfite sequencing
CN116083423B (zh) 一种靶向富集核酸的探针
CN114277114B (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN109136217B (zh) 一种测序文库构建的方法、建库试剂及其应用
CN107937493B (zh) 一种用于等位基因pcr的发夹修饰引物
WO2020005159A1 (en) Method for detection and quantification of genetic alterations
CN113512595B (zh) 一种用于dna样本跟踪检测的生物标志物、方法和应用
Bicci et al. Oxford Nanopore sequencing-based protocol to detect CpG methylation in human mitochondrial DNA
CN110603334A (zh) Pcr引物对及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant