CN105354442A - 一种高通量测序数据前期处理方法 - Google Patents

一种高通量测序数据前期处理方法 Download PDF

Info

Publication number
CN105354442A
CN105354442A CN201510830815.7A CN201510830815A CN105354442A CN 105354442 A CN105354442 A CN 105354442A CN 201510830815 A CN201510830815 A CN 201510830815A CN 105354442 A CN105354442 A CN 105354442A
Authority
CN
China
Prior art keywords
sample
gender information
analyzing
data
sequencing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510830815.7A
Other languages
English (en)
Other versions
CN105354442B (zh
Inventor
刘晶星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jinqirui Biotechnology Co ltd
Original Assignee
Guangzhou Kingmed Diagnostics Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kingmed Diagnostics Technology Co ltd filed Critical Guangzhou Kingmed Diagnostics Technology Co ltd
Priority to CN201510830815.7A priority Critical patent/CN105354442B/zh
Publication of CN105354442A publication Critical patent/CN105354442A/zh
Application granted granted Critical
Publication of CN105354442B publication Critical patent/CN105354442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种高通量测序数据前期处理方法,属于分子生物信息检测领域,步骤包括:S1、获取高通量测序数据,通过分析测序数据获得每一检测样本所属受检者的性别信息;S2、将经分析得到的性别信息与相应样本申请单上受检者的性别信息对比,得出对比结果并根据对比结果进行相应的操作。本发明还公开了一种高通量测序数据前期处理装置。本发明可以有效率地排查出大部分样本与测序数据对应错误的问题,有助于减少医疗纠纷甚至医疗事故,在高通量测序行业中具备广泛推广的前景。

Description

一种高通量测序数据前期处理方法
技术领域
本发明属于分子生物信息检测领域,具体涉及一种高通量测序数据前期处理方法及装置。
背景技术
高通量测序技术又称“下一代”测序技术,以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志,应用到实际的样本基因检测中,单次实验通量非常大。这一测序技术极大地节约了检测成本,但同时也增加了实验中操作失误的风险。尤其是当第一步提取DNA就搞混样本的情况下,会导致大量样本与实验错误匹配,而在实验过程中几乎不可能检查出这类错误。若科研机构使用错误的测序信息进行进一步的实验或检测,其很有可能对科研结果起一定的误导作用,浪费科研精力;若医疗检测机构将匹配错误的测序分析结果作为治疗凭据,或将造成医疗纠纷甚至事故。
发明内容
针对现有技术的不足,本发明的目的旨在提供一种高通量测序数据前期处理方法及装置,有效率地排查出大部分样本与测序数据对应错误的问题。
为实现上述目的,本发明采用如下技术方案:
一种高通量测序数据前期处理方法,包含以下步骤:
S1、获取高通量测序数据,通过分析测序数据获得每一检测样本所属受检者的性别信息;
S2、将经分析得到的性别信息与相应样本申请单上受检者的性别信息对比,当分析所得的性别信息与相应样本申请单上受检者的性别信息均一致时,继续后续的数据处理;当分析所得的性别信息与相应样本申请单上受检者的性别信息存在差别时,输出数据与样本匹配有误的信息并停止处理数据。
1.优选地,本发明提供的高通量测序数据前期处理方法通过分析检测样本X染色体上突变频率在30%~70%之间的突变位点的杂合度判断该检测样本所属受检者的性别,分析方法为:
1)统计所有位于X染色体的突变位点总数N;
2)统计位于X染色体上突变频率在30%~70%之间的突变位点总数Nz,则X染色体杂合度为Nz/N;
3)杂合度高于20%的检测样本判断为女性受检者的样本,杂合度低于20%的检测样本判断为男性受检者的样本。
一种高通量测序数据前期处理装置,包括数据提取装置和分析对比装置:
数据提取装置,用于获取高通量测序数据;
分析对比装置,用于分析测序数据获得每一检测样本所属受检者的性别信息,并且将分析得到的性别信息与相应样本申请单上受检者的性别信息进行对比。
本发明的有益效果在于:由于从不同检测样本中提取的DNA并无本质区别,为区分一份数据是否对应申请单中的受检者只能通过性别来判断,虽然搞混的样本可能刚好性别一致就无法区分,但因高通量测序的实验通量较大,搞混的样本全部性别一致的可能性较小,因此本发明通过分析测序数据中每一个样本的性别是否与申请单中受检者的性别信息相匹配,可以发现几乎所有由于实验操作串位导致的样本与测序数据错误对应的问题,另外有50%的可能性发现两两交叉错误对应的问题,从而有效地排查出大部分检测样本与测序数据对应错误的问题,发明人将本发明提供的测序数据前期处理方法应用到实际的数据处理过程中,3月内即发现近20例样本与数据错误对应的问题,其中14例为一次实验操作串位导致的对应错误,其余为两两交叉错误;
女性的突变位点杂合度通常在40%以上(即使考虑近亲结婚及试验误差,杂合度也不会低于20%),而男性的通常在10%以下(即使考虑试验误差,杂合度也不会高于20%),本发明采用此指标区分性别有较高的区分度,并且分析速度快,对于目前高通量测序实验室中最常规的36样本试剂盒只需要几秒钟时间即可得到全部样本的性别信息;本发明提供的高通量测序数据前期处理方法不需实施成本,并且快速、可靠,有助于减少医疗纠纷甚至医疗事故,在高通量测序行业中具备广泛推广的前景。
附图说明
图1为一批样本中X染色体突变频率情况的统计图;
图2为1800个样本的X染色体突变频率分布情况图;
图3是本发明一种高通量测序数据前期处理装置的结构框图。
图4是本发明一种高通量测序数据前期处理方法的流程图;
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
实施例1
图1所示为一批检测样本中X染色体突变频率的统计情况,其中第1列为样本的检测序号,第2~6列分别为突变频率介于90%~100%、70%~90%、30%~70%、10%~30%、0~10%的位点的比例(%),第7列为样本性别(F为女性,M为男性),显然地,突变频率介于30%~70%之间的位点所占的比例在男女之间有非常显著的差异,此指标可作为区分性别的可靠依据。
实施例2
图2所示为1800个样本(800女1000男)的X染色体突变频率在30%~70%的突变位点的杂合度分布情况,在1800个检测样本中,可见男女的X染色体突变频率在30%~70%的突变位点的杂合度差异明显,其中女性对应的杂合度均高于20%,男性对应的杂合度均低于20%。
实施例3
如图3所示,一种高通量测序数据前期处理装置,包括数据提取装置和分析对比装置:
数据提取装置,用于获取高通量测序数据;
分析对比装置,用于分析测序数据获得每一检测样本所属受检者的性别信息,并且将分析得到的性别信息与相应样本申请单上受检者的性别信息进行对比。
实施例4
如图4所示,一种高通量测序数据前期处理方法,包括以下步骤:
S1、获取高通量测序数据后,通过分析检测样本X染色体上突变频率在30%~70%之间的突变位点的杂合度判断该检测样本所属受检者的性别,杂合度高于20%的检测样本判断为女性受检者的样本,杂合度低于20%的检测样本判断为男性受检者的样本;
S2、将经分析得到的性别信息与相应样本申请单上受检者的性别信息对比跟根据对比结果进行相应的操作:
a.若出现分析所得的性别信息与相应样本申请单上受检者的性别信息不一致,输出数据与样本匹配有误的信息并停止处理数据;
b.若分析所得的性别信息与相应样本申请单上的性别信息均一致,继续后续的数据处理。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (3)

1.一种高通量测序数据前期处理方法,其特征在于,包含以下步骤:
S1、获取高通量测序数据,通过分析测序数据获得每一检测样本所属受检者的性别信息;
S2、将经分析得到的性别信息与相应样本申请单上受检者的性别信息对比,当分析所得的性别信息与相应样本申请单上受检者的性别信息均一致时,继续后续的数据处理;当分析所得的性别信息与相应样本申请单上受检者的性别信息存在差别时,输出数据与样本匹配有误的信息并停止处理数据。
2.如权利要求1所述的高通量测序数据前期处理方法,其特征在于,通过分析检测样本X染色体上突变频率在30%~70%之间的突变位点的杂合度判断该检测样本所属受检者的性别,分析方法为:
1)统计所有位于X染色体的突变位点总数N;
2)统计位于X染色体上突变频率在30%~70%之间的突变位点总数Nz,则X染色体杂合度为Nz/N;
3)杂合度高于20%的检测样本判断为女性受检者的样本,杂合度低于20%的检测样本判断为男性受检者的样本。
3.一种高通量测序数据前期处理装置,其特征在于,包括:
数据提取装置,用于获取高通量测序数据;
分析对比装置,用于分析测序数据获得每一检测样本所属受检者的性别信息,并且将分析得到的性别信息与相应样本申请单上受检者的性别信息进行对比。
CN201510830815.7A 2015-11-25 2015-11-25 一种高通量测序数据前期处理方法 Active CN105354442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510830815.7A CN105354442B (zh) 2015-11-25 2015-11-25 一种高通量测序数据前期处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510830815.7A CN105354442B (zh) 2015-11-25 2015-11-25 一种高通量测序数据前期处理方法

Publications (2)

Publication Number Publication Date
CN105354442A true CN105354442A (zh) 2016-02-24
CN105354442B CN105354442B (zh) 2018-02-16

Family

ID=55330413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510830815.7A Active CN105354442B (zh) 2015-11-25 2015-11-25 一种高通量测序数据前期处理方法

Country Status (1)

Country Link
CN (1) CN105354442B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111755116A (zh) * 2019-03-29 2020-10-09 欧蒙医学诊断(中国)有限公司 一种判断样本性别的方法以及实施该方法的装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6403778B1 (en) * 1998-05-04 2002-06-11 Incyte Genomics, Inc. Toxicological response markers
CN101560564A (zh) * 2009-04-08 2009-10-21 北京华生恒业科技有限公司 一种检测装置及系统
CN101914628A (zh) * 2010-09-02 2010-12-15 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法及 系统
CN102831330A (zh) * 2011-11-30 2012-12-19 北京诺禾致源生物信息科技有限公司 测序数据的处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6403778B1 (en) * 1998-05-04 2002-06-11 Incyte Genomics, Inc. Toxicological response markers
CN101560564A (zh) * 2009-04-08 2009-10-21 北京华生恒业科技有限公司 一种检测装置及系统
CN101914628A (zh) * 2010-09-02 2010-12-15 深圳华大基因科技有限公司 检测基因组目标区域多态性位点的方法及 系统
CN102831330A (zh) * 2011-11-30 2012-12-19 北京诺禾致源生物信息科技有限公司 测序数据的处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111755116A (zh) * 2019-03-29 2020-10-09 欧蒙医学诊断(中国)有限公司 一种判断样本性别的方法以及实施该方法的装置

Also Published As

Publication number Publication date
CN105354442B (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
CN107949845A (zh) 能够在多个平台上区分胎儿性别和胎儿性染色体异常的新方法
CN102061337B (zh) 一种组织特异性差异甲基化区域检测方法和系统
CN106096330B (zh) 一种无创产前生物信息检测分析方法
CN105279391A (zh) 一种宏基因组16S rRNA的高通量测序数据处理及分析流程控制方法
CN113450871B (zh) 基于低深度测序的鉴定样本同一性的方法
CN104169929A (zh) 用于确定胎儿是否存在性染色体数目异常的方法、系统和计算机可读介质
CN103776891A (zh) 一种检测差异表达蛋白质的方法
CN108268752B (zh) 一种染色体异常检测装置
CN103776773A (zh) 一种基于脂质红外光谱的反刍动物源性饲料原料鉴别方法
CN106599613B (zh) 一种判定遗传性肿瘤变异位点分级的方法
CN106778069B (zh) 确定胎儿染色体中微缺失微重复的方法及设备
CN105354442A (zh) 一种高通量测序数据前期处理方法
CN104561264B (zh) 华支睾吸虫实时荧光pcr检测试剂盒及检测方法
CN104093858A (zh) 确定生物样本中染色体数目异常的方法、系统和计算机可读介质
CN110910954A (zh) 一种低深度全基因组基因拷贝数变异的检测方法及系统
CN116949161A (zh) 一组肺结核血清外泌体miRNA标志物及其应用
CN105372224A (zh) 一种基于傅里叶拉曼光谱的不同种属饲用油脂鉴别方法
CN104131093B (zh) DNA蛋白结合位点的DNase高通测序检测信号处理方法
CN104181222A (zh) 利用同位素示踪法分析鉴别进口铁矿国别的方法
CN109321641B (zh) 一种基于dna片段富集及测序技术的产前无创胎儿染色体检测系统
WO2017059612A1 (zh) 一种虹膜识别方法、装置及终端
CN105243299B (zh) 一种检测cnv的精确断点及断点周围特征的方法及装置
CN109777875A (zh) Shh型髓母细胞瘤甲基化位点的应用
Erny et al. Introducing the concept of centergram. A new tool to squeeze data from separation techniques–mass spectrometry couplings
Kaisers et al. Hierarchical clustering of DNA k-mer counts in RNA-seq fastq files reveals batch effects

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510000 Guangdong City, Guangzhou International Biological Island spiral No. four, No. 1 standard industrial unit, a production area of the first layer of 304 units third units

Applicant after: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

Address before: 510000 Guangdong City, Guangzhou International Biological Island spiral No. four, No. 1 standard industrial unit, a production area of the first layer of 304 units third units

Applicant before: GUANGZHOU KINGMED DIAGNOSTICS TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20170307

Address after: 510300 Guangdong, Guangzhou International Biological Island spiral No. four, No. fourth, B401 cell layer, B501 cell layer, the sixth layer B601 unit 9

Applicant after: GUANGZHOU JINQIRUI BIOTECHNOLOGY CO.,LTD.

Address before: 510000 Guangdong City, Guangzhou International Biological Island spiral No. four, No. 1 standard industrial unit, a production area of the first layer of 304 units third units

Applicant before: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd.

TA01 Transfer of patent application right
CB03 Change of inventor or designer information

Inventor after: Liu Jingxing

Inventor after: Chen Baixue

Inventor after: Bi Xin

Inventor after: Chen Jiachang

Inventor after: Zhang Yao

Inventor after: Chen Xiaoyan

Inventor after: Jiang Yuanling

Inventor after: Zhao Weiwei

Inventor after: Yu Shihui

Inventor before: Liu Jingxing

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant