CN1152141C - 核酸碱基序列的测定方法 - Google Patents
核酸碱基序列的测定方法 Download PDFInfo
- Publication number
- CN1152141C CN1152141C CNB011403098A CN01140309A CN1152141C CN 1152141 C CN1152141 C CN 1152141C CN B011403098 A CNB011403098 A CN B011403098A CN 01140309 A CN01140309 A CN 01140309A CN 1152141 C CN1152141 C CN 1152141C
- Authority
- CN
- China
- Prior art keywords
- data
- point
- base sequence
- nucleic acid
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
用已设好的峰间距参数,对位于已检测数据前部的N个点的数据通过傅立叶变换进行波形定型(S1,S2),对位于N个点数据前部的M个点(M<N)的数据进行碱基序列测定(S3),从测序结果获得峰间距(S4)。用已获得的峰间距作为参数,以已测序的M个点中最后一个数据向前L个点(L<M)的位置为起点,对其后N个点的数据通过傅立叶变换进行波形定型,此后,序列测定,峰间距的计算和波形定型是同样重复进行的。这样,从一个迁移速率变化的数据范围中,基于傅立叶变换除去噪音,从而精确测定碱基序列。
Description
发明背景
发明领域
本发明涉及核酸,例如DNA(脱氧核糖核酸)的序列测定方法,更具体地说,本发明所叙述的核酸序列测定方法在预处理上有独到之处,该预处理在使用电泳获得的数据测定碱基序列之前用来去除噪音。
现有技术的描述
在对核酸片段样品进行电泳并以检测到的数据为基础测定核酸碱基序列的方法中,电泳检测到的数据是与核酸片段样品相对应的峰信号。因为峰信号包括噪音部分,因此波形定型是通过峰信号的预处理来完成的,随后以该峰信号为基础来测定碱基序列。
对于通过电泳获得的全部检测数据一般都集中执行预处理,随后用处理过的波形来进行序列测定(base calling)。
对波形定型的预处理包括通过以FFT(快速傅立叶变换)为代表的傅立叶变换进行的波形定型。在此预处理中,当对电泳检测到的峰信号的数据进行傅立叶变换时,执行过滤操作,随后通过反向傅立叶变换将数据返给峰信号。在此过滤过程中所运用的过滤函数适于除去那些出现频率短于DNA峰出现间隔的信号,主要为了除去高频组分的噪音。
①虽然FFT必须应用于2n个数目的数据,但数据的数目并不是恒定的,随迁移时间或取样频率而改变。
②设置这个除去噪音的过滤函数主要是为了除去具有高频组分的噪音,例如,那些出现频率短于DNA峰出现间隔的信号。因此,迁移速率可作为过滤函数的一个重要参数。但是,迁移速率在迁移过程中是逐渐改变的,因此在全部数据范围中噪音的过滤不能使用同一个参数完成。
发明概述
因此,本发明的目的在于获得一个基于傅立叶变换,从一个较长的、迁移速率是变化的数据范围内除去噪音从而能够精确测序的方法。
与本发明相对应的测序方法参照图1描述如下。
本发明涉及核酸的序列测定,即对核酸片段样品进行电泳并基于检测的数据测定碱基序列,包括以下步骤:
(A)步骤(S1,S2)是指利用已设定的峰间距参数,对可检测数据前部特定的N个点的数据通过傅立叶变换来进行波形定型。
(B)步骤(S3)是指对位于此N个点数据前部的P个点(P<N)的数据进行碱基序列测定。
(C)步骤(S4)是指从测序结果获得峰间距。
(D)步骤(S5,S6)是指以已测序的最后一个数据向前L(L<M)个点的位置为起点,用已获得的峰间距参数对从该起点往后的N个点数据通过傅立叶变换来进行波形定型。然后,
(E)步骤(S7)是指对于经历第二次或更后的波形定型的N个点数据,取位于其中部M个点(M<N)的数据进行碱基序列测定,这些数据与前一个步骤中的测序数据相衔接。
步骤(E)→(C)→(D)重复进行,直到数据消失,或者尽管由于信号的衰减或数据的异常而有数据存在,但已不需要进行分析。
术语“点”代表在电泳的检测位置根据设置的时间间隔进行扫描所俘获的数据,而点的数目与迁移时间相对应。
N个点宽度的傅立叶变换以及包括在此N个点内部的宽度为P或M个点的序列测定,是应用峰间距(迁移速率)作为参数的完全独立的过程,并不依赖于全部数据的数目。
在进行宽度为N个点的傅立叶变换之前所获得的峰间距(迁移速率)是非常有用途的,可以为过滤函数和测序反应提供合适的参数,从而提高测序的精度。
根据本发明,通过已获得的峰间距参数对特定点的检测数据应用傅立叶变换进行波形定型,从而在已进行波形定型的数据的基础上测定碱基序列,由于与先前进行的波形定型在范围上有部分重叠,从而改进了处理过程。一般来说,测序后被分析的(定型的)波形对测序也是必要的。而在本发明中基本上假定被分析的波形是不连续的,局部的点以重叠的方式有规律地进行傅立叶变换,从而可简单地通过连接已测序的部分,方便地获得被分析的波形。
当对全部数据均进行傅立叶变换时,由于气泡或污染的影响而出现的不连续部分的数据,可能会对正常部分的数据造成不良影响。但根据本发明,在到达不连续部分前不会造成影响。
另外,傅立叶变换的宽度和测序的宽度是固定的,互相独立的,但当增加新的规则或处理时,可达到高的灵活性。
通过下面有关本发明的具体描述,结合附图图例,本发明前述的以及其它的目标,特征,状况,优点将更加明显。
附图的简要描述
图1所示的是本发明的流程图。
图2所示的是本发明的一个实施例的处理过程。然后
图3所示的是实施例的处理过程以及电泳所显示的波形图表。
优选实施例的描述
通过傅立叶变换,FFT处理被用来进行波形定型。在此情况下,FFT处理的宽度(数据数目)固定在2n个点上,用来对经过处理的、位于其中央的2(n-1)个点进行测序,从测序结果获得峰间距(迁移速率),从后半部分的2(n-1)个点的位置起始,再次在宽度为2n个点上进行FFT处理。重复处理直到最后的数据。
参照图2和图3,本发明的一个实施例描述如下。
根据本实施例,FFT处理应用在N=2(n=8)=256个点上。
①获得峰间距的初值,该初值是预先设定的。
②从前部对N=256个点进行FFT处理。FFT处理是通过以下程序进行的:傅立叶变换用步骤①中的峰间距参数进行过滤反向傅立叶变换。
③用步骤①中的峰间距参数从前部对P=192个点进行测序。
④从测序结果获得峰间距。
⑤以已测序范围末端向前L(=2(n-2))=64个点的位置为起点,对其后的N=256个点进行FFT处理。如果此时在该点处无法获得256个点的数据,则停止处理。FFT处理是通过以下程序进行的:傅立叶变换用步骤④中的峰间距参数进行过滤反向傅立叶变换。
⑥使用步骤④中的峰间距参数,从前部第L=64位的点起始,对向后的M(=2(n-1))=128个点进行测序。
⑦返回步骤④。
在本实施例中,虽然由于FFT处理而使傅立叶变换的宽度(数据数目)固定在2n个点上,但傅立叶变换的宽度N,测序的宽度P,M及返回以进行下一次傅立叶变换的宽度L是不受数值2x所限的,可以选择那些满足关系N>M>L和N>P>L的整数。
虽然已经详细地描述和图示了本发明,但应清楚理解:这仅仅是作为图示和范例,而不是作为限制因素,本发明限定的要旨与范围仅如所附的要求所述。
Claims (3)
1.一种测定核酸碱基序列的方法,即对核酸片段样品进行电泳并基于检测的数据进行碱基序列测定,包括下列步骤:
(A)用已设定的峰间距参数,从检测数据前部开始,对一定数目的N个点的数据通过傅立叶变换进行波形定型;
(B)对位于N个点数据前部的P个点,P<N,的数据进行碱基序列测定;
(C)从测序结果获得峰间距;
(D)用已获得的峰间距作为参数,以已测序的最后一个数据向前L个点,L<M,的位置为起点,对其后N个点的数据通过傅立叶变换进行波形定型;然后
(E)对于经历第二次或更后的波形定型的N个点数据,对位于其中部M个点,M<N,的数据的碱基序列进行测定,这些数据与前一个步骤中的测序数据相衔接,
其中步骤E→C→D重复进行直到数据消失或尽管存在数据,但不需要进行分析为止。
2.按照权利要求1所述的测定核酸碱基序列的方法,其中快速傅立叶变换处理是通过傅立叶变换来进行波形定型的。
3.按照权利要求2所述的测定核酸碱基序列的方法,假设N等于2n,M等于2(n-1)以及L等于2(n-2)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001000499A JP3498706B2 (ja) | 2001-01-05 | 2001-01-05 | 核酸の塩基配列決定方法 |
JP2001000499 | 2001-01-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1363688A CN1363688A (zh) | 2002-08-14 |
CN1152141C true CN1152141C (zh) | 2004-06-02 |
Family
ID=18869273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011403098A Expired - Fee Related CN1152141C (zh) | 2001-01-05 | 2001-12-05 | 核酸碱基序列的测定方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7006925B2 (zh) |
JP (1) | JP3498706B2 (zh) |
KR (1) | KR100453528B1 (zh) |
CN (1) | CN1152141C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008050426A1 (fr) * | 2006-10-26 | 2008-05-02 | Shimadzu Corporation | Procede destine a determiner la sequence de base d'un acide nucleique |
US8317773B2 (en) * | 2006-11-07 | 2012-11-27 | Angio Dynamics, Inc. | Catheter with open faced sloped end portion |
KR200454305Y1 (ko) * | 2009-11-27 | 2011-06-27 | 대우버스(주) | 버스 도어용 시건장치 |
WO2017130349A1 (ja) * | 2016-01-28 | 2017-08-03 | 株式会社日立ハイテクノロジーズ | 塩基配列決定装置、キャピラリアレイ電気泳動装置及び方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0760146B2 (ja) * | 1991-01-31 | 1995-06-28 | 株式会社島津製作所 | 塩基配列決定装置 |
US5748491A (en) * | 1995-12-20 | 1998-05-05 | The Perkin-Elmer Corporation | Deconvolution method for the analysis of data resulting from analytical separation processes |
WO1998040520A1 (en) * | 1997-03-14 | 1998-09-17 | Hybridon, Inc. | Method for sequencing of modified nucleic acids using electrospray ionization-fourier transform mass spectrometry |
US6287773B1 (en) * | 1999-05-19 | 2001-09-11 | Hoeschst-Ariad Genomics Center | Profile searching in nucleic acid sequences using the fast fourier transformation |
-
2001
- 2001-01-05 JP JP2001000499A patent/JP3498706B2/ja not_active Expired - Lifetime
- 2001-11-19 KR KR10-2001-0071698A patent/KR100453528B1/ko not_active IP Right Cessation
- 2001-12-05 CN CNB011403098A patent/CN1152141C/zh not_active Expired - Fee Related
- 2001-12-06 US US10/003,120 patent/US7006925B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7006925B2 (en) | 2006-02-28 |
KR100453528B1 (ko) | 2004-10-20 |
US20020090634A1 (en) | 2002-07-11 |
JP3498706B2 (ja) | 2004-02-16 |
CN1363688A (zh) | 2002-08-14 |
KR20020057787A (ko) | 2002-07-12 |
JP2002202286A (ja) | 2002-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0868702B1 (en) | Deconvolution method for the analysis of data resulting from analytical separation processes | |
CN1152141C (zh) | 核酸碱基序列的测定方法 | |
EP0497468A2 (en) | Method of improving signal-to-noise in electropherogram | |
CN112345759A (zh) | 一种用于荧光强度峰检测的方法 | |
CN1199416C (zh) | 频率偏差检测装置及频率偏差检测方法 | |
KR101771402B1 (ko) | 핵산 정량 방법 | |
CN108181486B (zh) | 加速度信号的处理方法及装置 | |
JP3108317B2 (ja) | 信号処理装置および信号処理方法 | |
CN1552058A (zh) | 2阶段音调检测方法和装置 | |
JP2004020427A (ja) | ノイズ除去方法及びノイズ除去フィルタ | |
JP2006284528A (ja) | 信号処理機構 | |
JPS62291562A (ja) | クロマトグラフのデ−タ処理方法 | |
CN115381423A (zh) | 脉率检测装置、系统及存储介质 | |
CN118169110B (zh) | 光谱解析方法、样品成分分析方法及装置、设备、介质 | |
CN116758082B (zh) | 基于人工智能的型钢生产质量检测方法 | |
Wang et al. | A new denoising technique for capillary electrophoresis signals | |
CN117092406A (zh) | 一种用于交流电晕电流脉冲的数据统计方法及系统 | |
CN118311385A (zh) | 直流拉弧的检测方法、装置及光伏逆变器 | |
Nagarajan et al. | Refining motif finders with E-value calculations | |
JPH06241107A (ja) | ノッキング検出装置 | |
JP2645437B2 (ja) | ガスクロマトグラフ分析装置 | |
CN116074723A (zh) | 一种d类功放音频输出检测方法、设备及介质 | |
JP3321841B2 (ja) | ピッチ周波数推定方法及びその装置 | |
JP2002071447A (ja) | パルス音判定方法 | |
SU1257547A1 (ru) | Адаптивный анализатор спектра |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040602 Termination date: 20171205 |
|
CF01 | Termination of patent right due to non-payment of annual fee |