JPH05107227A - Determining apparatus of base sequence - Google Patents

Determining apparatus of base sequence

Info

Publication number
JPH05107227A
JPH05107227A JP3299917A JP29991791A JPH05107227A JP H05107227 A JPH05107227 A JP H05107227A JP 3299917 A JP3299917 A JP 3299917A JP 29991791 A JP29991791 A JP 29991791A JP H05107227 A JPH05107227 A JP H05107227A
Authority
JP
Japan
Prior art keywords
time
migration
calibration coefficient
signal
lane
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3299917A
Other languages
Japanese (ja)
Other versions
JPH0827258B2 (en
Inventor
Hidehiko Fujii
英彦 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP3299917A priority Critical patent/JPH0827258B2/en
Priority to US07/961,533 priority patent/US5419825A/en
Publication of JPH05107227A publication Critical patent/JPH05107227A/en
Publication of JPH0827258B2 publication Critical patent/JPH0827258B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

PURPOSE:To make it possible to determine a base sequence correctly even when a difference in a migration degree exists between lanes. CONSTITUTION:One of four migration lanes is made to be a reference lane, the times of appearance of maximal signals of three other migration lanes appearing between two maximal signals of the reference lane are calculated on the time base of the reference lane, a calibration coefficient is calculated from the ratio between the calculated times of the maximal signals of the three migration lanes and the actual times of the maximal signals, the time base of signals in a time region other than the time region used for computation of the calibration coefficient is converted, and the appropriateness of the calibration coefficient is determined on the basis of whether intervals of the times of appearance of the signals after the conversion are uniform or not. All of the time bases of the three migration lanes are calibrated by the calibration coefficient determined as appropriate, and a base sequence is determined on the basis of the times of the maximal signals of the four migration lanes based on the calibrated time base.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は蛍光プライマー(標識と
して螢光物質を化学結合させたプライマー)を用いサン
ガーの方法で前処理された核酸断片試料を、ゲル電気泳
動装置のスラブ状ゲルのサンプル投入部に末端塩基別に
投入して同時に泳動させ、泳動方向と直交する方向に走
査される励起・検出系によって泳動途中で蛍光を検出し
て、データ処理装置で塩基配列を決定するオンライン式
の塩基配列決定装置に関するものである。
The present invention relates to a slab-like gel sample of a gel electrophoresis apparatus for a nucleic acid fragment sample pretreated by Sanger's method using a fluorescent primer (a primer chemically bound with a fluorescent substance as a label). An online base that determines the base sequence by the data processor by detecting the fluorescence in the middle of the migration by the excitation / detection system that scans in the direction orthogonal to the migration direction, by inserting each end base into the injection part and allowing them to migrate simultaneously. The present invention relates to a sequence determination device.

【0002】[0002]

【従来の技術】スラブ状ゲルを用いたオンライン式の塩
基配列決定装置では、予めサンガー法によって処理した
核酸断片にその末端塩基の種類A(アデニン)、G(グ
アニン)、T(チミン)、C(シトシン)に応じて別々
の泳動レーンで電気泳動させる。一般に、ゲル電気泳動
装置では泳動レーンによって泳動速度が異なる、いわゆ
るスマイリングと呼ばれる現象が生じる。スマイリング
が生じると、単に末端塩基A,G,T,C別の泳動レー
ンの信号を順に読み取って塩基配列を決定したのでは、
配列の逆転を生じて配列の誤読に至る。
2. Description of the Related Art In an on-line type nucleotide sequencer using a slab-like gel, a nucleic acid fragment previously processed by the Sanger method has a terminal base type A (adenine), G (guanine), T (thymine), C. Electrophoresis in separate migration lanes depending on (cytosine). Generally, in a gel electrophoresis apparatus, a phenomenon called so-called "smileing" occurs in which the migration speed varies depending on the migration lane. When smileing occurs, simply reading the signals of the migration lanes for the terminal bases A, G, T, and C in order to determine the base sequence,
Sequence inversion occurs and leads to misreading of the sequence.

【0003】このスマイリングが生じる主な原因は、泳
動によるジュール熱の発生に起因する泳動レーンの温度
分布であると考えられている。そのため、スマイリング
を防止する方法として、泳動板に金属板を密着させて温
度の均一化を図ったり、泳動板を密閉可能な容器に収容
し、一定温度に制御した空気を流すことによって温度を
均一化する方法(特開平2−143145号公報参照)
などが検討されている。
It is considered that the main cause of this smiley is the temperature distribution in the migration lane due to the generation of Joule heat due to migration. Therefore, as a method for preventing smiles, a metal plate is closely attached to the migration plate to make the temperature uniform, or the migration plate is housed in a sealable container and the temperature is controlled to be uniform by flowing air controlled to a constant temperature. Method (see Japanese Patent Laid-Open No. 2-143145)
Are being considered.

【0004】[0004]

【発明が解決しようとする課題】温度制御によりスマイ
リングを防止しようとすれば、例えば500塩基と50
1塩基との泳動度差は0.2%(=1/500)である
が、温度制御によってスマイリングによる泳動度差を
0.2%以下に抑えるためには、0.1℃以下の温度ムラ
に抑える必要があり、現実には困難である。また、泳動
ゲル中には触媒として電解質の過硫酸アンモニウムが含
まれていて、泳動に従ってこれが外部の電極バッファ側
に出てくるが、この電解質の濃度が場所により不均一で
ある場合には泳動レーンによりイオン強度の差ができ、
結果的にスマイリングを生じる。電解質濃度の不均一に
基づくスマイリングは温度制御によっては防止すること
はできない。
To prevent smileing by controlling the temperature, for example, 500 bases and 50 bases are used.
The migration difference with one base is 0.2% (= 1/500), but in order to suppress the migration difference due to smileing to 0.2% or less by temperature control, temperature unevenness of 0.1 ° C or less It is necessary to keep it to, and it is difficult in reality. In addition, the electrophoresis gel contains the electrolyte ammonium persulfate as a catalyst, and this will come out to the external electrode buffer side according to the migration, but if the concentration of this electrolyte is not uniform depending on the location, it will depend on the migration lane. The difference in ionic strength
As a result, smileing occurs. Smileing due to non-uniformity of electrolyte concentration cannot be prevented by temperature control.

【0005】塩基配列の誤読につながる問題としては、
スマイリングの他にサンプル投入スロットの泳動レーン
による不均一も挙げられる。オンライン式の蛍光DNA
配列決定装置について考えると、その泳動距離(サンプ
ル投入スロットと検出部との距離)は通常200〜50
0mm程度である。サンプル投入スロットの所ではゲル
作成時の水平度の悪さやスロット内での尿素の侵入など
により、サンプル投入部での1〜2mmのサンプル位置
のずれは容易にあり得る。サンプル投入スロットでの1
mmの差は泳動距離を500mmとしても0.2%(1
/500)に相当し、これは500塩基と501塩基の
泳動度の差に匹敵する。このような泳動度差はもとより
温度制御によっては防止することはできない。
As a problem leading to misreading of nucleotide sequences,
In addition to smiley, nonuniformity due to the migration lane of the sample input slot is also included. Online fluorescent DNA
Considering a sequencer, the migration distance (distance between the sample input slot and the detection part) is usually 200 to 50.
It is about 0 mm. At the sample introduction slot, a 1-2 mm sample position shift at the sample introduction part can easily occur due to poor levelness during gel preparation and urea intrusion into the slot. 1 in sample input slot
The difference in mm is 0.2% (1
/ 500), which is comparable to the difference in migration between 500 and 501 bases. Such a difference in mobility cannot be prevented by controlling the temperature as well as by controlling the temperature.

【0006】本発明はスマイリングやその他の原因によ
ってレーン間に泳動度の差が存在しても、正しく塩基配
列を決定することのできる塩基配列決定装置を提供する
ことを目的とするものである。
[0006] It is an object of the present invention to provide a base sequence determination device capable of accurately determining a base sequence even if there is a difference in mobility between lanes due to smileing or other causes.

【0007】[0007]

【課題を解決するための手段】本発明の塩基配列決定装
置のデータ処理装置は、図1に示されるように、各泳動
レーンからの信号を時間に対して記憶する信号記憶手段
40と、各泳動レーンについて信号の極大値を与える時
刻を検出する極大信号時刻検出手段42と、その極大信
号時刻を記憶する極大信号時刻記憶手段44と、4泳動
レーンのうちの1つを基準レーンとし、基準レーンの2
つの極大信号間に出現した他の3泳動レーンの極大信号
に対して泳動レーン間に移動度の差がないと仮定して基
準レーンの時間軸でそれらの極大信号の出現時刻を算出
する出現時刻推定手段46と、出現時刻推定手段46で
算出された前記3泳動レーンの極大信号時刻と現実の極
大信号時刻との比から較正係数を算出する較正係数算出
手段48と、算出された較正係数を用い、較正係数の計
算に使用した時間領域以外の時間領域の信号の時間軸を
変換する手段101と、変換後の信号の出現時間間隔が
均一であるかどうかにより較正係数の妥当性を判定する
手段102と、妥当と判定された較正係数で前記3泳動
レーンの全時間軸を較正する全時間軸較正手段50と、
較正された時間軸にもとづく4泳動レーンの極大信号時
刻から塩基配列を決定する塩基配列決定手段52とを備
えている。出現時刻推定手段46は、例えば基準レーン
の2つの極大信号間に他の3泳動レーンの極大信号が時
間的に等間隔で出現するとして計算を行なう。103は
手段102の判定の結果、その較正係数が妥当でないと
判定されたときに、計算領域を変えて較正係数を再計算
する手段である。104は設定された基準レーンについ
て他のレーンの較正係数が全て妥当と判定されないとき
に基準レーンを変更する手段である。
As shown in FIG. 1, a data processing device of a base sequence determination device of the present invention includes a signal storage means 40 for storing signals from each migration lane with respect to time, and a signal storage means 40. Maximum signal time detection means 42 for detecting the time at which the maximum value of the signal is given to the migration lane, maximum signal time storage means 44 for storing the maximum signal time, and one of the four migration lanes as a reference lane, and a reference 2 in lane
Appearance time to calculate the appearance times of the maximal signals on the time axis of the reference lane, assuming that there is no difference in mobility between the migration lanes with respect to the maximal signals of the other three migration lanes that appear between the one maximal signal. The estimation means 46, the calibration coefficient calculation means 48 for calculating a calibration coefficient from the ratio of the maximum signal time of the three migration lanes calculated by the appearance time estimation means 46 and the actual maximum signal time, and the calculated calibration coefficient The means 101 for transforming the time axis of the signal in the time domain other than the time domain used for the calculation of the calibration coefficient, and the validity of the calibration coefficient are determined by whether or not the appearance time intervals of the transformed signal are uniform. Means 102 and full time axis calibration means 50 for calibrating the full time axis of the three migration lanes with a calibration factor determined to be valid;
And a base sequence determining means 52 for determining a base sequence from the maximum signal times of four migration lanes based on the calibrated time axis. The appearance time estimation means 46 performs calculation, for example, assuming that the maximum signals of the other three migration lanes appear at equal intervals in time between the two maximum signals of the reference lane. 103 is a means for recalculating the calibration coefficient by changing the calculation area when the calibration coefficient is determined to be invalid as a result of the determination by the means 102. Reference numeral 104 is a means for changing the reference lane when the calibration coefficients of the other lanes are not determined to be valid for the set reference lane.

【0008】[0008]

【作用】オンライン式塩基配列決定装置では時間の経過
とともに短かい核酸断片から長い核酸断片の順に信号が
現われてくる。図5はこれを示したもので、レーン1,
2,3,4は本来は全く同一の1本の曲線になるべきも
のであるが、温度ムラによって曲線が分離しているもの
である。しかし、温度ムラが定常状態ならば、このよう
な場合でも、曲線は比例関係にあり、どの点でもa1
2は一定となる。図5からわかるように、後に出てく
る長い核酸断片では信号自体もブロードな上にスマイリ
ングのために配列の誤読(配列の逆転)も起こりやすい
(図のサンプル点4,5,6)が、先に出てくる短かい
核酸断片では信号もシャープであり、スマイリングがあ
っても配列の逆転までには至らず、誤差とはならない
(図5のサンプル点1,2,3)。しかし、既に短かい
核酸断片が出ているときは、配列の逆転はないものの、
スマイリングがあれば本来出るべき位置(時間的にほぼ
等間隔の位置)からのずれが認められる。本発明では配
列の逆転の起こっていない範囲で今までに出た信号の位
置と信号が本来出るべきほぼ等間隔の位置とのずれから
各泳動レーンの時間軸の較正係数を求め、その較正係数
でそれから後の各々の泳動レーンに対する時間軸を較正
することにより正しい塩基配列を得る。
With the online base sequencer, signals appear in order from short nucleic acid fragments to long nucleic acid fragments over time. Figure 5 shows this, lane 1,
Originally, 2, 3 and 4 should be one curve which is exactly the same, but the curves are separated due to temperature unevenness. However, if the temperature unevenness is in a steady state, the curve has a proportional relationship even in such a case, and at any point a 1 :
a 2 is constant. As can be seen from FIG. 5, in the long nucleic acid fragment that appears later, the signal itself is broad, and misreading of the sequence (reversal of the sequence) is likely to occur due to smiley (sample points 4, 5, 6 in the figure). With the short nucleic acid fragment that appears earlier, the signal is also sharp, and even with smileing, it does not lead to sequence inversion, and does not cause an error (sample points 1, 2, and 3 in FIG. 5). However, when there are already short nucleic acid fragments, although there is no sequence inversion,
If there is a smile, a deviation from the original position (positions at almost regular intervals in time) can be recognized. In the present invention, the calibration coefficient of the time axis of each migration lane is obtained from the deviation between the position of the signal generated so far and the position at which the signal should be output at substantially equal intervals in the range where the sequence inversion does not occur, and the calibration coefficient Then, the correct base sequence is obtained by calibrating the time axis for each of the following migration lanes.

【0009】また、このような装置では信号は正しく得
られるが、化学的な原因によりピークが複数のレーンに
同時に現われたり、あるいはピークの高さが不均一で正
しく信号が認識されず、判断が正しく行なわれないこと
もありうる。図1の手段101,102,103はいっ
たん計算された較正係数を他の時間領域に適用して妥当
性を確かめるためのものである。この確認作業により、
較正係数の精度がよくなり、結局、塩基配列決定の精度
を上げることになる。
Although signals can be obtained correctly with such a device, peaks appear simultaneously in a plurality of lanes due to chemical causes, or the heights of the peaks are not uniform and the signals are not correctly recognized, so that the judgment cannot be made. It may not be done correctly. The means 101, 102 and 103 in FIG. 1 are for applying the calibration coefficient once calculated to another time domain to confirm the validity. By this confirmation work,
The accuracy of the calibration coefficient is improved, and eventually the accuracy of base sequence determination is increased.

【0010】[0010]

【実施例】図2は塩基配列決定装置の一実施例の全体図
を表わす。2はスラブ状泳動ゲルであり、ポリアクリル
アミドゲルが使用されている。泳動ゲル2の両端は電極
層4,6に浸され、電極層4,6には電解液が収容され
ている。電極層4,6の間には泳動電源8によって泳動
電圧が印加される。泳動ゲル2の一端には試料を注入す
るためのサンプル投入スロット10が設けられており、
サンプル投入スロット10の各々の所定の場所には末端
塩基別のサンプルが投入される。サンプルは蛍光物質で
あるFITCにより既知の方法で標識化され、サンガー
法により末端に塩基A,G,T,Cのそれぞれがくるよ
うに処理された4種類のDNA断片である。FITCは
488nmの波長のアルゴンレーザで励起され、520
nmの波長の蛍光を発する。泳動電源8が印加される
と、サンプルは泳動バンド16となって泳動方向14に
時間とともに泳動ゲル2中を泳動して分離されていき、
測定部に達する。
EXAMPLE FIG. 2 shows an overall view of an example of a base sequence determination device. 2 is a slab-like migration gel, and polyacrylamide gel is used. Both ends of the electrophoretic gel 2 are immersed in the electrode layers 4 and 6, and the electrode layers 4 and 6 contain an electrolytic solution. A migration voltage is applied between the electrode layers 4 and 6 by a migration power supply 8. A sample input slot 10 for injecting a sample is provided at one end of the electrophoretic gel 2,
A sample for each end base is introduced into each predetermined place of the sample introduction slot 10. The sample is four kinds of DNA fragments labeled by a known method with FITC which is a fluorescent substance, and treated by the Sanger method so that each of the bases A, G, T and C comes to the end. The FITC was excited by an argon laser with a wavelength of 488 nm to produce 520
It fluoresces at a wavelength of nm. When the migration power source 8 is applied, the sample becomes a migration band 16 and migrates in the migration direction 14 in the migration direction 14 over time to be separated.
Reach the measurement section.

【0011】測定部には488nmのレーザ光を発する
アルゴンレーザ18からの励起光を集光レンズ20とミ
ラー21によって照射する励起系と、その励起光ビーム
が当たった所に泳動バンド16があればその泳動バンド
16の蛍光物質から発せられた蛍光を対物レンズ22で
集め、520nmの干渉フィルタ24、集光レンズ26
から光ファイバ束27を経て光電子増倍管28で検出す
る検出系とが設けられている。集光レンズ20、ミラー
21、対物レンズ22、干渉フィルタ24、集光レンズ
26及び光ファイバ束27を含む励起・検出系には、励
起光ビーム照射位置が泳動方向14と直交する方向(走
査方向29)の測定ライン上を一定時間ごとに走査する
ように機械的に移動する走査ステージ30が備えられて
いる。
If there is an excitation system for irradiating excitation light from an argon laser 18 which emits a laser beam of 488 nm with a condenser lens 20 and a mirror 21, and a migration band 16 at the position where the excitation light beam hits, The fluorescence emitted from the fluorescent substance of the migration band 16 is collected by the objective lens 22, and the 520 nm interference filter 24 and the condenser lens 26 are collected.
To a photomultiplier tube 28 through the optical fiber bundle 27 and a detection system. In the excitation / detection system including the condenser lens 20, the mirror 21, the objective lens 22, the interference filter 24, the condenser lens 26 and the optical fiber bundle 27, the excitation light beam irradiation position is in a direction orthogonal to the migration direction 14 (scanning direction). 29) A scanning stage 30 is provided that moves mechanically so as to scan the measurement line at regular intervals.

【0012】光電子増倍管28の検出信号(蛍光信号)
は増幅器及びA/D変換器32を経てデータ処理装置で
ある信号処理マイクロコンピュータ31に取り込まれ
る。マイクロコンピュータ31にはまた、励起光ビーム
が泳動ゲル2上の測定部を照射するときに、その照射部
の位置に対応した信号が走査データとして取り込まれ
る。このようにして、走査方向に走査して得られた全蛍
光信号が場所情報とともにマイクロコンピュータ31に
取り込まれる。
Detection signal of the photomultiplier tube 28 (fluorescence signal)
Is taken into a signal processing microcomputer 31 which is a data processing device through an amplifier and an A / D converter 32. When the excitation light beam irradiates the measurement section on the electrophoretic gel 2, the microcomputer 31 also captures a signal corresponding to the position of the irradiation section as scanning data. In this way, all the fluorescence signals obtained by scanning in the scanning direction are taken into the microcomputer 31 together with the location information.

【0013】次に、一実施例の動作を図3及び図4によ
り説明する。図2の塩基配列決定装置で得られる信号は
例えば図3に示されるようなものである。A,G,T,
Cはそれぞれの泳動レーンに対応しており、横軸の時間
は光学系により泳動方向と直交する方向に走査を行なう
ときの走査数と一対一に対応している。図3は塩基長の
比較的短かい部分であって、塩基長1つ当たりの泳動速
度の差が比較的大きく、スマイリングが起こっていても
信号出現順序の逆転、即ち配列の誤読までには至らな
い。しかし、図3を詳細にみると、例えば、領域1内に
は、G,C,Gとピークが3個存在するので、このAの
2つのピークの間に3個のピークが等間隔で現われると
して線を引いてみると、Gのピークはこの線より遅れ、
Cのピークはこの線より少し早く出現していることがわ
かる。また、領域2内で同様のことを行なうとTがAに
比べて遅れていることがわかる。
Next, the operation of the embodiment will be described with reference to FIGS. The signal obtained by the base sequence determination device of FIG. 2 is as shown in FIG. 3, for example. A, G, T,
C corresponds to each migration lane, and the time on the horizontal axis has a one-to-one correspondence with the number of scans when scanning is performed by the optical system in the direction orthogonal to the migration direction. FIG. 3 shows a relatively short base length, and the difference in migration velocity per base length is relatively large. Even if smileing occurs, the order of signal appearance is reversed, that is, misreading of the sequence is not achieved. Absent. However, looking at FIG. 3 in detail, for example, since there are three peaks G, C, and G in the area 1, three peaks appear at equal intervals between the two peaks of A. When I draw a line, the peak of G lags behind this line,
It can be seen that the C peak appears a little earlier than this line. Further, it can be seen that T is delayed as compared with A when the same is done in the area 2.

【0014】定電圧で泳動を行なわせる場合、図2のよ
うな構成ではピークの出現間隔は厳密には等間隔ではな
い。しかし、図3のように、ある泳動レーン、この場合
Aの泳動レーンを基準レーンとしてその泳動レーンの2
つのピークの間で時間軸を較正するように操作を行なう
とすれば、基準レーンの2つのピーク間の間隔は最大で
も高々20〜30塩基分と考えられるので、このような
近似をしても出現順序が逆転するという誤差は生じな
い。図3の信号でも長時間が経過すればAに比べてG,
Tは遅く、Cは早くピークが出現するので、いつかは出
現順序が逆転し、塩基配列決定に誤差を与えるのは明白
である。
When electrophoresis is performed at a constant voltage, the peak appearance intervals are not strictly equal in the configuration shown in FIG. However, as shown in FIG. 3, one migration lane, in this case, the migration lane of A is used as a reference lane, and
If the operation is performed to calibrate the time axis between the two peaks, the interval between the two peaks in the reference lane is considered to be 20 to 30 bases at the maximum, and thus such an approximation is possible. There is no error that the order of appearance is reversed. Even if the signal of FIG. 3 is longer than G, G,
Since the peaks of T are late and C are early, it is clear that the order of appearance is reversed at some point, which gives an error in the sequencing.

【0015】図4のフローチャートにもとづいて時間軸
の較正を行なうまでの手順を説明する。較正係数の計算 較正係数(基準レーンに対する他のレーンの移動度の
比)は、上述のようにピークが明瞭で、信号出現順序の
逆転の起こらない、DNA断片の短かい部分で計算する
(ステップS21,S22,S23,S24)。基準レ
ーンは原則として任意に選ぶことができ、もしその選ん
だ基準レーンで較正係数を決定することができないとき
は、基準レーンを変更することができる(ステップS3
1)。しかし、実際にはレーンGやCではピークが接近
して現われることがあるので、そのような領域は基準レ
ーンから自動的に除かれるようにプログラムしておくこ
とができる。以下の説明ではレーンAが基準レーンに選
ばれたと仮定する。
The procedure up to the calibration of the time axis will be described with reference to the flowchart of FIG. Calculation of Calibration Factor The calibration factor (the ratio of the mobility of the other lane to the reference lane) is calculated on the short part of the DNA fragment where the peak is clear and the signal appearance order is not reversed as described above (step). S21, S22, S23, S24). In principle, the reference lane can be arbitrarily selected, and if the calibration coefficient cannot be determined with the selected reference lane, the reference lane can be changed (step S3).
1). However, in practice, peaks may appear close together in lanes G and C, and such regions can be programmed to be automatically excluded from the reference lane. In the following description, it is assumed that lane A is selected as the reference lane.

【0016】図3で、時間軸の各点は、レーンAの隣接
した2つのピークの間という限定された区間(A−A領
域)内のピーク出現ピッチが一定(これを単位ピーク間
隔という)であると仮定して計算された予想ピーク出現
時刻を示している。例えば、領域1では単位ピーク間隔
=(ta2−ta1)/4である。ここで、分母の4はレ
ーンAの隣接ピーク間に現われるピーク数に対応してい
る。ピーク出現ピッチが一定という仮定は、塩基長を出
現時刻に対して図示するとA−A領域(10〜20塩基
程度)内では直線で近似されることを意味している。予
想ピーク出現時刻と実際のピーク出現時刻との差はΔt
g,Δtb,Δttとして示されている。第1サイクル
では計算領域を領域1と仮定し、レーンG及びレーンC
の較正係数はそれぞれΔtg/tg及びΔtc/tcと
して計算される。レーンTの較正係数は計算領域を領域
2に移す第2サイクルで計算される。
In FIG. 3, at each point on the time axis, the peak appearance pitch is constant in a limited section (A-A area) between two adjacent peaks in lane A (this is called a unit peak interval). The expected peak appearance time calculated on the assumption that For example, in the region 1, the unit peak interval = (ta 2 −ta 1 ) / 4. Here, 4 in the denominator corresponds to the number of peaks appearing between adjacent peaks in lane A. The assumption that the peak appearance pitch is constant means that, when the base length is illustrated with respect to the appearance time, it is approximated by a straight line in the AA region (about 10 to 20 bases). The difference between the expected peak appearance time and the actual peak appearance time is Δt
It is shown as g, Δtb, Δtt. In the first cycle, the calculation area is assumed to be area 1, and lane G and lane C are used.
The calibration factors of are calculated as Δtg / tg and Δtc / tc, respectively. The calibration coefficient of lane T is calculated in the second cycle of moving the calculation area to area 2.

【0017】較正係数の検算 (ステップS25,S26,S29) 算出された較正係数の検算は、較正係数の計算に使用し
た時間領域の次の時間領域又はその後の時間領域で行な
い、その較正係数を用いて信号の時間軸を変換し、変換
後の信号の出現時間間隔が均一であるかどうかにより較
正係数の妥当性を判定する。その具体的な手順は次のよ
うに行なう。 (1)検算しようとするレーン(第1サイクルではレー
ンGとレーンC)の時間軸を計算された較正係数で割
る。
Verification of calibration coefficient (steps S25, S26, S29) The verification of the calculated calibration coefficient is performed in the time domain next to or after the time domain used for the calculation of the calibration coefficient, and the calibration coefficient is calculated. The time axis of the signal is converted by using the signal, and the validity of the calibration coefficient is determined by whether or not the time intervals of appearance of the converted signal are uniform. The specific procedure is as follows. (1) Divide the time axis of the lane to be checked (lane G and lane C in the first cycle) by the calculated calibration coefficient.

【0018】(2)検算しようとするレーンに次のピー
クをもつA−A領域に含まれるピーク数を計算するため
に、A−A領域の長さを単位ピッチで割り、その商を整
数に丸める。ここでは、単位ピッチは全体を通して僅か
しか変化しないと仮定している。 レーンGにおいて; 領域2のピーク数=(ta3−ta2)/{(ta2−ta1)
/4}の整数 レーンCにおいて; 領域3のピーク数=(ta4−ta3)/{(ta3−ta2)
/3}の整数
(2) In order to calculate the number of peaks included in the AA area having the next peak in the lane to be checked, the length of the AA area is divided by the unit pitch, and the quotient thereof is set to an integer. Round up. Here, it is assumed that the unit pitch changes only slightly throughout. In lane G; number of peaks in region 2 = (ta 3 −ta 2 ) / {(ta 2 −ta 1 ).
/ 4} in lane C; number of peaks in region 3 = (ta 4 −ta 3 ) / {(ta 3 −ta 2 ).
/ 3} integer

【0019】(3)検算しようとするピーク(tg3
やtc2’)付近の単位ピーク間隔を見積もるために、
A−A領域の長さを(2)で求めたピーク数で割る。 領域2の単位ピッチ=(ta3−ta2)/(領域2のピー
ク数) (この式はアルゴリズムを一般式で表現したものであっ
て、図3の例では(ta3−ta2)/3となる。) 領域3の単位ピーク間隔=(ta4−ta3)/(領域3の
ピーク数)
(3) Peak to be calculated (tg 3 '
Or tc 2 ') in order to estimate the unit peak interval,
The length of the AA area is divided by the number of peaks obtained in (2). Unit pitch of area 2 = (ta 3 −ta 2 ) / (number of peaks in area 2) (This expression is a general expression of the algorithm, and in the example of FIG. 3, (ta 3 −ta 2 ) / 3) The unit peak interval of area 3 = (ta 4 −ta 3 ) / (the number of peaks in area 3)

【0020】(4)検算しようとするピークと直前のA
ピークとの距離を(3)で求めた単位ピーク間隔で割
る。その割算の商から整数を引いた小数部分はピーク出
現の位相差を表わし、これによって妥当性を判断するこ
とができる。 レーンGにおいて; 位相差=[(tg3’−ta2)/(領域2の単位ピッ
チ)]の小数部分 レーンCにおいて; 位相差=[(tc2’−ta3)/(領域3の単位ピッ
チ)]の小数部分
(4) Peak to be checked and A immediately before
Divide the distance from the peak by the unit peak interval obtained in (3). The fractional part obtained by subtracting an integer from the quotient of the division represents the phase difference of peak appearance, and the validity can be judged by this. In lane G; Phase difference = [(tg 3 '-ta 2 ) / (unit pitch of region 2)] fractional part In lane C; Phase difference = [(tc 2 ' -ta 3 ) / (unit of region 3) Pitch)] fractional part

【0021】(5)もし(4)で求めた位相差(実験的
には許容誤差を時間軸の分解能の1単位とおく)が0又
は1に近ければ、算出された較正係数は正しいと判定さ
れる。もし、そうでなければ、算出された較正係数は正
しくないと判定され、計算用のA−A領域が次の領域に
変更され、プログラムはステップS24に戻って較正係
数を再度計算する(ステップS26,S29)。較正係
数の妥当性の判断を位相差の絶対値で行なっているが、
分散や標準偏差などで判断してもよい。
(5) If the phase difference obtained in (4) (experimentally, the allowable error is set to 1 unit of the resolution of the time axis) is 0 or close to 1, it is determined that the calculated calibration coefficient is correct. To be done. If not, the calculated calibration coefficient is determined to be incorrect, the AA area for calculation is changed to the next area, and the program returns to step S24 to recalculate the calibration coefficient (step S26). , S29). Although the validity of the calibration coefficient is judged by the absolute value of the phase difference,
You may judge by variance or standard deviation.

【0022】基準レーンの変更(ステップS31) 較正係数の計算と検算の操作を繰り返していって計算領
域が予め定められた短かいDNA断片の領域を越えてし
まった場合、基準レーンを替えて初めからやりなおしを
することができる。一例として、A→T→G→Cの順に
変更するようにプログラムしておく。ここで、短かいD
NA断片領域とは、一例としては1500〜2012走
査、すなわち2時間5分〜2時間47分までの範囲であ
り、この範囲であればピーク出現順序の逆転は決して起
こらない。
Changing the reference lane (step S31) When the calculation area exceeds the predetermined short DNA fragment area by repeating the calculation of the calibration coefficient and the verification operation, the reference lane is first changed. You can start over. As an example, it is programmed to change in the order of A → T → G → C. Where short D
The NA fragment region is, for example, a range from 1500 to 2012 scans, that is, from 2 hours 5 minutes to 2 hours 47 minutes, and in this range, the peak appearance order is never reversed.

【0023】時間軸変換(ステップS28) 計算され、検算によって正しいと判定された較正係数を
用いて時間軸全体を変換し、変換されたデータから塩基
配列を決定する。
Time Axis Conversion (Step S28) The entire time axis is converted using the calibration coefficient calculated and determined to be correct by verification, and the base sequence is determined from the converted data.

【0024】[0024]

【発明の効果】本発明ではA,G,T,Cの何れかを基
準レーンとし、他の3つの泳動レーンの時間軸を基準レ
ーンの2つのピーク間隔を基準にして較正するようにし
たので、スマイリングやその他の原因で泳動レーン間に
泳動速度差がある場合でも正しく塩基配列を決定するこ
とができる。そして、較正係数を検算して正しいものを
採用するので、塩基配列決定の精度が高くなる。温度分
布以外の原因によるスマイリングにも対応することがで
きる。周囲の空気制御により温度を均一化する従来の方
法と併用することもでき、その場合にはさらに精度が向
上する。
According to the present invention, any one of A, G, T, and C is used as the reference lane, and the time axes of the other three migration lanes are calibrated with reference to the two peak intervals of the reference lane. Even if there is a difference in migration speed between migration lanes due to smileing or other reasons, the base sequence can be correctly determined. Since the calibration coefficient is calculated and the correct one is adopted, the accuracy of the base sequence determination becomes high. It is also possible to deal with smileing due to causes other than temperature distribution. It can also be used in combination with the conventional method of uniformizing the temperature by controlling the ambient air, in which case the accuracy is further improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】一実施例における信号処理マイクロコンピュー
タの機能を示すブロック図である。
FIG. 1 is a block diagram showing functions of a signal processing microcomputer according to an embodiment.

【図2】一実施例を示す概略斜視図である。FIG. 2 is a schematic perspective view showing an embodiment.

【図3】一実施例で測定される各泳動レーンの信号を示
す図である。
FIG. 3 is a diagram showing a signal of each migration lane measured in one example.

【図4】実施例の動作を示すフローチャート図である。FIG. 4 is a flowchart showing the operation of the embodiment.

【図5】ピーク出現時刻とDNA断片塩基長との関係を
示す図である。
FIG. 5 is a diagram showing a relationship between a peak appearance time and a DNA fragment base length.

【符号の説明】[Explanation of symbols]

2 泳動ゲル 4,6 電極槽 8 泳動電源 10 サンプル投入スロット 14 泳動方向 16 泳動バンド 18 レーザ 20,26 集光レンズ 22 対物レンズ 24 干渉フィルタ 28 光電子増倍管 30 マイクロコンピュータ 32 A/D変換器 40 信号記憶手段 42 極大信号時刻検出手段 44 極大信号時刻記憶手段 46 出現時刻推定手段 48 較正係数算出手段 50 全時間軸較正手段 52 塩基配列決定手段 101 時間軸較正手段 102 検算手段 103 再計算手段 104 基準レーン変更手段 2 Electrophoresis gel 4,6 Electrode tank 8 Electrophoresis power supply 10 Sample input slot 14 Migration direction 16 Migration band 18 Laser 20, 26 Condensing lens 22 Objective lens 24 Interference filter 28 Photomultiplier tube 30 Microcomputer 32 A / D converter 40 Signal storage means 42 Maximum signal time detection means 44 Maximum signal time storage means 46 Appearance time estimation means 48 Calibration coefficient calculation means 50 Full time axis calibration means 52 Base sequence determination means 101 Time axis calibration means 102 Verification means 103 Recalculation means 104 Standard Lane change means

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 標識化された核酸断片試料を末端塩基の
種類別に4つの泳動レーンに分けて同時にゲル電気泳動
させながら核酸断片試料から出る信号を泳動方向と直交
する方向に走査してオンライン実時間で取得し、データ
処理装置で塩基配列を決定する塩基配列決定装置におい
て、データ処理装置は各泳動レーンからの信号を時間に
対して記憶する信号記憶手段と、各泳動レーンについて
信号の極大値を与える時刻を検出する極大信号時刻検出
手段と、その極大信号時刻を記憶する極大信号時刻記憶
手段と、4泳動レーンのうちの1つを基準レーンとし、
基準レーンの2つの極大信号間に出現した他の3泳動レ
ーンの極大信号に対して泳動レーン間に移動度の差がな
いと仮定して基準レーンの時間軸でそれらの極大信号の
出現時刻を算出する出現時刻推定手段と、出現時刻推定
手段で算出された前記3泳動レーンの極大信号時刻と現
実の極大信号時刻との比から較正係数を算出する較正係
数算出手段と、算出された較正係数を用い、較正係数の
計算に使用した時間領域以外の時間領域の信号の時間軸
を変換する手段と、変換後の信号の出現時間間隔が均一
であるかどうかにより較正係数の妥当性を判定する手段
と、妥当と判定された較正係数で前記3泳動レーンの全
時間軸を較正する全時間軸較正手段と、較正された時間
軸にもとづく4泳動レーンの極大信号時刻から塩基配列
を決定する塩基配列決定手段とを備えていることを特徴
とする塩基配列決定装置。
1. A labeled nucleic acid fragment sample is divided into four migration lanes according to the type of terminal base and simultaneously subjected to gel electrophoresis, and the signals emitted from the nucleic acid fragment sample are scanned in a direction orthogonal to the migration direction to carry out online implementation. In a base sequence determination device that acquires time and determines a base sequence by a data processing device, the data processing device has a signal storage unit that stores a signal from each migration lane with respect to time, and a maximum value of the signal for each migration lane. The maximum signal time detecting means for detecting the time giving the maximum signal time, the maximum signal time storing means for storing the maximum signal time, and one of the four migration lanes as a reference lane,
Assuming that there is no difference in mobility between the migration lanes with respect to the maximum signals of the other three migration lanes that appear between the two maximum signals of the reference lane, the time of appearance of those maximum signals on the time axis of the reference lane Appearance time estimating means for calculating, calibration coefficient calculating means for calculating a calibration coefficient from the ratio of the maximum signal time of the three migration lanes calculated by the appearance time estimating means to the actual maximum signal time, and the calculated calibration coefficient The validity of the calibration coefficient is determined by means for converting the time axis of the signal in the time domain other than the time domain used for the calculation of the calibration coefficient, and whether the appearance time intervals of the converted signal are uniform. Means, a means for calibrating all time axes of the three migration lanes with a calibration coefficient determined to be valid, and a base for determining a base sequence from the maximum signal time of four migration lanes based on the calibrated time axis. Distribution Sequencing apparatus characterized by and a determination unit.
【請求項2】 較正係数の妥当性を判定する手段は、計
算されたピークの出現予想時刻と変換後の信号の実際の
出現時刻との差の分散又は標準偏差が一定値以上になっ
たときを不適当と判定する請求項1に記載の塩基配列決
定装置。
2. The means for determining the validity of the calibration coefficient is provided when the variance or standard deviation of the difference between the calculated expected appearance time of the peak and the actual appearance time of the converted signal becomes a certain value or more. The nucleotide sequence determination device according to claim 1, wherein
【請求項3】 設定された基準レーンについて他のレー
ンの較正係数が全て妥当と判定されないときは基準レー
ンを変更する手段を更に備えた請求項1又は2に記載の
塩基配列決定装置。
3. The base sequence determination device according to claim 1, further comprising means for changing the reference lane when all the calibration coefficients of the other lanes are not judged to be valid with respect to the set reference lane.
JP3299917A 1991-07-29 1991-10-18 Nucleotide sequencer Expired - Fee Related JPH0827258B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3299917A JPH0827258B2 (en) 1991-10-18 1991-10-18 Nucleotide sequencer
US07/961,533 US5419825A (en) 1991-07-29 1992-10-15 Base sequencing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3299917A JPH0827258B2 (en) 1991-10-18 1991-10-18 Nucleotide sequencer

Publications (2)

Publication Number Publication Date
JPH05107227A true JPH05107227A (en) 1993-04-27
JPH0827258B2 JPH0827258B2 (en) 1996-03-21

Family

ID=17878491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3299917A Expired - Fee Related JPH0827258B2 (en) 1991-07-29 1991-10-18 Nucleotide sequencer

Country Status (1)

Country Link
JP (1) JPH0827258B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021053713A1 (en) * 2019-09-17 2021-03-25 株式会社日立ハイテク Biological sample analysis device and biological sample analysis method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021053713A1 (en) * 2019-09-17 2021-03-25 株式会社日立ハイテク Biological sample analysis device and biological sample analysis method
JPWO2021053713A1 (en) * 2019-09-17 2021-03-25

Also Published As

Publication number Publication date
JPH0827258B2 (en) 1996-03-21

Similar Documents

Publication Publication Date Title
Stellwagen et al. Determining the electrophoretic mobility and translational diffusion coefficients of DNA molecules in free solution
US6576108B1 (en) DNA detector and DNA detection method
JPS63243874A (en) Base sequence determining device
US5419825A (en) Base sequencing apparatus
Kheterpal et al. DNA sequencing using a four‐color confocal fluorescence capillary array scanner
Taylor et al. Multiplexed fluorescence detector for capillary electrophoresis using axial optical fiber illumination
JP2008122169A (en) Electrophoresis device and electrophoretic analysis method
JPH0798276A (en) Determining device for appangement of dna base
JPH05107227A (en) Determining apparatus of base sequence
JP2508404B2 (en) Nucleotide sequencer
JPH0618481A (en) Bade arrangement determining device
JP2610870B2 (en) Base sequencer
JPH1019846A (en) Multicapillary electrophoretic apparatus
JP4175735B2 (en) Multi-capillary electrophoresis device
Lindberg et al. Gel electrophoresis of DNA fragments in narrow‐bore capillaries
JPH05332992A (en) Electrophoresis device
JPH03285157A (en) Apparatus for determining base sequence
Fujii et al. Compensation for mobility inequalities between lanes computed from band signals in on‐line fluorescence DNA sequencing
JPH0833350B2 (en) Nucleotide sequence determination method
Djouadi et al. Dynamics of single‐stranded DNA migration in denaturing polyacrylamide slab‐gel electrophoresis
JPH09178703A (en) Base arrangement determining device
JP3887963B2 (en) Isoelectric focusing device
JP2000074834A (en) Dna base sequence determination device
JPH07134101A (en) Dna base sequence determining apparatus
CN115380208A (en) Electrophoresis device and analysis method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees