JP3671844B2 - 核酸の塩基配列決定方法 - Google Patents

核酸の塩基配列決定方法 Download PDF

Info

Publication number
JP3671844B2
JP3671844B2 JP2001023033A JP2001023033A JP3671844B2 JP 3671844 B2 JP3671844 B2 JP 3671844B2 JP 2001023033 A JP2001023033 A JP 2001023033A JP 2001023033 A JP2001023033 A JP 2001023033A JP 3671844 B2 JP3671844 B2 JP 3671844B2
Authority
JP
Japan
Prior art keywords
detection data
base sequence
types
peak
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001023033A
Other languages
English (en)
Other versions
JP2002228633A (ja
Inventor
一 狭間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2001023033A priority Critical patent/JP3671844B2/ja
Publication of JP2002228633A publication Critical patent/JP2002228633A/ja
Application granted granted Critical
Publication of JP3671844B2 publication Critical patent/JP3671844B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明はDNA(デオキシリボ核酸)などの核酸の塩基配列を決定する方法に関するものである。
【0002】
【従来の技術】
4種類の塩基(アデニンA、シトシンC、グアニンG、チミンT)に対応して異なる標識色素(Dye)をもつ核酸断片試料を電気泳動する際、標識色素の種類に起因して核酸断片試料の移動度が変化する場合がある。かかる場合、従来の塩基配列決定方法では、4種類の塩基に対応する4種類の検出データにおいて、ある塩基に対する検出データを基準として、標識色素に起因する移動度の差がなくなるような移動度補正用の関数(近似多項式等)を用いて、残る検出データの位置情報を変換している。この移動度補正用の関数を作成するには、手動操作で位置情報をティーチング(入力)する方法や、関数作成用のフラグメントを前もって電気泳動させて、その検出データにおけるピークの出現位置から既定値としての移動度補正用の関数を作成しておく方法等がある。
【0003】
【発明が解決しようとする課題】
予め移動度補正用の関数を作成しておく方法では、電気泳動の再現性が高いことが前提である。しかし、必ずしもこれは当たっておらず、電気泳動は行なう毎に微妙に違っているものである。
さらに、予め移動度補正用の関数を作成しておく方法では、ゲルやポリマーなどの泳動媒体の濃度を変えた場合又は泳動媒体自体を変えた場合に、温度や印加電圧等の他の泳動条件を再設定するために、いろいろな泳動条件で泳動評価する必要が生じる。しかし、泳動媒体や温度、印加電圧などの泳動条件毎に移動度補正用の関数をもたせることは非常に煩雑な操作である。
【0004】
そこで本発明は、塩基配列決定の前処理として、実際の核酸断片試料泳動時の検出データから移動度補正用の関数を適宜作成できる核酸の塩基配列決定方法を提供することを目的とするものである。
【0005】
【課題を解決するための手段】
本発明は、核酸断片試料を電気泳動し、その検出データに基づいて核酸の塩基配列を決定する方法であって、第1の局面は、塩基配列決定の前処理として、4種類の塩基に対応する4種類の検出データを重ねた状態で、4種類の検出データのうち1から3種類の検出データを固定し、残る検出データを前後方向に移動させて頂点波形の総面積が最大になる検出データの移動量を求める検出データ移動工程を含む塩基配列決定方法である。
ここで頂点波形とは、4種類の塩基に対応する4種類の検出データを重ねた状態で最も高い波形のみを結んだ波形を言う。
【0006】
図2は、2種類の塩基に対応する2種類の検出データ(実線と破線)のピーク部分を示す図であり、(A)は補正前、(B)は(A)の頂点波形の総面積、(C)は補正後、(D)は(C)の頂点波形の総面積を示す。
異なる移動度をもつ2種類の塩基に対応する標識核酸断片試料の移動度が補正されていない状態においては、一方の塩基の検出データにおけるピーク(破線)が他方の塩基の検出データにおけるピーク(実線)と重なってしまう((A)参照)。これらの検出データからその頂点波形のみを追跡して総面積を求めた場合((B)斜線部参照)、標識核酸断片試料の移動度の違いによりピークが重なっている部位があるので、移動度が正しく補正されていてピークが重なっていない場合((C)参照)の頂点波形の総面積((D)斜線部参照)より小さくなる。すなわち、頂点波形の総面積が最大になることが移動度補正の必要条件になる。よって、4種類の塩基に対応する4種類の検出データを重ねた状態で、4種類の検出データのうち1から3種類の検出データを固定し、移動度補正用の関数を直線的シフト(直線的移動)として、残る検出データを前後方向に移動させて頂点波形の総面積が最大になる検出データのシフト量(移動量)を求める。
【0007】
本発明の第2の局面は、塩基配列決定の前処理として、4種類の塩基に対応する4種類の検出データに基づいて仮の塩基配列を一旦決定する仮の塩基配列決定工程と、予め設定された基準塩基に対応する検出データにおける上記仮の塩基配列の決定に用いたピークを基準ピークとし、4種類の検出データを重ねた状態で、基準塩基以外の塩基に対応する検出データにおける上記仮の塩基配列の決定に用いたピークのうちから基準ピークに挟まれた対象ピークを検出データごとに少なくとも1つ選出し、対象ピークの前後の基準ピークとの間隔が等しくなる検出データの移動量を求める検出データ移動工程とを含む塩基配列決定方法である。
【0008】
仮の塩基配列決定工程により、4種類の塩基に対応する4種類の検出データに基づいて、ピーク間隔のチェックルールを若干緩めにして仮の塩基配列を決定する。検出データ移動工程により、移動度補正用の関数を直線的シフトとして、基準塩基以外の塩基に対応する検出データの対象ピークと前後の基準ピークとの間隔が等しくなるように検出データの移動量を求める。
【0009】
これらの方法は、電気泳動における4種類の塩基に対応する核酸断片試料の移動度が大幅に異ならない限り、十分に融通性をもっている。また、予め移動度補正用の関数をもつ必要がなく、さらに移動度補正用の関数を得るための電気泳動ももちろん必要ではない。
【0010】
【発明の実施の形態】
本発明の第2の局面にかかる塩基配列決定方法において、仮の塩基配列決定工程を、本発明の第1の局面を構成する検出データ移動工程を行なった後に行なうことが好ましい。その結果、仮の塩基配列決定工程におけるピークの検出精度を向上させることができ、ひいては最終的に決定した塩基配列の信頼性を向上させることができる。
【0011】
【実施例】
本発明の第1の局面にかかる方法を行なうためには、一般的には、4種類の塩基のうちいずれか1つの塩基の検出データを基準としてシフト量を他の3種類の塩基の検出データについて負から正の範囲で適当にふって、頂点波形の総面積を計算するプログラムを実行させ、その総面積が最大になる3種類の検出データのシフト量を答えとして得る。しかし、この計算は単純であるがかなりの負担を計算機に与える。以下に、この処理を簡略及び高速化する実施例の説明を行なう。
【0012】
図1は一実施例を示すフローチャートである。
例えば反応試薬キットとしてBigDye(Applied Biosystems 社の登録商標)ターミネータを使用して調整した標識核酸断片試料を電気泳動し、4種類の塩基に対応する4種類の検出データを得る(ステップS1)。
反応試薬キットとしてBigDyeターミネータを使用した場合、グアニンG又はチミンTに対応する標識核酸断片試料の移動度は、アデニンA又はシトシンCに対応する標識核酸断片試料の移動度に比べて速い。また、アデニンAとシトシンCの移動度の差は無視できる範囲である。したがって、アデニンAの検出データとシトシンCの検出データを基準検出データとし、グアニンGの検出データとチミンTの検出データを正側(遅らせる側)に移動させ(ステップS2)、頂点波形の総面積の計算を行なう(ステップS3)。このように、反応試薬キットに依存する塩基の種類毎の標識色素が標識核酸断片試料の移動度に与える影響の程度が予めわかっていれば、大幅に処理を高速化できる。
【0013】
頂点波形の総面積が最大になるグアニンGの検出データ及びチミンTの検出データのシフト量を求め(ステップS4)、グアニンGの検出データ及びチミンTの検出データの位置情報を補正する(ステップS5)。
図1の実施例において、ステップS1からステップS5までは、本発明の第1の局面にかかる塩基配列決定方法を構成する検出データ移動工程によるものである。
【0014】
図3は、2種類の塩基に対応する2種類の検出データ(実線と破線)のピーク部分を一方の検出データ(破線)のピークがテーリングを起こしている状態で示す図であり、(A)は補正前、(B)は補正後を示す。
4種類の塩基に対応する4種類の検出データのうちいずれか又は全部の検出データのピークがリーディングやテーリングを起こしている場合、例えば図3(A)に示すように、2種類の塩基の検出データのうち、一方の検出データ(破線)のピークがテーリングを起こしている場合、本発明の第1の局面にかかる塩基配列決定方法を適用したときシフト量がずれてしまう虞れがある。
そこで、図1の実施例では、本発明の第1の局面を構成する検出データ移動工程(ステップS1からステップS5)を行った後、本発明の第2の局面にかかる塩基配列決定方法を実行する。
【0015】
図1に戻って説明を続けると、本発明の第2の局面にかかる塩基配列決定方法を行なうには、まず、ピーク間隔のチェックルールを少し甘めにした上で一度ベースコール(塩基配列決定処理)を行なって仮の塩基配列を決定し、検出ピークの位置情報を得る(ステップS6)。
次に、予め設定された基準塩基、この実施例ではアデニンAとシトシンCの検出データを基準検出データとし、グアニンGの検出データ又はチミンTの検出データにおいて仮の塩基配列に使用したピークの前後両方に基準検出データの基準ピークを検出した場合に、そのピークを対象ピークとして選出する(ステップS7)。
【0016】
対象ピークと、対象ピークの前後の基準ピークとのピーク間隔を求める(ステップS8)。例えば、図3(A)に示すように、対象ピーク(破線)と前側の基準ピーク(実線)のピーク間隔fが10、対象ピーク(破線)と後ろ側の基準ピーク(実線)のピーク間隔bが14であるとする。このとき、対象ピークを含む検出データを2だけ後ろ方向(遅い方向)に移動してやれば、対象ピークの前後の基準ピークとのピーク間隔f,bが等しくなり(ステップS9)、移動度が補正されたことになる(図3(B)参照)。
【0017】
ステップS7からステップS9では、一度目のベースコール(ステップS6)で検出したピークの中から、ピークとして確度の高い(信用度の高い)ものについてステップS7とS8の操作を複数行なって、基準塩基以外の塩基、この実施例ではグアニンGとチミンTの検出データのシフト量をいくつか算出し、それぞれの検出データについてシフト量の平均値や中央値を取るなどして、ステップS9でグアニンGの検出データとチミンTの検出データのシフト量を得る。
【0018】
この実施例では、BigDyeターミネータにおいて、アデニンAとシトシンCを基準塩基とし、グアニンGの検出データとチミンTの検出データについて幾つか算出した各検出データのシフト量の中央値をそれぞれ計算してシフト量とする。この場合、グアニンG又はチミンTの検出データに含まれる対象ピークを選出する際、対象ピークの前後の基準ピークはアデニンAもしくはシトシンCであればどちらでも構わないし、前後がアデニンAとシトシンCの組み合わせであっても構わない。さらに同一塩基が連続している場合、例えばAGGGCとCGGGAとAGAは、グアニンGのシフト量の計算として同じものと考えることができる。
【0019】
図1に戻って実施例の説明を続けると、ステップS9で算出したシフト量に基づいて検出データの位置情報を補正する(ステップS10)。その後、ベースコールを行なって塩基配列を決定する(ステップS11)。
図1の実施例において、ステップS6は本発明の第2の局面にかかる塩基配列決定方法を構成する仮の塩基配列決定工程によるものであり、ステップS7からステップS10までは、本発明の第2の局面にかかる塩基配列決定方法を構成する検出データ移動工程によるものである。
【0020】
図1の実施例では、例えばサンガー反応試薬や泳動媒体の問題で、ピーク検出データが対称形でない場合でも、本発明の第1の局面にかかる塩基配列決定方法に第2の局面にかかる塩基配列決定方法を追補すれば、ほぼ完全な移動度の補正を行なうことができる。
【0021】
ゲルやポリマーなどの泳動媒体の濃度を変えた場合、あるいは泳動媒体自体を変えた場合に、温度や印加電圧等の泳動条件を再設定するために、いろいろなパターンで泳動評価する必要が生じるが、そのような場合でも、本発明の第1の局面にかかる塩基配列決定方法は原理が簡単かつ普遍的なので、特に手を加える必要もなく利用できる。仮にピーク間隔が歪みになるコンプレツション部位(収縮している部位)があっても、一般的には全体に比べ僅かな領域なので、本発明の第1の局面にかかる塩基配列決定方法にかかる統計的手法にとっては問題にならない。
【0022】
本発明の第2の局面にかかる塩基配列決定方法は、第1の局面にかかる塩基配列決定方法による検出データの補正をさらに信頼性の高いものにするのに有用であるが、標識核酸断片試料について、塩基の種類に対応する標識色素に起因する移動度の差が小さい場合には単独でも有用である。
上記実施例ではBigDyeターミネータを使用して調製された標識核酸断片試料の検出データを用いているが、本発明はこれに限定されるものではなく、他の標識色素をもつ標識核酸断片試料の検出データにも適用することができる。
【0023】
【発明の効果】
本発明の核酸の塩基配列決定方法にかかる第1の局面では、4種類の塩基に対応する4種類の検出データを重ねた状態で、4種類の検出データのうち1から3種類の検出データを固定し、残る検出データを前後方向に移動させて頂点波形の総面積が最大になる検出データの移動量を求める検出データ移動工程を含むようにした。第2の局面では、4種類の塩基に対応する4種類の検出データに基づいて仮の塩基配列を一旦決定する仮の塩基配列決定工程と、予め設定された基準塩基に対応する検出データにおける上記仮の塩基配列の決定に用いたピークを基準ピークとし、4種類の検出データを重ねた状態で、基準塩基以外の塩基に対応する検出データにおける上記仮の塩基配列の決定に用いたピークのうちから基準ピークに挟まれた対象ピークを検出データごとに少なくとも1つ選出し、対象ピークの前後の基準ピークとの間隔が等しくなる検出データの移動量を求める検出データ移動工程とを含むようにした。いずれの局面の本発明を実施しても、実際の核酸断片試料泳動時の検出データから移動度補正用の関数を適宜作成できる。
【図面の簡単な説明】
【図1】 一実施例を示すフローチャートである。
【図2】 2種類の塩基に対応する2種類の検出データ(実線と破線)のピーク部分を示す図であり、(A)は補正前、(B)は(A)の頂点波形の総面積、(C)は補正後、(D)は(C)の頂点波形の総面積を示す。
【図3】 2種類の塩基に対応する2種類の検出データ(実線と破線)のピーク部分を一方の検出データ(破線)のピークがテーリングを起こしている状態で示す図であり、(A)は補正前、(B)は補正後を示す。

Claims (3)

  1. 核酸断片試料を電気泳動し、その検出データに基づいて核酸の塩基配列を決定する方法において、
    塩基配列決定の前処理として、4種類の塩基に対応する4種類の検出データを重ねた状態で、4種類の検出データのうち1から3種類の検出データを固定し、残る検出データを前後方向に移動させて頂点波形の総面積が最大になる検出データの移動量を求める検出データ移動工程を含むことを特徴とする塩基配列決定方法。
  2. 核酸断片試料を電気泳動し、その検出データに基づいて核酸の塩基配列を決定する方法において、
    塩基配列決定の前処理として、4種類の塩基に対応する4種類の検出データに基づいて仮の塩基配列を一旦決定する仮の塩基配列決定工程と、
    予め設定された基準塩基に対応する検出データにおける前記仮の塩基配列の決定に用いたピークを基準ピークとし、4種類の検出データを重ねた状態で、前記基準塩基以外の塩基に対応する検出データにおける前記仮の塩基配列の決定に用いたピークのうちから前記基準ピークに挟まれた対象ピークを検出データごとに少なくとも1つ選出し、前記対象ピークの前後の前記基準ピークとの間隔が等しくなる検出データの移動量を求める検出データ移動工程と、を含むことを特徴とする塩基配列決定方法。
  3. 前記仮の塩基配列決定工程を、請求項1に記載の検出データ移動工程を行なった後に行なう請求項2に記載の塩基配列決定方法。
JP2001023033A 2001-01-31 2001-01-31 核酸の塩基配列決定方法 Expired - Lifetime JP3671844B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001023033A JP3671844B2 (ja) 2001-01-31 2001-01-31 核酸の塩基配列決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001023033A JP3671844B2 (ja) 2001-01-31 2001-01-31 核酸の塩基配列決定方法

Publications (2)

Publication Number Publication Date
JP2002228633A JP2002228633A (ja) 2002-08-14
JP3671844B2 true JP3671844B2 (ja) 2005-07-13

Family

ID=18888364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001023033A Expired - Lifetime JP3671844B2 (ja) 2001-01-31 2001-01-31 核酸の塩基配列決定方法

Country Status (1)

Country Link
JP (1) JP3671844B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647188B2 (en) * 2004-09-15 2010-01-12 F. Hoffmann-La Roche Ag Systems and methods for processing nucleic acid chromatograms
US8306756B2 (en) 2006-10-26 2012-11-06 Shimadzu Corporation Method of determining base sequence of nucleic acid
US8155889B2 (en) 2006-12-04 2012-04-10 Shimadzu Corporation Method for assessing degree of reliability of nucleic acid base sequence

Also Published As

Publication number Publication date
JP2002228633A (ja) 2002-08-14

Similar Documents

Publication Publication Date Title
US6090550A (en) Automated DNA sequencing comparing predicted and actual measurements
JP2993191B2 (ja) Dna配列を決定する方法
JP2004535198A (ja) 電気泳動分析のための内部較正標準
JP4360479B2 (ja) 生化学分離の品質の評価に品質評価基準を用いる方法
JP3671844B2 (ja) 核酸の塩基配列決定方法
Sciacchitano Analysis of polymerase chain reaction-amplified DNA fragments of Clostridium botulinum type E neurotoxin gene by high performance capillary electrophoresis
Baldazzi et al. Inference of DNA sequences from mechanical unzipping: an ideal-case study
JP3675521B2 (ja) Dnaの塩基配列決定時におけるフラグメント波形表示方法および装置
Hawtin et al. Utility of lab‐on‐a‐chip technology for high‐throughput nucleic acid and protein analysis
JPH05509000A (ja) Dnaシーケンス決定方法
JPH1040257A (ja) 文字配列比較方法、およびそれを用いたアセンブル方法
WO2008050426A1 (fr) Procede destine a determiner la sequence de base d'un acide nucleique
Azadan et al. Capillary electrophoresis sequencing: maximum read length at minimal cost
US20080306696A1 (en) Methods for Resolving Convoluted Peaks in a Chromatogram
JP4317398B2 (ja) 核酸塩基配列情報の記録方法及び核酸塩基配列決定方法
US6197516B1 (en) Computer method and apparatus for analyzing mutations in DNA
EP1945807B1 (en) Improvements in sequencing
Cupo et al. A high resolution two‐dimensional gel electrophoresis and silver staining protocol demonstrated with nuclear matrix proteins
CN110931082A (zh) 一种用于基因检测评估的方法及系统
US7179357B2 (en) Serial sample injection in capillary electrophoresis
JP2508404B2 (ja) 塩基配列決定装置
Arnold et al. From ABI sequence data to LASERGENE’s EDITSEQ
EP2203744B1 (en) A method for measuring the biological diversity of a sample
Tammi et al. ReDiT: Repeat Discrepancy Tagger—a shotgun assembly finishing aid
Ju DNA sequencing with solid-phase-capturable dideoxynucleotides and energy transfer primers

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050411

R150 Certificate of patent or registration of utility model

Ref document number: 3671844

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 9

EXPY Cancellation because of completion of term