JP4226912B2 - 核酸塩基配列決定方法 - Google Patents

核酸塩基配列決定方法 Download PDF

Info

Publication number
JP4226912B2
JP4226912B2 JP2003001950A JP2003001950A JP4226912B2 JP 4226912 B2 JP4226912 B2 JP 4226912B2 JP 2003001950 A JP2003001950 A JP 2003001950A JP 2003001950 A JP2003001950 A JP 2003001950A JP 4226912 B2 JP4226912 B2 JP 4226912B2
Authority
JP
Japan
Prior art keywords
peak
base sequence
waveform
nucleic acid
waveform data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003001950A
Other languages
English (en)
Other versions
JP2004208650A (ja
Inventor
智嗣 平田
伴  秀行
真一 福薗
康吉 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tochigi Prefecture
Hitachi High Tech Corp
Original Assignee
Hitachi High Technologies Corp
Tochigi Prefecture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi High Technologies Corp, Tochigi Prefecture filed Critical Hitachi High Technologies Corp
Priority to JP2003001950A priority Critical patent/JP4226912B2/ja
Publication of JP2004208650A publication Critical patent/JP2004208650A/ja
Application granted granted Critical
Publication of JP4226912B2 publication Critical patent/JP4226912B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、核酸試料を電気泳動して得られる蛍光強度波形データを解釈して、塩基配列決定やスプライシング異常の検出を行う核酸塩基配列決定方法に関するものである。
【0002】
【従来の技術】
デオキシリボ核酸(DNA)からタンパク質が作られる過程には、遺伝情報を正しいタンパク質合成に導くために、多くのステップが必要とされる。中でもスプライシングという現象はこの過程の中で重要なステップのひとつと考えられており、「遺伝子DNAからメッセンジャーRNA(リボ核酸)が作られる際、情報をもたない部分であるイントロンを切り捨て、情報を担う部分であるエクソンだけをつなぐ機構」のことを指している。
【0003】
例えば、5個のイントロン(I1〜I5)と5個のエクソン(E1〜E5)からなるDNAがあった場合、[I1]−[E1]−[I2]−[E2]−[I3]−[E3]−[I4]−[E4]−[I5]−[E5]の順に配列されたものとなっている。これが、スプライシングにより、5個のエクソン(E1〜E5)のみの[E1]−[E2]−[E3]−[E4]−[E5]の順に配列されたメッセンジャーRNAが作られる。ここで、イントロン[I1]、エクソン[E1]等は遺伝子が配列されたものであるが、ここでは、それらの個々の配列には意味はない。
【0004】
このスプライシングに異常が生じた場合、本来の機能を欠いたタンパク質が生成され、そのタンパク質が種々の疾患に関わる可能性が生じてくる。実際に、家族性アルツハイマー病が、プレセニリン1と呼ばれる遺伝子のエクソン4やエクソン9を欠失するスプライシング異常により発症することが報告されている。他にも多くの神経難病の発症に、スプライシング異常が深く関わると考えられており、スプライシング異常による疾患発生の機序解明が望まれている。
【0005】
現在、このスプライシング異常を検出する方法が幾つか開発されているが、信頼度が高く異常部位を直接検出できる塩基配列決定を行う場合が多い。従来、この塩基配列を決定するため、核酸断片を蛍光標識する技術、高解像度のゲル電気泳動技術、及び高感度の蛍光検出技術を組み合わせたDNAシーケンシング法が広く用いられてきた。
【0006】
【発明が解決しようとする課題】
従来のDNAシーケンシング法を用いた核酸塩基配列決定方法では、上記のようなスプライシング異常が生じている試料を計測した場合、スプライシング異常が生じているピーク以降の塩基配列を正しく解析することが困難となる。即ち、従来法による解析では、ある遺伝子の「あるピーク」以降でスプライシング異常が生じた場合、前記「あるピーク」以降の多くのピーク位置の塩基種がヘテロ(混合塩基)と判定されてしまう。
【0007】
何故ならヒトDNA遺伝子等では、父由来の遺伝子と母由来の遺伝子が一対となっており、遺伝子の殆どの部分で父由来の塩基種と母由来の塩基種が同一であり、またスプライシング異常は、通常、父由来の遺伝子もしくは母由来の遺伝子のうち、どちらか一方にのみで生じるためである。これにより、スプライシング異常が生じていない領域の殆どはホモと判定され、スプライシング異常が生じたピーク以降の領域の殆どはヘテロと判定されてしまう。
【0008】
このヘテロと判定された全てのピーク位置については、父由来の塩基種と母由来の塩基種に分離する必要があるが、この作業は熟練した作業者が波形データを目視しながら行う手作業に頼らざるを得なかった。
【0009】
また、上述したように、5個のイントロン(I1〜I5)と5個のエクソン(E1〜E5)からなるDNAがあり、[I1]−[E1]−[I2]−[E2]−[I3]−[E3]−[I4]−[E4]−[I5]−[E5]の順に配列されている場合、スプライシング異常により[E2]の欠損が生じた場合には、下記のような3種類のメッセンジャーRNAが作られる可能性が生じる。
[E1]−[E3]−[E4]−[E5]
[E1]−[E4]−[E5]
[E1]−[E5]
すなわち、[E1]の次には、[E2]より後ろのエクソンである[E3][E4][E5]と3個のエクソンが続く場合のみならず、[E4][E5]と2個のエクソンが続く場合、[E5]の1個のみのエクソンが続く場合とがある。このように、スプライシング異常が生じた後に通常とは異なるエクソンが続く現象をエクソンスキップと呼ぶ。そして、どのエクソンにスキップしたか、という情報は、上述したスプライシング異常による疾患発生の機序解明のための重要な情報源となる。
【0010】
しかしながら、従来のDNAシーケンシング法を用いた核酸塩基配列決定方法で得られた解析結果では、どのエクソンへスキップしたかを判定するのは非常に困難であり、熟練した作業者の目視及び手作業に頼らざるを得なかった。
【0011】
本発明は、このような従来技術の問題点に鑑み、スプライシング異常の検出や、スプライシング異常が生じたピーク以降の核酸塩基配列の決定、およびどのエクソンにスキップしたかを容易に判定することのできる方法を提供することを目的とする。
【0012】
【課題を解決するための手段】
前記目的を達成するため、本発明による核酸塩基配列決定方法では、核酸試料から作製した種々の長さの核酸断片を電気泳動して得られた4種類の塩基の蛍光強度波形データにおいて、各ピークの情報を元に前記核酸試料の塩基配列を仮決定するステップと、前記仮決定した塩基配列と既知塩基配列に対してホモロジー検索を行い、前記仮決定した塩基配列に相同性が高い既知塩基配列を並置するステップとを含み、前記既知塩基配列と前記仮決定した塩基配列が、所定の数以上連続して一致した後、所定のピーク(第1のピーク)以降で所定の数以上連続して一致しない領域があった場合に、前記第1のピーク以降でスプライシング(遺伝子DNAからメッセンジャーRNAが作られる際、情報をもたない部分であるイントロンを切り捨て、情報を担う部分であるエクソンだけをつなぐ機構)に異常が生じている可能性があると判定することを特徴とする。
【0013】
さらに、前記核酸試料の蛍光強度波形データと前記既知塩基配列に対応する蛍光強度波形データの差分波形データを作成するステップとを含み、前記差分波形データの前記スプライシング異常が生じていると判定した前記第1のピーク以降の範囲において、前記差分波形データの各ピーク情報を元に塩基配列を決定することを特徴とする。
【0014】
また、前記スプライシング異常が生じていると判定した前記第1のピーク以降の決定した塩基配列と、前記スプライシング異常が生じていると判定した前記第1のピーク以降の既知塩基配列に対してホモロジー検索を行うステップを含み、前記決定した第1のピーク以降の塩基配列に相同性が高い既知塩基配列を選定することを特徴とする。
【0015】
既知塩基配列に対応する蛍光強度波形データとしては、当該既知塩基配列に同定された複数の既知蛍光強度波形データを統計処理して作成した蛍光強度データベース波形を用いることができる。
【0016】
また、前記差分波形データの作成に先立ち、前記二つの波形データの対応する各ピークが一致するように、予め各ピーク間隔を両者で同一とする前処理及び/又は、対応する各ピークの強度基準が一致するようにピーク強度の基準を両者で同等とする前処理を行ってもよい。
【0017】
本発明によると、スプライシング異常の検出や、スプライシング異常が生じたピーク以降の核酸塩基配列の決定、および「どのエクソンにスキップしたか」を判定することができる。そして、その解析結果を用いることにより、スプライシング異常が深く関わると考えられている多くの神経難病の発症機序解明に役立てることができる。また、判定結果を用いて遺伝子診断を行うことにより、疾患遺伝子の探索や疾患感受性の判断、及び医薬品の開発(テーラーメイド医療)等を、高精度かつ迅速に行えるようになる。
【0018】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
【0019】
図1に、本発明が適用される核酸塩基配列決定装置の構成例をブロック図で示す。この装置は、核酸断片泳動部11、蛍光信号計測部12、蛍光信号演算部13、データ表示部14、データ格納部15、各部を制御する装置制御部16を備える。核酸断片泳動部11は、蛍光標識した核酸断片群を電気泳動させ塩基長の違いにより分離する。蛍光信号計測部12は、分離した核酸断片にレーザーを照射する光学機器及び発生する蛍光を検出する検出器等からなる。蛍光信号演算部13は、計測した蛍光強度波形データを信号処理し塩基配列の決定等を行う。データ表示部14は、蛍光強度波形データ及び決定した塩基配列に関連する情報の表示を行う。データ格納部15は、蛍光強度波形データ及び決定した塩基配列等の記録を行う。装置制御部16は、核酸断片泳動部11の電源の制御、蛍光信号計測部12の光源制御と検出器のサンプリング条件の制御、蛍光信号演算部13とデータ表示部14及びデータ格納部15間のデータ転送の制御、蛍光信号演算部13におけるデータ処理内容の制御等を行う。
【0020】
データ格納部15において蛍光強度波形データや決定した塩基配列及びピーク位置等を記録する際の形式(フォーマット)としては既に様々なものが提案されているが、一例としてSCFフォーマットと呼ばれる形式について、簡単に説明する。SCFフォーマット(version 3.00)では、以下の項目に対応する値が、ファイルに順次、記録されている。
【0021】
項目 内容
magic_number = フォーマット識別数(文字列”.SCF”を数値化したもの)
samples = 波形点数
samples_offset = 波形強度が記録されている最初の番地(バイトオフセット)
bases = 塩基数
bases_left_clip = 不使用(No. bases in left clip)
bases_right_clip = 不使用(No. bases in right clip)
bases_offset = 塩基配列が記録されている最初の番地(バイトオフセット)
comments_size = コメントの大きさ
comments_offset = コメントが記録されている最初の番地(バイトオフセット)
version = バージョン
sample_size = 波形強度値のビットサイズ(1=8ビット、2=16ビット)
code_set = 使用されているコードセット
private_size = プライベートデータの大きさ
private_offset = プライベート値が記録されている最初の番地(バイトオフセット)
spare = 予備
Samples for A trace = アデニン(A)塩基の波形データ
Samples for C trace = シトシン(C)塩基の波形データ
Samples for G trace = グアニン(G)塩基の波形データ
Samples for T trace = チミン(T)塩基の波形データ
Offset into peak index for each base = 各塩基のピーク位置
Accuracy estimate bases being ‘A’ = A塩基の同定信頼性
Accuracy estimate bases being ‘C’ = C塩基の同定信頼性
Accuracy estimate bases being ‘G’ = G塩基の同定信頼性
Accuracy estimate bases being ‘T’ = T塩基の同定信頼性
The called bases = 同定された塩基種(決定塩基配列)
Reserved for future use = 予備
Comments = コメント
Private data = プライベートデータ
本実施形態においては、電気泳動で得られた各塩基の蛍光強度波形データ、決定した塩基配列、ピーク位置等を上記SCFフォーマットにてデータ格納部15に記録するが、勿論他のフォーマットによって記録しても構わない。
【0022】
図1に示した塩基配列決定装置を用いて塩基配列を決定(仮決定)するためには、核酸断片泳動部11において、サンガー法等を用いて塩基配列を決定すべき核酸試料を元に様々な長さの核酸断片群を調製する。反応には、蛍光色素により標識したプライマー、または蛍光色素により標識したddNTPを用い、核酸断片群に蛍光色素を標識する。
【0023】
まず初めに、塩基配列を知りたいDNA(ターゲットDNA)を用意する。通常、未知の配列を持ったDNAをプラスミド(細菌等の細胞内にある核以外の細胞質中のDNAで、主に複製開始情報のみを有する)に組み込んだものか、ポリメラーゼ連鎖増幅反応(PCR)法で塩基配列を直接増幅した核酸断片を用いる。次に、ターゲットDNAとプライマー(ターゲットDNAの特定部分の配列と相補的な塩基配列を有するもので、PCR法を用いる場合は反応で利用する片側のものに相当する)を試験管内の溶液中で混合し、温度をコントロールすることでプライマーとテンプレートが相補的な二本鎖を形成するようにする(アニーリング)。更に、このプライマーを起点としてDNAを複製する過程に進み、複製はDNAポリメラーゼと呼ばれる酵素を触媒として行われる。そして、この反応液中にはDNAの合成に必要なdNTP(各種塩基:アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)(もしくはウラシル(U))のモノマー)と、4種類のddNTP(A,C,G,T(U)のターミネーター)を所定の割合で混合し所定の濃度で入れておく。すると、DNAが合成されていく時、ddNTPが取り込まれるとDNAの合成がそれ以上進まなくなる(伸長反応)。ここで、ddNTPにそれぞれの塩基に応じて色の異なる蛍光色素を標識しておく。その結果、末端にddNTPを持つ様々な長さ(塩基長)で合成が止まった核酸断片が生成され、各断片はその末端塩基に応じた蛍光色で標識されることになる。
【0024】
次に、標識された核酸断片群に対して電気泳動を行い、蛍光信号計測部12において、蛍光信号を検出して蛍光強度波形データを作成する。具体的には、上記のようにしてできた核酸断片を含む溶液を濃縮精製した後、一本鎖に変性して、ゲル電気泳動装置を用いて塩基長毎に核酸断片を分離する。以下では、ゲル電気泳動装置の一例として、キャピラリ泳動装置を用いた場合について説明する。まず、粘性のある高分子ポリマーをキャピラリ(ガラス細管)に充填しておき、その両端に電圧を印加することにより、負の電荷を有する核酸断片をキャピラリの片側から導入・泳動させる。この時、核酸断片は鎖状の重合体高分子であるため、ポリマー中を分子量に反比例した速度で移動し、短い(分子量が小さい)核酸断片ほど速く、長い(分子量が大きい)核酸断片ほどゆっくり移動するため、塩基長毎に核酸断片を分離することができる。そしてキャピラリの終端付近(各核酸断片を1塩基の長さの差異で分離可能となった位置)で核酸断片にレーザー光を照射し、各断片末端塩基から発生する蛍光を検出器により測定する。前記の通り、短い核酸断片から順番に蛍光を発生していくので、4塩基種毎の蛍光強度曲線が得られ、各ピーク位置での4種類の蛍光強度等を比較することにより、塩基種(A,C,G,T(U))の配列決定が可能となる。
【0025】
図2は、蛍光強度波形データの例21と、それを解釈して決定される塩基配列の例22を示す図である。実際には、1度の計測で数百塩基分のデータが得られるが、ここでは説明のためにその一部を示している。縦軸は蛍光強度を表し、横軸は泳動時間を表している。蛍光強度波形データ21に現れるピークの高さは、ある長さの核酸断片の量を反映したものである。通常、長い核酸断片ほど泳動時間が遅いところにピークが現れ、ピーク間隔は核酸断片が長くなるにつれて大きくなる傾向がある。そこで、表示の時間軸が塩基長に比例するように、泳動電圧等の泳動条件で決まるパラメータを用いて補正するのも有効である。
【0026】
図3は、未知核酸断片の塩基配列を仮決定するために蛍光強度波形データに対して通常行う処理を示す図である。この処理は、図1の蛍光信号演算部13によって行われる。
【0027】
蛍光信号演算部13は、未知核酸断片の蛍光強度波形データに対して、スムージング処理(ステップ31)及びバックグラウンド補正(ステップ32)を行う。その後、ピークの検出(ステップ33)及びピーク間隔の決定(ステップ34)を行う。また、電気泳動時の泳動むら(スマイリング)によりピーク間隔は常に一定になるとは限らないため、得られたピーク間隔の大きさから必要に応じてピーク位置の補正(スマイリング補正)を行う(ステップ35)。次に、各ピーク位置での各塩基種の信号強度(あるいは各ピークの面積等)を比較して、所定の同定基準に従い塩基種を順次決定する(塩基配列の仮決定)(ステップ36)。
【0028】
この同定基準の例としては、あるピーク位置においてある塩基種(例えばA)の信号強度が一番大きく、残る3つの塩基種の中で最も大きな塩基種(例えばC)の信号強度が最大塩基種(ここではA)の信号値のT%未満であった場合(Tは閾値は例えば50%)、最大塩基種(ここではA)として同定する。また、二番目の塩基種(ここではC)がT%(例えば50%)以上であり、かつ三番目の塩基種(例えばG)の強度が最大塩基種(ここではA)の信号値のT%(例えば50%)未満であった場合、最大塩基種(ここではA)と二番目の塩基種(ここではC)のヘテロ(混合塩基=同一ピーク位置に複数の塩基が含まれていると同定された部位)として決定される(ここではM(=A+C))。同様にして全ての組み合わせに応じて混合塩基の表示方法(IUB規格の混合塩基表示法)が決められているが、その判定基準としては明確な値は示されていない)。
【0029】
図4は、データベース波形及びその付随情報を取得する処理の一例を示す図である。データベース波形及びその付随情報は、図1の蛍光信号演算部13で取得して図1のデータ格納部15に格納してもよいし、他の装置によって取得されたものを図1のデータ格納部15に格納して利用してもよい。
【0030】
図4の処理では、塩基配列が既知である蛍光強度波形データの集合である既知塩基波形データ群に対し、塩基種毎に全波形の横軸を揃える処理(ステップ41)及び全波形の縦軸を揃える処理(ステップ42)を行い、全波形を平均して平均波形を作成する(ステップ43)。こうして作成された塩基種毎の波形をデータベース波形として保存する(ステップ44)。また、塩基種毎にピーク位置を検出してピーク位置情報として保存する(ステップ45)と共に、塩基配列の情報を既知塩基配列情報として保存する(ステップ46)。
【0031】
具体的には、横軸および縦軸が揃った「変異を含まない同一の塩基配列に同定された」n個の蛍光強度波形データセット(4塩基種分の蛍光強度波形データを1セットとする)を用意し、i番目(1≦i≦n)のデータセットのA塩基の波形データをAi(t)とした場合(tは泳動時刻に相当する横軸変数)、Aのデータベース波形Ab(t)は、下記(1)式で算出する。
【0032】
【数1】
Figure 0004226912
同様にして残るC,G,Tに対しても、それぞれのデータベース波形Cb(t),Gb(t),Tb(t)は、下記(2)式〜(4)式で算出される。
【0033】
【数2】
Figure 0004226912
【数3】
Figure 0004226912
【数4】
Figure 0004226912
上記の手順で作成したデータベース波形と各ピーク位置の情報、及び前記既知塩基配列情報は、図4のステップ44,45,46において前記SCFフォーマット等で保存する。
【0034】
次に、図1の蛍光信号演算部13は、図1のデータ格納部15にデータベースとして格納されている既知塩基配列と、未知の核酸試料に対して図3の処理を経て仮決定した塩基配列とを比較することにより、未知核酸断片の塩基配列の確定とスプライシング異常の検出を行う。
【0035】
図5はスプライシング異常の検出を行うための処理フローの例を示す。まず、仮決定した塩基配列とデータベース中の既知塩基配列に対してホモロジー検索を実施し、仮決定した塩基配列の各々の部位について既知の塩基配列との関連付けを行い、相同性が高い既知の塩基配列を並置する(ステップ51)。その後、仮決定塩基配列と既知塩基配列の比較を行い(ステップ52)、所定の比較基準に基づいてスプライシング異常の有無の判定を行う(ステップ53)。ステップ53でスプライシング異常が検出された場合には、塩基配列が既知である蛍光強度波形データと電気泳動して新規に得られた塩基配列を決定すべき蛍光強度波形データの横軸を揃え(ステップ54)、次に縦軸を揃え(ステップ55)、両波形データの差分波形を作成し(ステップ56)、所定の基準に基づいてスプライシング異常以降の塩基配列の決定を行い(ステップ57)、エクソンスキップ先の選定を行う(ステップ58)。ステップ53でスプライシング異常が検出されなかった場合には処理を終了する。
【0036】
以下、ステップ53でスプライシング異常が検出された場合の処理について詳しく説明を行う。
【0037】
実際の核酸試料の塩基配列を決定する際には、ある特定部位の塩基変異を調べる場合のように、塩基配列を決定すべき核酸試料の塩基配列の少なくとも一部が既知である場合が多い。このような参照できる既知の塩基配列が存在する場合、前記のようにして仮決定した塩基配列と既知の塩基配列に対してホモロジー検索を実施し、仮決定した塩基配列の各々の部位について既知の塩基配列との関連付けを行い、相同性が高い既知の塩基配列を並置して参照することが可能となる。ホモロジー検索による並置に際しては、「スミス・ウォーターマンの方法(ジャーナル オブ モレキュラー バイオロジー、第147巻、195頁〜197頁)」等を用いる。
【0038】
次に、既知塩基配列と仮決定塩基配列を並置した後、先頭のピーク位置から順に、二つの配列が一致しているかどうかを調べていく。スプライシング異常が生じていない場合には、仮決定時の判定誤りや実際に生じている塩基変異により、既知塩基配列と仮決定塩基配列の間に多少の相違は生じるものの、最終ピーク位置までの殆どのピーク位置で塩基種が一致し、不一致が数塩基以上続くことはない。これに対して、スプライシング異常が生じている場合には、スプライシング異常が生じているピーク以降で、既知塩基配列と仮決定配列の間に相違が生じ、最終ピークまで殆どのピーク位置で一致しない状態となる。
【0039】
これは、ヒトDNA遺伝子等では、父由来の遺伝子と母由来の遺伝子が一対となっており、遺伝子の殆どの部分で父由来の塩基種と母由来の塩基種が同一であり、またスプライシング異常は、比較的稀な現象であるため、父由来の遺伝子もしくは母由来の遺伝子のどちらか一方にのみ生じることが多いためである。これにより、スプライシング異常が生じたピーク以降の領域の殆どはヘテロとなり、既知塩基配列とは一致しなくなる。
【0040】
図6は、遺伝子hMLH1の4番目のエクソンと5番目のエクソンの境でスプライシング異常が生じている場合の解析結果の一例である。図の上段に塩基配列が既知である解析済み波形(データベース波形−DB波形)を、下段にはこれから解析を行う未知の波形(ターゲット波形−TG波形)を、2段に並べて表示している。この表示範囲での既知のデータベース配列(DB配列)は、
ATACAGAGCAAGTT(配列番号1)
であり、ターゲット波形の仮決定配列は、
ATACAGRKSRAGKW(配列番号2)
と仮決定されている。ここで、RはAとGのヘテロ、KはGとTのヘテロ、SはCとGのヘテロ、WはAとTのヘテロを、それぞれ、表している。
【0041】
この例では、既知のデータベース配列(DB配列)とターゲット波形(TG波形)の仮決定配列の2つの配列は先頭から259番目の塩基Gまでは完全に一致していたが、260番目からはターゲット波形の仮決定配列の多くがヘテロとなっているため、ターゲット波形(TG波形)の仮決定配列がホモのままであるピーク(264番目の塩基Aおよび265番目の塩基G)以外の多くのピーク位置で一致していない。このような場合、例えば「既知塩基配列と仮決定配列が4ピーク以上連続して一致した後、あるピーク以降で4ピーク以上連続して一致しない領域があった場合に、スプライシング異常が生じていると判定する」ことにより、前記「あるピーク」以降のスプライシング異常を検出することが可能になる。
【0042】
次に、上記の手順で「スプライシング異常が生じている」と判定された場合には、さらに、前記ターゲット波形(TG波形)データから前記データベース波形(DB波形)データを差し引いた差分波形データを作成することにより、この差分波形データの各ピーク情報を元に、前記塩基配列の仮決定の手順と同様の手順により、スプライシング異常発生後の塩基配列を、決定することが可能になる。
【0043】
図7はこれを説明するために、上段には既知のデータベース配列(DB配列)に対応するデータベース波形(DB波形)を、下段には、このDB波形と仮決定配列がなされ、これから解析を行うターゲット波形(TG波形)との差分を、2段に並べて表示している。この下段に示した差分波形から、スプライシング異常が発生したターゲットDNAの断片の塩基配列を、下記のように決定することが可能になる。
【0044】
ATACAGGTGGAGGA(配列番号3)
図7の差分波形では、例えば、260番目の塩基の差分について見ると、DB波形は塩基Aだけに対応するものであるのに対して、TG波形ではヘテロ塩基Rの波形、すなわち「塩基G+塩基A」の波形であるから、塩基Gに対応する波形は差分として正側に表れ、塩基Aに対応する波形は負側に現れることになる。ここでは、負側に現れる波形はヘテロ塩基のうちDB波形にある塩基を意味するから、スプライシング異常が発生したターゲットDNAの断片の塩基配列の決定には意味を持たないから無視すれば良い。したがって、スプライシング異常が発生したターゲットDNAの断片の260番目の塩基は塩基Gと決定できる。同様に、261番目のヘテロ塩基Kは「塩基G+塩基T」であるから、正側に表れる波形は塩基Tに対応するものとなる。なお、負側に現れる波形は意味を持たないと言う点から言えば、差分波形は正側に表れるものだけを処理するものとしても良い。
【0045】
また、上述の説明からも分かるように、データベース波形、ターゲット波形および差分波形のように、波形データを処理するのに代えて、配列文字列間での引き算により、スプライシング異常が発生したターゲットDNAの断片の塩基配列を決定することも可能となる。
RKSRAGKW−AGCAAGTT=GTGGAGGA
すなわち、仮決定配列のRKSRAGKWは(G+A)(G+T)(C+G)(G+A)(A+A)(G+G)(G+T)(T+A)のように2つの塩基の組として扱われるから、それぞれの組からデータベース配列のAGCAAGTTを引き算すれば、データベース配列との比較やデータベース波形との差分算出を行わなくても「スプライシング発生後の塩基配列決定」が可能となる。なお、ここでは、上記ターゲット波形の仮決定配列RKSRAGKW中の「A」、「G」は、それぞれ「AとAのホモ(一対)」、「GとGのホモ」を表しているものと考えて処理を行う。
【0046】
この配列文字列間での引き算による処理は「スプライシング異常の有無の判定」にも適用することができる。すなわち、前述したように、既知塩基配列と仮決定塩基配列を並置した後、先頭のピーク位置から順に、二つの配列が一致しているかどうかを調べて、スプライシング異常が生じているか否かを判定する段階で、配列文字列間での引き算による判定をするものとすれば、データベース波形およびターゲット波形のピーク検出による判定に代えることができる。
【0047】
この場合には、しかしながら、スプライシング異常が生じた後のピーク位置にズレが生じ、本来のピーク位置と本来のピーク位置の間にズレた方のピークが発生した場合には、ターゲット波形の仮決定配列が、スプライシング異常後では父方の塩基ピークと母方の塩基ピークが交互に同定され、
CATACAGAGGTCGAGAAGGTGTA(配列番号4)
と仮決定されることがあり、この場合には、データベース配列との比較やデータベース波形との差分算出を行うことが必須となる。すなわち、配列文字列間での引き算による判定では「スプライシング異常の有無の判定」や「スプライシング発生後の塩基配列決定」を行うことが出来ない。
【0048】
上記の例では、仮決定配列に多数のヘテロが含まれている場合のスプライシング異常の有無判定に、「あるピーク位置を先頭にヘテロが4ピーク以上連続して続いた場合に、スプライシング異常が生じていると判定する」という基準を用いる場合について述べたが、ピーク数が4以上連続の基準以外にも、種々の基準を設定することができる。例えば、「あるピーク位置を先頭にヘテロが2ピーク以上連続して続いた場合にはスプライシング異常が生じていると判定する」ことを判定基準としても良い。
【0049】
次に、スプライシング異常の結果、どのピーク位置にスキップしたかを決定する方法について説明する。図7を参照して説明したように、「あるピーク」以降のスプライシング異常が発生した塩基配列「GTGGAGGACCT」と、前記スプライシング異常が生じていると判定した前記「あるピーク」以降の父もしくは母由来の全ての既知塩基配列に対してホモロジー検索を行い、前記スプライシング異常が発生したDNA断片の塩基配列と相同性が高い既知塩基配列を選定することにより、どのピーク位置にスキップしたかを決定することが可能となる。
【0050】
例えば、スプライシング異常が発生した塩基配列「GTGGAGGACCT」と相同性が高い既知塩基配列が、
AGCAAG・・・ACGGTGGAGGACCTTTT・・・TGTTAA
であった場合、上記配列中のアンダーラインを付した配列「GTGGAGGACCT」の部分にスキップしたことが分かる。この配列「GTGGAGGACCT」と相同性が高い既知塩基配列が前記「遺伝子hMLH1」の6番目のエクソンであった場合、スプライシング異常により「6番目のエクソン」にスキップしたと判定することが可能になる。
【0051】
判定後に、この「何番目のピークでスプライシング異常が生じたかという情報」及び/又は、「何番目のエクソンにスキップしたかという情報」を、図1のデータ表示部14に表示しても良いし、上記SCFフォーマット等の解析結果保存用ファイルにコメントやプライベートデータとして、図1のデータ格納部15に記録しておいても良い。
【0052】
なお上記の例では、全ての既知塩基配列に対してホモロジー検索を行っているが、全ての既知塩基配列ではなく、前記「あるピーク」以降の全エクソンの先頭塩基配列(例えば11ピーク分)のみを、ホモロジー検索の対象としても良い。
【0053】
上記の例では、11ピーク分の塩基配列でホモロジー検索を行っているが、これ以外(11ピーク以外)のピーク数の塩基配列でホモロジー検索を行った場合にも、同等の効果を得ることができる。例えば、5ピーク分の塩基配列でホモロジー検索を行った場合にも、スキップ先を選定することが可能である。
【0054】
前記図6および図7は、TG波形とDB波形の横軸(ピーク間隔)と縦軸(ピーク強度)がほぼ同等であったため、前処理を行わずにそのまま差分波形を得ることができた場合の例について述べたものであるが、図8(A)に示す例のように、TG波形とDB波形間で、電気泳動時の泳動速度及び泳動むらが異なる(ピーク間隔が異なる)場合、両者の対応する各ピークが正確に一直線上に並ぶように、予め各ピーク間隔が両者で同一となるような前処理(横軸(泳動時間軸)を揃える為の内挿処理や間引き処理)を行えば良い。前処理後、図8(B)に示すように波形は泳動速度が両者で一致するように調整されたものとなる。なお、図8の例では、DB波形のピーク間隔を補正してTG波形に合わせているが、反対にTG波形のピーク間隔を補正してDB波形に合わせても良い。この「横軸を揃える前処理」は、図5のステップ54に相当するものであるが、図4のDB波形を作成する際の前処理ステップ41に関しても、同様の手順で行えばよい。すなわち、最初に、全波形における各ピーク間隔の平均を算出し、各波形のピーク間隔を各平均ピーク間隔に合わせる処理を行えば良い。
【0055】
図9(A)に示す例のように、TG波形とDB波形間で、蛍光信号強度が異なる(信号強度軸のスケールが異なる)場合、両者の対応する各ピークの強度基準が一致するように、予め、全ピーク強度の基準が両者で同等となるような前処理(縦軸(信号強度軸)を揃える前処理)を行えば良い。前処理後、図9(B)に示すように、波形は信号強度軸が揃える処理のなされたものとなる。なお、図9の例では、DB波形のピーク強度を補正してTG波形に合わせているが、反対にTG波形のピーク強度を補正してDB波形に合わせても良い。
【0056】
前記の図9に示す「縦軸を揃える前処理」の際には、両者の全ピーク強度の平均値を算出し、その平均値の比を一方の蛍光強度波形全体に乗じることにより、実施することができる。即ち、比較を行う一方の蛍光強度波形セット1(A,C,G,T(U)の4波形分で1セット)の全ピーク位置での信号値の平均値がA、他方の蛍光強度波形セット2の全ピーク位置での信号値の平均値がAであった場合、A/Aを蛍光強度波形セット2の波形全体に乗じるか、A/Aを蛍光強度波形セット1の波形全体に乗じれば良い。また、全ピーク位置での信号値の平均値を用いずに、所定の(注目している)ピークを含む前後の数ピーク(例えば、前後20ピーク)の平均信号値を用いても良い。
【0057】
この「縦軸を揃える前処理」は、図5のステップ55に相当するものであるが、図4のDB波形を作成する際の前処理ステップ42に関しても、同様の手順で行えばよい。すなわち、最初に、全波形における全ピーク強度の平均値を算出し、各波形の全ピーク強度の平均値が全波形での平均値と同等になるようにすれば良い。
【0058】
なお、上記のターゲット波形の仮決定配列例「ATACAGRKSRAGKW」のように、その配列自身に多数のヘテロが含まれている場合、例えば「あるピーク位置を先頭にヘテロが4ピーク以上連続して続いた場合に、スプライシング異常が生じていると判定する」ことにより、前記「あるピーク位置」以降のスプライシング異常を検出するようにすることも可能である。
【0059】
また前記の例では、二つの波形の表示後、スプライシング異常の有無判定やスプライシング異常発生後の塩基配列決定を行う場合について述べたが、波形表示を行わずにスプライシング異常の有無判定やスプライシング異常発生後の塩基配列決定を自動的に行い、その結果を記録(保存)するようにしても良い。
【0060】
また前記の例では、波形比較を行う際の基準波形として「同一の既知塩基配列に同定された複数の既知蛍光強度波形を統計処理して作成した蛍光強度データベース波形」を用いる場合について述べたが、「既知塩基配列に同定された或る一つの既知の蛍光強度波形」を基準波形として用いた場合にも、同様の効果を得ることができる。
【0061】
また、図1には、核酸断片泳動部11及び蛍光信号計測部12を含む装置構成例が示されているが、これらの構成部分は必ずしも必要ではなく、別の蛍光強度波形計測装置等で測定された蛍光強度波形データを読み込む機能を、蛍光信号演算部13に持たせた場合にも、同様の効果を得ることができる。なお、前記データの読み込み方法には、フロッピー(登録商標)ディスクや光ディスク等の記録媒体を用いる情報伝達方法や、通信回線を用いる方法等がある。
【0062】
さらに、図1では、蛍光信号演算部13、データ表示部14、データ格納部15および各部を制御する装置制御部16が独立した機能ブロックとして表現されているが、これらは、いわゆる、所定のプログラムを備えるパーソナルコンピュータにより実現できるものであることは、言うまでもない。
【0063】
【発明の効果】
本発明によれば、核酸断片を測定して得られた蛍光強度波形データを解釈して、A、C、G、T(U)等の塩基配列を決定する際に、スプライシング異常の検出や、スプライシング異常が生じたピーク以降の核酸塩基配列の決定、および「どのエクソンにスキップしたか」を判定することが可能となる。
Figure 0004226912
Figure 0004226912
Figure 0004226912

【図面の簡単な説明】
【図1】本発明が適用される核酸塩基配列決定装置の構成例を示すブロック図。
【図2】蛍光強度波形データの例と、それを解釈して決定される塩基配列の例を示す図。
【図3】未知核酸断片の塩基配列を仮決定するために蛍光強度波形データに対して行う処理を示す図。
【図4】データベース波形及びその付随情報を取得する処理の一例を示す図。
【図5】本発明における塩基配列決定処理フローの例を示す図。
【図6】本発明をスプライシング異常の有るデータに適用した例を示す図。
【図7】本発明により差分波形を作成した例を示す図。
【図8】(A)は横軸補正前のTG波形とDB波形の例、(B)は横軸補正後のTG波形とDB波形の例を示す図。
【図9】(A)は縦軸補正前のTG波形とDB波形の例、(B)は縦軸補正後のTG波形とDB波形の例を示す図。
【符号の説明】
11…核酸断片泳動部、12…蛍光信号計測部、13…蛍光信号演算部、14…データ表示部、15…データ格納部、16…各部を制御する装置制御部、TG…ターゲット、DB…データベース。

Claims (4)

  1. 核酸試料から作製した種々の長さの核酸断片を電気泳動して得られた4種類の塩基の蛍光強度波形データの各ピークの情報を元に前記核酸試料の塩基配列を仮決定するステップと、
    前記仮決定した塩基配列と既知塩基配列に対してホモロジー検索を行い、前記仮決定した塩基配列に相同性が高い既知塩基配列を並置するステップとを含み、
    前記既知塩基配列と前記仮決定した塩基配列とが、所定の数以上連続して一致した後、第1のピーク以降で所定の数以上連続して一致しない領域があった場合に、前記第1のピーク以降で、前記核酸試料に、スプライシングに異常が生じている可能性があると判定する段階と、
    前記核酸試料の蛍光強度波形データと前記既知塩基配列に対応する蛍光強度波形データの差分波形データを作成するステップを含み、前記差分波形データの前記スプライシングに異常が生じていると判定された前記第1のピーク以降の範囲に対して前記差分波形データの各ピーク情報を元に前記核酸試料の塩基配列を決定する段階とを有することを特徴とする核酸塩基配列決定方法。
  2. 前記スプライシング異常が生じていると判定された前記第1のピーク以降の決定された塩基配列と、前記スプライシング異常が生じていると判定された前記第1のピーク以降の既知塩基配列に対してホモロジー検索を行うステップを含み、
    前記決定された第1のピーク以降の塩基配列に相同性が高い既知塩基配列を選定する請求項記載の核酸塩基配列決定方法。
  3. 前記既知塩基配列に対応する蛍光強度波形データとして、当該既知塩基配列に同定された複数の既知蛍光強度波形データを統計処理して作成した蛍光強度データベース波形を用いる請求項または記載の核酸塩基配列決定方法。
  4. 前記差分波形データの作成に先行して、前記二つの波形データの対応する各ピークが一致するように、予め各ピーク間隔を両者で同一とする前処理及び/又は、対応する各ピークの強度基準が一致するように予めピーク強度の基準を両者で同等とする前処理を行う請求項1乃至3のいずれか一つに記載の核酸塩基配列決定方法。
JP2003001950A 2003-01-08 2003-01-08 核酸塩基配列決定方法 Expired - Lifetime JP4226912B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003001950A JP4226912B2 (ja) 2003-01-08 2003-01-08 核酸塩基配列決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003001950A JP4226912B2 (ja) 2003-01-08 2003-01-08 核酸塩基配列決定方法

Publications (2)

Publication Number Publication Date
JP2004208650A JP2004208650A (ja) 2004-07-29
JP4226912B2 true JP4226912B2 (ja) 2009-02-18

Family

ID=32819838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003001950A Expired - Lifetime JP4226912B2 (ja) 2003-01-08 2003-01-08 核酸塩基配列決定方法

Country Status (1)

Country Link
JP (1) JP4226912B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111464A1 (ja) * 2007-03-05 2008-09-18 Eisai R & D Management Co., Ltd. スプライシング異常を指標とする抗ガン剤の作用検定方法
WO2015015585A1 (ja) * 2013-07-31 2015-02-05 株式会社日立製作所 遺伝子変異分析装置、遺伝子変異分析システム及び遺伝子変異分析方法

Also Published As

Publication number Publication date
JP2004208650A (ja) 2004-07-29

Similar Documents

Publication Publication Date Title
Anasagasti et al. Current mutation discovery approaches in Retinitis Pigmentosa
McCaffrey et al. High-throughput single-molecule telomere characterization
JPH07136000A (ja) 欠失を検出するための複数染色体dna増幅法
US7617054B2 (en) Method and apparatus for analysing nucleic acid sequence
CN110033829A (zh) 基于差异snp标记物的同源基因的融合检测方法
CN111073961A (zh) 一种基因稀有突变的高通量检测方法
CN104450869B (zh) 一种双脱氧核苷修饰的引物方法、反应体系及其在突变检测中的应用
JP4103315B2 (ja) 核酸塩基配列決定装置および検査システム
KR101358416B1 (ko) 리가제 반응과 절단효소 증폭반응을 이용한 표적 유전자 또는 이의 돌연변이 검출방법
Zascavage et al. Deep-sequencing technologies and potential applications in forensic DNA testing
JP4209623B2 (ja) 核酸塩基配列決定方法
JP4226912B2 (ja) 核酸塩基配列決定方法
EP1092782B1 (en) Genetic screening method and genetic screening apparatus
EP1798291B1 (en) Methods and compositions for assaying mutations and/or large scale alterations in nucleic acids and their uses in diagnosis of genetic diseases and cancers
JP4317398B2 (ja) 核酸塩基配列情報の記録方法及び核酸塩基配列決定方法
JP3878503B2 (ja) 核酸塩基配列決定方法
CN115948532A (zh) 基于数字pcr技术的sma检测试剂盒
US20030082616A1 (en) Apparatus and method for analyzing nucleic acids and related genetic abnormality
JP3975663B2 (ja) 遺伝子多型解析方法
CN104450918B (zh) 检测fgf13基因第2外显子突变位点的方法及其试剂盒
CN103397089A (zh) 一种用于染色体数目异常快速检测的半特异性扩增引物组、方法及试剂盒
CN113355401A (zh) 一种基于ngs的cnv分析检测脑胶质瘤染色体的方法
US20080193922A1 (en) Methods and Compositions for Inferring Eye Color and Hair Color
CA3147613A1 (en) Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments
US6291167B1 (en) Method for determining the existence of a mutation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051101

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20070301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4226912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term