JP4209623B2 - 核酸塩基配列決定方法 - Google Patents
核酸塩基配列決定方法 Download PDFInfo
- Publication number
- JP4209623B2 JP4209623B2 JP2002076448A JP2002076448A JP4209623B2 JP 4209623 B2 JP4209623 B2 JP 4209623B2 JP 2002076448 A JP2002076448 A JP 2002076448A JP 2002076448 A JP2002076448 A JP 2002076448A JP 4209623 B2 JP4209623 B2 JP 4209623B2
- Authority
- JP
- Japan
- Prior art keywords
- peak
- base
- base sequence
- nucleic acid
- fluorescence intensity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
【発明の属する技術分野】
本発明は、核酸試料を電気泳動して得られる蛍光強度波形データを解釈して、塩基配列決定や塩基変異判定を行う核酸塩基配列決定方法に関するものである。
【0002】
【従来の技術】
約30億塩基からなるヒトの核酸(DNA)には、500塩基〜1000塩基に一カ所位の割合で変異が存在していると推測されており、現在280万個程度の一塩基変異対(SNPs)が報告されている。このようなSNPs等を指標とする遺伝子診断(DNAマーカー)法は、疾患遺伝子の探索や疾患感受性の判断、及び医薬品の開発(テーラーメイド医療)等で、その利用が期待されている。特に最近では、ヒトDNAの解読完了(99%以上)を受け、この膨大な解読済みデータを利用して個人毎の計測データの差異(多型)を解明したいという要望が強まっている。
【0003】
現在、このような多型を低コストかつ容易に検出する方法が多数開発されているが、何れの方法も核酸断片の大きさを比較して間接的に変異を知る方法であるため、最終的な確認として、信頼度が高く変異部位を直接検出できる塩基配列決定を行う場合が多い。従来、この塩基配列を決定するため、核酸断片を蛍光標識する技術、高解像度のゲル電気泳動技術、及び高感度の蛍光検出技術を組み合わせたDNAシーケンシング法が広く用いられてきた。
【0004】
【発明が解決しようとする課題】
従来の核酸塩基配列決定方法では、しばしば塩基配列の決定が困難な蛍光強度波形が得られる場合があった。その原因として、核酸断片の量が少なく信号強度が弱い場合や、核酸断片が自分自身で高次構造をとり余分な信号成分が発生する場合、塩基配列を決定すべき核酸試料の精製度が低いため余分な信号成分となる核酸断片が生成される場合、シーケンス反応時や電気泳動時の条件によって信号に歪みが生じる場合等が考えられる。また、一回の測定で決定可能な塩基長には限界があり、この限界はゲル電気泳動におけるDNA断片の分離限界塩基長によって決定される。すなわち、ゲル電気泳動においては、1塩基長だけ異なるDNA断片どうしのピーク分離が塩基長の増大とともに困難になってくる。これは、塩基長の増大に伴うピーク半値幅(サンプリング後の波形データにおけるピーク半値幅)の増大の度合いが、ピーク間隔(サンプリング後の波形データにおけるピーク間隔)の増大の度合いに比べて大きくなり、隣り合ったピークどうしの分離が困難になることによっている。
【0005】
一般にこれらの問題に対しては、塩基配列を決定すべき核酸試料に対して相補な塩基配列(配列順序(前後)も反転している)を持つ核酸の塩基配列を決定し、互いに相補な2つの塩基配列を照らし合わせることにより配列を確定したり、熟練した作業者が経験を元に目視判別による配列決定を行ったりして、対応する場合が多い。しかし、2つの試料を用意して塩基配列を2回決定する場合も、熟練者による目視判別を行う場合も、多くの時間や費用を要してしまうという新たな問題が生じてしまい、また試料によっては互いに相補な二つの塩基配列自体が得られない場合もある。以上の点は、全くの未知塩基配列を解読しようとする場合にしばしば問題となる。しかし、実際の核酸試料の塩基配列決定では、ある特定部位塩基の変異を調べる場合のように、塩基配列を決定すべき核酸試料の塩基配列の少なくとも一部が既知である場合も多い。また、ヒトDNAの全ての塩基配列を解読することを目標とする「ヒトゲノム計画」がほぼ完了した現在では、既知となったヒト塩基配列情報との違い(個人差=多型)を解明することに関心が集まっているとも言える。
【0006】
このような参照できる既知の塩基配列が存在する場合、既知の塩基配列を何らかの方法により参照して、核酸断片検出データの解釈がなされている。即ち、既知の蛍光強度波形とその塩基配列(A,C,G,Tという塩基種の文字の並び)を用意し、新規に取得した核酸断片の蛍光強度波形と比較検討することにより、塩基配列を決定することができる。この比較参照には、核酸断片の蛍光強度波形と、既知の蛍光強度波形及び塩基配列を目視で比較参照する必要があり労力がかかるのに加え、比較基準が明確で無い場合、判定者によって異なる決定が下されるという問題が生じる。特に、あるピークに未知の塩基変異が生じている場合、その変異の有無を高精度で判定することは非常に困難となる。
【0007】
本発明は、このような従来技術の問題点に鑑み、核酸塩基配列を精度良く決定することができ、塩基変異を高精度で判定することのできる方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
前記目的を達成するため、本発明による核酸試料の塩基配列決定方法は、核酸試料から得た種々の長さの核酸断片を電気泳動して得られた塩基種毎の蛍光強度波形データのピーク情報を元に前記核酸試料の塩基配列を仮決定するステップと、仮決定した塩基配列と既知塩基配列に対してホモロジー検索を行い、仮決定した塩基配列に相同性が高い既知塩基配列を並置するステップと、並置した核酸試料の蛍光強度波形データの信号強度と既知塩基配列の対応する蛍光強度波形データの信号強度とを、横軸を揃えて比較するステップとを含むことを特徴とする。
【0009】
2つの波形データを比較した際、核酸試料の第1の塩基の蛍光強度波形データの所定のピークの信号強度が、既知塩基配列の前記第1の塩基の蛍光強度波形データの前記所定のピークに対応するピークの信号強度に対して所定の割合以下である場合に、当該ピーク位置に塩基変異が生じている可能性があると判定する。
【0010】
更に、核酸試料の前記第1の塩基の前記所定のピーク(第1のピーク)の前又は後に位置する、第2の塩基の蛍光強度波形データのピーク(第2のピーク)の信号強度が、既知塩基配列の前記第2の塩基の蛍光強度波形データの前記第2のピークに対応する信号強度に対して所定の割合以上である場合に、前記第1のピークと第2のピークは前記第1の塩基と第2の塩基との混合塩基を表している可能性があると判定する。
【0011】
本発明による核酸試料の塩基配列決定方法は、また、核酸試料から得た種々の長さの核酸断片を電気泳動して得られた4種類の塩基の蛍光強度波形データのピーク情報を元に前記核酸試料の塩基配列を仮決定するステップと、仮決定した塩基配列と既知塩基配列に対してホモロジー検索を行い、仮決定した塩基配列に相同性が高い既知塩基配列を並置するステップと、並置した核酸試料の蛍光強度波形データの信号強度と既知塩基配列の対応する蛍光強度波形データの信号強度とを、横軸を揃えて比較するステップとを含み、核酸試料の第1の塩基の蛍光強度波形データの所定のピーク(第1のピーク)の信号強度が、既知塩基配列の前記第1の塩基の蛍光強度波形データの前記第1のピークに対応する信号強度に対して所定の割合以上である場合に、当該ピークを変異に伴って新たに生じた塩基のピークと判定し、核酸試料の第2の塩基の蛍光強度波形データの前記第1のピークの前又は後に位置するピーク(第2のピーク)のうち、ピークの信号強度が、既知塩基配列の前記第2の塩基の蛍光強度波形データの前記第2のピークに対応するピークの信号強度に対して所定の割合以下のものを変異が生じたピークと判定することを特徴とする。
【0012】
既知塩基配列の蛍光強度波形データとしては、当該既知塩基配列に同定された複数の既知蛍光強度波形データを統計処理して作成した蛍光強度データベース波形を用いることができる。
【0013】
核酸試料の蛍光強度波形データと既知塩基配列の対応する蛍光強度波形データを、横軸を共通軸として縦方向に2つ並べて表示すると、目視での確認が容易になる。
また、核酸試料の蛍光強度波形データと既知塩基配列の対応する蛍光強度波形データとの比較に先立ち、2つの波形データ間で、各ピーク間隔を両者で同一とする前処理及び/又は全ピーク強度の基準を両者で同等とする前処理を行ってもよい。
【0014】
本発明によると、核酸塩基配列を精度良く決定することができる。そして、その結果を用いて一塩基変異対(SNPs)等を指標とする遺伝子診断(DNAマーカー)を行うことにより、変異を容易に判定(検出)することが可能となり、疾患遺伝子の探索や疾患感受性の判断、及び医薬品の開発(テーラーメイド医療)等を、高精度かつ迅速に行えるようになる。
【0015】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
図1に、本発明が適用される核酸塩基配列決定装置の構成例を示す。この装置は、核酸断片泳動部11、蛍光信号計測部12、蛍光信号演算部13、データ表示部14、データ格納部15、各部を制御する装置制御部16を備える。核酸断片泳動部11は、蛍光標識した核酸断片群を電気泳動し塩基長の違いにより分離する。蛍光信号計測部12は、分離した核酸断片にレーザーを照射する光学機器及び発生する蛍光を検出する検出器等からなる。蛍光信号演算部13は、計測した蛍光強度波形データを信号処理し塩基配列の決定等を行う。データ表示部14は、蛍光強度波形データ及び決定した塩基配列に関連する情報の表示を行う。データ格納部15は、蛍光強度波形データ及び決定した塩基配列等の記録を行う。装置制御部16は、核酸断片泳動部11の電源の制御、蛍光信号計測部12の光源制御と検出器のサンプリング条件の制御、蛍光信号演算部13とデータ表示部14及びデータ格納部15間のデータ転送の制御、蛍光信号演算部13におけるデータ処理内容の制御等を行う。
【0016】
データ格納部15において蛍光強度波形データや決定した塩基配列及びピーク位置等を記録する際の形式(フォーマット)としては既に様々なものが提案されているが、一例としてSCFフォーマットと呼ばれる形式について、簡単に説明する。SCFフォーマット(version 3.00)では、以下の項目に対応する値が、ファイルに順次、記録されている。
【0017】
項目 内容
magic_number = フォーマット識別数(文字列".SCF"を数値化したもの)
samples = 波形点数
samples_offset = 波形強度が記録されている最初の番地(バイトオフセット)
bases = 塩基数
bases_left_clip = 不使用(No. bases in left clip)
bases_right_clip= 不使用(No. bases in right clip)
bases_offset = 塩基配列が記録されている最初の番地(バイトオフセット)
comments_size = コメントの大きさ
comments_offset = コメントが記録されている最初の番地(バイトオフセット)
version = バージョン
sample_size = 波形強度値のビットサイズ(1=8ビット、2=16ビット)
code_set = 使用されているコードセット
private_size = プライベートデータの大きさ
private_offset = プライベート値が記録されている最初の番地(バイトオフセット)
spare = 予備
Samples for A trace = アデニン(A)塩基の波形データ
Samples for C trace = シトシン(C)塩基の波形データ
Samples for G trace = グアニン(G)塩基の波形データ
Samples for T trace = チミン(T)塩基の波形データ
Offset into peak index for each base = 各塩基のピーク位置
Accuracy estimate bases being 'A' = A塩基の同定信頼性
Accuracy estimate bases being 'C' = C塩基の同定信頼性
Accuracy estimate bases being 'G' = G塩基の同定信頼性
Accuracy estimate bases being 'T' = T塩基の同定信頼性
The called bases = 同定された塩基種(決定塩基配列)
Reserved for future use = 予備
Comments = コメント
Private data = プライベートデータ
【0018】
本実施の形態においては、電気泳動で得られた各塩基の蛍光強度波形データ、決定した塩基配列、ピーク位置等を上記SCFフォーマットにてデータ格納部15に記録したが、勿論他のフォーマットによって記録しても構わない。
【0019】
図1に示した塩基配列決定装置を用いて塩基配列を決定(仮決定)するためには、核酸断片泳動部11において、サンガー法等を用いて塩基配列を決定すべき核酸試料を元に様々な長さの核酸断片群を調製する。反応には、蛍光色素により標識したプライマー、または蛍光色素により標識したddNTPを用い、核酸断片群に蛍光色素を標識する。
【0020】
まず初めに、塩基配列を知りたいDNA(テンプレートDNA)を用意する。通常、未知の配列を持ったDNAをプラスミド(細菌等の細胞内にある核以外の細胞質中の DNAで、主に複製開始情報のみを有する)に組み込んだものか、ポリメラーゼ連鎖増幅反応(PCR)法で塩基配列を直接増幅した核酸断片を用いる。次に、テンプレートDNAとプライマー(テンプレートDNAの特定部分の配列と相補的な塩基配列を有するもので、PCR法を用いた場合は反応で利用した片側のものに相当する)を試験管内の溶液中で混合し、温度をコントロールすることでプライマーとテンプレートが相補的な二本鎖を形成するようにする(アニーリング)。更に、このプライマーを起点としてDNAを複製する過程に進み、複製はDNAポリメラーゼと呼ばれる酵素を触媒として行われる。そして、この反応液中にはDNAの合成に必要なdNTP(各種塩基:アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)(もしくはウラシル(U))のモノマー)と、4種類のddNTP(A,C,G,T(U)のターミネーター)を所定の割合で混合し所定の濃度で入れておく。すると、DNAが合成されていく時、ddNTPが取り込まれるとDNAの合成がそれ以上進まなくなる(伸長反応)。ここで、ddNTPにそれぞれの塩基に応じて色の異なる蛍光色素を標識しておく。その結果、末端にddNTPを持つ様々な長さ(塩基長)で合成が止まった核酸断片が生成され、各断片はその末端塩基に応じた蛍光色で標識されることになる。
【0021】
次に、標識された核酸断片群に対して電気泳動を行い、蛍光信号計測部12において、蛍光信号を検出して蛍光強度波形データを作成する。具体的には、上記のようにしてできた核酸断片を含む溶液を濃縮精製した後、一本鎖に変性して、ゲル電気泳動装置を用いて塩基長毎に核酸断片を分離する。以下では、ゲル電気泳動装置の一例として、キャピラリ泳動装置を用いた場合について説明する。まず、粘性のある高分子ポリマーをキャピラリ(ガラス細管)に充填しておき、その両端に電圧を印加することにより、負の電荷を有する核酸断片をキャピラリの片側から導入・泳動させる。この時、核酸断片は鎖状の重合体高分子であるため、ポリマー中を分子量に反比例した速度で移動し、短い(分子量が小さい)核酸断片ほど速く、長い(分子量が大きい)核酸断片ほどゆっくり移動するため、塩基長毎に核酸断片を分離することができる。そしてキャピラリの終端付近(各核酸断片を1塩基の長さの差異で分離可能となった位置)で核酸断片にレーザー光を照射し、各断片末端塩基から発生する蛍光を検出器により測定する。前記の通り、短い核酸断片から順番に蛍光を発生していくので、4塩基種毎の蛍光強度曲線が得られ、各ピーク位置での4種類の蛍光強度等を比較することにより、塩基種(A,C,G,T(U))の配列決定が可能となる。
【0022】
図2は、蛍光強度波形データの例21と、それを解釈して決定される塩基配列の例22を示す図である。実際には、1度の計測で数百塩基分のデータが得られるが、ここでは説明のためにその一部を示している。縦軸は蛍光強度を表し、横軸は泳動時間を表している。蛍光強度波形データ21に現れるピークの高さは、ある長さの核酸断片の量を反映したものである。通常、長い核酸断片ほど泳動時間が遅いところにピークが現れ、ピーク間隔は核酸断片が長くなるにつれて大きくなる傾向がある。そこで、表示の時間軸が塩基長に比例するように、泳動電圧等の泳動条件で決まるパラメータを用いて補正するのも有効である。
図3は、未知核酸断片の塩基配列を仮決定するために蛍光強度波形データに対して通常行う処理を示す図である。この処理は、蛍光信号演算部13によって行われる。
【0023】
蛍光信号演算部13は、未知核酸断片の蛍光強度波形データに対して、スムージング処理(S31)及びバックグラウンド補正(S32)を行う。その後、ピークの検出(S33)及びピーク間隔の決定(S34)を行う。また、電気泳動時の泳動むら(スマイリング)によりピーク間隔は常に一定になるとは限らないため、得られたピーク間隔の大きさから必要に応じてピーク位置の補正(スマイリング補正)を行う(S35)。次に、各ピーク位置での各塩基種の信号強度(あるいは各ピークの面積等)を比較して、所定の同定基準に従い塩基種を順次決定する(塩基配列の仮決定)(S36)。
【0024】
この同定基準の例としては、あるピーク位置においてある塩基種(例えばA)の信号強度が一番大きく、残る3つの塩基種の中で最も大きな塩基種(例えばC)の信号強度が最大塩基種(ここではA)の信号値のT%未満であった場合(Tは閾値、例えば50%)、最大塩基種(ここではA)として同定する。また、二番目の塩基種(ここではC)がT%(例えば50%)以上であり、かつ三番目の塩基種(例えばG)の強度が最大塩基種(ここではA)の信号値のT%(例えば50%)未満であった場合、最大塩基種(ここではA)と二番目の塩基種(ここではC)のヘテロ(混合塩基=同一ピーク位置に複数の塩基が含まれていると同定された部位)として決定される(ここではM(=A+C))。同様にして全ての組み合わせに応じて混合塩基の表示方法(IUB規格の混合塩基表示法)が決められているが、その判定基準としては明確な値は示されていない。
【0025】
一方、データ格納部15には、塩基配列が既知であるデータベース波形と、その各ピーク位置の情報及び塩基配列情報が格納されている。図4は、データベース波形及びその付随情報を取得する処理の一例を示す図である。データベース波形及びその付随情報は、蛍光信号演算部13で取得してデータ格納部15に格納してもよいし、他の装置によって取得されたものをデータ格納部15に格納して利用してもよい。
【0026】
図4において、既知の塩基配列を電気泳動して得られる各塩基種(A,C,G,T(U))の蛍光強度波形の集合である既知塩基波形データ群に対し、塩基種毎に全波形の横軸を揃える処理(S41)及び全波形の縦軸を揃える処理(S42)を行い、全波形を平均して平均波形を作成する(S43)。こうして作成された塩基種毎の波形をデータベース波形として保存する(S44)。また、塩基種毎にピーク位置を検出してピーク位置情報として保存する(S45)と共に、塩基配列の情報を既知塩基配列情報として保存する(S46)。
【0027】
蛍光信号演算部13は、データ格納部15にデータベースとして格納されている既知塩基配列と、未知の核酸試料に対して図3の処理を経て仮決定した塩基配列とを比較し、未知核酸断片の塩基配列決定と変異判定を行う。
【0028】
すなわち、図5に示すように、仮決定した塩基配列とデータベース中の既知塩基配列に対してホモロジー検索を実施し、仮決定した塩基配列の各々の部位について既知の塩基配列との関連付けを行い、相同性が高い既知の塩基配列を並置する(S51)。その後、塩基配列が既知である蛍光強度波形データと電気泳動して新規に得られた塩基配列を決定すべき蛍光強度波形データの横軸を揃え(S52)、次に縦軸を揃え(S53)、両波形データの信号強度比較を行い(S54)、所定の比較基準に基づいて塩基配列の決定と塩基変異の有無の判定を行う(S55)。下記では、これらの処理についての説明を行う。
【0029】
実際の核酸試料の塩基配列決定では、ある特定部位の塩基変異を調べる場合のように、塩基配列を決定すべき核酸試料の塩基配列の少なくとも一部が既知である場合が多い。このような参照できる既知の塩基配列が存在する場合、前記のようにして仮決定した塩基配列と既知の塩基配列に対してホモロジー検索を実施し、仮決定した塩基配列の各々の部位について既知の塩基配列との関連付けを行い、相同性が高い既知の塩基配列を並置して参照することにより、塩基配列の決定精度を高めることが可能となる。ホモロジー検索による並置に際しては、「スミス・ウォーターマンの方法(ジャーナル オブ モレキュラー バイオロジー、第147巻、195頁〜197頁)」や、後述する「ピーク間隔を判定基準とする方法」等を用いる。
【0030】
以下、一つの例として、図6に示した塩基変異を含む新規に計測した蛍光強度波形(一部)の塩基配列を決定する場合について述べる。この図6は、塩基変異が生じていない既知の塩基配列「CAAGGAC」(=データベース(DB)配列)において、ある一箇所の塩基が変異を起こしヘテロが生じている場合の例である(5番目の塩基Gが変異を起こしてAとGのヘテロ(R)になっている)。このように、ヘテロ変異が生じている場合、何らかの要因(例えば、核酸断片が自分自身で高次構造を持つため等)によって、変異により生じたピークが本来のピーク位置からずれてしまう場合(ピークシフト)がある。このような波形に対してピーク検出を行うと、通常、このヘテロ塩基部分が2つの独立したピーク(塩基)として判定される。またピーク判定を行う際、ピーク間隔を基準として優先せず、信号強度の変化(微分値の変化)を優先した場合には、このようなピークシフトが生じていない場合にも、同一の位置に2つの独立したピークが存在すると判定される。
【0031】
図6に示した例の場合には、「CAAGRAC」として判定されるべき配列が、5番目の塩基Gと6番目の塩基Aが異なるピーク位置の塩基種として認識され、配列は「CAAGGAAC」として仮決定されている。
この仮決定された配列「CAAGGAAC」と既知の塩基配列「CAAGGAC」(=DB配列)とを、「ピーク間隔を判定基準とした方法」により並置させると、下記のようになる。以下、手順を追って説明する。
【0032】
まず、この仮決定された配列「CAAGGAAC」と既知の配列「CAAGGAC」を前記の「文字配列の情報のみで比較を行うスミス・ウォーターマンのホモロジー検索法」で並置させた場合、下記の配列が同スコアの最適候補として挙げられる。
( 仮配列 =CAAGGAAC )
候補配列1=CAAGG:AC
候補配列2=CAAGGA:C
【0033】
なお前記の候補配列は、「n文字の挿入・欠失に対して、−4n点」とするスコア方法を用いた場合の結果であり、また前記配列文字中の「:」は、ギャップ(欠損)を表す記号である。
【0034】
次に、「ピーク間隔を判定基準とした方法」を用いて、最適な候補を一つに絞り込む。まず初めに、仮決定された配列のピーク間隔を以下のように算出しておく。
ここで、上記数列の最初の値「9」は、1番目の塩基「C」と2番目の塩基「A」のピーク間隔を示す点数で、2番目の値「8」は、2番目の塩基「A」と3番目の塩基「A」のピーク間隔を示す点数、以下同様にして、各値が各ピークの間隔を示している。
【0035】
以下に、前記2つの候補配列に対して各同定塩基のピーク間隔を算出したものを示す。
【0036】
更に、前記各候補配列のギャップ「:」を含む部分のピーク間隔の値を下に示す。
候補配列1=9.0
候補配列2=14.0
ここで、前記ギャップを含む部分のピーク間隔の値が最も小さい候補配列を選択すると、候補配列1「CAAGG:AC」が選ばれ、これが最適な候補配列となる。
【0037】
次に本発明では、前記の並置結果に基づいて、前記の既知塩基配列に同定された或る一つの「既知の蛍光強度波形」と前記の「新規に計測した蛍光強度波形」とを、図7のように、両者の対応する各ピークが上下に並ぶように配置して、下記の手順で比較を行う。
【0038】
まず、前記「新規に計測した蛍光強度波形」において同定された塩基種の各ピークの信号強度と、前記「既知の蛍光強度波形」において同定された塩基種の各ピークの信号強度とを比較して、「新規に計測した蛍光強度波形」における各ピークの変化率を算出する。図7の例では、「新規に計測した蛍光強度波形」における1番目の「C」のピーク強度(ピーク位置での信号強度)が900で、「既知の蛍光強度波形」における1番目の「C」のピーク強度(ピーク位置での信号強度)が950なので、その比は900 / 950 = 0.947となり、変化率は−5.3 %と算出される。同様にして、2番目の「A」のピークの変化率は0 %、3番目の「A」のピークは+14.3 %、4番目の「G」は0 %、5番目の「G」は−55.6 %、7番目の「A」は−11.2 %、8番目の「C」は0 %と算出される。なお、6番目の「A」のピークの変化率は、「既知の蛍光強度波形」に対応するピークが存在しないため、「既知の蛍光強度波形」中の塩基種「A」の波形における同じ位置での信号値10との比をとり、変化率は+3900 %となる。
【0039】
次に、前記算出した変化率が所定の値以下、例えば−50.0 %以下のピークを抽出すると、図7の場合には、5番目の「G」のピークがこの条件を満たすこととなり、変異の可能性が有ると判定できる。これは、ホモの場合は「父由来の塩基種と母由来の塩基種が同じ」であるのに対し、ヘテロの場合には「父由来の塩基種と母由来の塩基種が異なる」ため、「ホモの状態における信号強度」と「ヘテロの状態におけるホモと同種の塩基種の信号強度」の比が、ほぼ2対1となるからである。更に、この変異の可能性が有ると判定された5番目の「G」のピークの前後に位置する4番目の「G」のピークと6番目の「A」のピークの変化率に注目すると、0 %と+3900 %になっており、6番目の「A」のピークが、5番目の「G」のピークの変異に伴って新たに生じた塩基であると判定することができる。具体的には、前記の変化率が所定の値以上、例えば+100 %以上のピークを、変異に伴って新たに生じた塩基と判定することができる。
【0040】
なお前記の手順とは逆に、前記算出した変化率が所定の値以上、例えば+100 %以上のピークを変異に伴って新たに生じた塩基と判定し、その前後に位置するピークのうち、変化率が所定の値以下、例えば−50.0 %以下のものを変異が生じたピークと判定しても良い。即ち図7の場合には、まず、6番目の「A」のピーク(変化率+3900 %)が変異に伴って新たに生じた塩基と判定でき、その前後に位置する5番目の「G」のピークと7番目の「A」のピークのうち、5番目の「G」のピーク(変化率−55.6 %)が変異を生じていると判定することができる。
【0041】
前記の例では、あるピークが変異を起こしている可能性の有無を判定する際に、「変化率−50.0 %以下」という基準を用いる場合について述べたが、これ以外の基準を用いた場合にも、同等の効果を得ることができる(例:−10.0 %以下〜−100 %以下)。なお、がん等の疾患により少量の細胞に変化が生じる場合等(体細胞変異や生殖細胞変異等)では、変異が生じている細胞の占める割合に応じて、この基準の設定を行う。
【0042】
また前記の例では、あるピークが変異に伴って新たに生じた塩基かどうかを判定する際に、「変化率+100 %以上」という基準を用いる場合について述べたが、これ以外の基準を用いた場合にも、同等の効果を得ることができる(例:+10.0 %以上〜+200 %以上)。なお、がん等の疾患により少量の細胞に変化が生じる場合等(体細胞変異や生殖細胞変異等)では、変異が生じている細胞の占める割合に応じて、この基準の設定を行う。
【0043】
また前記の例では、2つの波形を比較する際、特に前処理を行わずにそのまま比較する場合について述べたが、図8(a)に示す例のように、計測毎に電気泳動時の泳動速度及び泳動むらが異なる(ピーク間隔が異なる)場合、図5のステップ52に示したように、両者の対応する各ピークが正確に一直線上に並ぶように(上下で比較しやすいように)、予め各ピーク間隔が両者で同一となるような前処理(横軸(泳動時間軸)を揃える為の内挿処理や間引き処理)を行っておいても良い。前処理後、図8(a)の波形は図8(b)に示すようになる。なお、図8の例では、「新規に計測した蛍光強度波形」のピーク間隔を補正して「既知の蛍光強度波形」に合わせているが、反対に「既知の蛍光強度波形」のピーク間隔を補正して「新規に計測した蛍光強度波形」に合わせても良い。
【0044】
また、図9(a)に示す例のように、計測毎に電気泳動時の検出感度及び蛍光強度自体が異なる(信号強度軸のスケールが異なる)場合、図5のステップ53に示したように、両者の対応する各ピークの強度基準が一致するように(上下で比較しやすいように)、予め、全ピーク強度の基準が両者で同等となるような前処理(縦軸(信号強度軸)を揃える前処理)を行っておいても良い。前処理後、図9(a)の波形は図9(b)に示すようになる。なお、図6の例では、「新規に計測した蛍光強度波形」のピーク強度を補正して「既知の蛍光強度波形」に合わせているが、反対に「既知の蛍光強度波形」のピーク強度を補正して「新規に計測した蛍光強度波形」に合わせても良い。
【0045】
前記の「縦軸を揃える前処理」の際には、両者の全ピーク強度の平均値を算出し、その平均値の比を一方の蛍光強度波形全体に乗じることにより、実施することができる。即ち、比較を行う一方の蛍光強度波形セット1(A、C、G、Tの4波形分で1セット)の全ピーク位置での信号値の平均値がA1、他方の蛍光強度波形セット2の全ピーク位置での信号値の平均値がA2であった場合、A1/A2を蛍光強度波形セット2の波形全体に乗じるか、A2/A1を蛍光強度波形セット1の波形全体に乗じれば良い。また、全ピーク位置での信号値の平均値を用いずに、所定の(注目している)ピークを含む前後の数ピーク(例えば、前後20ピーク)の平均信号値を用いても良い。
【0046】
また前記の例では、二つの波形の表示後、ピーク強度を比較して変異の有無を判定する場合について述べたが、波形表示を行わずにピーク強度比較による変異の有無判定を自動的に行い、その判定結果を記録(保存)するようにしても良い。
【0047】
また前記の例では、波形比較を行う際の基準波形として「既知塩基配列に同定された或る一つの既知の蛍光強度波形」を用いる場合について述べたが、同一の既知塩基配列に同定された複数の既知蛍光強度波形を統計処理して作成した蛍光強度データベース波形を基準波形として用いた場合にも、同等の効果を得ることができる。なお、蛍光強度データベース波形を作成する際には、上述した「横軸を揃える前処理(図4のステップ41)」及び「縦軸を揃える前処理(図4のステップ42)」を施した後、塩基種毎に波形の加算を行い、波形数で除算(平均をとる)すれば良い(図4のステップ43)。
【0048】
具体的には、例えば上述した「横軸を揃える前処理」及び「縦軸を揃える前処理」を施した「変異を含まない同一の塩基配列に同定された」n個の蛍光強度波形データセット(4塩基種分の蛍光強度波形データを1セットとする) を用意し、i番目(1≦i≦n)のデータセットのA塩基の波形データをAi(t)とした場合(tは「横軸を揃える前処理」後の泳動時刻に相当する横軸変数)、Aのデータベース波形Ab(t)は、下記(式1)で算出する。
【0049】
【数1】
同様にして残るC, G, Tに対しても、それぞれのデータベース波形Cb(t),Gb(t),Tb(t)は、下記(式2)〜(式4)で算出される。
【0050】
【数2】
上記の手順で作成したデータベース波形と各ピーク位置の情報、及び前記既知塩基配列情報は、図4のステップ44,45,46において前記SCFフォーマット等で保存する。
【0051】
また、図1には、核酸断片泳動部11及び蛍光信号計測部12を含む装置構成例が示されているが、これらの構成部分は必ずしも必要ではなく、別の蛍光強度波形計測装置等で測定された蛍光強度波形データを読み込む機能を、蛍光信号演算部13に持たせた場合にも、同様の効果を得ることができる。なお、前記データの読み込み方法には、フロッピーディスクや光ディスク等の記録媒体を用いる情報伝達方法や、通信回線を用いる方法等がある。
【0052】
【発明の効果】
本発明によれば、核酸断片を測定して得られた蛍光強度波形データを解釈して、A、C、G、T(U)等の塩基配列を決定する際に、既知塩基配列に同定された蛍光強度波形のピーク強度を参照することが可能となり、その結果として塩基配列の決定精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明が適用される核酸塩基配列決定装置の構成例を示す図。
【図2】蛍光強度波形データの例と、それを解釈して決定される塩基配列の例を示す図。
【図3】未知核酸断片の塩基配列を仮決定するために蛍光強度波形データに対して行う処理を示す図。
【図4】データベース波形及びその付随情報を取得する処理の一例を示す図。
【図5】本発明における塩基配列決定処理フローの例を示す図。
【図6】ホモロジー検索とピーク間隔を用いた並置方法の説明図。
【図7】本発明による塩基配列決定(塩基変異有無の判定)の一例を説明する図。
【図8】横軸補正の例を示す図。
【図9】縦軸補正の例を示す図。
【符号の説明】
13…蛍光信号演算部、15…データ格納部、21…蛍光強度波形、22…塩基配列
Claims (1)
- 核酸試料から得た種々の長さの核酸断片を電気泳動して得られた4種類の塩基の蛍光強度波形データのピーク情報を元に前記核酸試料の塩基配列を仮決定するステップと、
前記仮決定した塩基配列と既知塩基配列に対してホモロジー検索を行い、前記仮決定した塩基配列に相同性が高い既知塩基配列を並置するステップと、
前記並置した核酸試料の蛍光強度波形データの信号強度と既知塩基配列の対応する蛍光強度波形データの信号強度とを、横軸を揃えて比較するステップとを含み、
前記核酸試料の第1の塩基の蛍光強度波形データの所定のピーク(第1のピーク)の信号強度が、既知塩基配列の前記第1の塩基の蛍光強度波形データの前記第1のピークに対応する信号強度に対して所定の割合以上である場合に、当該ピークを変異に伴って新たに生じた塩基のピークと判定し、前記核酸試料の第2の塩基の蛍光強度波形データの前記第1のピークの前又は後に位置するピーク(第2のピーク)のうち、ピークの信号強度が、既知塩基配列の前記第2の塩基の蛍光強度波形データの前記第2のピークに対応するピークの信号強度に対して所定の割合以下のものを変異が生じたピークと判定することを特徴とする核酸試料の塩基配列決定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002076448A JP4209623B2 (ja) | 2002-03-19 | 2002-03-19 | 核酸塩基配列決定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002076448A JP4209623B2 (ja) | 2002-03-19 | 2002-03-19 | 核酸塩基配列決定方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003270206A JP2003270206A (ja) | 2003-09-25 |
JP2003270206A5 JP2003270206A5 (ja) | 2005-08-11 |
JP4209623B2 true JP4209623B2 (ja) | 2009-01-14 |
Family
ID=29205218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002076448A Expired - Lifetime JP4209623B2 (ja) | 2002-03-19 | 2002-03-19 | 核酸塩基配列決定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4209623B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7805081B2 (en) * | 2005-08-11 | 2010-09-28 | Pacific Biosciences Of California, Inc. | Methods and systems for monitoring multiple optical signals from a single source |
JP5863396B2 (ja) * | 2011-11-04 | 2016-02-16 | 株式会社日立製作所 | Dna配列解読システム、dna配列解読方法及びプログラム |
JP6087128B2 (ja) * | 2012-12-17 | 2017-03-01 | 株式会社日立ハイテクノロジーズ | 遺伝子型解析装置及び遺伝子型解析方法 |
JP5789720B2 (ja) * | 2013-07-31 | 2015-10-07 | 株式会社日立製作所 | 遺伝子変異分析装置、遺伝子変異分析システム及び遺伝子変異分析方法 |
CN113005188A (zh) * | 2020-12-29 | 2021-06-22 | 阅尔基因技术(苏州)有限公司 | 用一代测序评估样本dna中碱基损伤、错配和变异的方法 |
-
2002
- 2002-03-19 JP JP2002076448A patent/JP4209623B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003270206A (ja) | 2003-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Logsdon et al. | Long-read human genome sequencing and its applications | |
Anasagasti et al. | Current mutation discovery approaches in Retinitis Pigmentosa | |
US9394567B2 (en) | Detection and quantification of sample contamination in immune repertoire analysis | |
Bocklandt et al. | Bionano genome mapping: high-throughput, ultra-long molecule genome analysis system for precision genome assembly and haploid-resolved structural variation discovery | |
US7617054B2 (en) | Method and apparatus for analysing nucleic acid sequence | |
WO2019001168A1 (zh) | 测序数据结果分析方法和装置、测序文库构建和测序方法 | |
US20160002717A1 (en) | Determining mutation burden in circulating cell-free nucleic acid and associated risk of disease | |
JP4103315B2 (ja) | 核酸塩基配列決定装置および検査システム | |
CN111073964B (zh) | 用于检测人类白细胞抗原hla-abcdrdq基因分型的试剂盒 | |
JP4209623B2 (ja) | 核酸塩基配列決定方法 | |
KR101358416B1 (ko) | 리가제 반응과 절단효소 증폭반응을 이용한 표적 유전자 또는 이의 돌연변이 검출방법 | |
JP4317398B2 (ja) | 核酸塩基配列情報の記録方法及び核酸塩基配列決定方法 | |
JP3878503B2 (ja) | 核酸塩基配列決定方法 | |
CN112102944A (zh) | 一种基于ngs的脑肿瘤分子诊断的分析方法 | |
JP4226912B2 (ja) | 核酸塩基配列決定方法 | |
CN105200051A (zh) | 一种皱纹盘鲍中国和日本群体鉴别用snp标记 | |
CN103397089A (zh) | 一种用于染色体数目异常快速检测的半特异性扩增引物组、方法及试剂盒 | |
JP3975663B2 (ja) | 遺伝子多型解析方法 | |
CN108304693B (zh) | 利用高通量测序数据分析基因融合的方法 | |
EP3795685A1 (en) | Methods for dna library generation to facilitate the detection and reporting of low frequency variants | |
US6291167B1 (en) | Method for determining the existence of a mutation | |
CN111793676A (zh) | 一种基因多态性检测的方法、试剂盒及其应用 | |
JP2021534803A (ja) | 無細胞核酸試料におけるアレル不均衡を検出するための方法およびシステム | |
CN117701722B (zh) | 一种牛高原适应育种10k液相芯片及应用 | |
Adam et al. | Nanopore guided assembly of segmental duplications near telomeres |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060927 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061211 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070319 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081023 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4209623 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |