JP7430153B2 - 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム - Google Patents

電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム Download PDF

Info

Publication number
JP7430153B2
JP7430153B2 JP2021050981A JP2021050981A JP7430153B2 JP 7430153 B2 JP7430153 B2 JP 7430153B2 JP 2021050981 A JP2021050981 A JP 2021050981A JP 2021050981 A JP2021050981 A JP 2021050981A JP 7430153 B2 JP7430153 B2 JP 7430153B2
Authority
JP
Japan
Prior art keywords
data
peak
cutoff frequency
electrophoresis
specific wavelength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021050981A
Other languages
English (en)
Other versions
JP2022149047A5 (ja
JP2022149047A (ja
Inventor
猛 石田
惟夫 香村
佑介 後藤
崇秀 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2021050981A priority Critical patent/JP7430153B2/ja
Priority to US17/669,258 priority patent/US20220308013A1/en
Publication of JP2022149047A publication Critical patent/JP2022149047A/ja
Publication of JP2022149047A5 publication Critical patent/JP2022149047A5/ja
Application granted granted Critical
Publication of JP7430153B2 publication Critical patent/JP7430153B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • G01N27/44717Arrangements for investigating the separated zones, e.g. localising zones
    • G01N27/44721Arrangements for investigating the separated zones, e.g. localising zones by optical means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Description

本発明は、電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法、電気泳動に係るデータにおけるピークが、試料由来ピークであるか、またはスパイクであるかを判定する方法、装置、およびプログラムに関する。
ゲノム解析技術の発展により、ヒトの様々な疾患と遺伝子変異の関連性が解明されてきている。がん等の疾患に由来する後天的な遺伝子変異には、ゲノム上での変異発生位置が予測できない、個体内や組織内における変異存在比率が予測できないという特徴がある。例えば、がん患者から切除したがん組織試料にはがん細胞と正常細胞が含まれ、さらにがん細胞間においても遺伝子変異に多様性があるため、ある特定遺伝子のある特定位置に遺伝子変異を有する細胞の試料中存在比率は、非常に低い場合がある。従って、疾患に由来する後天的な遺伝子変異を検出するためには高感度な検出方法が必要である。また、治療方法や治療薬の選択においては、標的遺伝子のある特定位置の遺伝子変異の有無だけではなく、その存在比率を指標とする場合もある。このため、遺伝子変異の高感度な検出に加えて、その存在比率の定量化も重要となる。
サンガ法を用いた従来のDNAシーケンサは塩基配列の決定を目的としていたため、微量に存在する遺伝子変異の検出力、すなわち感度が不十分であること、またその存在比率を定量できる範囲、すなわちダイナミックレンジが狭いことが課題であった。高感度化、高ダイナミックレンジ化に向けて様々な光学系が提案されているほか、データ処理の面からの検討も行われている。特に、データ処理による高感度化、高ダイナミックレンジ化は光学系の変更を伴わないため、比較的低コストに導入できる。
例えば、特許文献1には、測定及び算出した核酸試料の相対信号強度と予め格納された既知核酸試料の相対信号強度とを比較することにより遺伝子変異を高感度に検出し、高精度に定量化する方法が提示されている。
また、特許文献2には、測定データを時間周波数解析して複数の周波数成分の時間変化を表す波形データを取得し、それを解析することにより高精度にノイズ成分の大きさを推定する方法が示されている。
国際公開第2015/015585号パンフレット 国際公開第2016/132422号パンフレット
しかしながら、データ処理による従来の技術では、事前のデータベース構築が必要であるという課題があった。
特許文献1の方法は、効果的で優れた方法である一方、このような既知情報との比較を行うには、予め既知情報データベースを構築する必要がある。遺伝子変異に多様性があるため、比較的規模の大きいデータベースが必要となるほか、新たな標的遺伝子に対応するためには定期的なデータ拡充が必要である。
なお、特許文献2の方法は、ノイズレベルを把握するにあたって、優れた手法であり、ノイズ成分の除去に応用できれば、高感度化や高ダイナミックレンジ化に繋がるが、ノイズ成分除去の指針や方法、効果については触れられていない。
本発明はこのような課題を解決するためになされたものであり、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うための技術を提供することを目的とする。
本発明に係る方法の一例は、
電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法であって、
標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、第1データを取得することであって、ただし、前記第1データは、試料由来成分およびノイズ成分が含まれる検出強度の波形データである、第1データを取得することと、
前記第1データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応した特定波長データを選択することと、
前記特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行うことと、
各前記カットオフ周波数について、前記フィルタリング処理前後における前記特定波長データのピーク強度を比較することと、
前記カットオフ周波数のうち、前記特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低い前記カットオフ周波数を、第1カットオフ周波数として算出することと、
前記第1データに対して、または、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することと、
を備える。
また、本発明に係る方法の一例は、
電気泳動に係るデータにおけるピークが、試料由来ピークであるか、またはスパイクであるかを判定する方法であって、
上述の方法を用いて補正を行うことと、
各前記ピークについて、補正前のピーク強度と、補正後のピーク強度とに基づき、ピーク強度変化率を算出することと、
1つ以上の測定波長において、前記ピーク強度変化率の絶対値が、所定の閾値より大きい前記ピークについて、スパイクであると判定することと、
を備える。
本発明に係る技術によれば、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うことができる。
また、たとえば、大規模なデータベースを必要とせず、光学系の変更を伴わないため、低コストに導入できる。
本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、上記した以外の、課題、構成及び効果は、以下の実施例の説明により明らかにされる。
本発明の実施例1に係る電気泳動データ補正装置の構成図 実施例1に係る電気泳動データ補正方法におけるフローチャート 試料ありの場合と試料なしの場合の電気泳動データの波形の例 図3の波形のパワースペクトル 図4のパワースペクトルの横軸を線形にしたもの 平滑化処理前後のパワースペクトル 比較的小さなスパイクが含まれる電気泳動データの波形の例 図7Aの波形のパワースペクトル 比較的大きなスパイクが含まれる電気泳動データの波形の例 図7Cの波形のパワースペクトル 電気泳動データの波形の例 図8Aの波形のパワースペクトル ローパスフィルタのカットオフ周波数に対するフィルタリング処理前後の試料由来ピーク成分の強度の変化、ノイズの変化、ダイナミックレンジの変化の例 図8Aの波形を拡大したもの 図10Aの電気泳動データの波形を補正したもの 図2のステップS6の処理例を示すフローチャート 本発明の実施例2に係る電気泳動データ補正方法におけるフローチャート 補正を行っていない電気泳動データを用いて得たカラーコール後データの波形 図13Aのカラーコール後データの波形を拡大したもの 補正を行った電気泳動データを用いて得たカラーコール後データの波形 図13Cのカラーコール後データの波形を拡大したもの 電気泳動データに補正を行わずに、カラーコール後データに補正を行った場合のカラーコール後データの波形 図14Aの波形を拡大したもの 本発明の実施例3に係るカラーコール後データ補正装置の構成図 実施例3のカラーコール後データの補正方法におけるフローチャート 本発明の実施例4に係るカラーコール後データの補正方法におけるフローチャート スパイクを含まない電気泳動データの波形 図18Aの電気泳動データの波形を補正したもの 測定上限値で飽和したピーク値を有するスパイクを含む電気泳動データの波形 図18Cの電気泳動データの波形を補正したもの 比較的小さなスパイクを含む電気泳動データの波形 図18Eの電気泳動データの波形を補正したもの ピーク値付近に連続した近い値を有する比較的小さなスパイクを含む電気泳動データの波形 図18Gの電気泳動データの波形を補正したもの 3点連続で測定上限値で飽和したピーク値を有するスパイクを含む電気泳動データの波形 図19Aの電気泳動データの波形を補正したもの 図18Gの電気泳動データの波形からスパイクを除去し、データ点を補完したもの 図20Aの電気泳動データの波形を補正したもの
以下、図面に基づいて、本発明の実施例を説明する。なお、本発明の実施態様は、後述する実施例に限定されるものではなく、その技術思想の範囲において、種々の変形が可能である。
(1)実施例1
図1に本実施例に係る電気泳動データの補正を行う電気泳動データ補正装置1の構成を示す。電気泳動データ補正装置1は、たとえば汎用のコンピュータであり、CPU2(中央演算装置)、メモリ3、表示部4(たとえばモニタ)、入力部5、ハードディスク等の大容量記憶装置からなる記憶部6、そして通信インターフェース7を備える。
電気泳動データ補正装置1は、通信インターフェース7を通じて図示しないキャピラリー電気泳動型シーケンサに接続される。
記憶部6には、OS(Operating System)と電気泳動データ補正用プログラム8が保存されている。CPU2が、該電気泳動データ補正用プログラム8を実行することにより、電気泳動データ補正装置1は、後述するデータ選択部8A、時間周波数解析部8B、フィルタリング処理部8C、ピーク強度比較部8D、カットオフ周波数調整部8E、平滑化処理部8F、周波数取得部8Gとして機能する。
電気泳動データ補正装置1は、本実施例に係る方法を実行するよう構成される。また、電気泳動データ補正用プログラム8は、コンピュータにそのような方法を実行させ、これによって電気泳動データ補正装置1として機能させる。本実施例では、電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法が実行される。
本実施例に係る方法は、標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、電気泳動データ(第1データ)を取得することを備える。このデータは、試料由来成分およびノイズ成分が含まれる検出強度の波形データであり、複数の波長によるデータを含む。本実施例では、この電気泳動データが補正の対象となる。
以下、本実施例の電気泳動データ補正装置1を用いた電気泳動データ補正方法について、図2のフローチャートを参照して説明する。図2の処理は、たとえば、使用者による実行指示に基づいて、その実行が開始される。
まず、電気泳動データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応したデータ(特定波長データ)を選択する(ステップS1)。選択は、たとえばユーザーの指示に基づいて行うことができる。また、選択は、所定の基準に基づいて電気泳動データ補正装置1が自動的に行ってもよい。
該当する特定波長データが無い場合(ステップS2にてNO)は、解析をせずに図2の処理を終了する。
該当する特定波長データがある場合(ステップS2にてYES)は、特定波長のパワースペクトルにおいて、ホワイトノイズレベルのパワーよりも試料由来成分のパワーが大きくなるような最大の周波数を取得する(ステップS3)。ここで取得される周波数は、後述するカットオフ周波数の初期値として用いられるものであり、以下では初期カットオフ周波数と呼ぶ。たとえば、時間周波数解析部8Bが電気泳動データからパワースペクトルを取得し、周波数取得部8Gが初期カットオフ周波数を取得する。
この初期カットオフ周波数は、任意の値することができるが、上述のようにホワイトノイズレベルのパワーよりも試料由来成分のパワーが大きくなるような最大の周波数としておくと、後述するようにデータ補正処理の計算量が低減できる。
ステップS1~S2の詳細を説明するために、便宜上、ステップS3の詳細な説明を先に行う。図3に試料ありの場合(グレー)と試料なしの場合(黒)の電気泳動データの例を示す。試料ありのデータは、多数の試料由来のピークを含む波形を示す。一方、試料なしのデータは、ほぼ一定の値を示している。
図4に時間周波数解析部8Bが各波形データをフーリエ変換を用いて時間周波数解析することにより得たパワースペクトルを示す。試料なしのパワースペクトルには、ホワイトノイズ成分、1/fノイズ成分および1/fノイズ成分が含まれる。ノイズ成分は、たとえばキャピラリー電気泳動型シーケンサを構成する光検出部とキャピラリー内のポリマーに由来するものである。
これに対して、試料ありのパワースペクトルは、高周波数側はホワイトノイズであるが、ある周波数よりも低周波数側においてパワーが大きくなることが分かる。これは、試料由来成分のパワーはある周波よりも低周波数側に分布していることを意味する。
図4のグラフは横軸が対数であるので、横軸を線形にしたものを図5に示す。周波数約1.5Hzよりも高周波数側では、試料ありの場合もなしの場合もホワイトノイズレベルでほとんど一定であるのに対して、約1.5Hzよりも低周波数側において、試料ありのパワーが大きくなっている。
図3~図5では試料なしの電気泳動データやそのパワースペクトルを示しているが、初期カットオフ周波数を取得するためには、試料なしの電気泳動データは必ずしも必要ではない。試料ありの場合の電気泳動データとそのパワースペクトルのみに基づいて、ホワイトノイズレベルよりも試料由来成分のパワーが大きくなる初期カットオフ周波数を取得できる。
ステップS3において、平滑化処理部8Fがパワースペクトルの平滑化を行ってもよい。具体的な平滑化手法の例としては、移動平均法、隣接平均法、Savitzky-Golay法、FFTフィルタ、パーセンタイルフィルタ、LOWESS/LOESS平滑化などが挙げられる。すなわち、実施例1に係る方法は、初期カットオフ周波数を取得する際に、パワースペクトルに対して平滑化処理を行うことを備えてもよい。
図6に、51点の隣接平均法による平滑化を図5の試料ありのパワースペクトルに適用した前後の結果を示す。平滑化前のデータを黒で、平滑化後のデータをグレーで示す。平滑化を行うことによって、しきい値判定により初期カットオフ周波数を取得することが容易となる。例えば、周波数2.5から3.5Hzの範囲における成分の平均値の2倍をしきい値とすると、ホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数は1.48Hzとなる。
なお、ステップS3における初期カットオフ周波数の算出は、自動的に行う必要はない。たとえば、パワースペクトルや平滑化されたパワースペクトルからユーザーがホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数を読み取り、これを周波数取得部8Gに入力してもよい。
試料ありのパワースペクトルにおいて、ホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数は、電気泳動速度に依存する場合があり、したがってたとえば、測定条件のうち泳動電圧、ポリマーの粘度、キャピラリーの温度などに依存する。一方、観測する光の波長や色には依存しない場合がある。
但し、観測する光の波長や色によって試料由来のピークの大きさが極端に異なる場合がある。試料由来のピークが小さい場合には、パワースペクトルにおいて試料由来成分がホワイトノイズに埋もれてしまい、適切な初期カットオフ周波数の取得が困難となるため、上述のステップS1では、試料由来のピークが十分に大きな電気泳動データを選択することが望ましい。
パワースペクトルにおいてホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数は、測定条件に依存する。このため、図2の処理の開始に先立って、代表的な1つ以上の測定条件に対してそれぞれ適切な初期カットオフ周波数を取得し、記憶部6に保持しておいてもよい。
代表的な測定条件に対する初期カットオフ周波数を予め取得してあり、かつ、ステップS1において選択されたデータがその代表的な測定条件で測定したものであった場合には、ステップS2の判定を省略して後述のフィルタリング処理(ステップS4)へ進めてもよい。
また、ユーザーがホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数の予想値を設定できるようにしてもよい。ユーザーが予想値を設定した場合には、その予想値を初期カットオフ周波数とし、ステップS2の判定を省略して後述のフィルタリング処理(ステップS4)へ進めてもよい。
以上がステップS3の説明である。次に、ステップS1~S2を説明する。サンガー法を用いたDNAシーケンサにおいては、試料を泳動していなくても、混入した気泡や異物に起因したスパイクと呼ばれる複数の波長、色が重なったシャープなピークが電気泳動データの波形に現れることがある。
スパイクは試料由来のピーク波形と比較して急峻でピークを形成するデータ点数が少ないほか、ピークの高さが極めて大きいことが多いが、試料由来のピークの高さと同程度の場合もある。シーケンス解析やフラグメント解析のような解析時には、スパイクと試料由来のピーク波形は区別される必要があり、種々の方法が用いられている。
具体的なスパイク判定方法としては、ピークの高さや、半値幅、重なっている波長や色の範囲で判定する方法、それらの組み合わせを用いることが挙げられる。
電気泳動データに大きなスパイクが含まれている場合には、適切な初期カットオフ周波数を取得できない場合がある。図7Aに比較的小さなスパイクが含まれる電気泳動データ、図7Bにそのパワースペクトルを示し、図7Cに比較的大きなスパイクが含まれる電気泳動データ、図7Dにそのパワースペクトルの例を示す。2つの電気泳動データは同じ試料に対して同時に異なる波長で取得したものである。
図7Aの電気泳動データの時間824付近にスパイクが存在するが、試料由来のピークと同程度の大きさのため、この図では明確には確認できない。図7Bに示される図7Aの波形のパワースペクトルは、図5の試料ありのパワースペクトルと同様に、高周波数側はホワイトノイズレベルで、低周波数側にてパワーが大きくなる特徴が確認できる。従って、初期カットオフ周波数を適切に算出することが可能である。
一方、図7Cの電気泳動データには、時間536付近に測定上限値で飽和した値を示すスパイクと、時間824付近に試料由来のピークよりも大きなスパイクが存在する。図7Dに示される図7Cの波形のパワースペクトルは、図7Bのパワースペクトルと全く異なり、ホワイトノイズレベルを示す平坦なスペクトル領域が無いため、ホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数が明確に特定できず、初期カットオフ周波数を適切に算出することができない。
スパイクはシャープな波形を有することから、幅広い周波数帯にパワーを持っている。ピーク高さの大きなスパイクは大きなパワーを有することから、少数であっても試料由来成分のパワースペクトルを埋もれさせてしまう。一方、試料由来のピークと同程度の大きさのスパイクの場合は、通常、スパイクの数は試料由来のピークの数よりも十分に少ないため、スパイク成分のパワースペクトルに試料由来成分のパワースペクトルが埋もれることはない。
上述のように、電気泳動データは、同時に測定された複数の測定波長のデータを含む。ステップS1において電気泳動データのうちから特定波長データを選択する際には、図7Cのように大きなスパイク(試料由来のピークの数倍から十数倍、またはそれ以上)が含まれている測定波長のデータではなく、図7Aのようにスパイクが無いか、または、スパイクがあってもピーク高さが試料由来のピークと同程度である測定波長のデータを選択すると、適切な初期カットオフ周波数を算出できる可能性が高まる。
この基準は当業者が公知技術等に基づいて適宜決定可能であり、たとえば上述のように、ピークの高さ、半値幅、ピークが複数の測定波長で重なって出現するか否か、ピークが出現する色(測定波長)の範囲、等に基づいて定義することができる。また、定義された基準に基づいて自動的にデータを選択するように構成してもよい。
異なる波長で測定した電気泳動データであっても、同じ試料を同じ泳動条件で同時に測定したものであれば、パワースペクトルにおいてホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数は変わらないことを、本発明者らは実験的に確認している。
従って、ステップS1において、データ選択部8Aは、複数の波長で測定した電気泳動データから、所定の基準によってスパイクが無いと判定される測定波長のデータを選択することができ、または、所定の基準によってスパイクのピーク値が試料由来成分のピーク値と同範囲内であると判定される測定波長のデータを選択することができる。
ステップS4において、フィルタリング処理部8Cは、上記のように取得した初期カットオフ周波数によるフィルタリング処理を行う。フィルタリング処理は、初期カットオフ周波数よりも高周波数側の成分の一部または全部をカットするものであり、たとえばローパスフィルタ、バンドパスフィルタ、またはそれらの組み合わせを用いて実施することができる。
次に、ピーク強度比較部8Dは、フィルタリング処理前後のピーク強度を比較する(ステップS5)。
カットオフ周波数調整部8Eは、初期カットオフ周波数からカットオフ周波数を変化させ、フィルタリング処理によるピークの強度低下が所定の許容範囲内となるカットオフ周波数のうち、最も低い周波数であるカットオフ周波数(第1カットオフ周波数)を算出する(ステップS6)。
ステップS6では、特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行う。そして、各カットオフ周波数について、フィルタリング処理前後における特定波長データのピーク強度を比較する。さらに、これらのカットオフ周波数のうち、特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低いカットオフ周波数を、第1カットオフ周波数として算出する。
なお、本実施例において、ピーク強度が増大した場合には、許容範囲内であると判定される。ただし、変形例として、ピーク強度が増大した場合には許容範囲外であると判定してもよいし、増大率に基づいて(たとえば所定の閾値と比較することにより)許容範囲内であるか否かを判定してもよい。
このように、カットオフ周波数調整部8Eは、初期カットオフ周波数をカットオフ周波数の初期値とし、カットオフ周波数を低下させつつフィルタリング処理を繰り返すことを介して、第1カットオフ周波数を算出する。このため、初期カットオフ周波数を、ホワイトノイズレベルのパワーよりも試料由来成分のパワーが大きくなるような最大の周波数としておくと、計算が不要な高周波帯における演算を省略することができ、計算量が低減できる。
図8Aに示す電気泳動データを補正対象とした場合を説明する。時間周波数解析部8Bの解析により得られたパワースペクトルを図8Bに示す。平滑化処理部8Fによる平滑化と、周波数取得部8Gのしきい値判定により、初期カットオフ周波数を1.1Hzと取得した。
フィルタリング処理部8Cは、カットオフ周波数を1.1Hzとしたローパスフィルタを図8Aに示す電気泳動データに適用し、ピーク強度比較部8Dはフィルタリング処理前後のピーク強度を比較する。本実施例ではピーク強度を図6Aにある全てのピークの高さを用いて表し、これをフィルタリング処理前後で比較する。例えば図8A中のピークAの高さとは、ピークトップの値と、バックグラウンド値(ベースライン)との差を用いて表される。このように、ピークの高さを用いてピーク強度を表すと、ピーク強度を容易に算出することができる。
ステップS6において、フィルタリング処理部8Cは、特定波長データにおいてバックグラウンド値を取得してもよい。バックグラウンド値は、公知技術等に基づいて適宜取得可能である。たとえば、バックグラウンド値は、特定波長データにおいて、ピークが存在しない部分の平均値として算出可能である。
ピーク強度は、全てのピークの高さではなく、一部のピークの高さを用いて表してもよい。また、ピーク強度は、ピークの高さではなく、ピークの面積によって表してもよい。ピークの面積は、公知技術等に基づいて適宜算出可能である。たとえば、ピーク時刻の両側において極小値またはバックグラウンド値を与える時刻の間で積分を行ってもよく、当該積分の結果から所定の定数を減算してもよい。ピークの面積を用いてピーク強度を表すと、ピークトップの値のみならず幅も考慮して強度を算出することができる。
本実施例の効果を説明するために、カットオフ周波数に応じたノイズ成分の変化を説明する。ノイズの指標を、電気泳動データのうち試料由来ピークの無い部分の標準偏差とし、これをフィルタリング処理前後で比較する。図8Aの例では、時間範囲Bすなわち時刻1500を中心にした500のデータ点の標準偏差をノイズの指標とする。
図9に、ローパスフィルタのカットオフ周波数に対するフィルタリング処理前後の変化として、ピーク強度の変化、ノイズ強度の変化、およびダイナミックレンジの変化を示す。ピーク強度の変化のプロットは、図8Aに示す22個の試料由来ピークについての平均値である。各データの変化は、フィルタリング処理前、即ちフィルタリング処理なしのときを1としてプロットしてある。エラーバーは標準偏差である。例えば、ピーク強度の変化が0.9の場合は、フィルタリング処理前後で10%だけピーク強度が低下したことを意味する。
カットオフ周波数1.1Hzのローパスフィルタを適用した場合、ピーク強度の変化は0.998、ノイズの変化は0.625、ダイナミックレンジの変化は1.599であった。これは、ピーク強度は0.2%低下する一方、ノイズは37.5%減少し、ダイナミックレンジは59.9%増加することを意味する。
ピーク強度低下の許容範囲を1%以下とした場合は、内挿に基づいてカットオフ周波数を0.84Hzまで下げることが可能であることを算出した。なお図9では視認性のため1%の許容範囲を実際より広く示している。カットオフ周波数0.84Hzのローパスフィルタを適用した場合、ピーク強度の変化は0.990、ノイズの変化は0.549、ダイナミックレンジの変化は1.821となった。このように、ピーク強度低下の許容範囲を1%以下とすることにより、ピーク強度をほとんど低下させずに、ノイズを大幅に低減させることができ、また、ダイナミックレンジを大きく向上させることができる。
なお内挿演算は公知技術等に基づいて適宜設計可能である。たとえば、カットオフ周波数の数に応じ、線形または非線形の内挿演算を行うことができる。
ステップS6の後、フィルタリング処理部8Cは上記のように算出した第1カットオフ周波数によるフィルタリング処理を、補正対象である電気泳動データ(複数の測定波長データを含む)に対して行い(ステップS7)、これによって電気泳動データを補正する。
図10Aに補正前の電気泳動データの波形として図8Aの拡大図を示す。図10Bは補正後の電気泳動データ波形である。図10Aと図10Bを比較すると、補正後の図10Bの方がノイズが低減できていることが確認できる。
尚、ステップS7において、算出した第1カットオフ周波数を表示部4にてユーザーに通知し、ユーザーが補正に用いるカットオフ周波数を設定できるようにしてもよい。すなわち、フィルタリング処理部8Cは、ユーザーが設定したカットオフ周波数に基づいてフィルタリング処理を行い、これによって電気泳動データを補正してもよい。
このように、実施例1によれば、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うことができる。
(2)実施例1におけるステップS6の処理例
図2のステップS4~S6において、取得した初期カットオフ周波数に基づいて高周波数側をカットするフィルタリング処理を行い、フィルタリング処理前後のピーク強度を比較し、ピーク強度の低下が予め定めた許容範囲内でカットオフ周波数が低くなるよう調整し、最も低くなる値を算出した。この工程内のステップS6の処理例を図11に示すフローチャートを用いてより具体的に説明する。
図11は、図2のステップS6をより詳細に示すものである。ステップS5においてピーク強度比較部8Dがフィルタリング処理前後のピーク強度を比較した後、ピーク強度低下が許容範囲内であるかどうかを判定する(ステップS6-1)。
許容範囲内の場合(ステップS6-1がYES)、カットオフ周波数を下げたフィルタリング処理を行い、フィルタリング処理前後のピーク強度の比較を行う(ステップS6-2-1)。ここで再びピーク強度低下が許容範囲内であるかどうかを判定する(ステップS6-3-1)。
許容範囲内の場合(YES)は、ステップS6-2-1へ戻る。許容範囲外の場合(NO)は、ピーク強度低下が許容範囲内となる最も低いカットオフ周波数(第1カットオフ周波数)を内挿で算出(ステップS6-4)し、ステップS7へ進む。
ステップS6-1で許容範囲外の場合(ステップS6-1がNO)、カットオフ周波数を上げたフィルタリング処理を行い、フィルタリング処理前後のピーク強度の比較を行う(ステップS6-2-2)。ここで再びピーク強度低下が許容範囲内であるかどうかを判定する(ステップS6-3-2)。
許容範囲外の場合(NO)は、ステップS6-2-2へ戻り、許容範囲内の場合(YES)は、ピーク強度低下が許容範囲内で最も低いカットオフ周波数(第1カットオフ周波数)を内挿で算出(ステップS6-4)し、ステップS7へ進む。
尚、ステップS6-2-1およびS6-2-2におけるカットオフ周波数の上げ幅および下げ幅は、ステップS3で取得した周波数の10%以下とすると、第1カットオフ周波数を精密に算出することができる。
(3)実施例2
前記(1)実施例1では、図2のステップS4~S6において、取得した周波数をカットオフ周波数とした高周波数側をカットするフィルタリング処理を行い、フィルタリング処理前後のピーク強度を比較し、ピークの強度低下が予め定めた許容範囲内でカットオフ周波数が低くなるよう調整し、最も低くなる値を算出した。ピーク強度低下が許容範囲内でカットオフ周波数が低くなるように調整する際には、カットオフ周波数を上げて又は下げてフィルタリング処理を行い、フィルタリング処理前後のピーク強度を比較することを繰り返すという流れを含む。
一方、本実施例では、ある程度まとめてフィルタリング処理とピーク強度の比較を行い、フィルタリング処理によるピーク強度低下があらかじめ定めた値となるカットオフ周波数を算出する。
以下、本実施例の電気泳動データ補正方法について、図12のフローチャートを参照して説明する。ステップS1’~S3’は前記(1)実施例1の図2における、ステップS1~S3と同様である。
ステップS3’で取得した初期カットオフ周波数を基準として、複数のカットオフ周波数を設定し、高周波数側をカットするフィルタリング処理を時間周波数解析の対象である電気泳動データにそれぞれ実施する(ステップS4’)。
この複数のカットオフ周波数は、たとえば初期カットオフ周波数を上限とし、所定の刻み幅で設定されてもよい。
各フィルタリング処理前後のピーク強度を比較(ステップS5’)し、ピーク強度低下が許容範囲内で最も低いカットオフ周波数(第1カットオフ周波数)を内挿で算出する(ステップS6’)。その後、算出した第1カットオフ周波数によるフィルタリング処理を補正対象である複数の波長で測定した電気泳動データに適用し(ステップS7’)、電気泳動データの補正が終了する。
尚、ステップS7’において、算出した第1カットオフ周波数をユーザーに通知し、ユーザーが補正に用いるカットオフ周波数を設定できるようにしてもよい。すなわち、フィルタリング処理部8Cは、ユーザーが設定したカットオフ周波数に基づいてフィルタリング処理を行い、これによって電気泳動データを補正してもよい。
ステップS3’で取得した初期カットオフ周波数を基準に複数のカットオフ周波数を設定する際には、周波数の刻み幅は初期カットオフ周波数の10%以下とすると、第1カットオフ周波数を精密に算出することができる。
このように、実施例2によれば、実施例1と同様に、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うことができる。
(4)実施例3
前記(1)実施例1および(3)実施例2では、電気泳動データを補正した。すなわち、補正の対象となるデータは電気泳動による測定値データ(第1データ)であり、このデータに対して第1カットオフ周波数によるフィルタリング処理を行うことにより補正した。
実施例3では、カラーコール後のデータを補正する。すなわち、実施例3に係る方法は、電気泳動による測定値データ(第1データ)に対するカラーコール後データに対して、第1カットオフ周波数によるフィルタリング処理を行うことにより補正することを備える。
カラーコールについて説明する。蛍光色素を電気泳動することで、試薬キットに使用されている各蛍光色素の蛍光スペクトルを示す情報であるマトリックスが得られる。これをもとに、波長帯ごとの信号スペクトルのデータである電気泳動データを蛍光色素の種類ごとの信号スペクトルのデータ(カラーコール後データ)に変換することができる。カラーコール後データもまた、複数の波長によるデータを含む。
カラーコールとは、標識として用いた蛍光色素の種類ごとの信号スペクトルデータを取得する処理のことである。カラーコールは、たとえば、電気泳動データの各測定波長のデータに、測定波長に応じた重み付けを行うことによって行うことができる。各測定波長に対する重み付け係数は、蛍光色素の種類によって異なる。
まず、電気泳動データに実施例1または2に係る補正を行った場合、カラーコール後データにおいてもノイズ低減効果が維持されることを図13A~図13Dを用いて説明する。
図13Aに補正を行っていない電気泳動データを用いて得たカラーコール後データを、図13Cに同じ電気泳動データに実施例1または2に係る補正を行い、補正後の電気泳動データを用いて得たカラーコール後データを示す。図13Bと図13Dは、それぞれ図13Aと図13Cの一部拡大図である。
図13Aと図13Cを比較すると、スパイク以外の波形の違いは殆ど確認できない。特定のピークがスパイクであると判断している理由は、電気泳動データにおいて、同じ時間にて測定上限値で飽和した複数の波長で重なるシャープなピークが観測されていたためである。
スパイクの高さが実施例1または2による補正で低下することについては、後述する。
図13Bと図13Dを比較すると、補正した電気泳動データを用いた図13Dの方がノイズが低減できていることが確認できる。
次に、電気泳動データに補正を行わずに、カラーコール後データに補正を行った場合のカラーコール後データを図14Aに、その一部拡大図を図14Bに示す。補正のためのフィルタリング処理の条件は、図13C及び図13Dに行ったフィルタリング処理の条件と同じものである。なお、本実施例では、初期カットオフ周波数および第1カットオフ周波数は、電気泳動データに基づいて算出した。
図14Aと図13Aを比較すると、スパイク以外の波形の違いは殆ど確認できない。図14Aではスパイクの高さが低下しているほか、スパイクの裾がベースラインよりも下側に値をとっている。図14Bと図13Bを比較するとカラーコール後データに補正を行った図14Bの方がノイズを低減できており、図14Bと図13Dを比較すると、同等のノイズ低減効果であることが分かる。
以上より、カラーコール後データに対して補正を行うことで、カラーコール後データのノイズを低減することが可能であると言える。
図15に本実施例に係るカラーコール後データの補正を行うカラーコール後データ補正装置11の構成を示す。カラーコール後データ補正装置11の実体は、汎用のパーソナルコンピュータであり、CPU12(中央演算装置)、メモリ13、表示部14(たとえばモニタ)、入力部15、ハードディスク等の大容量記憶装置からなる記憶部16、そして通信インターフェース17を備える。
カラーコール後データ補正装置11は、通信インターフェース17を通じて図示しないキャピラリー電気泳動型シーケンサに接続される。
記憶部16には、OS(Operating System)とカラーコール後データ補正用プログラム18が保存されている。CPU12が、該カラーコール後データ補正用プログラム18を実行することにより、カラーコール後データ補正装置11は、後述するデータ選択部18A、時間周波数解析部18B、フィルタリング処理部18C、ピーク強度比較部18D、カットオフ周波数調整部18E、平滑化処理部18F、周波数取得部18Gとして機能する。
カラーコール後データ補正装置11は、本実施例に係る方法を実行するよう構成される。また、カラーコール後データ補正用プログラム18は、コンピュータにそのような方法を実行させ、これによってカラーコール後データ補正装置11として機能させる。
以下、カラーコール後データ補正装置11を用いたカラーコール後データの補正方法について、図16のフローチャートを参照して説明する。図16の処理は、たとえば、使用者による実行指示に基づいて、その実行が開始される。
まず、電気泳動データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応したデータ(特定波長データ)を選択する(ステップS1’’)。この電気泳動データは、補正対象であるカラーコール後データの元データである。選択は、たとえばユーザーの指示に基づいて行うことができる。また、選択は、所定の基準に基づいてカラーコール後データ補正装置11が自動的に行ってもよい。
これ以降のステップS2’’からステップS6’’は、前記(1)実施例1の図2のフローチャートにおけるステップS2からステップS6と同様である。また、装置構成については、図1の電気泳動データ補正装置1を構成する電気泳動データ補正用プログラム8をカラーコール後データ補正用プログラム18に置き換えたものを、カラーコール後データ補正装置11(図15)とすることができる。
ステップS2’’からステップS6’’において、図15に示す符号12~18並びに18A~18Gによって示される構成要素は、前記(1)実施例1(図1)の符号2~8並びに8A~8Gによって示される構成要素と同様の動作をする。
ステップS6’’にて算出した第1カットオフ周波数を用いたフィルタリング処理をフィルタリング処理部18Cが補正対象であるカラーコール後データに適用し(ステップS7’’)、カラーコール後データの補正が終了する。
尚、ステップS7’’において、算出した第1カットオフ周波数を表示部14にてユーザーに通知し、ユーザーが補正に用いるカットオフ周波数を設定できるようにしてもよい。すなわち、フィルタリング処理部8Cは、ユーザーが設定したカットオフ周波数に基づいてフィルタリング処理を行い、これによってカラーコール後データを補正してもよい。
このように、実施例3によれば、実施例1および2と同様に、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うことができる。
(5)実施例4
前記(4)実施例3では、補正対象はカラーコール後データであるが、第1カットオフ周波数はその元データである電気泳動データを用いて算出している。実施例4では、電気泳動データではなく、カラーコール後データを第1データとして用いて第1カットオフ周波数を算出し、カラーコール後データを補正する。
すなわち、本実施例では、第1データは電気泳動による測定値データに対するカラーコール後データであり、本実施例に係る方法は、カラーコール後データに対して第1カットオフ周波数によるフィルタリング処理を行うことにより補正することを備える。なお、カラーコール後データは、測定値データと同様に、試料由来成分およびノイズ成分が含まれる検出強度の波形データである。
カラーコール後データ補正装置11の構成は前記(4)実施例3(図15)と同じとすることができる。
以下、本実施の形態に係るカラーコール後データの補正方法について、図17のフローチャートを参照して説明する。図17の処理は、たとえば、使用者による実行指示に基づいて、その実行が開始される。
まず、カラーコール後データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応したデータ(特定波長データ)を選択する(ステップS11)。選択は、たとえばユーザーの指示に基づいて行うことができる。また、選択は、所定の基準に基づいてカラーコール後データ補正装置11が自動的に行ってもよい。
データ選択部18Aは、複数の波長によるデータを含むカラーコール後データから、所定の基準によってスパイクが無いと判定される測定波長のデータを選択することができ、または、所定の基準によってスパイクのピーク値が試料由来成分のピーク値と同範囲内であると判定される測定波長のデータを選択することができる。
該当する特定波長データが無い場合(ステップS12にてNO)は、解析をせずに終了となる。
該当する特定波長データがある場合(ステップS12にてYES)は、時間周波数解析部18Bが、特定波長データからパワースペクトルを取得し、周波数取得部18Gがパワースペクトルからホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数(初期カットオフ周波数)を取得する(ステップS13)。
周波数取得部18Gが初期カットオフ周波数を取得する際には、平滑化処理部18Fがパワースペクトルの平滑化を行ってもよい。
また、パワースペクトルや平滑化されたパワースペクトルからユーザーがホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数を読み取って、初期カットオフ周波数の値を入力してもよい。周波数取得部18Gはこの値を取得してもよい。
初期カットオフ周波数は元データである電気泳動データの測定条件に依存する。このため、図17の処理の開始に先立って、代表的な1つ以上の測定条件に対してそれぞれ適切な初期カットオフ周波数を取得し、記憶部16に保持しておいてもよい。
代表的な測定条件に対する初期カットオフ周波数を予め取得してあり、かつ、もとの電気泳動データがその代表的な測定条件で測定したものであった場合には、ステップS12の判定を省略して後述のフィルタリング処理(ステップS14)へ進めてもよい。
尚、代表的な測定条件に対する初期カットオフ周波数は、カラーコール後データのパワースペクトルから取得したものでもよいし、元データである電気泳動データのパワースペクトルから取得したものでもよい。
また、ユーザーがホワイトノイズレベルよりも試料由来成分のパワーが大きくなるような最大の周波数の予想値を設定できるようにしてもよい。ユーザーが予想値を設定した場合には、その予想値を初期カットオフ周波数とし、ステップS12の判定を省略して後述のフィルタリング処理(ステップS14)へ進めてもよい。
ステップS14において、フィルタリング処理部18Cは、上記のように取得した初期カットオフ周波数によるフィルタリング処理を行う。フィルタリング処理は、初期カットオフ周波数よりも高周波数側の成分の一部または全部をカットするものであり、たとえばローパスフィルタ、バンドパスフィルタ、またはそれらの組み合わせを用いて実施することができる。
次に、ピーク強度比較部18Dは、フィルタリング処理前後のピーク成分を比較する(ステップS15)。
カットオフ周波数調整部18Eは、初期カットオフ周波数からカットオフ周波数を変化させ、フィルタリング処理によるピークの強度低下が所定の許容範囲内となるカットオフ周波数のうち、最も低い周波数であるカットオフ周波数(第1カットオフ周波数)を算出する(ステップS16)。
フィルタリング処理部18Cは、算出したカットオフ周波数を用いたフィルタリング処理を、補正対象であるカラーコール後データに適用し(ステップS17)、カラーコール後データの補正が終了する。
尚、ステップS17において、算出した第1カットオフ周波数を表示部14にてユーザーに通知し、ユーザーが補正に用いるカットオフ周波数を設定できるようにしてもよい。すなわち、フィルタリング処理部18Cは、ユーザーが設定したカットオフ周波数に基づいてフィルタリング処理を行い、これによって電気泳動データを補正してもよい。
このように、実施例4によれば、実施例1~3と同様に、事前のデータベース構築を不要としつつ、データ処理によって高感度化または高ダイナミックレンジ化を行うことができる。
(6)実施例5
実施例5では、電気泳動データおよびカラーコール後データへの補正を用いたスパイク判定を行う。すなわち、実施例5に係る方法は、電気泳動に係るデータにおけるピークが、試料由来ピークであるか、またはスパイクであるかを判定する方法である。
前記実施例1~4において、試料を泳動していなくても混入した気泡や異物に起因したスパイクと呼ばれる複数の波長、色が重なったシャープなピークが電気泳動データに現れることがあることを説明した。
シーケンス解析やフラグメント解析などの解析時にはスパイクと試料由来のピーク波形は区別される必要があり、種々の方法が用いられている。具体的なスパイク判定方法としては、ピークの高さや、半値幅、重なっている波長や色の範囲で判定する方法、それらの組み合わせを用いることが挙げられる。
しかし、スパイク毎にピークの大きさや半値幅、重なっている波長や色の範囲は異なることから、ピークの大きさが試料由来ピークに近いスパイクを試料由来ピークと誤って判定することがある。
前記実施例1~4にて説明した電気泳動データおよびカラーコール後データへの補正を用いることで、スパイクを高い精度で判定することができる。以下にて、電気泳動データの補正を用いたスパイク判定を例を用いて説明する。
ピーク強度低下の許容範囲を1%以下として、電気泳動データを補正した場合における、補正前のピーク波形を図18A、図18C、図18E、図18Gに示し、各ピーク波形を補正したものを図18B、図18D、図18F、図18Hに示す。
図18Aと図18Bの矢印(a)~(e)は試料由来ピークを指している。データ補正によるピーク高さの変化率はそれぞれ、-0.63%、+0.06%、-0.36%、-0.61%、-0.21%であった。いずれも、ピーク高さの低下は1%以下である。
図18Cの矢印はデータ補正前のスパイクを指している。最大値は測定上限値で飽和している。データ補正後のスパイクは、図18Dに示すようにピーク高さが減少しているほか、スパイクのすそにカットオフ周波数に相当する波形が現れている。データ補正によるピーク高さの変化率は-22.6%であった。
図18Eの矢印はデータ補正前のスパイクを指している。比較的小さなスパイクで、試料由来ピークと同程度のピーク高さである。データ補正後のスパイクは、図18Fに示すようにピーク高さが減少しているほか、スパイクのすそにカットオフ周波数に相当する波形が加わり少し乱れている。データ補正によるピーク高さの変化率は-18.8%であった。
図18Gの矢印はデータ補正前のスパイクを指している。比較的小さなスパイクで、試料由来ピークと同程度のピーク高さである。スパイクはピーク値付近に連続した近い値を持っている。データ補正後のスパイクは、図18Hに示すようにピーク高さが増加しているほか、スパイクのすそにカットオフ周波数に相当する波形が加わり少し乱れている。データ補正によるピーク高さの変化率は+4.0%であった。
以上より、試料由来ピークの大部分は補正によってピーク高さが減少するが、その変化率は、予め定めた試料由来ピーク成分の強度低下の範囲と同じ1%以下である。試料由来ピークの高さが補正によって増加する場合もあるが、その変化率は減少の場合よりも小さいため、やはり変化率は1%以下である。
一方、スパイクの大部分も補正によってピーク高さが減少するが、その変化率は10%以上と試料由来ピークと比較して大きい。また、補正によってスパイクのピーク高さが増加する場合もあるが、増加の場合もその変化率は試料由来ピークと比較して大きい。
従って、補正によるピーク強度の変化率に基づいて、そのピークが試料由来ピークであるかまたはスパイクであるかを判別することができる。たとえば、まず各ピークについて、補正前のピーク強度と、補正後のピーク強度とに基づき、ピーク強度変化率を算出する。そして、1つ以上の測定波長において、ピーク強度変化率の絶対値が、所定の閾値より大きいピークについてスパイクであると判定し、そうでないピークについて試料由来ピークであると判定することができる。
本実施例ではピーク強度の指標としてピークの高さを用いるが、ピーク強度の指標としてピークの面積を用いてもよい。
以下では、ピーク強度の指標としてピークの高さを用いて説明する。例えば、補正によるピーク高さの変化率の絶対値が、ステップS6で用いた許容範囲(たとえば1%)の2倍以上である場合をスパイクと判定することで、後述する特定のスパイクを除いて、試料由来ピークとスパイクの判別ができる。この場合には、許容範囲が1%以下であるとすると、補正によるピーク高さの変化率の絶対値が2%以上である場合にスパイクと判定される。
この閾値は、任意の値とすることができるが、ステップS6の許容範囲の上限を超える値(上述の例では1%より大きい値)に決定すると、試料由来のピークの多くを正しく試料由来のピークと判定することができる。さらに、閾値をステップS6の許容範囲の上限の2倍以上とすると、さらに多くの試料由来のピークを正しく試料由来のピークと判定することができる。
ここで、補正後のピーク高さの変化率の絶対値の大きさではスパイクと判定できないスパイク(上述の特定のスパイク)について、図19Aと図19Bを用いて説明する。
図19Aの矢印はデータ補正前のスパイクを指している。ピーク高さは測定上限値で飽和しており、3点連続している。データ補正後のスパイクは、図19Bに示すようにピーク高さは測定上限で飽和したままで、2点連続となった。データ補正によるピーク高さの変化率は0.0%である。
このように、ピーク高さが複数点連続して測定上限値で飽和したスパイクについては、補正後のピーク高さの変化率の絶対値でスパイクと判定できないことがある。
このようなピーク高さが測定上限値で飽和したスパイクについては、既存の判定方法によって判定できる可能性がある。既存の判定方法としては、補正前のピークの高さに基づいて判定する方法、補正前のピークの半値幅に基づいて判定する方法、補正前のピークが複数の測定波長において重なっているか否かに基づいて判定する方法、補正前のピークが出現する色の範囲に基づいて判定する方法、それらの組み合わせ、等がある。
従って、本実施例による試料由来ピークとスパイクとを判別する手法は、既存の判定方法と組み合わせて用いると、より多くのピークを正しく判定することができる。
以上は、電気泳動データの補正を用いたスパイク判定の例を説明したが、カラーコール後データの場合にも同様にスパイクの判定ができる。
図13Aに補正を行っていない電気泳動データを用いて得たカラーコール後データを、図13Cに同じ電気泳動データに補正を行い、補正後の電気泳動データを用いて得たカラーコール後データを示した。試料由来のピークと比較してスパイクのピーク高さが補正により減少していることが分かる。
また、図14Aには、図13Aに示したカラーコール後データに補正を行った場合のカラーコール後データを示した。この場合も試料由来のピークと比較してスパイクのピーク高さが補正により減少していることが分かる。従って、補正によるピーク高さの変化率の違いから試料由来ピークとスパイクを判別することができる。
図18D、図18F、図18H、図19Bに示したように、補正後のスパイクのすそにはカットオフ周波数に相当する本来存在しない波形が現れる。すそに現れる波形の大きさはスパイクのピーク高さに依存するため、スパイクが比較的小さい場合には解析に影響しないが、試料由来のピークと比較してスパイクのピーク高さが大きい場合にはスパイクのすそに現れる本来存在しない波形によって、試料由来のピークの形状や大きさが変化し、解析結果を変えてしまう可能性がある。
そこで、スパイクを除去した後にデータ補正を行ってもよい。具体的には、前記実施例1~4にて説明したように、電気泳動データまたはカラーコール後データへの補正を行う。次に、補正前後のピーク強度に基づく実施例5の方法および従来のスパイク判定方法によってスパイクの判定を行う。
実施例5の方法による判定結果とおよび従来のスパイク判定方法による判定結果とが一致しない場合の調整方法は、当業者が適宜決定可能である。たとえば、いずれかの方法でスパイクと判定されたピークはスパイクであると判定してもよいし、双方の方法によりスパイクと判定されたピークのみスパイクであると判定してもよい。
そして、補正前の電気泳動データまたはカラーコール後データからスパイクを除去し、スパイクを除去した電気泳動データまたはカラーコール後データに対して、再度補正を行う。これにより、補正後のスパイクのすそに本来存在しないカットオフ周波数に相当する波形を現れることを防止することができる。
スパイクの除去方法としては種々の方法があるが、例えばスパイクを構成するプロットを除去した後、除去したプロットの周囲のデータ点を用いた非線形カーブフィットや非線形ピークフィットによりデータ点を補完する方法が挙げられる。
スパイクを含む電気泳動データからスパイクを除去し、非線形カーブフィットによりデータ点を補完した後に、補正する処理を、以下例を用いて説明する。スパイクを含む電気泳動データとして図18Gに示すデータを用いる。スパイクを除去し、データ点を補完した電気泳動データの波形を図20Aに示す。これに対してデータ補正を行った電気泳動データ波形を図20Bに示す。図20Bの波形と、スパイクを除去せずにデータ補正した図18Hの波形とを比較すると、図18Hで確認できるスパイクのすそ付近の波形の乱れが、図20Bでは生じていない。
このように、実施例5によれば、試料由来ピークとスパイクとをより適切に識別することができる。また、これによってスパイクをより容易に除去することができるので、電気泳動データに含まれるノイズをさらに低減することができ、高感度化または高ダイナミックレンジ化を行うことができる。
1…電気泳動データ補正装置
2,12…CPU
3,13…メモリ
4,14…表示部
5,15…入力部
6,16…記憶部
7,17…通信インターフェース
8…電気泳動データ補正用プログラム
11…カラーコール後データ補正装置
18…カラーコール後データ補正用プログラム
8A,18A…データ選択部
8B,18B…時間周波数解析部
8C,18C…フィルタリング処理部
8D,18D…ピーク強度比較部
8E,18E…カットオフ周波数調整部
8F,18F…平滑化処理部
8G,18G…周波数取得部

Claims (14)

  1. 電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法であって、
    標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、第1データを取得することであって、ただし、前記第1データは、試料由来成分およびノイズ成分が含まれる検出強度の波形データである、第1データを取得することと、
    前記第1データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応した特定波長データを選択することと、
    前記特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行うことと、
    各前記カットオフ周波数について、前記フィルタリング処理前後における前記特定波長データのピーク強度を比較することと、
    前記カットオフ周波数のうち、前記特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低い前記カットオフ周波数を、第1カットオフ周波数として算出することと、
    前記第1データに対して、または、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することと、を含み、
    前記特定波長データは、所定の基準によってスパイクが無いと判定される測定波長のデータであるか、または、所定の基準によってスパイクのピーク値が試料由来成分のピーク値と同範囲内であると判定される測定波長のデータである、方法。
  2. 前記所定の許容範囲は1%以下である、請求項1に記載の方法。
  3. 前記方法は、さらに前記特定波長データのバックグラウンド値を取得することを含み
    前記ピーク強度は、ピークトップの値と、前記バックグラウンド値との差を用いて表される、請求項1に記載の方法。
  4. 前記方法は、さらに前記特定波長データのバックグラウンド値を取得することを含み
    前記ピーク強度は、ピークの面積を用いて表される、請求項1に記載の方法。
  5. 前記第1データは、電気泳動による測定値データに対するカラーコール後データであり、
    前記補正することは、前記第1データに対して前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することである、請求項1に記載の方法。
  6. 電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法であって、
    標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、第1データを取得することであって、ただし、前記第1データは、試料由来成分およびノイズ成分が含まれる検出強度の波形データである、第1データを取得することと、
    前記第1データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応した特定波長データを選択することと、
    前記特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行うことと、
    各前記カットオフ周波数について、前記フィルタリング処理前後における前記特定波長データのピーク強度を比較することと、
    前記カットオフ周波数のうち、前記特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低い前記カットオフ周波数を、第1カットオフ周波数として算出することと、
    前記第1データに対して、または、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することと、
    前記特定波長データのパワースペクトルにおいて、ホワイトノイズレベルのパワーよりも試料由来成分によるパワーが大きくなるような最大の周波数を、初期カットオフ周波数として取得することと、
    前記初期カットオフ周波数をカットオフ周波数の初期値とし、カットオフ周波数を低下させつつ前記フィルタリング処理を繰り返すことを介して、前記第1カットオフ周波数を算出することと、
    含む、方法。
  7. 前記方法は、さらに、前記初期カットオフ周波数を取得する際に、前記パワースペクトルに対して平滑化処理を行うことを含む、請求項6に記載の方法。
  8. 電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法であって、
    標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、第1データを取得することであって、ただし、前記第1データは、試料由来成分およびノイズ成分が含まれる検出強度の波形データである、第1データを取得することと、
    前記第1データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応した特定波長データを選択することと、
    前記特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行うことと、
    各前記カットオフ周波数について、前記フィルタリング処理前後における前記特定波長データのピーク強度を比較することと、
    前記カットオフ周波数のうち、前記特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低い前記カットオフ周波数を、第1カットオフ周波数として算出することと、
    前記第1データに対して、または、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することと、を含み、
    前記第1データは、電気泳動による測定値データであり、
    前記補正することは、前記第1データに対して前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することである、方法。
  9. 電気泳動に係るデータからノイズ成分の一部を除去することにより当該データを補正する方法であって、
    標識化された分析対象の核酸試料を電気泳動し、標識信号を同時に複数の測定波長で検出することを介して、第1データを取得することであって、ただし、前記第1データは、試料由来成分およびノイズ成分が含まれる検出強度の波形データである、第1データを取得することと、
    前記第1データのうちから、時間周波数解析の対象とする1つ以上の測定波長に対応した特定波長データを選択することと、
    前記特定波長データに対し、高周波数側の一部または全部をカットするフィルタリング処理を、1つ以上のカットオフ周波数について行うことと、
    各前記カットオフ周波数について、前記フィルタリング処理前後における前記特定波長データのピーク強度を比較することと、
    前記カットオフ周波数のうち、前記特定波長データのピーク強度の低下が所定の許容範囲内となるような、最も低い前記カットオフ周波数を、第1カットオフ周波数として算出することと、
    前記第1データに対して、または、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することと、を含み、
    前記第1データは、電気泳動による測定値データであり、
    前記補正することは、前記第1データに対するカラーコール後データに対して、前記第1カットオフ周波数によるフィルタリング処理を行うことにより補正することである、方法。
  10. 電気泳動に係るデータにおけるピークが、試料由来ピークであるか、またはスパイクであるかを判定する方法であって、
    請求項1に記載の方法を用いて補正を行うことと、
    各前記ピークについて、補正前のピーク強度と、補正後のピーク強度とに基づき、ピーク強度変化率を算出することと、
    1つ以上の測定波長において、前記ピーク強度変化率の絶対値が、所定の閾値より大きい前記ピークについて、スパイクであると判定することと、
    含む方法。
  11. 前記所定の閾値は前記所定の許容範囲の上限を超える、請求項1に記載の方法。
  12. 前記所定の閾値は前記所定の許容範囲の上限の2倍以上である、請求項1に記載の方法。
  13. 請求項1から12の何れか1項に記載の方法を実行するよう構成される装置。
  14. コンピュータに請求項1から12の何れか1項に記載の方法を実行させるプログラム。
JP2021050981A 2021-03-25 2021-03-25 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム Active JP7430153B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021050981A JP7430153B2 (ja) 2021-03-25 2021-03-25 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム
US17/669,258 US20220308013A1 (en) 2021-03-25 2022-02-10 Method for correcting data related to electrophoresis, method for determining whether peak is sample-derived peak or spike, apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021050981A JP7430153B2 (ja) 2021-03-25 2021-03-25 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム

Publications (3)

Publication Number Publication Date
JP2022149047A JP2022149047A (ja) 2022-10-06
JP2022149047A5 JP2022149047A5 (ja) 2023-02-24
JP7430153B2 true JP7430153B2 (ja) 2024-02-09

Family

ID=83363290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021050981A Active JP7430153B2 (ja) 2021-03-25 2021-03-25 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム

Country Status (2)

Country Link
US (1) US20220308013A1 (ja)
JP (1) JP7430153B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510896A (ja) 1997-07-21 2001-08-07 バイオ−ラド・ラボラトリーズ・インコーポレーテッド パラプロテインのコンピュータ指示による検出
WO2008068831A1 (ja) 2006-12-04 2008-06-12 Shimadzu Corporation 核酸塩基配列信頼度の算定方法
US20100283785A1 (en) 2009-05-11 2010-11-11 Agilent Technologies, Inc. Detecting peaks in two-dimensional signals
WO2016132422A1 (ja) 2015-02-16 2016-08-25 株式会社島津製作所 ノイズレベル推定方法、測定データ処理装置、及び測定データ処理用プログラム
JP2017207449A (ja) 2016-05-20 2017-11-24 東ソー株式会社 ディジタルフィルタを備えた液体クロマトグラフ用データ処理装置
JP2020180983A (ja) 2020-07-22 2020-11-05 株式会社日立ハイテク キャピラリ電気泳動装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510896A (ja) 1997-07-21 2001-08-07 バイオ−ラド・ラボラトリーズ・インコーポレーテッド パラプロテインのコンピュータ指示による検出
WO2008068831A1 (ja) 2006-12-04 2008-06-12 Shimadzu Corporation 核酸塩基配列信頼度の算定方法
US20100070189A1 (en) 2006-12-04 2010-03-18 Shinichi Utsunomiya Method for assessing degree of reliability of nucleic acid base sequence
US20100283785A1 (en) 2009-05-11 2010-11-11 Agilent Technologies, Inc. Detecting peaks in two-dimensional signals
WO2016132422A1 (ja) 2015-02-16 2016-08-25 株式会社島津製作所 ノイズレベル推定方法、測定データ処理装置、及び測定データ処理用プログラム
JP2017207449A (ja) 2016-05-20 2017-11-24 東ソー株式会社 ディジタルフィルタを備えた液体クロマトグラフ用データ処理装置
JP2020180983A (ja) 2020-07-22 2020-11-05 株式会社日立ハイテク キャピラリ電気泳動装置

Also Published As

Publication number Publication date
JP2022149047A (ja) 2022-10-06
US20220308013A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
ES2757813T3 (es) Sistemas y procedimientos para el análisis automatizado de curva de fusión
WO2018101449A1 (ja) 肌特性解析方法
US20180314788A1 (en) Differential dissociation and melting curve peak detection
JP7430153B2 (ja) 電気泳動に係るデータを補正する方法、ピークが試料由来ピークであるかスパイクであるかを判定する方法、装置、およびプログラム
US6208941B1 (en) Method and apparatus for analysis of chromatographic migration patterns
KR101936934B1 (ko) 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
JP2004527728A (ja) ベースコーリング装置及びプロトコル
WO2015073650A2 (en) Automated nucleic acid repeat count calling methods
CN117275585A (zh) 基于lp-wgs和dna甲基化的肺癌早筛模型构建方法及电子设备
EP1798651B1 (en) Gene information display method and apparatus
JP4873011B2 (ja) 核酸の塩基配列決定方法
JP2005522223A (ja) 変異の検出および同定
EP2674886A2 (en) Methods and systems for high resolution melt analysis of a nucleic acid sequence
CN107250788B (zh) 噪声水平估计方法和测定数据处理装置
CN115497557A (zh) 一种针对靶向测序检测基因拷贝数变异的方法及装置
US20120088686A1 (en) Methods of array data wave correction
EP1997050B1 (en) Methods for resolving convoluted peaks in a chromatogram
Nezhat et al. Detection of deletions/duplications in α-globin gene cluster by multiplex ligation-dependent probe amplification
KR20220084472A (ko) 인지 부하를 고려한 정상상태시각유발전위 분류 방법
CN110970089A (zh) 胎儿浓度计算的预处理方法、预处理装置及其应用
CN114703263B (zh) 一种群组染色体拷贝数变异检测方法及装置
Forzy et al. Evaluation of semi-automatic image analysis tools for cerebrospinal fluid electrophoresis of IgG oligoclonal bands
CN115691662B (zh) 基于变构概率对近视/高度近视相关snp风险的排序方法和系统
JP3875171B2 (ja) 遺伝子発現データの正規化方法
Noguchi et al. About sequence quality: impact on clinical applications

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240130

R150 Certificate of patent or registration of utility model

Ref document number: 7430153

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150