JP2007526979A - 生体分子サンプルの特性を決定する方法 - Google Patents

生体分子サンプルの特性を決定する方法 Download PDF

Info

Publication number
JP2007526979A
JP2007526979A JP2006505504A JP2006505504A JP2007526979A JP 2007526979 A JP2007526979 A JP 2007526979A JP 2006505504 A JP2006505504 A JP 2006505504A JP 2006505504 A JP2006505504 A JP 2006505504A JP 2007526979 A JP2007526979 A JP 2007526979A
Authority
JP
Japan
Prior art keywords
characteristic
data
sample
measurement data
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006505504A
Other languages
English (en)
Other versions
JP4664280B2 (ja
Inventor
シュレーダー,アンドレアス
ラック,トーマス
シュトッカー,ズザンネ
ミュラー,オディーロ
ザロウスキー,リュディガー
ライバー,ミヒャエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of JP2007526979A publication Critical patent/JP2007526979A/ja
Application granted granted Critical
Publication of JP4664280B2 publication Critical patent/JP4664280B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

測定データからデータ解析によって多数の所定の特徴を抽出し、抽出された特徴から特性アルゴリズムを用いて特性値を算出することによる、生体分子サンプルの測定データに基づく、特性値で表現された生体分子サンプルの特性決定方法を開示する。
【選択図】 図15

Description

本発明は、生体分子サンプルの特性を決定する方法に関する。
リボ核酸(RNA)は全ての生物の細胞およびいくつかのウイルスに含まれるバイオポリマーであり、タンパク質を構築する際に様々な役割(主として、DNAの遺伝情報の運搬)を担っている。したがって、RNAは、マイクロアレイ・ハイブリダイゼーション試験およびRT−PCR、ならびに、例えば、ノーザンブロット、RNase保護アッセイ、またはcDNA合成の下でのゲノムの調査において使用される。かかる実験およびそれらの結果の有意性は、使用するRNAサンプルの特性に大きく依存する。
RNAバイオポリマーのサイズ分布は完全性の基準であり、すなわち関係するRNAサンプルの特性である。RNAサイズ分布は、関係する物質の起源および調製方法によって変化するが、RNA分解酵素(RNase)の混入または不適切な操作による機械的せん断力によって大きく影響を受ける。任意の事象において、分解が生じているときは常に、RNAポリマーの長さはより短くなることが見受けられる。
従来、RNAバイオポリマーは、ゲル電気泳動により分析される。例えば、出願人Agilent Technologies社により提供される、Agilent 2100 Bioanalyzerを用いたラボ・オン・チップ(Lab on a chip)分析は、ゲル電気泳動に対して、正確に再現可能な、高分解能の方法を提供する。Bioanalyzerは、特に、RNA解析のための業界標準となっている。したがって、それを用いて得られるデジタルエレクトロフェログラムは、より詳細な解析のための理想的な出発点を示す。
RNA分子の特性はその完全性の基準として理解することができる。例えば、せん断力による分解または切断を受けることなく、RNA分子が全体として細胞または組織からの抽出に耐えた場合、RNA分子は高い完全性を有することになる。完全性の基準は、例えば、サンプルが、分解またはせん断の兆候をどの程度示すのかを(例えば、調製中に無傷で残っているサンプルにより示される最大値によって)示すことが可能である。
これまでは、信頼可能な特性決定は、手作業による(したがって、多かれ少なかれ主観的な)方法のみを用いて取得可能であった。手作業による方法の下では、各個別のサンプルを、後に続く実験において使用する前に、経験を積んだ生化学者が完全性について視覚的に調べる必要がある。手作業による特性決定は、行われるRNA実験の数が増加し、ハイスループットな分析方法が現れて来るにつれて、受け入れられなくなりつつある。
単一の特徴、またはわずか2、3の特徴に基づいて、RNAサンプルの特性評価を可能にする方法は公知である。これまでに知られている最良の方法では、28S−rRNA−断片と18S−rRNA−断片についての曲線下面積の比率に対する判断基準が確立されている。理論的には、無傷のRNAサンプルは比率2を有する。この比率は、分解が進むにつれ低下し、また、無傷のRNAと分解されたRNAとを識別するための(実際にはこの比率と理論値との大きな偏差が時々生じることから、相対的に正確ではないが)初期的手段をもたらす。この判断基準は、RNAサンプル特性の自動決定における最新技術とみなされている。
本発明の目的は、生体分子サンプル特性の改良された決定方法を提供することである。
本発明の目的は本出願の独立請求項によって解決される。好ましい実施形態は従属請求項によって示される。
本発明は様々なタイプの生体分子サンプルについて使用することができるが、本発明は、特に、RNAに対して有効でありかつ有用であることが示されており、この記載における強調は、RNAにおいてのみの適用範囲に限定されることなく、生体分子としてのRNAに対してなされる。その他の生体分子サンプルとしては、例えば、RNAサンプル、DNAサンプル、タンパク質サンプル、ペプチドサンプル、糖サンプル、脂質サンプル、および前記生体分子サンプルの1以上の修飾形態を挙げることができる。
さらに、本発明は、生体分子サンプルの分析から得られる様々な種類の測定データに対して適用することができる。しかしながら、電気泳動は、多くの生体分子に対して有効かつ有用な方法として認識されており、この記載における強調は、エレクトロフェログラムにおいてのみの適用範囲に限定されることなく一つの例として、電気泳動分離からの測定データで表されるエレクトロフェログラムに対してなされる。クロマトグラムはその他の種類の測定データの例となりうる。しかしながら、いずれかの他のタイプの測定データを適宜適用させることもできる。
本発明の実施形態は、例えば、エレクトロフェログラムに基づく、例えば、RNAサンプルの特性を決定する、自動化された信頼しうる方法の開発を可能にする。このことは、関係する生体分子材料の供給源および種類とは独立的であり、例えば、生物種、細胞条件、組織もしくは臓器の種類、関係する生物、ならびに、例えば、RNAサンプル中のRNA濃度、ならびにそれらの調製方法とは独立的であり得る。
本発明の実施形態は、客観的、一般的、かつ再現可能な特性値により、生体分子サンプルを特徴付けることを可能にする。このことにより、特性の調節および特性の確証を行う新たな機会が開かれ、例えば、様々な製造業者による生体分子サンプルや様々な起源を有する生体分子サンプルの特性の客観的比較、ならびに、生体分子サンプル(例えば、様々なゲノム実験において使用されるRNA)の特性に課せられる最小要求の標準的決定に対する新たな機会が開かれる。
例えば、本発明の実施形態は、例えば、Agilent 2100 Bioanalyzerおよび「真核生物全RNAナノアッセイ(Eukaryote Total RNA Nano Assay)」を用いて分析されたRNAサンプルに対して適用することができる。後者のアッセイは、RNA 6000 Nano LabChip(登録商標)キットの使用を指示しており、該アッセイは、ナノグラム濃度(すなわち、5ng/μl〜500ng/μl)の真核生物RNA由来のRNAを分析するために使用することができる。「全RNA」とは、mRNA、rRNA、およびtRNAからなる細胞の全RNA調製物として規定される。
本発明の実施形態は、特に、Agilent 2100 Bioanalyzerシステムを使用することにより利用可能なその他のタイプの(例えば、RNA)アッセイと共に組み合わせることができる。例えば、「真核生物全RNAピコアッセイ(Eukaryote Total RNA Pico Assays)」はピコグラムレベルのRNA濃度を使用する。本発明の実施形態は、原核生物由来のRNAの特性を決定するためにも使用できる。原核生物RNAと真核生物RNAとの間の大きな違いは、リボゾーム断片中に生じるそれらポリマーの長さである。さらに、本発明の実施形態は、mRNAアッセイ(「真核生物mRNAナノ」、「真核生物mRNAピコ」、「原核生物mRNAナノ」、「原核生物mRNAピコ」)に対して使用することができる。mRNA調製物は、細胞の全RNAのmRNA部分を独占的に含むことが理想的である。
同様に、本発明の実施形態は、例えば、Agilent 2100 bioanalyzerシステムの「Protein 200 Plus」を介したタンパク質サンプルの特性評価に適合させることができる。
電気泳動図は通常「エレクトロフェログラム」と呼ばれる。これらの図は、移動時間の関数として分析したサンプル(例えば、RNA)断片量のプロットを表す。これは、例えば、Agilent 2100 Bioanalyzerまたはその他のゲル電気泳動法(例えば、キャピラリー電気泳動法およびチップ電気泳動法)を用いて測定することができる。エレクトロフェログラムに基づくデータポイント全体も日常的には「エレクトロフェログラム」と呼んでいる。
エレクトロフェログラムのデータポイントは好ましい実施形態に対するインプットを形成する。最初のステップでは、いくつかの所定の特徴(f1,K,f1)を、関係するエレクトロフェログラムから抽出する。2番目のステップでは、特性アルゴリズムを用いて、特性値をそれらの特徴から計算する。
例えば、RNAサンプルに適用し、エレクトロフェログラムを使用する、本発明の有益な実施形態に従うことにより、特性アルゴリズムを以下のプロセス手順である、所定のRNAサンプルセットを網羅する統計的に有意な数の試験的RNAエレクトロフェログラムを収集するステップ(A)と、全てのエレクトロフェログラムに特性ラベルqを付与するステップ(B)と、データ解析を利用して、エレクトロフェログラムからできるだけ多くの特徴を抽出するステップ(C)と、特性ラベル間の機能的な相互関係と、(例えば、適合方法を用いた)特徴の特定の組み合わせとを決定するステップ(D)と、格付け因子(例えば、Bayesian法を用いて決定される事後確率(a posteriori probability))を全ての機能的な相互関係に付与するステップ(E)と、特性アルゴリズムとして最大の格付け因子を有する機能的相互作用を特定するステップ(F)とによって決定することができる。
収集する試験的測定データ(例えば、エレクトロフェログラム)の数は、できるだけ多くする必要がある。かかる試験測定データは、実際に適用した場合のデータを正確に反映させる必要がある。
好ましくは、全てのサンプルについて予め特性ラベルを注意深く付与する。これらの特性ラベルは、特性の最良の組み合わせを選択するため、およびニューラルネットワークを指導するために後に利用しうる目標値を表すことができる。
例えば、RNAサンプルの特性は連続的に変化しうるパラメーターである。このことは、自然の特性分類というものは存在しないことを意味し、そのことが、本発明の別の有益な実施形態のもとにおいては別の特性分類が確立される理由である。例えば、7つの特性分類を導入することができる。最悪の特性サンプルに特性ラベル「1」を付与し、第1特性分類に割り当てる。少し良好な特性を示すサンプルには特性ラベル「2」を付与し、第2特性分類に割り当てる等である。最終的に、最良の特性サンプルに特性ラベル「7」を付与する。
適応可能方法は、特性決定のための特徴の最良の組み合わせが自動的に選択され、特性が特徴の組み合わせに基づいて適用されるように学習するという利点を有する。
この時点で、付与された特性ラベルq∈{1,...,7}を伴う全ての測定データの全体が、さらなる方法を開発するための可能な限りの知識の基礎を構成する。
測定データから特徴を抽出する目的は、そこからできるだけ多くの重要な特徴を抽出することである。本発明の実施形態にしたがい、エレクトロフェログラムは、その目的のために、プレ領域、マーカー領域、5S−領域、早期領域、18S−領域、中間領域、28S−領域、およびポスト領域のセグメントにさらに分割される。
次に、それらの各セグメントを別々に検討し、その検討により、セグメント内に含まれる特定のエレクトロフェログラムの形を十分正確に総合的に表す、特定のセグメントに対して特有のいくつかの局所的特徴が得られる。いくつかの全体的特徴(すなわち、いくつかのセグメントにまたがる特徴)も抽出する。このプロセスステップの結果は、例えば、エレクトロフェログラムあたり約100の特徴のリストとなり得る。
データ解析の基礎は、関係した特定の測定データ(例えば、エレクトロフェログラム)中に生じた極値(すなわち、ピーク)のリストである。ピークは、データ曲線を統合することにより検出することができる。この統合によって、ピークの高さ、幅、およびピーク下の面積とともに、ピークの位置およびその始点と終点が得られる。
Agilent 2100 Bioanalyzerシステムソフトウェアの実行についで、いくつかのピークに「ラダーピーク」、「マーカー」、「18Sピーク」、または「28Sピーク」というタグを付加することができる。この統合およびタグを付加するという方法により、よりよい正確性がもたらされ、「ゴーストピーク」または「スパイク」などの異常例に対する影響を受けにくくなる。本発明の実施形態にしたがい、第1の4つのラダーピークの位置、高さ、および面積の線型統計モデルがこの目的のために提供される。ラダーのこれら4つのピークは、このモデルに集合的に最良に適合し、「ラダーピーク」と名づけられ、そのようにラベルされる。
ラダーの第1のピークは、低分子量マーカーであり、その位置、高さ、および面積は、ドリフト効果を無視した場合には、チップのその他のサンプルにおける低分子量マーカーの位置、高さ、および面積と一致する。低分子量マーカーの位置、高さ、および面積に加えて、今度は、チップのサンプル中における低分子量マーカーのドリフトも考慮した統計モデルを再度設定する。13のピークそれぞれは、このモデルに最高に適したチップの各サンプルに対する1つのピークであり、低分子量マーカーとラベルする。
マーカーおよび18Sのピークおよび28Sのピークの位置における相互関係をモデルの中でまとめ、また、関係を有するピークを18Sのピークおよび28Sのピークのようにそれぞれラベルすることができる。分解が深刻なRNAの場合には、18Sのピークおよび28Sのピークはバックグラウンドからもはや識別できず、このような場合にもなお、特性分類のための次なるさらなる分割を可能にするための、予めの標識付けにもとづいて、18Sのピークおよび28Sのピークの計算による位置を算出することができる。
1実施形態において、この方法を使用することにより得られるラベル付けが、より低分子量のマーカーの手作業によるラベル付けと合致しない率は全ケースのうちのわずか0.8%であり、18Sのピークおよび28Sのピークの手作業によるラベル付けと合致しない率は全ケースのうちの1.2%である。
本発明および上記のタグ付け方法による実施形態における鋭意検討の下、全ての測定データ(例えば、エレクトロフェログラム)を、全データ面積をカバーする上記の8つの連続するセグメントにさらに分割することができる。より低分子のマーカーに先行するセグメントをプレ領域と設計する。マーカー領域は、より低分子のマーカーによって占有される面積と一致する。18S−領域および28S−領域のそれぞれは18Sのピークおよび28Sのピークをそれぞれカバーする。2つの領域、5S−領域および早期領域は、マーカー領域と18S−領域の間に位置する。これらの2領域間の好適な結合を、より低分子のマーカーの位置および、5.8S、5S rRNAおよびtRNAを含むサンプルの5.8S/5S/tRNA−ピークの位置から決定し、低分子マーカーの位置に基づいて、すべてのサンプルに転写される。中期領域は18S−領域および28S−領域の間に位置する。図1は更なる分割の実施を説明する。
例えば、エレクトロフェログラムのベースラインの補正は、いくつかの違いは有するものの、Agilent 2100 Bioanalyzerのシステムソフトウェアにより採用される補正実行に実質的に従い得る。
ノイズが無視される場合、ベースラインはプレ領域およびポスト領域セグメントに渡って一定に維持され得るのが理想的である。ベースラインレベルはエレクトロフェログラムごとに大きく異なり得る。いくつかの例では、ベースラインは傾斜していてもよく、または波型を示していてさえよい。後者の場合は、データ取得中に問題が生じたことを明らかに示す。
ベースライン補正の根底にある考えは、一定の値で、または直線的に増加もしくは減少する値で、データシグナルからバックグラウンド部分を消去することである。本発明の実施形態にしたがい、データシグナルと一致し、ノイズによる寄与を示す直線(すなわち、プレおよびポスト領域セグメント範囲内の、ノイズ標準偏差σnoiseによる、データシグナルと異なる平均の直線)を見出す試みを行う。ノイズ標準偏差σnoiseの計算には、文献から知られた方程式を通常使用する。
実際の特徴抽出を始める前に、5S−領域、早期領域、18S−領域、中間領域、および28S−領域範囲内で生じる全体的な最大データシグナルに対して上記データシグナルを標準化する。異なる濃度の処理をより良く行うために、マーカー領域はここでは無視する。上記にリスト化されるセグメントは、「利用区分」と称されるデータ曲線の1部分におよぶ。
オリジナルなデータ曲線に加えて、その他の平滑化データ曲線を使用することもできる。例えば欧州特許出願第0 969 283 A1号に記載のSavitzky−Golayフィルターおよびローリングボールアルゴリズムが、データ曲線の平滑化のために好適に使用される。
以下に示す任意のセグメントの特徴である、セグメント範囲内で生じる最大値および最小値と、セグメント領域範囲内の減少曲線における点に対し、直線を挿入した該直線の勾配およびy切片と、セグメントの始点および終点におけるこの挿入した直線のy値と、セグメントの曲線下面積と、セグメントの挿入直線下面積と、利用区分下面積に対するセグメントの曲線下面積の比率と、利用区分下面積に対するセグメントの挿入直線下面積の比率と、データ曲線からの挿入直線のずれと、オリジナルデータ曲線からの平滑化データ曲線のずれとをオリジナルおよび平滑化データ曲線から抽出し得る。
以下の全体的特徴である、全RNA比率、すなわち、利用区分範囲内に含まれる全面積に対する18S−断片および28S−断片の合計面積の比率と、28/18比率、すなわち18S−断片に対する28S−断片の面積の比率と、シグナル/ノイズ比率と、ノイズ標準偏差と、サンプルの濃度(所定の濃度を有し、サンプルに対するデータ曲線の下面積を有するラダーについてのデータ曲線下面積から計算し得る)とがまた抽出され得る。
測定データ(例えば、RNAエレクトロフェログラム)から抽出される特徴の全体性、およびそれらの関連する特性ラベルqは、特性ラベルおよび好適な特徴の組み合わせにおける機能的な相互関係を決定する実施態様ステップに対する、全体的な知識のベースを形成する。使用される特徴の組み合わせおよび含まれる機能的な相互関係は、例えば、適応可能な方法を用いて決定することができる。
好適なモデルを選択することは、適応可能な方法の性能に対して非常に重要である。モデルが適合可能なより多くのパラメーターを含むほど、実行可能な機能的な相互関係を決定するためにより多くのトレーニングデータが必要とされることになる。
正方向送りの2層ニューラルネットワークの場合、「モデル」は上記ニューラルネットワークのインプット層に含まれるニューロンおよび隠れ層に含まれるニューロンの総数として定義される。含まれる適応可能なパラメーターは、隠れニューロンに関するインプットニューロンの重み付け因子であり、さらに、アウトプットニューロンに関する隠れニューロンの重み付け因子である。好ましくは、ニューラルネットワークへのインプットとして、可能な限り少数の特徴を選択する。このような特徴の組み合わせが、特性ラベルにおいて十分な情報を伝える必要がある。
本発明のその他の有益な実施形態にしたがって、特性ラベルにおいて最大の情報を得るための特徴を検索することにより開始される、反復的な順方向検索が実行される。第2ステップの下、特性ラベルに関連した第1の特徴情報内容に対する最適な補足情報が検索される。反復的な順方向検索の更なるステップは、リストに追加される最後の特徴の内容が、すでにリスト上にあるそれらの特徴の特性ラベルに関し最適に追加されるように、リスト中の特徴を配列する。
この全ての反復的な順方向検索において、共通の情報、すなわち、特徴および特性ラベルの組み合わせにおける共通の情報内容が最大化される。
共通の情報の定義および、共通の情報に関する情報は、関係する文献中に見出されるであろう。quantiom bioinformatics GmbH i. G.より供給されるquantumソフトウェアパッケージによるquantum SELソフトウェアルーチンを、この共通情報の計算のために使用することができる。このソフトウェアおよび会社における情報は、http://www.quantiom.deにおいて入手可能である。
このモデル自体、すなわち使用される特徴の組み合わせおよび隠れニューロンの数は以下のステップの下で決定することができる。
リスト(f1,K,fn)の第1番目の特徴f1と特性ラベルとの間の最良の機能的な相互関係を決定するための試みから開始する。求められる1特徴の機能的な相互関係の複雑性は、隠れニューロンの連続的付加により増加し得る。格付け因子は、それぞれのこのような機能的な相互関係について計算され得る。隠れニューロンの数が増えると、見出される相互関係の格付け因子は最初増加し、次いで減少する。このモデルは、最初は十分に複雑ではないであろう。しかし、過度に複雑なモデルは過剰なパラメーターを取り込み、それらの値は、もはや所定のデータベースを用いて容易に決定できなくなる。
格付け因子の最大値を得る特徴f1および隠れニューロンの数は、特性アルゴリズムに対する最良の1特徴モデルを表す。
次いで、リストからさらなる特徴を連続的に追加することにより、格付け因子を増加させ、特徴(f1,f2),(f1,f2,f3)等の連続する組み合わせに関する、隠れニューロンの最適数および得られる格付け因子を見出すことを試みる。
格付け因子は最初増加し、次いで減少する。格付け因子が最大化されるような特徴(f1,f2,K,fl)、および関連する隠れニューロンの数の組み合わせが、特性アルゴリズムのために使用されるモデルを表す。この方法を図12に示す。
本発明による有益な実施形態に従い、Bayesian法を用いて格付け因子を決定する。例えば、最大事後確率(MAP)法が使用され得る。MAP法のもと、トレーニングデータに基づく所定のモデルについて最大事後確率が計算される。事後確率はこのモデルに関する格付け因子である。選択されるモデルを用いてニューラルネットワークの重み付け因子を適合させることにもMAP法を使用する。さらなるMAP法に関する情報は、関係する文献中に見出すことができるだろう。
MAP法は、上述のquantumソフトウェアパッケージによるquantum LEADソフトウェアルーチンの下で実行することができ、本明細書中で取り扱う方法の場合に使用することができる。
所定のエレクトロフェログラムに関して、特徴の所定の組み合わせから特性値を計算する特性アルゴリズムを得ることができる。この計算される特性値は小数であり、好ましくは導入される特性ラベルの状況において解釈される。例えば、特性ラベル5.8は、試験下のエレクトロフェログラムが、特性ラベル6を有する試験用エレクトロフェログラムのセットにおける平均エレクトロフェログラムより、わずかに悪いことを示すが、平均特性5を有する試験用エレクトロフェログラムのセットの平均エレクトロフェログラムよりは、かなり良いことを示す。
本発明の有益な1実施形態にしたがって、特性値および、含まれるサンプルが異常である度合を測定する。例えば、エレクトロフェログラムにおいて観察される多数の異常例を考慮して、かなり高頻度におこるかまたは特性値の有意味性に深刻に影響し得るもののみを考慮する。含まれる測定データは、これら所定の異常例の存在を検出するために検討され、また、したがって、特性値は潜在的な異常における情報の追加により富化される。本発明の実施形態によれば、以下の異常例、ゴーストピークと、スパイクと、プレ領域、5S−領域、早期領域、中期領域、およびポスト領域においてベースラインの問題に加えて生じるその他の異常とは所定のものである。
含まれるそれぞれの異常例に関する、それらの所定の特徴における数個を、好ましくは全ての異常例に関してエレクトロフェログラムから抽出し、また、関係する異常例アルゴリズムを用いて各異常例の存在を計算する。その結果、二元性の要素はエレクトロフェログラムが伴う各々の異常例を含むか示す。
異常例が検出されない場合においては、含まれるエレクトロフェログラムは異常例を含まないものとみなされる。さもなければ、異常例の影響を受けているとみなされ得る。異常の発生は特性値の信頼できる計算の妨害となる。したがって、異常例はまず計算され、さらにエレクトロフェログラムが異常の影響を受けていることが確認された場合には、特性値の計算を中止する。
異常例は、5S−領域、早期領域、および中期領域の異常例、ベースラインの問題などの重大な異常例と、プレ領域およびポスト領域の異常例などの重大でない異常例とにさらに分割され得る。重大でない異常例が起きた場合、特性値は依然として相対的に信頼性をもって計算することができ、重大でない異常を含むという通知を伴ってユーザーに報告される。このことを考慮し、エレクトロフェログラムが異常である度合、すなわち、異常がないか、重大でない異常の影響を受けているか、または異常の影響を受けているか言及がなされる。
個々の異常例アルゴリズムを決定するため、特性ラベルに代えて異常例ラベルを使用する以外は特性アルゴリズムの決定に使用されるものと類似のやり方で、ステップA〜Fの方法が実施される。
本発明の実施形態によれば、ひとたび上述のステップが結論付けられれば、サンプルの特性を決定するための方法が得られる。それらの特性を決定する方法は、その非常に高い性能および信頼性において顕著に優れる。
本発明は、任意の種類のデータ記憶媒体に保存されるか任意の種類のデータ記憶媒体より提供され、任意のデータ処理ユニットにより実行され得る1つ以上の好適なソフトウェアプログラムによって、部分的または全体的に具体化されまたサポートされる。
本発明の実施形態のその他の目的および多くの付随する利点は、図面を伴う以下の好ましい実施形態のより詳細な記述を参照することにより、容易に理解され、かつより理解されるであろう。実質的にまたは機能的に等しいもしくは類似の特徴は、同じ参照記号を用いて参照するものとする。
図面は、本発明に従う方法の複数の詳細について説明する。
図1は、以下の8領域、プレ領域と、マーカー領域と、5S−領域と、早期領域と、18S−領域と、中期領域と、28S−領域と、ポスト領域とにおいて、エレクトロフェログラムのさらなる分割を示す。
図2は、アッセイにより既定された、既知の長さおよび濃度の7つのRNA断片を含む典型的なラダーを示す。このエレクトロフェログラムを解析し、定量のために使用する。
図3a−3fは、特性が減少する順の様々な特性の全RNAサンプルのエレクトロフェログラムを示す。すなわちこれらの特性は、図3aから図3fまで減少していく。より低いマーカー、それらの初発ピークに加えて、良好な特性を有するRNAサンプルは、18S−rRNA−断片および28S−rRNA−断片における認識可能なピークをもはっきりと示す。それらのrRNA−断片におけるピークは、それらの特性を減少させるほどにははっきりと増加せず、バックグラウンドから区別することもできない。左側のより短い移動時間、すなわちより低分子量の側へとシフトする分解されたRNAを示す山が同時に形成される。
図4は、比較可能な特性および濃度を有する全RNAサンプルのエレクトロフェログラムを示す。それらの5S−領域(5.8Sおよび5S rRNAを含み得る)は、tRNAと同様に、それらの調製に用いる方法に大きく依存する。図4aに示すエレクトロフェログラムは、5S−領域における大量のRNAを含む。5.8Sおよび5S rRNA画分は、図4bのサンプルにおけるtRNA部分同様、調製の間に大部分が濾過除去される。
図5は、各濃度が2mg/μl、250ng/μl、および25ng/μlの、比較可能な特性を有する3つのRNAサンプルのエレクトロフェログラムを示す。図5a、5c、および5eは、共通のスケール因子を使用した場合に対するRNAサンプルのエレクトロフェログラムを表す。これらのマーカーの濃度は全RNAナノアッセイにより既定される。もし共通のスケール因子を使用した場合、それらのマーカーは同じ高さとなり、一方、18S−領域および28S−領域におけるピークの高さは変化するであろう。図5b、5d、および5fは異なるスケール因子を使用した場合の同じサンプルのエレクトロフェログラムを示す。
図6は、28Sの主ピークおよび良好に既定された28S共ピークの両方を示す。
図7は、ゲル電気泳動を行った場合、およびその結果得られるエレクトロフェログラムから得られるであろうゲル上の外観をシミュレートする、RNAサンプルのゲル上の表現を示す。このゲル上の表現において、シャープな幅の狭いバンドは、良好に既定されたシャープなピークに相当する。より幅の広い灰色のバンドは波状の隆起に相当する。このゲル上の表現は特にドリフト効果を表示するのに好適である。この図はチップの13種類のサンプルを示す。最初のサンプルはラダーを含む。このラダーは使用されるアッセイにより既定されるRNA断片を含み、任意の標準化および濃度測定を可能にするために各チップに対し共分析される。その他の12種のサンプルは実際のRNAサンプルを含む。図は典型的なドリフト効果を説明する。マーカーおよび18Sのピークおよび28Sのピークは全サンプルの場合において波状の曲線を形成する。
図8は、妨害となるいくつかのゴーストピークを示すエレクトロフェログラムを示す。
図9aは、真のシグナルの上に重ね合わされたゴーストピークを示すエレクトロフェログラムを示す。マーカーおよび18Sの断片および28Sの断片はほとんど識別できない。図9bは、好適に再スケール化した同じエレクトロフェログラムを示す。マーカーおよび両リボソームのピークは今や容易に識別できる。
図10は、スパイクを示すエレクトロフェログラムを示す。スパイクは滅多に生じることのない、わずか数データポイントの幅しかない高いピークである。
図11aは、理想的な水平のベースラインを有するエレクトロフェログラムを示す。図11bに示すエレクトロフェログラムのベースラインははっきりした勾配を有するが、まだ許容され得る。図11cは、データ取得の間に問題が生じることを示唆する波状のベースラインを有するエレクトロフェログラムを示す。これらの図は、図11aおよび11bにおいて見られるベースラインレベルおよびマーカーの高さの比較によりわかる、チップ間での明らかな蛍光レベルにおける隆起のずれをも説明する。使用されるデータ解析は、したがって、限定的に、相対的または標準化された蛍光レベルを計算する。
図12は、モデルの選択において含まれる方法を説明する。ベクトルf1,(f1,f2),・・・ (f1,K,fl),・・・,(f1,K,fn)を特徴づけるために、隠れニューロンの異なる数値l,K,hを用いたいくつかのモデルが育成されている。異常例を同定し、また特性値を決定するためには、h=7の値がより満足できる。モデルがより複雑になるほど、すなわち使用される特徴および隠れニューロンの数が増えるほど、含まれる課題に対しモデルが十分に複雑になるまでの証拠は、最初は増加するであろう。証拠は次いで減少するであろう。なぜならモデルがあまりに複雑になりすぎるためである。最良の事後確率、または証拠を有するモデルを次いで選択する。
図13aおよび13bは、オリジナルデータ曲線から抽出される、早期領域に出現する特徴の例を示す図である。エレクトロフェログラムの最大値が1.0に標準化されていることに留意されたい。データ曲線の最大値および最小値を図13aにおけるポイントで示す。データ曲線下の面積は黒色で塗られている。図13bにおいて、挿入された直線は実線で表され、早期領域の終点において挿入された実線直線の縦座標をポイントで示す。データ曲線のこの挿入直線からのずれを黒色で塗って示した。
図14に示すフローチャートは、特性値の決定、およびその値に対しエレクトロフェログラムが異常例に影響を受ける計算値に依存した特性値の計算を含む方法を説明する。異常例に影響を受けるエレクトロフェログラムの特性値の出力はほとんど意味がない。
図15に示すフローチャートは、特性アルゴリズムの決定において含まれる方法を説明する。個々の異常例アルゴリズムを決定するためにも、これら同様の方法が使用される。
エレクトロフェログラムをセグメントにさらに分割したものを示す図である。 ラダーを示すエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な特性の様々なRNAサンプルのエレクトロフェログラムを示す図である。 様々な方法を用いて調製したRNAサンプルのエレクトロフェログラムを示す図である。 様々な方法を用いて調製したRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 異なるスケールにおいて比較し得る3つのRNAサンプルのエレクトロフェログラムを示す図である。 複数のピークが共通の断片を伴うエレクトロフェログラムを示す図である。 RNAサンプルをゲル上に示した図である。 ゴーストピークを示すエレクトロフェログラムを示す図である。 ゴーストピークを示すエレクトロフェログラムを示す図である。 ゴーストピークを示すエレクトロフェログラムを示す図である。 スパイクを示すエレクトロフェログラムを示す図である。 様々なタイプのベースラインを有するエレクトロフェログラムを示す図である。 様々なタイプのベースラインを有するエレクトロフェログラムを示す図である。 様々なタイプのベースラインを有するエレクトロフェログラムを示す図である。 モデルの選択において含まれる方法を説明する図である。 早期領域から抽出される特徴を示す図である。 早期領域から抽出される特徴を示す図である。 特性値の決定において含まれる方法を説明するフローチャートである。 特性アルゴリズムの決定において含まれる方法を説明するフローチャートである。

Claims (28)

  1. 測定データからデータ解析を用いて多数の所定の特徴を抽出するステップと、
    前記抽出された特徴から特性アルゴリズムを用いて特性値を算出するステップと
    を含む、生体分子サンプルの測定データに基づく、特性値で表現された生体分子サンプルの特性を決定する方法。
  2. 所定数の潜在的な異常例から1つ以上の異常例が特定されることと、
    生体分子サンプルの測定データから、全ての異常例に対するデータ解析を用いて多数の所定の特徴が抽出されることと、
    前記測定データが同定される全ての異常例を検証するために、関連する異常例アルゴリズムを用いて解析されることと、
    生体分子サンプルが異常である度合を測定するために、存在する異常例の組み合わせから関係する異常の度合が決定されることと
    の特徴の少なくとも1つを含む請求項1に記載の方法。
  3. 所定の生体分子サンプルのセットを網羅する統計的に有意な数の試験的測定データを収集するステップと、
    全ての測定データに特性ラベルを付与するステップと、
    前記測定データからデータ解析を用いて特徴を抽出するステップと、
    前記特性ラベルおよび抽出される特徴の1つ以上の組み合わせにおける機能的な相互関係を決定するステップと、
    全ての機能的な相互関係に対して格付け因子を付与するステップと、
    特性アルゴリズムとして最高の格付け因子を有する機能的な相互関係を特定するステップと
    を特性アルゴリズムを決定するために行う請求項1または2に記載の方法。
  4. 特性ラベルおよび抽出される特徴の様々な組み合わせの中における機能的な相互関係を適応可能な方法を用いて決定する請求項3に記載の方法。
  5. 所定の生体分子サンプルのセットを網羅する統計的に有意な数の試験的測定データを収集するステップと、
    全ての測定データにおける所定の異常例に対して異常例ラベルを付与するステップと、
    測定データからデータ解析を用いて特徴を抽出するステップと、
    前記異常例ラベルおよび抽出される特徴の1つ以上の組み合わせにおける機能的な相互関係を決定するステップと、
    全ての機能的な相互関係に対して格付け因子を付与するステップと、
    異常例アルゴリズムとして最高の格付け因子を有する機能的な相互関係を特定するステップと、
    を所定の異常例に対する異常例アルゴリズムを決定するために行う請求項2に記載の方法。
  6. 前記異常例ラベルおよび抽出される特徴の様々な組み合わせの中における機能的な相互関係を適応可能な方法を用いて決定する請求項5に記載の方法。
  7. 測定データ特性のアクセス可能な領域に対して別々の分類が確立されており、かつ各分類について特性ラベルが付与されている請求項3または4に記載の方法。
  8. 7分類が特性ラベルについて確立されている請求項7に記載の方法。
  9. 異常例ラベルの認められた値として0および1が定められている請求項5または6に記載の方法。
  10. さらに特徴を抽出するために測定データをセグメントに分割する請求項1〜9のいずれかに記載の方法。
  11. 生体分子サンプルがRNAサンプルであり、RNAサンプルの測定データにおける8領域が、プレ領域と、マーカー領域と、5S−領域と、早期領域と、18S−領域と、中期領域と、28S−領域と、ポスト領域とのセグメントとして確立されている請求項10に記載の方法。
  12. 測定データにおいて生じているピークの位置、高さ、および幅を測定し、それらの面積が、測定データに対して行ったデータ解析のもとで、積分により計算される請求項1〜11のいずれかに記載の方法。
  13. 測定データのデータ解析において、測定データのデータ曲線または平滑化データ曲線のセグメントの局所的特性である、セグメント範囲内で生じる最大値および最小値、セグメント範囲内の減少曲線における点に対し点を結ぶ直線を挿入した該直線の勾配およびy切片、セグメントの始点および終点におけるこの挿入した直線のy値、曲線下面積、挿入直線下面積、全データ曲線下面積に対する挿入直線下面積の比率、データ曲線からの挿入直線のずれ、および/または、オリジナルおよび平滑化データ曲線のお互いからのずれを決定する請求項10または11に記載の方法。
  14. Savitzky−Golayフィルターおよび/またはローリングボールアルゴリズムをデータ曲線の平滑化のために使用する請求項13に記載の方法。
  15. 測定データのデータ解析において、生体分子サンプルがRNAサンプルであり、全体的特徴である、利用区分内に含まれる全面積に対する18S−断片および28S−断片の面積の比率、28S−断片に対する18S−断片の面積の比率、および/またはシグナル/ノイズ比率を決定する請求項1〜14のいずれかに記載の方法。
  16. 特性ラベルおよび/または異常例ラベルに関する情報が、各追加的特徴が付加されるにつれて徐々に最大化されるように抽出された特徴がリスト中に連続的に配列され、当該リストに対してある特徴が付加されるごとに新たな特徴の組み合わせを規定する請求項1〜15のいずれかに記載の方法。
  17. 前記リスト中の抽出された特徴の配列が相互情報に基づくものである請求項16に記載の方法。
  18. 前記適応可能な方法としてニューラルネットワークが使用される請求項4または6に記載の方法。
  19. Bayesian法がニューラルネットワークに対するパラメーターを調整するために適用される請求項18に記載の方法。
  20. 複雑性を変化させる機能的な相互関係を測定し、求める機能的な相互関係に必須の複雑性がニューロンネットワークに対する隠れニューロンの反復的付加により得られる請求項18または19に記載の方法。
  21. Bayesian法を用いて計算されたニューロンネットワークの事後確率を格付け因子として使用する請求項19に記載の方法。
  22. 生体分子サンプルが、RNAサンプル、DNAサンプル、タンパク質サンプル、ペプチドサンプル、糖サンプル、脂質サンプル、および前記生体分子サンプルの1以上の修飾形態を有する群の少なくとも1つを含む請求項1〜21のいずれかに記載の方法。
  23. 生体分子サンプルが、修飾形態の分子を含む、RNA分子、DNA分子、タンパク質分子、ペプチド、糖、または脂質などの公知な生体分子型の1つ以上を代表として含む請求項1〜22のいずれかに記載の方法。
  24. 特性値が生体分子サンプルの完全性の基準である請求項1〜23のいずれかに記載の方法。
  25. 測定データがエレクトロフェログラムである請求項1〜24のいずれかに記載の方法。
  26. エレクトロフェログラムからデータ解析を用いて多数の所定の特徴を抽出するステップと、
    抽出した特徴から特性アルゴリズムを用いて特性値を決定するステップと
    を含むRNAサンプルのエレクトロフェログラムに基づく、特性値で表現されたRNAサンプルの特性を決定する方法。
  27. コンピュータなどのデータ処理システムにおいて実行される、好ましくはデータ記憶媒体に保存された、請求項1〜26のいずれかに記載の方法を実行するためのソフトウェアプログラムまたは製品。
  28. データ解析を用いて測定データから所定の多数の特徴を抽出するおよび抽出した特徴から特性アルゴリズムを用いて特性値を決定する処理ユニットを含む、生体分子サンプルの測定データに基づく、特性値で表現された生体分子サンプルの特性を決定する装置。
JP2006505504A 2003-04-05 2004-03-29 生体分子サンプルの特性を決定する方法 Expired - Lifetime JP4664280B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10315581A DE10315581B4 (de) 2003-04-05 2003-04-05 Verfahren zur Qualitätsbestimmung von RNA-Proben
PCT/EP2004/050391 WO2004090780A2 (en) 2003-04-05 2004-03-29 Determining the quality of biomolecule samples

Publications (2)

Publication Number Publication Date
JP2007526979A true JP2007526979A (ja) 2007-09-20
JP4664280B2 JP4664280B2 (ja) 2011-04-06

Family

ID=33103220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006505504A Expired - Lifetime JP4664280B2 (ja) 2003-04-05 2004-03-29 生体分子サンプルの特性を決定する方法

Country Status (5)

Country Link
US (1) US8346486B2 (ja)
EP (1) EP1614055A2 (ja)
JP (1) JP4664280B2 (ja)
DE (1) DE10315581B4 (ja)
WO (1) WO2004090780A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012501458A (ja) * 2008-08-29 2012-01-19 バイオ−ラッド ラボラトリーズ,インコーポレイティド Rnaの完全性の測定
JP2015519887A (ja) * 2012-04-24 2015-07-16 アールエヌエー、ダイアグノスティックス、インコーポレイテッドRna Diagnostics Inc. Rna破壊を評価するためのアッセイ、方法および装置
WO2018163610A1 (ja) * 2017-03-10 2018-09-13 株式会社島津製作所 電気泳動解析方法、電気泳動解析装置及び電気泳動解析プログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1772522A1 (en) * 2005-10-04 2007-04-11 Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno Control of preservation by biomarkers
JP4807470B2 (ja) 2009-12-16 2011-11-02 東レ株式会社 Rnaの解析方法
WO2013090613A1 (en) * 2011-12-13 2013-06-20 Rutgers, The State University Of New Jersey Compositions and methods for functional quality control for human blood-based gene expression products
EP2925892B1 (en) * 2012-12-03 2019-02-06 RNA Diagnostics Inc. Methods for monitoring response to radiation therapies in cancer
WO2015048887A1 (en) 2013-10-04 2015-04-09 Rna Diagnostics Inc. Rna disruption assay for predicting survival
EP3692167B1 (en) * 2017-10-06 2024-03-13 Life Technologies Corporation Rna quality assay
CN112100432B (zh) * 2020-09-17 2024-04-09 咪咕文化科技有限公司 样本数据获取方法、特征提取方法、处理装置及存储介质
CN112131447B (zh) * 2020-09-29 2023-02-17 中国船舶重工集团公司第七二四研究所 一种雷达信号侦测数据样本标注方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08507365A (ja) * 1992-07-03 1996-08-06 アンスティチュ ナショナル ド ラ サンテ エ ド ラ ルシェルシュ メディカル(アンセルム) Dnaフラグメントのヌクレオチドのサイズの測定方法
JP2002505442A (ja) * 1998-03-06 2002-02-19 モレキュラー・ダイナミックス・インコーポレイテッド 生化学セパレーションの品質を評価する品質規準を用いる方法
WO2002023190A2 (en) * 2000-09-12 2002-03-21 Massachusetts Institute Of Technology Methods and products related to low molecular weight heparin

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5916747A (en) * 1995-06-30 1999-06-29 Visible Genetics Inc. Method and apparatus for alignment of signals for use in DNA based-calling
EP0944739A4 (en) * 1996-09-16 2000-01-05 Univ Utah Res Found METHOD AND DEVICE FOR ANALYZING PATTERNS OF CHROMATOGRAPHIC MIGRATION
CA2328881A1 (en) * 1998-04-16 1999-10-21 Northeastern University Expert system for analysis of dna sequencing electropherograms
WO2000075302A2 (en) * 1999-04-30 2000-12-14 Cyclops Genome Sciences Limited Isolation of nucleic acid
US6334099B1 (en) * 1999-05-25 2001-12-25 Digital Gene Technologies, Inc. Methods for normalization of experimental data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08507365A (ja) * 1992-07-03 1996-08-06 アンスティチュ ナショナル ド ラ サンテ エ ド ラ ルシェルシュ メディカル(アンセルム) Dnaフラグメントのヌクレオチドのサイズの測定方法
JP2002505442A (ja) * 1998-03-06 2002-02-19 モレキュラー・ダイナミックス・インコーポレイテッド 生化学セパレーションの品質を評価する品質規準を用いる方法
WO2002023190A2 (en) * 2000-09-12 2002-03-21 Massachusetts Institute Of Technology Methods and products related to low molecular weight heparin

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012501458A (ja) * 2008-08-29 2012-01-19 バイオ−ラッド ラボラトリーズ,インコーポレイティド Rnaの完全性の測定
JP2015519887A (ja) * 2012-04-24 2015-07-16 アールエヌエー、ダイアグノスティックス、インコーポレイテッドRna Diagnostics Inc. Rna破壊を評価するためのアッセイ、方法および装置
WO2018163610A1 (ja) * 2017-03-10 2018-09-13 株式会社島津製作所 電気泳動解析方法、電気泳動解析装置及び電気泳動解析プログラム

Also Published As

Publication number Publication date
DE10315581A1 (de) 2004-11-04
US20060246577A1 (en) 2006-11-02
EP1614055A2 (en) 2006-01-11
WO2004090780A2 (en) 2004-10-21
US8346486B2 (en) 2013-01-01
WO2004090780A3 (en) 2005-05-12
DE10315581B4 (de) 2007-06-28
JP4664280B2 (ja) 2011-04-06

Similar Documents

Publication Publication Date Title
Cox et al. Integrating gene and protein expression data: pattern analysis and profile mining
US9354236B2 (en) Method for identifying peptides and proteins from mass spectrometry data
JP4664280B2 (ja) 生体分子サンプルの特性を決定する方法
EP3182126A2 (en) Biomarker test for prediction or early detection of preeclampsia and/or hellp syndrome
US20190287646A1 (en) Identifying copy number aberrations
WO2015130696A1 (en) Reduction of bias in genomic coverage measurements
US20220165363A1 (en) De novo compartment deconvolution and weight estimation of tumor tissue samples using decoder
US20030194711A1 (en) System and method for analyzing gene expression data
WO2008007630A1 (fr) Méthode et appareil de recherche de protéine
CN112233722A (zh) 品种鉴定的方法、其预测模型的构建方法和装置
EP2926289A1 (en) Method and system for processing data for evaluating a quality level of a dataset
CN115831232A (zh) 一种癌症原发灶溯源方法、装置、系统及存储介质
JP5403563B2 (ja) 網羅的フラグメント解析における遺伝子同定方法および発現解析方法
US20030194701A1 (en) Diffuse large cell lymphoma diagnosis and outcome prediction by expression analysis
CN111028885B (zh) 一种检测牦牛rna编辑位点的方法及装置
JP5213009B2 (ja) 遺伝子発現変動解析方法及びシステム、並びにプログラム
CN114400045A (zh) 基于二代测序检测同源重组修复缺陷的方法、探针组、试剂盒和系统
JP7166638B2 (ja) 多型検出法
CN107614674A (zh) 检查系统、检查装置以及检查方法
CN115662519B (zh) 一种基于机器学习预测癌症的cfDNA片段特征组合及系统
Wainer-Katsir et al. BIRD: identifying cell doublets via biallelic expression from single cells
CN116825188B (zh) 基于高通量测序技术在多组学层面识别肿瘤新抗原的方法、装置及计算机可读存储介质
CN110475874A (zh) 脱靶序列在dna分析中的应用
CN115558716B (zh) 一种用于预测癌症的cfDNA片段特征组合、系统及应用
US20090215037A1 (en) Dynamically expressed genes with reduced redundancy

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110106

R150 Certificate of patent or registration of utility model

Ref document number: 4664280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250