JP5213009B2 - 遺伝子発現変動解析方法及びシステム、並びにプログラム - Google Patents
遺伝子発現変動解析方法及びシステム、並びにプログラム Download PDFInfo
- Publication number
- JP5213009B2 JP5213009B2 JP2007066506A JP2007066506A JP5213009B2 JP 5213009 B2 JP5213009 B2 JP 5213009B2 JP 2007066506 A JP2007066506 A JP 2007066506A JP 2007066506 A JP2007066506 A JP 2007066506A JP 5213009 B2 JP5213009 B2 JP 5213009B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- peak
- processing
- data
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000014509 gene expression Effects 0.000 title claims description 89
- 238000004458 analytical method Methods 0.000 title description 25
- 238000000034 method Methods 0.000 claims description 106
- 238000012545 processing Methods 0.000 claims description 104
- 238000012937 correction Methods 0.000 claims description 68
- 108090000623 proteins and genes Proteins 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 5
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 238000007792 addition Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 2
- 238000007781 pre-processing Methods 0.000 claims 2
- 238000005259 measurement Methods 0.000 description 43
- 230000006870 function Effects 0.000 description 36
- 239000012634 fragment Substances 0.000 description 22
- 239000000523 sample Substances 0.000 description 22
- 239000003550 marker Substances 0.000 description 19
- 239000002299 complementary DNA Substances 0.000 description 15
- 239000000428 dust Substances 0.000 description 11
- 238000001962 electrophoresis Methods 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 239000000126 substance Substances 0.000 description 8
- 238000013523 data management Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 6
- 238000013213 extrapolation Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000010195 expression analysis Methods 0.000 description 4
- 238000001506 fluorescence spectroscopy Methods 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- 101150000874 11 gene Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000012951 Remeasurement Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000012898 sample dilution Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 231100000041 toxicology testing Toxicity 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
遺伝子の発現量が遺伝子の種類及びその発現時期に依存して異なることは、当業界の研究者により経験的に広く知られている。ここで、「発現」とは、一般には、遺伝子(DNA)が転写及び翻訳を経て、タンパク質へ変換される過程(すなわち、DNAから転写されたmRNAの情報を基にタンパク質が合成される過程)をいう。しかし、本明細書においては、タンパク質の合成に限らず、翻訳されないRNA(非コードRNA)の合成も「遺伝子の発現」に含まれる。また、本明細書において「発現(量)」というときは、特に断らない限り、遺伝子の転写産物であるmRNAの存在(量)をいうものとする。
従来、遺伝子発現プロファイルの作成方法としては、ディファレンシャルディスプレー法や、遺伝子発現の逐次分析法(SAGE)、DNAマイクロアレイ又はDNAチップ法等がある。これらの遺伝子発現プロファイル作成方法においては、塩基配列が予め分かっている遺伝子にしか対応できないこと、感度が低い(例えば、検出のために必要なmRNA量の変動量の下限は、2〜3倍である)こと、大きな発現変動以外の結果の再現性に問題が見られること等の課題があった。
近年、高精度の遺伝子発現解析を可能にした、High Coverage Expression Profiling法(以下、「HiCEP法」という。)が注目を浴びている(例えば、特許文献1参照)。HiCEP法は、制限酵素により切断されるcDNA断片の発現ピークデータを利用するという基本原理に基づいており、塩基配列が決定されていない未知遺伝子においても、その発現変動を解析することができるという特徴を持っている。このため、発現している全転写物に対して観察される転写物の割合をカバー率と定義するならば、上述した従来法のカバー率が10〜30%であるのに対し、HiCEP法は70〜80%のカバー率を達成している。さらに、約20%の微小な発現変動を確実に捉えることが可能である(すなわち、この場合の感度は約1.2倍となる)。上記の点において、HiCEP法は、従来のDNAマイクロアレイ法等では実現し得なかった高精度・高感度を達成している。
HiCEP法は基本的にポリメラーゼ連鎖反応法(Polymerase Chain Reaction法。以下、「PCR」法)をベースに開発されたものであるが、HiCEP法が、高精度、高感度性能に加えて、特に「高カバー率」を実現できたことの理由の1つに、選択PCR法の採用が挙げられる。選択PCR法とは、膨大な種類のcDNA断片を、その後の電気泳動による分離が可能な数までに分類することを目的とした一連の段階である。
その原理は、アダプタを両脇側に結合しされた多種の2本鎖cDNA断片が、各アダプタ内側に位置するの2塩基(1つのcDNAでは計4塩基。各塩基となる)はA,T,G又はCである)(後述の図4の工程(i)におけるN1、N2、N3及びN4に相補的な塩基)の種類に基づいて44=256通りに分類できることを利用し、各種cDNA断片に対応する合成プライマを用いた選択的アニーリングにより、それぞれの塩基の位置に4種類の塩基、A,T,G,Cそれぞれに対応するフラグメントの存在を考慮して、cDNAの集団を44種類、すなわち計256種類に分類するというものである。
この分類工程が成功すれば、数万種類のcDNA集団を平均100〜150程度の小さな集団に分けることが可能となる。さらに、理論上は、アダプタ内側の3塩基に対して合成プライマを用いた選択アニーリングを行った場合には計4096種類に、アダプタ内側の4塩基に対して合成プライマを用いた選択アニーリングを行った場合には計65536種類に、それぞれ分類可能である。ここで、「アダプタ」とは、PCR反応の際に用いるプライマを結合させるために用いるものであって、使用する制限酵素及びプライマに応じて設計されるものである。
キャピラリタイプのDNAシーケンサは、本来、塩基配列を決定するための装置であり、サンプルである同一配列で長さが異なる断片の末端AGCT4塩基のそれぞれに対応する4種類の蛍光色素標識に加え、塩基数の基準となるサイズマーカに対する蛍光色素標識の、合計5種類の蛍光色素を使い、電気泳動を用いて分子量(つまりは配列長で1塩基ごと)の大きさに従って分離する。測定はレーザ光源で蛍光色素を励起し、CCDセンサによって蛍光強度を同時に測定する。その為、5種類の蛍光は発する波長域(色)が異なるものを組み合わせて使用する。
しかし、HiCEP法では、泳動しているフラグメントが多種類のmRNA 由来の異なる塩基配列をもつものであることから、波形ピークは1bp以内に近接したり、重なりあったりすることがあり、その為、波形のピーク情報を高精度に検出できない場合も見られ、キャピラリの使用条件やサンプルの希釈、室温やポリマーなど試薬類のロット差など、測定条件の僅かな差ですら、ピーク位置のズレや揺らぎといったノイズが混入する場合もある。また、1プロファイル内でのピーク間の相対的な高さは高精度に保持されるものの、絶対値は変化してしまうという問題点があった。つまり、ピーク高(または面積)を他のプロファイルの測定データと比較をする場合、比較するプロファイル間で何らかの規格化が必要であるが、規格化値の高精度な算出は極めて難しかった。
その結果、波形データの波形を読んで電圧データがピーク的に高くなる時間(時刻)を波形のピークとして抽出することができ、これら波形ピークの抽出は、後述するように、どのcDNA断片がどの位置に出現するかの関係にも対応付けることができる。
図6に、波形ピークの補正例を示す。図6(A)は、システム内に取り込んだ波形ピーク情報に基づいた波形データを表示したものであり、補正前のオリジナル波形である。上段には、上述したように256種類に分類されたプロファイルそれぞれについて、Lot1及びLot2の計10本のプロファイル分の波形データが表示されている。10本の波形データは色を変えて表示させることができ、システムによってピークと認識されている箇所にはマーク(丸印)が付されている。このマークに着目して10本の波形データ同士を比較すると、横軸方向に他のピークからずれている波形データが存在することが分かる。こうしたズレ等を無くすことが補正の目的の1つである。また、中段の数字は、ベースペアの数を示す。ベースペアは、本来、前記の如くDNA塩基が二重鎖で存在することから1塩基対としてカウントするためにbpなどと表現されているが、本明細書においては、実質的に塩基数と等価な関係にある。つまり、例えば、図6(A)における横軸は、元々時間を表わしているが、測定時に一緒に電気泳動させたサイズマーカを基準に塩基数に変換している。
(1)図6(A)上段の波形ピーク位置を1次元に射影する。
(2)2base以上離れたピークは別のクラスタと見なし、2baseを越えない範囲(又は2base以下の範囲)での最長距離法に基づくクラスタリングを実施する。
(3)同じ波形由来のピークを含むクラスタリングは行わない(この条件に適合する手前でクラスタリング処理を中止する)。
図7は、本発明にかかるシステムにおける、波形データ表示のグラフィカルユーザインタフェース(以下、「GUI」)例を示す。ハードウェア上では出力装置5における出力例である。本発明にかかるシステムにおけるGUI700は、図7に示した通り、大きくはメイン画面701と、HiCEPスイート画面702と、サンプルテーブル画面703とからなる。メイン画面701には、図6において説明したようなLot1及びLot2で採取した形10本の波形データを、オリジナル波形(画面701a)と、Resultデータ(画面701b)と、評価結果(画面701c)とを表示させることができる。メイン画面701の左端701dに表示されているのは、AA−AAから始まるアダプタ内側の塩基の組み合わせ一覧であり、例えば、ある組み合わせ(AA−CC)をマウス等でクリックすると、(AA−CC)に対応するプロファイルを瞬時に表示させることができるように構成されている。
(2)泳動にゴミが混じった場合、ゴミのためのピークを転写産物由来の本物のピークと誤認してしまうが、ゴミには蛍光は付けていないので、レーザの反射等でピークとして測定されているだけであり、他の蛍光データにも同じ位置に同じようなピークが観察される。そのため、サイズマーカの蛍光データを読み込めばゴミの判定及び除去が可能となる。具体的なゴミ判定基準としては、(i)サンプル側に鋭いピークが存在し、かつ、(ii)サイズマーカ側にもピークが存在する、といった場合には、観察されたピークはゴミであると判断する。反対に、(iii)サンプル側に鋭いピークが観察され、かつ、(iv)対応するサイズマーカ側にピークが観察されない場合には、該ピークを本物のピークとして扱う。
本発明にかかるシステムにおける波形の近似については、大きく分けて、ガウス関数近似方式を基本とし、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算方式を用いている。方式自体の内容については、本発明の本質的部分ではないので説明を省略するが、これらの近似方式を以下の条件で処理すると有効であることが確認されたので、本発明にかかる方法及びシステムの一部として開示する。
波形補正を行うに当たって、予め計算基準点を用意し、その基準点間にあるもう1つの基準点の左右をピークサイズ方向に拡大縮小して波形相互の評価値(相関係数に類するもの)が向上するように波形補正を行うグローバル補正と、波形ピークが僅かにずれている場合にそのピーク前後の評価値(相関係数に類するもの)を最大にするよう個別の補正量を計算して波形補正を行うローカル補正とがある。
上述した波形補正を行った後に波形ピーク位置のクラスタリングを行うとで、異なるプロファイル間での対応するピークを効率的に見つけ出すことができる。本発明の一実施形態におけるクラスタリングのアルゴリズムを以下に例示する。
(1)比較している各波形のピーク位置を直線上に射影する。つまり、サイズの値のみを取得して、1次元上に射影する。
(2)各ピークにつき、以下の条件のもと、最長距離法によるクラスタリング処理を行う。
条件1:同じ波形のピークは同じクラスタには入れない。
条件2:サイズが2bp以上離れたピークは必ず別クラスタとする。
次に、本発明にかかる遺伝子発現変動解析方法及びシステムにおいて上述した近似処理及び補正処理を行うに際して採用される条件判定の例について、1波形に対して適用される条件判定例と複数の波形に対して適用可能な条件判定例とに分けて説明する。なお、複数の波形に対しての適用される条件判定は、波形データ間のピーク対応付けが行われた後に可能となるが、1波形での条件判定は、関数近似によりピーク情報の補間抽出作業と同時に可能である。
まず、再現性のないピーク、例えば1波形でのみ測定されたピークは、ゴミの可能性であると判断して削除することができる。より具体的には、サンプル以外の色(測定波長域)の波形にピークがある場合に自動削除する。
図10に、発現マトリクス(又は、波形ピークリスト)の出力例を示す。このマトリクス(又は、リスト)の基本的構成は、ピークの名称としてのCLUSTER(図10の最左欄)と複数の発現強度値(図10の左から2列目以降)とのリストからなる。CLUSTERは、プライマセット名+クラスタ番号+クラスタを構成するサイズの最小値及び最大値を含む名称になっており、例えば、
AA−tt_1_35.32_36.12
は、プライマセット名“AA−tt”、クラスタ番号「1」、クラスタサイズの最小値「35.32」、同最大値「36.12」を意味する。
また、発現強度値については、サンプル及び繰り返し測定(Lot)の分だけ列挙されており、図10では、SampleAのLot1及び2、SampleBのLot1及び2、SampleCのLot1及び2、SampleDのLot1、の計9つの値が出力されている。なお、各ロットにおいてピークが検出されない場合には、欠損値として空欄になっている。
まず、S301においてピークデータベースの構築を行うが、これは、既に述べたように、例えば、HiCEP法により得られるPCR産物である遺伝子転写産物(mRNA)をcDNA化したDNA断片について、そのピークデータを測定して数値化したものである。その結果、例えば、図12に示したような波形データリストが測定データ記憶手段31に記憶される。
2 アプリケーションサーバ
3 波形データ管理記憶手段
31 測定データ記憶手段
311 時間データ
312 電圧データ
32 ピーク情報記憶手段
321 サイズ(ベースペア)データ
322 ピーク強度データ
4 入力端末
5 出力装置
6 ネットワーク接続手段
7 インターネット
8 外部ネットワーク接続手段
9 外部サーバ
10 外部データベース
11 遺伝子情報管理記憶手段
111 遺伝子情報記憶手段
Claims (13)
- 発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するための方法であって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成し、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行い、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行って、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理であって、前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理を行い、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力することを特徴とする方法。 - 前記関数近似に基づくピーク情報の補間抽出処理はガウス関数に基づく近似であり、
前記波形データに対して、ピーク情報抽出処理及び飽和ピークの推定処理と、ノイズ若しくは歪みの除去処理、複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの1又は複数の組み合わせとを行うことを特徴とする請求項1に記載の方法。 - 前記飽和ピークの推定処理は、波形ピークにおけるピーク強度または面積の総和で表わされる発現総量が保存されるとの前提に基づいた波形規格化において波形強度誤差を生じる部分を推定することを特徴とする請求項2に記載の方法。
- 前記波形補正処理は、前記測定された複数の波形データについて波形形状の類似性指標を用いた補正評価値の算出及び評価を行い、前記測定された複数の波形データ間の波形の高さを規格化する波形規格化のために、前記波形ピーク対応付け処理の前処理として実行されることを特徴とする請求項1〜請求項3のいずれか1項に記載の方法。
- 前記測定された複数の波形データの波形と、
前記関数近似に基づく補間抽出処理と、ノイズ若しくは歪みの除去処理、複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの少なくとも1つ以上の組み合わせを行った波形と、
前記複数波形データ間での波形補正処理とピーク対応付け処理を行った波形と
を重ねて表示することをさらに含む、請求項1〜請求項4のいずれか1項に記載の方法。 - 請求項5に記載の方法において、
前記波形データは、任意の組み合わせで選択表示可能であることを特徴とする方法。 - 請求子5に記載の方法において、
前記波形データは、サイズ及び/又は強度を拡大縮小表示可能であることを特徴とする方法。 - 請求項5に記載の方法において、
前記波形データに対し、波形ピークデータの追加、削除、対応付け修正のうちの、1又は複数の組み合わせによる編集が可能であることを特徴とする方法。 - 発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するためのシステムであって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成する手段と、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行う手段と、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行う手段と、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理手段であって、 前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理手段と、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力する手段とを備えたことを特徴とするシステム。 - 前記関数近似に基づくピーク情報の補間抽出手段は、ガウス関数に基づく関数近似を行い、
前記関数近似された波形データに対して、ピーク情報抽出手段と、
ノイズ若しくは歪みの除去手段とを有し、
複合ピークの分離処理、偽ピークの除去処理、重複ピークの推定処理のうちの1又は複数の組み合わせを行う波形ピーク検出手段
を更に備えたことを特徴とする請求項9に記載のシステム。 - 前記飽和ピークの推定処理は、波形ピークにおけるピーク強度または面積の総和で表わされる発現総量が保存されるとの前提に基づいた波形規格化において波形強度誤差を生じる部分を推定することを特徴とする請求項10に記載のシステム。
- 前記波形補正処理手段は、前記測定された複数の波形データについて波形形状の類似性指標を用いた補正評価値の算出及び評価を行い、前記測定された複数の波形データ間の波形の高さを規格化する波形規格化のために、前記波形ピーク対応付け処理の前処理として実行されることを特徴とする請求項9〜請求項11のいずれか1項に記載のシステム。
- 発現している遺伝子の転写産物の発現量と該転写産物のピークサイズとの情報を入力した遺伝子発現プロファイルをコンピュータにおいて解析処理するためのコンピュータプログラムであって、
前記転写産物の所定範囲位置における前記情報を波形データとして入力した前記遺伝子発現プロファイルを少なくとも二つ作成するステップと、
前記波形データに対し、近似による波形寄与分を元のデータから逐次減算して関数近似を繰り返す試行減算によりピークを特定する処理、及びピーク波形の裾野形状から飽和ピークを外挿することにより特定する処理を含むピーク情報補間抽出処理を行うステップと、
前記ピーク情報補間抽出処理を行った複数の波形データ間でグローバル補正及びローカル補正に基づく波形補正を行うステップと、
前記少なくとも二つの遺伝子発現プロファイル間で各波形データのピーク同士を対応付ける波形ピーク対応付け処理を行うステップであって、前記波形補正処理を行った複数の波形データ全てに対して、波形ピーク位置を射影して所定の条件のもとに最長距離法に基づくクラスタリングを行う波形ピーク対応付け処理を行うステップと、
前記対応付け処理を行った結果を、1つの発現マトリクスとしてリスト出力するステップと
をコンピュータに実行させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007066506A JP5213009B2 (ja) | 2007-03-15 | 2007-03-15 | 遺伝子発現変動解析方法及びシステム、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007066506A JP5213009B2 (ja) | 2007-03-15 | 2007-03-15 | 遺伝子発現変動解析方法及びシステム、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008226095A JP2008226095A (ja) | 2008-09-25 |
JP5213009B2 true JP5213009B2 (ja) | 2013-06-19 |
Family
ID=39844597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007066506A Expired - Fee Related JP5213009B2 (ja) | 2007-03-15 | 2007-03-15 | 遺伝子発現変動解析方法及びシステム、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5213009B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5344670B2 (ja) * | 2008-02-13 | 2013-11-20 | 独立行政法人放射線医学総合研究所 | 遺伝子発現解析方法、遺伝子発現解析装置、および遺伝子発現解析プログラム |
WO2012073322A1 (ja) * | 2010-11-30 | 2012-06-07 | 株式会社島津製作所 | 質量分析データ処理装置 |
JP6740941B2 (ja) * | 2016-08-05 | 2020-08-19 | 株式会社島津製作所 | 電気泳動測定方法、データ処理装置及びデータ処理プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60141221D1 (de) * | 2000-12-12 | 2010-03-18 | Masumi Abe | Verfahren zur genexpressionsanalyse |
JP4020640B2 (ja) * | 2000-12-28 | 2007-12-12 | 三洋電機株式会社 | 微生物識別方法および微生物識別装置 |
JP2005250615A (ja) * | 2004-03-02 | 2005-09-15 | Natl Inst Of Radiological Sciences | 遺伝子解析支援システム |
-
2007
- 2007-03-15 JP JP2007066506A patent/JP5213009B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008226095A (ja) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240218445A1 (en) | Methods for clonotype screening | |
US20180196915A1 (en) | Methods and systems for nucleic acid sequence analysis | |
Arrigo et al. | Automated scoring of AFLPs using RawGeno v 2.0, a free R CRAN library | |
JP5650083B2 (ja) | 多重プローブターゲット相互作用パターンの自動分析:パターンマッチング及び対立遺伝子同定 | |
CN107229841B (zh) | 一种基因变异评估方法及系统 | |
CN108920899B (zh) | 一种基于目标区域测序的单个外显子拷贝数变异预测方法 | |
CN107209111B (zh) | 自动化整体载片分析的质量控制 | |
EP3590059B1 (en) | Method for identifying expression distinguishers in biological samples | |
CN106021984A (zh) | 一种全外显子组测序数据分析系统 | |
US20090226916A1 (en) | Automated Analysis of DNA Samples | |
CN110021346B (zh) | 基于RNAseq数据的基因融合与突变检测方法及系统 | |
JP2005531853A (ja) | Snp遺伝子型クラスタリングのためのシステムおよび方法 | |
JP2009053070A (ja) | クロマトグラフィー質量分析の分析結果表示方法及び表示装置 | |
CN110021355B (zh) | 二倍体基因组测序片段的单倍体分型和变异检测方法和装置 | |
US20040142347A1 (en) | Mitochondrial DNA autoscoring system | |
CN112669903A (zh) | 基于Sanger测序的HLA分型方法及设备 | |
KR101874527B1 (ko) | 유전자 분석판정 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 | |
JP5213009B2 (ja) | 遺伝子発現変動解析方法及びシステム、並びにプログラム | |
EP2926289A1 (en) | Method and system for processing data for evaluating a quality level of a dataset | |
KR20140099189A (ko) | 유전자 서열 기반 개인 마커에 관한 정보를 제공하는 방법 및 이를 이용한 장치 | |
JP4664280B2 (ja) | 生体分子サンプルの特性を決定する方法 | |
US20040215401A1 (en) | Computerized analysis of forensic DNA evidence | |
KR20220109707A (ko) | 염기서열 시퀀싱 데이터 분석 장치 및 그 동작 방법 | |
CN110570901B (zh) | 一种基于测序数据进行ssr分型的方法及系统 | |
CN112102944A (zh) | 一种基于ngs的脑肿瘤分子诊断的分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5213009 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |