JP5297207B2 - スペクトル分析を介したdnaパターンの同定方法及びシステム - Google Patents
スペクトル分析を介したdnaパターンの同定方法及びシステム Download PDFInfo
- Publication number
- JP5297207B2 JP5297207B2 JP2008557880A JP2008557880A JP5297207B2 JP 5297207 B2 JP5297207 B2 JP 5297207B2 JP 2008557880 A JP2008557880 A JP 2008557880A JP 2008557880 A JP2008557880 A JP 2008557880A JP 5297207 B2 JP5297207 B2 JP 5297207B2
- Authority
- JP
- Japan
- Prior art keywords
- dna
- spectral
- dna sequence
- cluster
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Image Analysis (AREA)
Description
(i)4つのヌクレオチド塩基のバイナリインジケータ配列(BIS)uA〔n〕、uT〔n〕、uC〔n〕、及びuG〔n〕の形成。特定塩基のためのBISは、その塩基が存在する位置で「1」という値を取り、さもなければ「0」という値を取る。従って、「AACTGGCATCCGGGAATAAGGTCT」というヌクレオチド配列を有する例証的なDNA配列では、BISは以下のように転換される:
(iv)ピクセル値の正規化。色のスペクトログラムを与える前に、各ピクセルのRGB値は、一般的に0から1に下がるように正規化される。正規化機能を実行するための方法は多数ある。最も単純な方法は、グローバル最大値で全ての値を割ることである。しかし、そのようなワンステップ法は、画像の色対比全体を低下させてしまう恐れがある。より良い方法は、2つのレベルで正規化を行うことである:最初の操作の後、大部分のピクセルが0から1のRGB値を有するように、第一のレベルでは、全てのピクセル値は、例えば、全体の平均値と標準偏差に等しいもの等の統計上の最大値で割られる;次に、第2のレベルにて、1を超えるRGB値のうちどれかを有する残りのピクセルには、そのようなピクセル値のそれぞれをそのローカル最大値max(xr,xg,xb)で割ることによって、第2レベルの正規化が個々に行われる。この2つのレベルによる方法は、より極端なピクセル値によって画像の全体的な輝度が過度に減少するのを防ぎ、結果として、スペクトログラム画像の色対比をよりきれいに維持することができる。図7は、図6の組み合わされたDFT値における例証的な正規化されたプロットを示している。
(v)短時間フーリエ変換(STFT)。これまで、1つのみの離散フーリエ変換(DFT)窓が考慮されてきた。しかし、長いDNA配列においては、配列に沿って変化するDFT窓のために、ステップ(i)から(iv)まで繰り返す必要があり得る。これは、色ピクセルの連続的な断片を生じ、その断片のそれぞれが局所的なDNAセグメントの周波数スペクトルを示している。次に、DNAスペクトログラムが、これらの断片の連結により形成される。下記の画像は、本明細書の図8及び9に複写されている。
(i)4つのヌクレオチド塩基のバイナリインジケータ配列(BIS)uA〔n〕、uT〔n〕、uC〔n〕、及びuG〔n〕の形成。上記のように、例証的なBISパターンが、本明細書の図1に複写されており、BIS値のプロットが図2に示されている。
(ii)BISに対する離散フーリエ変換(DFT)。各塩基の周波数スペクトルを、方程式(3)(以下に複写されている)を用いてその対応するBISのDFTをコンピュータで計算することにより得る:
(iii)RGB色へのDTF値のマッピング。4つのDFT配列は、以下に複写されている一次方程式のセットにより、RGB空間において3つの配列に減少する:
(iv)ピクセル値の正規化。色のスペクトログラムを与える前に、各ピクセルのRGB値は、一般的に0から1に下がるように正規化される。図7は、図6の組み合わされたDFT値における例証的な正規化されたプロットを示している。
(v)短時間フーリエ変換(STFT)。DNAスペクトログラムが、個々のDNA配列断片の連結により形成され、各断片は、一般的に、局所的なDNAセグメントの周波数スペクトルを示している(図8及び9を参照)。
〔画像ノイズ除去〕
生のスペクトログラム画像はノイズを含んでおり、その除去により、検出の信頼度、効率、及び/又は性能を改善又は高めることができる。スペクトログラム画像のノイズ除去は、1又は複数のモルフォロジカルオペレーションを用いて達成することができる。例えば、モルフォロジカルオープニングに続いてモルフォロジカルクロージングを行うことにより、弱ピクセルの小さな領域を除去することができる。その後、互いに近い距離にある強ピクセルを含んだ領域は併合することができる。ノイズ除去は、一般的に、緑及び赤色の空間において別々に行われる。有用な詳細がスペクトログラムに保持されつつノイズが取り除かれるように、モルフォロジカルオペレーションでは、構造的要素の形及びサイズは慎重に選ばれる。1ピクセルの高さ及び50ピクセルの長さを有する長方形を構成する要素が、CpGアイランドの検出に関して、ノイズ除去操作のための効果的なパラメータを提供すると見いだされている。例証的なノイズ除去されたスペクトログラムが本明細書の図12に示されており、左側の画像は緑及び赤のチャネル画像のみを含み、対応する右側の画像は、モルフォロジカル「クローズ」に続く「オープン」フィルタ後の画像である。
〔分類における特徴の抽出〕
CpGアイランドにおいて、緑色の輝度(C及びGの存在)が、一般的に、赤色(A及びTの存在)よりも高いことが目視検査を介して判ってきている。さらに、1又は複数の明るい箇所のかたまりから明らかなように、緑の空間において輝度に大きな変動があるけれども、赤色の輝度は、一般的にその領域において均等に低い−すなわち、実質的に均一である−。均一性/不均一性という前述の問題に取り組むために、本開示のシステム及び方法は、強化された分類における特徴の抽出を好都合に促進している。従って、本開示の例証的な実施形態によると、「ソーベル」エッジ検出が、緑及び赤空間におけるノイズ除去されたスペクトログラムに対してそれぞれ行われる。当業界では一般的に既知であるように、ソーベルオペレータは、画像輝度の関数における勾配ベクトルの近似値を計算する離散微分オペレータである。画像の各ポイントで、ソーベルオペレータの結果は、対応する勾配ベクトル又はそのベクトルのノルムである。例えばキャニーエッジ検出器等、別のエッジ検出技術を、本開示の真意又は範囲から逸脱することなく使用することができる。
〔分類における特徴の評価を介する意志決定〕
スペクトル画像の分類における特徴が同定されると、CpGアイランドの分類器を提供することができると開示されたシステム/方法に従い熟慮される。分類器を生じるための2つの例証的な方法は、(i)固定しきい値法、及び(ii)遺伝的アルゴリズム/サポートベクトルマシン(GA−SVM)法である。
(i)(x_ヒストグラム_緑−x_ヒストグラム_赤)>しきい値(この例においては=2)
(ii)長さ<200bpの(1)を満たす領域は拒絶される。
(iii)100bp未満により分けられた(1)も(2)も満たす領域は併合される。
〔例証的な比較ヒストグラム/固定しきい値処理システム及び方法〕
1. 開示されたシステム/方法に長さMのDNA配列を入力するステップ:
パラメータ:N−STFT窓サイズ
q−重複
p−目視分解能(M>>p>N)
2. サイズNの入力されたDNA配列をバイナリインジケータ配列に転換するステッ
プ;
3. 短時間フーリエ変換(STFT)を前記バイナリインジケータ配列に適用し、周
波数領域ベクトルを生成するステップ;
4. A、T、C、及びGに対する前記周波数領域ベクトルを、例えばRGB(赤−緑
−青)又はHSV(色相−彩度−明度)色空間等の色空間にマップするステップ;
5. 従来のエッジ検出法(例えば、ソーベル又はキャニーエッジ検出器)を用いて、
DNAスペクトル画像にエッジ検出を適用するステップ;
6. エッジ投影(edge projection)を用いることにより、RGBか
ら赤、緑、青成分(又は、HSV色空間が使用された場合はHSV成分)における
水平及び垂直のヒストグラムを別々に計算するステップ。ヒストグラムは、組み合
わされた色も表すことができる。例えば、CとGを組み合わせて緑成分により表す
ことができ、AとTを組み合わせて赤成分を表すことができる;
7. ヒストグラムデータを評価するステップ。例えば、CpGアイランドには、以下の抽出基準を使用することができる:
(1)(x_ヒストグラム_緑−x_ヒストグラム_赤)>しきい値(例えば、2に等しい)
(2)長さ<200bpの(1)を満たす領域は拒絶される。
(3)100bp未満により分けられた(1)も(2)も満たす領域は併合される。
8. 評価基準を満たしたDNAセグメントは反復要素として標識され、開始及び終了位置が注目/記録される(例えば、CpGアイランド)。
● 緑のピクセルの数(1)
● 赤のピクセルの数(1)
● 緑のエッジピクセルの数(1)
● 赤のエッジピクセルの数(1)
● 緑のエッジピクセルの数引く赤のエッジピクセルの数(1)
● 周波数軸に沿った赤のエッジヒストグラムの数値(61)
● 周波数軸に沿った緑のエッジヒストグラムの数値(61)
例えば、ガーディナー及び/又はタカイのCpGアイランド定義等、種々のCpGアイランドの定義を使用することができる。選択された定義に基づき、例えば、各スペクトログラム画像に対して127個の特徴等、多数の特徴が、開示されたGA−SVM方法/技術に従い一般的に生じる。本開示の例証的な実施形態に従い、合計で3206のDNAセグメントを使用し、それらのセグメントをスペクトログラムに転換した。CpGの種類又は非CpGの種類を表す特徴セットがスペクトログラムから抽出される。
● 配列の総数:
本明細書に記述されているように、例証的な実行は、塩基「A」と「T」及び「C」と「G」を赤及び緑色にそれぞれグループ化するカラーマッピングスキームに基づいている。そのような実行では、CpGアイランドの同定のための抽出アルゴリズムにおいて赤及び緑色の成分を考慮することだけが必要である。しかし、他のカラーマッピングスキームを本開示に従い使用することができ、その場合、R、G、及びBという色(又はHSV)の全3層を考慮する必要があり得る。本明細書に提供された詳細な説明に基づき当業者には明らかになるように、別のカラーマッピングスキームに取り組むために、必要に応じて、特徴のセット及び選択基準を調節することができる。図16及び17を参考にすると、CpGアイランドの検出結果が示されており、カラーマッピングを用いて得られたスペクトログラムにおいてエッジヒストグラムが使用されている。
〔特徴の選択及び分類のための例証的なGA−SVMシステム及び方法〕
1. 前記開示されたシステム/方法に長さMのDNA配列を入力するステップ:
パラメータ:N−STFT窓サイズ
q−重複
p−目視分解能(M>>p>N)
2. サイズNの入力されたDNA配列をバイナリインジケータ配列に転換するステップ;
3. 短時間フーリエ変換(STFT)を前記バイナリインジケータ配列に適用し、周波数領域ベクトルを生成するステップ;
4. A、T、C、及びGに対する前記周波数領域ベクトルを、例えばRGB又はHSV等の色空間にマップするステップ;
5. 従来のエッジ検出法(例えば、ソーベル又はキャニーエッジ検出器)を用いて、DNAスペクトル画像にエッジ検出を適用するステップ;
6. エッジ投影を用いることにより、赤、緑、青成分(又は、HSV成分)における水平及び垂直のヒストグラムを別々に計算するステップ。ヒストグラムは、組み合わされた色も表すことができる。例えば、CとGを組み合わせて緑成分により表すことができ、AとTを組み合わせて赤成分を表すことができる;
7. 遺伝的アルゴリズムを有するサポートベクトルマシンを用いた特徴選択法を利用して、顕著なスペクトル特徴のセットを評価及び位置づけるステップ。あるいは、繰り返しの特徴を除去する方法及び/又は主成分分析を使用して、顕著な特徴を見つけることができる。例えば、以下の特徴を使用することができる:127個の特徴(N塩基長であるDNAセグメントから抽出され、Nは変更できる;例証的な実施形態において、Nは200bp長である)
● 緑のピクセルの数(1)
● 赤のピクセルの数(1)
● 緑のエッジピクセルの数(1)
● 赤のエッジピクセルの数(1)
● 緑のエッジピクセルの数引く赤のエッジピクセルの数(1)
● 周波数軸に沿った赤のエッジヒストグラムの数値(61)
● 周波数軸に沿った緑のエッジヒストグラムの数値(61)
8. 前述のステップから上位に位置づけられた特徴のサブセットを用いて分類器を設計/実行するステップ。本開示の例証的な実施形態では、サポートベクトルマシン分類器が使用される;しかし、例えば、神経回路網、自己組織化マップ(SOM)技術/システム、及び、機械学習文献において既知の他の分類器を使用できる等、別の分類器を、本開示の真意又は範囲から逸脱することなく、使用することができる。分類器は、未知の入力されたDNA配列を検出し、反復DNA構造(例えばCpGアイランド)を有するセグメントの一部に分類する;
9. 評価基準を満たしたDNAセグメントは反復要素として標識され、開始及び終了位置が注目/記録される(例えば、CpGアイランド)。
〔スペクトログラムからスペクトルビデオを作成するシステム/方法〕
本開示のさらなる態様によると、DNA配列に付随するスペクトログラムからスペクトルビデオを作成するシステム及び方法が開示されている。非常に長いDNA配列(例えば、1億5000万塩基長であり得る染色体)の周波数スペクトルは、いかなる所望の分解能でも1つのスペクトログラム枠に適合することはできない。個々の画像を見る代わりに、本開示の例証的なシステム及び方法は、スペクトログラムからの連続するビデオの作成を促進する。開示されたスペクトルビデオは、ゲノム又は他の関心のあるDNA配列にわたる「パニング」に本質的に相当する。スペクトルビデオで、短時間での、及び、所望の分解能でのゲノムの可視化が可能になる。さらに、スペクトルビデオの分析により、完全なゲノム分析が提供され、さらに、完全な長さのDNAパターンにおける変化の検知が可能になる。同じ配列のスペクトログラムとは対照的に、開示されたスペクトルビデオにより、同じ配列においてより多くの分解能が提供される。
● 個々のスペクトログラムの保存及び表示に対立するものとした、ゲノム全体の連続 目視;
● 時間の節約:スペクトログラムを1つずつ目視することは非常に時間がかかるけれ ども、スペクトルビデオは、DNAスペクトログラムを共に縫い合わせることにより作 成される;
● 連続する直線的なゲノムパターンの分析:低分解能では、これらのパターンは1つ のスペクトログラムを超えて及ぶ可能性がある;
● 所望の分解能、及び、優れたディテールでの長い配列の可視化;
● スペクトルビデオの目視が進むに従い、分解能を変える能力:例えば、興味深いパ ターンが現れた場合に、開示されたシステム/方法は、特定のサブ配列のさらなる細部 への即座の「飛び込み」を促進する;
を含めた多数の利点及び/又は機能性が提供される。
〔スペクトルビデオを作成するための例証的なアルゴリズム/プログラム〕
(1)開示されたシステム/方法に長さMのDNA配列を入力するステップ:
パラメータ:N−STFT窓サイズ
q−窓間隔(N−窓の重複)
p−目視分解能(ビデオ画像の幅)、及び
v−目視の速度、すなわち、1つのビデオフレームあたりにシフトされるスペクトル画像列の数(M>>p>N)
(2)初期化するステップ:s=1、r=1
(3)pという長さのセグメント、又は、完全なDNA配列のサブ配列に対して位置sで開始するステップ;
(4)位置rで開始し、サイズNという入力されたDNA配列を、バイナリインジケータ配列に転換するステップ;
(5)短時間フーリエ変換をバイナリインジケータ配列に適用し、周波数領域ベクトルを生成するステップ;
(6)A、T、C、及びGに対する前記周波数領域ベクトルを、例えばRGB又はHSV色空間等の色空間にマップするステップ;
(7)(r−s+1)<pの場合、結果を可視化し、qヌクレオチド分前方へ移動するステップ:r=r+q ステップ4へ進む。
(8)DNAスペクトル画像が前もって示されていない場合、スペクトル画像を表示するステップ:r=r+q ステップ4へ進む。
(9)(r−s+1)<p+vqの場合、1列目をスペクトル画像から除去し、最後に生成された列を末端部に付け加えるステップ;r=r+q ステップ4へ進む。
(10)(r−s+1)>=p+vqの場合、スペクトル画像を表示するステップ;s=s+vq r=r+q
(11)(r+N−1)<=Mの場合、ステップ4へ進むステップ。
(12)使用者の要求に従って、目視の速度vを調節するステップ;通常速度は、1つのビデオフレームあたり1列のシフトである。
〔無監督のスペクトログラム及びスペクトルビデオの分析〕
本開示の例証的な実施形態によると、遺伝子制御要素及びネットワークにおける無監督の調査に、スペクトログラムを使用することができる。実際に、重要な制御要素を見つけるための大規模なスペクトログラム分析が、本開示に従い熟慮されている。階層的なクラスタリング等の無監督の方法を、最も優勢なパターンの群を決定するために使用することができる。
〔ステップ1〕入力されたDNA配列(例えば染色体)のために、STFT窓がW(W<L)、及び、窓の重複がV(V<W)で、長さL(Lはヌクレオチドの数)のスペクトログラムS1を生じるステップ。
〔ステップ2〕DNA配列の終わりに達するまで、Rヌクレオチド右へ移動し、スペクトログラムSiを生じるステップ。
〔ステップ3〕ステップ1及び2で生じたスペクトログラム全てを用いて、無監督の画像ベースのクラスタリング(例えば、k平均クラスタリング、階層的なクラスタリング等)を行うステップ。開示された方法/アルゴリズムに従い使用するための例証的な類似度測定は、例えば、Cクラスタを生じるL1測定等、いかなる画像ベースの類似度測定も含む。クラスタリングのための特徴は、色、きめ〔テクスチャ〕、並びに、線、正方形、及び斜線等の画像に現れる特定の物〔オブジェクト〕を含むことができる。
〔ステップ4〕最も大きなクラスタを見つけ、そのクラスタの中心をとり、さらに、このクラスタのうちクラスラベルの要素を見るために、既知のゲノム源と対比して検索を行うステップ。これにより、特定の染色体上の最も反復する要素を明らかにすることができる。
〔ステップ5〕(a)又は(b)のうち1つを選択するステップ:
(a)クラスタの中心から最も遠いPスペクトログラムを無作為に選び、クラスラベルの検索を行うステップ。Pスペクトログラムも同じクラスに属していることを検証するステップ。
(b)スペクトログラム、及び、スペクトログラムのセットにおける全てのクラスラベルの要素の種類を使用者のために可視化するステップ。次に、スペクトログラムがクラスタ内にあり、その中心は既知であるが、そのクラスタの中心からさらに離れた前記スペクトログラムが未知である場合、新規の要素をクラスタの中心のクラスラベルとして名付け、さらに、その差を可視化するステップ。
〔ステップ6〕2番目に大きいクラスタで続け、ステップ(5)及び(6)を行う/繰り返すステップ。クラスタの中心−クラスラベルが未知になるまで、次に大きいクラスタで続けるステップ。Kクラスタは既知のラベルを有し、Uクラスタは未知のラベルを有していることを示すステップ。
〔ステップ7〕未知のラベルを有するUクラスタ全てのために、かなりのクラスタサイズ(一般的に、最大のクラスタにおける要素の最大数の少なくとも半分)で、パターンの普及率、同じ染色体内の統計的分布を見つけるステップ。染色体にわたる統計的分布を見つけるステップ。
〔ステップ8〕VがWの半分に達するまで、Vを上げ、所与のステップサイズ(例えば、ステップサイズ=1)でステップ(1)に進み、その後ステップ(9)に進む。
〔ステップ9〕WがLの半分に達するまで、Wを上げ、所与のステップサイズでステップ(1)に進み、その後ステップ(10)に進む。
〔ステップ10〕Lを上げ、ステップ(1)に進む。
〔ステップ11〕V、W、及びLの各レベルで結果を要約するステップ。
● ゲノム内比較:大規模な分析のためのアルゴリズムを、研究されるゲノムの各染色
体に適用することができる。次に、全体のクラスタリングを行ってそのゲノムの(染
色体にわたる)機能的に重要な要素を見るために、クラスタの中心全てを使用するこ
とができる。
● 比較ゲノミクス:大規模な分析のためのアルゴリズムを、既知の200以上の配列
決定されたゲノムの各ゲノムに適用することができる。次に、全体のクラスタリング
を行って進化中機能的に保存された要素を見るために、クラスタの中心全てを使用す
ることができる。
を含む。
〔ゲノムワイドなパターンを見つけるためのスペクトルビデオ分析〕
本開示のさらなる例証的な実施形態及び実行において、上記の技術に従い生じたスペクトルビデオにシーンチェンジ検出法を適用し、重要な直線的な視覚特徴における急な変化を見つけることができる。各シーンで、スペクトル領域からの統計学上の特徴を抽出することができる。さらに、完全なスペクトルビデオの個々のシーンを、無監督のクラスタリング法を用いてクラスタ化することができる。次に、無監督のビデオ特徴検出法を使用して、スペクトルDNAレベルでのゲノムワイドな類似点を明らかにすることができる。従って、そのような無監督の検出法の結果を、遺伝子ネットワーク、重要なモチーフ、反復DNA要素、及び他の顕著なDNAパターンを見つけるための自動DNA分析に使用することができる。そのような無監督の検出を行うための例証的な方法/アルゴリズムは、本明細書において以下に記述される:
〔ステップ1〕所与のDNA配列(例えば、完全な染色体又はその一部)のスペクトルビデオを生じるステップ。
〔ステップ2〕例えば、所与の窓、色、エッジの長さ、特定の列上の同じ色の数等に対する水平及び垂直のエッジヒストグラム等の特徴を抽出するステップ。
〔ステップ3〕例えば、抽出された特徴を用いて連続するパターンを見つける等、スペクトルカットを見つけるステップ。この技術は、フィルムにおいて「カット」を見つけることに類似している。
〔ステップ4〕例えば、各スペクトルカットのための特徴を記憶する等、シーンをクラスタ化するステップ。実際に、シーンをビデオにクラスタ化するように、これらの特徴を用いてスペクトルカットをクラスタ化することができる。
〔ステップ5〕例えば、順番を並び換え、さらに、特定の長さを有する「シーン」を可視化する等、最も長い要素を有するクラスタを見つけるステップ。
〔ステップ6〕例えば、1つのシーンに属するもの等、同じ長さのスペクトル要素をクエリするステップ。スペクトルカットに対応する各セグメントを、既知のゲノム源(例えば、NCBI)と対比して好都合に調べ、いかなる既知の機能上の重要性も決定することができる。
Claims (12)
- DNA配列内の注目すべき領域の存在を評価するための、コンピュータによって実行される方法であって:
(a)DNA配列をインターフェースを介して受領するステップ;
(b)前記DNA配列に基づき複数のスペクトログラムを作成手段によって作成するステップ;
(c)前記複数のスペクトログラムに関して以下のステップ:
(i)スペクトルビデオを作成して表示するステップであって、前記スペクトルビデオにおいてはビデオフレームあたり所定数のスペクトル画像列がシフトされる、ステップ、
(ii)比較ヒストグラム分析を実行するステップであって、エッジ検出を使うことによって生成される水平方向および垂直方向のヒストグラムデータを評価することによって注目すべき領域の存在が評価される、ステップ、
(iii)特徴選択及び分類を実行するステップであって、前記スペクトログラムの色および/またはエッジに関係した前記DNAスペクトル画像のスペクトル特徴を抽出してランク付けし、反復的なDNA構造をもつDNAセグメントを反復要素として分類および標識付けすることを含むステップ、並びに、
(iv)前記DNA配列中の構造的に新規のDNA要素の無監督の分類及び発見を実行するステップであって、色、テクスチャおよび前記スペクトログラムに現れる特定のオブジェクトという特徴の少なくとも一つを使って、無監督の画像ベースのクラスタリングを実行し、複数のクラスタを生成し、それらのクラスタを最も大きなクラスタから順に既知のゲノム源と照合することを含むステップ、
のうち少なくとも1つを実行手段によって実行するステップ;
前記少なくとも一つの機能の分析結果によって前記DNA配列中の前記注目すべき一つまたは複数のDNAパターンを識別するステップ;
前記少なくとも一つの機能の分析結果によって前記DNA配列中の前記注目すべき一つまたは複数のDNAパターンの位置を識別するステップ;
を含む方法。 - 前記DNA配列が、ゲノム、染色体、又はその一部を表す、請求項1に記載の方法。
- 前記複数のスペクトログラムを作成するステップが:
(i)前記DNA配列を入力するステップ、
(ii)前記DNA配列をバイナリインジケータ配列に転換するステップ、
(iii)前記バイナリインジケータ配列に短時間フーリエ変換を適用し、周波数領域ベクトルを生じるステップ、
(iv)前記周波数領域ベクトルを色空間にマップしてDNAスペクトル画像を生成するステップ、
(v)前記DNAスペクトル画像にエッジ検出を適用するステップ、並びに、
(vi)前記エッジ検出の結果に基づいて前記DNAスペクトル画像の水平及び垂直のヒストグラムを計算するステップ、
を含む、請求項1または2に記載の方法。 - 前記スペクトルビデオの作成が、処理装置で作動するよう適応されたアルゴリズムを含む、請求項1ないし3のうちいずれか1項に記載の方法。
- 前記アルゴリズムが:
(a)長さMのDNA配列;STFT窓サイズを示すN、N個の窓重複を含む窓重複を示すq、目視分解能を示すp、及び、1つのビデオフレームあたりにシフトされるスペクトル画像列の数を含む目視の速度を示すv、ここでM>>p>N、を含むパラメータを含む入力を使うステップ;
(b)s=1、r=1と設定することを含む、変数を初期化するステップ;
(c)pという長さのセグメント、又は、完全なDNA配列のサブ配列に対して位置sで開始するステップ;
(d)位置rで開始し、サイズNの入力された前記DNA配列の一部を、バイナリインジケータ配列に転換するステップ;
(e)短時間フーリエ変換を前記バイナリインジケータ配列に適用し、周波数領域ベクトルを生成するステップ;
(f)A、T、C、及びGに対する前記周波数領域ベクトルを前記色空間にマップして前記DNAスペクトル画像を生成するステップ;
(g)(r−s+1)<pの場合、結果を可視化し、qヌクレオチド分前方へ移動し、r=r+qと設定し、ステップ(d)へ進むステップ;
(h)DNAスペクトル画像が前もって示されていない場合、前記DNAスペクトル画像を表示して、r=r+qと設定し、ステップ(d)へ進むステップ;
(i)(r−s+1)<p+vqの場合、前記スペクトル画像から1列目を除去し、最後に生成された列を末端部に付け加えて、r=r+qと設定し、ステップ(d)へ進むステップ;
(j)(r−s+1)>=p+vqの場合、前記DNAスペクトル画像を表示して、s=s+vq r=r+qと設定するステップ;
(k)(r+N−1)<=Mの場合、ステップ(d)へ進むステップ;
(l)通常速度は1つのビデオフレームあたり1列のシフトであり、使用者の要求に従って、目視の速度vを調節するステップ;
を含む、請求項4に記載の方法。 - 前記比較ヒストグラム分析を実行するステップが:
(a)長さMの前記DNA配列;STFT窓サイズを示すN、窓重複を示すq、目視分解能を示すp、ここで、M>>p>N、を含むパラメータを入力するステップ;
(b)サイズNの入力された前記DNA配列の一部をバイナリインジケータ配列に転換するステップ;
(c)短時間フーリエ変換(STFT)を前記バイナリインジケータ配列に適用し、周波数領域ベクトルを生成するステップ;
(d)A、T、C、及びGに対する前記周波数領域ベクトルを色空間にマップしてDNAスペクトル画像を生成するステップ;
(e)エッジ検出法を用いて、前記DNAスペクトル画像にエッジ検出を適用するステップ;
(f)エッジ投影を用いることにより、前記DNAスペクトル画像の赤、緑及び青成分についての水平及び垂直のヒストグラムデータを別々に計算するステップ;
(g)特徴抽出基準に従って前記ヒストグラムデータを評価するステップ;
(h)前記特徴抽出基準を満たしたDNAセグメントを反復要素として標識付けし、標識付けされた各DNAセグメントの開始及び終了位置を記録するステップ;
を含む、請求項1ないし5のうちいずれか1項に記載の方法。 - 前記特徴選択及び分類を実行するステップが:
(a)長さMの前記DNA配列;STFT窓サイズを示すN、窓重複を示すq、目視分解能を示すp、ここで、M>>p>N、を含むパラメータを入力するステップ;
(b)サイズNの入力された前記DNA配列の一部をバイナリインジケータ配列に転換するステップ;
(c)短時間フーリエ変換(STFT)を前記バイナリインジケータ配列に適用し、周波数領域ベクトルを生成するステップ;
(d)A、T、C、及びGに対する前記周波数領域ベクトルを色空間にマップしてDNAスペクトル画像を生成するステップ;
(e)エッジ検出法を用いて、DNAスペクトル画像にエッジ検出を適用するステップ;
(f)エッジ投影を用いることにより、前記DNAスペクトル画像の赤、緑及び青成分についての水平及び垂直のヒストグラムデータを別々に計算するステップ;
(g)前記ヒストグラムデータと、遺伝的アルゴリズムを有するサポートベクトルマシン、繰り返しの特徴を除去する方法及び主成分分析のうちの少なくとも一つを使用する特徴選択法とを使って、前記DNAスペクトル画像のスペクトル特徴のセットを評価及びランク付けするステップ;
(h)前述のステップから上位にランク付けされた特徴のサブセットを用いて、反復DNA構造を有する前記DNAセグメントを分類する分類器を形成するステップ;
(i)評価基準を満たしたDNAセグメントを前記反復要素として標識付けし、前記反復要素の開始及び終了位置を記録するステップ;
を含む、請求項1ないし6のうちいずれか1項に記載の方法。 - 前記DNA配列中の構造的に新規のDNA要素の前記無監督の分類および発見が、以下のステップ、すなわち:
(1)入力されたDNA配列について、STFT窓W(W<L)、及び、窓の重複がV(V<W)で、Lはヌクレオチドの数であるとして、長さLのスペクトログラムS1を生じるステップ;
(2)Rヌクレオチド右へ移動し、スペクトログラムSiを生じ、前記DNA配列の終わりに達するまで繰り返すステップ;
(3)ステップ(1)及び(2)で生じたスペクトログラム全てを用いて、色、テクスチャ及び前記画像に現れる特定のオブジェクトという特徴の少なくとも一つを使って、無監督の画像ベースのクラスタリングを行うステップ;
(4)最も大きなクラスタを見つけて選択し、選択されたクラスタの中心を見きわめるステップ;
(5)選択されたクラスタの要素のラベルクラスを見きわるために、既知のゲノム源と対比して選択されたクラスタの検索を行うステップであって、これを
(a)選択されたクラスタの中心から最も遠いP個のスペクトログラムを無作為に選び、クラスラベルを行うサブステップ、または
(b)前記スペクトログラム、及び、前記スペクトログラムにおける全ての要素のクラスラベルの種類の可視化を操作者に提供し、スペクトログラムがクラスタ内にあり、その中心は既知であるが、前記クラスタの中心からさらに離れた前記スペクトログラムが未知である場合、新規の要素をクラスタの中心のクラスラベルとして名付け、さらに、その差の可視化を操作者に提供するサブステップ、
の一方ことによって行うステップ;
(6)次に大きいクラスタを選択し、前記クラスタ中心および前記クラスラベルが未知になるまでステップ(5)及び(6)を行う/繰り返し、K個のクラスタは既知のラベルを有し、U個のクラスタは未知のラベルを有していることを示す、ステップ;
(7)かなりのクラスタサイズをもつ未知のラベルを有するU個のクラスタ全てについて、パターンの普及率、同じ染色体内の統計的分布及び複数の染色体にわたる統計的分布を見つけるステップであって、前記かなりのクラスタサイズは、最大クラスタ中の要素の最大数の少なくとも半分である、ステップ;
(8)VがWの半分に達するまで、所与のステップサイズでVを増加させてステップ(1)に進み、その後ステップ(9)に進むステップ;
(9)WがLの半分に達するまで、所与のステップサイズでWを増加させてステップ(1)に進み、その後ステップ(10)に進むステップ;
(10)Lを増加させ、ステップ(1)に進むステップ;
(11)V、W、及びLの各レベルで結果を要約するステップ;
を実行することを含む、請求項1記載の方法。 - 1又は複数のDNAパターンが同定される、請求項1ないし8のうちいずれか1項に記載の方法。
- 前記1又は複数のDNAパターンが、CpGアイランド、1又は複数のAlu反復、1又は複数の非コードRNA、1又は複数のタンデム反復、及び、1又は複数のサテライト反復のうち少なくとも1つを含む、請求項9に記載の方法。
- 請求項1ないし10のうちいずれか一項記載の方法を動作させる及び/又は実行するように構成されたシステム。
- 少なくとも一つのプロセッサと、前記プロセッサに請求項1ないし10のうちいずれか一項記載の方法を実行させるコンピュータ・プログラムを含む、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78156806P | 2006-03-10 | 2006-03-10 | |
US60/781,568 | 2006-03-10 | ||
PCT/IB2007/050762 WO2007105150A2 (en) | 2006-03-10 | 2007-03-07 | Methods and systems for identification of dna patterns through spectral analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009529723A JP2009529723A (ja) | 2009-08-20 |
JP5297207B2 true JP5297207B2 (ja) | 2013-09-25 |
Family
ID=38509861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008557880A Expired - Fee Related JP5297207B2 (ja) | 2006-03-10 | 2007-03-07 | スペクトル分析を介したdnaパターンの同定方法及びシステム |
Country Status (7)
Country | Link |
---|---|
US (1) | US8189892B2 (ja) |
EP (1) | EP1999663A2 (ja) |
JP (1) | JP5297207B2 (ja) |
CN (1) | CN101401101B (ja) |
RU (1) | RU2466458C2 (ja) |
TW (1) | TW200741192A (ja) |
WO (1) | WO2007105150A2 (ja) |
Families Citing this family (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1999663A2 (en) * | 2006-03-10 | 2008-12-10 | Koninklijke Philips Electronics N.V. | Methods and systems for identification of dna patterns through spectral analysis |
US8925771B2 (en) | 2010-05-27 | 2015-01-06 | Che-Wen Lin | Cover-type containing structure for flexible enclosures |
EP2187328A1 (en) * | 2008-11-18 | 2010-05-19 | Koninklijke Philips Electronics N.V. | Method and device for efficient searching of DNA sequence based on energy bands of DNA spectrogram |
EP2228742A1 (en) | 2009-03-10 | 2010-09-15 | Koninklijke Philips Electronics N.V. | Efficient distribution method for frequency sorting in spectral video analysis of DNA sequences |
AU2010242073C1 (en) | 2009-04-30 | 2015-12-24 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
TWI399661B (zh) * | 2009-08-21 | 2013-06-21 | 從微陣列資料中分析及篩選疾病相關基因的系統 | |
US9163281B2 (en) | 2010-12-23 | 2015-10-20 | Good Start Genetics, Inc. | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
US20120191356A1 (en) * | 2011-01-21 | 2012-07-26 | International Business Machines Corporation | Assembly Error Detection |
US20140235474A1 (en) | 2011-06-24 | 2014-08-21 | Sequenom, Inc. | Methods and processes for non invasive assessment of a genetic variation |
US10424394B2 (en) | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10196681B2 (en) | 2011-10-06 | 2019-02-05 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US9984198B2 (en) | 2011-10-06 | 2018-05-29 | Sequenom, Inc. | Reducing sequence read count error in assessment of complex genetic variations |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
CA2850785C (en) | 2011-10-06 | 2022-12-13 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US8688388B2 (en) | 2011-10-11 | 2014-04-01 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
EP2768983A4 (en) | 2011-10-17 | 2015-06-03 | Good Start Genetics Inc | METHODS OF IDENTIFYING MUTATIONS ASSOCIATED WITH DISEASES |
WO2013109981A1 (en) | 2012-01-20 | 2013-07-25 | Sequenom, Inc. | Diagnostic processes that factor experimental conditions |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
US8812422B2 (en) | 2012-04-09 | 2014-08-19 | Good Start Genetics, Inc. | Variant database |
US10227635B2 (en) | 2012-04-16 | 2019-03-12 | Molecular Loop Biosolutions, Llc | Capture reactions |
US9920361B2 (en) | 2012-05-21 | 2018-03-20 | Sequenom, Inc. | Methods and compositions for analyzing nucleic acid |
US8787626B2 (en) * | 2012-05-21 | 2014-07-22 | Roger G. Marshall | OMNIGENE software system |
US10504613B2 (en) | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20130324417A1 (en) * | 2012-06-04 | 2013-12-05 | Good Start Genetics, Inc. | Determining the clinical significance of variant sequences |
US10497461B2 (en) | 2012-06-22 | 2019-12-03 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10482994B2 (en) | 2012-10-04 | 2019-11-19 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
RU2015121702A (ru) * | 2012-11-07 | 2016-12-27 | Лайф Текнолоджиз Корпорейшн | Средства визуализации данных цифровой пцр |
RU2538138C2 (ru) * | 2012-11-09 | 2015-01-10 | Елена Андреевна Чирясова | Способ изучения флуоресцентных свойств и спектральных характеристик нуклеотидных последовательностей днк с помощью квантово-связанного спектра излучения красителей со свободыми флуорофорными группами |
US20130309666A1 (en) | 2013-01-25 | 2013-11-21 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
EP2971159B1 (en) | 2013-03-14 | 2019-05-08 | Molecular Loop Biosolutions, LLC | Methods for analyzing nucleic acids |
HUE061261T2 (hu) | 2013-04-03 | 2023-05-28 | Sequenom Inc | Eljárások és folyamatok genetikai variánsok nem invazív értékelésére |
EP3004383B1 (en) | 2013-05-24 | 2019-04-24 | Sequenom, Inc. | Methods for non-invasive assessment of genetic variations using area-under-curve (auc) analysis |
US8847799B1 (en) | 2013-06-03 | 2014-09-30 | Good Start Genetics, Inc. | Methods and systems for storing sequence read data |
BR112015032031B1 (pt) | 2013-06-21 | 2023-05-16 | Sequenom, Inc | Métodos e processos para avaliação não invasiva das variações genéticas |
AU2014329493B2 (en) | 2013-10-04 | 2020-09-03 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
EP3495496B1 (en) | 2013-10-07 | 2020-11-25 | Sequenom, Inc. | Methods and processes for non-invasive assessment of chromosome alterations |
EP3058096A1 (en) | 2013-10-18 | 2016-08-24 | Good Start Genetics, Inc. | Methods for assessing a genomic region of a subject |
US10851414B2 (en) | 2013-10-18 | 2020-12-01 | Good Start Genetics, Inc. | Methods for determining carrier status |
JP6340438B2 (ja) * | 2014-02-13 | 2018-06-06 | イルミナ インコーポレイテッド | 統合消費者ゲノムサービス |
US11053548B2 (en) | 2014-05-12 | 2021-07-06 | Good Start Genetics, Inc. | Methods for detecting aneuploidy |
US20160034640A1 (en) | 2014-07-30 | 2016-02-04 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US11408024B2 (en) | 2014-09-10 | 2022-08-09 | Molecular Loop Biosciences, Inc. | Methods for selectively suppressing non-target sequences |
EP3224595A4 (en) | 2014-09-24 | 2018-06-13 | Good Start Genetics, Inc. | Process control for increased robustness of genetic assays |
EP3023884A1 (en) * | 2014-11-21 | 2016-05-25 | Thomson Licensing | Method and apparatus for generating fingerprint of an audio signal |
WO2016112073A1 (en) | 2015-01-06 | 2016-07-14 | Good Start Genetics, Inc. | Screening for structural variants |
WO2016193075A1 (en) * | 2015-06-02 | 2016-12-08 | Koninklijke Philips N.V. | Methods, systems and apparatus for subpopulation detection from biological data |
WO2017066785A1 (en) * | 2015-10-16 | 2017-04-20 | The Regents Of The University Of California, A California Corporation | Repetitive element (re)-based genome analysis and dynamic genetics surveillance systems |
EP3491560A1 (en) | 2016-07-27 | 2019-06-05 | Sequenom, Inc. | Genetic copy number alteration classifications |
EP3497233B1 (en) | 2016-08-08 | 2021-11-10 | F. Hoffmann-La Roche AG | Basecalling for stochastic sequencing processes |
US9943505B2 (en) | 2016-09-09 | 2018-04-17 | Corcept Therapeutics, Inc. | Glucocorticoid receptor modulators to treat pancreatic cancer |
US10216899B2 (en) | 2016-10-20 | 2019-02-26 | Hewlett Packard Enterprise Development Lp | Sentence construction for DNA classification |
CA3207879A1 (en) | 2017-01-24 | 2018-08-02 | Sequenom, Inc. | Methods and processes for assessment of genetic variations |
JP6240804B1 (ja) * | 2017-04-13 | 2017-11-29 | 大▲連▼大学 | 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム |
CN107437001B (zh) * | 2017-07-03 | 2020-03-27 | 微梦创科网络科技(中国)有限公司 | 信息序列转换为向量化数据的方法及系统 |
CN108009402A (zh) * | 2017-07-25 | 2018-05-08 | 北京工商大学 | 一种基于动态卷积网络的微生物基因序列分类模型的方法 |
US20190114388A1 (en) * | 2017-10-16 | 2019-04-18 | Genomic Vision Sa | Detection, measurement, and analysis of dna replication signals |
US11656174B2 (en) | 2018-01-26 | 2023-05-23 | Viavi Solutions Inc. | Outlier detection for spectroscopic classification |
US10810408B2 (en) | 2018-01-26 | 2020-10-20 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic classification |
US11009452B2 (en) * | 2018-01-26 | 2021-05-18 | Viavi Solutions Inc. | Reduced false positive identification for spectroscopic quantification |
CN108363905B (zh) * | 2018-02-07 | 2019-03-08 | 南京晓庄学院 | 一种用于植物外源基因改造的CodonPlant系统及其改造方法 |
US11380422B2 (en) * | 2018-03-26 | 2022-07-05 | Uchicago Argonne, Llc | Identification and assignment of rotational spectra using artificial neural networks |
CN112288783B (zh) * | 2018-08-22 | 2021-06-29 | 深圳市真迈生物科技有限公司 | 基于图像构建测序模板的方法、碱基识别方法和装置 |
EP3843033B1 (en) * | 2018-08-22 | 2024-05-22 | GeneMind Biosciences Company Limited | Method for constructing sequencing template based on image, and base recognition method and device |
CN109800337B (zh) * | 2018-12-06 | 2023-07-11 | 成都网安科技发展有限公司 | 一种适用于大字母表的多模式正则匹配算法 |
CN109818623B (zh) * | 2019-01-16 | 2022-12-13 | 上海上塔软件开发有限公司 | 一种基于特征模板的生活电器功率曲线在线压缩算法 |
CA3212158A1 (en) * | 2021-03-03 | 2022-09-09 | Mitsubishi Electric Corporation | Signal processing device, control circuit, storage medium, and signal processing method |
JP2023016243A (ja) * | 2021-07-21 | 2023-02-02 | パナソニックIpマネジメント株式会社 | 学習装置、学習方法、および非破壊検査システム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5580728A (en) * | 1994-06-17 | 1996-12-03 | Perlin; Mark W. | Method and system for genotyping |
US6142681A (en) * | 1999-02-22 | 2000-11-07 | Vialogy Corporation | Method and apparatus for interpreting hybridized bioelectronic DNA microarray patterns using self-scaling convergent reverberant dynamics |
US6136541A (en) * | 1999-02-22 | 2000-10-24 | Vialogy Corporation | Method and apparatus for analyzing hybridized biochip patterns using resonance interactions employing quantum expressor functions |
US6287773B1 (en) * | 1999-05-19 | 2001-09-11 | Hoeschst-Ariad Genomics Center | Profile searching in nucleic acid sequences using the fast fourier transformation |
US6728642B2 (en) * | 2001-03-29 | 2004-04-27 | E. I. Du Pont De Nemours And Company | Method of non-linear analysis of biological sequence data |
US6950755B2 (en) * | 2001-07-02 | 2005-09-27 | City Of Hope | Genotype pattern recognition and classification |
US20040101873A1 (en) * | 2002-02-06 | 2004-05-27 | Went Gregory T. | Method and apparatus for validating DNA sequences without sequencing |
WO2004007016A2 (en) | 2002-07-11 | 2004-01-22 | The Research Foundation Of State University Of New York | A method of using g-matrix fourier transformation nuclear magnetic resonance (gft nmr) spectroscopy for rapid chemical shift assignment and secondary structure determination of proteins |
EP1999663A2 (en) * | 2006-03-10 | 2008-12-10 | Koninklijke Philips Electronics N.V. | Methods and systems for identification of dna patterns through spectral analysis |
-
2007
- 2007-03-07 EP EP07713221A patent/EP1999663A2/en not_active Ceased
- 2007-03-07 JP JP2008557880A patent/JP5297207B2/ja not_active Expired - Fee Related
- 2007-03-07 US US12/282,435 patent/US8189892B2/en not_active Expired - Fee Related
- 2007-03-07 RU RU2008140168/08A patent/RU2466458C2/ru not_active IP Right Cessation
- 2007-03-07 TW TW096107903A patent/TW200741192A/zh unknown
- 2007-03-07 CN CN200780008687.1A patent/CN101401101B/zh not_active Expired - Fee Related
- 2007-03-07 WO PCT/IB2007/050762 patent/WO2007105150A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2009529723A (ja) | 2009-08-20 |
RU2466458C2 (ru) | 2012-11-10 |
TW200741192A (en) | 2007-11-01 |
EP1999663A2 (en) | 2008-12-10 |
RU2008140168A (ru) | 2010-04-20 |
WO2007105150A2 (en) | 2007-09-20 |
CN101401101A (zh) | 2009-04-01 |
CN101401101B (zh) | 2014-06-04 |
WO2007105150A3 (en) | 2008-04-24 |
US20090129647A1 (en) | 2009-05-21 |
US8189892B2 (en) | 2012-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5297207B2 (ja) | スペクトル分析を介したdnaパターンの同定方法及びシステム | |
EP3090381B1 (en) | Systems and methods for spectral unmixing of microscopic images using pixel grouping | |
EP2478356A1 (en) | High-throughput biomarker segmentation utilizing hierarchical normalized cuts | |
CN107944228A (zh) | 一种基因测序变异位点的可视化方法 | |
JP2003500663A (ja) | 実験データの正規化のための方法 | |
Qin et al. | Spot detection and image segmentation in DNA microarray data | |
Wang et al. | MSB: a mean-shift-based approach for the analysis of structural variation in the genome | |
Helmy et al. | Regular gridding and segmentation for microarray images | |
US8374798B2 (en) | Apparatus, method, and computer program product for determining gene function and functional groups using chromosomal distribution patterns | |
Nagesh et al. | An improved iterative watershed and morphological transformation techniques for segmentation of microarray images | |
Bryan et al. | Optimization-based decoding of Imaging Spatial Transcriptomics data | |
Dimitrova et al. | Analysis and visualization of DNA spectrograms: open possibilities for the genome research | |
US7689365B2 (en) | Apparatus, method, and computer program product for determining gene function and functional groups using chromosomal distribution patterns | |
Maji | Recent advances in multimodal big data analysis for cancer diagnosis | |
EP2310968B1 (en) | A method for spectral dna analysis | |
Zhang et al. | CNV-PCC: An efficient method for detecting copy number variations from next-generation sequencing data | |
WO2008129458A1 (en) | A method for data mining dna frequency based spectra | |
Blazadonakis et al. | The linear neuron as marker selector and clinical predictor in cancer gene analysis | |
WO2008129459A2 (en) | A method for visualizing a dna sequence | |
Cvek et al. | 16 Multidimensional | |
Bucur et al. | Frequency sorting method for spectral analysis of DNA sequences | |
Nagesh et al. | Evaluating the performance of watershed and morphology on microarray spot segmentation | |
Symons | Analysis and visualization of gene expression data | |
Nakao et al. | The development of a novel method for the classification of the aCGH profiles based on genomic alterations | |
Ruusuvuori et al. | Learning-based method for spot addressing in microarray images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5297207 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |