JP5247009B2 - 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 - Google Patents
配列抽出装置、配列抽出方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP5247009B2 JP5247009B2 JP2006168100A JP2006168100A JP5247009B2 JP 5247009 B2 JP5247009 B2 JP 5247009B2 JP 2006168100 A JP2006168100 A JP 2006168100A JP 2006168100 A JP2006168100 A JP 2006168100A JP 5247009 B2 JP5247009 B2 JP 5247009B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- information
- predetermined length
- comparison
- appearance frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 122
- 238000004364 calculation method Methods 0.000 claims description 27
- 150000001413 amino acids Chemical class 0.000 claims description 22
- 238000000034 method Methods 0.000 description 71
- 238000012545 processing Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 25
- 108090000623 proteins and genes Proteins 0.000 description 23
- 230000008569 process Effects 0.000 description 22
- 230000000694 effects Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 230000004807 localization Effects 0.000 description 16
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 11
- 241000209094 Oryza Species 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- 235000009566 rice Nutrition 0.000 description 10
- 230000000052 comparative effect Effects 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 241000219195 Arabidopsis thaliana Species 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 6
- 230000010365 information processing Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 241000219194 Arabidopsis Species 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000004899 motility Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101710203837 Replication-associated protein Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
まず、本発明の概要について図1を参照して説明する。図1は、本発明の基本原理を示す原理構成図である。
(1)所定長配列を比較配列中で、或る位置に移動する。
(2)(1)で移動した位置において、所定長配列とこれに対応する比較配列の部分とが完全に又は部分的に一致するか否かを判定する。
(3)(2)での判定結果が完全に又は部分的に一致するというものであった場合には、(1)で移動した位置を出現位置として決定する。
(4)(1)、(2)および(3)の処理を、比較配列中の全ての位置で網羅的に実行する。
なお、上述した(2)の処理においては、所定長配列とこれに対応する比較配列の部分とが完全に一致している場合に、これらが一致すると判定してもよく、また、所定長配列とこれに対応する比較配列の部分とが完全に一致していない場合であっても、これらの不一致の程度に応じて(例えば1つの塩基又は1つのアミノ酸の相違といった程度の不一致であれば)これらの配列が一致すると判定してもよい。具体的には、所定長配列および比較配列が塩基配列である場合、上述した(2)の処理においては、例えば「GACTC」で表される所定長配列を「GANTC」のような配列(Nは任意の塩基を表す。)に置き換え、この置き換えた配列とこれに対応する比較配列の部分とが完全に一致するか否かを判定してもよい。つまり、Nに対応する塩基以外の塩基が完全に一致するか否かを判定してもよい。
(A)極大ピーク値(出現頻度の極大値)が閾値のN0倍以上である。N0は実数であり、例えば5などである。
(B)極大ピーク値が、全体の出現頻度から算出した標準偏差(SD)のN1倍以上である。N1は実数であり、例えば5などである。
(C)出現頻度を縦軸とし位置を横軸とするグラフにおいて、極大ピーク位置(極大ピーク値に対応する位置)から最も近くに存在する当該極大ピーク位置の両側の極小ピーク位置(極小ピーク値(出現頻度の極小値)に対応する位置)で挟まれた領域(出現頻度に関する領域)を閾値を表す直線で仕切ることで形成された2つの領域の面積の比が、N2以上または1/N2倍以下である。N2は実数であり、例えば5などである。
つぎに、本実施の形態にかかる配列抽出装置100の構成について、図2から図7を参照して説明する。図2は、配列抽出装置100の構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
つぎに、配列抽出装置100の制御部102で行うメイン処理を、図8等を参照して説明する。図8は、配列抽出装置100の制御部102で行うメイン処理の一例を示すフローチャートである。
(I)極大ピーク値(出現頻度の極大値)が閾値のN0倍以上である。N0は実数であり、例えば5などである。
(II)極大ピーク値が、全体の出現頻度から算出した標準偏差(SD)のN1倍以上である。N1は実数であり、例えば5などである。
(III)出現頻度を縦軸とし位置を横軸とするグラフにおいて、極大ピーク位置(極大ピーク値に対応する位置)から最も近くに存在する当該極大ピーク位置の両側の極小ピーク位置(極小ピーク値(出現頻度の極小値)に対応する位置)で挟まれた領域(出現頻度に関する領域)を閾値を表す直線で仕切ることで形成された2つの領域の面積の比が、N2以上または1/N2倍以下である。N2は実数であり、例えば5などである。
以上説明したように、配列抽出装置100は、所定長配列情報および複数の比較配列情報を取得し、取得した所定長配列情報および複数の比較配列情報に基づいて、比較配列ごとに、所定長配列が当該比較配列中に出現する位置である出現位置を検索し、検索した記出現位置に関する出現位置情報に基づいて、比較配列中の位置ごとに、当該位置で所定長配列が出現する頻度である出現頻度を算出し、算出した出現頻度に関する出現頻度情報に基づいて閾値に関する閾値情報を設定し、出現頻度情報および設定した閾値情報に基づいて、比較配列中の位置ごとに、出現頻度と閾値との大小関係を比較する。これにより、入力データの制限を受けずに、コンピュータ解析だけで、特定の場所(位置)に局在する配列を効率よく且つ効果的に抽出することができる。また、配列抽出装置100よれば、所定長配列が出現する場所に注目し、特定の場所に局在することを指標とすることで、機能性配列の候補を効率よく且つ効果的に抽出することができる。これにより、入力データである複数の比較配列情報は互いに機能的に関連性を持っている必要が無く、その結果、配列抽出装置100では、従来のように入力データを事前に実験などで取得しておく必要は無い。つまり、配列抽出装置100よれば、所定長配列情報および複数の比較配列情報に関するテキストデータのみで、機能性配列の候補を効率よく且つ効果的に抽出することができる。また、配列抽出装置100よれば、入力データ(所定長配列情報および比較配列情報)に対応した最適な閾値を設定することができ、結果的に出現頻度と閾値との比較結果の精度を高めることができる。
(a)所定長配列を比較配列中で移動する。
(b)(a)で移動した位置において、所定長配列とこれに対応する比較配列の部分とが完全に又は部分的に一致するか否かを判定する。
(c)(b)での判定結果が完全に又は部分的に一致するというものであった場合、(a)で移動した位置を出現位置として決定する。
(d)(a)から(c)の処理を、比較配列中の全ての位置で網羅的に実行する。
102 制御部
102a 取得部
102b 生成部
102c 検索部
102c1 移動部
102c2 判定部
102c3 決定部
102d 算出部
102e 比較部
102f 設定部
102g 表示部
104 通信インターフェース部
106 記憶部
106a 所定長配列情報ファイル
106b 比較配列情報データベース
106c 出現位置情報ファイル
106d 出現頻度情報ファイル
106e 比較結果情報ファイル
108 入出力インターフェース部
110 入力装置
112 出力装置
200 外部システム
300 ネットワーク
Claims (13)
- 塩基またはアミノ酸で構成される配列であって所定の長さを有する所定長配列に関する所定長配列情報、および前記配列であって前記所定長配列の比較対象となる前記所定の長さ以上の長さを有する比較配列に関する複数の比較配列情報を取得する取得手段と、
前記取得手段で取得した前記所定長配列情報および複数の前記比較配列情報に基づいて、前記比較配列ごとに、前記所定長配列が当該比較配列中に出現する位置である出現位置を検索する検索手段と、
前記検索手段で検索した前記出現位置に関する出現位置情報に基づいて、前記比較配列中の前記位置ごとに、当該位置で前記所定長配列が出現する頻度である出現頻度を算出する算出手段と、
前記算出手段で算出した前記出現頻度に関する出現頻度情報に基づいて、閾値に関する閾値情報を設定する設定手段と、
前記算出手段で算出した前記出現頻度情報および前記設定手段で設定した前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値との大小関係を比較する比較手段と、
を備え、
前記設定手段は、前記出現頻度の極大値が全体の前記出現頻度から算出した標準偏差の1以上の実数倍以上であるという条件が満たされる場合において、前記極大値が前記閾値の1以上の実数倍以上であり且つ2つの領域の面積の比が1以上の実数倍以上または1以下の実数倍以下であるという条件を満たす前記閾値を設定し、
前記2つの領域は、前記出現頻度を縦軸とし前記位置を横軸とするグラフにおいて、前記出現頻度の極小値に対応する前記位置で挟まれた領域を前記閾値を表す直線で仕切ることで形成されたものであり、
前記極小値に対応する前記位置は、前記極大値に対応する前記位置から最も近く且つ当該位置の両側に存在するものであること、
を特徴とする配列抽出装置。 - 前記出現頻度情報を表示する表示手段
をさらに備え、
前記設定手段は、前記表示手段で表示した前記出現頻度情報について前記閾値情報を設定させ、
前記比較手段は、前記設定手段で前記閾値情報が設定された場合、前記出現頻度情報および前記設定された前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値とを比較すること
を特徴とする請求項1に記載の配列抽出装置。 - 前記検索手段は、
前記所定長配列を前記比較配列中で移動する移動手段と、
前記移動手段で移動した前記位置において、前記所定長配列とこれに対応する前記比較配列の部分とが完全に又は部分的に一致するか否かを判定する判定手段と、
前記判定手段での判定結果が完全に又は部分的に一致するというものであった場合、前記移動した前記位置を前記出現位置として決定する決定手段と、
をさらに備え、
前記移動手段、前記判定手段および前記決定手段を繰り返し実行すること
を特徴とする請求項1または2に記載の配列抽出装置。 - 前記取得手段で取得した前記所定長配列情報に基づいて、前記所定長配列と同じ長さで且つそれを構成する前記塩基または前記アミノ酸が前記所定長配列と異なる同一長異種配列に関する同一長異種配列情報を生成する生成手段
をさらに備え、
前記生成手段で生成した前記同一長異種配列情報について、少なくとも前記検索手段、前記算出手段および前記比較手段を実行すること
を特徴とする請求項1から3のいずれか1つに記載の配列抽出装置。 - コンピュータで実行される、
塩基またはアミノ酸で構成される配列であって所定の長さを有する所定長配列に関する所定長配列情報、および前記配列であって前記所定長配列の比較対象となる前記所定の長さ以上の長さを有する比較配列に関する複数の比較配列情報を取得する取得ステップと、
前記取得ステップで取得した前記所定長配列情報および複数の前記比較配列情報に基づいて、前記比較配列ごとに、前記所定長配列が当該比較配列中に出現する位置である出現位置を検索する検索ステップと、
前記検索ステップで検索した前記出現位置に関する出現位置情報に基づいて、前記比較配列中の前記位置ごとに、当該位置で前記所定長配列が出現する頻度である出現頻度を算出する算出ステップと、
前記算出ステップで算出した前記出現頻度に関する出現頻度情報に基づいて、閾値に関する閾値情報を設定する設定ステップと、
前記算出ステップで算出した前記出現頻度情報および前記設定ステップで設定した前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値との大小関係を比較する比較ステップと、
を含み、
前記設定ステップは、前記出現頻度の極大値が全体の前記出現頻度から算出した標準偏差の1以上の実数倍以上であるという条件が満たされる場合において、前記極大値が前記閾値の1以上の実数倍以上であり且つ2つの領域の面積の比が1以上の実数倍以上または1以下の実数倍以下であるという条件を満たす前記閾値を設定し、
前記2つの領域は、前記出現頻度を縦軸とし前記位置を横軸とするグラフにおいて、前記出現頻度の極小値に対応する前記位置で挟まれた領域を前記閾値を表す直線で仕切ることで形成されたものであり、
前記極小値に対応する前記位置は、前記極大値に対応する前記位置から最も近く且つ当該位置の両側に存在するものであること、
を特徴とする配列抽出方法。 - 前記コンピュータで実行される、前記出現頻度情報を表示する表示ステップ
をさらに含み、
前記設定ステップは、前記表示ステップで表示した前記出現頻度情報について前記閾値情報を設定させ、
前記比較ステップは、前記設定ステップで前記閾値情報が設定された場合、前記出現頻度情報および前記設定された前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値とを比較すること
を特徴とする請求項5に記載の配列抽出方法。 - 前記検索ステップは、
前記所定長配列を前記比較配列中で移動する移動ステップと、
前記移動ステップで移動した前記位置において、前記所定長配列とこれに対応する前記比較配列の部分とが完全に又は部分的に一致するか否かを判定する判定ステップと、
前記判定ステップでの判定結果が完全に又は部分的に一致するというものであった場合、前記移動した前記位置を前記出現位置として決定する決定ステップと、
をさらに含み、
前記移動ステップ、前記判定ステップおよび前記決定ステップを繰り返し実行すること
を特徴とする請求項5または6に記載の配列抽出方法。 - 前記コンピュータで実行される、前記取得ステップで取得した前記所定長配列情報に基づいて、前記所定長配列と同じ長さで且つそれを構成する前記塩基または前記アミノ酸が前記所定長配列と異なる同一長異種配列に関する同一長異種配列情報を生成する生成ステップ
をさらに含み、
前記コンピュータは、前記生成ステップで生成した前記同一長異種配列情報について、少なくとも前記検索ステップ、前記算出ステップおよび前記比較ステップを実行すること
を特徴とする請求項5から7のいずれか1つに記載の配列抽出方法。 - 塩基またはアミノ酸で構成される配列であって所定の長さを有する所定長配列に関する所定長配列情報、および前記配列であって前記所定長配列の比較対象となる前記所定の長さ以上の長さを有する比較配列に関する複数の比較配列情報を取得する取得ステップと、
前記取得ステップで取得した前記所定長配列情報および複数の前記比較配列情報に基づいて、前記比較配列ごとに、前記所定長配列が当該比較配列中に出現する位置である出現位置を検索する検索ステップと、
前記検索ステップで検索した前記出現位置に関する出現位置情報に基づいて、前記比較配列中の前記位置ごとに、当該位置で前記所定長配列が出現する頻度である出現頻度を算出する算出ステップと、
前記算出ステップで算出した前記出現頻度に関する出現頻度情報に基づいて、閾値に関する閾値情報を設定する設定ステップと、
前記算出ステップで算出した前記出現頻度情報および前記設定ステップで設定した前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値との大小関係を比較する比較ステップと、
を含む配列抽出方法をコンピュータに実行させ、
前記設定ステップは、前記出現頻度の極大値が全体の前記出現頻度から算出した標準偏差の1以上の実数倍以上であるという条件が満たされる場合において、前記極大値が前記閾値の1以上の実数倍以上であり且つ2つの領域の面積の比が1以上の実数倍以上または1以下の実数倍以下であるという条件を満たす前記閾値を設定し、
前記2つの領域は、前記出現頻度を縦軸とし前記位置を横軸とするグラフにおいて、前記出現頻度の極小値に対応する前記位置で挟まれた領域を前記閾値を表す直線で仕切ることで形成されたものであり、
前記極小値に対応する前記位置は、前記極大値に対応する前記位置から最も近く且つ当該位置の両側に存在するものであること、
を特徴とするプログラム。 - 前記出現頻度情報を表示する表示ステップ
をさらに含み、
前記設定ステップは、前記表示ステップで表示した前記出現頻度情報について前記閾値情報を設定させ、
前記比較ステップは、前記設定ステップで前記閾値情報が設定された場合、前記出現頻度情報および前記設定された前記閾値情報に基づいて、前記比較配列中の前記位置ごとに、前記出現頻度と前記閾値とを比較すること
を特徴とする請求項9に記載のプログラム。 - 前記検索ステップは、
前記所定長配列を前記比較配列中で移動する移動ステップと、
前記移動ステップで移動した前記位置において、前記所定長配列とこれに対応する前記比較配列の部分とが完全に又は部分的に一致するか否かを判定する判定ステップと、
前記判定ステップでの判定結果が完全に又は部分的に一致するというものであった場合、前記移動した前記位置を前記出現位置として決定する決定ステップと、
をさらに含み、
前記移動ステップ、前記判定ステップおよび前記決定ステップを繰り返し実行すること
を特徴とする請求項9または10に記載のプログラム。 - 前記取得ステップで取得した前記所定長配列情報に基づいて、前記所定長配列と同じ長さで且つそれを構成する前記塩基または前記アミノ酸が前記所定長配列と異なる同一長異種配列に関する同一長異種配列情報を生成する生成ステップ
をさらに含み、
前記生成ステップで生成した前記同一長異種配列情報について、少なくとも前記検索ステップ、前記算出ステップおよび前記比較ステップを実行すること
を特徴とする請求項9から11のいずれか1つに記載のプログラム。 - 前記請求項9から12のいずれか1つに記載のプログラムを記録したこと
を特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006168100A JP5247009B2 (ja) | 2006-06-16 | 2006-06-16 | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006168100A JP5247009B2 (ja) | 2006-06-16 | 2006-06-16 | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007334769A JP2007334769A (ja) | 2007-12-27 |
JP5247009B2 true JP5247009B2 (ja) | 2013-07-24 |
Family
ID=38934169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006168100A Expired - Fee Related JP5247009B2 (ja) | 2006-06-16 | 2006-06-16 | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5247009B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2479278A1 (en) * | 2011-01-25 | 2012-07-25 | Synpromics Ltd. | Method for the construction of specific promoters |
WO2019187100A1 (ja) * | 2018-03-30 | 2019-10-03 | 株式会社Rhelixa | データ作成装置、データ作成方法及びデータ作成プログラムを記憶した記憶媒体 |
CN113454727A (zh) * | 2019-02-07 | 2021-09-28 | 生物钥匙公司 | 生物序列信息处理 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT728015E (pt) * | 1992-06-18 | 2006-07-31 | Creagen Inc | Antigenes polipeptidicos combinatoriais |
JP3476310B2 (ja) * | 1996-08-01 | 2003-12-10 | 富士通株式会社 | 蛋白質データベース・システム並びに蛋白質の名前および機能の表示方法 |
WO2003014960A2 (en) * | 2001-08-03 | 2003-02-20 | Medical Research Council | Method of identifying a consensus sequence for intracellular antibodies |
JP3530842B2 (ja) * | 2001-11-19 | 2004-05-24 | 株式会社日立製作所 | 核酸塩基配列アセンブル装置及びその動作方法 |
JP4034740B2 (ja) * | 2002-04-18 | 2008-01-16 | 北海道ティー・エル・オー株式会社 | Dna合成用のプライマーの選定方法 |
JP4250554B2 (ja) * | 2003-04-02 | 2009-04-08 | キヤノン株式会社 | Dnaプローブ設計装置及びdnaプローブ設計のための情報処理方法 |
JP4385119B2 (ja) * | 2003-09-08 | 2009-12-16 | 国立大学法人九州大学 | 共通パターン発見装置とプログラム、記憶媒体、及び共通パターン発見方法 |
JP3976331B2 (ja) * | 2004-08-10 | 2007-09-19 | 学校法人早稲田大学 | 特徴パターン認識システムおよびその方法、並びにプログラム |
-
2006
- 2006-06-16 JP JP2006168100A patent/JP5247009B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007334769A (ja) | 2007-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Farré et al. | Identification of patterns in biological sequences at the ALGGEN server: PROMO and MALGEN | |
Down et al. | NestedMICA: sensitive inference of over-represented motifs in nucleic acid sequence | |
Lin et al. | iPro54-PseKNC: a sequence-based predictor for identifying sigma-54 promoters in prokaryote with pseudo k-tuple nucleotide composition | |
CN106068330B (zh) | 将已知等位基因用于读数映射中的系统和方法 | |
Gan et al. | A comparison study on feature selection of DNA structural properties for promoter prediction | |
Baek et al. | Quantitative analysis of genome-wide chromatin remodeling | |
Kucherov | Evolution of biosequence search algorithms: a brief survey | |
JP5247009B2 (ja) | 配列抽出装置、配列抽出方法、プログラムおよび記録媒体 | |
Katara et al. | Phylogenetic footprinting: a boost for microbial regulatory genomics | |
Wang et al. | A steganalysis-based approach to comprehensive identification and characterization of functional regulatory elements | |
Sacan et al. | LFM-Pro: a tool for detecting significant local structural sites in proteins | |
CA2519674A1 (en) | Genomic profiling of regulatory factor binding sites | |
Yang et al. | DNA motif discovery based on ant colony optimization and expectation maximization | |
Kann et al. | A structure-based method for protein sequence alignment | |
Vingron et al. | Integrating sequence, evolution and functional genomics in regulatory genomics | |
Prohaska et al. | The use and abuse of-omes | |
Pavesi et al. | Using Weeder for the discovery of conserved transcription factor binding sites | |
Zhao et al. | DTA-SiST: de novo transcriptome assembly by using simplified suffix trees | |
JP2004295606A (ja) | 遺伝子機能推定装置、遺伝子機能推定方法、および、プログラム | |
Osborne et al. | Capturing genomic relationships that matter | |
Brejová et al. | Pattern discovery: Methods and software | |
JP2007108949A (ja) | 遺伝子発現制御配列の推定方法 | |
Taneda | An efficient genetic algorithm for structural RNA pairwise alignment and its application to non-coding RNA discovery in yeast | |
Gunewardena et al. | Enhancing the prediction of transcription factor binding sites by incorporating structural properties and nucleotide covariations | |
Chan et al. | Generic spaced DNA motif discovery using Genetic Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130409 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |