JP2014515131A - 隠れマルコフモデルを見出す方法 - Google Patents
隠れマルコフモデルを見出す方法 Download PDFInfo
- Publication number
- JP2014515131A JP2014515131A JP2013557997A JP2013557997A JP2014515131A JP 2014515131 A JP2014515131 A JP 2014515131A JP 2013557997 A JP2013557997 A JP 2013557997A JP 2013557997 A JP2013557997 A JP 2013557997A JP 2014515131 A JP2014515131 A JP 2014515131A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- state
- states
- observed
- transitions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007704 transition Effects 0.000 claims description 133
- 238000000034 method Methods 0.000 claims description 97
- 230000008859 change Effects 0.000 claims description 14
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 230000003467 diminishing effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 abstract description 25
- 238000011156 evaluation Methods 0.000 abstract description 2
- 230000007958 sleep Effects 0.000 description 29
- 230000008569 process Effects 0.000 description 15
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 239000003814 drug Substances 0.000 description 11
- 230000012010 growth Effects 0.000 description 11
- 241000699670 Mus sp. Species 0.000 description 10
- 229940079593 drug Drugs 0.000 description 8
- 238000013515 script Methods 0.000 description 8
- 108090000862 Ion Channels Proteins 0.000 description 7
- 102000004310 Ion Channels Human genes 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005286 illumination Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 230000004461 rapid eye movement Effects 0.000 description 4
- 230000031018 biological processes and functions Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 230000002427 irreversible effect Effects 0.000 description 3
- 238000011813 knockout mouse model Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000036385 rapid eye movement (rem) sleep Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 206010062519 Poor quality sleep Diseases 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000037322 slow-wave sleep Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 101000934888 Homo sapiens Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 102000004257 Potassium Channel Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100025393 Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Human genes 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000035992 intercellular communication Effects 0.000 description 1
- 230000010262 intracellular communication Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 108020001213 potassium channel Proteins 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 238000005350 potential energy hypersurface Methods 0.000 description 1
- 238000005182 potential energy surface Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000008667 sleep stage Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本願は、米国特許出願第11/282,410号(2005年11月18日出願)の継続出願であり、該出願は、米国仮特許出願第60/629,114号(2004年11月18日出願)の優先日の利益を主張する。
1)QUBによって提供される便利なインターフェースにおいて実行する、Pythonスクリプトである、ModelGrower.py。本プログラムのためのソースコードのコピーは、本特許に添付される。
2)NAUTY22ディレクトリ内のgeng.exe、allpermg.exe、shortg.exe、およびlistm.exeと、色区分を適切に処理するためのBrendan McKayのオープンソースソフトウェアパッケージNAUTYの当業者にとって分かりやすい関連付けられた拡張/修正とであって、オリジナルは、オンラインで取得され、マルコフモデルに内在するグラフの同型重複を計数および排除するために使用される。
3)NAUTY22ディレクトリ内のchecklist、countgraphs、およびcountgraphjobと、cygwinディレクトリ内のcountjob.batおよびcountjobs.bat。全て、プログラム2)を1)から読み出すためのスクリプトを接続する。
我々は、U.Texas Southwestern Medical Center(Dallas,TX)のRolf Johoから、マウス睡眠状態の観測結果を入手した。これらのEEGベースのデータは、13の個々の野生型(WT)および13の個々のKv3.1/Kv3.3ダブルノックアウト(DKO)マウスに対する12/12照明/暗闇サイクルにおけるスペクトル的に割り当てられた24時間間の睡眠状態の観測結果である(ファイルMouseSleepKineticsWT.dwtおよびMouseSleepKineticsDKO.dwtならびに対応する照明および暗闇選択リスト参照)。各15秒の観測間隔が、コード1=REM睡眠(黒色、正方形)、2=徐波睡眠またはSWS(赤色、円形)、または3=覚醒(青色、六角形)に割り当てられる。照明および暗闇期間の間に差異を有するように、DKOマウスとWTマウスの睡眠/覚醒サイクルの大きな差異が、観測された(“Severely Disordered Sleep/Wake Cycle in KV3.1/KV3.3−DeficientMice”,F.Espinosa,G.A.Marks,&R.H. Joho,Abstract 580.A in SLEEP,Vol.25,Abstract Supplement 2002,pp.A411−412参照、本明細書では、「Joho」)。
インストール時の注意:
1)デフォルトcygwinインストールは、標準的bash shellに加え、tcshを含むように修正されなければならない。スクリプトは、より柔軟なtcshコマンド環境用に書かれる。
2)ModelGrower.py、countjob.bat、およびecho.batファイル内のパスは、正しい区分をポイントしなければならない([c−f]:を検索)
3)NAUTY22ディレクトリは、再コンパイルされる必要はない。
4)ModelGrower.pyは、Pythonスクリプトディレクトリ内のModelBuilder.pyと置換されるはずである。
実行時の注意:
1)我々は、秒をミリ秒として解釈し、したがって、時間尺度は、そのためにQUBが設計されたイオンチャネル反応速度にほぼ対応する。故に、最適化モデルにおける遷移速度は、1000秒あたりである。
2)我々は、不感時間=データサンプリング差分t(マウス睡眠データに対して15ミリ秒)を使用する。
3)理想化の前に、我々は、モデル内のデフォルト「イオンチャネル電流振幅」を黒色に対して1、赤色に対して2、および青色に対して3に変更し、睡眠状態コードに対応させる必要があった。デフォルト値は、0から始まる整数であった(閉鎖の間)。本変化は、.dwt(滞在時間)ファイルに反映される。
4)その最適化が失敗するグラフは、候補である可能性は低い。したがって、単に、(多くの)エラーボックスメッセージから「OK」を行い、スクリプトに次のグラフ候補に継続させる。
5)最適化は、前述のQUBプログラムまたは当業者に利用可能な任意の他の好適なマルコフ最適化プログラムを使用して達成される。QUBおよび他のそのようなプログラムは、局所最適のみを見つけることによってモデルを最適化し、この方法が最良または次の最良モデルを見つけ得ないことを示唆し、識別されたグラフおよび停止基準に関する疑問を生ずる。これらの不確実性を軽減するために、最適化は、「do Hypercube of starting rates:」にチェックされた「Yes」ボックスによって実行され得る。本選択肢は、4つの最適化を各モデルに関して行わせ、新しい遷移の2つの開始速度を定義する、正方形領域の4つの角から開始する。これは、全開始速度の周囲の超立方体の角からの開始速度の使用より遥かに経済的選択肢である。この選択肢は、ほんの時折、任意の段階において、最良または次の最良モデルを変化させる。
6)識別されたグラフの最適性を保証する、別の明白であるが、高価な方法は、異なる方法において、既存の接続を再配分することによって到達した同型モデルを最適化することであろう。本能力は、多くの問題となるグラフ最適化をやり直すことになるであろうため、実装されなかった。
7)時として、QUBは、特定のモデル最適化に関してクラッシュし、それに伴って、ModelGrowerスクリプトを削除し得る。病理学モデルは、異なるデフォルト開始速度、「do Hypercube of starting rates:」に関する「No」対「Yes」、異なる立方体半径等を伴うスクリプトを再始動することによって、回避することができる。最適化が、それらを全てスキップしないように、必ずNAUTY22ディレクトリ内の試行されたモデルのリスト(ファイル名「[0−9].*」)を除くことに留意されたい。我々は、QUBが、HMMを見つけるために必須ではない、ヒストグラムプロット化ステップに由来する、1つ以上の未処理浮動小数点例外をもたらし得ることを見出した。我々は、非必須ヒストグラムプロット化を無効にするか、または浮動小数点例外を処理するようにQUBを書き換えることのいずれかを推奨する。
8)新しい速度に対する最も合理的デフォルト開始値は、恐らく、既存の最適化速度の平均であるが、我々は、本設定をユーザに任せる(QUBモデルウィンドウ内の速度を右クリックする)。開始速度が遅いほど、より良好に動作すると考えられる。
9)最適化プロセスの間、本発明の方法によって抽出された任意のHMMは、視覚化され、画面上に配列されるか、または紙に印刷され、オペレータ/ユーザにオンラインで通知することができる。
マウスの睡眠モデル成長の概要
上記データに関する観測結果:
1)尤度は、無限小であって、したがって、その対数は、負となるであろうが、QUBは、定数によって、対数尤度を変換し、正にする。
2)DKO照明4−>5から閉鎖するループは、不可逆的(ゼロ速度)遷移を識別し、これは、ある意味、追加の自由度ではなく、したがって、本モデルが、本段階において、他との不公平な比較を受けたという理由から、小差分LL(0.17)が、容認された。
3)DKO暗闇7−>8からの成長のための大差分LL(18.32)は、DKO暗闇4−>5およびDKO暗闇6−>7の段階における2つの小差分LL(成長プロセスを外れさせ得る)の後に続き、不確かであるとして、無視された。
4)これらのモデルは、データによって正当化されるもののみである。遥かにより複雑な睡眠モデルは、より多くのデータとともに考えられる。モデルが大きいほど、可能性のあるモデルの数が、組み合わせ的に増加するにつれて(我々が、単純に、8つのエッジの代わりに、最大9つを可能にする場合、6,003,931の別個のモデルまで)、本方法をさらにより説得力のあるものにする。
暗闇下の野生型マウスの睡眠データに対して、我々は、図5に示されるように、観測可能状態遷移の大部分を記述する、モデルから開始することにする。図5は、野生型暗闇に対してラベル化されるが、他のデータセットの各々も、観測された状態に対して、同一の開始モデルを有する。観測された状態は、他の低可視性状態を隠し得る集計状態と見なされる。第1のインスタンスでは、観測または集計状態は、図中において、黒色が割り当てられ、正方形として示される、REM状態1と、赤色が割り当てられ、卵形によって指定される、徐波状態2と、青色が割り当てられ、六角形によって指定される、覚醒状態3とを含む。我々は、REM状態1と覚醒状態3との間の遷移を含み得るが、実際には、データにおいて、覚醒からREMの遷移はなく、したがって、我々は、本段階において、いずれの方向においてもこのような遷移を含まないように選択することに留意されたい。
本願明細書は、例えば、以下の項目も提供する。
(項目1)
コンピュータを動作させて状態機械を表すデータの組をデコードすることにより、前記状態機械の最も可能性の高い隠れ状態および前記隠れ状態間の遷移を推定する方法であって、前記隠れ遷移は、速度を含み、前記方法は、
前記状態機械の観測を表すデータを記憶するステップであって、前記データは、1つ以上の観測された状態、観測された状態間の遷移、および、観測された状態遷移間の連続状態滞在時間を含む、ステップと、
異なるコードを各観測された状態に割り当てるステップであって、前記コードは、各観測された状態の独自の特性を表し、各観測された状態を全ての他の観測された状態から区別する、ステップと、
初期観測グラフを識別するステップであって、前記初期観測グラフは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の組を有し、かつ、各々が同様に独自に発生し、観測された状態間の観測された終了および開始のみを含む、観測された状態間の観測された遷移の組を有している、ステップと、
その前のグラフから、各および全ての可能性のあるインスタンスにおける1つの追加の双方向性遷移を有する導出されたグラフの組を生成するステップ、すなわち、
前記その前のグラフにおける既存の状態を接続された新しい状態の対に変換することによって、第1の導出されたグラフを生成するステップであって、両方の新しい状態は、前記既存の状態のコードを有する、ステップ、および、新しい状態の前記対のうちの前記既存の状態の1つまたは複数の既存の遷移を任意の可能性のある方法で再配分するステップと、
前記その前のグラフにおける既存の状態を接続された新しい状態の対に変換することによって、第2の導出されたグラフを生成するステップであって、一方の新しい状態は、前記既存の状態のコードを有し、他方の新しい状態は、別の異なる観測された状態の異なるコードを有する、ステップ、および、新しい状態の前記対のうちの前記既存の状態の前記1つまたは複数の既存の遷移を任意の可能性のある方法で再配分するステップと、
遷移が存在しなかった前記その前のグラフの既存の状態間に、任意の可能性のある方法で新しい双方向性遷移を追加することによって、第3の導出されたグラフを生成するステップと、
同型グラフを導出されたグラフの前記組から除去するステップと、
各残っている導出されたグラフの全ての遷移の速度を最適化することにより、結果として生じる導出されたグラフの各々が前記記憶されたデータを生成した尤度を最大化するステップと、
前記結果として生じる導出されたグラフの尤度を検査することにより、その内在する導出されたグラフが、前記記憶されたデータに対応する可能性が最も高いものを識別するステップであって、各結果として生じる導出されたグラフは、少なくとも1つの隠れ状態遷移を含む、ステップと
を含む、方法。
(項目2)
初期観測グラフを識別するステップは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の前記組のみから成り、かつ、各々が同様に独自に発生し、前記観測された状態間の観測された終了および開始のみを含む、前記観測された状態間の観測された遷移の前記組から成る、項目1に記載の方法。
(項目3)
前記コードは、色である、項目2に記載の方法。
(項目4)
次の最も可能性の高いグラフを上回る尤度の差が収穫逓減を示すまで項目1に記載のステップを繰り返し、最良グラフを見つけるステップをさらに含み、前記グラフの比較は、前記観測されたデータの尤度を最大化する最も単純な可能性のあるグラフを見つけるために、常時、同一数の遷移または自由度を有するグラフ間で行われ、それによって、前記方法は、前記状態機械の隠れ状態および遷移の最も正当化された推定を生成する、項目1に記載の方法。
(項目5)
隠れマルコフモデルを観測の組からさらに識別し、観測の異なる組から識別された別の隠れマルコフモデルと比較される、項目4に記載の方法。
(項目6)
対応する状態が対応する遷移によってリンクされるように、各グラフ、候補、および/またはマルコフモデルをディスプレイ上に提示するステップをさらに含む、項目1に記載の方法。
(項目7)
コンピュータを動作させて状態機械を表すデータの組をデコードすることにより、前記状態機械の最も可能性の高い隠れ状態および前記隠れ状態間の遷移を推定する方法であって、前記隠れ遷移は、速度を含み、前記方法は、
前記状態機械を表すデータを経時的に記憶するステップであって、前記データは、1つ以上の状態および状態間の遷移を含む、ステップと、
異なるコードを各状態に割り当てるステップであって、前記コードは、各状態の独自の特性を表し、各状態を全ての他の状態から区別する、ステップと、
前記状態機械を表す初期グラフを識別するステップであって、前記初期グラフは、実験証拠によって正当化されたそれらの状態および遷移のみを含む、ステップと、
その前のグラフから、導出されたグラフの組を生成するステップであって、各導出されたグラフは、前記その前のグラフに関する動作の組のうちの1つの動作から生じ、前記動作は、1つのみの状態または1つのみの遷移に関して1度に1つの方法、かつ、全ての可能性のある方法で行われ、その結果、各動作は、前記その前のグラフに対して、遷移または自由度の総数において1つのみの変化を有する導出されたグラフをもたらし、前記導出されたグラフの組は、そのような単一変化の各およびすべての可能性のあるインスタンスを含む、ステップと、
同型グラフを前記導出されたグラフの組から除去するステップと、
各残っている導出されたグラフの全ての遷移の速度を最適化することにより、結果として生じる導出されたグラフの各々が前記記憶されたデータを生成した尤度を最大化するステップと、
前記結果として生じる導出されたグラフの尤度を検査することにより、その内在する導出されたグラフが、前記記憶されたデータに対応する可能性が最も高いものを識別するステップであって、各結果として生じる導出されたグラフは、少なくとも1つの隠れ状態遷移を含む、ステップと
を含む、方法。
(項目8)
そのような変化の前記可能性のあるインスタンスのうちの1つは、前記その前のグラフにおける各既存の状態のうちの1つを双方向性に接続された新しい状態の対に変換することによって、前記その前のグラフに関して、1度に1つの方法、かつ、全ての可能性のある方法で動作することにより、導出されるグラフを生成することを含み、
1)両方の新しい状態は、前記既存の状態のコードを有し、
2)前記既存の状態の1つまたは複数の既存の遷移は、1度に1つの方法、かつ、全ての可能性のある方法で新しい状態の前記対の間で再配分されている、
項目7に記載の方法。
(項目9)
そのような変化の前記可能性のあるインスタンスのうちの1つは、前記その前のグラフにおける各既存の状態のうちの1つを双方向性に接続された新しい状態の対に変換することによって、前記その前のグラフに関して、1度に1つの方法、かつ、全ての可能性のある方法で動作することにより、導出されるグラフを生成することを含み、
1)一方の新しい状態は、前記既存の状態のコードを有し、他方の新しい状態は、別の異なる観測された状態の異なるコードを有し、
2)前記既存の状態の1つまたは複数の既存の遷移は、1度に1つの方法、かつ、全ての可能性のある方法で新しい状態の前記対の間で再配分されている、
項目7に記載の方法。
(項目10)
そのような変化の前記可能性のあるインスタンスのうちの1つは、遷移が存在しなかった、前記その前のグラフの既存の状態間に単一の新しい双方向性遷移を追加することによって、前記その前のグラフに関し、1度に1つ、かつ、全ての可能性のある方法で動作して導出されるグラフを生成することを含む、項目7に記載の方法。
(項目11)
初期観測グラフを識別するステップは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の前記組のみから成り、かつ、各々が同様に独自に発生し、前記観測された状態間の観測された終了および開始のみを含む、前記観測された状態間の観測された遷移の前記組から成る、項目7に記載の方法。
(項目12)
前記コードは、色である、項目11に記載の方法。
(項目13)
次の最も可能性の高いグラフを上回る尤度の差が収穫逓減を示すまで項目7に記載のステップを繰り返し、最良グラフを見つけるステップをさらに含み、前記グラフの比較は、前記観測されたデータの尤度を最大化する最も単純な可能性のあるグラフを見つけるために、常時、同一数の遷移または自由度を有するグラフ間で行われ、それによって、前記方法は、前記状態機械の隠れ状態および遷移の最も正当化された推定を生成する、項目7に記載の方法。
(項目14)
隠れマルコフモデルを観測の組からさらに識別し、観測の異なる組から識別された別の隠れマルコフモデルと比較される、項目13に記載の方法。
(項目15)
対応する状態が対応する遷移によってリンクされるように、各グラフ、候補、および/またはマルコフモデルをディスプレイ上に提示するステップをさらに含む、項目7に記載の方法。
(項目16)
コンピュータに、項目1から15のいずれか一項に記載の方法を実行させる、コンピュータ実行可能命令を有するコンピュータ可読コンピュータプログラム製品。
Claims (16)
- コンピュータを動作させて状態機械を表すデータの組をデコードすることにより、前記状態機械の最も可能性の高い隠れ状態および前記隠れ状態間の遷移を推定する方法であって、前記隠れ遷移は、速度を含み、前記方法は、
前記状態機械の観測を表すデータを記憶するステップであって、前記データは、1つ以上の観測された状態、観測された状態間の遷移、および、観測された状態遷移間の連続状態滞在時間を含む、ステップと、
異なるコードを各観測された状態に割り当てるステップであって、前記コードは、各観測された状態の独自の特性を表し、各観測された状態を全ての他の観測された状態から区別する、ステップと、
初期観測グラフを識別するステップであって、前記初期観測グラフは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の組を有し、かつ、各々が同様に独自に発生し、観測された状態間の観測された終了および開始のみを含む、観測された状態間の観測された遷移の組を有している、ステップと、
その前のグラフから、各および全ての可能性のあるインスタンスにおける1つの追加の双方向性遷移を有する導出されたグラフの組を生成するステップ、すなわち、
前記その前のグラフにおける既存の状態を接続された新しい状態の対に変換することによって、第1の導出されたグラフを生成するステップであって、両方の新しい状態は、前記既存の状態のコードを有する、ステップ、および、新しい状態の前記対のうちの前記既存の状態の1つまたは複数の既存の遷移を任意の可能性のある方法で再配分するステップと、
前記その前のグラフにおける既存の状態を接続された新しい状態の対に変換することによって、第2の導出されたグラフを生成するステップであって、一方の新しい状態は、前記既存の状態のコードを有し、他方の新しい状態は、別の異なる観測された状態の異なるコードを有する、ステップ、および、新しい状態の前記対のうちの前記既存の状態の前記1つまたは複数の既存の遷移を任意の可能性のある方法で再配分するステップと、
遷移が存在しなかった前記その前のグラフの既存の状態間に、任意の可能性のある方法で新しい双方向性遷移を追加することによって、第3の導出されたグラフを生成するステップと、
同型グラフを導出されたグラフの前記組から除去するステップと、
各残っている導出されたグラフの全ての遷移の速度を最適化することにより、結果として生じる導出されたグラフの各々が前記記憶されたデータを生成した尤度を最大化するステップと、
前記結果として生じる導出されたグラフの尤度を検査することにより、その内在する導出されたグラフが、前記記憶されたデータに対応する可能性が最も高いものを識別するステップであって、各結果として生じる導出されたグラフは、少なくとも1つの隠れ状態遷移を含む、ステップと
を含む、方法。 - 初期観測グラフを識別するステップは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の前記組のみから成り、かつ、各々が同様に独自に発生し、前記観測された状態間の観測された終了および開始のみを含む、前記観測された状態間の観測された遷移の前記組から成る、請求項1に記載の方法。
- 前記コードは、色である、請求項2に記載の方法。
- 次の最も可能性の高いグラフを上回る尤度の差が収穫逓減を示すまで請求項1に記載のステップを繰り返し、最良グラフを見つけるステップをさらに含み、前記グラフの比較は、前記観測されたデータの尤度を最大化する最も単純な可能性のあるグラフを見つけるために、常時、同一数の遷移または自由度を有するグラフ間で行われ、それによって、前記方法は、前記状態機械の隠れ状態および遷移の最も正当化された推定を生成する、請求項1に記載の方法。
- 隠れマルコフモデルを観測の組からさらに識別し、観測の異なる組から識別された別の隠れマルコフモデルと比較される、請求項4に記載の方法。
- 対応する状態が対応する遷移によってリンクされるように、各グラフ、候補、および/またはマルコフモデルをディスプレイ上に提示するステップをさらに含む、請求項1に記載の方法。
- コンピュータを動作させて状態機械を表すデータの組をデコードすることにより、前記状態機械の最も可能性の高い隠れ状態および前記隠れ状態間の遷移を推定する方法であって、前記隠れ遷移は、速度を含み、前記方法は、
前記状態機械を表すデータを経時的に記憶するステップであって、前記データは、1つ以上の状態および状態間の遷移を含む、ステップと、
異なるコードを各状態に割り当てるステップであって、前記コードは、各状態の独自の特性を表し、各状態を全ての他の状態から区別する、ステップと、
前記状態機械を表す初期グラフを識別するステップであって、前記初期グラフは、実験証拠によって正当化されたそれらの状態および遷移のみを含む、ステップと、
その前のグラフから、導出されたグラフの組を生成するステップであって、各導出されたグラフは、前記その前のグラフに関する動作の組のうちの1つの動作から生じ、前記動作は、1つのみの状態または1つのみの遷移に関して1度に1つの方法、かつ、全ての可能性のある方法で行われ、その結果、各動作は、前記その前のグラフに対して、遷移または自由度の総数において1つのみの変化を有する導出されたグラフをもたらし、前記導出されたグラフの組は、そのような単一変化の各およびすべての可能性のあるインスタンスを含む、ステップと、
同型グラフを前記導出されたグラフの組から除去するステップと、
各残っている導出されたグラフの全ての遷移の速度を最適化することにより、結果として生じる導出されたグラフの各々が前記記憶されたデータを生成した尤度を最大化するステップと、
前記結果として生じる導出されたグラフの尤度を検査することにより、その内在する導出されたグラフが、前記記憶されたデータに対応する可能性が最も高いものを識別するステップであって、各結果として生じる導出されたグラフは、少なくとも1つの隠れ状態遷移を含む、ステップと
を含む、方法。 - そのような変化の前記可能性のあるインスタンスのうちの1つは、前記その前のグラフにおける各既存の状態のうちの1つを双方向性に接続された新しい状態の対に変換することによって、前記その前のグラフに関して、1度に1つの方法、かつ、全ての可能性のある方法で動作することにより、導出されるグラフを生成することを含み、
1)両方の新しい状態は、前記既存の状態のコードを有し、
2)前記既存の状態の1つまたは複数の既存の遷移は、1度に1つの方法、かつ、全ての可能性のある方法で新しい状態の前記対の間で再配分されている、
請求項7に記載の方法。 - そのような変化の前記可能性のあるインスタンスのうちの1つは、前記その前のグラフにおける各既存の状態のうちの1つを双方向性に接続された新しい状態の対に変換することによって、前記その前のグラフに関して、1度に1つの方法、かつ、全ての可能性のある方法で動作することにより、導出されるグラフを生成することを含み、
1)一方の新しい状態は、前記既存の状態のコードを有し、他方の新しい状態は、別の異なる観測された状態の異なるコードを有し、
2)前記既存の状態の1つまたは複数の既存の遷移は、1度に1つの方法、かつ、全ての可能性のある方法で新しい状態の前記対の間で再配分されている、
請求項7に記載の方法。 - そのような変化の前記可能性のあるインスタンスのうちの1つは、遷移が存在しなかった、前記その前のグラフの既存の状態間に単一の新しい双方向性遷移を追加することによって、前記その前のグラフに関し、1度に1つ、かつ、全ての可能性のある方法で動作して導出されるグラフを生成することを含む、請求項7に記載の方法。
- 初期観測グラフを識別するステップは、各々が独自に発生し、複数の発生が区別不可能である観測された状態の前記組のみから成り、かつ、各々が同様に独自に発生し、前記観測された状態間の観測された終了および開始のみを含む、前記観測された状態間の観測された遷移の前記組から成る、請求項7に記載の方法。
- 前記コードは、色である、請求項11に記載の方法。
- 次の最も可能性の高いグラフを上回る尤度の差が収穫逓減を示すまで請求項7に記載のステップを繰り返し、最良グラフを見つけるステップをさらに含み、前記グラフの比較は、前記観測されたデータの尤度を最大化する最も単純な可能性のあるグラフを見つけるために、常時、同一数の遷移または自由度を有するグラフ間で行われ、それによって、前記方法は、前記状態機械の隠れ状態および遷移の最も正当化された推定を生成する、請求項7に記載の方法。
- 隠れマルコフモデルを観測の組からさらに識別し、観測の異なる組から識別された別の隠れマルコフモデルと比較される、請求項13に記載の方法。
- 対応する状態が対応する遷移によってリンクされるように、各グラフ、候補、および/またはマルコフモデルをディスプレイ上に提示するステップをさらに含む、請求項7に記載の方法。
- コンピュータに、請求項1から15のいずれか一項に記載の方法を実行させる、コンピュータ実行可能命令を有するコンピュータ可読コンピュータプログラム製品。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2011/028302 WO2012125146A1 (en) | 2011-03-14 | 2011-03-14 | Method for uncovering hidden markov models |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014515131A true JP2014515131A (ja) | 2014-06-26 |
JP5898704B2 JP5898704B2 (ja) | 2016-04-06 |
Family
ID=46831013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013557997A Active JP5898704B2 (ja) | 2011-03-14 | 2011-03-14 | 隠れマルコフモデルを見出す方法 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP2686796A4 (ja) |
JP (1) | JP5898704B2 (ja) |
AU (1) | AU2011362611B2 (ja) |
CA (1) | CA2830159C (ja) |
SG (1) | SG193450A1 (ja) |
WO (1) | WO2012125146A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021506644A (ja) * | 2017-12-18 | 2021-02-22 | 北京京▲東▼尚科信息技▲術▼有限公司Beijing Jingdong Shangke Information Technology Co., Ltd. | 貨物保護の方法、デバイスおよびシステム、ならびに非一時的コンピュータ可読記憶媒体 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011243088A (ja) * | 2010-05-20 | 2011-12-01 | Sony Corp | データ処理装置、データ処理方法、及び、プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056793A (ja) * | 1998-08-12 | 2000-02-25 | Fuji Xerox Co Ltd | 音声認識装置 |
KR20040012285A (ko) * | 2002-08-02 | 2004-02-11 | 한국정보보호진흥원 | 은닉 마르코프 모델을 이용한 비정상행위 침입탐지 시스템및 방법 |
US7617091B2 (en) * | 2003-11-14 | 2009-11-10 | Xerox Corporation | Method and apparatus for processing natural language using tape-intersection |
US8407163B2 (en) * | 2009-08-27 | 2013-03-26 | Xerox Corporation | Monitoring a device, network, or system with adaptive dynamic classification employing a hidden Markov model operating on a time sequence of information |
-
2011
- 2011-03-14 EP EP20110861132 patent/EP2686796A4/en not_active Ceased
- 2011-03-14 SG SG2013069059A patent/SG193450A1/en unknown
- 2011-03-14 CA CA2830159A patent/CA2830159C/en active Active
- 2011-03-14 WO PCT/US2011/028302 patent/WO2012125146A1/en active Application Filing
- 2011-03-14 AU AU2011362611A patent/AU2011362611B2/en active Active
- 2011-03-14 JP JP2013557997A patent/JP5898704B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011243088A (ja) * | 2010-05-20 | 2011-12-01 | Sony Corp | データ処理装置、データ処理方法、及び、プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6015019045; 豊浦潤,他2名: '時系列データからのネットワークモデルの教師なし学習方式' 電子情報通信学会論文誌(情報・システムII-情報処理) 第J82-D-II巻, 第1号, 19990125, pp.61-74, 社団法人電子情報通信学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021506644A (ja) * | 2017-12-18 | 2021-02-22 | 北京京▲東▼尚科信息技▲術▼有限公司Beijing Jingdong Shangke Information Technology Co., Ltd. | 貨物保護の方法、デバイスおよびシステム、ならびに非一時的コンピュータ可読記憶媒体 |
JP7179065B2 (ja) | 2017-12-18 | 2022-11-28 | 北京京▲東▼尚科信息技▲術▼有限公司 | 貨物保護の方法、デバイスおよびシステム、ならびに非一時的コンピュータ可読記憶媒体 |
US11694294B2 (en) | 2017-12-18 | 2023-07-04 | Beijing Jingdong Shangke Information Technology Co, Ltd. | Cargo protection method, device and system, and non-transitory computer-readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
SG193450A1 (en) | 2013-10-30 |
JP5898704B2 (ja) | 2016-04-06 |
AU2011362611A1 (en) | 2013-09-26 |
CA2830159A1 (en) | 2012-09-20 |
EP2686796A4 (en) | 2015-05-13 |
AU2011362611B2 (en) | 2017-06-01 |
CA2830159C (en) | 2017-10-03 |
WO2012125146A1 (en) | 2012-09-20 |
EP2686796A1 (en) | 2014-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sarkar et al. | Hands-On Transfer Learning with Python: Implement advanced deep learning and neural network models using TensorFlow and Keras | |
CN108960514B (zh) | 展示预测模型的方法、装置及调整预测模型的方法、装置 | |
US7912717B1 (en) | Method for uncovering hidden Markov models | |
JP2019087237A (ja) | 敵対的ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 | |
KR102310487B1 (ko) | 속성 단위 리뷰 분석 장치 및 방법 | |
Richter et al. | A multi-dimensional comparison of toolkits for machine learning with big data | |
WO2018094295A1 (en) | Adaptive attention model for image captioning | |
EP4150480A1 (en) | Descriptive insight generation and presentation system | |
Johnston et al. | Applied Unsupervised Learning with Python: Discover hidden patterns and relationships in unstructured data with Python | |
Gove et al. | New guidance for using t-SNE: Alternative defaults, hyperparameter selection automation, and comparative evaluation | |
CN111902812A (zh) | 电子装置及其控制方法 | |
EP4196900A1 (en) | Identifying noise in verbal feedback using artificial text from non-textual parameters and transfer learning | |
JP2019212278A (ja) | アクセス可能な機械学習 | |
JP5898704B2 (ja) | 隠れマルコフモデルを見出す方法 | |
Jones et al. | The Unsupervised Learning Workshop: Get started with unsupervised learning algorithms and simplify your unorganized data to help make future predictions | |
WO2020167156A1 (ru) | Способ отладки обученной рекуррентной нейронной сети | |
US11900060B2 (en) | Information processing device, information processing method, and computer program product | |
Ngo et al. | Efficient interactive multiclass learning from binary feedback | |
JP6905237B2 (ja) | メールスレッド抽出装置、メールスレッド抽出方法、およびコンピュータプログラム | |
US20230044508A1 (en) | Data labeling processing | |
US20220092260A1 (en) | Information output apparatus, question generation apparatus, and non-transitory computer readable medium | |
Ravier et al. | GeoStat Representations of Time Series for Fast Classification | |
Martarello | Exploring CNNs and Attention Mechanisms for Brand Identification in Fashion Runway Shows | |
CN113901880A (zh) | 一种实时事件流识别方法及系统 | |
Norrgård | Using Computer Vision in Retail Analytics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150515 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150814 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151014 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5898704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |