JP4715389B2 - パターン認識方法及び装置及びプログラム - Google Patents

パターン認識方法及び装置及びプログラム Download PDF

Info

Publication number
JP4715389B2
JP4715389B2 JP2005243424A JP2005243424A JP4715389B2 JP 4715389 B2 JP4715389 B2 JP 4715389B2 JP 2005243424 A JP2005243424 A JP 2005243424A JP 2005243424 A JP2005243424 A JP 2005243424A JP 4715389 B2 JP4715389 B2 JP 4715389B2
Authority
JP
Japan
Prior art keywords
feature
combination
search
clustering
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005243424A
Other languages
English (en)
Other versions
JP2007058603A (ja
Inventor
弾 三上
正造 東
正志 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005243424A priority Critical patent/JP4715389B2/ja
Publication of JP2007058603A publication Critical patent/JP2007058603A/ja
Application granted granted Critical
Publication of JP4715389B2 publication Critical patent/JP4715389B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、パターン認識方法及び装置及びプログラムに係り、特に、学習用データや時系列データに正解ラベルを付与することが煩雑もしくは付与することが困難である場合に対処するためのパターン認識方法及び装置及びプログラムに関する。
パターン認識における特徴量選択方法は大きく分けて2通りある。
一つ目は、主成分分析などを用いて、全てのデータにおいて主要な働きをする成分を取り出すものである。しかし、この手法は統計的に主要な働きをする特徴量を作り出すだけであり、出力のラベルは一切関知しない(例えば、非特許文献1参照)。
2つ目は、出力のラベルを用いてクラス内分散最小化、クラス間分散量最大化する特徴量を選択する方法である。これは、学習データについて正確なラベルが付与されていることが前提となる手法である。(例えば、非特許文献2、特許文献1参照)。
オーム社、「パターン認識」石井健一郎、上田修功、前田栄作、村瀬洋p106 オーム社、「パターン認識」石井健一郎、上田修功、前田栄作、村瀬洋p73 特開平7−134774号公報
しかしながら、上記従来の一つ目の方法は、正解のラベルの存在を完全に無視してしまうため、重要か否かがわからない特徴量を多数用意して適切な特徴量を選択する(作成する)用途には適さない。
また、二つ目の方法では、予め正解ラベルの付与されたデータが存在することが前提となり、正解ラベルが付与されていないデータには適用ができなかった。さらに正解を与える際に間違った正解ラベルを付与してしまうと認識が困難になる場合が存在する。
本発明は、上記の点に鑑みなされたもので、学習データや時系列データに対して正解ラベルを付与することなく、データの範囲の選択を不要とし、簡易な入力でパターン認識が可能なパターン認識方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、学習用データが格納された記憶手段と、検索対象データが格納された検索対象データ記憶手段と、複数の特徴抽出手段と、特徴組み合わせ手段と、クラスタリング手段と、検索対象候補生成手段と、特徴決定手段と、検索手段とを有する装置が実行するパターン認識方法であって、
複数の特徴抽出手段が、学習用データが記憶された記憶手段から学習用データを読み込んで、該学習用データの複数の特徴を抽出する特徴抽出ステップ(ステップ1)と、
特徴組み合わせ手段が、特徴抽出ステップで抽出された複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせステップ(ステップ2)と、
クラスタリング手段が、特徴組み合わせステップで決定された全ての暫定的な特徴とフラグの組み合わせを用いて、学習用データをクラスタリングするクラスタリングステップ(ステップ3)と、
検索対象候補生成手段が、ユーザから入力された学習用データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき学習用データの数(以下、含有数と記す)を取得し、クラスタリングステップで取得したクラスタリング結果のうち該クラスタに属する学習用データの数が含有数と等しいクラスタリング結果を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成ステップ(ステップ4)と、
特徴決定手段が、ユーザにより選択された検索対象の候補であるクラスタリング結果に対し、該クラスタリング結果を生み出す暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定ステップ(ステップ5)と、
検索手段が、特徴決定ステップで決定された検索に必要な特徴に基づいて、検索対象データ記憶手段を検索し、検索結果を取得する検索ステップ(ステップ6)と、を行う。
本発明(請求項2)は、映像を含む時系列データが記憶された記憶手段と、検索対象データが格納された検索対象データ記憶手段と、複数の特徴抽出手段と、特徴組み合わせ手段と、クラスタリング手段と、検索対象候補生成手段と、特徴決定手段と、検索手段とを有する装置が実行するパターン認識方法であって、
複数の特徴抽出手段が、映像を含む時系列データが記憶された記憶手段から時系列データを読み込んで、該時系列データの複数の特徴を抽出する特徴抽出ステップと、
特徴組み合わせ手段が、特徴抽出ステップで抽出された複数の特徴から複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせステップと、
クラスタリング手段が、全ての暫定的な特徴とフラグの組み合わせを用いて、時系列データをクラスタリングするクラスタリングステップと、
検索対象候補生成手段が、ユーザから入力された時系列データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき時系列データの数(以下、含有数と記す)を取得し、クラスタリングステップで取得したクラスタリング結果のうち該クラスタに属する学習用データの数が該含有数と等しいクラスタリング結果である映像区間を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成ステップと、
特徴決定手段が、ユーザにより選択された検索対象の候補であるクラスタリング結果に対し、該クラスタリング結果を生み出す暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定ステップと、
検索手段が、特徴決定ステップで決定された検索に必要な特徴に基づいて、検索対象データ記憶手段を検索し、検索結果を取得する検索ステップと、
を行うことを特徴とするパターン認識方法。
また、本発明(請求項3)は、請求項1または請求項2のパターン認識方法であって、
特徴決定ステップにおいて、
ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す暫定的な徴とフラグの組み合わせを求め、
暫定的な特徴とフラグの組み合わせのうち、フラグが特徴を利用することを指し示している場合に対応する徴の数の逆数を各特徴とフラグの組み合わせの評価値とし、
暫定的な特徴とフラグの組み合わせのうち、評価値の最も大きい特徴とフラグの組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴とする。
また、本発明(請求項4)は、請求項1のパターン認識方法であって、
含有数の代わりに、学習データ中に検索したい対象となるデータがどの程度含まれるかを示す含有率を用いる。
図2は、本発明の原理構成図である。
本発明(請求項5)は、パターン認識装置であって、
学習用データが格納記憶された記憶手段1と、
検索対象データが格納された検索対象データ記憶手段13と、
記憶手段から学習用データを読み込んで、該学習用データの複数の特徴を抽出する複数の特徴抽出手段2と、
特徴抽出手段2で抽出された複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせ手段3と、
全ての暫定的な特徴とフラグの組み合わせを用いて、学習用データをクラスタリングするクラスタリング手段4と、
ユーザから入力された学習用データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき学習用データの数(以下、含有数と記す)を取得し、クラスタリング手段4で取得したクラスタリング結果のうち該クラスタに属する学習用データの数が含有数と等しいクラスタリング結果を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成手段5と、
ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定手段9と、
特徴決定手段9で決定された検索に必要な特徴に基づいて、検索対象データ記憶手段を検索し、検索結果を取得する検索手段10と、を有する。
本発明(請求項6)は、パターン認識装置であって、
映像を含む時系列データが格納された記憶手段と、
検索対象データが格納された検索対象データ記憶手段と、
記憶手段から時系列データを読み込んで、該時系列データの複数の特徴を抽出する複数の特徴抽出手段と、
特徴抽出手段で抽出された複数の特徴から複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせ手段と、
全ての暫定的な特徴とフラグの組み合わせを用いて、時系列データをクラスタリングするクラスタリング手段と、
ユーザから入力された時系列データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき時系列データの数(以下、含有数と記す)を取得し、クラスタリング手段で取得したクラスタリング結果のうち該クラスタに属する学習用データの数が該含有数と等しいクラスタリング結果である映像区間を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成手段と、
ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定手段と、
特徴決定手段で決定された検索に必要な特徴に基づいて、検索対象データ記憶手段を検索し、検索結果を取得する検索手段と、を有する。

本発明(請求項7)は、請求項5または請求項6のパターン認識装置であって、
特徴決定手段9は、
ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す暫定的な特徴とフラグの組み合わせを求め、
暫定的な特徴とフラグの組み合わせのうち、フラグが特徴を利用することを指し示している場合に対応する徴の数の逆数を各特徴とフラグの組み合わせの評価値とし、該暫定的な特徴とフラグの組み合わせのうち、評価値の最も大きい特徴とフラグの組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴とする手段を含む。

また、本発明(請求項8)は、含有数の代わりに、学習データ中に検索したい対象となるデータがどの程度含まれるかを示す含有率を用いる。
本発明(請求項9)は、請求項5乃至8のいずれか1項に記載のパターン認識装置を構成する各手段としてコンピュータを機能させるためのパターン認識プログラムである。

上記のように本発明によれば、ユーザは、学習用データや時系列データにおいて、全ての学習用データに対して正解ラベルを付与する代わりに、学習用データや時系列データ中に検索したい対象となるデータがどの程度含まれるか、すなわち、含有数(または含有率)を入力する。本発明のパターン認識方法及び装置及びプログラムは、ユーザの入力した含有数(率)に応じた検索結果の候補を提示し、ユーザは候補のうち正解のものを入力する。全ての学習データや時系列データに正解ラベルを付与するという煩雑な作業の代わりに、この2ステップの簡易な入力により、パターン認識が可能となる。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態におけるパターン認識装置の構成を示す。
同図に示すパターン認識装置は、特徴抽出部2、特徴組み合わせ部3、クラスタリング部4、検索対象候補生成部5、検索対象含有数入力取得部6、検索結果提示部7、正回検索結果入力取得部8、特徴決定部9、検索部10からなり、特徴抽出部2には、学習データを記憶する学習用データ記憶装置1が接続され、検索部10には、検索対象データを蓄積する検索対象データ記憶装置13が接続され、検索対象含有数入力取得部6には検索対象含有数入力装置11が、正解検索結果入力取得部8には、正解検索結果入力装置12が接続される。なお、同図の例では、検索対象含有数入力装置11と正解検索結果入力装置12の2つの入力装置が記載されているが、これは説明の都合上分けて記載しているに過ぎず、実質的には、マウスやキーボード等からなる1台の入力装置である。
特徴抽出部2は、複数の特徴抽出器からなり、特徴を抽出する。
特徴組み合わせ部3は、特徴抽出部2内の各特徴抽出器で抽出された特徴量を組み合わせる。
クラスタリング部4は、特徴組み合わせ部3で組み合わされた特徴量を用いてクラスタリングを行う。クラスタリングはどのようなアルゴリズムを用いても構わない。本明細書の実施の形態で用いたクラスタリングアルゴリズムは最近距離法である。
検索対象含有数入力取得部6は、ユーザから検索対象含有数入力装置11から学習用データが検索対象を含む割合(数)の入力を受け付ける。
検索対象候補生成部5は、クラスタリング部4からのクラスタリング結果及び検索対象含有数入力取得部6からの検索対象含有数を取得して、検索対象候補を生成する。
検索対象候補提示部7は、検索対象候補生成部5で生成された検索対象候補をユーザに対してディスプレイ等の表示手段(図示せず)に提示する。
正解検索結果入力取得部8は、表示手段(図示せず)に提示した検索対象候補の中から正解検索結果入力装置12を介してユーザによって入力される正解入力結果を取得する。
特徴決定部9は、検索対象候補提示部7及び正解検索結果入力取得部8からの入力により、検索対象及び検索に必要な特徴量を決定する。
検索部10は、特徴決定部9により決定した特徴量によって検索対象データ記憶装置13を検索し、検索結果を取得する。
次に、上記の構成における動作を説明する。
図4は、本発明の一実施の形態におけるパターン認識方法の動作のフローチャートである。
ステップ101) 特徴抽出部2の各々の特徴抽出器は、学習用データ記憶装置1から学習用データを読み込む。
ステップ102) 特徴抽出部2は、各特徴抽出器毎に特徴抽出を行う。特徴抽出は既存の方法により、本発明では特に限定しない。
ステップ103) 特徴組み合わせ部3において、ステップ102において各々の特徴抽出器で求めた複数の特徴のうち、以降のステップで利用する暫定の特徴の組み合わせを決定する。
ステップ104) クラスタリング部4は、ステップ103で決定した特徴の組み合わせを用いてクラスタリングを行い、クラスタリングの結果を検索対象候補生成部5に出力する。
ステップ105) 検索対象含有数入力取得部6は、当該パターン認識を行うユーザが検索対象含有数入力装置11から入力した検索対象含有数(率)を取得する。
ステップ106) 検索対象候補生成部5は、検索対象含有数入力取得部6からの入力と、クラスタリング結果から検索結果候補を生成し、検索結果提示部7に渡す。
ステップ107) 検索結果候補をユーザのディスプレイ(図示せず)に表示する。
ステップ108) ユーザがディスプレイ(図示せず)に表示された検索結果候補を目視により確認した後、正解を正解検索結果入力装置12から入力すると、正解検索結果入力取得部8は、正解入力を受け取り、特徴決定部9に出力する。ここで、正解入力とは、求めるクラスタリング結果を指す。
ステップ109) 特徴決定部9は、検索結果提示部7からの検索結果候補と正解検索結果入力取得部8から取得した正解入力から検索に適切な特徴量を決定する。
ステップ110) 検索部10は、特徴決定部9で決定された特徴量を用いて、検索対象データ記憶装置13を検索し、検索結果をディスプレイ(図示せず)等に出力する。
次に、上記のステップ109の動作を詳細に説明する。
図5は、本発明の一実施の形態における特徴決定部の動作のフローチャートである。
ステップ901) ユーザが求めるクラスタリング結果を生み出す特徴量の組み合わせ(特徴量セット)を求める。
ステップ902) ステップ901で求められた特徴量セットのうち利用する特徴量の数の逆数を各特徴量セットの評価値とする。なお、当該処理で評価値が与えられる特徴量セットは、まず、ステップ901において適切なクラスタリング結果を有すると判断された特徴量セットのみになる。
ステップ903) 評価値の最もよい特徴量セットを求める。
ステップ904) 最良の評価値を持つ特徴量セットが複数存在する場合は、ステップ906に移行する。
ステップ905) 特徴量セットを検索部10に出力する。
ステップ906) 複数の特徴量セットをユーザに提示する。
ステップ907) ユーザが提示された特徴量セットの中から利用する特徴量セットを選択する。選択された特徴量セットを検索部10に出力する。
以下に、本発明の実施例を具体的な例を用いて説明する。
[第1の実施例]
本実施例では、上記の実施の形態の動作に沿って具体的な例を説明する。
以下では、上記のステップ101及びステップ102が終了した状態、つまり、学習用データ記憶装置1から特徴を抽出した状態を以下に示す。なお、以下に示すデータは、文献「T.コホネン著、徳高平蔵、岸田悟、藤村喜久郎訳、「自己組織化マップ」Springer pp.152 表3,4」よりの抜粋である。
Figure 0004715389
第1カラム(:の左側)は、動物のIDである。以降、
1:小さい
2:中くらい
3:大きい
4:2本足
5:4本足
6:毛を持つ
7:ひずめを持つ
8:たてがみを持つ
9:羽をもつ
A:狩猟を好む
B:走ることを好む
C:飛ぶことを好む
D:泳ぐことを好む
の各項目に関して、当てはまる場合には「1」、当てはまらない場合は「0」が記載されている。
ここで、課題として、上記16種類の動物のうち、鳥を探していきたいが、鳥を識別するために適切な特徴はどれか(どれを組み合わせればよいか)は分からないが、16種類の動物のうち、鳥は7種類含んでいる、と仮定する。今、鳥を探すために適切な特徴を組み合わせを求めたい。
ここで、上記の表1では、特徴抽出部2の特徴抽出器が1からDまでの13種類存在している。
ステップ103において、特徴組み合わせ部3が、特徴抽出部2の特徴抽出器から出力された各特徴を利用するか否かを決定する。この例においては、各特徴について利用するか否かの「1」「0」のフラグを付与し、全ての組み合わせを試す。すなわち、ここでは、2の13乗通りの組み合わせを試すことになる。
ステップ104において、クラスタリング部4が、クラスタリングを行う。ここで、クラスタリングは、最小距離法を用いるものとする。また、クラスタリングの終了条件は、クラスタ数が「1」になることとしたが、クラスタ間距離の変化が閾値以上あった場合は、クラスタリング結果の候補として出力するものとする。
ここで、前提として、鳥が7種類含まれていることがわかる。ユーザは検索対象含有数入力装置11から検索対象含有数として「7」を入力する。そこで、ステップ106において検索対象含有数入力取得部6が取得する含有数は「7」となる。
ステップ107では、検索対象候補生成部5は、前述のステップ104において、クラスタの要素数が「7」となったクラスタリング結果を取得し、検索結果提示部7に出力し、検索結果提示部7では、ユーザに対して当該クラスタリング結果を提示する。
ここで、実際にクラスタ要素数「7」として得られたクラスタリング結果とその時に用いられた特徴量の状況のフラグを示す。但し、同じクラスタリング結果を複数の特徴量の状況から得られた場合、利用する特徴量が少ないものを(同数の場合には全て)提示するものとする。
はと めんどり あひる がちょう ふくろう たか わし
0000000010000→羽
0000010000000→毛
0000100000000→4本足
0001000000000→2本足
はと めんどり あひる がちょう ふくろう たか ねこ
1000000000000→小さい
めんどり きつね いぬ おおかみ ねこ トラ ライオン
0000001000010→ひずめ&飛べる
めんどり ねこ トラ ライオン うま しまうま うし
0100000000010→中ぐらい&飛べる
はと めんどり あひる がちょう うま しまうま うし
0100000001000→中ぐらい&狩猟
はと めんどり ふくろう たか わし キツネ ねこ
0010000000101→大きい&走ることが好き&泳ぐ
はと めんどり ふくろう たか ねこ トラ うし
0100000000101→中ぐらい&走ることが好き&泳ぐ
0100000100001→中ぐらい&たてがみ&泳ぐ
はと めんどり ふくろう たか ねこ トラ ライオン
0100001000001→中ぐらい&ひずめ&泳ぐ
上記の例では、7種類の動物を選ぶクラスタリング結果としては、8通りの選び方が存在しており、各々その選び方を可能とする特徴量の選択方法があることがわかる。
上記の例において、鳥の選び方は、最初の例が正しいため、ステップ108でユーザが選択する組は、最初の組となる。これにより、正解検索結果入力取得部8は、上記でユーザにより選択された最初の組を取得する。ステップ109において、そのときに用いられる特徴量の選び方として、
羽がある

2本足の動物
が想定される。
ステップ110において、検索部10は、今回の例では存在していないが、ステップ109によって決定した特徴量を用いて、検索対象データ記憶装置13の検索対象のデータ全てを検索することによって動物の中から全ての鳥を検索し、出力する。
[第2の実施例]
本実施例では、本システムを時系列データの検索へ拡張した例を説明する。
例えば、ゴルフ映像からゴルフスイングシーンのみを検索するような場合である。時系列データにおいては、正解も時系列データとして用意することが必要であり、その正解部分の指定が困難であることが多い。正解の時間幅を広く設定しすぎてしまうと、検出漏れの可能性が高くなり、また狭く設定しすぎてしまうと誤検出の可能性が高くなってしまう。
以下では、上記のような問題を解決するものである。
本実施例では、前述の実施の形態における図4のフローチャートに沿って説明する。
まず、ゴルフスイングの回数が既知である映像を学習用として学習用データ記憶装置1に用意する。
ステップ101において、特徴抽出部2は、学習用データ記憶装置1から映像を読み込み、分析時間幅に分割する。これが第1の実施例における動物に相当する。
ステップ102において、特徴抽出部2が分析時間幅毎に、パワー、MFCC、動き特徴など様々な特徴抽出を行う。
ステップ103において、特徴組み合わせ部3が、ステップ102で抽出された特徴の組み合わせを決定する。
ステップ104において、クラスタリング部4がクラスタリングを行う。
ステップ106において、ユーザが検索対象含有数入力装置11から検索対象含有数として、既知であるゴルフスイングの回数を入力する。
ステップ107において、検索結果提示部7が、入力された回数に相当するクラスタリング結果を持つ映像区間をユーザのディスプレイ(図示せず)に提示する。
ステップ108において、ユーザは、提示された映像を確認し、正しくゴルフスイングを提示しているものを選択する。これにより、正解検索結果入力取得部8は、選択された映像区間を取得する。
ステップ109において、特徴決定部9は、ステップ104で得られたクラスタリングの結果とステップ108で得られた映像区間から特徴量を決定する。
ステップ110において、検索部10は決定された特徴量に基づいて検索対象データ記憶装置13の全ての映像区間に対して検索を行い、検索結果を出力する。
上記の例は、例えば、当該ゴルフ映像にゴルフスイングが4スイング入っているような場合、一般にはスイングなどの動作について正確に定義するのは困難である。そこで、本実施例では、映像全体とその中の映像中のスイングの回数「4」を入力することにより、同じ様な特徴量の状況が4回程度出現する映像の区間を見つけるものである。
また、本実施例では、時系列データとして映像データの例を示しているが、この例に限定されることなく、音声データや、株価の変動などの数値的なデータであってもよい。
なお、上記の第1の実施例、第2の実施例では、検索対象含有数入力装置11から含有数が入力される例を示しているが、この例に限定されることなく、例えば、レントゲン写真が100枚存在していて、2割の写真には腫瘍が存在するような場合には、含有率として20%を入力するようにしてもよい。
上記のように、本発明では、クラスタリングによりデータ(学習データまたは、時系列データ)から同じような状況を集め、ユーザに提示し、ユーザから入力される含有数(率)に当てはまる部分や区間を取り出して提示することにより、ユーザの求める正解を得ることができる。
上記の図3に示すパターン認識装置の構成をプログラムとして構築し、パターン認識装置として利用されるコンピュータにインストールして実行する、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体等のコンピュータ読み取り可能な記録媒体に格納し、コンピュータにインストールして実行させる、または、配布することが可能である。
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、学習用データや時系列データを用いたパターン認識技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態におけるパターン認識装置の構成図である。 本発明の一実施の形態におけるパターン認識方法の動作のフローチャートである。 本発明の一実施の形態における特徴決定部の動作のフローチャートである。
符号の説明
1 記憶手段、学習用データ記憶装置
2 特徴抽出手段、特徴抽出部
3 特徴組み合わせ手段、特徴組み合わせ部
4 クラスタリング手段、クラスタリング部
5 検索対象候補生成手段、検索対象候補生成部
6 検索対象含有数入力取得部
7 検索結果提示部
8 正解検索結果入力取得部
9 特徴決定手段、特徴決定部
10 検索手段、検索部
11 検索対象含有数入力装置
12 正解検索結果入力装置
13 検索対象データ記憶手段、検索対象データ記憶装置

Claims (9)

  1. 学習用データが格納された記憶手段と、検索対象データが格納された検索対象データ記憶手段と、複数の特徴抽出手段と、特徴組み合わせ手段と、クラスタリング手段と、検索対象候補生成手段と、特徴決定手段と、検索手段とを有する装置が実行するパターン認識方法であって、
    前記複数の特徴抽出手段が、前記学習用データが記憶された記憶手段から学習用データを読み込んで、該学習用データの複数の特徴を抽出する特徴抽出ステップと、
    前記特徴組み合わせ手段が、前記特徴抽出ステップで抽出された前記複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせステップと、
    前記クラスタリング手段が、前記特徴組み合わせステップで決定された全ての前記暫定的な特徴とフラグの組み合わせを用いて、前記学習用データをクラスタリングするクラスタリングステップと、
    前記検索対象候補生成手段が、ユーザから入力された前記学習用データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき学習用データの数(以下、含有数と記す)を取得し、前記クラスタリングステップで取得したクラスタリング結果のうち該クラスタに属する学習用データの数が前記含有数と等しいクラスタリング結果を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成ステップと、
    前記特徴決定手段が、前記ユーザにより選択された検索対象の候補であるクラスタリング結果に対し、該クラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて前記フラグによって利用することが指定されている特徴の組み合わせを検索に必要な特徴として決定する特徴決定ステップと、
    前記検索手段が、前記特徴決定ステップで決定された検索に必要な特徴に基づいて、前記検索対象データ記憶手段を検索し、検索結果を取得する検索ステップと、
    を行うことを特徴とするパターン認識方法。
  2. 映像を含む時系列データが記憶された記憶手段と、検索対象データが格納された検索対象データ記憶手段と、複数の特徴抽出手段と、特徴組み合わせ手段と、クラスタリング手段と、検索対象候補生成手段と、特徴決定手段と、検索手段とを有する装置が実行するパターン認識方法であって、
    前記複数の特徴抽出手段が、前記映像を含む時系列データが記憶された記憶手段から時系列データを読み込んで、該時系列データの複数の特徴を抽出する特徴抽出ステップと、
    前記特徴組み合わせ手段が、前記特徴抽出ステップで抽出された前記複数の特徴から前記複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせステップと、
    前記クラスタリング手段が、全ての前記暫定的な特徴とフラグの組み合わせを用いて、前記時系列データをクラスタリングするクラスタリングステップと、
    前記検索対象候補生成手段が、ユーザから入力された前記時系列データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき時系列データの数(以下、含有数と記す)を取得し、前記クラスタリングステップで取得したクラスタリング結果のうち該クラスタに属する学習用データの数が前記該含有数と等しいクラスタリング結果である映像区間を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成ステップと、
    前記特徴決定手段が、前記ユーザにより選択された検索対象の候補であるクラスタリング結果に対し、該クラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定ステップと、
    前記検索手段が、前記特徴決定ステップで決定された検索に必要な特徴に基づいて、前記検索対象データ記憶手段を検索し、検索結果を取得する検索ステップと、
    を行うことを特徴とするパターン認識方法。
  3. 前記特徴決定ステップにおいて、
    前記ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、
    前記暫定的な特徴とフラグの組み合わせのうち、前記フラグが特徴を利用することを指し示している場合に対応する特徴の数の逆数を各特徴とフラグの組み合わせの評価値とし、
    前記暫定的な特徴とフラグの組み合わせのうち、前記評価値の最も大きい特徴とフラグの組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、前記検索に必要な特徴とする、
    請求項1または2記載のパターン認識方法。
  4. 前記含有数の代わりに、前記学習用データ中に検索したい対象となるデータがどの程度含まれるかを示す含有率を用いる、請求項1記載のパターン認識方法。
  5. パターン認識装置であって、
    学習用データが格納記憶された記憶手段と、
    検索対象データが格納された検索対象データ記憶手段と、
    前記記憶手段から学習用データを読み込んで、該学習用データの複数の特徴を抽出する複数の特徴抽出手段と、
    前記特徴抽出手段で抽出された前記複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせ手段と、
    全ての前記暫定的な特徴とフラグの組み合わせを用いて、前記学習用データをクラスタリングするクラスタリング手段と、
    ユーザから入力された前記学習用データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき学習用データの数(以下、含有数と記す)を取得し、前記クラスタリング手段で取得したクラスタリング結果のうち該クラスタに属する学習用データの数が前記含有数と等しいクラスタリング結果を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成手段と、
    前記ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定手段と、
    前記特徴決定手段で決定された検索に必要な特徴に基づいて、前記検索対象データ記憶手段を検索し、検索結果を取得する検索手段と、
    を有することを特徴とするパターン認識装置。
  6. パターン認識装置であって、
    映像を含む時系列データが格納された記憶手段と、
    検索対象データが格納された検索対象データ記憶手段と、
    前記記憶手段から時系列データを読み込んで、該時系列データの複数の特徴を抽出する複数の特徴抽出手段と、
    前記特徴抽出手段で抽出された前記複数の特徴から前記複数の特徴と該特徴それぞれを利用するか否かを示すフラグからなる暫定的な特徴とフラグの組み合わせを決定する特徴組み合わせ手段と、
    全ての前記暫定的な特徴とフラグの組み合わせを用いて、前記時系列データをクラスタリングするクラスタリング手段と、
    ユーザから入力された前記時系列データ中に含まれる検索したい対象となるデータ(検索対象)として抽出すべき時系列データの数(以下、含有数と記す)を取得し、前記クラスタリング手段で取得したクラスタリング結果のうち該クラスタに属する学習用データの数が前記該含有数と等しいクラスタリング結果である映像区間を検索対象の候補として該ユーザが閲覧可能な表示装置に提示する検索対象候補生成手段と、
    前記ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、該組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、検索に必要な特徴として決定する特徴決定手段と、
    前記特徴決定手段で決定された検索に必要な特徴に基づいて、前記検索対象データ記憶手段を検索し、検索結果を取得する検索手段と、
    を有することを特徴とするパターン認識装置。
  7. 前記特徴決定手段は、
    前記ユーザから選択された検索対象の候補となるクラスタリング結果を生み出す前記暫定的な特徴とフラグの組み合わせを求め、
    前記暫定的な特徴とフラグの組み合わせのうち、前記フラグが特徴を利用することを指し示している場合に対応する特徴の数の逆数を各特徴とフラグの組み合わせの評価値とし、該暫定的な特徴とフラグの組み合わせのうち、評価値の最も大きい特徴とフラグの組み合わせにおいて、該フラグによって利用することが指定されている特徴の組み合わせを、前記検索に必要な特徴とする手段を含む、
    請求項5または6記載のパターン認識装置。
  8. 前記含有数の代わりに、前記学習用データ中に検索したい対象となるデータがどの程度含まれるかを示す含有率を用いる、請求項5記載のパターン認識装置。
  9. 請求項5乃至8のいずれか1項に記載のパターン認識装置を構成する各手段としてコンピュータを機能させるためのパターン認識プログラム。
JP2005243424A 2005-08-24 2005-08-24 パターン認識方法及び装置及びプログラム Expired - Fee Related JP4715389B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005243424A JP4715389B2 (ja) 2005-08-24 2005-08-24 パターン認識方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005243424A JP4715389B2 (ja) 2005-08-24 2005-08-24 パターン認識方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2007058603A JP2007058603A (ja) 2007-03-08
JP4715389B2 true JP4715389B2 (ja) 2011-07-06

Family

ID=37922042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005243424A Expired - Fee Related JP4715389B2 (ja) 2005-08-24 2005-08-24 パターン認識方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4715389B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4985293B2 (ja) * 2007-10-04 2012-07-25 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP5414416B2 (ja) * 2008-09-24 2014-02-12 キヤノン株式会社 情報処理装置及び方法
CN104077605B (zh) * 2014-07-18 2017-08-29 北京航空航天大学 一种基于颜色拓扑结构的行人搜索识别方法
JP7000738B2 (ja) * 2017-08-22 2022-01-19 富士電機株式会社 品質監視システム及びプログラム
US11586703B2 (en) 2018-02-08 2023-02-21 Nec Corporation Feature transformation apparatus and method, and recording medium
JP2018125019A (ja) * 2018-03-27 2018-08-09 エルピクセル株式会社 画像処理装置及び画像処理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668066A (ja) * 1992-08-20 1994-03-11 Fuji Electric Co Ltd 判別条件生成方法
JPH07230446A (ja) * 1993-12-22 1995-08-29 Toshiba Corp パターン抽出方法及び装置
JPH08106391A (ja) * 1994-10-04 1996-04-23 Fuji Electric Co Ltd 判別ルール生成方法
JPH11213127A (ja) * 1998-01-23 1999-08-06 Tokyo Inst Of Technol 画像処理方法および装置
JP2000132558A (ja) * 1998-10-22 2000-05-12 Nri & Ncc Co Ltd 分類ルール探求式クラスター分析装置
JP2001101188A (ja) * 1999-09-30 2001-04-13 Toshiba Corp 相関関係分析方法、相関関係分析装置および記録媒体
JP2003256839A (ja) * 2002-02-27 2003-09-12 Nec Corp パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668066A (ja) * 1992-08-20 1994-03-11 Fuji Electric Co Ltd 判別条件生成方法
JPH07230446A (ja) * 1993-12-22 1995-08-29 Toshiba Corp パターン抽出方法及び装置
JPH08106391A (ja) * 1994-10-04 1996-04-23 Fuji Electric Co Ltd 判別ルール生成方法
JPH11213127A (ja) * 1998-01-23 1999-08-06 Tokyo Inst Of Technol 画像処理方法および装置
JP2000132558A (ja) * 1998-10-22 2000-05-12 Nri & Ncc Co Ltd 分類ルール探求式クラスター分析装置
JP2001101188A (ja) * 1999-09-30 2001-04-13 Toshiba Corp 相関関係分析方法、相関関係分析装置および記録媒体
JP2003256839A (ja) * 2002-02-27 2003-09-12 Nec Corp パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置

Also Published As

Publication number Publication date
JP2007058603A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN106462399B (zh) 代码推荐
US9098741B1 (en) Discriminitive learning for object detection
Divvala et al. Learning everything about anything: Webly-supervised visual concept learning
JP5031741B2 (ja) 文書視覚構造の文法的な解析
JP4715389B2 (ja) パターン認識方法及び装置及びプログラム
Mettes et al. Bag-of-fragments: Selecting and encoding video fragments for event detection and recounting
Lai et al. Recognizing complex events in videos by learning key static-dynamic evidences
RU2666277C1 (ru) Сегментация текста
Mazloom et al. Tagbook: A semantic video representation without supervision for event detection
CN107368613B (zh) 短文本情感分析方法及装置
CN106537387B (zh) 检索/存储与事件相关联的图像
US20160239490A1 (en) Using Alternate Words As an Indication of Word Sense
US8527516B1 (en) Identifying similar digital text volumes
CN107357765A (zh) Word文档碎片化方法及装置
WO2022247403A1 (zh) 关键点检测方法、电子设备、程序及存储介质
JP7193000B2 (ja) 類似文書検索方法、類似文書検索プログラム、類似文書検索装置、索引情報作成方法、索引情報作成プログラムおよび索引情報作成装置
JP5927955B2 (ja) 情報処理装置及びプログラム
JP6402637B2 (ja) 分析プログラム、分析方法及び分析装置
JP5870744B2 (ja) 情報処理装置及びプログラム
CN113901793A (zh) 结合rpa和ai的事件抽取方法及装置
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
Li et al. Learning cooking techniques from youtube
US20050154750A1 (en) Methods and apparatus for generating automated graphics using stored graphics examples
CN111078067A (zh) 一种信息定位方法及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110314

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140408

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees