JP2015028778A - 自律学習型パターン認識機 - Google Patents
自律学習型パターン認識機 Download PDFInfo
- Publication number
- JP2015028778A JP2015028778A JP2014150216A JP2014150216A JP2015028778A JP 2015028778 A JP2015028778 A JP 2015028778A JP 2014150216 A JP2014150216 A JP 2014150216A JP 2014150216 A JP2014150216 A JP 2014150216A JP 2015028778 A JP2015028778 A JP 2015028778A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- image
- patterns
- input
- recorder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
【課題】対象のパターンが大きい場合にも対応して、照合用のパターンの登録に多大な時間を要せず、入力した画像パターンの、検出位置ずれ、回転ずれ、サイズ補正を施し、検索したい対象を認識するまでに多大な時間を要しない画像パターン認識を提供する。
【解決手段】画像パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していく。より広い領域パターンに対しても、照合用のパターンを合成する。合成されたより広い領域に適用する照合用のパターンに対しても新規性を検出し照合用のパターンを自律的に登録していく。位置ずれ、回転ずれ、サイズ違いがあっても、同一パターンに対応させる機能を有し同じ照合パターンと照合することができる。また検出したい対象を設定すると、検出したい対象に対応する照合パターンが逐次選択され、パターン認識をする経路と逆に伝搬し、画像パターン検出器に至り、検出が容易となる。
【選択図】図3
【解決手段】画像パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していく。より広い領域パターンに対しても、照合用のパターンを合成する。合成されたより広い領域に適用する照合用のパターンに対しても新規性を検出し照合用のパターンを自律的に登録していく。位置ずれ、回転ずれ、サイズ違いがあっても、同一パターンに対応させる機能を有し同じ照合パターンと照合することができる。また検出したい対象を設定すると、検出したい対象に対応する照合パターンが逐次選択され、パターン認識をする経路と逆に伝搬し、画像パターン検出器に至り、検出が容易となる。
【選択図】図3
Description
この発明はパターン認識する機械に関するものである。
従来のパターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。照合する際、入力したパターンと登録したパターンの位置ずれ、回転ずれ、サイズ違いがある場合には該当する対象であっても相関が低くなるため、位置補正、回転補正、サイズ補正等を実施した後に相関を取りパターン認識する。
従来のパターン認識機は認識する対象の位置ずれ、回転ずれ、サイズ違い等を事前補正し、登録したパターンと照合する必要があり、処理に時間を要する等のデメリットがあった。また照合するパターンの設定および照合に時間を要する等のデメリットがあった。
(請求項1に対応)
従来の画像パターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。入力したパターンの新規性を検出し、新規のパターンを自律的に登録し、照合に利用する画像パターン認識機は従来無い。
(請求項2に対応)
従来の音声パターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。入力したパターンの新規性を検出し、新規のパターンを自律的に登録し、照合に利用する音声パターン認識機は従来無い。
(請求項3に対応)
従来の画像パターン認識機はある範囲を画像情報から照合用のパターンを生成し、より広い領域のパターン認識は照合用のパターンを合成することにより照合を行っている。
照合用のパターンは人間が事前に登録しておく必要がある。入力した画像パターンの新規性を検出し、照合用のパターンを自律的に充実化し、またその組合せである広い領域のパターンの新規性を検出し、広い領域の照合用のパターンを充実化していく画像パターン認識機は従来無い。
照合用のパターンは人間が事前に登録しておく必要がある。入力した画像パターンの新規性を検出し、照合用のパターンを自律的に充実化し、またその組合せである広い領域のパターンの新規性を検出し、広い領域の照合用のパターンを充実化していく画像パターン認識機は従来無い。
(請求項4に対応)
従来のパターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。照合する際、入力したパターンと登録したパターンの位置ずれ、回転ずれ、サイズ違いがある場合には該当する対象であっても相関が低くなるため、位置補正、回転補正、サイズ補正等を実施した後に相関を取りパターン認識する。自律的に位置補正、回転補正、サイズ補正をする画像パターン認識機は従来無い。
(請求項5に対応)
従来のパターン認識機は入力した画像パターンの、検出位置ずれ、回転ずれ、サイズ補正を施し、入力した画像が検出したい対象に対応するものか否かを逐次分析して判断する。検索したい対象の照合パターンの感度を上げ、画像パターンから検索する対象を能動的に抽出する画像パターン認識機は従来無い。
(請求項1に対応)
従来の画像パターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。パターン照合のためにはあらかじめ照合用のパターンを登録する必要があり、登録に多大な時間を要する等のデメリットがあった。
(請求項2に対応)
従来の音声パターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。パターン照合のためにはあらかじめ照合用のパターンを登録する必要があり、登録に多大な時間を要する等のデメリットがあった。
(請求項3に対応)
従来の画像パターン認識機はある範囲を画像情報から照合用のパターンを生成し、より広い領域のパターン認識は照合用のパターンを合成することにより照合を行っている。対象のパターンが大きい場合、照合用のパターンも複雑になり、照合用パターンの作成および登録に多大な時間を要する等のデメリットがあった。また、照合に多大な時間を要する等のデメリットがあった。
(請求項4に対応)
従来のパターン認識機は認識する対象のパターンをあらかじめ登録し、入力したパターンと照合し相関が大きい場合には対象であると認識し、相関が低い場合には対象でないと判断する。照合する際、入力したパターンと登録したパターンの位置ずれ、回転ずれ、サイズ違いがある場合には該当する対象であっても相関が低くなるため、位置補正、回転補正、サイズ補正等を実施した後に相関を取る必要があり、補正に多大な時間を要する等のデメリットがあった。
(請求項5に対応)
従来のパターン認識機は入力した画像パターンの、検出位置ずれ、回転ずれ、サイズ補正を施し、入力した画像が検出したい対象に対応するものか否かを逐次分析して判断する必要があり、検索したい対象を認識するまでに多大な時間を要する等のデメリットがあった。
(請求項1に対応)
この発明における画像パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していく。照合用のパターンを人間があらかじめ登録する必要が無い。
(請求項2に対応)
この発明における音声パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していく。照合用のパターンを人間があらかじめ登録する必要が無い。
(請求項3に対応)
この発明における画像パターン認識機はより広い領域パターンに対しても、照合用のパターンを合成することにより生成する。合成されたより広い領域に適用する照合用のパターンに対しても新規性を検出し照合用のパターンを自律的に登録していく。より広い領域の照合パターンについても人間があらかじめ登録する必要が無い。
(請求項4に対応)
この発明における画像パターン認識機は位置ずれ、回転ずれ、サイズ違いがあっても、同一パターンに対応させる機能を有する。この機能により、位置ずれ、回転ずれ、サイズ違いがあっても同じ照合パターンと照合することができる。
(請求項5に対応)
この発明におけるパターン認識機は検出したい対象を設定すると、検出したい対象に対応する照合パターンが逐次選択されていく。これは、パターン認識をする経路と逆に伝搬し、画像パターン検出器に至る。画像パターン検出器においては検出したい対象の照合パターンの検出感度が高くなっているため、検出が容易となる。
(請求項1に対応)
図1はこの発明の一実施例における画像パターン変換器の構成例を示した図である。
画像検出器で検出された画像情報は画像パターン変換器において画像パターンに変換される。処理の簡易性の観点から、本図の例においては、パターン例として、その要素を「1」と「0」で表現しているが、各画像情報に対し、識別可能である分解能を有する表現であれば別の表現でも良い。
図3はこの発明における一実施例における自律型学習パターン認識機の構成例について示したものである。図3において1は画像検出器である。2は画像パターン変換器である。3はパターン記録器(未登録)である。4はパターン記録器(既登録)である。5は入力信号と既登録のパターンとの相関を検出する相関検出器である。6は入力した信号の新規性を検出し、新規パターンである場合、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。7はパターン記録器の群と相関検出器と新規パターン登録器から構成されるパターン記録群である。
画像検出器で検出された画像情報は画像パターン変換器において画像パターンに変換される。処理の簡易性の観点から、本図の例においては、パターン例として、その要素を「1」と「0」で表現しているが、各画像情報に対し、識別可能である分解能を有する表現であれば別の表現でも良い。
図3はこの発明における一実施例における自律型学習パターン認識機の構成例について示したものである。図3において1は画像検出器である。2は画像パターン変換器である。3はパターン記録器(未登録)である。4はパターン記録器(既登録)である。5は入力信号と既登録のパターンとの相関を検出する相関検出器である。6は入力した信号の新規性を検出し、新規パターンである場合、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。7はパターン記録器の群と相関検出器と新規パターン登録器から構成されるパターン記録群である。
次に動作について説明する。
図3において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録器に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録器で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。図4は相関係数の定義例について示したものである。図4においてパターンAは入力されたパターンには信号が存在するがパターン記録器には対応する要素にパターンが記録されていないパターンである。パターンBは入力されたパターンに信号が存在し、パターン記録器にも対応する要素にパターンが記録されているパターンである。パターンCは入力されたパターンに信号は存在しないが、パターン記録器に対応する要素にパターンが記録されているパターンである。相関係数の計算例としては入力したパターンとパターン記録器に記録されているパターンを合わせた集合に対し、入力信号と記録されているパターンが一致するパターンの比で表現する方法がある。全てのラインにおいて入力信号と記録しているパターンの要素が一致する場合、相関係数は1.0となる。仮に入力したパターンと記録されているパターンを合わせた集合の内、半分が一致している場合、相関係数は0.5となる。図3の5の相関検出器において入力信号とパターン記録器に記録されているパターンとの相関係数が検出される。どのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、6の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。
図3において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録器に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録器で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。図4は相関係数の定義例について示したものである。図4においてパターンAは入力されたパターンには信号が存在するがパターン記録器には対応する要素にパターンが記録されていないパターンである。パターンBは入力されたパターンに信号が存在し、パターン記録器にも対応する要素にパターンが記録されているパターンである。パターンCは入力されたパターンに信号は存在しないが、パターン記録器に対応する要素にパターンが記録されているパターンである。相関係数の計算例としては入力したパターンとパターン記録器に記録されているパターンを合わせた集合に対し、入力信号と記録されているパターンが一致するパターンの比で表現する方法がある。全てのラインにおいて入力信号と記録しているパターンの要素が一致する場合、相関係数は1.0となる。仮に入力したパターンと記録されているパターンを合わせた集合の内、半分が一致している場合、相関係数は0.5となる。図3の5の相関検出器において入力信号とパターン記録器に記録されているパターンとの相関係数が検出される。どのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、6の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。
(請求項2に対応)
図2はこの発明の一実施例における音声パターン変換器の構成例を示した図である。
音声検出器で検出された音声情報は音声パターン変換器において音声パターンに変換される。処理の簡易性の観点から、本図の例においては、パターン例として、その要素を「1」と「0」で表現しているが、各画像情報に対し、識別可能である分解能を有する表現であれば別の表現でも良い。
図3はこの発明における一実施例における自律型学習パターン認識機の構成例について示したものである。図3において1は音声検出器である。2は音声パターン変換器である。3はパターン記録器(未登録)である。4はパターン記録器(既登録)である。5は入力信号と既登録のパターンとの相関を検出する相関検出器である。6は入力した信号の新規性を検出し、新規パターンである場合、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。
音声検出器で検出された音声情報は音声パターン変換器において音声パターンに変換される。処理の簡易性の観点から、本図の例においては、パターン例として、その要素を「1」と「0」で表現しているが、各画像情報に対し、識別可能である分解能を有する表現であれば別の表現でも良い。
図3はこの発明における一実施例における自律型学習パターン認識機の構成例について示したものである。図3において1は音声検出器である。2は音声パターン変換器である。3はパターン記録器(未登録)である。4はパターン記録器(既登録)である。5は入力信号と既登録のパターンとの相関を検出する相関検出器である。6は入力した信号の新規性を検出し、新規パターンである場合、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。
次に動作について説明する。
図3において1の音声検出器は音声情報を検出する。2の音声パターン変換器は音声情報を音声パターンに変換する。変換された音声パターンはパターン記録器に送られ記録している音声パターンとの照合が行われる。入力された音声パターンとパターン記録器で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。図4は相関係数の定義例について示したものである。図4においてパターンAは入力されたパターンには信号が存在するがパターン記録器には対応する要素にパターンが記録されていないパターンである。パターンBは入力されたパターンに信号が存在し、パターン記録器にも対応する要素にパターンが記録されているパターンである。パターンCは入力されたパターンに信号は存在しないが、パターン記録器に対応する要素にパターンが記録されているパターンである。相関係数の計算例としては入力したパターンとパターン記録器に記録されているパターンを合わせた集合に対し、入力信号と記録されているパターンが一致するパターンで表現する方法がある。全てのラインにおいて入力信号と記録しているパターンの要素が一致する場合、相関係数は1.0となる。仮に入力したパターンと記録されているパターンを合わせた集合の内、半分が一致している場合、相関係数は0.5となる。図3の5の相関検出器において入力信号とパターン記録器に記録されているパターンとの相関係数が検出される。どのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、6の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。
図3において1の音声検出器は音声情報を検出する。2の音声パターン変換器は音声情報を音声パターンに変換する。変換された音声パターンはパターン記録器に送られ記録している音声パターンとの照合が行われる。入力された音声パターンとパターン記録器で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。図4は相関係数の定義例について示したものである。図4においてパターンAは入力されたパターンには信号が存在するがパターン記録器には対応する要素にパターンが記録されていないパターンである。パターンBは入力されたパターンに信号が存在し、パターン記録器にも対応する要素にパターンが記録されているパターンである。パターンCは入力されたパターンに信号は存在しないが、パターン記録器に対応する要素にパターンが記録されているパターンである。相関係数の計算例としては入力したパターンとパターン記録器に記録されているパターンを合わせた集合に対し、入力信号と記録されているパターンが一致するパターンで表現する方法がある。全てのラインにおいて入力信号と記録しているパターンの要素が一致する場合、相関係数は1.0となる。仮に入力したパターンと記録されているパターンを合わせた集合の内、半分が一致している場合、相関係数は0.5となる。図3の5の相関検出器において入力信号とパターン記録器に記録されているパターンとの相関係数が検出される。どのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、6の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。
(請求項3に対応)
図5はこの発明の一実施例における階層型パターン認識機の構成例を示した図である。図5において1は画像検出器である。2は画像パターン変換器である。8はパターン記録群(1段目)である。9はパターン記録群(2段目)である。10はパターン記録群(N段目)である。11はパターン記録群により識別された対象を言語パターンに対応付けるパターン記録群(言語パターン)である。
次に動作について説明する。
図5において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録群(第1段目)に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録群で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。記録群内のどのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、記録群内の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。これらの動作により、第1段目の記録群に対する領域における照合パターンのライブラリが生成される。第1段目で照合したパターンを組み合わせることにより、より広い領域の照合パターンを生成することになる。9のパターン記録群(第2段目)はパターン記録群(第1段目)のライブラリを組み合わせることにより、より広い領域をカバーする照合パターンのライブラリが生成される。同様の手順を踏むことにより、さらに広い領域をカバーするパターン記録群(第N段目)のライブラリが生成される。パターン記録群(第N段目)においては識別する対象の全体像をカバーすることになる。パターン記録群(第N段目)において対象が識別され、対象が「何」かを示す11のパターン記録群(言語パターン)との関係付けが実施される。
図5において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録群(第1段目)に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録群で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。記録群内のどのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、記録群内の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。これらの動作により、第1段目の記録群に対する領域における照合パターンのライブラリが生成される。第1段目で照合したパターンを組み合わせることにより、より広い領域の照合パターンを生成することになる。9のパターン記録群(第2段目)はパターン記録群(第1段目)のライブラリを組み合わせることにより、より広い領域をカバーする照合パターンのライブラリが生成される。同様の手順を踏むことにより、さらに広い領域をカバーするパターン記録群(第N段目)のライブラリが生成される。パターン記録群(第N段目)においては識別する対象の全体像をカバーすることになる。パターン記録群(第N段目)において対象が識別され、対象が「何」かを示す11のパターン記録群(言語パターン)との関係付けが実施される。
(請求項4に対応)
図6はこの発明の一実施例における位置ずれ補正パターン認識機の構成を示した図である。図6において1は画像情報を検出する画像検出器である。2は画像検出器の出力を画像パターンに変換する画像パターン変換器である。6は入力した信号の新規性を検出し、新規パターンの時、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。7はパターン記録器の群から構成されるパターン記録群である。12は2の画像パターン変換器の出力が位置ずれにより記録したパターンと違ったパターンに見えるのを防止する同一パターン抽出器である。
次に動作について説明する。
図6(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べるオフセットさせるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつオフセットさせて実施する。位置ずれにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図6(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,0,1,0,0,1,1,0,・・,0,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次に位置ずれにより、画像パターン変換器の出力が図6(2/2)のように変化したとする。
図の例では[0,1,0,0,1,1,0,0,・・,0,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、位置ずれが発生しても同一パターンとして認識が可能である。このように位置ずれを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
図6(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べるオフセットさせるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつオフセットさせて実施する。位置ずれにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図6(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,0,1,0,0,1,1,0,・・,0,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次に位置ずれにより、画像パターン変換器の出力が図6(2/2)のように変化したとする。
図の例では[0,1,0,0,1,1,0,0,・・,0,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、位置ずれが発生しても同一パターンとして認識が可能である。このように位置ずれを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
図7はこの発明の一実施例における回転ずれ補正パターン認識機の構成を示した図である。図7において1は画像情報を検出する画像検出器である。2は画像検出器の出力を画像パターンに変換する画像パターン変換器である。6は入力した信号の新規性を検出し、新規パターンの時、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。7はパターン記録器の群から構成されるパターン記録群である。12は2の画像パターン変換器の出力が回転ずれにより記録したパターンと違ったパターンに見えるのを防止する同一パターン抽出器である。
次に動作について説明する。
図7(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べる回転オフセットさせるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつ回転角をオフセットさせて実施する。回転ずれにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図7(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,0,1,0,0,1,1,0,・・,0,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次に回転ずれにより、画像パターン変換器の出力が図7(2/2)のように変化したとする。
図の例では[0,1,0,0,1,1,0,0,・・,0,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、回転ずれが発生しても同一パターンとして認識が可能である。このように回転ずれを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
図7(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べる回転オフセットさせるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつ回転角をオフセットさせて実施する。回転ずれにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図7(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,0,1,0,0,1,1,0,・・,0,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次に回転ずれにより、画像パターン変換器の出力が図7(2/2)のように変化したとする。
図の例では[0,1,0,0,1,1,0,0,・・,0,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、回転ずれが発生しても同一パターンとして認識が可能である。このように回転ずれを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
図8はこの発明の一実施例におけるサイズ補正パターン認識機の構成を示した図である。図8において1は画像情報を検出する画像検出器である。2は画像検出器の出力を画像パターンに変換する画像パターン変換器である。6は入力した信号の新規性を検出し、新規パターンの時、パターン記録器(未登録)に新規パターンを記録する新規パターン登録器である。7はパターン記録器の群から構成されるパターン記録群である。12は2の画像パターン変換器の出力がサイズ違いにより記録したパターンと違ったパターンに見えるのを防止する同一パターン抽出器である。
次に動作について説明する。
図8(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べるサイズ変換させるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつサイズ変換させて実施する。サイズ違いにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図7(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,1,0,0,1,1,0,・・,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次にサイズ違いにより、画像パターン変換器の出力が図6(2/2)のように変化したとする。図の例ではサイズ違いのパターン[0,1,0,0,1,1,0,・・,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、サイズ変更が発生しても同一パターンとして認識が可能である。このようにサイズ違いを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
図8(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。画像パターンは12の同一パターン抽出器を経由して7のパターン記録群に入力される。12の同一パターン抽出器は2の画像パターン変換器の出力を複数のライン群に分けてパターン記録群に入力する。(本図ではライン群を3本で表現しているが、下記で述べるサイズ変換させるのに必要なライン群を設ける。)
各ライン群と画像パターン変換器の構成要素との接続は相対関係を維持しつつサイズ変換させて実施する。サイズ違いにより違ったように見えるパターンも同一パターン抽出器を経由することにより同一パターンとして認識することが可能となる。
図7(1/2)により具体的な例を示す。画像パターン変換器の構成要素によりパターンが設定されたとする。図の例では[0,1,0,0,1,1,0,・・,0,0]と表現できる。(1は信号有、0は信号無を表現。)このパターンは青色のラインを経由してパターン記録群内の各パターン記録器と照合される。あるパターン記録器は[0,1,0,0,1,1,0,・・,0,0]というパターンを記録しており、画像パターン記録器とのパターンと一致する。
次にサイズ違いにより、画像パターン変換器の出力が図6(2/2)のように変化したとする。図の例ではサイズ違いのパターン[0,1,0,0,1,1,0,・・,0,0]と表現できる。このパターンは青色のラインではパターン記録器のパターンと一致しない。ただし、赤色のラインでは上記に述べた記録器のパターン[0,1,0,0,1,1,0,・・,0,0]と一致する。
このように同一パターン抽出器を経由することにより、サイズ変更が発生しても同一パターンとして認識が可能である。このようにサイズ違いを補正することのより、見かけ上違って見えるパターンを除去し、実質的に違ったパターンをパターン記録器に記録する。新規のパターンは6の新規パターン登録器により、パターン記録器(未登録)に登録される。
(請求項5に対応)
図9はこの発明の一実施例における能動型パターン認識機の構成例を示した図である。図9において1は画像検出器である。2は画像パターン変換器である。8はパターン記録群(1段目)である。9はパターン記録群(2段目)である。10はパターン記録群(N段目)である。11はパターン記録群により識別された対象を言語パターンに対応付けるパターン記録群(言語パターン)である。
次に動作について説明する。
まずは、画像パターンの記録および画像パターンに対応する言語との関係付けの動作について説明する。
図9(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録群(第1段目)に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録群で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。記録群内のどのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、記録群内の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。これらの動作により、第1段目の記録群に対する領域における照合パターンのライブラリが生成される。第1段目で照合したパターンを組み合わせることにより、より広い領域の照合パターンを生成することになる。9のパターン記録群(第2段目)はパターン記録群(第1段目)のライブラリを組み合わせることにより、より広い領域をカバーする照合パターンのライブラリが生成される。同様の手順を踏むことにより、さらに広い領域をカバーするパターン記録群(第N段目)のライブラリが生成される。パターン記録群(第N段目)においては識別する対象の全体像をカバーすることになる。パターン記録群(第N段目)において対象が識別され、対象が「何」かを示す11のパターン記録群(言語パターン)との関係付けが実施される。
次に画像情報の中からある特定の対象物を能動的に検出する時の動作について説明する。図9(1/2)において検出したい対象を示す言語を入力すると11のパターン記録器(言語パターン)の内、検出したい対象を表現する言語パターンがスタンバイ状態になる。(図9(1/2)ではスタンバイ状態になったことを示すため該当するパターン記録器を黄色で塗っている。)この言語パターンによるスタンバイ化はパターン認識をする経路と逆に伝搬し、関連するパターン記録器を逐次、スタンバイ状態に変化させていき、最終的には2の画像パターン変換器に到達し、画像パターン変換器において検出したい画像パターンの検出感度を向上させる。
図9(2/2)は1の画像検出器において検出された数々のパターン(赤色のパターン、青色のパターンで表現)のうち検出したいパターン(赤色のパターン)が優先的に識別され検出されることを示している。検出したい対象が画像パターンの中に含まれている場合、該当する画像パターンは能動的に検出されることになる。
まずは、画像パターンの記録および画像パターンに対応する言語との関係付けの動作について説明する。
図9(1/2)において1の画像検出器は画像情報を検出する。2の画像パターン変換器は画像情報を画像パターンに変換する。変換された画像パターンはパターン記録群(第1段目)に送られ記録している画像パターンとの照合が行われる。入力された画像パターンとパターン記録群で記録されているパターンとの照合を行い入力パターンとの相関係数が評価される。記録群内のどのパターン記録器においても相関係数が低い場合、入力したパターンは新規性が高いと判断し、記録群内の新規パターン登録器により、パターン記録器(未登録)に入力信号のパターンが登録される。これらの動作により、第1段目の記録群に対する領域における照合パターンのライブラリが生成される。第1段目で照合したパターンを組み合わせることにより、より広い領域の照合パターンを生成することになる。9のパターン記録群(第2段目)はパターン記録群(第1段目)のライブラリを組み合わせることにより、より広い領域をカバーする照合パターンのライブラリが生成される。同様の手順を踏むことにより、さらに広い領域をカバーするパターン記録群(第N段目)のライブラリが生成される。パターン記録群(第N段目)においては識別する対象の全体像をカバーすることになる。パターン記録群(第N段目)において対象が識別され、対象が「何」かを示す11のパターン記録群(言語パターン)との関係付けが実施される。
次に画像情報の中からある特定の対象物を能動的に検出する時の動作について説明する。図9(1/2)において検出したい対象を示す言語を入力すると11のパターン記録器(言語パターン)の内、検出したい対象を表現する言語パターンがスタンバイ状態になる。(図9(1/2)ではスタンバイ状態になったことを示すため該当するパターン記録器を黄色で塗っている。)この言語パターンによるスタンバイ化はパターン認識をする経路と逆に伝搬し、関連するパターン記録器を逐次、スタンバイ状態に変化させていき、最終的には2の画像パターン変換器に到達し、画像パターン変換器において検出したい画像パターンの検出感度を向上させる。
図9(2/2)は1の画像検出器において検出された数々のパターン(赤色のパターン、青色のパターンで表現)のうち検出したいパターン(赤色のパターン)が優先的に識別され検出されることを示している。検出したい対象が画像パターンの中に含まれている場合、該当する画像パターンは能動的に検出されることになる。
(請求項1に対応)
第1の発明によれば画像パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していくため、照合用のパターンを人間があらかじめ登録する必要が無い。照合用のパターンを登録する労力を大幅に削減することができる。
(請求項2に対応)
第2の発明によれば音声パターン認識機は入力パターンの新規性を検出し照合用のパターンを自律的に登録していくため、照合用のパターンを人間があらかじめ登録する必要が無い。照合用のパターンを登録する労力を大幅に削減することができる。
(請求項3に対応)
第3の発明によれば画像パターン認識機はより広い領域パターンに対しても、照合用のパターンを合成することにより生成する。合成されたより広い領域に適用する照合用のパターンに対しても新規性を検出し照合用のパターンを自律的に登録していく。より広い領域の照合パターンについても人間があらかじめ登録する必要が無い。照合用のパターンを登録する労力を大幅に削減することができる。
(請求項4に対応)
第4の発明によれば画像パターン認識機は位置ずれ、回転ずれ、サイズ違いがあっても、自律的に同一パターンに対応させる機能を有する。この機能により、位置ずれ、回転ずれ、サイズ違いがあっても同じ照合パターンと照合することができる。人間による位置補正、回転補正、サイズ補正等の労力を大幅に削減することができる。
(請求項5に対応)
第5の発明によればパターン認識機は検出したい対象を設定すると、検出したい対象に対応する照合パターンが逐次選択されていく。これは、パターン認識をする経路と逆に伝搬し、画像パターン検出器に至る。画像パターン検出器においては検出したい対象の照合パターンの検出感度が高くなっているため、検出が容易となる。入力した画像から検出される多くのパターンの中から検索したい対象を逐次、照合する必要が無いため、検出に要する時間を大幅に短縮することができる。
1 画像検出器/音声検出器
2 画像パターン変換器/音声パターン変換器
3 パターン記録器(既登録)
4 パターン記録器(未登録)
5 相関検出器
6 新規パターン登録器
7 パターン記録
8 パターン記録群(第1段目)
9 パターン記録群(第2段目)
10 パターン記録群(第N段目)
11 パターン記録群(言語パターン)
12 同一パターン抽出器
2 画像パターン変換器/音声パターン変換器
3 パターン記録器(既登録)
4 パターン記録器(未登録)
5 相関検出器
6 新規パターン登録器
7 パターン記録
8 パターン記録群(第1段目)
9 パターン記録群(第2段目)
10 パターン記録群(第N段目)
11 パターン記録群(言語パターン)
12 同一パターン抽出器
Claims (5)
- 画像情報を対応するパターンに変換するパターン変換器と、パターンを記録するパターン記録器と、入力パターンの新規性を検出し新規パターンを登録する新規パターン登録器を備え、入力パターンから自律的に新規パターンを学習し、照合用のパターンを充実化していく自律学習型パターン認識機。
- 音声情報を対応するパターンに変換するパターン変換器と、パターンを記録するパターン記録器と、入力パターンの新規性を検出し新規パターンを登録する新規パターン登録器を備え、入力パターンから自律的に新規パターンを学習し、照合用のパターンを充実化していく自律学習型パターン認識機。
- ある範囲の画像情報の新規パターンを自律的に学習し、照合用のパターンを充実化していく自律学習型パターン認識器を群にすることにより、より広い領域のパターンを自律的に学習し、照合用のパターンを充実化していくパターン認識器の群を備え、より広い領域の照合用のパターンを充実化していく自律学習型パターン認識機。
- 画像情報を対応するパターンに変換するパターン変換器と、位置ずれ、回転ずれ、サイズ違いを補正する同一パターン抽出器とパターンを記録するパターン記録器と、入力パターンの新規性を検出し新規パターンを登録する新規パターン登録器を備え、入力パターンから自律的に新規パターンを学習し、照合用のパターンを充実化していく自律学習型パターン認識機。
- 画像情報を対応するパターンに変換するパターン変換器と、パターンを記録するパターン記録器と、パターン認識結果を格納する言語パターン記録器を備え、検索したい対象を指定するとパターン認識した経路を逆に伝搬し検索する対象の検出感度を上げることを特徴とする自律学習型パターン認識機。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014150216A JP2015028778A (ja) | 2014-07-06 | 2014-07-06 | 自律学習型パターン認識機 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014150216A JP2015028778A (ja) | 2014-07-06 | 2014-07-06 | 自律学習型パターン認識機 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015028778A true JP2015028778A (ja) | 2015-02-12 |
Family
ID=52492421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014150216A Pending JP2015028778A (ja) | 2014-07-06 | 2014-07-06 | 自律学習型パターン認識機 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015028778A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009252069A (ja) * | 2008-04-09 | 2009-10-29 | Fujifilm Corp | 画像処理装置、撮像装置、画像処理方法及びプログラム |
JP2010122994A (ja) * | 2008-11-20 | 2010-06-03 | Panasonic Electric Works Co Ltd | 顔認証システム |
JP2014096156A (ja) * | 2013-12-13 | 2014-05-22 | Canon Inc | 情報処理装置、制御方法、制御プログラム及び記憶媒体 |
-
2014
- 2014-07-06 JP JP2014150216A patent/JP2015028778A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009252069A (ja) * | 2008-04-09 | 2009-10-29 | Fujifilm Corp | 画像処理装置、撮像装置、画像処理方法及びプログラム |
JP2010122994A (ja) * | 2008-11-20 | 2010-06-03 | Panasonic Electric Works Co Ltd | 顔認証システム |
JP2014096156A (ja) * | 2013-12-13 | 2014-05-22 | Canon Inc | 情報処理装置、制御方法、制御プログラム及び記憶媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Adavanne et al. | A multi-room reverberant dataset for sound event localization and detection | |
Yoshioka et al. | Advances in online audio-visual meeting transcription | |
Zmolikova et al. | Neural target speech extraction: An overview | |
JP6520878B2 (ja) | 音声取得システムおよび音声取得方法 | |
US20190341058A1 (en) | Joint neural network for speaker recognition | |
KR102230667B1 (ko) | 오디오-비주얼 데이터에 기반한 화자 분리 방법 및 장치 | |
Chung et al. | Who said that?: Audio-visual speaker diarisation of real-world meetings | |
US20190341053A1 (en) | Multi-modal speech attribution among n speakers | |
US20210312915A1 (en) | System and method for audio-visual multi-speaker speech separation with location-based selection | |
WO2015182007A1 (ja) | 自律型思考パターン生成機 | |
JP6654611B2 (ja) | 成長型対話装置 | |
Stolcke et al. | DOVER: A method for combining diarization outputs | |
EP4082008B1 (en) | Text independent speaker-verification on a media operating system using deep learning on raw waveforms | |
Lucey et al. | Integration strategies for audio-visual speech processing: applied to text-dependent speaker recognition | |
JP2018526622A (ja) | ロボット音声探索回転システム及び方法 | |
CN103688187B (zh) | 使用相位谱的声音源定位 | |
WO2020053598A3 (en) | Vehicle position identification | |
Kwon et al. | Adapting speaker embeddings for speaker diarisation | |
US20140037150A1 (en) | Information processing device | |
US11881224B2 (en) | Multilingual speech recognition and translation method and related system for a conference which determines quantity of attendees according to their distances from their microphones | |
JP2015028778A (ja) | 自律学習型パターン認識機 | |
Nguyen et al. | What makes sound event localization and detection difficult? insights from error analysis | |
CN110475093A (zh) | 一种活动调度方法、装置及存储介质 | |
Thermos et al. | Audio-visual speech activity detection in a two-speaker scenario incorporating depth information from a profile or frontal view | |
CN105760854B (zh) | 信息处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20141113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150414 |