JP5188563B2 - パターンマッチング装置及び方法 - Google Patents

パターンマッチング装置及び方法 Download PDF

Info

Publication number
JP5188563B2
JP5188563B2 JP2010248442A JP2010248442A JP5188563B2 JP 5188563 B2 JP5188563 B2 JP 5188563B2 JP 2010248442 A JP2010248442 A JP 2010248442A JP 2010248442 A JP2010248442 A JP 2010248442A JP 5188563 B2 JP5188563 B2 JP 5188563B2
Authority
JP
Japan
Prior art keywords
pattern
compression
compressed
distance
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010248442A
Other languages
English (en)
Other versions
JP2011022621A (ja
Inventor
友成 柿野
ルアン・ジアン
ハオ・ジエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Publication of JP2011022621A publication Critical patent/JP2011022621A/ja
Application granted granted Critical
Publication of JP5188563B2 publication Critical patent/JP5188563B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声,文字,図形等の入力パターンが、予め想定されている標準パターンのうちのいずれであるかを判定するパターン認識分野で利用されるパターンマッチング装置及び方法に関する。
従来のパターン認識分野では、パターンマッチング方式として動的計画法(Dynamic programming : DP)が広く活用されている(例えば、特許文献1参照)。
音声のパターン認識分野を例に、動的計画法の原理について説明する。
音声パターンAは、次の(1)式のように表現される。
Figure 0005188563
(1)式において、i{i=1,2,…,I}は時間を示し、aは音声パターンAの時間iにおける特徴要素を意味している。
そこで、各種の単語毎に、音声パターンAと同様の、特徴要素の時系列で表現される標準パターンBを用意しておく。この標準パターンBは、次の(2)式のように表現される。
Figure 0005188563
(2)式において、j{j=1,2,…,J}は時間を示し、bは音声パターンBの時間jにおける特徴要素を意味している。
パターンマッチング装置では、入力された音声パターンAを、各種単語の標準パターンBとそれぞれ比較してパターン間の距離を求める。そして、最小距離の標準パターンを認識結果として出力する。
実際の音声パターンでは、発話速度の変動に起因して時間軸歪が生じる。動的計画法は、この時間軸歪を整合する手法として極めて有効である。
動的計画法では、次の(3)式に示された漸化式を繰返し演算する。
Figure 0005188563
(3)式において、d(i,j)は、音声パターンAの特徴要素aと標準パターンBの特徴要素bとの要素間距離である。g(i,j)は、音声パターンAと標準パターンBとの要素間累積距離である。
パターンマッチング装置では、上記漸化式(3)を繰り返し計算する。そして、図9に示すように、A,B平面でaとbとを最適に対応付ける経路(DP−pass)を求める。
上記漸化式(3)の最上段の式は、図10に示すA,B平面上の任意の点(i,j)に対し、下方に隣接する点(i,j−1)との関係を規定している。同漸化式(3)の中段の式は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)との関係を規定している。同漸化式(3)の最下段の式は、点(i,j)に対し、左側に隣接する点(i−1,j)との関係を規定している。
なお、この漸化式(3)から最上段の式を省略することで傾斜制限を加える場合もある。この場合は、任意の点(i,j)に対して図11に示すような関係が規定される。傾斜制限は極端な伸縮を制限するために設けられる。
ところで一般に、パターンマッチングに必要な標準パターンは多数用意される。このため、標準パターンを圧縮することによって、標準パターンを記憶する領域の効率化を図ることが考えられている。標準パターンを圧縮する方法としては、次の方法がある。すなわち、標準パターンを構成する各特徴要素について、それぞれ隣接する特徴要素との差をとる。そして、その差があらかじめ設定された閾値より小さい場合は、隣接した特長要素が近似していると判定する。近似しているものがあった場合には、それらを1つの特徴要素に統合する。かくして、標準パターンが圧縮される。
特開昭50-96104号公報
しかしながら、上述した方法で標準パターンを圧縮した場合、パターン認識に有益な時間情報が消失してしまう。すなわち、隣接する特徴要素が1つに統合されるので、各要素がそれぞれ有していた時間情報の一部が消失する。標準パターンから時間情報の一部が失われると、一般に、マッチングエラー(matching error)が発生し易くなる。特に、ノイズ(noise)の混入により部分的に近似した特徴パターンが数多く認識された場合や、傾斜制限が設けられた場合には、マッチングエラーが顕著に見られる。
本発明は、このような事情に基づいてなされたもので、その目的とするところは、標準パターンを圧縮した場合でもマッチングエラーの発生率を低減することができるパターンマッチング装置及びその方法を提供しようとするものである。
本発明のパターンマッチング装置は、標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。そして、記憶された圧縮標準パターンと入力パターンとのパターン間距離を、当該圧縮標準パターンに対して生成された圧縮情報を変数として持つ動的計画法の漸化式によって算出する。
かかる手段を講じた本発明によれば、標準パターンを圧縮した場合でもマッチングエラーの発生率を低減することができるパターンマッチング装置及びその方法を提供できる。
本発明の実施の形態であるパターンマッチング装置の構成を示すブロック図。 同パターンマッチング装置で行われる標準パターン圧縮処理を説明するための図。 同パターンマッチング装置の記憶部に記憶されるデータ構造を示す模式図。 第1の実施の形態におけるパターンマッチング処理部の要部構成を示すブロック図。 第2の実施の形態におけるパターンマッチング処理部の要部構成を示すブロック図。 第2の実施の形態のパターンマッチング処理部で計算される第1の漸化式を説明するための図。 第2の実施の形態のパターンマッチング処理部で計算される第2の漸化式を説明するための図。 第2の実施の形態のパターンマッチング処理部で計算される第3の漸化式を説明するための図。 従来の動的計画法を説明するための図。 従来の動的計画法で計算される漸化式を説明するための図。 従来の動的計画法で計算される漸化式の他の例を説明するための図。
以下、本発明を音声のパターン認識分野に適用した実施の形態について、図面を用いて説明する。はじめに、第1の実施の形態について、図1〜図4を用いて説明する。
図1は本実施の形態に係るパターンマッチング装置10の要部構成を示すブロック図である。パターンマッチング装置10は、音声分析部11,パターン圧縮部12、圧縮情報生成部13、記憶部14及びパターンマッチング処理部15を備えている。
音声分析部11には、音声信号Mが入力される。音声信号Mは、マイクロフォンを通して入力された音声から変換された電気信号である。音声分析部11は、入力された音声信号Mを分析する。そして、入力音声の特徴要素aを時系列で抽出して、前記(1)式で示される音声パターンAを生成する。音声パターンAは、パターンマッチング処理部15に出力される。
パターン圧縮部12には、複数の標準パターンB1,B2,B3,…が入力される。各標準パターンB1,B2,B3,…は、各種の単語毎に予め用意されたものである。これらの標準パターンB1,B2,B3,…は圧縮されていない。パターン圧縮部12は、入力された各標準パターンB1,B2,B3,…をそれぞれ時間方向に圧縮する。
その圧縮方法について、図2を用いて説明する。同図において、b,b,b,…,bは任意の標準パターンBxの各特長要素を示している。標準パターンBxは、各特長要素b,b,b,…,bがその順番に時系列に並べられたものである。
パターン圧縮部12では、標準パターンBxを構成する各特長要素b,b,b,…,bについて、それぞれ隣接した特徴要素との距離を求める。そして、距離が予め設定された閾値以下であった場合に、これら隣接した複数の特徴要素を一つの平均特徴要素b′(k=1,2,3,…)に置き換える。この処理により、局所的に複数の特徴要素が平均特徴要素に圧縮される。標準パターンBxの全体にこの処理を施すことにより、圧縮標準パターンB′xが生成される。
図2の例の場合、隣接する特徴要素bとbとの距離が閾値以下であり、これら特徴要素b,bが平均特徴要素b′{b′=(b+b)/2}に置き換えられている。また、隣接する特徴要素b,b及びbの距離が閾値以下であり、これらの特徴要素b,b及びbが平均特徴要素b′{b′=(b+b+b)/3}に置き換えられている。また、隣接する特徴要素bとbとの距離が閾値以下であり、これら特徴要素b,bが平均特徴要素b′{b′=(b+b)/2}に置き換えられている。かくして、標準パターンBx(=b,b,b,…,b)が圧縮標準パターンB′x(=b′,b′,b′,b′,b′)に圧縮される。
圧縮情報生成部13は、前記パターン圧縮部12により圧縮された圧縮標準パターンB′xの特徴要素b′,b′,b′,b′,b′毎の圧縮比n1,n2,n3,n4.n5の系列を圧縮情報Nxとして生成する。本実施の形態では、図2に示すように、圧縮標準パターンB′xの各特徴要素b′,b′,b′,b′,b′が、それぞれ元の標準パターンBxの何個分の特徴要素を代表しているのかを示す値を圧縮比n,n,n,n.nと定義している。
すなわち、圧縮標準パターンB′xの特徴要素b′は、標準パターンBxの特徴要素bだけを代表しているので、圧縮比n1は“1”である。同様に、特徴要素b′は、特徴要素bとbとを代表しているので、圧縮比n2は“2”である。特徴要素b′は、特徴要素bとbとbとを代表しているので、圧縮比n3は“3”である。特徴要素b′は、特徴要素bとbとを代表しているので、圧縮比n4は“2”である。特徴要素b′は、特徴要素bだけを代表しているので、圧縮比n5は“1”である。
かくして、圧縮標準パターンB′xに対する圧縮情報はNxは、“1,2,3,2,1”となる。
記憶部14は、図3に示すように、パターン圧縮部12で圧縮された圧縮標準パターンB′xを、当該圧縮標準パターンに対して圧縮情報生成部13で生成された圧縮情報Nxと関連付けて記憶する。
パターンマッチング処理部15は、図4に示すように、復元部21と、平滑化処理部22と、距離計算部23とを備えている。
復元部21は、記憶部14に記憶されている圧縮標準パターンB′xを、当該圧縮標準パターンB′xと関連付けて記憶されている圧縮情報Nxに基づき伸長して、標準パターンBx1に復元する。例えば図2の例の場合、圧縮標準パターンB′x(b′,b′,b′,b′,b′)に関連する圧縮情報Nx(n,n,n,n.n)は、“1,2,3,2,1”である。
したがって、特徴要素b′は、そのままとなる。特徴要素b′は、隣接する2つの特徴要素b′,b′となる。特徴要素b′は、隣接する3つの特徴要素b′,b′,b′となる。特徴要素b′は、隣接する2つの特徴要素b′,b′となる。特徴要素b′は、そのままとなる。かくして、圧縮標準パターンB′xは、標準パターンBx1(b′,b′,b′,b′,b′,b′,b′,b′,b′)に復元される。
平滑化処理部22は、復元部21で復元された標準パターンBx1に対して低域通過フィルタによる平滑化処理を行う。復元された標準パターンBx1には、圧縮によるノイズが発生している。平滑化処理を施すことによって、この種のノイズを除去できる。
距離計算部23は、音声分析部11を介して入力された音声パターンAと、平滑化処理部22にて平滑化処理された標準パターンBx1とのパターン間距離Gxを、周知の動的計画法により算出する。例えば、前記(3)式に示された漸化式の繰返し演算によってパターン間距離Gxを算出する。
パターンマッチング処理部15では、全ての圧縮標準パターンB′xについて、前記復元部21、平滑化処理部22及び距離計算部23での処理を繰返し実行する。そして、算出されたパターン間距離Gxが最小となる標準パターンBxを求めて、音声パターンAの認識結果Gとして出力する。
このように、本実施の形態のパターンマッチング装置10においては、標準パターンBxを圧縮して圧縮標準パターンB′xを生成する際に、その圧縮標準パターンB′xの特徴要素毎の圧縮比の系列を圧縮情報Nxとして生成している。そして、圧縮標準パターンB′xを、当該圧縮標準パターンB′xに対して生成された圧縮情報Nxと関連付けて記憶部14で記憶している。
音声信号Mが入力されると、音声分析部11により入力音声の特徴要素aが時系列で抽出されて、音声パターンAが生成される。音声パターンAは、パターンマッチング処理部15に出力される。パターンマッチング処理部15では、記憶部14に記憶された全ての圧縮標準パターンB′xに対して、以下のパターンマッチング処理が実行される。
先ず、記憶部14から任意の圧縮標準パターンB′xと、それに関連する圧縮情報Nxとが読み出される。そして、圧縮標準パターンB′xが圧縮情報Nxに基づき伸長されて、標準パターンBx1に復元される。次に、復元された標準パターンBx1に対して平滑化処理が行われる。しかる後、入力された音声パターンAと平滑化処理が施された標準パターンBx1とのパターン間距離Gxが動的計画法により算出される。
こうして、パターンマッチング処理部15では、圧縮標準パターンB′x毎に、音声パターンAとのパターン間距離Gxが算出される。そして、パターン間距離Gxが最小となる標準パターンBxが音声パターンAの認識結果Gとして出力される。
このように、圧縮された標準パターンB′xをそのまま音声パターンAとのパターン間距離の演算に用いるのではなく、圧縮情報Nxで標準パターンBx1に復元してから用いている。したがって、標準パターンBxの圧縮により失われた時間情報が加味されるので、マッチングエラーの発生率が低減される。
次に、第2の実施の形態について説明する。第2の実施の形態は、パターンマッチング処理部15のみが第1の実施の形態と異なる。第2の実施の形態におけるパターンマッチング処理部15の要部構成を図5のブロック図で示す。
パターンマッチング処理部15は、漸化式設定部31と距離計算部32とを備えている。距離計算部32は、音声パターンAと圧縮標準パターンB′xとのパターン間距離Gxを、漸化式設定部31に設定された漸化式の繰返し演算によって算出する。この際、圧縮標準パターンB′xと関連付けられて記憶されている圧縮情報Nxを用いて漸化式の計算を行う。
漸化式設定部31には、次の(4)式に示された漸化式が設定されている。
Figure 0005188563
(4)式において、d(i,j)は、音声パターンAの特徴要素aと圧縮標準パターンB′xの特徴要素b′との要素間距離である。g(i,j)は、音声パターンAと圧縮標準パターンB′xとの要素間累積距離である。nj−1は圧縮情報Nxの要素(圧縮比)である。
上記漸化式(4)の最上段の式は、図6に示すA,B平面上の任意の点(i,j)に対し、左側に隣接する点(i−1,j)との関係を規定している。
同漸化式(4)の最下段の式は、圧縮情報要素nj−1が“1”の場合である。この場合は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)との関係を規定している。
同漸化式(4)の中段の式は、圧縮情報要素nj−1が“1”より大きい場合である。この場合は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)から、さらに特徴要素b′j−1に対応する圧縮情報要素nj−1に従い制限経路長が伸長された点(i−nj−1,j−1)との関係を規定している。
このような漸化式(4)の演算を繰返し行うことによって、圧縮標準パターンB′xの特徴要素b′j−1は、入力パターンAのnj−1個の要素aとの対応が課せられる。したがって、標準パターンBxの圧縮により失われた時間情報が加味されるので、マッチングエラーの発生率が低減される。
同様な効果が得られる漸化式は、上記(4)式に限定されるものではない。例えば、図7に示すように、制限経路長の伸長を、特徴要素b′に対して行う下記(5)式の漸化式を漸化式設定部31に設定してもよい。
Figure 0005188563
あるいは、図8に示すように、制限経路長の伸長を、特徴要素b′とb′j−1との両方に対して行う下記(6)式の漸化式を漸化式設定部31に設定してもよい。
Figure 0005188563
なお、前記各実施の形態では、標準パターンBxを圧縮する際に、近似した複数の特徴要素の平均をとるようにしたが、近似した特徴要素の1つを代表として選択するようにしてもよい。また、コードブックによるクラスタリング手法を用いることも可能である。
また、前記実施の形態では、圧縮情報nXの要素(圧縮比)nをそのまま用いているが、所定の倍率、例えば0.8倍の値を用いてパターン間距離を計算するようにしてもよい。
また、前記実施の形態では、音声のパターン認識分野に適用した場合を示したが、本発明は、文字,図形等のパターン認識分野にも同様に適用できるものである。この他、本発明の要旨を逸脱しない範囲で種々変形実施可能であるのは勿論である。
10…パターンマッチング装置、11…音声分析部、12…パターン圧縮部、13…圧縮情報生成部、14…記憶部、15…パターンマッチング処理部。

Claims (5)

  1. それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置において、
    前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを時間方向に圧縮するパターン圧縮手段と、
    前記パターン圧縮手段により圧縮された圧縮標準パターンの特徴要素毎の、前記圧縮により失われた時間情報に係る圧縮比の系列を圧縮情報として生成する圧縮情報生成手段と、
    前記パターン圧縮手段により圧縮された前記圧縮標準パターンを、当該圧縮標準パターンに対して前記圧縮情報生成手段により生成された前記圧縮情報と関連付けて記憶する記憶手段と、
    前記記憶手段により記憶された前記圧縮標準パターンと前記入力パターンとのパターン間距離を、当該圧縮標準パターンに対して前記圧縮情報生成手段により生成された前記圧縮情報を変数として持つ動的計画法の漸化式によって算出する距離演算手段と、
    を具備したことを特徴とするパターンマッチング装置。
  2. 前記距離演算手段において用いられる漸化式は、
    前記入力パターンの特徴要素aと前記圧縮標準パターンの特徴要素bとの要素間距離をd(i,j)とし、前記入力パターンと前記圧縮標準パターンとの要素間累積距離をg(i,j)とし、前記圧縮比nの系列である圧縮情報をnとすると、
    Figure 0005188563
    で表されることを特徴とする請求項1記載のパターンマッチング装置。
  3. 前記距離演算手段において用いられる漸化式は、
    前記入力パターンの特徴要素aと前記圧縮標準パターンの特徴要素bとの要素間距離をd(i,j)とし、前記入力パターンと前記圧縮標準パターンとの要素間累積距離をg(i,j)とし、前記圧縮比nの系列である圧縮情報をnとすると、
    Figure 0005188563
    で表されることを特徴とする請求項1記載のパターンマッチング装置。
  4. 前記距離演算手段において用いられる漸化式は、
    前記入力パターンの特徴要素aと前記圧縮標準パターンの特徴要素bとの要素間距離をd(i,j)とし、前記入力パターンと前記圧縮標準パターンとの要素間累積距離をg(i,j)とし、前記圧縮比nの系列である圧縮情報をnとすると、
    Figure 0005188563
    で表されることを特徴とする請求項1記載のパターンマッチング装置。
  5. それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置におけるパターンマッチング方法であって、
    前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを時間方向に圧縮する圧縮工程と、
    前記圧縮工程により圧縮された圧縮標準パターンの特徴要素毎の、前記圧縮により失われた時間情報に係る圧縮比の系列を圧縮情報として生成する生成工程と、
    前記圧縮工程で圧縮された前記圧縮標準パターンと前記入力パターンとのパターン間距離を、当該圧縮標準パターンに対して前記生成工程により生成された前記圧縮情報を変数として持つ動的計画法の漸化式によって算出する演算工程と、
    を含むことを特徴とするパターンマッチング方法。
JP2010248442A 2006-10-20 2010-11-05 パターンマッチング装置及び方法 Expired - Fee Related JP5188563B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200610135658.9 2006-10-20
CNB2006101356589A CN100552664C (zh) 2006-10-20 2006-10-20 模式匹配装置以及方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007071480A Division JP2008102482A (ja) 2006-10-20 2007-03-19 パターンマッチング装置及び方法

Publications (2)

Publication Number Publication Date
JP2011022621A JP2011022621A (ja) 2011-02-03
JP5188563B2 true JP5188563B2 (ja) 2013-04-24

Family

ID=39334378

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007071480A Abandoned JP2008102482A (ja) 2006-10-20 2007-03-19 パターンマッチング装置及び方法
JP2010248442A Expired - Fee Related JP5188563B2 (ja) 2006-10-20 2010-11-05 パターンマッチング装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007071480A Abandoned JP2008102482A (ja) 2006-10-20 2007-03-19 パターンマッチング装置及び方法

Country Status (2)

Country Link
JP (2) JP2008102482A (ja)
CN (1) CN100552664C (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918204A (zh) 2014-10-03 2020-11-10 交互数字专利控股公司 用于限制直接发现的方法
KR102240455B1 (ko) * 2019-06-11 2021-04-14 네이버 주식회사 동적 노트 매칭을 위한 전자 장치 및 그의 동작 방법
CN110880315A (zh) * 2019-10-17 2020-03-13 深圳市声希科技有限公司 一种基于音素后验概率的个性化语音和视频生成系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system
JPS59195699A (ja) * 1983-04-21 1984-11-06 三菱電機株式会社 単語音声認識装置
JPS60146300A (ja) * 1984-01-10 1985-08-01 株式会社リコー パタ−ン作成方式
JPS60158498A (ja) * 1984-01-27 1985-08-19 株式会社リコー パターン照合装置
JPS60201398A (ja) * 1984-03-26 1985-10-11 日本電信電話株式会社 連続単語音声認識方式
JPS6170595A (ja) * 1984-09-14 1986-04-11 株式会社リコー 音声認識方式
JPS61129700A (ja) * 1984-11-29 1986-06-17 株式会社リコー 音声認識装置の辞書作成方法
JPH0635494A (ja) * 1992-07-16 1994-02-10 Nec Corp 音声認識装置
KR100324988B1 (ko) * 1994-06-13 2002-08-27 마츠시타 덴끼 산교 가부시키가이샤 신호해석장치
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
US7437398B2 (en) * 2004-07-30 2008-10-14 Intel Corporation Pattern matching architecture

Also Published As

Publication number Publication date
CN101165679A (zh) 2008-04-23
JP2011022621A (ja) 2011-02-03
CN100552664C (zh) 2009-10-21
JP2008102482A (ja) 2008-05-01

Similar Documents

Publication Publication Date Title
TWI682325B (zh) 辨識系統及辨識方法
JP4245617B2 (ja) 特徴量補正装置、特徴量補正方法および特徴量補正プログラム
CN102301419B (zh) 声音识别装置
CN101432799B (zh) 基于高斯混合模型的变换中的软校准
JP3189598B2 (ja) 信号合成方法および信号合成装置
JP5188563B2 (ja) パターンマッチング装置及び方法
CN110335608B (zh) 声纹验证方法、装置、设备及存储介质
JP6453681B2 (ja) 演算装置、演算方法およびプログラム
CN113870860A (zh) 端到端的声纹识别方法和声纹识别装置
JP5994639B2 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
JP6216809B2 (ja) パラメータ調整システム、パラメータ調整方法、プログラム
Liu et al. Detecting adversarial audio via activation quantization error
JP6791816B2 (ja) 音声区間検出装置、音声区間検出方法、およびプログラム
JP2019197149A (ja) ピッチ強調装置、その方法、およびプログラム
KR102363636B1 (ko) 통계적 불확실성 모델링을 활용한 음성 인식 방법 및 장치
JP2019125224A (ja) 境界探索テスト支援装置および境界探索テスト支援方法
CN115798453A (zh) 语音重建方法、装置、计算机设备和存储介质
JP2022072149A (ja) 機械学習プログラム、装置、及び方法
JPWO2009151002A1 (ja) パターン識別方法、装置およびプログラム
JP2021189402A (ja) 音声処理プログラム、音声処理装置及び音声処理方法
JP4242320B2 (ja) 音声認識方法、その装置およびプログラム、その記録媒体
US20230169977A1 (en) Sound Extraction System and Sound Extraction Method
JP3008520B2 (ja) 標準パタン作成装置
JP2985441B2 (ja) 自動採譜分析装置
WO2013145578A1 (ja) 音声処理装置、音声処理方法および音声処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101105

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees