JP2008102482A - パターンマッチング装置及び方法 - Google Patents
パターンマッチング装置及び方法 Download PDFInfo
- Publication number
- JP2008102482A JP2008102482A JP2007071480A JP2007071480A JP2008102482A JP 2008102482 A JP2008102482 A JP 2008102482A JP 2007071480 A JP2007071480 A JP 2007071480A JP 2007071480 A JP2007071480 A JP 2007071480A JP 2008102482 A JP2008102482 A JP 2008102482A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- compression
- standard pattern
- compressed
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Abstract
【課題】標準パターンを圧縮した場合でもマッチングエラーの発生率を低減する。
【解決手段】パターンマッチング装置10は、標準パターンを構成する各特徴要素B1,B2,B3について、パターン圧縮部12で、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮情報生成部13で、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、記憶部14で当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。また、パターンマッチング処理部15で、記憶された圧縮標準パターンを、当該圧縮標準パターンと関連付けて記憶されている圧縮情報に基づき伸長して標準パターンに復元する。そして、復元された標準パターンと入力パターンとのパターン間距離を動的計画法により算出する。
【選択図】 図1
【解決手段】パターンマッチング装置10は、標準パターンを構成する各特徴要素B1,B2,B3について、パターン圧縮部12で、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮情報生成部13で、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、記憶部14で当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。また、パターンマッチング処理部15で、記憶された圧縮標準パターンを、当該圧縮標準パターンと関連付けて記憶されている圧縮情報に基づき伸長して標準パターンに復元する。そして、復元された標準パターンと入力パターンとのパターン間距離を動的計画法により算出する。
【選択図】 図1
Description
本発明は、音声,文字,図形等の入力パターンが、予め想定されている標準パターンのうちのいずれであるかを判定するパターン認識分野で利用されるパターンマッチング装置及び方法に関する。
従来のパターン認識分野では、パターンマッチング方式として動的計画法(Dynamic programming : DP)が広く活用されている(例えば、特許文献1参照)。
(1)式において、i{i=1,2,…,I}は時間を示し、aは音声パターンAの時間iにおける特徴要素を意味している。
(2)式において、j{j=1,2,…,J}は時間を示し、bは音声パターンBの時間jにおける特徴要素を意味している。
パターンマッチング装置では、入力された音声パターンAを、各種単語の標準パターンBとそれぞれ比較してパターン間の距離を求める。そして、最小距離の標準パターンを認識結果として出力する。
実際の音声パターンでは、発話速度の変動に起因して時間軸歪が生じる。動的計画法は、この時間軸歪を整合する手法として極めて有効である。
(3)式において、d(i,j)は、音声パターンAの特徴要素aiと標準パターンBの特徴要素bjとの要素間距離である。g(i,j)は、音声パターンAと標準パターンBとの要素間累積距離である。
パターンマッチング装置では、上記漸化式(3)を繰り返し計算する。そして、図9に示すように、A,B平面でaiとbjとを最適に対応付ける経路(DP−pass)を求める。
上記漸化式(3)の最上段の式は、図10に示すA,B平面上の任意の点(i,j)に対し、下方に隣接する点(i,j−1)との関係を規定している。同漸化式(3)の中段の式は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)との関係を規定している。同漸化式(3)の最下段の式は、点(i,j)に対し、左側に隣接する点(i−1,j)との関係を規定している。
なお、この漸化式(3)から最上段の式を省略することで傾斜制限を加える場合もある。この場合は、任意の点(i,j)に対して図11に示すような関係が規定される。傾斜制限は極端な伸縮を制限するために設けられる。
ところで一般に、パターンマッチングに必要な標準パターンは多数用意される。このため、標準パターンを圧縮することによって、標準パターンを記憶する領域の効率化を図ることが考えられている。標準パターンを圧縮する方法としては、次の方法がある。すなわち、標準パターンを構成する各特徴要素について、それぞれ隣接する特徴要素との差をとる。そして、その差があらかじめ設定された閾値より小さい場合は、隣接した特長要素が近似していると判定する。近似しているものがあった場合には、それらを1つの特徴要素に統合する。かくして、標準パターンが圧縮される。
特開昭50-96104号公報
しかしながら、上述した方法で標準パターンを圧縮した場合、パターン認識に有益な時間情報が消失してしまう。すなわち、隣接する特徴要素が1つに統合されるので、各要素がそれぞれ有していた時間情報の一部が消失する。標準パターンから時間情報の一部が失われると、一般に、マッチングエラー(matching error)が発生し易くなる。特に、ノイズ(noise)の混入により部分的に近似した特徴パターンが数多く認識された場合や、傾斜制限が設けられた場合には、マッチングエラーが顕著に見られる。
本発明は、このような事情に基づいてなされたもので、その目的とするところは、標準パターンを圧縮した場合でもマッチングエラーの発生率を低減することができるパターンマッチング装置及びその方法を提供しようとするものである。
本発明のパターンマッチング装置は、標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって標準パターンを圧縮する。また、圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する。そして、圧縮された圧縮標準パターンを、当該圧縮標準パターンに対して生成された圧縮情報と関連付けて記憶する。また、記憶された圧縮標準パターンを、当該圧縮標準パターンと関連付けて記憶されている圧縮情報に基づき伸長して標準パターンに復元する。そして、復元された標準パターンと入力パターンとのパターン間距離を動的計画法により算出する。
かかる手段を講じた本発明によれば、標準パターンを圧縮した場合でもマッチングエラーの発生率を低減することができるパターンマッチング装置及びその方法を提供できる。
以下、本発明を音声のパターン認識分野に適用した実施の形態について、図面を用いて説明する。はじめに、第1の実施の形態について、図1〜図4を用いて説明する。
図1は本実施の形態に係るパターンマッチング装置10の要部構成を示すブロック図である。パターンマッチング装置10は、音声分析部11,パターン圧縮部12、圧縮情報生成部13、記憶部14及びパターンマッチング処理部15を備えている。
音声分析部11には、音声信号Mが入力される。音声信号Mは、マイクロフォンを通して入力された音声から変換された電気信号である。音声分析部11は、入力された音声信号Mを分析する。そして、入力音声の特徴要素aを時系列で抽出して、前記(1)式で示される音声パターンAを生成する。音声パターンAは、パターンマッチング処理部15に出力される。
パターン圧縮部12には、複数の標準パターンB1,B2,B3,…が入力される。各標準パターンB1,B2,B3,…は、各種の単語毎に予め用意されたものである。これらの標準パターンB1,B2,B3,…は圧縮されていない。パターン圧縮部12は、入力された各標準パターンB1,B2,B3,…をそれぞれ時間方向に圧縮する。
その圧縮方法について、図2を用いて説明する。同図において、b1,b2,b3,…,b9は任意の標準パターンBxの各特長要素を示している。標準パターンBxは、各特長要素b1,b2,b3,…,b9がその順番に時系列に並べられたものである。
パターン圧縮部12では、標準パターンBxを構成する各特長要素b1,b2,b3,…,b9について、それぞれ隣接した特徴要素との距離を求める。そして、距離が予め設定された閾値以下であった場合に、これら隣接した複数の特徴要素を一つの平均特徴要素b′k(k=1,2,3,…)に置き換える。この処理により、局所的に複数の特徴要素が平均特徴要素に圧縮される。標準パターンBxの全体にこの処理を施すことにより、圧縮標準パターンB′xが生成される。
図2の例の場合、隣接する特徴要素b2とb3との距離が閾値以下であり、これら特徴要素b2,b3が平均特徴要素b′2{b′2=(b2+b3)/2}に置き換えられている。また、隣接する特徴要素b4,b5及びb6の距離が閾値以下であり、これらの特徴要素b4,b5及びb6が平均特徴要素b′3{b′3=(b4+b5+b6)/3}に置き換えられている。また、隣接する特徴要素b7とb8との距離が閾値以下であり、これら特徴要素b7,b8が平均特徴要素b′4{b′4=(b7+b8)/2}に置き換えられている。かくして、標準パターンBx(=b1,b2,b3,…,b9)が圧縮標準パターンB′x(=b′1,b′2,b′3,b′4,b′5)に圧縮される。
圧縮情報生成部13は、前記パターン圧縮部12により圧縮された圧縮標準パターンB′xの特徴要素b′1,b′2,b′3,b′4,b′5毎の圧縮比n1,n2,n3,n4.n5の系列を圧縮情報Nxとして生成する。本実施の形態では、図2に示すように、圧縮標準パターンB′xの各特徴要素b′1,b′2,b′3,b′4,b′5が、それぞれ元の標準パターンBxの何個分の特徴要素を代表しているのかを示す値を圧縮比n1,n2,n3,n4.n5と定義している。
すなわち、圧縮標準パターンB′xの特徴要素b′1は、標準パターンBxの特徴要素b1だけを代表しているので、圧縮比n1は“1”である。同様に、特徴要素b′2は、特徴要素b2とb3とを代表しているので、圧縮比n2は“2”である。特徴要素b′3は、特徴要素b4とb5とb6とを代表しているので、圧縮比n3は“3”である。特徴要素b′4は、特徴要素b7とb8とを代表しているので、圧縮比n4は“2”である。特徴要素b′5は、特徴要素b9だけを代表しているので、圧縮比n5は“1”である。
かくして、圧縮標準パターンB′xに対する圧縮情報はNxは、“1,2,3,1,2”となる。
記憶部14は、図3に示すように、パターン圧縮部12で圧縮された圧縮標準パターンB′xを、当該圧縮標準パターンに対して圧縮情報生成部13で生成された圧縮情報Nxと関連付けて記憶する。
パターンマッチング処理部15は、図4に示すように、復元部21と、平滑化処理部22と、距離計算部23とを備えている。
復元部21は、記憶部14に記憶されている圧縮標準パターンB′xを、当該圧縮標準パターンB′xと関連付けて記憶されている圧縮情報Nxに基づき伸長して、標準パターンBx1に復元する。例えば図2の例の場合、圧縮標準パターンB′x(b′1,b′2,b′3,b′4,b′5)に関連する圧縮情報Nx(n1,n2,n3,n4.n5)は、“1,2,3,1,2”である。
したがって、特徴要素b′1は、そのままとなる。特徴要素b′2は、隣接する2つの特徴要素b′2,b′2となる。特徴要素b′3は、隣接する3つの特徴要素b′3,b′3,b′3となる。特徴要素b′4は、隣接する2つの特徴要素b′4,b′4となる。特徴要素b′5は、そのままとなる。かくして、圧縮標準パターンB′xは、標準パターンBx1(b′1,b′2,b′2,b′3,b′3,b′3,b′4,b′4,b′5)に復元される。
平滑化処理部22は、復元部21で復元された標準パターンBx1に対して低域通過フィルタによる平滑化処理を行う。復元された標準パターンBx1には、圧縮によるノイズが発生している。平滑化処理を施すことによって、この種のノイズを除去できる。
距離計算部23は、音声分析部11を介して入力された音声パターンAと、平滑化処理部22にて平滑化処理された標準パターンBx1とのパターン間距離Gxを、周知の動的計画法により算出する。例えば、前記(3)式に示された漸化式の繰返し演算によってパターン間距離Gxを算出する。
パターンマッチング処理部15では、全ての圧縮標準パターンB′xについて、前記復元部21、平滑化処理部22及び距離計算部23での処理を繰返し実行する。そして、算出されたパターン間距離Gxが最小となる標準パターンBx1を求めて、音声パターンAの認識結果Gとして出力する。
このように、本実施の形態のパターンマッチング装置10においては、標準パターンBxを圧縮して圧縮標準パターンB′xを生成する際に、その圧縮標準パターンB′xの特徴要素毎の圧縮比の系列を圧縮情報Nxとして生成している。そして、圧縮標準パターンB′xを、当該圧縮標準パターンB′xに対して生成された圧縮情報Nxと関連付けて記憶部14で記憶している。
音声信号Mが入力されると、音声分析部11により入力音声の特徴要素aが時系列で抽出されて、音声パターンAが生成される。音声パターンAは、パターンマッチング処理部15に出力される。パターンマッチング処理部15では、記憶部14に記憶された全ての圧縮標準パターンB′xに対して、以下のパターンマッチング処理が実行される。
先ず、記憶部14から任意の圧縮標準パターンB′xと、それに関連する圧縮情報Nxとが読み出される。そして、圧縮標準パターンB′xが圧縮情報Nxに基づき伸長されて、標準パターンBx1に復元される。次に、復元された標準パターンBx1に対して平滑化処理が行われる。しかる後、入力された音声パターンAと平滑化処理が施された標準パターンBx1とのパターン間距離Gxが動的計画法により算出される。
こうして、パターンマッチング処理部15では、圧縮標準パターンB′x毎に、音声パターンAとのパターン間距離Gxが算出される。そして、パターン間距離Gxが最小となる標準パターンBx1が音声パターンAの認識結果Gとして出力される。
このように、圧縮された標準パターンB′xをそのまま音声パターンAとのパターン間距離の演算に用いるのではなく、圧縮情報Nxで標準パターンBx1に復元してから用いている。したがって、標準パターンBxの圧縮により失われた時間情報が加味されるので、マッチングエラーの発生率が低減される。
次に、第2の実施の形態について説明する。第2の実施の形態は、パターンマッチング処理部15のみが第1の実施の形態と異なる。第2の実施の形態におけるパターンマッチング処理部15の要部構成を図5のブロック図で示す。
パターンマッチング処理部15は、漸化式設定部31と距離計算部32とを備えている。距離計算部32は、音声パターンAと圧縮標準パターンB′xとのパターン間距離Gxを、漸化式設定部31に設定された漸化式の繰返し演算によって算出する。この際、圧縮標準パターンB′xと関連付けられて記憶されている圧縮情報Nxを用いて漸化式の計算を行う。
(4)式において、d(i,j)は、音声パターンAの特徴要素aiと圧縮標準パターンB′xの特徴要素b′jとの要素間距離である。g(i,j)は、音声パターンAと圧縮標準パターンB′xとの要素間累積距離である。nj−1は圧縮情報Nxの要素(圧縮比)である。
上記漸化式(4)の最上段の式は、図6に示すA,B平面上の任意の点(i,j)に対し、左側に隣接する点(i−1,j)との関係を規定している。
同漸化式(4)の最下段の式は、圧縮情報要素nj−1が“1”の場合である。この場合は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)との関係を規定している。
同漸化式(4)の中段の式は、圧縮情報要素nj−1が“1”より大きい場合である。この場合は、点(i,j)に対し、左斜め下に隣接する点(i−1,j−1)から、さらに特徴要素b′j−1に対応する圧縮情報要素nj−1に従い制限経路長が伸長された点(i−nj−1,j−1)との関係を規定している。
このような漸化式(4)の演算を繰返し行うことによって、圧縮標準パターンB′xの特徴要素b′j−1は、入力パターンAのnj−1個の要素aiとの対応が課せられる。したがって、標準パターンBxの圧縮により失われた時間情報が加味されるので、マッチングエラーの発生率が低減される。
なお、前記各実施の形態では、標準パターンBxを圧縮する際に、近似した複数の特徴要素の平均をとるようにしたが、近似した特徴要素の1つを代表として選択するようにしてもよい。また、コードブックによるクラスタリング手法を用いることも可能である。
また、前記実施の形態では、圧縮情報nXの要素(圧縮比)njをそのまま用いているが、所定の倍率、例えば0.8倍の値を用いてパターン間距離を計算するようにしてもよい。
また、前記実施の形態では、音声のパターン認識分野に適用した場合を示したが、本発明は、文字,図形等のパターン認識分野にも同様に適用できるものである。この他、本発明の要旨を逸脱しない範囲で種々変形実施可能であるのは勿論である。
10…パターンマッチング装置、11…音声分析部、12…パターン圧縮部、13…圧縮情報生成部、14…記憶部、15…パターンマッチング処理部。
Claims (9)
- それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置において、
前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを圧縮するパターン圧縮手段と、
前記パターン圧縮手段により圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する圧縮情報生成手段と、
前記パターン圧縮手段により圧縮された前記圧縮標準パターンを、当該圧縮標準パターンに対して前記圧縮情報生成手段により生成された前記圧縮情報と関連付けて記憶する記憶手段と、
前記記憶手段により記憶された前記圧縮標準パターンを、当該圧縮標準パターンと関連付けて記憶されている前記圧縮情報に基づき伸長して前記標準パターンに復元するパターン復元手段と、
前記パターン復元手段により復元された前記標準パターンと前記入力パターンとのパターン間距離を動的計画法により算出する距離演算手段と、
を具備したことを特徴とするパターンマッチング装置。 - 前記パターン復元手段により復元された標準パターンを平滑化する平滑化処理手段をさらに具備し、
前記距離演算手段は、前記平滑化処理手段により平滑化された標準パターンと前記入力パターンとのパターン間距離を動的計画法により算出することを特徴とする請求項1記載のパターンマッチング装置。 - それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置において、
前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを圧縮するパターン圧縮手段と、
前記パターン圧縮手段により圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する圧縮情報生成手段と、
前記パターン圧縮手段により圧縮された前記圧縮標準パターンを、当該圧縮標準パターンに対して前記圧縮情報生成手段により生成された前記圧縮情報と関連付けて記憶する記憶手段と、
前記記憶手段により記憶された前記圧縮標準パターンと前記入力パターンとのパターン間距離を、当該圧縮標準パターンに対して前記圧縮情報生成手段により生成された前記圧縮情報を変数として持つ動的計画法の漸化式によって算出する距離演算手段と、
を具備したことを特徴とするパターンマッチング装置。 - それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置におけるパターンマッチング方法であって、
前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを圧縮する圧縮工程と、
前記パターン圧縮手段により圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する生成工程と、
前記圧縮工程で圧縮された前記圧縮標準パターンを、当該圧縮標準パターンに対して前記生成工程により生成された前記圧縮情報に基づき伸長して前記標準パターンに復元する復元工程と、
前記復元工程により復元された前記標準パターンと前記入力パターンとのパターン間距離を動的計画法により算出する演算工程と、
を含むことを特徴とするパターンマッチング方法。 - 前記復元工程により復元された標準パターンを平滑化する平滑化工程をさらに含み、
前記演算工程は、前記平滑化工程により平滑化された標準パターンと前記入力パターンとのパターン間距離を動的計画法により算出することを特徴とする請求項7記載のパターンマッチング方法。 - それぞれ特徴要素の時系列で示される標準パターンと入力パターンとのパターン間距離を求め、そのパターン間距離を認識結果として出力するパターンマッチング装置におけるパターンマッチング方法であって、
前記標準パターンを構成する各特徴要素について、隣接する特徴要素と近似しているものを1つの特徴要素に統合することによって前記標準パターンを圧縮する圧縮工程と、
前記パターン圧縮手段により圧縮された圧縮標準パターンの特徴要素毎の圧縮比の系列を圧縮情報として生成する生成工程と、
前記圧縮工程で圧縮された前記圧縮標準パターンと前記入力パターンとのパターン間距離を、当該圧縮標準パターンに対して前記生成工程により生成された前記圧縮情報を変数として持つ動的計画法の漸化式によって算出する演算工程と、
を含むことを特徴とするパターンマッチング方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006101356589A CN100552664C (zh) | 2006-10-20 | 2006-10-20 | 模式匹配装置以及方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010248442A Division JP5188563B2 (ja) | 2006-10-20 | 2010-11-05 | パターンマッチング装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008102482A true JP2008102482A (ja) | 2008-05-01 |
Family
ID=39334378
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007071480A Abandoned JP2008102482A (ja) | 2006-10-20 | 2007-03-19 | パターンマッチング装置及び方法 |
JP2010248442A Expired - Fee Related JP5188563B2 (ja) | 2006-10-20 | 2010-11-05 | パターンマッチング装置及び方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010248442A Expired - Fee Related JP5188563B2 (ja) | 2006-10-20 | 2010-11-05 | パターンマッチング装置及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP2008102482A (ja) |
CN (1) | CN100552664C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020201478A (ja) * | 2019-06-11 | 2020-12-17 | ネイバー コーポレーションNAVER Corporation | 動的ノートマッチングのための電子装置およびその動作方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4075832B1 (en) | 2014-10-03 | 2024-07-10 | InterDigital Patent Holdings, Inc. | Device and method for restricted direct discovery |
CN110880315A (zh) * | 2019-10-17 | 2020-03-13 | 深圳市声希科技有限公司 | 一种基于音素后验概率的个性化语音和视频生成系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5614381A (en) * | 1979-07-13 | 1981-02-12 | Nec Corp | Pattern recognizing system |
JPS60146300A (ja) * | 1984-01-10 | 1985-08-01 | 株式会社リコー | パタ−ン作成方式 |
JPS61129700A (ja) * | 1984-11-29 | 1986-06-17 | 株式会社リコー | 音声認識装置の辞書作成方法 |
JPH0635494A (ja) * | 1992-07-16 | 1994-02-10 | Nec Corp | 音声認識装置 |
JPH09244686A (ja) * | 1996-02-09 | 1997-09-19 | Canon Inc | 情報処理方法及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59195699A (ja) * | 1983-04-21 | 1984-11-06 | 三菱電機株式会社 | 単語音声認識装置 |
JPS60158498A (ja) * | 1984-01-27 | 1985-08-19 | 株式会社リコー | パターン照合装置 |
JPS60201398A (ja) * | 1984-03-26 | 1985-10-11 | 日本電信電話株式会社 | 連続単語音声認識方式 |
JPS6170595A (ja) * | 1984-09-14 | 1986-04-11 | 株式会社リコー | 音声認識方式 |
KR100324988B1 (ko) * | 1994-06-13 | 2002-08-27 | 마츠시타 덴끼 산교 가부시키가이샤 | 신호해석장치 |
US7437398B2 (en) * | 2004-07-30 | 2008-10-14 | Intel Corporation | Pattern matching architecture |
-
2006
- 2006-10-20 CN CNB2006101356589A patent/CN100552664C/zh not_active Expired - Fee Related
-
2007
- 2007-03-19 JP JP2007071480A patent/JP2008102482A/ja not_active Abandoned
-
2010
- 2010-11-05 JP JP2010248442A patent/JP5188563B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5614381A (en) * | 1979-07-13 | 1981-02-12 | Nec Corp | Pattern recognizing system |
JPS60146300A (ja) * | 1984-01-10 | 1985-08-01 | 株式会社リコー | パタ−ン作成方式 |
JPS61129700A (ja) * | 1984-11-29 | 1986-06-17 | 株式会社リコー | 音声認識装置の辞書作成方法 |
JPH0635494A (ja) * | 1992-07-16 | 1994-02-10 | Nec Corp | 音声認識装置 |
JPH09244686A (ja) * | 1996-02-09 | 1997-09-19 | Canon Inc | 情報処理方法及び装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020201478A (ja) * | 2019-06-11 | 2020-12-17 | ネイバー コーポレーションNAVER Corporation | 動的ノートマッチングのための電子装置およびその動作方法 |
US11556585B2 (en) | 2019-06-11 | 2023-01-17 | Naver Corporation | Electronic apparatus for dynamic note matching and operating method of the same |
Also Published As
Publication number | Publication date |
---|---|
CN101165679A (zh) | 2008-04-23 |
JP2011022621A (ja) | 2011-02-03 |
CN100552664C (zh) | 2009-10-21 |
JP5188563B2 (ja) | 2013-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI682325B (zh) | 辨識系統及辨識方法 | |
KR20170030923A (ko) | 음향 모델 생성 장치 및 방법, 음성 인식 장치 및 방법 | |
RU2568278C2 (ru) | Расширение полосы пропускания звукового сигнала нижней полосы | |
JP2007279349A (ja) | 特徴量補正装置、特徴量補正方法および特徴量補正プログラム | |
CN101432799B (zh) | 基于高斯混合模型的变换中的软校准 | |
CN110335608B (zh) | 声纹验证方法、装置、设备及存储介质 | |
JP2019028746A (ja) | ネットワーク係数圧縮装置、ネットワーク係数圧縮方法およびプログラム | |
Chen et al. | Wavmark: Watermarking for audio generation | |
JP5231839B2 (ja) | パターン認識装置及びその方法 | |
JP5188563B2 (ja) | パターンマッチング装置及び方法 | |
JP2006301446A (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
JP2023523763A (ja) | ダイナミックレンジ低減領域においてマルチチャネルオーディオを強調するための方法、装置、及びシステム | |
JP6453681B2 (ja) | 演算装置、演算方法およびプログラム | |
KR102213177B1 (ko) | 로봇에서의 음성인식 장치 및 방법 | |
WO2017037830A1 (ja) | 音声認識装置および音声認識処理方法 | |
WO2019216187A1 (ja) | ピッチ強調装置、その方法、およびプログラム | |
JPWO2008126254A1 (ja) | 話者認識装置、音響モデル更新方法及び音響モデル更新処理プログラム | |
WO2023154527A1 (en) | Text-conditioned speech inpainting | |
JP4586386B2 (ja) | 素片接続型音声合成装置及び方法 | |
CN115798453A (zh) | 语音重建方法、装置、计算机设备和存储介质 | |
JP5701348B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP5862667B2 (ja) | 波形処理装置、波形処理方法および波形処理プログラム | |
JP4741208B2 (ja) | 音声合成用読み上げテキストデータ選択プログラムおよび音声合成用読み上げテキストデータ選択装置 | |
JP6125808B2 (ja) | データ圧縮装置、データ圧縮プログラム、データ圧縮システム、およびデータ圧縮方法 | |
JP3008520B2 (ja) | 標準パタン作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100907 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20101108 |