JP3003276B2

JP3003276B2 - 信号解析装置

Info

Publication number: JP3003276B2
Application number: JP3147440A
Authority: JP
Inventors: 英一坪香
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1991-06-19
Filing date: 1991-06-19
Publication date: 2000-01-24
Anticipated expiration: 2015-01-24
Also published as: JPH04369700A; US5381513A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声認識等のパターン認
識に適用可能な新しいニューラルネットワークを含む時
系列信号解析装置に関する。

【０００２】

【従来の技術】図２は本発明で用いる階層型のニューラ
ルネットワークの一例である。○はユニットと呼ばれる
ものを示している。ユニット間を結ぶ矢線は信号の流れ
る方向を示し、矢線の根元につながっているユニットの
出力に矢線毎に与えられている前記重み係数が乗ぜられ
て矢線の先端部のユニットへの入力となる。ユニットの
横一列の並びは層と呼ばれる。本例は３層からなるニュ
ーラルネットワークを示している。ニューラルネットワ
ークへの入力が直接つながるユニットからなる層は入力
層、その出力がニューラルネットワークからの出力その
ものとなるユニットからなる層は出力層、それら以外の
層は隠れ層または中間層と呼ばれる。本例では、第１層
が入力層、第２層が隠れ層、第３層が出力層と言うこと
になる。各ユニットにおける、入力の総和とその出力と
の関係は、いわゆるシグモイド関数と呼ばれる関数で与
えられる特性を持たせるのが一般的である。図３はシグ
モイド関数の例を示している。通常、入力層はシグモイ
ド関数ではなく、線形関数で与え、入力そのものを伝え
るだけとする場合が多い。

【０００３】このニューラルネットワークに対して、重
み係数を調整することによって、入力層にあるパターン
が入力されたときに、それに対して望ましい出力が出力
層から出力されるようにすることが出来る。例えば、手
書き文字「Ａ」「Ｂ」「Ｃ」を識別する場合を考える。
最も簡単には、各文字を例えば３２×３２の編目で覆
い、編目の各々をニューラルネットワークの入力ユニッ
トに対応させ(従って入力ユニット数は32×32=1024)、
文字の線がかかる編目を１、そうでない編目を０として
前記ニューラルネットワークの入力層の対応する各ユニ
ットに入力する。出力層は３ユニットとする。「Ａ」が
入力された場合は第１ユニットが「１」他のユニットが
「０」、「Ｂ］が入力された場合は第２ユニットが
「１」他のユニットが「０」、「Ｃ］が入力された場合
は第３ユニットが「１」他のユニットが「０」となるよ
うに多数の標本から重み係数を調整しておく。このよう
に準備しておけば、未知入力「Ｘ」が入力されたとき、
値が最大になる出力ユニットに対応する文字として、未
知入力「Ｘ」が「Ａ」「Ｂ」「Ｃ」の何れであるか判定
することが出来る。階層型ニューラルネットワークにお
いては、前記重み係数を多数の訓練パターンから推定す
る方法が存在し、文字認識等の場合は、高い識別率の得
られることが報告されている。

【０００４】

【発明が解決しようとする課題】この例のように、入力
パターンの大きさ（この例では1024ビット）が固定であ
るときは、十分うまく行くが、音声パターンのように時
間軸に伸縮のあるパターンに対しては問題である。音声
の特徴量は、例えば10msec毎に10〜20組程度のパラメー
タに変換されたいわゆる特徴ベクトル系列で表される。
従って、10msec毎に10次元の特徴ベクトルに変換される
ものとすれば、例えば音韻/b/を表す区間は、ある場合
は20フレームであったり、ある場合は30フレームになっ
たりするから、特徴ベクトルの各成分たるパラメータを
ニューラルネットワークの入力ユニットに対応させると
しても、対応するユニット数は20×10=200となったり30
×10=300となったりして一定しない。また、音声は時間
軸に対して非線系な伸縮もあることから、ニューラルネ
ットワークをそのまま音声の識別に用いることにはかな
り問題がある。

【０００５】"静的"なパターンに対して高い識別能力を
持つニューラルネットワークを、音声のような"動的"な
時系列パターンにも適用出来るようにすることを目的と
する。

【０００６】

【課題を解決するための手段】１つ以上の入出力を有す
る複数のユニットが相互に結合され、各々の結合にはそ
こを流れる信号に対して重み付けを行うその結合固有の
荷重係数が定義され、入力の特徴ベクトル系列{y(t)}に
含まれる幾つかのベクトルの各々の成分が入力される入
力ユニット群と、該入力ユニット群に入力された前記ベ
クトルが前記ユニット及び結合を通過することにより変
換され、該変換されたベクトルを出力する出力ユニット
群と、前記入力ユニット群から前記出力ユニット群に至
る径路としてＪ通りの径路を備えたニューラルネットワ
ークと、前記径路をj=1,2,…,Jで区別するとき、これら
径路の各々をその状態に対応させたＨＭＭ（ヒト゛ゥンマルコフ
モテ゛ル (Hidden Markov Model)）とからなる。

【０００７】

【作用】前記ニューラルネットワークにおける前記径路
の選択を前記ＨＭＭの状態に対応させて制御する。

【０００８】

【実施例】本発明は、パターン変換たる階層型ニューラ
ルネットワーク（以後単にＮＮと略記する）に時系列信
号処理能力を導入する方法として、ＮＮの入力層から出
力層に至る径路をＨＭＭの状態に対応させるものであ
る。このことによって時系列に対するＮＮの持つ前記欠
点を排し、ＮＮの持つ"静的"パターンに対する優れたパ
ターン処理能力を"動的"な時系列パターンの処理にまで
拡大することを可能としたものである。

【０００９】従って、本発明の詳細を説明するに先立っ
て、先ず、ＨＭＭについて説明する。

【００１０】本発明は一般の時系列信号に適用可能なも
のであるが、説明の便宜のために、以下、音声認識を例
に説明する。

【００１１】先ずＨＭＭを用いた音声認識装置について
説明する。図４は、ＨＭＭを用いた音声認識装置のブロ
ック図である。３０１は特徴抽出部であって、入力音声
信号をフィルタバンク、フーリエ変換、ＬＰＣ分析等の
周知の方法により、一定時間間隔（フレームと呼ぶ）例
えば 10msec 毎に特徴ベクトルに変換する。従って、入
力音声信号は特徴ベクトルの系列 Y=y(1),y(2),…，y
(T) に変換される。y(t)は時点ｔにおける特徴ベクト
ル、T は前記系列のフレーム数である。３０２はパラメ
ータ推定部であって、訓練データから認識語彙たる各単
語に対応するＨＭＭを作成するものである。即ち、単語
ｖに対応するＨＭＭを作るには、先ず、ＨＭＭの構造
（状態数やそれら状態の間に許される遷移構造）を適当
に定め、然る後、単語ｖを多数回発声して得られた特徴
ベクトル系列から、それら特徴ベクトル系列の発生確率
(密度)が出来るだけ高くなるように、前記モデルにおけ
る状態遷移確率や状態の遷移に伴って発生する特徴ベク
トルの発生確率(密度)を求めるものである。３０３はＨ
ＭＭ記憶部であって、このようにして得られたＨＭＭを
各単語毎に記憶するものである。３０４は尤度計算部で
あって、認識すべき未知入力音声の特徴ベクトル系列に
対し、前記ＨＭＭ記憶部３０３に記憶されているそれぞ
れのモデルのその特徴ベクトル系列に対する尤度を計算
するものである。３０５は比較判定部であって尤度計算
部３０４で得られた前記それぞれのモデルに対する尤度
の最大値を与えるモデルに対応する単語を認識結果とし
て判定するものである。

【００１２】ＨＭＭによる認識は次のようにして行われ
る。即ち、未知入力に対して得られた特徴ベクトル系列
を Y= y(1),y(2),…,y(T)、モデルλ^vにより発生され
るＴの長さの任意の状態系列を X = x(1),x(2),…,x(T)
とするとき、λ^vから特徴ベクトル系列 Y の発生する確
率密度は〔厳密解〕

【００１３】

【数１２】

【００１４】〔近似解〕

【００１５】

【数１３】

【００１６】または、対数をとって

【００１７】

【数１４】

【００１８】で与えられる。ここで、P{Y,X|λ^v} は、
モデルλ^vにおける X,Y の同時確率密度である。

【００１９】従って、例えば、（数１２）を用いれば

【００２０】

【数１５】

【００２１】とするとき、v∧ が認識結果となる。
（数１３）（数１４）を用いるときも同様である。

【００２２】P{Y,X|λ} は（数１２）の場合は、次のよ
うにして求められる。いま、ＨＭＭλ の状態ｊ(j=1〜
J)に対して、状態ｊ毎に、特徴ベクトルyの発生確率密
度 b_j(y)と状態ｉから状態ｊへの遷移確率 a_ijが与
えられているとき、状態系列 X = x(1),x(2),…,x(T+1)
と特徴ベクトル系列 Y=y(1),y(2),…,y(T)のＨＭＭ λ
から発生する同時確率は

【００２３】

【数１６】

【００２４】と定義出来る。ここでa_x(0)x(1)は状態 x
(1)の初期確率である。また、x(T+1)=J+1は最終状態
で、フレームＴの入力後遷移して終了する状態であっ
て、如何なるベクトルも発生しない。

【００２５】この例では入力の特徴ベクトルy(t)をその
まま用いる場合を説明したが、特徴ベクトルy(t)をベク
トル量子化によってラベルに変換する方法もある。即
ち、この場合は、各状態ｊにおいてb_j(y(t))の代わりに
ラベルo(t)の状態ｊにおける発生確率b_j(o(t))を用いる
ことになる。

【００２６】次に、以上に述べたＮＮにＨＭＭを導入し
た、本願発明による新しいモデルについて具体例を挙げ
て説明する。ＮＮは入力パターンをパターン変換するの
に用いられる。如何なるパターンに変換するかは種々考
えられるが、時間的動的特徴を反映させるためには、複
数フレームを同時に入力して適当なパターンに変換する
のが良いと考えられる。即ち、ＮＮの入力ユニットに
は、時刻ｔにおいてy(t-c₁),y(t-c₂),・・・,y(t-c_M) （c_m
≠0）が入力され、ＮＮにおけるＨＭＭの状態ｊに対応
する径路を通過することによってパターン変換器から出
力される値をg_j(t)とするとき、このg_j(t)を用いて入力
パターンＹに対する本モデルの尤度を定義するものであ
る。

【００２７】その１つの方法として本例ではパターン変
換器を予測器として構成する場合について説明する。即
ち、ＮＮの入力ユニットには、時刻ｔにおいてy(t-c₁),
y(t-c₂),・・・,y(t-c_M) （c_mは零でない整数で、c₁＞c₂＞
・・・＞c_Mで、c_m＞0のときは前向き予測、c_m＜0のときは
後向き予測と呼ばれる）が入力され、ＮＮにおけるＨＭ
Ｍの状態ｊに対応する径路を通過することによってパタ
ーン変換器から出力される値g_j(t)を状態ｊにおけるy
(t)の予測値であるとする。このようにすることによっ
て、次のような利点が招来される。

【００２８】時刻ｔ、ＨＭＭの状態ｊにおける観測ベク
トルy(t)の確率密度を正規分布とすれば、通常のＨＭＭ
においては

【００２９】

【数１７】

【００３０】のように表される。ここで、μ_j,Σ_jはそ
れぞれＨＭＭの状態ｊにおける平均ベクトル、および分
散共分散行列である。通常のＨＭＭにおいては、μ_jは
ｔに関わらず一定で、状態ｊの自己ループにおいてy(t)
の出現順序は考慮されない（y(t)の出現順序は尤度に反
映されない）。これが通常のＨＭＭが時系列信号の過渡
的変化特性の記述能力に乏しいと言われる所以である。

【００３１】本例では、このμ_jを状態ｊに対応したy
(t)の予測値g_j(t)に置き換え、μ_j=μ_j(t)=g_j(t)とする
ものである。ＮＮを予測器とすることによって各状態に
対応する音声区間の特徴量の変化傾向が前記予測器の構
成に反映されるので、従来のＨＭＭのもつ前記欠点が除
去できる。ＮＮの重み係数の学習は、教師信号をy(t)と
することによって実行出来る。

【００３２】状態ｊに対応して本ＮＮから出力されるy
(t)の予測値を

【００３３】

【数１８】

【００３４】と表す。ここでh_j(t)は、一般に、h_j(t)=h
(y(t-c₁),…,y(t-c_M);w_j)と表される関数である。w_jは
それを規定するパラメータ集合で、w_jはＨＭＭの状態ｊ
（ＮＮの経路ｊ）に対応する径路群ｊに含まれる重み係
数集合である。

【００３５】この μ_j(t)を前記平均ベクトルμ_jと置き
換えることによって、y(t)の前後のベクトルの出現状況
に応じてその平均ベクトルが可変となり、前記通常のＨ
ＭＭの持つ欠点を排除することが可能となる。状態ｊに
おける予測誤差ベクトルをe_j(t)とすれば、（数１７）
に相当する式は

【００３６】

【数１９】

【００３７】となる。μ_0j は状態ｊ毎に定まるベクト
ルで状態ｊに留まっている間は不変であって、w_jに含ま
せることも可能であるが、ここでは、w_jと分離して取り
扱うこととする。図５(a)は本発明によるＮＮの一例
である。本例においてはy(t-2)とy(t-1)からy(t)を予測
することとし、ＨＭＭのループをもった状態数Ｊを３
（最終状態を含まず）、ＮＮの層数を３、第１層と第２
層の間の重み係数はＨＭＭの最終状態を除いた全状態で
共有し、第２層と第３層の間の重み係数は状態毎に固有
のものであるとする場合である。(b),(c),(d)は、ＮＮ
(a)に対し、それぞれＨＭＭの状態１、状態２、状態３
に対応している場合で、太線で示した径路が各々の状態
に対応して選択されている様子を表したものである。本
例では、出力ユニットが状態に対応する場合を示してい
るが、図６のように入力ユニットが状態に対応するよう
にもできるし、図７のように４層以上の場合は中間層が
状態に対応するようにも構成できる(長方形で囲んだユ
ニット群を通る径路が各々の状態に対応している)。こ
こで注意すべきは、図５、図６は各状態で共有される重
み係数が存在するが、図８(a)(b)(c)(d)等は各状態に対
応する径路は状態に関して共有する重み係数はなく全く
独立であり、同図(e)と等価になるということである。
同図(e)は状態毎に別々のＮＮを定義することに等し
い。音声現象は、区間毎に完全に分離したものではない
から、状態が変われば完全に予測器を切り替えるのでは
なく、状態間である程度共有部分をもたせる方がより現
実に即していると考えられる。

【００３８】図１(f),(l),(m),(n)は本発明のＮＮの他
の実施例であって、３層で、ＨＭＭのループを有する状
態数が５の場合を示している。本図では、表記の簡単の
ために、各層のユニット群は長方形で示し、ＨＭＭの各
状態に対応する径路群は斜線や網点で区別して示してい
る。

【００３９】(f),(n)は第２層と第３層の間の重み係数
も相隣る状態間で共有する場合、(l)，(m)は第２層と第
３層の間の重み係数は状態間で独立な場合である。ま
た、(f),(l)は第１層と第２層の間の重み係数を相隣る
状態間で半分づつ共有する構造で、両端の状態を除いて
は第１層と第２層の間の重み係数は必ず２つの状態で共
有される場合で、(m),(n)は第１層と第２層の間の重み
係数が相隣る状態間で共有する部分と独立な部分を有す
る場合である。

【００４０】図９は４層の他の実施例を示している。４
層のモデルの場合は、１層目と２層目、２層目と３層目
の間は状態毎に共有していて、２層目と３層目の間の重
み係数は状態毎に分離しているとか、その逆に１層目と
２層目、２層目と３層目の間は状態毎に分離していて、
２層目と３層目の間の重み係数は状態間で共有している
場合等、この場合は更に多くの径路の設定法が考えられ
る。図７、図９はその例である。さらに、ある状態同士
は共有する重み係数はあるが、他の状態同士では全く独
立していると言うようにも構成できることは勿論であ
る。

【００４１】以上のように、本発明は、ＨＭＭを組み込
むことによって階層型ニューラルネットワークによる時
系列信号処理を可能としたものであると言える。従っ
て、以後、このモデルを、ヒト゛ゥンマルコフト゛リフ゛ンニューラルネッ
トワークモテ゛ル (Hidden Markov driven Neural Network mod
el) 略してＨＭＮＮと呼ぶことにする。

【００４２】ＨＭＭの一般的問題は、１）観測時系列パターン{y(t)}に対するＨＭＭ λの尤
度を求めること２）カテゴリｖに対応するＨＭＭのパラメータλ^vを多
数の標本（訓練）パターンから推定すること３）ＨＭＭ λの観測時系列パターン{y(t)}に対応する
最適な状態系列を求めることがある。単語音声認識の場合は、１）は、認識方法に関
係し、各単語毎に定義されているＨＭＭの何れが観測
（入力）ベクトル系列{y(t)}を発生させる可能性が高い
かを求める問題、２）は認識に先立って各単語毎にそれ
に対応するモデルを作成する問題、３）は入力音声を音
韻毎に区切る場合やViterbiアルゴリズムを用いてモデ
ルを作成する際に生ずる問題である。

【００４３】そこで、本発明を実現する上での問題は、
前述の構造を持つ本発明になるＨＭＮＮに対して、上記
諸問題を解く方法を与えることが必要となる。

【００４４】図１０は本発明の原理を説明する原理図で
ある。同図を用いて上記問題の解決法を説明する。ｎ単
語の認識の場合は本図のようなモデルが各単語に対応し
てｎ種類あると言うことになる。ある単語に対して本モ
デルを特徴付けるパラメータの集合をλとすれば、λ =
（A，{μ_0j}，{Σ_j}，w）である。ただし、A=[a_ij]は第
ｉ行第ｊ列の要素をa_ijとする遷移マトリクス、{μ_0j},
{Σ_j},wは、それぞれ{μ_j0}={μ₀₁,…,μ_0J}、{Σ_j}=
{Σ₁,…,Σ_J}、w はＨＭＮＮの重み係数集合とし、w_iを
状態ｉに対応する径路群に含まれる重み係数集合とする
とき、i≠jのとき、w_iとw_jには一般に共通の元が存在す
る可能性がある。

【００４５】９０１は予測器で、観測ベクトル系列{y
(t)}における特徴ベクトルy(t)に対して、その周辺のベ
クトルy(t-c₁),…,y(t-c_m),…,y(t-c_M)が入力され、y
(t)のＪ種類の予測値がＮＮのＪ通りの信号径路に従っ
て出力され、信号径路ｊを通った場合の予測値μ_j(t)=g
_j(t)=μ_j0+h_j(t)が予測器から出力される。y(t)の次元
をｄとすれば、ニューラルネットの出力もｄ次元で、各
々の成分を一つ一つの出力端子に割り当てることになる
から、前記各々の状態に対応する出力端子群の端子数は
ｄ個である。

【００４６】ただし、後に述べるように、状態によって
異なった出力ユニット群が割り当てられる場合と、出力
ユニット群が全てあるいは一部の状態に対して共通に割
り当てられる場合がある。後者の場合も図面の上では、
状態毎に分離した形で描いてある。予測器ｊに得られる
予測値は、観測特徴ベクトル系列の第ｊ部分区間の特徴
ベクトル系列に対する予測の結果得られるものである。

【００４７】９０２は格子グラフであって横軸は入力フ
レーム番号、縦軸は予測回路網の各径路群に対応付けら
れており、本格子グラフの格子点(t,j)によって入力フレ
ームｔとＮＮの信号径路群ｊとの対応付けが表現され
る。

【００４８】９０３はマルコフ連鎖であって、各状態は
前記予測回路網のそれぞれの信号径路群に対応してい
る。

【００４９】先ず、上記１）の問題を解くと言うことを
本図を用いて説明すると次のようになる。

【００５０】問題は、格子点(t,j)におけるy(t)とμ
_j(t)との予測誤差ベクトル e_j(t)の確からしさをb_j(y
(t))とするとき、マルコフ連鎖９０３で規定される遷移
条件で入力フレームと予測回路網出力端子との対応関係
を定め、この対応によってマルコフ連鎖９０３の遷移確
率から計算される格子グラフ上の径路の発生確率P{X|
λ}と、格子点に対して計算される前記b_j(y(t))から計
算されるその径路に沿う観測ベクトル系列の発生確率密
度P{Y|X,λ}から、本モデルλから観測系列 {y(t)}の生
ずる確からしさp(λ)=P{X|λ}P{Y|X,λ}を計算すること
である。式で書けば（数２０）のようになる。ただし、
x(T+1)=J+1であって、状態Ｊ＋１はいわゆる吸収状態
で、他の状態から遷移はするが他の状態に遷移はせず、
ベクトルは観測されないとする。また、t=1で状態ｊに
ある確率をπ_jとするとき、一般には、a_x _(0)x(1)=π
_x(1)であるが、本例では、x(1)=1が必ず成立するとし、
a_x(0)x(1)=1、a_x(0)x( _j)=0 (j≠1のとき)であるとす
る。

【００５１】

【数２０】

【００５２】ここで、マルコフ連鎖９０３に対応する径
路の制限条件は図１０の格子グラフ上に太線で示したも
のとなる。即ち、状態ｊの１つ前（１フレーム前）に取
り得る状態は、この場合はj,j-1,j-2の何れかであるか
ら、格子グラフ上では格子点(t,j)を通る径路で、(t,j)
の１つ前の格子点は(t-1,j),(t-1,j-1),(t-1,j-2)の何
れかである。

【００５３】（数２０）は、厳密解を与えるものである
が、近似解として次式（数２１）が用いられ得る。

【００５４】

【数２１】

【００５５】（数２０）はいわゆるForwardあるいはBac
kwardアルゴリズムによって計算することが出来る。次
にこれを説明する。先ず、Forwardアルゴリズムによる
場合は次のようになる。

【００５６】

【数２２】

【００５７】とすれば、

【００５８】

【数２３】

【００５９】となる。本例の場合は

【００６０】

【数２４】

【００６１】である。従って、

【００６２】

【数２５】

【００６３】を初期値としてt=2,…,T，j=1,…,Jについ
て（数２４）を漸化的に計算することによって

【００６４】

【数２６】

【００６５】として求められる。Backwardアルゴリズム
による場合は次のようになる。

【００６６】

【数２７】

【００６７】とすれば、

【００６８】

【数２８】

【００６９】本例の場合は

【００７０】

【数２９】

【００７１】である。従って、

【００７２】

【数３０】

【００７３】を初期値として t=T-1,…,1，j=J,…,1 に
ついて（数２９）を漸化的に計算することによって

【００７４】

【数３１】

【００７５】として求められる。α_j(t)とβ_i(t)には次
の関係がある。

【００７６】

【数３２】

【００７７】次に（数２１）に基づく近似解を求める。
この場合は動的計画法によって効率的に計算する、いわ
ゆるViterbi アルゴリズムが適用できる。対数をとって
積を和の形にして計算するのが普通であるので以下では
そのようにする場合について説明する。

【００７８】（数２１）において両辺の対数をとれば次
式が得られる。

【００７９】

【数３３】

【００８０】いま、

【００８１】

【数３４】

【００８２】とおけば、次の漸化式が成り立つ。

【００８３】

【数３５】

【００８４】特に、本例の場合は

【００８５】

【数３６】

【００８６】となる。但し、初期値は

【００８７】

【数３７】

【００８８】であって、漸化式（数３６）をt=2,…,T，
j=1,…,J+1について順次計算することによって次式が得
られる。

【００８９】

【数３８】

【００９０】以上の原理に基づいて単語認識を行う場合
の実施例は図１１のようになる。ＨＭＮＮ記憶部１００
３は図４のＨＭＭ記憶部３０３に、尤度計算部１００４
は図４の尤度計算部３０４に対応し、ＨＭＮＮ記憶部１
００３におけるＨＭＮＮｖは、単語ｖに対応するＨＭＮ
Ｎを記憶し、尤度計算部１００４は尤度を前記（数２
６）、（数３１）、（数３８）の何れかで定義すると
き、各々に対して（数２４）、（数２９）、（数３６）
を計算するものである。１１０１、１００２、１００５
は図４における３０１、３０２、３０５と同様の動作を
する。

【００９１】単語ｖに対応するＨＭＮＮを学習する方法
について述べる（前記ＨＭＭの一般的問題の２））。

【００９２】問題は、単語ｖについて準備されたr=1〜R
の訓練パターンに対して尤度関数（確率密度）P{Y⁽¹⁾,Y
⁽²⁾,…,Y^(R)|λ}を最大にするパラメータλを推定する
ことである。以後、第ｒの訓練パターンに関係する量は
必要に応じて右肩に(r)を付して表記することとする。

【００９３】Y^(r)がｒに関して互いに独立であるとすれ
ば

【００９４】

【数３９】

【００９５】が成立する。ここで、次の補助関数Q(λ,
λ')を定義する。

【００９６】

【数４０】

【００９７】このとき、次のことが言える。「Q(λ,
λ')≧Q(λ,λ)が成立すれば、P{Y⁽¹⁾,…,Y^(R)|λ'}≧P
{Y⁽¹⁾,…,Y^(R)|λ}であって、等号はλ'=λの時に成り
立つ。」故に、

【００９８】

【数４１】

【００９９】を求めることが出来れば、λ"→λとして
（数４１）を繰り返し適用することにより、λはP
{Y⁽¹⁾,…,Y^(R)|λ}の停留点、即ち、P{Y⁽¹⁾,…,Y^(R)|
λ} の極大値または鞍点を与える点に収束し、P{Y⁽¹⁾,
…,Y^(R)|λ} の改善率が予め定めた閾値以下になるまで
この操作を繰り返すことにより局所最適解が得られる。

【０１００】次にその具体的方法を説明する。（数４
０）を変形すれば、次式が得られる。

【０１０１】

【数４２】

【０１０２】前述の説明に従えば、Q(λ,λ')をλ'の関
数と見なしてQ(λ,λ')＞Q(λ,λ)なるλ'を見出せば、
それはλの更新されたものとなるが、P{Y⁽¹⁾,…,Y^(R)|
λ}はλ'に関しては一定値となり、Q(λ,λ')＞Q(λ,
λ)となるλ'を探索する場合、これは定数であるから省
略し、ここでは改めて

【０１０３】

【数４３】

【０１０４】とおくことにする。ただし、C^(r)=1/P{Y
^(r)|λ}とおいている。図１２はパラメータ推定の第
１、第２の実施例を説明する図である。図１３、図１４
はその処理手順の詳細を示す図である。以下、これら図
面に従って説明する。

【０１０５】パラメータの推定は多数の訓練パターンか
ら反復計算を行うことによって実行される。図１２はそ
の一実施例である。

【０１０６】特徴抽出部１１０１は図４における特徴抽
出部３０１と同一のものである。訓練パターン記憶部１
１０２はＨＭＮＮのパラメータを推定するＲ種類の訓練
パターンを記憶する部分である。

【０１０７】部分尤度算出部１１０３は以後のステップ
におけるパラメータの推定値を算出するために用いる諸
量を計算する部分である。

【０１０８】パラメータ記憶部１１０４は前記反復計算
の都度更新されたパラメータを記憶する部分である。

【０１０９】遷移確率推定部１１０５は遷移確率a_ijの
再推定値をi=1,…,J，j=1,…,J+1について計算する部分
である。

【０１１０】確率分布パラメータ推定部１１０６は予測
誤差ベクトルe_j(t)の確率分布の形を規定するパラメー
タμ_0j,Σ_jの再推定値をi=1,…,J，j=1,…,J+1について
算出する部分である。

【０１１１】重み係数推定部１１０７は本発明モデルを
構成するＮＮの重み係数wの再推定値を計算する部分で
ある。

【０１１２】前記遷移確率a_ijの再推定値は、他のパラ
メータμ_0j',Σ_j',w'とは独立して計算できる。

【０１１３】μ_0j,Σ_jの再推定値はw'を固定すれば、μ
_0j,Σ_jに関する推定式を連立させて求めることが出来
る。

【０１１４】wの再推定値はμ_0j',Σ_j'を固定し、階層
型ＮＮの重み係数を推定する方法として知られているい
わゆるバックプロパゲーション法の適用によっ計算でき
る。このバックプロパゲーション法には２通りの方法が
ある（第１、第２の実施例として後述）。

【０１１５】μ_0j,Σ_j,wの再推定値はμ_0j',Σ_j',w'に
関する連立方程式を解くことによって得られるものであ
るが、解析的にこれを行うのは困難であるから、前記の
ごとくμ_0j,Σ_jの推定とwの推定を、一方を固定して、
予め定めた収束条件が満足されるまで交互に行うもので
ある。

【０１１６】以上のようにして得られた再推定値は、次
の反復計算に備えてパラメータ記憶部１１０４に記憶さ
れる。

【０１１７】以上の各パラメータの再推定値の計算が予
め定めた収束条件が満足されるまで繰り返され、最終的
な推定値がパラメータ記憶部１１０４に記憶されること
になる。前記収束条件としては、部分尤度算出部１１０
３におけるα^(r) _J+1(T^(r)+1)から L(λ)=Σ_r{log α
^(r) _J+1(T^(r)+1)} を算出し、前記反復計算の都度L(λ)
の改善比率を計算し、これが予め定めた閾値以下になっ
た時点で収束したと判定する等が可能である。

【０１１８】図１３、図１４は図１２のシステムの処理
手順を説明する図である。本実施例をソフトウェアで実
現する場合はこの手順によることが出来る。

【０１１９】図１３は第１の実施例である。ステップ１
２０１はパラメータλを初期化する部分である。

【０１２０】ステップ１２０２は目的関数値を初期化す
る部分である。ステップ１２０３において、

【０１２１】

【数４４】

【０１２２】であって、同ステップ以降のステップのパ
ラメータの逐次近似の各反復計算において、前記目的関
数の改善率を閾値ε₁と比較し、この改善率がε₁以下に
なれば収束したとしてその時の値をパラメータλの推定
値とし、この改善率がε₁以上の時はこの反復計算を続
行するという制御をする部分である。

【０１２３】ステップ１２０４は次の反復計算における
ステップ１２０３での評価に備えてL1をL(λ)に書き換
えるステップである。

【０１２４】ステップ１２０５は遷移確率行列A を推定
する部分である（推定値A∧）。ステップ１２０６は逐
次近似によりλ'からＡを除いたパラメータを推定する
反復計算に際して初期化する部分である。即ち、Aの再
推定式にはζ'=[{μ_0j'},{Σ_j'},w']は含まれないか
ら、A の再推定はステップ１２０５で単独に可能である
のに対し、{μ_0j'},{Σ_j'},w'は互いに再推定式に含ま
れるのでその解は連立方程式を解くことになるが、解析
的には求められないからこの計算も逐次的に求めるもの
である。

【０１２５】ステップ１２０７はζ'に関して、同ステ
ップ以降のステップの前記パラメータの逐次近似の各反
復計算において、目的関数Q(λ,λ')の改善率を閾値ε₂
と比較し、この改善率がε₂ 以下になれば収束したとし
てその時の値をパラメータζ'の推定値とし、この改善
率がε₂ 以上の時はこの反復計算を続行するという制御
をする部分である。

【０１２６】ステップ１２０８は次の反復計算における
ステップ１２０７での評価に備えてL2をQ(λ,λ')に書
き換えるステップである。

【０１２７】ステップ１２０９は {μ_0j'},{Σ_j'}の再
推定値を求める部分であって、同ステップにおける{μ
_0j'}{Σ_j'}に関する連立方程式を解くことによって得ら
れる。ステップ１２１０はステップ１２０９で得られ
た解をλ'における {μ_j0'},{Σ_j'}として書き換える部
分である。

【０１２８】ステップ１２１１〜１２１４はＮＮの重み
係数を推定するいわゆるバックプロパゲーションと呼ば
れる方法を実行している部分である。

【０１２９】ステップ１２１１はw'に関して、同ステッ
プ以降のステップの前記パラメータの逐次近似の各反復
計算において、目的関数Q(λ,λ') の改善率を閾値ε₃
と比較し、この改善率がε₃以下になれば収束したとし
てその時の値をパラメータwの推定値とし、この改善率
がε₃ 以上の時はこの反復計算を続行するという制御を
する部分である。

【０１３０】ステップ１２１２は次の反復計算における
ステップ１２１１での評価に備えてL3をQ(λ,λ') に書
き換えるステップである。

【０１３１】ステップ１２１３はQ(λ,λ')をw'の関数
とみなして、Q(λ,λ')をw'に関して増加させるΔw'を
求める部分である。

【０１３２】ステップ１２１４は w'をw'+Δw'に更新す
る部分である。ステップ１２１５はλ全体を通しての各
反復においてλ=[A∧,{μ_0j'},{Σ_j'},w']とするもので
ある。このλを用いてステップ１２０３の評価結果に応
じて更に反復を繰り返すか否かを決定する。改善率がε
₁以下になるとその時のλが最後の推定値とされる。

【０１３３】図１４は第２の実施例である。図１３のス
テップ１２１２〜１２１４に対する別解であって、図１
３においては、モデル作成のための訓練パターンをすべ
て提示する毎に重み係数の修正を１回行うものである
が、図１４においては、訓練パターンを１つ提示する毎
に重み係数の修正を１回行うものである。従って図１３
の場合は、重み係数の修正は必ず Q(λ,λ')を増加させ
る方向に行われるが、図１４の場合は必ずしもそうはな
らず、確率的に最終的には Q(λ,λ')を増加させる方向
に修正されることになる。この場合は、

【０１３４】

【数４５】

【０１３５】とおけば、パラメータの推定の手順は次の
ようになる。ここで、前記Q(λ,λ')とQ^(r)(λ,λ')は
次の関係がある。

【０１３６】

【数４６】

【０１３７】ステップ１２１６はステップ１２１２と同
様な目的で同様な操作を行う部分である。

【０１３８】ステップ１２１７は学習すべきパタンを順
次提示するよう制御する部分である。

【０１３９】ステップ１２１８はQ^(r)(λ,λ')を w'の
関数とみなして、Q^(r)(λ,λ')を w'に関して増加させ
るΔw'を求める部分である。

【０１４０】ステップ１２１９はw'を更新する部分であ
る。ステップ１２２０は、r=1,・・・,Rについて反復計算
をさらに繰り返すべきか否かをステップ１２１１にて判
定するために、Q(λ,λ')をQ^(R)(λ,λ')とみなす部分
である。

【０１４１】次に以上の各ステップにおいて具体的に行
うべき計算方法を説明する。（数４３）は次のようにな
る。

【０１４２】

【数４７】

【０１４３】ここで

【０１４４】

【数４８】

【０１４５】

【数４９】

【０１４６】とおけば、次式が成り立つ。

【０１４７】

【数５０】

【０１４８】

【数５１】

【０１４９】ただし、

【０１５０】

【数５２】

【０１５１】である。遷移確率a_ijの推定（数５０）から（数５３）が得られる。

【０１５２】

【数５３】

【０１５３】ラグランジュの未定乗数法により、（数５
３）を用いて

【０１５４】

【数５４】

【０１５５】より、

【０１５６】

【数５５】

【０１５７】であるから、両辺にa_ij'を掛けて、j=1〜J
+1について総和を取れば、

【０１５８】

【数５６】

【０１５９】となる。故にa_ijの再推定値は

【０１６０】

【数５７】

【０１６１】となる。ξ^(r) _ij(t)=P{Y,x^(r)(t-1)=i,x
^(r)(t)=j|λ}は前記α、βを用いて次のようにして求め
られる。

【０１６２】

【数５８】

【０１６３】従って、α，βとしてパラメータλに適当
な初期値を与え、t=2〜T^(r)、j=1〜Jについて（数２
３）に従ってα^(r) _j(t)を、t=T^(r)-1〜1、i=J〜1につい
て（数２８）に従ってβ^(r) _i(t)をそれぞれ漸化的に順
次計算して行けば、（数５８）が計算できる。b_j(y)のパラメータの推定 b_j(y)は従来のＨＭＭにおいては特徴ベクトルyの状態ｊ
における確率密度として定義されるのが普通であった。

【０１６４】本発明は、入力音声信号の時刻ｔにおける
特徴ベクトルy(t)に対する予測値を各状態に対応したユ
ニット群に出力するネットワークを備えたことを特徴と
するＨＭＭであって、状態ｊに対応するユニット群の出
力には、予測値μ_j(t)を得、その予測誤差e_j(t)=y(t)-
μ_j(t)の確率密度をb_j(y(t))とするもので、このとき
（数５１）から

【０１６５】

【数５９】

【０１６６】を解くことになる。例えば、y(t-c₁),y(t-
c₂),…,y(t-c_M) (c_kは零でない整数)からy(t)を予測す
るものとし、この予測誤差が正規分布で与えられ、y(t)
の次元をｄとすれば、

【０１６７】

【数６０】

【０１６８】即ち、

【０１６９】

【数６１】

【０１７０】から、次のようにして再推定式が導かれ
る。（ａ）μ_j0の推定（数６１）より

【０１７１】

【数６２】

【０１７２】に注意すれば、∂Q(λ,λ')／∂μ_j0'= 0
よりμ_j0の再推定式は

【０１７３】

【数６３】

【０１７４】（ｂ）分散共分散行列Σ_jの推定同様に∂Q(λ,λ')／∂Σ_j'= 0 よりΣ_jの再推定式は

【０１７５】

【数６４】

【０１７６】（Ｃ）重み係数wの推定ステップ１２１１〜１２１４を用いる場合は次のように
なる。

【０１７７】状態毎に予測器が独立している場合は、状
態ｊにおける重み係数集合をw_jとするとき、状態ｊにお
ける重み係数の再推定値は、ｊ毎にQ(λ,λ')を最大化
するw _j'として誤差逆伝播法で計算すれば良かった。こ
れは、Q(λ,λ') を目的関数とする非線形計画問題であ
って、何回目かの反復計算における重み係数をw_j'とす
るとき、何等かの方法によって修正量Δw_j'を決定し、w
_j'= w_j'+Δw_j'を求めるという操作を繰り返すことによ
り、求むべき再推定値w_j ^-を得る。

【０１７８】Δw_j'の算出に当たっては、非線形計画問
題の分野で開発されている様々な方法を用いることが出
来るが、最も単純には

【０１７９】

【数６５】

【０１８０】とすることが出来る。ここにεは適当に選
ばれた小さな正数である。ＨＭＮＮは、予測器は状態毎
に独立ではなく、状態間で共有される重み係数が存在す
る。従って、状態毎にΔw_j'を個別に求めるのではな
く、推定すべき重み係数の属する径路群全てに渡って同
時に計算される。

【０１８１】先ず、次なる諸量を定義する。 w^u-1 _mn：第u-1層の第mユニットから、第u層の第nユニッ
トまでの径路に沿う重み係数。 i^(r) _j ^u _n(t)：観測系列Y^(r)において、径路群ｊが選ばれ
たときの、時点ｔにおける第u層の第ｎユニットへの入
力。 o^(r) _j ^u _m(t)：観測系列Y^(r)において、径路群ｊが選ばれ
たときの、時点ｔにおける第u層の第ｍユニットからの
出力。 z^(r) _j ^u _n(t)：z^(r) _j ^u _n(t)= ∂h^(r) _j(t)/∂i^(r) _j ^u _n(t)
（ｄ次元ベクトル） S^u _mn：重み係数w^u _mnを共有する径路群の集合。 q^(r) _j ^u _m(t)：q^(r) _j ^u _m(t) = ∂o^(r) _j ^u _m(t)/∂i
^(r) _j ^u _m(t)。

【０１８２】各ユニットの入出力特性をf(θ)=2/{1+exp
(-θ)}-1とすれば、

【０１８３】

【数６６】

【０１８４】である。このとき、（数６５）に相当する
式は、要素毎に書けば、

【０１８５】

【数６７】

【０１８６】となる。ｊ∈S^u-1 _mnとすれば、

【０１８７】

【数６８】

【０１８８】であって、

【０１８９】

【数６９】

【０１９０】であるから、(数７３)を(数７２)に代入し
て次式を得る。

【０１９１】

【数７０】

【０１９２】また、z^(r) _j ^u _n(t)について（数７２）（数
７４）（数７５）が成立する。ただし、最終層をUとす
る。 u≠U の場合：

【０１９３】

【数７１】

【０１９４】から

【０１９５】

【数７２】

【０１９６】u=U の場合：図１(l)(m)のように、出力ユ
ニットを各状態で共有しているときは、状態ｊに対応す
る出力ユニット群の出力はh^(r) _j(t)であるから、h
^(r) _j(t)^*=(h^(r) _j1(t)，・・・，h^(r) _jd(t))とおけば、

【０１９７】

【数７３】

【０１９８】である。故に

【０１９９】

【数７４】

【０２００】である。同図(f)(n)のようにh^(r) _j(t)を出
力するユニット群が状態毎に分離しているときは、

【０２０１】

【数７５】

【０２０２】となる。以上のことから、前記ニューラル
ネットワークの構造に従って（数７４）または（数７
５）を先ず計算し、（数７２）（数７０）（数６７）を
u=U,U-1,・・・,1について、m,nのあらゆる組合せに関して
順次計算すれば、Δw'が得られる。

【０２０３】以上はフォワート゛・ハ゛ックワート゛(Forward-Backwar
d)法による推定であったが、訓練データが大量にある場
合はViterbi法によってより簡単にパラメータの推定が
出来る。図１５はヒ゛ターヒ゛(Viterbi)法によるパラメータ
推定の実施例である。この場合もバックプロパゲーショ
ン法には２通りの方法がある（第３、第４の実施例とし
て後述）。

【０２０４】これは、モデルλの、Y^(r)に対して最大の
尤度を与える状態系列をX^(r)∧とするとき、

【０２０５】

【数７６】

【０２０６】とおき、L(λ)を最大化するパラメータλ
を求めるものである。（数７６）は次のように書ける。

【０２０７】

【数７７】

【０２０８】そこで

【０２０９】

【数７８】

【０２１０】とおけば、

【０２１１】

【数７９】

【０２１２】

【数８０】

【０２１３】ここで、n^(r) _ijは径路X^(r)∧が状態i,jを
通過する回数である。図１５はこの場合のパラメータ推
定の実施例である。

【０２１４】特徴抽出部１３０１、訓練パターン記憶部
１３０２はそれぞれ図１２の特徴抽出部１１０１、訓練
パターン記憶部１１０２と全く同様である。

【０２１５】セグメンテーション・尤度算出部１３０３
はパラメータ記憶部１３０４に記憶されているパラメー
タを基にして、（数３６）の漸化式を計算し、（数３
８）により訓練パターン記憶部１４０２に記憶されてい
るr=1,…,Rのそれぞれについて第ｒの訓練パターンY^(r)
に対するlog p^(r)(λ)を計算すると共に、このlog p^(r)
(λ)を与える最適径路、即ち、各状態に対応する入力フ
レームを求める部分である。

【０２１６】パラメータ記憶部１３０４は前記反復計算
の都度更新されたパラメータを記憶する部分である。

【０２１７】遷移回数算出部１３０５は、r=1,…,Rの訓
練パターンｒに対して、i=1,…,J，j=1,…,J+1について
状態ｉからｊに遷移する回数n^(r) _ij、状態ｊに対応する
フレーム数n^(r) _jを算出する部分である。これはセグメ
ンテーション及び尤度算出部１３０３における結果から
算出される。

【０２１８】遷移確率推定部１３０６は遷移回数算出部
１３０３の結果から遷移確率a_ij (i=1,…,J, j=1,…,J+
1)を求める部分である。

【０２１９】確率分布パラメータ推定部１３０７は予測
誤差ベクトルe_j(t)の確率分布の形を規定するパラメー
タμ_j0,Σ_jの再推定値をi=1,…,J，j=1,…,J+1について
算出する部分であって、セグメンテーション・尤度算出
部１３０３において得られる各状態に対応する特徴ベク
トルと、遷移回数算出部１３０５で得られるn^(r) _jを用
いてこれらのパラメータを算出する部分である。

【０２２０】重み係数推定部１３０８は、本発明モデル
を構成するＮＮの重み係数wの再推定値を計算する部分
であって、セグメンテーション及び尤度算出部１３０３
において得られる各状態に対応する特徴ベクトルと、遷
移回数算出部１３０５で得られるn^(r) _jを用いてこれら
の重み係数を算出する部分である。

【０２２１】この場合も前記フォワート゛・ハ゛ックワート゛(Forward-
Backward)法による場合と同様に次のことが言える。

【０２２２】前記遷移確率a_ijの再推定値は、他のパラ
メータμ_0j',Σ_j',w'とは独立して計算できる。

【０２２３】μ_0j,Σ_jの再推定値はw'を固定すれば、μ
_0j,Σ_jに関する推定式を連立させて求めることが出来
る。

【０２２４】wの再推定値はμ_j0',Σ_j'を固定し、階層
型ＮＮの重み係数を推定する方法として知られているい
わゆるバックプロパゲーション法によって計算できる。
このバックプロパゲーション法には２通りの方法がある
（後述）。

【０２２５】本当ならば、μ_j0,Σ_j,wの再推定値は
μ_j0',Σ_j',w'に関する連立方程式を解くことによって
得られるものであるが、解析的にこれを行うのが困難で
あるから、前記のごとくμ_j0,Σ_jの推定とwの推定を、
一方を固定して、予め定めた収束条件が満足されるまで
交互に行う。

【０２２６】以上のようにして得られた再推定値は、次
の反復計算に備えてパラメータ記憶部１３０４に記憶さ
れる。

【０２２７】以上の各パラメータの再推定値の計算が予
め定めた収束条件が満足されるまで繰り返され、最終的
な推定値がパラメータ記憶部１３０４に記憶されること
になる。前記収束条件としては、セグメンテーション・
尤度算出部１３０３におけるφ^(r) _J+1(T^(r)+1)から L
(λ)=Σ_rφ^(r) _J+1(T^(r)+1)を算出し、前記反復計算の都
度L(λ)の改善比率を計算し、これが予め定めた閾値以
下になった時点で収束したと判定する等が可能である。

【０２２８】パラメータ推定のステップの詳細は図１
６、図１７のようになる。フォワート゛・ハ゛ックワート゛(Forward-Ba
ckward)法の場合と同様にこの場合も重み係数の推定法
には２通りある。従って、それぞれをViterbi法に組み
込んだものを、第３の実施例として図１６、第４の実施
例として図１７に示す。本例をソフトウェア的に実現す
る場合もこの手順にし従えばよい。

【０２２９】図１６、図１７においては、図１３におけ
るQ(λ,λ')をL(λ)とおいたものになっている。

【０２３０】図１６を用いる場合は次のようになる。遷移確率a_ijの再推定 Lagrangeの未定乗数法を用いる。

【０２３１】

【数８１】

【０２３２】両辺にa_ijを掛けてjについて総和を取れ
ば、

【０２３３】

【数８２】

【０２３４】となる。ここに、n^(r) _iは径路X^(r)∧が状
態iを通過する回数であって

【０２３５】

【数８３】

【０２３６】である。（数８２）を（数８１）に代入し
て整理すれば、a_ijの再推定値a_ij∧が次のように求めら
れる。

【０２３７】

【数８４】

【０２３８】b_j(y)のパラメータの推定（数８０）から

【０２３９】

【数８５】

【０２４０】が得られる。（ａ）μ_j0の推定（数６１）を参照して

【０２４１】

【数８６】

【０２４２】であるから、μ_j0の推定値μ_j0∧は次のよ
うになる。

【０２４３】

【数８７】

【０２４４】（ｂ）Σ_jの推定同様に（数６１）を参照して∂L_b(λ)／∂Σ_j = 0から
Σ_jの推定値Σ_j∧は次のように与えられる。

【０２４５】

【数８８】

【０２４６】（ｃ）重み係数wの推定前記Baum-Welch法のQ(λ,λ')を L(λ)に変更すること
によって同様に推定式が得られる。Baum-Welch法におけ
る（数６７）に相当する式は次のようになる。

【０２４７】

【数８９】

【０２４８】上記説明では、フォワート゛・ハ゛ックワート゛(Foward-B
ackward)法においてもヒ゛ターヒ゛(Viterbi)法においても、
ＮＮを構成する各ユニットの入出力特性は、入力層は線
形、隠れ層および出力層は非線形であるとしたが、出力
層を線形にすることも勿論可能である。このときは、z
^(r) _j ^u _n(t)は、u＝U のときは、図１(l)(m)のように出力
ユニットを各状態で共有しているときは、（数７４）に
相当する式は（数７５）においてq^(r) _j ^U _n(t)=1としたも
のになる。また、同図(f)(n)のようにh^(r) _j(t)を出力す
るユニット群が状態毎に分離しているときは、（数７
５）においてq_j ^U _(j-1)d+k=1としたものになる。全ての
ユニットの入出力特性を線形にすることも可能である。
このときは、u=Uのときは上記と同じであり、u≠Uのと
きは、q_j ^u _n(t)=1として全く同様の手続きにより、計算
できる。

【０２４９】次に、前記ＨＭＭの問題３の解法について
述べる。これは、前記ヒ゛ターヒ゛(Viterbi)法において述べ
たセグメンテーションを行う場合に必要とされるもので
ある。（数３５）の漸化式を計算する際に、B₁(1)=0
とおいて（数３５）を満足するｉをi∧とするとき、B
_j(t)=B_i∧(t-1)，S_j(t)=i∧ という操作を平行して行
えば、求められた最適の径路に沿って、各々の状態の最
終フレームを入力パターンの最終フレームＴから逆順に
求められる。即ち、状態Ｊの一つ前の状態はi∧=S
_J(T)、その状態の最終フレームはt∧=B_J(T)、状態Ｊの
二つ前の状態はi∧=S_i∧(t)、その状態の最終フレーム
はt∧=B_i∧(t)，・・・・・という操作をB_i∧(t)=0になるま
で行えば、状態系列と各状態の最終フレームが入力パタ
ーンの最終フレームＴから逆順に求められる。従って、
状態ｊの最終フレームがt_jであるとき、その開始フレー
ムはB_j(t_j)+1であって、状態ｊに対応するフレーム数は
n_ij=t_j-B_j(t_j)となる。また、状態ｊに対応する入力特
徴ベクトルは、y(B_j(t_j)+1)〜y(t_j)ということになる。
このような処理によって、前記ヒ゛ターヒ゛(Viterbi)法によ
ってパラメータを推定する場合に用いられるn^(r) _i, n
^(r) _ij, δ(x^(r)∧(t),j)が求められる。

【０２５０】以上のモデルは、ＮＮ内部の信号径路をＨ
ＭＭの状態に対応させたが、これを簡略化することによ
り従来のＤＰマッチングと同様な枠組みで定式化するこ
とが出来る。次にこれを説明する。

【０２５１】前記ＨＭＭにおいて、時点t₁からt₂までの
任意の状態系列の発生確率をすべて等しくなるようにす
る。これは図１０に示すようなモデルを用いる場合は、
例えば遷移確率をa_ij=1/3 (ただし、j=i,i+1,i+2)とす
れば（数９０）が成立し、

【０２５２】

【数９０】

【０２５３】時点t₁からt₂までの任意の状態系列の発生
確率はすべて等しくなる。ここで、前記Viterbiアルゴ
リズムを適用すれば、前記（数３４）は（数９１）のよ
うになる。

【０２５４】

【数９１】

【０２５５】故に（数９２）が成立するから、

【０２５６】

【数９２】

【０２５７】（数９３）とおき、

【０２５８】

【数９３】

【０２５９】漸化式（数９４）

【０２６０】

【数９４】

【０２６１】を（数９５）を初期値として計算し、

【０２６２】

【数９５】

【０２６３】（数９６）を尤度とする。

【０２６４】

【数９６】

【０２６５】即ち、T log (1/3) は入力パターンのフレ
ーム数のみに関連する量であるから、入力パターンＹに
対する各モデルの尤度を比較するときは、全モデルに共
通の量であるので省略することが出来、結局、（数９
４）の漸化式を計算し、（数９６）を尤度としたもので
ある。

【０２６６】本例の場合のパラメータの推定方法は、前
記ＨＭＭと同じ考え方で実行できる。即ち、前記ＨＭＭ
の場合の遷移確率はこれを無視し、前記ＨＭＭの場合と
同様にb_j(y(t))のパラメータを、この場合は{μ_0j}，w
についてフォワート゛・ハ゛ックワート゛(Forward-Backward)あるいはヒ
゛ターヒ゛(Viterbi)法を用いればよい。

【０２６７】図１８はフォワート゛・ハ゛ックワート゛(Forward-Backwa
rd)によるパラメータ推定の実施例である。図１２にお
ける遷移確率推定部１１０５を省略したものとなる。前
記したように尤度の表現式が異なることを除けば、１５
０１〜１５０４、１５０６、１５０７は１１０１〜１１
０４、１１０６、１１０７とそれぞれ同様な動作をする
ものである。

【０２６８】図１９はViterbi法によるパラメータ推定
の実施例である。図１５における遷移確率推定部１３０
６を省略したものとなる。前記したように尤度の表現式
が異なることを除けば、１６０１〜１６０５、１６０
７、１６０８は１３０１〜１３０５、１３０７、１３０
８とそれぞれ同じものである。

【０２６９】ここで、さらに、b_j(y(t))の分散共分散行
列を単位行列とすれば、（数９１）は（数９７）のよう
になり、（数９２）は（数９８）のようになる。

【０２７０】

【数９７】

【０２７１】

【数９８】

【０２７２】符号を変えることにより最大化問題を最小
化問題にすることにより、（数９９）とおき、

【０２７３】

【数９９】

【０２７４】漸化式（数１００）を（数１０１）を初期
値として計算し、（数１０２）を非尤度とする。

【０２７５】

【数１００】

【０２７６】

【数１０１】

【０２７７】

【数１０２】

【０２７８】この場合はp(λ)が小さいほど尤度が高い
と言うことになる。図２０はForward-Backwardによるこ
の場合のパラメータ推定の一実施例を示す図である。こ
の場合は図１８において確率分布パラメータ推定部１５
０６をさらに省略したものとなる。前記したように尤度
の表現式が異なることを除けば、１７０１〜１７０４、
１７０７は１５０１〜１５０４、１５０７と同様な動作
をするものである。ただし、前記説明から明らかなよう
に図１８部分尤度算出部１５０３は部分非尤度算出部１
７０３となり、重み係数推定部１７０７における重み係
数推定のための目的関数はこの非尤度であって、これを
最小化することになる。図２１はViterbi法によるこ
の場合のパラメータ推定の実施例である。図１９におけ
る遷移回数推定部１６０５、確率分布パラメータ推定部
１６０７を省略したものとなる。前記したように尤度の
表現式が異なることを除けば、１８０１〜１８０４、１
８０８は１６０１〜１６０４、１６０８とそれぞれ同様
な動作をするものである。ただし、セグメンテーション
・尤度算出部１６０３をセグメンテーション・非尤度算
出部１８０３に変更する必要がある。また、重み係数算
出部１８０８における重み係数推定のための目的関数は
この非尤度であって、これを最小化することになる点に
ついては、図２０の場合と同様である。

【０２７９】図１８〜図２１何れにおいても、重み係数
の推定は、前記２通りの方法がある。

【０２８０】さらに、ここの実施例で述べたものは、Ｎ
Ｎは予測器を構成する場合を述べたが、パターン変換と
して例えば「迫江，磯，“ダイナミックニューラルネッ
トワークの検討"，電子情報通信学会技術研究報告，SP8
7-102(1987年12月)」にＤＮＮとして記載のＮＮにも本
願発明と全く同様に、ＨＭＭの状態に入力層から出力層
に至る径路を状態に対応させたモデルとして実現するこ
とは勿論可能である。

【０２８１】

【発明の効果】以上のように、本発明によれば、ニュー
ラルネットワークにおける信号の伝播径路をＨＭＭの状
態に対応させることによって、"静的"なパターンに対し
て高い識別能力を持つニューラルネットワークを音声の
ような"動的"な時系列パターンにも適用出来るようにな
った。

【図面の簡単な説明】

【図１】本発明によるニューラルネットワークの一実施
例を例示する構成図

【図２】階層型ニューラルネットワークの構成図

【図３】ニューラルネットワークのユニットの非線形特
性の説明図

【図４】ＨＭＭによる音声認識装置の従来例のブロック
図

【図５】本発明によるニューラルネットワークの一実施
例を例示する構成図

【図６】本発明によるニューラルネットワークの他の実
施例を例示する構成図

【図７】本発明によるニューラルネットワークの更に他
の実施例を例示する構成図

【図８】本発明によるニューラルネットワークの更に他
の実施例を例示する構成図

【図９】本発明によるニューラルネットワークの更に他
の実施例を例示する構成図

【図１０】本発明の原理を説明する原理図

【図１１】本発明の原理に基づく音声認識装置の１実施
例を示すブロック図

【図１２】本発明によるモデルのパラメータを推定する
第１の実施例を示すブロック図

【図１３】第１の実施例の処理手順を示すＰＡＤ図

【図１４】第１の実施例の処理手順を示すＰＡＤ図

【図１５】本発明によるモデルのパラメータを推定する
第２の実施例を示すブロック図

【図１６】第２の実施例の処理手順を示すＰＡＤ図

【図１７】第２の実施例の処理手順を示すＰＡＤ図

【図１８】本発明によるモデルのパラメータを推定する
第３の実施例を示すブロック図

【図１９】本発明によるモデルのパラメータを推定する
第４の実施例を示すブロック図

【図２０】本発明によるモデルのパラメータを推定する
第５の実施例を示すブロック図

【図２１】本発明によるモデルのパラメータを推定する
第６の実施例を示すブロック図

フロントページの続き (56)参考文献特許2964507（ＪＰ，Ｂ２) 電子情報通信学会技術研究報告［音声］Ｖｏｌ．91 Ｎｏ．95 ＳＰ91−14 「時系列処理機能をもつ階層型ニューラルネットワーク」ｐ．63−70（1991／６／20発行) 電子情報通信学会技術研究報告［音声］Ｖｏｌ．89 Ｎｏ．340 ＳＰ89−83 「ニューラルネット駆動型ＨＭＭ」ｐ. 55−62（1989／12／14) 日本音響学会平成２年度秋季研究発表会講演論文集１−８−22「ニューラルネット予測型ＨＭＭによる音声認識」ｐ．43−44（平成２年９月19日発表) 電子情報通信学会技術研究報告［音声］Ｖｏｌ．89 Ｎｏ．90 ＳＰ89−23 「ニューラルネットワークによる予測モデルを用いた音声認識」ｐ．81−87 （1989／６／22) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 3/00 539 G10L 3/00 533 G10L 3/00 535 G10L 9/10 301 G06F 15/18 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】１つ以上の入出力を有する複数のユニッ
トが相互に結合され、各々の結合にはそこを流れる信号
に対して重み付けを行うその結合固有の荷重係数が定義
され、入力の特徴ベクトル系列{y(t)}に含まれる幾つか
のベクトルの各々の成分が入力される入力ユニット群
と、該入力ユニット群に入力された前記ベクトルが前記
ユニット及び結合を通過することにより変換され、該変
換されたベクトルを出力する出力ユニット群と、前記入
力ユニット群から前記出力ユニット群に至る径路の少な
くともの１つを重複させて所定数の径路群に分け、それ
ぞれの径路群を状態遷移網の状態または状態遷移に対応
させたニューラルネットワークを含むことを特徴とする
信号解析装置。
【請求項２】ニューラルネットワークの径路群ｊ(=1,
2,...J）による出力値はy(t)の前記径路群ｊにおける予
測値そのものあるいは予測値に関連した値であることを
特徴とする請求項１記載の信号解析装置。
【請求項３】観測特徴ベクトル系列Y={y(t)}に対し、
請求項２記載のニューラルネットワークの径路群ｊに基
づく予測誤差ベクトルe _j (t)の確率分布を規定するパラ
メータを記憶する確率分布パラメータ記憶手段と、状態
系列をX={x(t)}とし、E(X)={e _x(t) (t)}とするとき、前
記確率分布パラメータ記憶手段に記憶されているパラメ
ータを用いて計算される各状態あるいは各状態遷移毎の
確率密度から前記観測系列Yに対するモデルλの尤度を
（数１）として計算する尤度計算手段を備えたことを特
徴とする信号解析装置。【数１】
【請求項４】入力特徴ベクトル系列Y={y(t)}に対し、
請求項２記載のニューラルネットワークの径路群ｊに基
づく予測誤差ベクトルe _j (t)の確率分布を規定するパラ
メータを記憶する確率分布パラメータ記憶手段と、状態
系列をX={x(t)}とし、E(X)={e _x(t) (t)}とするとき、前
記確率分布パラメータ記憶手段に記憶されているパラメ
ータを用いて計算される各状態あるいは各状態遷移毎の
確率密度から前記観測系列Yに対するモデルλの尤度を
（数２）あるいは（数３）として計算する尤度計算手段
を備えたことを特徴とする時系列信号解析装置。【数２】【数３】
【請求項５】識別カテゴリC ₁ ,C ₂ ,…,C _mのそれぞれに
対応して請求項３または４記載のモデルを設け、カテゴ
リC _mに対応する前記モデルのパラメータの集合をλ _mと
するとき、観測パターンＹに対して（数４）を計算し、
C _m∧を識別結果とする時系列信号解析装置。【数４】
【請求項６】カテゴリＣに属する観測パターンY ⁽¹⁾ ,Y
⁽²⁾ ,…,Y ^(R) (ただし、Y ^(r) ={y ^(r) (t)}）に対し、請求
項３または４におけるYに対するE(X)と同様に、Y ^(r)に
対するE ^(r) (X ^(r) ）を定義するとき、（数５）を最大化
するパラメータλを算出するパラメータ推定手段を備え
たことを特徴とする時系列信号解析装置。【数５】
【請求項７】カテゴリＣに属する観測パターンY ⁽¹⁾ ,Y
⁽²⁾ ,…,Y ^(R) (ただし、Ｙ ^(r) ={y ^(r) (t)}）に対し、カテ
ゴリＣのパラメータの逐次推定において、逐次推定のあ
る段階における回路網のパラメータの集合をwとすると
き、第ｒの訓練パターンに対する請求項６で定義された
E ^(r) (X ^(r) )に対し、（数６）を計算する尤度計算手段
と、該尤度を増大せしむべきwの修正量Δwを算出するパ
ラメータ修正量算出手段を含み、w+Δwを新たなwとして
書換え、該wに関して観測パターンY ^(r+1)に関する尤度
を前記尤度計算手段によって算出する、と言う操作をw
の適当な初期値から始め、r=1,…,R,1,…,R,…について
予め定めた条件を満たすまで繰り返すことによってカテ
ゴリＣのパラメータを推定するパラメータ推定手段を備
えたことを特徴とする時系列信号解析装置。【数６】
【請求項８】カテゴリＣに属する観測パターンY ⁽¹⁾ ,Y
⁽²⁾ ,…,Y ^(R) (ただし、Y ^(r) ={y ^(r) (t)}）に対し、カテ
ゴリＣのパラメータの逐次推定において、ある時点にお
ける回路網のパラメータの集合をwとするとき、第ｒの
訓練パターンに対する請求項６で定義されたE ^(r) (X ^(r) )
に対し、（数８）または（数９）を算出する尤度計算手
段と、該尤度を増大せしむべきwの修正量Δwを算出する
パラメータ修正量算出手段を含み、w+Δwを新たなwとし
て書換え、該wに関して観測パターンY ^(r+1)に関する尤
度を前記尤度算出手段によって算出する、と言う操作を
wの適当な初期値から始め、r=1,…,R,1,…,R,…につい
て予め定めた条件を満たすまで繰り返すことによってカ
テゴリＣのパラメータを推定するパラメータ推定手段を
備えたことを特徴とする時系列信号解析装置。【数８】【数９】
【請求項９】カテゴリＣに属する観測パターンY ⁽¹⁾ ,Y
⁽²⁾ ,…,Y ^(R) (ただし、Y ^(r) ={y ^(r) (t)}）に対し、請求
項３または４におけるYに対するE(X)と同様に、Y ^(r)に
対するE ^(r) (X ^(r) )を定義するとき、（数１０）または
（数１１）を最大化するパラメータλを算定するパラメ
ータ推定手段を備えたことを特徴とする時系列信号解析
装置。【数１０】【数１１】
【請求項１０】請求項２記載のモデルに特徴ベクトル
系列Ｙを入力し、該特徴ベクトル系列Ｙに対する前記予
測モデルに基づく予測誤差電力の累積値の最小値を動的
計画法によって求める動的計画手段を備えたことを特徴
とする時系列信号解析装置。
【請求項１１】請求項２記載のモデルによって、特徴
ベクトルの系列からなるカテゴリＣに対する訓練パター
ンY ⁽¹⁾ ,Y ⁽²⁾ ,…,Y ^(R)のそれぞれに対する予測誤差電力
の累積値を請求項８記載の手段によって算出する累積予
測誤差電力算出手段と、該累積予測誤差電力算出手段に
よって累積予測誤差電力を算出する過程で得られる、予
測ベクトルを出力する出力ユニット群に対応する前記そ
れぞれの訓練パターンを構成する個々の特徴ベクトルを
用いて前記出力ユニット群につながる径路の重み係数の
推定を行う重み係数推定手段を含むことを特徴とする時
系列信号解析装置。