JP2001083980A - 標準パターン作成装置と方法および記録媒体 - Google Patents

標準パターン作成装置と方法および記録媒体

Info

Publication number
JP2001083980A
JP2001083980A JP25942199A JP25942199A JP2001083980A JP 2001083980 A JP2001083980 A JP 2001083980A JP 25942199 A JP25942199 A JP 25942199A JP 25942199 A JP25942199 A JP 25942199A JP 2001083980 A JP2001083980 A JP 2001083980A
Authority
JP
Japan
Prior art keywords
standard pattern
initial value
time series
creating
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25942199A
Other languages
English (en)
Other versions
JP4067716B2 (ja
Inventor
Toshiyuki Hanazawa
利行 花沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP25942199A priority Critical patent/JP4067716B2/ja
Priority to EP00119234A priority patent/EP1085498A3/en
Priority to CNB001338323A priority patent/CN1165888C/zh
Priority to US09/660,478 priority patent/US6708151B1/en
Publication of JP2001083980A publication Critical patent/JP2001083980A/ja
Application granted granted Critical
Publication of JP4067716B2 publication Critical patent/JP4067716B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Abstract

(57)【要約】 【課題】 好ましくない局所最小値で標準パターンの更
新が収束する現象を低減し、表現効率の高い標準パター
ンの作成を可能とする。 【解決手段】 初期値作成手段9が入力音声の特徴ベク
トルの時系列4を互いにオーバーラップするように区切
って、それら各小区間に属する特徴ベクトルの時系列を
平均して標準パターンの初期値10を作成し、標準パタ
ーン作成手段70がパターンマッチングによって、その
標準パターンの初期値の各状態と特徴ベクトルの時系列
とを対応付け、各状態ごとに対応付けられた特徴ベクト
ルの時系列を平均して標準パターン8の更新を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は単語音声認識にお
ける、表現効率の高い標準パターンを作成する標準パタ
ーン作成装置、それに用いられる標準パターン作成方
法、およびその標準パターン作成プログラムを記録した
記録媒体に関するものである。
【0002】
【従来の技術】単語音声認識では、入力音声と単語の標
準パターンとのパターンマッチングを行い、そのパター
ンマッチングの距離値が最小の単語を認識結果として出
力する方法が一般的である。通常、標準パターンは単語
入力音声の特徴ベクトルXの時系列X(t),(t=
1,2,3,…,T)として保持する。ここで、Tは単
語の長さ(フレーム数)である。しかしながら、標準パ
ターンを上記のように保持すると、単語によってフレー
ム数Tが異なるため、標準パターンのサイズも単語によ
って異なり、単語数を決めても標準パターンを保持する
ためのメモリのサイズが決まらないという問題点があっ
た。またフレーム数Tの値が大きくなると標準パターン
を保持するためのメモリ容量が大きくなるという問題点
もあった。そこで、従来から、入力音声の特徴ベクトル
X(t)の時系列を時間軸方向に圧縮して、単語のフレ
ーム数Tによらず、一定の状態数J(>1)の標準パタ
ーンを作成する装置や方法が検討されている。
【0003】図17は例えば特開昭64−44997号
公報に開示された、そのような従来の標準パターン作成
装置の一構成例を示すブロック図である。図において、
1は音声信号の入力端子、2は入力音声信号、3は入力
音声信号2の音響分析を行う分析手段、4は入力音声信
号2の音響分析結果である特徴ベクトルの時系列、5は
特徴ベクトルの時系列4から標準パターンの初期値を作
成する初期値作成手段、6は初期値作成手段5で作成さ
れた標準パターンの初期値、7は標準パターンの初期値
6より標準パターンを作成する標準パターン作成手段、
8は標準パターン作成手段7で作成された標準パターン
である。
【0004】次に動作について説明する。発声者より音
声信号の入力端子1から、標準パターン作成用の音声が
入力されると、分析手段3はこの入力端子1からの入力
音声信号2をA/D変換し、フレームと呼ぶ短い時間区
間ごとに音響分析を行うとともに、音声区間を切り出し
て各フレームごとに特徴ベクトルX(t),(t=1,
2,3,…,T)の時系列4を計算して出力する。ここ
で、Tは入力音声信号2の全フレーム数である。なお、
音声区間を正確に切り出すことは困難なので、特徴ベク
トルX(t),(t=1,2,3,…,T)の先頭と末
尾の数フレームにはポーズ区間が含まれているものとす
る。この例では特徴ベクトルX(t)は例えばLPC
(線形予測)分析によって得られるLPCケプストラム
とする。
【0005】初期値作成手段5は、特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を入力
とし、以下に説明する手順にしたがって標準パターンの
初期値6を作成する。この標準パターンの初期値6の作
成手順のフローチャートを図18に示す。
【0006】図17に示す初期値作成手段5では、ステ
ップST101においてまず、特徴ベクトルX(t),
(t=1,2,3,…,T)の時系列4を時間軸方向
に、J(J>1)個の小区間B(j),(j=1,2,
3,…,J)に分割する。その時、各小区間B(j)の
開始フレームsz(j)と終了フレームez(j)を以
下の(1)式〜(3)式で求めることによって、各小区
間B(j)をオーバーラップなしに均等分割する。
【0007】
【数1】
【0008】なお、上記(1)式における[.]は四捨
五入して整数化する演算を意味するものとする。
【0009】特徴ベクトルX(t),(t=1,2,
3,…,T)のフレーム数TをT=15、小区間B
(j),(j=1,2,3,…,J)の標準パターンの
状態数JをJ=5とした場合の、上記分割の様子を図1
9に示す。図示のように、特徴ベクトルX(t)の時系
列4は、特徴ベクトルX(1)〜X(3)が小区間B
(1)に、特徴ベクトルX(4)〜X(6)が小区間B
(2)に、…、特徴ベクトルX(13)〜X(15)が
小区間B(5)に均等に分割されている。
【0010】次にステップST102に進み、上記ステ
ップST101で分割した各小区間B(j)ごとに、次
に示す(4)式にしたがって各小区間B(j)に属する
特徴ベクトルX(t)の時系列4を平均して初期値Rz
(j),(j=1,2,3,…,J)を作成する。
【0011】
【数2】
【0012】状態数をJ=5とした場合における初期値
Rz(j),(j=1,2,3,…,J)の作成の様子
を図19に示す。図示のように、小区間B(1)に属す
る特徴ベクトルX(1)〜X(3)の時系列4を平均し
て初期値Rz(1)を、小区間B(2)に属する特徴ベ
クトルX(4)〜X(6)の時系列4を平均して初期値
Rz(2)を、…、小区間B(5)に属する特徴ベクト
ルX(13)〜X(15)の時系列4を平均して初期値
Rz(5)を作成している。
【0013】上記平均処理によって、次に示す(5)式
で計算される小区間B(j)に属する特徴ベクトルX
(t),(t=sz(j)〜ez(j))と、初期値の
状態jであるRz(j)とのユークリッド距離の和D
(j)が最小になるように初期値Rz(j)が求められ
ることになる。
【0014】
【数3】
【0015】以上で初期値作成手段5による初期値6の
作成の処理を終了する。
【0016】次に、標準パターン作成手段7は、この初
期値作成手段5によって作成された初期値Rz(j),
(j=1,2,3,…,J)と、分析手段3からの入力
音声の特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4を入力として、以下の手順にしたがって
標準パターンR(j),(j=1,2,3,…,J)を
作成する。この標準パターンR(j)の作成手順のフロ
ーチャートを図20に示す。
【0017】標準パターン作成手段7は、ステップST
201においてまず、学習回数カウンタの値cに0をセ
ットする。次にステップST202に進み、以下の
(6)式にしたがって初期値Rz(j),(j=1,
2,3,…,J)を標準パターンR(c)(j),(j
=1,2,3,…,J)にコピーする。 R(c)(j)=Rz(j), (j=1,2,3,…、J) (6) なお、この(6)式における(c)内のcは、上記学習
回数カウンタの値cを意味している。
【0018】次にステップST203において、標準パ
ターンR(c)(j),(j=1,2,3,…,J)と
入力音声の特徴ベクトルX(t),(t=1,2,3,
…,T)の時系列4との対応付けを行う。この対応付け
としては、例えばビタビアルゴリムを用い、以下に述べ
るパターンマッチング距離Dを最小化するように対応付
けを行う。なお、ビタビアルゴリズムは次に示す(7)
式および(8)式によって初期設定を行い、(9)式お
よび(10)式によって漸化式演算を繰り返すことによ
って実現し、また、パターンマッチング距離Dは次の
(11)式によって与えられる。
【0019】
【数4】
【0020】ここで、G(t,j)は累積ビタビ距離、
BTK(t,j)はバックトラック情報、Dは入力音声
の特徴ベクトルX(t),(t=1,2,3,…,T)
の時系列と標準パターンR(c)(j),(j=1,
2,3,…,J)とのパターンマッチング距離である。
また(9)式中のmin{.,.}は最小値を選択する
演算子である。
【0021】上記(9)式および(10)式による漸化
式計算終了後、フレームTから時間軸に逆方向に前記バ
ックトラック情報BTK(t,j)を辿ることによっ
て、上記(11)式にて与えられるパターンマッチング
距離Dを最小化する標準パターンR(c)(j),(j
=1,2,3,…,J)と、入力音声の特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4との対
応付けを得ることができる。以下、この対応付けをビタ
ビパスと呼ぶことにする。このステップST203では
さらに、このビタビパスに基づいてJ個の小区間B
(j),(j=1,2,3,…,J)の開始フレーム
s’(j)と終了フレームe’(j)とを求める。
【0022】次にステップST204に進んで、上記ス
テップST203において分割した各小区間B(j)ご
とに、次の(12)式によって各小区間B(j)に属す
る特徴ベクトルX(t)の時系列4を平均することによ
って、更新した標準パターンR(c+1)(j),(j
=1,2,3,…,J)を求める。
【0023】
【数5】
【0024】ここで、s’(j)は各小区間B(j)の
開始フレームであり、e’(j)はその終了フレームで
ある。
【0025】次にステップST205において、学習回
数カウンタの値cに1を加え、次いでステップST20
6にてその学習回数カウンタの値cが、予め設定された
所定回数(閾値CC)に達したか否かの判定を行う。そ
の結果、学習回数カウンタの値cが当該閾値CCに達し
ていればステップST207に分岐して、標準パターン
R(c)(j),(j=1,2,3,…,J)を出力
し、この標準パターン作成手順を終了する。一方、学習
回数カウンタの値cが当該閾値CCに達してなければ、
ステップST203に戻って上記標準パターン作成手順
の処理を繰り返す。なお、この標準パターン作成手順を
繰り返すことにより、前記パターンマッチング距離Dを
局所最小値に収束させることができる。このパターンマ
ッチング距離Dが小さいということは、圧縮による情報
量の欠損が少ない表現効率の高い標準パターンであるこ
とを意味する。
【0026】
【発明が解決しようとする課題】従来の標準パターン作
成装置は以上のように構成されているので、初期値作成
手段5において各分割小区間B(j),(j=1,2,
3,…,J)に属する特徴ベクトルX(t)を一意に決
定し、各小区間に属する特徴ベクトルX(t),(t=
sz(j)〜ez(j))と初期値Rz(j)のユーク
リッド距離の和D(j)が最小になるように初期値Rz
(j)を求めていた。そのため、標準パターン作成手段
7において、パターンマッチング距離Dの最小化基準の
もとで再度対応付けた場合でも、初期値Rz(j)を作
成したときの小区間b(j),(j=1,2,3,…,
J)に再び属する場合が多くなる。すなわち初期値にト
ラップされることが多く、好ましくない局所最小値で標
準パターンの更新が収束することがあるという課題があ
った。
【0027】この発明は上記のような課題を解決するた
めになされたもので、好ましくない局所最小値で標準パ
ターンの更新が収束する現象を低減し、表現効率の高い
標準パターンを生成することができる標準パターン作成
装置、標準パターン作成方法およびその標準パターン作
成プログラムを記録した記録媒体を得ることを目的とす
る。
【0028】
【課題を解決するための手段】この発明に係る標準パタ
ーン作成装置は、初期値作成手段が入力音声の特徴ベク
トルの時系列を互いにオーバーラップするように区切っ
た各小区間に属する特徴ベクトルの時系列を平均して標
準パターンの初期値を作成し、標準パターン作成手段が
パターンマッチングによって、その標準パターンの初期
値の各状態と特徴ベクトルの時系列とを対応付け、各状
態ごとに対応付けられた特徴ベクトルの時系列を平均し
て標準パターンの更新を行うようにしたものである。
【0029】この発明に係る標準パターン作成装置は、
入力音声の特徴ベクトルの時系列を互いにオーバーラッ
プする小区間に区切って標準パターンの初期値を作成す
る初期値作成手段が、その小区間の区間長を均等分割に
基づいて決定するようにしたものである。
【0030】この発明に係る標準パターン作成装置は、
入力音声の特徴ベクトルの時系列を互いにオーバーラッ
プする小区間に区切って標準パターンの初期値を作成す
る初期値作成手段が、その小区間をポーズ区間と音声区
間とで別個に決定するようにしたものである。
【0031】この発明に係る標準パターン作成装置は、
入力音声の特徴ベクトルの時系列を互いにオーバーラッ
プする小区間に区切って標準パターンの初期値を作成す
る初期値作成手段が、その小区間を特徴ベクトルの時系
列が前の時刻より大きく変化している時刻の特徴ベクト
ルの時系列をそのオーバーラップする区間に含むように
決定するようにしたものである。
【0032】この発明に係る標準パターン作成装置は、
オーバーラップ初期値作成手段が均等分割に基づいて各
小区間を決定して標準パターンの初期値を作成し、ポー
ズ区別オーバーラップ初期値作成手段がポーズ区間と音
声区間とで別個に小区間を決定して標準パターンの初期
値を作成し、スペクトル変化オーバーラップ初期値作成
手段が前の時刻との間の変化量が大きい時刻の特徴ベク
トルを含むように小区間を決定にして標準パターンの初
期値を作成し、標準パターン作成手段がそれら各標準パ
ターンの初期値を用いてそれぞれの標準パターンを作成
し、標準パターン選択手段がその中から入力音声の特徴
ベクトルの時系列とのパターンマッチング距離が最小の
標準パターンを選択するようにしたものである。
【0033】この発明に係る標準パターン作成方法は、
小区間に属する特徴ベクトルの時系列を平均して標準パ
ターンの初期値を作成する際に、小区間が入力音声の特
徴ベクトルの時系列を互いにオーバーラップして区切る
ようにしたものである。
【0034】この発明に係る標準パターン作成方法は、
入力音声の特徴ベクトルの時系列をオーバーラップする
小区間に区切る際に、均等分割に基づいて小区間の区間
長を決定するようにしたものである。
【0035】この発明に係る標準パターン作成方法は、
入力音声の特徴ベクトルの時系列をオーバーラップする
小区間に区切る際に、小区間をポーズ区間と音声区間と
で別個に決定するようにしたものである。
【0036】この発明に係る標準パターン作成方法は、
入力音声の特徴ベクトルの時系列をオーバーラップする
小区間に区切る際に、前の時刻との変化量が大きい時刻
の特徴ベクトルの時系列が、当該小区間のオーバーラッ
プする区間に含まれるように小区間を決定するようにし
たものである。
【0037】この発明に係る標準パターン作成方法は、
均等分割で、ポーズ区間と音声区間とで別個に、および
前の時刻との変化量が大きい時刻の特徴ベクトルの時系
列を含ませて、などの複数の方法で入力音声の特徴ベク
トルの時系列を互いにオーバーラップした小区間に区切
り、それら各方法で区切られた小区間の標準パターンの
初期値を用いて作成したそれぞれの標準パターンの中よ
り、入力音声の特徴ベクトルの時系列とのパターンマッ
チング距離が最小のものを選択するようにしたものであ
る。
【0038】この発明に係る記録媒体は、入力音声の特
徴ベクトルの時系列を互いにオーバーラップするように
区切った小区間に属する特徴ベクトルの時系列を平均し
て標準パターンの初期値を作成する初期値作成のステッ
プと、パターンマッチングにてその標準パターンの初期
値の各状態と特徴ベクトルの時系列とを対応付け、各状
態ごとに対応付けられた特徴ベクトルの時系列を平均し
て標準パターンの更新を行う標準パターン作成のステッ
プとを有する標準パターン作成方法を、コンピュータに
実行させるためのプログラムを記録したものである。
【0039】この発明に係る記録媒体は、初期値作成の
ステップを、均等分割に基づいて互いにオーバーラップ
する小区間の区間長を決定し、その各小区間に属する特
徴ベクトルの時系列を平均して標準パターンの初期値を
作成するオーバーラップ初期値作成のステップとしたも
のである。
【0040】この発明に係る記録媒体は、初期値作成の
ステップを、ポーズ区間と音声区間で別個に、互いにオ
ーバーラップする小区間を決定し、その各小区間に属す
る特徴ベクトルの時系列を平均して標準パターンの初期
値を作成するポーズ区別オーバーラップ初期値作成のス
テップとしたものである。
【0041】この発明に係る記録媒体は、初期値作成の
ステップを、前の時刻との変化量が大きい時刻の特徴ベ
クトルの時系列を含むように、互いにオーバーラップす
る小区間を決定し、その各小区間に属する特徴ベクトル
の時系列を平均して標準パターンの初期値を作成するス
ペクトル変化オーバーラップ初期値作成のステップとし
たものである。
【0042】この発明に係る記録媒体は、初期値作成の
ステップを、オーバーラップ初期値作成、ポーズ区別オ
ーバーラップ初期値作成、およびスペクトル変化オーバ
ーラップ初期値作成の各ステップとし、それら標準パタ
ーンの初期値を作成する各ステップによって作成された
標準パターンの初期値を用いてそれぞれの標準パターン
を作成する標準パターン作成のステップと、作成された
各標準パターンと入力音声の特徴ベクトルの時系列との
パターンマッチング距離が最小の標準パターンを選択す
る標準パターン選択のステップとを有するプログラムを
記録したものである。
【0043】
【発明の実施の形態】以下、この発明の実施の一形態に
ついて説明する。 実施の形態1.図1はこの発明による標準パターン作成
装置の構成の一例を示すブロック図である。図1におい
て、1は音声信号が入力される入力端子であり、2はこ
の入力端子1より入力された入力音声信号である。3は
この入力音声信号2の音響分析を行う分析手段であり、
4はこの分析手段3による入力音声信号2の音響分析結
果としての特徴ベクトルの時系列である。9は特徴ベク
トルの時系列4を互いにオーバーラップした複数の小区
間に区切り、それら各小区間に属する特徴ベクトルの時
系列を平均して標準パターンの初期値を作成する初期値
作成手段であり、ここでは各小区間の区間長を均等分割
に基づいて決定し、それら各小区間に属する特徴ベクト
ルの時系列を平均してそれぞれの標準パターンの初期値
を作成するオーバーラップ初期値作成手段が用いられて
いる。10はこのオーバーラップ初期値作成手段9によ
って作成された標準パターンの初期値としてのオーバー
ラップ初期値であり、7は分析手段3より出力された特
徴ベクトルの時系列4と、オーバーラップ初期値作成手
段9が作成したオーバーラップ初期値10の各状態とを
パターンマッチングによって対応付けし、それぞれの状
態ごとに対応付けられた特徴ベクトルの時系列4を平均
して標準パターンの更新を行う標準パターン作成手段で
ある。8はこの標準パターン作成手段7によって作成さ
れた標準パターンである。
【0044】次に動作について説明する。まず、発声者
によって入力端子1から標準パターン作成用の音声信号
が入力される。分析手段3は入力端子1より入力音声信
号2が入力されると、それをA/D変換してフレームと
呼ぶ短い時間区間ごとに音響分析を行うとともに、それ
ら各フレームにおける音響分析の結果に基づいて音声区
間を切り出し、各フレームごとに特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を計算
して出力する。なお、上記Tは入力音声信号2の全フレ
ーム数である。ここで、音声区間を正確に切り出すこと
は困難なので、特徴ベクトルX(t),(t=1,2,
3,…,T)の先頭と末尾の数フレームにはポーズ区間
が含まれているものとする。またこの実施の形態1にお
いても、特徴ベクトルX(t)は例えばLPC(線形予
測)分析によって得られるLPCケプストラムであるも
のとする。
【0045】オーバーラップ初期値作成手段9は、この
分析手段3による入力音声信号2の音響分析結果である
特徴ベクトルX(t),(t=1,2,3,…,T)の
時系列4を入力として、以下に説明する手順にしたがっ
てオーバーラップ初期値10を作成する。このオーバー
ラップ初期値10の作成手順を図2のフローチャートに
示す。
【0046】このオーバーラップ初期値作成手段9で
は、図2に示すフローチャートのステップST301に
おいてまず、特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4を時間軸方向にJ(J>1)個
の小区間B(j),(j=1,2,3,…,J)に分割
する。この時、各小区間B(j)の開始フレームs
(j)と終了フレームe(j)を以下の(13)式〜
(15)式によって求めることにより、各小区間B
(j)がオーバーラップするように均等分割する。
【0047】
【数6】
【0048】なお、上記(13)式における[.]は四
捨五入して整数化する演算を意味するものとする。
【0049】また(15)式において、Kは予め定めた
定数であり、各小区間B(j)のオーバーラップフレー
ム数を制御するオーバラップパラメータである。例えば
特徴ベクトルX(t),(t=1,2,3,…,T)の
フレーム数TをT=15、小区間B(j),(j=1,
2,3,…,J)の標準パターンの状態数JをJ=5、
オーバラップパラメータKをK=2とした場合の分割の
様子を図3に示す。このように、特徴ベクトルX(t)
の時系列4は特徴ベクトルX(1)〜X(5)が小区間
B(1)に、特徴ベクトルX(4)〜X(8)が小区間
B(2)に、…、特徴ベクトルX(13)〜X(15)
が小区間B(5)に、互いにオーバーラップするように
分割されている。
【0050】次にステップST302に進み、上記ステ
ップST301で分割した各小区間B(j)ごとに、次
に示す(16)式にしたがって各小区間B(j)に属す
る特徴ベクトルX(t)の時系列4を平均して、それぞ
れのオーバーラップ初期値R1(j),(j=1,2,
3,…,J)を作成する。
【0051】
【数7】
【0052】なお、このオーバーラップ初期値R1
(j),(j=1,2,3,…,J)の作成の様子を図
3に示す。図示のように、小区間B(1)に属する特徴
ベクトルX(1)〜X(5)の時系列4を平均してオー
バーラップ初期値R1(1)を、小区間B(2)に属す
る特徴ベクトルX(4)〜X(8)の時系列4を平均し
てオーバーラップ初期値R1(2)を、…、小区間B
(5)に属する特徴ベクトルX(13)〜X(15)の
時系列4を平均してオーバーラップ初期値R1(5)を
それぞれ作成している。
【0053】以上でオーバーラップ初期値作成手段9に
よるオーバーラップ初期値10の作成を終了する。
【0054】次に、標準パターン作成手段7は、このオ
ーバーラップ初期値作成手段9によって作成されたオー
バーラップ初期値R1(j),(j=1,2,3,…,
J)と、分析手段3から送られてきた入力音声の特徴ベ
クトルX(t),(t=1,2,3,…,T)の時系列
4を入力として、以下に説明する手順にしたがって標準
パターンR(j),(j=1,2,3,…,J)を作成
する。この標準パターンR(j)の作成手順のフローチ
ャートを図4に示す。
【0055】標準パターン作成手段7では、図4に示す
ステップST401において、まず学習回数カウンタの
値cに0をセットする。次にステップST402に進
み、以下に示す(17)式にしたがってオーバーラップ
初期値R1(j),(j=1,2,3,…,J)を標準
パターンR(c)(j),(j=1,2,3,…,J)
にコピーする。
【0056】
【数8】
【0057】なお、この(17)式における(c)内の
cは、上記学習回数カウンタの値cを意味している。
【0058】次にステップST403において、標準パ
ターンR(c)(j),(j=1,2,3,…,J)
と、入力音声の特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4との対応付けを行う。この対応
付けとしては、例えば従来の標準パターン作成装置の場
合と同様にビタビアルゴリムを用い、以下に述べるパタ
ーンマッチング距離Dを最小化するような対応付けを行
う。なお、ビタビアルゴリズムは従来の標準パターン作
成装置で説明した通り、(7)式および(8)式によっ
て初期設定を行い、(9)式および(10)式によって
漸化式演算を繰り返すことによって実現する。
【0059】この(9)式および(10)式の漸化式計
算終了後に、従来の標準パターン作成装置の場合と同様
に、フレームTから時間軸に逆方向に前記バックトラッ
ク情報BTK(t,j)を辿ることによって、パターン
マッチング距離Dを最小化する標準パターンR(c)
(j),(j=1,2,3,…,J)と、入力音声の特
徴ベクトルX(t),(t=1,2,3,…,T)の時
系列4との対応付けを得る。図5にこの標準パターンR
(c)(j)と入力音声の特徴ベクトルX(t)の時系
列4との対応付けの概要を示す。この図5において、縦
軸は標準パターンR(c)(j)、横軸は入力音声の特
徴ベクトルX(t)の時系列であり、図中の太い実線が
ビタビパスである。なお、この図5では、特徴ベクトル
X(t)のフレーム数TをT=15、標準パターンR
(c)(j)の状態数JをJ=5とした場合について示
している。
【0060】次にステップST403において、この図
5に示すビタビパスより、J個の小区間B(j),(j
=1,2,3,…,J)の開始フレームs’(j)と終
了フレームe’(j)を求める。すなわち、標準パター
ンの各状態であるRc(1),Rc(2),…,Rc
(J)に対応付けられた特徴ベクトルX(t),(t=
1,2,3,…,T)の開始フレームと終了フレーム
を、各小区間B(j)の開始フレームと終了フレームと
する。図5に示した例では、R(c)(1)にはX
(1)〜X(3)が対応付けられているので、s’
(1)=1,e’(1)=3となり、また、R(c)
(2)にはX(4)〜X(7)が対応付けられているの
で、s’(2)=4,e’(2)=7、…、R(c)
(5)にはX(13)〜X(15)が対応付けられてい
るので、s’(5)=13,e’(5)=15となる。
【0061】次にステップST404に進み、上記ステ
ップST403で分割した各小区間B(j)ごとに、以
下に示す(18)式によって各小区間B(j)に属する
特徴ベクトルX(t)の時系列4を平均することによっ
て、更新した標準パターンR(c+1)(j),(j=
1,2,3,…,J)を求める。
【0062】
【数9】
【0063】なお、この式(18)中の、s’(j)は
と各小区間B(j)の開始フレームであり、e’(j)
は各小区間B(j)の終了フレームである。
【0064】次にステップST405において、学習回
数カウンタの値cに1を加え、次いでステップST40
6にてその学習回数カウンタの値cが、予め設定された
閾値CCに達したか否かの判定を行う。判定の結果、学
習回数カウンタの値cが当該閾値CCに達していればス
テップST407に分岐して、標準パターンR(c)
(j),(j=1,2,3,…,J)を出力し、この標
準パターン作成手順を終了する。一方、学習回数カウン
タの値cが当該閾値CCに達していなければ、ステップ
ST403に戻って上記標準パターン作成手順の処理を
繰り返す。なお、この標準パターン作成手順を繰り返す
ことにより、前記パターンマッチング距離Dを局所最小
値に収束させることができる。このパターンマッチング
距離Dが小さいということは、圧縮による情報量の欠損
が少ない表現効率の高い標準パターンであることを意味
する。
【0065】次に、このような標準パターン作成装置を
使用して標準パターンを作成する方法を具体的に説明す
る。図6はこの発明の実施の形態1における標準パター
ン作成方法の手順を示すフローチャートである。
【0066】発声者が入力端子1から標準パターン作成
用の音声を入力すると、図6にST701で示した分析
のステップが開始される。この分析のステップにおいて
は、その入力音声信号2をA/D変換してフレームと呼
ぶ短い時間区間ごとに音響分析を行うとともに、それら
各フレームの音響分析の結果に基づいて音声区間を切り
出し、各フレームごとに特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を計算して出力する。
ここで、Tは入力音声信号2の全フレーム数を示すもの
である。また、この音声区間を正確に切り出すのは困難
なので、特徴ベクトルX(t),(t=1,2,3,
…,T)の先頭と末尾の数フレームにはポーズ区間が含
まれているものとする。この例では、上記特徴ベクトル
X(t)は、例えばLPC分析によって得られるLPC
ケプストラムとする。
【0067】次に、図6にST702で示したオーバー
ラップ初期値作成のステップに進む。このオーバーラッ
プ初期値作成のステップにおいては、分析のステップで
得られた特徴ベクトルX(t),(t=1,2,3,
…,T)の時系列4を入力として、オーバーラップ初期
値10を作成する。なお、このオーバーラップ初期値作
成のステップの詳細な手順は図2のフローチャートに示
す通りである。
【0068】すなわち、特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を時間軸方向に、J個
の小区間B(j),(j=1,2,3,…,J)に分割
する(ST301)。このとき、各小区間B(j)の開
始フレームs(j)と終了フレームe(j)とを(1
3)式〜(15)式で求めることによって、各小区間B
(j)がオーバーラップするように分割する。なお、図
3には、例えば特徴ベクトルX(t)のフレーム数Tを
T=15、標準パターンの状態数JをJ=5、オーバラ
ップパラメータKをK=2とした場合の分割の様子を示
す。
【0069】次に、このステップST301で分割した
各小区間B(j)ごとに、図3に示すように各小区間B
(j)に属する特徴ベクトルX(t)の時系列4を平均
してオーバーラップ初期値R1(j),(j=1,2,
3,…,J)を作成する(ST302)。以上でオーバ
ーラップ初期値の作成を終了する。
【0070】次に、図6にST703で示す標準パター
ン作成のステップに進み、上記オーバーラップ初期値作
成のステップで作成されたオーバーラップ初期値R1
(j),(j=1,2,3,…,J)と、入力音声の特
徴ベクトルX(t),(t=1,2,3,…,T)の時
系列4を入力として、以下の手順にしたがって標準パタ
ーンR(j),(j=1,2,3,…,J)を作成す
る。この標準パターン作成のステップの詳細な手順は図
4のフローチャートに示す通りである。
【0071】まず学習回数カウンタの値cを0にセット
する(ST401)。次に(17)式にしたがってオー
バーラップ初期値R1(j),(j=1,2,3,…,
J)を標準パターンR(c)(j),(j=1,2,
3,…,J)にコピーする(ST402)。
【0072】次に、標準パターンR(c)(j),(j
=1,2,3,…,J)と入力音声の特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を、例
えばビタビアルゴリムを用いて、パターンマッチング距
離Dを最小化するように対応付ける。ビタビアルゴリズ
ムは前述のように、(7)式および(8)式によって初
期設定を行い、(9)式および(10)式によって漸化
式演算を繰り返すことによって実現する。この(9)式
と(10)式の漸化式計算終了後に、フレームTから時
間軸に逆方向に前記バックトラック情報BTK(t,
j)を辿ることによって、上記パターンマッチング距離
Dを最小化する標準パターンR(c)(j),(j=
1,2,3,…,J)と入力音声の特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4との対
応付けを得る。この対応付けの概要は図5に示す通りで
ある。このビタビパスに基づいてJ個の小区間B
(j),(j=1,2,3,…,J)の開始フレーム
s’(j)と終了フレームe’(j)を求める(ST4
03)。すなわち標準パターンの各状態であるR(c)
(1),R(c)(2),…,R(c)(J)に対応付
けられた特徴ベクトルX(t),(t=1,2,3,
…,T)の開始フレームと終了フレームを各小区間B
(j)の開始フレームと終了フレームとする。
【0073】図5に示す例によれば、R(c)(1)に
はX(1)〜X(3)が対応付けられているのでs’
(1)=1,e’(1)=3、R(c)(2)にはX
(4)〜X(7)が対応付けられているのでs’(2)
=4,e’(2)=7、R(c)(3)にはX(8)〜
X(10)が対応付けられているので、s’(3)=
8,e’(3)=10、…、R(c)(5)にはX(1
3)〜X(15)が対応付けられているのでs’(5)
=13,e’(5)=15となる。
【0074】次に、このようにして分割した各小区間B
(j)ごとに、(18)式を用いて各小区間B(j)に
属する特徴ベクトルX(t)の時系列4を平均すること
により、更新した標準パターンR(c+1)(j),
(j=1,2,3,…,J)を求める(ST404)。
【0075】次に、学習回数カウンタの値cに1を加え
(ST405)、この学習回数カウンタの値cが所定の
閾値CCに達したか否かを判定する(ST406)。学
習回数カウンタの値cがその閾値CCに達していれば、
標準パターンR(c)(j),(j=1,2,3,…,
J)を出力して(ST407)、この標準パターン作成
の手順を終了する。一方、学習回数カウンタの値cが閾
値CCに達していなければ、処理をステップST403
に戻して、上記処理を繰り返す。
【0076】なお、この実施の形態1の標準パターン作
成をソフトウェアで実現しようとする場合、入力音声信
号2に対して音響分析を行い、特徴ベクトルX(t)の
時系列4を求める分析のステップと、この特徴ベクトル
X(t)の時系列4を互いにオーバーラップする小区間
B(j)に区切り、それら各小区間B(j)に属する特
徴ベクトルX(t)の時系列4を平均してオーバーラッ
プ初期値R1(j)を作成するオーバーラップ初期値作
成のステップと、パターンマッチングによって、特徴ベ
クトルX(t)の時系列4とオーバーラップ初期値R1
(j)の複数の状態とを対応付け、各状態ごとに対応付
けられた特徴ベクトルX(t)の時系列4を平均して標
準パターンR(c)(j)の更新を行う標準パターン作
成のステップとを有した、コンピュータに標準パターン
を作成させるためのプログラムを記録している、コンピ
ュータで読み取り可能な記録媒体が必要である。
【0077】以上のように、この実施の形態1によれ
ば、オーバーラップ初期値作成手段9によって特徴ベク
トルX(t),(t=1,2,3,…,T)の時系列4
をオーバーラップするように分割しているので、オーバ
ーラップ初期値R1(j)を作成した段階では分割され
た各小区間B(j)の境界が一意に決定されることはな
い。そして標準パターン作成手段7において標準パター
ンR(c)(j),(j=1,2,3,…,J)と入力
音声の特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4とを、ビタビアルゴリズムによってパタ
ーンマッチング距離Dの最小化基準のもとで対応付けた
際に、初めて各小区間をオーバーラップせずに分割し、
その境界を一意に決定しているので、初期値にトラップ
されることが少なくなり、好ましくない局所最小値で標
準パターンの学習が収束することを低減できるという効
果が得られる。また、標準パターンの初期値10を作成
するため、特徴ベクトルX(t),(t=1,2,3,
…,T)の時系列4を互いにオーバーラップする小区間
B(j)に区切る際に、その小区間B(j)の区間長を
均等分割に基づいて決定しているので、それら各小区間
B(j)の分割を簡単に行うことができるといった効果
もある。
【0078】実施の形態2.図7はこの発明の実施の形
態2による標準パターン作成装置の構成の一例を示すブ
ロック図であり、実施の形態1における各機能ブロック
と同等の部分には、図1と同一符号を付してその説明を
省略する。図において、11は分析手段3から送られて
くる特徴ベクトルの時系列4を互いにオーバーラップす
る小区間に分割する際に、各小区間をポーズ区間と音声
区間とで別個に決定し、それら各小区間に属する特徴ベ
クトルの時系列4を平均してそれぞれの標準パターンの
初期値を作成する、初期値作成手段としてのポーズ区別
オーバーラップ初期値作成手段である。12はこのポー
ズ区別オーバーラップ初期値作成手段11より標準パタ
ーンの初期値として出力されるポーズ区別オーバーラッ
プ初期値である。
【0079】このように、この実施の形態2による標準
パターン作成装置は、初期値作成手段として、オーバー
ラップ初期値10を出力するオーバーラップ初期値作成
手段9の代わりに、ポーズ区別オーバーラップ初期値1
2を出力する上記ポーズ区別オーバーラップ初期値作成
手段11が用いられている点で、実施の形態1の標準パ
ターン作成装置とは異なっている。
【0080】次に動作について説明する。発声者によっ
て入力端子1に標準パターン作成用の音声信号が入力さ
れると、分析手段3はその入力端子1からの入力音声信
号2をA/D変換してフレームと呼ぶ短い時間区間ごと
に音響分析を行うとともに音声区間を切り出し、各フレ
ームごとに特徴ベクトルX(t),(t=1,2,3,
…,T)の時系列4を計算して出力する。この分析手段
3はその時、各フレームごとに音声信号のパワーP
(t),(t=1,2,3,…,T)の時系列も計算
し、それを上記特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4とともに出力している。なお、
Tは入力音声信号2の全フレーム数である。ここで、音
声区間を正確に切り出すことは困難なので、特徴ベクト
ルX(t),(t=1,2,3,…,T)の先頭と末尾
の数フレームにはポーズ区間が含まれているものとす
る。また、この実施の形態2においても、特徴ベクトル
X(t)は例えばLPC分析によって得られるLPCケ
プストラムとする。
【0081】ポーズ区別オーバーラップ初期値作成手段
11は、この特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4を入力とし、以下に説明する手
順にしたがってポーズ区別オーバーラップ初期値12を
作成する。このポーズ区別オーバーラップ初期値12の
作成手順を図8のフローチャートに、またポーズ区別オ
ーバーラップ初期値12の作成の概要を図9の説明図に
示す。
【0082】ポーズ区別オーバーラップ初期値作成手段
11では、図8に示すフローチャートのステップST5
01においてまず、図9に示すように、入力端子1に入
力された音声信号のパワーP(t)(t=1,2,3,
…,T)を、t=1から時間軸に順方向に予め定めた閾
値Pthと比較し、音声信号のパワーP(t)がこの閾
値Pthを越えるフレームを検出して、そのフレームを
T1とする。図9の例ではt=3で閾値Pthを越えて
いるので、T1=3である。
【0083】次にステップST502において、上記音
声信号のパワーP(t)(t=1,2,3,…,T)
を、t=Tから時間軸と逆方向に予め定めた閾値Pth
と比較し、音声信号のパワーP(t)がこの閾値Pth
を越えるフレームを検出して、そのフレームをT2とす
る。図9の例ではt=13で閾値Pthを越えているの
で、T2=13である。
【0084】次にステップST503に進み、特徴ベク
トルX(t),(t=1,2,3,…,T)の時系列4
を、時間軸方向にJ個の小区間B(j),(j=1,
2,3,…,J)に分割する際の、先頭から1番目の小
区間B(1)の開始フレームsp(1)をsp(1)=
1とする。また、当該小区間B(1)の終了フレームe
p(1)を上記ステップST501で求めたT1とす
る。すなわちep(1)=T1とする。
【0085】同様に、次のステップST504におい
て、特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4を、時間軸方向にJ個の小区間B
(j),(j=1,2,3,…,J)に分割する際の、
先頭からJ番目の小区間B(J)の開始フレームsp
(J)を上記ステップST502で求めたT2とする。
すなわちsp(J)=T2とする。また、当該小区間B
(J)の終了フレームep(J)をep(J)=Tとす
る。
【0086】次にステップST505に進んで、特徴ベ
クトルX(t),(t=1,2,3,…,T)の時系列
4を、時間軸方向にJ個の小区間B(i),(i=1,
2,3,…,J)に分割する際の、先頭から2番目より
(J−1)番目までの小区間B(j),(j=2,3,
…,J−1)の開始フレームsp(j)と終了フレーム
ep(j)を、以下の(19)式〜(21)式によって
求める。
【0087】
【数10】
【0088】なお、上記(19)式における[.]は四
捨五入して整数化する演算を意味するものとする。また
(21)式でK2は予め定められた定数であり、各小区
間B(j)のオーバーラップフレーム数を制御するパラ
メータである。例えば特徴ベクトルX(t)のフレーム
数TをT=15、オーバラップパラメータK2をK2=
2、標準パターンの状態数JをJ=5とした場合の分割
の様子を図9に示す。
【0089】次にステップST506において、上記ス
テップST503〜ステップST505において分割し
た各小区間B(j)ごとに、それぞれの小区間B(j)
に属する特徴ベクトルX(t)の時系列4を平均してポ
ーズ区別オーバーラップ初期値Rp(j),(j=1,
2,3,…,J)を作成する。なお、このポーズ区別オ
ーバーラップ初期値Rp(j),(j=1,2,3,
…,J)の作成には、次の(22)式が用いられる。
【0090】
【数11】
【0091】以上でポーズ区別オーバーラップ初期値作
成手段11によるポーズ区別オーバーラップ初期値12
の作成を終了する。
【0092】標準パターン作成手段7は、このポーズ区
別オーバーラップ初期値作成手段11の作成したポーズ
区別オーバーラップ初期値Rp(j),(j=1,2,
3,…,J)と、入力音声の特徴ベクトルX(t),
(t=1,2,3,…,T)の時系列4とを入力とし
て、標準パターンR(j),(j=1,2,3,…,
J)を作成する。その際、オーバーラップ初期値R1
(j),(j=1,2,3,…,J)の代わりに、ポー
ズ区別オーバーラップ初期値Rp(j),(j=1,
2,3,…,J)を標準パターンR(c)(j),(j
=1,2,3,…,J)にコピーしている。なお、それ
以外は、実施の形態1における標準パターン作成手段7
と同一の手順で処理を進めて、コピーされた標準パター
ンR(c)(j),(j=1,2,3,…,J)を更新
し、それを標準パターンR(j),(j=1,2,3,
…,J)として出力する。
【0093】次に、このような標準パターン作成装置を
使用して標準パターンを作成する方法を具体的に説明す
る。図10はこの発明の実施の形態2における標準パタ
ーン作成方法の手順を示すフローチャートである。
【0094】発声者が入力端子1から標準パターン作成
用の音声を入力すると、図10にST801で示した分
析のステップが開始される。この分析のステップにおい
ては、その入力音声信号2をA/D変換してフレームと
呼ぶ短い時間区間ごとに音響分析を行うとともに、それ
に基づいて音声区間を切り出し、各フレームごとに特徴
ベクトルX(t),(t=1,2,3,…,T)の時系
列4を計算して出力する。なお、この場合も、音声区間
を正確に切り出すことは困難なので、特徴ベクトルX
(t),(t=1,2,3,…,T)の先頭と末尾の数
フレームにはポーズ区間が含まれているものとする。こ
の例でも実施の形態1の場合と同様に、特徴ベクトルX
(t)は例えばLPC分析によって得られるLPCケプ
ストラムとする。また、この実施の形態2における分析
のステップでは、各フレームごとに音声信号のパワーP
(t),(t=1,2,3,…,T)の時系列も計算し
て、特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4とともに出力する。
【0095】次に図10にST802で示すポーズ区別
オーバーラップ初期値作成のステップに進み、上記分析
のステップで得られた特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を入力として、ポーズ
区別オーバーラップ初期値12を作成する。なお、この
ポーズ区別オーバーラップ初期値作成の詳細な手順は図
8のフローチャートに示す通りであり、また、このポー
ズ区別オーバーラップ初期値作成の概要を図9に示す。
【0096】図9に示すように、音声信号のパワーP
(t)(t=1,2,3,…,T)と所定の閾値Pth
との比較を、t=1から時間軸に順方向に行って、音声
信号のパワーP(t)が閾値Pthを越えるフレームを
検出し、そのフレームをT1とする(ST501)。図
9の例ではt=3で閾値Pthを越えているので、T1
=3である。
【0097】同様にして、上記音声信号のパワーP
(t)(t=1,2,3,…,T)と閾値Pthとの比
較を、t=Tから時間軸と逆方向に行って、音声信号の
パワーP(t)が閾値Pthを越えるフレームを検出
し、そのフレームをT2とする(ST502)。図9の
例ではt=13で閾値Pthを越えているので、T2=
13である。
【0098】次に、特徴ベクトルX(t),(t=1,
2,3,…,T)の時系列4を、時間軸方向にJ個の小
区間B(j),(j=1,2,3,…,J)に分割する
際の、先頭から1番目の小区間B(1)の開始フレーム
sp(1)をsp(1)=1とし、終了フレームep
(1)を上記T1(すなわちep(1)=T1)とする
(ST503)。
【0099】同様に、特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を、時間軸方向にJ個
の小区間B(j),(j=1,2,3,…,J)に分割
する際の、先頭からJ番目の小区間B(J)の開始フレ
ームsp(J)を上記T2(すなわちsp(J)=T
2)とし、終了フレームep(J)をep(J)=Tと
する(ST504)。
【0100】次に、特徴ベクトルX(t),(t=1,
2,3,…,T)の時系列4を、時間軸方向にJ個の小
区間B(i),(i=1,2,3,…,J)に分割する
際の、先頭から2〜(J−1)番目の小区間B(j),
(j=2,3,…,J−1)の開始フレームsp(j)
と終了フレームep(j)を、(19)式〜(21)式
によって求める(ST505)。例えば、特徴ベクトル
X(t)のフレーム数TをT=15、オーバラップパラ
メータK2をK2=2、標準パターンの状態数JをJ=
5とした場合の、特徴ベクトルX(t)の時系列4の分
割の様子を図9に示す。
【0101】次に、前述の手順で分割した各小区間B
(j)ごとに、(22)式にしたがってそれら各小区間
に属する特徴ベクトルX(t)の時系列4を平均して、
ポーズ区別オーバーラップ初期値Rp(j),(j=
1,2,3,…,J)を作成する(ST506)。以上
でポーズ区別オーバーラップ初期値の作成を終了する。
【0102】次に図10にST803で示した標準パタ
ーン作成のステップに進んで、上記ポーズ区別オーバー
ラップ初期値作成のステップで作成されたポーズ区別オ
ーバーラップ初期値Rp(j),(j=1,2,3,
…,J)と、入力音声の特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を入力として、標準パ
ターンR(j),(j=1,2,3,…,J)を作成す
る。なお、この標準パターン作成のステップでは、オー
バーラップ初期値R1(j),(j=1,2,3,…,
J)の代わりに、ポーズ区別オーバーラップ初期値Rp
(j),(j=1,2,3,…,J)を標準パターンR
(c)(j),(j=1,2,3,…,J)にコピーし
ている点で、図6にST703で示した、実施の形態1
における標準パターン作成のステップとは異なってい
る。
【0103】なお、この実施の形態2の標準パターン作
成をソフトウェアで実現しようとする場合、入力音声信
号2に対して音響分析を行って、特徴ベクトルX(t)
の時系列4と、音声信号のパワーP(t)の時系列を求
める分析のステップと、その音声信号のパワーP(t)
の時系列を用いてポーズ区間と音声区間で個別に、特徴
ベクトルX(t)の時系列4を互いにオーバーラップす
る小区間B(j)に区切り、それら各小区間B(j)に
属する特徴ベクトルX(t)の時系列4を平均してポー
ズ区別オーバーラップ初期値Rp(j)を作成するポー
ズ区別オーバーラップ初期値作成のステップと、パター
ンマッチングによって、特徴ベクトルX(t)の時系列
4とポーズ区別オーバーラップ初期値Rp(j)の複数
の状態とを対応付け、各状態ごとに対応付けられた特徴
ベクトルX(t)の時系列4を平均して標準パターンR
(c)(j)の更新を行う標準パターン作成のステップ
とを有した、コンピュータに標準パターンを作成させる
ためのプログラムを記録している、コンピュータで読み
取り可能な記録媒体が必要である。
【0104】以上のように、この実施の形態2によれ
ば、ポーズ区別オーバーラップ初期値作成手段11によ
って特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4を単語の前後のポーズ区間を区別して互
いにオーバーラップする小区間に分割することにより、
ポーズ区別オーバーラップ初期値Rp(j),(j=
1,2,3,…,J)を作成しているので、音声区間と
ポーズ区間の混合による局所最小値への収束を防止する
ことができ、より好ましい局所最小値で標準パターンの
学習が収束するという効果が得られる。
【0105】実施の形態3.図11はこの発明の実施の
形態3による標準パターン作成装置の構成の一例を示す
ブロック図であり、実施の形態1における各機能ブロッ
クと同等の部分には、図1と同一符号を付してその説明
を省略する。図において、13は分析手段3から送られ
てくる特徴ベクトルの時系列4を互いにオーバーラップ
する小区間に分割する際に、互いにオーバーラップする
小区間として、特徴ベクトルの時系列4が前の時刻より
大きく変化している時刻の特徴ベクトルの時系列4をそ
のオーバーラップする区間に含むように決定し、それら
各小区間に属する特徴ベクトルの時系列4を平均してそ
れぞれの標準パターンの初期値を作成する、初期値作成
手段としてのスペクトル変化オーバーラップ初期値作成
手段である。14はこのスペクトル変化オーバーラップ
初期値作成手段13より標準パターンの初期値として出
力されるスペクトル変化オーバーラップ初期値である。
【0106】このように、この実施の形態3による標準
パターン作成装置は、初期値作成手段として、オーバー
ラップ初期値10を出力するオーバーラップ初期値作成
手段9、あるいはポーズ区別オーバーラップ初期値12
を出力するポーズ区別オーバーラップ初期値作成手段1
1の代わりに、スペクトル変化オーバーラップ初期値1
4を出力するスペクトル変化オーバーラップ初期値作成
手段13が用いられている点で、実施の形態1または実
施の形態2における標準パターン作成装置とは異なって
いる。
【0107】次に動作について説明する。発声者によっ
て入力端子1に標準パターン作成用の音声信号が入力さ
れると、分析手段3はその入力端子1からの入力音声信
号2をA/D変換してフレームと呼ぶ短い時間区間ごと
に音響分析を行うとともに音声区間を切り出して、各フ
レームごとに特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4を計算して出力する。なお、T
は入力音声信号2の全フレーム数である。ここで、音声
区間を正確に切り出すことは困難なので、特徴ベクトル
X(t),(t=1,2,3,…,T)の先頭と末尾の
数フレームにはポーズ区間が含まれているものとする。
また、この実施の形態3においても、特徴ベクトルX
(t)は例えばLPC分析によって得られるLPCケプ
ストラムとする。
【0108】スペクトル変化オーバーラップ初期値作成
手段13は、特徴ベクトルX(t),(t=1,2,
3,…,T)の時系列4を入力とし、以下に説明する手
順にしたがってスペクトル変化オーバーラップ初期値1
4を作成する。このスペクトル変化オーバーラップ初期
値14の作成手順のフローチャートを図12に、またス
ペクトル変化オーバーラップ初期値14の作成の概要を
図13に示す。
【0109】このスペクトル変化オーバーラップ初期値
作成手段13では、図12に示すフローチャートのステ
ップST601においてまず、次の(23)式によっ
て、フレームt=2〜Tについて、特徴ベクトルX
(t)とX(t−1)とのスペクトル変化量dx(t)
を求める。 dx(t)=|X(t)−X(t−1)|, (t=2,3,…,T) (23)
【0110】次にステップST602に進み、上記(2
3)式によって計算されたスペクトル変化量dx(t)
の値の大きい、上位(J−1)個のフレームを選択し、
この上位(J−1)個のフレームを時間軸上の順番にし
たがってF(1),F(2),…,F(J−1)とす
る。ここで、Jは小区間B(j)に分割する際の分割数
である。この分割の様子を図13に示す。図13におい
て縦軸はスペクトル変化量、横軸は特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4であ
る。図13はJ=5とした場合の例であり、前記スペク
トル変化量dx(t)の値の大きい上位4個のフレーム
はt=3,7,9,13なので、F(1)=3,F
(2)=7,F(3)=9,F(4)=13となる。
【0111】次にステップST603に進んで、特徴ベ
クトルX(t),(t=1,2,3,…,T)の時系列
4を、時間軸方向にJ個の小区間B(j),(j=1,
2,3,…,J)に分割する際の、小区間B(j),
(j=1,2,3,…,J)の開始フレームss(j)
と終了フレームes(j)とを、以下に示す(24)式
および(25)式によって求める。
【0112】
【数12】
【0113】なお、(24)式中のK3は予め定められ
た定数であり、各小区間B(j)のオーバーラップフレ
ーム数を制御するパラメータを示している。例えば特徴
ベクトルX(t)のフレーム数TをT=15、標準パタ
ーンの状態数JをJ=5、オーバラップパラメータK3
をK3=1とした場合の分割の様子を図13に示す。
【0114】次にステップST604において、上記ス
テップST603で分割した各小区間B(j)ごとに、
次の(26)式にしたがってそれら各小区間B(j)に
属する特徴ベクトルX(t)の時系列4を平均し、オー
バーラップ初期値Rs(j),(j=1,2,3,…,
J)を作成する。
【0115】
【数13】
【0116】以上でスペクトル変化オーバーラップ初期
値作成手段13によるスペクトル変化オーバーラップ初
期値14の作成を終了する。
【0117】標準パターン作成手段7では、このスペク
トル変化オーバーラップ初期値作成手段13が作成した
スペクトル変化オーバーラップ初期値Rs(j),(j
=1,2,3,…,J)と、入力音声の特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4とを入
力として、標準パターンR(j),(j=1,2,3,
…,J)を作成する。その際、オーバーラップ初期値R
1(j),(j=1,2,3,…,J)、あるいはポー
ズ区別オーバーラップ初期値Rp(j),(j=1,
2,3,…,J)の代わりに、スペクトル変化オーバー
ラップ初期値Rs(j),(j=1,2,3,…,J)
を標準パターンR(c)(j),(j=1,2,3,
…,J)にコピーしている。なお、それ以外は、実施の
形態1または実施の形態2における標準パターン作成手
段7と同一の手順で処理を進め、コピーされた標準パタ
ーンR(c)(j),(j=1,2,3,…,J)の更
新を行って、それを標準パターンR(j),(j=1,
2,3,…,J)として出力する。
【0118】次に、このような標準パターン作成装置を
使用して標準パターンを作成する方法を具体的に説明す
る。図14はこの発明の実施の形態3における標準パタ
ーン作成方法の手順を示すフローチャートである。
【0119】発声者が入力端子1から標準パターン作成
用の音声を入力すると、図14にST901で示した分
析のステップが開始される。この分析のステップにおい
ては、その入力音声信号2をA/D変換してフレームと
呼ぶ短い時間区間ごとに音響分析を行うとともに、音声
区間を切り出して、各フレームごとに特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を計算
して出力する。なお、この場合においても、音声区間を
正確に切り出すことは困難なので、特徴ベクトルX
(t),(t=1,2,3,…,T)の先頭と末尾の数
フレームにはポーズ区間が含まれているものとする。こ
の例でも実施の形態1および実施の形態2と同様に、特
徴ベクトルX(t)は例えばLPC分析によって得られ
るLPCケプストラムとする。
【0120】次に、図14にST902で示すスペクト
ル変化オーバーラップ初期値作成のステップに進み、そ
の特徴ベクトルX(t),(t=1,2,3,…,T)
の時系列4を入力として、以下に説明する手順にしたが
って、スペクトル変化オーバーラップ初期値14を作成
する。なお、このスペクトル変化オーバーラップ初期値
14の作成手順のフローチャートを図12に、またスペ
クトル変化オーバーラップ初期値14の作成方法の概要
を図13に示す。
【0121】まず、フレームt=2〜Tについて、特徴
ベクトルX(t)とX(t−1)とのスペクトル変化量
dx(t)を(23)式を用いて求める(ST60
1)。次に、その得られたスペクトル変化量dx(t)
の値の大きい上位(J−1)個のフレームを選択し、そ
れら(J−1)個のフレームを時間軸の順番にしたがっ
てF(1),F(2),…,F(J−1)とする(ST
602)。なお、Jは小区間B(j)に分割する際の分
割数である。この分割の様子を図13に示す。図13に
おいて縦軸はスペクトル変化量、横軸は特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4であ
る。図はJ=5の場合を示しており、上記スペクトル変
化量dx(t)の値の大きい上位4個のフレームは、t
=3,7,9,13であるので、F(1)=3,F
(2)=7,F(3)=9,F(4)=13となる。
【0122】次に、特徴ベクトルX(t),(t=1,
2,3,…,T)の時系列4を、時間軸方向にJ個の小
区間B(j),(j=1,2,3,…,J)に分割する
際の、各小区間B(j),(j=1,2,3,…,J)
の開始フレームss(j)と終了フレームes(j)
を、(24)式および(25)式によって求める(ST
603)。図13には、例えば特徴ベクトルX(t)の
フレーム数TをT=15、標準パターンの状態数JをJ
=5、オーバラップパラメータK3をK3=1とした場
合の分割の様子を示している。
【0123】次に、前述の手順で分割した各小区間B
(j)ごとに、(26)式にしたがって各小区間B
(j)に属する特徴ベクトルX(t)の時系列4を平均
して、スペクトル変化オーバーラップ初期値Rs
(j),(j=1,2,3,…,J)を作成する(ST
604)。以上でこのスペクトル変化オーバーラップ初
期値の作成を終了する。
【0124】次に、図14にST903で示した標準パ
ターン作成のステップに進んで、上記スペクトル変化オ
ーバーラップ初期値作成のステップにて作成されたスペ
クトル変化オーバーラップ初期値Rs(j),(j=
1,2,3,…,J)と、入力音声の特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を入力
として、標準パターンR(j),(j=1,2,3,
…,J)を作成する。なお、この標準パターン作成のス
テップでは、オーバーラップ初期値R1(j),(j=
1,2,3,…,J)あるいはポーズ区別オーバーラッ
プ初期値Rp(j),(j=1,2,3,…,J)の代
わりに、スペクトル変化オーバーラップ初期値Rs
(j),(j=1,2,3,…,J)を標準パターンR
(c)(j),(j=1,2,3,…,J)にコピーし
ている点で、実施の形態1および実施の形態2における
標準パターン作成のステップ(ST703,ST80
3)とは異なっている。
【0125】なお、この実施の形態3の標準パターン作
成をソフトウェアで実現しようとする場合、入力音声信
号2に対して音響分析を行って、特徴ベクトルX(t)
の時系列4の時系列を求める分析のステップと、互いに
オーバーラップする小区間B(j)のオーバーラップす
る区間に、特徴ベクトルX(t)の時系列4で、前の時
刻との変化量が大きい時刻の特徴ベクトルX(t)の時
系列4を含むように小区間B(j)を決定し、それら各
小区間B(j)に属する特徴ベクトルX(t)の時系列
4を平均してスペクトル変化オーバーラップ初期値Rs
(j)を作成するスペクトル変化オーバーラップ初期値
作成のステップと、パターンマッチングによって、特徴
ベクトルX(t)の時系列4とスペクトル変化オーバー
ラップ初期値Rs(j)の複数の状態とを対応付け、各
状態ごとに対応付けられた特徴ベクトルX(t)の時系
列4を平均して標準パターンR(c)(j)の更新を行
う標準パターン作成のステップとを有した、コンピュー
タに標準パターンを作成させるためのプログラムを記録
している、コンピュータで読み取り可能な記録媒体が必
要である。
【0126】以上のように、この実施の形態3によれ
ば、スペクトル変化オーバーラップ初期値作成手段13
によって、スペクトル変化量の大きいフレームを分割境
界の基準として小区間B(j)の分割を行っているの
で、スペクトルが大きく異なる特徴ベクトルどうしの混
合による局所最小値への収束を防止することができ、よ
り好ましい局所最小値で標準パターンの学習収束すると
いう効果が得られる。
【0127】実施の形態4.図15はこの発明の実施の
形態4による標準パターン作成装置の構成の一例を示す
ブロック図であり、実施の形態1〜実施の形態3におけ
る各機能ブロックと同等の部分には、図1、図7、もし
くは図11と同一符号を付してその説明を省略する。図
において、15は入力音声信号2の音響分析を行った分
析手段3より出力された特徴ベクトルの時系列4を、そ
のパワーPの時系列を含めて保持する特徴ベクトル記憶
メモリである。16は初期値作成手段としてのオーバー
ラップ初期値作成手段9、ポーズ区別オーバーラップ初
期値作成手段11、およびスペクトル変化オーバーラッ
プ初期値作成手段13のそれぞれで作成された、オーバ
ーラップ初期値10、ポーズ区別オーバーラップ初期値
12、およびスペクトル変化オーバーラップ初期値14
に基づいて、それぞれの標準パターンを作成する標準パ
ターン作成手段であり、17a,17b,17cはこの
標準パターン作成手段16より出力されるそれぞれの標
準パターンである。18は標準パターン作成手段16に
よって作成された各標準パターン17a,17b,17
cと、特徴ベクトル記憶メモリ15から読み出された特
徴ベクトルの時系列4とのパターンマッチングを行い、
パターンマッチング距離が最小の標準パターンを選択す
る標準パターン選択手段であり、19はこの標準パター
ン選択手段18より出力される、最終的な標準パターン
である。
【0128】このように、この実施の形態4による標準
パターン作成装置は、初期値作成手段として、オーバー
ラップ初期値作成手段9、ポーズ区別オーバーラップ初
期値作成手段11、およびスペクトル変化オーバーラッ
プ初期値作成手段13を備え、標準パターン作成手段1
6が、それらオーバーラップ初期値10、ポーズ区別オ
ーバーラップ初期値12、およびスペクトル変化オーバ
ーラップ初期値14に基づいてそれぞれの標準パターン
17a〜17cを作成するものであり、この標準パター
ン17a〜17cよりパターンマッチング距離が最小の
標準パターンを選択する標準パターン選択手段18を備
えている点で、実施の形態1の標準パターン作成装置と
は異なっている。
【0129】次に動作について説明する。発声者によっ
て入力端子1から標準パターン作成用の音声を入力され
ると、分析手段3は入力音声信号2をA/D変換し、フ
レームと呼ぶ短い時間区間ごとに音響分析を行うととも
に音声区間を切り出して、各フレームごとに特徴ベクト
ルX(t),(t=1,2,3,…,T)の時系列4を
計算して出力する。そのとき、各フレームごとに音声信
号のパワーP(t),(t=1,2,3,…,T)の時
系列も計算して、特徴ベクトルX(t),(t=1,
2,3,…,T)の時系列4とともに出力する。この場
合にも、音声区間を正確に切り出すことは困難なので、
特徴ベクトルX(t),(t=1,2,3,…,T)の
先頭と末尾の数フレームにはポーズ区間が含まれている
ものとする。この例では、特徴ベクトルX(t)は、例
えばLPC分析によって得られるLPCケプストラムと
する。
【0130】この分析手段3の音響分析で得られた入力
音声の特徴ベクトルX(t),(t=1,2,3,…,
T)の時系列4とパワーP(t),(t=1,2,3,
…,T)の時系列は、特徴ベクトル記憶メモリ15に送
られて一旦保持される。そして、この特徴ベクトル記憶
メモリ15の出力端子Yをオーバーラップ初期値作成手
段9の入力端子A1に接続するとともに、標準パターン
作成手段16の入力端子Zをオーバーラップ初期値作成
手段9の出力端子A2に接続する。この接続条件で特徴
ベクトル記憶メモリ15は保持している特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を出力
する。オーバーラップ初期値作成手段9と標準パターン
作成手段16は実施の形態1の場合と同一の手順で動作
して、標準パターンを作成する。標準パターン作成手段
16は作成したその標準パターンをオーバーラップ初期
値10に基づく標準パターン17aとして標準パターン
選択手段18に出力する。
【0131】次に特徴ベクトル記憶メモリ15の出力端
子Yをポーズ区別オーバーラップ初期値作成手段11の
入力端子B1に接続するとともに、標準パターン作成手
段16の入力端子Zをポーズ区別オーバーラップ初期値
作成手段11の出力端子B2に接続する。この接続条件
で特徴ベクトル記憶メモリ15は保持している特徴ベク
トルX(t),(t=1,2,3,…,T)の時系列4
と音声信号のパワーP(t),(t=1,2,3,…,
T)の時系列を出力する。ポーズ区別オーバーラップ初
期値作成手段11と標準パターン作成手段16は実施の
形態2の場合と同一の手順で動作して標準パターンを作
成する。標準パターン作成手段16は作成した標準パタ
ーンをポーズ区別オーバーラップ初期値12に基づく標
準パターン17bとして標準パターン選択手段18に出
力する。
【0132】次に特徴ベクトル記憶メモリ15の出力端
子Yをスペクトル変化オーバーラップ初期値作成手段1
3の入力端子C1に接続するとともに、標準パターン作
成手段16の入力端子Zをスペクトル変化オーバーラッ
プ初期値作成手段13の出力端子C2に接続する。この
接続条件で特徴ベクトル記憶メモリ15は保持している
特徴ベクトルX(t),(t=1,2,3,…,T)の
時系列4を出力する。スペクトル変化オーバーラップ初
期値作成手段13と標準パターン作成手段16は実施の
形態3の場合と同一の手順で動作して標準パターンを作
成する。標準パターン作成手段16は作成した標準パタ
ーンをスペクトル変化オーバーラップ初期値14に基づ
く標準パターン17cとして標準パターン選択手段18
に出力する。
【0133】標準パターン選択手段18は特徴ベクトル
記憶メモリ15が保持している特徴ベクトルX(t),
(t=1,2,3,…,T)の時系列4、オーバーラッ
プ初期値10に基づく標準パターン17a、ポーズ区別
オーバーラップ初期値12に基づく標準パターン17
b、およびスペクトル変化オーバーラップ初期値14に
基づく標準パターン17cを入力として、実施の形態1
にて説明したビタビアルゴリズムを用いて、前記3種の
標準パターン17a,17b,17cと、特徴ベクトル
X(t),(t=1,2,3,…,T)の時系列4との
パターンマッチング距離を計算する。そして、このパタ
ーンマッチング距離が最小となる標準パターンを選択
し、それを最終的な標準パターン19として出力する。
【0134】次に、このような標準パターン作成装置を
使用して標準パターンを作成する方法を具体的に説明す
る。図16はこの発明の実施の形態4における標準パタ
ーン作成方法の手順を示すフローチャートである。
【0135】発声者が入力端子1から標準パターン作成
用の音声を入力すると、図16にST1001で示す分
析のステップにおいて、入力音声信号2をA/D変換し
フレームと呼ぶ短い時間区間ごとに音響分析を行うとと
もに音声区間を切り出して、各フレームごとに特徴ベク
トルX(t),(t=1,2,3,…,T)の時系列4
を計算して出力する。そのとき、各フレームごとに音声
信号のパワーP(t),(t=1,2,3,…,T)の
時系列も計算して、上記特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4とともに出力する。な
お、この場合も音声区間を正確に切り出すことは困難な
ので、特徴ベクトルX(t),(t=1,2,3,…,
T)の先頭と末尾の数フレームにはポーズ区間が含まれ
ているものとする。また、この例では特徴ベクトルX
(t)は例えばLPC分析で得られるLPCケプストラ
ムとする。
【0136】次に図16にST1002で示すオーバー
ラップ初期値作成のステップに進む。このオーバーラッ
プ初期値作成のステップでは、特徴ベクトル記憶メモリ
15の出力端子Yをオーバーラップ初期値作成手段9の
入力端子A1に接続し、標準パターン作成手段16の入
力端子Zをオーバーラップ初期値作成手段9の出力端子
A2に接続して、その接続条件で特徴ベクトル記憶メモ
リ15は保持している特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4を出力し、オーバーラ
ップ初期値作成手段9にて、実施の形態1の場合と同一
の手順でオーバーラップ初期値10を作成する。次に図
16にST1003で示す標準パターン作成のステップ
において、標準パターン作成手段16が実施の形態1の
場合と同一の手順で標準パターンを作成し、それをオー
バーラップ初期値10に基づく標準パターン17aとし
て出力する。
【0137】次に図16にST1004で示すポーズ区
別オーバーラップ初期値作成のステップに進む。このポ
ーズ区別オーバーラップ初期値作成のステップでは、特
徴ベクトル記憶メモリ15の出力端子Yをポーズ区別オ
ーバーラップ初期値作成手段11の入力端子B1に、標
準パターン作成手段16の入力端子Zをポーズ区別オー
バーラップ初期値作成手段11の出力端子B2に接続し
て、その接続条件で特徴ベクトル記憶メモリ15は保持
している特徴ベクトルX(t),(t=1,2,3,
…,T)の時系列4と、音声信号のパワーP(t),
(t=1,2,3,…,T)の時系列を出力し、ポーズ
区別オーバーラップ初期値作成手段11にて、実施の形
態2の場合と同一の手順でポーズ区別オーバーラップ初
期値12を作成する。次に図16にST1005で示す
標準パターン作成のステップにおいて、標準パターン作
成手段16が実施の形態2の場合と同一の手順で標準パ
ターンを作成し、それをポーズ区別オーバーラップ初期
値12に基づく標準パターン17bとして出力する。
【0138】次に図16にST1006で示すスペクト
ル変化オーバーラップ初期値作成のステップに進む。こ
のスペクトル変化オーバーラップ初期値作成のステップ
では、特徴ベクトル記憶メモリ15の出力端子Yをスペ
クトル変化オーバーラップ初期値作成手段13の入力端
子C1に接続し、標準パターン作成手段16の入力端子
Zをスペクトル変化オーバーラップ初期値作成手段13
の出力端子C2に接続して、その接続条件で特徴ベクト
ル記憶メモリ15は保持している特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4を出力
し、スペクトル変化オーバーラップ初期値作成手段13
にて、実施の形態3の場合と同一の手順でスペクトル変
化オーバーラップ初期値14を作成する。次に図16に
ST1007で示す標準パターン作成のステップにおい
て、標準パターン作成手段16が実施の形態3の場合と
同一の手順で標準パターンを作成し、それをスペクトル
変化オーバーラップ初期値14に基づく標準パターン1
7cとして出力する。
【0139】次に、図16にST1008で示す標準パ
ターン選択のステップにおいて、特徴ベクトル記憶メモ
リ15が保持している特徴ベクトルX(t),(t=
1,2,3,…,T)の時系列4、オーバーラップ初期
値10に基づく標準パターン17a、ポーズ区別オーバ
ーラップ初期値12に基づく標準パターン17b、およ
びスペクトル変化オーバーラップ初期値14に基づく標
準パターン17cを入力として、実施の形態1にて説明
したビタビアルゴリズムを用いて、それら3種の標準パ
ターン17a,17b,17cと、特徴ベクトルX
(t),(t=1,2,3,…,T)の時系列4とのパ
ターンマッチング距離を計算し、このパターンマッチン
グ距離が最小となる標準パターンを選択して、それを最
終的な標準パターン19として出力する。
【0140】なお、この実施の形態4の標準パターン作
成をソフトウェアで実現しようとする場合、入力音声信
号2に対して音響分析を行って、特徴ベクトルX(t)
の時系列4の時系列と音声信号のパワーP(t)の時系
列とを求める分析のステップ、均等分割に基づいて決定
した各小区間B(j)に属する特徴ベクトルX(t)の
時系列4を平均してオーバーラップ初期値10を作成す
るオーバーラップ初期値作成のステップ、そのオーバー
ラップ初期値10を用いて標準パターン17aを作成す
る標準パターン作成のステップ、ポーズ区間と音声区間
で別個に決定した各小区間B(j)に属する特徴ベクト
ルX(t)の時系列4を平均してポーズ区別オーバーラ
ップ初期値12を作成するポーズ区別オーバーラップ初
期値作成のステップ、そのポーズ区別オーバーラップ初
期値12を用いて標準パターン17bを作成する標準パ
ターン作成のステップ、前の時刻との変化量が大きい時
刻の特徴ベクトルをそのオーバーラップ区間に含むよう
に決定した各小区間B(j)に属する特徴ベクトルX
(t)の時系列4を平均してスペクトル変化オーバーラ
ップ初期値14を作成するスペクトル変化オーバーラッ
プ初期値作成のステップ、そのスペクトル変化オーバー
ラップ初期値14を用いて標準パターン17cを作成す
る標準パターン作成のステップ、およびそれら3種の標
準パターン17a,17b,17cと特徴ベクトルX
(t)の時系列4とのパターンマッチング距離が最小の
標準パターンを選択して、最終的な標準パターン19と
して出力する標準パターン選択のステップを有した、コ
ンピュータに標準パターンを作成させるためのプログラ
ムを記録している、コンピュータで読み取り可能な記録
媒体が必要である。
【0141】以上のように、この実施の形態4によれ
ば、オーバーラップ初期値10に基づく標準パターン1
7aと、ポーズ区別オーバーラップ初期値12に基づく
標準パターン17bと、スペクトル変化オーバーラップ
初期値14に基づく標準パターン17cの中から、特徴
ベクトルX(t),(t=1,2,3,…,T)の時系
列4とのパターンマッチング距離が最小となる標準パタ
ーンを、最終的な標準パターン19として選択している
ので、より表現効率の高い標準パターンを得ることがで
きるという効果が得られる。
【0142】
【発明の効果】以上のように、この発明によれば、初期
値作成手段が各小区間に属する特徴ベクトルの時系列を
平均して標準パターンの初期値を作成する際に、特徴ベ
クトルの時系列を互いにオーバーラップするように区切
って小区間を形成し、標準パターン作成手段がその標準
パターンの初期値の各状態と特徴ベクトルの時系列との
対応付けをパターンマッチングによって行い、各状態ご
とに対応付けられた特徴ベクトルの時系列を平均して標
準パターンの更新を行うように構成したので、初期値に
トラップされることが少なくなり、好ましくない局所最
小値で標準パターンの学習が収束することを低減するこ
とができる標準パターン作成装置が得られる効果があ
る。
【0143】この発明によれば、オーバーラップ初期値
作成手段が特徴ベクトルの時系列を互いにオーバーラッ
プする小区間に区切って標準パターンの初期値を作成す
る際に、均等分割に基づいてその小区間の区間長を決定
するように構成したので、各小区間の分割を単純化する
ことができる標準パターン作成装置が得られる効果があ
る。
【0144】この発明によれば、ポーズ区別オーバーラ
ップ初期値作成手段が特徴ベクトルの時系列を互いにオ
ーバーラップする小区間に区切って標準パターンの初期
値を作成する際に、その小区間をポーズ区間と音声区間
とで別個に決定するように構成したので、音声区間とポ
ーズ区間の混合による局所最小値への収束を防止するこ
とが可能となり、より好ましい局所最小値で標準パター
ンの学習を収束させることができる標準パターン作成装
置が得られる効果がある。
【0145】この発明によれば、スペクトル変化オーバ
ーラップ初期値作成手段が特徴ベクトルの時系列を互い
にオーバーラップする小区間に区切って標準パターンの
初期値を作成する際に、特徴ベクトルの時系列が前の時
刻より大きく変化している時刻の特徴ベクトルの時系列
を、そのオーバーラップ区間に含むように小区間を決定
するように構成したので、スペクトルが大きく異なる特
徴ベクトルどうしの混合による局所最小値への収束を防
止することが可能となり、より好ましい局所最小値で標
準パターンの学習を収束させることができる標準パター
ン作成装置が得られるという効果がある。
【0146】この発明によれば、オーバーラップ初期値
作成手段、ポーズ区別オーバーラップ初期値作成手段、
およびスペクトル変化オーバーラップ初期値作成手段で
それぞれ作成された各標準パターンの初期値を用いて、
それらに基づく標準パターンを標準パターン作成手段で
作成し、その中で特徴ベクトルの時系列とのパターンマ
ッチング距離が最小のものを標準パターン選択手段で選
択して、最終的な標準パターンとして出力するように構
成したので、より表現効率の高い標準パターンを得るこ
とのできる標準パターン作成装置が得られる効果があ
る。
【0147】この発明によれば、各小区間に属する特徴
ベクトルの時系列を平均して標準パターンの初期値を作
成する際に、互いにオーバーラップするように特徴ベク
トルの時系列を区切って小区間を形成するように構成し
たので、初期値にトラップされることが少なくなり、好
ましくない局所最小値で標準パターンの学習が収束する
ことを低減できる標準パターン作成方法が得られる効果
がある。
【0148】この発明によれば、特徴ベクトルの時系列
をオーバーラップする小区間に区切る際に、各小区間の
区間長を均等分割に基づいて決定するように構成したの
で、各小区間の分割を単純化することができる標準パタ
ーン作成方法が得られる効果がある。
【0149】この発明によれば、特徴ベクトルの時系列
をオーバーラップする小区間に区切る際に、ポーズ区間
と音声区間とで別個に各小区間を決定するように構成し
たので、音声区間とポーズ区間の混合による局所最小値
への収束を防止することが可能となり、より好ましい局
所最小値で標準パターンの学習を収束させることができ
る標準パターン作成方法が得られる効果がある。
【0150】この発明によれば、特徴ベクトルの時系列
をオーバーラップする小区間に区切る際に、当該小区間
のオーバーラップ区間に、前の時刻との変化量が大きい
時刻の特徴ベクトルの時系列が含まれるように小区間を
決定するように構成したので、スペクトルが大きく異な
る特徴ベクトルどうしの混合による局所最小値への収束
を防止することが可能となり、より好ましい局所最小値
で標準パターンの学習を収束させることができる標準パ
ターン作成方法が得られる効果がある。
【0151】この発明によれば、特徴ベクトルの時系列
を互いにオーバーラップした小区間に区切る際に、均等
分割、ポーズ区間と音声区間とで別個に分割、および前
の時刻との変化量が大きい時刻の特徴ベクトルの時系列
を含むように分割の、各分割方法で分割し、それら各分
割方法による標準パターンの初期値を用いて作成したそ
れぞれの標準パターンから、特徴ベクトルの時系列との
パターンマッチング距離が最小のものを選択するように
構成したので、表現効率の高い標準パターンを得ること
のできる標準パターン作成方法が得られる効果がある。
【0152】この発明によれば、各小区間を互いにオー
バーラップするように区切って、その小区間の特徴ベク
トルの時系列を平均して標準パターンの初期値を作成す
る標準パターン初期値作成のステップと、その標準パタ
ーン初期値に基づく標準パターンを作成する標準パター
ン作成のステップとを有するプログラムを記録媒体に記
録させるように構成したので、好ましくない局所最小値
で標準パターンの学習が収束することを低減できる標準
パターン作成方法をコンピュータに実行させることがで
きる効果がある。
【0153】この発明によれば、小区間の区間長を均等
分割によって決定するオーバーラップ初期値作成のステ
ップを初期値作成のステップとしたプログラムを記録媒
体に記録させるように構成したので、各小区間の分割を
単純化することができる標準パターン作成方法をコンピ
ュータに実行させることができる効果がある。
【0154】この発明によれば、ポーズ区間と音声区間
で別個に小区間を決定するポーズ区別オーバーラップ初
期値作成のステップを初期値作成のステップとしたプロ
グラムを記録媒体に記録させるように構成したので、音
声区間とポーズ区間の混合による局所最小値への収束を
防止でき、より好ましい局所最小値で標準パターンの学
習が収束する標準パターン作成方法をコンピュータに実
行させることができる効果がある。
【0155】この発明によれば、スペクトルが大きく変
化する部分がオーバーラップ部分に含まれるように小区
間の分割を行うスペクトル変化オーバーラップ初期値作
成のステップを初期値作成のステップとしたプログラム
を記録媒体に記録させるように構成したので、スペクト
ルが大きく異なる特徴ベクトルどうしの混合による局所
最小値への収束を防止でき、より好ましい局所最小値で
標準パターンの学習が収束する標準パターン作成方法を
コンピュータに実行させることができる効果がある。
【0156】この発明によれば、オーバーラップ初期値
作成、ポーズ区別オーバーラップ初期値作成、およびス
ペクトル変化オーバーラップ初期値作成の各ステップ
と、それらによって作成された各標準パターンの初期値
を用いてそれぞれの標準パターンを作成する標準パター
ン作成のステップと、作成された各標準パターンと入力
音声の特徴ベクトルの時系列とのパターンマッチング距
離が最小の標準パターンを選択する標準パターン選択の
ステップとを有するプログラムを記録媒体に記録させる
ように構成したので、より表現効率の高い標準パターン
が得られる標準パターン作成方法をコンピュータに実行
させることができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による標準パターン
作成装置を示すブロック図である。
【図2】 実施の形態1におけるオーバーラップ初期値
作成手段の動作手順を示すフローチャートである。
【図3】 実施の形態1におけるオーバーラップ初期値
作成手段の動作の概要を示す説明図である。
【図4】 実施の形態1における標準パターン作成手段
の動作手順を示すフローチャートである。
【図5】 実施の形態1における標準パターンと特徴ベ
クトルの時系列4との対応付けの概要を示す説明図であ
る。
【図6】 この発明の実施の形態1による標準パターン
作成方法を示すフローチャートである。
【図7】 この発明の実施の形態2による標準パターン
作成装置を示すブロック図である。
【図8】 実施の形態2におけるポーズ区別オーバーラ
ップ初期値作成手段の動作手順を示すフローチャートで
ある。
【図9】 実施の形態2におけるポーズ区別オーバーラ
ップ初期値作成手段の動作の概要を示す説明図である。
【図10】 この発明の実施の形態2による標準パター
ン作成方法を示すフローチャートである。
【図11】 この発明の実施の形態3による標準パター
ン作成装置を示すブロック図である。
【図12】 実施の形態3におけるスペクトル変化オー
バーラップ初期値作成手段の動作手順を示すフローチャ
ートである。
【図13】 実施の形態3におけるスペクトル変化オー
バーラップ初期値作成手段の動作の概要を示す説明図で
ある。
【図14】 この発明の実施の形態3による標準パター
ン作成方法を示すフローチャートである。
【図15】 この発明の実施の形態4による標準パター
ン作成装置を示すブロック図である。
【図16】 この発明の実施の形態4による標準パター
ン作成方法を示すフローチャートである。
【図17】 従来の標準パターン作成装置を示すブロッ
ク図である。
【図18】 従来の標準パターン作成装置における初期
値作成手段の動作手順を示すフローチャートである。
【図19】 従来の標準パターン作成装置における初期
値作成手段の動作の概要を示す説明図である。
【図20】 従来の標準パターン作成装置における標準
パターン作成手段の動作手順を示すフローチャートであ
る。
【符号の説明】
1 入力端子、2 入力音声信号、3 分析手段、4
特徴ベクトルの時系列、7 標準パターン作成手段、8
標準パターン、9 オーバーラップ初期値作成手段
(初期値作成手段)、10 オーバーラップ初期値(標
準パターンの初期値)、11 ポーズ区別オーバーラッ
プ初期値作成手段(初期値作成手段)、12 ポーズ区
別オーバーラップ初期値(標準パターンの初期値)、1
3 スペクトル変化オーバーラップ初期値作成手段(初
期値作成手段)、14 スペクトル変化オーバーラップ
初期値(標準パターンの初期値)、15 特徴ベクトル
記憶メモリ、16 標準パターン作成手段、17a,1
7b,17c 標準パターン、18 標準パターン選択
手段、19 標準パターン。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 入力音声の特徴ベクトルの時系列を互い
    にオーバーラップする小区間に区切り、当該各小区間に
    属する特徴ベクトルの時系列を平均して標準パターンの
    初期値を作成する初期値作成手段と、 前記特徴ベクトルの時系列と、前記初期値作成手段が作
    成した標準パターンの初期値の各状態とをパターンマッ
    チングによって対応付け、前記各状態ごとに対応付けら
    れた前記特徴ベクトルの時系列を平均して標準パターン
    の更新を行う標準パターン作成手段とを備えた標準パタ
    ーン作成装置。
  2. 【請求項2】 初期値作成手段として、互いにオーバー
    ラップする小区間の区間長を均等分割に基づいて決定
    し、前記各小区間に属する特徴ベクトルの時系列を平均
    してそれぞれの標準パターンの初期値を作成するオーバ
    ーラップ初期値作成手段を備えたことを特徴とする請求
    項1記載の標準パターン作成装置。
  3. 【請求項3】 初期値作成手段として、互いにオーバー
    ラップする小区間をポーズ区間と音声区間とで別個に決
    定し、前記各小区間に属する特徴ベクトルの時系列を平
    均してそれぞれの標準パターンの初期値を作成するポー
    ズ区別オーバーラップ初期値作成手段を備えたことを特
    徴とする請求項1記載の標準パターン作成装置。
  4. 【請求項4】 初期値作成手段として、特徴ベクトルの
    時系列が前の時刻より大きく変化している時刻の特徴ベ
    クトルの時系列をそのオーバーラップする区間に含むよ
    うに、互いにオーバーラップする小区間を決定し、前記
    各小区間に属する特徴ベクトルの時系列を平均して標準
    パターンの初期値を作成するスペクトル変化オーバーラ
    ップ初期値作成手段を備えたことを特徴とする請求項1
    記載の標準パターン作成装置。
  5. 【請求項5】 初期値作成手段として、均等分割に基づ
    いて決定した各小区間に属する特徴ベクトルの時系列を
    平均して標準パターンの初期値を作成するオーバーラッ
    プ初期値作成手段と、ポーズ区間と音声区間とで別個に
    決定した各小区間に属する特徴ベクトルの時系列を平均
    して標準パターンの初期値を作成するポーズ区別オーバ
    ーラップ初期値作成手段と、前の時刻との間の変化量が
    大きい時刻の特徴ベクトルをそのオーバーラップ区間に
    含むように決定した各小区間に属する特徴ベクトルの時
    系列を平均して標準パターンの初期値を作成するスペク
    トル変化オーバーラップ初期値作成手段を備え、 前記オーバーラップ初期値作成手段、ポーズ区別オーバ
    ーラップ初期値作成手段、およびスペクトル変化オーバ
    ーラップ初期値作成手段によって作成された標準パター
    ンの初期値を用いてそれぞれの標準パターンを作成する
    標準パターン作成手段と、 前記標準パターン作成手段の作成する各標準パターンと
    入力音声の特徴ベクトルの時系列とのパターンマッチン
    グを行い、パターンマッチング距離が最小の標準パター
    ンを選択する標準パターン選択手段とを有することを特
    徴とする請求項1記載の標準パターン作成装置。
  6. 【請求項6】 入力音声の特徴ベクトルの時系列を時間
    軸方向に圧縮し、複数の状態数の標準パターンを作成す
    る標準パターン作成方法において、 前記特徴ベクトルの時系列を互いにオーバーラップする
    小区間に区切り、 区切られた前記各小区間に属する特徴ベクトルの時系列
    を平均して標準パターンの初期値を作成し、 作成された前記標準パターンの初期値の各状態と、前記
    入力音声の特徴ベクトルの時系列との対応付けをパター
    ンマッチングによって行い、 前記各状態ごとに対応付けられた特徴ベクトルの時系列
    を平均して、標準パターンの更新を行うことを特徴とす
    る標準パターン作成方法。
  7. 【請求項7】 入力音声の特徴ベクトルの時系列を互い
    にオーバーラップする小区間に区切り、当該各小区間に
    属する特徴ベクトルの時系列を平均して標準パターンの
    初期値を作成する際に、前記小区間の区間長を均等分割
    に基づいて決定することを特徴とする請求項6記載の標
    準パターン作成方法。
  8. 【請求項8】 入力音声の特徴ベクトルの時系列を互い
    にオーバーラップする小区間に区切り、当該各小区間に
    属する特徴ベクトルの時系列を平均して標準パターンの
    初期値を作成する際に、前記小区間をポーズ区間と音声
    区間とで別個に決定することを特徴とする請求項6記載
    の標準パターン作成方法。
  9. 【請求項9】 入力音声の特徴ベクトルの時系列を互い
    にオーバーラップする小区間に区切り、当該各小区間に
    属する特徴ベクトルを平均して標準パターンの初期値を
    作成する際に、前記小区間の互いにオーバーラップする
    区間に、前記特徴ベクトルの時系列で前の時刻との特徴
    ベクトルの変化量が大きい時刻の特徴ベクトルの時系列
    を含むように前記小区間を決定することを特徴とする請
    求項6記載の標準パターン作成方法。
  10. 【請求項10】 入力音声の特徴ベクトルの時系列を、
    互いにオーバーラップした小区間に区切る際に、均等分
    割、ポーズ区間と音声区間とで別個に、および前の時刻
    との変化量が大きい時刻の特徴ベクトルの時系列を含ま
    せるといった異なる複数の方法で区切り、 前記各方法で区切られた小区間に属する特徴ベクトルの
    時系列を平均して作成した標準パターンの初期値を用い
    てそれぞれの標準パターンを作成し、 作成された各標準パターンと前記特徴ベクトルの時系列
    とのパターンマッチングを行い、パターンマッチング距
    離が最小の標準パターンを選択することを特徴とする請
    求項6記載の標準パターン作成方法。
  11. 【請求項11】 入力音声の特徴ベクトルの時系列を互
    いにオーバーラップする小区間に区切り、それら各小区
    間に属する特徴ベクトルの時系列を平均して標準パター
    ンの初期値を作成する初期値作成のステップと、 パターンマッチングによって、前記特徴ベクトルの時系
    列と前記標準パターンの初期値の各状態とを対応付け、
    前記各状態ごとに対応付けられた特徴ベクトルの時系列
    を平均して標準パターンの更新を行う標準パターン作成
    のステップとを有する標準パターン作成をコンピュータ
    に実行させるためのプログラムを記録したコンピュータ
    読み取り可能な記録媒体。
  12. 【請求項12】 標準パターンの初期値を作成するステ
    ップとして、互いにオーバーラップする小区間の区間長
    を均等分割に基づいて決定し、前記各小区間に属する特
    徴ベクトルの時系列を平均して標準パターンの初期値を
    作成するオーバーラップ初期値作成のステップを有する
    ことを特徴とする請求項11記載の記録媒体。
  13. 【請求項13】 標準パターンの初期値を作成するステ
    ップとして、互いにオーバーラップする小区間をポーズ
    区間と音声区間で別個に決定し、前記各小区間に属する
    特徴ベクトルの時系列を平均して標準パターンの初期値
    を作成するポーズ区別オーバーラップ初期値作成のステ
    ップを有することを特徴とする請求項11記載の記録媒
    体。
  14. 【請求項14】 標準パターンの初期値を作成するステ
    ップとして、互いにオーバーラップする小区間のオーバ
    ーラップする区間に、特徴ベクトルの時系列で、前の時
    刻との変化量が大きい時刻の特徴ベクトルの時系列を含
    むように小区間を決定し、それら各小区間に属する特徴
    ベクトルの時系列を平均して標準パターンの初期値を作
    成するスペクトル変化オーバーラップ初期値作成のステ
    ップを有することを特徴とする請求項11記載の記録媒
    体。
  15. 【請求項15】 標準パターンの初期値を作成するステ
    ップとして、均等分割に基づいて決定した各小区間に属
    する特徴ベクトルの時系列を平均して標準パターンの初
    期値を作成するオーバーラップ初期値作成のステップ
    と、ポーズ区間と音声区間とで別個に決定した各小区間
    に属する特徴ベクトルの時系列を平均して標準パターン
    の初期値を作成するポーズ区別オーバーラップ初期値作
    成のステップと、前の時刻との変化量が大きい時刻の特
    徴ベクトルを含むように決定した各小区間に属する特徴
    ベクトルの時系列を平均して標準パターンの初期値を作
    成するスペクトル変化オーバーラップ初期値作成のステ
    ップとを備え、 前記標準パターンの初期値を作成する各ステップによっ
    て作成された標準パターンの初期値を用いてそれぞれの
    標準パターンを作成する標準パターン作成のステップ
    と、 前記特徴ベクトルの時系列と前記標準パターン作成のス
    テップで作成された各標準パターンとのパターンマッチ
    ングを行い、パターンマッチング距離が最小の標準パタ
    ーンを選択する標準パターン選択のステップを有するこ
    とを特徴とする請求項11記載の記録媒体。
JP25942199A 1999-09-13 1999-09-13 標準パターン作成装置と方法および記録媒体 Expired - Fee Related JP4067716B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP25942199A JP4067716B2 (ja) 1999-09-13 1999-09-13 標準パターン作成装置と方法および記録媒体
EP00119234A EP1085498A3 (en) 1999-09-13 2000-09-06 Reference speech pattern generating method
CNB001338323A CN1165888C (zh) 1999-09-13 2000-09-12 基准图形生成装置和方法
US09/660,478 US6708151B1 (en) 1999-09-13 2000-09-12 Reference pattern generating apparatus and method, and computer readable medium having reference pattern generating program embodied thereon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25942199A JP4067716B2 (ja) 1999-09-13 1999-09-13 標準パターン作成装置と方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2001083980A true JP2001083980A (ja) 2001-03-30
JP4067716B2 JP4067716B2 (ja) 2008-03-26

Family

ID=17333876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25942199A Expired - Fee Related JP4067716B2 (ja) 1999-09-13 1999-09-13 標準パターン作成装置と方法および記録媒体

Country Status (4)

Country Link
US (1) US6708151B1 (ja)
EP (1) EP1085498A3 (ja)
JP (1) JP4067716B2 (ja)
CN (1) CN1165888C (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
US4837831A (en) * 1986-10-15 1989-06-06 Dragon Systems, Inc. Method for creating and using multiple-word sound models in speech recognition
JPS6444997A (en) 1987-08-13 1989-02-17 Ricoh Kk Reference pattern registration system
US5202952A (en) * 1990-06-22 1993-04-13 Dragon Systems, Inc. Large-vocabulary continuous speech prefiltering and processing system
US5455889A (en) * 1993-02-08 1995-10-03 International Business Machines Corporation Labelling speech using context-dependent acoustic prototypes
US5822730A (en) * 1996-08-22 1998-10-13 Dragon Systems, Inc. Lexical tree pre-filtering in speech recognition
US6260013B1 (en) * 1997-03-14 2001-07-10 Lernout & Hauspie Speech Products N.V. Speech recognition system employing discriminatively trained models
GB9802836D0 (en) * 1998-02-10 1998-04-08 Canon Kk Pattern matching method and apparatus

Also Published As

Publication number Publication date
CN1165888C (zh) 2004-09-08
JP4067716B2 (ja) 2008-03-26
EP1085498A3 (en) 2005-02-09
EP1085498A2 (en) 2001-03-21
CN1301006A (zh) 2001-06-27
US6708151B1 (en) 2004-03-16

Similar Documents

Publication Publication Date Title
JP4145796B2 (ja) テキストファイルのディクテーションを筆記するための及びテキストを修正するための方法及びシステム
US8386256B2 (en) Method, apparatus and computer program product for providing real glottal pulses in HMM-based text-to-speech synthesis
US9767790B2 (en) Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
JP2007249212A (ja) テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ
JPH0355837B2 (ja)
JPWO2005109399A1 (ja) 音声合成装置および方法
US6278972B1 (en) System and method for segmentation and recognition of speech signals
JP2004310098A (ja) スイッチング状態空間型モデルによる変分推論を用いた音声認識の方法
JP5790646B2 (ja) パープレキシティ算出装置
JP2004054298A (ja) 音声認識の方法および音声信号を復号化する方法
JP2023539948A (ja) ロングコンテキストエンドツーエンド音声認識システム
JP2001282278A (ja) 音声情報処理装置及びその方法と記憶媒体
JP6261924B2 (ja) 韻律編集装置、方法およびプログラム
JPH11161464A (ja) 日本語文章作成装置
CN110956020B (zh) 呈现校正候选的方法、存储介质和信息处理设备
JP2001083980A (ja) 標準パターン作成装置と方法および記録媒体
JP6027754B2 (ja) 適応化装置、音声認識装置、およびそのプログラム
JP5914119B2 (ja) 音響モデル性能評価装置とその方法とプログラム
JP6472342B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP2002287785A (ja) 音声セグメンテーション装置及びその方法並びにその制御プログラム
JP2004341259A (ja) 音声素片伸縮装置およびその方法
CN110955401B (zh) 声音回放区间控制方法、计算机可读存储介质和信息处理装置
WO2017028003A1 (zh) 基于隐马尔科夫模型的语音单元拼接方法
CN110600005A (zh) 语音识别纠错方法及装置、计算机设备和记录介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees