JPH0434499A - 発声法指示装置 - Google Patents
発声法指示装置Info
- Publication number
- JPH0434499A JPH0434499A JP2140628A JP14062890A JPH0434499A JP H0434499 A JPH0434499 A JP H0434499A JP 2140628 A JP2140628 A JP 2140628A JP 14062890 A JP14062890 A JP 14062890A JP H0434499 A JPH0434499 A JP H0434499A
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- lattice
- uttered
- string
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 112
- 239000011159 matrix material Substances 0.000 claims abstract description 100
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 230000001755 vocal effect Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 2
- 230000033764 rhythmic process Effects 0.000 abstract 3
- 230000001186 cumulative effect Effects 0.000 description 33
- 238000010586 diagram Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 5
- 101150021503 Mesd gene Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- HLYQBBSYKLLKAF-UHFFFAOYSA-N 4-o-(2,5-dioxopyrrolidin-1-yl) 1-o-[2-(2,5-dioxopyrrol-1-yl)ethyl] butanedioate Chemical compound O=C1C=CC(=O)N1CCOC(=O)CCC(=O)ON1C(=O)CCC1=O HLYQBBSYKLLKAF-UHFFFAOYSA-N 0.000 description 1
- 241000862969 Stella Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
この発明は、音節認識結果あるいは音韻認識結果に基づ
く音声認識装置におけるユーザ支援装置としての発声法
指示装置に関する。
く音声認識装置におけるユーザ支援装置としての発声法
指示装置に関する。
音節認識結果に基づく特定話者用音声認識装置として第
13図に示すようなものがある。第13図において、音
響処理部1に入力された音声信号はA/D変換され、パ
ワー、ケプストラム係数等の特徴パラメータが抽出され
る。そしてさらに、この特徴パラメータからパワー変化
やスペクトル変化が算出される。そうすると、音節切出
部2では、パワー変化やスペクトル変化の変化点から音
節境界候補が求められる。そして、上記音節切出部2に
おいて音節候補毎に切り出された入力音声の特徴パラメ
ータの時系列(特徴パターン)と、音節標準パターン格
納部5に格納された音節標準パターンとのマツチングが
音節照合部3によって実施され、その結果複数の音節候
補の時系列から成る音節ラティスが得られる。その際に
、音節ラティスの各音節候補には標準パターンとの類似
度に基づく信頼度が付加され、その信頼度の高い順に音
節候補が配列されているのである。言語処理部4では上
記音節ラティスから順次選出される音節候補の組み合わ
せと単語辞書との照合が行われて、文法的に意味のある
単語候補が認識結果として出力されるのである。 上記音節認識結果に基づく特定話者用音声認識装置にお
いては、音節切出部2で求めた音節境界候補の位置に従
って音節候補毎の特徴パターンを切り出し、この音節候
補毎の特徴パターンに基づいて単語候補を得るので、次
のような問題がある。 すなわち、話者の発声がはっきりしない場合には、明瞭
なパワー変化やスペクトル変化の変化点が得られない場
合がある。その場合には、得られる音節境界候補の位置
がはっきりせず誤った音節境界候補の位置を求めてしま
う。その結果、音節切り出し時において、音節の脱落、
音節の併合、音節の分離誤り等が生じてしまうのである
。 しかしながら、音声認識装置の操作に熟達した人は、経
験によって上述のような切り出し誤りが生じ易い音節や
音節位置(語頭1語中および語尾)をよく知っている。 したかって、その音節や音節位置の際に注意して明瞭に
発声することによって、高い音声認識率を得ることがで
きるのである。 これに対して、初心者は、身近に熟練者やインストラク
タがいない場合には、経験によって上記切り出し誤りが
生じ易い音節や音節位置および明瞭な発声方法を会得し
なければならず、音声認識装置を使いこなすには時間が
掛かるという問題がある。 従来、このような問題に対処するために、入力された音
声信号から発声速度を検出し、この検出された発声速度
がある閾値を越えた場合には、発声速度を低めるような
メツセージを出力するような発声法指示部を備えた音声
認識装置がある。
13図に示すようなものがある。第13図において、音
響処理部1に入力された音声信号はA/D変換され、パ
ワー、ケプストラム係数等の特徴パラメータが抽出され
る。そしてさらに、この特徴パラメータからパワー変化
やスペクトル変化が算出される。そうすると、音節切出
部2では、パワー変化やスペクトル変化の変化点から音
節境界候補が求められる。そして、上記音節切出部2に
おいて音節候補毎に切り出された入力音声の特徴パラメ
ータの時系列(特徴パターン)と、音節標準パターン格
納部5に格納された音節標準パターンとのマツチングが
音節照合部3によって実施され、その結果複数の音節候
補の時系列から成る音節ラティスが得られる。その際に
、音節ラティスの各音節候補には標準パターンとの類似
度に基づく信頼度が付加され、その信頼度の高い順に音
節候補が配列されているのである。言語処理部4では上
記音節ラティスから順次選出される音節候補の組み合わ
せと単語辞書との照合が行われて、文法的に意味のある
単語候補が認識結果として出力されるのである。 上記音節認識結果に基づく特定話者用音声認識装置にお
いては、音節切出部2で求めた音節境界候補の位置に従
って音節候補毎の特徴パターンを切り出し、この音節候
補毎の特徴パターンに基づいて単語候補を得るので、次
のような問題がある。 すなわち、話者の発声がはっきりしない場合には、明瞭
なパワー変化やスペクトル変化の変化点が得られない場
合がある。その場合には、得られる音節境界候補の位置
がはっきりせず誤った音節境界候補の位置を求めてしま
う。その結果、音節切り出し時において、音節の脱落、
音節の併合、音節の分離誤り等が生じてしまうのである
。 しかしながら、音声認識装置の操作に熟達した人は、経
験によって上述のような切り出し誤りが生じ易い音節や
音節位置(語頭1語中および語尾)をよく知っている。 したかって、その音節や音節位置の際に注意して明瞭に
発声することによって、高い音声認識率を得ることがで
きるのである。 これに対して、初心者は、身近に熟練者やインストラク
タがいない場合には、経験によって上記切り出し誤りが
生じ易い音節や音節位置および明瞭な発声方法を会得し
なければならず、音声認識装置を使いこなすには時間が
掛かるという問題がある。 従来、このような問題に対処するために、入力された音
声信号から発声速度を検出し、この検出された発声速度
がある閾値を越えた場合には、発声速度を低めるような
メツセージを出力するような発声法指示部を備えた音声
認識装置がある。
上述のように、音節認識結果に基づく特定話者用音声認
識装置においては、得られる音節境界候補の位置がはっ
きりしない場合には音節の脱落。 音節の併合、音節の分離誤り等が生しる。そこで、高い
認識率を得るためには明瞭な音節境界候補の位置が得ら
れるように発声しなければならない。 ところが、上記発声法指示部を備えた音声認識装置にお
いては、単に発声速度を低めるようなメソセージを出力
するだけである。したがって、そのようなメツセージか
らは具体的にどのように発声すれば明瞭な音節境界候補
の位置が得られるかは不明であり、ユーザがメツセージ
に従って発声しても正しい発声かできないのである。 そこで、この発明の目的は、身近に熟練者やインストラ
クタがいない初心者であっても音声認識装置を短時間の
うちに使いこなせ、かつ高い音声認識率を得ることがで
きるように、ユーザの発声法を訓練するための発声指示
装置を提供することにある。
識装置においては、得られる音節境界候補の位置がはっ
きりしない場合には音節の脱落。 音節の併合、音節の分離誤り等が生しる。そこで、高い
認識率を得るためには明瞭な音節境界候補の位置が得ら
れるように発声しなければならない。 ところが、上記発声法指示部を備えた音声認識装置にお
いては、単に発声速度を低めるようなメソセージを出力
するだけである。したがって、そのようなメツセージか
らは具体的にどのように発声すれば明瞭な音節境界候補
の位置が得られるかは不明であり、ユーザがメツセージ
に従って発声しても正しい発声かできないのである。 そこで、この発明の目的は、身近に熟練者やインストラ
クタがいない初心者であっても音声認識装置を短時間の
うちに使いこなせ、かつ高い音声認識率を得ることがで
きるように、ユーザの発声法を訓練するための発声指示
装置を提供することにある。
上記目的を達成するため、この発明の発声法指示装置は
、発声すべき音節の順序を表す発声音節列又は発声音韻
列に従って発声された音声に基づく音声信号から特徴パ
ターンを抽出し、この抽出された特徴パターンに基づい
て上記音声信号を音節単位又は音韻単位で認識して音節
ラティス又は音韻ラティスを生成する音声認識部と、上
記音声認識部によって生成された音節ラティス又は音韻
ラティスと上記発声音節列又は発声音韻列とを取り込ん
で、上記発声音節列の各音節位置と上記音節ラティスの
総ての音節位置との距離あるいは上記発声音韻列の各音
韻位置と上記音韻ラティスの総ての音韻位置との距離を
所定の手順で算出する距離計算部と、上記距離計算部に
よって算出された上記距離を用いて、上記発声音節列と
上記音節ラティスとのDPマツチングあるいは上記発声
音韻列と上記音韻ラティスとのDPマツチングを行って
、DPパスの終点から始点に向かって上記DPパスを遡
る際における各格子点から次の格子点への方向を表すパ
ス行列を生成するDP部と、上記DP部によって生成さ
れた上記パス行列で表される上記方向に基づいて、上記
発声音節列の各音節位置と上記音節ラティスの各音節位
置とを対応付けた対応表あるいは上記発声音韻列の各音
韻位置と上記音韻ラティスの各音韻位置とを対応付けた
対応表を作成する対応表作成部と、上記対応表作成部に
よって作成された上記対応表を参照して、上記発声音節
列と音節ラティスとの音節位置対応関係あるいは発声音
韻列と音韻ラティスとの音韻位置対応関係が1対1でな
い箇所を検索し、この検索された箇所とその箇所におけ
る上記音節位置対応関係又は音韻位置対応関係とに従っ
て、上記発声音節列又は発声音韻列をより正しく発声す
るための発声法指示メツセージを生成する発声法指示メ
ツセージ生成部を備えたことを特徴としている。
、発声すべき音節の順序を表す発声音節列又は発声音韻
列に従って発声された音声に基づく音声信号から特徴パ
ターンを抽出し、この抽出された特徴パターンに基づい
て上記音声信号を音節単位又は音韻単位で認識して音節
ラティス又は音韻ラティスを生成する音声認識部と、上
記音声認識部によって生成された音節ラティス又は音韻
ラティスと上記発声音節列又は発声音韻列とを取り込ん
で、上記発声音節列の各音節位置と上記音節ラティスの
総ての音節位置との距離あるいは上記発声音韻列の各音
韻位置と上記音韻ラティスの総ての音韻位置との距離を
所定の手順で算出する距離計算部と、上記距離計算部に
よって算出された上記距離を用いて、上記発声音節列と
上記音節ラティスとのDPマツチングあるいは上記発声
音韻列と上記音韻ラティスとのDPマツチングを行って
、DPパスの終点から始点に向かって上記DPパスを遡
る際における各格子点から次の格子点への方向を表すパ
ス行列を生成するDP部と、上記DP部によって生成さ
れた上記パス行列で表される上記方向に基づいて、上記
発声音節列の各音節位置と上記音節ラティスの各音節位
置とを対応付けた対応表あるいは上記発声音韻列の各音
韻位置と上記音韻ラティスの各音韻位置とを対応付けた
対応表を作成する対応表作成部と、上記対応表作成部に
よって作成された上記対応表を参照して、上記発声音節
列と音節ラティスとの音節位置対応関係あるいは発声音
韻列と音韻ラティスとの音韻位置対応関係が1対1でな
い箇所を検索し、この検索された箇所とその箇所におけ
る上記音節位置対応関係又は音韻位置対応関係とに従っ
て、上記発声音節列又は発声音韻列をより正しく発声す
るための発声法指示メツセージを生成する発声法指示メ
ツセージ生成部を備えたことを特徴としている。
発声音節列又は発声音韻列に従って発声された音声に基
づく音声信号が音声認識部に入力され、音節単位又は音
韻単位で認識されて音節ラティス又は音韻ラティスが生
成される。そして、距離計算部によって、上記音節ラテ
ィス又は音韻ラティスと上記発声音節列又は発声音韻列
とが取り込まれて、上記発声音節列の各音節位置と上記
音韻ラティスの総ての音節位置との距離あるいは上記発
声音韻列の各音韻位置と上記音韻ラティスの総ての音韻
位置との距離が所定の手順で算出される。 そうすると、DP部は、上記距離計算部によって算出さ
れた上記距離を用いて、上記発声音節列と上記音節ラテ
ィスとのDPマツチングあるいは上記発声音韻列と上記
音韻ラティスとのDPマツチングを行って、DPババス
終点から始点に向かって上記DPパスを遡る際における
各格子点から次の格子点への方向を表すパス行列を生成
する。そして、対応表作成部によって、上記DP部で生
成された上記パス行列で表される上記方向に基づいて、
上記発声音節列の各音節位置と上記音節ラティスの各音
節位置とを対応付けた対応表あるいは上記発声音韻列の
各音韻位置と上記音韻ラティスの各音韻位置とを対応付
けた対応表が作成される。 そうすると、発声法指示メツセージ生成部は、上記対応
表作成部によって作成された上記対応表を参照して、上
記発声音節列と音節ラティスとの音節位置対応関係ある
いは上記発声音韻列と音韻ラティスとの音韻位置対応関
係が1対!でない箇所を検索し、この検索された箇所と
その箇所における上記音節位置対応関係又は音韻位置対
応関係とに従って、上記発声音節列又は発声音韻列をよ
り正しく発声するための発声法指示メツセージを生成す
る。 したがって、ユーザは、上記発声法指示メツセージ生成
部によって生成される発声法指示メツセージに従って発
声法を訓練することによって、明瞭な音節境界候補の位
置が得られるような発声法を会得することができるので
ある。
づく音声信号が音声認識部に入力され、音節単位又は音
韻単位で認識されて音節ラティス又は音韻ラティスが生
成される。そして、距離計算部によって、上記音節ラテ
ィス又は音韻ラティスと上記発声音節列又は発声音韻列
とが取り込まれて、上記発声音節列の各音節位置と上記
音韻ラティスの総ての音節位置との距離あるいは上記発
声音韻列の各音韻位置と上記音韻ラティスの総ての音韻
位置との距離が所定の手順で算出される。 そうすると、DP部は、上記距離計算部によって算出さ
れた上記距離を用いて、上記発声音節列と上記音節ラテ
ィスとのDPマツチングあるいは上記発声音韻列と上記
音韻ラティスとのDPマツチングを行って、DPババス
終点から始点に向かって上記DPパスを遡る際における
各格子点から次の格子点への方向を表すパス行列を生成
する。そして、対応表作成部によって、上記DP部で生
成された上記パス行列で表される上記方向に基づいて、
上記発声音節列の各音節位置と上記音節ラティスの各音
節位置とを対応付けた対応表あるいは上記発声音韻列の
各音韻位置と上記音韻ラティスの各音韻位置とを対応付
けた対応表が作成される。 そうすると、発声法指示メツセージ生成部は、上記対応
表作成部によって作成された上記対応表を参照して、上
記発声音節列と音節ラティスとの音節位置対応関係ある
いは上記発声音韻列と音韻ラティスとの音韻位置対応関
係が1対!でない箇所を検索し、この検索された箇所と
その箇所における上記音節位置対応関係又は音韻位置対
応関係とに従って、上記発声音節列又は発声音韻列をよ
り正しく発声するための発声法指示メツセージを生成す
る。 したがって、ユーザは、上記発声法指示メツセージ生成
部によって生成される発声法指示メツセージに従って発
声法を訓練することによって、明瞭な音節境界候補の位
置が得られるような発声法を会得することができるので
ある。
以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の発声法指示装置のブロック図である
。第1図は第13図に示すブロック図と大略同じであり
、発声法指示部16を備えた点が異なる。 この発声法指示装置は、処理モードを認識モードに切り
替えることによって発声法指示部!6が非動作状態とな
り、音響処理部If、音節切出部12、音節照合部!3
および言語処理部14が上述のような特定話者用音声認
識装置として動作して入力音声を認識し、言語処理部1
4から認識結果を出力する。一方、インストモードに切
り替えることによって発声法指示部16が動作状態とな
り、以下に詳述するように発声法指示装置として動作す
る。 すなわち、予め設定されてメモリ(図示せず)に格納さ
れた発声すべき音節の順序を表す複数の発声音節列のう
ち、一つの発声音節列(例えば、「わらしの」)が表示
画面(図示せず)等に表示される。 そして、ユーザはこの表示された発声音節列と同じ音節
列を発声する。そうすると、ユーザの発声による音声に
基づく音声信号は音響処理部11に入力されて音声信号
のパワー変化やスペクトル変化が算出され、さらに音節
切出部I2によって音節境界候補毎の特徴パターンが切
り出される。そして、音節照合部!3によって上記特徴
パターンと音節標準パターン格納部!5に格納された音
節標準パターンとに基づいて音節ラティスが生成される
。 こうして得られた音節ラティスは発声法指示部16に入
力される。そうすると、発声法指示部I6は入力された
音節ラティスと上記メモリから読み出された発声音節列
とからユーザに対する発声法指示のメツセージを生成し
て出力するのである。 こうすることによって、ユーザは先程発声した発声音節
列について、どのように発声したら正しい音節境界候補
が得られるかを知ることができるのである。すなわち、
ユーザは、上記発声法指示メツセージに従って発声法を
訓練することによって、音声認識装置を使いこなすため
の発声法を会得することができるのである。 第2図は上記発声法指示部】6の詳細なブロック図であ
る。この発声法指示部16は、距離計算部21.DP部
22.音節対応表作成部23および発声法指示メツセー
ジ生成部24から概略構成される。 上記距離計算部21は、第1図に示す音節照合部13か
ら入力される音節ラティス(第4図に例示)とメモリ等
から読み出された発声音節列(第3図に例示)とから、
後に詳述するようにして発声音節列の音節位置と音節ラ
ティスの音節位置との距離を算出して、発声音節列にお
ける音節位置番号を行とし音節ラチスにおける音節位置
番号を列とする距離行列(第5図に例示)を作成する。 DP部22は、後に詳述するように動的計画法(DP)
によって、発声音節列の音節位置番号と音節ラティスの
音節位置番号との最適な対応関係を求めるための累積行
列(第6図に例示)を作成し、さらにこの累積行列から
パス行列(第7図に例示)を作成する。音節対応表作成
部23は、DP部22によって作成されたパス行列の終
点から始点までDPパスを逆にたどって、行と列との最
適な対応関係を表す音節対応表(第8図に例示)を作成
する。発声法指示メツセージ生成部24は、音節対応表
作成部23によって作成された音節対応表を参照して音
節切り出し誤りの種類と位置とを判定する。そして、再
発声の際に音節切り出し誤りを回避できるように発声法
指示メツセージを生成して出力する。 第5図に例示する距離行列、第6図に例示する累積行列
、第7図に例示するパス行列および第8図に例示する音
節対応表は、第3図に示すような発声音節列「わらじの
」と、ユーザが「わらじの」と発声した際に2音節目が
脱落する一方4音節目が長音化した場合に上記音節照合
部13によって得られる第4図に示すような音節ラティ
スとに基づいて作成されたものである。但し、第4図に
おいては音節候補「わJ、rLJ、rの」および「お」
以外の音節候補は省略して表現しである。 第9図は、上記距離計算部21によって実施される距離
行列作成処理動作のフローチャートである。以下、第9
図に従って距離行列作成処理動作について詳細に説明す
る。 ここで、 rer(i):発声音節列におけるi番目の音節1n(
j、k):音節ラティスのj番目の音節位置における信
頼変事に位の音節候補 d(i、D:距離行列の要素値 1、J、に:夫々i、j、にの最大値(但し、本実施例
においてはに=4) a+:作業用変数 とする。 ステップSlで、発声音節列における音節位置番号iに
初期値“ビがセットされる。 ステップS2で、音節ラティスにおける音節位置番号j
に初期値“ビがセットされる。 ステップS3で、作業用変数mに初期値“lO”がセッ
トされ、音節ラティスにおける音節候補の信頼度順位k
に初期値“1”がセットされる。 ステップS4で、ref(i)= 1n(j、k)が成
立するか否かが判定される。その結果成立すればステッ
プS5に進み、そうでなければステップS5をスキップ
する。 すなわち、発声音節列におけるi番目の音節と音節ラテ
ィスにおけるj番目の音節候補群中の信頼変事に位の音
節候補とが同じである場合にはステップS5を実施する
のである。 ステップS5で、作業用変数1の内容が“k+2”に更
新される。 ステップS6で、信頼度順位にの内容がインクリメント
される。 ステップS7で、k>Kが成立するか否かが判定される
。その結果、成立すればステップS8に進む。一方、成
立しなければステップS4に戻って、発声音節列におけ
るi番目の音節と音節ラティスのj番目の音節候補群中
における次の信頼度順位の音節候補とが比較される。 ステップS8で、距離行列の要素値d(i、Dの内容が
“−“に更新される。 ステップS9で、音節ラティスにおける音節位置番号j
の内容がインクリメントされる。 ステップSlOで、j>Jが成立するか否かが判定され
る。その結果、成立すればステップSllに進む。一方
、成立しなければステップS3に戻って、発声音節列に
おけるi番目の音節と音節ラティスにおける次の音節位
置番号の総ての音節候補とが比較される。 ステップSllで、発声音節列における音節位置番号1
の内容がインクリメントされる。 ステップS12で、i>1が成立するか否かが判定され
る。その結果、成立しなければステップS2に戻って発
声音節列における次の音節位置番号の音節と音節ラティ
スにおける総ての音節候補とが比較される。一方、成立
すれば距離行列作成処理動作を終了する。 こうして、第5図に示すような距離行列が作成される。 この距離行列は発声音節列における音節位置番号iを行
とする一方音節ラティスにおける音節位置番号jを列と
し、その要素値は音節位置番号iに属する音節と音節位
置番号jに属する各音節候補との互いの信頼度に基づく
距離(最大値“10”)の最小値である。すなわち、距
離行列は、発声音声列における音節位置番号iと音節ラ
ティスにおける音節位置番号jとの距離を表していると
言えるのである。 第10図は、上記DP部22によって実施される累積行
列/パス行列作成処理動作のフローチャートである。以
下、第10図に従って累積行列/パス行列作成処理動作
について詳細に説明する。 ここで、 d(i、コ):距離行列の要素値 g(i、j)・累積行列の要素値 pt(i、j):パス行列の要素値 1、J:夫々i、jの最大値 di、d2.d3.m:作業用変数 とする。 ステップS21で、累積行列の要素値d(1,1)に距
離行列の要素値g(1,1)の要素値がセットされ、パ
ス行列の要素値pt(t、t)が“0”にセットされる
。 ステップS22で、距離行列、累積行列およびパス行列
の行番号i(発声音節列における音節位置番号iに対応
)に°2“がセットさ−れる。 ステップS23で、累積行列における1行1列の要素値
g(i、1)が、累積行列および距離行列に基づいて次
式によって算出される。 g(i、1)=g(i−1,1)+d(i、1)また、
パス行列における1行1列の要素値pL(il)が“ビ
にセットされる。 ステップS24で、行番号iの内容がインクリメントさ
れる。 ステップS25で、i>1が成立するか否かが判定され
る。その結果、成立すればステップS26に進む。一方
、成立しなければステップS23に戻って、累積行列の
1列目における次行の要素値が算出される。 こうして、行番号iの内容を順次インクリメントしてス
テップS23を繰り返して実行することによって、累積
行列における1列目の各要素値は距離行列における1列
目の各要素値の累積値となる。 また、バス行列の1列目における2行目以降の総ての要
素値は“ビとなるのである。 ステップS26で、距離行列1累積行列およびバス行列
の列番号j(音節ラティスにおける音節位置番号jに対
応)に“2“がセットされる。 ステップS27で、累積行列における1行j列の要素f
tig(1,j)が、累積行列および距離行列に基づい
て次式によって算出される。 g(1,j)=g(1,j−1)+d(1,j)また、
パス行列における1行j列の要素値pt(1j)が“3
”にセットされる。 ステップ62gで、列番号jの内容がインクリメントさ
れる。 ステップS29で、j>Jが成立するか否かが判定され
る。その結果、成立すればステップS30に進む。一方
、成立しなければステップS27に戻って、累積行列の
1行目における次列の要素値が算出される。 こうして、列番号jの内容を順次インクリメントしてス
テップS27を繰り返して実行することによって、累積
行列における1行目の各要素値は距離行列における1行
目の各要素値の累積値となる。 また、バス行列の1行目における2列目以降の総ての要
素値は“3”となるのである。 ステップS30で、上記列番号jに“2”がセットされ
る。 ステップS31で、上記行番号11ご2”がセットされ
る。 ステップS32で、作業変数d1.d2およびd3の内
容が次式に従って更新される。 dl=g(i−1,j) d2=g(i−1,j−1) d3=g(i、j−1) ステップS33で、dl、d2.d3中において、dl
の値が最小であるか否かが判定される。その結果最小で
あればステップS34に進み、そうでなければステップ
S35に進む。 ステップS34で、累積行列の要素値g(i、Dが“d
l”にセットされ、バス行列の要素値pt(i、j)が
“I”にセットされてステップ838に進む。 ステップS35で、di、d2.d3中において、d3
の値が最小であるか否かが判定される。その結果最小で
あればステップS36に進み、そうでなければステップ
S37に進む。 ステップS36で、累積行列の要素値g(ij)が“d
3”にセットされ、パス行列の要素値pt(i、Dが“
3”にセットされてステップS38に進む。 ステップS37で、累積行列の要素値g(i、Dが“d
2”にセットされ、バス行列の要素値pL(i、Dが“
2”にセットされる。 ステップS38で、累積行列の要素値g(i、j)の内
容が次式によって更新される。 g(i、j)=g(i、j)+d(i、コ)ステップS
39で、行番号iの内容がインクリメントされる。 ステップS40で、i>Iが成立するか否かが判定され
る。その結果、成立すればステップS41に進む。一方
、成立しなければステップS32?こ戻って、累積行列
およびパス行列のj列における次の行の要素値が求めら
れる。 ステップS41で、列番号jの内容がインクリメントさ
れる。 ステップS42で、j>Jが成立するか否かが判別され
る。その結果、成立しなければステップS31に戻って
、累積行列およびパス行列における次の列における2行
目以降の総ての要素値が求められる。一方、成立すれば
累積行列/バス行列作成処理動作を終了する。 こうして、第6図に示すような累積行列と第7図に示す
ようなバス行列が作成される。上記累積行列は、発声音
節列における音節位置番号iを行とする一方音節ラティ
スにおける音節位置番号jを列とし、その要素値は距離
行列における要素(1,1)から要素(i、j)に至る
経路のうち最短経路における累積距離の値を表している
のである。 一方、パス行列は、発声音節列における音節位置番号i
を行とする一方音節ラティスにおける音節位置番号jを
列とし、その要素値はパス行列の終点(第7図において
は要素(4、4))から始点(第7図においては要素(
1,1))に向かって最短経路(すなわち、DPパス)
上を遡る際のある要素から次の要素へ向かう方向を表し
ている。つまり、パス行列における要素値pt(i、j
)が“3°の場合には要素(i、Dから上記DPパス上
を遡る際の次の要素は(i、j()であり、“2“の場
合には(i−1,j−1)であり、“l”の場合には(
i−1,j)であることを表しているのである。 以上のことから、上記DPパスを遡ると言うことは、発
声音節列における音節位置番号iと音節ラティスにおけ
る音節位置番号jとを最適に対応付けることであると言
える。 第1!図は、上記音節対応表作成部23によって実施さ
れる音節対応表作成処理動作のフローチャートである。 ここでは、上述のようにDP行列の終点から始点に向か
ってDPパス上を遡りながら、発声音節列における音節
位置番号iと音節ラティスにおける音節位置番号jとを
最適に対応付ける音節対応表を作成するのである。以下
、第11図に従りて音節対応表作成処理動作について詳
細に説明する。 ここで、 pt(i、D:パス行列の要素値 +1111)(i、12):音節対応表の要素値I:i
の最大値(発声音節列における 音節長) J:jの最大値(音節ラティスにおけ る音節長) L:Qの最大値(本実施例においては “2“) とする。また、音節対応表の各要素値map(i、I2
)には初期値として“0“がセットされているものとす
る。 ステップS51で、パス行列における行番号iおよび音
節対応表における音節位置番号l(発声音節列における
音節位置番号iに対応)に“ビがセットされ、パス行列
の列番号jに“J“がセットされる。 ステップS52で、音節対応表の要素値map(i、1
)が“0″であるか否かが判別される。その結果“0“
であればステップS53に進み、そうでなければステッ
プS54に進む。 ステップS53で、音節対応表の要素値map(i、1
)に“j′がセットされてステップS55に進む。 ステップS54で、音節対応表の要素(i、1)には既
にある値がセットされているので、要素(L2)の要素
値a+ap(i、l)として“j”がセットされる。 ステップS55で、パス行列の要素値pt(i、j)が
“0“であるか否かが判別される。その結果“0”でな
ければステップS56に進み、10”であればパス行列
の終点に至ったので音節対応表作成動作を終了する。 ステップS56で、パス行列の要素値pt(i、Dが“
1“であるか否かが判別される。その結果“1″″であ
ればステップS57に進み、“ビでなければステップS
58に進む。 ステップS57で、パス行列における行番号iおよび音
節対応表における音節位置番号iの内容がデクリメント
されてステップS52に戻り、次の処理に入る。 ステップ958で、パス行列の要素値pt(i、j)が
°3″であるか否かが判別される。その結果“3″であ
ればステップS59に進み、“3°でなければステップ
S60に進む。 ステップS59で、パス行列における列番号jの内容が
デクリメントされてステップS52に戻り、次の処理に
入る。 ステップS60で、パス行列における行番号iおよび音
節対応表における音節位置番号iの内容と、パス行列に
おける列番号jの内容とがデクリメントされてステップ
S52に戻り、次の処理に入る。 そして、上述にようにステップS55において、パス行
列の要素値pt(i、Dが“0”であると判別されると
、パス行列における終点に至ったとして音節対応表作成
動作を終了するのである。 こうして、パス行列における終点から始点に向かってD
Pババス上遡りながら音節対応表における要素値を求め
ることによって、第8図に示すような、発声音節列にお
ける音節位置番号iと音節ラティスにおける音節位置番
号jとの最適な対応関係を表す音節対応表が作成される
のである。 第8図においては次のことを意味する。すなわち、発声
音節列における第1音節(すなわち、音節「わ」)と音
節ラティスにおける第1音節とが対応し、発声音節列に
おける第2.3音節(すなわち、連続した音節「ら−シ
」)と音節ラティスにおける第2音節が対応し、発声音
節列における第4音節(すなわち、音節「の」)と音節
ラティスにおける第3.4音節とが対応することを表し
ているのである。 つまり、この場合には、発声音声列と音節ラティスとの
音節位置対応関係が発声音節列における第2音節および
第4音節の箇所においてI対lとはならず不自然である
。そこで、発声法指示メツセージ生成部24は、この発
声音節列と音節ラティスとの音節位置対応関係がl対!
ではない箇所を検索して、その音節位置対応関係に応じ
た発声法指示メツセージを生成するのである。 第12図は、上記発声法指示メツセージ生成部24によ
って実施される発声法指示メツセージ生成処理動作のフ
ローチャートである。以下、第12図に従って、発声法
指示メツセージ生成処理動作について詳細に説明する。 ここで、 ref(i):発声音節列(こおけるi番目の音節ma
p(i、12):音節対応表の要素値I:iの最大値(
発声音節列Jこおける音節長) *esd: aeso: ■esl: es3 園esh west: Sa、■b: char(x) : 発声法指示メツセージを表す文字 列 文字列“第” 文字列“音節口の” 文字列“を明瞭に発声して下さい” 文字列“をのばさないで下さい“ 文字列“語頭の” 文字列“語尾の” 作業用変数 数字“X”を対応する文字コードに 変換する関数 とする。 ステップS71で、発声指示メツセージmessの内容
が空白(スペース)にされる。 ステップS?2で、発声音節列における音節位置番号i
および音節対応表における音節位置番号iの初期値が“
ピにセットされる。 ステップS73で、音節対応表における要素値5ap(
i、2)が“0”であるか否かが判別される。 すなわち、発声音節列における一つの音節位置番号に対
して、音節ラティスにおける2つの音節位置番号が対応
しているか否かが判別されるのである。 その結果“0”であれば(すなわち、一つの音節位置番
号のみが対応していれば)ステップS81に進み、そう
でなければ(すなわち、2つの音節位置番号が対応して
いれば)ステップS74に進む。 ステップS74で、作業用変数ma、a+bの内容が空
白にされる。 ステップS75で、作業用変数ma、a+bの内容が次
式によって更新される。 ran ←mesd+char(i)+aes。 mb 4− ref(i)+g+es3その結果、作業
変数maの内容は″第”+“iの内容に対応する数字”
+“音節口の“となる一方、作業変数mbの内容は“発
声音節列におけるi番目の音節°+“をのばさないで下
さ、い”となる。 ステップS76で、発声音節列における音節位置番号i
の内容が“ビであるか否かが判別される。 その結果“ビであればステップS77に進み、そうでな
ければステップS78に進む。 ステップS77で、作業用変敗maの内容が次式によっ
て再更新されて“語頭の”となり、ステップS80に進
む。 aha ← mesh ステップ578で、発声音節列における音節位置番号i
の内容が“ビであるか否かが判別される。 その結果“■“であればステップS79に進み、そうで
なければステップS80に進む。 ステップS79で、作業用変数ll1aの内容が次式に
よって再更新されて“語尾の“となる。 ma ← west ステップS80で、発声法指示メツセージmessの内
容が次式によって更新される。 園ess 4− mess+++a+mbステップ
S81で、音節対応表における要素値@ap(i、l)
と要素値map(i+1.1)とが等しいか否かが判別
される。すなわち、発声音節列における2つの連続した
音節位置番号が、音節ラティスにおける一つの音節位置
番号に対応しているか否かが判別されるのである。 その結果等しければ(すなわち、2つの音節位置番号が
対応していれば)ステラ7S 82に進み、そうでなけ
れば(すなわち、一つの音節位置番号が対応していれば
)ステップS89に進む。 ステップS82で、作業用変数Ila、Ilbの内容が
空白にされる。 ステップ5113で、作業用変数a+a、mbの内容が
次式によって更新される。 sa ←mesd+char(i)+ses。 sb a−ref(i)+mesl その結果、作業変数saの内容は“第”十“iの内容に
対応する数字°+“音節口の°となる一方、作業変数m
bの内容は“発声音節列におけるi番目の音節”+“を
明瞭に発声して下さい”となる。 ステップS84で、発声音節列における音節位置番号i
の内容が“l”であるか否かが判別される。 その結果“ビであればステップS85に進み、そうでな
ければステップS86に進む。 ステップS85で、作業用変数18の内容が次式によっ
て再更新されて“語頭の“となり、ステップS88に進
む。 ola←l1eSh ステップS86て、発声音節列における音節位置番号1
の内容が“じであるか否かが判別される。 その結果“ピであればステップS87に進み、そうでな
ければステップS8gに進む。 ステップS8?で、作業用変数+++aの内容が次式に
よって再更新されて“語尾の”となる。 ma 4− west ステップS8gで、発声法指示メツセージ@essの内
容が次式によって更新される。 mess 4− 5ess+ma+mbステップS8
9で、発声音節列における音節位置番号iおよび音節対
応表における音節位置番号iの内容がインクリメントさ
れる。 ステップ690で、i>1が成立するか否かが判別され
る。その結果、成立しなければステップ873に戻って
、発声音節列および音節対応表における次の音節位置番
号に係る処理が実行される。 方、成立すれば発声法指示メツセージ生成処理動作を終
了する。 こうして音節対応表を参照して、発声音節列における一
つの音節位置番号に音節ラティスにおける2つの連続し
た音節位置番号が対応している場合には、その1音節を
伸ばさないで発声するようにメツセージを出力する。一
方、発声音節列における2つの連続した音節位置番号が
音節ラティスにおける一つの音節位置番号に対応してい
る場合には、その連続する2音節を明瞭に発声するよう
にメツセージを出力するのである。 以下、発声音節列「わらじの」(第3図)とそれに対す
る音節ラティス(第4図)とから得られた第8図に示す
音節対応表に従って、上述の発声法指示メツセージ生成
処理動作について、発声法指示メツセージmessの内
容を例示しながら更に具体的に説明する。 まず、発声法指示メツセージmessの内容が空白に設
定される。 mess ’ (空白) ・・・ステップS71 次に、発声音節列における第1音節「わ」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(1,2)の内容は“0°
であり、かつ、音節対応表における要素(1,1)の内
容“l”と要素(2,1)の内容“2”とは異なる。し
たがって、発声音節列における第1音節「わ」には、音
節対応表における要素(1,1)の値′1°で表現され
た音節ラティスの第1音節が対応していると判定される
。つまり、発声音節列における第1音節「わ」は正しく
発声されていると判定されて発声法指示メツセージ1I
lessの内容はスペースのままとなる。 ・・・ステップS73ステツプS81 次に、発声音節列における第2音節「ら」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(2,2)の内容は10”
であるが、音節対応表における要素(2,1)の内容“
2”と要素(3,1)の内容“2”とは同じである。し
たがって、発声音節列における第2音節「らJと第3音
節「シ」とには、音節対応表における要素(2,1)お
よび要素(3,1)の値“2”で表現された音節ラティ
スの第2音節が対応していると判定される。つまり、発
声音節列における第2音節「ら」の発声が明瞭でないた
めに脱落したと判定されるのである。 ・・・ステップS73ステツプS81 そこで、作業用変数1lIaの内容を“第”+“2 (
= i)“+゛音節目の”とする。一方、作業用変数1
lIbの内容を“丁ら」”+“を明瞭に発声して下さい
”とする。 ・・・ステップS83 そして、作業用変数ff1aの内容と作業用変数mbの
内容とから、発声法指示メツセージmessの内容はm
ess “第2音節目の「ら」を明瞭に発声して下さ
い” となる。 ・・・ステップS88
次に、発声音節列における第3音節「シ」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(3,2)の内容は“0”
であり、かつ、音節対応表における要素(3、1)の内
容“2“と要素(4,1)の内容“4”とは異なる。し
たがって、発声音節列における第3音節rLJには、音
節対応表における要素(3、I )の値“2”で表現さ
れた音節ラティスの第2音節か対応していると判定され
る。つまり、発声音節列における第3音節「シ」は正し
く発声されていると判定されて発声法メツセージmes
sの内容はそのままとなる。 ・・・ステップS7
3.ステップ981次に、発声音節列における第4音節
「の」と音節ラティスにおける音節位置との対応関係が
調へられる。その結果、音節対応表における要素(4,
2)の内容が“3”である(と言うことは、当然音節対
応表における要素(4、1)にはある値が与えられてい
る。したがって、発声音節列における第4音範「の」に
は、音節対応表における要素(4、1)の値“4”およ
び要素(4,2)の値“3“で表現された音節ラティス
の2つの連続した第3.4音節が対応していると判定さ
れる。つまり、音節「の」が長音化していると判定され
るのである。 ・・ステップS73 そこで、作業用変数ll1aの内容を“第”+“4(=
i)”+“音節目の”とする。一方、作業用変数ff1
bの内容を“「の」”+“をのばさないで下さい゛とす
る。 ・ステップS75 ここで、発声音節列における音節「の」は4番目(すな
わち、最終音節位置番号“じ)の音節であるから、作業
用変数maの内容を「“語尾の”」に変更する。
・・・ステップ978ステツプS79そして、
作業用変数maの内容と作業用変数ff1bの内容とか
ら、発声法指示メツセージff1essの内容はmes
s “第2音節目の「ら」を明瞭に発声して下さい、
“語尾の「の」をのばさないで下さい” となる。 ・・・ステップS80
こうして、発声音節列における音節位置番号1の内容が
1(=4)より大きくなると、発声法指示メツセージm
essの内容が見易((あるいは聞き易く)編集されて
、例えば以下のように画面表示されて発声法指示メツセ
ージ生成処理が終了されるのである。 くメツセージ〉 ☆第2音節目の「ら」を明瞭に発声して下さい。 ☆語尾の「の」をのばさないで下さい。 ユーザは、こうして表示された発声法指示メツセージに
従って「ら」を明瞭に発声し「の」を伸ばさないで発声
する発声法によって、発声音節列「わらじの」を再度発
声する。そして、発声法指示メツセージが表示されなく
なるまで発声法を練習するのである。 こうして発声音節列の内容を種々変えて発声法を訓練す
ることによって、初心者であっても音声認識装置を操作
する際に正しい発声法によって発声できるのである。し
たがって、処理モードを認識モードに切り替えて本装置
を音声認識装置として使用する場合に、音節切出部12
によって得られる各音節境界候補がはつきりしないた給
に1音節が2音節に認識されたり音節が脱落して認識さ
れたりすることなく、入力音声が正しく認識されるので
ある。 上述のように、本実施例においては、発声法指示装置を
音響処理部11.音節切出部100音節照合部13およ
び発声法指示部16て構成する。そして、処理モードを
インストモートに切り替えた際には、予め表示された発
声音節列に従って発声された音声を音響処理部11によ
って分析し、その分計結果に従って音節切出部12て音
節候補に切り出し、この切り出された音節候補と音節標
準パターンとの音節照合部13によるマツチングによっ
て音節ラティスを生成する。こうして生成された音節ラ
ティスと上記発声音節列とか発声法指示部16に入力さ
れる。 そうすると、発声法指示部16における距離計算部21
によって、発声音節列の音節位置番号iと音節ラティス
の音節位置番号jとの距離を表す距離行列を作成する。 さらに、DP部22によって、上記距離行列に基づいて
この距離行列における各要素(i、j)に至る最短累積
距離を表す累積行列と、DPババス終点(発声音節列に
おける最終音節と音節ラティスにおける最終音節との対
応付け)から始点(発声音節列における先頭音節と音節
ラティスにおける先頭音節との対応付け)に向かってD
Pパス上を遡る際の最適方向を示すパス行列とを作成す
る。そして、音節対応表作成部23によって、上記パス
行列に従って終点から始点に向かってDPババス遡るこ
とによって、発声音節列における音節位置番号lと音節
ラティスにおける音節位置番号jとを最適に対応付けた
音節対応表を作成する。 そうすると、発声法指示メツセージ生成部24は、こう
して作成された音節対応表に基づいて、発声音節列にお
ける2音節が音節ラティスにおけるl音節に対応付けら
れた(すなわち、音節が脱落した)箇所、あるいは、発
声音節列におけるl音節が音節ラティスにおける2音節
に対応付けられた(すなわち、音節が伸ばされた)箇所
を検索して、音節切り出し誤り位置とその種類とを検出
する。そして、検出した音節切り出し誤り位置と音節切
り出し誤りの種類とから発声法指示メツセージを生成し
て出力するようにしている。 こうして出力された発声法指示メツセージ?こ従つた発
声法によって同じ発声音節列を再発声することによって
、当該発声音節列を正しく発声できるようになるのであ
る。したがって、発声音節列を替えて繰り返し発声法を
訓練することによって、処理モードを認識モードに切り
替えて本装置を音声認識装置として動作させる際に、音
声認識装置における発声法として正しい発声法によって
音声入力ができるようになり、高い認識率が得られるの
である。 すなわち、本実施例における発声法指示装置によって発
声法を訓練すれは、身近に熟練者やインストラクタのい
ない初心者であっても、短時間のうちに音声認識装置を
使いこなせるようになるのである。 上記音節ラティスの信頼度順位数および上記音節対応表
におけるQの数は、上記実施例に限定されるものではな
い。 上記実施例においては、入力音声信号を音節単位で認識
して音節ラティスを作成し、この音節ラティスに基づい
て発声法指示メツセージを生威するようにしている。し
かしながら、この発明はこれに限定されるものではなく
、人力音声信号を音韻単位で認識して音韻ラティスを作
成し、この音韻ラティスに基づいて発声法指示メツセー
ジを生成するようにしてもよい。 この発明における距離行列作成処理動作、累積行列/パ
ス行列作成処理動作、音節対応表作成処理動作および発
声法指示メツセージ生成処理動作のアルゴリズムは、上
記実施例におけるアルゴリズムに限定されるものではな
い。
。第1図は第13図に示すブロック図と大略同じであり
、発声法指示部16を備えた点が異なる。 この発声法指示装置は、処理モードを認識モードに切り
替えることによって発声法指示部!6が非動作状態とな
り、音響処理部If、音節切出部12、音節照合部!3
および言語処理部14が上述のような特定話者用音声認
識装置として動作して入力音声を認識し、言語処理部1
4から認識結果を出力する。一方、インストモードに切
り替えることによって発声法指示部16が動作状態とな
り、以下に詳述するように発声法指示装置として動作す
る。 すなわち、予め設定されてメモリ(図示せず)に格納さ
れた発声すべき音節の順序を表す複数の発声音節列のう
ち、一つの発声音節列(例えば、「わらしの」)が表示
画面(図示せず)等に表示される。 そして、ユーザはこの表示された発声音節列と同じ音節
列を発声する。そうすると、ユーザの発声による音声に
基づく音声信号は音響処理部11に入力されて音声信号
のパワー変化やスペクトル変化が算出され、さらに音節
切出部I2によって音節境界候補毎の特徴パターンが切
り出される。そして、音節照合部!3によって上記特徴
パターンと音節標準パターン格納部!5に格納された音
節標準パターンとに基づいて音節ラティスが生成される
。 こうして得られた音節ラティスは発声法指示部16に入
力される。そうすると、発声法指示部I6は入力された
音節ラティスと上記メモリから読み出された発声音節列
とからユーザに対する発声法指示のメツセージを生成し
て出力するのである。 こうすることによって、ユーザは先程発声した発声音節
列について、どのように発声したら正しい音節境界候補
が得られるかを知ることができるのである。すなわち、
ユーザは、上記発声法指示メツセージに従って発声法を
訓練することによって、音声認識装置を使いこなすため
の発声法を会得することができるのである。 第2図は上記発声法指示部】6の詳細なブロック図であ
る。この発声法指示部16は、距離計算部21.DP部
22.音節対応表作成部23および発声法指示メツセー
ジ生成部24から概略構成される。 上記距離計算部21は、第1図に示す音節照合部13か
ら入力される音節ラティス(第4図に例示)とメモリ等
から読み出された発声音節列(第3図に例示)とから、
後に詳述するようにして発声音節列の音節位置と音節ラ
ティスの音節位置との距離を算出して、発声音節列にお
ける音節位置番号を行とし音節ラチスにおける音節位置
番号を列とする距離行列(第5図に例示)を作成する。 DP部22は、後に詳述するように動的計画法(DP)
によって、発声音節列の音節位置番号と音節ラティスの
音節位置番号との最適な対応関係を求めるための累積行
列(第6図に例示)を作成し、さらにこの累積行列から
パス行列(第7図に例示)を作成する。音節対応表作成
部23は、DP部22によって作成されたパス行列の終
点から始点までDPパスを逆にたどって、行と列との最
適な対応関係を表す音節対応表(第8図に例示)を作成
する。発声法指示メツセージ生成部24は、音節対応表
作成部23によって作成された音節対応表を参照して音
節切り出し誤りの種類と位置とを判定する。そして、再
発声の際に音節切り出し誤りを回避できるように発声法
指示メツセージを生成して出力する。 第5図に例示する距離行列、第6図に例示する累積行列
、第7図に例示するパス行列および第8図に例示する音
節対応表は、第3図に示すような発声音節列「わらじの
」と、ユーザが「わらじの」と発声した際に2音節目が
脱落する一方4音節目が長音化した場合に上記音節照合
部13によって得られる第4図に示すような音節ラティ
スとに基づいて作成されたものである。但し、第4図に
おいては音節候補「わJ、rLJ、rの」および「お」
以外の音節候補は省略して表現しである。 第9図は、上記距離計算部21によって実施される距離
行列作成処理動作のフローチャートである。以下、第9
図に従って距離行列作成処理動作について詳細に説明す
る。 ここで、 rer(i):発声音節列におけるi番目の音節1n(
j、k):音節ラティスのj番目の音節位置における信
頼変事に位の音節候補 d(i、D:距離行列の要素値 1、J、に:夫々i、j、にの最大値(但し、本実施例
においてはに=4) a+:作業用変数 とする。 ステップSlで、発声音節列における音節位置番号iに
初期値“ビがセットされる。 ステップS2で、音節ラティスにおける音節位置番号j
に初期値“ビがセットされる。 ステップS3で、作業用変数mに初期値“lO”がセッ
トされ、音節ラティスにおける音節候補の信頼度順位k
に初期値“1”がセットされる。 ステップS4で、ref(i)= 1n(j、k)が成
立するか否かが判定される。その結果成立すればステッ
プS5に進み、そうでなければステップS5をスキップ
する。 すなわち、発声音節列におけるi番目の音節と音節ラテ
ィスにおけるj番目の音節候補群中の信頼変事に位の音
節候補とが同じである場合にはステップS5を実施する
のである。 ステップS5で、作業用変数1の内容が“k+2”に更
新される。 ステップS6で、信頼度順位にの内容がインクリメント
される。 ステップS7で、k>Kが成立するか否かが判定される
。その結果、成立すればステップS8に進む。一方、成
立しなければステップS4に戻って、発声音節列におけ
るi番目の音節と音節ラティスのj番目の音節候補群中
における次の信頼度順位の音節候補とが比較される。 ステップS8で、距離行列の要素値d(i、Dの内容が
“−“に更新される。 ステップS9で、音節ラティスにおける音節位置番号j
の内容がインクリメントされる。 ステップSlOで、j>Jが成立するか否かが判定され
る。その結果、成立すればステップSllに進む。一方
、成立しなければステップS3に戻って、発声音節列に
おけるi番目の音節と音節ラティスにおける次の音節位
置番号の総ての音節候補とが比較される。 ステップSllで、発声音節列における音節位置番号1
の内容がインクリメントされる。 ステップS12で、i>1が成立するか否かが判定され
る。その結果、成立しなければステップS2に戻って発
声音節列における次の音節位置番号の音節と音節ラティ
スにおける総ての音節候補とが比較される。一方、成立
すれば距離行列作成処理動作を終了する。 こうして、第5図に示すような距離行列が作成される。 この距離行列は発声音節列における音節位置番号iを行
とする一方音節ラティスにおける音節位置番号jを列と
し、その要素値は音節位置番号iに属する音節と音節位
置番号jに属する各音節候補との互いの信頼度に基づく
距離(最大値“10”)の最小値である。すなわち、距
離行列は、発声音声列における音節位置番号iと音節ラ
ティスにおける音節位置番号jとの距離を表していると
言えるのである。 第10図は、上記DP部22によって実施される累積行
列/パス行列作成処理動作のフローチャートである。以
下、第10図に従って累積行列/パス行列作成処理動作
について詳細に説明する。 ここで、 d(i、コ):距離行列の要素値 g(i、j)・累積行列の要素値 pt(i、j):パス行列の要素値 1、J:夫々i、jの最大値 di、d2.d3.m:作業用変数 とする。 ステップS21で、累積行列の要素値d(1,1)に距
離行列の要素値g(1,1)の要素値がセットされ、パ
ス行列の要素値pt(t、t)が“0”にセットされる
。 ステップS22で、距離行列、累積行列およびパス行列
の行番号i(発声音節列における音節位置番号iに対応
)に°2“がセットさ−れる。 ステップS23で、累積行列における1行1列の要素値
g(i、1)が、累積行列および距離行列に基づいて次
式によって算出される。 g(i、1)=g(i−1,1)+d(i、1)また、
パス行列における1行1列の要素値pL(il)が“ビ
にセットされる。 ステップS24で、行番号iの内容がインクリメントさ
れる。 ステップS25で、i>1が成立するか否かが判定され
る。その結果、成立すればステップS26に進む。一方
、成立しなければステップS23に戻って、累積行列の
1列目における次行の要素値が算出される。 こうして、行番号iの内容を順次インクリメントしてス
テップS23を繰り返して実行することによって、累積
行列における1列目の各要素値は距離行列における1列
目の各要素値の累積値となる。 また、バス行列の1列目における2行目以降の総ての要
素値は“ビとなるのである。 ステップS26で、距離行列1累積行列およびバス行列
の列番号j(音節ラティスにおける音節位置番号jに対
応)に“2“がセットされる。 ステップS27で、累積行列における1行j列の要素f
tig(1,j)が、累積行列および距離行列に基づい
て次式によって算出される。 g(1,j)=g(1,j−1)+d(1,j)また、
パス行列における1行j列の要素値pt(1j)が“3
”にセットされる。 ステップ62gで、列番号jの内容がインクリメントさ
れる。 ステップS29で、j>Jが成立するか否かが判定され
る。その結果、成立すればステップS30に進む。一方
、成立しなければステップS27に戻って、累積行列の
1行目における次列の要素値が算出される。 こうして、列番号jの内容を順次インクリメントしてス
テップS27を繰り返して実行することによって、累積
行列における1行目の各要素値は距離行列における1行
目の各要素値の累積値となる。 また、バス行列の1行目における2列目以降の総ての要
素値は“3”となるのである。 ステップS30で、上記列番号jに“2”がセットされ
る。 ステップS31で、上記行番号11ご2”がセットされ
る。 ステップS32で、作業変数d1.d2およびd3の内
容が次式に従って更新される。 dl=g(i−1,j) d2=g(i−1,j−1) d3=g(i、j−1) ステップS33で、dl、d2.d3中において、dl
の値が最小であるか否かが判定される。その結果最小で
あればステップS34に進み、そうでなければステップ
S35に進む。 ステップS34で、累積行列の要素値g(i、Dが“d
l”にセットされ、バス行列の要素値pt(i、j)が
“I”にセットされてステップ838に進む。 ステップS35で、di、d2.d3中において、d3
の値が最小であるか否かが判定される。その結果最小で
あればステップS36に進み、そうでなければステップ
S37に進む。 ステップS36で、累積行列の要素値g(ij)が“d
3”にセットされ、パス行列の要素値pt(i、Dが“
3”にセットされてステップS38に進む。 ステップS37で、累積行列の要素値g(i、Dが“d
2”にセットされ、バス行列の要素値pL(i、Dが“
2”にセットされる。 ステップS38で、累積行列の要素値g(i、j)の内
容が次式によって更新される。 g(i、j)=g(i、j)+d(i、コ)ステップS
39で、行番号iの内容がインクリメントされる。 ステップS40で、i>Iが成立するか否かが判定され
る。その結果、成立すればステップS41に進む。一方
、成立しなければステップS32?こ戻って、累積行列
およびパス行列のj列における次の行の要素値が求めら
れる。 ステップS41で、列番号jの内容がインクリメントさ
れる。 ステップS42で、j>Jが成立するか否かが判別され
る。その結果、成立しなければステップS31に戻って
、累積行列およびパス行列における次の列における2行
目以降の総ての要素値が求められる。一方、成立すれば
累積行列/バス行列作成処理動作を終了する。 こうして、第6図に示すような累積行列と第7図に示す
ようなバス行列が作成される。上記累積行列は、発声音
節列における音節位置番号iを行とする一方音節ラティ
スにおける音節位置番号jを列とし、その要素値は距離
行列における要素(1,1)から要素(i、j)に至る
経路のうち最短経路における累積距離の値を表している
のである。 一方、パス行列は、発声音節列における音節位置番号i
を行とする一方音節ラティスにおける音節位置番号jを
列とし、その要素値はパス行列の終点(第7図において
は要素(4、4))から始点(第7図においては要素(
1,1))に向かって最短経路(すなわち、DPパス)
上を遡る際のある要素から次の要素へ向かう方向を表し
ている。つまり、パス行列における要素値pt(i、j
)が“3°の場合には要素(i、Dから上記DPパス上
を遡る際の次の要素は(i、j()であり、“2“の場
合には(i−1,j−1)であり、“l”の場合には(
i−1,j)であることを表しているのである。 以上のことから、上記DPパスを遡ると言うことは、発
声音節列における音節位置番号iと音節ラティスにおけ
る音節位置番号jとを最適に対応付けることであると言
える。 第1!図は、上記音節対応表作成部23によって実施さ
れる音節対応表作成処理動作のフローチャートである。 ここでは、上述のようにDP行列の終点から始点に向か
ってDPパス上を遡りながら、発声音節列における音節
位置番号iと音節ラティスにおける音節位置番号jとを
最適に対応付ける音節対応表を作成するのである。以下
、第11図に従りて音節対応表作成処理動作について詳
細に説明する。 ここで、 pt(i、D:パス行列の要素値 +1111)(i、12):音節対応表の要素値I:i
の最大値(発声音節列における 音節長) J:jの最大値(音節ラティスにおけ る音節長) L:Qの最大値(本実施例においては “2“) とする。また、音節対応表の各要素値map(i、I2
)には初期値として“0“がセットされているものとす
る。 ステップS51で、パス行列における行番号iおよび音
節対応表における音節位置番号l(発声音節列における
音節位置番号iに対応)に“ビがセットされ、パス行列
の列番号jに“J“がセットされる。 ステップS52で、音節対応表の要素値map(i、1
)が“0″であるか否かが判別される。その結果“0“
であればステップS53に進み、そうでなければステッ
プS54に進む。 ステップS53で、音節対応表の要素値map(i、1
)に“j′がセットされてステップS55に進む。 ステップS54で、音節対応表の要素(i、1)には既
にある値がセットされているので、要素(L2)の要素
値a+ap(i、l)として“j”がセットされる。 ステップS55で、パス行列の要素値pt(i、j)が
“0“であるか否かが判別される。その結果“0”でな
ければステップS56に進み、10”であればパス行列
の終点に至ったので音節対応表作成動作を終了する。 ステップS56で、パス行列の要素値pt(i、Dが“
1“であるか否かが判別される。その結果“1″″であ
ればステップS57に進み、“ビでなければステップS
58に進む。 ステップS57で、パス行列における行番号iおよび音
節対応表における音節位置番号iの内容がデクリメント
されてステップS52に戻り、次の処理に入る。 ステップ958で、パス行列の要素値pt(i、j)が
°3″であるか否かが判別される。その結果“3″であ
ればステップS59に進み、“3°でなければステップ
S60に進む。 ステップS59で、パス行列における列番号jの内容が
デクリメントされてステップS52に戻り、次の処理に
入る。 ステップS60で、パス行列における行番号iおよび音
節対応表における音節位置番号iの内容と、パス行列に
おける列番号jの内容とがデクリメントされてステップ
S52に戻り、次の処理に入る。 そして、上述にようにステップS55において、パス行
列の要素値pt(i、Dが“0”であると判別されると
、パス行列における終点に至ったとして音節対応表作成
動作を終了するのである。 こうして、パス行列における終点から始点に向かってD
Pババス上遡りながら音節対応表における要素値を求め
ることによって、第8図に示すような、発声音節列にお
ける音節位置番号iと音節ラティスにおける音節位置番
号jとの最適な対応関係を表す音節対応表が作成される
のである。 第8図においては次のことを意味する。すなわち、発声
音節列における第1音節(すなわち、音節「わ」)と音
節ラティスにおける第1音節とが対応し、発声音節列に
おける第2.3音節(すなわち、連続した音節「ら−シ
」)と音節ラティスにおける第2音節が対応し、発声音
節列における第4音節(すなわち、音節「の」)と音節
ラティスにおける第3.4音節とが対応することを表し
ているのである。 つまり、この場合には、発声音声列と音節ラティスとの
音節位置対応関係が発声音節列における第2音節および
第4音節の箇所においてI対lとはならず不自然である
。そこで、発声法指示メツセージ生成部24は、この発
声音節列と音節ラティスとの音節位置対応関係がl対!
ではない箇所を検索して、その音節位置対応関係に応じ
た発声法指示メツセージを生成するのである。 第12図は、上記発声法指示メツセージ生成部24によ
って実施される発声法指示メツセージ生成処理動作のフ
ローチャートである。以下、第12図に従って、発声法
指示メツセージ生成処理動作について詳細に説明する。 ここで、 ref(i):発声音節列(こおけるi番目の音節ma
p(i、12):音節対応表の要素値I:iの最大値(
発声音節列Jこおける音節長) *esd: aeso: ■esl: es3 園esh west: Sa、■b: char(x) : 発声法指示メツセージを表す文字 列 文字列“第” 文字列“音節口の” 文字列“を明瞭に発声して下さい” 文字列“をのばさないで下さい“ 文字列“語頭の” 文字列“語尾の” 作業用変数 数字“X”を対応する文字コードに 変換する関数 とする。 ステップS71で、発声指示メツセージmessの内容
が空白(スペース)にされる。 ステップS?2で、発声音節列における音節位置番号i
および音節対応表における音節位置番号iの初期値が“
ピにセットされる。 ステップS73で、音節対応表における要素値5ap(
i、2)が“0”であるか否かが判別される。 すなわち、発声音節列における一つの音節位置番号に対
して、音節ラティスにおける2つの音節位置番号が対応
しているか否かが判別されるのである。 その結果“0”であれば(すなわち、一つの音節位置番
号のみが対応していれば)ステップS81に進み、そう
でなければ(すなわち、2つの音節位置番号が対応して
いれば)ステップS74に進む。 ステップS74で、作業用変数ma、a+bの内容が空
白にされる。 ステップS75で、作業用変数ma、a+bの内容が次
式によって更新される。 ran ←mesd+char(i)+aes。 mb 4− ref(i)+g+es3その結果、作業
変数maの内容は″第”+“iの内容に対応する数字”
+“音節口の“となる一方、作業変数mbの内容は“発
声音節列におけるi番目の音節°+“をのばさないで下
さ、い”となる。 ステップS76で、発声音節列における音節位置番号i
の内容が“ビであるか否かが判別される。 その結果“ビであればステップS77に進み、そうでな
ければステップS78に進む。 ステップS77で、作業用変敗maの内容が次式によっ
て再更新されて“語頭の”となり、ステップS80に進
む。 aha ← mesh ステップ578で、発声音節列における音節位置番号i
の内容が“ビであるか否かが判別される。 その結果“■“であればステップS79に進み、そうで
なければステップS80に進む。 ステップS79で、作業用変数ll1aの内容が次式に
よって再更新されて“語尾の“となる。 ma ← west ステップS80で、発声法指示メツセージmessの内
容が次式によって更新される。 園ess 4− mess+++a+mbステップ
S81で、音節対応表における要素値@ap(i、l)
と要素値map(i+1.1)とが等しいか否かが判別
される。すなわち、発声音節列における2つの連続した
音節位置番号が、音節ラティスにおける一つの音節位置
番号に対応しているか否かが判別されるのである。 その結果等しければ(すなわち、2つの音節位置番号が
対応していれば)ステラ7S 82に進み、そうでなけ
れば(すなわち、一つの音節位置番号が対応していれば
)ステップS89に進む。 ステップS82で、作業用変数Ila、Ilbの内容が
空白にされる。 ステップ5113で、作業用変数a+a、mbの内容が
次式によって更新される。 sa ←mesd+char(i)+ses。 sb a−ref(i)+mesl その結果、作業変数saの内容は“第”十“iの内容に
対応する数字°+“音節口の°となる一方、作業変数m
bの内容は“発声音節列におけるi番目の音節”+“を
明瞭に発声して下さい”となる。 ステップS84で、発声音節列における音節位置番号i
の内容が“l”であるか否かが判別される。 その結果“ビであればステップS85に進み、そうでな
ければステップS86に進む。 ステップS85で、作業用変数18の内容が次式によっ
て再更新されて“語頭の“となり、ステップS88に進
む。 ola←l1eSh ステップS86て、発声音節列における音節位置番号1
の内容が“じであるか否かが判別される。 その結果“ピであればステップS87に進み、そうでな
ければステップS8gに進む。 ステップS8?で、作業用変数+++aの内容が次式に
よって再更新されて“語尾の”となる。 ma 4− west ステップS8gで、発声法指示メツセージ@essの内
容が次式によって更新される。 mess 4− 5ess+ma+mbステップS8
9で、発声音節列における音節位置番号iおよび音節対
応表における音節位置番号iの内容がインクリメントさ
れる。 ステップ690で、i>1が成立するか否かが判別され
る。その結果、成立しなければステップ873に戻って
、発声音節列および音節対応表における次の音節位置番
号に係る処理が実行される。 方、成立すれば発声法指示メツセージ生成処理動作を終
了する。 こうして音節対応表を参照して、発声音節列における一
つの音節位置番号に音節ラティスにおける2つの連続し
た音節位置番号が対応している場合には、その1音節を
伸ばさないで発声するようにメツセージを出力する。一
方、発声音節列における2つの連続した音節位置番号が
音節ラティスにおける一つの音節位置番号に対応してい
る場合には、その連続する2音節を明瞭に発声するよう
にメツセージを出力するのである。 以下、発声音節列「わらじの」(第3図)とそれに対す
る音節ラティス(第4図)とから得られた第8図に示す
音節対応表に従って、上述の発声法指示メツセージ生成
処理動作について、発声法指示メツセージmessの内
容を例示しながら更に具体的に説明する。 まず、発声法指示メツセージmessの内容が空白に設
定される。 mess ’ (空白) ・・・ステップS71 次に、発声音節列における第1音節「わ」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(1,2)の内容は“0°
であり、かつ、音節対応表における要素(1,1)の内
容“l”と要素(2,1)の内容“2”とは異なる。し
たがって、発声音節列における第1音節「わ」には、音
節対応表における要素(1,1)の値′1°で表現され
た音節ラティスの第1音節が対応していると判定される
。つまり、発声音節列における第1音節「わ」は正しく
発声されていると判定されて発声法指示メツセージ1I
lessの内容はスペースのままとなる。 ・・・ステップS73ステツプS81 次に、発声音節列における第2音節「ら」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(2,2)の内容は10”
であるが、音節対応表における要素(2,1)の内容“
2”と要素(3,1)の内容“2”とは同じである。し
たがって、発声音節列における第2音節「らJと第3音
節「シ」とには、音節対応表における要素(2,1)お
よび要素(3,1)の値“2”で表現された音節ラティ
スの第2音節が対応していると判定される。つまり、発
声音節列における第2音節「ら」の発声が明瞭でないた
めに脱落したと判定されるのである。 ・・・ステップS73ステツプS81 そこで、作業用変数1lIaの内容を“第”+“2 (
= i)“+゛音節目の”とする。一方、作業用変数1
lIbの内容を“丁ら」”+“を明瞭に発声して下さい
”とする。 ・・・ステップS83 そして、作業用変数ff1aの内容と作業用変数mbの
内容とから、発声法指示メツセージmessの内容はm
ess “第2音節目の「ら」を明瞭に発声して下さ
い” となる。 ・・・ステップS88
次に、発声音節列における第3音節「シ」と音節ラティ
スにおける音節位置との対応関係が調べられる。その結
果、音節対応表における要素(3,2)の内容は“0”
であり、かつ、音節対応表における要素(3、1)の内
容“2“と要素(4,1)の内容“4”とは異なる。し
たがって、発声音節列における第3音節rLJには、音
節対応表における要素(3、I )の値“2”で表現さ
れた音節ラティスの第2音節か対応していると判定され
る。つまり、発声音節列における第3音節「シ」は正し
く発声されていると判定されて発声法メツセージmes
sの内容はそのままとなる。 ・・・ステップS7
3.ステップ981次に、発声音節列における第4音節
「の」と音節ラティスにおける音節位置との対応関係が
調へられる。その結果、音節対応表における要素(4,
2)の内容が“3”である(と言うことは、当然音節対
応表における要素(4、1)にはある値が与えられてい
る。したがって、発声音節列における第4音範「の」に
は、音節対応表における要素(4、1)の値“4”およ
び要素(4,2)の値“3“で表現された音節ラティス
の2つの連続した第3.4音節が対応していると判定さ
れる。つまり、音節「の」が長音化していると判定され
るのである。 ・・ステップS73 そこで、作業用変数ll1aの内容を“第”+“4(=
i)”+“音節目の”とする。一方、作業用変数ff1
bの内容を“「の」”+“をのばさないで下さい゛とす
る。 ・ステップS75 ここで、発声音節列における音節「の」は4番目(すな
わち、最終音節位置番号“じ)の音節であるから、作業
用変数maの内容を「“語尾の”」に変更する。
・・・ステップ978ステツプS79そして、
作業用変数maの内容と作業用変数ff1bの内容とか
ら、発声法指示メツセージff1essの内容はmes
s “第2音節目の「ら」を明瞭に発声して下さい、
“語尾の「の」をのばさないで下さい” となる。 ・・・ステップS80
こうして、発声音節列における音節位置番号1の内容が
1(=4)より大きくなると、発声法指示メツセージm
essの内容が見易((あるいは聞き易く)編集されて
、例えば以下のように画面表示されて発声法指示メツセ
ージ生成処理が終了されるのである。 くメツセージ〉 ☆第2音節目の「ら」を明瞭に発声して下さい。 ☆語尾の「の」をのばさないで下さい。 ユーザは、こうして表示された発声法指示メツセージに
従って「ら」を明瞭に発声し「の」を伸ばさないで発声
する発声法によって、発声音節列「わらじの」を再度発
声する。そして、発声法指示メツセージが表示されなく
なるまで発声法を練習するのである。 こうして発声音節列の内容を種々変えて発声法を訓練す
ることによって、初心者であっても音声認識装置を操作
する際に正しい発声法によって発声できるのである。し
たがって、処理モードを認識モードに切り替えて本装置
を音声認識装置として使用する場合に、音節切出部12
によって得られる各音節境界候補がはつきりしないた給
に1音節が2音節に認識されたり音節が脱落して認識さ
れたりすることなく、入力音声が正しく認識されるので
ある。 上述のように、本実施例においては、発声法指示装置を
音響処理部11.音節切出部100音節照合部13およ
び発声法指示部16て構成する。そして、処理モードを
インストモートに切り替えた際には、予め表示された発
声音節列に従って発声された音声を音響処理部11によ
って分析し、その分計結果に従って音節切出部12て音
節候補に切り出し、この切り出された音節候補と音節標
準パターンとの音節照合部13によるマツチングによっ
て音節ラティスを生成する。こうして生成された音節ラ
ティスと上記発声音節列とか発声法指示部16に入力さ
れる。 そうすると、発声法指示部16における距離計算部21
によって、発声音節列の音節位置番号iと音節ラティス
の音節位置番号jとの距離を表す距離行列を作成する。 さらに、DP部22によって、上記距離行列に基づいて
この距離行列における各要素(i、j)に至る最短累積
距離を表す累積行列と、DPババス終点(発声音節列に
おける最終音節と音節ラティスにおける最終音節との対
応付け)から始点(発声音節列における先頭音節と音節
ラティスにおける先頭音節との対応付け)に向かってD
Pパス上を遡る際の最適方向を示すパス行列とを作成す
る。そして、音節対応表作成部23によって、上記パス
行列に従って終点から始点に向かってDPババス遡るこ
とによって、発声音節列における音節位置番号lと音節
ラティスにおける音節位置番号jとを最適に対応付けた
音節対応表を作成する。 そうすると、発声法指示メツセージ生成部24は、こう
して作成された音節対応表に基づいて、発声音節列にお
ける2音節が音節ラティスにおけるl音節に対応付けら
れた(すなわち、音節が脱落した)箇所、あるいは、発
声音節列におけるl音節が音節ラティスにおける2音節
に対応付けられた(すなわち、音節が伸ばされた)箇所
を検索して、音節切り出し誤り位置とその種類とを検出
する。そして、検出した音節切り出し誤り位置と音節切
り出し誤りの種類とから発声法指示メツセージを生成し
て出力するようにしている。 こうして出力された発声法指示メツセージ?こ従つた発
声法によって同じ発声音節列を再発声することによって
、当該発声音節列を正しく発声できるようになるのであ
る。したがって、発声音節列を替えて繰り返し発声法を
訓練することによって、処理モードを認識モードに切り
替えて本装置を音声認識装置として動作させる際に、音
声認識装置における発声法として正しい発声法によって
音声入力ができるようになり、高い認識率が得られるの
である。 すなわち、本実施例における発声法指示装置によって発
声法を訓練すれは、身近に熟練者やインストラクタのい
ない初心者であっても、短時間のうちに音声認識装置を
使いこなせるようになるのである。 上記音節ラティスの信頼度順位数および上記音節対応表
におけるQの数は、上記実施例に限定されるものではな
い。 上記実施例においては、入力音声信号を音節単位で認識
して音節ラティスを作成し、この音節ラティスに基づい
て発声法指示メツセージを生威するようにしている。し
かしながら、この発明はこれに限定されるものではなく
、人力音声信号を音韻単位で認識して音韻ラティスを作
成し、この音韻ラティスに基づいて発声法指示メツセー
ジを生成するようにしてもよい。 この発明における距離行列作成処理動作、累積行列/パ
ス行列作成処理動作、音節対応表作成処理動作および発
声法指示メツセージ生成処理動作のアルゴリズムは、上
記実施例におけるアルゴリズムに限定されるものではな
い。
以上より明らかなように、この発明の発声法指示装置は
、音声認識部、距離計算部、DP部および対応表作成部
によって発声音節列の各音節位置と音節ラティスの各音
節位置とを対応付けた対応表あるいは発声音韻列の各音
韻位置と音韻ラティスの各音韻位置とを対応付けた対応
表を作成する。 そして、この対応表を参照して、発声法指示メツセージ
生成部によって発声法指示メツセージを生成するように
したので、ユーザはこの発声法指示メツセージに従った
発声法を繰り返すことによって、音声認識装置に適応し
た正しい発声法を会得することができる。 したがって、身近に熟練者やインストラクタかいない初
心者であっても、この発明によって発声法の訓練を行な
うことによって、音声認識装置を短時間のうちに使いこ
なせ、かつ、高い認識率を得ることができるのである。
、音声認識部、距離計算部、DP部および対応表作成部
によって発声音節列の各音節位置と音節ラティスの各音
節位置とを対応付けた対応表あるいは発声音韻列の各音
韻位置と音韻ラティスの各音韻位置とを対応付けた対応
表を作成する。 そして、この対応表を参照して、発声法指示メツセージ
生成部によって発声法指示メツセージを生成するように
したので、ユーザはこの発声法指示メツセージに従った
発声法を繰り返すことによって、音声認識装置に適応し
た正しい発声法を会得することができる。 したがって、身近に熟練者やインストラクタかいない初
心者であっても、この発明によって発声法の訓練を行な
うことによって、音声認識装置を短時間のうちに使いこ
なせ、かつ、高い認識率を得ることができるのである。
第1図はこの発明の発声法指示装置における一実施例の
ブロック図、第2図は第1図における発声法指示部の詳
細ブロック図、第3図は発声音節列の一例を示す図、第
4図は第3図の発声音節列に基づいて得られた音節ラテ
ィスの一例を示す図、第5図は第3図の発声音節列と第
4図の音節ラティスとに基づいて作成された距離行列の
一例を示す図、第6図は第5図の距離行列に基づいて作
成された累積行列の一例を示す図、第7図は第6図の累
積行列に基づいて作成されたパス行列の一例を示す図、
第8図は第7図のパス行列に基づいて作成された音節対
応表の一例を示す図、第9図は距離行列作成処理動作の
フローチャート、第10図は累積行列/パス行列作成処
理動作のフローチャート、第11図は音節対応表作成処
理動作のフローチャート、第12図は発声法指示メツセ
ージ生成処理動作のフローチャート、第13図は音節認
識結果に基づく特定話者用音声認識装置の一例を示すブ
ロック図である。 1!・・・音響処理部、 13・・・音節照合部、 21・・・距離計算部、 23・・・音節対応表作成部、 24・・・発声法指示メツセージ生成部。 12・・・音節切出部、 !6・・・発声法指示部、 22・・・DP部、 第2図
ブロック図、第2図は第1図における発声法指示部の詳
細ブロック図、第3図は発声音節列の一例を示す図、第
4図は第3図の発声音節列に基づいて得られた音節ラテ
ィスの一例を示す図、第5図は第3図の発声音節列と第
4図の音節ラティスとに基づいて作成された距離行列の
一例を示す図、第6図は第5図の距離行列に基づいて作
成された累積行列の一例を示す図、第7図は第6図の累
積行列に基づいて作成されたパス行列の一例を示す図、
第8図は第7図のパス行列に基づいて作成された音節対
応表の一例を示す図、第9図は距離行列作成処理動作の
フローチャート、第10図は累積行列/パス行列作成処
理動作のフローチャート、第11図は音節対応表作成処
理動作のフローチャート、第12図は発声法指示メツセ
ージ生成処理動作のフローチャート、第13図は音節認
識結果に基づく特定話者用音声認識装置の一例を示すブ
ロック図である。 1!・・・音響処理部、 13・・・音節照合部、 21・・・距離計算部、 23・・・音節対応表作成部、 24・・・発声法指示メツセージ生成部。 12・・・音節切出部、 !6・・・発声法指示部、 22・・・DP部、 第2図
Claims (1)
- (1)発声すべき音節の順序を表す発声音節列又は発声
音韻列に従って発声された音声に基づく音声信号から特
徴パターンを抽出し、この抽出された特徴パターンに基
づいて上記音声信号を音節単位又は音韻単位で認識して
音節ラティス又は音韻ラティスを生成する音声認識部と
、 上記音声認識部によって生成された音節ラティス又は音
韻ラティスと上記発声音節列又は発声音韻列とを取り込
んで、上記発声音節列の各音節位置と上記音節ラティス
の総ての音節位置との距離あるいは上記発声音韻列の各
音韻位置と上記音韻ラティスの総ての音韻位置との距離
を所定の手順で算出する距離計算部と、 上記距離計算部によって算出された上記距離を用いて、
上記発声音節列と上記音節ラティスとのDPマッチング
あるいは上記発声音韻列と上記音韻ラティスとのDPマ
ッチングを行って、DPパスの終点から始点に向かって
上記DPパスを遡る際における各格子点から次の格子点
への方向を表すパス行列を生成するDP部と、 上記DP部によって生成された上記パス行列で表される
上記方向に基づいて、上記発声音節列の各音節位置と上
記音節ラティスの各音節位置とを対応付けた対応表ある
いは上記発声音韻列の各音韻位置と上記音韻ラティスの
各音韻位置とを対応付けた対応表を作成する対応表作成
部と、 上記対応表作成部によって作成された上記対応表を参照
して、上記発声音節列と音節ラティスとの音節位置対応
関係あるいは発声音韻列と音韻ラティスとの音韻位置対
応関係が1対1でない箇所を検索し、この検索された箇
所とその箇所における上記音節位置対応関係又は音韻位
置対応関係とに従って、上記発声音節列又は発声音韻列
をより正しく発声するための発声法指示メッセージを生
成する発声法指示メッセージ生成部を備えたことを特徴
とする発声法指示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2140628A JPH0434499A (ja) | 1990-05-30 | 1990-05-30 | 発声法指示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2140628A JPH0434499A (ja) | 1990-05-30 | 1990-05-30 | 発声法指示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0434499A true JPH0434499A (ja) | 1992-02-05 |
Family
ID=15273120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2140628A Pending JPH0434499A (ja) | 1990-05-30 | 1990-05-30 | 発声法指示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0434499A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001100790A (ja) * | 1999-08-30 | 2001-04-13 | Koninkl Philips Electronics Nv | 音声認識用の方法及び装置 |
JP2004502985A (ja) * | 2000-06-29 | 2004-01-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 以後のオフライン音声認識のための音声情報を記録する記録装置 |
JP2007163895A (ja) * | 2005-12-14 | 2007-06-28 | Mitsubishi Electric Corp | 音声認識装置 |
-
1990
- 1990-05-30 JP JP2140628A patent/JPH0434499A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001100790A (ja) * | 1999-08-30 | 2001-04-13 | Koninkl Philips Electronics Nv | 音声認識用の方法及び装置 |
JP2004502985A (ja) * | 2000-06-29 | 2004-01-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 以後のオフライン音声認識のための音声情報を記録する記録装置 |
JP4917729B2 (ja) * | 2000-06-29 | 2012-04-18 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 以後のオフライン音声認識のための音声情報を記録する記録装置 |
JP2007163895A (ja) * | 2005-12-14 | 2007-06-28 | Mitsubishi Electric Corp | 音声認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4189051B2 (ja) | 発音測定装置および方法 | |
US6101470A (en) | Methods for generating pitch and duration contours in a text to speech system | |
JP6523893B2 (ja) | 学習装置、音声合成装置、学習方法、音声合成方法、学習プログラム及び音声合成プログラム | |
US8942983B2 (en) | Method of speech synthesis | |
US9798653B1 (en) | Methods, apparatus and data structure for cross-language speech adaptation | |
Duan et al. | A Preliminary study on ASR-based detection of Chinese mispronunciation by Japanese learners | |
Bettayeb et al. | Speech synthesis system for the holy quran recitation. | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
Li et al. | Improving mandarin tone mispronunciation detection for non-native learners with soft-target tone labels and blstm-based deep models | |
El Amrani et al. | Towards using CMU sphinx tools for the holy Quran recitation verification | |
JPH0434499A (ja) | 発声法指示装置 | |
Batlouni et al. | Mathifier—Speech recognition of math equations | |
JP2001306087A (ja) | 音声データベース作成装置および音声データベース作成方法および記録媒体 | |
KR100259777B1 (ko) | 텍스트/음성변환기에서의최적합성단위열선정방법 | |
Pitrelli et al. | Expressive speech synthesis using American English ToBI: questions and contrastive emphasis | |
JP2003022093A (ja) | 音声認識方法および音声認識装置ならびに音声認識プログラム | |
Wilhelms-Tricarico et al. | The lessac technologies hybrid concatenated system for blizzard challenge 2013 | |
JP3503862B2 (ja) | 音声認識方法及び音声認識プログラムを格納した記録媒体 | |
JP3522005B2 (ja) | 音声合成装置 | |
JPH04158476A (ja) | 音声対話装置 | |
JP2755792B2 (ja) | 音声認識装置 | |
JP3378448B2 (ja) | 音声素片選択方法,音声合成装置,及び命令記憶媒体 | |
JPH06167989A (ja) | 音声合成装置 | |
JP2001100775A (ja) | 音声合成装置のための音声データ量削減装置及び音声合成装置 | |
Nanyan | An Intelligent Evaluation Model of English Pronunciation Quality Based on Sphinx |