JPH03149598A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH03149598A
JPH03149598A JP1289610A JP28961089A JPH03149598A JP H03149598 A JPH03149598 A JP H03149598A JP 1289610 A JP1289610 A JP 1289610A JP 28961089 A JP28961089 A JP 28961089A JP H03149598 A JPH03149598 A JP H03149598A
Authority
JP
Japan
Prior art keywords
syllable
consonant
long
section
long sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1289610A
Other languages
English (en)
Other versions
JP2664785B2 (ja
Inventor
Shin Kamiya
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1289610A priority Critical patent/JP2664785B2/ja
Publication of JPH03149598A publication Critical patent/JPH03149598A/ja
Application granted granted Critical
Publication of JP2664785B2 publication Critical patent/JP2664785B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は−音韻認識や音節認識に基づく音声、認識装
置の改良に関する。
〈従米の技術〉 従来、音節認識に基づく特定話者用の音声認識装置とし
て、第3図に示すようなものがある。この音声認識装置
において、特徴抽出部lに入力された音声信号は、A/
D変換されてパワーお上びケプストラム係数等の特徴パ
ラメータが計算される。そしてさらに、この特徴パラメ
ータからパワー変化やスペクトル変化が算出される。そ
うすると、音節切出部2ではパワー変化やスペクトル変
化の変化点に基づいて音節境界候補を求める。音声の登
録時においては、特徴抽出部lによって算出されて音節
切出II52によって音節毎に切り出された特徴パラメ
ータの時系列が、音節登録部3によって音節標準パター
ン・メモリ4に標準パターンとして登録される。一方、
音声の認識時においては、音節切出部2によって音節毎
に切り出された入力音声の特徴パラメータの時系列(特
徴パターン)と、音節標準パターン・メモリ4に登録さ
れた標準パターンとのマツチングを音節認識部5によっ
て実施し、音節認識部5はマツチングの結果得られた音
節ラチスを出力する。
長音・促音判定部6では、音節切出部2で切り出された
音節区間や無音区間の長さを平均音声長と比較して、音
節認識部5によって認識された音節や無音が長音や促音
であるか否かの判定を行う。
言語処理部7は、長音や促音が挿入された音節ラチスと
単語辞書メモり8内の単語辞書とを照合して、文法的に
意味のある単語候補や文節候補を生成する。そして、こ
の生成された候補の中から結果選択部IOによって選択
された候補が表示部11に表示される。その際に、ユー
ザは表示部11−に表示された候補を見てその表示候補
が正しいか否かを判断し、表示候補を認識結果として受
は入れるか、あるいは次の候補を表示部11に表示させ
るか、あるいは表示候補を取り消して言い直すか等の指
示をキーボード部9から入力する。そうすると、このキ
ーボード部9からの指示に従って、長音・促音判定部6
の判定結果を変更したり、結果選択部lOによって次の
表示候補が選択されたりする。
く発明が解決しようとする課題〉 しかしながら、上記従来の音声認識装置においては、次
に説明するように言い直しの際に対処できないという問
題がある。
すなわち、第4図は通常の発声速度で「あたま」と発声
された場合における音節区間と無音区間との二側を示す
。このような音声が入力された場合には、音節切出部2
によって切り出された各区間長は平均音節長と比較して
長くないので、長音・促音判定部6において長音や促音
は検出されない。
ここで、例えば音節切出部2における音節切り出しの誤
りや音節認識部5におけるマツチング誤り等によって正
しい認識結果が得られなかったとする。その場合、ユー
ザはキーボード部9の取消”キーを押して認識結果を消
去し、「あたま」と再発声する。そして、何度言い直し
ても正しい認識結果が得られない場合には、ユーザは−
音節ずつ区切って発声することが多い。
第5図は−音節毎に区切って「あ・た・ま」とゆっくり
発声された場合(以下、このような発声を音節区切り発
声という)における音節区間と無音区間との一例を示す
。このように音節区切り発声によってゆっくり発声され
た場合には、音節切出部2による音節の切り出しは正し
く行われる。しかしながら、各区間の長さが平均音節長
より十分長くなるので、長音・促音判定部6によって多
くの長音や促音が検出されてしまい、音節認識部5によ
る認識結果は例えば「ああったあっまあ」となる。
すなわち、何度も音節区切り発声によってゆっくり言い
直しても正しく認識されないという問題がある。
そこで、この発明の目的は、極めて認識が困難な単語や
文節を入力する際に、音節区切り発声によって入力する
ことが可能な音声認識装置を提供することにある。
〈課題を解決するための手段〉 上記目的を達成するため、この発明は、入力された音声
信号の特徴パターンと標準パターン・メモリに格納され
た標準パターンとに基づいて音声を認識する際に、長音
・促音判定部によって長音あるいは促音を判定する音声
認識装置において、外部からの指示によって動作を開始
して、上記長音・促音判定部による長音あるいは促音の
判定結果を所定の手順によって無効にする長音・促音判
定無効手段と、上記長音・促音判定無効手段に対して動
作開始を指示する指示手段を備えたことを特徴としてい
る。
く作用〉 音声信号が人力されると、この入力された音声信号の特
徴パターンと標準パターン・メモリに格納された標準パ
ターンとに基づいて入力音声が認識される。さらに、長
音・促音判定部によって長音あるいは促音が判定される
。その際に、指示手段によって長音・促音判定無効手段
に対して動作開始が指示されると、上記長音・促音判定
無効手段が動作を開始して、上記長音・促音判定部によ
る長音あるいは促音の判定結果が所定の手順によって無
効にされる。したがって、音節区切り発声によって言い
直しを行う際に、予め上記指示手段によって長音・促音
判定部の判定結果を無効にすることを指示しておけば、
音声区切り発声に起因する長音・促音判定部の判定結果
が無効にされ、長音・促音判定部による誤判定が避けら
れる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明の音声認識装置のブロック図である。
この音声認識装置における各部の動作は、第3図に示し
た従来の音声認識装置と同じである。
すなわち、入力された音声信号は特徴抽出部21によっ
て特徴パラメータか求められ、この特徴パラメータに基
づいて音節切出部22によって音節境界候補が求められ
て音節に切り出される。そして、この入力音声の音節毎
の特徴パターンと登録時に音節標準パターン・メモり2
4に登録された音節毎の標準パターンとのマツチングが
音節認識部25によって実施され、認識結果の音節ラチ
スに対する言語処理が言語処理部27によって行われて
単語候補あるいは文節候補が得られる。そして、キーボ
ード部29からの指示に従って結果選択部30によって
選択された候補が表示部31に表示される。
その際に、長音・促音判定部26によって長音や促音が
判定されるのであるが、その際に実行される長音・促音
判定処理動作について詳細に説明する。
第2図は、上記長音・促音判定部26によって実行され
る長音・促音判定処理動作のフローチャートである。
ここで、 ■:切出区間の数 8(i): i番目の切出区間の種類(音節°と無音°
の2種類) L(i): i番目の切出区間の長さくフレーム数) LM:平均音節長(フレーム数) 05(i): i番目の切出区間が長音または促音なら
ば′1”でありそれ以外は0” である敗 key:最後に押されたキーの種類(正解”。
次候補゜および取消゜の3種類 a、b:定数 ステップSlで、iがビにセットされる。
ステップS2で、CS(i)が0°にセットされる。
ステップS3で、i番目の切出区間が音節”であるか否
かが判別される。その結果音節0であればステップS4
に進み、そうでなければステップS6に進む。
ステップS4で、L(i)>aXLMであるか否かが判
別される。その結果L(i)>aX4LMであればステ
ップS5に進み、そうでなければステップS5をスキッ
プしてステップS8に進む。
ステップS5で、CS(i)にl”がセットされる。
すなわち、切出区間が音節であって、その切出区間長が
平均音節長に基づく所定フレーム数より長い場合には、
音節認識部25によって認識された音節は長音であると
判定するのである。
ステップS6で、L(i)>bXLMであるか否かが判
別される。その結果L(i)>bX4LMであればステ
ップS7に進み、そうでなければステップS7をスキッ
プする。
ステップS7で、CS (i)にビがセットされる。
すなわち、切出区間が無音であって、その切出区間長が
平均音節長に基づく所定フレーム数より長い場合には、
音節認識部25によって認識された無音は促音であると
判定するのである。
ステップS8で、i=1であるか否かが判別される。そ
の結果i=IであればステップSIOに進み、そうでな
ければステップS9に進む。
ステップS9で、iをインクリメントしてステップS2
に戻り、次の切出区間に対する処理を実行する。
上記ステップS9までは、従来の音声認識装置における
長音・促音判定処理動作と同じである。
ステップSIO以降はこの発明に係る処理であり、指示
手段からの指示に基づいて、上述のようにして得られた
長音あるいは促音の判定結果を無効にする長音・促音判
定無効処理である。
ステップS10で、キーボード部29において最後に押
されたキーの種類が取消”キーであるか否かが判別され
る。その結果取消”キーであればステップSitに進み
、そうでなければ長音・促音判定処理動作を終了する。
すなわち、長音・促音判定部26に対して判定結果を無
効にすることを指示するための指示手段を取消”キーで
構成するのである。
ステップS11で、S (1)が1音節”であり、かつ
CS(1)=、=1であるか否かが判別される。その結
果S (1)が音節°でありCS(1)=1であればス
テップS12に進み、そうでなければ長音・促音判定処
理動作を終了する。
ステップS12で、S(2)が無音”であり、かつCS
(2)=1であるか否かが判別される。その結果S(2
)が無音”でありCS(2)=1であればステップS1
3に進み、そうでなければ長音・促音判定処理動作を終
了する。
ステップS13で、S(3)が音節”であり、かつCS
(3)=1であるか否かが判別される。その結果S(3
)が音節でありCS(3)=1であればステップS14
に進み、そうでなければ長音・促音判定処理動作を終了
する。
ステップS14で、iにl”がセットされる。
ステップS15で、CS(i)に0がセットされる。
ステップS16で、i=Iであるか否かが判別される。
その結果i=1でなければステップ817に進み、そう
でなければ長音・促音判定処理動作を終了する。
ステップSt?で、iがインクリメントされてステップ
S15に戻る。
こうして、取消°キーが押された後に入力された音声の
認識結果から長音および促音が取り除かれるのである すなわち、この発明にかかる長音・促音判定処理動作に
おいては、キーボード部29の取消”キーを押すことに
よって、それ以降に入力された音声の認識結果の時系列
における1番目の切出区間〜3番目の切出区間が「長音
」−「促音」−「長音」の時系列である場合(すなわち
、音節区切り発声であると見なされる場合)には長音・
促音フラグCS(i)をリセットするのである。こうす
ることによって、取消”キーを押してから入力された音
節区切り発声による音声に対しては、長音・促音判定結
果を無効にするのである。
以下、音節区切り発声によって「あ・た・ま」が入力さ
れた場合を例に、上述の長音・促音判定処理動作を具体
的に説明する。キーボード部29における取消”キーが
押された後、音節区切り発声によって「あ・た・ま」と
発声される。そうすると、音節切出部22によって第5
図に示すような切出区間!〜切出区間5の5個の切出区
間に切り出され、音節認識部25によって各切出区間に
対する認識処理が実行される。その結果、切出区間!は
音節「あ(音節1)Jと認識され、切出区間2は無音(
無音l)と認識され、切出区間3は音節「た(音節2)
」と認識され、切出区間4は無音(無音2)と認識され
、切出区間5は音節「ま(音13)」と認識される。
そして、長音・促音判定部26による長音・促音判定処
理動作に入る。
初期設定(ステップSt、ステップS2)シた後、切出
区間lは音節”であって所定時間長(平均音節長L M
 X a)より長い(音節区切り発声によってゆっくり
発声された)ので長音であると判定される(ステップS
3およびステップS4)。そして、長音・促音フラグC
S (1)に!”がセットされる(ステップS5)。次
に、切出区間2は無音”であって所定時間長(平均音節
長L M x b)より長いので促音であると判定され
る(ステップS3およびステップS6)。そして、長音
・促音フラグCS (2)に冒”がセットされる(ステ
ップS7)。以下同様にして、切出区間3および切出区
間5は長音であると判定されて長音・促音フラグCS 
(3)およびCS (5)にI”がセットされる。また
、切出区M4は促音であると判定されて長音・促音フラ
グCS (4)にl。
がセットされる。この結果、切出区間lの認識候補は「
ああ」、切出区間2の認識候補は「っ」、切出区M3の
認識候補は「たあ」、切出区間4の認識候補は「っ」、
切出区間5の認識候補は「まあ」となるのである。
ここで、キーボード部29の取消”キーが押されている
ので(ステップS 10)、切出区間1.切出区間2お
よび切出区間3の内容が調べられる。その結果、音節区
間l〜音節区間3は「長音(ああ)」−「促音(っ)」
−「長音(たあ)」の時系列になっているので(ステッ
プs it、ステップS12およびステップS13)、
総ての切出区間(切出区間1〜切出区間5)の長音・促
音フラグCj(i)に0”をセットする。この結果、切
出区間lの認識候補は「あ」、切出区間2の認識候補は
「無音」、切出区間3の認識候補は「た」、切出区間4
の認識候補は「無音」、切出区間5の認識候補は「ま」
と修正されるのである。
したがって、当初の認識候補「ああうたあつまあ」の長
音と促音とが自動的に取り除かれて、認識候補は「あた
ま」に変更されるのである。この場合、「あたま」は音
節区切り発声によってゆっくり発声されているので音節
切出部22によって正しく音節が切り出され、入力音声
が正しく認識されるのである。
その際に、例えば「ぴったり」のように2音節目に促音
を含む単語や文節を音節区切り発声すると必要な促をも
自動的に取り除かれて、認識候補は「びたり」となって
しまう。そこで、このような場合には「び・つ・た・す
」と音節区切り発声すればよい。そうすることによって
認識候補「ぴったり」が得られるが、後に言語処理部2
7における言語処理によって認識候補「ぴったり」を「
ぴったり」に変換するようにすれば良いのである。
上述のように、本実施例においては、単語や文節を音声
入力した際に音節認識部25によって正しい認識結果が
得られない場合には、キーボード部29の取消°キーを
押す。そうした後、音節区切り発声によって上記単語あ
るいは文節を再度入力する。そうすると、長音・促音判
定部26は、音節区切り発声における認識候補に含まれ
る長音あるいは促音を所定の手順によって自動的に除去
するようにしている。したがって、音節区切り発声によ
る認識結果に不必要な長音や促音が含まれることがなく
、音節区切り発声によってゆっくり発声された単語や文
節が正しく認識されるのである。
上記実施例においては、音節認識部25による音節認識
結果に基づいて音声を認識するようにしているが、この
発明は音韻認識結果に基づいて音声を認識する音声認識
装置に用いてもよい。
この発明における長音・促音判定部26による長音・促
音判定処理のアルゴリズムは本実施例に限定されるもの
ではない。
〈発明の効果〉 以上より明らかなように、この発明の音声認識装置は、
長音・促音判定部、長音・促音判定無効手段および指示
手段を備えて、上記指示手段による指示に従って上記長
音・促音判定無効手段が動作を開始し、上記長音・促音
判定部による判定結果を無効にするようにしたので、言
い直しを行う場合、予め指示手段によって上記長音・促
音判定部による長音あるいは促音の判定結果を無効にす
るように指示しておけば、音節区切り発声によってゆっ
くり発声しても不必要な長音や促音が付加されず、音節
区切り発声による言い直しにも対処できるのである。
したがって、この発明によれば、極めて認識が困難な単
語や文節を入力する際に、音節区切り発声によって言い
直しを行って音韻あるいは音節の切り出しを確実にして
、正しく音声を認識することができる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置における一実施例のブ
ロック図、第2図は第1図における長音・促音判定部に
よる長音・促音判定処理動作のフローチャート、第3図
は従来の音声認識装置のブロック図、第4図は通常に発
声された場合の切出区間の一例を示す図、第5図は音節
区切り発声された場合の切出区間の一例を示す図である
。 21・・・特徴抽出部、 22・・・音節切出部、23
−・・音節登録部、 24・・・音節標準パターン・メモり、25・・・音節
認識部、  26・・・長音・促音判定部、27・・・
言語処理部、  2B・・一単語辞書メモり、29・・
・キーボード部、 30・・・結果選択部、31・・・
表示部。 第2図 sa<て二び二!Σ〕〕〉J4−一−−一一一一一−−
一」−只A〇− C5(i)−1l

Claims (1)

    【特許請求の範囲】
  1. (1)入力された音声信号の特徴パターンと標準パター
    ン・メモリに格納された標準パターンとに基づいて音声
    を認識する際に、長音・促音判定部によって長音あるい
    は促音を判定する音声認識装置において、 外部からの指示によって動作を開始して、上記長音・促
    音判定部による長音あるいは促音の判定結果を所定の手
    順によって無効にする長音・促音判定無効手段と、 上記長音・促音判定無効手段に対して動作開始を指示す
    る指示手段を備えたことを特徴とする音声認識装置。
JP1289610A 1989-11-07 1989-11-07 音声認識装置 Expired - Fee Related JP2664785B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1289610A JP2664785B2 (ja) 1989-11-07 1989-11-07 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1289610A JP2664785B2 (ja) 1989-11-07 1989-11-07 音声認識装置

Publications (2)

Publication Number Publication Date
JPH03149598A true JPH03149598A (ja) 1991-06-26
JP2664785B2 JP2664785B2 (ja) 1997-10-22

Family

ID=17745470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1289610A Expired - Fee Related JP2664785B2 (ja) 1989-11-07 1989-11-07 音声認識装置

Country Status (1)

Country Link
JP (1) JP2664785B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647224B2 (en) 2004-11-24 2010-01-12 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for speech recognition
JP2013125119A (ja) * 2011-12-14 2013-06-24 Mitsubishi Electric Corp 音声認識装置および音声認識方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195900A (ja) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 音声入力式日本語文書処理装置
JPS60149098A (ja) * 1984-01-13 1985-08-06 三洋電機株式会社 音声入力装置
JPS6370298A (ja) * 1986-09-11 1988-03-30 株式会社東芝 促音認識装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58195900A (ja) * 1982-05-11 1983-11-15 電子計算機基本技術研究組合 音声入力式日本語文書処理装置
JPS60149098A (ja) * 1984-01-13 1985-08-06 三洋電機株式会社 音声入力装置
JPS6370298A (ja) * 1986-09-11 1988-03-30 株式会社東芝 促音認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647224B2 (en) 2004-11-24 2010-01-12 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for speech recognition
JP2013125119A (ja) * 2011-12-14 2013-06-24 Mitsubishi Electric Corp 音声認識装置および音声認識方法

Also Published As

Publication number Publication date
JP2664785B2 (ja) 1997-10-22

Similar Documents

Publication Publication Date Title
JP6052814B2 (ja) 音声認識モデルの構築方法、音声認識方法、コンピュータ・システム、音声認識装置、プログラムおよび記録媒体
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
JPH0422276B2 (ja)
EP2048655A1 (en) Context sensitive multi-stage speech recognition
JP2815579B2 (ja) 音声認識における単語候補削減装置
US20030200090A1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
EP1126438A1 (en) Speech recognizer
EP1298645A1 (en) Method for detecting emotions in speech, involving linguistic correlation information
JP2955297B2 (ja) 音声認識システム
JPH03149598A (ja) 音声認識装置
JP3277579B2 (ja) 音声認識方法および装置
JP2880436B2 (ja) 音声認識装置
JP3110025B2 (ja) 発声変形検出装置
JP2001188556A (ja) 音声認識方法及び装置
JP2000276189A (ja) 日本語ディクテーションシステム
JPH03217900A (ja) テキスト音声合成装置
JP3357752B2 (ja) パターンマッチング装置
KR19980013825A (ko) 언어모델 적응기능을 가진 음성인식장치 및 그 제어방법
JP2578771B2 (ja) 音声認識装置
JPH08171396A (ja) 音声認識装置
JP2004309654A (ja) 音声認識装置
JP2008286930A (ja) 音声対話装置
JPH04233599A (ja) 音声認識方法及び装置
JPH01285998A (ja) 音声認識装置
JP2001013983A (ja) 音声合成を用いた音声認識装置および音声認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees