JPS60185999A - 日本語音声入力装置 - Google Patents

日本語音声入力装置

Info

Publication number
JPS60185999A
JPS60185999A JP59042661A JP4266184A JPS60185999A JP S60185999 A JPS60185999 A JP S60185999A JP 59042661 A JP59042661 A JP 59042661A JP 4266184 A JP4266184 A JP 4266184A JP S60185999 A JPS60185999 A JP S60185999A
Authority
JP
Japan
Prior art keywords
syllable
recognition
speech
input
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59042661A
Other languages
English (en)
Other versions
JPH0229231B2 (ja
Inventor
充宏 斗谷
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP59042661A priority Critical patent/JPS60185999A/ja
Publication of JPS60185999A publication Critical patent/JPS60185999A/ja
Publication of JPH0229231B2 publication Critical patent/JPH0229231B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 木兄8AFi入力された音声を音節単位に認識する日本
語音声入力装置mの改良に関し、更に詳細には入力時に
発声された音声の認識結果にもとすいて、誤認識に関与
した特徴標準パターンを消去するように成したものであ
る。
〈発明の技術的背景とその問題点〉 従来の音声認識装置においては、音声の特徴標準パター
ンを登録する登録モードと、入力音声を認識する認識モ
ード(入力モード)とを分け、再登録という形式での音
節特徴パターンの入れ換えを行なうことは出来ても、認
識モードにおいて誤認識に関与した特徴標準パターンを
消去することが出来なかった。このことは単語の認識を
単位とする場合にはあまり問題とならないが、音節を単
位とする場合には音節間の特徴パターンの差が小さいた
め、切り出し位置等の影響により、特徴標準パターンと
して不適当なものがあった場合には、認識性能の低下が
生じるという問題点があった。
〈発明の目的〉 本発明は上記の点に鑑みて成されたものであり、一つの
音節に対して複数の特徴標準パターン全備えるようにし
た日本語音声入力装置において、誤認識に開力した不適
当な特徴標準パターンを消去することによって、認識性
能を向上させることを目的とし、この目的を達成するた
め、本発明の日本語音声入力装置は、入力時に発声され
た音声の認識結果にもとすいて、誤認識に関与した特徴
標準パターン全消去する消去手段を備えるように構成さ
れている。
また本発明の実施例によれば、入力した音声を記憶して
おくことにより、誤認識に関与した特徴標準パターンの
消去を指示したときの、対応する部分の入力音声を再生
出力して、正確に音節として切り出されたか否かを入力
者自身が確認でき、間違って特徴標準パターンを消去し
ないように成されている。
〈発明の実施例〉 以下、図面を参照して本発明を、連続的に発声された音
声を音節単位に認識し、この認識結果全キーボード等の
入力装置で修正した後に、単語等の単位で外部装置に転
送する機能を有する日本語音声入力装U′L を−例と
して説明する。
第1図は本発明の一実施例装置の構成を示すブロック図
である。
第I図において、発声され入力された音声はマイクロホ
ン1等を介してアナログ入力部2に入力され、該アナロ
グ入力部2内の増幅器3によって増幅された後、アナロ
グ/デジタル変換部4によってデジタル信号に変換され
、そのデジタル信号が音声分析部5及び音節セグメンテ
ーション部6に入力される。
音声分析部5では入力音声116m5程度のフレームに
分け、スペクトル分析全行ない、8ms 程度の間隔で
音節セグメンテーション部6に特徴パターンと、音節セ
グメンテーションに必要な情報(パワー、零交差数等)
f:転送する。
音節セグメンテーンヨン部6では、音声分析部5からの
種々の情報を用いて、入力音声から音節を切り出す。そ
の切り出した部分の特徴パターンと、その区間の音声波
形を波形・特徴パターン一時メモリ7にたくわえる。そ
して、音節を切、り出したこと’zcPU8に伝達する
と共に波形・特徴パターン一時メモリ7内のアドレスも
同時に伝達する0 波形・特徴パターン一時メモリ7は複数の音節?:たく
わえることができるように構成されている。
音節セグメンテーンヨン部6の処理はCPU8からの命
令により、開始・停止がコントロールされるように構成
されている。
9は単音節認識部でり、該単音節認識部9でu、CPU
8からの命令によりパターンメモリlO内の特徴パター
ンメモリ10aと標準パターンメモリl0−bとの間で
距離計算等を行ない、その結果′f:cPU8に戻す。
そして、CPU8はその結果を、認識結果格納メモIJ
 I 1にたくわえ、表示装置12に表示する。認識結
果格納メモ!J 11t/il:は、複数の音節に対す
る認識結果をたくわえることができるように構成されて
いる。
13は音声出力制御部であり、該音声出力制御部■3で
は、CPU8の命令により、波形・特徴パターン一時メ
モリ7の任意の部分に記憶され友情報をアナログ出力部
14に送る。そしてアナログ出力部14では音声、のデ
ジタル信号をデジタル/アナログ変換部14a及び増幅
器+4bによって音声波形に再生し出力するように構成
されている。
なお、上記パターンメモリ10は二つの部分に分かれて
おり、1’Oaは特徴パターンメモリであり入力さり、
た音節に対応する特徴パターンを一個分たけ記憶できる
。後の一つのIObは特徴標準パターン用メモリであり
複数の音節の特徴パターンが記憶されている。
上記音節の特徴パターン用メモU 10 bは後述する
ように各音節名をコードで記憶するエリア、登録の有無
を記憶するフラグエリア及び特徴標準パターンデータを
記憶する特徴標準パターンエリアより構成されている。
また15Iriキーボード等により構成された入力部で
あり、例えば第2図に示すようにカナキー15 a s
登録モードキー15b1認識モードキー15c1音節消
去キー15d等が備えられている。
また16は認識結果を外部装置1イに転送する際のデー
タの送受信の制御を行なうI/F部である。
次に、上記の如く構成された装置の動作を登録モード及
び認識モードについて説明する。
■登録モードの説明 第3図は登録モードにおけるCPU8の処理フローを示
したものである。
第3図において、装置本体が、登録モードキー15bの
操作によって登録モードに設定されるとまずステップn
1においてパターンメモIJIOが初期化され、標準パ
ターンが総て消去される。第1表は標準パターンメモI
J 10 bの構成を示したものである。
第1表 標準パターン10bの構成例 ステップnlにおける初期化の処理は標準パターンメモ
リ10bの登録の有無のフラグエリアに「0」を入れる
ことで実現される。
次にステップn2に移行して発声すべき単音節が表示装
置12に次のように表示される。
「あl」 ここで添字の「1」は「あ」のパターンの中の一番目で
あるこすを示している。
オペレータはこの表示装置12の表示を見て、所定の単
音節の音声全発声して入力する。
この音声入力に応じてステップn3に移行して音節セグ
メンテーション部6に音声の切り出しの開始の指示を行
ない、音節セグメンテーション部6は単音節を切り出し
、その区間の波形及び音声分析部5で得られた特徴パタ
ーンを波形・特徴パターン一時メモリ7に記憶させる。
ステップn4では音節セグメンテーンヨン部6で単音節
が切り出されたかどうかのチェックを行ない、切り出さ
れると次のステップn5に移行する0 ステップn5では音節セグメンテーション部6に切り出
し処理の停止全命令し登録の処理を継続する。
ステップn6では今切り出された音節に対応する音声部
分を波形・特徴パターン一時メモリ7より読み出して音
声出力制御部13を介してアナログ出力部14より再生
出力させる。
ステップn7では再生出力された音声にもとずいてオペ
レータが正確に切り出されたかどうか、を判定し、その
結果のキーボード15による指示に従い、再切り出しか
登録の実行かを決定する。このステップn7において、
オペレータが再生出力を聞いて正確に切り出されたと判
断した場合には実行キー+5i’5操作することになり
、その結果ステップn8に移行し、オペレータが再切り
出しを指示する場合には、解除キー15hの操作に応じ
て、ステップn3に戻ることになる。
ステップn8では表示装置12に表示されている音節に
対応する特徴標準パターンメモリlObの位置に特徴標
準パターンを記憶させると共に対応する登録の有無を示
すフラグにr lJtセットする。
ステップn9では全標準パターンの登録が終了されたか
どうかの判断を行ない、終了していなければステップn
2に戻り、次の単音節の表示、例えば「あ。」を表示し
、同様の処理を行なう。
このようにして、登録が終了すると標準パターンメモ1
JIlbKは総ての単音節の特徴標準パターンが数個ず
つ登録されることになる。
次に認識モードの動作を説明する。
第4図は、認識モードにおけるCPU8の処理フローを
示したものである。
ます、認識モードキー15cの操作によって装置が認識
モードに設定され、オペレータが認識すべき音声を発声
すると、この入力音声に応じてステップnllでは音節
セグメンテーンヨン部6に音節の切り出し開始の命令を
与える。そして、音節セグメンテーンヨン部6は波形・
特徴パターン一時メモIJ 7 f:初期化し、以後切
り出した音節に対応する特徴パターンと波形を先頭番地
から入れていき、各音節の波形及び特徴パターンの始端
と終端番地の情報をCPU8に与える。
ステップn12では音節が切り出されたかどうかのチェ
ックを行ない、切り出されるとステップn13に移る。
ステップn13では、波形・特徴パターン一時メモリ7
−の特徴パターンをパターンメモリIOの特徴パターン
メモ!JlOaの領域に転送して認識を行なう。即ち単
音節認識部9に認識の命令を与えることにより特徴パタ
ーンメモリメモリ7に入れるとともに、表示装置12に
表示する(ステップn14.)0 例えば、入力音声として「かいもの」と発声したときの
認識結果の第1位が「もぎもの」であれば表示装置12
には もぎもの− と表示され、また認識結果格納メモリ11には、各音節
に対する複数の認識結果候補が例えば第2表に示すよう
に格納される。
第2表 上記第2表において、アンダーラインを付したものは各
音節名での上位の認識結果であり、「音節次候補」キー
15eの操作によって順次、表示装置12に表示され、
また、本発明にしたがって消去の対象となり得る特徴標
準パターンに対応したものである。
上記の「かいもの」といった単語の入力が終わると、オ
ペレータはキーボード等の入力部15の「終了」キー1
5gを操作する。この結果、音節セグメンテーンヨン部
6に切り出しの停止が命令、される(ステップn15.
n16)。そして、全文字列が正解であれば「転送」の
キー15.+を入力することによジ、IlF部16を介
して外部装置にカナ文字を出力することができる(ステ
ップn l 8 +n19)。
また認識結果の表示を見て、はとんどの文字が間違って
いたり、言い間違いをしたときには「取消」キー15f
”f入力することによジ、ステップn17の判断により
、初期状態に戻すことができる0 才た、一部の認識結果が違っている場合には、ステップ
n20に示すように、オペレータがキーによる修正を行
なうことになる。
キーによる修正には二種類の方法がある。
まず、修正したい位置にカーソル移動キー15k。
151「→」「←」を用いて、修正したい文字のところ
にカーソルを持っていく。例えば第2文字目の「ぎ」を
修正したい場合には、カーソル移動キー「←J151の
操作により表示は次のよ□うになる。
もぎもの 一つの方法としては、このカーソル位置でキーボード1
5のカナキー15aで文字を入れることにより、次のよ
うに修正する。
くキー人力〉 ■ 「い」 もいもの もう一つの方法としては、キーボード15の「音節次候
補」のキー15eを入力することによってくキー人力〉 8 「音節次候補」 もにもの ■ 「音節次候補」 もいもの のように修正ができる。なお、このとき同−音節名のも
のは一度しか表示されないように構成されている。即ち
gS2S2O認識結果の候補は「き、。
に、、ぎ。、い。、・・・」であるが、「き、」は表示
されないように成されている。
上記のような手順−によって認識結果の修正が行なわれ
るが、本発明による特徴標準パターンの消去が次の手順
によって行なわれる。
上記した「かいもの」の例でいえば、入力音声「か」に
対する認識結果として「も」が出現することは、音節の
類似度の点から異常だと考えられる。
そこで表示装置12上のカーソルをカーソル移動キー1
5に、15H←」「→」を用いて、最初の「も」の位置
に移動させて表示画面を次のようにする(n20)もい
もの ここで、この「も」の特徴標準パターンを消去する場合
には「音節消去」キー15dを操作する(ステップn2
1)oもし、「も」以外の特徴標準パターンを消去した
い場合には「音節次候補」キー15e全操作して音節候
補を順次選択して表示させ、表示に現われたときに「音
節消去J−1−−15dを操作して消去したい音節全指
示することになる。
上記表示のときに、「音節消去」キー15dを入力する
ことにより1ステツプn21の判断でステップn22に
移り、音声出力制御部13に再生すべき音節の波形の始
端と終端の番地が指示され、波形・特徴パターン一時メ
モリ7より該当部分の線形が読み出されて、音声出力制
御部1B’に介してアナログ出力部14に与えられ、該
アナログ出力部14から1か」に対応する音声が再生出
力される0 オペレータはこの再生音声を聞くことにより、入力者自
身によって切り出し位17’:fが正確かどうかの判断
を下し、「実行」キー15iあるいは「解除」キー15
ht入力することに々るが、「実行」キー15iが押さ
れるとステップn23からステップn24に進み、「解
除」キー15hが押されるとステップn17に進むこと
になる。
ステップn23からn24に移行するとCPU8は指示
された認識結果(今の場合は「も、」)に対応する音節
特徴標準パターンをパターンメモ1月0の標準パターン
メモIJ 10 bから消去すると共に該当音節名部分
の登録の有無フラグヲ「0」にする0上記の例では、特
徴標準パターンの「も1」の消去を行なうので、音節名
「も、」の登録有無のフラグにrOJ’!z入れること
によって実現される。
もし、その音節名の登録の有無フラグが総て「0」にな
ってしまった場合には(ステップn25の判断による)
、再登録を促すために次のような表示を行なう(ステッ
プ026)。
「も」のパターンは総て消去されました。
オペレータはこの表示を見て、装置を登録モードに設定
して、「も」の標準パターンの登録を行なうことになる
上記実施例では、標準パターンメモリlObの記憶内容
の一部を入力者自らの判断だけで消去するように成して
いるが、本発明はこれに限定されるものではな(、例え
ば標準パターンの良否全判定することにより認識に貢献
している特徴標準パターンは消去できないようになして
も構わない。
標準パターンの良否の判定方法としては、例えば本出願
人が先に特願昭57−217296号「音声認識装置」
として提案した方法、即ち特徴標準パターン毎にカウン
タ手段を設け、入力音声の認識判定結果に応じて、その
カウンタ値を増減させ、このカウンタ値に応じて認識に
貢献している特徴標準パターンを判定する方法等がある
以上のようにして、上記した実施例によれば、一つの音
節に対して複数の特徴標準パターンを持つ音声入力装置
において、誤認識に関与した不適当な特徴標準パターン
を消去することにより、認識性能を向上させることがで
きる。したがって、例えば音声入力装置を使用している
と、登録時の操作ミス等によって特徴標準パターンとし
て不適当なものが登録され、入力音声とかけはなれた音
節が認識結果として出現することかあり、例えは「い」
と発声しても常に「にゃ」が認識結果として一位に出現
し、その度に修正を行なわなければならない場合が生じ
るが、本発明の実施例によれは、誤認識に関与した特徴
標準パターンの1にゃ」を消去することにより、以後は
「にゃ」が−位に出現することがなくなり、認識性能が
向上することになる。
また、例えば「かいもの」と発声したときの「か」を「
も」に誤認識した場合、入力した音声を記憶しておくこ
とにより、この「も」の特徴標準パターンの消去を指示
したときに、入力音声「か」に対応する部分の音声を再
生出力して、正確に音節として切り出されたか否か全入
力者自身が確認でき、また消去を指示した特徴標準パタ
ーンが正常な入力音声に対する認識結果であるか否かを
判断することが出来、認識に貢献している特徴標準パタ
ーン全問違って消去することを避けることが出来る。
〈発りJの効果〉 以上のように、本発明によれば入力された音声を予め登
録された複数種類の音節の特徴標準パターンと照合して
音節単位に認識する日本語音声入力装置において、入力
時に発声された音声の認識結果にもとすいて、誤認識に
関与した特徴標準パターンを消去する消去手段を備える
ように成しているため、誤認識に関与した不適当な特徴
標準パターンを消去することが出来、その結果認識性能
を向上させることが出来る。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すブロック図
、第2図はキーボード等の入力部の一例を示す平面図、
第3図は登録モードの動作を説明するための処理フロー
図、第4図は認識モードの動作を説明するための処理フ
ロー図である。 5・・・音声分析部、7・・・波形・特徴パターン一時
メモリ、8・・・CPU、9・・・単音節認識部、10
・・・パターンメモリ、10a・・・特徴パターンメモ
リ。 +Ob会←ヰ4吟・・・標準パターンメモIJ、II・
・・認識結果格納メモ!J、+5・・・キーボード、1
5b・・・登録モードキー、15c・・・認識モートキ
ー。 15d・・・音節消去キー。 代理人 弁理士 福 士 愛 彦 (他2名)第1図 第 2 し1

Claims (1)

  1. 【特許請求の範囲】 1、入力された音声を予め登録された複数種類の音節の
    特徴標準パターンと照合して音節単位に認識する日本語
    音声入力装置において、入力時に発声された音声の認識
    結果に−ちとすいて、誤認識に関与した特徴標準パター
    ンを消去する消去手段を備えるように成したことを特徴
    とする日本語音声入力装置。 2、上記消去手段は入力された音声を再生可能なデータ
    として記憶し、特徴標準パターンの消去を指示した音節
    に対応する音声部分を再生出力する手段を備えるように
    構成されたことを特徴とする特許請求の範囲第1項記載
    の日本語音声入力装置。
JP59042661A 1984-03-05 1984-03-05 日本語音声入力装置 Granted JPS60185999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59042661A JPS60185999A (ja) 1984-03-05 1984-03-05 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59042661A JPS60185999A (ja) 1984-03-05 1984-03-05 日本語音声入力装置

Publications (2)

Publication Number Publication Date
JPS60185999A true JPS60185999A (ja) 1985-09-21
JPH0229231B2 JPH0229231B2 (ja) 1990-06-28

Family

ID=12642193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59042661A Granted JPS60185999A (ja) 1984-03-05 1984-03-05 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS60185999A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57191698A (en) * 1981-05-21 1982-11-25 Hitachi Ltd Voice recognition system
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57191698A (en) * 1981-05-21 1982-11-25 Hitachi Ltd Voice recognition system
JPS5862699A (ja) * 1981-10-09 1983-04-14 シャープ株式会社 音声認識装置
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置

Also Published As

Publication number Publication date
JPH0229231B2 (ja) 1990-06-28

Similar Documents

Publication Publication Date Title
JP3263392B2 (ja) テキスト処理装置
JP4574390B2 (ja) 音声認識方法
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JPS60185999A (ja) 日本語音声入力装置
JP3903841B2 (ja) 自動通訳装置及び自動通訳用プログラム
JP2686085B2 (ja) 音声認識システム
JP3592803B2 (ja) 音声認識装置および音声認識方法
JPH0863185A (ja) 音声認識装置
JPH1011457A (ja) 携帯型検索装置
JPS6226049B2 (ja)
JP2547611B2 (ja) 文章作成システム
JP2547612B2 (ja) 文章作成システム
JPH0632005B2 (ja) 日本語音声入力装置
JP2609874B2 (ja) 音声認識システム
JPS6141199A (ja) 日本語音声入力装置
JPS6061875A (ja) パターン認識装置における標準パターン作成方法
JP2647873B2 (ja) 文章作成システム
JPH01161296A (ja) 音声認識システム
JPS63316899A (ja) 音声認識システム
JPS63259686A (ja) 音声入力装置
JPH0656609B2 (ja) 中文入力装置
JPH11338493A (ja) 情報処理装置および方法、並びに提供媒体
JPH0560880B2 (ja)
JPS60205594A (ja) 認識結果表示方式