JPS6141199A - 日本語音声入力装置 - Google Patents

日本語音声入力装置

Info

Publication number
JPS6141199A
JPS6141199A JP16321884A JP16321884A JPS6141199A JP S6141199 A JPS6141199 A JP S6141199A JP 16321884 A JP16321884 A JP 16321884A JP 16321884 A JP16321884 A JP 16321884A JP S6141199 A JPS6141199 A JP S6141199A
Authority
JP
Japan
Prior art keywords
syllable
key
syllables
input
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16321884A
Other languages
English (en)
Inventor
徹 上田
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP16321884A priority Critical patent/JPS6141199A/ja
Publication of JPS6141199A publication Critical patent/JPS6141199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は日本語の音声を予め登録された複数種類の音節
の特徴標準パターンとの類似度計算を行なって音節単位
で認識する音声入力装置に関し、特に簡単なキー操作等
の外部指示操作によ多入力音節の訂正が行なえ、かつ訂
正後の音節を標準パターンとして登録し得るように成し
たものである。
〈従来技術〉 現在の技術レベルでは100%正しい音声認識を行なう
ことは困難である。したがって、日本語音声認識装置で
はどうしても誤認識された音節を出来るだけ簡単に訂正
する手段が必要となる。
そこで、従来は認識の次候補を順次表示することによっ
て音節を訂正する方法が提案されている。
しかしながら、この方法では次候補に入力したい音節が
含まれていない場合には当該音節について再発声するか
、もしくはカナキーボードからi接正しい音節を入力す
る必要があシ、このため訂正操作が非常に煩雑で而もキ
ーボードのキー数も増加するという問題を有している。
〈目 的〉 本発明はかかる従来の問題点に鑑みて成されたもので、
その目的とするところは、入力音節の訂正の際に、外部
指示操作により、当該音節に係る訂正用の各音節候補を
一定の順序に従って順次表示させることによって、再発
声による入力やカナキーによる訂正入力を行なうことな
く、きわめ2て簡単な操作により入力音節の訂正と標準
パターンとしての登録を行なえるようにした日本語音声
入力装置を提供することにある。
〈実施例〉 以下、図面を参照して本発明を、連続的に発声された音
声を音節単位に認識し、その認識結果をキーボードで修
正した後、単語等の単位で外部装置に転送する機能を持
つ日本語音声入力装置を一例として説明する。
第1図は本発明の一実施例装置の構成を示すブロック図
である。
第1図において、発声され入力された音声はマイクロホ
ンを介してアナログ入力部aに入力され、該入力部a内
の増幅器(AMPCによって増幅された後、アナログ・
デジタル変換部(A/D ’)によってデジタル信号に
変換され、そのデジタル信号が音声分析部す及び音節セ
グメンテーション部Cに入力される。
音声分析部すでぽ入力音声を16m5程度のフレームに
分け、スペクトル分析を行ない、8ms程度の間隔で音
節セグメンテーション部Cに特徴パターンと、音節のセ
グメンテーションに必要な情報(パワー、零交差数等)
を転送する。
音節セグメンテーション部Cでは、音声分析部すからの
種々の情報を用いて、入力音声から音節を切り出す。そ
の切シ出した部分の特徴パターンと、その区間の音声波
形を波形・特徴パターン一時メモlJdにたくわえる。
そして、音節を切シ出したことをCPUeに伝達すると
共に波形・特徴パターン一時メモリd内のアドレノも同
時に伝達する。
波形・特徴パターン一時メモリdは複数の音節をたくわ
えることができるように構成されている。
音節セグメンテーション部Cの処理はCPUeからの命
令により、開始・停止がコントロールされるように構成
されている。
fは単音節認識部であシ、該単音節認識部fでは、CP
Ueからの命令によシバターンメモリa内の特徴パター
ンメモリ1gと標準パターンメモIJ2g及び3gとの
間で距離計算等を行ない、その結果をCPUeに戻す。
そして、CPUeはその結果を、認識結果格納メモリj
にたくわえ、表示装置lに表示する。認識結果格納メモ
lJjは1、 複数の音節に対する認識結果をたくわえ
ることができるように構成されている。
hは音声出力制御部であり、該音声出力制御部りでは、
CPUeの命令により、波形・特徴パターン一時メモリ
dの任意の部分に記憶された情報をアナログ出力部iに
送る。そしてアナログ出力部iでは音声のデジタル信号
をデジタルアナログ変換部(D/A)及び増幅器AMP
によって音声波形に再生し出力するように構成されてい
る。
なお、上記パターンメモリgは三つの部分に分かれてお
り、1gは特徴パターンメモリであり入力された音節に
対応する特徴パターンを一側方だけ記憶できる。後の二
つの2g及び3gは特徴標準パターン用メモリであり、
2gのエリアは登録モードで登録する音節の特徴パター
ン用のメモリであシ、3gのエリアは本特許で実現され
る認識(入力)モードで登録される音節の特徴パターン
用のメモリである。
上記音節の特徴パターン用メモリ2g及び3gは後述す
るようにそれぞれ各音節名をコードで記憶するエリア、
登録の有無を記憶するフラグエリア及び特徴標準パター
ンデータを記憶する特徴標準パターンエリアよ多構成さ
れている。またkはキーボード等により構成された入力
部であシ、例えば第2図に示すように登録モードキー1
k、音節登録キー2に、取消キー3に、解除キー4k。
転送キー5k、認識モードキー6k、音節次候補キー7
に、終了キー8に、実行キー9に、カーソル移動キー1
0に、llk及びカナキーの替わシに本発明に係る音節
選択キー12kが備えられている。
なお、mは認識結果を外部装置に転送する際のデータの
送受信の制御を行なうI/F (インターフェース)部
である。
次に、上記の如く構成された装置の動作を登録モード及
び認識モードについて説明する。
!、登録モードの説明 第3図は登録モードにおけるCPUeの処理フローを示
したものである。
第3図において、装置本体が登録モードキー1にの操作
によって登録モードに設定されるとまずステップn1に
おいてパターンメモリgが初期化され、標準パターンが
総て消去される。第1表は標準パターンメモリ2gの構
成を示したものであり、標準パターンメモリ3gも同様
に構成されている。
ステップn1における初期化の処理は標準パターンメモ
リ2g及び3gの登録の有無のフラグエリアに「0」を
入れることで実現される。次にステップn2に移行して
発声すべき単音節が表示装置lに次のように表示される
「あ、」 ここで添字の「1」は「あ」のパターンの中の一番目で
あることを示している。
オペレータはこの表示装置lの表示を見て、所定の単音
節の音声を発声して入力する。
この音声入力に応じてステップn8に移行して音節セグ
メンテーション部Cに音声の切シ出しの開始の指示を行
ない、音節セグメンション部Cは単音節を切り出し、そ
の区間の波形及び音声分析部すで得られた特徴パターン
を波形・特徴パターン一時メモリdに記憶させる。
ヌテツ7’n4では音節セグメンテーション部Cで単音
節が切り出されたかどうかのチェックを行ない、切り出
されると次のステップn5に移行する。
ステップn5では音節セグメンテーション部Cに切り出
し処理の停止を命令し登録の処理を継続する。
ステップn6では今切り出された音節に対応する音声部
分を波形・特徴パターン一時メモリdより読み出して音
声出力制御部りを介してアナログ出力部iより再生出力
させる。
ステップn7では再生出力された音声にもとすいてオペ
レータが正確に切シ出されたかどうかを判定し、その結
果のキーボードkによる指示に従い、再切り出しか登録
の実行かを決定する。このステップn7において、オペ
レータが再生出力を聞いて正確に切り出されたと判断し
た場合には実行キー9kを操作することになってステッ
プn8に移行し、オペレータが再切り出しを指示する場
合には、解除キー4にの操作に応じて、ステップn8に
戻ることになる。
ステップn8では表示装置lに表示されている音節に対
応する特徴標準パターンメモリ2gの位置に特徴標準パ
ターンを記憶させると共に対応する登録の有無を示すフ
ラグに、「1」をセットする。
ステップn9では全標準パターンの登録が終了されたか
どうかの判断を行々い、終了していなければステップn
2に戻シ、次の単音節の表示、例えば「あ2」を表示し
、同様の処理を行なう。
このようにして、登録が終了すると標準パターンメモリ
2gKは総ての単音節の特徴標準パターンが数個ずつ登
録されることになる。
次に認識モードの動作を説明する。
第4図は、認識モードにおけるCPUeの処理フローを
示したものである。
まず、認識モードキー6にの操作によって装置が認識モ
ードに設定され、オペレータが認識すべき音声を発声す
ると、この入力音声に応じてステップnilでは音節セ
グメンテーション部Cに音節の切り出し開始の命令を与
える。そして、音節セグメンテーション部Cは波形・特
徴パターン一時メモリdを初期化し、以後切り出した音
節に対応する特徴パターンと波形を先頭番地から入れて
いき、各音節の波形及び特徴パターンの始端と終端番地
の情報をCPUeに与える。
ステップn12では音節が切シ出されたかどうかのチェ
ックを行い、切シ出されるとステップn13に移る。
ステップnlBでは、波形・特徴パターン一時メモリd
の特徴パターンをパターンメ/4゛すgの特徴パターン
メモリ1gの領域に転送して認識を行なう。即ち単音節
認識部fに認識の命令を与えることによシ特徴パターン
メモリ1gの内容と標準パターンメモリ2g・3gの内
容の照合によりa識が行なわれ、その結果を認識結果格
納メモリjに入れるとともに、表示装置lに表示する(
ステップn14)。
例えば、入力音声として「かいもの」と発声したときの
認識結果の第1位が「かぎもも」であれば表示装置12
には かぎもも と表示され、また認識結果格納メモリjには、各音節に
対する複数の認識結果候補が例えば箸2表に示すように
格納される。
上記の「かいもの」といった単語の入力が終わると、オ
ペレータはキーボード入力部にの1終了」キー8kを入
力する。そうすると、音節セグメンテーション部Cに切
シ出しの停止が命令される(ステップr115.n16
)。そして、全文字列が正解であれば「転送」のキー5
kを入力することにより、14部mを介して外部装置に
カナ文字を出力することができる(ステップn18.n
19)。
また認識結果の表示を見て、はとんどの文字が間違って
いたり、言い間違いをしたときには「取消」キー3kを
入力することにより、ステップn17の判断により、初
期状態に戻すことができる。
また、一部の認識結果が違っている場合には、ステップ
n20に示すように、オペレータがキーによる修正を行
なうことになる。
まず、修正したい位置にカーソル移動キー10k。
11k「→」「=」を用いて、修正したい文字のところ
にカーソルを持っていく。例えば第4文字目の「も」を
修正したい場合には、カーソル移動キーr −J 11
 kの操作によシ表示は次のようになる。
かぎもも こjで、本発明ではキーボードにの「音節選択キー」1
2kを入力する。すなわち、この音節選択キー12kを
入力する度毎に、カーソル部分の音節が、 というように一定の順序(この例ではアイウェオ順)で
表示される。よって、カーソルキーで所望の音節を指定
したのちは、単に音節選択キー12kを操作するだけで
訂正することが出来る。
なお、上記の例では音節選択キー12kを操作する度毎
に順次訂正用の音節候補を表示するようにしているが、
まず音節選択キー12kが操作されると、以後は自動的
に訂正用の音節候補が一定間隔で順次表示され、所望の
音節が表示されたところで今一度音節選択キー12kを
操作するととで訂正できるようにしてもよい。
また、上記実施例では訂正用の音節候補をアイウェオ順
に表示しているが、音節の認識時には母音を誤る確率は
少ないのでr音節選択」キー12を操作すると現在表示
されている音節と同じ母音の頭から順に表示させるとよ
り訂正の効率が上がる。
なお、第1候補が入力の音節の母音と異なっているとき
には、「音節次候補」キー7kによってまず認識次候補
を出して同じ母音の音節を選択してから上記の方法を行
なうようにすればよい。
上記した例によれば、カーソルマークに対応する現在の
認識結果が「も」であるため、こ\で音というようにオ
段の音節から順次訂正することが出来る。
以上のようにして、音節を訂正したのち、たとk  え
ば、上記した「の」の入力音声を標準パターンとして登
録を行なう場合には「音節登録」キー2kを入力するこ
とにより、ステップn21の判断でステップn22に移
シ、音声出力制御部dに再生すべき音節の波形の始端と
終端の番地が指示され、波形・特徴パターン一時メモリ
dより該当部分の波形が読み出されて音声出力制御部り
を介してアナログ出力部1に与えられ、該アナログ出力
部iから「の」に対応する音声が再生出力される。
オペレータはこの再生音声を聞くことにょシ、入力者自
身によって切シ出し位置が正確がどうかの判断を下し、
「実行」キー9にあるいは「解除」キー4kを入力する
ことになるが、「実行」キー9kが押されるとステップ
n2gからステップn24に進み、「解除」キー4kが
押されるとステップn17に進むことになる。
ステップn23からステップn24に移行するとCPU
eは指定された音声に対応する音節特徴パターンとして
波形・特徴パターン一時メモリd内に記憶された該当音
節の特徴パターンをパターンメモリgの標準パターンメ
モリ3gに登録する。
この時、認識結果の音節候補群以外の音節としては登録
ができないように成されている。即ち波形・特徴パター
ン一時メモリ7に記憶された各音節に対する特徴パター
ンは認識結果の各音節候補に対する特徴標準パターンと
してしか登録できないように成されている。したがって
、例えば今の例では第1音節の特徴パターンは「か」、
Uた」。
「が」、「は」以外の特徴標準パターンとして登録でき
ないようになされている。
第3表は標準パターンメモリ3gの構成例を示したもの
である。
第3表 標準パターン3gの構成側 上記例では、入力音声を「の」として登録を行なうので
、音節者Uの」のエリアで登録の無いところ、すなわち
「のa」に特徴パターンを転送し登録の有無を「1」に
する。
もし登録の有無が総て「1」の場合、例えば第3表の「
あ」の場合には、「あC」までが登録されているので、
一番時間的に古い「あa」のエリアのデータを消してか
ら、その場所に登録する。
上記実施例では、標準パターンメモリを2g及び3gに
分けて登録したが、例えば標準パターンの良否を判定す
ることにより最も悪い特徴標準パターンを消して、その
エリアに入力時の音節を登録するようになしても構わな
い。
標準パターンの良否の判定方法としては、例えば本発明
者等が先に特願昭57−217296号「音声認識装置
」として提案した方法、即ち特徴標準パターン毎にカウ
ンタ手段を設け、入力音声の認識判定結果に応じて、そ
のカウンタ値を増減させ、このカウンタ値に応じて最も
悪い特徴標準パターンを判定する方法等がある。
以上のようにして、上記した実施例によれば、訂正すべ
き音節をカーソルマークで指定したのち、音節選択キー
の操作によって訂正用の各音節候補を一定の順序で順次
表示することにより、再発声やカナキーなどからの入力
を行なうことなく、きわめて簡単な操作で入力音節を訂
正することが出来る。
また、音節選択キーの操作で訂正することができるから
、従来のカナキーボードは全く不要となり、キーボード
にのキー数を著しく減少させることができる。
〈効 果〉 以上のように、本発明によれば入力された音声を予め登
録された複数種類の音節の特徴標準パターンと照合して
音節単位に認識する日本語音声入力装置において、入力
音節の訂正の際に、外部指示操作により、当該音節に係
る訂正用の各音節候補を一定の順序に従って順次表示す
る手段を備えるように構成しているので、カナキーボー
ドを設けることなく、また再発声することなく入力音節
の訂正を行なうことが出来る等、きわめて簡単な操作で
訂正作業が行なえ而も数個から士数個程度のキーからな
るキーボードを備えた小型軽量で安価外日本語音声入力
装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の構成を示すグロック図
、第2図はキーボード等の入力部の一例を示す平面図、
第3図は登録モードの動作を説明するための処理フロー
図、第4図は認識モードの動作を説明するための処理フ
ロー図である。 b・・・音声分析部、d・・・波形・特徴パターン一時
メモリ、e・・・CPU、f・・・単音節認識部、g・
・・パターンメモリ、1g・・・特徴パターンメモリ、
2g及び3g・・・標準パターンメモリ、j・・・認識
結果格納メモリ、k・・キーボード、1k・・・登録モ
ードキー、6k・・・認識モードキー、12k・・・音
節選択キー〇 代理人 弁理士  福 士 愛 彦(他2名)第2−

Claims (1)

  1. 【特許請求の範囲】 1、日本語の音声を、予め登録された複数種類の音節の
    特徴標準パターンとの類似度計算を行なって音節単位で
    認識する音声入力装置において、入力音節の訂正の際に
    、外部指示操作により、当該音節に係る訂正用の各音節
    候補を一定の順序に従って順次表示する手段を備えて成
    ることを特徴とする日本語音声入力装置。 2、上記手段は音節登録キーの操作に応じて上記訂正後
    の音節を標準パターンとして登録する手段を包含して成
    ることを特徴とする特許請求の範囲第1項記載の日本語
    音声入力装置。
JP16321884A 1984-07-31 1984-07-31 日本語音声入力装置 Pending JPS6141199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16321884A JPS6141199A (ja) 1984-07-31 1984-07-31 日本語音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16321884A JPS6141199A (ja) 1984-07-31 1984-07-31 日本語音声入力装置

Publications (1)

Publication Number Publication Date
JPS6141199A true JPS6141199A (ja) 1986-02-27

Family

ID=15769550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16321884A Pending JPS6141199A (ja) 1984-07-31 1984-07-31 日本語音声入力装置

Country Status (1)

Country Link
JP (1) JPS6141199A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56116096A (en) * 1980-02-20 1981-09-11 Canon Kk Method of revising voice recognizing apparatus
JPS5775349A (en) * 1980-10-28 1982-05-11 Nippon Telegr & Teleph Corp <Ntt> Japanese input device of voice recognition type
JPS59106085A (ja) * 1982-12-10 1984-06-19 Fujitsu Ltd 認識装置の辞書更新方法
JPS59160276A (ja) * 1983-03-02 1984-09-10 Matsushita Electric Ind Co Ltd パタ−ン認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56116096A (en) * 1980-02-20 1981-09-11 Canon Kk Method of revising voice recognizing apparatus
JPS5775349A (en) * 1980-10-28 1982-05-11 Nippon Telegr & Teleph Corp <Ntt> Japanese input device of voice recognition type
JPS59106085A (ja) * 1982-12-10 1984-06-19 Fujitsu Ltd 認識装置の辞書更新方法
JPS59160276A (ja) * 1983-03-02 1984-09-10 Matsushita Electric Ind Co Ltd パタ−ン認識装置

Similar Documents

Publication Publication Date Title
US7027985B2 (en) Speech recognition method with a replace command
JPS62239231A (ja) 口唇画像入力による音声認識方法
JP2002116796A (ja) 音声処理装置、音声処理方法及び記憶媒体
JP3104661B2 (ja) 日本語文章作成装置
JP3927800B2 (ja) 音声認識装置及び方法、プログラム、並びに記憶媒体
JPS6141199A (ja) 日本語音声入力装置
WO2021154018A1 (en) Electronic device and method for controlling the electronic device thereof
JP3903841B2 (ja) 自動通訳装置及び自動通訳用プログラム
JP2002215184A (ja) 音声認識装置、及びプログラム
JP2000099546A (ja) 音声によるデータ検索装置、データ検索方法、及び記憶媒体
JPH09230889A (ja) 音声認識応答装置
JP2003323196A (ja) 音声認識システム、音声認識方法および音声認識用プログラム
JPH064598A (ja) 情報格納検索装置
JPH11282486A (ja) サブワード型不特定話者音声認識装置及び方法
JPS6143337A (ja) 日本語音声入力装置
JPH0632005B2 (ja) 日本語音声入力装置
JP3108121B2 (ja) 音声認識装置の辞書制御方式
JP2995941B2 (ja) 不特定話者用音声認識装置
JPS60185999A (ja) 日本語音声入力装置
JPH0628415A (ja) 電子ファイリング装置
JP2000214878A (ja) 音声情報処理装置
JPS5961899A (ja) 日本語音声入力装置
JPH06308994A (ja) 日本語音声認識方法
JPS62180397A (ja) 音声パタ−ンの登録方式
JPS6026398A (ja) 音声入力装置