JPH04296898A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04296898A
JPH04296898A JP3063106A JP6310691A JPH04296898A JP H04296898 A JPH04296898 A JP H04296898A JP 3063106 A JP3063106 A JP 3063106A JP 6310691 A JP6310691 A JP 6310691A JP H04296898 A JPH04296898 A JP H04296898A
Authority
JP
Japan
Prior art keywords
dictionary
word
phrase
candidate
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3063106A
Other languages
English (en)
Inventor
Shin Kamiya
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3063106A priority Critical patent/JPH04296898A/ja
Publication of JPH04296898A publication Critical patent/JPH04296898A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、入力された音声を音
韻認識結果あるいは音節認識結果に基づいて認識し、認
識結果を仮名漢字変換して出力する音声認識装置に関す
る。
【0002】
【従来の技術】従来、音声認識の曖昧さを言語処理によ
って修正する機能を有した日本語入力装置がある。図6
は上記日本語入力装置のブロック図を示し、音節認識部
1,辞書照合部2,辞書3,認識結果格納部7および結
果表示部8から概略構成される。日本語による音声信号
が上記音節認識部1に入力される。そして、音節認識部
1によって音響分析されて特徴パラメータが得られ、こ
の得られた特徴パラメータの時系列が音節に切り出され
て特徴パターンが得られる。そうした後、この特徴パタ
ーンと標準パターン格納部(図示せず)に格納され標準
パターンとのパターンマッチングが実施されて音節候補
ラチスが生成される。上記辞書照合部2は、音節認識部
1からの音節候補ラチスを展開して音節候補列を得る。 そして、この得られた音節候補列が文節として成立する
か否かを辞書3を参照した言語処理によって判定して文
節候補を得る。上記辞書3は自立語辞書4,接辞語辞書
5および付属語辞書6から成り、上記言語処理に際して
は各自立語辞書4,接辞語辞書5および付属語辞書6が
参照されて、文節内文法を満たす音節候補列(すなわち
文節候補)が得られるのである。このようにして得られ
た認識結果(文節候補)は、認識結果の確からしさの順
位を付加して認識結果格納部7に格納される。こうして
、上記認識結果格納部7に格納された認識結果は、結果
表示部8の表示画面に仮名表記によってウインドウ表示
される。図7は付加された確からしさの順位が上位の数
個の認識結果をウインドウに表示した例である。
【0003】上述のようして、結果表示部8によって表
示された複数の認識結果の中から正しい文節を次のよう
にして確定する。すなわち、入力部(図示せず)を構成
するキーボードには、“変換”,“無変換”,“認識候
補”および“言い直し”の4種類のキーが設けられてい
る。上記ウインドウに表示されたカーソル“→”の位置
に在る音節候補列(図7では「ごふにんを」)が、発声
した文節を構成する音節列と同じであるか否かがオペレ
ータによって判定される。その結果、同じであればオペ
レータは“変換”キーを押圧して仮名漢字変換を実施し
、カーソル“→”によって指定された文節候補を正しい
文節として確定する。あるいは、“無変換”キーを押圧
して、カーソル“→”によって指定された文節候補を仮
名漢字変換することなく正しい文節として確定するので
ある。
【0004】一方、上記カーソル“→”によって指定さ
れた文節候補の音節候補列が発声した文節の音節列と同
じでなければ(すなわち、正しい文節でなければ)“認
識候補”キーを押圧し、カーソル“→”を次の文節候補
の位置に移動して次の文節候補に対する判定を行う。ま
た、ウインドウ内に表示された音節候補列の中に正しい
文節がない場合には“言い直し”キーを押圧し、認識結
果格納部7に格納されている認識結果をキャンセルして
ウインドウ内を消去する。そして、再度発声し直して音
声認識をやり直すのである。
【0005】
【発明が解決しようとする課題】こうして、上記日本語
入力装置においては、認識の曖昧さを言語処理によって
修正するのである。しかしながら、上記日本語入力装置
には次のような問題がある。すなわち、上記辞書3を構
成する自立語辞書4,接辞語辞書5および付属語辞書6
に登録される自立語,接辞語および付属語の語彙数を増
加した場合には、未だ音声入力されていない未知単語に
対するカバー率は向上して未知単語の認識率は増加する
。ところが、既に音声入力された既知単語に類似した音
節候補列を有する単語数も語彙数の増加に伴って増加す
る。その結果、既知単語の発声に基づく音節候補列の中
から辞書3を参照して文節内文法を満たす文節候補を得
る場合に、多くの文節候補が得られて曖昧性が増加して
しまうのである。したがって、入力音声の認識率が低下
してしまうという問題がある。例えば、語彙数が10万
語近くなれば文節認識率は70%程度になり、確からし
さが第5位までの累積文節認識率でも90%程度になっ
てしまうのである。
【0006】また、上記結果表示部8によって認識結果
をウインドウ表示する際に、仮名表記によって表示する
ようにしている。したがって、ウインドウ表示される認
識結果は図7から分かるように非常に似た音節候補列と
なり、一瞥しただけでは正しい文節を識別できない。そ
のため、オペレータが認識結果の中から正しい文節を確
定する場合には、音節候補列を構成する各音節候補を一
つ一つ丹念に確認しなければ成らないのである。さらに
、こうして選択された音節候補列を仮名漢字変換するか
否かを判断して、判断結果に応じて“変換”キーあるい
は“無変換”キーを操作して正しい文節を確定しなけれ
ばならないのである。つまり、この正しい文節の確定作
業は能率が悪く、オペレータに負担を強いるという問題
がある。
【0007】そこで、この発明の目的は、辞書の実質的
な語彙数を少なくして高い認識率を簡単に得ることがで
きる音声認識装置を提供することにある。
【0008】
【課題を解決するための手段】上記目的を達成するため
、第1の発明は、入力された音声信号から得られた音節
区間の特徴パラメータと標準パターンとのマッチングに
よって生成された音節候補ラチスに基づいて入力音声を
認識する音声認識装置において、上記音節候補ラチスを
展開して得られる音節候補列が文節内文法を満たす音節
候補列であるかを判定する際に用いられる辞書と、上記
辞書に登録された各単語に付加されて上記単語が過去に
使用されたことを表す使用情報が格納される使用情報格
納部と、上記音節候補ラチスを展開して音節候補列を作
成し、上記使用情報格納部の内容を参照しながら上記辞
書の内容を照合して上記作成された音節候補列の中から
文節内文法を満たす音節候補列を文節候補として得る辞
書照合部と、上記辞書照合部によって得られた文節候補
が過去に使用された単語を含む文節候補と過去に使用さ
れていない単語のみから成る文節候補とに区別して格納
される認識結果格納部と、上記認識結果格納部に格納さ
れた文節候補を過去に使用された単語を含む文節候補か
ら優先的に表示する結果表示部と、上記結果表示部によ
って表示された文節候補のうち正しい文節であると確定
された文節候補を構成する各単語の中に過去に使用され
ていない単語が在る場合には、その過去に使用されてい
ない単語に対応する上記使用情報格納部に上記使用情報
を書き込む使用情報書き込み部を備えたことを特徴とし
ている。
【0009】また、第2の発明は、上記第1の発明の音
声認識装置において、上記辞書には登録された各単語の
仮名・漢字表記を夫々の単語に付加して格納し、上記辞
書照合部は、得られた文節候補に同音異義語がない場合
には上記辞書の仮名・漢字表記を参照して当該文節候補
を漢字仮名交じり表記に変換する漢字変換手段を有する
ことを特徴としている。
【0010】また、第3の発明は、入力された音声信号
から得られた音韻区間の特徴パラメータと標準パターン
とのマッチングによって生成された音韻候補ラチスに基
づいて入力音声を認識する音声認識装置において、上記
音韻候補ラチスを展開して得られる音節候補列が文節内
文法を満たす音節候補列であるかを判定する際に用いら
れる辞書と、上記辞書に登録された各単語に付加されて
上記単語が過去に使用されたことを表す使用情報が格納
される使用情報格納部と、上記音韻候補ラチスを展開し
て音節候補列を作成し、上記使用情報格納部の内容を参
照しながら上記辞書の内容を照合して上記作成された音
節候補列の中から文節内文法を満たす音節候補列を文節
候補として得る辞書照合部と、上記辞書照合部によって
得られた文節候補が過去に使用された単語を含む文節候
補と過去に使用されていない単語のみから成る文節候補
とに区別して格納される認識結果格納部と、上記認識結
果格納部に格納された文節候補を過去に使用された単語
から成る文節候補から優先的に表示する結果表示部と、
上記結果表示部によって表示された文節候補のうち正し
い文節であると確定された文節候補を構成する各単語の
中に過去に使用されていない単語が在る場合には、その
過去に使用されていない単語に対応する上記使用情報格
納部に上記使用情報を書き込む使用情報書き込み部を備
えたことを特徴としている。
【0011】また、第4の発明は、上記第3の発明の音
声認識装置において、上記辞書には登録された各単語の
仮名・漢字表記を夫々の単語に付加して格納し、上記辞
書照合部は、得られた文節候補に同音異義語がない場合
には上記辞書の仮名・漢字表記を参照して当該文節候補
を漢字仮名交じり表記に変換する漢字変換手段を有する
ことを特徴としている。
【0012】
【作用】第1の発明では、入力された音声信号から得ら
れた音節区間の特徴パラメータに基づいて得られた音節
候補ラチスが辞書照合部によって展開されて、音節候補
列が作成される。そして、辞書に登録された各単語に付
加された使用情報格納部の内容を参照しながら上記辞書
の内容が照合されて、上記作成された音節候補列の中か
ら文節内文法を満たす音節候補列が文節候補として得ら
れる。そして、上記辞書照合部によって得られた文節候
補は、過去に使用された単語を含む文節候補と過去に使
用されていない単語のみから成る文節候補とに区別して
認識結果格納部に格納される。こうして、認識結果格納
部に格納された文節候補は、結果表示部によって過去に
使用された単語を含む文節候補から優先的に表示される
。そして、上記結果表示部によって表示された文節候補
のうち、音声入力された文節の音節列と同じ音節候補列
を有する文節候補が正しい文節として確定されるのであ
る。その結果、正しい文節であると確定された文節候補
を構成する単語中に過去に使用されていない単語が在る
場合には、使用情報書き込み部によって、上記過去に使
用されていない単語に対応する上記使用情報格納部にそ
の単語が過去に使用されたことを表す使用情報が書き込
まれる。このように、上記辞書照合部によって得られた
文節候補のうち、上記使用情報格納部に使用情報が格納
されている単語を含む文節候補を優先的に表示すること
によって、上記辞書の実質的な語彙数を少なくして精度
の良い音声認識が実施される。
【0013】また、第2の発明では、上記第1の発明に
おける辞書照合部によって得られた文節候補に同音異義
語がない場合には、辞書に格納された仮名・漢字表記を
参照して、上記辞書照合部の漢字変換手段によって当該
文節候補が漢字仮名交じり表記に変換される。こうして
、同音異義語のない文節候補が予め漢字仮名交じり表記
に変換されてウインドウに表示された文節候補に基づい
て、容易に正しい文節が識別されて確定されるのである
【0014】また、第3の発明では、入力された音声信
号から得られた音韻区間の特徴パラメータに基づいて得
られた音韻候補ラチスが辞書照合部によって展開されて
、音節候補列が作成される。そうした後、上記第1の発
明と同様にして、使用情報格納部の内容を参照しながら
辞書の内容を照合して辞書照合部によって文節候補が得
られ、過去に使用された単語から成る文節候補から優先
的に表示される。そして、正しい文節であると確定され
た文節候補を構成する単語中に過去に使用されていない
単語が在る場合には、使用情報書き込み部によって使用
情報が書き込まれるのである。このように、過去に使用
された単語を含む文節候補を優先的に表示することによ
って、上記辞書の実質的な語彙数を少なくして精度の良
い音声認識が実施される。
【0015】また、第4の発明では、上記第3の発明に
おける辞書照合部によって得られた文節候補に同音異義
語がない場合には、辞書に格納された仮名・漢字表記を
参照して、上記辞書照合部の漢字変換手段によって当該
文節候補が漢字仮名交じり表記に変換される。こうして
、正しい文節の確定が容易に実施されるのである。
【0016】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。図1は本実施例における音声認識装置のブロ
ック図である。音節認識部11は入力された音声信号を
音響分析して特徴パラメータを得、この得られた特徴パ
ラメータの時系列を音節に切り出して特徴パターンを得
る。そうした後、この特徴パターンと標準パターンとの
パターンマッチングを実施して図3に示すような音節候
補ラチスを生成する。辞書14は自立語辞書15,接辞
語辞書17および付属語辞書19から成る。そして、図
2に示すように、各辞書15,17,19には各単語の
品詞,発音仮名列および仮名・漢字表記が登録されてい
る。 また、自立語辞書15には自立語カウンタ16が各単語
毎に付加され、接辞語辞書17には接辞語カウンタ18
が各単語毎に付加され、付属語辞書19には付属語カウ
ンタ20が各単語毎に付加されている。上記各カウンタ
16,18,20の内容は、対応する単語が入力部24
の“変換”キーあるいは“無変換”キーが押圧されて正
しい文節であると確定された場合に、カウンタ制御部2
5によってインクリメントされる。すなわち、各カウン
タ16,18,20は各単語が音声入力された文章中に
おいて使用された回数をカウントするのである。
【0017】第1辞書照合部12は、図6の日本語入力
装置における辞書照合部2と同様にして、上記音節認識
部11からの音節候補ラチスを展開して音節候補列を得
る。そして、この得られた音節候補列に基づいて、上記
自立語辞書15,接辞語辞書17および付属語辞書19
に登録された総ての“発声仮名列”を照合して文節内文
法を満たす音節候補列(文節候補)を得る。こうして得
られた認識結果(文節候補)は、認識結果の確からしさ
の順位を付加して第1認識結果格納部21に格納される
。第2辞書照合部13は、上記各辞書15,17,19
における過去に使用された(すなわち、各カウンタ16
,18,20の内容が“0”でない)“発声仮名列”の
みを照合して、第1辞書照合部12によって得られた音
節候補列の中から文節内文法を満たす音節候補列を得る
。ここで、得られた音節候補列(文節候補)に同音異義
語が存在しない場合には、各辞書15,17,19の仮
名・漢字表記を参照して漢字変換手段(図示せず)によ
って当該音節候補列を漢字仮名交じり表記に変換する。 こうして得られた認識結果(文節候補)は、認識結果の
確からしさの順位を付加して第2認識結果格納部22に
格納される。
【0018】結果表示部23は、こうして上記第2認識
結果格納部22に格納された認識結果のうち上位N個の
文節候補をウインドウに表示する。引き続いて、第1認
識結果格納部21に格納された認識結果のうち上位M個
の文節候補を上記ウインドウに表示する。図4はN=2
,M=2+αで表示した場合の例である。この場合、第
2認識結果格納部22から読み出された2個の文節候補
の中の自立語「こくみん」には同音異義語が存在しない
ので、既に自動的に漢字表記「国民」に変換されている
。 CPU(中央処理装置)26は、音節認識部11,第1
辞書照合部12,第2辞書照合部13,結果表示部23
,入力部24およびカウンタ制御部25を制御して、音
声認識処理を実行する。
【0019】すなわち、本実施例では、自立語カウンタ
16,接辞語カウンタ18および付属語カウンタ20で
上記使用情報格納部を構成し、カウタ制御部25で上記
使用情報書き込み部を構成するのである。
【0020】上記第2辞書照合部13のように、過去に
使用された単語のみを参照して言語処理を実施すること
によって、辞書14の実質的な語彙数を減らすことがで
き、認識結果の曖昧性を減少して認識率を高めることが
できる。その際に、得られた音節候補列に相当する文節
候補に同音異義語が存在しない場合には予め自動的に漢
字仮名交じり表記に変換しておくので、後に実施される
正しい文節の確定動作の際に容易に発声文節を指定する
ことができると共に、“変換”キーを押圧する手間を省
くことができ、処理速度を速めることができる。
【0021】また、過去に使用されていない単語に基づ
く認識結果をも同時にウインドウ表示することによって
、未知単語が入力された場合にも対処できるようになっ
ている。さらに、過去に使用された単語に基づく確から
しさの高い認識結果を優先的にウインドウ表示すること
によって、現在作成中の文章の内容に沿った文節候補が
先に表示される。したがって、図4に示すように、正し
い文節であるとして確定される確率の高い文節候補が先
に表示され、次に実施される正しい文節の確定動作を更
に容易にしている。
【0022】上述のように、本実施例においては、自立
語辞書15には自立語カウンタ16を設け、接辞語辞書
17には接辞語カウンタ18を設け、付属語辞書19に
は付属語カウンタ20を設ける。そして、第1辞書照合
部12は、音節認識部11で生成された音節候補ラチス
を展開して音節候補列を得る。そして、上記各辞書15
,17,19に登録された総ての“発音仮名列”の内容
を照合して、上記音節候補列に基づいて文節内文法を満
たす文節候補を得る。そして、得られた文節候補を第1
認識結果格納部21に格納する。一方、上記第2辞書照
合部13は、上記各辞書15,17,19に登録された
各“発音仮名列”のうちカウンタ16,18,20の内
容が“0”ではない“発音仮名列”の内容を照合して、
第1辞書照合部12で得られた音節候補列に基づいて文
節内文法を満たす文節候補を得る。そして、得られた文
節候補は第2認識結果格納部22に格納される。その際
に、同音異義語がない文節候補があればその文節候補は
予め漢字仮名交じり表記に変換する。そうした後、結果
表示部23は、上記第2認識結果格納部22の中から確
からしさの高い順にN個の文節候補をウインドウ表示し
、続いて上記第1認識結果格納部21の中から確からし
さの高い順にM個の文節候補をウインドウ表示する。
【0023】したがって、上記自立語カウンタ16,接
辞語カウンタ18および付属語カウンタ20の内容に基
づいて、自立語辞書15,接辞語辞書17および付属語
辞書19に登録された多くの単語の中から既に音声入力
されており再度用いられる可能性の高い単語を選出する
ことができ、予め辞書の実質的な語彙数を減らして認識
率を高めることができるのである。また、上記言語処理
によって得られた文節候補に同音異義語がなければ、そ
の文節候補を漢字仮名交じり表記に変換してからウイン
ドウ表示するようにしているので、後に正しい文節を確
定する際には、非常に簡単であり作業性がよいのである
【0024】上記実施例においては、辞書14に登録さ
れた総ての単語を用いた第1辞書照合部12による辞書
照合と、過去に使用された単語のみを用いた第2辞書照
合部13による辞書照合との2種類の辞書照合を実施す
る。そして、得られた2種類の認識結果のうち過去に使
用された単語に基づく確からしさの高い認識結果を優先
的にウインドウ表示している。しかしながら、以下に述
べるようにして、辞書14に登録された総ての語を用い
た辞書照合のみを実施して、過去に使用された単語に基
づく認識結果を優先的にウインドウ表示することが可能
である。
【0025】本実施例における音声認識装置は、図1に
示す音声認識装置のうち第2辞書照合部13および第2
認識結果格納部22を除去した構成を有し、かつ第1認
識結果格納部21を複数の認識バッファで構成する。こ
の音声認識装置は、第1辞書照合部12によって自立語
辞書15,接辞語辞書17および付属語辞書19に登録
された総ての単語と照合する言語処理を実施する。その
際に、後に述べるような使用頻度を算出する。また、文
節内文法を満たす音節候補列から成る文節候補のうち同
音異義語がない文節候補は予め漢字仮名交じり表記に変
換しておく。そして、得られた文節候補を第1認識結果
格納部21の各認識結果バッファに使用頻度別に格納す
る。結果表示部23は、上記認識結果バッファに格納さ
れた文節候補のうち過去に使用された単語の数を多く含
む文節候補を優先的に表示するのである。
【0026】図5は、その際に第1辞書照合部12によ
って実施される使用頻度算出処理動作のフローチャート
である。以下、図5にしたがって使用頻度算出処理動作
について詳細に説明する。 ステップS1で、上記音節認識部11によって得られた
音節候補ラチスを展開する際の順番を表す展開番号m(
上限値M)と上記音節候補ラチスを展開して得られた文
節候補の数j(上限値J)との内容が初期値“0”に設
定される。また、後に詳述するポインタp(i)の内容
が初期値“1”に設定される。 ステップS2で、上記音節候補ラチスが展開されて音節
候補列RETU(m)が得られ、展開番号mの内容がイ
ンクリメントされる。 ステップS3で、変数xの内容が展開番号mの音節候補
列RETU(m)に設定される。 ステップS4で、上記音節候補列RETU(m)が文節
内文法を満たす音節候補列であるかが、自立語辞書15
,接辞語辞書17および付属語辞書19の総ての単語を
照合して調べられる。 ステップS5で、上記ステップS4における辞書照合の
結果に基づいて、上記音節候補列x(=RETU(m)
)は文節内文法を満たす音節候補列であるか否かが判定
される。その結果、文節内文法を満たす音節候補列であ
る場合にはステップS6に進み、そうでなければ当該音
節候補列xを棄却してステップS14に進む。
【0027】ステップS6で、対象となる音節候補列x
の使用頻度iが次式によって算出される。 i=KITI(x)−MITI(x)+k  …(1)
ここで、 KITI(x):文節内文法を満たす音節候補列x(=
RETU(m))を構成する単語のうちで、自立語カウ
ンタ16,接辞語カウンタ18および付属語カウンタ2
0の内容が“0”ではない単語の数 MITI(x):文節内文法を満たす音節候補列x(=
RETU(m))を構成する単語のうちで、自立語カウ
ンタ16,接辞語カウンタ18および付属語カウンタ2
0の内容が“0”である単語の数 k:定数 ステップS7で、上記ステップS6で算出された使用頻
度iの値が“1”より小さいか否かが判別される。その
結果“1”より小さければステップS8に進み、そうで
なければステップS8をスキップする。 ステップS8で、上記使用頻度iに“1”がセットされ
る。 ステップS9で、上記使用頻度iの値が上限値“I”よ
り大きいか否かが判別される。その結果上限値“I”よ
り大きければステップS10に進み、そうでなければス
テップS10をスキップする。 ステップS10で、上記使用頻度iに上限値“I”がセ
ットされる。
【0028】ステップS11で、上記使用頻度iを呈す
る音節候補列xを格納するための認識結果バッファ(以
下、認識結果バッファB(i)と言う)における当該文
節候補x(=RETU(m))が格納される位置を示す
上記ポインタp(i)の内容が、その上限値“maxp
(i)”以下であるか否かが判別される。その結果上限
値“maxp(i)”以下であればステップS12に進
み、そうでなければステップS14に進む。すなわち、
上記認識結果バッファB(i)(1≦i≦I)で上記第
1認識結果格納部21を構成するのである。 ステップS12で、上記認識結果バッファB(i)にお
けるポインタp(i)によって示される位置に格納され
る文節候補BUF(i,p(i))の内容が、当該音節
候補列x(=RETU(m))に設定される。 ステップS13で、当該音節候補列RETU(m)が認
識結果バッファB(i)におけるポインタp(i)によ
って示される位置に格納されて文節候補として確定され
たので、文節候補数jおよびポインタp(i)の内容が
インクリメントされる。 ステップS14で、文節候補数jの内容がその上限値J
であるか否かが判別される。その結果、上限値Jであれ
ば使用頻度算出処理動作を終了する。一方、上限値Jよ
り小さければステップS15に進む。 ステップS15で、上記展開番号mの内容がその上限値
Mであるか否かが判別される。その結果、上限値Mであ
れば使用頻度算出処理動作を終了する。一方、上限値M
より小さければステップS2に戻って、展開番号(m+
1)の音節候補列RETU(m+1)の処理に入る。こ
うして、上記ステップS14において文節候補数jの内
容が上記上限値Jになるか、あるいは上記ステップS1
5において展開番号mの内容が上記上限値Mになると、
使用頻度算出処理動作を終了するのである。
【0029】上述のようにして、上記第1辞書照合部1
2によって使用頻度算出処理動作を実施して言語処理が
行われると、上記第1認識結果格納部21における使用
頻度i別に設けられた認識結果バッファB(i)内には
、上記ポインタp(i)によって示される位置に文節候
補BUF(i,p(i))が格納されることになる。つ
まり、より大きい“i”に係る認識結果バッファB(i
)には、より多くの過去に使用された単語から構成され
た文節候補が格納されるのである。
【0030】そこで、上記結果表示部23は、使用頻度
iの最大値に係る認識結果バッファB(i)から順に文
節候補を読み出してウインドウに表示すれば、過去に使
用された単語に基づく認識結果(文節候補)を優先して
表示できるのである。具体的に言えば、BUF(I,1
),BUF(I,2),…,BUF(I,p(I)−1
),…,BUF(1,1),BUF(1,2),…,B
UF(1,p(1)−1)の順に表示すればよいのであ
る。
【0031】さらに、上述のような言語処理を具体例を
挙げて説明する。例えば入力された音声に基づいて音節
認識部11によって得られた音節候補ラチスを、第1辞
書照合部12で展開して得られた音節候補列xが「ごふ
にんを」である場合には、次のようにして使用頻度iが
算出される。すなわち、図2を参照して、音節候補列x
の接頭語「ご」の接辞語カウンタ18の内容は“37”
であることを知る。同様にして、音節列xの名詞「ふに
ん」の自立語カウンタ16の内容は“0”であり、助詞
「を」の付属語カウンタ20の内容は“355”である
ことを知る。したがって、各カウンタ16,18,20
の内容が“0”ではない単語数KITI(x)は“2”
であり、上記カウンタ16,18,20の内容が“0”
である単語数MITI(x)は“1”である。その結果
、使用頻度iは式(1)によりk=3として、 i=KITI(x)−MITI(x)+3=2−1+3
=4 と算出される。したがって、音節候補列「ごふにんを」
は、上記第1認識結果格納部21の認識バッファB(4
)に格納される。
【0032】さらに、上記音節ラチスを展開して得られ
た音節候補列xが「こくみんを」である場合には、音節
候補列xの名詞「こくみん」の自立語カウンタ16の内
容は“8”であり、助詞「を」の付属語カウンタ20の
内容は“355”である。したがって、KITI(x)
=2,MITI(x)=0であり、使用頻度iはi=K
ITI(x)−MITI(x)+3=2−0+3=5 と算出される。したがって、音節候補列「こくみんを」
は、上記第1認識結果格納部21の認識バッファB(5
)に格納される。その結果、結果表示部23は、i=5
(>4)に係る認識バッファB(5)内に格納された文
節候補から先に文節候補を表示する。こうして、文節候
補「こくみんを(国民を)」の方が文節候補「ごふにん
を」よりも優先してウインドウ表示されるのである。な
お、上述の使用頻度iの算出式(1)における定数kは
使用頻度iの算出結果を正数にするための定数であり、
上記“3”に限定されるものではなく適宜に設定すれば
よい。
【0033】上述のように、本実施例においては、第1
辞書照合部12によって、音節認識部11で生成された
音節候補ラチスを展開して得た音節候補列に対して言語
処理を実施するに際して、各音節候補列が既に使用され
た単語によって構成されている度合いを表す使用頻度i
を求める。そして、認識結果を表示する際には、この使
用頻度iの高い文節候補を優先的にウインドウ表示する
ようにしている。このことは、上記自立語辞書15,接
辞語辞書17および付属語辞書19の実質的な語彙数を
減らすことと同じ効果を齎し、認識率を高めることがで
きるのである。
【0034】本実施例における使用頻度算出処理のアル
ゴリズムは、上述のアルゴリズムに限定されるものでは
ない。また、上記各実施例においては、自立語カウンタ
16,接辞語カウンタ18および付属語カウンタ20で
使用情報格納部を構成しているが、フラグ等で構成して
も何等差し支えない。また、上記各実施例においては、
入力された音声を音節認識結果に基づいて認識する場合
を例に説明しているが、音韻認識結果に基づいて認識し
てもよい。
【0035】
【発明の効果】以上より明らかなように、第1の発明の
音声認識装置は、辞書照合部によって音節候補ラチスを
展開して音節候補列を作成し、使用情報格納部の内容を
参照しながら辞書の内容を照合して文節候補を得て、認
識結果格納部に過去に使用された単語を含む文節候補と
そうでない文節候補とを区別して格納し、結果表示部に
よって過去に使用された単語を含む文節候補から優先的
に表示する。そして、正しい文節であると確定された文
節候補を構成する各単語の中に過去に使用されていない
単語が在る場合には、その単語に係る上記使用情報格納
部に当該単語が既に使用されたことを表す使用情報を使
用情報書き込み部によって書き込むようにしている。し
たがって、この発明によれば、上記過去に使用された単
語を含む文節候補から優先的に表示することによって辞
書の実質的な語彙数を少なくして、高い認識率を得るこ
とができる。
【0036】また、第2の発明の音声認識装置は、上記
第1の発明における辞書照合部によって得られた文節候
補に同音異議語がない場合には、辞書の仮名・漢字表記
を参照して、上記辞書照合部の漢字変換手段によって当
該文節候補を漢字仮名交じり表記に変換するので、結果
表示部よってウインドウ表示された文節候補中から正し
い文節を容易に識別できる。したがって、第1の発明の
効果に加えて、正しい文節を容易に確定して言語処理を
簡単にできるという効果を呈するのである。
【0037】第3の発明の音声認識装置は、辞書照合部
によって音韻候補ラチスを展開して音節候補列を作成し
、上記第1の発明と同様にして、辞書照合部によって使
用情報格納部の内容を参照しながら辞書の内容を照合し
て文節候補を得、結果表示部によって過去に使用された
単語を含む文節候補から優先的に表示し、正しい文節で
あると確定された文節候補に基づいて、使用情報書き込
み部によって上記使用情報格納部に使用情報を書き込む
ようにしている。したがって、この発明によれば、辞書
の実質的な語彙数を少なくして高い認識率を得ることが
できる。
【0038】また、第4の発明の音声認識装置は、上記
第3の発明における辞書照合部によって得られた文節候
補に同音異議語がない場合には、上記第2の発明と同様
にして、当該文節候補を漢字仮名交じり表記に変換する
ので、結果表示部よってウインドウ表示された文節候補
中から正しい文節を容易に識別できる。したがって、第
3の発明の効果に加えて、言語処理を容易にできるとい
う効果を呈する。
【図面の簡単な説明】
【図1】この発明の音声認識装置における一実施例のブ
ロック図である。
【図2】図1における辞書の内容の一例を示す図である
【図3】図1における音節認識部によって生成される音
節候補ラチスの一例を示す図である。
【図4】図1における結果表示部によってウインドウに
表示される認識結果の一例を示す図である。
【図5】他の実施例における使用頻度算出処理動作のフ
ローチャートである。
【図6】従来の日本語入力装置のブロック図である。
【図7】図6における結果表示部によってウインドウに
表示される認識結果の一例を示す図である。
【符号の説明】
11…音節認識部、                
  12…第1辞書照合部、13…第2辞書照合部、 
             14…辞書、15…自立語
辞書、                  16…自
立語カウンタ、17…接辞語辞書、         
         18…接辞語カウンタ、19…付属
語辞書、                  20…
付属語カウンタ、21…第1認識結果格納部、    
      22…第2認識結果格納部、23…結果表
示部、24…入力部、25…カウンタ制御部、    
          26…CPU。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】  入力された音声信号から得られた音節
    区間の特徴パラメータと標準パターンとのマッチングに
    よって音節候補ラチスを生成し、この生成された音節候
    補ラチスに基づいて入力音声を認識する音声認識装置に
    おいて、上記音節候補ラチスを展開して得られる音節候
    補列が文節内文法を満たす音節候補列であるかを判定す
    る際に用いられる辞書と、上記辞書に登録された各単語
    に付加されると共に、上記単語が過去に使用されたこと
    を表す使用情報が格納される使用情報格納部と、上記音
    節候補ラチスを展開して音節候補列を作成し、上記使用
    情報格納部の内容を参照しながら上記辞書の内容を照合
    して上記作成された音節候補列の中から文節内文法を満
    たす音節候補列を文節候補として得る辞書照合部と、上
    記辞書照合部によって得られた文節候補が、過去に使用
    された単語を含む文節候補と過去に使用されていない単
    語のみから成る文節候補とに区別して格納される認識結
    果格納部と、上記認識結果格納部に格納された文節候補
    を、過去に使用された単語を含む文節候補から優先的に
    表示する結果表示部と、上記結果表示部によって表示さ
    れた文節候補のうち正しい文節であると確定された文節
    候補を構成する各単語の中に過去に使用されていない単
    語が在る場合には、その過去に使用されていない単語に
    対応する上記使用情報格納部に上記使用情報を書き込む
    使用情報書き込み部を備えたことを特徴とする音声認識
    装置。
  2. 【請求項2】  請求項1に記載の音声認識装置におい
    て、上記辞書には、登録された各単語の仮名・漢字表記
    を夫々の単語に付加して格納し、上記辞書照合部は、得
    られた文節候補に同音異義語がない場合には、上記辞書
    の仮名・漢字表記を参照して当該文節候補を漢字仮名交
    じり表記に変換する漢字変換手段を有することを特徴と
    する音声認識装置。
  3. 【請求項3】  入力された音声信号から得られた音韻
    区間の特徴パラメータと標準パターンとのマッチングに
    よって音韻候補ラチスを生成し、この生成された音韻候
    補ラチスに基づいて入力音声を認識する音声認識装置に
    おいて、上記音韻候補ラチスを展開して得られる音節候
    補列が文節内文法を満たす音節候補列であるかを判定す
    る際に用いられる辞書と、上記辞書に登録された各単語
    に付加されると共に、上記単語が過去に使用されたこと
    を表す使用情報が格納される使用情報格納部と、上記音
    韻候補ラチスを展開して音節候補列を作成し、上記使用
    情報格納部の内容を参照しながら上記辞書の内容を照合
    して上記作成された音節候補列の中から文節内文法を満
    たす音節候補列を文節候補として得る辞書照合部と、上
    記辞書照合部によって得られた文節候補が、過去に使用
    された単語を含む文節候補と過去に使用されていない単
    語のみから成る文節候補とに区別して格納される認識結
    果格納部と、上記認識結果格納部に格納された文節候補
    を、過去に使用された単語から成る文節候補から優先的
    に表示する結果表示部と、上記結果表示部によって表示
    された文節候補のうち正しい文節であると確定された文
    節候補を構成する各単語の中に過去に使用されていない
    単語が在る場合には、その過去に使用されていない単語
    に対応する上記使用情報格納部に上記使用情報を書き込
    む使用情報書き込み部を備えたことを特徴とする音声認
    識装置。
  4. 【請求項4】  請求項3に記載の音声認識装置におい
    て、上記辞書には、登録された各単語の仮名・漢字表記
    を夫々の単語に付加して格納し、上記辞書照合部は、得
    られた文節候補に同音異義語がない場合には、上記辞書
    の仮名・漢字表記を参照して当該文節候補を漢字仮名交
    じり表記に変換する漢字変換手段を有することを特徴と
    する音声認識装置。
JP3063106A 1991-03-27 1991-03-27 音声認識装置 Pending JPH04296898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3063106A JPH04296898A (ja) 1991-03-27 1991-03-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3063106A JPH04296898A (ja) 1991-03-27 1991-03-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04296898A true JPH04296898A (ja) 1992-10-21

Family

ID=13219713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3063106A Pending JPH04296898A (ja) 1991-03-27 1991-03-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04296898A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008051895A (ja) * 2006-08-22 2008-03-06 Casio Comput Co Ltd 音声認識装置および音声認識処理プログラム
JP2011203434A (ja) * 2010-03-25 2011-10-13 Fujitsu Ltd 音声認識装置及び音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008051895A (ja) * 2006-08-22 2008-03-06 Casio Comput Co Ltd 音声認識装置および音声認識処理プログラム
JP2011203434A (ja) * 2010-03-25 2011-10-13 Fujitsu Ltd 音声認識装置及び音声認識方法

Similar Documents

Publication Publication Date Title
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
JP5072415B2 (ja) 音声検索装置
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US9978364B2 (en) Pronunciation accuracy in speech recognition
EP1617409B1 (en) Multimodal method to provide input to a computing device
US20110106792A1 (en) System and method for word matching and indexing
JP2004046807A (ja) 表意文字言語のマルチモーダル入力
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
JP3911178B2 (ja) 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体
El Méliani et al. Accurate keyword spotting using strictly lexical fillers
JP2002278579A (ja) 音声データ検索装置
JPS634206B2 (ja)
JPH04296898A (ja) 音声認識装置
JP5474723B2 (ja) 音声認識装置およびその制御プログラム
WO2009147745A1 (ja) 検索装置
JPH0962286A (ja) 音声合成装置および音声合成方法
US20060206301A1 (en) Determining the reading of a kanji word
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPH0627985A (ja) 音声認識方法
JPS63153596A (ja) 音声文章入力装置
JPH0632021B2 (ja) 日本語音声認識装置
JPH11344991A (ja) 音声認識装置および記憶媒体
JPS6024630A (ja) 制御情報付きカナ文字列形成方式
JPH0573039B2 (ja)
GB2292235A (en) Word syllabification.