JPH0574837B2 - - Google Patents

Info

Publication number
JPH0574837B2
JPH0574837B2 JP59147190A JP14719084A JPH0574837B2 JP H0574837 B2 JPH0574837 B2 JP H0574837B2 JP 59147190 A JP59147190 A JP 59147190A JP 14719084 A JP14719084 A JP 14719084A JP H0574837 B2 JPH0574837 B2 JP H0574837B2
Authority
JP
Japan
Prior art keywords
word
words
distance
word set
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59147190A
Other languages
English (en)
Other versions
JPS6126096A (ja
Inventor
Yuriko Ishigaki
Yasuo Sato
Akihiko Takeuchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14719084A priority Critical patent/JPS6126096A/ja
Publication of JPS6126096A publication Critical patent/JPS6126096A/ja
Publication of JPH0574837B2 publication Critical patent/JPH0574837B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
〔産業上の利用分野〕 本発明は、音声認識装置の認識対象単語セツト
を、該セツト中の単語相互の距離情報を求めて他
の単語と誤認識され易いか否か、実際に音声認識
してみる前に文字の段階で事前に評価し、評価結
果に従つて異なる読みを採用して誤認識の少ない
最良の単語セツトを得る音声認識単語事前評価シ
ステムに関する。 〔従来の技術〕 音声認識装置が認識対象とする単語複数個(認
識対象単語セツトという)において、任意の認識
対象単語が同じセツト内の他の単語と誤認識され
ないようにすることは重要である。音声認識対象
単語セツトの簡単な例として数字の1、2、3、
……、9、0を考えると、これらは何通りもの読
みで発音され得る。例えば、「4」は「し」とも
「よん」とも発音され、また「7」は「しち」と
も「なな」とも発音される。このような場合に、
「1」を「いち」と読み、「7」を「しち」と読む
と、両者が誤認識され易いことは経験的にも予想
される。同様に誤認識され易い組合せには、「2」
の「に」と「4」の「し」がある。これらの誤認
識され易い組合せはいずれか一方の読みを変更す
ることが回避できる。例えば「7」を「なな」と
読めば「いち」との認識率は向上する。また
「4」を「よん」と読めば「に」との認識率は向
上する。そこで意味内容は同じ1、2、3、……
9、0であるが、各単語の読みを適切に定めて当
該セツト内では誤認識が生じにくい認識対象単語
セツトとすることができ、音声認識装置に採用す
る単語セツトにはかゝる単語セツトが望まれる。 認識率を向上させるには粉らわしい単語対の一
方を他の読みに変えるのが有効であるが、1つの
単語の読み換えが他の単語との間の認識率を低下
させることもあるので、単語セツトが大規模にな
ればなるほど上述した様な簡単な読み換えで、単
語セツト全体の認識率が向上したか否かを即断す
ことはできない。そこで従来は、不特定及び特定
話者認識装置の認識対象単語セツトは、実際に、
入力データと照合するための辞書やテンプレート
を作成したうえで、認識実験(シミユレーシヨ
ン)を繰り返し行ない、その結果に従つて各単語
の読みを決定している。 〔発明が解決しようとする問題点〕 しかし、この方法で一度決定された認識対象単
語セツト全体の認識率が低いことがその後判明し
てその認識対象単語セツトの読みを変更すること
になると、それまでに費やした辞書やテンプレー
トの作成、或いは認識実験のための多くの時間と
労力が無駄になる。また、認識対象単語セツトの
読みを何回も変更し、試行錯誤を繰り返し、その
結果高い認識率が期待できる認識対象単語セツト
が得られたとしても、そのために必要となる時間
と労力は莫大なものとなり、実用的ではない。そ
こで本発明では、希望する認識対象単語セツトを
入力すると、そのセツトに含まれる各単語の意味
内容は変えないで読みのみ変え、高い認識率が期
待できる認識対象単語セツトを自動的に得ること
ができるようにするものである。 〔問題点を解決するための手段〕 本発明の音声認識単語の事前評価システムは、
音声認識装置の認識対象単語セツトを入力される
手段、該入力された単語セツト内の各単語につき
同類誤を検索して異なる読みを求め、読みの異な
る複数の単語セツトを生成する手段、各単語セツ
トにつき該セツト内の各単語相互間距離を求めそ
れらより最小の単語間距離を求める手段、最小の
単語間距離を判定要素として認識対象単語セツト
に採用できる単語セツトを求めこれを出力する手
段とを備えることを特徴とするものである。 〔作用〕 認識対象単語セツトの各単語間距離を求める
と、最小単語間距離及び平均単語間距離などを得
ることができ、これら、特に最小単語間距離によ
り当該単語セツトは誤認識が生じ易いか否か判断
できる。単語には異なる読みを持つものがあるか
ら予め用意してある同類語辞書を検索して他の読
みに変えれば該最小距離及び平均距離を増大させ
ることができる。これらの距離特に最小距離の大
きい単語セツトを選べば認識率の向上を期待でき
る。そしてかゝる事前評価を、実際に発音して認
識させてみるのでなく、文字のレベルで済ませて
おけば、認識テストのための多くの時間や労力、
コストを節減することができる。 〔実施例〕 以下、図面を参照しながら本発明を詳細に説明
する。 認識対象単語のセツト例を前述の数字1、2、
3、……9、0としたとき、これらを第1図に示
すように「いち」「に」「さん」「し」……と発音
すると、各単語の文字列から単語間の距離を算出
した結果の距離マトリクスは第2図のようにな
る。図中の数字50、40、70、……等は「に」と
「いち」、「さん」と「いち」、「し」と「いち」な
どの単語間距離で、この数値が大きいほど誤認識
されにくい。 第1図の単語セツトは「に」と「し」の間が最
小距離5で、全体の平均距離は53.8である。認識
率を上昇させるためには最小距離を増大させれば
よいので、先ず、「し」を「よん」と読み換えて
見る。これは第3図に示す同類誤辞書からその読
みを取り出すだけでよい。第4図aが「し」を
「よん」と読み換えた単語セツトで、その最小距
離は10に増大している。同時に平均距離も第1図
の53.8から58.5に上昇している。このとき得られ
た距離マトリクスは図示しないが、第2図の
「し」に関する部分が「よん」に変つているので、
その縦および横方向が少なくとも1つ(最小距離
5の部分は10)に変つている。 次に、第4図aの単語セツトの「しち」を「な
な」に読み変えると新たな単語セツトは同図bの
ようになり、最小距離は変らないものの、平均距
離が63.5に増大する。以下同様にしてのb「く」
を「きゆう」に読み換えると新たな単語セツトは
cのようになり、平均距離は70.3に増大する。こ
こではこのcの単語セツトを音声入力に用いると
最も高い認識率が得られるので、これを音声入力
時の指定用語集(入力モデル)とするとよい。 第5図は本発明の一実施例を示すフローチヤー
トで、数字1、2、……9、0の読みの1つを希
望単語セツトとして入力したときの処理概要を示
している。同類語の検索は同類語の辞書の範囲内
で行なわれ、それらを組合せることで有り得る全
ての単語の組合せG1、G2、……Gnを作る。本例
では6個の単語にそれぞれ2個の同類語があるの
で、組み合わせ数は26通りになる。次に各単語セ
ツトのスコアを求める。例えGnの場合のスコア
Snは Sn= min i=1、10 j=i+1、10d(ti、tj) である。ここでd(ti、tj)は単語tiとtjの単語間
距離である。 上記の式の意味は距離マトリクス中の各数値の
最小値をとる、ということであり、第2図では
Sn=5である。得られたスコアを評価し、スコ
ア順に単語セツトを並べ、一定スコア以上の複数
の単語セツトを選択し、その単語セツト及びスコ
アを出力する。出力するスコアとしては、上記の
数値そのものの他に、グルーフ分けしてスコアが
上、中、下、などのレベルで示したものでもよ
い。使用者は出力された複数の単語セツトとその
スコアを眺め、スコアが充分で語呂またはセンス
の点でも満足の行く単語セツトを選び、これを実
際に使用する認識対象単語セツトとすることがで
きる。 また、上記の単語セツト評価は、読みを変えた
全ての単語の組み合せを作り、それらを評価する
のでいわば一括式であるが、これは逐次式にする
即ち単語セツトが入力されたらそのスコアを出
し、使用者はそのスコアを見て不満なら又は更に
よいスコアのものがあるか否か知りたいなら、単
語セツト中の1つの単語の読みを変えた単語おセ
ツトのスコアを出力するよう指示し、以下これを
繰り返して行くことも可能であるお。また入力単
語セツトについてはスコアが良くても悪くてもそ
のスコアを出し、同時に該スコアより良いスコア
の他の(読みを変えた)所要数の単語セツトとそ
のスコアを出力するようにしてもよい。 単語間の距離を文字列から求めるには、かなの
単位で比較して字数が同じか(同数のものは距
離小)、母音が同じか(同じものは距離小)な
どにより計算することができる。第6図はかなを
音素に分解して (かな間の距離)=(子音間の距離) + (母音間の距離) で求める場合のフローチヤートである。本例では
入力はひらがなで表示された2個の単語A,Bと
する。単語Aを音素列Aに変換するには表1の変
換テーブルを利用する。
【表】 この変換テーブルは基本的にはかなをローマ字
で表記したものであるが、例えば母音を示す部分
にはスペースマース(〓)を付す等の変形がして
ある。表1はその一部を抜枠して示すものであ
る。 第7図は単語入力をかな単位に分解し、さらに
表1の変換テーブルを用いてローマ字表記に変換
し、それを表2の音素のレベルに分解して出力す
る変換サブルーチン1を示す。
【表】
【表】

Claims (1)

    【特許請求の範囲】
  1. 1 音声認識装置の認識対象単示語セツトを入力
    される手段、該入力された単語セツト内の各単語
    につき同類語を検索して異なる読みを求め、読み
    の異なる単語セツトを生成する手段、各単語セツ
    トにつき該セツト内の各単語相互間距離を計算し
    該距離より単語セツトのスコアを算出する手段、
    該算出手段が出力したスコアを評価し、選択した
    単語セツトとそのスコアを出力する手段とを備え
    ることを特徴とする音声認識単語の事前評価シス
    テム。
JP14719084A 1984-07-16 1984-07-16 音声認識単語の事前評価システム Granted JPS6126096A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14719084A JPS6126096A (ja) 1984-07-16 1984-07-16 音声認識単語の事前評価システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14719084A JPS6126096A (ja) 1984-07-16 1984-07-16 音声認識単語の事前評価システム

Publications (2)

Publication Number Publication Date
JPS6126096A JPS6126096A (ja) 1986-02-05
JPH0574837B2 true JPH0574837B2 (ja) 1993-10-19

Family

ID=15424600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14719084A Granted JPS6126096A (ja) 1984-07-16 1984-07-16 音声認識単語の事前評価システム

Country Status (1)

Country Link
JP (1) JPS6126096A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4967519B2 (ja) * 2006-08-11 2012-07-04 日産自動車株式会社 音声認識装置
CN109754784B (zh) 2017-11-02 2021-01-29 华为技术有限公司 训练滤波模型的方法和语音识别的方法

Also Published As

Publication number Publication date
JPS6126096A (ja) 1986-02-05

Similar Documents

Publication Publication Date Title
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US5220639A (en) Mandarin speech input method for Chinese computers and a mandarin speech recognition machine
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
Lee et al. Golden Mandarin (I)-A real-time Mandarin speech dictation machine for Chinese language with very large vocabulary
JP6245846B2 (ja) 音声認識における読み精度を改善するシステム、方法、およびプログラム
KR20010096490A (ko) 이동통신을 위한 철자 음성인식장치 및 방법
JPH0261700A (ja) 音声認識装置
Greibus et al. The phoneme set influence for Lithuanian speech commands recognition accuracy
JPH0574837B2 (ja)
JP6879521B1 (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
JPS634206B2 (ja)
JPS6229796B2 (ja)
O’Neil et al. Comparing methods of orthographic conversion for Bàsàá, a language of Cameroon
KR20150076587A (ko) 다언어로 찾는 중국어 사전
JPH0434499A (ja) 発声法指示装置
Cherifi et al. Conditional Random Fields Applied to Arabic Orthographic-Phonetic Transcription
JPH04127199A (ja) 外国語単語の日本語発音決定方法
KR20140059910A (ko) 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치
Silamu et al. HMM-based uyghur continuous speech recognition system
Polyákova et al. Further improvements to pronunciation by analogy
Boyd Pronunciation modeling in spelling correction for writers of English as a foreign language
JPS63153596A (ja) 音声文章入力装置
JPH0573039B2 (ja)
JPH0574838B2 (ja)
JPS60158496A (ja) 音声認識装置