JPS6126096A - 音声認識単語の事前評価システム - Google Patents
音声認識単語の事前評価システムInfo
- Publication number
- JPS6126096A JPS6126096A JP14719084A JP14719084A JPS6126096A JP S6126096 A JPS6126096 A JP S6126096A JP 14719084 A JP14719084 A JP 14719084A JP 14719084 A JP14719084 A JP 14719084A JP S6126096 A JPS6126096 A JP S6126096A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- distance
- word set
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、音声認識装置の認識対象単語セットを、該セ
ット中の単語相互の距離情報を求めて他の単語′と誤認
識され易いか否か、実際に音声認識してみる前に文字の
段階で事前に評価し、評価結果に従って異なる読みを採
用して誤認識の少ない最良の単語セットを得る音声認識
単語事前、評価システムに関する。
ット中の単語相互の距離情報を求めて他の単語′と誤認
識され易いか否か、実際に音声認識してみる前に文字の
段階で事前に評価し、評価結果に従って異なる読みを採
用して誤認識の少ない最良の単語セットを得る音声認識
単語事前、評価システムに関する。
(従来の技術〕
音声認識装置が認識対象とする単語複数個(認識対象単
語セットという)において、任意の認識対象単語が同じ
セット内の他の単語と誤認識されないようにすることは
重要である。音声認識対象単語セットの簡単な例として
数字の1.2. 3゜・・・・・・、9.0を考えると
、これらは何通りもの読みで発音され得る。例えば、「
4」は「シjとも「よん」とも発音され、また「7」は
「しち」とも「なな」とも発音される。このような場合
に、「1」を「いち」と読み、「7」を1しち」と読む
と、両者が誤認識され易いことは経験的にも予想される
。同様に誤認識され易い組合セには、「2」の「に」と
14」の「シ」かある。これらの誤認識され易い組合−
Uはいずれか一方の読みを変更することで回避できる。
語セットという)において、任意の認識対象単語が同じ
セット内の他の単語と誤認識されないようにすることは
重要である。音声認識対象単語セットの簡単な例として
数字の1.2. 3゜・・・・・・、9.0を考えると
、これらは何通りもの読みで発音され得る。例えば、「
4」は「シjとも「よん」とも発音され、また「7」は
「しち」とも「なな」とも発音される。このような場合
に、「1」を「いち」と読み、「7」を1しち」と読む
と、両者が誤認識され易いことは経験的にも予想される
。同様に誤認識され易い組合セには、「2」の「に」と
14」の「シ」かある。これらの誤認識され易い組合−
Uはいずれか一方の読みを変更することで回避できる。
例えば「7」を「なな」と読めば「いち」との認識率は
向上する。また「4」を「よん」と読めば「に」との認
識率は向上する。そこで意味内容は同し1,2,3.・
・・・・・9゜0であるが、各単語の読みを適切に定め
て当該セット内では誤認識が生じにくい認識対象単語セ
ットとすることができ、音声認識装置に採用する単語セ
ットにはか\る単語七ノ1−が望まれる。
向上する。また「4」を「よん」と読めば「に」との認
識率は向上する。そこで意味内容は同し1,2,3.・
・・・・・9゜0であるが、各単語の読みを適切に定め
て当該セット内では誤認識が生じにくい認識対象単語セ
ットとすることができ、音声認識装置に採用する単語セ
ットにはか\る単語七ノ1−が望まれる。
認識率を向上させるには紛られしい単語対の一方を他の
読みに変えるのが有効であるが、1つの単語の読み換え
が他の単語との間の認識率を低下させることもあるので
、単語セットが大規模になればなるほど上述した様な簡
単な読み換えで、単語セット全体の認識率が向上したか
否かを即断することはできない。そこで従来は、不特定
及び特定話者認識装置の認識対象単語セットは、実際に
、入力データと照合するための辞書やテンプレートを作
成したうえで、認識実験(シミュレーション)を繰り返
し行ない、その結果に従って各単語の読みを決定してい
る。
読みに変えるのが有効であるが、1つの単語の読み換え
が他の単語との間の認識率を低下させることもあるので
、単語セットが大規模になればなるほど上述した様な簡
単な読み換えで、単語セット全体の認識率が向上したか
否かを即断することはできない。そこで従来は、不特定
及び特定話者認識装置の認識対象単語セットは、実際に
、入力データと照合するための辞書やテンプレートを作
成したうえで、認識実験(シミュレーション)を繰り返
し行ない、その結果に従って各単語の読みを決定してい
る。
〔発明が解決しようとする問題点〕
しかし、この方法で一度決定された認識対象単語セット
全体の認識率が低いことがその後判明してその認識対象
単語セットの読みを変更することになると1.それまで
に費やした辞書やテンプレートの作成、或いは認識実験
のための多くの時間と労力が無駄になる。また、認識対
象単語セットの読みを何回も変更し、試行錯誤を繰り返
し、その結果高い認識率が期待できる認識対象単語セッ
トが得られたとしても、そのために必要となる時間と労
力は莫大なものとなり、実用的ではない。そこで本発明
では、希望する認識対象単語セソ)を入力すると、その
セットに含まれる各単語の意味内容は変えないで読みの
み変え、高い認識率が期待できる認識対象単語セノl−
を自動的に得ることができるようにするものである。
全体の認識率が低いことがその後判明してその認識対象
単語セットの読みを変更することになると1.それまで
に費やした辞書やテンプレートの作成、或いは認識実験
のための多くの時間と労力が無駄になる。また、認識対
象単語セットの読みを何回も変更し、試行錯誤を繰り返
し、その結果高い認識率が期待できる認識対象単語セッ
トが得られたとしても、そのために必要となる時間と労
力は莫大なものとなり、実用的ではない。そこで本発明
では、希望する認識対象単語セソ)を入力すると、その
セットに含まれる各単語の意味内容は変えないで読みの
み変え、高い認識率が期待できる認識対象単語セノl−
を自動的に得ることができるようにするものである。
本発明の音声認識単語の事前評価システムは、音声認識
装置の認識対象単語セットを入力される手段、該入力さ
れた単語セット内の各単語につき同@語を検索して異な
る読みを求め、読みの異なる複数の単語セットを生成す
る手段、各単語セットにつき該セット内の各単語相互間
距離を求めそれらより最小の単語間距離を求める手段、
−最小の単語間距離を判定要素として認識対象単語セッ
トに採用できる単語セットを求めこれを出力する手段と
を備えることを特徴とするものである。
装置の認識対象単語セットを入力される手段、該入力さ
れた単語セット内の各単語につき同@語を検索して異な
る読みを求め、読みの異なる複数の単語セットを生成す
る手段、各単語セットにつき該セット内の各単語相互間
距離を求めそれらより最小の単語間距離を求める手段、
−最小の単語間距離を判定要素として認識対象単語セッ
トに採用できる単語セットを求めこれを出力する手段と
を備えることを特徴とするものである。
認識対象単語セットの各単語間距離を求めると、最小単
語間距離及び平均単語間距離などを得ることができ、こ
れら、特に最小単語間距離により当該単語セソ1へは誤
認識が生し易いか否か判断できる。単語には異なる読み
を持つものがあるから予め用意しである同類語辞書を検
索して他の読みに変えれば該最小距離及び平均距離を増
大させることができる。これらの距離特に最小距離の大
きい単語セットを選べば認識率の向上を期待できる。
語間距離及び平均単語間距離などを得ることができ、こ
れら、特に最小単語間距離により当該単語セソ1へは誤
認識が生し易いか否か判断できる。単語には異なる読み
を持つものがあるから予め用意しである同類語辞書を検
索して他の読みに変えれば該最小距離及び平均距離を増
大させることができる。これらの距離特に最小距離の大
きい単語セットを選べば認識率の向上を期待できる。
そしてか\る事前評価を、実際に発音して認識させてみ
るのでなく、文字のレヘルで済ませておけば、認識テス
トのための多くの時間や労力、コストを節減することが
できる。
るのでなく、文字のレヘルで済ませておけば、認識テス
トのための多くの時間や労力、コストを節減することが
できる。
以下、図面を参照しながら本発明の詳細な説明する。
認識対象単語のセット例を前述の数字1,2゜3、・・
・・・・9,0としたとき、これらを第1図に示すよう
に「いち」 「にJ 「さん」「シ」・・・・・・と発
音すると、各単語の文字列から単語間の距離を算出した
結果の距離マトリクス体第2図のようにな〜る。図中の
数字50.40,70.・・・・・・等は「に」と「い
ち」、「さん」と「いち」、「シ」と「いち」などの単
語間距離で、この数値が大きいほど誤認識されにくい。
・・・・9,0としたとき、これらを第1図に示すよう
に「いち」 「にJ 「さん」「シ」・・・・・・と発
音すると、各単語の文字列から単語間の距離を算出した
結果の距離マトリクス体第2図のようにな〜る。図中の
数字50.40,70.・・・・・・等は「に」と「い
ち」、「さん」と「いち」、「シ」と「いち」などの単
語間距離で、この数値が大きいほど誤認識されにくい。
第1図の単語セソ1〜は「に」と1シ」の間が最小距離
5で、全体の平均距離は53.8である。認識率を上昇
させるためには最小距離を増大させればよいので、先ず
、「シ」を「よん」と読み換えて見る。9れは第3図に
示す同類語辞書からその読みを取り出すだけでよい。第
4図fatが「シ」を「よん」と読み換えた単語セット
で、その最小距離は10に増大している。同時に平均距
離も第1図の53.8から58.5に上昇している。こ
のとき得られた距離マトリクスは図示しないが、第2図
の「シ」に関する部分が「よん」に変っているので、そ
の縦および横方向が少なくとも1つ(最小距l1lI1
5の部分は1゛0)に変っている。
5で、全体の平均距離は53.8である。認識率を上昇
させるためには最小距離を増大させればよいので、先ず
、「シ」を「よん」と読み換えて見る。9れは第3図に
示す同類語辞書からその読みを取り出すだけでよい。第
4図fatが「シ」を「よん」と読み換えた単語セット
で、その最小距離は10に増大している。同時に平均距
離も第1図の53.8から58.5に上昇している。こ
のとき得られた距離マトリクスは図示しないが、第2図
の「シ」に関する部分が「よん」に変っているので、そ
の縦および横方向が少なくとも1つ(最小距l1lI1
5の部分は1゛0)に変っている。
次に、第4図(alの単語セットの1しち」を1なな」
に読み変えると新たな単語セットは同図(blのように
なり、最小距離は変らないものの、平均距離が63.5
に増大する。以下同様にして(blの「<」を「きゅう
]に読み換えると新たな単語セットは(C1のようにな
り、平均距離は70.3に増大する。
に読み変えると新たな単語セットは同図(blのように
なり、最小距離は変らないものの、平均距離が63.5
に増大する。以下同様にして(blの「<」を「きゅう
]に読み換えると新たな単語セットは(C1のようにな
り、平均距離は70.3に増大する。
ここではこのfclの単語セットを音声入力に用いると
最も高い認識率が得られるので、これを音声入力時の指
定用語集(入力モデル)とするとよい。
最も高い認識率が得られるので、これを音声入力時の指
定用語集(入力モデル)とするとよい。
第5図は本発明の一実施例を示すフローチャートで、数
字1,2.・・・・・・9,0の読みの1つを希望単語
セットとして入力したときの処理概要を示している。同
類語の検索は同類語の辞書の範囲内で行なわれ、それら
を組合せることで有り得る全ての単語の糾合せG1.G
2.・・・・・・Onを作る。
字1,2.・・・・・・9,0の読みの1つを希望単語
セットとして入力したときの処理概要を示している。同
類語の検索は同類語の辞書の範囲内で行なわれ、それら
を組合せることで有り得る全ての単語の糾合せG1.G
2.・・・・・・Onを作る。
本例では6個の単語にそれぞれ2個の同類語があるので
、組み合わせ数は26 通りになる。次に各単語セッ
トのスコアを求める。例え4f G nの場合のスコア
Snは である。ここでd (ti、 tj)は単語ti&
tjの単語間距離である。
、組み合わせ数は26 通りになる。次に各単語セッ
トのスコアを求める。例え4f G nの場合のスコア
Snは である。ここでd (ti、 tj)は単語ti&
tjの単語間距離である。
上記の式の意味は距離マトリクス中の各数値の最小値を
とる、ということであり、第2図では5n=5である。
とる、ということであり、第2図では5n=5である。
得られたスコアを評価し、スコア類に単語上71−を並
べ、一定スコア以上の複数の単語セットを選択し、その
単語セット及びスコアを出力する。出力するスコアとし
ては、上記の数値そのものの他に、グループ分けしてス
コアが上、中、下、などのレヘルで示したものでもよい
。使用者は出力された複数の単語セットとそのスコアを
眺め、スコアが充分で語呂またはセンスの点でも満足の
行く単語セットを選び、これを実際に使用する認識対象
単語セットとすることができる。
べ、一定スコア以上の複数の単語セットを選択し、その
単語セット及びスコアを出力する。出力するスコアとし
ては、上記の数値そのものの他に、グループ分けしてス
コアが上、中、下、などのレヘルで示したものでもよい
。使用者は出力された複数の単語セットとそのスコアを
眺め、スコアが充分で語呂またはセンスの点でも満足の
行く単語セットを選び、これを実際に使用する認識対象
単語セットとすることができる。
また、上記の単語セット評価は、読みを変えた全ての単
語の組み合せを作り、それらを評価するのでいわば一括
式であるが、これは逐次式にする即ち単語セットが入力
されたらそのスコアを出し、使用者はそのスコアを見て
不満なら又は更によいスコアのものがあるか否か知りた
いなら、単語上ソト中の1つの単語の読みを変えた単語
セットのスコアを出力するよう指示し、以下これを繰り
返して行くことも可能である。また入力単語セットにつ
いてはスコアが良くても悪くてもそのスコアを出し、同
時に該スコアより良いスコアの他の(読みを変えた)所
要数のff1語セットとそのスコアを出力するようにし
てもよい。
語の組み合せを作り、それらを評価するのでいわば一括
式であるが、これは逐次式にする即ち単語セットが入力
されたらそのスコアを出し、使用者はそのスコアを見て
不満なら又は更によいスコアのものがあるか否か知りた
いなら、単語上ソト中の1つの単語の読みを変えた単語
セットのスコアを出力するよう指示し、以下これを繰り
返して行くことも可能である。また入力単語セットにつ
いてはスコアが良くても悪くてもそのスコアを出し、同
時に該スコアより良いスコアの他の(読みを変えた)所
要数のff1語セットとそのスコアを出力するようにし
てもよい。
単語間の距離を文字列から求めるには、かなの単位で比
較して0字数が同じか(同数のものは距離小)、■母音
が同じか(同じものは距離小)などにより計算すること
ができる。第6図はかなを音素に分解して (かな間の距離)−(子音間の距離)+(母音間の距!
1)It) で求める場合のフローチャートである。本例では入力は
ひらがなで表示された2個の単語A、Bとする。単語A
を音素列Aに変換するには表1の変換テーブルを利用す
る。
較して0字数が同じか(同数のものは距離小)、■母音
が同じか(同じものは距離小)などにより計算すること
ができる。第6図はかなを音素に分解して (かな間の距離)−(子音間の距離)+(母音間の距!
1)It) で求める場合のフローチャートである。本例では入力は
ひらがなで表示された2個の単語A、Bとする。単語A
を音素列Aに変換するには表1の変換テーブルを利用す
る。
表 1
この変換テーブルは基本的にはかなをローマ字で表記し
たものであるが、例えば母音を示す部分にはスペースマ
ーク(U)を付す等の変形がしである。表1はその一部
を抜粋して示すものである。
たものであるが、例えば母音を示す部分にはスペースマ
ーク(U)を付す等の変形がしである。表1はその一部
を抜粋して示すものである。
第7図は単語入力をかな単位に分解し、さらに表1の変
換テーブルを用いてローマ字表記に変換し、それを表2
の音素のレヘルに分解して出力する変換サブルーチン1
を示す。
換テーブルを用いてローマ字表記に変換し、それを表2
の音素のレヘルに分解して出力する変換サブルーチン1
を示す。
このサブルーアンで卑語Aと単語B7音系列Aと音素列
Bに変換したら、表3の音素間の距離テーブルを用いて
音素列間の距離2求める。
Bに変換したら、表3の音素間の距離テーブルを用いて
音素列間の距離2求める。
表3(a)子音の距離マトリクス
5Ml 0115050
表3(b)母音の距離マトリクス
第8図は音素列間の距離を求めるサブルーチン2で、t
a+は各音素間距離の単純加算法、fb)はDP法であ
る。いずれの場合でも音素間の距離を距離マトリクスを
用いて求め、それより単語間距離を求める。第9図は第
5図のフローチャートに対応する事前評価システムのブ
ロック図で、フロー類に101は入力部、102は同類
語検索部、103は類似単語セット生成部、104は類
似単語セットスコア算出部、105はスコア評価部、1
06は出力部である。また、107は同類語辞書である
。
a+は各音素間距離の単純加算法、fb)はDP法であ
る。いずれの場合でも音素間の距離を距離マトリクスを
用いて求め、それより単語間距離を求める。第9図は第
5図のフローチャートに対応する事前評価システムのブ
ロック図で、フロー類に101は入力部、102は同類
語検索部、103は類似単語セット生成部、104は類
似単語セットスコア算出部、105はスコア評価部、1
06は出力部である。また、107は同類語辞書である
。
以上述べたように本発明の評価システムによれば、認識
対象単語セットを入力すると、そのセ・ノドに含まれる
各単語の意味内容を変えないで同類語の範囲内で他の読
みにした単語セットを生成し、これらの単語セットのス
コアを算出し、選択した単語セットとそのスコアを出力
するので、高い認識率が期待できる認識対象単語セット
を自動もしくは半自動的に、実際の音声認識処理を開始
する前段階で作成でき、甚だ有すノである。
対象単語セットを入力すると、そのセ・ノドに含まれる
各単語の意味内容を変えないで同類語の範囲内で他の読
みにした単語セットを生成し、これらの単語セットのス
コアを算出し、選択した単語セットとそのスコアを出力
するので、高い認識率が期待できる認識対象単語セット
を自動もしくは半自動的に、実際の音声認識処理を開始
する前段階で作成でき、甚だ有すノである。
第1図〜第4図は本発明の詳細な説明する図で、第1図
゛は入力単語セットの説明図、第2図は単語間距離マ;
・リクスの説明図、第3図は同類語辞書の説明図、第4
図は頬億単語セット作成の説明図、第5図は本発明の一
実施例を示すフローチャート、第6図は単語間距離を求
めるフローチャート、第7図および第8図はその要部ザ
ブルーチンの説明図、第9図は第5図に対応するブロッ
ク図である。 図中、101は入力部、102は同頬語検索部、103
は類似単語セット生成部、104は類似単語セットスコ
ア算出部、105ばスコア評価部、106は出力部、1
07は同類語辞書である。
゛は入力単語セットの説明図、第2図は単語間距離マ;
・リクスの説明図、第3図は同類語辞書の説明図、第4
図は頬億単語セット作成の説明図、第5図は本発明の一
実施例を示すフローチャート、第6図は単語間距離を求
めるフローチャート、第7図および第8図はその要部ザ
ブルーチンの説明図、第9図は第5図に対応するブロッ
ク図である。 図中、101は入力部、102は同頬語検索部、103
は類似単語セット生成部、104は類似単語セットスコ
ア算出部、105ばスコア評価部、106は出力部、1
07は同類語辞書である。
Claims (1)
- 音声認識装置の認識対象単語セットを入力される手段、
該入力された単語セット内の各単語につき同類語を検索
して異なる読みを求め、読みの異なる単語セットを生成
する手段、各単語セットにつき該セット内の各単語相互
間距離を計算し該距離より単語セットのスコアを算出す
る手段、該算出手段が出力したスコアを評価し、選択し
た単語セットとそのスコアを出力する手段とを備えるこ
とを特徴とする音声認識単語の事前評価システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14719084A JPS6126096A (ja) | 1984-07-16 | 1984-07-16 | 音声認識単語の事前評価システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14719084A JPS6126096A (ja) | 1984-07-16 | 1984-07-16 | 音声認識単語の事前評価システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6126096A true JPS6126096A (ja) | 1986-02-05 |
JPH0574837B2 JPH0574837B2 (ja) | 1993-10-19 |
Family
ID=15424600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14719084A Granted JPS6126096A (ja) | 1984-07-16 | 1984-07-16 | 音声認識単語の事前評価システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6126096A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008046260A (ja) * | 2006-08-11 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2021501912A (ja) * | 2017-11-02 | 2021-01-21 | 華為技術有限公司Huawei Technologies Co.,Ltd. | フィルタリングモデル訓練方法および音声認識方法 |
-
1984
- 1984-07-16 JP JP14719084A patent/JPS6126096A/ja active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008046260A (ja) * | 2006-08-11 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2021501912A (ja) * | 2017-11-02 | 2021-01-21 | 華為技術有限公司Huawei Technologies Co.,Ltd. | フィルタリングモデル訓練方法および音声認識方法 |
US11211052B2 (en) | 2017-11-02 | 2021-12-28 | Huawei Technologies Co., Ltd. | Filtering model training method and speech recognition method |
Also Published As
Publication number | Publication date |
---|---|
JPH0574837B2 (ja) | 1993-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR900009170B1 (ko) | 규칙합성형 음성합성시스템 | |
US6029132A (en) | Method for letter-to-sound in text-to-speech synthesis | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
JP3481497B2 (ja) | 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置 | |
US20110106792A1 (en) | System and method for word matching and indexing | |
CN109979257B (zh) | 一种基于英语朗读自动打分进行分拆运算精准矫正的方法 | |
Rietveld et al. | Pitfalls in corpus research | |
JPS6126096A (ja) | 音声認識単語の事前評価システム | |
JP2009271117A (ja) | 音声検索装置および音声検索方法 | |
Minematsu et al. | Acoustic modeling of sentence stress using differential features between syllables for English rhythm learning system development. | |
Fata | Is my stress right or wrong? Studying the production of stress by non-native speaking teachers of English | |
Hendessi et al. | A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM | |
Nicolai et al. | English orthography is not “close to optimal” | |
TWI731493B (zh) | 多語語音辨識及主題語意分析方法與裝置 | |
JPH03245192A (ja) | 外国語単語の発音決定方法 | |
Al-Daradkah et al. | Automatic grapheme-to-phoneme conversion of Arabic text | |
JPS62134698A (ja) | 多数単語の音声入力方式 | |
Silamu et al. | HMM-based uyghur continuous speech recognition system | |
JPH04127199A (ja) | 外国語単語の日本語発音決定方法 | |
Tursun et al. | Large vocabulary continuous speech recognition in Uyghur: data preparation and experimental results | |
O’Neil et al. | Comparing methods of orthographic conversion for Bàsàá, a language of Cameroon | |
JP2005534968A (ja) | 漢字語の読みの決定 | |
CN115273898A (zh) | 发音训练方法、装置、电子设备和存储介质 | |
JPH04296898A (ja) | 音声認識装置 | |
KR20140059910A (ko) | 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치 |