JPS63294600A - 単語音声認識装置 - Google Patents
単語音声認識装置Info
- Publication number
- JPS63294600A JPS63294600A JP62132903A JP13290387A JPS63294600A JP S63294600 A JPS63294600 A JP S63294600A JP 62132903 A JP62132903 A JP 62132903A JP 13290387 A JP13290387 A JP 13290387A JP S63294600 A JPS63294600 A JP S63294600A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- group
- alternative
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 2
- 238000007630 basic procedure Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は音声認識技術、特に嘔語音声認識の技術の改良
に関する。
に関する。
(従来の技術とその問題点)
単語音声認識装置では、利用者のアプリケーションに従
って認識語いを設定し、語いの各単語を標準パタンとし
て登録してこれを用いて認識を行っているところが、従
来の単語音声uR装置は、設定する語いの如何によって
は、誤認識を起こしやすい。これは、認識対象となる単
語の中に互いに類似している単語が存在することがある
からである。
って認識語いを設定し、語いの各単語を標準パタンとし
て登録してこれを用いて認識を行っているところが、従
来の単語音声uR装置は、設定する語いの如何によって
は、誤認識を起こしやすい。これは、認識対象となる単
語の中に互いに類似している単語が存在することがある
からである。
本発明は、利用者が使いたい単語名を、利用者に代替可
能な複数の単語群として設定してもらい、これらの単語
群の中で最も誤認識を起こしにくい組合せを自動的に決
定する手段を装置の中に組み入れることによシ、認識i
bの起こυにくい音声認識装置を実現することを目的と
している。
能な複数の単語群として設定してもらい、これらの単語
群の中で最も誤認識を起こしにくい組合せを自動的に決
定する手段を装置の中に組み入れることによシ、認識i
bの起こυにくい音声認識装置を実現することを目的と
している。
(問題点を解決するための手段)
本願の第1の発明は、認識対象となる語いを設定するに
際して、対象となる単語機能の各々について互いに代替
可能な複数の単語からなる単語群(代替単語群)を定義
し、各代替単語群の中から一つの単語を選択することに
よって語いを決定する手段を含んでなり、この語い決定
手段における前記単語の選択は前記代替単語群中の単語
を発声した学習パタンの各々の間で計算されたパタン間
距離を用いて行われることを特徴とする。
際して、対象となる単語機能の各々について互いに代替
可能な複数の単語からなる単語群(代替単語群)を定義
し、各代替単語群の中から一つの単語を選択することに
よって語いを決定する手段を含んでなり、この語い決定
手段における前記単語の選択は前記代替単語群中の単語
を発声した学習パタンの各々の間で計算されたパタン間
距離を用いて行われることを特徴とする。
また、本願の第2の発明は、認識対象となる語いを設定
するに際して、対象となる単語機能の6各について互い
に代替可能な複数の単語からなる単語群(代替単語群)
を定義し、各代替単語群の中から一つの単語を選択する
ことによって語いを決定する手段を含んでなり、この語
い決定手段における前記単語の選択は代替単語群中の単
語の背形記述により算出された各単語間距離を用いて行
われることを特徴とする。
するに際して、対象となる単語機能の6各について互い
に代替可能な複数の単語からなる単語群(代替単語群)
を定義し、各代替単語群の中から一つの単語を選択する
ことによって語いを決定する手段を含んでなり、この語
い決定手段における前記単語の選択は代替単語群中の単
語の背形記述により算出された各単語間距離を用いて行
われることを特徴とする。
(作 用)
本発明の基本的な原理を以下に説明する。利用者の必要
とする単語の種類なKとする。ここではこれをに種類の
カテゴリがあると呼ぶことにする。
とする単語の種類なKとする。ここではこれをに種類の
カテゴリがあると呼ぶことにする。
利用者は各単語の代替として可能な単語名を与える。即
ち、利用者は各カテゴリ毎に可能な単語の群を与える。
ち、利用者は各カテゴリ毎に可能な単語の群を与える。
一方、単語の間での誤認識の起こりやすさを表すものと
して、単語間での距fiD(X。
して、単語間での距fiD(X。
Y)を考える。ここでX、 Yは単語を表す。
問題は、各カテゴリに属する単語群の内から、単語を選
んだとき、選択された単語相互間の距離がなるべく大き
くなるように、単語を選択することである。誤認識の点
からは、単語間距離の小さい単語対の存在を避けること
が必要である。このためには、選択された各単語間の距
離の最小値が最大となるように、単語を選択を行えばよ
い。選択の組合せが少ないときはすべての組合せについ
て単語間距離を計算すればよいが、語いが増えるに従っ
て処理量も著しく増加する。ここでは、最適ではないが
、単語間距離をできるだけ大きく保つよプ効果的な次の
方法について説明する。
んだとき、選択された単語相互間の距離がなるべく大き
くなるように、単語を選択することである。誤認識の点
からは、単語間距離の小さい単語対の存在を避けること
が必要である。このためには、選択された各単語間の距
離の最小値が最大となるように、単語を選択を行えばよ
い。選択の組合せが少ないときはすべての組合せについ
て単語間距離を計算すればよいが、語いが増えるに従っ
て処理量も著しく増加する。ここでは、最適ではないが
、単語間距離をできるだけ大きく保つよプ効果的な次の
方法について説明する。
基本的な手順は、すべてカテゴリの代替単語群の中から
、他の単語との単語間距離の小さい単語を順次削除し、
最終的に各カテゴリ1ケの単語を残すというものである
。具体的には次のようになる。
、他の単語との単語間距離の小さい単語を順次削除し、
最終的に各カテゴリ1ケの単語を残すというものである
。具体的には次のようになる。
+11 全カテゴリの代替単語群中の、各単語WKつ
いて自分の属するカテゴリ以外のすべての単語(但し、
既に削除されている単語を除く)との距離を計算し、こ
れらの距離の最小値をd(w) とする。
いて自分の属するカテゴリ以外のすべての単語(但し、
既に削除されている単語を除く)との距離を計算し、こ
れらの距離の最小値をd(w) とする。
(2)得られたd (W)のうちで最小値を与えるW(
=w X選択し、これを削除する。但し、W”が七〇
カテゴIJ K属する唯一の単語であるときには、W
のかわりに、2番目に小さい値を与えるWを選択する。
=w X選択し、これを削除する。但し、W”が七〇
カテゴIJ K属する唯一の単語であるときには、W
のかわりに、2番目に小さい値を与えるWを選択する。
D (X、 Y)を決定する方法として、ここでは2つ
の方法を示す。
の方法を示す。
〈方法1〉
実際に発声した単語音声相互を、音声認識装置で認識処
理として実行されるパタンマツチングによシ比較し、単
語間距離を求める。パタンマツチング法として音声会誌
Vol、 42. No、9. p 。
理として実行されるパタンマツチングによシ比較し、単
語間距離を求める。パタンマツチング法として音声会誌
Vol、 42. No、9. p 。
725.1986に述べられているDPマツチング法が
使える。また2つのパタンを比較してパタン間の距離が
算出されるものであれば、任意の方法が利用可能である
。
使える。また2つのパタンを比較してパタン間の距離が
算出されるものであれば、任意の方法が利用可能である
。
く方法2〉
単語の背形記述、すなわち、単語を音素(ないし音節)
の列としたものを使う方法であ1匙へみいし音節)間の
距離をあらかじめ音声学の知識に基いて定義しておけば
、通常のDPマツチングの方法においてパタンのペラト
ル間距離のかわシにこの音素間距離を用いることによっ
て、単語間距離が算出される。すなわち比較する2つの
単語の背形記述をそれぞれA=(al・・・AM)、B
=(bt ”’ bN)とし、音素X、 Y間距離をd
(x。
の列としたものを使う方法であ1匙へみいし音節)間の
距離をあらかじめ音声学の知識に基いて定義しておけば
、通常のDPマツチングの方法においてパタンのペラト
ル間距離のかわシにこの音素間距離を用いることによっ
て、単語間距離が算出される。すなわち比較する2つの
単語の背形記述をそれぞれA=(al・・・AM)、B
=(bt ”’ bN)とし、音素X、 Y間距離をd
(x。
y)とすると、単語間距離D (A、B)は次の漸化成
によシ計算することができる。
によシ計算することができる。
初期条件g (my n) =Q 、 m=o、 n
=oのとき= ” (m)o 、 n=o)又は(m
=o、u>o)のときm=t、−、M: n=1. ”
”* ND (A、 B) =g (M、 N) /
CM+N)(実施例) 第1図は本発明を実現した装置の一実施例を示すブロッ
ク図である。参照数字1はパタンバッファであシ各カテ
ゴリに属する単語群を発声した音声パタンか格納される
。参照数字2はパタン間距離計算部であり パタンバッ
ファl内の各カテゴリkに属する単語群w”(1)−w
K(、r(x))のそれぞれの間の距離の群(d(jt
、 jt))が計算され、パタン間距離バッファ3に格
納される。但しここでd(js* jt)は単語W電」
、)とwK(jt)の間のパタン間距離であり゛、前述
の方法1によシ算出されるものである。参照数字4はパ
タン選択部であシ、上記の距離バッファ3の内容を読み
出し、前述した単語を順次削除する手順を実行し、最終
的に標準パタンとして使用する単語を選択し選択結果を
出力するとともに、標準パタンだけをパタンバッファ1
に残す。認識部5はパタンバッファ1に格納されたパタ
ンのうち上記によ)選択されたものだけを標準パタンと
して用いて単語認識を行う。ここで、単語認識の実現形
態としては標準パタンとのマツチングによるものであれ
ばいかなるものでも使用可能である。
=oのとき= ” (m)o 、 n=o)又は(m
=o、u>o)のときm=t、−、M: n=1. ”
”* ND (A、 B) =g (M、 N) /
CM+N)(実施例) 第1図は本発明を実現した装置の一実施例を示すブロッ
ク図である。参照数字1はパタンバッファであシ各カテ
ゴリに属する単語群を発声した音声パタンか格納される
。参照数字2はパタン間距離計算部であり パタンバッ
ファl内の各カテゴリkに属する単語群w”(1)−w
K(、r(x))のそれぞれの間の距離の群(d(jt
、 jt))が計算され、パタン間距離バッファ3に格
納される。但しここでd(js* jt)は単語W電」
、)とwK(jt)の間のパタン間距離であり゛、前述
の方法1によシ算出されるものである。参照数字4はパ
タン選択部であシ、上記の距離バッファ3の内容を読み
出し、前述した単語を順次削除する手順を実行し、最終
的に標準パタンとして使用する単語を選択し選択結果を
出力するとともに、標準パタンだけをパタンバッファ1
に残す。認識部5はパタンバッファ1に格納されたパタ
ンのうち上記によ)選択されたものだけを標準パタンと
して用いて単語認識を行う。ここで、単語認識の実現形
態としては標準パタンとのマツチングによるものであれ
ばいかなるものでも使用可能である。
また単語間距離の算出に方法2を用いた実施例ではパタ
ンバッファ1には、単語の背形記述が入力格納され、単
語間距離計算部2で計算された単語間距離の群はバッフ
ァ3へ格納され、単語選択部4で前述の第一の実施例と
同様に単語が選択される。認識部5ではあらためて選択
された単語につい【標準パタン登録が行われ、これによ
る認識が行われる。
ンバッファ1には、単語の背形記述が入力格納され、単
語間距離計算部2で計算された単語間距離の群はバッフ
ァ3へ格納され、単語選択部4で前述の第一の実施例と
同様に単語が選択される。認識部5ではあらためて選択
された単語につい【標準パタン登録が行われ、これによ
る認識が行われる。
(発明の効果)
以上述べたように本発明によれば、複数の単語群の中で
最も誤認識を起こしにくい組合せを自動的に決定する手
段を装置の中に組み入れることが可能となシ、認識精度
の高い音声認識装置を実現できる。
最も誤認識を起こしにくい組合せを自動的に決定する手
段を装置の中に組み入れることが可能となシ、認識精度
の高い音声認識装置を実現できる。
第1図は本発明による一実施例を示すブロック図であシ
、図中、1・・・パタンバッファ、2・・・距離計算部
、3・・・距離バッファ、4・・・選択部、5・・・認
識部である。
、図中、1・・・パタンバッファ、2・・・距離計算部
、3・・・距離バッファ、4・・・選択部、5・・・認
識部である。
Claims (2)
- (1)認識対象となる語いを設定するに際して、対象と
なる単語機能の各々について互いに代替可能な複数の単
語からなる単語群を代替単語群として定義し、各代替単
語群の中から一つの単語を選択することによつて語いを
決定する手段を含んでなり、この語い決定手段における
前記単語の選択は前記代替単語群中の単語を発声した学
習パタンの各々の間で計算されたパタン間距離を用いて
行われることを特徴とする単語音声認識装置。 - (2)認識対象となる語いを設定するに際して、対象と
なる単語機能の各々について互いに代替可能な複数の単
語からなる単語群を代替単語群として定義し、各代替単
語群の中から一つの単語を選択することによつて語いを
決定する機能を含んでなり、この語い決定手段における
前記単語の選択は前記代替単語群中の単語の音形記述に
より算出された各単語間距離を用いて行われることを特
徴とする単語音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62132903A JPH0766274B2 (ja) | 1987-05-27 | 1987-05-27 | 単語音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62132903A JPH0766274B2 (ja) | 1987-05-27 | 1987-05-27 | 単語音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63294600A true JPS63294600A (ja) | 1988-12-01 |
JPH0766274B2 JPH0766274B2 (ja) | 1995-07-19 |
Family
ID=15092236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62132903A Expired - Fee Related JPH0766274B2 (ja) | 1987-05-27 | 1987-05-27 | 単語音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0766274B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57129497A (en) * | 1981-02-03 | 1982-08-11 | Sanyo Electric Co | Voice register |
-
1987
- 1987-05-27 JP JP62132903A patent/JPH0766274B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57129497A (en) * | 1981-02-03 | 1982-08-11 | Sanyo Electric Co | Voice register |
Also Published As
Publication number | Publication date |
---|---|
JPH0766274B2 (ja) | 1995-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2897701B2 (ja) | 効果音検索装置 | |
JPS597998A (ja) | 連続音声認識装置 | |
JPS63294600A (ja) | 単語音声認識装置 | |
JPH04301695A (ja) | 音声認識装置の辞書制御方式 | |
JPH04195100A (ja) | 連続音声認識装置 | |
JPS62124599A (ja) | 音声認識装置 | |
JPS61138296A (ja) | 音声認識装置 | |
JPS63188199A (ja) | パタンマッチング装置 | |
JPH0430598B2 (ja) | ||
JPS6073592A (ja) | 特定話者用音声認識装置 | |
JPS5977499A (ja) | 音声認識装置 | |
JPS63303398A (ja) | 音声認識装置 | |
JPS6134599A (ja) | パタ−ン認識方式 | |
JPS61279896A (ja) | 音声認識装置 | |
JPH08305389A (ja) | 音声認識装置 | |
JPH02118696A (ja) | 音声標準パタン登録方式 | |
JPS58220197A (ja) | 擬似連続発声認識に於ける標準パタ−ン作成方式 | |
JPS59176797A (ja) | 音声認識装置 | |
JPS6031638A (ja) | 音声情報入力装置 | |
JPH02118697A (ja) | 音声標準パタン登録方式 | |
JPS59176791A (ja) | 音声登録方式 | |
JPH0570838B2 (ja) | ||
JPS6382500A (ja) | 規則合成音出力装置 | |
JPS60140396A (ja) | 音声ガイダンス方式 | |
JPS63236094A (ja) | 音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |