JPS62121499A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS62121499A JPS62121499A JP60261482A JP26148285A JPS62121499A JP S62121499 A JPS62121499 A JP S62121499A JP 60261482 A JP60261482 A JP 60261482A JP 26148285 A JP26148285 A JP 26148285A JP S62121499 A JPS62121499 A JP S62121499A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- word
- learning
- unit
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は特定話者用の音声認識装置に関し、特に、音素
標準・ぐタンを格納する音素標準・ぐタン部と、音素系
列で表現された単語を格納する学語辞書部とを有する音
声認識装置に関する。
標準・ぐタンを格納する音素標準・ぐタン部と、音素系
列で表現された単語を格納する学語辞書部とを有する音
声認識装置に関する。
特定話者用の音声認識装置を大別すると1話者に固有の
特徴パラメータとして、単語標準パタンを有するものと
、音素標準i<?タンを有するものとに分ける事ができ
る。本発明1は後者に属するものである。
特徴パラメータとして、単語標準パタンを有するものと
、音素標準i<?タンを有するものとに分ける事ができ
る。本発明1は後者に属するものである。
音素の学習は、音素系列と、その音素系列で表現された
単語の入力音声とを照合し、それぞれの音素に対する入
力音声の特徴・9ラメータを得る事である。それは入力
音声を一定の区間に区切り。
単語の入力音声とを照合し、それぞれの音素に対する入
力音声の特徴・9ラメータを得る事である。それは入力
音声を一定の区間に区切り。
特徴パラメータをもとめ、その区間の入力音声がどの音
素であるかに調べる事によシ行われる。
素であるかに調べる事によシ行われる。
又、単語の認識は次の様に行われる。まず、入力音声を
一定の区間に区切り1区間毎に各音素標準パタンをの類
似度を計算する。次に各単語とのマツチングを行う。単
語は音素系列の形で表現されているので、その区間に対
応する音素に関する類似度を求め、それを全区間につい
て加え合わせた結果が、入力音声と音素系列との類似度
である。。
一定の区間に区切り1区間毎に各音素標準パタンをの類
似度を計算する。次に各単語とのマツチングを行う。単
語は音素系列の形で表現されているので、その区間に対
応する音素に関する類似度を求め、それを全区間につい
て加え合わせた結果が、入力音声と音素系列との類似度
である。。
次に全単語((ついての類似度を比較して、最大の類似
度を示す単語を認識結果とする。
度を示す単語を認識結果とする。
ところで、入力音声がある条P!l:と満たす時2例え
ば2語尾の無声子音の後(例えば、 ROKUのU)。
ば2語尾の無声子音の後(例えば、 ROKUのU)。
又は無声子音にはさまれた時などに、音素が変化する場
合があるため、同一単語に対し二種類の音素系列が用意
されている。従来、この様な単語に対する学習は、入力
音声がどちらの音素系列に属するかを調べるために、同
じ単語の入力を二面行い、それぞれ別の音素系列との類
似度をもとめて。
合があるため、同一単語に対し二種類の音素系列が用意
されている。従来、この様な単語に対する学習は、入力
音声がどちらの音素系列に属するかを調べるために、同
じ単語の入力を二面行い、それぞれ別の音素系列との類
似度をもとめて。
類似度の大きい方の音素系列を選択し、前述した処理を
行っていた。
行っていた。
以下余日
〔発明が解決しようとす不問厘点〕
従来の音声認識装置では、前記単語に対する発声が二面
必要であり1話者を混乱させる恐れがあると同時に1話
者への負担が大きくなるという欠点がある。
必要であり1話者を混乱させる恐れがあると同時に1話
者への負担が大きくなるという欠点がある。
又、前述したように、二つの音素系列の違い、:d。
その系列中の一部の声素の違いであり、二面の発声が全
く同じであるという保障もないので、類似度の差は、音
素の違いによるものでもあり2発声の違い;こよるもの
でもある。従来は音素の違いによるものとみなして処理
していたわけであるが6発声の違いによる影響の方が太
きかった場合、まちがった音素系列全選択してしまう可
能性がある。
く同じであるという保障もないので、類似度の差は、音
素の違いによるものでもあり2発声の違い;こよるもの
でもある。従来は音素の違いによるものとみなして処理
していたわけであるが6発声の違いによる影響の方が太
きかった場合、まちがった音素系列全選択してしまう可
能性がある。
そして、誤った音素標準・ぐタンを作成してしまい。
ひいては、認識率の低下をひきおこすという欠点がある
。
。
本発明の目的は、二種類の音素系列を持つ単語に関する
学習を一回の発声で行うことができるようにして1話者
の負担全軽減すると共に、認識時にまちがった音声系列
全選択することのない認識率の向上した音声認識装置を
提供することにある。
学習を一回の発声で行うことができるようにして1話者
の負担全軽減すると共に、認識時にまちがった音声系列
全選択することのない認識率の向上した音声認識装置を
提供することにある。
本発明によれば、特定話者用の音声認識装置において、
二種類の音素系列で表現された単語を格1納する単語辞
書部と、該単語の入力音声と該単語辞書部の該単語に関
する前記二種類の音素系列のうちの一方とを照合し、そ
れぞれの音素に対する特徴パラメータを抽出し、類似度
を計算する第1の学習機能部と、該単語の入力音声と該
単語辞書部の該単語に関する前記二種類の音素系列のう
ちの他方とを照合し、それぞれの音素に対する特徴パラ
メータを抽出し、類似度を計算する第2の学習機能部と
、該第1及び第2の学習機能部のうち。
二種類の音素系列で表現された単語を格1納する単語辞
書部と、該単語の入力音声と該単語辞書部の該単語に関
する前記二種類の音素系列のうちの一方とを照合し、そ
れぞれの音素に対する特徴パラメータを抽出し、類似度
を計算する第1の学習機能部と、該単語の入力音声と該
単語辞書部の該単語に関する前記二種類の音素系列のう
ちの他方とを照合し、それぞれの音素に対する特徴パラ
メータを抽出し、類似度を計算する第2の学習機能部と
、該第1及び第2の学習機能部のうち。
類似度の大きい方の学習;幾能部での処理結果をもとに
して音素標準・ぐタンを作成し、音素標準・ぐタン部に
格納する制御部とを備えたことを特徴とする音声認識装
置tが得られる。
して音素標準・ぐタンを作成し、音素標準・ぐタン部に
格納する制御部とを備えたことを特徴とする音声認識装
置tが得られる。
次に本発明について図面を参照して説明する。
第1図は本発明の一実施例による音声認識装置のブロッ
ク図である。1はマイクロホン、2は音声入力部、3お
よび9は学習・認識部、4および10は単語辞書部、5
および11は音素標準7477部、6は制御部、7は制
御部6を制御する制御プログラムが格納されるメモリ部
、8は表示部を゛示す。この図において、学習・認識部
3および学習・認識部9は、制御部6の制御により学習
機能力認識機能かのどちらかを選択する。
ク図である。1はマイクロホン、2は音声入力部、3お
よび9は学習・認識部、4および10は単語辞書部、5
および11は音素標準7477部、6は制御部、7は制
御部6を制御する制御プログラムが格納されるメモリ部
、8は表示部を゛示す。この図において、学習・認識部
3および学習・認識部9は、制御部6の制御により学習
機能力認識機能かのどちらかを選択する。
二種類の音素系列を持つ単語に関する学習を行う場合の
処理の流れを次に列挙する。
処理の流れを次に列挙する。
(1)制御部6の制御てより、学習・認識部3および学
習・認識部9を学習機能に設定する。
習・認識部9を学習機能に設定する。
(2)制御部6は、学習・認識部3の学習対象用音素系
列を、二種類の音素系列のうちのどちらか一方(即ち、
単語辞書部4)とする。
列を、二種類の音素系列のうちのどちらか一方(即ち、
単語辞書部4)とする。
(3)制御部6は、学習・認識部9の学習対象用音素系
列を、もう一方の音素系列(即ち、単語辞書部10)と
する。
列を、もう一方の音素系列(即ち、単語辞書部10)と
する。
(4)制御部6は1表示部8に該当単語を表示し。
話者に発声を促す。
(5)話者はマイクロホン1に音声を入力する。
(6) 音声入力部2は、入力音声のΦ変換等の処理
を行いその:結果を学習・認識部3および学習・認識部
9に送る。
を行いその:結果を学習・認識部3および学習・認識部
9に送る。
(7)学習・認識部3および学習・認識部9は送られて
きたデータ全もとにそれぞれの音素に対する特徴パラメ
ータの抽出、類似度計算等を行う。
きたデータ全もとにそれぞれの音素に対する特徴パラメ
ータの抽出、類似度計算等を行う。
(8) 制御部6は、二つの類似度を比較して類似度
の大きい方の学習・認識部での処理結果をもとにして音
素標準・ぐタンの作成を行い、対応する音素標準・ぐタ
ン部5または11に格納する。
の大きい方の学習・認識部での処理結果をもとにして音
素標準・ぐタンの作成を行い、対応する音素標準・ぐタ
ン部5または11に格納する。
尚1本装置において学習・認識部3および学習・認識部
9を認識機能に設定し、単語辞書部4と単語辞書部10
に異なる単語辞書を格納しておけば。
9を認識機能に設定し、単語辞書部4と単語辞書部10
に異なる単語辞書を格納しておけば。
従来の約2倍の単語を認識する事も可能である。
以上説明したよって本発明は、二つの学習機能部を有す
る事により、二種類の音素系列を持つ単語に関する学習
を一回の発声で行う事ができ話者の負担が軽減すると同
時に、まちがった音素系列を選択することがないので認
識率の向上が見込まれるという効果がある。
る事により、二種類の音素系列を持つ単語に関する学習
を一回の発声で行う事ができ話者の負担が軽減すると同
時に、まちがった音素系列を選択することがないので認
識率の向上が見込まれるという効果がある。
第1図は本発明の一実施例だよる音声認識装置のブロッ
ク図である。 1・・・マイクロホン、2・・・音声入力部、3,9・
・・学習認識部、4.10・・・単語辞書部、5.11
・・・音素標準・やタン部、6・・・制御部、7・・・
メモリ部。 8・・・表示部。 3゛°′−1, 1(ゴム(7783)弁理士?也田憲保 は、−ノ。
ク図である。 1・・・マイクロホン、2・・・音声入力部、3,9・
・・学習認識部、4.10・・・単語辞書部、5.11
・・・音素標準・やタン部、6・・・制御部、7・・・
メモリ部。 8・・・表示部。 3゛°′−1, 1(ゴム(7783)弁理士?也田憲保 は、−ノ。
Claims (1)
- 1、特定話者用の音声認識装置において、二種類の音素
系列で表現された単語を格納する単語辞書部と、該単語
の入力音声と該単語辞書部の該単語に関する前記二種類
の音素系列のうちの一方とを照合し、それぞれの音素に
対する特徴パラメータを抽出し、類似度を計算する第1
の学習機能部と、該単語の入力音声と該単語辞書部の該
単語に関する前記二種類の音素系列のうちの他方とを照
合し、それぞれの音素に対する特徴パラメータを抽出し
、類似度を計算する第2の学習機能部と、該第1及び第
2の学習機能部のうち、類似度の大きい方の学習機能部
での処理結果をもとにして音素標準パタンを作成し、音
素標準パタン部に格納する制御部とを備えたことを特徴
とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60261482A JPS62121499A (ja) | 1985-11-22 | 1985-11-22 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60261482A JPS62121499A (ja) | 1985-11-22 | 1985-11-22 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62121499A true JPS62121499A (ja) | 1987-06-02 |
Family
ID=17362517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60261482A Pending JPS62121499A (ja) | 1985-11-22 | 1985-11-22 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62121499A (ja) |
-
1985
- 1985-11-22 JP JP60261482A patent/JPS62121499A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
EP1233406A1 (en) | Speech recognition adapted for non-native speakers | |
JP2955297B2 (ja) | 音声認識システム | |
JPH11149294A (ja) | 音声認識装置および音声認識方法 | |
JPS62121499A (ja) | 音声認識装置 | |
JPH07230293A (ja) | 音声認識装置 | |
JPS645320B2 (ja) | ||
JP2003022093A (ja) | 音声認識方法および音声認識装置ならびに音声認識プログラム | |
JP2003022091A (ja) | 音声認識方法および音声認識装置ならびに音声認識プログラム | |
JPS6312000A (ja) | 音声認識装置 | |
JPS62114082A (ja) | パタ−ン認識学習方式 | |
JPH04271397A (ja) | 音声認識装置 | |
JPH08110797A (ja) | パターンマッチング装置 | |
JPS60241097A (ja) | 音声認識応用装置 | |
JPS62217297A (ja) | 単語音声認識装置 | |
JPS607492A (ja) | 単音節音声認識方式 | |
JPS62111292A (ja) | 音声認識装置 | |
JPS61123889A (ja) | 音声認識装置 | |
JPH0484196A (ja) | 連続音声認識用登録パターン作成方法 | |
JPS60170900A (ja) | 音節音声標準パタン登録方式 | |
JPS63218999A (ja) | 音声認識装置 | |
JPH01126694A (ja) | 音声認識装置における音韻記号の付加方式 | |
JPS63223693A (ja) | 音韻パタ−ン登録方法 | |
JPS6247100A (ja) | 音声認識装置 | |
JPS60113298A (ja) | 特定話者音声認識装置 |