JPS58105299A - アルフアベツト音声認識装置 - Google Patents
アルフアベツト音声認識装置Info
- Publication number
- JPS58105299A JPS58105299A JP56204818A JP20481881A JPS58105299A JP S58105299 A JPS58105299 A JP S58105299A JP 56204818 A JP56204818 A JP 56204818A JP 20481881 A JP20481881 A JP 20481881A JP S58105299 A JPS58105299 A JP S58105299A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- classification
- alphabet
- standard
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明はアルファべ、ト音声認識装置に関するものであ
る。
る。
従来%1文字ずつのアルファベットに対応し、区切って
発声・されたアルファぺ、ト音声は、一般の単語音声と
同じように、一つの発声に関するすべての特徴パターン
を、あらかじめ登録しておいた婁準パターンとパターン
マツチングすることによ〕認識されていた。
発声・されたアルファぺ、ト音声は、一般の単語音声と
同じように、一つの発声に関するすべての特徴パターン
を、あらかじめ登録しておいた婁準パターンとパターン
マツチングすることによ〕認識されていた。
しかし、アルファベット音声は、カナ文字に対応する単
音節音声のように、 ■ 発声され、る時間が短かい九め、特徴に関する情報
量が少ない。
音節音声のように、 ■ 発声され、る時間が短かい九め、特徴に関する情報
量が少ない。
■ 標準パターン登録時と音声入力時の時間の経過、入
力環境の変化等による特徴パターンのばらつきが多い。
力環境の変化等による特徴パターンのばらつきが多い。
■ まぎられしい発音のものが多い。
等の理由によって、認識率の高い認識は非常に困難であ
る。ところが、カナ文字に対応する単音節音声認識の場
合、単音節が子音+母音tたは母音のみという形で表わ
されることを利用し、入力した音声の母音部からア行か
らオ行までの5つの母音系列に予備選択し、その後子音
部(母音のみで構成される単音節では、その前部を疑似
的に4音部とみなす、)で認識する手法を用いて性能を
向上させている。
る。ところが、カナ文字に対応する単音節音声認識の場
合、単音節が子音+母音tたは母音のみという形で表わ
されることを利用し、入力した音声の母音部からア行か
らオ行までの5つの母音系列に予備選択し、その後子音
部(母音のみで構成される単音節では、その前部を疑似
的に4音部とみなす、)で認識する手法を用いて性能を
向上させている。
本発明は、アルファぺ、ト音声をカナ文字に対応する単
音節音声と同様に、アルファベットの音韻的特徴に合わ
せた予備選択等の処理をすることによって、認識率が高
いアルファベット音声認識装置t−提供することにある
。
音節音声と同様に、アルファベットの音韻的特徴に合わ
せた予備選択等の処理をすることによって、認識率が高
いアルファベット音声認識装置t−提供することにある
。
本発明のアルファべ、ト音声認識装置は、1文字ずつの
アルファべ、トに対応して区切って発声されたアルファ
ベット音声の特徴を抽出してパターン化する特徴パター
ン抽出部と、入力された音声のパワーデータを抽出し記
憶するパワーデータ抽出部と、前記パワーデータよ〕前
記特徴パターン管いくつかに分類する特徴パターン分類
部と、分類された特徴パターンを標準パターンとして登
帰する標準パターン登鎌部と、認識しようとする入力音
声より、前記特徴パターン抽出部と特徴パターン分類部
において抽出分類された入j% パターンと、前記標準
パターンとの間の類似度を基に、認識結果を求めるアル
ファベット音声認識部と、尚該iitm結果を出力する
結果出力部とを有することを特徴とする。
アルファべ、トに対応して区切って発声されたアルファ
ベット音声の特徴を抽出してパターン化する特徴パター
ン抽出部と、入力された音声のパワーデータを抽出し記
憶するパワーデータ抽出部と、前記パワーデータよ〕前
記特徴パターン管いくつかに分類する特徴パターン分類
部と、分類された特徴パターンを標準パターンとして登
帰する標準パターン登鎌部と、認識しようとする入力音
声より、前記特徴パターン抽出部と特徴パターン分類部
において抽出分類された入j% パターンと、前記標準
パターンとの間の類似度を基に、認識結果を求めるアル
ファベット音声認識部と、尚該iitm結果を出力する
結果出力部とを有することを特徴とする。
以下、本発明の一実施例について説明する。
第1図は本発明によるアルファベット音声認識装置の一
実施例の構成図である。まず認識のための基準管得るた
めのアルファぺ、ト音声はマイクロホン1よ〕入力され
、特徴パターン抽出部2で1文字ごとにアルファベット
音声全体にわたる特徴パターンが抽出される。これと同
時にパワーデータ抽出部4で振幅情報が抽出される。特
徴パターン分類部4では、この振幅情報に基き、抽出部
2による特徴パターンth<つかの部分に分類する。以
後分類された特徴パターンを単にアルファベット特徴パ
ターンと呼ぶ、スィッチ5t″人側にたおした時、アル
ファベット特徴パターンは、標準パターン登鋒IS6に
記憶される。I[識されるべきすべてのアルファベット
音声のアルファベット特徴パターンが標準パターン登嚢
部6に記憶された後、認識処理を始める九めに、スイッ
チ5’j−B側にたおす、この時、入力された音声の特
徴パターンは、アルファべ、ト音声認識1137に入力
され、アルファベット音声の音韻的特徴に基く規則によ
シ、標準パターン登鎌I$6内の標準パターンとマツチ
ングし、Il識結果を結果出力部8に出力する。
実施例の構成図である。まず認識のための基準管得るた
めのアルファぺ、ト音声はマイクロホン1よ〕入力され
、特徴パターン抽出部2で1文字ごとにアルファベット
音声全体にわたる特徴パターンが抽出される。これと同
時にパワーデータ抽出部4で振幅情報が抽出される。特
徴パターン分類部4では、この振幅情報に基き、抽出部
2による特徴パターンth<つかの部分に分類する。以
後分類された特徴パターンを単にアルファベット特徴パ
ターンと呼ぶ、スィッチ5t″人側にたおした時、アル
ファベット特徴パターンは、標準パターン登鋒IS6に
記憶される。I[識されるべきすべてのアルファベット
音声のアルファベット特徴パターンが標準パターン登嚢
部6に記憶された後、認識処理を始める九めに、スイッ
チ5’j−B側にたおす、この時、入力された音声の特
徴パターンは、アルファべ、ト音声認識1137に入力
され、アルファベット音声の音韻的特徴に基く規則によ
シ、標準パターン登鎌I$6内の標準パターンとマツチ
ングし、Il識結果を結果出力部8に出力する。
アルファベット特徴パターンは、音声の振幅が最も大き
い部分の前後16m5ec程度のピーク部パターンと、
振幅があるスレッシ、ホルトを越える始端点からの10
6m5ec程度の始端部パターント、振幅が最後にある
スレ、シュホルトよ)小さくなる終端点の前tooms
ecsI[の終端部パターンの3つの部分によって分類
される。このとき各アルファベットは以下の様に分類さ
れる。
い部分の前後16m5ec程度のピーク部パターンと、
振幅があるスレッシ、ホルトを越える始端点からの10
6m5ec程度の始端部パターント、振幅が最後にある
スレ、シュホルトよ)小さくなる終端点の前tooms
ecsI[の終端部パターンの3つの部分によって分類
される。このとき各アルファベットは以下の様に分類さ
れる。
まず、ピーク部パターンによシ5母音系列、つ壕〕分類
〔1〕1分類〔量31分類(u)、、分類〔631分類
(0)に大きく分けられる1次にそれぞれ次の様に分類
される1 (1)分類(a)は終端部パターンにより、R(as)
。
〔1〕1分類〔量31分類(u)、、分類〔631分類
(0)に大きく分けられる1次にそれぞれ次の様に分類
される1 (1)分類(a)は終端部パターンにより、R(as)
。
W(dAbljμ:) に分類され、始端部パターンに
よ−’F I (a 1) 、 Y (waすに分類さ
レル。
よ−’F I (a 1) 、 Y (waすに分類さ
レル。
(2)分類〔量〕は終端部メタ3−ンのみによシB(b
l:)。
l:)。
C(II ’ :) * D (d ’ :) a E
(’ :) e G (d] ’ :) @ P(1
” :) a T(tj:)、V(vl:)、Z(xi
;I K分1[ルル。
(’ :) e G (d] ’ :) @ P(1
” :) a T(tj:)、V(vl:)、Z(xi
;I K分1[ルル。
(3) 分類(U)は始端部パターンのみによシQO
cM。
cM。
U(jsrl に分類される。
(4)分類(e)は終端部パターンによIF(ef)。
H(ei tj)、 L(el)、 M(am)、 N
(an)、、s (am)。
(an)、、s (am)。
X(aks) に分類され、始端部パターンによ〕A
(eす、 J (d2reす、K(keリ に分類され
る。
(eす、 J (d2reす、K(keリ に分類され
る。
(5) 分類(0)do(ou)のみとする。
上記分類で、〔〕内は発音記号を示している。
この分類によシマ、チングすべII椰準パターン数が減
少し、tた、特に特徴的な部分のマツチングによシii
*できる。
少し、tた、特に特徴的な部分のマツチングによシii
*できる。
第2図に第一11$の標準−(ターン登*ll56に町
憶されている標準パターンの記憶形態の例を示し、第3
図に第1図のアルファぺ、ト音声認識ff17の具体的
構成例を示す、第2図において、標準バター登fil$
6に記憶されている標準パターンは、各アルファベット
61ごとに、−大分類係数RCOと二次分類係数RC1
,C1,ビーターンRPO終端部パターンRPi、始端
部パターンRP2から成る。
憶されている標準パターンの記憶形態の例を示し、第3
図に第1図のアルファぺ、ト音声認識ff17の具体的
構成例を示す、第2図において、標準バター登fil$
6に記憶されている標準パターンは、各アルファベット
61ごとに、−大分類係数RCOと二次分類係数RC1
,C1,ビーターンRPO終端部パターンRPi、始端
部パターンRP2から成る。
第2図を参照しながら第3図の動作を説明する。
入力され九アルファベット音声の入カバターンIPは、
ピークマツチング部71へ入力され、全アルファへ、ト
のピーク部パターンRp o を対象Vcパターンマツ
チングを行なう、その結果最も良く!、チング會したア
ルファべ、トの係数RCOとパターンlPt−一次分類
郡72へ送〕、ここでは、係数RCOの値C1〜C5に
従い、以下の処理tする。係数RCOがC1tたはC4
のとき係数RCOとパターンIPはそれぞれ分類1終端
!、チング部73tたは分類4終端マッチジ夛部74へ
送られる。
ピークマツチング部71へ入力され、全アルファへ、ト
のピーク部パターンRp o を対象Vcパターンマツ
チングを行なう、その結果最も良く!、チング會したア
ルファべ、トの係数RCOとパターンlPt−一次分類
郡72へ送〕、ここでは、係数RCOの値C1〜C5に
従い、以下の処理tする。係数RCOがC1tたはC4
のとき係数RCOとパターンIPはそれぞれ分類1終端
!、チング部73tたは分類4終端マッチジ夛部74へ
送られる。
!、チング部73.74では、おのおの係数RCOが同
じ値のパターンRPIについてマツチングを行ない、そ
の結果最も良くマツチングしたアルファぺ、トの係数R
C1とパターンIPを二次分類部75へ送ル、係数RC
Iの値が1種類しかまいアルファベラ)R,WKついて
は、そのアルファベラ)を認識結果RDとして出力部8
へ送る。係数R,CIの値が複数ある場合は、係数RC
IとパターンIPをそれぞれ分類1始端!ツチングf!
S76゜分類1始端!ツチング部77へ送る。Y、チン
グ部71からの係数RCOが02または03のときは、
分類部72により″その係数RCOとパターンIPがそ
れぞれ分類2始端マツチング部78、分類3始端マツチ
ング部79へ送られる。マツチング部76.77.78
.79ではそれぞれ送られてきた係数RCOあるいは係
数RCIの値の等しいアルファベットのパターンRP2
についてパターンIPとマツチングを行ない、最も良く
マツチングしたアルファぺy)tl!識結果RDとして
出力部8へ送る。ま九マツチング部71からの係数RC
Oが05の場合、分類N72は認識結果RDとしてアル
ファベットO1−出力部8へ送る。
じ値のパターンRPIについてマツチングを行ない、そ
の結果最も良くマツチングしたアルファぺ、トの係数R
C1とパターンIPを二次分類部75へ送ル、係数RC
Iの値が1種類しかまいアルファベラ)R,WKついて
は、そのアルファベラ)を認識結果RDとして出力部8
へ送る。係数R,CIの値が複数ある場合は、係数RC
IとパターンIPをそれぞれ分類1始端!ツチングf!
S76゜分類1始端!ツチング部77へ送る。Y、チン
グ部71からの係数RCOが02または03のときは、
分類部72により″その係数RCOとパターンIPがそ
れぞれ分類2始端マツチング部78、分類3始端マツチ
ング部79へ送られる。マツチング部76.77.78
.79ではそれぞれ送られてきた係数RCOあるいは係
数RCIの値の等しいアルファベットのパターンRP2
についてパターンIPとマツチングを行ない、最も良く
マツチングしたアルファぺy)tl!識結果RDとして
出力部8へ送る。ま九マツチング部71からの係数RC
Oが05の場合、分類N72は認識結果RDとしてアル
ファベットO1−出力部8へ送る。
以上説明したように本発明によるアルファベット認識で
は、まぎられしい発音のアルファベットについてさらに
細かく特徴的部分のマツチングが行なえ、認識率が著し
く向上する。
は、まぎられしい発音のアルファベットについてさらに
細かく特徴的部分のマツチングが行なえ、認識率が著し
く向上する。
尚、本発明はアルファベット音声認識率向上に関する方
式の発明であ〕、回路の構成方法や本発明がある音声認
識装置上の一部として実現されることに拘らず成立する
ことはもちろんである。
式の発明であ〕、回路の構成方法や本発明がある音声認
識装置上の一部として実現されることに拘らず成立する
ことはもちろんである。
第1図は本発明によるアルファベット音声認識装置の一
実施例の構成図、第2図は第1図の標準パターン登11
部6内の標準パターンの記憶形態の一例を示す説明図、
第3図は第1図のアルファぺ、ト音声認識部の一例を示
すプ四ツク図である。 1・・・・・・マイク、2・・・・・・特徴パターン抽
出部、3・・・・・・パワーデータ抽出部、4・・・・
・・特徴ノ(ターン分類部、5・・・・・・スイッチ、
6・・・・・・標準バターyi鍮IIS%7・・・・・
・アルファベット音声認識部、訃・・・・・結果出力部
、RCo・・・・・・−大分類′係数、RCI・・・・
・・二次分類係数、RPO・・・・・・ピーク部パター
ン、RPI・・・・・・終端部パターン、RP2・・・
・・・始端部パターン、71・・・・・・ピークマツチ
ング部、72・・・・・・−次分類部、テ訃・・・・・
分類1終端!ツチング部174・・・・・・分類4終端
マツチング部%75・・・・・・二次分類部、76・・
・・・・分類1始端!ツチング部、77・・・・・・分
類4始端マツチング部、78・・・・・・分類2始端!
ツチング部、79・・・・・・分類3始端!ツチング部
。 第1図 第2図
実施例の構成図、第2図は第1図の標準パターン登11
部6内の標準パターンの記憶形態の一例を示す説明図、
第3図は第1図のアルファぺ、ト音声認識部の一例を示
すプ四ツク図である。 1・・・・・・マイク、2・・・・・・特徴パターン抽
出部、3・・・・・・パワーデータ抽出部、4・・・・
・・特徴ノ(ターン分類部、5・・・・・・スイッチ、
6・・・・・・標準バターyi鍮IIS%7・・・・・
・アルファベット音声認識部、訃・・・・・結果出力部
、RCo・・・・・・−大分類′係数、RCI・・・・
・・二次分類係数、RPO・・・・・・ピーク部パター
ン、RPI・・・・・・終端部パターン、RP2・・・
・・・始端部パターン、71・・・・・・ピークマツチ
ング部、72・・・・・・−次分類部、テ訃・・・・・
分類1終端!ツチング部174・・・・・・分類4終端
マツチング部%75・・・・・・二次分類部、76・・
・・・・分類1始端!ツチング部、77・・・・・・分
類4始端マツチング部、78・・・・・・分類2始端!
ツチング部、79・・・・・・分類3始端!ツチング部
。 第1図 第2図
Claims (1)
- 1文字ずつのアルファべ、トに対応して区切って発声さ
れたアルファぺ、ト音声の特徴を抽出してパターン化す
る特徴パターン抽出部と、入力された音声のパワーデー
タを抽出し配憶するノ(ワーデータ抽出部と、前iパワ
ーデ=りよ)前記特徴パターンをいくつかに分類する特
徴パターン分m部と、分類された特徴パターンを標準パ
ターンとして登碌する標準Aターン登鎌部と、認識しよ
うとする入力音−より前記物像ノリーシ抽出部と特徴パ
ターン分類部において抽出分類された入カシ(ターン1
と前記標準パターンとの間の類似度を基に”認識−果を
求めるアルファー<ット音声認識部と、前記認識結果を
出力する結果出力部とを有することを特徴゛とするアル
ファベット音−−識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56204818A JPS58105299A (ja) | 1981-12-18 | 1981-12-18 | アルフアベツト音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56204818A JPS58105299A (ja) | 1981-12-18 | 1981-12-18 | アルフアベツト音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58105299A true JPS58105299A (ja) | 1983-06-23 |
Family
ID=16496885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56204818A Pending JPS58105299A (ja) | 1981-12-18 | 1981-12-18 | アルフアベツト音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58105299A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01105248A (ja) * | 1987-07-09 | 1989-04-21 | Fuji Photo Film Co Ltd | 写真用シアン色素形成カプラー |
-
1981
- 1981-12-18 JP JP56204818A patent/JPS58105299A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01105248A (ja) * | 1987-07-09 | 1989-04-21 | Fuji Photo Film Co Ltd | 写真用シアン色素形成カプラー |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS58130393A (ja) | 音声認識装置 | |
JPS62232691A (ja) | 音声認識装置 | |
CN111898342A (zh) | 一种基于编辑距离的中文发音校验方法 | |
CN116110370A (zh) | 基于人机语音交互的语音合成系统及相关设备 | |
JPS58105299A (ja) | アルフアベツト音声認識装置 | |
JP2966002B2 (ja) | 音声認識装置 | |
JPS58208795A (ja) | 音声認識に於るリジエクト方式 | |
JP2615643B2 (ja) | 単語音声認識装置 | |
JPS59185400A (ja) | 単音節音声認識方式 | |
JP2707552B2 (ja) | 単語音声認識装置 | |
JP2615649B2 (ja) | 単語音声認識装置 | |
JPS6135498A (ja) | 音声認識装置 | |
JPS58224396A (ja) | 音声認識装置 | |
JPS62217297A (ja) | 単語音声認識装置 | |
JPS59195299A (ja) | 特定話者音声認識装置 | |
JPS6075890A (ja) | 母音認識方法 | |
JPS60115993A (ja) | 単音節音声認識装置 | |
JPS6147992A (ja) | 音声認識方式 | |
JPS63161498A (ja) | 音声情報入力装置 | |
JPS63155195A (ja) | 音声認識装置 | |
JPS6287993A (ja) | 音声認識装置 | |
JPS61121093A (ja) | 音声認識装置 | |
JPS6173200A (ja) | 音声認識装置 | |
JPS5978399A (ja) | 単語音声認識方法 | |
JPS6344698A (ja) | 単語検出方式 |