JPS58105299A - アルフアベツト音声認識装置 - Google Patents

アルフアベツト音声認識装置

Info

Publication number
JPS58105299A
JPS58105299A JP56204818A JP20481881A JPS58105299A JP S58105299 A JPS58105299 A JP S58105299A JP 56204818 A JP56204818 A JP 56204818A JP 20481881 A JP20481881 A JP 20481881A JP S58105299 A JPS58105299 A JP S58105299A
Authority
JP
Japan
Prior art keywords
pattern
classification
alphabet
standard
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56204818A
Other languages
English (en)
Inventor
井関 治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56204818A priority Critical patent/JPS58105299A/ja
Publication of JPS58105299A publication Critical patent/JPS58105299A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明はアルファべ、ト音声認識装置に関するものであ
る。
従来%1文字ずつのアルファベットに対応し、区切って
発声・されたアルファぺ、ト音声は、一般の単語音声と
同じように、一つの発声に関するすべての特徴パターン
を、あらかじめ登録しておいた婁準パターンとパターン
マツチングすることによ〕認識されていた。
しかし、アルファベット音声は、カナ文字に対応する単
音節音声のように、 ■ 発声され、る時間が短かい九め、特徴に関する情報
量が少ない。
■ 標準パターン登録時と音声入力時の時間の経過、入
力環境の変化等による特徴パターンのばらつきが多い。
■ まぎられしい発音のものが多い。
等の理由によって、認識率の高い認識は非常に困難であ
る。ところが、カナ文字に対応する単音節音声認識の場
合、単音節が子音+母音tたは母音のみという形で表わ
されることを利用し、入力した音声の母音部からア行か
らオ行までの5つの母音系列に予備選択し、その後子音
部(母音のみで構成される単音節では、その前部を疑似
的に4音部とみなす、)で認識する手法を用いて性能を
向上させている。
本発明は、アルファぺ、ト音声をカナ文字に対応する単
音節音声と同様に、アルファベットの音韻的特徴に合わ
せた予備選択等の処理をすることによって、認識率が高
いアルファベット音声認識装置t−提供することにある
本発明のアルファべ、ト音声認識装置は、1文字ずつの
アルファべ、トに対応して区切って発声されたアルファ
ベット音声の特徴を抽出してパターン化する特徴パター
ン抽出部と、入力された音声のパワーデータを抽出し記
憶するパワーデータ抽出部と、前記パワーデータよ〕前
記特徴パターン管いくつかに分類する特徴パターン分類
部と、分類された特徴パターンを標準パターンとして登
帰する標準パターン登鎌部と、認識しようとする入力音
声より、前記特徴パターン抽出部と特徴パターン分類部
において抽出分類された入j% パターンと、前記標準
パターンとの間の類似度を基に、認識結果を求めるアル
ファベット音声認識部と、尚該iitm結果を出力する
結果出力部とを有することを特徴とする。
以下、本発明の一実施例について説明する。
第1図は本発明によるアルファベット音声認識装置の一
実施例の構成図である。まず認識のための基準管得るた
めのアルファぺ、ト音声はマイクロホン1よ〕入力され
、特徴パターン抽出部2で1文字ごとにアルファベット
音声全体にわたる特徴パターンが抽出される。これと同
時にパワーデータ抽出部4で振幅情報が抽出される。特
徴パターン分類部4では、この振幅情報に基き、抽出部
2による特徴パターンth<つかの部分に分類する。以
後分類された特徴パターンを単にアルファベット特徴パ
ターンと呼ぶ、スィッチ5t″人側にたおした時、アル
ファベット特徴パターンは、標準パターン登鋒IS6に
記憶される。I[識されるべきすべてのアルファベット
音声のアルファベット特徴パターンが標準パターン登嚢
部6に記憶された後、認識処理を始める九めに、スイッ
チ5’j−B側にたおす、この時、入力された音声の特
徴パターンは、アルファべ、ト音声認識1137に入力
され、アルファベット音声の音韻的特徴に基く規則によ
シ、標準パターン登鎌I$6内の標準パターンとマツチ
ングし、Il識結果を結果出力部8に出力する。
アルファベット特徴パターンは、音声の振幅が最も大き
い部分の前後16m5ec程度のピーク部パターンと、
振幅があるスレッシ、ホルトを越える始端点からの10
6m5ec程度の始端部パターント、振幅が最後にある
スレ、シュホルトよ)小さくなる終端点の前tooms
ecsI[の終端部パターンの3つの部分によって分類
される。このとき各アルファベットは以下の様に分類さ
れる。
まず、ピーク部パターンによシ5母音系列、つ壕〕分類
〔1〕1分類〔量31分類(u)、、分類〔631分類
(0)に大きく分けられる1次にそれぞれ次の様に分類
される1 (1)分類(a)は終端部パターンにより、R(as)
W(dAbljμ:) に分類され、始端部パターンに
よ−’F I (a 1) 、 Y (waすに分類さ
レル。
(2)分類〔量〕は終端部メタ3−ンのみによシB(b
l:)。
C(II ’ :) * D (d ’ :) a E
 (’ :) e G (d] ’ :) @ P(1
” :) a T(tj:)、V(vl:)、Z(xi
;I  K分1[ルル。
(3)  分類(U)は始端部パターンのみによシQO
cM。
U(jsrl に分類される。
(4)分類(e)は終端部パターンによIF(ef)。
H(ei tj)、 L(el)、 M(am)、 N
(an)、、s (am)。
X(aks)  に分類され、始端部パターンによ〕A
(eす、 J (d2reす、K(keリ に分類され
る。
(5)  分類(0)do(ou)のみとする。
上記分類で、〔〕内は発音記号を示している。
この分類によシマ、チングすべII椰準パターン数が減
少し、tた、特に特徴的な部分のマツチングによシii
*できる。
第2図に第一11$の標準−(ターン登*ll56に町
憶されている標準パターンの記憶形態の例を示し、第3
図に第1図のアルファぺ、ト音声認識ff17の具体的
構成例を示す、第2図において、標準バター登fil$
6に記憶されている標準パターンは、各アルファベット
61ごとに、−大分類係数RCOと二次分類係数RC1
,C1,ビーターンRPO終端部パターンRPi、始端
部パターンRP2から成る。
第2図を参照しながら第3図の動作を説明する。
入力され九アルファベット音声の入カバターンIPは、
ピークマツチング部71へ入力され、全アルファへ、ト
のピーク部パターンRp o を対象Vcパターンマツ
チングを行なう、その結果最も良く!、チング會したア
ルファべ、トの係数RCOとパターンlPt−一次分類
郡72へ送〕、ここでは、係数RCOの値C1〜C5に
従い、以下の処理tする。係数RCOがC1tたはC4
のとき係数RCOとパターンIPはそれぞれ分類1終端
!、チング部73tたは分類4終端マッチジ夛部74へ
送られる。
!、チング部73.74では、おのおの係数RCOが同
じ値のパターンRPIについてマツチングを行ない、そ
の結果最も良くマツチングしたアルファぺ、トの係数R
C1とパターンIPを二次分類部75へ送ル、係数RC
Iの値が1種類しかまいアルファベラ)R,WKついて
は、そのアルファベラ)を認識結果RDとして出力部8
へ送る。係数R,CIの値が複数ある場合は、係数RC
IとパターンIPをそれぞれ分類1始端!ツチングf!
S76゜分類1始端!ツチング部77へ送る。Y、チン
グ部71からの係数RCOが02または03のときは、
分類部72により″その係数RCOとパターンIPがそ
れぞれ分類2始端マツチング部78、分類3始端マツチ
ング部79へ送られる。マツチング部76.77.78
.79ではそれぞれ送られてきた係数RCOあるいは係
数RCIの値の等しいアルファベットのパターンRP2
についてパターンIPとマツチングを行ない、最も良く
マツチングしたアルファぺy)tl!識結果RDとして
出力部8へ送る。ま九マツチング部71からの係数RC
Oが05の場合、分類N72は認識結果RDとしてアル
ファベットO1−出力部8へ送る。
以上説明したように本発明によるアルファベット認識で
は、まぎられしい発音のアルファベットについてさらに
細かく特徴的部分のマツチングが行なえ、認識率が著し
く向上する。
尚、本発明はアルファベット音声認識率向上に関する方
式の発明であ〕、回路の構成方法や本発明がある音声認
識装置上の一部として実現されることに拘らず成立する
ことはもちろんである。
【図面の簡単な説明】
第1図は本発明によるアルファベット音声認識装置の一
実施例の構成図、第2図は第1図の標準パターン登11
部6内の標準パターンの記憶形態の一例を示す説明図、
第3図は第1図のアルファぺ、ト音声認識部の一例を示
すプ四ツク図である。 1・・・・・・マイク、2・・・・・・特徴パターン抽
出部、3・・・・・・パワーデータ抽出部、4・・・・
・・特徴ノ(ターン分類部、5・・・・・・スイッチ、
6・・・・・・標準バターyi鍮IIS%7・・・・・
・アルファベット音声認識部、訃・・・・・結果出力部
、RCo・・・・・・−大分類′係数、RCI・・・・
・・二次分類係数、RPO・・・・・・ピーク部パター
ン、RPI・・・・・・終端部パターン、RP2・・・
・・・始端部パターン、71・・・・・・ピークマツチ
ング部、72・・・・・・−次分類部、テ訃・・・・・
分類1終端!ツチング部174・・・・・・分類4終端
マツチング部%75・・・・・・二次分類部、76・・
・・・・分類1始端!ツチング部、77・・・・・・分
類4始端マツチング部、78・・・・・・分類2始端!
ツチング部、79・・・・・・分類3始端!ツチング部
。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. 1文字ずつのアルファべ、トに対応して区切って発声さ
    れたアルファぺ、ト音声の特徴を抽出してパターン化す
    る特徴パターン抽出部と、入力された音声のパワーデー
    タを抽出し配憶するノ(ワーデータ抽出部と、前iパワ
    ーデ=りよ)前記特徴パターンをいくつかに分類する特
    徴パターン分m部と、分類された特徴パターンを標準パ
    ターンとして登碌する標準Aターン登鎌部と、認識しよ
    うとする入力音−より前記物像ノリーシ抽出部と特徴パ
    ターン分類部において抽出分類された入カシ(ターン1
    と前記標準パターンとの間の類似度を基に”認識−果を
    求めるアルファー<ット音声認識部と、前記認識結果を
    出力する結果出力部とを有することを特徴゛とするアル
    ファベット音−−識装置。
JP56204818A 1981-12-18 1981-12-18 アルフアベツト音声認識装置 Pending JPS58105299A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56204818A JPS58105299A (ja) 1981-12-18 1981-12-18 アルフアベツト音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56204818A JPS58105299A (ja) 1981-12-18 1981-12-18 アルフアベツト音声認識装置

Publications (1)

Publication Number Publication Date
JPS58105299A true JPS58105299A (ja) 1983-06-23

Family

ID=16496885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56204818A Pending JPS58105299A (ja) 1981-12-18 1981-12-18 アルフアベツト音声認識装置

Country Status (1)

Country Link
JP (1) JPS58105299A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01105248A (ja) * 1987-07-09 1989-04-21 Fuji Photo Film Co Ltd 写真用シアン色素形成カプラー

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01105248A (ja) * 1987-07-09 1989-04-21 Fuji Photo Film Co Ltd 写真用シアン色素形成カプラー

Similar Documents

Publication Publication Date Title
JPS58130393A (ja) 音声認識装置
JPS62232691A (ja) 音声認識装置
CN111898342A (zh) 一种基于编辑距离的中文发音校验方法
CN116110370A (zh) 基于人机语音交互的语音合成系统及相关设备
JPS58105299A (ja) アルフアベツト音声認識装置
JP2966002B2 (ja) 音声認識装置
JPS58208795A (ja) 音声認識に於るリジエクト方式
JP2615643B2 (ja) 単語音声認識装置
JPS59185400A (ja) 単音節音声認識方式
JP2707552B2 (ja) 単語音声認識装置
JP2615649B2 (ja) 単語音声認識装置
JPS6135498A (ja) 音声認識装置
JPS58224396A (ja) 音声認識装置
JPS62217297A (ja) 単語音声認識装置
JPS59195299A (ja) 特定話者音声認識装置
JPS6075890A (ja) 母音認識方法
JPS60115993A (ja) 単音節音声認識装置
JPS6147992A (ja) 音声認識方式
JPS63161498A (ja) 音声情報入力装置
JPS63155195A (ja) 音声認識装置
JPS6287993A (ja) 音声認識装置
JPS61121093A (ja) 音声認識装置
JPS6173200A (ja) 音声認識装置
JPS5978399A (ja) 単語音声認識方法
JPS6344698A (ja) 単語検出方式