JPS58105299A

JPS58105299A - アルフアベツト音声認識装置

Info

Publication number: JPS58105299A
Application number: JP56204818A
Authority: JP
Inventors: 井関　治
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1981-12-18
Filing date: 1981-12-18
Publication date: 1983-06-23

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明はアルファべ、ト音声認識装置に関するものであ
る。

従来％１文字ずつのアルファベットに対応し、区切って
発声・されたアルファぺ、ト音声は、一般の単語音声と
同じように、一つの発声に関するすべての特徴パターン
を、あらかじめ登録しておいた婁準パターンとパターン
マツチングすることによ〕認識されていた。

しかし、アルファベット音声は、カナ文字に対応する単
音節音声のように、 ■　発声され、る時間が短かい九め、特徴に関する情報
量が少ない。

■　標準パターン登録時と音声入力時の時間の経過、入
力環境の変化等による特徴パターンのばらつきが多い。

■　まぎられしい発音のものが多い。

等の理由によって、認識率の高い認識は非常に困難であ
る。ところが、カナ文字に対応する単音節音声認識の場
合、単音節が子音＋母音ｔたは母音のみという形で表わ
されることを利用し、入力した音声の母音部からア行か
らオ行までの５つの母音系列に予備選択し、その後子音
部（母音のみで構成される単音節では、その前部を疑似
的に４音部とみなす、）で認識する手法を用いて性能を
向上させている。

本発明は、アルファぺ、ト音声をカナ文字に対応する単
音節音声と同様に、アルファベットの音韻的特徴に合わ
せた予備選択等の処理をすることによって、認識率が高
いアルファベット音声認識装置ｔ−提供することにある
。

本発明のアルファべ、ト音声認識装置は、１文字ずつの
アルファべ、トに対応して区切って発声されたアルファ
ベット音声の特徴を抽出してパターン化する特徴パター
ン抽出部と、入力された音声のパワーデータを抽出し記
憶するパワーデータ抽出部と、前記パワーデータよ〕前
記特徴パターン管いくつかに分類する特徴パターン分類
部と、分類された特徴パターンを標準パターンとして登
帰する標準パターン登鎌部と、認識しようとする入力音
声より、前記特徴パターン抽出部と特徴パターン分類部
において抽出分類された入ｊ％　パターンと、前記標準
パターンとの間の類似度を基に、認識結果を求めるアル
ファベット音声認識部と、尚該ｉｉｔｍ結果を出力する
結果出力部とを有することを特徴とする。

以下、本発明の一実施例について説明する。

第１図は本発明によるアルファベット音声認識装置の一
実施例の構成図である。まず認識のための基準管得るた
めのアルファぺ、ト音声はマイクロホン１よ〕入力され
、特徴パターン抽出部２で１文字ごとにアルファベット
音声全体にわたる特徴パターンが抽出される。これと同
時にパワーデータ抽出部４で振幅情報が抽出される。特
徴パターン分類部４では、この振幅情報に基き、抽出部
２による特徴パターンｔｈ＜つかの部分に分類する。以
後分類された特徴パターンを単にアルファベット特徴パ
ターンと呼ぶ、スィッチ５ｔ″人側にたおした時、アル
ファベット特徴パターンは、標準パターン登鋒ＩＳ６に
記憶される。Ｉ［識されるべきすべてのアルファベット
音声のアルファベット特徴パターンが標準パターン登嚢
部６に記憶された後、認識処理を始める九めに、スイッ
チ５’ｊ−Ｂ側にたおす、この時、入力された音声の特
徴パターンは、アルファべ、ト音声認識１１３７に入力
され、アルファベット音声の音韻的特徴に基く規則によ
シ、標準パターン登鎌Ｉ＄６内の標準パターンとマツチ
ングし、Ｉｌ識結果を結果出力部８に出力する。

アルファベット特徴パターンは、音声の振幅が最も大き
い部分の前後１６ｍ５ｅｃ程度のピーク部パターンと、
振幅があるスレッシ、ホルトを越える始端点からの１０
６ｍ５ｅｃ程度の始端部パターント、振幅が最後にある
スレ、シュホルトよ）小さくなる終端点の前ｔｏｏｍｓ
ｅｃｓＩ［の終端部パターンの３つの部分によって分類
される。このとき各アルファベットは以下の様に分類さ
れる。

まず、ピーク部パターンによシ５母音系列、つ壕〕分類
〔１〕１分類〔量３１分類（ｕ）、、分類〔６３１分類
（０）に大きく分けられる１次にそれぞれ次の様に分類
される１（１）分類（ａ）は終端部パターンにより、Ｒ（ａｓ）
。

Ｗ（ｄＡｂｌｊμ：）　に分類され、始端部パターンに
よ−’Ｆ　Ｉ　（ａ　１）　、　Ｙ　（ｗａすに分類さ
レル。

（２）分類〔量〕は終端部メタ３−ンのみによシＢ（ｂ
ｌ：）。

Ｃ（ＩＩ　’　：）　＊　Ｄ　（ｄ　’　：）　ａ　Ｅ
　（’　：）　ｅ　Ｇ　（ｄ］　’　：）　＠　Ｐ（１
”　：）　ａ　Ｔ（ｔｊ：）、Ｖ（ｖｌ：）、Ｚ（ｘｉ
；Ｉ　　Ｋ分１［ルル。

（３）　　分類（Ｕ）は始端部パターンのみによシＱＯ
ｃＭ。

Ｕ（ｊｓｒｌ　に分類される。

（４）分類（ｅ）は終端部パターンによＩＦ（ｅｆ）。

Ｈ（ｅｉ　ｔｊ）、　Ｌ（ｅｌ）、　Ｍ（ａｍ）、　Ｎ
（ａｎ）、、ｓ　（ａｍ）。

Ｘ（ａｋｓ）　　に分類され、始端部パターンによ〕Ａ
（ｅす、　Ｊ　（ｄ２ｒｅす、Ｋ（ｋｅリ　に分類され
る。

（５）　　分類（０）ｄｏ（ｏｕ）のみとする。

上記分類で、〔〕内は発音記号を示している。

この分類によシマ、チングすべＩＩ椰準パターン数が減
少し、ｔた、特に特徴的な部分のマツチングによシｉｉ
＊できる。

第２図に第一１１＄の標準−（ターン登＊ｌｌ５６に町
憶されている標準パターンの記憶形態の例を示し、第３
図に第１図のアルファぺ、ト音声認識ｆｆ１７の具体的
構成例を示す、第２図において、標準バター登ｆｉｌ＄
６に記憶されている標準パターンは、各アルファベット
６１ごとに、−大分類係数ＲＣＯと二次分類係数ＲＣ１
，Ｃ１，ビーターンＲＰＯ終端部パターンＲＰｉ、始端
部パターンＲＰ２から成る。

第２図を参照しながら第３図の動作を説明する。

入力され九アルファベット音声の入カバターンＩＰは、
ピークマツチング部７１へ入力され、全アルファへ、ト
のピーク部パターンＲｐ　ｏ　を対象Ｖｃパターンマツ
チングを行なう、その結果最も良く！、チング會したア
ルファべ、トの係数ＲＣＯとパターンｌＰｔ−一次分類
郡７２へ送〕、ここでは、係数ＲＣＯの値Ｃ１〜Ｃ５に
従い、以下の処理ｔする。係数ＲＣＯがＣ１ｔたはＣ４
のとき係数ＲＣＯとパターンＩＰはそれぞれ分類１終端
！、チング部７３ｔたは分類４終端マッチジ夛部７４へ
送られる。

！、チング部７３．７４では、おのおの係数ＲＣＯが同
じ値のパターンＲＰＩについてマツチングを行ない、そ
の結果最も良くマツチングしたアルファぺ、トの係数Ｒ
Ｃ１とパターンＩＰを二次分類部７５へ送ル、係数ＲＣ
Ｉの値が１種類しかまいアルファベラ）Ｒ，ＷＫついて
は、そのアルファベラ）を認識結果ＲＤとして出力部８
へ送る。係数Ｒ，ＣＩの値が複数ある場合は、係数ＲＣ
ＩとパターンＩＰをそれぞれ分類１始端！ツチングｆ！
Ｓ７６゜分類１始端！ツチング部７７へ送る。Ｙ、チン
グ部７１からの係数ＲＣＯが０２または０３のときは、
分類部７２により″その係数ＲＣＯとパターンＩＰがそ
れぞれ分類２始端マツチング部７８、分類３始端マツチ
ング部７９へ送られる。マツチング部７６．７７．７８
．７９ではそれぞれ送られてきた係数ＲＣＯあるいは係
数ＲＣＩの値の等しいアルファベットのパターンＲＰ２
についてパターンＩＰとマツチングを行ない、最も良く
マツチングしたアルファぺｙ）ｔｌ！識結果ＲＤとして
出力部８へ送る。ま九マツチング部７１からの係数ＲＣ
Ｏが０５の場合、分類Ｎ７２は認識結果ＲＤとしてアル
ファベットＯ１−出力部８へ送る。

以上説明したように本発明によるアルファベット認識で
は、まぎられしい発音のアルファベットについてさらに
細かく特徴的部分のマツチングが行なえ、認識率が著し
く向上する。

尚、本発明はアルファベット音声認識率向上に関する方
式の発明であ〕、回路の構成方法や本発明がある音声認
識装置上の一部として実現されることに拘らず成立する
ことはもちろんである。

【図面の簡単な説明】

第１図は本発明によるアルファベット音声認識装置の一
実施例の構成図、第２図は第１図の標準パターン登１１
部６内の標準パターンの記憶形態の一例を示す説明図、
第３図は第１図のアルファぺ、ト音声認識部の一例を示
すプ四ツク図である。１・・・・・・マイク、２・・・・・・特徴パターン抽
出部、３・・・・・・パワーデータ抽出部、４・・・・
・・特徴ノ（ターン分類部、５・・・・・・スイッチ、
６・・・・・・標準バターｙｉ鍮ＩＩＳ％７・・・・・
・アルファベット音声認識部、訃・・・・・結果出力部
、ＲＣｏ・・・・・・−大分類′係数、ＲＣＩ・・・・
・・二次分類係数、ＲＰＯ・・・・・・ピーク部パター
ン、ＲＰＩ・・・・・・終端部パターン、ＲＰ２・・・
・・・始端部パターン、７１・・・・・・ピークマツチ
ング部、７２・・・・・・−次分類部、テ訃・・・・・
分類１終端！ツチング部１７４・・・・・・分類４終端
マツチング部％７５・・・・・・二次分類部、７６・・
・・・・分類１始端！ツチング部、７７・・・・・・分
類４始端マツチング部、７８・・・・・・分類２始端！
ツチング部、７９・・・・・・分類３始端！ツチング部
。第１図第２図

Claims

【特許請求の範囲】

１文字ずつのアルファべ、トに対応して区切って発声さ
れたアルファぺ、ト音声の特徴を抽出してパターン化す
る特徴パターン抽出部と、入力された音声のパワーデー
タを抽出し配憶するノ（ワーデータ抽出部と、前ｉパワ
ーデ＝りよ）前記特徴パターンをいくつかに分類する特
徴パターン分ｍ部と、分類された特徴パターンを標準パ
ターンとして登碌する標準Ａターン登鎌部と、認識しよ
うとする入力音−より前記物像ノリーシ抽出部と特徴パ
ターン分類部において抽出分類された入カシ（ターン１
と前記標準パターンとの間の類似度を基に”認識−果を
求めるアルファー＜ット音声認識部と、前記認識結果を
出力する結果出力部とを有することを特徴゛とするアル
ファベット音−−識装置。