JPS5885495A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5885495A
JPS5885495A JP18325681A JP18325681A JPS5885495A JP S5885495 A JPS5885495 A JP S5885495A JP 18325681 A JP18325681 A JP 18325681A JP 18325681 A JP18325681 A JP 18325681A JP S5885495 A JPS5885495 A JP S5885495A
Authority
JP
Japan
Prior art keywords
vowel
section
acoustic
candidate
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP18325681A
Other languages
English (en)
Inventor
義幸 原
村田 敏健
恒雄 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP18325681A priority Critical patent/JPS5885495A/ja
Publication of JPS5885495A publication Critical patent/JPS5885495A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は連続して入力される音声信号の音韻を簡易にし
て効果的に認識できる音声認識装置に関する。
〈従来技術〉 近時、情報入力手段の一つとして音声認識が注目されて
いる。この音声認識処理は、入力された音声に対して、
例えば数十単語を対象として学習を行い、一旦、音韻系
列に変換して予め準備された音韻系列辞書と照合して認
識を行うものであシ、かなシ高い認識率を期待できる。
特にこの認識処理では、音韻認識の精度が認識率の良否
を決定する。この為、従来よシ音声信号よシ得られる音
韻列を音韻単位に分割して、各音韻毎にその認識処理を
行っている。
〈従来技術の問題点〉 しかして従来、母音パターンの検出に際しては、その音
響パラメータの安定点を検出し、この安定点の音響・ク
ラメータとその前後の音響パラメータとの類似度を求め
て音韻の分割を行い、しかるのち母音候補ツクターンの
中から差分が小さくなる複数点の音4L’ラメータを平
均化してこれを母音パターンとしてその認識を行ってい
る。然1〜乍ら、半母音を含む音韻のように・ぐワ−ス
ペクトルがなだらかに変化する音節中の母音は、そのノ
J?ワースにクトル変化が小さく、この結果母音候補パ
ターン中から母音パターンを正確に切出すことが困難で
あると云う問題がある。この為、認識率を十分に高める
ことが困難であシ、情報入力の一手段としての実用性に
問題が残されている。
〈発明の目的〉 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、ノ奇ワースベクトルがなだらか
に変化する音声パターンの音韻であっても、その母音候
補パターンを正確に切出して母音ノ譬ターンを検出し、
母音を正確且つ良好に認識することのできる音声認識装
置を提供することにある。
〈発明の要約〉 本発明の概要は、入力された音声信号の特徴パラメータ
の定常ノfター/からその子音候補区間と母音候補区間
とを分離する手段は従来と同じくするものであるが、こ
の分離された母音候補区間のパターンから母音パターン
を抽出するに際して、前記候補区間分離に用いた特徴パ
ラメータとは異なる特徴・母うメータの母音定常・ぐタ
ーンを検出してその認識を行うことによって、上述した
目的を効果的に達成したものでちる。
例えば隣接パワースペクトルの変化に従って候補区間の
分離を行ったのち、パワースペクトルから母音候補区間
中の母音定常パターンを検出することによって上記目的
を達成したものである。
〈発明の実施例〉 以下、図面を参照して本発明の実施例につき説明する。
第1図は実施例装置の概略構成図であり、第2図(、)
〜(、)は実施例装置の作用を示す図である。
第1図において、音声入力部1に入力された音声信号は
、電気信号に変換されると共に、例えばディジタル化さ
れて時系列に出力される。
このようにして音声入力部1を介して入力された音声信
号は、音響パラメータ抽出部2にて、その音響・母うメ
ータが抽出されている。この音響パラメータは、例えば
音声信号のパワースにクトルやその相関値、更にはその
ケゾヌトラムや、これらの分析処理によって求められる
特徴ノ9ターン等からなるものである。しかして、この
ような音声信号の特徴パラメータは、セグメント化処理
部3に導びかれる。このセグメント化処理部3では、例
えば上記パワースペクトルを周波数方向に加算してなる
i4ワー特性と、隣り合う2つのパワースペクトル間の
差分を各周波数帯域毎に計算し、その絶対値を加算して
求められた隣接・ぐワースベクトル変化とから上記音声
信号の安定した点(個所)を抽出している。
そして、この安定点の・ぐワースベクトルに対してその
前後あるいはその一方のパワースペクトルとの相関を求
め、その相関値が予め設定された閾値以上の区間を母音
候補区間、閾値以下の区間を子音候補区間としてセグメ
ント分離している。は音検出部4は、上記セグメント化
処理部3で求められた母音候補区間の音響パラメー5− タを入力し、特に上記候補区間分離に用いた音響パラメ
ータとは異なる種類の音響パラメータを用いて上記母音
候補区間の音声ノ4ターン中から母音定常パターンを検
出している。この母音定常パターンの抽出は、例えば前
記パワースペクトルの最大点を安定点とする等して行わ
れる。
しかして、この母音検出部4で求められた母音定常パタ
ーンの情報は、音韻認識部5に与えられる。音韻認識部
5では上記母音検出部4で求められた母音定常・母ター
ン、即ち母音・ヤターンと前記分離された子音候補区間
の子音パワースペクトルパターンとを、音韻辞書部6に
予め登録された標準パターンに対して照合して、その音
韻認識を行っている。この音韻認識は、前記した子音お
よび母音のノやターンと標準パターンとの類似度を計算
することによって行われ、例えば先ず母音を認識したの
ち子音を認識して完了する。具体的には、例えば母音定
常パターンと認識辞書6に登録されている母音の標準パ
ワースペクトルとの相関等を用いてその類似度6− 計算を行う。その後、音声信号のパワースペクトルパタ
ーン全体について辞書6の参照子音部ノ卆ワースペクト
ルノ母ターンとの類似度を計算することによって母音お
よび子音をそれぞれ認識する。このようにして認識され
た音韻の結果情報が出力部7を介して出力される。
即ち、入力された音声信号のセグメント化処理部3にお
ける子音候補区間と母音候補区間との分離、そして母音
認識部4における上記母音候補区間中での母音パターン
の検出は、前記音声信号の相互に異った特徴・9ラメー
タの定常部分を抽出してそれぞれ行われる。
かくしてこのように構成された装置に、例えば1東京」
なる音声を入力した場合、その音韻r Tok、lo 
Jは入力部1により第2図(a)に示す如き成分として
取出される。この信号は特徴パラメータ抽出部2におい
て、例えば第2図伽)に示すようにパワースペクトルの
周波数、時間パターンとしてその特徴ノ母うメータが抽
出され、また同図(C)に示すようにその・ぐワー特性
、同図(d)に示す隣接ス(クトル変化として特徴パラ
メータがそれぞれ抽出される。セグメント化処理部3で
は、これらの特徴)4ラメータに従って音声パワーが比
較的大きい区間で、且つスペクトル変化の小さい時点t
r 、 t’rを音声パターンの安定点として抽出して
いる。そして、この時点tr 。
t’rの/’Pワースベクトルとその前後の時刻におけ
るパワースペクトルの相関係数を計算して類似度を求め
ている。この計算結果、つまシ相関値VTを第2図(、
)に示す上記音声信号に対する閾値として定めている。
この閾値vTと音声信号とのレベル比較によシ、母音候
補区間■と子音候補区間Cとが分離されている。尚、こ
こでは母音成分が子音成分よりレベルが高いと云う音声
信号の性質に従い、上記閾値vTよりレベルの高い音声
区間を母音候補区間としている。
母音検出部4はこのようにして分離された母音候補区間
の、上記区間分離に使用した音饗・(ラメータとは異な
る音響i4’ラメータ、例えば第2図(C)に示すパワ
ー特性から、そのパワーが最も大きい時刻tm 、 t
’mを母音定常パターンを与える点として検出している
。つまυ、先の区間分離については、パワースペクトル
変化の安定点を基準として処理し、今後はパワー特性の
最大パワ一点を母音・臂ターン検出の為の定常点として
検出している。
しかしてこの母音定常パターンと前記分離された子音候
補のパターンとが音韻認識部5に与えられ、先ず母音定
常・臂ターンについて認識処理が行われる。この認識処
理は、音劉辞書6に登録されている各種母音のノやワー
スベクトルと前記母音定常パターンとの相関等から類似
度を計算して行われる。この類似度計算結果に従って母
音部が認識される。次に、入力された音声信号のパワー
スペクトル全体について音韻辞書部6に登録された参照
子音部ツクワースはクトルとの類似度計算が行われ、そ
の結果から子音部が認識される。これによシ入力音声の
音韻が[Tokyo jと認識され、出力部7を介して
「東京」として出力される。
9− 尚、ここでは「東京」なる音声の認識につき説明したが
、通常会話で用いられる単語や独立に発生した単音節に
ついても同様にその認識処理が実行される。
かくして上述した本装置によれば、半母音を含む音韻の
ようにそのA?ワースベクトルがなだらかに変化する音
節であっても、母音部に先行する子音に影響され難い安
定した母音の・ぐワースベクトルから母音)eターンを
抽出するので、母音部の認識率の向上を図シ得る。この
結果、高精度の音韻認識が可能となる。特に母音認識の
特徴ノ母うメータとは異なる特徴ノ母うメータの定常点
を検出して母音候補区間を分離するので、信頼性の高い
分離処理が可能であり、その効果は絶大である。つt、
b母音A?ターンのあいまいな音韻についても確実な認
識を行うことが可能である。
〈発明の異なる実施例〉 尚、本発明は上記した実施例にのみ限定されないことは
云うまでもない。例えば音声信号の一1〇− 特徴パラメータとして自己相関やその他の特徴を抽出し
てもよい。また音声信号の母音候補区間と子音候補区間
との分離に用いる特9パラメータ、および母音/4’タ
ーン検出に用いる特徴A?ラメータけ、それぞれそれに
最適なもの、つまりその差異が顕著に現われるものを適
宜用いればよい。また類似度計算も周知の手法を適宜用
いればよい。要するに本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。
〈発明の効果〉 以上詳述したように本発明は、母音候補区間と子音候補
区間の分離および母音ノ4ターンの検出に、それに適し
た異った種類の音響ノ4ラメータをそれぞれ用いて音韻
検出を行うので、半母音を含む音韻等のように母音パタ
ーンがなだらかに変化する音節で一般に母音ノリーンの
正確な検出が困難なものまでを含めて、正確に音韻認識
することができる。しかも処理制御が簡単であシ、実用
性が高く、認識率の大幅な向上を期待できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す装置の概略構成図、第
2図(、)〜(e)は実施例装置の作用を示す図である
。 1・・・音声入力部、2・・・音響i4ラメータ抽出部
、3・・・セグメント化処理部、4・・・母音検出部、
5・・・音韻認識部、6・・・音韻辞書部、7・・・認
識結果出力部。

Claims (1)

    【特許請求の範囲】
  1. 入力された音声信号の音響・クラメータを抽出する手段
    と、この抽出された音響・クラメータの定常ノQターン
    を検出し、この定常・9ターンと上記音響パラメータと
    の類似度から子音候補区間と母音候補区間とを分離する
    手段と、この区間分離に用いた音響ノクラメータとは異
    なる種類の音響・ぐラメータから前記母音候補区間にお
    ける母音定常パターンを検出する手段と、この検出され
    た母音定常パターンと母音辞書・ヤターンとの類似度か
    ら前記音声信号の音韻を認識する手段とを具備したこと
    を特徴とする音声認識装置。
JP18325681A 1981-11-16 1981-11-16 音声認識装置 Pending JPS5885495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18325681A JPS5885495A (ja) 1981-11-16 1981-11-16 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18325681A JPS5885495A (ja) 1981-11-16 1981-11-16 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5885495A true JPS5885495A (ja) 1983-05-21

Family

ID=16132480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18325681A Pending JPS5885495A (ja) 1981-11-16 1981-11-16 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5885495A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62119600A (ja) * 1985-11-20 1987-05-30 富士通株式会社 単語音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62119600A (ja) * 1985-11-20 1987-05-30 富士通株式会社 単語音声認識装置

Similar Documents

Publication Publication Date Title
EP0237934B1 (en) Speech recognition system
JPH0352640B2 (ja)
JPS5972496A (ja) 単音識別装置
JPS6138479B2 (ja)
EP0109140B1 (en) Recognition of continuous speech
KR100391123B1 (ko) 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
JPS5939760B2 (ja) 音声認識装置
JPS5885495A (ja) 音声認識装置
JPS58108590A (ja) 音声認識装置
JPS5936759B2 (ja) 音声認識方法
JPH045198B2 (ja)
JPH0682275B2 (ja) 音声認識装置
JPH10340096A (ja) 音声認識装置
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPH0554678B2 (ja)
Heinrich Speech identification using a sequence-based heuristic
JPS5936300A (ja) 音声認識装置
KASUYA et al. Automatic Detection of Vowel Centers from Continuous Speech
JPH0114600B2 (ja)
JPS60138599A (ja) 音声区間検出装置
JPS62191900A (ja) 無声破裂子音識別方式
JPH026079B2 (ja)
JPH0316039B2 (ja)
JPS63257797A (ja) 音声始端検出装置
JPH02278295A (ja) 音声パターン登録方式及び音声認識装置