JPS61122699A - 単音節音声認識方式 - Google Patents

単音節音声認識方式

Info

Publication number
JPS61122699A
JPS61122699A JP59243988A JP24398884A JPS61122699A JP S61122699 A JPS61122699 A JP S61122699A JP 59243988 A JP59243988 A JP 59243988A JP 24398884 A JP24398884 A JP 24398884A JP S61122699 A JPS61122699 A JP S61122699A
Authority
JP
Japan
Prior art keywords
vowel
speech
section
monosyllabic
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59243988A
Other languages
English (en)
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59243988A priority Critical patent/JPS61122699A/ja
Publication of JPS61122699A publication Critical patent/JPS61122699A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は6音声認識装置に関するものであり。
特に入力音声から母音部を高精度で抽出する手段をそな
えた単音節音声認識方式に関する。
〔従来の技術〕
従来の単音節音声認識装置では、認識精度と認識速度を
高める1つの手段として、単音節音声中で比較的認識が
容易な母音部を先に認識しておき。
候補となる子音の範囲を絞る方式がとられている。
たとえば、未知入力単音節音声が母音a、t。
u、e、oのうちの“a”を含んでいることが判れば、
候補単音節音声は+ Ka + Sa + Ta + 
Na +・・・・・・、の段の範囲に絞ることが可能で
ある。このように、母音部を用いて、登録されている単
音節音声を大分けして認識処理を行えば、全体の照合回
数を減少させることができると同時に、あいまいさを小
さくすることができる。
ところで上記の方式をとるためには、単音節音声から母
音部の情報のみを抽出する必要があり。
従来は、音声バタン中でパワーが大きくて時間変化の少
ない安定な点(安定点という)を探し、そのパラメータ
を用いるのが一般的であった。たとえば第2図に示す音
声バタンの例では、安定点として■点のフレームが見出
されるので、このパラメータが用いられる。なお9図中
のSは始端、eは終端を示す。
しかし、子音部のパワーが比較的大きい拗音節音声など
の場合には、安定点が必ずしも母音部にはなく、子音部
あるいは子音部から母音部への渡りの部分に見出される
場合があった。たとえば” Kya″は“K−y−a”
に分解されるが、“y”のパワーが大きい場合があるた
め、安定点は第3図に■で示すように、母音部“a”の
区間内ではなく、“y“の区間に求められてしまい、そ
の結果、“y″のバタンと“i”のバタンか似ているこ
とから、母音を“i”と判定してしまうことがあった。
〔発明が解決しようとする問題点〕
へ このように、従来方式では母音部のパラメータ抽出で誤
りが生じる可能性があり、その場合には候補単音節音声
群の中から正しい単音節音声が全く除かれてしまうため
、誤認識あるいは認識不能となる問題があった。本発明
はこの点を解決できる手段を提供しようとするものであ
る。
〔問題点を解決するための手段〕
本発明は、上記の問題点を解決するため、音声バタン中
の安定点のみから母音部のパラメータを抽出するのでは
なく、単音節音声の母音部が主に音声パタンの後半にあ
ることに着目して、音声バタン中で変化の少ない安定点
に続く後の区間のパラメータを対象にするものである。
安定点は母音により生じるから、この安定点以降の区間
のパラメータを平均化することにより、拗音節音声の場
合にも、真の母音部の情報が支配的なパラメータを得る
ことができ、候補単音節音声群の選出精度を向上させる
ことができる。
本発明の構成はそれにより、予め各単音節についての音
声を登録し、該登録された単音節音声と未知入力単音節
音声とを照合するに際し、まず登    録された単音
節音声の母音部のパラメータと未知入力単音節音声の母
音部のパラメータ距離により。
登録された単音節音声の中から候補単音節音声を絞り、
該絞られた候補単音節音声と未知入力単音節音声とを照
合するようにした単音節音声認識装置において、上記照
合に用いる母音部のパラメータを、変化の少ない定常部
以降の所定の区間のバタンの平均とすることを特徴とし
ている。
〔発明の作用〕
第4図および第5図は9本発明に基づく母音パラメータ
の作成過程を説明するための図である。
なお第4図は第2図に、そして第5図は第3図に対比的
に示しである。第4図の例では、第2図に示す従来例の
安定点■と同様に+  jlおよび12間に変化の小さ
い定常部が検出される。そこでこの定常部(t+、tz
)から一定の区間を設定し。
図ではtlからt3までの区間を母音部パラメータ抽出
区間として選択し、その中の各フレームのパラメータを
平均して母音パラメータを作成する。
なお、この場合、定常点から、終端までの平均としても
良い。同様に第5図の例では、定常部(1+”、tz′
)が求められるので、この後の一定区間tl′からt3
′までを母音部パラメータ抽出区間として選択し、この
中の各フレームのパラメータを平均して母音パラメータ
を作成する。それぞれ第2図および第3図の従来例と比
較すれば明らかなように、母音部パラメータ抽出区間が
定常部から後方に拡がりをもってとられているので、母
音部のより確実な抽出が可能となる。
〔実施例〕
以下に9本発明の詳細を実施例にしたがって説明する。
第1図は本発明の1実施例装置の構成図である。
図において、1は前処理部、2は音声区間検出部。
3はパラメータ抽出部、4は定常部抽出部、5は母音部
パラメータ計算部、6および7は切替部。
8は母音部パラメータ登録部、9は子音部音声バタン登
録部、10は候補削減部、11はDP照合部、12は判
定部を示す。次にこれら各要素の機能および動作の概要
について述べる。
前処理部1は、入力された音声信号を増幅し高域強調な
どの前処理を行う。
音声区間検出部2は、所定の闇値を用いて音声信号の始
端と終端を検出し、音声区間を弁別して音声区間情報と
ともにパラメータ抽出部3に送る。
パラメータ抽出部3は、音声区間内の音声信号をフレー
ムに分解し、パラメータ化する。パラメータは、たとえ
ば16チヤネルの帯域通過フィルタBPFを用いて音声
信号を分波し、それぞれのチャネルの出力信号レベルを
A/Dコンバータによリディジタル信号に変換したもの
を組合わせたちのである。音声パタンは、連続するフレ
ームとパラメータで表される。
定常部抽出部4は、音声バタン中の変化の少ない部分、
すなわち定常部(安定点に対応する)を検出する。検出
は、連続するフレーム間のパラメータを比較し、変化の
少ないフレーム区間が一定長以上続く部分を探すことに
よって行う。
母音部パラメータ計算部5は、検出された定常へ 部に続く一定区間、すなわち第4図および第5図で説明
した母音部パラメータ抽出区間のフレームのパラメータ
を平均し、母音部パラメータを作成する。母音部パラメ
ータ抽出区間は、使用に際して最適の長さに設定される
切替部6および7は、辞書作成時に入力をa側に接続し
、認識処理時に入力をb側に接続する。
母音部パラメータ登録部8は1つの辞書メモリであり、
予め標準となる各単音節音声パタンから作成された母音
部パラメータを記憶している。
子音部音声バタン登録部9も1つの辞書メモリであり、
予め標準となる単音節音声パタンの始端から定常部まで
の、主に子音情報を含む区間の部分音声パタンを記憶し
ている。第4図および第5図の例では区間(s、 t+
)および区間(altl”)の音声パタンに相当する。
候補削減部10は、認識処理時に未知入力音声バタンか
ら作成された母音部パラメータを、母音部パラメータ登
録部8に記憶されている標準の母音部パラメータと照合
し、母音の種別を識別し。
母音情報としてDP照合部11に通知する。
DP照合部11は、認識処理時に、切替部7から送られ
た未知入力音声バタン中の始端から定常部までの部分音
声パ7ン乞子音部音声バタン登録部9から読み出した標
準の単音節音声パタンの対応する部分音声パタンとを照
合し、DP法による距離計算を行う。そしてその際、候
補削減部10から通知された母音情報を用いて、子音部
音声バタン登録部9から読み出す標準の部分音声パタン
を絞り、候補を削減する。
判定部12は、DP照合部11で計算された各候補音声
パタンごとの距離値に基づいて類似度の最も高い標準音
声パタンを決定し、認識結果として出力する。
〔発明の効果〕
本発明によれば、音声バタン中の定常部(あるいは安定
点)以降の一定区間のパラメータが母音部パラメータ作
成の際の要素に含められるため。
母音部パラメータが実際の母音区間の情報と正しく対応
するようになり、母音認識の誤りを減少させることがで
き、認識情報を高めることができる。
【図面の簡単な説明】
第1図は本発明の1実施例装置の構成図、第2図および
第3図は従来の母音部パラメータ抽出方法の説明図、第
4図および第5図は本発明に基づ(母音部パラメータ作
成方法の説明図である。 図中、1は前処理部、2は音声区間検出部、3はパラメ
ータ抽出部、4は定常部抽出部、5は母音部パラメータ
計算部、6.7は切替部、8は母音部パラメータ登録部
、9は子音部音声バタン登録部、10は候補削減部、1
1はDP照合部、12は判定部を示す。

Claims (1)

    【特許請求の範囲】
  1. 予め各単音節についての音声を登録し、該登録された単
    音節音声と未知入力単音節音声とを照合するに際し、ま
    ず登録された単音節音声の母音部のパラメータと未知入
    力単音節音声の母音部のパラメータ距離により、登録さ
    れた単音節音声の中から候補単音節音声を絞り、該絞ら
    れた候補単音節音声と未知入力単音節音声とを照合する
    ようにした単音節音声認識装置において、上記照合に用
    いる母音部のパラメータを、変化の少ない定常部以降の
    所定の区間のパタンの平均とすることを特徴とする単音
    節音声認識方式。
JP59243988A 1984-11-19 1984-11-19 単音節音声認識方式 Pending JPS61122699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59243988A JPS61122699A (ja) 1984-11-19 1984-11-19 単音節音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59243988A JPS61122699A (ja) 1984-11-19 1984-11-19 単音節音声認識方式

Publications (1)

Publication Number Publication Date
JPS61122699A true JPS61122699A (ja) 1986-06-10

Family

ID=17112036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59243988A Pending JPS61122699A (ja) 1984-11-19 1984-11-19 単音節音声認識方式

Country Status (1)

Country Link
JP (1) JPS61122699A (ja)

Similar Documents

Publication Publication Date Title
EP0109140B1 (en) Recognition of continuous speech
JPS61122699A (ja) 単音節音声認識方式
JPH0585917B2 (ja)
JP2655637B2 (ja) 音声パターン照合方式
JPS6312000A (ja) 音声認識装置
JPS6027000A (ja) パタンマツチング方法
KR950009328B1 (ko) 단음절단위의 음성인식방법
JPS6250800A (ja) 音声認識装置
JPS63173100A (ja) キ−ワ−ド抽出装置
JPS59125800A (ja) 音声認識装置
JPS6167899A (ja) 音声認識装置
JPH01158499A (ja) 定常雑音除去方式
JPH0695684A (ja) 音声認識システム
JPS59124394A (ja) 単音節音声認識方式
JPS63131196A (ja) 鼻子音識別装置
JPS6352200A (ja) 音声認識装置
JPS6147994A (ja) 音声認識方式
JPS61252595A (ja) 音声認識処理方式
Yanagida et al. Detection and Identification of Plosive Sounds in Japanese Words
JPS62166400A (ja) 音声ワ−ドプロセツサ装置
JPS63223698A (ja) 単音節音声認識装置
JPS63259600A (ja) 連続音声認識方式
JPS63223694A (ja) 単音節登録・認識方式
JPH067359B2 (ja) 音声認識装置
JPS62218997A (ja) 単語音声認識装置