JPS62280800A - 破裂子音識別方式 - Google Patents
破裂子音識別方式Info
- Publication number
- JPS62280800A JPS62280800A JP61124827A JP12482786A JPS62280800A JP S62280800 A JPS62280800 A JP S62280800A JP 61124827 A JP61124827 A JP 61124827A JP 12482786 A JP12482786 A JP 12482786A JP S62280800 A JPS62280800 A JP S62280800A
- Authority
- JP
- Japan
- Prior art keywords
- plosive
- point
- spectrum
- analysis
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000001228 spectrum Methods 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000010183 spectrum analysis Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 101100340271 Caenorhabditis elegans ida-1 gene Proteins 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
3、発明の詳細な説明
〔概要〕
本発明は、臂声破裂子音相互及び無声破裂子音間相互を
識別する方式において、安定かつ確実に各々の子音の特
徴を捉えるため、音声分析により得られるとなりあう分
析フレーム間のケプストラム距離を演算し、スペクトル
変化の大きい時点即ち最もその子音の特徴が包含されて
いると考えられる時点を検出し、その時点における特徴
パラメータを抽出することにより、破裂子音の%aをに
定に捉えることが可能となり、高い識別率でM声働無声
破裂子音間相互ヲ識別でさるようにしたものである。
識別する方式において、安定かつ確実に各々の子音の特
徴を捉えるため、音声分析により得られるとなりあう分
析フレーム間のケプストラム距離を演算し、スペクトル
変化の大きい時点即ち最もその子音の特徴が包含されて
いると考えられる時点を検出し、その時点における特徴
パラメータを抽出することにより、破裂子音の%aをに
定に捉えることが可能となり、高い識別率でM声働無声
破裂子音間相互ヲ識別でさるようにしたものである。
本発明は、音声認識装置特に有声/無声破裂子音間相互
を識別する方式に関する。音声認識装置特に単音節認識
袋*は基本的に68個の単音節で丁ぺての日本語語量t
l−構底できることから、キーボード入力のかわりとし
て文章入力に用いることができ、音声ワードプロセッサ
として現在実用化がはかられている。しかし、単音節認
識においては、語頭の子音部の特徴の違いが大きな比重
をしめており、従来から単語認識で用いられている音声
分析方法ではその特徴を捉えきれず、認識藁が低いとい
う問題があり、実用化にはさらに多くの技術的!!題の
克服が要求されている。この中でも特に発声機構が非零
に似ている子音肝門相互の識別は雌しく、その高精度な
識別方式の確立が必要とされている。
を識別する方式に関する。音声認識装置特に単音節認識
袋*は基本的に68個の単音節で丁ぺての日本語語量t
l−構底できることから、キーボード入力のかわりとし
て文章入力に用いることができ、音声ワードプロセッサ
として現在実用化がはかられている。しかし、単音節認
識においては、語頭の子音部の特徴の違いが大きな比重
をしめており、従来から単語認識で用いられている音声
分析方法ではその特徴を捉えきれず、認識藁が低いとい
う問題があり、実用化にはさらに多くの技術的!!題の
克服が要求されている。この中でも特に発声機構が非零
に似ている子音肝門相互の識別は雌しく、その高精度な
識別方式の確立が必要とされている。
従来の破裂子音識別方式としては、破裂時点直後の破裂
部スペクトルを特徴量として用いる方式や、破裂時点か
ら後続母音方向におけるスペクトル時系列を用いる方式
がある。
部スペクトルを特徴量として用いる方式や、破裂時点か
ら後続母音方向におけるスペクトル時系列を用いる方式
がある。
■ 破裂時点直後の破裂部スペクトルを用いる場合の構
成を第4図に示す。
成を第4図に示す。
図中、21はマイクロホン、22はA/D変換器、23
#″IA/Dデータメモリ、24は破裂時点検出部、2
5は周波数分析部、26は照合部、27は辞書メモリで
ある。
#″IA/Dデータメモリ、24は破裂時点検出部、2
5は周波数分析部、26は照合部、27は辞書メモリで
ある。
この方式は、破裂時点直後の破裂部スペクトルに識別に
有効な情報が存在するという考え万に基ライており、破
裂部近傍の1フレームのスペクトルを識別パラメータと
して破裂子音間相互の識別を行っている。
有効な情報が存在するという考え万に基ライており、破
裂部近傍の1フレームのスペクトルを識別パラメータと
して破裂子音間相互の識別を行っている。
■ 破裂時点から後続母音方向におけるスペクトル時系
列を用いる方式の構成に基本的には第4図と同じである
が、25の周波数分析部では複数のスペクトル即ち時系
列情報が求まり、辞書メモ:J27には各子音のカテゴ
リ毎にスペクト/I/時系列が格納されることになる。
列を用いる方式の構成に基本的には第4図と同じである
が、25の周波数分析部では複数のスペクトル即ち時系
列情報が求まり、辞書メモ:J27には各子音のカテゴ
リ毎にスペクト/I/時系列が格納されることになる。
この方式では破裂時点から後続母音側への過渡領域(時
間変化)にも破裂子音間相互を識別する特徴が存在する
という考え方に基づいている。
間変化)にも破裂子音間相互を識別する特徴が存在する
という考え方に基づいている。
従来の有声/無声被装子音識別方式では、その識別パラ
メータとして、■破裂部近傍の17レームの破裂部スペ
クトルを用いるものや、■破裂時点から後続する母音へ
の過渡部特徴をスペクトル時系列で捉えて用いるものが
多い。
メータとして、■破裂部近傍の17レームの破裂部スペ
クトルを用いるものや、■破裂時点から後続する母音へ
の過渡部特徴をスペクトル時系列で捉えて用いるものが
多い。
■では、破裂時点直後の破裂部のスペクトル形状に無声
破裂子音の特徴が存在するという立場から用いられてい
る識別パラメータであるが、静的な特徴であるとともに
、母音と異なり、基本的には雑音に近い破裂音を安定に
抽出することは困難であり、従って識別率も低い。
破裂子音の特徴が存在するという立場から用いられてい
る識別パラメータであるが、静的な特徴であるとともに
、母音と異なり、基本的には雑音に近い破裂音を安定に
抽出することは困難であり、従って識別率も低い。
■では、破裂時点のスペクトルの他に後続母音への過渡
領域のスペクトルを付は加えたスペクトル時系列の形の
識別パラメータを用いる。しかし、一般的には破裂時点
、から母音側にある一定の分析周期で音声分析がなされ
るだけであり、各発声毎に変動すると考えられる破裂時
点から母音の立上りまでの時間(分析対象区間内に後続
する母音がどの程度含まれるか〕等の変動の影響を強く
受け、安定した分析結果が得られないという問題がある
〇〔問題点を解決するための手段〕 第1図は本発明の破裂子音識別方式の原理ブロック図で
ある。図中、1はマイクロホン、2はA/D変換器、3
はA/Dデータメモリ、4は音声分析部、5け特徴佃出
部、6はケグストラム距離演算回路、7はスペクトル変
化点検出回路、8はスペクトル分析回路、9は照合回路
、10は辞書メモリである。本発明ではマイクロホン1
から入力、変換され九破裂音音声信号に関して、ケプス
トラム分析を行い、となりあう分析フレーム間のケプス
トラム距離を演算し、その値に基づいてスペクトル変化
点を検出し、その各時点においてスペクトル分析回路8
VCおいてスペクトル形状め、そAを識別パラメータ
としてg誠を行う。
領域のスペクトルを付は加えたスペクトル時系列の形の
識別パラメータを用いる。しかし、一般的には破裂時点
、から母音側にある一定の分析周期で音声分析がなされ
るだけであり、各発声毎に変動すると考えられる破裂時
点から母音の立上りまでの時間(分析対象区間内に後続
する母音がどの程度含まれるか〕等の変動の影響を強く
受け、安定した分析結果が得られないという問題がある
〇〔問題点を解決するための手段〕 第1図は本発明の破裂子音識別方式の原理ブロック図で
ある。図中、1はマイクロホン、2はA/D変換器、3
はA/Dデータメモリ、4は音声分析部、5け特徴佃出
部、6はケグストラム距離演算回路、7はスペクトル変
化点検出回路、8はスペクトル分析回路、9は照合回路
、10は辞書メモリである。本発明ではマイクロホン1
から入力、変換され九破裂音音声信号に関して、ケプス
トラム分析を行い、となりあう分析フレーム間のケプス
トラム距離を演算し、その値に基づいてスペクトル変化
点を検出し、その各時点においてスペクトル分析回路8
VCおいてスペクトル形状め、そAを識別パラメータ
としてg誠を行う。
本発明の音声分析部4は、入力された音声信号をフレー
ム単位でケプストラム分析する。またスペクトル変化点
抽出回路7は前記フレーム間のケプストラム距離を演算
し、スペクトル変化の急峻な時点即ち、最も子音の特徴
を包含している時点を検出する。この検出された時点で
のスペクトルを識別パラメータとして抽出する。この結
果、安定して確実な特徴を捉えることが可能となる。
ム単位でケプストラム分析する。またスペクトル変化点
抽出回路7は前記フレーム間のケプストラム距離を演算
し、スペクトル変化の急峻な時点即ち、最も子音の特徴
を包含している時点を検出する。この検出された時点で
のスペクトルを識別パラメータとして抽出する。この結
果、安定して確実な特徴を捉えることが可能となる。
第2図は本発明の一実施例による破裂子音識別装置の構
成図である。
成図である。
図中、1はマイクロホン、2flA/111器、3はA
/Dデータメモリ、4は音声分析部、5は特徴抽出部、
6はケプストラム距離演算回路、7はスペクトル変化点
検出回路、8はスペクトル分析回路、9は照合回路、1
0は辞書メモリ、11は窓処理回路、12はケグストラ
ム分析回路、13はF’F’T演算回路、14は対数パ
ワースペクトル演算回路、15は逆FFT演算回路、1
6はケプストラム時系列メモリである。
/Dデータメモリ、4は音声分析部、5は特徴抽出部、
6はケプストラム距離演算回路、7はスペクトル変化点
検出回路、8はスペクトル分析回路、9は照合回路、1
0は辞書メモリ、11は窓処理回路、12はケグストラ
ム分析回路、13はF’F’T演算回路、14は対数パ
ワースペクトル演算回路、15は逆FFT演算回路、1
6はケプストラム時系列メモリである。
図中、マイクロホン1から入力された離散単音節(破裂
音)は2のA/D変換器によりアナログ/ディジタル変
換され、3のA/Dデータメモリに格納される。
音)は2のA/D変換器によりアナログ/ディジタル変
換され、3のA/Dデータメモリに格納される。
3のメモリ内に格納された音声信号系列の先頭から一定
の分析周期でケグストラム分析回路う。
の分析周期でケグストラム分析回路う。
この処理はケグストラム分析回路12で行なわれる。
音声信号系列の先頭からある一定の分析周期で分析窓全
シフトさせ、11の窓処理回路において窓処理を行い、
次に13のFFTfi、u回路にてFFTによる周波数
分析全行う。そして14の対数パワースペクトル演算回
路にて13で寿られたスペクトルを対数パワースペクト
ル化し、さらにその対数パワースペクトルを15の逆F
FT演冥回路にて逆FFT処理してFFTケブストラム
ヲ得る。得られたFFTケプストラム時系列は16のケ
プストラム時系列メモリに一時格納される。
シフトさせ、11の窓処理回路において窓処理を行い、
次に13のFFTfi、u回路にてFFTによる周波数
分析全行う。そして14の対数パワースペクトル演算回
路にて13で寿られたスペクトルを対数パワースペクト
ル化し、さらにその対数パワースペクトルを15の逆F
FT演冥回路にて逆FFT処理してFFTケブストラム
ヲ得る。得られたFFTケプストラム時系列は16のケ
プストラム時系列メモリに一時格納される。
次に、このケプストラム時系列を対象に、となりあう分
析フレーム間のケプストラム距離を演算する。これは6
のケプストラム距離演算回路にて行なわれる。
析フレーム間のケプストラム距離を演算する。これは6
のケプストラム距離演算回路にて行なわれる。
ここでケプストラム距離は次式で定義する。
・ CtHtフレーム目、i次元目のケグストラム係数
である。
である。
・ ケプストラム係数は低ケフレンシ側n個(CI−C
n )を用いるものとする0(1)式の定義に基づいて
、となりあうフレーム間のケプストラム距離を各々計算
する。その結果得られた系列をDとすると、次式が求め
られるOD ” dt r ds r ds + −−
dm第3図にケプストラム距離系列の一例を示す0次に
、このケプストラム距離を基にスペクトル変化の大きい
時点を検出する。
n )を用いるものとする0(1)式の定義に基づいて
、となりあうフレーム間のケプストラム距離を各々計算
する。その結果得られた系列をDとすると、次式が求め
られるOD ” dt r ds r ds + −−
dm第3図にケプストラム距離系列の一例を示す0次に
、このケプストラム距離を基にスペクトル変化の大きい
時点を検出する。
一般に、ケプストラム距離が大きい時点は被装時点付近
及び母音立上り付近であり、第3図のA。
及び母音立上り付近であり、第3図のA。
B点の様に顕著なピークを持つ0この時点は知覚上重要
なポイントであるという笑我結果が得られている。
なポイントであるという笑我結果が得られている。
スペクトル変化点検出回路7では、ケプストラム距離が
最大となるピーク点及び次に大きいピーク点を検出する
。
最大となるピーク点及び次に大きいピーク点を検出する
。
次に、スペクトル分析回路8では、7で得られたスペク
トル変化の大きい2つの時点において周波数分析を行い
、スペクトルを得る。ここで、得られたスペクトル’I
: ’+ * h とする。
トル変化の大きい2つの時点において周波数分析を行い
、スペクトルを得る。ここで、得られたスペクトル’I
: ’+ * h とする。
9の照合回路では、予め標準パターンとして辞書メモリ
VC格納されている各子音のデータとのパターン間距離
を演算し、距離最小のカテゴリを識別結果とする。
VC格納されている各子音のデータとのパターン間距離
を演算し、距離最小のカテゴリを識別結果とする。
本発明によれば、知覚上最も重要である2つの時点即ち
破裂時点及び母音の立上夛時点における特徴パラメータ
を安定かつ確実に抽出することができ、この結果有声/
無声破裂子音内相互の識別を高率で行うことが可能とな
る。
破裂時点及び母音の立上夛時点における特徴パラメータ
を安定かつ確実に抽出することができ、この結果有声/
無声破裂子音内相互の識別を高率で行うことが可能とな
る。
第1図は本発明の原理図、
第2因は不発明の一実施例の構成図、
第3図はケグヌトラム距離系列の一例を示す図、第4図
は従来技術を説明するブロック図である。 図中、1はマイクロホン、2はA/D変換器、3はA/
Dデータメモリ、4は音声分析部、5は特徴抽出部、6
はケグストラム距離演算回路、7はスペクトル変化点検
出回路、8はスペクトル分析回路、9は照合回路、1o
は辞書メモリである。 不繁朗の斥理国 簿1(!3 音チ値形 註 ケアストラム距難系列の一イダ1 21 22 23 24
25 ム2′7
は従来技術を説明するブロック図である。 図中、1はマイクロホン、2はA/D変換器、3はA/
Dデータメモリ、4は音声分析部、5は特徴抽出部、6
はケグストラム距離演算回路、7はスペクトル変化点検
出回路、8はスペクトル分析回路、9は照合回路、1o
は辞書メモリである。 不繁朗の斥理国 簿1(!3 音チ値形 註 ケアストラム距難系列の一イダ1 21 22 23 24
25 ム2′7
Claims (1)
- 【特許請求の範囲】 音声分析部(4)と特徴抽出部(5)を含み、有声破裂
子音間相互および無声破裂子音間相互を識別する破裂子
音識別装置において、 上記音声分析部(4)に、隣り合う分析フレーム間のケ
プストラム距離を演算するケプストラム距離演算回路(
6)を設け、 上記特徴抽出部(5)に、上記ケプストラム距離演算回
路(6)にて得られたケプストラム距離を基にスペクト
ル変化が大きい時点を検出するスペクトル変化点検出回
路(7)を設け、 該スペクトル変化点検出回路(7)で検出された時点で
の特徴パラメータを抽出し、該抽出された特徴パラメー
タを基に識別処理を行なうように構成したことを特徴と
する破裂子音識別方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61124827A JPS62280800A (ja) | 1986-05-30 | 1986-05-30 | 破裂子音識別方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61124827A JPS62280800A (ja) | 1986-05-30 | 1986-05-30 | 破裂子音識別方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62280800A true JPS62280800A (ja) | 1987-12-05 |
Family
ID=14895083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61124827A Pending JPS62280800A (ja) | 1986-05-30 | 1986-05-30 | 破裂子音識別方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62280800A (ja) |
-
1986
- 1986-05-30 JP JP61124827A patent/JPS62280800A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6553342B1 (en) | Tone based speech recognition | |
Rahman et al. | Continuous bangla speech segmentation using short-term speech features extraction approaches | |
van Santen et al. | High-accuracy automatic segmentation. | |
Sakran et al. | A review: Automatic speech segmentation | |
Zolnay et al. | Extraction methods of voicing feature for robust speech recognition. | |
JPS6138479B2 (ja) | ||
Hasija et al. | Recognition of children Punjabi speech using tonal non-tonal classifier | |
JPS5972500A (ja) | 音声認識方式 | |
JPS62280800A (ja) | 破裂子音識別方式 | |
Sharma | Implementation of ZCR and STE techniques for the detection of the voiced and unvoiced signals in Continuous Punjabi Speech | |
JPS63161499A (ja) | 音声認識装置 | |
JPS63217399A (ja) | 音声区間検出装置 | |
JP3049711B2 (ja) | 音声処理装置 | |
JPS63131196A (ja) | 鼻子音識別装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JPH0254560B2 (ja) | ||
JPS63191199A (ja) | 有声破裂子音識別装置 | |
JPS6225796A (ja) | 音声認識装置 | |
KI et al. | Automatic Spotting of Plosives and Fricatives from Speech signals | |
JPS62191900A (ja) | 無声破裂子音識別方式 | |
JPS61180300A (ja) | 音声認識装置 | |
CN115019775A (zh) | 一种基于音素的语种区分性特征的语种识别方法 | |
JPS6011898A (ja) | 音声認識装置 | |
JPS6033599A (ja) | 音声認識装置 | |
JPH045699A (ja) | 鼻音区間検出方式 |