JPH0682278B2 - 有声破裂子音識別方式 - Google Patents

有声破裂子音識別方式

Info

Publication number
JPH0682278B2
JPH0682278B2 JP60250542A JP25054285A JPH0682278B2 JP H0682278 B2 JPH0682278 B2 JP H0682278B2 JP 60250542 A JP60250542 A JP 60250542A JP 25054285 A JP25054285 A JP 25054285A JP H0682278 B2 JPH0682278 B2 JP H0682278B2
Authority
JP
Japan
Prior art keywords
time
vowel
point
spectrum
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60250542A
Other languages
English (en)
Other versions
JPS62111294A (ja
Inventor
敦仁 小林
泰弘 奈良
均 岩見田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60250542A priority Critical patent/JPH0682278B2/ja
Publication of JPS62111294A publication Critical patent/JPS62111294A/ja
Publication of JPH0682278B2 publication Critical patent/JPH0682278B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 有声破裂子音を識別する有声破裂子音識別方式におい
て、破裂時点検出部と、検出された破裂時点から母音部
に至るパワー系列を演算するパワー演算部と、母音立上
り点検出部と、検出された母音立上り点と破裂時点とか
ら立ち上がり時間特性を検出する立上り時間特性検出部
と、検出された立上り時間特性に基づいて破裂時点から
母音部に至る過渡部スペクトルの時系列を抽出し有声破
裂子音を判定する判定部とを備え、判定された結果を出
力するようにしている。
〔産業上の利用分野〕
本発明は、破裂時点から母音部に至るパワーの立上り時
間特性を基に時間正視化した時間情報を算出し、この算
出した時間情報に基づいて破裂時点から母音部に至る過
渡部のスペクトルを抽出し、かつ時間情報によって重み
づけを行うことによって有声破裂子音を識別する有声破
裂子音識別方式に関するものである。
〔従来の技術と発明が解決しようとする問題点〕
従来の有声破裂子音識別方式として、破裂時点での破裂
部スペクトルを特徴量として用いる方式や、ホルマント
ローカスを特徴量として用いる方式などが代表的であ
り、この他にも種々の識別パラメータを用いた方式が提
案されている。
前者は、破裂部の静的なスペクトル中に識別に有効な情
報が存在するという考え方に基づいてるが、識別能力と
いう点からは多少落ちる。後者は、ホルマントローカス
と呼ばれる破裂時点での第2、第3ホルマントの遷移開
始周波数を特徴量とするものであるが、各ホルマント周
波数の軌跡を求める必要があり、技術的な困難さは前者
に比べてかなり大きい。また、上記方式以外にも、破裂
部から後続する母音への過渡部の動的な特徴を用いる方
式などもある。しかし、いずれの方式においても、現像
変化の速い有声破裂子音(ば行、だ行およびが行の子
音)の特徴を確実に捉えるのは、難しいという問題点が
あった。
〔問題点を解決するための手段〕
本発明は、前記問題点を解決するために、破裂時点から
母音部に至るパワーの立上り時間特性を基に時間正視化
した時間情報を算出し、この算出した時間情報に基づい
て破裂時点から母音部に至る過渡部のスペクトルを抽出
し、かつ時間情報によって重みづけを行うことによって
有声破裂子音を識別する構成を採用することにより、高
い認識率で有声破裂子音を識別している。
第1図に示す本発明の実施例構成を用いて問題点を解決
するための手段を説明する。
第1図において、破裂時点検出部4は、入力された有声
破裂子音の破裂時点を検出するものである。
パワー演算部5は、破裂時点検出部4によって検出され
た破裂時点から母音部に至るパワー系列を演算して算出
するものである。
母音立上り点検出部7は、パワー演算部5によって演算
されたパワー系列から母音の立ち上がり点を検出するも
のである。
立上り時間特性検出部8は、母音立上り点検出部7によ
って検出された点と、破裂時点とを例えば直線を用いて
結んだ立上り時間特性を算出するものである。
分析位置指示部9は、立上り時間特性検出部8によって
算出された例えば検出された点と、破裂時点とを直線を
用いて結んだ立上り時間特性曲線を、等間隔に分割した
位置(分析位置)を指示するものである。
スペクトル分析部10は、分析位置指示部9から通知され
た分析位置を例えば始点として所定幅(時間幅)内のス
ペクトルを分析するものである。
距離演算部12は、スペクトル分析部10によって分析した
スペクトルと、予め分析して登録しておいた辞書メモリ
11から読み出したスペクトルとに基づいて、所定の距離
dを算出(後述する)するものである。この際、分析位
置指示部9によって指示された分析位置情報に基づい
て、前記所定の距離に対して夫々重みづけ(後述する)
を行う。
判定部14は、距離演算部12によって演算された距離dに
基づいて、有声破裂子音であるか否かを判定するもので
ある。
〔作用〕
第1図を用いて説明した構成を採用し、音声入力を破裂
時点検出部4に入力すると、破裂時点Bが検出される。
次いで、パワー演算部5によって、当該破裂時点から母
音部に至る過渡部のパワー系列が演算される。このパワ
ー系列の通知を受けた母音立上り点検出部7は、当該パ
ワー系列からパワーがほぼ一定値となる母音定常点Sを
検出し、立上り時間特性検出部8に通知する。この通知
を受けた立上り時間特性検出部8は、前記母音定常点S
から所定レベル値Lだけ小さいパワー系列上の点Tを求
め、前記破裂時点Bとこの点Tとを例えば直線を用いて
結んだ立上り時間特性曲線を算出する。分析位置指示部
9は、前記立上り特性曲線を例えば等分割した点を求
め、この点を分析位置として、スペクトル分析部10に通
知する。この通知を受けたスペクトル分析部10は、当該
通知を受けた分析位置を例えば始点として所定時間幅内
のスペクトルを分析して距離演算部12に通知する。通知
を受けた距離演算部12は、後述するようにして、スペク
トル分析部10によって分析されたスペクトルと、予め辞
書メモリ11に登録しておいたスペクトルとから所定の距
離dを演算して算出する。この際、分析位置指示部9に
よって指示された分析位置の情報(時間情報)は、当該
距離dを算出するのに重みづけに利用される。そして、
この算出された距離は、判定部14に通知され、有声破裂
子音であるか否かが判定される。
以上説明したように、有声破裂子音の破裂時点から母音
部に至る過渡部でのパワー時系列を用いて、時間正視化
した態様の分析位置情報を算出し、この算出した分析位
置でのスペクトルを検出すると共に、当該分析位置情報
(時間情報)の重みづけを行った距離dを算出し、この
距離dから有声破裂子音であるか否かを判定しているた
め、高い認識率で有声破裂子音を識別することが可能と
なる。
〔実施例〕
第1図は本発明の1実施例構成、第2図ないし第5図は
第1図図示構成の動作を説明するものを夫々示す。図
中、1はマイク、2はA/D変換器、3は音声メモリ、4
は破裂時点検出部、5はパワー演算部、6はパワー系列
メモリ、7は母音立上り点検出部、8は立上り時間特性
検出部、9は分析位置指示部、10はスペクトル分析部、
11は辞書メモリ、12は距離演算部、13は重み付け部、14
は判定部を表す。
第1図において、音声例えば特定話者が離散短音節とし
て発音した有声破裂子音(ば行、だ行およびが行音)を
マイク1に入力すると、この入力された音声入力はアナ
ログの電気信号に変換される。この電気信号に変換され
たアナログ信号は、A/D変換器2によってデジタル信号
に変換され、破裂時点検出部4に通知されると共に、音
声メモリ3に格納される。以下第2図ないし第5図を用
いて動作を順次詳細に説明する。
第1に、破裂時点の検出。
破裂時点は、破裂時点検出部4によって行われ、音声信
号の急峻な変化時点として検出したり、あるいはスペク
トル上で低い周波数帯域が優勢な状態から高い周波数帯
域が優勢な状態となる変化時点として検出したりなど各
種の方法がある。
第2に、音声パワー系列の抽出。
入力された音声x(t)のパワー時系列pを下式を用い
て求める。
ここで、Nは演算区間長を表す。
上記式(1)を用いて算出した破裂時点以降のデータに
ついて、分析間隔Mでパワー系列Pを下式を用いて求め
る。
P=p(1)、p(2)、・・・p(1) ……(2) 第2図(イ)は入力された音声“da"の音声波形x
(t)を示し、第2図(ロ)は式(1)および(2)を
用いて演算して算出したパワー系列P(1)を示す。
第3に、母音定常点Sの抽出。
破裂時点以降のパワー系列において、パワーの変動が、
下式を用いて表されるように或る閾値“TH"以下の地点
を母音定常点Sとする。この母音定常点Sは、第3図図
中“S"を用いて表されている。
|P(li)−P(lj)|≦TH ……(3) 第4図に、母音の立上り時点の設定。
母音の定常点Sにおけるパワー値よりも、Lレベル下が
ったパワー系列上の点Tを算出し、これを母音の立上り
時点Tとする(第3図図示“T")。
第5に、パワーの立上り時間特性の算出。
破裂時点でのパワー系列上の点Bと、母音の立上り時点
Tとを結んだ直線を、パワーの立上り時間特性とする
(第3図図中点Bと点Tとを結ぶ一点鎖線)。
第6に、時間正視化スペクトル系列の抽出。
破裂時点Bから母音の立上り時点Tまでのスペクトル系
列を、時間正視化した形で抽出する。そして、第4図に
おいて、破裂時点Bでのパワー値PBと母音の立上り時点
Tでのパワー値PTとの間をK分割することにより得られ
るパワー値(例えばP1、P2)と、立上り時間特性の直線
とから、スペクトルの抽出時点を決定する(例えばt1
t2)。これら決定された時点t1、t2と、破裂時点t0およ
び母音の立上り時間t3とを加えた点を、分析開始位置と
してスペクトル分析を行い、時間を正視化した形で破裂
時点から母音の立上り時点までのスペクトル系列を得
る。この時間正視化は、乱流雑音によりbuzz bar(バ
ズ バー)上で破裂波形が生じる場合や、音声波が声道
で共振を開始する時点で破裂波形を生じる場合などにお
いて破裂の仕方の変動を吸収する効果がある。この時間
正視化したスペクトル系列を特徴点パラメータとして、
有声破裂子音の間での識別を行うようにしている。
第7に、識別方法。
ここでは、時間正視化されたスペクトル系列間のマッチ
ングを行い、その距離尺度で識別を行う。本発明の他の
1つの特徴は、この距離を算出する場合に、時間情報の
重み付けを行うところにある。
今、辞書メモリ11に登録されているスペクトル系列を
D、入力されたスペクトル系列をIとし、そのパワー立
上り時間特性が夫々第5図(イ)および第5図(ロ)に
示すものとする。スペクトル系列Dは、t0ないしt3時点
を分析開始位置として、スペクトル分析されたものであ
り、下式のように表される。
D=d(t0)、d(t1)、d(t2)、d(t3)…(4) 同様に、入力スペクトル系列Iは、下式のように表され
る。
I=i(t0′)、i(t1′)、i(t2′)、i(t3′) ……(5) ここで、次のような距離dを定義する。
距離d=|d(t0)−i(t0′)| +w1|d(t1)−i(t1′)| +w2|d(t2)−i(t2′)| +w3|d(t3)−i(t3′)| ……(6) ここで、wi(i=1ないし3)は、重み係数であって、
以下の式によって定義される。
wi=ti/ti′(ti/ti′>1) ……(7) wi=ti′/ti(ti/ti′<1) ……(8) wi=1・・・(ti/ti′=1) ……(9) 即ち、破裂時点でのスペクトル以外のスペクトル系列間
の距離を計算する場合に、破裂時点からの時間情報を重
みとして付加することになる。これによって、母音部へ
の立上り時間が異なる“だ行、ば行”と、“が行”との
識別が容易となる効果もある。以上説明した距離dを用
いて識別を行う。
〔発明の効果〕
以上説明したように、本発明によれば、破裂時点から母
音部に至るパワーの立上り時間特性を基に時間正視化し
た時間情報を算出し、この算出した時間情報に基づいて
破裂時点から母音部に至る過渡部のスペクトルを抽出
し、かつ時間情報によって重みづけを行うことによって
有声破裂子音を識別する構成を採用しているため、高い
認識率で有声破裂子音を識別することができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は音声パワー
系列の抽出説明図、第3図はパワーの立上り時間特性説
明図、第4図は分析位置算出説明図、第5図は識別説明
図を示す。 図中、1はマイク、2はA/D変換器、3は音声メモリ、
4は破裂時点検出部、5はパワー演算部、6はパワー系
列メモリ、7は母音立上り点検出部、8は立上り時間特
性検出部、9は分析位置指示部、10はスペクトル分析
部、11は辞書メモリ、12は距離演算部、13は重み付け
部、14は判定部を表す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】有声破裂子音を識別する有声破裂子音識別
    方式において、 有声破裂子音の破裂時点を検出する破裂時点検出部
    (4)と、 この破裂時点検出部(4)によって検出された破裂時点
    から母音部に至るパワー系列を演算するパワー演算部
    (5)と、 このパワー演算部(5)によって演算されたパワー系列
    から母音の立ち上がり点を検出する母音立上り点検出部
    (7)と、 この母音立上り点検出部(7)によって検出された母音
    立上り点と破裂時点とから立ち上がり時間特性を検出す
    る立上り時間特性検出部(8)と、 この立上り時間特性検出部(8)によって検出された立
    上り時間特性に基づいて分析位置を指示する分析位置指
    示部(9)と、 この分析位置指示部(9)によって指示された位置のス
    ペクトル分析を行うスペクトル分析部(10)と、 このスペクトル分析部(10)によって分析されたスペク
    トルに対して、予め登録しておいたスペクトルを用いて
    距離を演算すると共にこの距離を演算する際に分析位置
    指示部(9)から通知された分析位置の重みづけを行う
    距離演算部(12)と、 この距離演算部(12)によって演算された距離に基づい
    て、有声破裂子音を判定する判定部(14)とを備え、 この判定部(14)によって判定された結果を出力するよ
    う構成したことを特徴とする有声破裂子音識別方式。
JP60250542A 1985-11-08 1985-11-08 有声破裂子音識別方式 Expired - Lifetime JPH0682278B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60250542A JPH0682278B2 (ja) 1985-11-08 1985-11-08 有声破裂子音識別方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60250542A JPH0682278B2 (ja) 1985-11-08 1985-11-08 有声破裂子音識別方式

Publications (2)

Publication Number Publication Date
JPS62111294A JPS62111294A (ja) 1987-05-22
JPH0682278B2 true JPH0682278B2 (ja) 1994-10-19

Family

ID=17209457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60250542A Expired - Lifetime JPH0682278B2 (ja) 1985-11-08 1985-11-08 有声破裂子音識別方式

Country Status (1)

Country Link
JP (1) JPH0682278B2 (ja)

Also Published As

Publication number Publication date
JPS62111294A (ja) 1987-05-22

Similar Documents

Publication Publication Date Title
US4809332A (en) Speech processing apparatus and methods for processing burst-friction sounds
CN103617799B (zh) 一种适应于移动设备的英语语句发音质量检测方法
US20170301343A1 (en) Method and system for generating advanced feature discrimination vectors for use in speech recognition
JPH0682278B2 (ja) 有声破裂子音識別方式
KR100391123B1 (ko) 피치 단위 데이터 분석을 이용한 음성인식 방법 및 시스템
Villing et al. Performance limits for envelope based automatic syllable segmentation
JPS5939760B2 (ja) 音声認識装置
JPS5936759B2 (ja) 音声認識方法
JPH07120153B2 (ja) 有声破裂子音識別方式
JP3049711B2 (ja) 音声処理装置
JPH07120159B2 (ja) 無声破裂子音識別方式
JPS63217399A (ja) 音声区間検出装置
JP2679039B2 (ja) 母音切出し装置
WO1989003519A1 (en) Speech processing apparatus and methods for processing burst-friction sounds
JPS5969798A (ja) ピツチ抽出方法
JPS63191199A (ja) 有声破裂子音識別装置
JPS5961900A (ja) 音声入力装置
JPH02239290A (ja) 音声認識装置
JPS62280800A (ja) 破裂子音識別方式
JPH0235500A (ja) 音声認識方式
JPS60138599A (ja) 音声区間検出装置
JPS61180300A (ja) 音声認識装置
JPS6255699A (ja) 音声認識装置
JPS6069700A (ja) 音声認識装置
JPH0754435B2 (ja) 音声認識方法