JPH075898A

JPH075898A - 音声信号処理装置と破裂性抽出装置

Info

Publication number: JPH075898A
Application number: JP4109451A
Authority: JP
Inventors: Yoshiyuki Yoshizumi; 嘉之吉住; Tsuyoshi Megata; 強司目片; Yoshinori Yamada; 義則山田; Ryoji Suzuki; 良二鈴木
Original assignee: Technology Research Association of Medical and Welfare Apparatus
Current assignee: Technology Research Association of Medical and Welfare Apparatus
Priority date: 1992-04-28
Filing date: 1992-04-28
Publication date: 1995-01-10
Also published as: US5583969A

Abstract

(57)【要約】【目的】子音の種類に応じて、増幅区間長とゲインを
制御し、音声の強調を行なう音声信号処理装置と破裂性
抽出装置を提供する。【構成】係数演算手段１１で音声のレベル補償する値
が出力され、係数制御手段１４で子音の種類に応じたゲ
インと時間幅を持った値になる。特徴抽出手段１５は音
声内の子音の破裂性、摩擦性、母音のピッチを抽出し、
子音の種類を判別して、係数制御手段へ伝達する。第１
の遅延手段１２処理に要する時間だけ遅延を行なう。係
数制御手段の出力と第１の遅延手段１２の出力を乗算し
て出力する。【効果】破裂子音の判別ができ、補償係数の時間的な
制御が破裂子音の種類に応じて行われるのでＶＯＴを変
化させずに安定した強調を行うことができるので、音声
の明瞭度を向上することができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号処理分野にお
ける音声信号処理装置に関するものである。

【０００２】

【従来の技術】従来の音声信号処理装置を図面を用いて
説明する。従来の音声信号処理装置の基本構成を図９に
示す。１０１は音声信号を増幅する増幅器、１０２は無
音区間を検出する無音区間抽出部、１０３は音声信号の
包絡線を抽出する包絡線抽出部、１０４は入力された信
号のゼロクロス周波数を検出するゼロクロス検出部、１
０５は入力される信号の変化率を求める微分器である。
１０６は無音区間検出部１０２、微分器１０５、ゼロク
ロス検出部１０４から出力される信号に基づいてパルス
を出力し、増幅器１０１を制御するワンショットモノマ
ルチバイブレーターである。次に、従来の音声信号処理
装置の動作について説明する。図１０に図９における各
部の時間波形を示す。図１０（ａ）のように入力された
音声信号は増幅器１０１、無音区間検出部１０２、包絡
線検出部１０３、ゼロクロス検出部１０４に伝達され
る。無音区間検出部１０２は音声信号中の無音区間を検
出しワンショットモノマルチバイブレーター１０６へ伝
達する。包絡線抽出部１０３は音声信号の包絡線を抽出
し、微分器１０５へ伝達する。微分器１０５は音声信号
の包絡線の変化率を求めワンショットモノマルチバイブ
レーター１０６へ伝達する。ゼロクロス検出部１０４は
音声信号のゼロクロス周波数を求めてワンショットモノ
マルチバイブレーター１０６へ伝達する。ワンショット
モノマルチバイブレーター１０６は無音区間検出部１０
２、微分器１０５、ゼロクロス検出部１０４の出力に基
づき、図１０（ｂ）のように無音から音声に変わった時
点からゼロクロス周波数が高く、かつ、包絡線の変化率
が大きい時点までパルスを出力する。ワンショットモノ
マルチバイブレーター１０６から出力されたパルスは増
幅器１０１へ入力される。増幅器１０１はワンショット
モノマルチバイブレーター１０６から出力されるパルス
が入力されると予め決められたゲインで、入力される音
声信号を増幅し、出力する。増幅器１０１はワンショッ
トモノマルチバイブレーター１０６からのパルス出力が
無い場合はゲイン１で入力された音声信号をそのまま出
力する。図１０（ｃ）に増幅器１０１から出力された音
声信号波形を示す。

【０００３】

【発明が解決しようとする課題】しかしながら上記のよ
うな構成では、摩擦音の検出は行えるが、破裂音のよう
なバーストが短く、振幅の小さい子音の検出は困難であ
る。また、破裂音の種類によってＶＯＴの長さは異なる
が、これを検出することはできない。したがって、増幅
器１０１は子音の種類に応じて増幅区間長を制御し、子
音の増幅を行なうことができないという課題を有してい
た。また、摩擦音を増幅する場合はその一部の区間のみ
を増幅した場合に異聴が生じやすいという課題を有して
いた。

【０００４】本発明はかかる点に鑑み、子音の種類に応
じて、増幅区間長とゲインを制御し、音声の強調を行な
う音声信号処理装置と破裂性抽出装置を提供することを
目的とする。

【０００５】

【課題を解決するための手段】本発明における音声信号
処理装置においては、入力信号のレベルの変化を抑える
値を求める係数演算手段と、処理時間を補償するために
前記入力信号を遅延する第１の遅延手段と、前記入力信
号から子音の特徴量を抽出する特徴抽出手段と、前記特
徴抽出手段からの出力信号に基づいて係数演算手段で求
められた値の振幅値、時間長を制御する係数制御手段
と、前記第１の遅延手段から出力される信号と前記係数
制御手段から出力される信号の乗算を行なう乗算手段と
を備えた構成とする。

【０００６】本発明における破裂性抽出装置において
は、入力信号の特定の周波数帯域のみを通過させて出力
する第１の帯域通過手段と、前記第１の帯域通過手段の
周波数帯域とは異なる特定の周波数帯域のみを通過させ
て出力する第２の帯域通過手段と、前記第１の帯域通過
手段から出力される信号の短区間平均振幅を求める第１
の平均振幅抽出手段と、前記第２の帯域通過手段から出
力される信号の短区間平均振幅を求める第２の平均振幅
抽出手段と、前記第１の平均振幅手段から出力される値
を前記第２の平均振幅抽出手段から出力される値で除算
する除算手段と、しきい値データを記憶しておく第１の
記憶手段と、前記除算手段から出力される値と前記第１
の記憶手段から出力されるしきい値を比較する比較手段
と、時間幅に対応した定数を記憶しておく第２の記憶手
段と、時間幅が一定なパルスを出力する時間軸発生手段
と、比較手段から出力される時間が第２の記憶手段に記
憶された時間幅内に入る場合には破裂音と判定する判定
手段とを備えた構成とする。

【０００７】

【作用】本発明は前記した構成により、音声信号が入力
されたとき、中高域の短区間平均振幅と低中域の短区間
平均振幅の比とその継続時間長を算出することにより破
裂子音の判別ができ、補償係数の時間的な制御が破裂子
音の種類に応じて行われるのでＶＯＴを変化させずに安
定した強調を行うことができる。

【０００８】

【実施例】以下、本発明の音声信号処理装置の一実施例
について、図面を参照しながら説明する。

【０００９】図１は本発明の第１の実施例における音声
信号処理装置の構成図を示すものである。図１におい
て、１１は入力信号から補償係数を計算する係数演算手
段、１２は入力される信号を遅延する第１の遅延手段、
１５は入力信号から音声の特徴量を抽出する特徴抽出手
段、１４は特徴抽出手段１５から伝達されるデータに基
づいて係数の保持時間を制御する係数制御手段、１３は
第１の遅延手段１２の出力と係数制御手段１４の出力間
の乗算を行なう乗算手段である。

【００１０】以上のように構成された本実施例の音声信
号処理装置について、以下その動作を説明する。

【００１１】入力信号ｓ（ｔ−ｂ）は係数演算手段１１
と第１の遅延手段１２と特徴抽出手段１５に入力され
る。次に、係数演算手段１１は、その時刻ｔ及びその前
後の入力信号に基づいて入力信号ｓ（ｔ）のレベルの変
化を抑える補償係数Ａ（ｔ）を求める。また、第１の遅
延手段１２は、処理に要する時間だけ入力信号に遅延を
かけて、遅延された信号ｓ（ｔ）を出力する。次に、特
徴抽出手段１５は音声の特徴量を抽出し破裂音であるか
どうかの判定を行い係数制御手段１４へ伝達する。係数
制御手段１４は特徴抽出手段１５から伝達されるデータ
に基づき、係数演算手段１１から出力される係数Ａ
（ｔ）の時間的な保持時間を制御し、新しい係数Ｇ
（ｔ）を出力する。これは、特徴抽出手段１５から伝達
されるデータに基づき一定時間係数をホールドすること
により、容易に実現できる。次に、乗算手段１３は第１
の遅延手段１２の出力ｓ（ｔ）に係数制御手段１４の出
力Ｇ（ｔ）を乗じて出力する。そして、第１の遅延手段
１２が記憶している内容全体を１ポイントずつ遅延させ
る。

【００１２】図２に図１における各波形を示す。図２
（ａ）は第１の遅延手段１２から出力された原音声信号
Ｓ（ｔ）の時間波形、図２（ｂ）は係数演算手段１１か
ら出力される補償係数Ａ（ｔ）の時間波形、図２（ｃ）
は係数制御手段１４から出力される補償係数Ｇ（ｔ）の
時間波形、図２（ｄ）は乗算手段１３から出力される音
声信号ｙ（ｔ）の時間波形を示す。

【００１３】図３は本発明の音声強調装置の一実施例に
おける特徴抽出手段の構成図を示すものである。図３に
おいて、２１は入力される信号を遅延させて出力する第
２の遅延手段、２２は音声信号中の破裂部分を検出する
破裂性抽出手段、２３は音声のピッチを抽出するピッチ
抽出手段、２４は破裂性抽出手段２２とピッチ抽出手段
２３から伝達されるデータに基づいて破裂音であるかど
うかを判定する判別部である。

【００１４】以上のように構成された特徴量抽出手段に
ついて、以下その動作を説明する。まず、入力された信
号は第２の遅延手段２１とピッチ抽出手段２３へ伝達さ
れる。第２の遅延手段２１は入力信号を時間ｄだけ遅延
させ破裂性抽出手段２２へ出力する。破裂性抽出手段２
２は音声の破裂部の特徴量を検出し、データを判定部２
４へ伝達する。また、ピッチ抽出手段２３は入力音声信
号内からピッチ周波数の抽出を行ない有声／無声の判別
を行ないデータを判定部２４へ伝達する。判別部２４は
破裂性抽出手段２２から出力されるデータが真で、か
つ、ピッチ抽出手段２３から出力されるデータが真であ
る時、破裂音であると判別する。

【００１５】以上のように本実施例によれば、入力信号
から補償係数を計算する係数演算手段１１と、入力され
る信号を遅延する第１の遅延手段１２と、入力信号から
音声の特徴量を抽出する特徴抽出手段１５と、特徴抽出
手段１５から伝達されるデータに基づいて係数の保持時
間を制御する係数制御手段１４と、第１の遅延手段１２
の出力と係数制御手段１４の出力間の乗算を行なう乗算
手段１３とを設けることにより、各子音の種類に応じた
特徴量が検出されるので、破裂音、摩擦音等の子音の種
類に応じて補償係数の時間的な区間長の制御ができ、従
来困難であったＶＯＴの異なる子音に対しても最適な区
間長で補償係数を制御できる音声信号処理装置を提供す
ることができる。

【００１６】また、特徴抽出手段１５において、入力さ
れる信号を遅延させて出力する第２の遅延手段２１、音
声信号中の破裂部分を検出する破裂性抽出手段２２、音
声のピッチを抽出するピッチ抽出手段２３、破裂性抽出
手段２２とピッチ抽出手段２３から伝達されるデータに
基づいて破裂音であるかどうかを判定する判別部２４を
設けることにより母音の直前に存在する破裂音のみが検
出されるので、誤って破裂音と検出することを防ぐこと
ができる。なお、特徴抽出手段は破裂性抽出手段のみか
ら構成することにより誤りは増えるが、全体の処理遅延
時間を減少することができる。

【００１７】図４は本発明における第２の実施例におけ
る破裂性抽出装置の構成図を示すものである。図４にお
いて、３１は中域から高域を通過させる第１の帯域通過
手段、３２は低域から中域を通過させる第２の帯域通過
手段、３３、３４は信号の短区間平均振幅を算出する平
均振幅抽出手段、３５は除算手段、３６は除算手段から
出力されるデータとしきい値記憶部３７から出力される
データを比較する比較部、３７は定数を記憶するしきい
値記憶部、３９は破裂音の時間長等を記憶した定数記憶
部、４０はクロックを発生する時間軸発生部、３８は比
較部３６から出力されるデータと定数記憶部３９から出
力されるデータを時間軸発生部４０から出力されるクロ
ックに基づいて計時的に比較し破裂の種類を判定する判
定部である。

【００１８】以上のように構成された破裂性抽出装置に
ついて、以下その動作を説明する。まず、入力された信
号は中域から高域、例えば３．７ｋＨｚ〜５ｋＨｚを通
過させる第１の帯域通過手段３１と低域から中域、例え
ば１００Ｈｚ〜９００Ｈｚを通過させる第２の帯域通過
手段３２へ伝達される。次に、帯域制限された信号は平
均振幅抽出手段３３、３４へ入力され、予め定められた
区間長の短区間平均振幅が算出される。次に、除算手段
３５は、平均振幅抽出手段３３の出力値を平均振幅抽出
手段３４の出力値で除算し、信号の中高域成分の短区間
平均振幅と低中域の短区間平均振幅の比を算出する。し
きい値記憶部３７は予め決められた定数を記憶する。比
較部３６は除算手段から出力されるデータとしきい値記
憶部３７から出力されるデータを比較し、一定のレベル
を越えている場合にデータを判定部に伝達する。定数記
憶部３９は各破裂音／ｐ／，／ｔ／，／ｋ／の時間長に
対応した定数ｔ₁，ｔ₂，ｔ₃を記憶する。時間軸発生部
４０は一定周期のクロックを発生する。判定部３８は比
較部３６から出力されるデータと定数記憶部３９から出
力されるデータを時間軸発生部４０から出力されるクロ
ックに基づいて計時的に比較し、破裂音の種類を判定す
る。これは、比較部３６からの出力がｔ₁以内の場合に
／ｐ／，比較部３６からの出力がｔ₂以内の場合に／ｔ
／，比較部３６からの出力がｔ₃以内の場合に／ｋ／と
し、それ以上の場合は破裂音ではないものとする。

【００１９】以上のように本実施例のよれば、中域から
高域を通過させる第１の帯域通過手段３１と、低域から
中域を通過させる第２の帯域通過手段３２と、信号の短
区間平均振幅を算出する平均振幅抽出手段３３、３４
と、除算手段３５と、除算手段３５から出力されるデー
タとしきい値記憶部３７から出力されるデータを比較す
る比較部３６、定数を記憶するしきい値記憶部３７と、
破裂音の時間長等を記憶した定数記憶部３９と、クロッ
クを発生する時間軸発生部３９と、比較部３６から出力
されるデータと定数記憶部３９から出力されるデータを
時間軸発生部４０から出力されるクロックに基づいて計
時的に比較し破裂の種類を判定する判定部３８とを設け
ることにより、中高域の短区間平均振幅と低中域の短区
間平均振幅の比を計時的に判定できるので、無声破裂音
の検出と破裂の種類の弁別を行なうことができる。した
がって、ＶＯＴが異なる無声破裂音／ｐ／、／ｔ／、／
ｋ／に適応した区間長を設定することができる破裂性抽
出装置を構成することができる。

【００２０】図５は本発明における第３の実施例におけ
る破裂性抽出装置の構成図を示すものである。図５にお
いて、３１は中域から高域を通過させる第１の帯域通過
手段、３２は低域から中域を通過させる第２の帯域通過
手段、３３、３４は信号の短区間平均振幅を算出する平
均振幅抽出手段、３５は除算手段、５１は除算手段３５
の出力信号を時間微分する微分手段、５２は入力信号を
絶対値する絶対値手段、３６は絶対値手段５２から出力
されるデータとしきい値記憶部３７から出力されるデー
タを比較する比較手段、３７は定数を記憶するしきい値
記憶部、３９は破裂音の時間長等を記憶した定数記憶
部、４０はクロックを発生する時間軸発生部、３８は比
較部３６から出力されるデータと定数記憶部３９から出
力されるデータを時間軸発生部４０から出力されるクロ
ックに基づいて計時的に比較し破裂の種類を判定する。

【００２１】以上のように構成された破裂性抽出装置に
ついて、以下その動作を説明する。まず、入力された信
号は中域から高域、例えば３．７ｋＨｚ〜５ｋＨｚを通
過させる第１の帯域通過手段３１と低域から中域、例え
ば１００Ｈｚ〜９００Ｈｚを通過させる第２の帯域通過
手段３２へ伝達される。次に、帯域制限された信号は平
均振幅抽出手段３３、３４へ入力され、予め定められた
区間長の短区間平均振幅が算出される。次に、除算手段
３５は、平均振幅抽出手段３３の出力値を平均振幅抽出
手段３４の出力値で除算し、信号の中高域成分の短区間
平均振幅と低中域の短区間平均振幅の比を算出する。微
分手段５１は除算手段３５から出力される信号を時間方
向に２階微分する。そして、絶対値手段５２で絶対値化
される。次に、しきい値記憶部３７は予め決められた定
数を記憶する。比較部３６は絶対値手段５２から出力さ
れるデータとしきい値記憶部３７から出力されるデータ
を比較し、一定のレベルを越えている場合にデータを判
定部に伝達する。定数記憶部３９は各破裂音／ｐ／，／
ｔ／，／ｋ／の時間長に対応した定数ｔ₁，ｔ₂，ｔ₃を
記憶する。時間軸発生部４０は一定周期のクロックを発
生する。判定部３８は比較部３６から出力されるデータ
と定数記憶部３９から出力されるデータを時間軸発生部
４０から出力されるクロックに基づいて計時的に比較
し、破裂音の種類を判定する。これは、比較部３６から
の出力がｔ₁以内の場合に／ｐ／，比較部３６からの出
力がｔ₂以内の場合に／ｔ／，比較部３６からの出力が
ｔ₃以内の場合に／ｋ／とし、それ以上の場合は破裂音
ではないものとする。図６に図５における各部の時間波
形を示す。図６（ａ）は・点（イ）における入力音声の
時間波形、図６（ｂ）は点（ロ）における中高域の短区
間平均振幅と低中域の短区間平均振幅の比の時間波形、
図６（ｃ）は点（ハ）における時間微分後の時間波形を
示す。

【００２２】以上のように本実施例によれば、中域から
高域を通過させる第１の帯域通過手段３１と、低域から
中域を通過させる第２の帯域通過手段３２と、信号の短
区間平均振幅を算出する平均振幅抽出手段３３、３４
と、除算手段３５と、除算手段３５の出力信号を時間微
分する微分手段５１と、入力信号を絶対値する絶対値手
段５２と、絶対値手段５２から出力されるデータとしき
い値記憶部３７から出力されるデータを比較する比較部
３６と、定数を記憶するしきい値記憶部３７と、破裂音
の時間長等を記憶した定数記憶部３９と、クロックを発
生する時間軸発生部３９と、比較部３６から出力される
データと定数記憶部３９から出力されるデータを時間軸
発生部４０から出力されるクロックに基づいて計時的に
比較し破裂の種類を判定する判定部３８とを設けること
により、中高域の短区間平均振幅と低中域の短区間平均
振幅の比のコントラストが強調され、かつ、計時的に判
定できるので、無声破裂音の検出と破裂の種類の弁別を
行なうことができる。したがって、振幅が小さく、ＶＯ
Ｔが異なる無声破裂音／ｐ／、／ｔ／、／ｋ／に適応し
た区間長を設定することができる破裂性抽出装置を構成
することができる。

【００２３】図７は本発明における第４の実施例におけ
る音声信号処理装置の構成図を示すものである。図７に
おいて、１１は入力信号から補償係数を計算する係数演
算手段、１２は入力される信号を遅延する第１の遅延手
段、６０は判定部３８から伝達されるデータに基づいて
係数を１にする係数制御手段、１３は第１の遅延手段１
２の出力と係数制御手段１４の出力間の乗算を行なう乗
算手段である。６１は入力信号のゼロクロス周波数を算
出するゼロクロス抽出手段、３６はゼロクロス抽出手段
６１から出力されるデータとしきい値記憶部３７から出
力されるデータを比較する比較手段、３７は定数を記憶
するしきい値記憶部、３９は摩擦音の時間長等を記憶し
た定数記憶部、４０はクロックを発生する時間軸発生
部、３８は比較部３６から出力されるデータと定数記憶
部３９から出力されるデータを時間軸発生部４０から出
力されるクロックに基づいて計時的に比較し摩擦性を判
定する。

【００２４】以上のように構成された音声信号処理装置
について、以下その動作を説明する。

【００２５】まず、入力ｓ（ｔ−ｂ）は係数演算手段１
１と第１の遅延手段１２とゼロクロス抽出手段６１に入
力される。係数演算手段１１は、その時刻ｔ及びその前
後の入力信号に基づいて入力信号ｓ（ｔ）のレベルの変
化を抑える補償係数Ａ（ｔ）を求める。また、第１の遅
延手段１２は、処理に要する時間だけ入力信号に遅延を
かけて、遅延された信号ｓ（ｔ）を出力する。次に、ゼ
ロクロス抽出手段６１は音声のゼロクロス周波数を算出
する。また、しきい値記憶部３７は予め決められた定数
を記憶する。比較部３６はゼロクロス抽出手段６１から
出力されるデータとしきい値記憶部３７から出力される
データを比較し、一定のレベルを越えている場合にデー
タを判定部３８に伝達する。定数記憶部３９は予め定め
られた時間長に対応した定数ｔ₄を記憶する。時間軸発
生部４０は一定周期のクロックを発生する。判定部３８
は比較部３６から出力されるデータと定数記憶部３９か
ら出力されるデータを時間軸発生部４０から出力される
クロックに基づいて計時的に比較し、比較部３６からの
出力がｔ₄よりも長い場合には摩擦音であると判定す
る。次に、係数制御手段６０は判定部３８からの入力が
無い場合は係数演算手段１１から入力される補償係数Ａ
（ｔ）をそのまま通過させ、補償係数Ｈ（ｔ）として出
力し、判定部３８からの入力がある場合は補償係数Ａ
（ｔ）を１にして新しい補償係数Ｈ（ｔ）を出力する。
乗算手段１３は第１の遅延手段１２から出力される値と
係数制御手段６０から出力される値Ｈ（ｔ）を乗算した
値を出力する。そして、第１の遅延手段１９が記憶して
いる内容全体を１ポイントずつ遅延させる。

【００２６】図８に図７における各波形を示す。図８
（ａ）は点（ニ）における第１の遅延手段１２から出力
された原音声信号Ｓ（ｔ）の時間波形、図８（ｂ）は点
（ホ）におけるゼロクロス抽出手段６１から出力される
ゼロクロス周波数の時間波形、図８（ｃ）は点（ヘ）に
おける係数演算手段１１から出力される補償係数Ａ
（ｔ）の時間波形、図８（ｄ）は点（ト）における係数
制御手段６０から出力される補償係数Ｈ（ｔ）の時間波
形を示す。

【００２７】以上のように本実施例によれば、入力信号
から補償係数を計算する係数演算手段１１と、入力され
る信号を遅延する第１の遅延手段と、判定部３８から伝
達されるデータに基づいて係数を１にする係数制御手段
６０と、第１の遅延手段１２の出力と係数制御手段１４
の出力間の乗算を行なう乗算手段１３と、入力信号のゼ
ロクロス周波数を算出するゼロクロス抽出手段６１と、
ゼロクロス抽出手段６１から出力されるデータとしきい
値記憶部３７から出力されるデータを比較する比較手段
３６と、定数を記憶するしきい値記憶部３７と、摩擦音
の時間長等を記憶した定数記憶部３９と、クロックを発
生する時間軸発生部４０と、比較部３６から出力される
データと定数記憶部３９から出力されるデータを時間軸
発生部４０から出力されるクロックに基づいて計時的に
比較し摩擦性を判定する判定部３８とを設けることによ
り、摩擦区間の検出が行われ、係数演算手段１１で求め
られた補償係数Ａ（ｔ）を１にすることができるので、
時間区間の長い摩擦音の一部の区間だけを増幅すること
による異聴を防ぐことができる音声信号処理装置を構成
できる。

【００２８】

【発明の効果】本発明によれば、音声の破裂性を検出し
破裂子音の種類に適応して補償係数の時間区間長が制御
されるので、ＶＯＴを変化させること無く、安定した破
裂子音の増幅が行える。

【００２９】また、ピッチ抽出手段と第２の遅延手段を
設けることにより、母音の直前の破裂子音の抽出がで
き、破裂子音と誤って増幅することを防げる。

【００３０】さらに、ゼロクロス抽出手段により、摩擦
音の抽出を行い摩擦音を一部増幅することをなくし異聴
を防ぐことができる。

【００３１】したがって、本発明の音声信号処理装置は
自然性を損なうことなく破裂子音の強調ができ、音声の
明瞭度を向上することができ、その実用的効果は大き
い。

【図面の簡単な説明】

【図１】本発明の第１の実施例における音声信号処理装
置の構成図

【図２】本発明の第１の実施例における音声信号処理装
置の各部波形図

【図３】本発明における特徴抽出手段の一実施例の構成
図

【図４】本発明の第２の実施例における破裂性抽出装置
の構成図

【図５】本発明の第３の実施例における破裂性抽出装置
の構成図

【図６】本発明における第３の実施例における破裂性抽
出装置の各部波形図

【図７】本発明の第４の実施例における音声信号処理装
置の構成図

【図８】本発明における第４の実施例における音声信号
処理装置の各部波形図

【図９】従来の音声信号処理装置の構成図

【図１０】従来の音声信号処理装置の説明用信号波形図

【符号の説明】１１係数演算手段１２第１の遅延手段１３乗算手段１４係数制御手段１５特徴抽出手段２１第２の遅延手段２２破裂性抽出手段２３ピッチ抽出手段２４判別部３１第１の帯域通過手段３２第２の帯域通過手段３３平均振幅抽出手段３４平均振幅抽出手段３５除算手段３６比較部３７しきい値記憶部３８判定部３９定数記憶部４０時間軸発生部５１微分手段５２絶対値手段６０係数制御手段６１ゼロクロス抽出手段

───────────────────────────────────────────────────── フロントページの続き (72)発明者鈴木良二大阪府門真市大字門真1006番地松下電器産業株式会社内

Claims

【特許請求の範囲】

【請求項１】入力信号のレベルの変化を抑える値を求め
る係数演算手段と、処理時間を補償するために前記入力
信号を遅延する第１の遅延手段と、前記入力信号から子
音の特徴量を抽出する特徴抽出手段と、前記特徴抽出手
段からの出力信号に基づいて係数演算手段で求められた
値の振幅値、時間長を制御する係数制御手段と、前記第
１の遅延手段から出力される信号と前記係数制御手段か
ら出力される信号の乗算を行なう乗算手段とを備えたこ
とを特徴とする音声信号処理装置。
【請求項２】特徴抽出手段は、入力音声信号のピッチを
抽出するピッチ抽出手段と、前記入力音声信号を一定の
時刻だけ遅延させる第２の遅延手段と、遅延された前記
入力音声信号から破裂部分を抽出する破裂性抽出手段
と、前記破裂性抽出手段からの出力と前記ピッチ抽出手
段からの出力に基づいて、母音の直前に破裂部分がある
場合に破裂音と判別する判別手段とを備えたことを特徴
とする請求項１記載の音声信号処理装置。
【請求項３】入力信号の特定の周波数帯域のみを通過さ
せて出力する第１の帯域通過手段と、前記第１の帯域通
過手段の周波数帯域とは異なる特定の周波数帯域のみを
通過させて出力する第２の帯域通過手段と、前記第１の
帯域通過手段から出力される信号の短区間平均振幅を求
める第１の平均振幅抽出手段と、前記第２の帯域通過手
段から出力される信号の短区間平均振幅を求める第２の
平均振幅抽出手段と、前記第１の平均振幅手段から出力
される値を前記第２の平均振幅抽出手段から出力される
値で除算する除算手段と、しきい値データを記憶してお
く第１の記憶手段と、前記除算手段から出力される値と
前記第１の記憶手段から出力されるしきい値を比較する
比較手段と、時間幅に対応した定数を記憶しておく第２
の記憶手段と、時間幅が一定なパルスを出力する時間軸
発生手段と、比較手段から出力される時間が第２の記憶
手段に記憶された時間幅内に入る場合には破裂音と判定
する判定手段とを備えたことを特徴とする破裂性抽出装
置。
【請求項４】入力信号の特定の周波数帯域のみを通過さ
せて出力する第１の帯域通過手段と、前記第１の帯域通
過手段の周波数帯域とは異なる特定の周波数帯域のみを
通過させて出力する第２の帯域通過手段と、前記第１の
帯域通過手段から出力される信号の短区間平均振幅を求
める第１の平均振幅抽出手段と、前記第２の帯域通過手
段から出力される信号の短区間平均振幅を求める第２の
平均振幅抽出手段と、前記第１の平均振幅手段から出力
される値を前記第２の平均振幅抽出手段から出力される
値で除算する除算手段と、前記除算手段の出力信号の時
間微分を行なう微分手段と、前記微分手段の出力値の絶
対値化を行なう絶対値手段と、しきい値データを記憶し
ておく第１の記憶手段と、前記絶対値手段から出力され
る値と前記第１の記憶手段から出力されるしきい値を比
較する比較手段と、時間幅に対応した定数を記憶してお
く第２の記憶手段と、時間幅が一定なパルスを出力する
時間軸発生手段と、比較手段から出力される時間が第２
の記憶手段に記憶された時間幅内に入る場合には破裂音
と判定する判定手段とを備えたことを特徴とする破裂性
抽出装置。
【請求項５】第２の記憶手段は各破裂子音／ｐ／，／ｔ
／，／ｋ／に対応する時間幅ｔ₁，ｔ₂，ｔ₃を記憶して
いることを特徴とする請求項３または４記載の破裂性抽
出装置。
【請求項６】第２の記憶手段は（数１）で示す関係を有
することを特徴とする請求項３または４記載の破裂性抽
出装置。【数１】
【請求項７】微分手段は、時間方向に２階微分されるこ
とを特徴とする請求項４記載の破裂抽出装置。
【請求項８】特徴抽出手段が、請求項３または４記載の
破裂性抽出装置を備えたことを特徴とする請求項１記載
の音声信号処理装置。
【請求項９】入力信号のレベルの変化を抑える値を求め
る係数演算手段と、処理時間を補償するために前記入力
信号を遅延する第１の遅延手段と、前記入力信号からゼ
ロクロス周波数を抽出するゼロクロス抽出手段と、しき
い値データを記憶しておく第１の記憶手段と、前記ゼロ
クロス抽出手段から出力される値と前記第１の記憶手段
から出力されるしきい値を比較する比較手段と、時間幅
に対応した定数を記憶しておく第２の記憶手段と、時間
幅が一定なパルスを出力する時間軸発生手段と、比較手
段から出力される時間が第２の記憶手段に記憶された時
間幅以上の場合には摩擦音と判定する判定手段と前記判
定手段からの出力信号に基づいて係数演算手段で求めら
れた値の振幅値、時間長を制御する係数制御手段と、前
記第１の遅延手段から出力される信号と前記係数制御手
段から出力される信号の乗算を行なう乗算手段とを備え
たことを特徴とする音声信号処理装置。