JPH075898A - 音声信号処理装置と破裂性抽出装置 - Google Patents

音声信号処理装置と破裂性抽出装置

Info

Publication number
JPH075898A
JPH075898A JP4109451A JP10945192A JPH075898A JP H075898 A JPH075898 A JP H075898A JP 4109451 A JP4109451 A JP 4109451A JP 10945192 A JP10945192 A JP 10945192A JP H075898 A JPH075898 A JP H075898A
Authority
JP
Japan
Prior art keywords
output
time
extraction
signal
average amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4109451A
Other languages
English (en)
Inventor
Yoshiyuki Yoshizumi
嘉之 吉住
Tsuyoshi Megata
強司 目片
Yoshinori Yamada
義則 山田
Ryoji Suzuki
良二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technology Research Association of Medical and Welfare Apparatus
Original Assignee
Technology Research Association of Medical and Welfare Apparatus
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technology Research Association of Medical and Welfare Apparatus filed Critical Technology Research Association of Medical and Welfare Apparatus
Priority to JP4109451A priority Critical patent/JPH075898A/ja
Priority to US08/052,698 priority patent/US5583969A/en
Publication of JPH075898A publication Critical patent/JPH075898A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 子音の種類に応じて、増幅区間長とゲインを
制御し、音声の強調を行なう音声信号処理装置と破裂性
抽出装置を提供する。 【構成】 係数演算手段11で音声のレベル補償する値
が出力され、係数制御手段14で子音の種類に応じたゲ
インと時間幅を持った値になる。特徴抽出手段15は音
声内の子音の破裂性、摩擦性、母音のピッチを抽出し、
子音の種類を判別して、係数制御手段へ伝達する。第1
の遅延手段12処理に要する時間だけ遅延を行なう。係
数制御手段の出力と第1の遅延手段12の出力を乗算し
て出力する。 【効果】 破裂子音の判別ができ、補償係数の時間的な
制御が破裂子音の種類に応じて行われるのでVOTを変
化させずに安定した強調を行うことができるので、音声
の明瞭度を向上することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号処理分野にお
ける音声信号処理装置に関するものである。
【0002】
【従来の技術】従来の音声信号処理装置を図面を用いて
説明する。従来の音声信号処理装置の基本構成を図9に
示す。101は音声信号を増幅する増幅器、102は無
音区間を検出する無音区間抽出部、103は音声信号の
包絡線を抽出する包絡線抽出部、104は入力された信
号のゼロクロス周波数を検出するゼロクロス検出部、1
05は入力される信号の変化率を求める微分器である。
106は無音区間検出部102、微分器105、ゼロク
ロス検出部104から出力される信号に基づいてパルス
を出力し、増幅器101を制御するワンショットモノマ
ルチバイブレーターである。次に、従来の音声信号処理
装置の動作について説明する。図10に図9における各
部の時間波形を示す。図10(a)のように入力された
音声信号は増幅器101、無音区間検出部102、包絡
線検出部103、ゼロクロス検出部104に伝達され
る。無音区間検出部102は音声信号中の無音区間を検
出しワンショットモノマルチバイブレーター106へ伝
達する。包絡線抽出部103は音声信号の包絡線を抽出
し、微分器105へ伝達する。微分器105は音声信号
の包絡線の変化率を求めワンショットモノマルチバイブ
レーター106へ伝達する。ゼロクロス検出部104は
音声信号のゼロクロス周波数を求めてワンショットモノ
マルチバイブレーター106へ伝達する。ワンショット
モノマルチバイブレーター106は無音区間検出部10
2、微分器105、ゼロクロス検出部104の出力に基
づき、図10(b)のように無音から音声に変わった時
点からゼロクロス周波数が高く、かつ、包絡線の変化率
が大きい時点までパルスを出力する。ワンショットモノ
マルチバイブレーター106から出力されたパルスは増
幅器101へ入力される。増幅器101はワンショット
モノマルチバイブレーター106から出力されるパルス
が入力されると予め決められたゲインで、入力される音
声信号を増幅し、出力する。増幅器101はワンショッ
トモノマルチバイブレーター106からのパルス出力が
無い場合はゲイン1で入力された音声信号をそのまま出
力する。図10(c)に増幅器101から出力された音
声信号波形を示す。
【0003】
【発明が解決しようとする課題】しかしながら上記のよ
うな構成では、摩擦音の検出は行えるが、破裂音のよう
なバーストが短く、振幅の小さい子音の検出は困難であ
る。また、破裂音の種類によってVOTの長さは異なる
が、これを検出することはできない。したがって、増幅
器101は子音の種類に応じて増幅区間長を制御し、子
音の増幅を行なうことができないという課題を有してい
た。また、摩擦音を増幅する場合はその一部の区間のみ
を増幅した場合に異聴が生じやすいという課題を有して
いた。
【0004】本発明はかかる点に鑑み、子音の種類に応
じて、増幅区間長とゲインを制御し、音声の強調を行な
う音声信号処理装置と破裂性抽出装置を提供することを
目的とする。
【0005】
【課題を解決するための手段】本発明における音声信号
処理装置においては、入力信号のレベルの変化を抑える
値を求める係数演算手段と、処理時間を補償するために
前記入力信号を遅延する第1の遅延手段と、前記入力信
号から子音の特徴量を抽出する特徴抽出手段と、前記特
徴抽出手段からの出力信号に基づいて係数演算手段で求
められた値の振幅値、時間長を制御する係数制御手段
と、前記第1の遅延手段から出力される信号と前記係数
制御手段から出力される信号の乗算を行なう乗算手段と
を備えた構成とする。
【0006】本発明における破裂性抽出装置において
は、入力信号の特定の周波数帯域のみを通過させて出力
する第1の帯域通過手段と、前記第1の帯域通過手段の
周波数帯域とは異なる特定の周波数帯域のみを通過させ
て出力する第2の帯域通過手段と、前記第1の帯域通過
手段から出力される信号の短区間平均振幅を求める第1
の平均振幅抽出手段と、前記第2の帯域通過手段から出
力される信号の短区間平均振幅を求める第2の平均振幅
抽出手段と、前記第1の平均振幅手段から出力される値
を前記第2の平均振幅抽出手段から出力される値で除算
する除算手段と、しきい値データを記憶しておく第1の
記憶手段と、前記除算手段から出力される値と前記第1
の記憶手段から出力されるしきい値を比較する比較手段
と、時間幅に対応した定数を記憶しておく第2の記憶手
段と、時間幅が一定なパルスを出力する時間軸発生手段
と、比較手段から出力される時間が第2の記憶手段に記
憶された時間幅内に入る場合には破裂音と判定する判定
手段とを備えた構成とする。
【0007】
【作用】本発明は前記した構成により、音声信号が入力
されたとき、中高域の短区間平均振幅と低中域の短区間
平均振幅の比とその継続時間長を算出することにより破
裂子音の判別ができ、補償係数の時間的な制御が破裂子
音の種類に応じて行われるのでVOTを変化させずに安
定した強調を行うことができる。
【0008】
【実施例】以下、本発明の音声信号処理装置の一実施例
について、図面を参照しながら説明する。
【0009】図1は本発明の第1の実施例における音声
信号処理装置の構成図を示すものである。図1におい
て、11は入力信号から補償係数を計算する係数演算手
段、12は入力される信号を遅延する第1の遅延手段、
15は入力信号から音声の特徴量を抽出する特徴抽出手
段、14は特徴抽出手段15から伝達されるデータに基
づいて係数の保持時間を制御する係数制御手段、13は
第1の遅延手段12の出力と係数制御手段14の出力間
の乗算を行なう乗算手段である。
【0010】以上のように構成された本実施例の音声信
号処理装置について、以下その動作を説明する。
【0011】入力信号s(t−b)は係数演算手段11
と第1の遅延手段12と特徴抽出手段15に入力され
る。次に、係数演算手段11は、その時刻t及びその前
後の入力信号に基づいて入力信号s(t)のレベルの変
化を抑える補償係数A(t)を求める。また、第1の遅
延手段12は、処理に要する時間だけ入力信号に遅延を
かけて、遅延された信号s(t)を出力する。次に、特
徴抽出手段15は音声の特徴量を抽出し破裂音であるか
どうかの判定を行い係数制御手段14へ伝達する。係数
制御手段14は特徴抽出手段15から伝達されるデータ
に基づき、係数演算手段11から出力される係数A
(t)の時間的な保持時間を制御し、新しい係数G
(t)を出力する。これは、特徴抽出手段15から伝達
されるデータに基づき一定時間係数をホールドすること
により、容易に実現できる。次に、乗算手段13は第1
の遅延手段12の出力s(t)に係数制御手段14の出
力G(t)を乗じて出力する。そして、第1の遅延手段
12が記憶している内容全体を1ポイントずつ遅延させ
る。
【0012】図2に図1における各波形を示す。図2
(a)は第1の遅延手段12から出力された原音声信号
S(t)の時間波形、図2(b)は係数演算手段11か
ら出力される補償係数A(t)の時間波形、図2(c)
は係数制御手段14から出力される補償係数G(t)の
時間波形、図2(d)は乗算手段13から出力される音
声信号y(t)の時間波形を示す。
【0013】図3は本発明の音声強調装置の一実施例に
おける特徴抽出手段の構成図を示すものである。図3に
おいて、21は入力される信号を遅延させて出力する第
2の遅延手段、22は音声信号中の破裂部分を検出する
破裂性抽出手段、23は音声のピッチを抽出するピッチ
抽出手段、24は破裂性抽出手段22とピッチ抽出手段
23から伝達されるデータに基づいて破裂音であるかど
うかを判定する判別部である。
【0014】以上のように構成された特徴量抽出手段に
ついて、以下その動作を説明する。まず、入力された信
号は第2の遅延手段21とピッチ抽出手段23へ伝達さ
れる。第2の遅延手段21は入力信号を時間dだけ遅延
させ破裂性抽出手段22へ出力する。破裂性抽出手段2
2は音声の破裂部の特徴量を検出し、データを判定部2
4へ伝達する。また、ピッチ抽出手段23は入力音声信
号内からピッチ周波数の抽出を行ない有声/無声の判別
を行ないデータを判定部24へ伝達する。判別部24は
破裂性抽出手段22から出力されるデータが真で、か
つ、ピッチ抽出手段23から出力されるデータが真であ
る時、破裂音であると判別する。
【0015】以上のように本実施例によれば、入力信号
から補償係数を計算する係数演算手段11と、入力され
る信号を遅延する第1の遅延手段12と、入力信号から
音声の特徴量を抽出する特徴抽出手段15と、特徴抽出
手段15から伝達されるデータに基づいて係数の保持時
間を制御する係数制御手段14と、第1の遅延手段12
の出力と係数制御手段14の出力間の乗算を行なう乗算
手段13とを設けることにより、各子音の種類に応じた
特徴量が検出されるので、破裂音、摩擦音等の子音の種
類に応じて補償係数の時間的な区間長の制御ができ、従
来困難であったVOTの異なる子音に対しても最適な区
間長で補償係数を制御できる音声信号処理装置を提供す
ることができる。
【0016】また、特徴抽出手段15において、入力さ
れる信号を遅延させて出力する第2の遅延手段21、音
声信号中の破裂部分を検出する破裂性抽出手段22、音
声のピッチを抽出するピッチ抽出手段23、破裂性抽出
手段22とピッチ抽出手段23から伝達されるデータに
基づいて破裂音であるかどうかを判定する判別部24を
設けることにより母音の直前に存在する破裂音のみが検
出されるので、誤って破裂音と検出することを防ぐこと
ができる。なお、特徴抽出手段は破裂性抽出手段のみか
ら構成することにより誤りは増えるが、全体の処理遅延
時間を減少することができる。
【0017】図4は本発明における第2の実施例におけ
る破裂性抽出装置の構成図を示すものである。図4にお
いて、31は中域から高域を通過させる第1の帯域通過
手段、32は低域から中域を通過させる第2の帯域通過
手段、33、34は信号の短区間平均振幅を算出する平
均振幅抽出手段、35は除算手段、36は除算手段から
出力されるデータとしきい値記憶部37から出力される
データを比較する比較部、37は定数を記憶するしきい
値記憶部、39は破裂音の時間長等を記憶した定数記憶
部、40はクロックを発生する時間軸発生部、38は比
較部36から出力されるデータと定数記憶部39から出
力されるデータを時間軸発生部40から出力されるクロ
ックに基づいて計時的に比較し破裂の種類を判定する判
定部である。
【0018】以上のように構成された破裂性抽出装置に
ついて、以下その動作を説明する。まず、入力された信
号は中域から高域、例えば3.7kHz〜5kHzを通
過させる第1の帯域通過手段31と低域から中域、例え
ば100Hz〜900Hzを通過させる第2の帯域通過
手段32へ伝達される。次に、帯域制限された信号は平
均振幅抽出手段33、34へ入力され、予め定められた
区間長の短区間平均振幅が算出される。次に、除算手段
35は、平均振幅抽出手段33の出力値を平均振幅抽出
手段34の出力値で除算し、信号の中高域成分の短区間
平均振幅と低中域の短区間平均振幅の比を算出する。し
きい値記憶部37は予め決められた定数を記憶する。比
較部36は除算手段から出力されるデータとしきい値記
憶部37から出力されるデータを比較し、一定のレベル
を越えている場合にデータを判定部に伝達する。定数記
憶部39は各破裂音/p/,/t/,/k/の時間長に
対応した定数t1,t2,t3を記憶する。時間軸発生部
40は一定周期のクロックを発生する。判定部38は比
較部36から出力されるデータと定数記憶部39から出
力されるデータを時間軸発生部40から出力されるクロ
ックに基づいて計時的に比較し、破裂音の種類を判定す
る。これは、比較部36からの出力がt1以内の場合に
/p/,比較部36からの出力がt2以内の場合に/t
/,比較部36からの出力がt3以内の場合に/k/と
し、それ以上の場合は破裂音ではないものとする。
【0019】以上のように本実施例のよれば、中域から
高域を通過させる第1の帯域通過手段31と、低域から
中域を通過させる第2の帯域通過手段32と、信号の短
区間平均振幅を算出する平均振幅抽出手段33、34
と、除算手段35と、除算手段35から出力されるデー
タとしきい値記憶部37から出力されるデータを比較す
る比較部36、定数を記憶するしきい値記憶部37と、
破裂音の時間長等を記憶した定数記憶部39と、クロッ
クを発生する時間軸発生部39と、比較部36から出力
されるデータと定数記憶部39から出力されるデータを
時間軸発生部40から出力されるクロックに基づいて計
時的に比較し破裂の種類を判定する判定部38とを設け
ることにより、中高域の短区間平均振幅と低中域の短区
間平均振幅の比を計時的に判定できるので、無声破裂音
の検出と破裂の種類の弁別を行なうことができる。した
がって、VOTが異なる無声破裂音/p/、/t/、/
k/に適応した区間長を設定することができる破裂性抽
出装置を構成することができる。
【0020】図5は本発明における第3の実施例におけ
る破裂性抽出装置の構成図を示すものである。図5にお
いて、31は中域から高域を通過させる第1の帯域通過
手段、32は低域から中域を通過させる第2の帯域通過
手段、33、34は信号の短区間平均振幅を算出する平
均振幅抽出手段、35は除算手段、51は除算手段35
の出力信号を時間微分する微分手段、52は入力信号を
絶対値する絶対値手段、36は絶対値手段52から出力
されるデータとしきい値記憶部37から出力されるデー
タを比較する比較手段、37は定数を記憶するしきい値
記憶部、39は破裂音の時間長等を記憶した定数記憶
部、40はクロックを発生する時間軸発生部、38は比
較部36から出力されるデータと定数記憶部39から出
力されるデータを時間軸発生部40から出力されるクロ
ックに基づいて計時的に比較し破裂の種類を判定する。
【0021】以上のように構成された破裂性抽出装置に
ついて、以下その動作を説明する。まず、入力された信
号は中域から高域、例えば3.7kHz〜5kHzを通
過させる第1の帯域通過手段31と低域から中域、例え
ば100Hz〜900Hzを通過させる第2の帯域通過
手段32へ伝達される。次に、帯域制限された信号は平
均振幅抽出手段33、34へ入力され、予め定められた
区間長の短区間平均振幅が算出される。次に、除算手段
35は、平均振幅抽出手段33の出力値を平均振幅抽出
手段34の出力値で除算し、信号の中高域成分の短区間
平均振幅と低中域の短区間平均振幅の比を算出する。微
分手段51は除算手段35から出力される信号を時間方
向に2階微分する。そして、絶対値手段52で絶対値化
される。次に、しきい値記憶部37は予め決められた定
数を記憶する。比較部36は絶対値手段52から出力さ
れるデータとしきい値記憶部37から出力されるデータ
を比較し、一定のレベルを越えている場合にデータを判
定部に伝達する。定数記憶部39は各破裂音/p/,/
t/,/k/の時間長に対応した定数t1,t2,t3
記憶する。時間軸発生部40は一定周期のクロックを発
生する。判定部38は比較部36から出力されるデータ
と定数記憶部39から出力されるデータを時間軸発生部
40から出力されるクロックに基づいて計時的に比較
し、破裂音の種類を判定する。これは、比較部36から
の出力がt1以内の場合に/p/,比較部36からの出
力がt2以内の場合に/t/,比較部36からの出力が
3以内の場合に/k/とし、それ以上の場合は破裂音
ではないものとする。図6に図5における各部の時間波
形を示す。図6(a)は・点(イ)における入力音声の
時間波形、図6(b)は点(ロ)における中高域の短区
間平均振幅と低中域の短区間平均振幅の比の時間波形、
図6(c)は点(ハ)における時間微分後の時間波形を
示す。
【0022】以上のように本実施例によれば、中域から
高域を通過させる第1の帯域通過手段31と、低域から
中域を通過させる第2の帯域通過手段32と、信号の短
区間平均振幅を算出する平均振幅抽出手段33、34
と、除算手段35と、除算手段35の出力信号を時間微
分する微分手段51と、入力信号を絶対値する絶対値手
段52と、絶対値手段52から出力されるデータとしき
い値記憶部37から出力されるデータを比較する比較部
36と、定数を記憶するしきい値記憶部37と、破裂音
の時間長等を記憶した定数記憶部39と、クロックを発
生する時間軸発生部39と、比較部36から出力される
データと定数記憶部39から出力されるデータを時間軸
発生部40から出力されるクロックに基づいて計時的に
比較し破裂の種類を判定する判定部38とを設けること
により、中高域の短区間平均振幅と低中域の短区間平均
振幅の比のコントラストが強調され、かつ、計時的に判
定できるので、無声破裂音の検出と破裂の種類の弁別を
行なうことができる。したがって、振幅が小さく、VO
Tが異なる無声破裂音/p/、/t/、/k/に適応し
た区間長を設定することができる破裂性抽出装置を構成
することができる。
【0023】図7は本発明における第4の実施例におけ
る音声信号処理装置の構成図を示すものである。図7に
おいて、11は入力信号から補償係数を計算する係数演
算手段、12は入力される信号を遅延する第1の遅延手
段、60は判定部38から伝達されるデータに基づいて
係数を1にする係数制御手段、13は第1の遅延手段1
2の出力と係数制御手段14の出力間の乗算を行なう乗
算手段である。61は入力信号のゼロクロス周波数を算
出するゼロクロス抽出手段、36はゼロクロス抽出手段
61から出力されるデータとしきい値記憶部37から出
力されるデータを比較する比較手段、37は定数を記憶
するしきい値記憶部、39は摩擦音の時間長等を記憶し
た定数記憶部、40はクロックを発生する時間軸発生
部、38は比較部36から出力されるデータと定数記憶
部39から出力されるデータを時間軸発生部40から出
力されるクロックに基づいて計時的に比較し摩擦性を判
定する。
【0024】以上のように構成された音声信号処理装置
について、以下その動作を説明する。
【0025】まず、入力s(t−b)は係数演算手段1
1と第1の遅延手段12とゼロクロス抽出手段61に入
力される。係数演算手段11は、その時刻t及びその前
後の入力信号に基づいて入力信号s(t)のレベルの変
化を抑える補償係数A(t)を求める。また、第1の遅
延手段12は、処理に要する時間だけ入力信号に遅延を
かけて、遅延された信号s(t)を出力する。次に、ゼ
ロクロス抽出手段61は音声のゼロクロス周波数を算出
する。また、しきい値記憶部37は予め決められた定数
を記憶する。比較部36はゼロクロス抽出手段61から
出力されるデータとしきい値記憶部37から出力される
データを比較し、一定のレベルを越えている場合にデー
タを判定部38に伝達する。定数記憶部39は予め定め
られた時間長に対応した定数t4を記憶する。時間軸発
生部40は一定周期のクロックを発生する。判定部38
は比較部36から出力されるデータと定数記憶部39か
ら出力されるデータを時間軸発生部40から出力される
クロックに基づいて計時的に比較し、比較部36からの
出力がt4よりも長い場合には摩擦音であると判定す
る。次に、係数制御手段60は判定部38からの入力が
無い場合は係数演算手段11から入力される補償係数A
(t)をそのまま通過させ、補償係数H(t)として出
力し、判定部38からの入力がある場合は補償係数A
(t)を1にして新しい補償係数H(t)を出力する。
乗算手段13は第1の遅延手段12から出力される値と
係数制御手段60から出力される値H(t)を乗算した
値を出力する。そして、第1の遅延手段19が記憶して
いる内容全体を1ポイントずつ遅延させる。
【0026】図8に図7における各波形を示す。図8
(a)は点(ニ)における第1の遅延手段12から出力
された原音声信号S(t)の時間波形、図8(b)は点
(ホ)におけるゼロクロス抽出手段61から出力される
ゼロクロス周波数の時間波形、図8(c)は点(ヘ)に
おける係数演算手段11から出力される補償係数A
(t)の時間波形、図8(d)は点(ト)における係数
制御手段60から出力される補償係数H(t)の時間波
形を示す。
【0027】以上のように本実施例によれば、入力信号
から補償係数を計算する係数演算手段11と、入力され
る信号を遅延する第1の遅延手段と、判定部38から伝
達されるデータに基づいて係数を1にする係数制御手段
60と、第1の遅延手段12の出力と係数制御手段14
の出力間の乗算を行なう乗算手段13と、入力信号のゼ
ロクロス周波数を算出するゼロクロス抽出手段61と、
ゼロクロス抽出手段61から出力されるデータとしきい
値記憶部37から出力されるデータを比較する比較手段
36と、定数を記憶するしきい値記憶部37と、摩擦音
の時間長等を記憶した定数記憶部39と、クロックを発
生する時間軸発生部40と、比較部36から出力される
データと定数記憶部39から出力されるデータを時間軸
発生部40から出力されるクロックに基づいて計時的に
比較し摩擦性を判定する判定部38とを設けることによ
り、摩擦区間の検出が行われ、係数演算手段11で求め
られた補償係数A(t)を1にすることができるので、
時間区間の長い摩擦音の一部の区間だけを増幅すること
による異聴を防ぐことができる音声信号処理装置を構成
できる。
【0028】
【発明の効果】本発明によれば、音声の破裂性を検出し
破裂子音の種類に適応して補償係数の時間区間長が制御
されるので、VOTを変化させること無く、安定した破
裂子音の増幅が行える。
【0029】また、ピッチ抽出手段と第2の遅延手段を
設けることにより、母音の直前の破裂子音の抽出がで
き、破裂子音と誤って増幅することを防げる。
【0030】さらに、ゼロクロス抽出手段により、摩擦
音の抽出を行い摩擦音を一部増幅することをなくし異聴
を防ぐことができる。
【0031】したがって、本発明の音声信号処理装置は
自然性を損なうことなく破裂子音の強調ができ、音声の
明瞭度を向上することができ、その実用的効果は大き
い。
【図面の簡単な説明】
【図1】本発明の第1の実施例における音声信号処理装
置の構成図
【図2】本発明の第1の実施例における音声信号処理装
置の各部波形図
【図3】本発明における特徴抽出手段の一実施例の構成
【図4】本発明の第2の実施例における破裂性抽出装置
の構成図
【図5】本発明の第3の実施例における破裂性抽出装置
の構成図
【図6】本発明における第3の実施例における破裂性抽
出装置の各部波形図
【図7】本発明の第4の実施例における音声信号処理装
置の構成図
【図8】本発明における第4の実施例における音声信号
処理装置の各部波形図
【図9】従来の音声信号処理装置の構成図
【図10】従来の音声信号処理装置の説明用信号波形図
【符号の説明】 11 係数演算手段 12 第1の遅延手段 13 乗算手段 14 係数制御手段 15 特徴抽出手段 21 第2の遅延手段 22 破裂性抽出手段 23 ピッチ抽出手段 24 判別部 31 第1の帯域通過手段 32 第2の帯域通過手段 33 平均振幅抽出手段 34 平均振幅抽出手段 35 除算手段 36 比較部 37 しきい値記憶部 38 判定部 39 定数記憶部 40 時間軸発生部 51 微分手段 52 絶対値手段 60 係数制御手段 61 ゼロクロス抽出手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 良二 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】入力信号のレベルの変化を抑える値を求め
    る係数演算手段と、処理時間を補償するために前記入力
    信号を遅延する第1の遅延手段と、前記入力信号から子
    音の特徴量を抽出する特徴抽出手段と、前記特徴抽出手
    段からの出力信号に基づいて係数演算手段で求められた
    値の振幅値、時間長を制御する係数制御手段と、前記第
    1の遅延手段から出力される信号と前記係数制御手段か
    ら出力される信号の乗算を行なう乗算手段とを備えたこ
    とを特徴とする音声信号処理装置。
  2. 【請求項2】特徴抽出手段は、入力音声信号のピッチを
    抽出するピッチ抽出手段と、前記入力音声信号を一定の
    時刻だけ遅延させる第2の遅延手段と、遅延された前記
    入力音声信号から破裂部分を抽出する破裂性抽出手段
    と、前記破裂性抽出手段からの出力と前記ピッチ抽出手
    段からの出力に基づいて、母音の直前に破裂部分がある
    場合に破裂音と判別する判別手段とを備えたことを特徴
    とする請求項1記載の音声信号処理装置。
  3. 【請求項3】入力信号の特定の周波数帯域のみを通過さ
    せて出力する第1の帯域通過手段と、前記第1の帯域通
    過手段の周波数帯域とは異なる特定の周波数帯域のみを
    通過させて出力する第2の帯域通過手段と、前記第1の
    帯域通過手段から出力される信号の短区間平均振幅を求
    める第1の平均振幅抽出手段と、前記第2の帯域通過手
    段から出力される信号の短区間平均振幅を求める第2の
    平均振幅抽出手段と、前記第1の平均振幅手段から出力
    される値を前記第2の平均振幅抽出手段から出力される
    値で除算する除算手段と、しきい値データを記憶してお
    く第1の記憶手段と、前記除算手段から出力される値と
    前記第1の記憶手段から出力されるしきい値を比較する
    比較手段と、時間幅に対応した定数を記憶しておく第2
    の記憶手段と、時間幅が一定なパルスを出力する時間軸
    発生手段と、比較手段から出力される時間が第2の記憶
    手段に記憶された時間幅内に入る場合には破裂音と判定
    する判定手段とを備えたことを特徴とする破裂性抽出装
    置。
  4. 【請求項4】入力信号の特定の周波数帯域のみを通過さ
    せて出力する第1の帯域通過手段と、前記第1の帯域通
    過手段の周波数帯域とは異なる特定の周波数帯域のみを
    通過させて出力する第2の帯域通過手段と、前記第1の
    帯域通過手段から出力される信号の短区間平均振幅を求
    める第1の平均振幅抽出手段と、前記第2の帯域通過手
    段から出力される信号の短区間平均振幅を求める第2の
    平均振幅抽出手段と、前記第1の平均振幅手段から出力
    される値を前記第2の平均振幅抽出手段から出力される
    値で除算する除算手段と、前記除算手段の出力信号の時
    間微分を行なう微分手段と、前記微分手段の出力値の絶
    対値化を行なう絶対値手段と、しきい値データを記憶し
    ておく第1の記憶手段と、前記絶対値手段から出力され
    る値と前記第1の記憶手段から出力されるしきい値を比
    較する比較手段と、時間幅に対応した定数を記憶してお
    く第2の記憶手段と、時間幅が一定なパルスを出力する
    時間軸発生手段と、比較手段から出力される時間が第2
    の記憶手段に記憶された時間幅内に入る場合には破裂音
    と判定する判定手段とを備えたことを特徴とする破裂性
    抽出装置。
  5. 【請求項5】第2の記憶手段は各破裂子音/p/,/t
    /,/k/に対応する時間幅t1,t2,t3を記憶して
    いることを特徴とする請求項3または4記載の破裂性抽
    出装置。
  6. 【請求項6】第2の記憶手段は(数1)で示す関係を有
    することを特徴とする請求項3または4記載の破裂性抽
    出装置。 【数1】
  7. 【請求項7】微分手段は、時間方向に2階微分されるこ
    とを特徴とする請求項4記載の破裂抽出装置。
  8. 【請求項8】特徴抽出手段が、請求項3または4記載の
    破裂性抽出装置を備えたことを特徴とする請求項1記載
    の音声信号処理装置。
  9. 【請求項9】入力信号のレベルの変化を抑える値を求め
    る係数演算手段と、処理時間を補償するために前記入力
    信号を遅延する第1の遅延手段と、前記入力信号からゼ
    ロクロス周波数を抽出するゼロクロス抽出手段と、しき
    い値データを記憶しておく第1の記憶手段と、前記ゼロ
    クロス抽出手段から出力される値と前記第1の記憶手段
    から出力されるしきい値を比較する比較手段と、時間幅
    に対応した定数を記憶しておく第2の記憶手段と、時間
    幅が一定なパルスを出力する時間軸発生手段と、比較手
    段から出力される時間が第2の記憶手段に記憶された時
    間幅以上の場合には摩擦音と判定する判定手段と前記判
    定手段からの出力信号に基づいて係数演算手段で求めら
    れた値の振幅値、時間長を制御する係数制御手段と、前
    記第1の遅延手段から出力される信号と前記係数制御手
    段から出力される信号の乗算を行なう乗算手段とを備え
    たことを特徴とする音声信号処理装置。
JP4109451A 1992-04-28 1992-04-28 音声信号処理装置と破裂性抽出装置 Pending JPH075898A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4109451A JPH075898A (ja) 1992-04-28 1992-04-28 音声信号処理装置と破裂性抽出装置
US08/052,698 US5583969A (en) 1992-04-28 1993-04-26 Speech signal processing apparatus for amplifying an input signal based upon consonant features of the signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4109451A JPH075898A (ja) 1992-04-28 1992-04-28 音声信号処理装置と破裂性抽出装置

Publications (1)

Publication Number Publication Date
JPH075898A true JPH075898A (ja) 1995-01-10

Family

ID=14510574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4109451A Pending JPH075898A (ja) 1992-04-28 1992-04-28 音声信号処理装置と破裂性抽出装置

Country Status (2)

Country Link
US (1) US5583969A (ja)
JP (1) JPH075898A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6921133B2 (en) 2001-02-21 2005-07-26 Daihatsu Motor Co., Ltd. Seat for car
JP2014194554A (ja) * 2009-01-29 2014-10-09 Panasonic Corp 補聴器および補聴処理方法
US9701915B2 (en) 2012-01-25 2017-07-11 Mitsubishi Hitachi Power Systems, Ltd. Gasification furnace, gasification power plant, and method of preventing blockage of slag hole in gasification furnance

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119089A (en) * 1998-03-20 2000-09-12 Scientific Learning Corp. Aural training method and apparatus to improve a listener's ability to recognize and identify similar sounds
US6021389A (en) * 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
AUPQ366799A0 (en) * 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
US6889186B1 (en) * 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
US7155385B2 (en) * 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
JP2004297273A (ja) * 2003-03-26 2004-10-21 Kenwood Corp 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム
AU2003903576A0 (en) * 2003-07-11 2003-07-24 Cochlear Limited Audio path diagnostics
US8023673B2 (en) * 2004-09-28 2011-09-20 Hearworks Pty. Limited Pitch perception in an auditory prosthesis
US7660715B1 (en) 2004-01-12 2010-02-09 Avaya Inc. Transparent monitoring and intervention to improve automatic adaptation of speech models
US7892648B2 (en) * 2005-01-21 2011-02-22 International Business Machines Corporation SiCOH dielectric material with improved toughness and improved Si-C bonding
US7529670B1 (en) 2005-05-16 2009-05-05 Avaya Inc. Automatic speech recognition system for people with speech-affecting disabilities
US7653543B1 (en) 2006-03-24 2010-01-26 Avaya Inc. Automatic signal adjustment based on intelligibility
US7962342B1 (en) 2006-08-22 2011-06-14 Avaya Inc. Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns
US7925508B1 (en) 2006-08-22 2011-04-12 Avaya Inc. Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
US8935158B2 (en) * 2006-12-13 2015-01-13 Samsung Electronics Co., Ltd. Apparatus and method for comparing frames using spectral information of audio signal
US7675411B1 (en) 2007-02-20 2010-03-09 Avaya Inc. Enhancing presence information through the addition of one or more of biotelemetry data and environmental data
US8041344B1 (en) 2007-06-26 2011-10-18 Avaya Inc. Cooling off period prior to sending dependent on user's state
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
KR101849423B1 (ko) 2010-06-30 2018-04-16 메드-엘 엘렉트로메디지니쉐 게라에테 게엠베하 엔벨로프 특정 자극 타이밍
JP6284003B2 (ja) * 2013-03-27 2018-02-28 パナソニックIpマネジメント株式会社 音声強調装置及び方法
DE102019102414B4 (de) 2019-01-31 2022-01-20 Harmann Becker Automotive Systems Gmbh Verfahren und System zur Detektion von Reibelauten in Sprachsignalen

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3679830A (en) * 1970-05-11 1972-07-25 Malcolm R Uffelman Cohesive zone boundary detector
JPS5712999B2 (ja) * 1974-04-08 1982-03-13
US4181813A (en) * 1978-05-08 1980-01-01 John Marley System and method for speech recognition
US4817155A (en) * 1983-05-05 1989-03-28 Briar Herman P Method and apparatus for speech analysis
AT379274B (de) * 1983-12-22 1985-12-10 Akg Akustische Kino Geraete Anordnung zur unterdrueckung der amplitudenspitzen am beginn von explosivlauten in einem elektroakustischen uebertragungssystem, an dessen eingang ein mikrophon angeordnet ist
US4780906A (en) * 1984-02-17 1988-10-25 Texas Instruments Incorporated Speaker-independent word recognition method and system based upon zero-crossing rate and energy measurement of analog speech signal
JPS60181798A (ja) * 1984-02-28 1985-09-17 電子計算機基本技術研究組合 音声認識装置
JPS62232691A (ja) * 1986-04-03 1987-10-13 株式会社リコー 音声認識装置
JPH07113840B2 (ja) * 1989-06-29 1995-12-06 三菱電機株式会社 音声検出器
JP2751604B2 (ja) * 1990-09-07 1998-05-18 松下電器産業株式会社 音声信号処理装置と音声信号処理方法
US5146504A (en) * 1990-12-07 1992-09-08 Motorola, Inc. Speech selective automatic gain control
US5408581A (en) * 1991-03-14 1995-04-18 Technology Research Association Of Medical And Welfare Apparatus Apparatus and method for speech signal processing

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6921133B2 (en) 2001-02-21 2005-07-26 Daihatsu Motor Co., Ltd. Seat for car
JP2014194554A (ja) * 2009-01-29 2014-10-09 Panasonic Corp 補聴器および補聴処理方法
US9701915B2 (en) 2012-01-25 2017-07-11 Mitsubishi Hitachi Power Systems, Ltd. Gasification furnace, gasification power plant, and method of preventing blockage of slag hole in gasification furnance

Also Published As

Publication number Publication date
US5583969A (en) 1996-12-10

Similar Documents

Publication Publication Date Title
JPH075898A (ja) 音声信号処理装置と破裂性抽出装置
US5572593A (en) Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same
US7363232B2 (en) Method and system for enabling audio speed conversion
CN105706167A (zh) 有语音的话音检测方法和装置
EP0647935B1 (en) A speech enhancement apparatus
US6091013A (en) Attack transient detection for a musical instrument signal
US5864793A (en) Persistence and dynamic threshold based intermittent signal detector
JP2564821B2 (ja) 音声判定検出装置
JPS6257040B2 (ja)
US5208861A (en) Pitch extraction apparatus for an acoustic signal waveform
JPH05249994A (ja) 音声強調装置
JP5177657B2 (ja) 音響特性制御装置
JP3237350B2 (ja) 自動利得制御装置
JPH05100661A (ja) 小節境界時刻抽出装置
WO1993009531A1 (en) Processing of electrical and audio signals
KR930010853A (ko) 음소(音素)녹음 및 음성재생 방법 및 그 장치
JPS59124397A (ja) 無音区間検出回路
KR970012536A (ko) 에코(Echo)/반주음 보정장치 및 그 방법
JP2734526B2 (ja) ピッチ抽出装置
JPH0698398A (ja) 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法
JPS61140999A (ja) 音声区間検出方式
SU836656A1 (ru) Способ обнаружени пауз в речевомСигНАлЕ
JPS638698A (ja) リズム表示装置
KR100322203B1 (ko) 차량의 음성인식장치 및 그 방법
JP2009186273A (ja) 音検知装置