JP2000315091A - 音声信号の立ち上がり検出装置 - Google Patents

音声信号の立ち上がり検出装置

Info

Publication number
JP2000315091A
JP2000315091A JP11122944A JP12294499A JP2000315091A JP 2000315091 A JP2000315091 A JP 2000315091A JP 11122944 A JP11122944 A JP 11122944A JP 12294499 A JP12294499 A JP 12294499A JP 2000315091 A JP2000315091 A JP 2000315091A
Authority
JP
Japan
Prior art keywords
audio signal
average power
threshold value
signal
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11122944A
Other languages
English (en)
Inventor
Naoya Tanaka
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11122944A priority Critical patent/JP2000315091A/ja
Publication of JP2000315091A publication Critical patent/JP2000315091A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 少ない演算量で音声信号の立ち上がりを
検出するとともに、立ち上がりの検出誤りが増加するこ
とを防止し、立ち上がりを安定して検出すること。 【解決手段】 周期性算出部109は、入力音声信号の
周期性の度合いをパラメータ値として算出し、比較検出
部110は、1フレーム内の平均パワと複数フレームに
渡る長時間平均パワとからパワ比を算出し、そのパワ比
と、入力音声信号の周期性の度合いに従って可変である
しきい値とを比較し、比較結果より音声信号の立ち上が
りを検出し、検出結果を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号の立ち上
がり検出装置に関し、特に入力音声信号の性質によって
変換ブロック長を変化させる適応ブロック長変換を用い
た音声符号化装置における音声信号の立ち上がり検出装
置およびその検出方法に関する。
【0002】
【従来の技術】人間の音声、音楽など、一般の音声信号
を高能率に圧縮し符号化する方法として、ブロック変換
を利用して符号化する方法が知られている。これは、入
力信号を、ある長さのブロック(またはフレーム)に分
割し、分割されたブロック内の音声信号に対して直交変
換を施し、変換された信号(変換係数)を符号化するも
のである。
【0003】直交変換後の変換係数は、そのエネルギ分
布が、直交変換を行う前の入力音声信号と比較して偏っ
ているため、変換係数のうち、エネルギ分布が集中して
いる部分を重点的に符号化することにより、直交変換を
用いない符号化方法と比較して、高い圧縮効率を得るこ
とができる。
【0004】直交変換の方法としては、MDCT(Modif
ied Discrete Cosine Transform)を用いるのが一般的で
あるが、変換されたMDCT係数のエネルギ集中度は、
変換ブロック長が長いほど高まるため、圧縮効率を高め
るためには、変換ブロック長を長く取った方がよい。
【0005】その一方で、MDCT係数の量子化に伴う
誤差は、逆変換によりブロック全体に拡散することにな
るため、特に、変換ブロック内に急峻な立ち上がり部分
が存在しているときには、変換ブロック内の立ち上がり
より前の部分に、プリエコーと呼ばれるノイズが発生す
る。変換ブロック長を長くすると、必然的にプリエコー
の持続時間も長くなり、聴覚的な音質の劣化につなが
る。
【0006】このようなプリエコーによる音質の劣化を
抑えるために、適応ブロック長変換と呼ばれる技術が用
いられる。これは、プリエコーの発生が予想される音声
信号の立ち上がりを検出し、立ち上がりと判定された部
分については変換ブロック長を短くすることによって、
プリエコーの持続時間を短縮し、聴覚的な劣化を抑える
というものである。
【0007】このような、適応ブロック長変換を用いた
符号化方式としては、例えば、ISO/IEC標準MP
EG2オーディオ符号化方式(IS−11172−3)
があり、その規格書において、音声信号の立ち上がり部
分を検出する方法が開示されている。
【0008】MPEG2オーディオ標準規格で開示され
る方法によれば、変換ブロックに分割された入力音声信
号をフーリエ変換し、そのフーリエ変換係数を複数の帯
域(サブバンド)に分割し、心理聴覚モデルに基づいて
各サブバンド毎に算出される音声信号対最小可聴ノイズ
比SMR(Signal-to-Mask Ratio)を基に、心理聴覚エン
トロピと呼ばれる値が算出され、この値をあらかじめ任
意に定められたしきい値と比較することにより、音声信
号の立ち上がりを検出する。
【0009】しかし、上記フーリエ変換と心理聴覚モデ
ルを用いる方法では、長い変換ブロック(例えば、10
24サンプル以上)を用いる場合に演算量が多くなると
いう問題がある。この問題を解決するために、本発明者
は、音声信号の立ち上がり検出を時間領域で行う方法を
用いた音声信号の立ち上がり検出装置を先に提案し、こ
の検出装置によれば、音声信号の立ち上がり検出をする
ためのすべての処理を時間領域で行うため、フーリエ変
換処理を行う必要がなく、少ない演算量で音声信号の立
ち上がりを検出することができる(特開平11−309
1)。以下、図面を用いて上記本発明者が先に提案した
音声信号の立ち上がり検出装置の構成および動作につい
て説明する。
【0010】図6は、特開平11−3091号公報にお
いて本発明者が先に提案した上記音声信号の立ち上がり
検出装置の概略構成を示す要部ブロック図である。ま
ず、構成について説明する。図6において、フレームミ
ング部11は、サンプリング周波数fsでサンプリング
された入力音声信号をあらかじめ任意に定められた長さ
のフレームに分割する。
【0011】第1平均パワ算出部12は、フレーミング
された入力音声信号のフレーム内の平均パワを算出す
る。ダウンサンプラ部13は、入力音声信号をダウンサ
ンプリングする。第2平均パワ算出部14は、ダウンサ
ンプリングされた入力音声信号のフレーム内の平均パワ
を算出する。パワ減少部15は、第2平均パワ算出部1
4において算出されたフレーム平均パワを減少させる。
減算器16は、第1平均パワ算出部12において算出さ
れた平均パワから、パワ減少部15において減少された
平均パワを減算する。
【0012】長時間平均パワ算出部17は、減算器16
において減算処理された平均パワをさらに複数フレーム
にわたって平均し、長時間平均パワを算出する。比較検
出部18は、減算処理された平均パワと長時間平均パワ
とからパワ比を算出し、そのパワ比とあらかじめ比較検
出部18に任意に定められたしきい値とを比較し、比較
結果より音声信号の立ち上がりを検出し、検出結果を出
力する。
【0013】次いで、上記構成を有する音声信号の立ち
上がり検出装置における動作について説明する。フレー
ミング部11において、あらかじめ任意に定められた長
さのフレームに分割された入力音声信号は、一方では、
第1平均パワ算出部12に入力され、もう一方では、ダ
ウンサンプラ部13に入力される。フレームの長さとし
ては、2msから6ms程度が適当である。
【0014】第1平均パワ算出部12においては、フレ
ーム内の入力音声信号からフレーム平均パワが算出され
る。このフレーム平均パワは、フレーム内の入力音声信
号に含まれる全周波数成分のパワを含むフレーム平均パ
ワである。
【0015】一方、ダウンサンプラ部13においては、
入力された音声信号に対して、ダウンサンプリングレー
トDRでダウンサンプリング処理が施される。その結
果、ダウンサンプリングされた入力音声信号のサンプリ
ング周波数はfs/DRとなり、サンプリング定理によ
って、ダウンサンプリングされた入力音声信号に含まれ
る信号の帯域はfs/2DRとなる。
【0016】ここで、入力音声信号のサンプリング周波
数fsが、48kHzないしは44.1kHzのハイク
オリティ音声の場合、ダウンサンプリングレートDRは
4から6程度が適当であり、例えば、fsが48kHz
でDRが6ならば、ダウンサンプリング後のサンプリン
グ周波数は8kHz、含まれる信号の帯域は4kHzと
なる。
【0017】そして、第2平均パワ算出部14におい
て、ダウンサンプリングされた入力音声信号のフレーム
平均パワが算出される。このとき、入力音声信号はダウ
ンサンプリングによりサンプル点数が1/DRに減少し
ているため、フレーム平均パワ算出に必要な演算量も1
/DRに減少する。また、ここで算出されるフレーム平
均パワは、上記サンプリング定理により、入力音声信号
中の低域成分のみのフレーム平均パワとなる。
【0018】算出された低域成分のフレーム平均パワ
は、パワ減少手部15において、わずかに値を減じられ
た後、減算器16によって、全周波数成分のフレーム平
均パワから減算される。全周波数成分から低域成分が減
算された結果、高域成分のみが残されることとなり、高
域成分のフレーム平均パワが求められる。この高域成分
のフレーム平均パワは、長時間平均パワ算出部17およ
び比較検出部18に入力される。
【0019】長時間平均パワ算出部17においては、高
域成分のフレーム平均パワがさらに複数フレームにわた
って平均され、高域成分の長時間平均パワが算出され
る。長時間平均パワ算出に用いられるフレーム数は、一
般にフレーム長に依存するが、時間長としては20ms
から50ms程度が望ましく、例えば、フレーム長を5
msとすると、長時間平均パワ算出に用いられるフレー
ム数は、4から10程度となる。高域成分の長時間平均
パワは、比較検出部18に入力される。
【0020】比較検出部18においては、高域成分のフ
レーム平均パワを高域成分の長時間平均パワで除するこ
とによってパワ比が算出され、そのパワ比とあらかじめ
比較検出部18に任意に定められたしきい値とが比較さ
れ、パワ比がしきい値を超えるときに、フレーミング部
11から出力されたフレーム内の入力音声信号に入力音
声信号の立ち上がりが存在すると検出され、検出結果が
出力される。
【0021】高域成分のフレーム平均パワおよび高域成
分の長時間平均パワを比較対象として用いるのは、以下
の理由による。すなわち、周波数的に見ると、入力音声
信号は、通常、エネルギーが低域側に分布しているのに
対し、プリエコーの発生による音声品質の劣化が問題と
なるような鋭い立ち上がり部分は、通常、エネルギーが
非常に広い帯域にわたって分布している。従って、入力
音声信号に鋭い立ち上がり部分が生じた場合には、特
に、高域側でのパワ変化が顕著となるので、立ち上がり
の検出を比較的容易に行えるからである。
【0022】なお、比較検出部18におけるしきい値と
の比較対象としては、前記フレーム平均パワ対長時間平
均パワのパワ比の他に、フレーム平均パワおよび長時間
平均パワの絶対値、フレーム平均パワと長時間平均パワ
の差、前フレームと現フレームの間でのフレーム平均パ
ワの変化比等から1つないしは複数を選択し、組み合わ
せて使用することもできる。
【0023】また、しきい値については、固定値を用い
る代わりに、例えば、しきい値を超えるような値が連続
するようなときにはしきい値を引き上げ、逆に、しきい
値を超えないような値が連続するときにはしきい値を引
き下げるような、入力音声信号の状態によって適応的に
制御されるしきい値を用いてもよい。
【0024】このように、上記本発明者が先に提案した
音声信号の立ち上がり検出装置によれば、音声信号の立
ち上がり検出をするためのすべての処理を時間領域で行
うため、フーリエ変換処理を行う必要がなく、少ない演
算量で音声信号の立ち上がりを検出することができる
【0025】
【発明が解決しようとする課題】しかしながら、上記本
発明者が先に提案した音声信号の立ち上がり検出装置で
は、入力音声信号の大部分が、周波数的なエネルギー分
布がある時間において非常に偏っている信号、すなわち
単一周波数分布に近いトーン性の信号である場合には、
エネルギー分布のピークが帯域制限された周波数帯域内
に存在するか帯域外に存在するかによって、算出される
平均パワの値が影響を受けるため、この影響を考慮せず
にしきい値を設定すると、立ち上がりの検出誤りが増加
することが考えられる。
【0026】また、入力音声信号が時間的に短い間隔で
急激なパワ変動を繰り返す場合には、長時間平均パワの
値が上昇してフレーム平均パワとの差が小さくなるた
め、判定値に長時間平均パワとフレーム平均パワとのパ
ワ比等を用いると、立ち上がりの検出誤りが増加するこ
とが考えられる。
【0027】本発明はかかる点に鑑みてなされたもので
あり、少ない演算量で音声信号の立ち上がりを検出する
とともに、立ち上がりの検出誤りが増加することを防止
し、立ち上がりを安定して検出することができる音声信
号の立ち上がり検出装置を提供することを目的とする。
【0028】
【課題を解決するための手段】本発明者は、立ち上がり
の検出誤りが増加することが考えられる原因は、音声信
号の特性に基づくしきい値制御が行われていないこと
や、音声信号の立ち上がりを示す判定値の設定が適正で
ないことにあると着目して、音声信号の特性に応じたし
きい値制御を行うことや、立ち上がりの発生分布を示す
値等のような適正な判定値を用いることによって、検出
誤りが増加することを防止することができることを見出
し、本発明をするに至った。
【0029】すなわち、本発明の骨子は、音声信号の周
期性に応じて適応的にしきい値を制御し、またはパワ比
等に代えて平均パワの分布の広がりを示す値を立ち上が
りの判定値として用いることである。
【0030】
【発明の実施の形態】本発明の第1の態様に係る音声信
号の立ち上がり検出装置は、音声信号を任意の長さのフ
レームに分割する分割手段と、分割されたフレーム内の
音声信号の平均パワから求められた判定値についてしき
い値判定を行う判定手段と、音声信号の特性に応じて前
記しきい値判定におけるしきい値を制御する制御手段
と、前記しきい値判定の判定結果により音声信号の立ち
上がりを検出する検出手段と、を具備する構成を採る。
【0031】この構成によれば、音声信号の特性に応じ
て、音声信号の立ち上がりの検出に用いるしきい値を可
変とするため、音声信号がトーン性の信号であっても、
その立ち上がりを安定して検出することができる。
【0032】本発明の第2の態様に係る音声信号の立ち
上がり検出装置は、第1の態様において、前記制御手段
は、音声信号の周期性の度合いを算出し、その周期性の
度合いが大きいほど前記しきい値を下げる構成を採る。
【0033】この構成によれば、入力音声信号の周期性
の度合に応じて、音声信号の立ち上がりの検出に用いる
しきい値を可変とするため、入力音声信号がトーン性の
信号であっても、その立ち上がりを安定して検出するこ
とができる。
【0034】本発明の第3の態様に係る音声信号の立ち
上がり検出装置は、第1の態様または第2の態様におい
て、前記制御手段は、音声信号の周波数を算出し、その
周波数が高いほど前記しきい値を下げる構成を採る。
【0035】この構成によれば、音声信号の周波数に応
じて、音声信号の立ち上がりの検出に用いるしきい値を
可変とするため、入力音声信号がトーン性の信号であっ
ても、その立ち上がりを安定して検出することができ
る。
【0036】本発明の第4の態様に係る音声信号の立ち
上がり検出装置は、第1の態様から第3の態様のいずれ
かにおいて、音声信号をダウンサンプリングするダウン
サンプリング手段を具備し、前記制御手段は、前記ダウ
ンサンプリングした音声信号の特性に応じてしきい値を
制御する構成を採る。
【0037】この構成によれば、音声信号のサンプル点
数が減少するため、音声信号の周期性の度合いまたは音
声信号の周波数を算出する際の演算量を削減することが
できる。
【0038】本発明の第5の態様に係る音声信号の立ち
上がり検出装置は、第1の態様から第4の態様のいずれ
かにおいて、前記判定値算出手段は、前記1フレーム内
の平均パワと前記複数フレーム間に渡る平均パワとから
1フレーム内の平均パワの分布の広がりを示す値を判定
値として算出する構成を採る。
【0039】この構成によれば、分布の広がりを示す値
を判定値として用いるため、複数フレーム区間内に複数
の立ち上がり部分が含まれる場合でも、立ち上がりを安
定して検出することができる。
【0040】本発明の第6の態様に係る音声符号化装置
は、第1の態様から第5の態様のいずれかの音声信号の
立ち上がり検出装置を搭載する構成を採る。
【0041】本発明の第7の態様に係る無線通信端末装
置は、第6の態様の音声符号化装置を搭載する構成を採
る。
【0042】本発明の第8の態様に係る無線通信基地局
制御装置は、第6の態様の音声符号化装置を搭載する構
成を採る。
【0043】これらの構成によれば、音声信号がトーン
性の信号であっても、その立ち上がりを安定して検出す
ることができる。
【0044】本発明の第9の態様に係る音声信号の立ち
上がり検出方法は、音声信号を任意の長さのフレームに
分割する分割工程と、分割されたフレーム内の音声信号
の平均パワから求められた判定値についてしきい値判定
を行う判定工程と、音声信号の特性に応じて前記しきい
値判定におけるしきい値を制御する制御工程と、前記し
きい値判定の判定結果により音声信号の立ち上がりを検
出する検出工程と、を具備するようにした。
【0045】この方法によれば、音声信号の特性に応じ
て、音声信号の立ち上がりの検出に用いるしきい値を可
変とするため、音声信号がトーン性の信号であっても、
その立ち上がりを安定して検出することができる。
【0046】以下、本発明の実施の形態について、図面
を参照して詳細に説明する。 (実施の形態1)本発明の実施の形態1に係る音声信号
の立ち上がり検出装置は、音声信号の周期性の度合また
は音声信号の周波数に応じて、音声信号の立ち上がりの
検出に用いるしきい値を可変とするものである。
【0047】以下、図1を用いて、本発明の実施の形態
1に係る音声信号の立ち上がり検出装置について説明す
る。図1は、本発明の実施の形態1に係る音声信号の立
ち上がり検出装置の概略構成を示す要部ブロック図であ
る。図1において、フレームミング部101は、サンプ
リング周波数fsでサンプリングされた入力音声信号を
あらかじめ任意に定められた長さのフレームに分割す
る。
【0048】第1平均パワ算出部102は、フレーミン
グされた入力音声信号のフレーム内の平均パワを算出す
る。ダウンサンプラ部103は、入力音声信号をダウン
サンプリングする。第2平均パワ算出部104は、ダウ
ンサンプリングされた入力音声信号のフレーム内の平均
パワを算出する。パワ減少部105は、第2平均パワ算
出部104において算出されたフレーム平均パワを減少
させる。減算器106は、第1平均パワ算出部102に
おいて算出された平均パワから、パワ減少部105にお
いて減少された平均パワを減算する。
【0049】長時間平均パワ算出部107は、減算器1
06において減算処理された平均パワをさらに複数フレ
ームにわたって平均し、長時間平均パワを算出する。バ
ッファ108は、入力音声信号を一時的に蓄積する。周
期性算出部109は、入力音声信号の周期性の度合いを
パラメータ値として算出する。
【0050】比較検出部110は、減算処理された平均
パワと長時間平均パワとからパワ比を算出し、そのパワ
比と、入力音声信号の周期性の度合いに従って可変であ
るしきい値とを比較し、比較結果より音声信号の立ち上
がりを検出し、検出結果を出力する。
【0051】次いで、上記構成を有する音声信号の立ち
上がり検出装置の動作について説明する。フレーミング
部101において、あらかじめ任意に定められた長さの
フレームに分割された入力音声信号は、一方では、第1
平均パワ算出部102に入力され、一方では、ダウンサ
ンプラ部103に入力され、さらにもう一方では、バッ
ファ108に入力される。フレームの長さとしては、2
msから6ms程度が適当である。
【0052】第1平均パワ算出部102においては、フ
レーム内の入力音声信号からフレーム平均パワが算出さ
れる。このフレーム平均パワは、フレーム内の入力音声
信号に含まれる全周波数成分のパワを含むフレーム平均
パワである。
【0053】一方、ダウンサンプラ部103において
は、入力された音声信号に対して、ダウンサンプリング
レートDRでダウンサンプリング処理が施される。その
結果、ダウンサンプリングされた入力音声信号のサンプ
リング周波数はfs/DRとなり、サンプリング定理に
よって、ダウンサンプリングされた入力音声信号に含ま
れる信号の帯域はfs/2DRとなる。
【0054】ここで、入力音声信号のサンプリング周波
数fsが、48kHzないしは44.1kHzのハイク
オリティ音声の場合、ダウンサンプリングレートDRは
4から6程度が適当であり、例えば、fsが48kHz
でDRが6ならば、ダウンサンプリング後のサンプリン
グ周波数は8kHz、含まれる信号の帯域は4kHzと
なる。
【0055】そして、第2平均パワ算出部104におい
て、ダウンサンプリングされた入力音声信号のフレーム
平均パワが算出される。このとき、入力音声信号はダウ
ンサンプリングによりサンプル点数が1/DRに減少し
ているため、フレーム平均パワ算出に必要な演算量も1
/DRに減少する。また、ここで算出されるフレーム平
均パワは、上記サンプリング定理により、入力音声信号
中の低域成分のみのフレーム平均パワとなる。
【0056】算出された低域成分のフレーム平均パワ
は、パワ減少手部105において、わずかに値を減じら
れた後、減算器106によって、全周波数成分のフレー
ム平均パワから減算される。全周波数成分から低域成分
が減算された結果、高域成分のみが残されることとな
り、高域成分のフレーム平均パワが求められる。この高
域成分のフレーム平均パワは、長時間平均パワ算出部1
07および比較検出部110に入力される。
【0057】長時間平均パワ算出部107においては、
高域成分のフレーム平均パワがさらに複数フレームにわ
たって平均され、高域成分の長時間平均パワが算出され
る。長時間平均パワ算出に用いられるフレーム数は、一
般にフレーム長に依存するが、時間長としては20ms
から50ms程度が望ましく、例えば、フレーム長を5
msとすると、長時間平均パワ算出に用いられるフレー
ム数は、4から10程度となる。高域成分の長時間平均
パワは、比較検出部110に入力される。
【0058】一方、バッファ部108においては、一般
に周期性の検出にはフレーム長よりも長い時間の信号が
必要とされるため、入力された音声信号が一時的に蓄積
される。そして、バッファ部108においては、周期性
の検出に必要な時間長の信号が蓄積された時点で、その
信号が周期性算出部109に出力される。
【0059】周期性算出部109においては、バッファ
部108より出力された信号より、入力音声信号の周期
性の度合い示すパラメータ値が算出される。周期性の度
合いを示すパラメータとしては、例えば、入力音声信号
の自己相関係数を利用することができる。
【0060】ここで、入力音声信号の自己相関係数の算
出方法について説明する。周期性算出部109は、以下
の式(1)および式(2)により、周期性の度合いを示
すパラメータ値として、入力音声信号の自己相関係数を
算出する。
【数1】 上式(1)において、X(k)は入力音声信号のフレーム
内のk番目のサンプル点、X(k+i)は入力音声信号の
フレーム内のk+i番目のサンプル点であり、iは0か
ら自己相関係数を算出したい最大周期のサンプル点まで
1づつ増加する。また、nは自己相関係数を算出する入
力音声信号のフレーム内の総サンプル点数である。上式
(1)により算出された、それぞれの自己相関係数C
(i)を、以下の式(2)により、入力音声信号のエネル
ギーC(0)で正規化する。
【数2】 この正規化された自己相関係数Cn(i)は、X(k)と、
X(k)とiサンプル離れたX(k+i)が類似しているほ
ど大きな値となる。また、X(k)と、X(k)とiサンプ
ル離れたX(k+i)が類似しているということは、入力
音声信号がiサンプルの周期を持っていることになる。
従って、Cn(i)の最大値を求め、これを入力音声信号
の周期性の度合いを示すパラメータ値として利用する。
【0061】なお、ここでは周期性の度合いを示すパラ
メータ値として例えば自己相関係数を利用したが、これ
に限られるものではなく、周期性の度合いを示すことが
できれば、他のパラメータを利用しても構わない。
【0062】比較検出部110においては、高域成分の
フレーム平均パワを高域成分の長時間平均パワで除する
ことによってパワ比が算出され、そのパワ比と、周期性
算出部109より出力される入力音声信号の周期性の度
合いを示すパラメータ値に従って可変であるしきい値と
が比較され、パワ比がしきい値を超えるときに、フレー
ミング部101から出力されたフレーム内の入力音声信
号に入力音声信号の立ち上がりが存在すると検出され、
検出結果が出力される。なお、しきい値の制御について
は、後に詳述する。
【0063】高域成分のフレーム平均パワおよび高域成
分の長時間平均パワを比較対象として用いるのは、以下
の理由による。すなわち、周波数的に見ると、入力音声
信号は、通常、エネルギーが低域側に分布しているのに
対し、プリエコーの発生による音声品質の劣化が問題と
なるような鋭い立ち上がり部分は、通常、エネルギーが
非常に広い帯域にわたって分布している。従って、入力
音声信号に鋭い立ち上がり部分が生じた場合には、特
に、高域側でのパワ変化が顕著となるので、立ち上がり
の検出を比較的容易に行えるからである。
【0064】なお、比較検出部110におけるしきい値
との比較対象としては、前記フレーム平均パワ対長時間
平均パワのパワ比の他に、フレーム平均パワおよび長時
間平均パワの絶対値、フレーム平均パワと長時間平均パ
ワの差、前フレームと現フレームの間でのフレーム平均
パワの変化比等から1つないしは複数を選択し、組み合
わせて使用することもできる。
【0065】ここで、入力音声信号の周期性の度合いを
示すパラメータ値に従って可変であるしきい値の制御方
法について図2を用いて詳細に説明する。図2は、入力
音声信号の周波数的なエネルギー分布と入力音声信号の
立ち上がりを示す信号の周波数的なエネルギー分布とを
示すエネルギー分布図である。
【0066】一般に、信号の周波数的なエネルギー分布
が特定の周波数成分に偏っているほど、その信号はトー
ン性の信号であると言える。特に、単一の周波数成分に
すべてのエネルギーが集中すると、その信号は完全なモ
ノトーン信号(サイン波)となり、完全に周期性のある
信号となる。
【0067】従って、ここでは、もっとも顕著な例とし
てモノトーン信号が入力音声信号として本実施形態に係
る音声信号の立ち上がり検出装置に入力される場合につ
いて説明する。また、ここでは、音声信号の立ち上がり
を示す信号として、モノトーン信号に対して立ち上がり
の激しいアタック信号を用い、そのアタック信号がモノ
トーン信号に付加されたときを、音声信号の立ち上がり
として説明する。
【0068】まず、モノトーン信号の周波数が、減算器
106において行われる帯域制限の周波数よりも低い場
合について説明する。図2(a)に示すように、モノト
ーン信号の周波数が帯域制限の周波数より低い場合に
は、モノトーン信号は、減算器106において行われる
帯域制限により除去される。
【0069】ここで、このモノトーン信号に、モノトー
ン信号に対して立ち上がりの激しいアタック信号が付加
されると、アタック信号のエネルギーは、図2(b)に
示すように広い周波数帯域に分布しており、また、モノ
トーン信号は、上述したように減算器106において行
われる帯域制限により除去される。従って、減算器10
6から出力される高域成分のフレーム平均パワは、アタ
ック信号のフレーム平均パワのみを含むものとなるた
め、アタック信号が付加されたことによる高域成分のフ
レーム平均パワの上昇が大きくなるので、モノトーン信
号の周波数が帯域制限の周波数より低い場合には、音声
信号の立ち上がりを検出することは容易である。
【0070】次いで、これとは逆に、モノトーン信号の
周波数が、減算器106において行われる帯域制限の周
波数よりも高い場合について説明する。図2(c)に示
すように、モノトーン信号の周波数が帯域制限の周波数
より高い場合には、モノトーン信号は、減算器106に
おいて行われる帯域制限によっては除去されない。
【0071】ここで、上記と同様に、このモノトーン信
号に、モノトーン信号に対して立ち上がりの激しいアタ
ック信号が付加されると、アタック信号のエネルギー
は、図2(d)に示すように広い周波数帯域に分布して
おり、また、モノトーン信号は、上述したように減算器
106において行われる帯域制限によっては除去されな
い。従って、減算器106から出力される高域成分のフ
レーム平均パワは、モノトーン信号のフレーム平均パワ
とアタック信号のフレーム平均パワの双方を含むものと
なるため、アタック信号が付加されたことによる高域成
分のフレーム平均パワの上昇が大きくならないので、モ
ノトーン信号の周波数が帯域制限の周波数より高い場合
には、音声信号の立ち上がりを検出することが困難とな
る。
【0072】そこで、本実施形態に係る音声信号の立ち
上がり検出装置においては、トーン性の信号の周波数が
帯域制限の周波数より高い場合にも、音声信号の立ち上
がりを検出することができるように、入力音声信号の周
期性の度合いに応じてしきい値を可変とする以下のよう
な制御を行う。すなわち、トーン性の信号はある基本周
波数を持つ周期的な信号であるため、これに基づき、周
期性算出部109は、周期性の度合いを示すパラメータ
値として例えば入力音声信号の自己相関係数を求め、比
較検出部110へ出力する。
【0073】トーン性の入力音声信号の周波数が帯域制
限の周波数より高い場合には、上述したように、アタッ
ク信号が付加されたしても、アタック信号が付加された
ことによる高域成分のフレーム平均パワの上昇が大きく
ならないため、フレーム平均パワ対長時間平均パワのパ
ワ比は小さくなる。
【0074】従って、比較検出部110は、周期性算出
部109から出力される周期性の度合いを示すパラメー
タ値が大きいほど、パワ比と比較するしきい値を下げて
立ち上がりを検出しやすくし、逆に周期性の度合いを示
すパラメータ値が小さいほど、パワ比と比較するしきい
値を上げる。
【0075】なお、周期性の度合いを示すパラメータ値
に加えて、周期性が最大となる周期の逆数、すなわち入
力音声信号の周波数をパラメータ値として利用し、これ
らに基づいてしきい値を制御する構成としてもよい。こ
の場合、周期性算出部109は、例えば、周期性の度合
いを示すパラメータとして入力音声信号の自己相関係数
の最大値を算出するとともに、自己相関係数が最大とな
る周期の逆数から入力音声信号の周波数を算出し、これ
らを比較検出部110へ出力する。比較検出部110
は、周期性の度合いを示すパラメータ値および周波数を
示すパラメータ値が大きいほど、パワ比と比較するしき
い値を下げて立ち上がりを検出しやすくし、これらのパ
ラメータ値が小さいほど、パワ比と比較するしきい値を
上げる。
【0076】このように、音声信号の周期性の度合、ま
たは音声信号の周期性の度合および周波数に応じて、音
声信号の立ち上がりの検出に用いるしきい値を可変とす
るため、音声信号がトーン性の信号であっても、帯域制
限周波数とトーン性信号の周波数との関係による上述し
たような影響を軽減することができ、立ち上がりを安定
して検出することができる。
【0077】なお、本実施の形態に係る音声信号の立ち
上がり検出装置は、図3に示すように、ダウンサンプラ
部103においてダウンサンプリングされた後の入力音
声信号を用いて、周期性算出部109が周期性の度合い
を示すパラメータ値を算出する構成としてもよい。この
ような構成とすることにより、周期性算出部109に入
力される入力音声信号のサンプル点数が、上記サンプリ
ング定理によって1/DRに減少するため、周期性算出
部109において周期性の度合いを示すパラメータ値を
算出する際の演算量を削減することができる。
【0078】この場合、周期性の度合いを示すパラメー
タ値を算出する際の周波数の範囲が、ダウンサンプリン
グされた入力音声信号に含まれる最大周波数であるfs
/2DRまでに制限される。しかし、一般的な音声信号
を対象とする場合、その音声信号は、トーン性の信号で
あっても完全なモノトーン信号(サイン波)であること
は稀であり、多くの高調波成分を含むハーモニック信号
であることが多い。そして、ハーモニック信号の基本周
波数は数kHz以下であることが多い。従って、周期性の
度合いを示すパラメータ値を算出する際の周波数の範囲
がfs/2DRまでに制限されたとしても問題はない。
【0079】また、本実施の形態に係る音声信号の立ち
上がり検出装置において、ダウンサンプラ部103は、
帯域制限処理とサンプル点間引き処理の2つの処理を行
っているので、サンプル点間引き処理を行わずに、帯域
制限処理のみを行った信号を出力することが可能であ
る。従って、図4に示すように、本実施の形態に係る音
声信号の立ち上がり検出装置は、この帯域制限処理のみ
を行った信号を用いて入力音声信号の高域成分を算出す
るように構成することもできる。
【0080】図4において、ダウンサンプラ部103
は、帯域制限処理のみを行った入力音声信号をパワ減少
部105へ出力し、また、帯域制限処理とサンプル点間
引き処理の両方の処理を行った入力音声信号をバッファ
108へ出力する。ここで、帯域制限処理のみが行われ
た信号のサンプル点数は入力音声信号のサンプル点数と
同じであり、また、帯域制限処理とサンプル点間引き処
理の両方の処理が行われた信号のサンプル点数は、入力
音声信号のサンプル点数の1/DRとなる。
【0081】この構成においては、パワ減少部105か
ら出力される帯域制限処理のみが行われた信号のサンプ
ル点数とフレーミング部101から出力される入力音声
信号のサンプル点数とが同じになる。これにより、減算
器106は、各サンプル点毎に信号の減算処理を行うこ
とができるようになる。
【0082】従って、フレーム平均パワを算出した後に
減算処理を行うのではなく、まず信号の減算処理を行い
低域成分をわずかに含む高域成分の信号を算出してか
ら、平均パワ算出部401がフレーム平均パワを算出す
る。なお、平均パワ算出部401は、上記第1平均パワ
算出部102および上記第2平均パワ算出部104と同
様の機能を有するものである。
【0083】このような構成とすることにより、フレー
ム平均パワおよび長時間平均パワが、サンプル点の間引
き処理による近似値とならずに、正確に算出されるた
め、近似に伴う誤差による立ち上がりの検出誤りを減少
することができる。また、各フレーム毎のフレーム平均
パワを算出する平均パワ算出部が1つで済むため、装置
構成を簡易にすることができる。
【0084】(実施の形態2)本発明の実施の形態2に
係る音声信号の立ち上がり検出装置は、実施の形態1と
略同一の構成を有し、音声信号の立ち上がり検出を、フ
レーム平均パワと長時間平均パワとから算出されるフレ
ーム平均パワの分布の広がりを示すパラメータ値としき
い値とを比較することによって行う点において異なる。
【0085】以下、図5を用いて、本発明の実施の形態
2に係る音声信号の立ち上がり検出装置について説明す
る。図5は、本発明の実施の形態4に係る音声信号の立
ち上がり検出装置の概略構成を示す要部ブロック図であ
る。但し、実施の形態1と同一の構成となるものについ
ては同一番号を付し、詳しい説明を省略する。
【0086】図5において、分布広がり算出部501
は、減算器106から出力された高域成分のフレーム平
均パワと、長時間平均パワ算出部107から出力された
高域成分の長時間平均パワとから、以下の式(3)によ
り、標準偏差σを算出する。比較検出部502は、この
標準偏差σと、あらかじめ比較検出部502に任意に定
められたしきい値または適応的に制御されるしきい値と
を比較して、標準偏差σがしきい値を越えるときに、フ
レーミング部101から出力されたフレーム内の入力音
声信号に入力音声信号の立ち上がりが存在すると検出
し、検出結果を出力する。
【0087】分布広がり算出部501は、以下の式
(3)により、標準偏差σを算出する。
【数3】 上式(3)において、pf(i)はi番目のフレームのフ
レーム平均パワ、paは1番目からn番目のフレームま
での長時間平均パワ、nは長時間平均パワを算出するの
に使用したフレームの数である。また、標準偏差σは、
長時間平均パワに対して各フレームの平均パワがどの程
度ばらついているか、すなわちフレーム平均パワの分布
の広がりを示すパラメータ値であり、その値は、n個の
フレーム平均パワの分布が広い範囲に渡っているほど大
きくなる。
【0088】音声信号の立ち上がり部分では、フレーム
平均パワがフレーム毎に大きく変化するため、複数フレ
ーム間でのフレーム平均パワの分布が大きく広がる。従
って、この複数フレーム間の標準偏差σを算出して、そ
の標準偏差σと、あらかじめ任意に定められたしきい値
または適応的に制御されるしきい値と比較して、標準偏
差σがしきい値を越えるときに、フレーミング部101
から出力されたフレーム内の入力音声信号に入力音声信
号の立ち上がりが存在するものとする。
【0089】なお、ここでは標準偏差σを使用したが、
標準偏差σを二乗した値、すなわち分散σ2を使用して
もよく、この場合にはルート演算が不要になるため、分
布広がり算出部501における演算量を削減することが
できる。
【0090】このように、長時間平均パワを算出する区
間に複数の立ち上がり部分が含まれる場合には、長時間
平均パワの値も上昇するため、長時間平均パワとフレー
ム平均パワとのパワ比等を判定値として用いる上記本発
明者が先に提案した音声信号の立ち上がり検出装置(特
開平11−3091)では、算出される判定値が区間内
に含まれる立ち上がり部分の数によって影響を受け、立
ち上がりの検出誤りが増加することが考えられた。しか
し、本実施形態によれば、フレーム平均パワと長時間平
均パワとから算出されるフレーム平均パワの分布の広が
りを示すパラメータ値を判定値として用いるため、区間
内に複数の立ち上がり部分が含まれる場合でも、立ち上
がりを安定して検出することができる。
【0091】なお、上記実施の形態1と上記実施の形態
2とを組み合わせた構成として実施することも可能であ
る。この構成によれば、上記実施の形態1で説明した入
力音声信号の周期性の度合に応じて可変であるしきい値
と、上記実施の形態2で説明したフレーム平均パワと長
時間平均パワとから算出されるフレーム平均パワの分布
の広がりを示すパラメータ値とを比較し、パラメータ値
がしきい値を越えるときを入力音声信号の立ち上がり部
分として検出する。従って、それぞれの実施の形態単独
では対応することが難しい、入力音声信号がトーン性の
信号であって、そのトーン性の信号が時間的に短い間隔
で発生する立ち上がり部分を含むような場合であって
も、立ち上がりを安定して検出することができる。
【0092】また、上記実施の形態1または上記実施の
形態2と、ダウンサンプラを備える階層符号化装置また
はスケーラブルコーデックと呼ばれる音声符号化装置と
を組み合わせて用いることもできる。この場合には、ダ
ウンサンプリングに関わる演算処理を省くことができる
ため、さらに演算量を削減した音声信号の立ち上がり検
出装置を実現することができる。
【0093】また、上記実施の形態1および上記実施の
形態2は、その処理アルゴリズムをプログラミング言語
によって記述し、ソフトウェアとして実現することもで
きる。この場合には、プログラムをフロッピディスク等
の記憶媒体に記録しておき、パーソナルコンピュータ等
の汎用信号処理装置に記憶媒体を接続して、プログラム
を実行させることにより、上記実施の形態1および上記
実施の形態2に係る音声信号の立ち上がり検出装置の機
能を実現することができる。
【0094】また、上記実施の形態1および上記実施の
形態2に係る音声信号の立ち上がり検出装置は、音声符
号化装置に適用することができる。さらに、この音声符
号化装置を、無線通信端末装置や無線通信基地局制御装
置に適用することができる。
【0095】
【発明の効果】以上説明したように、本発明によれば、
少ない演算量で音声信号の立ち上がりを検出するととも
に、立ち上がりの検出誤りが増加することを防止し、立
ち上がりを安定して検出することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声信号の立ち上
がり検出装置の概略構成を示す要部ブロック図
【図2】入力音声信号の周波数的なエネルギー分布と入
力音声信号の立ち上がりを示す信号の周波数的なエネル
ギー分布とを示すエネルギー分布図
【図3】本発明の実施の形態1に係る音声信号の立ち上
がり検出装置の概略構成を示す要部ブロック図
【図4】本発明の実施の形態1に係る音声信号の立ち上
がり検出装置の概略構成を示す要部ブロック図
【図5】本発明の実施の形態2に係る音声信号の立ち上
がり検出装置の概略構成を示す要部ブロック図
【図6】本発明者が先に提案した音声信号の立ち上がり
検出装置の概略構成を示す要部ブロック図
【符号の説明】
101 フレーミング部 102 第1平均パワ算出部 103 ダウンサンプラ部 104 第2平均パワ算出部 105 パワ減少部 106 減算器 107 長時間平均パワ算出部 108 バッファ 109 周期性算出部 110 比較検出部 201 モノトーン信号のエネルギー分布 202 アタック信号のエネルギー分布 401 平均パワ算出部 501 分布広がり算出部 502 比較検出部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を任意の長さのフレームに分割
    する分割手段と、分割されたフレーム内の音声信号の平
    均パワから求められた判定値についてしきい値判定を行
    う判定手段と、音声信号の特性に応じて前記しきい値判
    定におけるしきい値を制御する制御手段と、前記しきい
    値判定の判定結果により音声信号の立ち上がりを検出す
    る検出手段と、を具備することを特徴とする音声信号の
    立ち上がり検出装置。
  2. 【請求項2】 前記制御手段は、音声信号の周期性の度
    合いを算出し、その周期性の度合いが大きいほど前記し
    きい値を下げることを特徴とする請求項1記載の音声信
    号の立ち上がり検出装置。
  3. 【請求項3】 前記制御手段は、音声信号の周波数を算
    出し、その周波数が高いほど前記しきい値を下げること
    を特徴とする請求項1または請求項2記載の音声信号の
    立ち上がり検出装置。
  4. 【請求項4】 音声信号をダウンサンプリングするダウ
    ンサンプリング手段を具備し、前記制御手段は、前記ダ
    ウンサンプリングした音声信号の特性に応じてしきい値
    を制御することを特徴とする請求項1から請求項3のい
    ずれかに記載の音声信号の立ち上がり検出装置。
  5. 【請求項5】 前記判定値算出手段は、前記1フレーム
    内の平均パワと前記複数フレーム間に渡る平均パワとか
    ら1フレーム内の平均パワの分布の広がりを示す値を判
    定値として算出することを特徴とする請求項1から請求
    後4のいずれかに記載の音声信号の立ち上がり検出装
    置。
  6. 【請求項6】 請求項1から請求項5のいずれかに記載
    の音声信号の立ち上がり検出装置を搭載することを特徴
    とする音声符号化装置。
  7. 【請求項7】 請求項6記載の音声符号化装置を搭載す
    ることを特徴とする無線通信端末装置。
  8. 【請求項8】 請求項6記載の音声符号化装置を搭載す
    ることを特徴とする無線通信基地局制御装置。
  9. 【請求項9】 音声信号を任意の長さのフレームに分割
    する分割工程と、分割されたフレーム内の音声信号の平
    均パワから求められた判定値についてしきい値判定を行
    う判定工程と、音声信号の特性に応じて前記しきい値判
    定におけるしきい値を制御する制御工程と、前記しきい
    値判定の判定結果により音声信号の立ち上がりを検出す
    る検出工程と、を具備することを特徴とする音声信号の
    立ち上がり検出方法。
JP11122944A 1999-04-28 1999-04-28 音声信号の立ち上がり検出装置 Withdrawn JP2000315091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11122944A JP2000315091A (ja) 1999-04-28 1999-04-28 音声信号の立ち上がり検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11122944A JP2000315091A (ja) 1999-04-28 1999-04-28 音声信号の立ち上がり検出装置

Publications (1)

Publication Number Publication Date
JP2000315091A true JP2000315091A (ja) 2000-11-14

Family

ID=14848492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11122944A Withdrawn JP2000315091A (ja) 1999-04-28 1999-04-28 音声信号の立ち上がり検出装置

Country Status (1)

Country Link
JP (1) JP2000315091A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010019876A (ja) * 2008-07-08 2010-01-28 Nec Electronics Corp ノイズキャンセル装置、及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010019876A (ja) * 2008-07-08 2010-01-28 Nec Electronics Corp ノイズキャンセル装置、及び方法

Similar Documents

Publication Publication Date Title
US6529868B1 (en) Communication system noise cancellation power signal calculation techniques
US6766292B1 (en) Relative noise ratio weighting techniques for adaptive noise cancellation
US6523003B1 (en) Spectrally interdependent gain adjustment techniques
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
US20110054889A1 (en) Enhancing Receiver Intelligibility in Voice Communication Devices
US6671667B1 (en) Speech presence measurement detection techniques
WO1999010879A1 (en) Waveform-based periodicity detector
JP6730391B2 (ja) オーディオ信号内の雑音を推定するための方法、雑音推定器、オーディオ符号化器、オーディオ復号器、およびオーディオ信号を送信するためのシステム
EP1386313B1 (en) Speech enhancement device
US20060004565A1 (en) Audio signal encoding device and storage medium for storing encoding program
JP3815323B2 (ja) 周波数変換ブロック長適応変換装置及びプログラム
JPH113091A (ja) 音声信号の立ち上がり検出装置
CA2401672A1 (en) Perceptual spectral weighting of frequency bands for adaptive noise cancellation
JP3418855B2 (ja) 雑音除去装置
JP2000315091A (ja) 音声信号の立ち上がり検出装置
Lin et al. Speech enhancement based on a perceptual modification of Wiener filtering
JP2011071806A (ja) 電子機器、及び電子機器の音量制御プログラム
JP2003517761A (ja) 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060208

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060308