JP2002268657A - 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体 - Google Patents

音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体

Info

Publication number
JP2002268657A
JP2002268657A JP2001066712A JP2001066712A JP2002268657A JP 2002268657 A JP2002268657 A JP 2002268657A JP 2001066712 A JP2001066712 A JP 2001066712A JP 2001066712 A JP2001066712 A JP 2001066712A JP 2002268657 A JP2002268657 A JP 2002268657A
Authority
JP
Japan
Prior art keywords
energy
sections
acoustic signal
calculating
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001066712A
Other languages
English (en)
Other versions
JP3660599B2 (ja
Inventor
Kazuaki Chikira
和明 千喜良
Takehiro Moriya
健弘 守谷
Akio Jin
明夫 神
Takeshi Mori
岳至 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001066712A priority Critical patent/JP3660599B2/ja
Publication of JP2002268657A publication Critical patent/JP2002268657A/ja
Application granted granted Critical
Publication of JP3660599B2 publication Critical patent/JP3660599B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【課題】音響信号の立ち上がり・立ち下がりを的確に、
少ない演算量、処理量で検出する。 【解決手段】入力された音響信号を解析フレーム単位に
分割し、解析フレームをさらに複数区間に分割し、各区
間内の音響信号のエネルギーを算出し、複数区間のエネ
ルギーの変動を近似する直線あるいは曲線を計算して求
め、各区間ごとに直線あるいは曲線で近似した近似値と
音響信号のエネルギーの誤差を計算し、誤差の絶対値あ
るいは二乗値を複数区間加算した値と予め設定された閾
値と比較することにより解析フレーム内の音響信号の立
ち上がり・立ち下がりを検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音響信号(楽
音、音声信号)の立ち上がり・立ち下がりの検出方法に
関し、音響信号の符号化、音声認識、音声通信等に用い
られる。
【0002】
【従来の技術】アタック検出技術は、例えば音響信号の
符号化技術において変換長を決定する際に利用されてい
る。楽音符号化技術の代表的な例としてはTwinVQ(Trans
form domain Weighted INterleave Vector Quantizatio
n)、AAC(Advanced Audio Coding)、ATRAC3(Adaptive TR
ansform Acoustic Coding)等があげられる。これらの符
号化技術は主に量子化によって表現ビット数を削減する
が、量子化効率を上げるために、音響信号を時間領域か
ら周波数領域へ変換してから量子化を行う。この変換は
一般的に直交変換を用いて行うが変換長の選択が重要で
ある。より長い変換フレームを採用し、フレームを一度
に変換すれば周波数領域でパワーが集中しやすく後に行
う量子化効率が高くなるが、同一フレーム内で信号の特
性が著しく変化する場合には、量子化によって特性の異
なる信号同士が干渉しあうため、聴感上のひずみが目立
つようになる(これをプリエコーといい、高圧縮率時に
顕著となる)。逆に変換長を短くすれば音響信号の特性
が変化した場合でもその影響(干渉)が及ぶ範囲は時間
的に短い。したがって音響信号の特性が激しく変化する
(アタックが存在する)場合には短い変換長で時間領域
/周波数領域変換を行い、通常はそれよりも長い変換長
で変換を行うことが対策として考えられる。
【0003】前述のTwinVQ方式では変換フレーム内の各
区間ごとの信号エネルギーのばらつき度(相加平均と相
乗平均の比)を主な尺度としてアタックの検出を行って
いる。また、AAC方式では聴覚的エントロピーを用いた
検出方法が提案されている。聴覚的エントロピーは複数
の周波数帯域部分ごとに聴覚モデルを用いて計算した最
小可聴ノイズから計算され、このエントロピーの大小に
よってアタックの存在を判定し、アタックの検出を行っ
ている。
【0004】
【発明が解決しようとする課題】従来技術のようにエネ
ルギーのばらつきを選択基準とすると、一定の割合でエ
ネルギーが増加している場合(エネルギーの変動の例:
1,2,3,4,5)でも、急激にエネルギーが変動している場
合(エネルギー変動の例:1,5,4,3,2)でも同じ基準値
を生成することになる。後者は明らかにアタックであ
り、前者の場合はアタックとはいえないためエネルギー
のばらつきは尺度として的確ではない場合がある。ま
た、聴覚エントロピーは計算するために高次のFFT(Fast
Fourier Transform)を行う必要があるなど演算量の面
で不利である。この発明の課題は音響信号の立ち上がり
及び立ち下がりを的確に、少ない演算量、処理量で検出
することである。
【0005】
【課題を解決するための手段】音響信号の立ち上がり及
び立ち下がりの検出判定として、解析フレーム内のエネ
ルギーの変動を直線あるいは曲線により近似し、(1)
この近似した値と実際の値の誤差の和をとり閾値と比較
して行う、(2)近似した直線あるいは曲線の傾きを閾
値と比較して行う。また、高域信号部分(例えば、4kH
z以上)のエネルギーだけを対象としてエネルギー変動
を直線あるいは曲線により近似し、同様に検出判定を行
う。
【0006】
【発明の実施の形態】図1を参照してこの発明の概要を
説明する。 (1)入力された音響信号を解析フレーム単位に分割
し、解析フレーム内をさらに複数の解析区間(1,2,・・
・,j)に分割し、各区間内の音響信号のエネルギーを算
出し(E1,E2,・・・,Ej)、
【0007】
【数1】
【0008】(2)(1)でエネルギーの変動を直線で
近似した傾きa1と予め設定された閾値Athと比較するこ
とにより解析フレーム内の音響信号の立ち上がり・立ち
下がりを検出する。
【0009】図2,3を参照してこの発明を詳細に説明
する。図2に概要(1)で説明した音響信号の立ち上が
り・立ち下がり検出装置の構成、図3に入力された音響
信号を解析フレーム単位に分割し、解析フレーム内をさ
らに複数の区間に分割するための説明図を示す。 〈フレーム解析区間抽出部〉 (1)入力された音響信号列を解析フレーム単位に分割
し、解析フレーム内をさらに複数の解析区間に分割す
る。解析フレームは標本化点を2048点とすると、解析フ
レーム内を図3に示すように1,2,・・・,8個の解析区間
jを重ね合わせて抽出する場合、第j区間は((j+2)×204
8)÷16+1点目から((j+4)×2048÷16)点目となる。
【0010】図3からわかるように第j区間と第j+1区間
は2048/16=128点重複する。通常楽音符号化方式におけ
る時間領域/周波数領域変換部では重ね合わせ直交変換
(LOT:Lapped Orthogonal Transform)が利用されている
ため、第i変換フレームと第i+1変換フレームとは1024点
重複している。したがって、この変換フレームをそのま
まこの発明の解析フレームとした場合には、第i解析フ
レーム内の第8区間は第i+1解析フレーム内の第1区間と
128点重複している。 (2)解析区間内の音響信号(サンプル値)を[xk],(k=0,
1,2,・・・,255)とするとき、各解析区間内のサンプル
値にハミング窓をかけるとwk=xk×(0.54−0.46×cos(2
πk/256))となる。 (3)各区間の[wk]を周波数領域に変換する。これは256点
のFFTを用いて行うことができる。周波数成分は[fk],(k
=0,1,2,・・・,127)となる。また、高域成分は例えば[f
k],(k=64,65,66,・・・,127)とすることができる(この
高域成分の設定は実験等により行う)。 〈解析区間内エネルギー生成部〉 (4)FFT前(時間領域)とFFT後(周波数領域)のそれぞ
れについて解析区間内サンプル値の二乗和(エネルギー)
G,Eを計算する。
【0011】
【数2】 〈直線によるエネルギー近似値計算部〉 (4)次にEj,Gjの変動を直線あるいは曲線により近似す
る。
【0012】
【数3】 を最小にするan,bnは最小二乗法により求める。
【0013】
【数4】 例えば、N=2で、解析区間数が8の場合、これはエネルギ
ーの変動を直線近似することになり、以下のようにな
る。
【0014】
【数5】 となる。 〈二乗演算器・加算器〉誤差の二乗和は、以下に示すよ
うになる。
【0015】
【数6】
【0016】なお、上記の例では誤差の二乗和を求めて
いるが、誤差の絶対値を用いることもできる。 〈立ち上がり・立ち下がり検出部〉 (5)音響信号の立ち上がり・立ち下がりの有無はe,g,a1,
b1の大小で判断する。eあるいはgが大きいときは直線に
よる近似がうまくいかなかったときであるから(すなわ
ち、誤差の和が大きい場合)、解析フレーム内に音響信
号の立ち上がり・立ち下がりが存在すると判定する目安
となる。また、a1,b1が大きいとき(すなわち、傾きが
大きい場合)、解析フレーム内でエネルギーの変動が激
しいときであるから音響信号の立ち上がり・立ち下がり
が存在すると判定する目安となる。したがって、実験結
果等により求めた閾値Ath,Bth,Eth,Gthと比較し、a1>A
th,b1>Bth,e>Eth,g>Gth のときに音響信号の立ち上
がり・立ち下がりが存在すると判定する。また、判定を
例えば、e>Ethかつa1>Athかつb1>Bth とすれば検出
精度を上げることができる。
【0017】なお、a1>Athあるいはb1>Bthの判定は直
線によるエネルギー近似値計算部において計算された傾
きa1あるいはb1を閾値Ath,Bthと比較することにより音
響信号の立ち上がり・立ち下がりを検出することができ
る。この発明は、例えば符号化技術において変換フレー
ム内の変換長の決定に利用することができる。変換フレ
ームを解析フレームとしてこの発明による音響信号の立
ち上がり・立ち下がり検出を行い、音響信号の立ち上が
り・立ち下がりが存在するフレームでは変換長を短く、
また、音響信号の立ち上がり・立ち下がりが存在しない
ならばフレーム全体を変換長とすればよい。
【0018】図4に示すように、音響信号の立ち上がり
(アタック)が存在する音を、長い変換領域を用いて符
号化するとアタックのエネルギーが変換領域全体にわた
って拡散されてしまい、復号後にプリエコーと呼ばれる
音質の劣化を引き起こす。このような場合に精度の高い
アタック検出法を用いて変換長を短くすればプリエコー
を抑えることができ、復号時に音質が向上する。本方式
を実際に符号化・復号化装置に組み込み品質評価試験を
行った結果を図5に示す。
【0019】コーデックはMPEG-4/Audioのリファレンス
ソフトウェアを利用している。試験はリファレンスソフ
トによる復号音と、本方式による変換長切換えを実装し
たリファレンスソフトによる復号音を比較するものであ
る。この試験では判定の条件をEth>0.2かつGth>0.2と
した。表の数値は、従来方式に比べて本方式の音を採点
したものである。採点の範囲は、悪い(−3)から良い(+
3)までである。上限と下限は評価の分布を正規分布で近
似し、分布を95%で切り捨てたときの上限と下限であ
る。
【0020】音声のように急激に音が変化する場合には
アタックによって変換長を切り換える方法が有効である
が、本方式では音声(歌唱:女性、独語:男性、英語
等)において音質が平均値0より上回り向上する傾向が
ある。また、この発明の音響信号の立ち上がり・立ち下
がり検出装置をCPUやメモリ等を有するコンピュータ
と、アクセス主体となるユーザが利用する利用者端末と
記録媒体から構成することができる。記録媒体は、CD-R
OM、磁気ディスク、半導体メモリ等の機械読み取り可能
な記録媒体であり、ここに記録された、あるいは通信回
線等で配信された音響信号の立ち上がり・立ち下がり検
出プログラムはコンピュータに読み取られ、コンピュー
タの動作を制御し、コンピュータ上に実施の形態におけ
る各構成要素、すなわち、フレーム解析区間抽出部、解
析区間内エネルギー生成部、直線あるいは曲線によるエ
ネルギー近似値計算部等を実現する。
【0021】
【発明の効果】本発明によれば、なめらかなエネルギー
変動(エネルギー変動の例:1,2,3,4,5)は直線で近似
できるためアタック無しと判定される。また、アタック
が存在する例(エネルギー変動の例:1,5,4,3,2)は近
似が困難なため、誤差が大きくなりアタックが存在する
と判定される。また、エネルギーの変動が大きい場合で
も、高域信号にエネルギーが少ない場合は、短い変換長
を用いたときの量子化雑音がマスキングされないため、
聴覚上のひずみが目立ってしまう。したがってこの場合
には長い変換長を選択することが必要である。本発明で
は高域信号のエネルギーの変動にも着目しているため高
域信号のエネルギー変動が無い場合には長い変換長が選
択される。
【0022】以上から本発明に音響信号の立ち上がり・
立ち下がり検出法を用いれば少ない演算量で音響信号の
特性に適した変換長を選択することが可能となり、符号
化技術変換長の選択に応用すればプリエコーが軽減さ
れ、復号後の音質が向上する。
【図面の簡単な説明】
【図1】本発明の概要を説明するための図。
【図2】本発明の音響信号の立ち上がり・立ち下がり検
出装置の構成を示すブロック図。
【図3】音響信号と解析フレーム、解析区間の関係を示
す図。
【図4】アタック音に対する長・短変換長における復号
後の出力信号を示す図。
【図5】本発明の音響信号の立ち上がり・立ち下がり検
出法を適用した符号化・復号化による品質評価試験の結
果を示す図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 神 明夫 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 森 岳至 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5D015 DD03 5D378 AD67

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割
    し、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似する直線あるいは曲線を計算し
    て求め、 各区間ごとに直線あるいは曲線で近似した近似値と音響
    信号のエネルギーの誤差を計算し、誤差の絶対値あるい
    は二乗値を複数区間加算した値と予め設定された閾値と
    比較することにより解析フレーム内の音響信号の立ち上
    がり・立ち下がりを検出することを特徴とする音響信号
    の立ち上がり・立ち下がり検出方法。
  2. 【請求項2】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割
    し、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似した直線あるいは曲線を計算し
    て求め、 近似した直線あるいは曲線の傾きと予め設定された閾値
    と比較することにより解析フレーム内の音響信号の立ち
    上がり・立ち下がりを検出することを特徴とする音響信
    号の立ち上がり・立ち下がり検出方法。
  3. 【請求項3】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割
    し、 各区間内の音響信号に窓関数をかけた後、時間領域/周
    波数領域変換して周波数領域の音響信号を生成し、 各区間内の周波数領域の音響信号のうち、予め設定され
    た高域周波数領域部分のエネルギーを算出し、複数解析
    区間のエネルギーの変動を近似する直線あるいは曲線を
    計算して求め、 各区間ごとの近似値と音響信号のエネルギーの誤差を計
    算し、誤差の絶対値あるいは二乗値を複数区間加算した
    値と予め設定された閾値と比較することにより解析フレ
    ーム内の音響信号の立ち上がり・立ち下がりを検出する
    ことを特徴とする音響信号の立ち上がり・立ち下がり検
    出方法。
  4. 【請求項4】請求項1乃至3のいずれか1項に記載の音
    響信号の立ち上がり・立ち下がり検出方法において、 複数区間のエネルギーの変動を近似する直線あるいは曲
    線は最小二乗法により求めることを特徴とする音響信号
    の立ち上がり・立ち下がり検出方法。
  5. 【請求項5】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割す
    るフレーム解析区間抽出部と、 各区間内の音響信号のエネルギーを算出するエネルギー
    生成部と、 複数区間のエネルギーの変動を近似する直線あるいは曲
    線を計算して求めるエネルギー近似値計算部と、 各区間ごとに直線あるいは曲線で近似した近似値と音響
    信号のエネルギーの誤差を計算する減算器と、 誤差の絶対値あるいは二乗値を複数区間加算する演算器
    と、 複数区間加算した値と予め設定された閾値と比較するこ
    とにより解析フレーム内の音響信号の立ち上がり・立ち
    下がりを検出する検出部を備えたことを特徴とする音響
    信号の立ち上がり・立ち下がり検出装置。
  6. 【請求項6】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割す
    るフレーム解析区間抽出部と、 各区間内の音響信号のエネルギーを算出するエネルギー
    生成部と、 複数区間のエネルギーの変動を近似した直線あるいは曲
    線を計算して求めるエネルギー近似値計算部と、 近似した直線あるいは曲線の傾きと予め設定された閾値
    と比較することにより解析フレーム内の音響信号の立ち
    上がり・立ち下がりを検出する検出部とを備えたことを
    特徴とする音響信号の立ち上がり・立ち下がり検出装
    置。
  7. 【請求項7】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割す
    るフレーム解析区間抽出部と、 各区間内の音響信号に窓関数をかけた後、時間領域/周
    波数領域変換して周波数領域の音響信号を生成する周波
    数領域変換部と、 各区間内の周波数領域の音響信号のうち、予め設定され
    た高域周波数領域部分のエネルギーを算出し、複数解析
    区間のエネルギーの変動を近似する直線あるいは曲線を
    計算して求めるエネルギー近似値計算部と、 各区間ごとの近似値と音響信号のエネルギーの誤差を計
    算する減算器と、 誤差の絶対値あるいは二乗値を複数区間加算する演算部
    と、 複数区間加算した値と予め設定された閾値と比較するこ
    とにより解析フレーム内の音響信号の立ち上がり・立ち
    下がりを検出する検出部とを備えたことを特徴とする音
    響信号の立ち上がり・立ち下がり検出装置。
  8. 【請求項8】請求項5乃至7のいずれか1項に記載の音
    響信号の立ち上がり・立ち下がり検出装置において、 エネルギー近似値計算部における複数区間のエネルギー
    の変動を近似する直線あるいは曲線を最小二乗法により
    求めることを特徴とする音響信号の立ち上がり・立ち下
    がり検出装置。
  9. 【請求項9】入力された音響信号を解析フレーム単位に
    分割し、前記解析フレーム内をさらに複数区間に分割す
    る処理と、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似する直線あるいは曲線を計算し
    て求める処理と、 各区間ごとに直線あるいは曲線で近似した近似値と音響
    信号のエネルギーの誤差を計算し、誤差の絶対値あるい
    は二乗値を複数区間加算した値と予め設定された閾値と
    比較することにより解析フレーム内の音響信号の立ち上
    がり・立ち下がりを検出する処理をコンピュータに実行
    させる音響信号の立ち上がり・立ち下がり検出プログラ
    ム。
  10. 【請求項10】入力された音響信号を解析フレーム単位
    に分割し、前記解析フレーム内をさらに複数区間に分割
    する処理と、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似した直線あるいは曲線を計算し
    て求める処理と、 近似した直線あるいは曲線の傾きと予め設定された閾値
    と比較することにより解析フレーム内の音響信号の立ち
    上がり・立ち下がりを検出する処理をコンピュータに実
    行させる音響信号の立ち上がり・立ち下がり検出プログ
    ラム。
  11. 【請求項11】入力された音響信号を解析フレーム単位
    に分割し、前記解析フレーム内をさらに複数区間に分割
    する処理と、 各区間内の音響信号に窓関数をかけた後、時間領域/周
    波数領域変換して周波数領域の音響信号を生成する処理
    と、 各区間内の周波数領域の音響信号のうち、予め設定され
    た高域周波数領域部分のエネルギーを算出し、複数解析
    区間のエネルギーの変動を近似する直線あるいは曲線を
    計算して求める処理と、 各区間ごとの近似値と音響信号のエネルギーの誤差を計
    算し、誤差の絶対値あるいは二乗値を複数区間加算した
    値と予め設定された閾値と比較することにより解析フレ
    ーム内の音響信号の立ち上がり・立ち下がりを検出する
    処理をコンピュータに実行させる音響信号の立ち上がり
    ・立ち下がり検出プログラム。
  12. 【請求項12】請求項9乃至11のいずれか1項に記載
    の音響信号の立ち上がり・立ち下がりプログラムにおい
    て、 複数区間のエネルギーの変動を近似する直線あるいは曲
    線を計算して求める処理は最小二乗法を用いて求める処
    理を有する音響信号の立ち上がり・立ち下がり検出プロ
    グラム。
  13. 【請求項13】入力された音響信号を解析フレーム単位
    に分割し、前記解析フレーム内をさらに複数区間に分割
    する処理と、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似する直線あるいは曲線を計算し
    て求める処理と、 各区間ごとに直線あるいは曲線で近似した近似値と音響
    信号のエネルギーの誤差を計算し、誤差の絶対値あるい
    は二乗値を複数区間加算した値と予め設定された閾値と
    比較することにより解析フレーム内の音響信号の立ち上
    がり・立ち下がりを検出する処理をコンピュータに実行
    させる音響信号の立ち上がり・立ち下がり検出プログラ
    ムを記録した記録媒体。
  14. 【請求項14】入力された音響信号を解析フレーム単位
    に分割し、前記解析フレーム内をさらに複数区間に分割
    する処理と、 各区間内の音響信号のエネルギーを算出し、複数区間の
    エネルギーの変動を近似した直線あるいは曲線を計算し
    て求める処理と、 近似した直線あるいは曲線の傾きと予め設定された閾値
    と比較することにより解析フレーム内の音響信号の立ち
    上がり・立ち下がりを検出する処理をコンピュータに実
    行させる音響信号の立ち上がり・立ち下がり検出プログ
    ラムを記録した記録媒体。
  15. 【請求項15】入力された音響信号を解析フレーム単位
    に分割し、前記解析フレーム内をさらに複数区間に分割
    する処理と、 各区間内の音響信号に窓関数をかけた後、時間領域/周
    波数領域変換して周波数領域の音響信号を生成する処理
    と、 各区間内の周波数領域の音響信号のうち、予め設定され
    た高域周波数領域部分のエネルギーを算出し、複数解析
    区間のエネルギーの変動を近似する直線あるいは曲線を
    計算して求める処理と、 各区間ごとの近似値と音響信号のエネルギーの誤差を計
    算し、誤差の絶対値あるいは二乗値を複数区間加算した
    値と予め設定された閾値と比較することにより解析フレ
    ーム内の音響信号の立ち上がり・立ち下がりを検出する
    処理をコンピュータに実行させる音響信号の立ち上がり
    ・立ち下がり検出プログラムを記録した記録媒体。
  16. 【請求項16】請求項13乃至15のいずれか1項に記
    載の音響信号の立ち上がり・立ち下がりプログラムを記
    録した記録媒体において、 複数区間のエネルギーの変動を近似する直線あるいは曲
    線を計算して求める処理は最小二乗法を用いて求める処
    理を有する音響信号の立ち上がり・立ち下がり検出プロ
    グラムを記録した記録媒体。
JP2001066712A 2001-03-09 2001-03-09 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体 Expired - Lifetime JP3660599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001066712A JP3660599B2 (ja) 2001-03-09 2001-03-09 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001066712A JP3660599B2 (ja) 2001-03-09 2001-03-09 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002268657A true JP2002268657A (ja) 2002-09-20
JP3660599B2 JP3660599B2 (ja) 2005-06-15

Family

ID=18925172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001066712A Expired - Lifetime JP3660599B2 (ja) 2001-03-09 2001-03-09 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP3660599B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058959A (ja) * 2004-08-17 2006-03-02 Fujifilm Software Co Ltd 類似画像判定方法、プログラム及び装置
JP2013242462A (ja) * 2012-05-22 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム
JP2014002217A (ja) * 2012-06-15 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> 発生音感知装置、方法、プログラム
CN104025189A (zh) * 2011-10-27 2014-09-03 Lg电子株式会社 编码语音信号的方法、解码语音信号的方法,及使用其的装置
JP2019144591A (ja) * 2012-04-27 2019-08-29 株式会社Nttドコモ 音声復号装置
US10714113B2 (en) 2012-04-27 2020-07-14 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
JP2020170187A (ja) * 2014-09-12 2020-10-15 オランジュ デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4625935B2 (ja) * 2007-02-26 2011-02-02 独立行政法人産業技術総合研究所 音分析装置およびプログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058959A (ja) * 2004-08-17 2006-03-02 Fujifilm Software Co Ltd 類似画像判定方法、プログラム及び装置
US9672840B2 (en) 2011-10-27 2017-06-06 Lg Electronics Inc. Method for encoding voice signal, method for decoding voice signal, and apparatus using same
CN104025189A (zh) * 2011-10-27 2014-09-03 Lg电子株式会社 编码语音信号的方法、解码语音信号的方法,及使用其的装置
JP2014531064A (ja) * 2011-10-27 2014-11-20 エルジー エレクトロニクスインコーポレイティド 音声信号符号化方法及び復号化方法とこれを利用する装置
CN104025189B (zh) * 2011-10-27 2016-10-12 Lg电子株式会社 编码语音信号的方法、解码语音信号的方法,及使用其的装置
JP2019144591A (ja) * 2012-04-27 2019-08-29 株式会社Nttドコモ 音声復号装置
US10714113B2 (en) 2012-04-27 2020-07-14 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US11562760B2 (en) 2012-04-27 2023-01-24 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
JP2013242462A (ja) * 2012-05-22 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 音響特徴量計算装置及び方法、特定状況モデルデータベース作成装置、特定要素音モデルデータベース作成装置、状況推定装置、発呼適否通知装置並びにプログラム
JP2014002217A (ja) * 2012-06-15 2014-01-09 Nippon Telegr & Teleph Corp <Ntt> 発生音感知装置、方法、プログラム
JP2020170187A (ja) * 2014-09-12 2020-10-15 オランジュ デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
CN112086107A (zh) * 2014-09-12 2020-12-15 奥兰治 用于辨别和衰减前回声的方法、设备、解码器和存储介质
JP7008756B2 (ja) 2014-09-12 2022-01-25 オランジュ デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
CN112086107B (zh) * 2014-09-12 2024-04-02 奥兰治 用于辨别和衰减前回声的方法、设备、解码器和存储介质

Also Published As

Publication number Publication date
JP3660599B2 (ja) 2005-06-15

Similar Documents

Publication Publication Date Title
JP7050976B2 (ja) 高度なスペクトラム拡張を使用して量子化ノイズを低減するための圧縮伸張装置および方法
JP6185457B2 (ja) 効率的なコンテンツ分類及びラウドネス推定
US10861475B2 (en) Signal-dependent companding system and method to reduce quantization noise
EP2828855B1 (en) Determining a harmonicity measure for voice processing
JPH03132228A (ja) 直交変換信号符号化復号化方式
JP2010539792A (ja) スピーチ増強
JPS6035799A (ja) 人間の音声エンコード装置及び方法
EP2169667B1 (en) Parametric stereo audio decoding method and apparatus
US20090180531A1 (en) codec with plc capabilities
US20140019125A1 (en) Low band bandwidth extended
JP2002268657A (ja) 音響信号の立ち上がり・立ち下がり検出方法及び装置並びにプログラム及び記録媒体
KR101102016B1 (ko) 오디오 인코딩에서 짧은 윈도우를 그룹화하는 방법
JP5287546B2 (ja) 情報処理装置およびプログラム
KR20140000260A (ko) 왜곡 스펙트럼 및 정밀 추정 오디오 인코딩
JP3815323B2 (ja) 周波数変換ブロック長適応変換装置及びプログラム
JP2010102129A (ja) 基本周波数抽出方法、基本周波数抽出装置、およびプログラム
US11830507B2 (en) Coding dense transient events with companding
Eaton et al. Detection of clipping in coded speech signals
US10332527B2 (en) Method and apparatus for encoding and decoding audio signal
US10950251B2 (en) Coding of harmonic signals in transform-based audio codecs
Milivojević et al. Estimation of the fundamental frequency of the speech signal compressed by G. 723.1 algorithm applying PCC interpolation
RU2801156C2 (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
Wang et al. Noise removal of audio clips for fingerprint matching
KR100931181B1 (ko) 노이지 음성 신호의 처리 방법 및 이를 위한 컴퓨터 판독가능한 기록매체
Koshikawa et al. Pitch shifting of music based on adaptive order estimation of linear predictor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050317

R151 Written notification of patent or utility model registration

Ref document number: 3660599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080325

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090325

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090325

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100325

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110325

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110325

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120325

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130325

Year of fee payment: 8

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term