JP2007102031A - 音声信号の圧伸方法および音声信号圧伸装置 - Google Patents
音声信号の圧伸方法および音声信号圧伸装置 Download PDFInfo
- Publication number
- JP2007102031A JP2007102031A JP2005294069A JP2005294069A JP2007102031A JP 2007102031 A JP2007102031 A JP 2007102031A JP 2005294069 A JP2005294069 A JP 2005294069A JP 2005294069 A JP2005294069 A JP 2005294069A JP 2007102031 A JP2007102031 A JP 2007102031A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- volume level
- similarity
- level function
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Control Of Amplification And Gain Control (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】
類似度演算部3は、音声信号91、92の音声データとを比較して類似度を計算する。また、音量レベル関数計算部7は、前記類似度が予め定めた閾値より大きいか否か判断する。音量レベル関数計算部7は、前記類似度が前記閾値より大きい場合には、前記第1の信号と前記第2の信号の音量レベルの和が一定になるようにし、前記類似度が前記閾値より小さい場合には、前記第1の信号と前記第2の信号の音量レベルの2乗和が一定になるようにして、音量レベル関数を選択する。クロスフェードデータ合成部4は、この音量レベル関数により、これらの音声信号91、92をフェードアウト、フェードインして合成する。
【選択図】図3
Description
このクロスフェードは、接続される第1の音声信号のフェードアウトすると共に、接続する前記第2の音声信号のフェードインを行って、連続的に第1の音声信号から第2の音声信号へ継ぎ目なく音声を出力する技術である。
一方、前述したエネルギー和が一定とする合成方法では、音声信号の類似度が低くとも効果的に機能するが、音量レベルのみで計算するので、クロスフェードを行う区間の第1の音声信号と第2の音声信号の類似度が高く周期性を帯びている場合には、そのクロスフェード処理により、波形が重ね合わせにより増強され、クロスフェード途中に音量が増大する問題があった。
入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェード処理を用いた、音声信号の圧伸方法であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算ステップと、
前記類似度が予め定めた閾値より大きいか否か判断する閾値判断ステップと、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を計算する音量レベル関数計算ステップと、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成ステップと、を備え、
前記音量レベル関数計算ステップは、
前記類似度が前記閾値より大きい場合には、前記第1の信号と前記第2の信号の音量レベルの和が一定になるようにし、
前記類似度が前記閾値より小さい場合には、前記第1の信号と前記第2の信号の音量レベルの2乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号の圧伸方法であることを特徴とする。
また、本発明の方法において、音量レベルの和が一定になるように合成するには、直線的に音量を変動させればよい。また、本発明の方法におけるエネルギー和が一定になるようにするためには、音量レベルの2乗和を一定にすればよい。例えば、正弦関数等を用いて、2乗和一定、即ちsin2α+cos2α=1となるように、フェードアウト、フェードインをする音量レベルを計算することができる。以下の発明も同様である。
入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェード処理を用いた、音声信号の圧伸方法であって、
前記クロスフェード処理は、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算ステップと、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算ステップと、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成ステップと、を備え、
前記音量レベル関数計算ステップは、
kを1〜2の値として、前記類似度が小さいほど前記kの値を大きくなるよう段階的にまたは連続的に前記kを変化させ、
前記第1の音声信号と前記第2の音声信号の音量レベルのk乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号の圧伸方法であることを特徴とする。
入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェードを用いた、音声信号圧伸装置であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算手段と、
前記類似度が予め定めた閾値より大きいか否か判断する閾値判断手段と、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算手段と、
前記音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成手段と、を備え、
前記音量レベル関数計算手段は、
前記類似度が前記閾値より大きい場合には、前記第1の信号と前記第2の信号の音量レベルの和が一定になるようにし、
前記類似度が前記閾値より小さい場合には、前記第1の信号と前記第2の信号の音量レベルの2乗和が一定になるようにして、前記音量レベル関数を計算する音声信号圧伸装置であることを特徴とする。
入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェードを用いた、音声信号圧伸装置であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算手段と、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算手段と、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成手段と、を備え、
前記音量レベル関数計算手段は、
kを1〜2の値として、前記類似度が小さいほど前記kの値を大きくなるよう段階的にまたは連続的に前記kを変化させ、
前記第1の音声信号と前記第2の音声信号の音量レベルのk乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号圧伸装置であることを特徴とする。
なお、このバッファの容量として、少なくとも、第1の音声信号入力91のフェードアウトする部分のデータと、第2の音声信号入力91のフェードインする部分のデータの類似度を類似度演算部3で計算するための必要な容量以上は、必要である。
また、音声信号圧伸装置では、元の音声データを切り出して、音声信号入力91、92とし、後述の開始位置制御部2の制御の下、音声信号入力91、92を同時に入力することが可能であるから、類似度演算部3の類似度の計算方法として、リアルタイムで前述の一定時間分の音声信号入力の互いの残差の2乗和を計算し、随時この2乗和を更新し、この2乗和の最小値が出現した時間における、前記2乗和の逆数を類似度とすることができる。
また、第1の音声信号入力91の中で、フェードアウトする部分は、本発明の「第1の音声信号入力」に相当する。第2の音声信号入力92の中で、フェードインする部分は、本発明の「第2の音声信号入力」に相当する。
類似度演算部3の処理は、本発明の「類似度計算ステップ」または、「類似度計算手段」に相当する。
音量レベル関数計算部7の処理のうち閾値と比較する処理は、本発明の「閾値判断ステップ」または「閾値判断手段」に相当する。
クロスフェードデータ合成部4は、本発明の「信号合成ステップ」または、「信号合成手段」に相当する。
(第1の音声信号入力91をフェードアウトした音声信号)
=(第1の音声信号入力91の音量レベル)×(1−T/N)
N:フェードアウトに要する離散時間、
T:クロスフェード開始時間からの経過離散時間
×は掛け算を表す。以下同じ。
(第2の音声信号入力92をフェードインした音声信号)
=(第2の音声信号入力92の音量レベル)×(T/N)
この式から明らかなように、クロスフェード開始時間からの経過離散時間Tがフェードアウトに要する離散時間Nとなったときには、音量レベルは波形メモリから出力された音量レベルと同等となる。
(第1の音声信号入力91をフェードアウトした音声信号)
=(第1の音声信号入力91の音量レベル)×cos(90×T/N)
N:フェードアウトに要する離散時間、
T:クロスフェード開始時間からの経過離散時間。
(第2の音声信号入力92をフェードインした音声信号)
=(第2の音声信号入力92の音量レベル)×sin(90×T/N)
なお、上述の数式において、音声信号入力92の音量レベルに対し、右から積算している関数は、それぞれ、音量レベル関数計算部7で計算する音量レベル関数に相当する。
また、cos(90×T/N)の代わりに、√(1−(T/N)2)を用い、sin(90×T/N)の代わりに、T/Nを用いても良い。この場合も2乗和が一定となる。
一方、音量レベル関数計算部7は、演算部3で計算した類似度と比較して、閾値より小さい場合は、類似度が低いと判断して、図2のようなエネルギー和が一定とする合成方法を用いる。
まず、パラメータkを1〜2の間の可変な値として、図3のクロスフェードデータ合成部4で、フェードアウト、フェードインするカーブを以下の数式により求める。
(第1の音声信号入力91をフェードアウトした音声信号)
=(第1の音声信号入力91の音量レベル) ×(1−(T/N)k)1/k
N:フェードアウトに要する離散時間、
T:クロスフェード開始時間からの経過離散時間。
(第2の音声信号入力92をフェードインした音声信号)
=(第2の音声信号入力92の音量レベル) ×(T/N)k
このようにして、フェードアウト、フェードインした音声信号については、以下の関係を満たす。
(第1の音声信号入力91の音量レベルをフェードアウトした音声信号)k
+(第2の音声信号入力92の音量レベルをフェードインした音声信号)k=1
この式は、パラメータkを1〜2の間の可変な値(整数に限られない。)とした場合に、上述で求めたフェードアウト、フェードインした音声信号が、図1で示した音量和一定(k=1)、図2で示したエネルギー和一定(k=2)の間の関数を補間するような関数となることを示している。
11−DSP
1−波形メモリ
2−開始位置制御部
3−類似度演算部
4−クロスフェードデータ合成部
5−出力カウント部
6−制御部
7−音量レベル関数計算部
8−操作部
91−第1の音声信号入力
92−第2の音声信号入力
Claims (4)
- 入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェード処理を用いた、音声信号の圧伸方法であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算ステップと、
前記類似度が予め定めた閾値より大きいか否か判断する閾値判断ステップと、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を計算する音量レベル関数計算ステップと、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成ステップと、を備え、
前記音量レベル関数計算ステップは、
前記類似度が前記閾値より大きい場合には、前記第1の信号と前記第2の信号の音量レベルの和が一定になるようにし、
前記類似度が前記閾値より小さい場合には、前記第1の信号と前記第2の信号の音量レベルの2乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号の圧伸方法。 - 入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェード処理を用いた、音声信号の圧伸方法であって、
前記クロスフェード処理は、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算ステップと、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算ステップと、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成ステップと、を備え、
前記音量レベル関数計算ステップは、
kを1〜2の値として、前記類似度が小さいほど前記kの値を大きくなるよう段階的にまたは連続的に前記kを変化させ、
前記第1の音声信号と前記第2の音声信号の音量レベルのk乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号の圧伸方法。 - 入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェードを用いた、音声信号圧伸装置であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算手段と、
前記類似度が予め定めた閾値より大きいか否か判断する閾値判断手段と、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算手段と、
前記音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成手段と、を備え、
前記音量レベル関数計算手段は、
前記類似度が前記閾値より大きい場合には、前記第1の信号と前記第2の信号の音量レベルの和が一定になるようにし、
前記類似度が前記閾値より小さい場合には、前記第1の信号と前記第2の信号の音量レベルの2乗和が一定になるようにして、前記音量レベル関数を計算する音声信号圧伸装置。 - 入力される第1の音声信号をフェードアウトすると共に、入力される第2の音声信号をフェードインして、これらの信号を継ぎ目なく接続するクロスフェードを用いた、音声信号圧伸装置であって、
前記第1の音声信号の音声データと、前記第2の音声信号の音声データとを比較して類似度を計算する類似度計算手段と、
前記第1の音声信号をフェードアウトし、前記第2の音声信号のフェードインするための音量レベル関数を演算する音量レベル関数計算手段と、
当該音量レベル関数に基づいて、前記第1の音声信号と第2の音声信号を加工して合成する信号合成手段と、を備え、
前記音量レベル関数計算手段は、
kを1〜2の値として、前記類似度が小さいほど前記kの値を大きくなるよう段階的にまたは連続的に前記kを変化させ、
前記第1の音声信号と前記第2の音声信号の音量レベルのk乗和が一定になるようにして、前記音量レベル関数を計算する、音声信号圧伸装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005294069A JP4779553B2 (ja) | 2005-10-06 | 2005-10-06 | 音声信号の圧伸方法および音声信号圧伸装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005294069A JP4779553B2 (ja) | 2005-10-06 | 2005-10-06 | 音声信号の圧伸方法および音声信号圧伸装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007102031A true JP2007102031A (ja) | 2007-04-19 |
JP4779553B2 JP4779553B2 (ja) | 2011-09-28 |
Family
ID=38029025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005294069A Expired - Fee Related JP4779553B2 (ja) | 2005-10-06 | 2005-10-06 | 音声信号の圧伸方法および音声信号圧伸装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4779553B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011203482A (ja) * | 2010-03-25 | 2011-10-13 | Yamaha Corp | 音声処理装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06177676A (ja) * | 1992-12-10 | 1994-06-24 | Yamaha Corp | 信号処理装置 |
JP2000322100A (ja) * | 1999-05-06 | 2000-11-24 | Yamaha Corp | ディジタル信号の時間軸圧伸方法及び装置 |
JP2001075571A (ja) * | 1999-09-07 | 2001-03-23 | Roland Corp | 波形生成装置 |
JP2002287758A (ja) * | 2001-03-26 | 2002-10-04 | Yamaha Corp | 波形編集方法および波形編集装置 |
JP2004317911A (ja) * | 2003-04-18 | 2004-11-11 | Chiba Inst Of Technology | 音場シミュレーション装置、音場シミュレーション方法、コンピュータプログラム、プログラム記録媒体 |
-
2005
- 2005-10-06 JP JP2005294069A patent/JP4779553B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06177676A (ja) * | 1992-12-10 | 1994-06-24 | Yamaha Corp | 信号処理装置 |
JP2000322100A (ja) * | 1999-05-06 | 2000-11-24 | Yamaha Corp | ディジタル信号の時間軸圧伸方法及び装置 |
JP2001075571A (ja) * | 1999-09-07 | 2001-03-23 | Roland Corp | 波形生成装置 |
JP2002287758A (ja) * | 2001-03-26 | 2002-10-04 | Yamaha Corp | 波形編集方法および波形編集装置 |
JP2004317911A (ja) * | 2003-04-18 | 2004-11-11 | Chiba Inst Of Technology | 音場シミュレーション装置、音場シミュレーション方法、コンピュータプログラム、プログラム記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011203482A (ja) * | 2010-03-25 | 2011-10-13 | Yamaha Corp | 音声処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4779553B2 (ja) | 2011-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4760160B2 (ja) | 集音装置 | |
US8369538B2 (en) | Effect adding method and effect adding apparatus | |
RU2403674C2 (ru) | Система и способ искусственной реверберации (варианты) | |
US8635077B2 (en) | Apparatus and method for expanding/compressing audio signal | |
JP3430985B2 (ja) | 合成音生成装置 | |
WO2015020025A1 (ja) | 音高補正装置及び音高補正方法 | |
JP4702392B2 (ja) | 共鳴音発生装置および電子楽器 | |
KR101535013B1 (ko) | 차량의 실내외 가상 사운드 시스템 | |
JP4779553B2 (ja) | 音声信号の圧伸方法および音声信号圧伸装置 | |
JP4622908B2 (ja) | 信号処理装置 | |
JP2007316269A5 (ja) | ||
JP5282469B2 (ja) | 音声処理装置およびプログラム | |
WO2020179472A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP2008219713A (ja) | ノイズキャンセルヘッドホン | |
JP2008015191A (ja) | オーディオ信号処理装置およびホール | |
JP2007094004A (ja) | 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置 | |
JP4529513B2 (ja) | 音圧周波数特性調整装置、プログラム、楽曲再生装置 | |
JP2008262140A (ja) | 音程変換装置及び音程変換方法 | |
JP2009025340A (ja) | オーディオデータ再生装置及びオーディオデータ再生速度制御方法 | |
JP4471780B2 (ja) | 音声信号処理装置及びその方法 | |
JP3095018B2 (ja) | 楽音発生装置 | |
JP4675179B2 (ja) | 遅延装置 | |
JP4556866B2 (ja) | 高能率符号化プログラム及び高能率符号化装置 | |
JP2010008546A (ja) | インパルス応答加工装置、残響付与装置およびプログラム | |
JP2007189530A (ja) | ノイズキャンセルヘッドホンおよびヘッドホンにおけるノイズキャンセル方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110107 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140715 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |