JP2001005500A - ステレオ信号の時間軸圧伸方法及び装置 - Google Patents
ステレオ信号の時間軸圧伸方法及び装置Info
- Publication number
- JP2001005500A JP2001005500A JP11175439A JP17543999A JP2001005500A JP 2001005500 A JP2001005500 A JP 2001005500A JP 11175439 A JP11175439 A JP 11175439A JP 17543999 A JP17543999 A JP 17543999A JP 2001005500 A JP2001005500 A JP 2001005500A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- stereo signal
- cross
- time
- cutout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 45
- 238000007906 compression Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000006835 compression Effects 0.000 claims abstract description 12
- 238000005562 fading Methods 0.000 claims abstract description 6
- 238000011156 evaluation Methods 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 239000002131 composite material Substances 0.000 abstract description 7
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006731 degradation reaction Methods 0.000 abstract description 2
- 230000011218 segmentation Effects 0.000 abstract 4
- 230000008878 coupling Effects 0.000 abstract 1
- 238000010168 coupling process Methods 0.000 abstract 1
- 238000005859 coupling reaction Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 10
- 230000004807 localization Effects 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H7/00—Instruments in which the tones are synthesised from a data store, e.g. computer organs
- G10H7/008—Means for controlling the transition from one tone waveform to another
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/375—Tempo or beat alterations; Music timing control
- G10H2210/385—Speed change, i.e. variations from preestablished tempo, tempo change, e.g. faster or slower, accelerando or ritardando, without change in pitch
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/025—Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
- G10H2250/035—Crossfade, i.e. time domain amplitude envelope control of the transition between musical sounds or melodies, obtained for musical purposes, e.g. for ADSR tone generation, articulations, medley, remix
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
のつなぎ部分での音質劣化を防止する。 【解決手段】 類似度評価部12及び切り出し位置決定
部3は、ステレオ信号の全チャネルを合成した合成信号
DIに対して、所定の探索開始位置から探索終了位置ま
での間、クロスフェードされる波形同士が最も類似する
次の切り出し開始位置を、ステレオ信号の各チャネルの
信号DIL,DIRに共通の切り出し開始位置として決定
する。時間軸圧伸処理部4,5は、決定された切り出し
開始位置に基づいて各チャネルの信号DIL,DIRをそ
れぞれ切り出してクロスフェードにより結合することに
より、時間軸圧伸処理を行う。
Description
号のピッチを変えずに原ディジタル信号を所望とする圧
伸率で時間軸圧伸する時間軸圧伸方法及び装置に関し、
特にステレオ信号に適した時間軸圧伸方法及び装置に関
する。
変えずにその時間軸を圧縮又は伸長する時間軸圧伸技術
は、例えば、収録されたディジタルオーディオ信号の全
体的な収録時間を所定の時間に合わせ込む、いわゆる
「尺合わせ」や、カラオケ装置等のテンポ変換等に利用
される。この種の時間軸圧伸技術としては、従来より、
カット・アンド・スプライス法(例えば特開平10−2
82963号)やポインター移動量制御による重複加算
法(“ポインター移動量制御による重複加算法を用いた
音声の時間積での伸長圧縮とその評価”;森田、板倉、
昭和61年10月;日本音響学会秋期大会講演論文集1-4-1
4,PP149)等が知られている。
よる時間軸圧伸処理は、波形とは無相関に波形の切り出
しを行い、切り出した波形をつなぎ合わせて指定された
圧伸率での圧伸処理を行うもので、切り出し波形同士の
つなぎの部分では、波形の不連続が生じるので、クロス
フェード処理を行って、フレームのつなぎ部分を滑らか
にする。切り出し間隔は、人間の聴感上、エコー感や音
のダブリ感が検知されにくい間隔、例えば60msec程度
に設定される。特に、特開平10−282963号の方
式では、音声タイミング情報に同期して切り出しの長さ
を決める。通常の方式に比べ、元波形のリズムと同じ周
期でつなぎ目が現れ、つなぎ目の部分の音質変化が目立
ちにくいという特徴がある。また、クロスフェード処理
に関して言えば、大きく位相の異なる部分でのクロスフ
ェードは著しく音質を損なうため、本出願人は別途、信
号位相に着目し、できるだけ位相の合う部分を検出し
て、その部分でクロスフェードを行うようにした、位相
マッチング形カット・アンド・スプライス法も提案して
いる。
算法では、原オーディオ信号において、波形相関の高い
隣接した同じ長さの2つの区間を抽出し、これら区間の
信号を重複加算し、この重複加算された信号を元の2つ
の区間と入れ換えたり、元の2つの区間の間に挿入する
ことで、全体的な時間を短くしたり長くする。この方式
は、カット・アンド・スプライス法よりもスムーズな波
形接続が可能となる。特に音声信号や単音楽器のような
ピッチ性の高い音源に対し、より品質の高い時間軸圧伸
が可能となる。
形カット・アンド・スプライス法やポインター移動量制
御による重複加算法では、その対象とする信号を全てモ
ノラル信号としている。これらの方式は、クロスフェー
ドポイントを位相の合う部分、波形相関の高い部分とな
るように処理を行うものであるが、ステレオ信号に対し
てそのまま適用すると、定位感の異常を感じ、これが大
きな問題となってしまう。これは、左右各々のチャンネ
ルを独立したモノラル信号とみなして処理を行うため、
チャンネル毎にクロスフェードポイントが異なり、ステ
レオ信号の定位感を決定する両耳間位相差が変化してし
まうことが原因である。
るが、カット・アンド・スプライス法を用い、更に読出
し速度を変える処理が行われるピッチ変換装置として
は、左右のステレオ信号のピッチ変換に際して、Lチャ
ネルの最も相関の高い位置でクロスフェード処理を行っ
てLチャネルの接続を行い、次にLチャネルの編集点近
傍におけるRチャネルの最も相関の高い位置でクロスフ
ェード処理を行ってRチャネルの接続を行うもの、及び
Lチャネル,Rチャネルの2チャネル間の相関に応じ
て、相関が低い場合には、Lチャネル、Rチャネル独立
で最も相関の高い位置で編集を行うようにし、相関が高
い場合にはLチャネル(又はRチャネル)で最も相関の
高い位置で2チャネルとも編集するように適応的に編集
方法を切り換えるようにしたピッチ変換装置も提案され
ている(特開平5−297891号)。
ル間のクロスフェードポイントが完全には同期せず、し
たがって、両耳間位相差が発生することがあり得る。そ
の場合、聴取時の定位感の異常となってしまう。聴覚
上、左右チャンネルの過渡的な定位感の異常は、クロス
フェードのつながりの悪さ以上に目立ってしまう傾向が
あり、依然として問題を残している。
れたもので、ステレオ信号に対して時間軸圧伸処理を施
した場合でも、チャネル間でクロス・フェードポイント
がずれることがなく、これにより、自然な定位感を得る
ことができるステレオ信号の時間軸圧伸方法及び装置を
提供することを目的とする。
信号の時間軸圧伸方法は、時間軸圧伸すべきステレオ信
号から所定長さの波形を順次切り出して、各切り出され
た波形の両端をクロスフェードさせながら結合すること
により、指定された圧伸率で時間軸圧伸された出力信号
を生成するステレオ信号の時間軸圧伸方法において、次
に切り出す波形の切り出し開始位置を、前記ステレオ信
号の全チャネルを合成した信号における所定の探索開始
位置から探索終了位置までの間の、クロスフェード期間
の波形同士が最も類似する位置に決定し、この決定され
た切り出し開始位置に基づいて前記ステレオ信号の各チ
ャネルの信号を個々に切り出してクロスフェードにより
結合するようにしたことを特徴とする。
間軸圧伸装置は、時間軸圧伸すべきステレオ信号の各チ
ャネルの信号から所定長さの波形を順次切り出して、各
切り出された波形の両端をクロスフェードさせながら結
合することにより、指定された圧伸率で時間軸圧伸され
た出力信号を生成するステレオ信号の時間軸圧伸装置に
おいて、前記ステレオ信号の全チャネルを合成した信号
に対して、所定の探索開始位置から探索終了位置までの
間、クロスフェードされる波形同士が最も類似する次の
切り出し開始位置を、前記ステレオ信号の各チャネルに
共通の切り出し開始位置として決定する類似度評価・切
出位置決定手段と、前記ステレオ信号の各チャネルに対
応して設けられ、前記類似度評価・切出位置決定手段で
決定された切り出し開始位置に基づいて前記ステレオ信
号の各チャネルの信号をそれぞれ切り出してクロスフェ
ードにより結合する複数の時間軸圧伸処理手段とを備え
たことを特徴とする。
クロスフェードして結合するに際し、ステレオ信号の全
チャネルの合成信号に基づいて、次に切り出す波形の切
り出し開始位置を決定し、この決定された切り出し開始
位置に基づいて各チャネルの信号の波形切り出してクロ
スフェードで接続する処理を行うので、全チャネルの切
り出し位置を全く同じ位置にすることができ、しかもそ
の位置は、各チャネルで独立に求められる最適切り出し
位置の平均的位置(一方のチャネルが支配的である場合
には支配的なチャネルの影響を強く受けた位置)に設定
されることになる。このため、切り出し波形のつなぎ部
分での音質の劣化を生じさせることなく、クロス・フェ
ードポイントのずれも防止して、自然な定位感を得るこ
とができる。
の好ましい実施の形態について説明する。図1は、この
発明の一実施例に係るステレオ信号の時間軸圧伸装置の
構成を示すブロック図である。時間軸圧伸すべき原ディ
ジタルデータであるオーディオ・ステレオ信号のLチャ
ネルの信号DIL及びRチャネルの信号DIRは、加算器
1で合成され、この合成信号DIが類似度評価部2に供
給されている。類似度評価部2は、内部に合成信号DI
を記憶する図示しない波形メモリを有し、与えられた圧
伸率Rに基づいて、合成信号DIの予め決定された探索
開始位置から探索終了位置までクロスフェードされる波
形同士の類似度を計算する。この類似度評価部2で求め
られた類似度は、切り出し位置決定部3に供給されてい
る。切り出し位置決定部3は、与えられた圧伸率Rに基
づいて、供給された類似度が最も大きくなる(誤差が最
も小さくなる)切り出し開始位置を決定する。一方、各
チャネルの信号DIL,DIRは、それぞれ個別に時間軸
圧伸処理部4,5に入力されている。これら時間軸圧伸
処理部4,5は、それぞれ合成信号DIに基づいて求め
られた左右チャネルに共通の切り出し開始位置に基づい
て、各チャネル毎に波形の切り出しとクロスフェードに
よる接続を行って、圧伸率Rに応じた時間軸圧伸処理を
行う。
を示すブロック図である。時間軸圧伸すべきL(R)チ
ャネル信号DIL(DIR)は、波形メモリ11に順次格
納される。波形メモリ11に格納された信号DIL(D
IR)は、読出位置制御部12の制御に基づき、指定さ
れた切り出し開始位置から所定のデータ長で連結する2
種類のデータD1,D2として順次読み出される。波形
メモリ11から読み出されたデータD1,D2は、クロ
スフェード部13に供給され、ここでクロスフェード処
理される。クロスフェード処理されたデータは、出力カ
ウント部14を介して圧伸された出力信号DOL(D
OR)として出力される。出力カウント部14は、出力
信号のデータ数をカウントする。制御部15は、外部か
ら指定された圧伸率Rに基づいて、クロスフェード時間
や探索範囲等を決定したり、切り出し位置決定部3から
与えられた切り出し開始位置に基づいて切り出しデータ
長等を決定する。また、制御部15は、決定された切り
出しデータ長を出力カウント部14にセットし、出力カ
ウント部14が制御部15によってセットされた切り出
しデータ長をカウントしたら、次の切り出し位置の探索
を実行するように各部を制御する。
の動作を説明する。図3は、圧伸率Rを説明するための
図である。同図(a),(b)に示すように原ディジタ
ル信号の長さをL1、出力ディジタル信号の長さをL2
(但しL2<L1)としたとき、圧伸率Rは、R=L2
/L1で求められる。この場合R<1.0であるから、
出力ディジタル信号は、時間軸圧縮された圧縮ディジタ
ルデータとなる。また同図(c)に示すように、出力デ
ィジタル信号の長さをL3(但しL3>L1)としたと
き、圧伸率R=L3/L1>1.0となり、出力ディジ
タル信号は時間軸伸長された伸長ディジタルデータとな
る。尺合わせ等の用途では、出力ディジタル信号の収録
時間に合わせるように原ディジタル信号の時間軸を圧縮
又は伸長するので、予め収録されている原ディジタル信
号の収録時間と目標とする収録時間とから圧伸率Rが決
められる。
と、切り出された波形の後端位置から次の切り出し波形
の先頭位置までのオフセットの長さLoffによって表す
こともできるので、オフセットの長さLoffが変わって
も、これに合わせて切り出し波形の長さLsを変えるこ
とによって一定の圧伸率Rに合わせ込むことができる。
そこで、この実施例では、時間軸圧縮の場合は図4に示
すように、また時間軸伸長の場合には図5に示すよう
に、次に切り出す各チャネルの波形の先頭位置を、全チ
ャネルの合成信号DIをベースとして、この合成信号D
I上で所定の探索開始位置tsから探索終了位置teま
で移動させたときに、現在の終端部と次に切り出す波形
の先端部のクロスフェード期間tcfの合成信号DIの波
形が最も類似する位置txを求め、その位置から各チャ
ネルの次の波形を切り出すようにしている。txを切り
出し先頭位置とした場合のクロスフェード波形の類似度
S(x)は、下記数1のように誤差の二乗和の形で求め
られる。勿論、これは一例であり、類似度S(x)を誤
差の絶対値和で求めるようにしても良い。
に切り出す波形の長さが決まる。即ち、i-1番目に決定
されたオフセットの長さをLoffi-1とすると、次に切り
出す波形の長さLsiは、
形の長さLsiは、上式に拘わらず、最低切り出し長さL
sminを設定し、この最低切り出し長さLsminよりも短く
ならないように設定することが望ましい。この最低切り
出し長さLsminとしては、例えば最低周波数を50Hz
として20msecとする。また、これに対応して探索範囲
ts−teも、20msec程度に設定する。具体的な探索
開始位置tsと探索終了位置teは、例えば、ts=5
msec,te=25msecのように決定すればよい。
(圧縮率や伸長率が高くなればなるほど)、原ディジタ
ル信号との近似性がなくなってくるので、波形のつなぎ
部分がより不自然になりやすい。このため、最適なクロ
スフェード期間の長さtcfを、圧伸率が1から離れるに
つれて長くするように適応的に変化させることが望まし
い。より具体的には、例えば圧縮率50%又は伸長率2
00%の場合、切り出し波形の長さLsiの50%程度を
クロスフェード期間の長さtcfとして設定し、圧伸率が
100%に近づくにつれて切り出し波形の長さLsiに対
するクロスフェード期間tcfの割合を0%に近づけるよ
うにする。
い場合、前述した類似度の計算に時間がかかるので、類
似度計算のステップ幅を、クロスフェード期間の長さt
cfに応じて変化させるようにしても良い。例えば圧縮率
50%又は伸長率200%では、3〜5サンプルおきに
データを比較して類似度を計算し、圧伸率が100%に
近づくにつれて1サンプルずつのデータ比較に近づけ
る。クロスフェード波形の類似度を探すような用途で
は、振幅レベルの大きな変動を伴うピッチ波形での相関
がとれればよいので、小さな変動部分はあまり考慮する
必要はなく、このような処理を行っても結果に大きな差
がでることはない。
の手順を示したフローチャートである。まず、探索のた
めのパラメータiを0にリセットし、類似度Sとして初
期値Smaxを与え、現在位置Tを探索開始位置tsにセ
ットする(S11)。次に、切り出し位置txとして、
ts+iをセットし(S12)、jを0からtcfまで変
化させながら、下記数3の計算を行う(S14〜S1
7)。
度Sをdに、最小類似度位置Tをtxにそれぞれ更新す
る(S18,S19)。そして、iを更新して、次の切
り出し位置txについて同様の処理を繰り返す(S2
0,S12)。txが探索終了位置teに達したら処理
を終了する(S13)。これによってTには、最終的に
最小類似度が得られた切り出し開始位置が格納されるこ
とになる。
の時間軸圧伸手順を示すフローチャートである。まず、
波形メモリ11に、少なくとも切り出し位置探索に必要
な量の対応チャネルの原ディジタル信号波形のデータを
バッファリングする(S21)。
部3より与えられる切り出し位置txから切り出し波形
の長さLsを求め、これを出力カウントの最大値Nmax
として記憶する。同時に、クロスフェード部13にクロ
スフェード処理の動作切換を指示する(S22)。
いて、読出位置制御部12で、波形メモリ11の他方の
ポインタ位置をセットする(S23)。即ち、時間軸圧
縮の場合には、図8(a)に示すように、波形メモリ1
1のポインタDP1,DP2でそれぞれ示されるオフセ
ットLoffi-1を保ってそれぞれデータが読み出されてい
るときに、先行する一方のポインタDP2が切り出し波
形の後端位置(後端のクロスフェード開始位置)に達し
たとき、次の切り出し位置txが求められる。このと
き、追従していた他方のポインタDP1がDP1′の位
置までジャンプして、新たなオフセットLoffiを保った
まま、2つのポインタDP1′,DP2が同時に移動し
ていく。また、時間軸伸長の場合には、図8(b)に示
すように、ポインタのジャンプする方向が上述した前方
向ではなく、後ろ方向になる。波形メモリ11のこれら
2つのポインタが示す位置からデータD1,D2がそれ
ぞれ読み出される。読み出されたデータD1,D2は、
クロスフェード部13に送られる(S24)。
よって求められたクロスフェード時間tcfに基づいて、
クロスフェード合成処理を実行する。即ち、図9に示す
ように、データD1にはクロスフェード係数W1を乗算
し、データD2にはクロスフェード係数W2を乗算し、
両者を加算することにより合成データを生成する(S2
5)。但し、W1+W2=1.0である。同図(a)は
圧伸率Rが1に近い場合のクロスフェード係数W1,W
2を、同図(b)は圧伸率Rが1から離れている場合
(例えばR=0.5,R=2.0)のクロスフェード係
数W1,W2をそれぞれ示している。得られた合成デー
タは出力カウント部14に送られる(S25)。
力カウント値Nをカウントし、その値Nを制御部15に
送る(S26)。制御部15では、出力カウント値Nが
出力カウント最大値Nmaxに達したかどうかを判定し
(S27)、最大値Nmaxに達していなかったらポイン
タDP1,DP2をそれぞれ更新して(S28)、次の
データD1,D2を読み出して(S24)、クロスフェ
ード処理を繰り返す(S25〜S27)。出力カウント
値Nが最大値Nmaxに達したら(S27)、次の切り出
し位置探索のために必要な原ディジタル信号を波形メモ
リ11にバッファリングして、同様の処理を繰り返す
(S21〜S28)。
ルの合成信号DIのクロスフェード部分に対応する波形
同士が類似している部分を探索して、その位置を全チャ
ネルに共通の切り出し開始位置として決定し、且つ指定
された圧伸率を維持するように波形を切り出すようにし
ているので、自然な定位感を維持しつつ、波形のつなぎ
をスムーズにして、違和感のないステレオ信号の時間軸
圧伸処理を実現することができる。また、この装置で
は、圧伸率に応じてクロスフェードする時間tcfを変え
ているので、圧縮率や伸長率が高い場合でも、自然なつ
なぎが可能になる。
されるものではない。上記実施例では、対象となるステ
レオ信号として、ディジタル・オーディオ・ステレオ信
号のL・Rチャンネル、すなわち2チャンネルの信号を
用いたが、3チャンネル以上の信号で構成されるいわゆ
るサラウンドステレオ信号にも適用できることは言うま
でもない。例えばAC3信号などの5チャンネル信号に
対しては、全5チャンネルを対象としてそれらの全部又
は一部の加算信号などからなる合成信号を作成し、この
合成信号に基づいて波形切り出し位置を決定し、この切
り出し位置で一律に全5チャンネルの波形切り出しを行
い、各々をクロスフェード接続するようにしても良い。
理のための窓関数として台形窓を用いたが、ガウシアン
窓、ハミング窓等、他の窓関数を用いた場合でも、同様
の効果が得られる。
切り出した波形同士をクロスフェードして結合するに際
し、ステレオ信号の全チャネルの合成信号に基づいて、
次に切り出す波形の切り出し開始位置を決定し、この決
定された切り出し開始位置に基づいて各チャネルの信号
の波形切り出してクロスフェードで接続する処理を行う
ので、全チャネルの切り出し位置を全く同じ位置にする
ことができ、しかもその位置は、各チャネルで独立に求
められる最適切り出し位置の平均的位置に設定されるこ
とになるため、自然な定位感を維持しつつ、つなぎ部分
での音質の劣化も防止することができるという効果を奏
する。
間軸圧伸装置のブロック図である。
のブロック図である。
である。
ための図である。
ための図である。
定処理を示すフローチャートである。
トである。
を説明するための図である。
るための図である。
部、4,5…時間軸圧伸処理部、11…波形メモリ、1
2…読出位置制御部、13…クロスフェード部、14…
出力カウント部、15…制御部。
Claims (2)
- 【請求項1】 時間軸圧伸すべきステレオ信号から所定
長さの波形を順次切り出して、各切り出された波形の両
端をクロスフェードさせながら結合することにより、指
定された圧伸率で時間軸圧伸された出力信号を生成する
ステレオ信号の時間軸圧伸方法において、 次に切り出す波形の切り出し開始位置を、前記ステレオ
信号の全チャネルを合成した信号における所定の探索開
始位置から探索終了位置までの間の、クロスフェード期
間の波形同士が最も類似する位置に決定し、 この決定された切り出し開始位置に基づいて前記ステレ
オ信号の各チャネルの信号を個々に切り出してクロスフ
ェードにより結合するようにしたことを特徴とするディ
ジタル信号の時間軸圧伸方法。 - 【請求項2】 時間軸圧伸すべきステレオ信号の各チャ
ネルの信号から所定長さの波形を順次切り出して、各切
り出された波形の両端をクロスフェードさせながら結合
することにより、指定された圧伸率で時間軸圧伸された
出力信号を生成するステレオ信号の時間軸圧伸装置にお
いて、 前記ステレオ信号の全チャネルを合成した信号に対し
て、所定の探索開始位置から探索終了位置までの間、ク
ロスフェードされる波形同士が最も類似する次の切り出
し開始位置を、前記ステレオ信号の各チャネルに共通の
切り出し開始位置として決定する類似度評価・切出位置
決定手段と、 前記ステレオ信号の各チャネルに対応して設けられ、前
記類似度評価・切出位置決定手段で決定された切り出し
開始位置に基づいて前記ステレオ信号の各チャネルの信
号をそれぞれ切り出してクロスフェードにより結合する
複数の時間軸圧伸処理手段とを備えたことを特徴とする
ディジタル信号の時間軸圧伸装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17543999A JP3430974B2 (ja) | 1999-06-22 | 1999-06-22 | ステレオ信号の時間軸圧伸方法及び装置 |
US09/598,091 US6487536B1 (en) | 1999-06-22 | 2000-06-21 | Time-axis compression/expansion method and apparatus for multichannel signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17543999A JP3430974B2 (ja) | 1999-06-22 | 1999-06-22 | ステレオ信号の時間軸圧伸方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001005500A true JP2001005500A (ja) | 2001-01-12 |
JP3430974B2 JP3430974B2 (ja) | 2003-07-28 |
Family
ID=15996119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17543999A Expired - Fee Related JP3430974B2 (ja) | 1999-06-22 | 1999-06-22 | ステレオ信号の時間軸圧伸方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6487536B1 (ja) |
JP (1) | JP3430974B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004518162A (ja) * | 2001-01-16 | 2004-06-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリック符号化における信号成分の連結 |
WO2009025142A1 (ja) * | 2007-08-22 | 2009-02-26 | Nec Corporation | 話者速度変換システムおよびその方法ならびに速度変換装置 |
JP2009536885A (ja) * | 2006-05-12 | 2009-10-22 | クレイン アンド カンパニー インコーポレーテッド | 単独で、またはセキュリティドキュメントまたはラベルと共に、スタティック像および/または他の投影された像により空間的にコーディネートされた像を投影するマイクロ光学的膜構造体 |
JP2012181429A (ja) * | 2011-03-02 | 2012-09-20 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3430968B2 (ja) | 1999-05-06 | 2003-07-28 | ヤマハ株式会社 | ディジタル信号の時間軸圧伸方法及び装置 |
JP4300641B2 (ja) * | 1999-08-10 | 2009-07-22 | ヤマハ株式会社 | マルチトラック音源信号の時間軸圧伸方法及び装置 |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
EP1386312B1 (en) * | 2001-05-10 | 2008-02-20 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
US20050137729A1 (en) * | 2003-12-18 | 2005-06-23 | Atsuhiro Sakurai | Time-scale modification stereo audio signals |
US8296143B2 (en) * | 2004-12-27 | 2012-10-23 | P Softhouse Co., Ltd. | Audio signal processing apparatus, audio signal processing method, and program for having the method executed by computer |
JP4550652B2 (ja) | 2005-04-14 | 2010-09-22 | 株式会社東芝 | 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 |
US8155972B2 (en) * | 2005-10-05 | 2012-04-10 | Texas Instruments Incorporated | Seamless audio speed change based on time scale modification |
US7642444B2 (en) * | 2006-11-17 | 2010-01-05 | Yamaha Corporation | Music-piece processing apparatus and method |
US20100169105A1 (en) * | 2008-12-29 | 2010-07-01 | Youngtack Shim | Discrete time expansion systems and methods |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3076859B2 (ja) | 1992-04-20 | 2000-08-14 | 三菱電機株式会社 | ディジタルオーディオ信号の信号処理装置 |
JP3759810B2 (ja) | 1997-04-07 | 2006-03-29 | ローランド株式会社 | 波形データの時間圧縮伸張方法および装置 |
JP3546755B2 (ja) * | 1999-05-06 | 2004-07-28 | ヤマハ株式会社 | リズム音源信号の時間軸圧伸方法及び装置 |
-
1999
- 1999-06-22 JP JP17543999A patent/JP3430974B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-21 US US09/598,091 patent/US6487536B1/en not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004518162A (ja) * | 2001-01-16 | 2004-06-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリック符号化における信号成分の連結 |
JP2009536885A (ja) * | 2006-05-12 | 2009-10-22 | クレイン アンド カンパニー インコーポレーテッド | 単独で、またはセキュリティドキュメントまたはラベルと共に、スタティック像および/または他の投影された像により空間的にコーディネートされた像を投影するマイクロ光学的膜構造体 |
WO2009025142A1 (ja) * | 2007-08-22 | 2009-02-26 | Nec Corporation | 話者速度変換システムおよびその方法ならびに速度変換装置 |
US8392197B2 (en) | 2007-08-22 | 2013-03-05 | Nec Corporation | Speaker speed conversion system, method for same, and speed conversion device |
JP2012181429A (ja) * | 2011-03-02 | 2012-09-20 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3430974B2 (ja) | 2003-07-28 |
US6487536B1 (en) | 2002-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3546755B2 (ja) | リズム音源信号の時間軸圧伸方法及び装置 | |
JP3430968B2 (ja) | ディジタル信号の時間軸圧伸方法及び装置 | |
US5842172A (en) | Method and apparatus for modifying the play time of digital audio tracks | |
JP3430974B2 (ja) | ステレオ信号の時間軸圧伸方法及び装置 | |
JP2004527000A (ja) | オーディオ信号の高品質タイムスケーリング及びピッチスケーリング | |
JPH11194796A (ja) | 音声再生装置 | |
KR100303913B1 (ko) | 음성처리방법, 음성처리장치 및 기록재생장치 | |
JP3465628B2 (ja) | オーディオ信号の時間軸圧伸方法及び装置 | |
JP4300641B2 (ja) | マルチトラック音源信号の時間軸圧伸方法及び装置 | |
US8635077B2 (en) | Apparatus and method for expanding/compressing audio signal | |
KR101008250B1 (ko) | 기지 음향신호 제거방법 및 장치 | |
JP4581190B2 (ja) | 音楽信号の時間軸圧伸方法及び装置 | |
JP2905191B1 (ja) | 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0962257A (ja) | 楽音信号処理装置 | |
JP2001255882A (ja) | 音声信号処理装置及びその信号処理方法 | |
JP2003241800A (ja) | ディジタル信号の時間軸圧伸方法及び装置 | |
JP2009282536A (ja) | 既知音響信号除去方法及び装置 | |
JP4364544B2 (ja) | 音声信号処理装置及びその方法 | |
JP2007094004A (ja) | 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置 | |
JP2002297200A (ja) | 話速変換装置 | |
JPH06337696A (ja) | 速度変換制御装置と速度変換制御方法 | |
JPH0411300A (ja) | 音声信号の時間圧縮伸長方法 | |
AU2002248431A1 (en) | High quality time-scaling and pitch-scaling of audio signals | |
JP2002023750A (ja) | オーディオ波形データ再生装置、オーディオ波形データの時間軸圧縮伸長処理装置およびオーディオ波形データのピッチ変換処理装置 | |
JP2001242870A (ja) | 楽音発生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090523 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100523 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140523 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |