JP2001005500A - ステレオ信号の時間軸圧伸方法及び装置 - Google Patents

ステレオ信号の時間軸圧伸方法及び装置

Info

Publication number
JP2001005500A
JP2001005500A JP11175439A JP17543999A JP2001005500A JP 2001005500 A JP2001005500 A JP 2001005500A JP 11175439 A JP11175439 A JP 11175439A JP 17543999 A JP17543999 A JP 17543999A JP 2001005500 A JP2001005500 A JP 2001005500A
Authority
JP
Japan
Prior art keywords
signal
stereo signal
cross
time
cutout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11175439A
Other languages
English (en)
Other versions
JP3430974B2 (ja
Inventor
Shinji Hizuka
真二 肥塚
Kazunobu Kondou
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP17543999A priority Critical patent/JP3430974B2/ja
Priority to US09/598,091 priority patent/US6487536B1/en
Publication of JP2001005500A publication Critical patent/JP2001005500A/ja
Application granted granted Critical
Publication of JP3430974B2 publication Critical patent/JP3430974B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/008Means for controlling the transition from one tone waveform to another
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/375Tempo or beat alterations; Music timing control
    • G10H2210/385Speed change, i.e. variations from preestablished tempo, tempo change, e.g. faster or slower, accelerando or ritardando, without change in pitch
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • G10H2250/035Crossfade, i.e. time domain amplitude envelope control of the transition between musical sounds or melodies, obtained for musical purposes, e.g. for ADSR tone generation, articulations, medley, remix

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 自然な定位を損なわずにステレオ信号の波形
のつなぎ部分での音質劣化を防止する。 【解決手段】 類似度評価部12及び切り出し位置決定
部3は、ステレオ信号の全チャネルを合成した合成信号
DIに対して、所定の探索開始位置から探索終了位置ま
での間、クロスフェードされる波形同士が最も類似する
次の切り出し開始位置を、ステレオ信号の各チャネルの
信号DIL,DIRに共通の切り出し開始位置として決定
する。時間軸圧伸処理部4,5は、決定された切り出し
開始位置に基づいて各チャネルの信号DIL,DIRをそ
れぞれ切り出してクロスフェードにより結合することに
より、時間軸圧伸処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、原ディジタル信
号のピッチを変えずに原ディジタル信号を所望とする圧
伸率で時間軸圧伸する時間軸圧伸方法及び装置に関し、
特にステレオ信号に適した時間軸圧伸方法及び装置に関
する。
【0002】
【従来の技術】ディジタル・オーディオ信号のピッチを
変えずにその時間軸を圧縮又は伸長する時間軸圧伸技術
は、例えば、収録されたディジタルオーディオ信号の全
体的な収録時間を所定の時間に合わせ込む、いわゆる
「尺合わせ」や、カラオケ装置等のテンポ変換等に利用
される。この種の時間軸圧伸技術としては、従来より、
カット・アンド・スプライス法(例えば特開平10−2
82963号)やポインター移動量制御による重複加算
法(“ポインター移動量制御による重複加算法を用いた
音声の時間積での伸長圧縮とその評価”;森田、板倉、
昭和61年10月;日本音響学会秋期大会講演論文集1-4-1
4,PP149)等が知られている。
【0003】一般的なカット・アンド・スプライス法に
よる時間軸圧伸処理は、波形とは無相関に波形の切り出
しを行い、切り出した波形をつなぎ合わせて指定された
圧伸率での圧伸処理を行うもので、切り出し波形同士の
つなぎの部分では、波形の不連続が生じるので、クロス
フェード処理を行って、フレームのつなぎ部分を滑らか
にする。切り出し間隔は、人間の聴感上、エコー感や音
のダブリ感が検知されにくい間隔、例えば60msec程度
に設定される。特に、特開平10−282963号の方
式では、音声タイミング情報に同期して切り出しの長さ
を決める。通常の方式に比べ、元波形のリズムと同じ周
期でつなぎ目が現れ、つなぎ目の部分の音質変化が目立
ちにくいという特徴がある。また、クロスフェード処理
に関して言えば、大きく位相の異なる部分でのクロスフ
ェードは著しく音質を損なうため、本出願人は別途、信
号位相に着目し、できるだけ位相の合う部分を検出し
て、その部分でクロスフェードを行うようにした、位相
マッチング形カット・アンド・スプライス法も提案して
いる。
【0004】一方、ポインター移動量制御による重複加
算法では、原オーディオ信号において、波形相関の高い
隣接した同じ長さの2つの区間を抽出し、これら区間の
信号を重複加算し、この重複加算された信号を元の2つ
の区間と入れ換えたり、元の2つの区間の間に挿入する
ことで、全体的な時間を短くしたり長くする。この方式
は、カット・アンド・スプライス法よりもスムーズな波
形接続が可能となる。特に音声信号や単音楽器のような
ピッチ性の高い音源に対し、より品質の高い時間軸圧伸
が可能となる。
【0005】
【発明が解決しようとする課題】従来の位相マッチング
形カット・アンド・スプライス法やポインター移動量制
御による重複加算法では、その対象とする信号を全てモ
ノラル信号としている。これらの方式は、クロスフェー
ドポイントを位相の合う部分、波形相関の高い部分とな
るように処理を行うものであるが、ステレオ信号に対し
てそのまま適用すると、定位感の異常を感じ、これが大
きな問題となってしまう。これは、左右各々のチャンネ
ルを独立したモノラル信号とみなして処理を行うため、
チャンネル毎にクロスフェードポイントが異なり、ステ
レオ信号の定位感を決定する両耳間位相差が変化してし
まうことが原因である。
【0006】一方、このような時間軸圧伸装置とは異な
るが、カット・アンド・スプライス法を用い、更に読出
し速度を変える処理が行われるピッチ変換装置として
は、左右のステレオ信号のピッチ変換に際して、Lチャ
ネルの最も相関の高い位置でクロスフェード処理を行っ
てLチャネルの接続を行い、次にLチャネルの編集点近
傍におけるRチャネルの最も相関の高い位置でクロスフ
ェード処理を行ってRチャネルの接続を行うもの、及び
Lチャネル,Rチャネルの2チャネル間の相関に応じ
て、相関が低い場合には、Lチャネル、Rチャネル独立
で最も相関の高い位置で編集を行うようにし、相関が高
い場合にはLチャネル(又はRチャネル)で最も相関の
高い位置で2チャネルとも編集するように適応的に編集
方法を切り換えるようにしたピッチ変換装置も提案され
ている(特開平5−297891号)。
【0007】しかし、これらの装置では、左右チャンネ
ル間のクロスフェードポイントが完全には同期せず、し
たがって、両耳間位相差が発生することがあり得る。そ
の場合、聴取時の定位感の異常となってしまう。聴覚
上、左右チャンネルの過渡的な定位感の異常は、クロス
フェードのつながりの悪さ以上に目立ってしまう傾向が
あり、依然として問題を残している。
【0008】この発明は、このような問題点に鑑みなさ
れたもので、ステレオ信号に対して時間軸圧伸処理を施
した場合でも、チャネル間でクロス・フェードポイント
がずれることがなく、これにより、自然な定位感を得る
ことができるステレオ信号の時間軸圧伸方法及び装置を
提供することを目的とする。
【0009】
【課題を解決するための手段】この発明に係るステレオ
信号の時間軸圧伸方法は、時間軸圧伸すべきステレオ信
号から所定長さの波形を順次切り出して、各切り出され
た波形の両端をクロスフェードさせながら結合すること
により、指定された圧伸率で時間軸圧伸された出力信号
を生成するステレオ信号の時間軸圧伸方法において、次
に切り出す波形の切り出し開始位置を、前記ステレオ信
号の全チャネルを合成した信号における所定の探索開始
位置から探索終了位置までの間の、クロスフェード期間
の波形同士が最も類似する位置に決定し、この決定され
た切り出し開始位置に基づいて前記ステレオ信号の各チ
ャネルの信号を個々に切り出してクロスフェードにより
結合するようにしたことを特徴とする。
【0010】また、この発明に係るディジタル信号の時
間軸圧伸装置は、時間軸圧伸すべきステレオ信号の各チ
ャネルの信号から所定長さの波形を順次切り出して、各
切り出された波形の両端をクロスフェードさせながら結
合することにより、指定された圧伸率で時間軸圧伸され
た出力信号を生成するステレオ信号の時間軸圧伸装置に
おいて、前記ステレオ信号の全チャネルを合成した信号
に対して、所定の探索開始位置から探索終了位置までの
間、クロスフェードされる波形同士が最も類似する次の
切り出し開始位置を、前記ステレオ信号の各チャネルに
共通の切り出し開始位置として決定する類似度評価・切
出位置決定手段と、前記ステレオ信号の各チャネルに対
応して設けられ、前記類似度評価・切出位置決定手段で
決定された切り出し開始位置に基づいて前記ステレオ信
号の各チャネルの信号をそれぞれ切り出してクロスフェ
ードにより結合する複数の時間軸圧伸処理手段とを備え
たことを特徴とする。
【0011】この発明によれば、切り出した波形同士を
クロスフェードして結合するに際し、ステレオ信号の全
チャネルの合成信号に基づいて、次に切り出す波形の切
り出し開始位置を決定し、この決定された切り出し開始
位置に基づいて各チャネルの信号の波形切り出してクロ
スフェードで接続する処理を行うので、全チャネルの切
り出し位置を全く同じ位置にすることができ、しかもそ
の位置は、各チャネルで独立に求められる最適切り出し
位置の平均的位置(一方のチャネルが支配的である場合
には支配的なチャネルの影響を強く受けた位置)に設定
されることになる。このため、切り出し波形のつなぎ部
分での音質の劣化を生じさせることなく、クロス・フェ
ードポイントのずれも防止して、自然な定位感を得るこ
とができる。
【0012】
【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図1は、この
発明の一実施例に係るステレオ信号の時間軸圧伸装置の
構成を示すブロック図である。時間軸圧伸すべき原ディ
ジタルデータであるオーディオ・ステレオ信号のLチャ
ネルの信号DIL及びRチャネルの信号DIRは、加算器
1で合成され、この合成信号DIが類似度評価部2に供
給されている。類似度評価部2は、内部に合成信号DI
を記憶する図示しない波形メモリを有し、与えられた圧
伸率Rに基づいて、合成信号DIの予め決定された探索
開始位置から探索終了位置までクロスフェードされる波
形同士の類似度を計算する。この類似度評価部2で求め
られた類似度は、切り出し位置決定部3に供給されてい
る。切り出し位置決定部3は、与えられた圧伸率Rに基
づいて、供給された類似度が最も大きくなる(誤差が最
も小さくなる)切り出し開始位置を決定する。一方、各
チャネルの信号DIL,DIRは、それぞれ個別に時間軸
圧伸処理部4,5に入力されている。これら時間軸圧伸
処理部4,5は、それぞれ合成信号DIに基づいて求め
られた左右チャネルに共通の切り出し開始位置に基づい
て、各チャネル毎に波形の切り出しとクロスフェードに
よる接続を行って、圧伸率Rに応じた時間軸圧伸処理を
行う。
【0013】図2は、時間軸圧伸処理部4(5)の構成
を示すブロック図である。時間軸圧伸すべきL(R)チ
ャネル信号DIL(DIR)は、波形メモリ11に順次格
納される。波形メモリ11に格納された信号DIL(D
R)は、読出位置制御部12の制御に基づき、指定さ
れた切り出し開始位置から所定のデータ長で連結する2
種類のデータD1,D2として順次読み出される。波形
メモリ11から読み出されたデータD1,D2は、クロ
スフェード部13に供給され、ここでクロスフェード処
理される。クロスフェード処理されたデータは、出力カ
ウント部14を介して圧伸された出力信号DOL(D
R)として出力される。出力カウント部14は、出力
信号のデータ数をカウントする。制御部15は、外部か
ら指定された圧伸率Rに基づいて、クロスフェード時間
や探索範囲等を決定したり、切り出し位置決定部3から
与えられた切り出し開始位置に基づいて切り出しデータ
長等を決定する。また、制御部15は、決定された切り
出しデータ長を出力カウント部14にセットし、出力カ
ウント部14が制御部15によってセットされた切り出
しデータ長をカウントしたら、次の切り出し位置の探索
を実行するように各部を制御する。
【0014】次にこのように構成された時間軸圧伸装置
の動作を説明する。図3は、圧伸率Rを説明するための
図である。同図(a),(b)に示すように原ディジタ
ル信号の長さをL1、出力ディジタル信号の長さをL2
(但しL2<L1)としたとき、圧伸率Rは、R=L2
/L1で求められる。この場合R<1.0であるから、
出力ディジタル信号は、時間軸圧縮された圧縮ディジタ
ルデータとなる。また同図(c)に示すように、出力デ
ィジタル信号の長さをL3(但しL3>L1)としたと
き、圧伸率R=L3/L1>1.0となり、出力ディジ
タル信号は時間軸伸長された伸長ディジタルデータとな
る。尺合わせ等の用途では、出力ディジタル信号の収録
時間に合わせるように原ディジタル信号の時間軸を圧縮
又は伸長するので、予め収録されている原ディジタル信
号の収録時間と目標とする収録時間とから圧伸率Rが決
められる。
【0015】圧伸率Rはまた、波形の切り出し長さLs
と、切り出された波形の後端位置から次の切り出し波形
の先頭位置までのオフセットの長さLoffによって表す
こともできるので、オフセットの長さLoffが変わって
も、これに合わせて切り出し波形の長さLsを変えるこ
とによって一定の圧伸率Rに合わせ込むことができる。
そこで、この実施例では、時間軸圧縮の場合は図4に示
すように、また時間軸伸長の場合には図5に示すよう
に、次に切り出す各チャネルの波形の先頭位置を、全チ
ャネルの合成信号DIをベースとして、この合成信号D
I上で所定の探索開始位置tsから探索終了位置teま
で移動させたときに、現在の終端部と次に切り出す波形
の先端部のクロスフェード期間tcfの合成信号DIの波
形が最も類似する位置txを求め、その位置から各チャ
ネルの次の波形を切り出すようにしている。txを切り
出し先頭位置とした場合のクロスフェード波形の類似度
S(x)は、下記数1のように誤差の二乗和の形で求め
られる。勿論、これは一例であり、類似度S(x)を誤
差の絶対値和で求めるようにしても良い。
【0016】
【数1】
【0017】切り出し先頭位置txが決定されると、次
に切り出す波形の長さが決まる。即ち、i-1番目に決定
されたオフセットの長さをLoffi-1とすると、次に切り
出す波形の長さLsiは、
【0018】
【数2】 (但し、R≠1,Loffi-1>0のとき圧縮 Loffi-1<0のとき伸長)
【0019】で求めることができる。なお、切り出す波
形の長さLsiは、上式に拘わらず、最低切り出し長さL
sminを設定し、この最低切り出し長さLsminよりも短く
ならないように設定することが望ましい。この最低切り
出し長さLsminとしては、例えば最低周波数を50Hz
として20msecとする。また、これに対応して探索範囲
ts−teも、20msec程度に設定する。具体的な探索
開始位置tsと探索終了位置teは、例えば、ts=5
msec,te=25msecのように決定すればよい。
【0020】なお、圧伸率が1から離れれば離れるほど
(圧縮率や伸長率が高くなればなるほど)、原ディジタ
ル信号との近似性がなくなってくるので、波形のつなぎ
部分がより不自然になりやすい。このため、最適なクロ
スフェード期間の長さtcfを、圧伸率が1から離れるに
つれて長くするように適応的に変化させることが望まし
い。より具体的には、例えば圧縮率50%又は伸長率2
00%の場合、切り出し波形の長さLsiの50%程度を
クロスフェード期間の長さtcfとして設定し、圧伸率が
100%に近づくにつれて切り出し波形の長さLsiに対
するクロスフェード期間tcfの割合を0%に近づけるよ
うにする。
【0021】また、クロスフェード期間の長さtcfが長
い場合、前述した類似度の計算に時間がかかるので、類
似度計算のステップ幅を、クロスフェード期間の長さt
cfに応じて変化させるようにしても良い。例えば圧縮率
50%又は伸長率200%では、3〜5サンプルおきに
データを比較して類似度を計算し、圧伸率が100%に
近づくにつれて1サンプルずつのデータ比較に近づけ
る。クロスフェード波形の類似度を探すような用途で
は、振幅レベルの大きな変動を伴うピッチ波形での相関
がとれればよいので、小さな変動部分はあまり考慮する
必要はなく、このような処理を行っても結果に大きな差
がでることはない。
【0022】図6は、類似度計算及び切り出し位置決定
の手順を示したフローチャートである。まず、探索のた
めのパラメータiを0にリセットし、類似度Sとして初
期値Smaxを与え、現在位置Tを探索開始位置tsにセ
ットする(S11)。次に、切り出し位置txとして、
ts+iをセットし(S12)、jを0からtcfまで変
化させながら、下記数3の計算を行う(S14〜S1
7)。
【0023】
【数3】 d=d+{DI(t0+j)−DI(tx+j)}2
【0024】求められたdがSよりも小さければ、類似
度Sをdに、最小類似度位置Tをtxにそれぞれ更新す
る(S18,S19)。そして、iを更新して、次の切
り出し位置txについて同様の処理を繰り返す(S2
0,S12)。txが探索終了位置teに達したら処理
を終了する(S13)。これによってTには、最終的に
最小類似度が得られた切り出し開始位置が格納されるこ
とになる。
【0025】図7は、この装置による原ディジタル信号
の時間軸圧伸手順を示すフローチャートである。まず、
波形メモリ11に、少なくとも切り出し位置探索に必要
な量の対応チャネルの原ディジタル信号波形のデータを
バッファリングする(S21)。
【0026】続いて、制御部15は、切り出し位置決定
部3より与えられる切り出し位置txから切り出し波形
の長さLsを求め、これを出力カウントの最大値Nmax
として記憶する。同時に、クロスフェード部13にクロ
スフェード処理の動作切換を指示する(S22)。
【0027】次に、与えられた切り出し位置txに基づ
いて、読出位置制御部12で、波形メモリ11の他方の
ポインタ位置をセットする(S23)。即ち、時間軸圧
縮の場合には、図8(a)に示すように、波形メモリ1
1のポインタDP1,DP2でそれぞれ示されるオフセ
ットLoffi-1を保ってそれぞれデータが読み出されてい
るときに、先行する一方のポインタDP2が切り出し波
形の後端位置(後端のクロスフェード開始位置)に達し
たとき、次の切り出し位置txが求められる。このと
き、追従していた他方のポインタDP1がDP1′の位
置までジャンプして、新たなオフセットLoffiを保った
まま、2つのポインタDP1′,DP2が同時に移動し
ていく。また、時間軸伸長の場合には、図8(b)に示
すように、ポインタのジャンプする方向が上述した前方
向ではなく、後ろ方向になる。波形メモリ11のこれら
2つのポインタが示す位置からデータD1,D2がそれ
ぞれ読み出される。読み出されたデータD1,D2は、
クロスフェード部13に送られる(S24)。
【0028】クロスフェード部13では、制御部15に
よって求められたクロスフェード時間tcfに基づいて、
クロスフェード合成処理を実行する。即ち、図9に示す
ように、データD1にはクロスフェード係数W1を乗算
し、データD2にはクロスフェード係数W2を乗算し、
両者を加算することにより合成データを生成する(S2
5)。但し、W1+W2=1.0である。同図(a)は
圧伸率Rが1に近い場合のクロスフェード係数W1,W
2を、同図(b)は圧伸率Rが1から離れている場合
(例えばR=0.5,R=2.0)のクロスフェード係
数W1,W2をそれぞれ示している。得られた合成デー
タは出力カウント部14に送られる(S25)。
【0029】出力カウント部14では、合成データの出
力カウント値Nをカウントし、その値Nを制御部15に
送る(S26)。制御部15では、出力カウント値Nが
出力カウント最大値Nmaxに達したかどうかを判定し
(S27)、最大値Nmaxに達していなかったらポイン
タDP1,DP2をそれぞれ更新して(S28)、次の
データD1,D2を読み出して(S24)、クロスフェ
ード処理を繰り返す(S25〜S27)。出力カウント
値Nが最大値Nmaxに達したら(S27)、次の切り出
し位置探索のために必要な原ディジタル信号を波形メモ
リ11にバッファリングして、同様の処理を繰り返す
(S21〜S28)。
【0030】このように、この装置によれば、全チャネ
ルの合成信号DIのクロスフェード部分に対応する波形
同士が類似している部分を探索して、その位置を全チャ
ネルに共通の切り出し開始位置として決定し、且つ指定
された圧伸率を維持するように波形を切り出すようにし
ているので、自然な定位感を維持しつつ、波形のつなぎ
をスムーズにして、違和感のないステレオ信号の時間軸
圧伸処理を実現することができる。また、この装置で
は、圧伸率に応じてクロスフェードする時間tcfを変え
ているので、圧縮率や伸長率が高い場合でも、自然なつ
なぎが可能になる。
【0031】なお、この発明は、上述した実施例に限定
されるものではない。上記実施例では、対象となるステ
レオ信号として、ディジタル・オーディオ・ステレオ信
号のL・Rチャンネル、すなわち2チャンネルの信号を
用いたが、3チャンネル以上の信号で構成されるいわゆ
るサラウンドステレオ信号にも適用できることは言うま
でもない。例えばAC3信号などの5チャンネル信号に
対しては、全5チャンネルを対象としてそれらの全部又
は一部の加算信号などからなる合成信号を作成し、この
合成信号に基づいて波形切り出し位置を決定し、この切
り出し位置で一律に全5チャンネルの波形切り出しを行
い、各々をクロスフェード接続するようにしても良い。
【0032】また、上記実施例では、クロスフェード処
理のための窓関数として台形窓を用いたが、ガウシアン
窓、ハミング窓等、他の窓関数を用いた場合でも、同様
の効果が得られる。
【0033】
【発明の効果】以上述べたように、この発明によれば、
切り出した波形同士をクロスフェードして結合するに際
し、ステレオ信号の全チャネルの合成信号に基づいて、
次に切り出す波形の切り出し開始位置を決定し、この決
定された切り出し開始位置に基づいて各チャネルの信号
の波形切り出してクロスフェードで接続する処理を行う
ので、全チャネルの切り出し位置を全く同じ位置にする
ことができ、しかもその位置は、各チャネルで独立に求
められる最適切り出し位置の平均的位置に設定されるこ
とになるため、自然な定位感を維持しつつ、つなぎ部分
での音質の劣化も防止することができるという効果を奏
する。
【図面の簡単な説明】
【図1】 この発明の一実施例に係るステレオ信号の時
間軸圧伸装置のブロック図である。
【図2】 同時間軸圧伸装置における時間軸圧伸処理部
のブロック図である。
【図3】 ディジタル信号の圧伸率を説明するための図
である。
【図4】 同装置を使用した時間軸圧縮処理を説明する
ための図である。
【図5】 同装置を使用した時間軸伸長処理を説明する
ための図である。
【図6】 同装置の類似度計算処理及び切り出し位置決
定処理を示すフローチャートである。
【図7】 同装置の時間軸圧伸処理を示すフローチャー
トである。
【図8】 同装置における波形メモリと読出位置の制御
を説明するための図である。
【図9】 同装置におけるクロスフェード処理を説明す
るための図である。
【符号の説明】
1…加算器、2…類似度評価部、3…切り出し位置決定
部、4,5…時間軸圧伸処理部、11…波形メモリ、1
2…読出位置制御部、13…クロスフェード部、14…
出力カウント部、15…制御部。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 時間軸圧伸すべきステレオ信号から所定
    長さの波形を順次切り出して、各切り出された波形の両
    端をクロスフェードさせながら結合することにより、指
    定された圧伸率で時間軸圧伸された出力信号を生成する
    ステレオ信号の時間軸圧伸方法において、 次に切り出す波形の切り出し開始位置を、前記ステレオ
    信号の全チャネルを合成した信号における所定の探索開
    始位置から探索終了位置までの間の、クロスフェード期
    間の波形同士が最も類似する位置に決定し、 この決定された切り出し開始位置に基づいて前記ステレ
    オ信号の各チャネルの信号を個々に切り出してクロスフ
    ェードにより結合するようにしたことを特徴とするディ
    ジタル信号の時間軸圧伸方法。
  2. 【請求項2】 時間軸圧伸すべきステレオ信号の各チャ
    ネルの信号から所定長さの波形を順次切り出して、各切
    り出された波形の両端をクロスフェードさせながら結合
    することにより、指定された圧伸率で時間軸圧伸された
    出力信号を生成するステレオ信号の時間軸圧伸装置にお
    いて、 前記ステレオ信号の全チャネルを合成した信号に対し
    て、所定の探索開始位置から探索終了位置までの間、ク
    ロスフェードされる波形同士が最も類似する次の切り出
    し開始位置を、前記ステレオ信号の各チャネルに共通の
    切り出し開始位置として決定する類似度評価・切出位置
    決定手段と、 前記ステレオ信号の各チャネルに対応して設けられ、前
    記類似度評価・切出位置決定手段で決定された切り出し
    開始位置に基づいて前記ステレオ信号の各チャネルの信
    号をそれぞれ切り出してクロスフェードにより結合する
    複数の時間軸圧伸処理手段とを備えたことを特徴とする
    ディジタル信号の時間軸圧伸装置。
JP17543999A 1999-06-22 1999-06-22 ステレオ信号の時間軸圧伸方法及び装置 Expired - Fee Related JP3430974B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP17543999A JP3430974B2 (ja) 1999-06-22 1999-06-22 ステレオ信号の時間軸圧伸方法及び装置
US09/598,091 US6487536B1 (en) 1999-06-22 2000-06-21 Time-axis compression/expansion method and apparatus for multichannel signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17543999A JP3430974B2 (ja) 1999-06-22 1999-06-22 ステレオ信号の時間軸圧伸方法及び装置

Publications (2)

Publication Number Publication Date
JP2001005500A true JP2001005500A (ja) 2001-01-12
JP3430974B2 JP3430974B2 (ja) 2003-07-28

Family

ID=15996119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17543999A Expired - Fee Related JP3430974B2 (ja) 1999-06-22 1999-06-22 ステレオ信号の時間軸圧伸方法及び装置

Country Status (2)

Country Link
US (1) US6487536B1 (ja)
JP (1) JP3430974B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518162A (ja) * 2001-01-16 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリック符号化における信号成分の連結
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置
JP2009536885A (ja) * 2006-05-12 2009-10-22 クレイン アンド カンパニー インコーポレーテッド 単独で、またはセキュリティドキュメントまたはラベルと共に、スタティック像および/または他の投影された像により空間的にコーディネートされた像を投影するマイクロ光学的膜構造体
JP2012181429A (ja) * 2011-03-02 2012-09-20 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3430968B2 (ja) 1999-05-06 2003-07-28 ヤマハ株式会社 ディジタル信号の時間軸圧伸方法及び装置
JP4300641B2 (ja) * 1999-08-10 2009-07-22 ヤマハ株式会社 マルチトラック音源信号の時間軸圧伸方法及び装置
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
US20050137729A1 (en) * 2003-12-18 2005-06-23 Atsuhiro Sakurai Time-scale modification stereo audio signals
US8296143B2 (en) * 2004-12-27 2012-10-23 P Softhouse Co., Ltd. Audio signal processing apparatus, audio signal processing method, and program for having the method executed by computer
JP4550652B2 (ja) 2005-04-14 2010-09-22 株式会社東芝 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
US8155972B2 (en) * 2005-10-05 2012-04-10 Texas Instruments Incorporated Seamless audio speed change based on time scale modification
US7642444B2 (en) * 2006-11-17 2010-01-05 Yamaha Corporation Music-piece processing apparatus and method
US20100169105A1 (en) * 2008-12-29 2010-07-01 Youngtack Shim Discrete time expansion systems and methods

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3076859B2 (ja) 1992-04-20 2000-08-14 三菱電機株式会社 ディジタルオーディオ信号の信号処理装置
JP3759810B2 (ja) 1997-04-07 2006-03-29 ローランド株式会社 波形データの時間圧縮伸張方法および装置
JP3546755B2 (ja) * 1999-05-06 2004-07-28 ヤマハ株式会社 リズム音源信号の時間軸圧伸方法及び装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004518162A (ja) * 2001-01-16 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリック符号化における信号成分の連結
JP2009536885A (ja) * 2006-05-12 2009-10-22 クレイン アンド カンパニー インコーポレーテッド 単独で、またはセキュリティドキュメントまたはラベルと共に、スタティック像および/または他の投影された像により空間的にコーディネートされた像を投影するマイクロ光学的膜構造体
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置
US8392197B2 (en) 2007-08-22 2013-03-05 Nec Corporation Speaker speed conversion system, method for same, and speed conversion device
JP2012181429A (ja) * 2011-03-02 2012-09-20 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム

Also Published As

Publication number Publication date
JP3430974B2 (ja) 2003-07-28
US6487536B1 (en) 2002-11-26

Similar Documents

Publication Publication Date Title
JP3546755B2 (ja) リズム音源信号の時間軸圧伸方法及び装置
JP3430968B2 (ja) ディジタル信号の時間軸圧伸方法及び装置
US5842172A (en) Method and apparatus for modifying the play time of digital audio tracks
JP3430974B2 (ja) ステレオ信号の時間軸圧伸方法及び装置
JP2004527000A (ja) オーディオ信号の高品質タイムスケーリング及びピッチスケーリング
JPH11194796A (ja) 音声再生装置
KR100303913B1 (ko) 음성처리방법, 음성처리장치 및 기록재생장치
JP3465628B2 (ja) オーディオ信号の時間軸圧伸方法及び装置
JP4300641B2 (ja) マルチトラック音源信号の時間軸圧伸方法及び装置
US8635077B2 (en) Apparatus and method for expanding/compressing audio signal
KR101008250B1 (ko) 기지 음향신호 제거방법 및 장치
JP4581190B2 (ja) 音楽信号の時間軸圧伸方法及び装置
JP2905191B1 (ja) 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0962257A (ja) 楽音信号処理装置
JP2001255882A (ja) 音声信号処理装置及びその信号処理方法
JP2003241800A (ja) ディジタル信号の時間軸圧伸方法及び装置
JP2009282536A (ja) 既知音響信号除去方法及び装置
JP4364544B2 (ja) 音声信号処理装置及びその方法
JP2007094004A (ja) 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置
JP2002297200A (ja) 話速変換装置
JPH06337696A (ja) 速度変換制御装置と速度変換制御方法
JPH0411300A (ja) 音声信号の時間圧縮伸長方法
AU2002248431A1 (en) High quality time-scaling and pitch-scaling of audio signals
JP2002023750A (ja) オーディオ波形データ再生装置、オーディオ波形データの時間軸圧縮伸長処理装置およびオーディオ波形データのピッチ変換処理装置
JP2001242870A (ja) 楽音発生装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090523

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100523

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140523

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees