JP2006293230A - 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 - Google Patents

音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 Download PDF

Info

Publication number
JP2006293230A
JP2006293230A JP2005117375A JP2005117375A JP2006293230A JP 2006293230 A JP2006293230 A JP 2006293230A JP 2005117375 A JP2005117375 A JP 2005117375A JP 2005117375 A JP2005117375 A JP 2005117375A JP 2006293230 A JP2006293230 A JP 2006293230A
Authority
JP
Japan
Prior art keywords
channel
acoustic signal
similarity
feature
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005117375A
Other languages
English (en)
Other versions
JP4550652B2 (ja
Inventor
Koichi Yamamoto
幸一 山本
Akinori Kawamura
聡典 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005117375A priority Critical patent/JP4550652B2/ja
Priority to US11/376,130 priority patent/US7870003B2/en
Priority to CNB2006100666200A priority patent/CN100555876C/zh
Publication of JP2006293230A publication Critical patent/JP2006293230A/ja
Application granted granted Critical
Publication of JP4550652B2 publication Critical patent/JP4550652B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】全チャンネル共通の特徴量を正確に抽出し、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができる音響信号処理装置を提供する。
【解決手段】マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し(特徴抽出手段3)、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う(時間軸圧伸部4)。これにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
【選択図】 図1

Description

本発明は、マルチチャンネル音響信号を時間的に圧縮/伸張する音響信号処理装置、音響信号処理プログラム及び音響信号処理方法に関する。
従来、話速変換のように音響信号の時間的な長さを変化させる場合、入力信号から基本周波数などの特徴量を抽出し、得られた特徴量に基づいて決定される適応的な時間幅を有する信号の挿入・削除を行うことによって所望とする圧伸率を実現していた。代表的な時間軸圧伸方法として、例えば、非特許文献1に記載されているPICOLA(Pointer Interval Controlled OverLap and Add)がある。このPICOLAでは、入力信号から基本周波数を抽出し、得られた基本周波数分の波形の挿入及び削除を行うことによって時間的な圧伸処理を行っている。また、特許文献1では、クロスフェード区間の波形が最も類似する位置で波形を切り出し、切り出された波形の両端を接続することによって時間的な圧伸処理を行っている。どちらの手法も原信号の時間軸方向に区切られた2つの区間の類似性を示す特徴量に基づいた圧伸処理を行っており、音程を変化させることなく自然な時間軸圧縮及び伸張処理が可能になる。
ところで、処理する音響信号がステレオや5.1チャンネル信号に代表されるようなマルチチャンネルの音響信号である場合、各チャンネルについて独立に時間軸圧伸処理を行うと、各チャンネルから抽出される基本周波数などの特徴量が必ずしも一致せず、波形の挿入・削除を行うタイミングが各チャンネルで異なってしまう。その結果、処理後の各チャンネルの信号間で原信号にはなかった位相差が生じてしまい、視聴時に違和感を与えてしまうという問題が生じる。
そこで、マルチチャンネル音響信号の話速変換では、音源定位を保つために、全てのチャンネルに共通の特徴量(共通ピッチ)を抽出し、得られた共通の特徴量(共通ピッチ)に基づいて波形の挿入・削除を行うことでチャンネル間の同期をとる必要がある。このように全チャンネル共通の特徴量(共通ピッチ)を抽出し、チャンネル間の同期を保つ従来技術としては、例えば特許文献2や特許文献3に記載されている技術がある。これらの技術によれば、マルチチャンネル音響信号の全部もしくは一部を合成(加算)した信号から特徴量(共通ピッチ)の抽出を行っている。例えば、入力信号がステレオ信号であった場合には、LチャンネルとRチャンネルを合成(加算)したL+Rの信号から全チャンネル共通の特徴量を抽出することになる。
森田直孝、板倉文忠 著「自己相関関数を用いた音声の時間軸での伸縮」、日本音響学会講演論文集3−1−2、昭和61年10月、p.149−150 特許第3430968号公報 特許第2905191号公報 特許第3430974号公報
しかしながら、前述したようなマルチチャンネル音響信号を合成(加算)した信号から全チャンネル共通の特長量を抽出する方法によれば、複数のチャンネル信号を合成(加算)する際に信号間で逆位相の音が含まれていた場合、特徴量(共通ピッチ)を正確に抽出することができないという問題がある。より具体的には、ステレオ信号におけるLチャンネルとRチャンネルが逆位相を持つ信号であった場合、L+Rのように両信号を合成(加算)してしまうと信号が打ち消されてしまい(同振幅の場合は0になる)、特徴量(共通ピッチ)を正確に抽出することが出来ないという問題がある。
本発明は、上記に鑑みてなされたものであって、全チャンネル共通の特徴量を正確に抽出し、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができる音響信号処理装置、音響信号処理プログラム及び音響信号処理方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の音響信号処理装置は、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出手段と、この特徴抽出手段で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸手段と、を備える。
また、本発明の音響信号処理プログラムは、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出機能と、この特徴抽出機能で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸機能と、をコンピュータに実行させる。
また、本発明の音響信号処理方法は、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出工程と、この特徴抽出工程で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸工程と、を含む。
本発明によれば、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行うことにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
以下に添付図面を参照して、この発明にかかる音響信号処理装置、音響信号処理プログラム及び音響信号処理方法の最良な実施の形態を詳細に説明する。
[第1の実施の形態]
本発明の第1の実施の形態を図1ないし図3に基づいて説明する。本実施の形態は、音響信号処理装置として、処理する音響信号がステレオであって音楽のテンポを変える場合や話速を変える場合に用いるマルチチャンネル音響信号処理装置を適用した例である。
図1は、本発明の第1の実施の形態にかかる音響信号処理装置1の構成を示すブロック図である。図1に示すように、音響信号処理装置1は、所定のサンプリング周波数で左入力信号及び右入力信号をA/D変換するA/D変換部2と、このA/D変換部2から出力される左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出手段である特徴抽出部3と、この特徴抽出部3で抽出された左右チャンネルに共通する特徴量に基づいて、入力された原ディジタル信号を指定された圧伸率に応じて時間軸圧伸処理を行う時間軸圧伸手段である時間軸圧伸部4と、この時間軸圧伸部4で処理された各チャンネルのディジタル信号をD/A変換した左出力信号及び右出力信号を出力するD/A変換部5とで構成されている。
特徴抽出部3は、左右の信号を用いて合成類似度計算を行う合成類似度計算手段である合成類似度計算部6と、この合成類似度計算部6で得られた合成類似度が最大となる探索位置を決定する最大値探索手段である最大値探索部7とから構成されている。
時間軸圧伸部4における時間軸圧伸処理には、PICOLA(Pointer Interval Controlled OverLap and Add)が用いられる。PICOLAは、非特許文献1に記載されているように、入力信号から基本周波数を抽出し、得られた基本周波数分の波形の挿入・削除を繰り返すことによって、所望とする圧伸率を実現する。ここで、(処理後時間長/処理前時間長)で表される時間軸圧伸率をRと定義すると、圧縮処理の場合は0<R<1、伸張処理の場合はR>1の範囲を採ることになる。なお、本実施の形態の時間軸圧伸部4においては、時間軸圧伸方式としてPICOLAを用いるようにしたが、時間軸圧伸方式はこれに限るものではなく、例えばクロスフェード区間の波形が最も類似する位置で波形を切り出し、切り出された波形の両端を接続することによって時間的な圧伸処理を行うようにしても良い。
次に、音響信号処理装置1における処理の手順について説明する。
まず、時間軸圧伸処理を行うステレオ信号の左入力信号及び右入力信号の各々がA/D変換部2によってアナログ信号からディジタル信号に変換される。
次に、特徴抽出部3においてA/D変換部2で変換された左ディジタル信号及び右ディジタル信号から左右チャンネル共通の基本周波数を抽出する。
特徴抽出部3における合成類似度計算部6では、A/D変換部2からの左右ディジタル信号について時間軸方向に区切られた2つの区間の合成類似度を計算する。合成類似度は、下記に示す式(1)に基づいて算出することができる。
Figure 2006293230
ここで、xl(n),xr(n)は時刻nにおける左信号及び右信号、Nは合成類似度を計算する波形窓幅、τは類似波形の探索位置、Δnは合成類似度計算を行う際の間引き幅、Δdは左右チャンネル間での間引き幅のずれを表している。
式(1)では、時間方向に区切られた2つの波形の合成類似度を自己相関関数で計算している。s(τ)は、探索位置τにおける左信号及び右信号それぞれの自己相関関数値の和、つまり、各チャンネルの類似度を合成(加算)した合成類似度を表している。合成類似度s(τ)が大きいほど、時刻nを始点とする長さNの波形と、時刻n+τを始点とする長さNの波形の左右チャンネルにおける平均的な類似度が高くなる。合成類似計算を行う波形窓幅Nは、少なくとも抽出対象とする基本周波数の最低周波数分を必要とする。例えば、A/D変換のサンプリング周波数を48000Hz、抽出する基本周波数の下限値を50Hzとした場合、波形窓幅Nは960サンプルになる。式(1)のように各チャンネルから得られる類似度を合成した合成類似度を用いることによって、左右チャンネル間で逆位相の音が含まれていた場合でも正確に類似度を表現することが可能になる。
また、式(1)では演算量を削減させることを目的として、各チャンネルの類似度をΔnおきに計算している。Δnは類似度計算の間引き幅を表しており、この値を大きく設定すれば演算量を削除することが可能になる。例えば、圧伸率が1以下(圧縮)である場合、変換処理に必要な短時間当たりの演算量は多くなる。そのため、圧伸率が1以下の場合は、Δnを5〜10サンプルと設定し、圧伸率が1に近づくにつれてΔnを1サンプルに近づけるように変化させてもよい。合成類似度計算においては、振幅の大局的な違いを掴むことが出来ればよく、このようにサンプルを間引いて計算を行っても時間軸圧伸後の音質が大きく低下することはない。また、5.1チャンネルなどのようにチャンネル数が増えると特徴抽出に必要な演算量は増えるため、Δnをチャンネル数に応じて決定してもよい。例えば、Δnのサンプル数をチャンネル数と同値にすることによって、5.1チャンネル信号を処理する際にも演算量を削減することが可能になる。
式(1)におけるΔdは、左右チャンネル間で間引き処理を行う位置のずれ幅を表している。これは、間引き処理を行う位置を左右チャンネルでずらすことによって、間引き処理による時間的な分解能の低下を低減させることを目的としたものである。例えば、ずらし幅ΔdをΔn/2のように設定した場合、式(1)ではΔn/2を間引き幅として左右チャンネル交互で類似度を計算していることに相当する。このようにマルチチャンネル間で間引き位置をずらすことにより、全チャンネルでの時間的な分解能の低下を削減することが可能になる。チャンネル間のずらし幅もΔnと同様にチャンネル数に応じて変化させてもよい。例えば、5.1チャンネル信号を処理する場合、各チャンネルのΔdを0、Δn×1/6、Δn×2/6、Δn×3/6、Δn×4/6、Δn×5/6のように設定することによって、Δn/6を間引き幅として全6チャンネル交互に類似度を計算していることに相当し、全チャンネルでの時間的な分解能の低下を削減させることが可能になる。
特徴抽出部3における最大値探索部7では、類似波形探索範囲において合成類似度が最大となる探索位置τmaxを探索する。合成類似度を式(1)で計算する場合、所定の探索開始位置Pstから終了位置Pedにおけるs(τ)の最大値を探索すればよい。例えば、A/D変換のサンプリング周波数を48000Hz、抽出する基本周波数の上限値を200Hz、下限値を50Hzとした場合、類似波形探索位置τは240〜960サンプルまでの間になり、その間でs(τ)を最大にするτmaxを求める。このようにして得られたτmaxが両チャンネル共通の基本周波数となる。この最大値探索においても間引き処理を適用することが出来る。つまり、時間軸方向の類似波形の探索位置τをΔτおきに探索開始位置Pstから探査終了位置Pedまで変化させるのである。Δτは類似波形探索の時間軸方向の間引き幅を表しており、この値を大きく設定すれば演算量を削除することが可能になる。Δτの値は、前述したΔnと同様に圧伸率及びチャンネル数に応じて変化させることにより、効果的に演算量を削減することが出来る。例えば、圧伸率が1以下の場合は、Δτを5〜10サンプルと設定し、圧伸率が1に近づくにつれてΔτを1サンプルに近づけるように変化させてもよい。
なお、以上の説明では、演算量を削減することに着目していたが、演算量に余裕がある場合は、間引き幅Δn、Δτを1サンプルとして詳細な合成類似度計算及び最大値探索を行うことも当然可能である。
時間軸圧伸部4では、特徴抽出部3で得られた基本周波数τmaxに基づいて左右信号の時間軸圧伸処理を行う。図2は、PICOLA方式により時間軸圧縮(R<1)が行われる際の音声信号波形を表している。図2に示すように、まず、時間軸圧縮の開始位置にポインタ(図2中、□で示す)を設定し、当該ポインタ以降の音声信号における基本周波数τmaxを特徴抽出部3で抽出する。次に、前記ポインタ位置から基本周波数τmax分の2つの波形A、Bをクロスフェードする重み付けにより重複加算した信号Cを生成する。ここで、波形Aに対しては、1から0へ、Bに対しては0から1へ直線的に向かう重みをつけて長さτmaxの波形Cを生成している。このクロスフェード処理は波形Cの前後の接続点における連続性を保つために設けられている。次に、ポインタをC上で
c=R・τmax/(1−R)
だけ移動させ、次処理の開始ポインタ(図2中、▽で示す)とする。以上の処理では、長さLc+τmax=τmax/(1−R)の入力信号から長さLcの出力波形が作られており圧伸率Rを満たしていることが分かる。
一方、図3は、PICOLA方式により時間軸伸張(R>1)が行われる際の音声信号波形を表している。図3に示すように、伸張処理の場合も圧縮処理と同様に、まず、時間軸圧縮の開始位置にポインタ(図3中、□で示す)を設定し、当該ポインタ以降の音声信号における基本周波数を特徴抽出部3から得る。前記ポインタ位置から基本周波数τmax分の2つの波形をA、Bとする。まず、波形Aをそのまま出力する。次に、波形Aに対しては、0から1へ、Bに対しては1から0へ直線的に向かう重み付けによる重畳加算を行うことにより、長さτmaxの波形Cを生成する。次に、ポインタをC上で
S=τmax/(R−1)
だけ移動させ、次処理の開始ポインタ(図3中、▽で示す)とする。以上の処理では、長さLSの信号から長さLS+τmax=R・τmax/(R−1)の出力信号が作られており圧伸率Rを満たしている。
以上が、時間軸圧伸部4におけるPICOLAによる時間軸圧伸処理となる。
このような時間軸圧伸部4では、PICOLAによる時間軸圧伸処理を左右信号それぞれについて行う。このとき特徴抽出部3で抽出された共通の基本周波数τmaxを左右チャンネルにおける時間軸圧伸処理に使用することにより、チャンネル間での同期が保たれ、変換後の音声に違和感のない時間軸圧伸処理を行うことが可能になる。
最後に、D/A変換部5では、時間軸圧伸部4で処理された左右の信号をD/A変換することによりディジタル信号からアナログ信号に変換する。
以上が、本実施の形態におけるステレオ音響信号の時間軸圧伸処理である。
このように本実施の形態によれば、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行うことにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
また、合成類似度計算及び最大類似度探索を行う際、サンプル数を間引いて計算を行うことによって特徴量抽出に必要な演算量を大幅に削減させることができる。
さらに、合成類似度計算において各チャンネルでの間引き位置をずらすことにより、全チャンネル時間的な分解能の低下を防ぐことができる。
なお、5.1チャンネル音響信号のようにチャンネル数が増えた場合も、全チャンネルもしくは一部のチャンネル信号から計算した合成類似度を用いて特徴抽出を行うことにより、チャンネル間の位相関係に左右されることなく正確に特徴量を抽出することが可能になる。
[第2の実施の形態]
次に、本発明の第2の実施の形態を図4および図5に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
第1の実施の形態として示した音響信号処理装置1では、左信号及び右信号から両チャンネルに共通の特徴量を抽出する処理が、ディジタル回路構成のハードウェア資源によって実行される例を示した。これに対して、本実施の形態では、そのような左信号及び右信号から両チャンネルに共通の特徴量を抽出する処理を、音響信号処理装置のハードウェア資源(例えば、HDDやNVRAMなど)にインストールされたコンピュータプログラムによって実行する例を説明する。
図4は、本発明の第2の実施の形態にかかる音響信号処理装置10のハードウェア資源を示すブロック図である。本実施の形態の音響信号処理装置10は、特徴抽出部3に代えてシステムコントローラ11が設けられている。システムコントローラ11は、システムコントローラ11全体の制御を行なうCPU(Central Processing Unit)12、システムコントローラ11の制御プログラムを記憶したROM(Read Only Memory)13、及びCPU12の作業用メモリであるRAM(Random Access Memory)14から構築されるマイクロコンピュータである。そして、システムコントローラ11にバス接続されたHDD(Hard Disk Drive)15に左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理のためのコンピュータプログラムをインストールしておき、そのようなコンピュータプログラムが音響信号処理装置10の起動時にRAM14に書き込まれて実行される構成になっている。すなわち、左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理は、コンピュータであるシステムコントローラ11がコンピュータプログラムに従い実行することになる。この意味で、HDD15は、音響信号処理プログラムであるコンピュータプログラムを記憶する記憶媒体として機能する。
以下、コンピュータプログラムに従い実行される左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理を図5に示すフローチャートを参照して説明する。図5に示すように、CPU12は、まず、圧伸処理の開始位置をT0とし、類似波形の探索位置を示すパラメータτをTSTにセットするとともに、最大合成類似度の初期値としてSmax=−∞を与える(ステップS1)。
次いで、時刻nをT0、探索位置τにおける合成類似度S(τ)を0として(ステップS2)、合成類似度S(τ)を計算する(ステップS3)。合成類似度S(τ)の計算は、時刻nをΔnずつ増やし(ステップS4)、nがT0+Nよりも大きくなるまで(ステップS5のY)、繰り返される。
nがT0+Nよりも大きくなると(ステップS5のY)、ステップS6に進み、計算された合成類似度S(τ)とSmaxとを比較する。計算された合成類似度S(τ)がSmaxよりも大きい場合には(ステップS6のY)、Smaxを計算された合成類似度S(τ)に置き換えるとともに、この場合のτをτmaxとし(ステップS7)、ステップS8に進む。一方、計算された合成類似度S(τ)がSmaxよりも小さい場合には(ステップS6のN)、そのままステップS8に進む。
以上のステップS2〜S7の処理は、τをΔτずつ増やしながら(ステップS8)、TEDを越えるまで行い(ステップS9のY)、最終的に得られた最大の合成類似度Smaxにおけるτmaxを左右信号に共通の基本周波数(特徴量)とする(ステップS10)。
このように本実施の形態によれば、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行うことにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
なお、HDD15にインストールされる音響信号処理プログラムであるコンピュータプログラムは、CD−ROMやDVD−ROM等の光情報記録メディアやFD等の磁気メディア等の記憶媒体に記録され、この記憶媒体に記録されたコンピュータプログラムがHDD15にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、音響信号処理プログラムであるコンピュータプログラムを記憶する記憶媒体となり得る。さらには、音響信号処理プログラムであるコンピュータプログラムは、例えばネットワークを介して外部から取り込まれ、HDD15にインストールされても良い。
[第3の実施の形態]
次に、本発明の第3の実施の形態を図6に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
第1の実施の形態として示した音響信号処理装置1では、各チャンネルの波形の自己相関関数値の和、つまり、各チャンネルの類似度を合成(加算)した合成類似度S(τ)を算出し、合成類似度s(τ)の最大値における基本周波数τmaxを左右信号に共通の基本周波数(特徴量)とし、共通の基本周波数τmaxを左右チャンネルにおける時間軸圧伸処理に使用するようにした。本実施の形態においては、各チャンネルの波形の振幅差の絶対値和である各チャンネルの類似度を合成(加算)した合成類似度S(τ)を算出し、合成類似度s(τ)の最小値における基本周波数τminを左右信号に共通の基本周波数(特徴量)とし、共通の基本周波数τminを左右チャンネルにおける時間軸圧伸処理に使用するようにした。
図6は、本発明の第3の実施の形態にかかる音響信号処理装置20の構成を示すブロック図である。図6に示すように、音響信号処理装置20は、所定のサンプリング周波数で左入力信号及び右入力信号をA/D変換するA/D変換部2と、このA/D変換部2から出力される左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出手段である特徴抽出部3と、この特徴抽出部3で抽出された左右チャンネルに共通する特徴量に基づいて、入力された原ディジタル信号を指定された圧伸率に応じて時間軸圧伸処理を行う時間軸圧伸手段である時間軸圧伸部4と、この時間軸圧伸部4で処理された各チャンネルのディジタル信号をD/A変換した左出力信号及び右出力信号を出力するD/A変換部5とで構成されている。
特徴抽出部3は、左右の信号を用いて合成類似度計算を行う合成類似度計算手段である合成類似度計算部21と、この合成類似度計算部21で得られた合成類似度が最小となる探索位置を決定する最小値探索手段である最小値探索部22とから構成されている。
特徴抽出部3における合成類似度計算部21では、A/D変換部2からの左右ディジタル信号について時間軸方向に区切られた2つの区間の合成類似度を計算する。合成類似度は、下記に示す式(2)に基づいて算出することができる。
Figure 2006293230
ここで、xl(n),xr(n)は時刻nにおける左信号及び右信号、Nは合成類似度を計算する波形窓幅、τは類似波形の探索位置、Δnは合成類似度計算を行う際の間引き幅、Δdは左右チャンネル間での間引き幅のずれを表している。
式(2)では、時間方向に区切られた2つの波形の類似度を振幅差の絶対値和で計算し、探索位置τにおける左信号及び右信号それぞれの振幅差の絶対値和を合成(加算)することにより合成類似度s(τ)を算出している。合成類似度s(τ)が小さいほど,時刻nを始点とする長さNの波形と、時刻n+τを始点とする長さNの波形の左右チャンネルにおける平均的な類似度が高くなる。
特徴抽出部3における最小値探索部22では、類似波形探索範囲において合成類似度が最小となる探索位置τminを探索する。合成類似度を式(2)で計算する場合、所定の探索開始位置Pstから終了位置Pedにおけるs(τ)の最小値を探索すればよい。
このように本実施の形態によれば、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行うことにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
[第4の実施の形態]
次に、本発明の第4の実施の形態を図7に基づいて説明する。なお、前述した第1の実施の形態ないし第3の実施の形態と同じ部分は同じ符号で示し説明も省略する。
第3の実施の形態として示した音響信号処理装置20では、左信号及び右信号から両チャンネルに共通の特徴量を抽出する処理が、ディジタル回路構成のハードウェア資源によって実行される例を示した。これに対して、本実施の形態では、そのような左信号及び右信号から両チャンネルに共通の特徴量を抽出する処理を、情報処理装置のハードウェア資源(例えば、HDD)にインストールされたコンピュータプログラムによって実行する例を説明する。
本実施の形態の音響信号処理装置のハードウェア構成は、第2の実施の形態で説明した音響信号処理装置10のハードウェア構成と何ら変わるものではないため、その説明は省略する。本実施の形態の音響信号処理装置は、第2の実施の形態で説明した音響信号処理装置10とは、HDD15にインストールされた左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理のためのコンピュータプログラムが異なるものである。
以下、コンピュータプログラムに従い実行される左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理を図7に示すフローチャートを参照して説明する。図7に示すように、CPU12は、まず、圧伸処理の開始位置をT0とし、類似波形の探索位置を示すパラメータτをTSTにセットするとともに、最小合成類似度の初期値としてSmin=∞を与える(ステップS11)。
次いで、時刻nをT0、探索位置τにおける合成類似度S(τ)を0として(ステップS12)、合成類似度S(τ)を計算する(ステップS13)。合成類似度S(τ)の計算は、時刻nをΔnずつ増やし(ステップS14)、nがT0+Nよりも大きくなるまで(ステップS15のY)、繰り返される。
nがT0+Nよりも大きくなると(ステップS15のY)、ステップS16に進み、計算された合成類似度S(τ)とSminとを比較する。計算された合成類似度S(τ)がSminよりも小さい場合には(ステップS16のY)、Sminを計算された合成類似度S(τ)に置き換えるとともに、この場合のτをτminとし(ステップS17)、ステップS18に進む。一方、計算された合成類似度S(τ)がSminよりも大きい場合には(ステップS16のN)、そのままステップS18に進む。
以上のステップS12〜S17の処理は、τをΔτずつ増やしながら(ステップS18)、TEDを越えるまで行い(ステップS19のY)、最終的に得られた最小の合成類似度Sminにおけるτminを左右信号に共通の基本周波数(特徴量)とする(ステップS20)。
このように本実施の形態によれば、マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出し、抽出された特徴量に基づいてマルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行うことにより、全チャンネル共通の特徴量を正確に抽出することができ、得られた共通の特徴量に基づいて全チャンネルの同期を保った状態で時間圧伸処理を行うことができるので、高品質な時間軸圧伸処理を実現することができる。
本発明の第1の実施の形態にかかる音響信号処理装置の構成を示すブロック図である。 PICOLA方式により時間軸圧縮が行われる際の音声信号波形を示す説明図である。 PICOLA方式により時間軸伸張が行われる際の音声信号波形を示す説明図である。 本発明の第2の実施の形態にかかる音響信号処理装置のハードウェア資源を示すブロック図である。 左信号及び右信号から両チャンネルに共通の特徴量を抽出する特徴抽出処理の流れを示すフローチャートである。 本発明の第3の実施の形態にかかる音響信号処理装置の構成を示すブロック図である。 本発明の第4の実施の形態にかかる音響信号処理装置における特徴抽出処理の流れを示すフローチャートである。
符号の説明
1,10,20 音響信号処理装置
3 特徴抽出手段
4 時間軸圧伸手段
6 合成類似度計算手段
7 最大値探索手段
21 合成類似度計算手段
22 最小値探索手段

Claims (14)

  1. マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出手段と、
    この特徴抽出手段で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸手段と、
    を備えることを特徴とする音響信号処理装置。
  2. 前記特徴抽出手段は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の自己相関関数値の和である類似度を合成した合成類似度を算出する合成類似度計算手段と、この合成類似度計算手段で算出された合成類似度の最大値を探索して各チャンネル信号に共通の特徴量を抽出する最大値探索手段と、
    を備えることを特徴とする請求項1記載の音響信号処理装置。
  3. 前記特徴抽出手段は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の振幅差の絶対値和である類似度を合成した合成類似度を算出する合成類似度計算手段と、この合成類似度計算手段で算出された合成類似度の最小値を探索して各チャンネル信号に共通の特徴量を抽出する最小値探索手段と、
    を備えることを特徴とする請求項1記載の音響信号処理装置。
  4. 前記マルチチャンネル音響信号を構成する各チャンネル信号の類似度計算のサンプル数を間引いて合成類似度を算出する、
    ことを特徴とする請求項1ないし3のいずれか一記載の音響信号処理装置。
  5. 前記マルチチャンネル音響信号を構成する各チャンネル信号の類似度計算のサンプル数を間引く際に、各チャンネル信号における間引き位置を一致させない、
    ことを特徴とする請求項4記載の音響信号処理装置。
  6. 時間軸方向の類似波形の探索位置を間引いて所望の合成類似度を探索する、
    ことを特徴とする請求項2または3記載の音響信号処理装置。
  7. 間引き幅を前記マルチチャンネル音響信号のチャンネル数によって決定する、
    ことを特徴とする請求項4または6記載の音響信号処理装置。
  8. 間引き幅を指定された圧伸率に応じて決定する、
    ことを特徴とする請求項4または6記載の音響信号処理装置。
  9. マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出機能と、
    この特徴抽出機能で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸機能と、
    をコンピュータに実行させることを特徴とする音響信号処理プログラム。
  10. 前記特徴抽出機能は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の自己相関関数値の和である類似度を合成した合成類似度を算出する合成類似度計算機能と、この合成類似度計算機能で算出された合成類似度の最大値を探索して各チャンネル信号に共通の特徴量を抽出する最大値探索機能と、
    をコンピュータに実行させることを特徴とする請求項9記載の音響信号処理プログラム。
  11. 前記特徴抽出機能は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の振幅差の絶対値和である類似度を合成した合成類似度を算出する合成類似度計算機能と、この合成類似度計算機能で算出された合成類似度の最小値を探索して各チャンネル信号に共通の特徴量を抽出する最小値探索機能と、
    をコンピュータに実行させることを特徴とする請求項9記載の音響信号処理プログラム。
  12. マルチチャンネル音響信号を構成する各チャンネル信号から計算された類似度を合成した合成類似度に基づいて各チャンネル信号に共通の特徴量を抽出する特徴抽出工程と、
    この特徴抽出工程で抽出された前記特徴量に基づいて前記マルチチャンネル音響信号に対する時間的な圧縮/伸張処理を行う時間軸圧伸工程と、
    を含むことを特徴とする音響信号処理方法。
  13. 前記特徴抽出工程は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の自己相関関数値の和である類似度を合成した合成類似度を算出する合成類似度計算工程と、この合成類似度計算工程で算出された合成類似度の最大値を探索して各チャンネル信号に共通の特徴量を抽出する最大値探索工程と、
    を含むことを特徴とする請求項12記載の音響信号処理方法。
  14. 前記特徴抽出工程は、前記マルチチャンネル音響信号を構成する各チャンネル信号の波形の振幅差の絶対値和である類似度を合成した合成類似度を算出する合成類似度計算工程と、この合成類似度計算工程で算出された合成類似度の最小値を探索して各チャンネル信号に共通の特徴量を抽出する最小値探索工程と、
    を含むことを特徴とする請求項12記載の音響信号処理方法。
JP2005117375A 2005-04-14 2005-04-14 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法 Active JP4550652B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005117375A JP4550652B2 (ja) 2005-04-14 2005-04-14 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
US11/376,130 US7870003B2 (en) 2005-04-14 2006-03-16 Acoustical-signal processing apparatus, acoustical-signal processing method and computer program product for processing acoustical signals
CNB2006100666200A CN100555876C (zh) 2005-04-14 2006-04-13 声信号处理装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005117375A JP4550652B2 (ja) 2005-04-14 2005-04-14 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法

Publications (2)

Publication Number Publication Date
JP2006293230A true JP2006293230A (ja) 2006-10-26
JP4550652B2 JP4550652B2 (ja) 2010-09-22

Family

ID=37078086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005117375A Active JP4550652B2 (ja) 2005-04-14 2005-04-14 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法

Country Status (3)

Country Link
US (1) US7870003B2 (ja)
JP (1) JP4550652B2 (ja)
CN (1) CN100555876C (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007163915A (ja) * 2005-12-15 2007-06-28 Mitsubishi Electric Corp 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP2008107413A (ja) * 2006-10-23 2008-05-08 Sony Corp オーディオ信号伸張圧縮装置及び方法
JP2008145685A (ja) * 2006-12-08 2008-06-26 Mitsubishi Electric Corp 音声合成装置及び音声合成方法
JP2009048676A (ja) * 2007-08-14 2009-03-05 Toshiba Corp 再生装置および方法
JP2011521305A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声信号復号器、音声信号符号器、マルチチャンネル音声信号表現、復号化されたマルチチャンネル音声信号表現の提供方法、符号化されたマルチチャンネル音声信号表現の提供方法およびコンピュータプログラム
JP2013117635A (ja) * 2011-12-02 2013-06-13 Canon Inc 音声信号処理装置
JP2014518407A (ja) * 2011-07-15 2014-07-28 華為技術有限公司 多チャンネル・オーディオ信号を処理する方法および装置
US9015041B2 (en) 2008-07-11 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100169105A1 (en) * 2008-12-29 2010-07-01 Youngtack Shim Discrete time expansion systems and methods
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203199A (ja) * 1986-03-03 1987-09-07 富士通株式会社 ピツチ周期抽出方式
JPH08265697A (ja) * 1995-03-23 1996-10-11 Sony Corp 信号のピッチ抽出装置、ステレオ信号のピッチコレクション方法及びビデオテープレコーダー
JP2002297200A (ja) * 2001-03-30 2002-10-11 Sanyo Electric Co Ltd 話速変換装置
JP2004309893A (ja) * 2003-04-09 2004-11-04 Kobe Steel Ltd 音声信号処理装置及びその方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2905191B1 (ja) 1998-04-03 1999-06-14 日本放送協会 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3430968B2 (ja) 1999-05-06 2003-07-28 ヤマハ株式会社 ディジタル信号の時間軸圧伸方法及び装置
JP3430974B2 (ja) * 1999-06-22 2003-07-28 ヤマハ株式会社 ステレオ信号の時間軸圧伸方法及び装置
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP3871657B2 (ja) * 2003-05-27 2007-01-24 株式会社東芝 話速変換装置、方法、及びそのプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62203199A (ja) * 1986-03-03 1987-09-07 富士通株式会社 ピツチ周期抽出方式
JPH08265697A (ja) * 1995-03-23 1996-10-11 Sony Corp 信号のピッチ抽出装置、ステレオ信号のピッチコレクション方法及びビデオテープレコーダー
JP2002297200A (ja) * 2001-03-30 2002-10-11 Sanyo Electric Co Ltd 話速変換装置
JP2004309893A (ja) * 2003-04-09 2004-11-04 Kobe Steel Ltd 音声信号処理装置及びその方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007163915A (ja) * 2005-12-15 2007-06-28 Mitsubishi Electric Corp 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体
US8635077B2 (en) 2006-10-23 2014-01-21 Sony Corporation Apparatus and method for expanding/compressing audio signal
JP2008107413A (ja) * 2006-10-23 2008-05-08 Sony Corp オーディオ信号伸張圧縮装置及び方法
JP2008145685A (ja) * 2006-12-08 2008-06-26 Mitsubishi Electric Corp 音声合成装置及び音声合成方法
JP2009048676A (ja) * 2007-08-14 2009-03-05 Toshiba Corp 再生装置および方法
US9502049B2 (en) 2008-07-11 2016-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9646632B2 (en) 2008-07-11 2017-05-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
JP2014130359A (ja) * 2008-07-11 2014-07-10 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev 音声信号符号器、符号化されたマルチチャンネル音声信号表現の生成方法およびコンピュータプログラム
US9466313B2 (en) 2008-07-11 2016-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9015041B2 (en) 2008-07-11 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9025777B2 (en) 2008-07-11 2015-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, audio signal encoder, encoded multi-channel audio signal representation, methods and computer program
US9043216B2 (en) 2008-07-11 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, time warp contour data provider, method and computer program
US9263057B2 (en) 2008-07-11 2016-02-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9293149B2 (en) 2008-07-11 2016-03-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9299363B2 (en) 2008-07-11 2016-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp contour calculator, audio signal encoder, encoded audio signal representation, methods and computer program
JP2011521305A (ja) * 2008-07-11 2011-07-21 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声信号復号器、音声信号符号器、マルチチャンネル音声信号表現、復号化されたマルチチャンネル音声信号表現の提供方法、符号化されたマルチチャンネル音声信号表現の提供方法およびコンピュータプログラム
US9431026B2 (en) 2008-07-11 2016-08-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
US9406302B2 (en) 2011-07-15 2016-08-02 Huawei Technologies Co., Ltd. Method and apparatus for processing a multi-channel audio signal
JP2014518407A (ja) * 2011-07-15 2014-07-28 華為技術有限公司 多チャンネル・オーディオ信号を処理する方法および装置
JP2013117635A (ja) * 2011-12-02 2013-06-13 Canon Inc 音声信号処理装置

Also Published As

Publication number Publication date
CN1848691A (zh) 2006-10-18
US20060235680A1 (en) 2006-10-19
JP4550652B2 (ja) 2010-09-22
CN100555876C (zh) 2009-10-28
US7870003B2 (en) 2011-01-11

Similar Documents

Publication Publication Date Title
JP4550652B2 (ja) 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
JP2004505304A (ja) デジタルオーディオ信号の連続可変時間スケール変更
JP2005535915A (ja) 可変長さ合成と相関度計算減縮技法を利用したオーディオ信号の時間スケール修正方法
EP1840871B1 (en) Audio waveform processing device, method, and program
KR100303913B1 (ko) 음성처리방법, 음성처리장치 및 기록재생장치
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
JP4608650B2 (ja) 既知音響信号除去方法及び装置
JP3871657B2 (ja) 話速変換装置、方法、及びそのプログラム
JP2010134391A (ja) 音響信号に対する情報の埋め込み装置および音響信号を利用した位置検出装置
JP3422716B2 (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体
JP2015022236A (ja) 信号処理装置及びプログラム
JP2612867B2 (ja) 音声ピッチ変換方法
JP5552794B2 (ja) 音響信号の符号化方法および装置
JP2009282536A (ja) 既知音響信号除去方法及び装置
JP2001069010A (ja) 圧縮方法及び装置、伸長方法及び装置、圧縮伸長システム、記録媒体
JP2002297200A (ja) 話速変換装置
JPH06222794A (ja) 音声速度変換方法
KR100359988B1 (ko) 실시간 화속 변환 장치
JP4471780B2 (ja) 音声信号処理装置及びその方法
JP2007163915A (ja) 音声速度変換装置、音声速度変換プログラム及びそのプログラムを記憶したコンピュータ読み取り可能な記録媒体
JP2709198B2 (ja) 音声合成方法
JP6424462B2 (ja) オーディオ信号の時間軸圧縮伸張方法および装置並びにプログラム
JP2005204003A (ja) 連続メディアデータ高速再生方法、複合メディアデータ高速再生方法、多チャンネル連続メディアデータ高速再生方法、映像データ高速再生方法、連続メディアデータ高速再生装置、複合メディアデータ高速再生装置、多チャンネル連続メディアデータ高速再生装置、映像データ高速再生装置、プログラム、および、記録媒体
KR20040054843A (ko) 음성 신호의 시간축 변환 방법
KR101152616B1 (ko) 오디오 신호 배속 재생 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100204

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20100601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100708

R151 Written notification of patent or utility model registration

Ref document number: 4550652

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3