JP2000330599A - 信号処理方法及び装置、並びに情報提供媒体 - Google Patents

信号処理方法及び装置、並びに情報提供媒体

Info

Publication number
JP2000330599A
JP2000330599A JP11142516A JP14251699A JP2000330599A JP 2000330599 A JP2000330599 A JP 2000330599A JP 11142516 A JP11142516 A JP 11142516A JP 14251699 A JP14251699 A JP 14251699A JP 2000330599 A JP2000330599 A JP 2000330599A
Authority
JP
Japan
Prior art keywords
signal
pitch
decoding
conversion
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11142516A
Other languages
English (en)
Inventor
Kiyouya Tsutsui
京弥 筒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11142516A priority Critical patent/JP2000330599A/ja
Priority to EP00110699A priority patent/EP1054400A3/en
Priority to US09/574,899 priority patent/US6519558B1/en
Publication of JP2000330599A publication Critical patent/JP2000330599A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 元の音の高さよりも高い音を再生する場合
に、少ない演算量の処理で十分に高い所望の音を得られ
るようにし、復号装置のコストの上昇をも抑える。 【解決手段】 符号化データを復号再生する復号装置で
あり、復号後の再生信号のピッチを設定する制御部13
9と、設定したピッチに応じて符号化データの低域側の
みを復号する部分復号部133とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、符号化された信号
を復号してピッチ変換する信号処理方法及び装置、その
復号とピッチ変換を実現するプログラムを提供する情報
提供媒体に関するものである。
【0002】
【従来の技術】従来より、パルスコード変調(PCM)
されて記録等された音響信号を、当該PCM時のサンプ
リング間隔とは異なる間隔で再サンプリングすることに
より、音程(音の高さ)を変化させる技術が知られてい
る。例えば、元の信号の各サンプル値間の値を補間しな
がら、同一単位時間内に2倍のレートで得られた2倍の
個数のサンプル値を、元のサンプリングレートで得られ
たサンプル値として再生することによって、1オクター
ブ低い音を再生することができる。また逆に、元の信号
のサンプル数を半分に間引く再サンプリングにより得ら
れた各サンプルを、元のレートで再生することによっ
て、1オクターブ高い音を再生することができる。ただ
し、元の音よりも高い音を再生する場合(ピッチを上げ
る場合)は、いわゆるエイリアシングが発生するため、
再サンプリングを行う前の信号を例えば低域通過フィル
タに通すことが必要となる。なお、上述の例では、再サ
ンプリング後のサンプルの一部は元のサンプルと一致し
ているが、これは必ずしも必要ではなく、一般には、値
を補間しながら、任意のレートで再サンプリングを行う
ことによって、音程を任意に変化させること(すなわち
ピッチ制御)が可能となる。
【0003】一方、オーディオや音等の信号について、
聴感上、殆ど品質を劣化させずにそのデータ量を圧縮す
る高能率符号化の手法が知られている。上記オーディオ
信号等の高能率符号化の手法には種々あるが、その高能
率符号化の手法としては、例えば、時間軸上のオーディ
オ信号を所定時間単位でブロック化し、このブロック毎
の時間軸の信号を周波数軸上の信号に変換(スペクトル
変換)して複数の周波数帯域に分割し、各帯域毎に符号
化するブロック化周波数帯域分割方式であるいわゆる変
換符号化や、時間軸上のオーディオ信号をブロック化し
ないで、複数の周波数帯域に分割して符号化する非ブロ
ック化周波数帯域分割方式であるいわゆる帯域分割符号
化(サブ・バンド・コーディング:SBC)等を挙げる
ことができる。
【0004】ここで、上述した帯域分割符号化において
用いられる帯域分割用フィルタとしては、例えばいわゆ
るQMF(Quadrature Mirror filter)などのフィルタ
があり、このQMFのフィルタは、文献「ディジタル・
コーディング・オブ・スピーチ・イン・サブバンズ」("
Digital coding of speech in subbands" R.E.Crochie
re, Bell Syst.Tech. J., Vol.55,No.8 1976) に述べら
れている。このQMFのフィルタは、等バンド幅に分割
した2つの帯域を後に合成したときに、いわゆるエリア
シングが発生しないことが特徴となっている。すなわ
ち、このQMFによれば、帯域分割時に半分のレートに
間引かれた信号に発生する折り返し成分(エリアシン
グ)が、帯域合成時に発生する折り返し成分と互いにキ
ャンセルする性質があり、このため、十分な精度で各帯
域の信号が符号化されていれば、当該符号化によって生
じる損失を殆ど無くすことが可能となる。
【0005】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler, ICASSP 83, BOSTO
N) には、等バンド幅のフィルタ分割手法であるPQF
(Polyphase Quadrature filters)について述べられて
いる。このPQFは、信号を等バンド幅の複数の帯域に
分割する際に一度に分割でき、また、それら各帯域の信
号を後に合成したときに、エリアシングが発生しないこ
とが特徴となっている。すなわち、このPQFによれ
ば、各帯域幅に応じたレートに間引かれた信号と隣接帯
域との間で発生する折り返し成分が、帯域合成時に隣接
帯域との間で発生する折り返し成分と互いにキャンセル
する性質があり、このため、十分な精度で各帯域の信号
が符号化されていれば、当該符号化によって生じる損失
を殆ど無くすことが可能となる。
【0006】さらに、上述したスペクトル変換として
は、例えば、入力オーディオ信号を所定単位時間(フレ
ーム)でブロック化し、当該ブロック毎に離散フーリエ
変換(Discrete Fourier Transform:DFT)、離散コ
サイン変換( Discrete CosineTransform:DCT)、
モディファイド離散コサイン変換(変形離散コサイン変
換:Modified Discrete Cosine Transform:MDCT)
等を行うことで時間軸を周波数軸に変換するようなスペ
クトル変換がある。なお、上記MDCTについては、文
献「時間領域エリアシング・キャンセルを基礎とするフ
ィルタ・バンク設計を用いたサブバンド/変換符号化」
("Subband/Transform Coding Using Filter Bank Desig
ns Based on Time Domain Aliasing Cancellation," J.
P.PrincenA.B.Bradley, Univ. of Surrey Royal Melbou
rne Inst. of Tech. ICASSP 1987)に述べられている。
【0007】また、波形信号をスペクトル変換する方法
として上述のDFTやDCTを使用した場合、例えばM
個のサンプルデータからなる時間ブロックで変換(以
下、このブロックを変換ブロックと呼ぶ)を行うと、M
個の独立な実数データが得られる。ここで変換ブロック
間の接続歪みを軽減するために、通常は、両隣の変換ブ
ロック間でそれぞれM1個のサンプルデータをオーバー
ラップさせるので、これらDFTやDCTでは、平均化
して(M−M1)個のサンプルデータに対してM個の実
数データが得られるようになり、したがって、これらM
個の実数データが、その後量子化及び符号化されること
になる。
【0008】これに対して、スペクトル変換の方法とし
て上述のMDCTを使用した場合には、両隣の変換ブロ
ック間でそれぞれM個ずつのサンプルデータをオーバー
ラップさせた2M個のサンプルから、独立なM個の実数
データが得られる。すなわち、MDCTを使用した場合
には、平均化してM個のサンプルデータに対してM個の
実数データが得られ、これらM個の実数データが、その
後量子化及び符号化されることになる。復号化装置にお
いては、このようにしてMDCTを用いて得られた符号
から、各ブロックにおいて逆変換を施して得た波形要素
を互いに干渉させながら加え合わせることにより、波形
信号を再構成することができる。
【0009】ここで、一般に、上記スペクトル変換のた
めの変換ブロックを長くすると、周波数分解能が高ま
り、特定のスペクトル信号成分にエネルギが集中するこ
とが起きる。したがって、両隣の変換ブロック間でそれ
ぞれ半分ずつサンプルデータをオーバーラップさせた長
い変換ブロック長でスペクトル変換を行い、しかも得ら
れたスペクトル信号成分の個数が、元の時間軸のサンプ
ルデータの個数に対して増加しない上記MDCTを使用
するようにすれば、DFTやDCTを使用した場合より
も効率の良い符号化を行うことが可能となる。また、隣
接する変換ブロック同士で十分長いオーバーラップを持
たせるようにすれば、波形信号の変換ブロック間の接続
歪みを軽減することもできる。ただし、変換のための変
換ブロックを長くするということは、変換のための作業
領域がより多く必要になるということでもあるため、再
生手段等の小型化を図る上での障害となり、特に半導体
の集積度を上げることが困難な時点で長い変換ブロック
を採用することはコストの増加につながるので注意が必
要となる。
【0010】上述したように、フィルタやスペクトル変
換によって帯域毎に分割された信号成分を量子化するこ
とにより、量子化雑音が発生する帯域を制御することが
でき、したがって、いわゆるマスキング効果などの性質
を利用して聴覚的により高能率な符号化を行うことが可
能となる。
【0011】ここで、上記マスキング効果とは、大きな
音が小さな音を聴覚的に隠蔽してしまう現象を指し、こ
の効果を利用すると、発生した量子化雑音を元の信号音
自身で聴覚的に隠蔽してしまうことができ、圧縮しても
元の信号と聴覚的に殆ど変わらない音質を実現すること
ができる。ただし、マスキング効果を効果的に利用する
ためには、量子化雑音の発生の仕方を、時間と周波数領
域で制御しなければならない。例えば、信号レベルが小
さい状態の後に急激に信号レベルが大きくなるアタック
部分を含む信号をブロック化して符号化及び復号化する
ようにした場合、当該アタック部分を含む信号のブロッ
クを符号化及び復号化することによって発生する量子化
雑音は、上記アタック部分の前の小レベル信号部分にも
現れることになる。このとき、例えば上記アタック部分
の前の小レベル信号部分の時間長が短い場合には、当該
アタック部分によるマスキング効果によって聴感的に遮
蔽されることになる。しかし、例えばブロック内におい
て上記アタック部分の前の小レベル信号部分が数mse
c以上も続いていたとすると、上記アタック部分による
マスキング効果が及ぶ範囲を越えることになり、聴感的
に遮蔽されなくなってしまい、いわゆるプリエコーとし
て知られる聞き苦しい音質劣化を引き起こすことにな
る。このような場合は、スペクトル信号に変換するブロ
ック長を、そのブロック内の信号の性質に応じて切り替
えることで、上記プリエコーの発生を防止するような手
法が用いられることがある。なお、この場合、量子化を
行う前に、各帯域毎に、例えばその帯域における信号成
分の絶対値の最大値で各サンプルデータの正規化を行な
うようにすれば、さらに高能率な符号化を行なうことが
できる。
【0012】また、例えばオーディオ信号を周波数帯域
分割して得た各信号成分を量子化する場合の周波数分割
幅としては、例えば人間の聴覚特性を考慮した帯域幅を
用いることが好ましい。すなわち、一般に高域ほど帯域
幅が広くなるような臨界帯域(クリティカルバンド)と
呼ばれている帯域幅で、オーディオ信号を複数(例えば
25バント)の帯域に分割することが好ましい。また、
この時の各帯域毎のデータを符号化する際には、各帯域
毎に所定のビット配分或いは、各帯域毎に適応的なビッ
ト割当て(ビットアロケーション)による符号化が行わ
れる。例えば、上記MDCT処理されて得られた係数デ
ータを上記ビットアロケーションによって符号化する際
には、上記各変換ブロック毎のMDCT処理により得ら
れる各帯域毎のMDCT係数データに対して、適応的な
割当てビット数で符号化が行われることになる。ビット
割当手法としては、次の2手法が知られている。
【0013】例えば、文献「音声信号の適応変換符号
化」("Adaptive Transform Coding of Speech Signal
s", R.Zelinski and P.Noll, IEEE Transactions of Ac
coustics, Speech, and Signal Processing, vol.ASSP-
25, No.4, August 1977)では、各帯域毎の信号の大き
さをもとに、ビット割当を行っている。この方式では、
量子化雑音スペクトルが平坦となり、雑音エネルギ最小
となるが、聴感覚的にはマスキング効果が利用されてい
ないために実際の雑音感は最適ではない。
【0014】また、例えば文献「臨界帯域符号化器 −
聴覚システムの知覚の要求に関するディジタル符号化」
("The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT, ICASSP 1980)では、聴覚マス
キングを利用することで、各帯域毎に必要な信号対雑音
比を得て固定的なビット割当を行う手法が述べられてい
る。しかしこの手法では、サイン波入力で特性を測定す
る場合でも、ビット割当が固定的であるために特性値が
それほど良い値とならない。
【0015】これらの問題を解決するために、ビット割
当に使用できる全ビットを、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行う分とに分割
使用するようにし、そのときの分割比を入力信号に関係
する信号に依存させ、前記信号のスペクトルのパターン
が滑らかなほど前記固定ビット割当パターン分への分割
比率を大きくするような高能率符号化方法が提案されて
いる。
【0016】この方法によれば、サイン波入力のよう
に、特定のスペクトル信号成分にエネルギが集中する場
合にはそのスペクトル信号成分を含むブロックに多くの
ビットを割り当てる事により、全体の信号対雑音特性を
著しく改善することができる。一般に、急峻なスペクト
ル信号成分をもつ信号に対して人間の聴覚は極めて敏感
であるため、このような方法を用いる事により、信号対
雑音特性を改善することは、単に測定上の数値を向上さ
せるばかりでなく、聴感上、音質を改善するのに有効で
ある。
【0017】ビット割り当ての方法にはこの他にも数多
くの方法が提案されており、さらに聴覚に関するモデル
が精緻化され、符号化装置の能力があがれば聴覚的にみ
てより高能率な符号化が可能になる。
【0018】これらの方法においては、計算によって求
められた信号対雑音特性をなるべく忠実に実現するよう
な実数のビット割り当て基準値を求め、それを近似する
整数値を割り当てビット数とすることが一般的である。
【0019】実際の符号列を構成するにあたっては、先
ず、正規化及び量子化が行われる帯域毎に、量子化精度
情報と正規化係数情報を所定のビット数で符号化し、次
に、正規化及び量子化されたスペクトル信号成分を符号
化すれば良い。また、ISO標準(ISO/IEC 1
1172−3:1993(E),1993)では、帯域
によって量子化精度情報を表すビット数が異なるように
設定された高能率符号化方式が記述されており、ここで
は高域になるにしたがって、量子化精度情報を表すビッ
ト数が小さくなるように規格化されている。
【0020】さらに、量子化精度情報を直接符号化する
代わりに、復号化装置において例えば正規化係数情報か
ら量子化精度情報を決定する方法も知られているが、こ
の方法では、規格を設定した時点で正規化係数情報と量
子化精度情報の関係が決まってしまうので、将来的にさ
らに高度な聴覚モデルに基づいた量子化精度の制御を導
入することができなくなる。また、実現する圧縮率に幅
がある場合には圧縮率毎に正規化係数情報と量子化精度
情報との関係を定める必要が出てくる。
【0021】また、例えば、文献「最小冗長コードの構
成のための方法」("A Method forConstruction of Min
imum Redundancy Codes" D.A.Huffman:,Proc.I.R.E., 4
0,p.1098 (1952))のように、可変長符号を用いて符号
化することによって、量子化されたスペクトル信号成分
をより効率的に符号化する方法も知られている。
【0022】さらに、本件出願人による国際公開番号WO
94/28633の国際出願の明細書及び図面には、スペクトル
信号成分から聴感上特に重要なトーン性の成分を分離し
て、他のスペクトル信号成分とは別に符号化する方法が
提案されており、これにより、オーディオ信号等を聴感
上の劣化を殆ど生じさせずに高い圧縮率で効率的に符号
化することが可能になっている。
【0023】なお、上述した各符号化手法は、複数のチ
ャネルから構成される音響信号の各チャネルに対しても
適用することが可能である。例えば、左側のスピーカに
対応するLチャネル、右側のスピーカに対応するRチャ
ネルのそれぞれに適用することによってステレオのオー
ディオ信号に対する効率の良い符号化が可能となる。ま
た、Lチャネル、Rチャネルそれぞれの信号を加えるこ
とによって得られた(L+R)/2の信号に対して適用
しても良い。さらに、同じ2チャネルの信号でも、(L
+R)/2の信号と(L−R)/2の信号に対して上述
の方法を用いて効率の良い符号化を行うようにしても良
い。またさらに、本件出願人は、特願平9−81208
号の明細書及び図面において、ステレオ感は低域側の信
号によって支配的な影響を受けることに注目し、(L−
R)/2の信号の帯域を(L+R)/2の信号の帯域よ
りも狭くする方法を提案している。この手法を用いる
と、聴感上のステレオ感を保ちながら、より少ないビッ
ト数で効率的な符号化を行うことが可能となる。
【0024】このように、符号化効率を高める手法は次
々と開発されており、新たに開発された手法を組み込ん
だ規格を採用することによって、より長時間の記録が可
能になったり、同じ記録時間であれば、より音質の高い
オーディオ信号を記録することが可能になる。
【0025】また、時系列のオーディオ信号を符号化す
る際の時間・周波数領域上へのマッピングの方法として
は、前述した帯域分割符号化と変換符号化とを組み合わ
せた高能率符号化の手法も考えられている。この場合に
は、例えば、上記帯域分割符号化で帯域分割を行った
後、該各帯域毎の信号を周波数軸上の信号にスペクトル
変換し、このスペクトル変換された各帯域毎に符号化が
施される。
【0026】このように、一旦、帯域分割フィルタで分
割してからMDCT等でスペクトル信号に変換すること
のメリットととしては、以下のような点を挙げることが
できる。
【0027】先ず、変換ブロック長などを帯域毎に最適
なものに設定できるため、量子化雑音の時間/周波数領
域上での発生を、聴感上、最適に制御することができ、
音質の向上を図ることができる。
【0028】次に、MDCT等のスペクトル変換は、一
般に高速フーリエ変換(Fast Fourier Transform:FF
T)等の高速演算手法を利用して処理が行われる場合が
多いが、こうした高速演算手法を実現するためには、ブ
ロック長に比例した大きさのメモリ領域が必要になる。
しかしながら、一旦、帯域分割をしてから各帯域毎に帯
域幅に比例して間引いた信号にスペクトル変換を行うこ
とにより、同じ周波数分解能を得るためのスペクトル変
換のサンプル数を少なくすることができるため、スペク
トル変換のために必要なメモリ領域を小さくすることが
できる。
【0029】さらに、例えば符号化された信号を復号す
る場合において、高音質である必要ないが、できるだけ
小さいハードウェア規模の復号器で再生したい場合に
は、低域側の信号データのみを処理することで目的を達
成することができ、便利である。
【0030】このように、帯域分割フィルタとMDCT
等のスペクトル変換を組み合わせてスペクトル信号に変
換する方法を用いた圧縮方式は、比較的小規模なハード
ウェア上で実現することができるので、例えば、携帯録
音機用の圧縮方式としては大変好都合である。ただし、
帯域分割フィルタを実現するためには多数の積和演算が
必要となるため、演算処理量という意味では増加する。
【0031】
【発明が解決しようとする課題】ところで、上述したよ
うに符号化された信号を復号して再生信号を得る場合に
おいて、例えばゲーム機や編集機器、その他各種の機器
の用途として、例えば符号化信号を復号化しつつピッチ
変換をも行って再生することが要求される場合がある。
【0032】しかしながら、実際に符号化された元のオ
ーディオ信号よりも、例えば1オクターブ高い音を再生
しようとすると、全帯域の符号化信号を2倍の速度で復
号しなければならず、また、例えば2オクターブ高い音
を再生しようとすると、全帯域の符号化信号を4倍の速
度で復号しなければならなくなる。したがって、このよ
うなピッチ変換の手法を用いた場合、元の音の高さより
も高い音を得るためには、復号装置の処理速度及び処理
量を、音の高さに応じて十分に高く設計する必要があ
り、その結果、復号装置のコストが高くなってしまうと
いう問題があった。
【0033】そこで、本発明はこのような状況に鑑みて
なされたものであり、符号化されているオーディオ信号
を復号するとともに、ピッチ変換を行って再生すること
を可能とし、また、元の音の高さよりも高い音を再生す
る場合に、少ない演算量の処理で十分に高い所望の音を
得ることができ、さらに復号装置のコストの上昇をも抑
えることが可能な、信号処理方法及び装置、並びに情報
提供媒体を提供することを目的とする。
【0034】
【課題を解決するための手段】本発明の情報処理方法
は、符号化信号を復号再生する信号処理方法であり、復
号後の再生信号のピッチを設定し、上記設定したピッチ
に応じて上記符号化信号の低域側のみを復号し、上記復
号後の再生信号を上記設定したピッチに基づいてピッチ
変換することにより、上述した課題を解決する。
【0035】また、本発明の情報処理方法は、復号後の
再生信号のピッチを設定し、上記設定したピッチに応じ
て上記符号化信号の高域側に0値を挿入して復号し、上
記設定したピッチに応じたピッチの再生信号を生成する
ことにより、上述した課題を解決する。
【0036】本発明の情報処理装置は、符号化信号を復
号再生する信号処理装置であり、復号後の再生信号のピ
ッチを設定する設定手段と、上記設定したピッチに応じ
て上記符号化信号の低域側のみを復号する復号手段と、
上記復号後の再生信号を上記設定したピッチに基づいて
ピッチ変換するピッチ変換手段とを有することにより、
上述した課題を解決する。
【0037】また、本発明の情報処理装置は、復号後の
再生信号のピッチを設定するピッチ設定手段と、上記設
定したピッチに応じて上記符号化信号の高域側に0値を
挿入して復号する復号手段と、上記設定したピッチに応
じたピッチの再生信号を生成する再生信号生成手段とを
有することにより、上述した課題を解決する。
【0038】ここで、上記符号化信号が信号を帯域分割
してから符号化したものであるとき、上記復号の際に
は、上記分割された各帯域のうち上記設定したピッチに
応じた低域側の帯域のみを復号し、一方、上記符号化信
号が信号を周波数成分に変換してから符号化したもので
あるとき、上記復号の際には、上記変換された各周波数
成分のうち上記設定したピッチに応じた低域側の周波数
成分のみを復号する。また、本発明の情報処理方法及び
装置では、上記設定したピッチに基づいてピッチ変換し
たディジタルの再生信号を、上記設定したピッチに応じ
たクロックにてアナログの再生信号に変換する。さら
に、上記ピッチ変換の際には、上記復号後の再生信号の
低域側のみを、上記設定したピッチに基づいてサンプリ
ング変換したり、上記復号後の再生信号の高域側に0値
を挿入して、上記設定したピッチに基づいたサンプリン
グ変換を行うことができる。
【0039】本発明の情報提供媒体は、符号化信号を復
号再生するプログラムを提供する情報提供媒体であり、
復号後の再生信号のピッチを設定する工程と、上記設定
したピッチに応じて符号化信号の低域側のみを復号する
工程と、上記復号後の再生信号を上記設定したピッチに
基づいてピッチ変換する工程とを少なくとも有するプロ
グラムを提供することにより、上述した課題を解決す
る。
【0040】また、本発明の情報提供媒体は、復号後の
再生信号のピッチを設定する工程と、上記設定したピッ
チに応じて符号化信号の高域側に0値を挿入して復号す
る工程と、上記設定したピッチに応じたピッチの再生信
号を生成する工程とを少なくとも有するプログラムを提
供することにより、上述した課題を解決する。
【0041】
【発明の実施の形態】以下、本発明の好ましい実施例に
ついて、図面を参照にしながら説明する。
【0042】本発明の情報処理方法及び装置は、例えば
ゲーム機や編集機器、その他各種の機器の用途として、
符号化信号を復号しつつピッチ変換をも行って再生する
ような場合に好適なものであるが、先ず、上記符号化信
号の復号及びピッチ変換の説明に先立ち、本発明の情報
処理方法及び装置が扱う符号化信号の生成のための構成
について説明する。なお、以下に説明する各構成要素
は、ハードウェア的に構成しても、またソフトウェア的
に構成してもよい。
【0043】本発明実施の形態では、符号化信号の生成
の際に、前述したような高能率符号化技術を採用してい
る。上記高能率符号化技術の一例として、例えばオーデ
ィオPCM信号等の入力ディジタル信号を、帯域分割符
号化(SBC)、適応変換符号化(ATC)及び適応ビ
ット割当ての各技術を用いて高能率符号化する技術につ
いて、図1から図5を参照しながら説明する。
【0044】図1には、オーディオPCM信号(音響波
形信号)を符号化する符号化装置の全体構成を示す。こ
の図1に示す符号化装置では、入力されたオーディオP
CM信号(音響波形信号)100を変換部101によっ
て信号周波数成分102に変換し、得られた各周波数成
分102を信号成分符号化部103によって符号化し、
その後、符号列生成部105において、上記信号成分符
号化部103にて生成された符号化信号104から符号
列106を生成する。
【0045】図2には、上記変換部101の構成例を示
す。この図2に示す変換部101では、入力信号100
を帯域分割フィルタ107によって複数の帯域(図2の
例では4つの帯域)に分割し、得られた各帯域の信号1
08,109,110,111をMDCT等を用いた順
スペクトル変換部112,113,114,115によ
りスペクトル信号成分116,117,118,119
に変換する。なお、上記入力信号100は、上記図1の
オーディオPCM信号(音響波形信号)に対応し、ま
た、上記スペクトル信号成分116〜119は上記図1
の信号周波数成分102に対応している。この図2に示
す構成を有する変換部101では、上記4つの帯域に分
割された信号108〜111の帯域幅が入力信号100
の帯域幅の1/4となっており、該入力信号100が1
/4に間引かれている。もちろん、当該変換部101と
しては、この具体例以外にも多数考えられ、例えば、入
力信号を直接、MDCTによってスペクトル信号に変換
するものでも良いし、MDCTではなく、DFTやDC
Tによって変換するものであっても良い。なお、本実施
の形態では、例えば0〜24KHzのオーディオ信号の
帯域を上記帯域分割フィルタ107によって0〜6KH
z、6KHz〜12KHz、12KHz〜18KHz、
18KHz〜24KHzの4つの帯域に分割している。
【0046】図3には、図1の信号成分符号化部103
の構成例を示す。この図3に示す信号成分符号化部10
3では、各信号成分102を正規化部120によって所
定の帯域毎に正規化すると共に、量子化精度決定部12
2にて上記信号成分102から量子化精度情報123を
計算し、当該量子化精度情報123に基づいて、上記正
規化部120からの正規化されたスペクトル係数データ
121を量子化部124が量子化する。なお、上記信号
成分102は上記図1の信号周波数成分102に対応
し、また、前記図1の符号化信号104には、図3の量
子化部124からの量子化された信号成分125に加え
て上記正規化の際の正規化係数情報と上記量子化精度情
報123も含まれている。
【0047】なお、上述した符号化装置の図1に示した
変換部101によって得られるスペクトル信号は、例え
ば図4に示すようなものとなる。この図4に示す各スペ
クトル成分は、MDCTによるスペクトル成分の絶対値
のレベルを〔dB〕に変換して示したものである。この
符号化装置においては、入力信号を所定の変換ブロック
毎に64個のスペクトル信号に変換しており、それを図
中〔1〕から〔8〕にて示す8つの帯域(以下、これを
符号化ユニットと呼ぶ)にまとめて正規化及び量子化し
ている。また、量子化精度を周波数成分の分布の仕方に
よって符号化ユニット毎に変化させるようにすれば、音
質の劣化を最小限に抑えた聴覚的に効率の良い符号化が
可能となる。
【0048】図5には、図1の符号列生成部105にて
生成した符号列の構成例を示す。この図5に示す符号列
は、各変換ブロック(時間ブロック)のスペクトル信号
を復元するためのデータがそれぞれ、所定のビット数で
構成されるフレームに対応して符号化されている。各フ
レームの先頭(ヘッダ部)には、先ず同期信号および符
号化されている符号化ユニット数等の制御データを一定
のビット数で符号化した情報が配置され、次に各符号化
ユニットの量子化精度情報と正規化係数情報をそれぞれ
低域側の符号化ユニットから順に符号化した情報が、最
後に各符号化ユニット毎に上述の正規化係数情報および
量子化精度情報に基づいて正規化および量子化されたス
ペクトル係数データを低域側から順に符号化した情報が
配置されている。これら変換ブロック(時間ブロック)
のスペクトル信号を復元するために実際に必要なビット
数は、上記符号化されている符号化ユニットの数、およ
び各符号化ユニットの量子化精度情報が示す量子化ビッ
ト数によって決まり、その量は各フレーム毎に異なって
いても良い。
【0049】なお、以上述べたような符号化の手法に対
して、さらに符号化効率を高めることも可能である。
【0050】例えば、量子化されたスペクトル信号のう
ち、出現頻度の高いものに対しては比較的短い符号長を
割り当て、出現頻度の低いものに対しては比較的長い符
号長を割り当てる、いわゆる可変長符号化技術を用いる
ことによって、符号化効率を高めることができる。
【0051】また例えば、入力信号を符号化する際の上
記所定の変換ブロック、すなわちスペクトル変換のため
の時間ブロック長を長くとるようにすれば、量子化精度
情報や正規化係数情報といったサブ情報の量を1ブロッ
ク当たりで相対的に削減でき、また、周波数分解能も上
がるので、周波数軸上での量子化精度をより細やかに制
御できるようになり、符号化効率を高めることが可能と
なる。
【0052】さらにまた、例えば本件出願人による国際
公開番号WO94/28633の国際特許出願の明細書及び図面に
て提案しているように、スペクトル信号成分から聴感上
特に重要なトーン性の成分、すなわち特定の周波数周辺
にエネルギーが集中している信号成分を分離して、他の
スペクトル信号成分とは別に符号化する方法を適用すれ
ば、オーディオ信号等を聴感上の劣化を殆ど生じさせず
に高い圧縮率で効率的に符号化することが可能になる。
【0053】次に、上述したような符号化装置によって
生成された符号列を復号しつつ、ピッチ変換をも行って
再生する、本発明の情報処理方法及び装置の一実施の形
態について、以下に説明する。
【0054】上記符号列を復号しつつ、例えば音の高さ
を高くする方向にシフトさせて再生するピッチ変換(高
域側へのピッチ変換)処理の一例として、例えば48K
Hzでサンプリングされた信号を2オクターブ(すなわ
ち4倍)以上高いピッチに変換して再生することを考え
る。また、前述したように、符号化時には、0〜24K
Hzのオーディオ信号の帯域が0〜6KHz、6KHz
〜12KHz、12KHz〜18KHz、18KHz〜
24KHzの4つの帯域に分割されているとする。
【0055】ここで、上記4つの帯域のうち、例えば元
のオーディオ信号の6KHz以上の帯域の信号成分は、
上記2オクターブ(4倍)のピッチ変換によって24K
Hz以上の帯域の信号成分に変換されることになる。し
かしながら、通常、人間の耳では知覚することができな
い20KHz以上の帯域の信号(個人差があるため本実
施の形態では24KHz以上とする)については、特に
再生しなくても聴感上の音質劣化として感じられない。
すなわち、上記2オクターブ(4倍)のピッチ変換を行
った場合、元のオーディオ信号の6KHz以上の帯域の
信号成分については再生する必要が無いと考えられる。
また、高い音にピッチ変換した信号を48KHzでサン
プリングし直す場合には、エイリアシングの影響を防ぐ
ために、24KHz以上の信号成分を予め除去しておく
必要がある。したがって、高い音にピッチ変換する場合
には、このように高域側の信号の復号再生を予め省略し
ても、実際に音質低下を招くことはない。
【0056】また、同様の理由から、例えば48KHz
でサンプリングされた信号を1オクターブ(すなわち2
倍)以上高いピッチに変換して再生することを考えた場
合は、上記4つの帯域のうち元のオーディオ信号の12
KHz以上の帯域の信号成分が上記1オクターブ(2
倍)のピッチ変換によって24KHz以上の帯域の信号
成分に変換されることになるため、元のオーディオ信号
の12KHz以上の帯域の信号成分については再生する
必要が無い。なお、この場合も、ピッチ変換した信号を
48KHzでサンプリングし直す場合には、エイリアシ
ングの影響を防ぐために、24KHz以上の信号成分を
予め除去しておく必要がある。
【0057】そこで、本発明の第1の実施の形態の復号
装置では、符号列を復号しつつ例えば音の高さを高くす
る方向にピッチ変換(高域側にピッチ変換)して再生を
行う場合に、元のオーディオ信号の低域側の部分のみを
復号することによって、比較的小規模なハードウェアを
用いて高速にピッチ変換された信号の再生を実現するよ
うにしている。
【0058】図6には、本発明の第1の実施の形態の復
号装置(オーディオ信号復号再生装置)の構成例を示
す。この第1の実施の形態の復号装置は、メモリ131
に蓄積された、符号化されたオーディオ信号を、必要に
応じてピッチ変換しながら再生するものである。
【0059】この図6において、入力信号130は、前
述したように48KHzでサンプリングされたオーディ
オPCM信号を符号化装置により圧縮符号化して生成さ
れた図5の符号列(符号化データ)であり、この入力信
号130はメモリ131に一旦蓄積される。
【0060】当該メモリ131は、例えば半導体メモリ
によって構成されており、制御部139からの制御信号
140により、自由な速度で読み書きを行うことがで
き、また、同じ信号部分のデータを繰り返し出力するこ
とも、さらに、蓄積した符号化データの一部のみを読み
出すことも可能となっている。このメモリ131から読
み出された符号化データ132は、部分復号部133に
送られる。
【0061】部分復号部133は、ユーザにより指定さ
れるピッチ選択信号に応じて制御部139が生成した制
御信号140に基づいて、前記図5の符号列から所望の
低域部分の符号化データのみを取り出して、その低域部
分の符号化データのみを復号する。ここで、上記所望の
低域部分の符号化データとは、前述したように48KH
zでサンプリングされている信号を、例えば2オクター
ブ(4倍)高いピッチに変換して再生する場合には、元
のオーディオ信号の6KHz以下の帯域の符号化データ
であり、また、1オクターブ(2倍)高いピッチに変換
して再生する場合には、元のオーディオ信号の12KH
z以下の帯域の符号化データである。当該部分復号部1
33では、上述したように所望の低域部分の符号化デー
タのみを取り出して、その低域部分の符号化データのみ
を復号するようにしているため、全帯域の符号化データ
を復号してピッチ変換を行う場合に比較して、少ない処
理量で高速に復号処理を行うことが可能となっている。
なお、以上の説明では、メモリ131から全帯域の符号
列を読み出し、その全体域の符号列から部分復号部13
3が所望の低域部分の符号化データのみを取り出して復
号する例を説明したが、メモリ131から符号列を読み
出す際に所望の低域部分の符号化データのみを読み出し
て部分復号部133に送るようにしてもよい。また、こ
こでは高域ピッチ変換を行う場合の処理を説明したが、
高域にピッチ変換を行わない場合の部分復号部133
は、全帯域の符号化データを復号することになる。当該
部分復号部133での復号処理は、ピッチ変換に応じた
スピードで処理が行われ、例えば2オクターブ高域にシ
フトする場合は4倍のスピードで、1オクターブ高域に
シフトする場合は2倍のスピードで処理が行われる。こ
うして処理されたオーディオデータ136は、D/A
(ディジタル/アナログ)変換部137に送られる。
【0062】D/A変換部137では、上記部分復号部
133にて、ピッチ変換に応じたスピードで復号された
オーディオデータ136をアナログオーディオ信号13
8に変換する。なお、本実施の形態のように、ピッチ変
換後のデータを直接D/A変換する場合、当該D/A変
換で使用するクロックには、そのピッチに応じた速度を
使用する。例えば、48KHzでサンプリングされてい
た元のオーディオ信号に対して、1オクターブ高いピッ
チに変換して再生する場合には、96KHzのサンプリ
ング周波数に相当するクロックでD/A変換を施すこと
になる。
【0063】図7には、上述したピッチ変換を行う場合
に、制御部139による全体の制御の流れを示す。
【0064】この図7において、先ず、制御部139
は、ステップS1において、ピッチ変換が2オクターブ
以上高域へのピッチ変換(ピッチシフト)か否か判断
し、2オクターブ以上高域へのピッチ変換であると判断
した場合はステップS4の処理へ、2オクターブ以上高
域へのピッチ変換でないと判断した場合はステップS2
の処理へ進む。
【0065】ステップS4の処理に進んだ場合の制御部
139は、メモリ131、部分復号部133、D/A変
換部137に対して、2オクターブ以上高域へのピッチ
変換に必要な処理を行わせる。すなわち、制御部139
は、メモリ131と部分復号部133を制御して前述し
た4つの分割帯域のうちの低域側1バンド(最低域の1
バンド)の符号化データのみをピッチ変換に応じた4倍
以上のスピードで復号させ、2オクターブ以上高くなっ
た音に対して、D/A変換部137を制御して2オクタ
ーブ以上高いピッチに対応するクロックでD/A変換を
行わせる。
【0066】また、ステップS2の処理に進んだ場合の
制御部139は、ピッチ変換が1オクターブ以上高域へ
のピッチ変換(ピッチシフト)か否か判断し、1オクタ
ーブ以上高域へのピッチ変換であると判断した場合はス
テップS5の処理へ、1オクターブ以上高域へのピッチ
変換でないと判断した場合はステップS3の処理へ進
む。
【0067】ステップS5の処理に進んだ場合の制御部
139は、メモリ131、部分復号部133、D/A変
換部137に対して、1オクターブ以上高域へのピッチ
変換に必要な処理を行わせる。すなわち、制御部139
は、メモリ131と部分復号部133を制御して低域側
2バンドの符号化データをピッチ変換に応じた2倍以上
のスピードで復号、1オクターブ以上高くなった音に対
してD/A変換部137を制御して1オクターブ以上高
いピッチに対応するクロックでD/A変換を行わせる。
【0068】一方、 ステップS3の処理に進んだ場合
の制御部139は、メモリ131、部分復号部133、
D/A変換部137に対して、全帯域の符号化データを
復号するのに必要な処理を行わせる。すなわち、制御部
139は、メモリ131と部分復号部133を制御して
全帯域の符号化データをピッチ変換に応じたスピードで
復号させ、D/A変換部137を制御してピッチ変換に
対応するクロックでD/A変換を行わせる。
【0069】次に、図8には、図6の部分復号部133
の具体的な構成及び制御部139を示す。
【0070】この図8において、符号列分解部141で
は、供給された符号列132(図6の符号化データ13
2に対応する)から、各信号成分の符号と正規化係数情
報と量子化精度情報とを抽出する。すなわち、上述した
ようにピッチ変換を行う場合、符号列分解部141で
は、制御部139からの制御信号140に基づいて、前
記図5の符号列からピッチ変換に応じた所望の信号成分
の符号と正規化係数情報と量子化精度情報を抽出する。
当該符号列分解部141から出力された信号142は、
信号成分復号化部143に送られる。
【0071】信号成分復号化部143では、上記信号1
42から各信号成分144を復元する。すなわち、上述
したようにピッチ変換を行う場合、当該信号成分復号化
部143では、制御部139からの制御信号140に基
づいて、上記符号列分解部141から供給された信号成
分の符号を、逆量子化及び逆正規化する。当該信号成分
復号化部143での逆量子化及び逆正規化により復元さ
れた信号成分144は、逆変換部145に送られる。
【0072】逆変換部145では、上記信号成分復号化
部143からの信号成分144を逆スペクトル変換し、
さらに帯域合成して、音響波形信号146を再現する。
なお、この音響波形信号146は、図6の時系列オーデ
ィオデータ136に相当する。
【0073】図9には、上記図8の信号成分復号化部1
43の具体的構成例を示す。
【0074】この図9において、逆量子化部151は、
制御部139からの制御信号140に基づき、図8の符
号列分解部141から供給された信号150の内、信号
成分の符号を前記量子化精度情報を用いて逆量子化す
る。すなわち、上述したようにピッチ変換を行う場合、
符号列分解部141にてピッチ変換に応じて抽出された
所望の帯域の信号成分の符号を、同じくピッチ変換に応
じて抽出された所望の帯域の量子化精度情報を用いて逆
量子化する。当該逆量子化後の信号152は、逆正規化
部153に送られる。なお、図9の信号150は図8の
信号142に対応する。
【0075】逆正規化部153では、制御部139から
の制御信号140に基づき、上記逆量子化後の信号15
2を前記正規化係数情報を用いて逆正規化し、信号成分
154を出力する。すなわち、上述したようにピッチ変
換を行う場合、上記逆量子化部151にて逆量子化され
た信号152を、符号列分解部141にてピッチ変換に
応じて抽出された所望の帯域の正規化精度情報を用いて
逆正規化する。なお、図9の信号154は図8の信号1
44に対応する。
【0076】このように、図9の構成において、ピッチ
変換を行う場合には、少ない処理量で高速に復号処理を
行うことが可能となっている。
【0077】図10には、上記図8の逆変換部145の
具体的構成例を示す。
【0078】この図10において、逆スペクトル変換部
164,165,166,167では、制御部139か
らの制御信号140に基づいて、それぞれ供給された入
力信号160,161,162,163に逆スペクトル
変換を施して各帯域の信号168,169,170,1
71を復元する。すなわち、上述したようにピッチ変換
を行う場合、ピッチ変換に応じた所望の帯域のみ逆スペ
クトル変換を行う。例えば、2オクターブ高域へのピッ
チ変換を行う場合には、最低域の1バンドに対応する逆
スペクトル変換を行い、1オクターブ高域へのピッチ変
換を行う場合には、低域側2バンドに対応する逆スペク
トル変換を行う。なお、入力信号160,161,16
2,163は、図8の信号142に対応する。
【0079】帯域合成フィルタ172では、制御部13
9からの制御信号140に基づいて、逆スペクトル変換
部164〜167から供給された帯域の信号を合成し、
その合成後の信号173を出力する。すなわち、上述し
たようにピッチ変換を行う場合、ピッチ変換に応じて逆
スペクトル変換された後の各帯域の信号を合成する。例
えば、2オクターブ高域へのピッチ変換を行う場合に
は、最低域の1バンドの逆スペクトル変換後の帯域の信
号を出力し、また、1オクターブ高域へのピッチ変換を
行う場合には、低域側2バンドの逆スペクトル変換後の
帯域の信号を合成して出力する。なお、信号173は、
図8の信号144に対応する。
【0080】このように、図10の構成において、ピッ
チ変換を行う場合には、少ない処理量で高速に復号処理
を行うことが可能となっている。すなわち、逆スペクト
ル変換の処理は、一般に膨大な信号処理量となるが、本
実施の形態のようにピッチ変換の際に、低域側の信号の
みを逆スペクトル変換することで処理量を減らすことが
できる。このことは帯域合成フィルタに関しても同様で
ある。
【0081】上述した第1の実施の形態によれば、ピッ
チ変換を高域側にシフトすると、その高域側へのシフト
に反比例するように復号再生すべき信号の帯域が狭くな
るため、非常に高い音へのピッチ変換を行う場合に非常
に効果的である。なお、元の音の高さよりも低い方向に
ピッチを変換する場合には、復号の処理速度上問題ない
ため、全ての帯域を使用する。
【0082】次に、図11には、符号化装置により生成
された符号列を復号しつつピッチ変換をも行う、ピッチ
変換機能を備えた本発明の第2の実施の形態の復号装置
(オーディオ信号復号再生装置)の構成例を示す。この
第2の実施の形態の復号装置は、メモリ181に蓄積さ
れた、符号化されたオーディオ信号を、必要に応じてピ
ッチ変換しながら再生するものである。
【0083】この図11において、入力信号180は、
前述した48KHzでサンプリングされたオーディオP
CM信号を符号化装置により圧縮符号化して生成された
図5の符号列(符号化データ)であり、この入力信号1
80はメモリ181に一旦蓄積される。
【0084】当該メモリ181は、例えば半導体メモリ
によって構成されており、第1の実施の形態と同様の制
御部189からの制御信号190により、自由な速度で
読み書きを行うことができ、また、同じ信号部分のデー
タを繰り返し出力することも可能となっている。ここ
で、メモリ181からの読み出し速度は、ユーザにより
指定されるピッチ選択信号に応じて制御部139が生成
した制御信号140に基づいて制御される。例えば、1
オクターブ高い方向にピッチを上げる場合には、通常の
再生時の2倍の速度で読み出し、2オクターブ高い方向
にピッチを上げる場合には、通常の再生時の4倍の速度
で読み出す。逆に、例えば、1オクターブ低い方向にピ
ッチを下げる場合には、通常の再生時の1/2の速度で
の読み出しが行われ、2オクターブ低い方向にピッチを
下げる場合には、通常の再生時の1/4の速度での読み
出しが行われる。
【0085】復号部183は、制御部189からの制御
信号190(ピッチ選択信号)に基づいて、メモリ18
1から供給された符号列を復号する。例えば、音の高さ
を高域側にシフトするピッチ変換を行う場合は、前記図
5の符号列のうち所望の低域部分の符号化データ以外を
0データとし、その低域部分の符号化データ及びそれ以
外の0データを用いて復号を行う。ここで、上記所望の
低域部分の符号化データとは、前述の第1の実施の形態
と同様の帯域である。当該復号部183では、実質的に
所望の低域部分の符号化データのみ復号すれば良く、上
記低域部分以外の0データの復号は不要となるため、全
帯域の符号化データを復号してピッチ変換を行う場合に
比較して、少ない処理量で高速に復号処理を行うことが
可能となっている。なお、ここではピッチ変換を行う場
合の処理を説明したが、ピッチ変換を行わない場合や、
音を低くする方向にシフトするピッチ変換を行う場合
は、復号部183にて全帯域の符号化データを復号する
ことになる。当該復号部183の構成は、基本的に図8
〜図10と同じである。当該復号部183での復号処理
により得られた復号データ(時系列のオーディオデータ
184)は、サンプリング変換部185に送られる。
【0086】サンプリング変換部185では、上述のよ
うにしてピッチを変えて復号された時系列信号を、後述
する方法により、元のサンプリング周波数、この例では
48KHzで再サンプリングする。このサンプリング変
換部185にて再サンプリングされたオーディオデータ
186は、D/A変換部187に送られる。
【0087】D/A変換部187では、上記サンプリン
グ変換部185にて再サンプリングされたオーディオデ
ータ186をアナログオーディオ信号188に変換す
る。このように、当該第2の実施の形態では、サンプリ
ング変換部185にて再サンプリングを行うことによ
り、D/A変換部187のクロックは、元のオーディオ
信号のサンプリング周波数である48KHzに相当する
一定のクロックを用いることができる。
【0088】次に、図12には、図11のサンプリング
変換部185の構成例を示す。
【0089】この図11において、入力信号184は、
低域通過フィルタ191に入力する。当該低域通過フィ
ルタ191は、制御部189からの制御信号190に基
づいて、入力信号184を低域通過フィルタリングす
る。なお、入力信号184は図1の信号184と対応す
る。
【0090】ここで、例えば図13に示すように、音の
高さを高域側に1オクターブ高くする方向にシフトする
ようなピッチ変換、すなわち復号再生速度を2倍にする
と、その復号再生信号の帯域は2倍に広がることにな
る。これを元のサンプリング周波数、この例では48K
Hzのサンプリング周波数にて再サンプリングすると、
24KHz以上の帯域にシフトした信号がエリアシング
信号として、24KHz以下の帯域に折り返されること
になる。したがって、低域通過フィルタ191では、制
御部189からの制御信号190に基づいて、ピッチを
高域側にシフトする場合、図13に示すように、上記入
力信号184の24KHz以下の帯域のみを通過させる
(24KHz以上の帯域の通過を制限する)ようにして
いる。この場合の制御信号190は、低域通過フィルタ
のフィルタ係数を、その低域通過特性に合うように選択
制御するものとなる。なお、ピッチを変えない場合、或
いは、音の高さを下げる方向にピッチ変換する場合に
は、オーディオ信号の帯域が狭くなることになるので、
低域通過フィルタ191による帯域制限は必要ない。こ
の低域通過フィルタ191からの信号192は、選択部
193に送られる。
【0091】選択部193には、低域通過フィルタ19
1からの信号192と入力信号184とが供給され、制
御部189からの制御信号190に基づいて、低域通過
フィルタ191からの信号192と入力信号184の何
れかを選択する。すなわち、音の高さを高域側にシフト
するピッチ変換を行う場合には低域通過フィルタ191
からの信号192を選択し、ピッチ変換を行わない場合
と低域側にシフトするピッチ変換を行う場合は入力信号
184を選択する。この選択部193からの信号194
は、再サンプリング部195に送られる。
【0092】なお、上述の説明では、サンプリング変換
部185において、エリアシングを無くすために低域通
過フィルタを使用しているが、前述した復号部183の
場合と同様の考え方として、所望の低域部分以外に0デ
ータを詰める(又は、低域側のみを処理し、高域側は処
理しない)ようにすれば、低域通過フィルタを通さなく
てもエリアシングを発生させずに済むことになる。
【0093】再サンプリング部195では、図14を用
いて説明する方法により、再サンプリングを行い、元の
48KHzのサンプリング周波数のオーディオPCMデ
ータ196を得る。なお、オーディオPCMデータ19
6は、図11の信号186と対応する。
【0094】図14は、再サンプリングの方法を説明す
るための図であり、図中の信号波形上の黒丸で表された
点は、図11の復号部183の出力信号(PCM信号)
184のサンプリング位置であり、図中の白丸で表され
た点は元の48KHzでサンプリングされた場合のサン
プリング位置である。一般に、標本化周波数定理(Samp
ling Theorem)の名前でよく知られているように、連続
関数f(t)の帯域がサンプリング周波数の半分に制限さ
れている場合、f(t)は、間隔T毎にサンプリングされ
たサンプルから、下記式のように一意的に復元すること
が可能である。
【0095】
【数1】
【0096】但し、この式において、sincT(t)=sin
(πt/T)/(πt/T)であり、incT(0)=1とする。
【0097】そこで、図14に示されるように、例え
ば、点Bの白丸のサンプル値は、信号波形の黒丸のサン
プル点とsincT(t)のサンプル点の畳み込みを計算する
ことによって得ることが可能となる。但し、sincT(t)
はその両端で十分小さな値をとるので、必要な計算精度
に応じて定めた有限の積和項で打ち切るようにすれば良
い。
【0098】上述したように、第2の実施の形態によれ
ば、復号処理の速度は速くなるが、高い音へシフトする
ピッチ変換時に不要となる高域側のデータを0データと
することで、全帯域を復号する場合よりも処理量を減ら
すことができ、復号時の負担を軽減することが可能であ
る。したがって、ハードウェア規模の増大とコストアッ
プを招くことなく、高い音へシフトするピッチ変換を実
現できる。
【0099】なお、ここまでの説明では、符号化データ
として、帯域分割フィルタによって帯域分割した後、ス
ペクトル信号に変換して符号化したものを例に挙げてい
るが、例えば、PCM信号を直接、MDCT等の変換に
よってスペクトル信号に変換した後、符号化した符号化
データであっても、本発明に係るピッチ変換を適用する
ことができる。この場合も、高い音にシフトするピッチ
変換を行う場合には、低域側の信号だけを復号するよう
にすれば、処理量を減らすことができる。
【0100】さらに、上述した各実施の形態では、帯域
分割数を4つとした例を挙げているが、例えば6、8、
10、12、・・・等の分割数であっても本発明を適用
できる。また、分割された4つの帯域の低域側の3帯域
を用いて上述したピッチ変換の処理を行うこともでき
る。
【0101】次に、図15には、上述した各実施の形態
の符号化装置及び復号化装置が適用される一具体例とし
ての圧縮データ記録及び/又は再生装置の概略構成を示
す。
【0102】図15に示す圧縮データ記録及び/又は再
生装置において、先ず記録媒体としては、スピンドルモ
ータ(M)51により回転駆動される光磁気ディスク1
が用いられる。光磁気ディスク1に対するデータの記録
時には、例えば光学ヘッド(H)53によりレーザ光を
照射した状態で記録データに応じた変調磁界を磁気ヘッ
ド54により印加することによって、いわゆる磁界変調
記録を行い、光磁気ディスク1の記録トラックに沿って
データを記録する。また再生時には、光磁気ディスク1
の記録トラックを光学ヘッド53によりレーザ光でトレ
ースして磁気光学的に再生を行う。
【0103】光学ヘッド(H)53は、例えば、レーザ
ダイオード等のレーザ光源、コリメータレンズ、対物レ
ンズ、偏光ビームスプリッタ、シリンドリカルレンズ等
の光学部品及び所定パターンの受光部を有するフォトデ
ィテクタ等から構成されている。この光学ヘッド53
は、光磁気ディスク1を介して上記磁気ヘッド54と対
向する位置に設けられている。光磁気デイスク1にデー
タを記録するときには、後述する記録系の磁気ヘッド駆
動回路66により磁気ヘッド54を駆動して記録データ
に応じた変調磁界を印加すると共に、光学ヘッド53に
より光磁気ディスク1の目的トラックにレーザ光を照射
することによって、磁界変調方式により熱磁気記録を行
う。またこの光学ヘッド53は、目的トラックに照射し
たレーザ光の反射光を検出し、例えばいわゆる非点収差
法によりフォーカスエラーを検出し、例えばいわゆるプ
ツシユプル法によりトラッキングエラーを検出する。光
磁気ディスク1からデータを再生するとき、光学ヘツド
53は上記フォーカスエラーやトラッキングエラーを検
出すると同時に、レーザ光の目的トラックからの反射光
の偏光角(カー回転角)の違いを検出して再生信号を生
成する。
【0104】光学ヘッド53の出力は、RF回路55に
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して後述する再生系の復調器71
に供給する。
【0105】サーボ制御回路56は、例えばフォーカス
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
【0106】システムコントローラ57にはキー入力操
作部58や表示部(ディスプレイ)59が接続されてい
る。このシステムコントローラ57は、キー入力操作部
58による操作入力情報により操作入力情報により記録
系及び再生系の制御を行う。またシステムコントローラ
57は、光磁気ディスク1の記録トラックからヘツダー
タイムやサブコードのQデータ等により再生されるセク
タ単位のアドレス情報に基づいて、光学ヘッド53及び
磁気ヘッド54がトレースしている上記記録トラック上
の記録位置や再生位置を管理する。さらにシステムコン
トローラ57は、本圧縮データ記録再生装置のデータ圧
縮率と上記記録トラック上の再生位置情報とに基づいて
表示部(ディスプレイ)59に再生時間を表示させる制
御を行う。また、システムコントローラ67は、前述し
た制御部139,189の機能も担当する。
【0107】この再生時間表示は、光磁気ディスク1の
記録トラックからいわゆるヘッダータイムやいわゆるサ
ブコードQデータ等により再生されるセクタ単位のアド
レス情報(絶対時間情報)に対し、データ圧縮率の逆数
(例えば1/4圧縮のときには4)を乗算することによ
り、実際の時間情報を求め、これを表示部(ディスプレ
イ)59に表示させるものである。なお、記録時におい
ても、例えば光磁気ディスク等の記録トラックに予め絶
対時間情報が記録されている(プリフォーマットされて
いる)場合に、このプリフォーマットされた絶対時間情
報を読み取ってデータ圧縮率の逆数を乗算することによ
り、現在位置を実際の記録時間で表示させることも可能
である。
【0108】次にこのディスク記録再生装置の記録系に
おいて、入力端子60からのアナログオーディオ入力信
号Ainがローパスフイルタ(LPF)61を介してA/
D変換器62に供給され、このA/D変換器62は上記
アナログオーディオ入力信号Ainを量子化する。A/D
変換器62から得られたディジタルオーディオ信号は、
ATC(Adaptive Transform Coding)符号化器63に
供給される。また、入力端子67からのディジタルオー
ディオ入力信号Dinがディジタル入力インターフェース
回路(ディジタル入力)68を介してATC符号化器6
3に供給される。ATC符号化器63は、前記図1に示
したものであり、上記入力信号Ainを上記A/D変換器
62により量子化した所定転送速度のディジタルオーデ
ィオPCMデータについて、所定のデータ圧縮率に応じ
たビット圧縮(データ圧縮)処理を行うものであり、A
TC符号化器63から出力される圧縮データ(ATCデ
ータ)は、メモリ64に供給される。例えばデータ圧縮
率が1/8の場合について説明すると、ここでのデータ
転送速度は、上記標準のCD−DAのフオーマットのデ
ータ転送速度(75セクタ/秒)の1/8(9.375セク
タ/秒)に低減されている。
【0109】次に、メモリ64は、データの書き込み及
び読み出しがシステムコントローラ57により制御さ
れ、ATC符号化63から供給されるATCデータを一
時的に記憶しておき、必要に応じてディスク上に記録す
るためのバッファメモリとして用いられている。すなわ
ち、例えばデータ圧縮率が1/8の場合において、AT
C符号化器63から供給される圧縮オーディオデータ
は、そのデータ転送速度が、標準的なCD−DAフォー
マットのデータ転送速度(75セクタ/秒)の1/8、
すなわち9.375セクタ/秒に低減されており、この
圧縮データがメモリ64に連続的に書き込まれる。この
圧縮データ(ATCデータ)は、前述したように8セク
タにつき1セクタの記録を行えば足りるが、このような
8セクタおきの記録は事実上不可能に近いため、後述す
るようなセクタ連続の記録を行うようにしている。この
記録は、休止期間を介して、所定の複数セクタ(例えば
32セクタ+数セクタ)から成るクラスタを記録単位と
して、標準的なCD−DAフォーマットと同じデータ転
送速度(75セクタ/秒)でバースト的に行われる。
【0110】すなわちメモリ64においては、上記ビッ
ト圧縮レートに応じた9.375(=75/8)セクタ
/秒の低い転送速度で連続的に書き込まれたデータ圧縮
率1/8のATCオーディオデータが、記録データとし
て上記75セクタ/秒の転送速度でバースト的に読み出
される。この読み出されて記録されるデータについて、
記録休止期間を含む全体的なデータ転送速度は、上記
9.375セクタ/秒の低い速度となっているが、バー
スト的に行われる記録動作の時間内での瞬時的なデータ
転送速度は上記標準的な75セクタ/秒となっている。
従って、ディスク回転速度が標準的なCD−DAフォー
マットと同じ速度(一定線速度)のとき、該CD−DA
フォーマットと同じ記録密度、記憶パターンの記録が行
われることになる。
【0111】メモリ64から上記75セクタ/秒の(瞬
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、変調器65に供
給される。ここで、メモリ64から変調器65に供給さ
れるデータ列において、1回の記録で連続記録される単
位は、複数セクタ(例えば32セクタ)から成るクラス
タ及び該クラスタの前後位置に配されたクラスタ接続用
の数セクタとしている。このクラスタ接続用セクタは、
変調器65でのインターリーブ長より長く設定してお
り、インターリーブされても他のクラスタのデータに影
響を与えないようにしている。
【0112】変調器65は、メモリ64から上述したよ
うにバースト的に供給される記録データについて、エラ
ー訂正のための符号化処理(パリテイ付加及びインター
リーブ処理)やEFM符号化処理などを施す。この変調
器65による符号化処理の施された記録データが磁気ヘ
ッド駆動回路66に供給される。この磁気ヘッド駆動回
路66は、磁気ヘッド54が接続されており、上記記録
データに応じた変調磁界を光磁気ディスク1に印加する
ように磁気ヘッド54を駆動する。
【0113】また、システムコントローラ57は、メモ
リ64に対する上述の如きメモリ制御を行うとともに、
このメモリ制御によりメモリ64からバースト的に読み
出される上記記録データを光磁気ディスク1の記録トラ
ックに連続的に記録するように記録位置の制御を行う。
この記録位置の制御は、システムコントローラ57によ
りメモリ64からバースト的に読み出される上記記録デ
ータの記録位置を管理して、光磁気ディスク1の記録ト
ラック上の記録位置を指定する制御信号をサーボ制御回
路56に供給することによって行われる。
【0114】次に再生系について説明する。この再生系
は、上述の記録系により光磁気ディスク1の記録トラッ
ク上に連続的に記録された記録データを再生するための
ものであり、光学ヘッド53によって光磁気ディスク1
の記録トラックをレーザ光でトレースすることにより得
られる再生出力がRF回路55により2値化されて供給
される復調器71を備えている。この時光磁気ディスク
のみではなく、いわゆるコンパクトディスク(CD:Co
mpact Disc、商標)と同じ再生専用光ディスクの読み出
しも行なうことができる。
【0115】復調器71は、上述の記録系における変調
器65に対応するものであって、RF回路55により2
値化された再生出力について、エラー訂正のための上述
の如き復号化処理やEFM復号化処理などの処理を行
い、上述のデータ圧縮率1/8のATCオーディオデー
タを、正規の転送速度よりも早い75セクタ/秒の転送
速度で再生する。この復調器71により得られる再生デ
ータは、前記図6のメモリ131,図11のメモリ18
1であるメモリ72に供給される。
【0116】メモリ72は、データの書き込み及び読み
出しがシステムコントローラ57により制御され、復調
器71から75セクタ/秒の転送速度で供給される再生
データがその75セクタ/秒の転送速度でバースト的に
書き込まれる。また、このメモリ72は、上記75セク
タ/秒の転送速度でバースト的に書き込まれた上記再生
データがデータ圧縮率1/8に対応する9.375セク
タ/秒の転送速度で連続的に読み出される。
【0117】システムコントローラ57は、再生データ
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記9.37
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72からバースト的に
書き込まれる上記再生データを光磁気ディスク1の記録
トラックから連続的に再生するように再生位置の制御を
行う。この再生位置の制御は、システムコントローラ5
7によりメモリ72からバースト的に読み出される上記
再生データの再生位置を管理して、光磁気ディスク1も
しくは光ディスク1の記録トラック上の再生位置を指定
する制御信号をサーボ制御回路56に供給することによ
って行われる。
【0118】メモリ72から9.375セクタ/秒の転
送速度で連続的に読み出された再生データとして得られ
るATCオーディオデータは、前述した図6或いは図1
1の復号部133,183であるATC復号器73に供
給される。このATC復号器73は、上記記録系のAT
C符号化器63に対応するもので、例えばATCデータ
を8倍にデータ伸張(ビット伸張)することで16ビッ
トのディジタルオーディオデータを再生する。このAT
C復号器73からのディジタルオーディオデータは、図
11のサンプリング変換部185である変換器74に供
給される。
【0119】当該変換器74にてピッチ変換或いはサン
プリング変換された信号は、前記図6,図11のD/A
変換器137,197であるD/A変換器74に供給さ
れる。
【0120】D/A変換器74は、ATC復号器73か
ら供給されるディジタルオーディオデータをアナログ信
号に変換して、アナログオーディオ出力信号Aoutを形
成する。このD/A変換器74により得られるアナログ
オーディオ信号Aoutは、ローパスフイルタ75を介し
て出力端子76から出力される。
【0121】なお、ピッチ変換を行う場合には、システ
ムコントローラ57の制御により、そのピッチ変換に応
じたスピードで復号、再生が行われる。
【0122】次に、図16には、上述した各実施の形態
の符号化装置及び復号化装置が適用される他の具体例と
してのパーソナルコンピュータの概略構成を示す。
【0123】すなわち、この図16のパーソナルコンピ
ュータは、前述した実施の形態の機能をアプリケーショ
ンプログラムによるソフトウェアにて実現するものであ
る。
【0124】この図16において、MPU(マイクロプ
ロセッサユニット)203は、RAM202に展開され
たアプリケーションプログラムにより、前述した各実施
の形態のピッチ変換処理を行う。ROM201は、当該
パーソナルコンピュータの初期設定値等を保存する。
【0125】ハードディスクドライブ214のハードデ
ィスクには、上記アプリケーションプログラムが格納さ
れ、このハードディスクに記録されたアプリケーション
プログラムがハードディスクコントローラ213を介し
てRAM202上に格納される。上記アプリケーション
プログラムは、ディスクドライブ206に装填されたC
D−ROMやDVD−ROM等に記録されており、これ
らディスクを再生してハードディスクに格納される。な
お、アプリケーションプログラムは、モデム210を介
してサーバからダウンロードすることも可能であり、ま
た、通信ポート211及び通信ポートコントローラ21
1を介して外部から供給することも可能である。
【0126】ENC/DECボード215は、前述した
実施の形態の符号化と復号を行う。なお、MPU203
にて符号化と復号化をリアルタイムで行うことができる
場合には当該ボード215は不要である。
【0127】オーディオ処理ボード216は、前述した
実施の形態のピッチ変換或いはサンプリング変換を行
う。なお、MPU203にてピッチ変換或いはサンプリ
ング変換をリアルタイムで行うことができる場合には当
該ボード215は不要である。
【0128】A/D・D/A部217は、オーディオ信
号のA/D変換とD/A変換を行う。D/A変換された
オーディオ信号はオーディオ出力端子219から出力さ
れ、また、オーディオ入力端子218から入力されたオ
ーディオ信号はA/D変換される。
【0129】その他、ディスプレイ204、マウス・キ
ーボード208は、通常のパーソナルコンピュータに付
属するものであり、ディスプレイ204はディスプレイ
コントローラ205によりコントロールされ、マウス・
キーボード208からの操作信号はインターフェイス
(I/F)部209を介して取り込まれる。
【0130】
【発明の効果】以上の説明からも明らかなように、本発
明の情報処理方法及び装置によれば、復号後の再生信号
のピッチを設定し、そのピッチに応じて符号化信号の低
域側のみを復号し、復号後の再生信号をピッチ変換する
ことにより、符号化されている例えばオーディオ信号を
復号するとともに、ピッチ変換を行って再生することを
可能とし、また、元の音の高さよりも高い音を再生する
場合に、少ない演算量の処理で十分に高い所望の音を得
ることができ、さらに復号装置のコストの上昇をも抑え
ることが可能となる。
【0131】また、本発明の情報処理方法及び装置によ
れば、復号後の再生信号のピッチを設定し、その応じて
符号化信号の高域側に0値を挿入して復号して、ピッチ
変換した再生信号を生成することにより、符号化されて
いる例えばオーディオ信号を復号するとともに、ピッチ
変換を行って再生することを可能とし、また、元の音の
高さよりも高い音を再生する場合に、少ない演算量の処
理で十分に高い所望の音を得ることができ、さらに復号
装置のコストの上昇をも抑えることが可能となる。
【0132】ここで、本発明の情報処理方法及び装置に
よれば、符号化信号が信号を帯域分割してから符号化し
たものである場合に、分割された各帯域のうち設定した
ピッチに応じた低域側の帯域のみを復号するようにした
り、また、符号化信号が信号を周波数成分に変換してか
ら符号化したものである場合に、変換された各周波数成
分のうち設定したピッチに応じた低域側の周波数成分の
みを復号するようにすることで、容易にピッチ変換後の
音を生成することができる。また、本発明の情報処理方
法及び装置によれば、ピッチ変換したディジタルの再生
信号を、そのピッチに応じたクロックにてアナログの再
生信号に変換することで、ピッチ変換後のアナログ信号
を得ることができる。さらに、本発明の情報処理方法及
び装置によれば、ピッチ変換の際に、復号後の再生信号
の低域側のみを、設定したピッチに基づいてサンプリン
グ変換したり、復号後の再生信号の高域側に0値を挿入
して、設定したピッチに基づいたサンプリング変換を行
うことで、エリアシングが発生しないピッチ変換後の音
を生成することができる。
【0133】本発明の情報提供媒体によれば、復号後の
再生信号のピッチを設定する工程と、そのピッチに応じ
て符号化信号の低域側のみを復号する工程と、復号後の
再生信号を設定したピッチに基づいてピッチ変換する工
程とを少なくとも有するプログラムを提供することによ
り、符号化されている例えばオーディオ信号を復号する
とともに、ピッチ変換を行って再生することが可能とな
り、また、元の音の高さよりも高い音を再生する場合
に、少ない演算量の処理で十分に高い所望の音を得るこ
とができ、さらに復号装置のコストの上昇をも抑えるこ
とが可能となる。
【0134】また、本発明の情報提供媒体によれば、復
号後の再生信号のピッチを設定する工程と、そのピッチ
に応じて符号化信号の高域側に0値を挿入して復号する
工程と、設定したピッチに応じたピッチの再生信号を生
成する工程とを少なくとも有するプログラムを提供する
ことにより、符号化されている例えばオーディオ信号を
復号するとともに、ピッチ変換を行って再生することが
可能となり、また、元の音の高さよりも高い音を再生す
る場合に、少ない演算量の処理で十分に高い所望の音を
得ることができ、さらに復号装置のコストの上昇をも抑
えることが可能となる。
【図面の簡単な説明】
【図1】本発明に関わる符号化装置の概略構成を示すブ
ロック回路図である。
【図2】符号化装置の変換部の構成例を示すブロック回
路図である。
【図3】符号化装置の信号成分符号化部の構成例を示す
ブロック回路図である。
【図4】符号化ユニットの説明に用いる図である。
【図5】符号列の構成を説明するための図である。
【図6】本発明の第1の実施の形態のピッチ変換機能を
有する復号装置の概略構成を示すブロック回路図であ
る。
【図7】本発明実施の形態の復号装置におけるピッチ変
換を伴う復号再生の基本的な流れを示すフローチャート
である。
【図8】第1の実施の形態の復号装置における部分復号
部の概略構成を示すブロック回路図である。
【図9】部分復号部の信号成分復号化部の構成例を示す
ブロック回路図である。
【図10】部分復号部の逆変換部の構成例を示すブロッ
ク回路図である。
【図11】本発明の第2の実施の形態のピッチ変換機能
を有する復号装置の概略構成を示すブロック回路図であ
る。
【図12】第2の実施の形態の復号装置のサンプリング
変換部の構成例を示すブロック回路図である。
【図13】第2の実施の形態の復号装置の低域通過フィ
ルタの説明に用いる図である。
【図14】第2の実施の形態の復号装置のサンプリング
変換部における再サンプリングの説明に用いる図であ
る。
【図15】本発明実施の形態の符号化装置及び復号装置
が適用される一具体例としての圧縮データ記録再生装置
の構成を示すブロック回路図である。
【図16】本発明実施の形態の符号化装置及び復号装置
が適用される他の具体例としてのパーソナルコンピュー
タの構成を示すブロック回路図である。
【符号の説明】
131,181 メモリ、 133 部分復号部、 1
37,187 D/A変換部、 139,189 制御
部、 183 復号部、 185 サンプリング変換
部、 191 低域通過フィルタ、 193 選択部、
195 再サンプリング部

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 符号化信号を復号再生する信号処理方法
    において、 復号後の再生信号のピッチを設定し、 上記設定したピッチに応じて上記符号化信号の低域側の
    みを復号し、 上記復号後の再生信号を上記設定したピッチに基づいて
    ピッチ変換することを特徴とする信号処理方法。
  2. 【請求項2】 上記符号化信号は少なくとも信号を帯域
    分割してから符号化したものであり、 上記復号の際には、上記分割された各帯域のうち上記設
    定したピッチに応じた低域側の帯域のみを復号すること
    を特徴とする請求項1記載の信号処理方法。
  3. 【請求項3】 上記符号化信号は少なくとも信号を周波
    数成分に変換してから符号化したものであり、 上記復号の際には、上記変換された各周波数成分のうち
    上記設定したピッチに応じた低域側の周波数成分のみを
    復号することを特徴とする請求項1記載の信号処理方
    法。
  4. 【請求項4】 上記設定したピッチに基づいてピッチ変
    換したディジタルの再生信号を、上記設定したピッチに
    応じたクロックにてアナログの再生信号に変換すること
    を特徴とする請求項1記載の信号処理方法。
  5. 【請求項5】 上記ピッチ変換の際には、上記復号後の
    再生信号の低域側のみを、上記設定したピッチに基づい
    てサンプリング変換することを特徴とする請求項1記載
    の信号処理方法。
  6. 【請求項6】 上記ピッチ変換の際には、上記復号後の
    再生信号の高域側に0値を挿入して、上記設定したピッ
    チに基づいたサンプリング変換を行うことを特徴とする
    請求項1記載の信号処理方法。
  7. 【請求項7】 符号化信号を復号再生する信号処理方法
    において、 復号後の再生信号のピッチを設定し、 上記設定したピッチに応じて上記符号化信号の高域側に
    0値を挿入して復号し、 上記設定したピッチに応じたピッチの再生信号を生成す
    ることを特徴とする信号処理方法。
  8. 【請求項8】 符号化信号を復号再生する信号処理装置
    において、 復号後の再生信号のピッチを設定する設定手段と、 上記設定したピッチに応じて上記符号化信号の低域側の
    みを復号する復号手段と、 上記復号後の再生信号を上記設定したピッチに基づいて
    ピッチ変換するピッチ変換手段とを有することを特徴と
    する信号処理装置。
  9. 【請求項9】 上記符号化信号は少なくとも信号を帯域
    分割してから符号化したものであり、 上記復号手段は、上記分割された各帯域のうち上記設定
    したピッチに応じた低域側の帯域のみを復号することを
    特徴とする請求項8記載の信号処理装置。
  10. 【請求項10】 上記符号化信号は少なくとも信号を周
    波数成分に変換してから符号化したものであり、 上記復号手段は、上記変換された各周波数成分のうち上
    記設定したピッチに応じた低域側の周波数成分のみを復
    号することを特徴とする請求項8記載の信号処理装置。
  11. 【請求項11】 上記設定したピッチに基づいてピッチ
    変換したディジタルの再生信号を、上記設定したピッチ
    に応じたクロックにてアナログの再生信号に変換するデ
    ィジタル/アナログ変換手段を有することを特徴とする
    請求項8記載の信号処理装置。
  12. 【請求項12】 上記ピッチ変換手段は、上記復号後の
    再生信号の低域側のみを、上記設定したピッチに基づい
    てサンプリング変換するサンプリング変換手段を有する
    ことを特徴とする請求項8記載の信号処理装置。
  13. 【請求項13】 上記ピッチ変換手段は、上記復号後の
    再生信号の高域側に0値を挿入して、上記設定したピッ
    チに基づいたサンプリング変換を行うサンプリング変換
    手段を有することを特徴とする請求項8記載の信号処理
    装置。
  14. 【請求項14】 符号化信号を復号再生する信号処理装
    置において、 復号後の再生信号のピッチを設定するピッチ設定手段
    と、 上記設定したピッチに応じて上記符号化信号の高域側に
    0値を挿入して復号する復号手段と、 上記設定したピッチに応じたピッチの再生信号を生成す
    る再生信号生成手段とを有することを特徴とする信号処
    理装置。
  15. 【請求項15】 符号化信号を復号再生するプログラム
    を提供する情報提供媒体において、 復号後の再生信号のピッチを設定する工程と、 上記設定したピッチに応じて符号化信号の低域側のみを
    復号する工程と、 上記復号後の再生信号を上記設定したピッチに基づいて
    ピッチ変換する工程とを少なくとも有するプログラムを
    提供することを特徴とする情報提供媒体。
  16. 【請求項16】 符号化信号を復号再生するプログラム
    を提供する情報提供媒体において、 復号後の再生信号のピッチを設定する工程と、 上記設定したピッチに応じて符号化信号の高域側に0値
    を挿入して復号する工程と、 上記設定したピッチに応じたピッチの再生信号を生成す
    る工程とを少なくとも有するプログラムを提供すること
    を特徴とする情報提供媒体。
JP11142516A 1999-05-21 1999-05-21 信号処理方法及び装置、並びに情報提供媒体 Withdrawn JP2000330599A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP11142516A JP2000330599A (ja) 1999-05-21 1999-05-21 信号処理方法及び装置、並びに情報提供媒体
EP00110699A EP1054400A3 (en) 1999-05-21 2000-05-19 Signal processing method and apparatus, and information serving medium
US09/574,899 US6519558B1 (en) 1999-05-21 2000-05-19 Audio signal pitch adjustment apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11142516A JP2000330599A (ja) 1999-05-21 1999-05-21 信号処理方法及び装置、並びに情報提供媒体

Publications (1)

Publication Number Publication Date
JP2000330599A true JP2000330599A (ja) 2000-11-30

Family

ID=15317185

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11142516A Withdrawn JP2000330599A (ja) 1999-05-21 1999-05-21 信号処理方法及び装置、並びに情報提供媒体

Country Status (3)

Country Link
US (1) US6519558B1 (ja)
EP (1) EP1054400A3 (ja)
JP (1) JP2000330599A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001097212A1 (fr) * 2000-06-14 2001-12-20 Kabushiki Kaisha Kenwood Dispositif et procédé d'interpolation de fréquence
JP2002373075A (ja) * 2001-06-14 2002-12-26 Sony Corp 音声メッセージ掲示板システム、情報処理端末、サーバ、および音声メッセージ発信方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356799A (ja) * 2000-06-12 2001-12-26 Toshiba Corp タイム/ピッチ変換装置及びタイム/ピッチ変換方法
ATE353465T1 (de) * 2001-11-30 2007-02-15 Koninkl Philips Electronics Nv Signalkodierung
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム
JP4222250B2 (ja) * 2004-04-26 2009-02-12 ヤマハ株式会社 圧縮楽音データ再生装置
US20080215340A1 (en) * 2005-05-25 2008-09-04 Su Wen-Yu Compressing Method for Digital Audio Files
US20070036297A1 (en) * 2005-07-28 2007-02-15 Miranda-Knapp Carlos A Method and system for warping voice calls
US8473298B2 (en) * 2005-11-01 2013-06-25 Apple Inc. Pre-resampling to achieve continuously variable analysis time/frequency resolution
KR101301245B1 (ko) * 2008-12-22 2013-09-10 한국전자통신연구원 스펙트럼 계수의 서브대역 할당 방법 및 장치
US10019995B1 (en) 2011-03-01 2018-07-10 Alice J. Stiebel Methods and systems for language learning based on a series of pitch patterns
US11062615B1 (en) 2011-03-01 2021-07-13 Intelligibility Training LLC Methods and systems for remote language learning in a pandemic-aware world
US11205056B2 (en) * 2019-09-22 2021-12-21 Soundhound, Inc. System and method for voice morphing

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
GB2240656A (en) 1990-01-15 1991-08-07 British Telecomm Audio recording/replay
JP3278863B2 (ja) * 1991-06-05 2002-04-30 株式会社日立製作所 音声合成装置
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5642466A (en) * 1993-01-21 1997-06-24 Apple Computer, Inc. Intonation adjustment in text-to-speech systems
US5567901A (en) 1995-01-18 1996-10-22 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6212496B1 (en) * 1998-10-13 2001-04-03 Denso Corporation, Ltd. Customizing audio output to a user's hearing in a digital telephone

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001097212A1 (fr) * 2000-06-14 2001-12-20 Kabushiki Kaisha Kenwood Dispositif et procédé d'interpolation de fréquence
US6836739B2 (en) 2000-06-14 2004-12-28 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
JP2002373075A (ja) * 2001-06-14 2002-12-26 Sony Corp 音声メッセージ掲示板システム、情報処理端末、サーバ、および音声メッセージ発信方法

Also Published As

Publication number Publication date
EP1054400A3 (en) 2001-11-07
EP1054400A2 (en) 2000-11-22
US6519558B1 (en) 2003-02-11

Similar Documents

Publication Publication Date Title
JP3123286B2 (ja) ディジタル信号処理装置又は方法、及び記録媒体
US6169973B1 (en) Encoding method and apparatus, decoding method and apparatus and recording medium
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
KR100276788B1 (ko) 디지탈 신호 처리 장치와 방법 및 기록 매체
US6741965B1 (en) Differential stereo using two coding techniques
JP3186307B2 (ja) 圧縮データ記録装置及び方法
US6353807B1 (en) Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
JP3200851B2 (ja) ディジタル信号処理装置,ディジタル信号処理方法及びデータ記録媒体
KR100341374B1 (ko) 디지탈신호처리방법,디지털신호처리장치및기록매체
JPH1132399A (ja) 符号化方法及び装置、並びに記録媒体
JP3531177B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法
JP3175446B2 (ja) 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
JP4211166B2 (ja) 符号化装置及び方法、記録媒体、並びに復号装置及び方法
US6519558B1 (en) Audio signal pitch adjustment apparatus and method
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
JP2000036755A (ja) 符号変換方法及び装置、並びにプログラム供給媒体
JP3531178B2 (ja) ディジタル信号処理装置及び方法
JP3304717B2 (ja) ディジタル信号圧縮方法及び装置
JP3186489B2 (ja) ディジタル信号処理方法及び装置
JP3175456B2 (ja) ディジタル信号処理装置
JP3572817B2 (ja) 情報符号化方法及び情報復号化装置
JP4123632B2 (ja) 情報符号化方法及び装置、並びにプログラム供給媒体
KR100563161B1 (ko) 부호화 방법 및 장치, 복호화 방법 및 장치,기록 매체
JP3477735B2 (ja) 圧縮データ変換装置及び方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060801