JPH10256918A - 音響符号化方法 - Google Patents

音響符号化方法

Info

Publication number
JPH10256918A
JPH10256918A JP9062666A JP6266697A JPH10256918A JP H10256918 A JPH10256918 A JP H10256918A JP 9062666 A JP9062666 A JP 9062666A JP 6266697 A JP6266697 A JP 6266697A JP H10256918 A JPH10256918 A JP H10256918A
Authority
JP
Japan
Prior art keywords
data
bit
encoding
equation
data length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9062666A
Other languages
English (en)
Inventor
Takane Chuma
高嶺 中馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9062666A priority Critical patent/JPH10256918A/ja
Publication of JPH10256918A publication Critical patent/JPH10256918A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 汎用CPUでも実時間処理を実現でき、さま
ざまなデータ長の音響信号を入力できる音響符号化方法
を提供する。 【解決手段】 サンプリングした4つの16ビットデータ
101〜104を8ビットデータ105〜108に変換し、それを3
2ビットレジスタに4個ずつパックして格納し、連結デ
ータ109を作成する。連結データ109に対して処理を行
い、連結データ110とする。連結データ110からデータを
分離して8ビットデータ111〜114とし、データ長を変換
し、16ビットデータ115〜118を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音響データを符号
化する音響符号化方法に関する。
【0002】
【従来の技術】近年のディジタル信号処理技術の進歩と
共に、映像や音響信号をディジタルデータとして伝送、
もしくは蓄積する必要性が高まっており、それにともな
い映像・音響信号を符号化する技術が重要となってきて
いる。映像・音響信号の符号化方式の一例としては、MP
EG1がある。MPEG1は映像・音響符号化のISO/IEC標準方
式であり、ビデオCDやカラオケ等の用途に幅広く利用さ
れている。また、近年のパソコンの高性能化にともな
い、パソコンでもMPEG1を扱えるようになってきてお
り、映像・音響符号化の標準としての重要度が増してき
ている。
【0003】MPEG1のうち、音響符号化に関する部分はM
PEG1/Audioと呼ばれ、ステレオオーディオ符号化のISO/
IEC標準方式である。以下に、音響符号化の代表例とし
て、MPEG1/Audioレイヤ1の符号化処理について説明す
る。
【0004】図6は、MPEG1/Audioレイヤ1による音響符
号化のフローチャートである。まず図6を用いて、音響
符号化の手順を説明する。
【0005】ステップS61:音響入力をデータ長16ビッ
ト,サンプリング周期44.1MHzのPCMフォーマットでサン
プリングする。
【0006】ステップS62:ステップS61でサンプリング
した音響信号を、サブバンド分析により32帯域のサブバ
ンド信号に分割する。
【0007】ステップS63:ステップS62で求めた各サブ
バンド信号に対するスケールファクタを計算する。
【0008】ステップS64:ステップS61の音響信号とス
テップS63のスケールファクタから心理聴覚分析を行
い、人間に聞こえやすい帯域の信号劣化が最小になるよ
うに各バンドへのビット割り当てを決める。
【0009】ステップS65:ステップS64の心理聴覚分析
で得られたビット割り当てに基づいて、ステップS62の
各サブバンド信号を量子化処理する。
【0010】ステップS66:ステップS65で量子化された
データにヘッダ等を付加し、ビットストリームを生成す
る。
【0011】次に、上記ステップS62のサブバンド分析
について詳細に説明する。サブバンド分析は512タップP
FB(Polyphase Filter Bank)によって次のような手順で
行われる。
【0012】ステップ62:入力信号サンプルX[i](i=0,
…,511)に対して、(数1)に従って基本低域通過フィ
ルタのインパルス応答C[i]をかける。C[i]は、MPEG1/Au
dioの規格書(ISO/IEC 11172-3)で定義されている。
【0013】
【数1】
【0014】ステップ62-2:周期加算信号Y[i]を(数
2)に従って計算する。
【0015】
【数2】
【0016】ステップ62-3:サブバンド出力S[i]を(数
3)に従って計算する。
【0017】
【数3】
【0018】
【発明が解決しようとする課題】従来例で示したような
符号化処理を実時間で行うために、従来は専用のハード
ウェアやDSPなどが用いられている。しかしながら、専
用ハードウェアやDSPを用いた符号化装置は高価なもの
になってしまい、一般のパソコンユーザは簡単には使え
ない。そこで、汎用のCPU上で、ソフトウェアによる処
理を行う方法が注目されている。
【0019】しかしながら、符号化処理は汎用CPUで行
うには計算量も多く、実時間での符号化は困難であるの
で、実時間での符号化処理を行うためにさまざまな高速
化の提案がなされている。その中では例えば、特開平5
−206868号公報に開示されているように、複数の
データをパックして一度に演算することで、演算回数を
減らす方法が考えられている。しかし、現時点で利用可
能なCPUでは、上記方法でも符号化の実時間処理を行う
には不十分であり、さらに、一般の多くのパソコンユー
ザが使用しているより性能の低いCPUであっても実時間
で符号化処理できる方法が求められている。従って、本
発明の目的は、汎用CPUでも実時間処理を実現できる音
響符号化方法を提供することである。
【0020】また、符号化処理の入力データのデータ長
は規定されている。従って、音響入力装置によりサンプ
リングした音響データのデータ長が符号化処理で規定さ
れたデータ長と一致しておらず、かつ、使用するコンピ
ュータがデータ長の変換手段を持っていない場合には、
符号化できないという欠点があった。従って、本発明の
目的は、さまざまなデータ長の音響信号を入力できる音
響符号化方法を提供することである。
【0021】
【課題を解決するための手段】上記課題を解決するため
に、本発明の音響符号化方法は、サンプリングしたデー
タ長nビットの音響データ1のデータ長をn/(2^m)ビット
(以下x^yはxのy乗を表す)に変換して音響データ2に変換
するステップと、前記音響データ2をk個連結してデータ
長k×n/(2^m)ビットの連結データを作成するステップ
と、データ長n×2^lビットの音響データを帯域分割符号
化した場合と結果が同一になるように前記連結データ内
の前記音響データ2をk個同時に帯域分割符号化するステ
ップとを備える。
【0022】
【実施の実施の形態】まず最初に、マルチメディア対応
CPU特有の機能について説明する。本発明では、レジス
タに格納された複数のデータを同時に処理する機能を備
えた、マルチメディア対応と呼ばれるCPUを利用する。
マルチメディア対応のCPUは汎用CPUの一種であり、複数
のデータをそれぞれレジスタの別のビット位置へ格納す
ることにより、複数のデータを同時に演算する機能を備
えている。
【0023】なお、本実施の形態では説明が簡略化でき
るため、上述したマルチメディア対応のCPUを用いて説
明するが、上記機能を有しない汎用CPUでも、十分リア
ルタイム処理可能な処理速度を有する汎用CPUであれば
本発明記載内容を実施することができるので、マルチメ
ディア対応のCPUに限定されることはない。
【0024】図2はマルチメディア対応のCPUを用いて
加算を行う場合の例を示したものである。図2におい
て、32ビットレジスタ201には8ビットの値a0〜a3が格納
されている。a0〜a3が格納された状態の32ビットレジス
タ201の値をAとし、(数4)を(数5)と表記する。
【0025】
【数4】
【0026】
【数5】
【0027】また、同様に32ビットレジスタ202には8ビ
ットの値b0〜b3が格納されている。b0〜b3が格納された
状態の32ビットレジスタ202の値をBとする。
【0028】この時、(数6)に対して(数7)という
4つの演算を一つの命令で一度に計算し、32ビットレジ
スタ203に格納できるというものである。
【0029】
【数6】
【0030】
【数7】
【0031】32ビットレジスタ203は上記32ビットレジ
スタ201もしくは32ビットレジスタ202と同一のレジスタ
であることもありうる。一つのレジスタに複数の値を格
納したり、逆にレジスタから値を分離する命令を持つも
のもある。以下で説明する実施の形態では、マルチメデ
ィア対応のCPUで処理を行うことを前提としている。
【0032】(実施の形態1)図1は、本発明の基本的
な処理の流れを説明したものである。図1では、まずサ
ンプリングした4つの16ビットデータ101〜104を8ビット
データ105〜108に変換し、それを32ビットレジスタに4
個ずつパックして格納し、連結データ109を作成してい
る。そして、連結データ109に対して処理を行い、連結
データ110とする。処理が終了したらデータを分離し、8
ビットデータ111〜114とする。最後に、元のデータ長に
変換し、16ビットデータ115〜118を得る。このように本
発明は、入力される音響データのデータ長を短縮して、
できるだけ多くのデータを一つのレジスタに格納し、同
時にできるだけ多くのデータに対する処理を行う。
【0033】本実施の形態では、上記で説明した処理
を、サブバンド符号化を採用した音響符号化方法である
MPEG1/Audioレイヤ1に適用した例を示す。
【0034】図3は、MPEG1/Audioレイヤ1における符号
化処理に本発明を適用した場合の音響符号化のフローチ
ャートである。まず図3を用いて、音響符号化の手順を
説明する。
【0035】ステップS31:音響入力をデータ長16ビッ
ト, サンプリング周期44.1MHzのPCMフォーマットでサン
プリングする。
【0036】ステップS32:ステップS31でサンプリング
された16ビットのデータを8ビットのデータに変換す
る。
【0037】ステップS33:ステップS32の8ビットデー
タを4個ずつ連結して32ビットの変数に格納し、連結デ
ータとする。
【0038】ステップS34:ステップS33の連結データに
対してサブバンド分析を行い、32帯域のサブバンド信号
に分割する。
【0039】ステップS35:連結データ内でサブバンド
信号に変換されたデータを分離し、そのデータ長を16ビ
ットに変換する。
【0040】ステップS36:ステップS35で求めた各サブ
バンド信号に対するスケールファクタを計算する。
【0041】ステップS37:ステップS31の音響信号とス
テップS36のスケールファクタから心理聴覚分析を行
い、人間が聞きやすい帯域の信号劣化を最小になるよう
に各バンドへのビット割り当てを決める。
【0042】ステップS38:ステップS37の心理聴覚分析
で得られたビット割り当てに基づいて、ステップS35の
各サブバンド信号を量子化処理する。
【0043】ステップS39:ステップS38で量子化された
データにヘッダ等を付加し、ビットストリームを生成す
る。
【0044】次に、本実施の形態におけるサブバンド分
析の手順について図4を用いて詳細に説明する。
【0045】ステップS32では、(数8)に従って16ビ
ットのサンプリングデータW[i]を8ビットのデータB[i]
に変換する。
【0046】
【数8】
【0047】ステップS33では、(数9)に従ってステ
ップS32で生成したデータB[i]を4個ずつ連結して32ビ
ットの変数DW[i]に格納し、連結データとする。
【0048】
【数9】
【0049】ステップS34では、処理するデータが連結
データとなることにともない、従来例で挙げたサブバン
ド分析の場合とは異なり、次のような手順で行われる。
【0050】ステップS34-1:ステップS33で生成した連
結データDW[i] (i=0,…,127)に対して、(数10)に従
って基本低域通過フィルタのインパルス応答C[i]をかけ
る。
【0051】
【数10】
【0052】ステップS34-2:周期加算信号Y[i]を(数
11)に従って計算する。
【0053】
【数11】
【0054】ステップS34-3:サブバンド出力S[i]を
(数12)、(数13)に従って計算する。
【0055】
【数12】
【0056】
【数13】
【0057】ステップS35では、(数14)、(数1
5)に従ってS[i]に含まれる各値を分離し、データ長を
16ビットに変換する。
【0058】
【数14】
【0059】
【数15】
【0060】以上のように、データ長を16ビットから8
ビットに短縮して同時に処理できるデータ数を2から4
へ増加させることで、精度は落ちるが演算できるデータ
数を増加させ、処理速度を向上させることができる。音
響データにおいては、精度の低下は音質の劣化として現
れるが、特に問題はない。また、CPU性能が向上して扱
えるデータ長が大きくなれば、この問題は改善できる。
【0061】なお、CPU性能に合わせて、データ長をよ
り短く変換して同時に処理できるデータ数を増加させる
ことにより、より性能の低いCPUでも処理することが可
能である。
【0062】なお、本実施の形態では入力する音響デー
タのデータ長と、最終的に得られるデータのデータ長は
共に16ビットで同一であるが、異なるデータ長とするこ
とももちろん可能である。
【0063】(実施の形態2)上記実施の形態1ではま
ず入力信号のデータ長を変換して短縮していたが、本実
施の形態のように、データ長変換の処理を省略すること
ももちろん可能である。
【0064】図5は、MPEG1/Audioレイヤ1における符号
化処理に本発明をデータ長を変換せずに適用した場合の
音響符号化のフローチャートである。まず図5を用い
て、音響符号化の手順を説明する。
【0065】ステップS51:音響入力をデータ長8ビッ
ト, サンプリング周期44.1MHzのPCMフォーマットでサン
プリングする。
【0066】ステップS52:ステップS51の8ビットデー
タを4個ずつ連結して32ビットの変数に格納し、連結デ
ータとする。
【0067】ステップS53:ステップS52の連結データに
対してサブバンド分析を行い、32帯域のサブバンド信号
に分割する。
【0068】ステップS54:連結データ内でサブバンド
信号に変換されたデータを分離し、そのデータ長を16ビ
ットに変換する。
【0069】ステップS55:ステップS54で求めた各サブ
バンド信号に対するスケールファクタを計算する。
【0070】ステップS56:ステップS51の音響信号とス
テップS55のスケールファクタから心理聴覚分析を行
い、人間が聞きやすい帯域の信号劣化が最小になるよう
に各バンドへのビット割り当てを決める。
【0071】ステップS57:ステップS56の心理聴覚分析
で得られたビット割り当てに基づいて、ステップS54の
各サブバンド信号を量子化処理する。
【0072】ステップS58:ステップS57で量子化された
データにヘッダ等を付加し、ビットストリームを生成す
る。
【0073】次に、本実施の形態におけるサブバンド分
析の手順について詳細に説明する。ステップS52では、
(数9)によってステップS52で生成したデータB[i]を4
個ずつ連結して64ビットの変数DW[i]に格納し、連結デ
ータとする。
【0074】ステップS53では、処理するデータが連結
データとなることにともない、通常のサブバンド分析の
場合とは異なり、次のような手順で行われる。
【0075】ステップS53-1:ステップS52で生成した連
結データDW[i] (i=0,…, 127)に対して、(数10)の
ように基本低域通過フィルタのインパルス応答C[i]をか
ける。
【0076】ステップS53-2:周期加算信号Y[i]を(数
11)に従って計算する。 ステップS53-3:サブバンド出力S[i]を(数12)(数
13)によって求める。
【0077】ステップS54では、S[i]に含まれる各値を
(数14)(数15)によって分離し、データ長を16ビ
ットに変換する。
【0078】以上のように、音響入力装置から入力され
るサンプリングデータのデータ長がもともと短い場合な
どでデータ長を変換する必要がない場合には、8ビット
のデータをそのまま32ビットレジスタに4つずつ格納す
ることができ、サブバンド分析の処理の後でデータ長を
16ビットに変換することにより、その後の符号化処理を
問題なく行うことができる。従って、本発明ではさまざ
まなデータ長の音響信号を入力して符号化することがで
きる。
【0079】なお、上記第2の実施の形態においては、
データ長16ビットのデータを8ビットに変換し、32ビッ
トの変数に格納する例と、データ長16ビットのデータを
そのまま64ビットの変数に格納する例を示したが、元の
音響データ、変換後の音響データ、格納する変数それぞ
れのデータ長をこの他の組み合わせにすることはもちろ
ん可能である。
【0080】なお、データ長の変換においては(数8)
や(数15)を用いたが、他の方法を用いることも可能
である。
【0081】なお、連結データへのデータの格納や取り
出しは(数4)を用いたが、格納するデータの位置が一
意に定まり、取り出しが正しく行える限り、他の方法を
用いることも可能である。
【0082】なお、データ長の変換と連結データの格納
や取り出しの順序は、上記第2の実施の形態の通りに行
う必要はなく、結果が同一になる限り任意の順序で行う
ことが可能である。
【0083】なお、サブバンド分析においては(数1
0)〜(数13)を用いたが、同一の結果が得られる限
り、高速化等の改良を行う等、その他の方法を用いるこ
とも可能である。
【0084】なお、上記第2の実施の形態においてはMP
EG1/Audioレイヤ1を例にとって説明したが、本発明を
その他の符号化方式に適用することが可能であることは
もちろんのことである。
【0085】また、本発明は音響データの符号化方法と
して説明したが、本発明を映像その他の信号の符号化に
用いることも可能である。
【0086】
【発明の効果】本発明は、サンプリングしたデータ長n
ビットの音響データのデータ長をn/(2^m)ビットに変換
し、それらをk個連結してデータ長k×n/(2^m)ビットの
連結データを作成し、k個同時に帯域分割符号化するの
で、処理の高速化が可能になる。
【0087】また、サンプリングしたデータ長nビット
の音響データのデータ長をn/(2^m)ビットに変換するの
で、音響入力装置からの入力のデータ長に関係なく符号
化を行うことができ、従って、任意の音響入力装置を用
いることができる。
【0088】さらに、データ長n×2^lビットの音響デー
タを帯域分割符号化した場合と結果が同一になるよう
に、データ長n/(2^m)ビットの連結データ内の音響デー
タを帯域分割符号化するので、特定のデータ長の音響デ
ータしか符号化できない符号化方法にも採用することが
でき、その結果、汎用性の高いシステムを構築できる。
【図面の簡単な説明】
【図1】本発明における基本的な処理の流れを説明する
説明図
【図2】マルチメディア対応のCPUを用いた演算のを
説明する説明図
【図3】本発明の第一の実施の形態の動作を示すフロー
チャート
【図4】本発明の第一の実施の形態における、サブバン
ド分析の処理を説明する説明図
【図5】本発明の第二の実施の形態の動作を示すフロー
チャート
【図6】従来例の動作を示すフローチャート
【符号の説明】
101,102,103,104 サンプリングした音
響データ 105,106,107,108 データ長を変換した
データ 109 連結データ 110 処理後の連結データ 111,112,113,114 連結データ110か
ら分離したデータ 115,116,117,118 データ長を変換した
データ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】サンプリングしたデータ長nビットの音響
    データ1のデータ長をn/(2^m)ビット(ただしx^yはxのy
    乗を表す)に変換して音響データ2に変換するステップ
    と、前記音響データ2をk個連結してデータ長k×n/(2^m)
    ビットの連結データを作成するステップと、データ長n
    ×2^lビットの音響データを符号化した場合と結果のデ
    ータ長が同一になるように前記連結データ内の前記音響
    データ2をk個同時に符号化するステップとを具備するこ
    とを特徴とする音響符号化方法。
  2. 【請求項2】サンプリングしたデータ長nビットの音響
    データ1をk個連結してデータ長k×nビットの連結データ
    を作成するステップと、データ長n×2^lビット(ただしx
    ^yはxのy乗を表す)の音響データを符号化した場合と結
    果のデータ長が同一になるように前記連結データ内の前
    記音響データ1をk個同時に符号化するステップとを具備
    することを特徴とする音響符号化方法。
JP9062666A 1997-03-17 1997-03-17 音響符号化方法 Pending JPH10256918A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9062666A JPH10256918A (ja) 1997-03-17 1997-03-17 音響符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9062666A JPH10256918A (ja) 1997-03-17 1997-03-17 音響符号化方法

Publications (1)

Publication Number Publication Date
JPH10256918A true JPH10256918A (ja) 1998-09-25

Family

ID=13206857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9062666A Pending JPH10256918A (ja) 1997-03-17 1997-03-17 音響符号化方法

Country Status (1)

Country Link
JP (1) JPH10256918A (ja)

Similar Documents

Publication Publication Date Title
JPS5853358B2 (ja) 音声分析装置
JPH0562495A (ja) サンプリング周波数変換器
JPS58207100A (ja) 次数を減らした波形形成多項式を用いるlpc符号化方法
JP2001188600A5 (ja)
JP3208001B2 (ja) 副バンドコーディングシステムの信号処理装置
JPH10256918A (ja) 音響符号化方法
JP2552102B2 (ja) ディジタルデータのフォーマッチング/ディフォーマッチング回路
JP3236758B2 (ja) 可変長データのcrc演算装置
JPH0235320B2 (ja)
JP3319551B2 (ja) ベクトル量子化装置
JP2004138789A (ja) ディジタル信号符号化方法、復号化方法、符号器、復号器及びこれらのプログラム
JP3200940B2 (ja) 楽音制御装置
JP2674155B2 (ja) データ圧縮符号化方法
JP2000206972A (ja) 波形デ―タの演奏制御装置
JPH0426895A (ja) 楽音信号発生装置
JP2002300042A (ja) 信号復号方法および信号復号装置ならびに信号復号処理プログラムを記録した記録媒体
KR100264389B1 (ko) 키변환 기능을 갖는 컴퓨터 음악반주기
JPH08286670A (ja) 電子楽器
JPH01239599A (ja) 音声合成方式
JPS60134378A (ja) 相関値演算装置
JPH0833742B2 (ja) 音声合成方式
JP2003258647A (ja) デジタルデータ処理装置,およびその方法
JPS61146020A (ja) 電子楽器の楽音波形処理装置
JPS5990899A (ja) 音声合成器
JP2005300656A (ja) 音声処理装置、及び、音声処理方法