JP2002268700A - 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体 - Google Patents

音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Info

Publication number
JP2002268700A
JP2002268700A JP2001067217A JP2001067217A JP2002268700A JP 2002268700 A JP2002268700 A JP 2002268700A JP 2001067217 A JP2001067217 A JP 2001067217A JP 2001067217 A JP2001067217 A JP 2001067217A JP 2002268700 A JP2002268700 A JP 2002268700A
Authority
JP
Japan
Prior art keywords
information
header
pitch
reproduction
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001067217A
Other languages
English (en)
Inventor
Ryotaro Wakae
亮太郎 若江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001067217A priority Critical patent/JP2002268700A/ja
Publication of JP2002268700A publication Critical patent/JP2002268700A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音質劣化を防ぎつつ、符号化側で音響情報の
再生速度及びピッチを設定可能にする。 【解決手段】 速度パラメータ入力部4、ピッチパラメ
ータ入力部7でそれぞれのパラメータを入力する。入力
されたパラメータは、付加部6、9でHVXCヘッダに
付加する形で拡張ヘッダとして生成される。符号化デー
タ形成部10は、ヘッダにHVXC音声符号化部で符号
化された符号データをフレーム単位に付加して出力す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音響情報符号化装置
及び復号装置及び方法及びコンピュータプログラム及び
記憶媒体に関するものである。
【0002】
【従来の技術】ディジタル移動体通信において電波を効
率的に利用したり、音声または音楽蓄積サービス等で通
信回線や記憶媒体を効率的に利用するために、高能率音
声符号化方法が用いられる。高能率符号化方式の中でも
比較的低いビットレートで音声信号を符号化する方式と
して、ISO/IEC 14496 part 3(MPEG-4 Audio)で規定され
る符号励振型線形予測符号化(Code Excited Linear Pr
ediction:CELP)やHVXC(Harmonic Vector eXcitat
ion Coding)と呼ばれる音声符号化方式がある。
【0003】中でも、HVXCは2.0kbps〜4.
0kbpsという非常に低いビットレートで音声信号を
符号化することを目的とし、有声音部分と無声音部分と
で異なる符号化方式を利用している。有声音部分では線
形予測係数(LPC:LinearPrediction Coefficient)
の残差信号の調波(ハーモニック)構造をベクトル量子
化し、無声音部分については周期性のない駆動音源のみ
を用いたCELP方式を利用している。このように、超
低ビットレートのコーデックにおいて、入力音声の性質
に応じて符号化方式を切り替えることは音質向上に大き
く貢献する。
【0004】また、HVXCは更なる低ビットレートの
符号化機能のみならず、4.0kbpsのビットストリ
ームの一部を用いて、2.0kbpsでデコード(復
号)するビットレートスケーラビリティ機能や、符号化
パラメータの簡単な操作により、再生速度変換機能や再
生ピッチ変換機能など新しい機能性を考慮している。
【0005】再生速度変換機能と再生ピッチ変換機能
は、符号化された信号が完全にパラメータ化しているた
め、デコード時にパラメータの値や設定を任意に変えて
もデコードが可能であるというパラメトリック符号化の
特徴を生かした機能で、符号化されたパラメータの更新
周期を変えることによって再生速度変換機能を、また、
基本周波数を変えることによって、再生ピッチ変換機能
を実現している。
【0006】次に、この2つの機能の中でも、再生速度
変換機能の詳細について説明する。
【0007】スペクトル包絡を表すLPCパラメータ
(スペクトルパラメータ)、LPC残差信号のハーモニ
クススペクトルとピッチ(共に音源パラメータ)が有声
音部分の符号化パラメータであるが、これらは線形補間
によって任意の時刻の符号化パラメータに変換すること
ができる。また、無声音部分のCELP駆動音源はノイ
ズで代替することで任意の時刻の符号化パラメータを得
ることができる。このようにして得られた、任意の更新
レートに変換された符号化パラメータ列を復号化器に入
力することで、0.5〜2.0の範囲で任意のレートの時
間軸の伸縮が行える。
【0008】次に、補間されたパラメータの算出方法を
以下に記す。
【0009】速度変換する前の各パラメータをpara
m[n]、補間されたパラメータをmdf_param
[m]とする。ただしnとmは時間軸伸縮前後の時間イン
デックスである。フレームインターバルはともに20m
sである。また、N1を元の音源の長さ(変換前のフレ
ームの総数)、N2を速度変換されたスピーチの長さ
(変換後のフレームの総数)とすると、速度変換の比率
spdは、spd=N1/N2と定義される。したがっ
て、0≦n<N1、0≦m<N2となる。時間軸を変更
したパラメータは mdf_param[m] = param[m×spd] ……(A) と記述される。しかし一般にはm×spdは整数値をと
らない。そこで時刻m×spdのパラメータを時刻fr
0と時刻fr1のパラメータから線形補間によって得る
ために、 fr0 =[m×spd] ([]は切り捨て) fr1 = fr0+1 を定義する。線形補間を実行するために left = m×spd−fr0 right = fr1−m×spd と定義する。すると式(A)は下記の近似式で実行可能
となる。 mdf_param[m] = param[fr0]×right+param[fr1]×left このようなアルゴリズムで、任意の時刻の符号化パラメ
ータを算出している。
【0010】これらの処理は全て,エンコーダ側で生成
されたビットストリームをデコーダ側で復号する際に、
デコーダに速度変換パラメータを与える事により実現さ
れる。同様に、再生ピッチ変換機能においても処理は異
なるが、ピッチ変換パラメータをデコーダに与えること
により実現される。
【0011】
【発明が解決しようとする課題】しかしながら、上記公
報記載のISO/IEC 14496 part 3(MPEG-4 Audio)で規定さ
れるHVXC音声符号化方式では、デコーダ側でしか再
生速度変換機能(再生ピッチ変換機能)を実現すること
ができず、例えば、符号化データ(HVXCビットスト
リーム)を再生側に渡すユーザー(ここでは送信側と呼
ぶ)が任意の速度(ピッチ)で符号化データを再生する
ことを希望する場合、その情報(何倍速で再生するか
等)を、符号化データを再生するユーザー(ここでは受
信側と呼ぶ)にその都度伝えなければならず、手間がか
かってしまう。では、このような状況を回避するため、
送信側の任意の速度(ピッチ)で再生される符号化デー
タを、送信側で作成する方法として、現状のHVXC音
声符号化方式で実現することが可能な一具体案を、図1
を用いて説明する。
【0012】再生時間10秒の音声(1-0)をエンコ
ーダ(1-1)で符号化し、再生時間が10秒のHVX
Cビットストリーム(符号化データ)(1-2)を作成
する。作成されたビットストリームを速度変換パラメー
タ0.5が設定されたデコーダ(1-3)で復号化を行
い、再生時間が20秒の音声(1-4)を作成する。作
成された20秒の音声を再びエンコーダ(1-5)で符
号化し、再生時間が20秒のビットストリーム(1-
6)を作成する。このような方法により、送信側の任意
の速度で再生される符号化データを送信側で作成するこ
とが可能となり、受信側に何倍速で再生して欲しいとい
うような情報をその都度伝えるという手間は省かれる。
しかし、この具体案では、元の音声を最終的に2回エン
コードするため、音質が劣化するという問題が発生す
る。これはピッチ変換機能においても同様のことが言え
る。
【0013】本発明は上記実情に鑑みて為されたもので
あり、音質劣化を防ぎつつ、符号化側で音響情報の再生
速度及びピッチを設定可能にした音響情報符号化装置及
び復号装置及び方法及びコンピュータプログラム及び記
憶媒体を提供しようとするものである。
【0014】
【課題を解決するための手段】この課題を解決するた
め、例えば本発明の音響情報符号化装置は以下の構成を
備える。すなわち、音響情報を符号化し、所定のヘッダ
情報に付加してストリームとして出力する符号化装置で
あって、与えられた音響情報に対する再生速度及び再生
ピッチに関する情報を設定する設定手段と、該設定手段
により、与えられた音響情報のオリジナル再生速度及び
オリジナル再生ピッチに対して異なる情報が設定された
場合、前記ヘッダ情報の未定義の状態を活用し、前記設
定手段で設定された情報を前記ヘッダに付加した拡張ヘ
ッダを生成する生成手段と、該生成手段で生成された拡
張ヘッダに符号化したストリームを付加して出力する出
力手段とを備える。
【0015】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態(音声符号化データ作成装置、及び復号装
置、並びに記憶媒体)を詳細に説明する。
【0016】図2は、ISO/IEC 14496 part 3(MPEG-4 Au
dio)で規定されるHVXC音声符号化方式のビットスト
リームの構成図、ならびにヘッダ構造図である。図示の
如く、ビットストリームの先頭部分にHVXCヘッダと
して、4ビットが割り当てられており、それに続いてビ
ットレートが2kbpsの場合では1フレーム40ビッ
ト、4kbpsでは1フレーム80ビットのエレメンタ
リーストリームが続く。HVXCヘッダの構成内容とし
ては、固定レートモードか可変レートモードかを判断す
るHVXCvarModeフラグが1ビット、ビットレートを制御
するHVXCrateModeフラグが2ビット、また、拡張フラグ
であるextensionFlagが1ビット割り当てられている。
【0017】上記HVXCヘッダにおいて、MPEG-4 Aud
io (version 1)におけるHVXCrateModeの2ビットは、二
進表記で00、01、10は決められているものの、1
1となることはない。そこで、本実施形態ではこの11
(=十進数で3)を拡張有りとして用いる。
【0018】図3に、本実施形態の音声符号化データ作
成装置の構成を示す。本実施形態の音声符号化データ作
成装置は、音声データ入力部12、HVXC音声符号化
部1、HVXCヘッダ情報入力部2、HVXCヘッダ符
号化部3、速度パラメータ入力部4、速度パラメータ符
号化部5、速度パラメータ付加部6、ピッチパラメータ
入力部7、ピッチパラメータ符号化部8、ピッチパラメ
ータ付加部9、符号化データ形成部10で構成される。
【0019】まず、HVXCヘッダ情報入力部2に、固
定/可変レートモード、ビットレートなどの情報が送信
側により入力され、HVXCヘッダ符号化部3において
符号化パラメータに変換される。ここでいう符号化パラ
メータは、先に示したHVXCvarMode、HVXCrateMode、ext
ensionFlagのパラメータを指している。また、速度パラ
メータ入力部4、及びピッチパラメータ入力部7にはそ
れぞれ、速度、ピッチパラメータは送信装置に備えられ
たスイッチ、キーボード或いはマウス等により入力さ
れ、入力された速度、ピッチパラメータはそれぞれ速度
パラメータ符号化部5、ピッチパラメータ符号化部8で
符号化パラメータ(SpeedParam、PitchParam)に変換さ
れ、速度パラメータ付加部6、ピッチパラメータ付加部
9に伝送される。
【0020】ここでいう速度パラメータ、及びピッチパ
ラメータは、先に説明したように0.5〜2.0という限
定された範囲内の数値であり、符号化パラメータは、図
7に示されるように、入力された速度パラメータ、ピッ
チパラメータに対応している。
【0021】HVXCヘッダ符号化部3で変換された符
号化パラメータは、速度パラメータ付加部6、ピッチパ
ラメータ付加部9を介して速度パラメータ、ピッチパラ
メータが付加されたHVXCヘッダを生成し、加算器に
伝送される。
【0022】一方、音声データ入力部12に音声信号が
入力されると、入力された音声信号から、HVXC音声
符号化部1ではHVXCヘッダ符号化部3で変換された
符号化パラメータを用いてLSP係数や、音源パラメー
タなどの符号化パラメータを算出する。算出された符号
化パラメータは加算器に送られ、HVXCヘッダと共に
符号化データ形成部10に伝送され、HVXCビットス
トリームを形成する。
【0023】次に速度パラメータ付加部6、及びピッチ
パラメータ付加部9について、図4を用いて詳細に説明
する。
【0024】速度パラメータ符号化部5、及びピッチパ
ラメータ符号化部8で生成された符号化パラメータ(Sp
eedParam、PitchParam)はそれぞれ4ビットずつ割り当
てられる。また、いずれのパラメータが有効であるかを
示す2ビット(NumParam)を付加する。この計10ビッ
トのデータが、図2で記載されたISO/IEC 14496 part3
(MPEG-4 Audio)で規定されるHVXC音声符号化方式の
HVXCヘッダに付加され、新たにHVXCヘッダが生
成される。なお、NumParamは2ビットであるが、そのビ
ット1が“1”の場合にはSpeedParamが付加されている
ことを示し、ビット0が“1”の場合にはPitchParamが
付加されていることを示す。当然、ビット1、0の組み
合わせた結果“11”である場合は、SpeedParamとPitc
hParamの両方が付加されていることを示すことになる。
【0025】また、速度パラメータ入力部4、及びピッ
チパラメータ入力部7に、それぞれの数値が入力された
場合には、以下のような制御が行われる。 if( SpeedParam = 5 && PitchParam = 5 ){ HVXC_header = ISO_HVXC_header;………………………(1) } else if( SpeedParam != 5 && PitchParam = 5){ HVXC_header = Original_HVXC_header1;………………(2) } else if( SpeedParam = 5 && PitchParam != 5){ HVXC_header = Original_HVXC_header2;………………(3) } else{ HVXC_header = Original_HVXC_header3;………………(4) } (1)ではISO規定のHVXCヘッダのみで何も付加さ
れない。(2)ではISO規定のHVXCヘッダにNumPara
+SpeedParamが付加される。(3)ではISO規定のHV
XCヘッダにNumPara+PitchParamが付加される。
(4)では図4で示される新HVXCヘッダ(NumPara+
SpeedParam+PitchParam)が生成される。
【0026】従って、速度パラメータ1.0の数値(Spe
edParam = 5)、ピッチパラメータ1.0(PitchParam
= 5)の数値が入力された場合には(1)のHVXCヘ
ッダを生成することになる。また、それ以外の(2)乃
至(4)では、それぞれに応じた拡張ヘッダが挿入され
ることになる。
【0027】次に符号化データ形成部10について、図
5を用いて説明する。
【0028】HVXC音声符号化部1で生成された符号
化パラメータ(エレメンタリーストリーム)と、HVX
Cヘッダ符号化部3、速度/ピッチパラメータ付加部
6、9を経て生成された、先に示した4パターンのHV
XCヘッダを用いて、HVXCビットストリームを形成
する。
【0029】同図(A)は上記(1)のHVXCヘッダ
を用いて生成されたビットストーリムであり、同図
(B)、(C)はそれぞれ、上記(2)(3)のHVX
Cヘッダを用いて生成されたビットストリームであり、
同図(D)は上記(4)のHVXCヘッダを用いて生成
されたHVXCビットストリームを示している。図示の
如く、HVXCヘッダにおけるHVXCrateModeの2ビット
が“11”(規格上“11”となることはいないことを
利用している)の場合に、拡張された情報がヘッダに追
加されることになる。
【0030】上記の処理は、汎用の情報処理装置(例え
ばパーソナルコンピュータ等)上で動作するアプリケー
ションで実現できる。
【0031】この場合の動作処理は、例えば図9のフロ
ーチャートに従って処理することになる。
【0032】先ず、ステップS1で音声情報を入力す
る。入力元はサウンドボードに接続したマイクでも良い
し、音声情報を記憶した記憶媒体からでも良いし、ネッ
トワークからダウンロードしたものでもよい。
【0033】次いで、ステップS2で再生する際のパラ
メータを入力する。デフォルトでは、再生速度及び再生
ピッチとも“1”である。この入力は、例えばGUIに
よってマウス等で適宜変更することでも実現でき、その
入力方法は問わない。
【0034】次いで、ステップS3で符号化を行い、ス
テップS4、S5で先に入力した速度パラメータ及びピ
ッチパラメータが“1”であるか否かを判断する。両方
とも“1”であると判断した場合には、ステップS6で
通常のHVXCヘッダを生成し、ステップS7でそのヘ
ッダ先頭にし、後続する符号化済みデータをフレーム単
位に出力する。出力先は、ネットワークでも良いし、フ
ロッピー(登録商標)等の記憶媒体でも構わない。
【0035】一方、ステップS4、S5のいずれかの判
定がNoの場合、処理はステップS7に進み、先に説明
したNumparamを作成し、且つ、図7のテーブルを参照し
てSpeedParam又は/及びPitchParamを生成し、尚且つ、
HVXCrateModeの2ビットを“11”にした拡張ヘッダを
生成する。この後は、ステップS8での出力処理を行う
ことになる。
【0036】次に本発明の復号装置について説明する。
【0037】図6には、本実施の形態の復号装置の構成
を示す。本実施の形態の復号装置は、本発明の音声符号
化データ作成装置で作成されたHVXCビットストリー
ムから、HVXCヘッダを読み込むHVXCヘッダ読み
込み部60と、本発明の音声符号化データ作成装置で作
成されたHVXCビットストリームから、エレメンタリ
ーストリームを読み込むエレメンタリーストリーム読み
込み部61と、HVXCヘッダ情報を用いて、エレメン
タリーストリームを復号し、再生音声データを生成する
HVXC音声復号化部62と、再生音声データを出力す
る音声出力部63とを備えている。
【0038】前記HVXCヘッダ読み込み部60は、本
発明の音声符号化データ作成装置で作成されたHVXCrate
Modeの2ビットが“11”である場合、NumParamの2ビ
ットを調べることで上記(2)〜(4)のいずれかであ
るかを判断し、“11”以外の場合には通常通り再生す
る。
【0039】SpeedParam、PitchParamに関しては、読み
込んだそれぞれのパラメータを図8に示された速度パラ
メータ、ピッチパラメータに変換する。ただし、本実施
形態の音声符号化データ作成装置で作成されたHVXC
ヘッダが上記(1)の場合は、この変換処理は行われな
い。また、前記HVXC音声復号化部62において、初
期値として速度パラメータ1.0、ピッチパラメータ1.
0が設定されている。
【0040】さて、復号装置もまた、先に説明した符号
化装置と同様、パーソナルコンピュータ等の汎用情報処
理装置上で動作するアプリケーションで実現できる。こ
の場合には、図9のフローチャートに従って処理すれば
良いであろう。
【0041】先ず、ステップS11でストリームを入力
する。この入力は、フロッピーディスク等の記憶媒体、
或いはネットワーク等の通信媒体のいずれでも構わな
い。
【0042】次いで、ステップS12でHVXCヘッダ
を調べ、HVXCrateModeの2ビットが“11”であるか否
かを判断し、拡張ヘッダであるか否かを判断する。
【0043】拡張ヘッダではない、と判断した場合に
は、ステップS13において、速度パラメータに1、ピ
ッチパラメータに1を代入する。また、拡張ヘッダであ
ると判断した場合には、ステップS14に進み、NumPar
amの2ビットの“1”となっているのがビット0か、ビ
ット1か或いは両方かを判断し、後続4ビット(又は、
その後に後続する4ビット)からSpeedParam又は/及び
PitchParamのビットを取り出し、図8のテーブルを参照
して、速度パラメータ又は/及びピッチパラメータに変
換する。なお、NumParamが“10”であった場合、Spee
dParamのみが有効な情報として付加されていることにな
るので、PitchParamについてはデフォルトの1を設定す
る。NumParamが“01”の場合も同様である。
【0044】こうして、再生する際の2つのパラメータ
の値が決定されると、ステップS15で復号処理を行
い、ステップS16で決定されたパラメータに従って再
生処理を行い、出力する。出力先は、音源ボードに対し
て行い、最終的にスピーカから出力されることになる。
【0045】本実施形態における音声符号化方式は、IS
O/IEC 14496 part 3(MPEG-4 Audio)で規定されるHVX
C音声符号化方式を適用しているが、符号化された信号
が完全にパラメータ化されていて、復号時にパラメータ
の値や設定を任意に変えても復号ができ、再生速度変換
機能や再生ピッチ変換機能を実現することが可能な音声
符号化方式であるならば、本発明に適用することが可能
である。また、速度パラメータやピッチパラメータの範
囲が変更される場合においては、図8のような符号化パ
ラメータに変換するフォーマットも変更する必要があ
る。この範囲に応じて、割り当てビット数も変更する必
要性がある事は言うまでもない。
【0046】また、実施形態では、MPEG-4 AudioのHV
XCヘッダのHVXCrateModeを利用してヘッダを拡張した
が、拡張対象はMEG-4 Audioに限るものではなく、他の
音声ストリームに適用しても構わない。要は、既存のフ
ォーマットを活用して拡張できれば良いからである。
【0047】また、本発明の目的は前述したように、実
施形態の機能を実現するソフトウェアのプログラムコー
ドを記録した記憶媒体をシステムあるいは装置に提供
し、そのシステムあるいは装置のコンピュータ(または
CPUやMPU)が記憶媒体に格納されたプログラムコードを
読み出し実行することによっても達成されることは言う
までもない。この場合、記憶媒体から読み出されたプロ
グラムコード自体が前述した実施形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。
【0048】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピーディスク、ハードディ
スク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁
気テープ、不揮発性のメモリカード、ROMなどを用いる
ことができる。
【0049】また、コンピュータが読み出したプログラ
ムコードを実行することにより、前述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼動しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれていることは言うまでもない。
【0050】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張ボー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書きこまれた後、そのプログラムコードの指
示に基づき、その機能拡張ボードや機能拡張ユニットに
備わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含むことは言うまでもない。
【0051】以上説明したように本実施形態によれば、
音声符号化データを作成するユーザーの任意の速度(ピ
ッチ)で再生する音声符号化データを作成する場合、あ
らかじめビットストリームのヘッダ部分に、速度変換パ
ラメータ(ピッチ変換パラメータ)に関する情報を付加
させることにより、再生側に速度変換パラメータ(ピッ
チ変換パラメータ)に関する情報を伝える手間が省け、
また、音質を劣化させずに再生することができる。
【0052】
【発明の効果】以上説明したように本発明によれば、音
質劣化を防ぎつつ、符号化側で音響情報の再生速度及び
ピッチを設定可能になる。
【図面の簡単な説明】
【図1】通常のHVXC音声符号化方式で実現すること
が可能な具体案を説明する図である。
【図2】ISO/IEC 14496 part 3(MPEG-4 Audio)
で規定されるHVXC音声符号化方式のビットストリー
ムの構成図を示す図である。
【図3】本実施形態における音声符号化データ作成装置
のブロック構成図である。
【図4】本実施形態における速度パラメータ付加部6、
及びピッチパラメータ付加部9内での処理動作を説明す
るための図である。
【図5】本実施形態における4パターンのHVXCヘッ
ダを用いて生成されるHVXCビットストリームの構成
を示す図である。
【図6】本実施形態における復号装置のブロック構成図
である。
【図7】実施形態の符号化装置側で活用する変換テーブ
ルを示す図である。
【図8】実施形態の復号装置側で活用する変換テーブル
を示す図である。
【図9】実施形態の符号化装置における動作処理手順を
示すフローチャートである。
【図10】実施形態の復号装置における動作処理手順を
示すフローチャートである。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音響情報を符号化し、所定のヘッダ情報
    に付加してストリームとして出力する符号化装置であっ
    て、 与えられた音響情報に対する再生速度及び再生ピッチに
    関する情報を設定する設定手段と、 該設定手段により、与えられた音響情報のオリジナル再
    生速度及びオリジナル再生ピッチに対して異なる情報が
    設定された場合、前記ヘッダ情報の未定義の状態を活用
    し、前記設定手段で設定された情報を前記ヘッダに付加
    した拡張ヘッダを生成する生成手段と、 該生成手段で生成された拡張ヘッダに符号化したストリ
    ームを付加して出力する出力手段とを備えることを特徴
    とする音響情報符号化装置。
  2. 【請求項2】 前記未定義状態は、通常のヘッダ内のビ
    ットの組み合わせ取り得ないパターンを用いることを特
    徴とする請求項第1項に記載の音響情報符号化装置。
  3. 【請求項3】 前記生成手段で生成する拡張ヘッダは、
    通常のヘッダに、再生速度又は再生ピッチそれぞれの有
    無を示す2ビット、及び、再生速度のデータ又は/及び
    再生ピッチのデータが付加されたものであることを特徴
    とする請求項第2項に記載の音響情報符号化装置。
  4. 【請求項4】 音響情報を符号化し、所定のヘッダ情報
    に付加してストリームとして出力する符号化方法であっ
    て、 与えられた音響情報に対する再生速度及び再生ピッチに
    関する情報を設定する設定工程と、 該設定工程により、与えられた音響情報のオリジナル再
    生速度及びオリジナル再生ピッチに対して異なる情報が
    設定された場合、前記ヘッダの未定義の状態を活用し、
    前記設定工程で設定された情報を前記ヘッダに付加した
    拡張ヘッダを生成する生成工程と、 該生成工程で生成された拡張ヘッダに符号化したストリ
    ームを付加して出力する出力工程とを備えることを特徴
    とする音響情報符号化方法。
  5. 【請求項5】 音響情報を符号化し、所定のヘッダ情報
    に付加してストリームとして出力する符号化するコンピ
    ュータプログラムであって、 与えられた音響情報に対する再生速度及び再生ピッチに
    関する情報を設定する設定工程のプログラムコードと、 該設定工程により、与えられた音響情報のオリジナル再
    生速度及びオリジナル再生ピッチに対して異なる情報が
    設定された場合、前記ヘッダの未定義の状態を活用し、
    前記設定工程で設定された情報を前記ヘッダに付加した
    拡張ヘッダを生成する生成工程のプログラムコードと、 該生成工程で生成された拡張ヘッダに符号化したストリ
    ームを付加して出力する出力工程のプログラムコードと
    を備えることを特徴とするコンピュータプログラム。
  6. 【請求項6】 請求項第5項に記載のコンピュータプロ
    グラムを格納することを特徴とする記憶媒体。
  7. 【請求項7】 請求項第1項に記載の音響情報符号化装
    置により符号化されたデータストリームを復号する復号
    装置であって、 入力したデータストリームのヘッダ情報の未定義パター
    ンを利用しているか否かを判別する判別手段と、 該判別手段で未定義パターンを利用していると判別した
    場合、拡張ヘッダであるとして、音響情報に対する再生
    速度又は/及び再生ピッチに関する情報を抽出する抽出
    手段と、 前記データストリームを復号し、前記抽出手段で抽出し
    た再生速度又は/及び再生ピッチに関する情報に従い再
    生出力する出力手段とを備えることを特徴とする音響情
    報復号装置。
  8. 【請求項8】 請求項第1項に記載の音響情報符号化装
    置により符号化されたデータストリームを復号する復号
    方法であって、 入力したデータストリームのヘッダ情報の未定義パター
    ンを利用しているか否かを判別する判別工程と、 該判別工程で未定義パターンを利用していると判別した
    場合、拡張ヘッダであるとして、音響情報に対する再生
    速度又は/及び再生ピッチに関する情報を抽出する抽出
    工程と、 前記データストリームを復号し、前記抽出工程で抽出し
    た再生速度又は/及び再生ピッチに関する情報に従い再
    生出力する出力工程とを備えることを特徴とする音響情
    報復号方法。
  9. 【請求項9】 請求項第1項に記載の音響情報符号化装
    置により符号化されたデータストリームを復号するため
    のコンピュータプログラムであって、 入力したデータストリームのヘッダ情報の未定義パター
    ンを利用しているか否かを判別する判別工程のプログラ
    ムコードと、 該判別工程で未定義パターンを利用していると判別した
    場合、拡張ヘッダであるとして、音響情報に対する再生
    速度又は/及び再生ピッチに関する情報を抽出する抽出
    工程のプログラムコードと、 前記データストリームを復号し、前記抽出工程で抽出し
    た再生速度又は/及び再生ピッチに関する情報に従い再
    生出力する出力工程のプログラムコードとを備えること
    を特徴とするコンピュータプログラム。
  10. 【請求項10】 請求項第9項に記載のコンピュータプ
    ログラムを格納することを特徴とする記憶媒体。
JP2001067217A 2001-03-09 2001-03-09 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体 Withdrawn JP2002268700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001067217A JP2002268700A (ja) 2001-03-09 2001-03-09 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001067217A JP2002268700A (ja) 2001-03-09 2001-03-09 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2002268700A true JP2002268700A (ja) 2002-09-20

Family

ID=18925599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001067217A Withdrawn JP2002268700A (ja) 2001-03-09 2001-03-09 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2002268700A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007519967A (ja) * 2004-01-28 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号を時間スケーリングする方法及び装置
US7424210B2 (en) 2003-09-05 2008-09-09 Kabushiki Kaisha Toshiba Information storage medium, information reproduction device, information reproduction method
JP2008283415A (ja) * 2007-05-10 2008-11-20 Mitsubishi Electric Corp 暗号化装置、暗号化方法、暗号化プログラム、復号装置、復号方法及び復号プログラム
JP2012037726A (ja) * 2010-08-06 2012-02-23 Nippon Hoso Kyokai <Nhk> 音声合成装置およびコンピュータプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7424210B2 (en) 2003-09-05 2008-09-09 Kabushiki Kaisha Toshiba Information storage medium, information reproduction device, information reproduction method
JP2007519967A (ja) * 2004-01-28 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号を時間スケーリングする方法及び装置
JP2008283415A (ja) * 2007-05-10 2008-11-20 Mitsubishi Electric Corp 暗号化装置、暗号化方法、暗号化プログラム、復号装置、復号方法及び復号プログラム
JP2012037726A (ja) * 2010-08-06 2012-02-23 Nippon Hoso Kyokai <Nhk> 音声合成装置およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
JP5792710B2 (ja) 正弦波符号化
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JPH10260692A (ja) 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
JP2001005474A (ja) 音声符号化装置及び方法、入力信号判定方法、音声復号装置及び方法、並びにプログラム提供媒体
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP4793539B2 (ja) 符号変換方法及び装置とプログラム並びにその記憶媒体
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d&#39;analyse de signal de bruit et procede de synthese de signal de bruit
JP2002140098A (ja) 音声復号装置および音声復号プログラムを記録した記録媒体
JP2002268700A (ja) 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体
JP3050978B2 (ja) 音声符号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP3235526B2 (ja) 音声圧縮伸長方法及びその装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP4737416B2 (ja) 符号変換方法及び装置
JPH09244695A (ja) 音声符号化装置及び復号化装置
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
JP3418803B2 (ja) 音声符号復号化装置
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP2000163097A (ja) 音声変換装置、音声変換方法および音声変換プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3099844B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080513