JP4091506B2 - 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 - Google Patents
2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4091506B2 JP4091506B2 JP2003309721A JP2003309721A JP4091506B2 JP 4091506 B2 JP4091506 B2 JP 4091506B2 JP 2003309721 A JP2003309721 A JP 2003309721A JP 2003309721 A JP2003309721 A JP 2003309721A JP 4091506 B2 JP4091506 B2 JP 4091506B2
- Authority
- JP
- Japan
- Prior art keywords
- stage
- encoding
- signal
- coding
- snr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000004364 calculation method Methods 0.000 claims description 19
- 108091026890 Coding region Proteins 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 abstract description 41
- 230000003247 decreasing effect Effects 0.000 abstract description 4
- 238000013459 approach Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 21
- 239000013598 vector Substances 0.000 description 18
- 238000013139 quantization Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、多段音声画像符号化方法で動作する多段音声画像符号化装置の第一の最良の形態を示す。第一の最良の形態においては、入力端子11に与えられた音声画像入力信号を1段階目符号化部1211において符号化し、得られた符号化列を1段階目復号化部1311で復号化し、復号信号を得る。この復号信号と入力信号との誤差信号を誤差信号計算部141 で計算し、入力信号と誤差信号から次段符号化の動作を判定する判定パラメータを判定パラメータ計算部151 において算出する。ここで用いられる判定パラメータとしては、信号対雑音比(SNR)、重み付き信号対雑音比(WSNR)、ケプストラム距離(CD)、セグメンタルSNR、重み付きセグメンタルSNR、また音声や楽音の場合にはPESQ(Perceptual Evaluation of Speech Quality)、PEAQ(Perceived Evaluation of Audio Quality)等を使用すると効果的である。
また、2段目符号化部1221が図6に示すように複数の符号化法を切り替える形態とする場合には、閾値比較部161 は判定パラメータとさらに細かく設定した閾値との比較により次段の符号化列の送信非送信および複数の符号化の切り替えを行なう。以下同様にk−1段目(1<k<=N)の復号化信号と入力信号より判定パラメータを計算し、閾値と比較することにより、k段目の符号化列の送信または非送信の切り替えもしくは複数の符号化法の切り替えを行なう。
図3は、多段音声画像符号化方法で動作する多段音声画像符号化装置の第三の最良の形態を示す。この第三の最良の形態においては、入力端子31に与えられた入力信号を1段階目符号化部3211において符号化し、得られた符号化列を1段階目復号化部3311で復号化し、復号信号を得る。この復号信号と1段目入力信号との誤差信号を誤差信号計算部341 で計算し、1段目入力信号と誤差信号から次段符号化の動作を判定する判定パラメータを判定パラメータ計算部351 において算出する。
2段目符号化部が図7に示すように単一の符号化法を用いる形態とする場合には算出した判定パラメータと閾値を閾値比較部361 において比較し、符号化信号の品質が十分であると判定した場合には2段目以降の符号化列を送信しないように、また必要な復号化音の音質に達していないと判定した場合には2段目の符号化を送信するようにそれぞれ符号化列送信スイッチ372 を切り替える。
ここでk−1段階目の判定パラメータと比較するための閾値は、予め設定した固定値を使用しても良い。もしくはネットワーク送信部39から得られるネットワーク送信バッファ残量などのネットワーク状況により、閾値算出部38において、ネットワークが混雑している場合に符号化列が送信されにくいように、ネットワークが空いている場合には符号化列が送信されやすいように閾値を増減させる制御を行なっても良い。
図4は、多段音声画像符号化方法で動作する多段音声画像符号化装置の第四の最良の形態を示す。第四の最良の形態では、上記第三の最良の形態と同様にN−1段階目まで符号化を行ない、N−1段階目の判定パラメータと閾値との比較により、N段階目の符号化部42N1の動作非動作を切り替える。
図9、図10に多段音声画像符号化方法で動作する多段音声画像符号化装置及び復号化装置の第1の具体的実施例を示す。ここでは音声信号を符号化する場合の実施例を示す。ただし、説明を簡単にするため、1段目をCELP符号化方式により、2段目を背景技術の項での説明は各種の変換符号化方式により符号化する場合を示すが、3段目以上に変換符号化方式を適用する設計を行なっても効果的である。また2段目の符号化に3種類の変換符号化法を適用した場合を示すが、ネットワーク速度により1種類から複数種類の変換符号化法を適用する設計を行なっても良い。
一方、入力端子151に入力した入力信号はフレーム処理単位ごとにLPC分析部152でLPC分析し、そのLPC予測係数を量子化部153で量子化し、合成フィルタ154へ入力することでフィルタ係数を決定する。フレーム処理単位は30ms.程度で分析を行なうと効果が高い。入力信号から合成フィルタ154による合成信号を差し引いた差信号を聴覚重み付けフィルタ156に入力し、その出力のエネルギーが最小になるように制御部157により適応符号帳158、雑音符号帳159に対するベクトルの選択を行なう。
ここでは判定パラメータとして信号対雑音比を用いた実施例を示す。また閾値算出部96においてネットワーク送信部97から受信したネットワーク送信バッファ残量などに基づき閾値を算出する。ここではネットワーク送信バッファ残量から閾値を切り替える例を示しているが、閾値は固定とし、閾値算出部96を使用しない構成も可能である。
本実施例ではバッファ残量が20%を下回ると信号対雑音比の閾値を下げ、送信する符号化列を減少させ、バッファ残量を増加させ、バッファオーバーフローによる通信断を避ける制御を行なっている。
本実施例で使用するCELP符号化による復号化音声は原音声信号に対して平均13dB程度の信号対雑音比となることから、表1のように閾値を設定することによりバッファ残量が20%を下回った場合には、平均的に16kbit/sのビットレートのみの符号化列を送信することになり、バッファ残量が20%以上の場合の平均ビットレート64kbit/s(=CELP符号化16kbit/s+変換符号化−3 48kbit/s)にくらべ約1/4のビットレートとなり、送信バッファの増加を抑える制御が可能となる。
ここで1段目CELP復号化部103のための符号化列が受信できなかった場合には2段目の変換復号化部1061 ,1062 ,1063 は動作せず、0ベクトルを出力する。また復号化部103,1061 ,1062 ,1063 のうち動作しない復号化部は0ベクトルを出力する。復号化部103,1061 ,1062 ,1063 で復号した復号信号は復号信号加算部107にて加算され、出力信号を端子100より出力する。
また閾値比較部1161 においてネットワーク送信部119から受信したネットワーク送信バッファ残量などのネットワーク状況に基づき閾値を算出する。ここでは閾値を固定とした実施例を示しているが、実施例1で示した場合と同様にネットワーク状況から閾値を変化させることも可能である。閾値比較部1161 において、判定パラメータであるWSNRと閾値との比較を行ない、2段目符号化切り替え部1172 で2段目符号化(変換符号化部2)による符号化列の送信非送信を切り替える。同様にして、3段目の符号化(変換符号化部3)による符号化列の送信非送信を2段目符号化部−2における2段目入力信号と誤差信号から判定パラメータ計算部1152 にて計算される判定パラメータと閾値を閾値比較部1162 にて判定する。
図17にJPEG符号化方式のブロック図を示す。ここでは入力端子171に入力された入力画像信号をDCT変換部172でコサイン変換(Discrete Cosine Transform:DCT)によりDCT係数に変換し、量子化部173で前記DCT係数列を量子化する。ここで量子化は量子化テーブル174から歪を最小とする量子化ステップを選択し行なわれ、テーブル中の量子化ステップのインデックスを符号化列として出力する。量子化された係数列はハフマン符号化部175にてエントロピー符号化の一種であるハフマン符号化にて圧縮され、ハフマン符号化テーブル176における符号化テーブルインデックスおよび符号化インデックスを符号化列として出力する。
1221,2221,3221,4221 2段階目符号化部
12N1,22N1,32N1,42N1 N段階目符号化部
1311,2311,3311,4311 1段階目復号化部
1321,2321,3321,4321 2段階目復号化部
141 ,142 ,241 ,242 ,341 ,342 ,441 ,442 誤差信号計算部
151 ,152 ,251 ,252 ,351 ,352 ,451 ,452 判定パラメータ計算部
161 ,162 ,261 ,262 ,361 ,362 ,461 ,462 閾値比較部
172 ,17N ,272 ,27N ,372 ,37N ,472 ,47N 符号化列送信スイッチ
18,28,38,48 閾値算出部
19,29,39,49 ネットワーク送信部
10,20,30,40 符号化復号化動作制御部
Claims (4)
- 入力音声画像信号の特徴に応じて2段階の符号化手段により符号化を行なう2段階音声画像符号化方法であって、
入力音声画像信号を1段階目の符号化方式により符号化し第1の符号化列を得るステップと、
前記1段階目の符号化方式による前記符号化列を復号化し復号信号を得るステップと、
前記1段階目入力信号と前記復号信号との差分を計算し、1段階目誤差信号を計算するステップと、
前記1段階目誤差信号を入力として、予め定めた異なる複数のビットレートに符号化し複数の第2の符号化列を得る2段目符号化ステップと、
前記入力音声画像信号と前記1段階目誤差信号との比であるSNRを計算するステップと、
前記SNRと、異なる複数の値に設定される閾値との大小関係を比較し、前記SNRの大きさを段階的に評価した比較結果を得るステップと、
前記SNRが全ての閾値より大きい場合は前記第2の符号化列を選択せず、それ以外の場合は、前記SNRより大きな閾値が多いほど前記複数の第2の符号化列の中から順に大きなビットレートの第2の符号化列を1つ選択するステップと、
を備えることを特徴とする2段階音声画像符号化方法。 - 入力音声画像信号の特徴に応じて2段階の符号化手段により符号化を行なう2段階音声画像符号化装置であって、
入力音声画像信号を1段階目の符号化方式により符号化し符号化列を得る1段目符号化部と、
前記1段階目符号化部による前記符号化列を復号化し復号信号を得る1段目復号化部と、
前記1段階目入力信号と前記復号信号との差分を計算し、1段階目誤差信号を計算する誤差信号計算部と、
前記1段階目誤差信号を入力として、予め定めた異なる複数のビットレートに符号化し複数の第2の符号化列を得る複数の変換符号化部と、
前記入力音声画像信号と前記1段階目誤差信号との比であるSNRを計算する判定パラメータ計算部と、
前記SNRと、異なる複数の値に設定される閾値との大小関係を比較し、前記SNRの大きさを段階的に評価した比較結果を得る閾値比較部と、
前記SNRが全ての閾値より大きい場合は前記第2の符号化列を選択せず、それ以外の場合は、前記SNRより大きな閾値が多いほど前記複数の第2の符号化列の中から順に大きなビットレートの第2の符号化列を1つ選択する2段階目符号化切替え部と、
を具備することを特徴とする2段階音声画像符号化装置。 - 請求項2に記載された2段階音声画像符号化装置としてコンピュータを機能させるためのプログラム。
- 請求項3に記載されたプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003309721A JP4091506B2 (ja) | 2003-09-02 | 2003-09-02 | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003309721A JP4091506B2 (ja) | 2003-09-02 | 2003-09-02 | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005080063A JP2005080063A (ja) | 2005-03-24 |
JP4091506B2 true JP4091506B2 (ja) | 2008-05-28 |
Family
ID=34411790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003309721A Expired - Lifetime JP4091506B2 (ja) | 2003-09-02 | 2003-09-02 | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4091506B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5058152B2 (ja) * | 2006-03-10 | 2012-10-24 | パナソニック株式会社 | 符号化装置および符号化方法 |
FR2898443A1 (fr) * | 2006-03-13 | 2007-09-14 | France Telecom | Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants |
JP2008172515A (ja) | 2007-01-11 | 2008-07-24 | Sony Corp | 送信装置および方法、通信装置、並びにプログラム |
US20100088102A1 (en) * | 2007-05-21 | 2010-04-08 | Panasonic Corporation | Audio coding and reproducing apparatus |
JP5340261B2 (ja) * | 2008-03-19 | 2013-11-13 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 |
JP6010539B2 (ja) | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
CN103812824A (zh) * | 2012-11-07 | 2014-05-21 | 中兴通讯股份有限公司 | 音频多编码传输方法及相应装置 |
-
2003
- 2003-09-02 JP JP2003309721A patent/JP4091506B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005080063A (ja) | 2005-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4731775B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
US9390720B2 (en) | Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes | |
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
US9269366B2 (en) | Hybrid instantaneous/differential pitch period coding | |
JP5688861B2 (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
JP5583881B2 (ja) | オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置 | |
WO2010140546A1 (ja) | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 | |
EP1281172A2 (en) | Method and apparatus for compression of speech encoded parameters | |
JP5337235B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 | |
WO2010139257A1 (zh) | 压缩编码和解码的方法、编码器和解码器以及编码装置 | |
KR101100280B1 (ko) | 오디오 양자화 | |
JP4091506B2 (ja) | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 | |
JP4834179B2 (ja) | 符号化方法、その装置、プログラム及び記録媒体 | |
JP4848049B2 (ja) | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
Kohata et al. | A New Segment Quantization Using Lempel–Ziv Algorithm and Its Application to Quantization of Line Spectral Frequencies | |
KR20090100664A (ko) | 휴대용 단말기의 대역 확장 기법을 이용한 부호화 장치 및방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050719 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050719 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4091506 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120307 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130307 Year of fee payment: 5 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |