JP2007179071A - 音声符号化装置及び音声符号化方法 - Google Patents
音声符号化装置及び音声符号化方法 Download PDFInfo
- Publication number
- JP2007179071A JP2007179071A JP2007044048A JP2007044048A JP2007179071A JP 2007179071 A JP2007179071 A JP 2007179071A JP 2007044048 A JP2007044048 A JP 2007044048A JP 2007044048 A JP2007044048 A JP 2007044048A JP 2007179071 A JP2007179071 A JP 2007179071A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- adaptive
- sound
- excitation
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】周期予備選択手段23は、適応音源の繰り返し周期に複数の定数を乗じて複数の駆動音源の繰り返し周期候補を求め、所定個の駆動音源の繰り返し周期候補を選択する。駆動音源符号化手段27は、所定個の駆動音源の繰り返し周期候補毎に、符号化歪を最も小さくする音源位置と極性及びその時の符号化歪みの評価値を出力する。周期符号化手段28は、各繰り返し周期ごとの符号化歪みの評価値を比較し、その比較結果に基づき駆動音源の繰り返し周期候補を選択して、選択情報と音源位置符号と極性を出力する。
【選択図】図1
Description
図14及び図15において、1は入力音声、2は線形予測分析手段、3は線形予測係数符号化手段、4は適応音源符号化手段、5は駆動音源符号化手段、6はゲイン符号化手段、7は多重化手段、8は音声符号、9は分離手段、10は線形予測係数復号化手段、11は適応音源復号化手段、12は駆動音源復号化手段、13はゲイン復号化手段、14は合成フィルタ、15は出力音声である。
この従来の音声符号化装置及び音声復号化装置では、5〜50ms程度を1フレームとして、フレーム単位で処理を行う。まず、図14に示す音声符号化装置において、入力音声1が線形予測分析手段2と適応音源符号化手段4とゲイン符号化手段6に入力される。線形予測分析手段2は、入力音声1を分析し、音声のスペクトル包絡情報である線形予測係数を抽出する。線形予測係数符号化手段3は、この線形予測係数を符号化し、その符号を多重化手段7に出力すると共に、音源の符号化のために量子化された線形予測係数を出力する。
よる合成音を差し引いた信号である符号化対象信号との距離を調べ、この距離を最小とする駆動音源符号を選択して多重化手段7に出力すると共に、選択された駆動音源符号に対応する時系列ベクトルを駆動音源として、ゲイン符号化手段6に出力する。
非特許文献1には、演算量とメモリ量の削減を主な目的として、駆動音源の符号化にパルス音源を導入したCELP系音声符号化装置及び音声復号化装置が開示されている。この従来の構成では、駆動音源を数本のパルスの各位置情報と極性情報のみで表現している。このような音源は代数的音源と呼ばれ、構造が簡単な割に符号化特性が良く、最近の多くの標準方式に採用されている。
まず、距離の最小化は次の(1)式で示される評価値Dを最大化することと等価であり、この評価値Dの計算をパルス位置の全組合せに対して実行することで探索が実行できる。
D=C2 /E (1)
但し、
mk はk番目のパルスのパルス位置、
g(k)はk番目のパルスのパルス振幅、
d(x)はパルス位置xにインパルスを立てた時のインパルス応答と符号化対象信号の相関値、
φ(x,y)はパルス位置xにインパルスを立てた時のインパルス応答とパルス位置yにインパルスを立てた時のインパルス応答との相関値
である。
d’(mk )=|d(mk )| (6)
φ’(mk ,mi )
=sign[d(mk )]sign[d(mi )]φ(mk ,mi ) (7)
となり、パルス位置の全組合せに対する評価値Dの計算を始める前に、d’とφ’の計算を行っておけば、後は(4)式と(5)式の単純加算という少ない演算量で評価値Dが算出できる。
まず、図14に示す音声符号化装置内の線形予測係数符号化手段3から、量子化された線形予測係数が聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に入力され、適応音源符号化手段4から、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号である符号化対象信号が聴覚重み付けフィルタ17に入力され、適応音源符号化手段4から、適応音源符号を変換して得られる適応音源の繰り返し周期が基礎応答生成手段18に入力される。
実施の形態1.
図1はこの発明の実施の形態1による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は図14と同様である。図において、23は周期予備選択手段、27は駆動音源符号化手段、28は周期符号化手段であり、周期予備選択手段23は、定数テーブル24,比較手段25,予備選択手段26により構成されている。
まず、音声符号化装置の動作について図1を用いて説明する。図14に示す適応音源符号化手段4から、適応音源符号を変換して得られた適応音源の繰り返し周期が周期予備選択手段23に入力される。また、適応音源符号化手段4からの符号化対象信号と、線形予測係数符号化手段3からの量子化された線形予測係数とが、駆動音源符号化手段27に入力される。
図5はこの発明の実施の形態2による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は、実施の形態1,すなわち図14と同様である。図5において、31は周期予備選択手段、33は適応音源符号化手段4内に格納されている適応音源符号帳であり、周期予備選択手段31は、定数テーブル32、適応音源生成手段34、距離計算手段35、予備選択手段36によって構成されている。
まず、音声符号化装置の動作について図5を用いて説明する。実施の形態1と同様に、適応音源符号化手段4が出力した適応音源の繰り返し周期が周期予備選択手段31に入力され、適応音源符号化手段4からの符号化対象信号、及び線形予測係数符号化手段3からの量子化された線形予測係数が駆動音源符号化手段27に入力される。
図10はこの発明の実施の形態3による音声符号化装置における駆動音源符号化手段5と新たに追加した聴覚重み付け制御手段37の構成を示すブロック図である。音声符号化装置の全体構成は、図14において、聴覚重み付け制御手段37が駆動音源符号化手段5に付随して追加されたものとなる。聴覚重み付け制御手段37は、比較手段38,強度制御手段39によって構成される。駆動音源符号化手段5内の構成は、図17で説明した従来のものと同様であり、唯一、聴覚重み付けフィルタ係数算出手段16が聴覚重み付け制御手段37により制御されている点のみが変更されている。
まず、音声符号化装置内の図14に示す線形予測係数符号化手段3から、駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に、量子化された線形予測係数が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18と聴覚重み付け制御手段37内の比較手段38に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。さらに、適応音源符号化手段4から、駆動音源符号化手段5内の聴覚重み付けフィルタ17に、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号が、符号化対象信号として入力される。
図11はこの発明の実施の形態4による音声符号化装置における駆動音源符号化手段5と新たに追加した聴覚重み付け制御手段40の構成を示すブロック図である。音声符号化装置の全体構成は、図14において、聴覚重み付け制御手段40が駆動音源符号化手段5に付随して追加されたものとなる。聴覚重み付け制御手段40は、比較手段38,強度制御手段39,平均値更新手段41によって構成される。駆動音源符号化手段5内の構成は、図17で説明した従来のものと同様であり、唯一、聴覚重み付けフィルタ係数算出手段16が聴覚重み付け制御手段40によって制御されている点のみが変更されている。
この実施の形態4は、上期実施の形態3の聴覚重み付け制御手段37内に平均値更新手段41を追加した構成となっているので、この新しい部分の動作を中心に説明する。適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18と聴覚重み付け制御手段40内の平均値更新手段41に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。
図12はこの発明の実施の形態5による音声符号化装置における駆動音源符号化手段5及び音声復号化装置における駆動音源復号化手段12で使用する音源位置テーブル22を示す図である。図16に示した従来の音源位置テーブルに対して、音源番号毎に固定振幅が追加されたものとなっている。
φ”(mk ,mi )=ak ai φ’(mk ,mi ) (11)
とする。ここで、ak はk番目のパルスの振幅(図12の振幅)である。パルス位置の全組合せに対する評価値Dの計算を始める前に、d”とφ”の計算を行っておくことにより、後は(8)式と(9)式の単純加算という少ない演算量で評価値Dが算出できる。
図13はこの発明の実施の形態5による音声符号化装置における駆動音源符号化手段5の構成を示すブロック図である。音声符号化装置の全体構成は図14と同様である。図13において、42はプリテーブル補正手段である。この実施の形態では、このプリテーブル補正手段42のみの追加によって、聴覚重み付けされた符号化対象信号を適応音源に対して直交化する。
まず、音声符号化装置内の線形予測係数符号化手段3から、駆動音源符号化手段5内の聴覚重み付けフィルタ係数算出手段16と基礎応答生成手段18に、量子化された線形予測係数が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の基礎応答生成手段18に、適応音源符号を変換して得られる適応音源の繰り返し周期が入力される。また、適応音源符号化手段4から、駆動音源符号化手段5内の聴覚重み付けフィルタ17に、入力音声1又は入力音声1から適応音源による合成音を差し引いた信号が符号化対象信号として入力される。そして、適応音源符号化手段4から、駆動音源符号化手段5内のプリテーブル補正手段42に、適応音源が入力される。
ctgt は聴覚重み付けされた符号化対象信号と聴覚重み付けされた適応音源応答(合成音)の相関値、すなわち、聴覚重み付けされた符号化対象信号と聴覚重み付けされた適応音源に基づく合成音との間の相関値であり、
cx は聴覚重み付けされた基礎応答を音源位置xに配置した信号と聴覚重み付けされた適応音源応答(合成音)の相関値、すなわち、全ての音源位置候補に対応する仮駆動音源に基づく合成音と適応音源に基づく合成音との間の相関値であり、
pacb は聴覚重み付けされた適応音源応答(合成音)のパワーである。
Claims (2)
- 過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力する音声符号化装置において、
1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するプリテーブル算出手段と、
上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するプリテーブル補正手段と、
上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索手段とを
備えたことを特徴とする音声符号化装置。 - 過去の音源より生成した適応音源と、入力音声と上記適応音源により生成され、複数の音源位置と極性で表現した駆動音源とを用いて、上記入力音声をフレーム単位に符号化して音声符号を出力する音声符号化方法において、
1つの音源位置に所定の音源を配置した信号を仮駆動音源とし、上記入力音声等の符号化対象信号と全ての音源位置候補に対応する上記仮駆動音源に基づく合成音との間の相関値を計算すると共に、全ての候補の組み合わせに対応した上記仮駆動音源に基づく合成音間の相互相関値を計算してプリテーブルとして記憶するステップと、
上記符号化対象信号と上記適応音源に基づく合成音との間の相関値を計算すると共に、上記全ての音源位置候補に対応する仮駆動音源に基づく合成音と上記適応音源に基づく合成音との間の相関値を計算して、計算したこれらの相関値を用いて上記プリテーブルを補正するステップと、
上記補正されたプリテーブルを用いて複数の音源位置と極性を決定して、音源位置を表す音声位置符号と極性を出力する探索ステップとを
備えたことを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007044048A JP4660496B2 (ja) | 2007-02-23 | 2007-02-23 | 音声符号化装置及び音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007044048A JP4660496B2 (ja) | 2007-02-23 | 2007-02-23 | 音声符号化装置及び音声符号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004203597A Division JP3954050B2 (ja) | 2004-07-09 | 2004-07-09 | 音声符号化装置及び音声符号化方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009018494A Division JP4907677B2 (ja) | 2009-01-29 | 2009-01-29 | 音声符号化装置及び音声符号化方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007179071A true JP2007179071A (ja) | 2007-07-12 |
JP2007179071A5 JP2007179071A5 (ja) | 2009-02-12 |
JP4660496B2 JP4660496B2 (ja) | 2011-03-30 |
Family
ID=38304242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007044048A Expired - Lifetime JP4660496B2 (ja) | 2007-02-23 | 2007-02-23 | 音声符号化装置及び音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4660496B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH028900A (ja) * | 1988-06-28 | 1990-01-12 | Nec Corp | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 |
JPH02310600A (ja) * | 1989-05-26 | 1990-12-26 | Nec Corp | マルチパルス音声符号化方法 |
JPH1069297A (ja) * | 1996-08-26 | 1998-03-10 | Nec Corp | 音声符号化装置 |
JPH1097294A (ja) * | 1996-02-21 | 1998-04-14 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH10232696A (ja) * | 1997-02-19 | 1998-09-02 | Matsushita Electric Ind Co Ltd | 音源ベクトル生成装置及び音声符号化/復号化装置 |
WO1998040877A1 (fr) * | 1997-03-12 | 1998-09-17 | Mitsubishi Denki Kabushiki Kaisha | Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal |
-
2007
- 2007-02-23 JP JP2007044048A patent/JP4660496B2/ja not_active Expired - Lifetime
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH028900A (ja) * | 1988-06-28 | 1990-01-12 | Nec Corp | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 |
JPH02310600A (ja) * | 1989-05-26 | 1990-12-26 | Nec Corp | マルチパルス音声符号化方法 |
JPH1097294A (ja) * | 1996-02-21 | 1998-04-14 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH1069297A (ja) * | 1996-08-26 | 1998-03-10 | Nec Corp | 音声符号化装置 |
JPH10232696A (ja) * | 1997-02-19 | 1998-09-02 | Matsushita Electric Ind Co Ltd | 音源ベクトル生成装置及び音声符号化/復号化装置 |
WO1998040877A1 (fr) * | 1997-03-12 | 1998-09-17 | Mitsubishi Denki Kabushiki Kaisha | Codeur vocal, decodeur vocal, codeur/decodeur vocal, procede de codage vocal, procede de decodage vocal et procede de codage/decodage vocal |
Also Published As
Publication number | Publication date |
---|---|
JP4660496B2 (ja) | 2011-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE43190E1 (en) | Speech coding apparatus and speech decoding apparatus | |
JP3566220B2 (ja) | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
KR100350340B1 (ko) | 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법 | |
JP3404024B2 (ja) | 音声符号化方法および音声符号化装置 | |
JP2002202799A (ja) | 音声符号変換装置 | |
WO1998006091A1 (fr) | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications | |
JP3426207B2 (ja) | 音声符号化方法および装置 | |
JPH1097294A (ja) | 音声符号化装置 | |
WO2002054386A1 (fr) | Systeme de codage vocal et procede de codage vocal | |
JP2001075600A (ja) | 音声符号化装置および音声復号化装置 | |
JP3954050B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4660496B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4907677B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4087429B2 (ja) | 音声符号化装置及び音声符号化方法 | |
KR100736504B1 (ko) | 확률적 코드북의 음원 부호화 방법 | |
JP3579276B2 (ja) | 音声符号化/復号化方法 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
USRE43209E1 (en) | Speech coding apparatus and speech decoding apparatus | |
JPH06130994A (ja) | 音声符号化方法 | |
JP4373667B2 (ja) | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070704 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070913 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101228 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140107 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4660496 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |