JP4547965B2 - 音声符号化装置、方法及びプログラム - Google Patents
音声符号化装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4547965B2 JP4547965B2 JP2004110107A JP2004110107A JP4547965B2 JP 4547965 B2 JP4547965 B2 JP 4547965B2 JP 2004110107 A JP2004110107 A JP 2004110107A JP 2004110107 A JP2004110107 A JP 2004110107A JP 4547965 B2 JP4547965 B2 JP 4547965B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- encoding
- signal sequence
- unit
- independent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
予めサンプリングされている音声信号列を符号化する音声符号化装置であって、
音声信号列を所定のサンプル数からなる音声フレームに分割する分割手段と、
前記分割手段により分割された音声フレームを、連続する2つの独立フレームが周期的に現れるように、予測フレームと独立フレームとに区分する順序制御手段と、
独立フレームを構成する信号列を所定の方式で符号化して出力する第1の符号化手段と、
前後して現れる連続する2つの独立フレームに対応して、当該2つの独立フレームを構成する信号列を記憶する2つの倍長フレーム記憶手段と、
予測フレームを構成する信号列と最も類似する信号列部分を前記2つの倍長フレーム記憶手段に記憶された信号列から検索する検索手段と、
予測フレームを構成する信号列と前記検索手段で検索された最も類似する信号列部分との差分を計算する差分計算手段と、
前記差分計算手段で計算された前記差分と前記最も類似する信号列部分が含まれる独立フレームを示す情報と前記最も類似する信号列部分が存在する位置を示す情報とを所定の方式で符号化して出力する第2の符号化手段と、を具備することを特徴とする。
ある波形が繰り返されている状態である、定常状態にある信号列を、音声フレームを構成する信号列が含んでいるか否かを判別する定常状態判別手段と、
音声フレームを構成する信号列を所定の方式で符号化する第3の符号化手段と、
を具備し、
前記定常状態判別手段で、音声フレームを構成する信号列が定常状態にある信号列を含んでいると判別した場合は、前記順序制御手段の区分に従って、該部分信号列を前記第1の符号化手段あるいは前記第2の符号化手段で符号化し、
前記定常状態判別手段で、音声フレームを構成する信号列が定常状態にある信号列を含んでいないと判別した場合は、当該信号列を前記第3の符号化手段で符号化するようにしても良い。
図1は、本発明の実施形態にかかる音声処理装置の構成を示すブロック図である。
分割部200は、音声波形データを所定のサンプル数毎に分割して音声フレームとする。そして、音声フレームを符号化処理部210に送信する。なお、音声フレームのサンプル数は特に限定されるものではないが、音声の周期性を利用するため、音声フレーム内にアナログ音声の1周期分のサンプル値を含む程度の長さが必要である。例えば、人間の音声を圧縮・伸張の対象とした場合は、50分の1秒に相当するサンプル数(160個)とする。
(数4)
yi=xi−si
(i=0,1,・・・,N−1)
(数5)
xi=si+yi
(i=0,1,・・・,N−1)
母音のような定常信号では、類似した波形が繰り返される。このため、予測が働きやすく、予測信号の波形と現実の信号波形との差分が小さくなり、圧縮率の向上に寄与する。しかし、子音は雑音信号に近いため、信号波形の予測を行うことは必ずしも圧縮率の向上に寄与しない。従って、実施形態2では、音声フレームが母音を含むか否か(すなわち定常信号を含むか否か)を判別し、母音を含む場合には予測差分信号を求めて符号化を行い、母音を含まない場合には予測差分信号を求めないで符号化を行う音声符号化処理について説明する。
上記実施形態1及び実施形態2において、音声フレーム毎に予測信号の振幅を調整することで、予測差分信号の波形をより小さくすることができる。ここで、振幅の調整とは、予測信号の各サンプル値に係数(ゲイン)Gを乗じることで、予測信号の波形を予測フレームの音声信号の波形に、より類似させようとすることをいう。
(数8)
yi=xi−G×si
(数9)
xi=yi+G×si
Claims (4)
- 予めサンプリングされている音声信号列を符号化する音声符号化装置であって、
音声信号列を所定のサンプル数からなる音声フレームに分割する分割手段と、
前記分割手段により分割された音声フレームを、連続する2つの独立フレームが周期的に現れるように、予測フレームと独立フレームとに区分する順序制御手段と、
独立フレームを構成する信号列を所定の方式で符号化して出力する第1の符号化手段と、
前後して現れる連続する2つの独立フレームに対応して、当該2つの独立フレームを構成する信号列を記憶する2つの倍長フレーム記憶手段と、
予測フレームを構成する信号列と最も類似する信号列部分を前記2つの倍長フレーム記憶手段に記憶された信号列から検索する検索手段と、
予測フレームを構成する信号列と前記検索手段で検索された最も類似する信号列部分との差分を計算する差分計算手段と、
前記差分計算手段で計算された前記差分と前記最も類似する信号列部分が含まれる独立フレームを示す情報と前記最も類似する信号列部分が存在する位置を示す情報とを所定の方式で符号化して出力する第2の符号化手段と、
を具備することを特徴とする音声符号化装置。 - ある波形が繰り返されている状態である、定常状態にある信号列を、音声フレームを構成する信号列が含んでいるか否かを判別する定常状態判別手段と、
音声フレームを構成する信号列を所定の方式で符号化する第3の符号化手段と、
を具備し、
前記定常状態判別手段で、音声フレームを構成する信号列が定常状態にある信号列を含んでいると判別した場合は、前記順序制御手段の区分に従って、該部分信号列を前記第1の符号化手段あるいは前記第2の符号化手段で符号化し、
前記定常状態判別手段で、音声フレームを構成する信号列が定常状態にある信号列を含んでいないと判別した場合は、当該信号列を前記第3の符号化手段で符号化すること、
を特徴とする請求項1記載の音声符号化装置。 - 予めサンプリングされている音声信号列を所定のサンプル数からなる音声フレームに分割する分割ステップと、
前記分割ステップにより分割された音声フレームを、連続する2つの独立フレームが周期的に現れるように、予測フレームと独立フレームとに区分する順序制御ステップと、
独立フレームを構成する信号列を所定の方式で符号化して出力する第1の符号化ステップと、
前後して現れる連続する2つの独立フレームに対応して、当該2つの独立フレームを構成する信号列をそれぞれメモリに記憶する倍長フレーム記憶ステップと、
予測フレームを構成する信号列と最も類似する信号列部分を前記メモリに記憶された2つの独立フレームを構成するそれぞれの信号列から検索する検索ステップと、
予測フレームを構成する信号列と前記検索ステップで検索された最も類似する信号列部分との差分を計算する差分計算ステップと、
前記差分計算ステップで計算された前記差分と前記最も類似する信号列部分が含まれる独立フレームを示す情報と前記最も類似する信号列部分が存在する位置を示す情報とを所定の方式で符号化して出力する第2の符号化ステップと、
を具備することを特徴とする音声符号化方法。 - コンピュータ装置を
予めサンプリングされている音声信号列を所定のサンプル数からなる音声フレームに分割する分割手段と、
前記分割手段により分割された音声フレームを、連続する2つの独立フレームが周期的に現れるように、予測フレームと独立フレームとに区分する順序制御手段と、
独立フレームを構成する信号列を所定の方式で符号化して出力する第1の符号化手段と、
前後して現れる連続する2つの独立フレームに対応して、当該2つの独立フレームを構成する信号列を記憶する2つの倍長フレーム記憶手段と、
予測フレームを構成する信号列と最も類似する信号列部分を前記2つの倍長フレーム記憶手段に記憶された信号列から検索する検索手段と、
予測フレームを構成する信号列と前記検索手段で検索された最も類似する信号列部分との差分を計算する差分計算手段と、
前記差分計算手段で計算された前記差分と前記最も類似する信号列部分が含まれる独立フレームを示す情報と前記最も類似する信号列部分が存在する位置を示す情報とを所定の方式で符号化して出力する第2の符号化手段と、
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004110107A JP4547965B2 (ja) | 2004-04-02 | 2004-04-02 | 音声符号化装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004110107A JP4547965B2 (ja) | 2004-04-02 | 2004-04-02 | 音声符号化装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005292640A JP2005292640A (ja) | 2005-10-20 |
JP4547965B2 true JP4547965B2 (ja) | 2010-09-22 |
Family
ID=35325602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004110107A Expired - Fee Related JP4547965B2 (ja) | 2004-04-02 | 2004-04-02 | 音声符号化装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4547965B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009253744A (ja) * | 2008-04-08 | 2009-10-29 | Mitsubishi Electric Corp | 符号化装置、復号装置及び映像音声伝送システム |
CN116665683A (zh) * | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002094384A (ja) * | 2000-09-13 | 2002-03-29 | Nec Corp | 長時間用画像・音声圧縮装置及びその方法 |
JP2002182697A (ja) * | 1994-04-29 | 2002-06-26 | Audiocodes Ltd | ピッチポストフィルタ |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110455A (ja) * | 1992-09-25 | 1994-04-22 | Mitsubishi Electric Corp | オーディオ信号の符号化/復号化方法およびこの方法を用いたオーディオ再生装置 |
JP3088204B2 (ja) * | 1992-10-16 | 2000-09-18 | 沖電気工業株式会社 | コード励振線形予測符号化装置及び復号化装置 |
JP3537008B2 (ja) * | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
JP3166572B2 (ja) * | 1995-07-21 | 2001-05-14 | 日本電気株式会社 | 動画像音声圧縮装置 |
JP3618217B2 (ja) * | 1998-02-26 | 2005-02-09 | パイオニア株式会社 | 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 |
-
2004
- 2004-04-02 JP JP2004110107A patent/JP4547965B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002182697A (ja) * | 1994-04-29 | 2002-06-26 | Audiocodes Ltd | ピッチポストフィルタ |
JP2002094384A (ja) * | 2000-09-13 | 2002-03-29 | Nec Corp | 長時間用画像・音声圧縮装置及びその方法 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005292640A (ja) | 2005-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2335242B1 (en) | Audio decoder, method for decoding an audio signal and computer program | |
KR101437127B1 (ko) | 가중 윈도우들을 사용한 저-지연 변환 코딩 | |
KR101689766B1 (ko) | 음성 복호 장치, 음성 복호 방법, 음성 부호화 장치, 및 음성 부호화 방법 | |
JPH0353300A (ja) | 音声符号化装置 | |
JP2707564B2 (ja) | 音声符号化方式 | |
WO2008072736A1 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
US6611797B1 (en) | Speech coding/decoding method and apparatus | |
JP4108317B2 (ja) | 符号変換方法及び装置とプログラム並びに記憶媒体 | |
JP4547965B2 (ja) | 音声符号化装置、方法及びプログラム | |
KR100416363B1 (ko) | 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더 | |
JPH03257500A (ja) | 音声のスペクトル包絡パラメータ符号化装置 | |
EP1522063B1 (en) | Sinusoidal audio coding | |
JP2006211243A (ja) | ディジタル信号符号化装置,ディジタル信号符号化方法 | |
JP2002091497A (ja) | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 | |
JPH09230898A (ja) | 音響信号変換符号化方法及び復号化方法 | |
JP3308783B2 (ja) | 音声復号化装置 | |
US7092878B1 (en) | Speech synthesis using multi-mode coding with a speech segment dictionary | |
RU2792658C1 (ru) | Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
JP2508002B2 (ja) | 音声符号化方法とその装置 | |
JP2004260252A (ja) | 時系列信号の符号化装置および復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061016 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090617 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100615 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4547965 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130716 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |