JP6552986B2 - 音声符号化装置、方法及びプログラム - Google Patents
音声符号化装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6552986B2 JP6552986B2 JP2016044737A JP2016044737A JP6552986B2 JP 6552986 B2 JP6552986 B2 JP 6552986B2 JP 2016044737 A JP2016044737 A JP 2016044737A JP 2016044737 A JP2016044737 A JP 2016044737A JP 6552986 B2 JP6552986 B2 JP 6552986B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- quantization
- probability
- sample
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、本実施形態による音声符号化装置の概略的な構成図である。なお、以下で説明する処理は、フレームと呼ばれる所定期間の信号を単位として行われる。ディジタル音声信号である入力信号は、まず、分離部10に入力される。分離部10は、入力信号を第1信号と第2信号に分離し、第1信号をフィルタバンク11に出力し、第2信号を量子化・重畳部13に出力する。ここで、第1信号は、音声信号を三角関数の和で近似した信号であり、以下では周期成分信号とも呼ぶ。一方、第2信号は、音声信号から第1信号を減じた信号であり、雑音成分に近い特性を持つため、以下では雑音成分信号とも呼ぶ。また、入力信号は、決定部12にも入力される。フィルタバンク11は、第1信号を、所定の周波数帯域毎に分割し、各周波数帯域に分割された第1信号を量子化・重畳部13に出力する。決定部12は、人間の聴覚特性に基づき、各周波数帯域の信号の量子化ステップを決定し、決定した量子化ステップを示す量子化ステップ情報を量子化・重畳部13に出力する。量子化・重畳部13での処理については後述するが、最終的に、量子化・重畳部13は、第2信号と、決定部12からの量子化ステップ情報に基づき、各周波数帯域に分割された第1信号の各サンプルの振幅値を生成部14に出力する。量子化・重畳部13は、決定部12が決定した量子化ステップを変更する場合があり、量子化ステップを変更した場合、量子化・重畳部13は、変更後の量子化ステップを示す量子化ステップ情報を生成部14に出力する。なお、量子化ステップを変更しなかった場合、量子化・重畳部13は、決定部12からの量子化ステップ情報をそのまま生成部14に出力する。生成部14は、各周波数帯域のサンプルの振幅と量子化ステップ情報に基づきビットストリームを生成して出力する。ここで、決定部12は、人間の聴覚心理モデルに基づき量子化ステップを決定する。具体的には、人間の聴感上、信号対雑音比(SNR)が低くても良い周波数帯域に対しては量子化ステップを荒くして量子化ビット数を小さくする。
p(80−68)+q(48−68)+r(64−68)=0 (1)
また、量子化誤差のパワーの期待値を雑音成分信号のパワー、つまり、本例では20とすると、以下の式(2)が得られる。
p(80−68)2+q(48−68)2+r(64−68)2=20 (2)
また。上述した様に、増加確率p、減少確率q及び維持確率rには式(3)で示す関係がある。
r=1−p−q (3)
s(80−68)2+r(64−68)2=20 (4)
r=1−s (5)
上記式(4)及び(5)から変更確率sは0.03125となり、維持確率rは0.96875となる。この場合、振幅調整部135は、発生した乱数の値により確率0.03125でサンプルの振幅を量子化ステップで1だけ増加又は減少させることになる。
続いて、本実施形態について、第一実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図1と同様である。図3は、本実施形態による量子化・重畳部13の構成図である。本実施形態と第一実施形態は、確率計算部134において、増加確率p、減少確率q及び維持確率rの内、1つでも0未満の値や、1より大きい値が得られた場合の処理が異なるのみであり、その他の処理は第一実施形態と同様である。
p(72−68)+q(56−68)+r(64−68)=0 (6)
p(72−68)2+q(56−68)2+r(64−68)2=20 (7)
式(3)、式(6)及び式(7)より、量子化ステップを小さくすると、増加確率p=0.53125、減少確率q=0.03125、維持確率r=0.4375が得られる。この場合、確率計算部134は、量子化ステップの変更を変更通知信号で振幅調整部135に通知し、振幅調整部135は、変更後の量子化ステップを示す量子化ステップ情報を生成部14に出力する。
続いて、本実施形態について、第一実施形態及び第二実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図1と同様である。図4は、本実施形態による量子化・重畳部13の構成図である。本実施形態において、確率計算部134には各周波数帯域の量子化後のサンプルの振幅も入力される。そして、確率計算部134は、各周波数帯域について、量子化後のサンプルの振幅の2乗のフレーム内における総和を求め、これを、フレーム内のサンプル数で除することで、当該フレームにおける量子化後の第1信号のパワーを求める。そして求めた第1信号のパワーを、パワー情報が示す当該フレームの雑音成分のパワーと比較する。例えば、求めた第1信号のパワーが、雑音成分信号のパワーより大変小さいと、当該フレームに対応する周波数帯域の信号は、雑音成分信号が支配的であり、周期成分信号については無視しても復号される音声信号の品質はあまり劣化しない。よって、確率計算部134は、例えば、当該フレームにおける量子化後の第1信号のパワーに対する雑音成分信号のパワーの比を求め、この比が閾値以上であると、雑音成分信号のパワーとなるサンプル列と、量子化ステップと、を求めて振幅調整部135に変更通知信号で通知する。このとき、量子化ステップを、決定部12が決定した量子化ステップより大きい値に変更する。振幅調整部135は、変更通知信号により、サンプル列と量子化ステップが通知されると、当該フレームにおいては、量子化部131で量子化されたサンプル列を、確率計算部134から通知されたサンプル列に置換して出力する。また、量子化ステップ情報として、確率計算部134から通知された量子化ステップを出力する。その他の構成は第一実施形態又は第二実施形態と同様である。なお、本実施形態においては、量子化後の第1信号のパワーと雑音成分信号のパワーとを比較したが、量子化前の第1信号のパワーと雑音成分信号のパワーとを比較する構成であっても良い。
MPEGオーディオ・レイヤ3では、量子化後のサンプルについて、可変長符号であるハフマン符号化を更に行う。具体的には、内部ループにおいて量子化ステップを調整しながら量子化を行う。その後、外部ループにおいて、符号化歪みが許容範囲内であるかを判定し、許容範囲内でなければ、再度、内部ループについての処理を行う。
Claims (14)
- 音声信号を符号化する音声符号化装置であって、
前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第1信号を出力する分割手段と、
前記複数の第1信号それぞれの量子化ステップを決定する決定手段と、
前記決定手段が決定した量子化ステップに基づき第1信号の各サンプルを量子化する量子化手段と、
前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定手段と、
前記第1信号の量子化誤差によるパワーが、前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第1信号のサンプルの振幅を調整する調整手段と、
を備えていることを特徴とする音声符号化装置。 - 前記判定手段は、所定期間の前記雑音成分信号について、前記複数の周波数帯域それぞれのパワーを判定し、
前記調整手段は、前記所定期間の前記第1信号の量子化誤差によるパワーが、前記所定期間の前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーである第1の値に近づく様に、量子化後の前記第1信号のサンプルの振幅を調整することを特徴とする請求項1に記載の音声符号化装置。 - 前記調整手段は、前記所定期間の前記第1信号の各サンプルそれぞれについて変更確率sを求め、当該各サンプルの量子化後の振幅を対応する変更確率sで所定値だけ増加又は減少させることで、量子化後の前記第1信号のサンプルの振幅を調整し、
サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率sであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となる様に、当該サンプルに対応する変更確率sは求められ、
前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項2に記載の音声符号化装置。 - 前記調整手段は、前記所定期間の前記第1信号の各サンプルそれぞれについて増加確率p及び減少確率qを求め、当該各サンプルの量子化後の振幅を対応する増加確率pで所定値だけ増加させ、対応する減少確率qで前記所定値だけ減少させることで、量子化後の前記第1信号のサンプルの振幅を調整し、
サンプルの量子化後の振幅を前記所定値だけ増加させる確率が増加確率pであり、かつ、当該サンプルの量子化後の振幅を前記所定値だけ減少させる確率が減少確率qであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となり、かつ、当該サンプルの量子化誤差の期待値が0となる様に、当該サンプルに対応する増加確率p及び減少確率qは求められ、
前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項2に記載の音声符号化装置。 - 前記調整手段は、前記所定期間の前記第1信号のサンプルの増加確率p又は減少確率qが0より小さいか1より大きい場合、当該サンプルについて変更確率sを求め、当該サンプルの量子化後の振幅を求めた変更確率sで前記所定値だけ増加又は減少させることで、当該サンプルの振幅を調整し、
当該サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率sであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となる様に、当該サンプルに対応する前記変更確率sは求められることを特徴とする請求項4に記載の音声符号化装置。 - 前記調整手段は、前記所定期間の前記第1信号の各サンプルに対応する増加確率p及び減少確率qに0より小さいもの、又は、1より大きいものが含まれる場合、前記所定期間の前記第1信号の各サンプルの増加確率p及び減少確率qが0以上、かつ、1以下となるまで前記量子化ステップを小さくすることを特徴とすることを特徴とする請求項4に記載の音声符号化装置。
- 前記所定値は、前記決定手段が決定した量子化ステップの値であることを特徴とする請求項3から6のいずれか1項に記載の音声符号化装置。
- 前記調整手段は、前記所定期間の前記第1信号のパワーに対する、前記第1信号に対応する周波数帯域における前記所定期間の前記雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第1信号の量子化ステップをより大きい値に変更することを特徴とする請求項2から7のいずれか1項に記載の音声符号化装置。
- 前記調整手段は、前記所定期間の前記第1信号のパワーに対する、前記第1信号に対応する周波数帯域における前記所定期間の雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第1信号の量子化ステップをより大きい値に変更し、前記所定期間の量子化後の前記第1信号を、前記第1信号に対応する周波数帯域における前記雑音成分信号のパワーに対応する振幅のサンプル列に置換することを特徴とする請求項2から7のいずれか1項に記載の音声符号化装置。
- 前記調整手段は、量子化後の前記第1信号の少なくとも1つのサンプルの調整後の振幅に対応する符号語の長さが、調整前の振幅に対応する符号語より短くなる様に当該サンプルの振幅を調整することを特徴とする請求項1に記載の音声符号化装置。
- 前記音声信号を前記周期成分信号と前記雑音成分信号に分離する分離手段を更に備えていることを特徴とする請求項1から10のいずれか1項に記載の音声符号化装置。
- 前記周期成分信号及び前記雑音成分信号それぞれを他の装置から受信することを特徴とする請求項1から10のいずれか1項に記載の音声符号化装置。
- 音声符号化装置における音声信号の符号化方法であって
前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第1信号を出力する分割工程と、
前記複数の第1信号それぞれの量子化ステップを決定する決定工程と、
前記決定工程で決定した量子化ステップに基づき第1信号の各サンプルを量子化する量子化工程と、
前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定工程と、
前記第1信号の量子化誤差によるパワーが、前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第1信号のサンプルの振幅を調整する調整工程と、
を含むことを特徴とする符号化方法。 - 請求項1から12のいずれか1項に記載の音声符号化装置としてコンピュータを機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016044737A JP6552986B2 (ja) | 2016-03-08 | 2016-03-08 | 音声符号化装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016044737A JP6552986B2 (ja) | 2016-03-08 | 2016-03-08 | 音声符号化装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017161648A JP2017161648A (ja) | 2017-09-14 |
JP6552986B2 true JP6552986B2 (ja) | 2019-07-31 |
Family
ID=59857904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016044737A Active JP6552986B2 (ja) | 2016-03-08 | 2016-03-08 | 音声符号化装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6552986B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
JP6079230B2 (ja) * | 2012-12-28 | 2017-02-15 | 株式会社Jvcケンウッド | 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム |
-
2016
- 2016-03-08 JP JP2016044737A patent/JP6552986B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017161648A (ja) | 2017-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2718421C1 (ru) | Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования | |
KR101859246B1 (ko) | 허프만 부호화를 실행하기 위한 장치 및 방법 | |
US8237594B2 (en) | Encoding apparatus, decoding apparatus, information processing system, and computer-readable storage medium | |
KR20160120713A (ko) | 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치 | |
JP3255022B2 (ja) | 適応変換符号化方式および適応変換復号方式 | |
US20030093266A1 (en) | Speech coding apparatus, speech decoding apparatus and speech coding/decoding method | |
JPWO2013108343A1 (ja) | 音声復号装置及び音声復号方法 | |
KR101381602B1 (ko) | 계층적 부호화 및 복호화 방법 및 장치 | |
JP6552986B2 (ja) | 音声符号化装置、方法及びプログラム | |
JPS63110830A (ja) | 帯域分割符号化復号化装置 | |
JP4335245B2 (ja) | 量子化装置、逆量子化装置、音声音響符号化装置、音声音響復号装置、量子化方法、および逆量子化方法 | |
JP2016206244A (ja) | 符号化装置、符号化方法、及びプログラム | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
JP3692959B2 (ja) | 電子透かし情報埋め込み装置 | |
JP2004015537A (ja) | オーディオ信号符号化装置 | |
JP6856644B2 (ja) | ビデオ情報を用いたオーディオエンコーディング | |
JP2005004119A (ja) | 音響信号符号化装置及び音響信号復号化装置 | |
AL-Rawi | ADPCM: US Patents from 2010 to 2016 | |
JPS59214346A (ja) | サブバンド符号化方法とその符号化復号器 | |
JPS59211340A (ja) | 2チヤンネル同時符号化方法とその符号復号器 | |
JP2008268792A (ja) | オーディオ信号符号化装置およびそのビットレート変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6552986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |