JP5994073B2 - 音声信号圧縮装置及び音声信号圧縮方法 - Google Patents
音声信号圧縮装置及び音声信号圧縮方法 Download PDFInfo
- Publication number
- JP5994073B2 JP5994073B2 JP2013016764A JP2013016764A JP5994073B2 JP 5994073 B2 JP5994073 B2 JP 5994073B2 JP 2013016764 A JP2013016764 A JP 2013016764A JP 2013016764 A JP2013016764 A JP 2013016764A JP 5994073 B2 JP5994073 B2 JP 5994073B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- error
- feature
- sample
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、この実施の形態に係る音声信号圧縮システム及び音声信号圧縮装置の全体構成を示す機能ブロック図である。音声信号圧縮システム1Aは、音声信号の圧縮を含む符号化に用いられる。ここでいう音声信号は、単音(一人の人間の発話や、一つの楽器の鳴らした音等)であってもよいし、複音(複数の人間の発話や複数の楽器を一度に鳴らした音等)であってもよい。また、音楽であってもよいし機械の動作音や列車の走行音のような音であってもよい。さらに、ここでいう音声信号は、基本的にディジタル信号を指すが、アナログ信号であってもよい。
図2乃至図7に、第一の音声信号圧縮方式の原理を示す。
誤差検出部12が、上記<1−1>に示すような誤差の検出を複数回繰り返して行った場合を考える。
誤差検出部12は、過去に検出した直前2つの誤差の値に基づいて次の標本を生成することができる。
(A)第一の可能性:直前2つの信号S121,S122誤差の延長線上の値である“3(つまり誤差“−2”)”・・・図5の符号(A)
(B)第二の可能性:直前の信号S122の誤差と同じ値である“1(つまり誤差“0”)”・・・図5の符号(B)
そこで、誤差検出部12は、この、符号(A)の信号値と、符号(B)の信号値の平均、即ち、(3+1)÷2=2、を次の標本31(21)の信号値として生成する。ただし、過去の統計情報等により、符号値(A)の信号値と符号(B)の信号値のいずれかの発生可能性が高いことが判っている場合には、誤差検出部12は、符号(A)の信号値と符号(B)の信号値に対し、発生可能性の高さに依存した重み付けを行って、標本31(21)の信号値を生成することもできる。このようにすることで、着目している信号に相関の高い直前の誤差の値に基づいて生成した標本31(21)に基づいて次の予測(信号値S123の予測)を行い、精度の高い予測を行い、符号量を減少させることができる。
図6に示すように、誤差検出部12において複数、例えば“2”,“1”,“0”,“−1”,“−2”の5つ、の誤差の値が検出され、検出回数はそれぞれ2回、4回、20回、3回、1回である場合を考える。この場合、信号値割り当て部13は、エントロピー符号化、例えばハフマン符号化を適用し、検出回数の多いものから順に短い信号値を割り当てる。具体的には、前述の場合、誤差0に信号値“01”、誤差1に信号値“011”、誤差−1に信号値“0111”、誤差2に信号値“01111”、誤差−2に信号値“011111”を付与する。誤差の値、出現回数、それぞれの誤差に付与される信号値は、図6に示す、記憶部19の第二のテーブル192に記録され、信号値割り当て部13は、この第二のテーブル192を参照して符号化や復号を行う。これにより、全体としての音声信号100の符号量を減らすことができる。
例えば、誤差検出部12において複数、例えば“2”,“1”,“0”,“−1”,“−2”の5つ、の誤差の値が検出された場合を考える。この場合、丸め処理部14は、任意の範囲内の数値を任意の数値に置き換える丸め処理を行う。具体的には、丸め処理部14は、図7に示すように、「−1を越えて1未満」の値を全て「0」に、「1以上3未満」の値を全て「2」に、「−3を越えて−1以下」の値を全て「−2」に、それぞれ丸め処理により置き換える。丸め処理の対象となる値の範囲、丸め処理後の値は、図7に示す、記憶部19の第三のテーブル193に記録され、丸め処理部14は、この第三のテーブル193を参照して符号化や復号を行う。これにより、誤差を示す情報の数を減らし、音声信号の符号量を減らすことができる。
図8は、上記<1−1>〜<1−5>を用いた第一の音声信号圧縮方式の具体的手順を示すフローチャートである。以下、同フローチャートに基づいて、音声信号圧縮装置1における、第一の音声信号圧縮の手順を説明する。
図9乃至図11に、第一の音声信号圧縮方式の原理を示す。
図12は、第二の音声信号圧縮の具体的手順を示すフローチャートである。同図に示す通り、フィルタ部15は、ステップS1〜S8の処理のうち一部又は全部などが行われる音声信号100について、符号化前の音声信号100が存在しうる帯域又は領域を確認する(ステップS11)。そして、フィルタ部15は、ステップS1〜S8の処理のうち一部又は全部などにより歪みが生じた音声信号100(符号化された音声信号100でもよいし、復号された後の音声信号100でもよい)に対し、符号化前の音声信号100が存在しうる帯域を基準としたフィルタリング処理や、符号化前の音声信号100が存在しうる領域を基準とした、フィルタリング処理と同等の処理を行う(ステップS12、フィルタリング手順)。
図13及び図14に、第三の音声信号圧縮方式の原理を示す。
M=L+R・・・(1)
S=|L−R|・・・(2)
なお、式(2)は、“S=L−R”であってもよい。
第三の音声信号圧縮方式においては、置換部16が、上記式(1)と式(2)とに基づいて、図13の(a)に示す、LR座標空間130の音声信号100を、図13の(b)に示す「置換座標空間」としてのMS座標空間140の音声信号100に置換する。なお、図13、図14においては、それぞれ、LR座標空間130、及びMS座標空間140において、音声信号100の値が存在する領域を模式的に示している。
図15は、第三の音声信号圧縮方式の手順を示すフローチャートである。同図に示す通り、置換部16は、LR座標空間130に存在する音声信号100の値を、MS座標空間140に存在する音声信号100の値に置換する(ステップS21、置換手順)。音声信号100がMS座標空間140に置換されたのち、分布領域確認部17は、MS座標空間140における音声信号100の分布領域を確認する(ステップS22、分布領域確認手順)。分布領域確認部17の確認により、音声信号100の分散が最小となる方向が確認されたら、座標回転部18は、音声信号100の分散が最小となる方向が第一軸になり、第一軸に直交する方向を第二軸になるように座標を回転させる(ステップS23、座標回転手順)。
図16乃至図19は、本発明の第一乃至第四の実施例における結果を示す図である。これらの図においては、それぞれ、同一の音声や音楽を、本発明に係る第一の音声信号圧縮、本発明に係る第二の音声信号圧縮、従来の音声信号圧縮によって圧縮した場合における、圧縮率と、復号後の音質との相関を示している。これらの図において、「1号(フィルタあり)」と「2号(フィルタあり)」とは、本発明に係る音声圧縮方式(第一の音声信号圧縮+第二の音声信号圧縮)による結果を示す。また、「1号(フィルタなし)」と「2号(フィルタなし)」とは、本発明に係る音声圧縮方式(第一の音声信号圧縮)による結果を示す。なお、「1号」「2号」は、それぞれ、実験において、符号の割り当て方法、閾値の動的変化ルール等を任意条件に固定した場合の一例の実験(任意実験)の結果を示すものである。
11・・・特徴検出部(特徴検出手段)
12・・・誤差検出部(誤差検出手段)
13・・・信号値割り当て部(信号値割り当て手段)
14・・・丸め処理部(丸め処理手段)
15・・・フィルタ部(フィルタ手段)
16・・・置換部(置換手段)
17・・・分布領域確認部(分布領域確認手段)
18・・・座標回転部(座標回転手段)
31,31(1),31(2),・・・,31(n)・・・標本
41,41(1),41(2),・・・,41(m)・・・対比特徴
100・・・音声信号
140・・・MS座標空間(置換座標空間)
Claims (6)
- 音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮装置であって、
前記音声信号の信号成分の特徴を検出する特徴検出手段と、
前記特徴検出手段によって検出された複数の前記特徴の相違を誤差として検出する誤差検出手段とを備え、
該誤差検出手段は、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手段によって検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする音声信号圧縮装置。 - 前記誤差検出手段は、検出された複数の前記誤差の平均値を算出し、該算出された誤差の平均値を前記標本に加えて新たな前記標本を生成することを特徴とする請求項1に記載の音声信号圧縮装置。
- 前記誤差検出手段は、直前二つの前記標本に対する前記誤差の値に基づいて、次の前記標本を算出することを特徴とする請求項1又は2に記載の音声信号圧縮装置。
- 前記誤差検出手段によって検出された前記誤差に対し、出現頻度の高い数値ほど短い信号値を割り当てる信号値割り当て手段を備えたことを特徴とする請求項1乃至3の何れか一つに記載の音声信号圧縮装置。
- 前記誤差検出手段によって検出された前記誤差について、任意の範囲内の数値を任意の数値に置き換える丸め処理を行う丸め処理手段を備えたことを特徴とする請求項1乃至4の何れか一つに記載の音声信号圧縮装置。
- 音声信号の予測符号化において、任意の処理により前記音声信号の符号量を削減する音声信号圧縮方法であって、
前記音声信号の信号成分の特徴を検出する特徴検出手順と、
前記特徴検出手順において検出された複数の前記特徴の相違を誤差として検出する誤差検出手順とを備え、
該誤差検出手順においては、既に検出済の前記特徴に基づいて記録された、前記信号成分の予測情報である前記特徴の標本と、前記特徴検出手順において検出され対比対象として着目する前記特徴としての対比特徴とを対比して、前記標本と前記対比特徴との差分を誤差として検出し、該検出された前記誤差を前記標本に加えて新たな前記標本を生成し、該新たに生成された前記標本を該生成後の前記対比特徴との対比に用いることを特徴とする音声信号圧縮方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013016764A JP5994073B2 (ja) | 2013-01-31 | 2013-01-31 | 音声信号圧縮装置及び音声信号圧縮方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013016764A JP5994073B2 (ja) | 2013-01-31 | 2013-01-31 | 音声信号圧縮装置及び音声信号圧縮方法 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016003540A Division JP2016105188A (ja) | 2016-01-12 | 2016-01-12 | 音声信号圧縮装置及び音声信号圧縮方法 |
JP2016003541A Division JP2016095531A (ja) | 2016-01-12 | 2016-01-12 | 音声信号圧縮装置及び音声信号圧縮方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014149342A JP2014149342A (ja) | 2014-08-21 |
JP5994073B2 true JP5994073B2 (ja) | 2016-09-21 |
Family
ID=51572383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013016764A Active JP5994073B2 (ja) | 2013-01-31 | 2013-01-31 | 音声信号圧縮装置及び音声信号圧縮方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5994073B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6301877B2 (ja) * | 2015-08-03 | 2018-03-28 | 株式会社タムラ製作所 | 音符号化システム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05102860A (ja) * | 1991-10-09 | 1993-04-23 | Olympus Optical Co Ltd | 符号化装置 |
JP3496402B2 (ja) * | 1995-08-01 | 2004-02-09 | ソニー株式会社 | 情報信号符号化装置、符号化方法、並びに情報信号復号方法 |
JP3224127B2 (ja) * | 1996-08-22 | 2001-10-29 | アイチップス・テクノロジー株式会社 | 画像データ変換処理装置 |
AU2003209957A1 (en) * | 2002-04-10 | 2003-10-20 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
JP4184817B2 (ja) * | 2003-02-03 | 2008-11-19 | 大日本印刷株式会社 | 時系列信号の符号化方法および装置 |
DE102004007185B3 (de) * | 2004-02-13 | 2005-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Prädiktives Codierungsschema |
US20100017196A1 (en) * | 2008-07-18 | 2010-01-21 | Qualcomm Incorporated | Method, system, and apparatus for compression or decompression of digital signals |
-
2013
- 2013-01-31 JP JP2013016764A patent/JP5994073B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014149342A (ja) | 2014-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8447597B2 (en) | Audio encoding device, audio decoding device, audio encoding method, and audio decoding method | |
AU2016202800B2 (en) | Signal processing apparatus and method, and program | |
JP6037156B2 (ja) | 符号化装置および方法、並びにプログラム | |
JP6769299B2 (ja) | オーディオ符号化装置およびオーディオ符号化方法 | |
EP3413307B1 (en) | Audio signal coding apparatus, audio signal decoding device, and methods thereof | |
AU2015235133B2 (en) | Audio decoding device, audio encoding device, audio decoding method, audio encoding method, audio decoding program, and audio encoding program | |
JP2009533716A (ja) | オーディオ符号化並びに復号化における励起の処理 | |
KR20160055266A (ko) | 인코딩 방법 및 장치 | |
JP2008033269A (ja) | デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置 | |
JP6162254B2 (ja) | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 | |
JP5994073B2 (ja) | 音声信号圧縮装置及び音声信号圧縮方法 | |
JP2016095531A (ja) | 音声信号圧縮装置及び音声信号圧縮方法 | |
JP2016105188A (ja) | 音声信号圧縮装置及び音声信号圧縮方法 | |
JP7316093B2 (ja) | 音声雑音除去装置及びプログラム | |
EP3248190B1 (en) | Method of encoding, method of decoding, encoder, and decoder of an audio signal | |
KR101786863B1 (ko) | 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계 | |
JP5491193B2 (ja) | 音声コード化の方法および装置 | |
JP3886851B2 (ja) | オーディオ信号符号化装置 | |
EP2355094B1 (en) | Sub-band processing complexity reduction | |
JP6552986B2 (ja) | 音声符号化装置、方法及びプログラム | |
JP5569476B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JPH11177435A (ja) | 量子化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5994073 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |