JP5891502B1 - 音声信号の線形予測装置、音声信号の線形予測方法 - Google Patents
音声信号の線形予測装置、音声信号の線形予測方法 Download PDFInfo
- Publication number
- JP5891502B1 JP5891502B1 JP2014251227A JP2014251227A JP5891502B1 JP 5891502 B1 JP5891502 B1 JP 5891502B1 JP 2014251227 A JP2014251227 A JP 2014251227A JP 2014251227 A JP2014251227 A JP 2014251227A JP 5891502 B1 JP5891502 B1 JP 5891502B1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- weighting
- weighting coefficient
- audio signal
- time series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
Description
図1にこの発明の実施の形態を示す。
予測部4は、重み付けがされた一の系列の過去の複数の時系列信号と重み付けがされた前記他の系列の過去の複数の時系列信号とを用いて予測値を算出する。
fs(n−1)も用いることで、精度の高い予測値を算出する。(なお、図2、図3において、“α”は後述する重み付け係数を示す。)
[重み付け設定部における重み付けの原理]
この実施の形態において、重み付け設定部3は、複数の過去の音声信号に重み付け係数を乗じたものを用いて、図2に示す、音声信号f^0(n)の予測値を求める。ここで、重み付け設定部3は、過去の音声信号の信号値に、重み付け係数によって重み付けを行って音声信号f^0(n)の予測値を求めることで、音声信号f^0(n)の予測値と、実際の音声信号f^0(n)の信号値との誤差としての予測誤差を小さくする。このとき、音声信号f^0(n)の予測値と、実際の音声信号f^0(n)の信号値との予測誤差の値が小さい方が、圧縮時の信号量が小さくなり、圧縮率を高くすることができる。そのため、重み付け設定部3においては、この、予測誤差の値を小さくできるような重み付け係数を算出することが必要となる。
の値を最小化する重み付け係数を算出することが必要となる。
下記式(2)
ATAx+Ab=0・・・(2)
ただし、
A:任意の行及び列からなる行列
AT:Aの転置行列
b:定数ベクトル
から二乗誤差を最小にする値である重み付け係数xを求めることで、上記式(1)の値を最小化する重み付け係数を算出する。これにより、図4に示す、求める音声信号f^0(n)の予測値における、予測値と現実の信号の信号値との予測誤差e(n)を最小にすることが可能になる。
と作るとき、その予測誤差e(n)=f0(n)−f^0(n)の二乗和を最小化する重み付け係数αを求めるには、行列を用いた計算式における行列の個々の要素に、個々の信号値を用いたものの演算を行う。この行列は、行方向及び/又は列方向に沿って、音声信号を時系列に沿って順に配置したものを用いる。具体的には、例えば、下記式(4)
ただし、
α100,α110,α200,α210,・・・,αP00:過去の音声信号f0(0),f1(0),f0(1),f1(1),・・・f0(P),f1(P)に付与される重み付け係数
P:それぞれの系列の過去の音声信号の数(P>0)
を最小化するような重み付け係数α(重み付け係数α100,α110,α200,α210,・・・,αP00)を求めればよい。
ただし、
α100,α110,α200,α210,・・・,αP00:過去の音声信号f0(0),f1(0),f0(1),f1(1),・・・f0(P),f1(P)に付与される重み付け係数
P:それぞれの系列の過去の音声信号の数(P>0)
を、重み付け係数α(重み付け係数α100,α110,α200,α210,・・・,αP00)について解くことによって求められる。
上記式(5)の演算は、任意の複数の系列に適用できる。そしてその際に、式の主要部分を共用することができる。
ただし、
α101,α111,α201,α211,・・・,αP01:過去の音声信号f0(0),f1(0),f0(1),f1(1),・・・f0(P),f1(P)に付与される重み付け係数
P:それぞれの系列の過去の音声信号の数(P>0)
そして、この式(6)を、重み付け係数α(重み付け係数α101,α111,α201,α211,・・・,αP01)について解く。
点が、式(5)との主たる相違である。そして、第3項(第2項の直後の“+”のすぐ右側の、2つのカッコでくくられた部分)は、音声信号f^0(n)の予測値を求める場合も、音声信号f^1(n)の予測値の算出を求める場合も共用されることになる。これにより、式(6)の式の主要な数値は、音声信号f0の系列、及び、音声信号f1の系列において、それぞれ予測値を求める場合に共用できるため、それぞれの系列で式(6)の主要な部分の数値を別個に求める場合に比べ、演算量を少なくできる。
と作る。この場合、予測による二乗誤差和を最小にするには、式(9)
ただし、下記式(10)及び式(11)
を解くことで、係数αを求めればよい。
に示す信号値群は、項群(a)が式(9)のF−1,−1に、項群(b)が式(9)のF−2,−1に、項群(c)が式(9)のF−p,−1に・・・項群(d)が式(9)のF−1,−pの一部に、項群(e)が式(9)のF−2,−pの一部に、項群(f)が式(9)のF−p,−pの一部に、それぞれ対応する。
の逆行列を式(9)の各項に乗することになるが、この式(13)の逆行列を共用することが可能になる。
なお、上記式(9)のような、行列を用いた計算を行うための計算式等としての行列計算式(以下単に「行列計算式」と称する。本明細書において同じ。)を求めるには、「F」が要素となっている上記式(13)の逆行列を求める必要がある。そして、このような逆行列を求めるためには、大量の演算を行わねばならず、線形予測装置1のCPU等の機器に高い負荷を与える。
を考えると、例えば、式(9)のF−2,−1に対応する項群(b)は、式(9)のF−3,−2に対応する項群(式(12)に示さず)は、ほぼ同様の演算内容である。同様に、式(9)に示されない、F−4,−3に対応する項群や、F−5,−4に対応する項群等も、項群(b)とほぼ同様の演算内容となる。
RA=FA,0・・・式(14)
のようなRの行列として定義し直し、さらに、上述したような“F”の行列の性質を用いて
として、ほぼ同様の計算内容の式を全て同一の行列ないし同一の行列要素として扱う。このようにして上述の“F”を要素とする行列計算式を“R”を要素とする行列計算式に置き換えると、式(16)となる。
これは式(17)に置き換えられる。
ただし、Θ0=I(この“I”は単位行列を示す。本明細書において同じ。)である。
そして、式(16)の逆行列は式(18)となる。
これは、式(19)に置き換えられる。
ただしΘ0=Iである。
式(9)に含まれる式(11)の重み付け係数α(重み付け係数α100,α110,α200,α210,・・・,αP00,αP10)を求めるには、式(17)と式(19)を解けばよい。
これをm次の正方行列φm(ただし、φ:行列“R”を個々の要素とする正方行列)に置き換えると、式(21)として表される。
すると、正方行列φの次数が(m+1)次のときの、順方向予測に基づく式としての行列計算式は式(22)として表され、
また、正方行列φの次数が(m+1)次のときの、逆方向予測に基づく式としての行列計算式は式(23)として表される。
なお、式(22)と式(23)における、σ−(m+1)とσ(m+1)とは二乗誤差和であり、Φm+1の該当列と係数との内積の和で求まるものである。
また、逆方向予測に基づく式としての行列計算式は式(25)として表される。
一方、(m)次のときの順方向予測に基づく式としての行列計算式は式(26)として表され、
また、逆方向予測に基づく式としての行列計算式は式(27)として表される。
これを用いて、m+1次の式から“φ”で示された行列すなわち“R”の行列部分を消去し、全ての項にある“−φm+1”を除することで、順方向予測に基づく式の漸化式である式(28)が得られ、
また、逆方向予測に基づく式の漸化式である式(29)が導かれる。
そして、m次の時の予測係数と、式(30)
および式(31)
とによって、(m+1)次の行列のそれぞれの要素を形成している重み付け係数αが得られることは、明らかである。
n:求める重み付け係数αの最大次数、
m:系列の数
として説明する。
上述の漸化式においては、それぞれの系列の最後部の音声信号(例えば、図2における、音声信号f0のうち、予測対象の音声信号f^0(n)から時系列上最も遠い音声信号f0(n−P))に設定する重み付け係数αを算出することができない。そこで、この、音声信号f0(n−P)に設定する重み付け係数を、以下のように別途算出する。
ただし、○:零行列(本明細書において同じ。)
次に、逆方向の行列計算式は、上記式(24)の左辺を用いて、式(33)のように式を立てる。
ここからただちに、順方向の行列計算式として、式(34)及び式(35)が得られる。
さらに、逆方向の行列計算式として、式(36)及び式(37)が得られる。
が得られる。
さらに、逆方向の行列計算式として、下記式(40)及び式(41)が得られる。
これは、上記式(34)及び式(36)を用いてΣを消去した式である。
これは、上記式(35)及び式(37)を用いてΣを消去した式である。
これらの漸化式、すなわち式(38)〜式(41)を用いて、図2に示す音声信号f0(n−P)に設定する重み付け係数を算出することができる。なお、同様の漸化式を用いて、予測対象の音声信号f^0(n)に時系列上最も近い、図2に示す音声信号f0(n−1))に設定する重み付け係数を算出することもできる。
次に、この実施の形態の圧縮・解凍装置1A及び線形予測装置1における処理手順について説明する。
RA=FA,0・・・(式14)
と定義し、さらに、上述したような“F”の行列の性質を用いて
としてほぼ同様の計算内容の式を全て同一の行列ないし同一の行列要素として扱うような所定の条件により、近似した値の要素同士を同一の要素に変換することにより、逆行列計算が必要になる場合、本来の逆行列計算を行う際よりも少ない計算量で演算を行うことができる。これにより、逆行列計算の増大による演算量や処理負荷の増大や演算時間の長大化を確実に抑止できる。
3・・・重み付け設定部(重み付け設定手段)
4・・・予測部(予測手段)
f^0(n),f0(n−P),・・・,f0(n−1),f1(n−P),・・・,f1(n−1),f2(n−p),・・・, f2(n−1),fS(n−P),・・・,fS(n−1),f0(0),f1(0),f0(1),f1(1),・・・f0(P),f1(P)・・・音声信号
α,α1,α2,α100,α101,α110,α111,α200,α201,α210,α211,・・・,αP00,αP01,x・・・重み付け係数
Claims (5)
- 複数の時系列信号によって形成される音声信号の予測符号化に用いられる音声信号の線形予測装置であって、
前記音声信号を構成するそれぞれの前記時系列信号の信号値の予測誤差を算出するための重み付け係数を算出し、該算出された重み付け係数を時系列信号のそれぞれに付与して重み付けを行う重み付け設定手段と、
前記重み付け係数によって重み付けを行った、過去の前記時系列信号を用いて前記時系列信号の予測値を算出する予測手段とを備え、
前記重み付け設定手段は、
特定の前記時系列を形成する複数の前記音声信号について、
時系列上の特定の前記音声信号を算出するための前記重み付け係数を、前記特定の音声信号よりも時間軸上の前方向又は後方向に存在する他の前記音声信号を参照して算出することを繰り返して、それぞれの前記音声信号を算出するためのそれぞれの前記重み付け係数を設定する第一の重み付け係数設定手段と、
前記時間軸上の、前記第一の重み付け係数設定手段において参照する前記他の音声信号が存在しない位置に存在する前記音声信号を前記特定の音声信号として設定した際に、前記時系列上の、前記第一の重み付け係数設定手段が参照する方向とは逆の方向に存在する前記他の音声信号を参照して、前記特定の音声信号を算出するための前記重み付け係数を設定する第二の重み付け係数設定手段とを備え、
前記予測手段は、前記第一の重み付け係数設定手段と前記第二の重み付け係数設定手段とによって設定された前記重み付け係数によって前記重み付けがされた過去の複数の前記時系列信号を用いて前記予測値を算出することで、前記音声信号の信号値の予測値を算出することを特徴とする音声信号の線形予測装置。 - 前記重み付け設定手段は、複数の前記時系列の前記時系列信号の前記重み付け係数を設定する際において行列を用いた計算を行うための行列計算式を用い、かつ、該行列計算式を構成する行列の少なくとも一部を所定の演算によって得られる漸化式に置換して演算することで前記重み付け係数を設定することを特徴とする請求項1に記載の音声信号の線形予測装置。
- 前記行列は、個々の要素が複数の前記信号値に基づいて形成されたものであって、所定の条件により、近似した値の前記要素同士を同一の前記要素に変換したものであることを特徴とする請求項2に記載の音声信号の線形予測装置。
- 前記重み付け設定手段は、順方向予測に基づく式と逆方向予測に基づく式としてそれぞれ形成し、前記順方向予測に基づく式と前記逆方向予測に基づく式とを用いて前記重み付け係数を設定することを特徴とする請求項1乃至3の何れか一つに記載の音声信号の線形予測装置。
- 複数の時系列信号によって形成される音声信号の予測符号化に用いられる音声信号の線形予測方法であって、
前記音声信号を構成するそれぞれの前記時系列信号の信号値の予測誤差を算出するための重み付け係数を算出し、該算出された重み付け係数を時系列信号のそれぞれに付与して重み付けを行う重み付け設定手順と、
前記重み付け係数によって重み付けを行った、過去の前記時系列信号を用いて前記時系列信号の予測値を算出する予測手順とを備え、
前記重み付け設定手順においては、
特定の前記時系列を形成する複数の前記音声信号について、
時系列上の特定の前記音声信号を算出するための前記重み付け係数を、前記特定の音声信号よりも時間軸上の前方向又は後方向に存在する他の前記音声信号を参照して算出することを繰り返して、それぞれの前記音声信号を算出するためのそれぞれの前記重み付け係数が設定される第一の重み付け係数設定手順と、
前記時間軸上の、前記第一の重み付け係数設定手順において参照する前記他の音声信号が存在しない位置に存在する前記音声信号を前記特定の音声信号として設定した際に、前記時系列上の、前記第一の重み付け係数設定手順において参照される方向とは逆の方向に存在する前記他の音声信号が参照されて、前記特定の音声信号を算出するための前記重み付け係数が設定される第二の重み付け係数設定手順とを備え、
前記予測手順においては、前記第一の重み付け係数設定手順と前記第二の重み付け係数設定手順とにおいて設定された前記重み付け係数によって前記重み付けがされた過去の複数の前記時系列信号を用いて前記予測値が算出されることで、前記音声信号の信号値の予測値が算出されることを特徴とする音声信号の線形予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014251227A JP5891502B1 (ja) | 2014-12-11 | 2014-12-11 | 音声信号の線形予測装置、音声信号の線形予測方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014251227A JP5891502B1 (ja) | 2014-12-11 | 2014-12-11 | 音声信号の線形予測装置、音声信号の線形予測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5891502B1 true JP5891502B1 (ja) | 2016-03-23 |
JP2016114665A JP2016114665A (ja) | 2016-06-23 |
Family
ID=55541173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014251227A Active JP5891502B1 (ja) | 2014-12-11 | 2014-12-11 | 音声信号の線形予測装置、音声信号の線形予測方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5891502B1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025497A (ja) * | 2007-07-18 | 2009-02-05 | Nippon Telegr & Teleph Corp <Ntt> | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 |
-
2014
- 2014-12-11 JP JP2014251227A patent/JP5891502B1/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009025497A (ja) * | 2007-07-18 | 2009-02-05 | Nippon Telegr & Teleph Corp <Ntt> | マルチチャネル線形予測符号化の予測係数決定方法及び装置、プログラム、記録媒体 |
Non-Patent Citations (1)
Title |
---|
JPN7015001618; Benesty, Sondhi, Huang (Eds.): Springer Handbook of Speech Processing , 2008, pp. 111-124, Springer-Verlag Berlin Heidelberg * |
Also Published As
Publication number | Publication date |
---|---|
JP2016114665A (ja) | 2016-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7353427B2 (ja) | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 | |
KR102232486B1 (ko) | 고차 앰비소닉스 표현을 압축 및 압축해제하기 위한 방법 및 장치 | |
JP4374448B2 (ja) | 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体 | |
US9805729B2 (en) | Encoding device and method, decoding device and method, and program | |
SE521129C2 (sv) | Sätt och anordning för audiokodning | |
KR100714980B1 (ko) | 가상음원위치정보를 이용한 멀티채널 오디오 신호의 압축및 복원 방법 | |
KR101850529B1 (ko) | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 | |
CN107895580B (zh) | 一种音频信号的重建方法和装置 | |
JP5891502B1 (ja) | 音声信号の線形予測装置、音声信号の線形予測方法 | |
JP5891501B1 (ja) | 音声信号の線形予測装置、音声信号の線形予測方法 | |
JP5891500B1 (ja) | 音声信号の線形予測装置、音声信号の線形予測方法 | |
KR20160097367A (ko) | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 | |
JP5866575B1 (ja) | 音声信号の線形予測装置、音声信号の線形予測方法 | |
JP4699117B2 (ja) | 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。 | |
JP4714075B2 (ja) | 多チャネル信号符号化方法、その方法を用いた装置、プログラム、および記録媒体 | |
JP2005115267A (ja) | 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体 | |
JP7380833B2 (ja) | 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体 | |
JP5345024B2 (ja) | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム | |
JPH0784600A (ja) | ベクトル量子化装置 | |
JP5574498B2 (ja) | 符号化装置、復号装置、およびこれらの方法 | |
JP4348322B2 (ja) | 多チャネル信号符号化方法、多チャネル信号復号化方法、それらの方法を用いた装置、プログラム、および記録媒体 | |
JP2005018606A (ja) | 浮動小数点形式信号系列の線形予測分析方法、その装置、プログラムおよびその記録媒体 | |
JP2897940B2 (ja) | 音声の線形予測パラメータ符号化方法 | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2023554411A (ja) | 空間音声パラメータの量子化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5891502 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |