JP2017026795A - Transmission system, encoding device, decoding device, and method and program therefor - Google Patents
Transmission system, encoding device, decoding device, and method and program therefor Download PDFInfo
- Publication number
- JP2017026795A JP2017026795A JP2015144740A JP2015144740A JP2017026795A JP 2017026795 A JP2017026795 A JP 2017026795A JP 2015144740 A JP2015144740 A JP 2015144740A JP 2015144740 A JP2015144740 A JP 2015144740A JP 2017026795 A JP2017026795 A JP 2017026795A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- observed signal
- eigenvalues
- signal
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 263
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 abstract description 6
- 239000004576 sand Substances 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 18
- 230000008707 rearrangement Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- HLXZNVUGXRDIFK-UHFFFAOYSA-N nickel titanium Chemical compound [Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ti].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni].[Ni] HLXZNVUGXRDIFK-UHFFFAOYSA-N 0.000 description 1
- 229910001000 nickel titanium Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Abstract
Description
本発明は、複数のマイクロホンを用いて収音した音を伝送する技術に関する。なお、三次元空間上に複数のマイクロホンを配置し、音を収音することで、その観測信号には、音場の情報が含まれるため、音場の情報を伝送する技術に関すると言ってもよい。なお、音場の情報とは、例えばインパルス応答などであり、音空間情報、または、音の三次元空間情報を含む特性と言ってもよい。 The present invention relates to a technique for transmitting sound collected using a plurality of microphones. It should be noted that, by arranging a plurality of microphones in a three-dimensional space and collecting sound, the observation signal includes information on the sound field. Good. The sound field information is, for example, an impulse response or the like, and may be referred to as characteristics including sound space information or sound three-dimensional space information.
複数のマイクロホンを用いて収音した音を伝送する技術として非特許文献1〜3が知られている。非特許文献1〜3では、音声情報を圧縮し伝送する。
しかしながら、非特許文献1〜3の音声圧縮の技術は、複数のマイクロホンを隣接して並べた際のマイクロホン間の相関は考慮されていない。すなわち、複数のマイクロホンを隣接して並べた場合には、各マイクロホンには非常に相関の高い信号が入力されることとなるが、従来の技術ではこれらは独立の信号として扱っている。
However, the sound compression techniques of
本発明は、複数のマイクロホン間の相関を考慮して、音空間情報を効率的に伝送する伝送システム、符号化装置、復号装置、それらの方法及びプログラムを提供することを目的とする。 An object of the present invention is to provide a transmission system, an encoding device, a decoding device, and a method and a program for efficiently transmitting sound space information in consideration of the correlation between a plurality of microphones.
上記の課題を解決するために、本発明の一態様によれば、伝送システムは、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sを符号化装置から復号装置へ伝送する。符号化装置は、n=1,2,…,Nとし、各マイクロホンの各観測信号snと、各観測信号snの平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化部と、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替える並び替え部と、N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、所定の閾値と固有値λ(n')に対応する値との大小関係に基づき、N'個の固有値λ(n')にそれぞれ対応するN'個の固有ベクトルe(n')のみからなる行列E'=[e(1)e(2)…e(N')]を得る打切り部と、N個の各観測信号snの分散σs_ns_nと、行列Mと行列E'との積である行列μ'と、行列E'とを用いて観測信号行列Sの近似値行列S'を求め、観測信号行列Sと近似値行列S'との差分を誤差Rとして求める誤差算出部と、を含む。復号装置は、行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号部を含む。 In order to solve the above problem, according to one aspect of the present invention, a transmission system uses N as an integer equal to or greater than 2, and an observation signal matrix S collected by N microphones from an encoding device. Transmit to the decoding device. Encoding device, n = 1, 2, ..., and N, and each of the observed signal s n of each microphone, the average s of each observed signal s n - autocovariance of the observed signal s n a difference between n sigma A normalization unit that generates a matrix M having elements m n normalized by s_ns_n , and N eigenvalues λ n and eigenvectors e n of the square matrix M T M are arranged in descending order with respect to the eigenvalue λ n. N '<N, n' = 1,2, ..., N ', and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N ), The eigenvector corresponding to λ (n) is e (n), and N ′ eigenvalues λ (n ′) are respectively determined based on the magnitude relationship between the predetermined threshold and the value corresponding to the eigenvalue λ (n ′). and the corresponding n 'eigenvectors e (n') consisting only of matrix E '= [e (1) e (2) ... e (n')] truncation unit to obtain, for each of the n observed signal s n and variance σ s_ns_n, a 'matrix μ is the product of' the matrix M matrix E, obtains a 'approximate value matrix S of the observation signal matrix S by using the' matrix E, the observed signal matrix S Including the difference between the Nitinol matrix S 'and the error calculating section for obtaining an error R, a. The decoding device includes a decoding unit that decodes the observed signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n, and the error R.
上記の課題を解決するために、本発明の他の態様によれば、符号化装置は、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sに対応する符号を生成する。符号化装置は、n=1,2,…,Nとし、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化部と、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替える並び替え部と、N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列E'を得る打切り部と、N個の各観測信号snの分散σs_ns_nと、行列Mと行列E'との積である行列μ'と、行列E'とを用いて観測信号行列Sの近似値行列S'を求め、観測信号行列Sと近似値行列S'との差分を誤差Rとして求める誤差算出部と、を含む。 In order to solve the above-described problem, according to another aspect of the present invention, the encoding device corresponds to an observation signal matrix S collected by N microphones, where N is any integer greater than or equal to 2. Generate a code. Encoding device, n = 1,2, ..., and N, and each of the observed signal s n, times the average s of each observed signal s n - in autocovariance sigma S_ns_n of each observation signal the difference between n s n A normalization unit that generates a matrix M having elements of normalized values m n and an array that rearranges the N eigenvalues λ n and eigenvectors e n of the square matrix M T M in descending order with respect to the eigenvalues λ n. And N ′ <N, n ′ = 1, 2,..., N ′, and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), The eigenvector corresponding to λ (n) is e (n), and a truncation unit that obtains a matrix E ′ composed of only eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold And an approximate value matrix S ′ of the observed signal matrix S using the variance σ s_ns_n of each of the N observed signals s n , the matrix μ ′ that is the product of the matrix M and the matrix E ′, and the matrix E ′. And an error calculation unit that calculates a difference between the observed signal matrix S and the approximate value matrix S ′ as an error R.
上記の課題を解決するために、本発明の他の態様によれば、復号装置は、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sに対応する符号を受け取り、観測信号行列Sを復号する。復号装置は、n=1,2,…,Nとし、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列をMとし、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替えて得られる、並び替え後の固有値をλ(n)とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、N'<N、n'=1,2,…,N'とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列をE'とし、N個の各観測信号snの分散σs_ns_nと、行列μ'=ME'と行列E'とを用いて得られる観測信号行列Sの近似値行列をS'とし、観測信号行列Sと近似値行列S'との差分を誤差Rとし、行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号部を含む。 In order to solve the above-described problem, according to another aspect of the present invention, a decoding device uses a code corresponding to an observation signal matrix S collected by N microphones, where N is any integer of 2 or more. And the observed signal matrix S is decoded. Decoding apparatus, n = 1,2, ..., and N, and each of the observed signal s n, times the average s of each observed signal s n - normal differences between n in autocovariance sigma S_ns_n of each observed signal s n M is a matrix whose elements are generalized values m n , and is obtained by rearranging the N eigenvalues λ n and eigenvectors e n of the square matrix M T M in descending order with respect to the eigenvalues λ n Is the eigenvalue of λ (n), the rearranged eigenvalue is λ (n), λ (1)> λ (2)>...> λ (N), and the eigenvector corresponding to λ (n) is e (n) N ′ <N, n ′ = 1, 2,..., N ′, and a matrix consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold Let E 'be the approximate value matrix of the observed signal matrix S obtained using the variance σ s_ns_n of each of the N observed signals s n and the matrix μ' = ME 'and the matrix E', and the observed signal matrix The difference between S and the approximate value matrix S ′ is the error R, and the observed signal row is calculated using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n and the error R. A decoding unit for decoding the sequence S is included.
上記の課題を解決するために、本発明の他の態様によれば、伝送方法は、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sを符号化装置から復号装置へ伝送する。伝送方法は、n=1,2,…,Nとし、符号化装置が、各マイクロホンの各観測信号snと、各観測信号snの平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化ステップと、符号化装置が、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替える並び替えステップと、N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、符号化装置が、所定の閾値と固有値λ(n')に対応する値との大小関係に基づき、N'個の固有値λ(n')にそれぞれ対応するN'個の固有ベクトルe(n')のみからなる行列E'=[e(1)e(2)…e(N')]を得る打切りステップと、符号化装置が、N個の各観測信号snの分散σs_ns_nと、行列Mと行列E'との積である行列μ'と、行列E'とを用いて観測信号行列Sの近似値行列S'を求め、観測信号行列Sと近似値行列S'との差分を誤差Rとして求める誤差算出ステップと、復号装置が、行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号ステップとを含む。 In order to solve the above-described problem, according to another aspect of the present invention, a transmission method uses N as an integer equal to or greater than 2, and encodes an observation signal matrix S collected by N microphones. To the decoding device. Transmission method, n = 1, 2, ..., and N, the coding apparatus, and the observed signal s n of each microphone, the average s of each observed signal s n - a difference between n of each observed signal s n A normalization step for generating a matrix M whose elements are values m n normalized by the autocovariance σ s_ns_n , and an encoding device converts the N eigenvalues λ n and eigenvectors e n of the square matrix M T M into eigenvalues. A rearrangement step for rearranging λ n in descending order, N ′ <N, n ′ = 1, 2,..., N ′, and eigenvalues after the rearrangement are λ (n), λ (1)> λ (2)>...> The eigenvectors corresponding to λ (N) and λ (n) are set to e (n), and the encoding device has a magnitude relationship between the predetermined threshold and the value corresponding to the eigenvalue λ (n ′). Based on the matrix E ′ = [e (1) e (2)... E (N ′)] consisting only of N ′ eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′), respectively. a truncation obtaining, encoding apparatus, the variance sigma S_ns_n of n each observed signal s n, which is the product of the the matrix M matrix E 'line An error calculation step of obtaining an approximate value matrix S ′ of the observation signal matrix S using μ ′ and the matrix E ′, and obtaining a difference between the observation signal matrix S and the approximate value matrix S ′ as an error R, and a decoding device , A decoding step of decoding the observed signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n, and the error R.
上記の課題を解決するために、本発明の他の態様によれば、符号化方法は、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sに対応する符号を生成する。符号化方法は、n=1,2,…,Nとし、正規化部が、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化ステップと、並び替え部が、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替える並び替えステップと、N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、打切り部が、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列E'を得る打切りステップと、誤差算出部が、N個の各観測信号snの分散σs_ns_nと、行列Mと行列E'との積である行列μ'と、行列E'とを用いて観測信号行列Sの近似値行列S'を求め、観測信号行列Sと近似値行列S'との差分を誤差Rとして求める誤差算出ステップと、を含む。 In order to solve the above-described problem, according to another aspect of the present invention, an encoding method corresponds to an observation signal matrix S collected by N microphones, where N is any integer greater than or equal to 2. Generate a code. Encoding method, n = 1, 2, ..., and N, normalization section, and each of the observed signal s n, times the average s of each observed signal s n - a difference between n own respective observation signal s n A normalization step for generating a matrix M whose elements are values m n normalized by the covariance σ s_ns_n , and a reordering unit converts the N eigenvalues λ n and eigenvectors e n of the square matrix M T M into eigenvalues λ A rearrangement step for rearranging n in descending order, N ′ <N, n ′ = 1, 2,..., N ′, and eigenvalues after the rearrangement are λ (n), λ (1)> λ ( 2)>...> The eigenvector corresponding to λ (N), λ (n) is e (n), and the eigenvector e corresponding to N ′ eigenvalues λ (n ′) whose truncation part is equal to or less than a predetermined threshold value A truncation step for obtaining a matrix E ′ consisting only of (n ′), and an error calculating unit, a variance σ s_ns_n of each of the N observation signals s n , and a matrix μ ′ that is a product of the matrix M and the matrix E ′ , Find approximate matrix S 'of observed signal matrix S using matrix E' and approximate observed signal matrix S Including, an error calculation step of obtaining an error R the difference between the matrix S '.
上記の課題を解決するために、本発明の他の態様によれば、復号方法は、Nを2以上の整数の何れかとし、N個のマイクロホンで収音した観測信号行列Sに対応する符号を受け取り、観測信号行列Sを復号する。復号方法は、n=1,2,…,Nとし、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列をMとし、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替えて得られる、並び替え後の固有値をλ(n)とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、N'<N、n'=1,2,…,N'とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列をE'とし、N個の各観測信号snの分散σs_ns_nと、行列μ'=ME'と、行列E'とを用いて得られる観測信号行列Sの近似値行列をS'とし、観測信号行列Sと近似値行列S'との差分を誤差Rとし、復号部が、行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号ステップを含む。 In order to solve the above-described problem, according to another aspect of the present invention, a decoding method uses a code corresponding to an observation signal matrix S collected by N microphones, where N is any integer greater than or equal to 2. And the observed signal matrix S is decoded. Decoding method, n = 1,2, ..., and N, and each of the observed signal s n, times the average s of each observed signal s n - normal differences between n in autocovariance sigma S_ns_n of each observed signal s n M is a matrix whose elements are generalized values m n , and is obtained by rearranging the N eigenvalues λ n and eigenvectors e n of the square matrix M T M in descending order with respect to the eigenvalues λ n Is the eigenvalue of λ (n), the rearranged eigenvalue is λ (n), λ (1)> λ (2)>...> λ (N), and the eigenvector corresponding to λ (n) is e (n) N ′ <N, n ′ = 1, 2,..., N ′, and a matrix consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold Let E 'be the approximate value matrix of the observation signal matrix S obtained using the variance σ s_ns_n of each of the N observation signals s n , the matrix μ' = ME ', and the matrix E', and the observation signal The difference between the matrix S and the approximate value matrix S ′ is an error R, and the decoding unit uses the matrix μ ′, the matrix E ′, the N variances σ s_ns_n, and the error R. A decoding step of decoding the observed signal matrix S.
本発明によれば、音空間情報を効率的に伝送することができるという効果を奏する。 According to the present invention, there is an effect that sound space information can be efficiently transmitted.
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。 Hereinafter, embodiments of the present invention will be described. In the drawings used for the following description, constituent parts having the same function and steps for performing the same process are denoted by the same reference numerals, and redundant description is omitted. In the following description, it is assumed that processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise specified.
<第一実施形態のポイント>
第一実施形態の音空間情報圧縮方法は、符号化ステップと、復号ステップとからなる。まず、符号化ステップについて説明する。
<Points of first embodiment>
The sound space information compression method according to the first embodiment includes an encoding step and a decoding step. First, the encoding step will be described.
S(j)をN個のマイクロホンから入力されたフレーム長Lの観測信号からなる行列(以下、観測信号行列ともいう)とする。この場合、観測信号行列S(j)は式(1)で表現される Let S (j) be a matrix (hereinafter also referred to as an observation signal matrix) composed of observation signals of frame length L input from N microphones. In this case, the observed signal matrix S (j) is expressed by equation (1)
jはフレームのインデックス、lはフレームj内のサンプルのインデックス、nはマイクロホンのインデックス、l=0,1,…,L-1、n=1,2,…,Nである。なお、以下の説明において、特に断りのない限り、フレームj毎に処理を行うものとし、フレームのインデックスjを省略する。 j is the index of the frame, l is the index of the sample in frame j, n is the index of the microphone, l = 0, 1,..., L−1, n = 1, 2,. In the following description, unless otherwise specified, processing is performed for each frame j, and the index j of the frame is omitted.
ここで、観測信号sn(l)からその平均s- n(マイクロホンn毎の観測信号の平均であり、例えば、時間平均であり、sn(0),sn(1),…,sn(L-1)の平均値)を減算し、自己共分散σs_ns_n(ただし、下付添え字におけるA_BはABを表し、s_ns_nはsnsnを表す)で正規化された値mn(l)を要素とする行列Mを式(2),(3)のように定義する。 Here, the observed signal s n (l) from the average s - n (the average of the observation signal of each microphone n, for example, a time average, s n (0), s n (1), ..., s n (L-1) mean value) is calculated by subtracting an, autocovariance σ s_ns_n (However, A_B in subscript represents a B, s_ns_n is s n s n represents an) in normalized value m A matrix M having n (l) as an element is defined as in equations (2) and (3).
ここで、カルーネン・レーベ(Karhunen-Loeve)変換を導入する。この変換は、相関の高い信号を互いに独立な成分に分解するものである。カルーネン・レーベ変換により、次式により表されるN行N列の正方行列MTMを得る。 Here we introduce the Karhunen-Loeve transformation. This conversion decomposes highly correlated signals into components independent of each other. An N-by-N square matrix M T M expressed by the following equation is obtained by Karoonen-Loeve transform.
ただし、正方行列MTMの要素σm_j,m_k(ただし、j=1,2,…,N、k=1,2,…,Nであり、下付添え字m_jm_kは、mjmkを表す)の値は、マイクロホンj,k間の相関の程度を示している。この正方行列MTMを、さらに次式により固有値分解する。 However, the element σ m_j, m_k (where j = 1,2, ..., N, k = 1,2, ..., N of the square matrix M T M, and the subscript m_jm_k is m j m k The value of (represents) indicates the degree of correlation between the microphones j and k. This square matrix M T M is further subjected to eigenvalue decomposition according to the following equation.
ただし、Eは、N個の固有ベクトルen=[en,1,en,2,…,en,N]T(要素数N)を要素とする正方行列である。Λは、N個の固有値λnを対角要素とする対角行列である。さらに、固有値λn及び固有ベクトルenを、固有値λnに関して降順となるよう並び替える。並び替え後のN個の固有値λnをλ(1),λ(2),…,λ(N)と表現すると、λ(1)>λ(2)>…>λ(N)である。固有値λnに関して降順に並び替えた後のN個の固有ベクトルenをe(1),e(2),…,e(N)と表現し、e(n)=[e(n,1),e(n,2),…,e(n,N)]Tと表現する。 Here, E is a square matrix having N eigenvectors e n = [e n, 1 , e n, 2 ,..., E n, N ] T (number of elements N) as elements. Λ is a diagonal matrix having N eigenvalues λ n as diagonal elements. Furthermore, the eigenvalues lambda n and eigenvectors e n, rearranges to be a descending order with respect to the eigenvalue lambda n. When the rearranged N eigenvalues λ n are expressed as λ (1), λ (2),..., Λ (N), λ (1)> λ (2)>. N eigenvectors e n after sorting in descending order with respect to the eigenvalue λ n are expressed as e (1), e (2),..., E (N), and e (n) = [e (n, 1) , e (n, 2),..., e (n, N)] T.
次に、行列Mと行列Eの積として得られるL行N列の行列μを、次式で定義する。 Next, an L × N matrix μ obtained as a product of the matrix M and the matrix E is defined by the following equation.
直交性のために次式(7)が成り立つので、正規化された元の行列Mは、式(8)によって求めることができる。 Since the following equation (7) holds because of the orthogonality, the normalized original matrix M can be obtained by equation (8).
降順に並べた固有値λ(n)をある閾値で打ち切って対角行列Λを近似することができる。この場合、対角行列Λの近似行列Λ'、行列Eとその近似行列E'は式(9)の関係になる。 The diagonal matrix Λ can be approximated by truncating eigenvalues λ (n) arranged in descending order at a certain threshold. In this case, the approximate matrix Λ ′ and the matrix E of the diagonal matrix Λ have the relationship of Equation (9).
なお、式(9)を満たすのであれば、閾値及びN'はどのような値に設定してもよい。例えば、固有値λ(1)からλ(n')までの総和x'に対して閾値y1(0<y1<1)を設けてもよいし(図1のS4の(x'<y1?)に相当)、固有値λ(1)からλ(n')までの固有値の個数n'に対して閾値y2(1≦y2≦N)を設けてもよいし(図1のS4の(n'<y2?)に相当)、各固有値λ(n')に対して閾値y3(0<y3<1)を設けてもよい(図1のS4の(λ(n')>y3?)に相当)。さらに、これらの条件を組合せてもよい(例えば、上述の条件の少なくとも2つ以上の条件に対して、and条件またはor条件を設定する)。閾値y1,y2,y3の大きさや条件は、実験やシミュレーションにより、伝送に先立ち予め適切なものを求めておけばよい。なお、固有値λ(1)からλ(N')までの総和xが1以上となると、対角行列Λを適切に近似することができないため、総和xが1未満となるようにN'を設定する(図1のS3及びS6参照)。 Note that the threshold and N ′ may be set to any value as long as Expression (9) is satisfied. For example, a threshold value y 1 (0 <y 1 <1) may be provided for the sum x ′ from eigenvalues λ (1) to λ (n ′) ((x ′ <y 1 of S4 in FIG. 1). )), Or a threshold value y 2 (1 ≦ y 2 ≦ N) may be provided for the number n ′ of eigenvalues from eigenvalues λ (1) to λ (n ′) (in S4 of FIG. 1). (equivalent to n ′ <y 2 ?)), a threshold value y 3 (0 <y 3 <1) may be provided for each eigenvalue λ (n ′) ((λ (n ′) of S4 in FIG. 1). > y 3 ?)). Furthermore, these conditions may be combined (for example, an and condition or an condition is set for at least two conditions described above). The magnitudes and conditions of the thresholds y 1 , y 2 , and y 3 may be determined in advance prior to transmission through experiments and simulations. Note that if the sum x from the eigenvalues λ (1) to λ (N ') is 1 or more, the diagonal matrix Λ cannot be approximated appropriately, so N' is set so that the sum x is less than 1. (Refer to S3 and S6 in FIG. 1).
式(6)のN行N列の行列Eの代わりにN行N'列の行列E'を用いることで、次式により、L行N列の行列μから次元を削減したL行N'列の行列μ'を得ることができる(式(10))。 By using the N-row N'-column matrix E 'instead of the N-row N-column matrix E in Equation (6), the L-row N'-column is reduced in dimension from the L-row N-column matrix μ by the following equation: Can be obtained (Equation (10)).
ここから、L行N列の行列Mの近似であるL行N列の行列M'を次式(11)のように求めることができる。 From this, a matrix M ′ of L rows and N columns, which is an approximation of the matrix M of L rows and N columns, can be obtained as in the following equation (11).
観測信号行列Sの近似値行列であるS'は、式(12)によって求めることができる。 S ′, which is an approximate value matrix of the observation signal matrix S, can be obtained by Expression (12).
ここで、要素s'n(l)は次式(13)となる。 Here, the element s ′ n (l) is expressed by the following equation (13).
観測信号行列Sとその近似値行列S'の誤差をRと定義する(式(14)) The error between the observed signal matrix S and its approximate value matrix S 'is defined as R (Equation (14))
ここで、誤差Rは、観測信号行列Sと同様にL行N列の行列であるが、観測信号行列Sとその近似値行列S'との差分であり、誤差Rの各要素は小さな値となる。そのため、誤差Rの各要素は、観測信号行列Sの各要素よりも少ないビット数で表現することができ、観測信号行列Sを送るよりも伝送量を削減することができる。以上から、元の観測信号行列Sを伝送する代わりに、μ',E',R,およびσ2=[σs_1s_1 σs_2 s_2 … σs_n s_n]を伝送することで、伝送量を削減することが可能となる。 Here, the error R is a matrix of L rows and N columns like the observation signal matrix S, but is a difference between the observation signal matrix S and its approximate value matrix S ′, and each element of the error R is a small value. Become. Therefore, each element of the error R can be expressed with a smaller number of bits than each element of the observation signal matrix S, and the transmission amount can be reduced as compared with sending the observation signal matrix S. From the above, instead of transmitting the original observed signal matrix S, μ ′, E ′, R, and σ 2 = [σ s_1s_1 σ s_2 s_2 … σ s_n s_n ] are transmitted to reduce the transmission amount Is possible.
符号化ステップでは、観測信号行列Sを用いてμ',E',R,およびσ2を算出し、観測信号行列Sに代えて、μ',E',R,およびσ2を伝送する。 In the encoding step, μ ′, E ′, R, and σ 2 are calculated using the observed signal matrix S, and μ ′, E ′, R, and σ 2 are transmitted instead of the observed signal matrix S.
復号ステップでは、μ',E',R,およびσ2を受け取り、これらの値を用いて、次式(15)により、観測信号行列Sを復号する。 In the decoding step, μ ′, E ′, R, and σ 2 are received, and using these values, the observed signal matrix S is decoded by the following equation (15).
ただし、「.*」は、行列の要素同士の乗算を表す演算子であり、 However, ". *" Is an operator that represents the multiplication of matrix elements.
である。また、 It is. Also,
である。つまり、Σ2は、L個のσ2を要素として持つ行列である。 It is. That is, Σ 2 is a matrix having L σ 2 as elements.
以下、上述の伝送方法を実現する構成について説明する。 Hereinafter, a configuration for realizing the above transmission method will be described.
<第一実施形態に係る伝送システム10>
図2は第一実施形態に係る伝送システム10の機能図を示す。
<
FIG. 2 shows a functional diagram of the
伝送システム10は、符号化装置100と復号装置200とを含む。符号化装置100と復号装置200とは、通信回線11を介して通信可能とされている。符号化装置100は、N個のマイクロホン12−nでそれぞれ収音したN個の観測信号snを入力とし、符号(μ',E',R,σ2)を生成し、通信回線11を介して復号装置200に伝送する。ただし、n=1,2,…,Nであり、sn=[sn(0) sn(1) … sn(L-1)]である。復号装置200は、符号(μ',E',R,σ2)を受け取り、この符号を用いてN個の観測信号snを復号する。例えば、復号装置200は、N個のスピーカ13−nにそれぞれN個の観測信号snを出力し、N個のスピーカ13−nはそれぞれN個の観測信号snを再生し、N個のマイクロホン12−nが配置された音場を再現する。
The
<符号化装置100>
図3は符号化装置100の機能ブロック図を、図4はその処理フローを示す。
<
FIG. 3 is a functional block diagram of the
符号化装置100は、正規化部110、分散計算部120、カルーネン・レーベ変換部130、並び替え部140、打切り部150、次元削減部160及び誤差算出部170を含む。
The
<正規化部110>
正規化部110は、N個のマイクロホン12−nでそれぞれ収音したN個の観測信号snを受け取り、これらの値に基づき式(1')に従って観測信号行列Sを生成し、分散計算部120及び誤差算出部170に出力する。
<
Normalizing
また、正規化部110は、N個の観測信号snを用いて、式(2),(3)に従って行列Mを生成し、カルーネン・レーベ変換部130、打切り部150、次元削減部160に出力する。
Further, the
行列Mの各要素mn(l)は、各観測信号sn(l)と各観測信号snの平均s- n(例えば時間平均)との差分を各観測信号snの自己共分散σs_ns_nで正規化した値である。 Each element m n matrix M (l), the average s of each observed signal s n and the observed signal s n (l) - n (eg, time average) auto-covariance of the observed signal s n a difference between σ It is a value normalized by s_ns_n .
<分散計算部120>
分散計算部120は、観測信号行列Sを受け取り、各観測信号snの分散σs_ns_nを計算し(S120)、分散σ=[σS_1S_1 σS_2S_2 … σS_NS_N]を符号化装置100の出力値として出力するとともに、誤差算出部170に出力する。
<Distributed
<カルーネン・レーベ変換部130>
カルーネン・レーベ変換部130は、行列Mを受け取り、カルーネン・レーベ変換し(S130)、式(4)により表される正方行列MTMを得、並び替え部140に出力する。
<Kalunen-
The Karoonen-
<並び替え部140>
並び替え部140は、正方行列MTMを受け取り、固有値分解し(式(5))、正方行列MTMのN個の固有値λn及び固有ベクトルenを得る。
<Sort
Rearranging
さらに、並び替え部140は、固有値λnに関して降順となるように並び替え(S140)、並び替え後のN個の固有値λ(1),λ(2),…,λ(N)(ただし、λ(1)>λ(2)>…>λ(N))を対角要素とする対角行列Λ=diag(λ(1),λ(2),…,λ(N))とN個の固有ベクトルe(1),e(2),…,e(N)からなるL行N列の行列E=[e(1) e(2) … e(N)]を打切り部150に出力する。なお、固有ベクトルe(n)は固有値λ(n)に対応する固有ベクトルである。
Further, the
<打切り部150>
打切り部150は、並び替え後のN個の固有値λ(n)を対角要素とする対角行列Λと、並び替え後のN個の固有ベクトルe(1),e(2),…,e(N)からなるL行N列の行列E=[e(1) e(2) … e(N)]を受け取り、所定の閾値yと固有値λ(n')に対応する値との大小関係に基づき、N'を設定し(図1のS6参照)、N'個の固有値λ(n')にそれぞれ対応するN'個の固有ベクトルe(n')のみからなる行列E'=[e(1) e(2) … e(N')]を得(S150)、符号化装置100の出力値として出力するとともに、次元削減部160及び誤差算出部170に出力する。ただし、N'<N、n'=1,2,…,N'である。固有値λ(n')に対応する値とは、例えば、(i)固有値λ(1)からλ(n')までの総和x'、(ii)固有値λ(1)からλ(n')までの固有値の個数n'、(iii)固有値λ(n')自体、(iv)上述の(i)〜(iii)の組合せである(図1のS4参照)。所定の閾値yとは、例えば、図1のy1,y2,y3またはそれらの組合せである。
<
The
なお、固有値λ(1)からλ(N')までの総和xが1以上となると、対角行列Λを適切に近似することができないため、総和xが1未満となるようにN'を設定する(図1のS3及びS6参照)。また、N'<NとなるようにN'を設定する(図1のS3及びS6参照)。 Note that if the sum x from the eigenvalues λ (1) to λ (N ') is 1 or more, the diagonal matrix Λ cannot be approximated appropriately, so N' is set so that the sum x is less than 1. (Refer to S3 and S6 in FIG. 1). Also, N ′ is set so that N ′ <N (see S3 and S6 in FIG. 1).
<次元削減部160>
次元削減部160は、行列Mと行列E'とを受け取り、式(10)に従って、行列Mと行列E'との積である行列μ'=ME'を得(S160)、符号化装置100の出力値として出力するとともに、誤差算出部170に出力する。
<
The
<誤差算出部170>
誤差算出部170は、観測信号行列Sと行列μ'と行列E'と分散σ2とを受け取り、これらの用いて、式(11)〜(13)に従い、観測信号行列Sの近似値行列S'を求める。
<
The
さらに、誤差算出部170は、式(14)に従い、観測信号行列Sと近似値行列S'との差分を誤差Rとして求め(S170)、符号化装置100の出力値として出力する。
Further, the
符号化装置100は、図示しない送信部からフレーム毎に符号(μ',E',R,σ2)を伝送する。
The
<復号装置200>
図5は復号装置200の機能ブロック図を、図6はその処理フローを示す。
<
FIG. 5 shows a functional block diagram of the
復号装置200は、復号部210、音信号生成部220を含む。復号部210は、近似行列計算部211、観測信号予測部212を含む。
The
<復号部210>
復号部210は、符号(μ',E',R,σ2)を受け取り、これらの値を用いて、次式により、観測信号行列Sを復号し(S210)、音信号生成部220に出力する。
<Decoding
The
ただし、「.*」は、行列の要素同士の乗算を表す演算子であり、 However, ". *" Is an operator that represents the multiplication of matrix elements.
である。例えば以下のように観測信号行列Sを復号する。 It is. For example, the observation signal matrix S is decoded as follows.
復号部210の近似行列計算部211は、行列μ'と行列E'とを用いて、式(11)に従い、行列Mの近似行列M'を求め(S211)、観測信号予測部212に出力する。
The approximate
復号部210の観測信号予測部212は、近似行列M'と誤差Rと分散σを受け取り、近似行列M'と分散σとを用いて、式(12),(13)に従い、観測信号行列Sの近似値行列S'を求める。
The observation
さらに、観測信号予測部212は、近似値行列S'と誤差Rとを用いて、次式により、観測信号行列Sを求め(S212)、音信号生成部220に出力する。
Further, the observation
<音信号生成部220>
音信号生成部220は、観測信号行列Sを受け取り、各スピーカ13−nの観測信号(再生信号)snに分離し、それぞれ各スピーカ13−nに出力する。
<Sound
The
各スピーカ13−nは、観測信号(再生信号)snを受け取り、再生する。 Each speaker 13-n receives the observed signal (reproduced signal) s n, to play.
<効果>
以上の構成により、音空間情報を効率的に伝送することができる。誤差Rは、観測信号行列Sと同様にL行N列の行列であるが、観測信号行列Sとその近似値行列S'との差分であり、誤差Rの各要素は小さな値となる。そのため、誤差Rの各要素は、観測信号行列Sの各要素よりも少ないビット数で表現することができ、観測信号行列Sを送るよりも伝送量を削減することができる。以上から、元の観測信号行列Sを伝送する代わりに、符号(μ',E',R,σ2)を伝送することで、伝送量を削減することが可能となる。
<Effect>
With the above configuration, sound space information can be efficiently transmitted. The error R is a matrix of L rows and N columns similarly to the observation signal matrix S, but is a difference between the observation signal matrix S and its approximate value matrix S ′, and each element of the error R has a small value. Therefore, each element of the error R can be expressed with a smaller number of bits than each element of the observation signal matrix S, and the transmission amount can be reduced as compared with sending the observation signal matrix S. From the above, it is possible to reduce the transmission amount by transmitting the code (μ ′, E ′, R, σ 2 ) instead of transmitting the original observation signal matrix S.
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<Other variations>
The present invention is not limited to the above-described embodiments and modifications. For example, the various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. In addition, it can change suitably in the range which does not deviate from the meaning of this invention.
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
<Program and recording medium>
In addition, various processing functions in each device described in the above embodiments and modifications may be realized by a computer. In that case, the processing contents of the functions that each device should have are described by a program. Then, by executing this program on a computer, various processing functions in each of the above devices are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage unit. When executing the process, this computer reads the program stored in its own storage unit and executes the process according to the read program. As another embodiment of this program, a computer may read a program directly from a portable recording medium and execute processing according to the program. Further, each time a program is transferred from the server computer to the computer, processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program includes information provided for processing by the electronic computer and equivalent to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, although each device is configured by executing a predetermined program on a computer, at least a part of these processing contents may be realized by hardware.
Claims (8)
前記符号化装置は、
n=1,2,…,Nとし、各マイクロホンの各観測信号snと、前記各観測信号snの平均s- nとの差分を前記各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化部と、
正方行列MTMのN個の固有値λn及び固有ベクトルenを、前記固有値λnに関して降順となるように並び替える並び替え部と、
N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、所定の閾値と固有値λ(n')に対応する値との大小関係に基づき、N'個の固有値λ(n')にそれぞれ対応するN'個の固有ベクトルe(n')のみからなる行列E'=[e(1) e(2) … e(N')]を得る打切り部と、
N個の前記各観測信号snの分散σs_ns_nと、前記行列Mと前記行列E'との積である行列μ'と、前記行列E'とを用いて前記観測信号行列Sの近似値行列S'を求め、前記観測信号行列Sと前記近似値行列S'との差分を誤差Rとして求める誤差算出部と、を含み、
前記復号装置は、
前記行列μ'と前記行列E'とN個の前記分散σs_ns_nと前記誤差Rとを用いて、前記観測信号行列Sを復号する復号部を含む、
伝送システム。 N is any integer of 2 or more, and is a transmission system for transmitting an observation signal matrix S collected by N microphones from an encoding device to a decoding device,
The encoding device includes:
n = 1, 2, ..., and N, and each of the observed signal s n of each microphone, the average s of each observed signal s n - regular self-covariance sigma S_ns_n of each observed signal the difference between n s n A normalization unit that generates a matrix M whose elements are generalized values m n ,
A reordering unit that reorders the N eigenvalues λ n and eigenvectors e n of the square matrix M T M in descending order with respect to the eigenvalues λ n ;
N ′ <N, n ′ = 1, 2,..., N ′, and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), λ (n) Let e (n) be the eigenvector corresponding to, and based on the magnitude relationship between the predetermined threshold and the value corresponding to the eigenvalue λ (n ′), N ′ pieces of N ′ corresponding to N ′ eigenvalues λ (n ′) respectively A truncation unit for obtaining a matrix E ′ = [e (1) e (2)... E (N ′)] consisting only of eigenvectors e (n ′);
An approximate value matrix of the observed signal matrix S using a variance σ s_ns_n of each of the N observed signals s n , a matrix μ ′ that is a product of the matrix M and the matrix E ′, and the matrix E ′ An error calculator that calculates S ′ and calculates the difference between the observed signal matrix S and the approximate value matrix S ′ as an error R, and
The decoding device
A decoding unit for decoding the observed signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n and the error R;
Transmission system.
n=1,2,…,Nとし、各観測信号snと、前記各観測信号snの時間平均s- nとの差分を前記各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化部と、
正方行列MTMのN個の固有値λn及び固有ベクトルenを、前記固有値λnに関して降順となるように並び替える並び替え部と、
N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列E'を得る打切り部と、
N個の前記各観測信号snの分散σs_ns_nと、前記行列Mと前記行列E'との積である行列μ'と、前記行列E'とを用いて前記観測信号行列Sの近似値行列S'を求め、前記観測信号行列Sと前記近似値行列S'との差分を誤差Rとして求める誤差算出部と、を含む、
符号化装置。 An encoding device that generates a code corresponding to an observation signal matrix S collected by N microphones, where N is any integer of 2 or more,
n = 1, 2, ..., and N, and each of the observed signal s n, the time average s of each observed signal s n - normalized by auto-covariance sigma S_ns_n of the difference between n each observed signal s n A normalization unit that generates a matrix M having elements of value m n ,
A reordering unit that reorders the N eigenvalues λ n and eigenvectors e n of the square matrix M T M in descending order with respect to the eigenvalues λ n ;
N ′ <N, n ′ = 1, 2,..., N ′, and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), λ (n) An eigenvector corresponding to e (n), and a truncation unit for obtaining a matrix E ′ consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold value;
An approximate value matrix of the observed signal matrix S using a variance σ s_ns_n of each of the N observed signals s n , a matrix μ ′ that is a product of the matrix M and the matrix E ′, and the matrix E ′ An error calculation unit that calculates S ′ and calculates a difference between the observed signal matrix S and the approximate value matrix S ′ as an error R.
Encoding device.
M'=μ'(E')T、M'の各要素をm'n、前記各観測信号snの各近似値をs'nとし、前記誤差算出部は、
s'n=m'nσs_ns_n
により、前記近似値行列S'=[s'1 s'2 … s'N]を求める、
符号化装置。 The encoding device according to claim 2, comprising:
M ′ = μ ′ (E ′) T , each element of M ′ is m ′ n , each approximate value of each observation signal s n is s ′ n , and the error calculation unit is
s ' n = m' n σ s_ns_n
To obtain the approximate value matrix S ′ = [s ′ 1 s ′ 2 ... S ′ N ],
Encoding device.
n=1,2,…,Nとし、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列をMとし、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替えて得られる、並び替え後の固有値をλ(n)とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、N'<N、n'=1,2,…,N'とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列をE'とし、N個の前記各観測信号snの分散σs_ns_nと、行列μ'=ME'と、行列E'とを用いて得られる観測信号行列Sの近似値行列をS'とし、観測信号行列Sと近似値行列S'との差分を誤差Rとし、
行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号部を含む、
復号装置。 N is any integer of 2 or more, receives a code corresponding to an observation signal matrix S collected by N microphones, and decodes the observation signal matrix S,
n = 1,2, ..., and N, and each of the observed signal s n, times the average s of each observed signal s n - n value difference normalized with the auto-covariance sigma S_ns_n of each observed signal s n and m A matrix having n as an element is M, and N eigenvalues λ n and eigenvectors e n of the square matrix M T M are rearranged so as to be in descending order with respect to the eigenvalue λ n. (n), the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), the eigenvector corresponding to λ (n) is e (n), and N ′ <N, n ′ = 1, 2,..., N ′, and E ′ a matrix consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold value, An approximate value matrix of the observed signal matrix S obtained by using the variance σ s_ns_n of each of the N observed signals s n , the matrix μ ′ = ME ′, and the matrix E ′ is defined as S ′, and the observed signal matrix S and The difference from the approximate value matrix S ′ is the error R,
A decoding unit that decodes the observed signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n, and the error R;
Decoding device.
n=1,2,…,Nとし、前記符号化装置が、各マイクロホンの各観測信号snと、前記各観測信号snの平均s- nとの差分を前記各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化ステップと、
前記符号化装置が、正方行列MTMのN個の固有値λn及び固有ベクトルenを、前記固有値λnに関して降順となるように並び替える並び替えステップと、
N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、前記符号化装置が、所定の閾値と固有値λ(n')に対応する値との大小関係に基づき、N'個の固有値λ(n')にそれぞれ対応するN'個の固有ベクトルe(n')のみからなる行列E'=[e(1) e(2) … e(N')]を得る打切りステップと、
前記符号化装置が、N個の前記各観測信号snの分散σs_ns_nと、前記行列Mと前記行列E'との積である行列μ'と、前記行列E'とを用いて前記観測信号行列Sの近似値行列S'を求め、前記観測信号行列Sと前記近似値行列S'との差分を誤差Rとして求める誤差算出ステップと、
前記復号装置が、前記行列μ'と前記行列E'とN個の前記分散σs_ns_nと前記誤差Rとを用いて、前記観測信号行列Sを復号する復号ステップとを含む、
伝送方法。 N is any integer of 2 or more, and is a transmission method for transmitting an observation signal matrix S collected by N microphones from an encoding device to a decoding device,
n = 1, 2, ..., and N, the coding apparatus, and the observed signal s n of each microphone, the average s of each observed signal s n - self of each observed signal the difference between n s n A normalization step for generating a matrix M having elements m n normalized by the covariance σ s_ns_n ;
The encoding apparatus, the N eigenvalues lambda n and eigenvectors e n square matrix M T M, and rearranging step for rearranging so that descending with respect to the eigenvalue lambda n,
N ′ <N, n ′ = 1, 2,..., N ′, and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), λ (n) The eigenvector corresponding to e (n) is set to e (n), and the encoding device determines each of N ′ eigenvalues λ (n ′) based on a magnitude relationship between a predetermined threshold and a value corresponding to the eigenvalue λ (n ′). A truncation step to obtain a matrix E ′ = [e (1) e (2)... E (N ′)] consisting only of the corresponding N ′ eigenvectors e (n ′);
The encoding apparatus, the variance sigma S_ns_n of N each observed signal s n, a 'matrix μ is the product of' the matrix E and the matrix M, the observed signal using said matrix E ' Obtaining an approximate value matrix S ′ of the matrix S, and calculating an error R as a difference between the observed signal matrix S and the approximate value matrix S ′;
The decoding apparatus includes a decoding step of decoding the observed signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n and the error R,
Transmission method.
n=1,2,…,Nとし、正規化部が、各観測信号snと、前記各観測信号snの時間平均s- nとの差分を前記各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列Mを生成する正規化ステップと、
並び替え部が、正方行列MTMのN個の固有値λn及び固有ベクトルenを、前記固有値λnに関して降順となるように並び替える並び替えステップと、
N'<N、n'=1,2,…,N'とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、打切り部が、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列E'を得る打切りステップと、
誤差算出部が、N個の前記各観測信号snの分散σs_ns_nと、前記行列Mと前記行列E'との積である行列μ'と、前記行列E'ととを用いて前記観測信号行列Sの近似値行列S'を求め、前記観測信号行列Sと前記近似値行列S'との差分を誤差Rとして求める誤差算出ステップと、を含む、
符号化方法。 An encoding method for generating a code corresponding to an observation signal matrix S collected by N microphones, where N is any integer of 2 or more,
n = 1, 2, ..., and N, normalization section, and each of the observed signal s n, the time of each observation signal s n Mean s - wherein a difference between n each observed signal s n autocovariance σ of a normalization step for generating a matrix M having elements m n normalized by s_ns_n ;
Rearranging portion, a N eigenvalues lambda n and eigenvectors e n square matrix M T M, and rearranging step for rearranging so that descending with respect to the eigenvalue lambda n,
N ′ <N, n ′ = 1, 2,..., N ′, and the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), λ (n) The eigenvector corresponding to is e (n), and the truncation unit obtains a matrix E ′ consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold. When,
Error calculation section, and the variance sigma S_ns_n of N each observed signal s n, a 'matrix μ is the product of' the matrix E and the matrix M, the observed signal using said matrix E 'Toto Calculating an approximate value matrix S ′ of the matrix S, and calculating an error R as a difference between the observed signal matrix S and the approximate value matrix S ′.
Encoding method.
n=1,2,…,Nとし、各観測信号snと、各観測信号snの時間平均s- nとの差分を各観測信号snの自己共分散σs_ns_nで正規化した値mnを要素とする行列をMとし、正方行列MTMのN個の固有値λn及び固有ベクトルenを、固有値λnに関して降順となるように並び替えて得られる、並び替え後の固有値をλ(n)とし、並び替え後の固有値をλ(n)、λ(1)>λ(2)>…>λ(N)、λ(n)に対応する固有ベクトルをe(n)とし、N'<N、n'=1,2,…,N'とし、所定の閾値以下となるN'個の固有値λ(n')に対応する固有ベクトルe(n')のみからなる行列をE'とし、N個の各観測信号snの分散σs_ns_nと、行列μ'=ME'と、行列E'とを用いて得られる観測信号行列Sの近似値行列をS'とし、観測信号行列Sと近似値行列S'との差分を誤差Rとし、
復号部が、行列μ'と行列E'とN個の分散σs_ns_nと誤差Rとを用いて、観測信号行列Sを復号する復号ステップを含む、
復号方法。 N is any integer of 2 or more, receives a code corresponding to the observed signal matrix S collected by N microphones, and decodes the observed signal matrix S,
n = 1,2, ..., and N, and each of the observed signal s n, times the average s of each observed signal s n - n value difference normalized with the auto-covariance sigma S_ns_n of each observed signal s n and m A matrix having n as an element is M, and N eigenvalues λ n and eigenvectors e n of the square matrix M T M are rearranged so as to be in descending order with respect to the eigenvalue λ n. (n), the rearranged eigenvalues are λ (n), λ (1)> λ (2)>...> λ (N), the eigenvector corresponding to λ (n) is e (n), and N ′ <N, n ′ = 1, 2,..., N ′, and E ′ a matrix consisting only of eigenvectors e (n ′) corresponding to N ′ eigenvalues λ (n ′) that are equal to or less than a predetermined threshold value, An approximate value matrix of the observed signal matrix S obtained by using the variance σ s_ns_n of each of the N observed signals s n , the matrix μ ′ = ME ′, and the matrix E ′ is defined as S ′, and approximated to the observed signal matrix S The difference from the value matrix S ′ is the error R,
The decoding unit includes a decoding step of decoding the observation signal matrix S using the matrix μ ′, the matrix E ′, the N variances σ s_ns_n and the error R,
Decryption method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015144740A JP6355207B2 (en) | 2015-07-22 | 2015-07-22 | Transmission system, encoding device, decoding device, method and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015144740A JP6355207B2 (en) | 2015-07-22 | 2015-07-22 | Transmission system, encoding device, decoding device, method and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017026795A true JP2017026795A (en) | 2017-02-02 |
JP6355207B2 JP6355207B2 (en) | 2018-07-11 |
Family
ID=57950561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015144740A Active JP6355207B2 (en) | 2015-07-22 | 2015-07-22 | Transmission system, encoding device, decoding device, method and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6355207B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014187991A1 (en) * | 2013-05-24 | 2014-11-27 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
-
2015
- 2015-07-22 JP JP2015144740A patent/JP6355207B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014187991A1 (en) * | 2013-05-24 | 2014-11-27 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
Also Published As
Publication number | Publication date |
---|---|
JP6355207B2 (en) | 2018-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4461144B2 (en) | Multi-channel signal encoding method, decoding method thereof, apparatus, program and recording medium thereof | |
CN111712835A (en) | Channel modeling in data transmission system | |
JP4970456B2 (en) | Coding in MIMO communication system | |
JP6571193B2 (en) | Data adaptive compression and data encryption using Kronecker products | |
JP6495910B2 (en) | Method and apparatus for high-order Ambisonics encoding and decoding using singular value decomposition | |
CN110019865B (en) | Mass image processing method and device, electronic equipment and storage medium | |
EP3392883A1 (en) | Method for processing an input audio signal and corresponding electronic device, non-transitory computer readable program product and computer readable storage medium | |
CN107240396B (en) | Speaker self-adaptation method, device, equipment and storage medium | |
JP2015079080A (en) | Sound source position estimation device, method, and program | |
RU2486609C2 (en) | Quantiser, encoder and methods thereof | |
CN110301003B (en) | Improving processing in sub-bands of actual three-dimensional acoustic content for decoding | |
JP6355207B2 (en) | Transmission system, encoding device, decoding device, method and program thereof | |
KR102184275B1 (en) | Electronic apparatus and communication system for optimally achieving private information retrieval with low upload cost based on probabilistic technique, and operating method of the same | |
CN107079171B (en) | Method and apparatus for encoding and decoding video signal using improved prediction filter | |
US6539366B1 (en) | Codec with genetic adaptation | |
US20240078411A1 (en) | Information processing system, encoding device, decoding device, model learning device, information processing method, encoding method, decoding method, model learning method, and program storage medium | |
JPWO2006048919A1 (en) | Optimal design management device, optimal design calculation system, optimal design management method, optimal design management program | |
JP2006333055A (en) | System and method for observation device distributed observation | |
JP5325072B2 (en) | Matrix decomposition apparatus, matrix decomposition method and program | |
JP4234018B2 (en) | Digital video / audio signal lossless encoding / decoding method and apparatus, and recording medium recording a computer program for executing the method | |
US11501782B2 (en) | Encoder, decoder, encoding method, decoding method, program, and recording medium | |
KR102621139B1 (en) | Method and apparatus for distributed matrix multiplication baed on frame quantization | |
CN111865842B (en) | Two-stage low-complexity Massive MIMO channel estimation method, device and equipment | |
JP2013003330A (en) | Stereo signal encoding method, stereo signal encoding device, and program | |
JP5891500B1 (en) | Speech signal linear prediction apparatus and speech signal linear prediction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6355207 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |