TWI634798B

TWI634798B - Audio signal output device and method, encoding device and method, decoding device and method, and program

Info

Publication number: TWI634798B
Application number: TW103117630A
Authority: TW
Inventors: 史潤宇; 知念徹; 山本優樹; 畠中光行
Original assignee: 新力股份有限公司
Priority date: 2013-05-31
Filing date: 2014-05-20
Publication date: 2018-09-01
Also published as: WO2014192603A1; CN105247893A; TW201505455A; RU2015149206A; RU2668113C2; US9866985B2; JP6376127B2; KR20160013861A; BR112015029344A2; US20160127847A1; EP3007469A4; EP3007469A1; JPWO2014192603A1

Abstract

本技術是有關於，能夠進行更具臨場感之音訊再生的音訊訊號輸出裝置及方法、編碼裝置及方法、解碼裝置及方法、以及程式。

假設從被配置在理想位置之假想揚聲器亦即理想揚聲器輸出聲音而被生成之音訊訊號被輸入時，求出理想揚聲器之位置與實際再生揚聲器之位置的距離。然後，藉由相應於所求出之距離的增益來進行音訊訊號的增益調整，增益調整後的音訊訊號係被再生揚聲器所再生。藉此，即使理想揚聲器與再生揚聲器之配置位置有偏離的情況下，仍可實現更具臨場感的音訊再生。本技術係可適用於再生裝置。

Description

音訊訊號輸出裝置及方法、編碼裝置及方法、解碼裝置及方法、以及程式

本技術係有關於音訊訊號輸出裝置及方法、編碼裝置及方法、解碼裝置及方法、以及程式，尤其是有關於，可進行更具臨場感的音訊再生的音訊訊號輸出裝置及方法、編碼裝置及方法、解碼裝置及方法、以及程式。

於多聲道的音訊再生中，再生側的揚聲器配置，係和音源的位置完全一致較為理想，但現實中再生側的揚聲器位置與音源的位置經常不同。

若再生側的揚聲器之配置位置和音源的位置不同，則會再非揚聲器之位置上產生音源，因此要如何再生此種音源的聲音，是重要的事項。

又，將位於任意位置的音源之聲音，從任意位置的揚聲器進行再生的方法，係有一種稱作VBAP(Vector Base Amplitude Pannning)的技術被提出(例如，參照非專利文獻1)。

在VBAP中，目標之音像之定位位置，係用朝向位於該定位位置之周圍的2個或3個揚聲器之方向的向量的線性和來表現。然後，於該線性和中，對各向量所乘算之係數，係被當成從各揚聲器所輸出之音訊訊號之增益來使用而進行增益調整，使得音像被定位在目標之位置。

〔先前技術文獻〕〔非專利文獻〕

〔非專利文獻1〕Ville Pulkki, “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, Journal of AES, vol.45, no.6, pp.456-466, 1997

順便一提，在先前技術中，音源的聲道數及揚聲器配置、與再生側的揚聲器的聲道數及揚聲器配置，是分別為被預定之聲道數和揚聲器配置的情況下，例如數個國際標準會議所推薦的7.1聲道配置和5.1聲道配置、5.1聲道配置和2.1聲道配置、或22.2聲道配置和5.1聲道配置的這種情況下，係有被提出聲音的再生方法。此種情況下，藉由降轉混音處理而從各揚聲器以適切的增益來輸出聲音，可實現具有臨場感的音訊再生。

然而，上記以外的情況下，或者音源位置或揚聲器配置位置是位於從預定位置偏離開來的位置的情況下，在所被提出的再生方法中，可能無法再生聲音，或是就算能夠再生但是音質與音像定義可能大幅劣化。

又，上述的VBAP中，在再生聲道基礎之音源的情況下，聲道基礎之音源的音像和音源所被再生之理想的揚聲器之位置幾乎都是不同，因此音像定義會大幅劣化。

如以上所述，在上述的技術中，難以實現具臨場感之音訊再生。

本技術係有鑑於此種狀況而研發，目的在於能夠進行更具臨場感的音訊再生。

本技術之第1側面的音訊訊號輸出裝置，係具備：距離計算部，係計算出再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離；和增益計算部，係基於前記距離而計算出前記音訊訊號的再生增益；和增益調整部，係基於前記再生增益而進行前記音訊訊號的增益調整。

可令前記增益計算部，基於用來獲得相對於各前記距離的前記再生增益所需的曲線資訊，來計算前記再生增益。

可將前記曲線資訊，設成表示折線曲線或函數曲線的資訊。

可令前記增益調整部，在前記理想揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。

可令前記增益調整部，基於根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。

可令前記增益調整部，在前記實際揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。

可令前記增益調整部，基於根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。

在音訊訊號輸出裝置中係可還設有：增益補正部，係基於理想中央揚聲器之位置、與前記實際揚聲器之位置的距離，來補正前記再生增益。

在音訊訊號輸出裝置中係可還設有：下限值補正部，係在前記再生增益小於預定之下限值時，將前記再生增益予以補正。

在音訊訊號輸出裝置係可還設置有：全體增益補正部，係根據以所被輸入之前記音訊訊號為基礎的輸入聲音之音壓的期望值、及前記再生增益，而算出以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎的輸出聲音之全體功率、和前記輸入聲音之全體功率的比值，基於前記比值而將前記再生增益予以補正。

本技術之第1側面的音訊訊號輸出方法或程式，係含有以下步驟：計算出再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離；基於前記距離而計算出前記音訊訊號的再生增益；基於前記再生增益而進行前記音訊訊號的增益調整。

在本技術的第1側面中，再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，會被計算出來；基於前記距離而會計算出前記音訊訊號的再生增益；基於前記再生增益而會進行前記音訊訊號的增益調整。

本技術之第2側面的編碼裝置，係具備：補正資訊生成部，係生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；和編碼部，係將前記音訊訊號予以編碼；和輸出部，係將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出。

本技術之第2側面的編碼方法，係含有以下步驟：生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；將前記音訊訊號予以編碼；將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出。

在本技術的第2側面中，補正資訊會被生成，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；前記音訊訊號會被編碼；含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，會被輸出。

本技術之第3側面的解碼裝置，係具備：抽出部，係從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和解碼部，係將前記已被編碼之前記音訊訊號予以解碼；和輸出部，係將已被解碼之前記音訊訊號及前記補正資訊，予以輸出。

可將前記補正資訊設成前記理想揚聲器之位置資訊。

可將前記補正資訊，設成用來獲得相對於各前記距離之增益所需的曲線資訊。

可將前記曲線資訊，設成表示折線曲線或函數曲線的資訊。

本技術之第3側面的解碼方法，係含有以下步驟：從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和將前記已被編碼之前記音訊訊號予以解碼；將已被解碼之前記音訊訊號及前記補正資訊，予以輸出。

在本技術的第3側面中，用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益所需的補正資訊，及已被編碼之前記音訊訊號，會被從位元串流中抽出；前記已被編碼之前記音訊訊號會被解碼；已被解碼之前記音訊訊號及前記補正資訊，會被輸出。

若依據本技術的第1側面乃至第3側面，則可進行更具臨場感的音訊再生。

11‧‧‧再生裝置

12‧‧‧再生揚聲器

21‧‧‧距離計算部

22‧‧‧再生增益計算部

23‧‧‧補正部

24‧‧‧下限值補正部

25‧‧‧全體增益補正部

26‧‧‧增益調整部

31‧‧‧增幅部

32‧‧‧增幅部

33‧‧‧增幅部

61‧‧‧編碼器

62‧‧‧解碼器

71‧‧‧詮釋資料生成部

72‧‧‧音訊訊號編碼部

73‧‧‧輸出部

81‧‧‧抽出部

82‧‧‧音訊訊號解碼部

83‧‧‧輸出部

501‧‧‧CPU

502‧‧‧ROM

503‧‧‧RAM

504‧‧‧匯流排

505‧‧‧輸出入介面

506‧‧‧輸入部

507‧‧‧輸出部

508‧‧‧記錄部

509‧‧‧通訊部

510‧‧‧驅動機

511‧‧‧可移除式媒體

〔圖1〕本技術之概要的說明圖。

〔圖2〕折線曲線的說明圖。

〔圖3〕函數曲線的說明圖。

〔圖4〕再生增益的說明圖。

〔圖5〕再生裝置之構成例的圖示。

〔圖6〕說明降轉混音處理的流程圖。

〔圖7〕音訊系統之構成例的圖示。

〔圖8〕詮釋資料的說明圖。

〔圖9〕說明編碼處理的流程圖。

〔圖10〕說明解碼處理的流程圖。

〔圖11〕電腦之構成例的圖示。

以下，參照圖面，說明適用了本技術的實施形態。

〈第1實施形態〉〈關於本技術之概要〉

本技術係有關於，將任意聲道之音源以任意數目之揚聲器進行再生的再生方法、再生方法之實現所必需的資訊(詮釋資料)的編碼及解碼技術。

首先說明本技術之概要。

例如，複數之各聲道的音訊訊號、和這些音訊訊號的詮釋資料係被供給至再生裝置，於再生裝置中，基於詮釋資料和音訊訊號，來控制聲音的再生。

此處，各聲道之音訊訊號，係假設是藉由被配置在詮釋資料所示之理想位置上的揚聲器所再生而被生成的訊號。以下，將位於詮釋資料所示之位置、將各聲道之音訊訊號予以再生的假想之揚聲器，稱作理想揚聲器。又，基於從再生裝置所輸出之音訊訊號而輸出聲音的實際揚聲器，稱作再生揚聲器。

在本技術中，全聲道之音訊訊號，係被分類成LFE(Low Frequency Effect)用的音訊訊號、和非LFE用的音訊訊號。亦即，全理想揚聲器係被分類成，LFE用的揚聲器、和非LFE用的揚聲器。同樣地，再生揚聲器也被分類成，LFE用的揚聲器、和非LFE用的揚聲器。

首先說明，非LFE用的聲道之音訊訊號的再生。

非LFE用的聲道之音訊訊號的再生中，例如圖1所示，基於理想揚聲器與再生揚聲器之距離，來進行音訊訊號的增益調整。

在圖1中，以視聽者的使用者U11的位置為中心的半徑r_u的球PH11之表面上，配置有理想揚聲器VSP1、和再生揚聲器RSP11-1乃至再生揚聲器RSP11-3。理想揚聲器VSP1及再生揚聲器RSP11-1乃至再生揚聲器RSP11-3，係為非LFE用的揚聲器。

此外，以下若沒有特別需要區別再生揚聲器RSP11-1乃至再生揚聲器RSP11-3時，則也會簡稱為再生揚聲器RSP11。又，在此例中，雖然只圖示了1個理想揚聲器及3個再生揚聲器，但實際上亦還有其他理想揚聲器或再生揚聲器存在。

例如，以理想揚聲器VSP1所對應之聲道之音訊訊號為基礎的聲音，係使音像被定位在理想揚聲器VSP1之位置為理想的。

於是，在本技術中，隨著理想揚聲器VSP1與再生揚聲器RSP11之距離來決定各再生揚聲器RSP11之再生增益，以這些再生增益令以音訊訊號為基礎之聲音從各再生揚聲器RSP11輸出，藉此以使音像被定位在理想揚聲器VSP1之位置。

具體而言，理想揚聲器VSP1與再生揚聲器RSP11之距離係被視為，以使用者U11為起點而指向理想揚聲器VSP1方向之向量、和以使用者U11為起點而指向再生揚聲器RSP11方向之向量，所夾的角度。

換言之，球PH11之表面上的理想揚聲器VSP1與再生揚聲器RSP11之距離、亦即2個揚聲器所連結的弧的長度，係被視為理想揚聲器VSP1與再生揚聲器RSP11之距離。

在圖1之例子中，箭頭A11與箭頭A12所夾的角度，係被視為理想揚聲器VSP1與再生揚聲器RSP11-1之距離DistM1。同樣地，箭頭A11與箭頭A13所夾的角度，係被視為理想揚聲器VSP1與再生揚聲器RSP11-2之距離DistM2；箭頭A11與箭頭A14所夾的角度，係被視為理想揚聲器VSP1與再生揚聲器RSP11-3之距離DistM3。

然後，例如理想揚聲器VSP1的聲道之音訊訊號，係基於距離DistM1而被增益調整然後被再生揚聲器RSP11-1所再生。又，理想揚聲器VSP1的聲道之音訊訊號，係分別基於距離DistM2及距離DistM3而被增益調整，被再生揚聲器RSP11-2及再生揚聲器RSP11-3所再生。

藉此，即使理想揚聲器VSP1與再生揚聲器RSP11之位置有偏離的情況下，仍可減輕其所產生之音像的偏離，可實現更具臨場感的音訊再生。

接著，更詳細說明關於非LFE用之聲道的音訊訊號之再生。

此處係說明，例如，具體而言，將非LFE用的M個理想揚聲器、亦即M聲道之音訊訊號予以降轉混音而當成N聲道之音訊訊號，將這些N聲道之音訊訊號藉由非LFE用的N個再生揚聲器予以再生之例子。

在降轉混音處理中，主要依序進行以下所示的6個處理STE1乃至處理STE6。

(處理STE1)：求出理想揚聲器與再生揚聲器之距離

(處理STE2)：根據所求出之距離與預定之衰減曲線，針對每一理想揚聲器求出各再生揚聲器之再生增益

(處理STE3)：隨著再生揚聲器之配置位置而補正再生增益

(處理STE4)：基於下限值而補正再生增益

(處理STE5)：以使得輸出聲音全體之能量，變成接近於輸入聲音全體之能量的方式，來補正再生增益

(處理STE6)：將再生增益適用於音訊訊號，進行增益調整

接下來，針對這些處理STE1乃至處理STE6，再加以說明。

〈關於處理STE1〉

首先，在處理STE1中，揚聲器間之距離會被求出，但各揚聲器之位置，係藉由水平方向角度θ(-180°≦θ≦+180°)、垂直方向角度γ(-90°≦γ≦+90°)、及從使用者到揚聲器為止之距離r(0≦r≦+∞)來表現。

例如於圖1中，考慮以使用者U11之位置為原點，而由x軸、y軸、及z軸所成之3維座標系。

此處，若將含有圖中縱深方向之直線、和圖中橫方向之直線的平面令作xy平面，則於xy平面中作為基準方向之直線例如y軸、與以使用者U11為起點的揚聲器方向之向量，於xy平面上所夾的角度，視為水平方向角度θ。亦即，水平方向角度θ係為圖1中水平方向之角度。

又，以使用者U11為起點的揚聲器方向之向量、與xy平面所夾的角度係被視為垂直方向角度γ，使用者U11與揚聲器所連結成的直線之長度視為距離r。

表示各理想揚聲器之位置的水平方向角度θ、垂直方向角度γ、及距離r，係被當成音訊訊號之詮釋資料而供給至再生裝置。又，對再生裝置係也供給著表示各再生揚聲器之位置的水平方向角度θ、垂直方向角度γ、及距離r。

此外，以下說明中，特別將M個理想揚聲器之其中的第m個理想揚聲器的水平方向角度θ、垂直方向角度γ、及距離r，分別以θ_im、γ_im、及r_im來表示。同樣地，以下將N個再生揚聲器之其中的第n個再生揚聲器的水平方向角度θ、垂直方向角度γ、及距離r，分別以θ_on、γ_on、及r_on來表示。

在再生裝置中，針對M個理想揚聲器，一一求出這些理想揚聲器、與N個各再生揚聲器之距離。

例如，第m個理想揚聲器、與第n個再生揚聲器之距離Dist(m,n)，係可由下式(1)求出。

在再生裝置中，係針對M個理想揚聲器與N個再生揚聲器之每一組合進行式(1)的計算，合計會計算出M×N個距離Dist(m,n)。

順便一提，各理想揚聲器或再生揚聲器若是被配置在半徑r_u之單位圓上、亦即圖1所示的球PH11上，則從各揚聲器所輸出的聲音，係同時到達使用者U11。可是，若一部分揚聲器沒有位於球PH11上，則來自該揚聲器的聲音，係會比來自其他揚聲器的聲音較早或較晚到達使用者U11，使用者聽到的聲音的音壓也會有變化。

於是，在再生裝置中，對於距離r_im≠r_u的理想揚聲器之音訊訊號，藉由補正值SoundPressureCorrection_im而進行音壓之補正，藉由延遲時間Delay_im而施行延遲處理。

藉此，理想揚聲器就可被視為是位於球PH11上。

具體而言，基於距離r_im和半徑r_u而進行下式(2)之計算，算出補正值SoundPressureCorrection_im。

由式(2)所求出的補正值SoundPressureCorrection_im，係對被輸入至理想揚聲器側、亦即再生裝置的聲道m之音訊訊號之補正時，會被使用。以下，特別將被輸入至再生裝置的音訊訊號稱作輸入音訊訊號，將從再生裝置所輸出的音訊訊號稱作輸出音訊訊號。

又，對理想揚聲器之輸入音訊訊號的延遲處理所需之延遲時間Delay_im，係基於距離r_im和半徑r_u而藉由下式(3)而被算出。此外，r_im>r_u時延遲時間Delay_im係變成負值，在延遲處理中音訊訊號會往負的方向被延遲，亦即音訊訊號會朝時間上較前的方向平移。

【數3】Delay_im=(r_u-r_im)×音速(s)．．．(3)

這些補正值SoundPressureCorrection_im和延遲時間Delay_im，係針對距離r_im≠r_u的理想揚聲器而被算出。同樣地，針對距離r_on≠r_u的再生揚聲器也算出補正值SoundPressureCorrection_on和延遲時間Delay_on。

亦即，藉由下式(4)而算出補正值SoundPressureCorrection_on，藉由式(5)而算出延遲時間Delay_on。

【數5】Delay_on=(r_u-r_on)×音速(s)．．．(5)

如此所被求出的補正值SoundPressureCorrection_on和延遲時間Delay_on，係為對於再生揚聲器側、亦即輸出音訊訊號的音壓之補正值和延遲時間。在再生裝置中，對於被供給至距離r_on≠r_u的再生揚聲器的音訊訊號藉由補正值SoundPressureCorrection_on而進行音壓之補正、藉由延遲時間Delay_on而施行延遲處理。

〈關於處理STE2〉

接下來，在處理STE2中，針對每一理想揚聲器而求出各再生揚聲器的再生增益。

首先針對M個各理想揚聲器，特定出是否有與該理想揚聲器之距離Dist(m,n)為「0」的再生揚聲器存在，各理想揚聲器係被分類成，位於再生揚聲器位置的揚聲器、或不位於再生揚聲器位置的揚聲器之任一種。

然後，針對被視為位於再生揚聲器位置之揚聲器的第m個理想揚聲器關於該第m個理想揚聲器所對應之聲道m之音訊訊號的第n個再生揚聲器之再生增益MixGain(m,n)，係藉由下式(6)而被算出。

在式(6)中，位於和距離Dist(m,n)為「0」的再生揚聲器、亦即第m個理想揚聲器相同位置的再生揚聲器之再生增益MixGain(m,n)，係被設成0dB。又，位於和距離Dist(m,n)非「0」之再生揚聲器、亦即第m個理想揚聲器不同位置的再生揚聲器之再生增益MixGain(m,n)，係被設成-∞ dB。

藉此，第m個理想揚聲器所對應之聲道m之音訊訊號，係在位於和該理想揚聲器相同位置的再生揚聲器中被再生。亦即，從其他再生揚聲器不會輸出聲道m之聲音成分。

相對於此，關於被視為非位於再生揚聲器位置之揚聲器的第m個理想揚聲器，係會使用折線曲線、或函數曲線之任一衰減曲線，求出關於該理想揚聲器的各再生揚聲器之再生增益MixGain(m,n)。

具體而言，被供給至再生裝置的詮釋資料中，係含有表示使用折線曲線、或函數曲線之任一曲線來求出再生增益的曲線資訊，再生裝置係使用詮釋資料中所含之曲線資訊所示之種類的曲線，來算出再生增益。

又，詮釋資料中也含有，表示在曲線資訊所示之種類之曲線之中要具體使用哪種曲線的曲線索引。曲線索引，係也可以是表示再生裝置中並未記錄的新的曲線之資訊。

再生裝置，係在曲線索引是表示預定之曲線的資訊時，則使用預先記錄的用來獲得係數等之曲線所需的資訊，來進行再生增益之算出。另一方面，若曲線索引是表示新曲線的資訊時，則再生裝置，係從詮釋資料讀出用來獲得新曲線所需的資訊，使用根據該資訊所獲得之曲線來算出再生增益。

例如，再生增益之算出中所使用的折線曲線，係藉由相對於各距離Dist(m,n)的再生增益之值所構成的數列來表現。

具體而言，作為再生增益之值的數列，〔0,-1.5,-4.5,-6,-9,-10.5,-12,-13.5,-15,-15,-16.5,-16.5,-18,-18,-18,-19.5,-19.5,-21,-21,-21,-∞,-∞,-∞,-∞,-∞,-∞〕 (dB)，係被當成用來獲得再生增益所需的資訊。

此種場合下，數列的起點之值係被視為距離Dist(m,n)=0°之時的再生增益，數列的終點之值係被視為距離Dist(m,n)=180°之時的再生增益。又，數列的第k個點之值，係被視為下式(7)所示之距離Dist(m,n)之時的再生增益。

又，數列的相鄰的點之間，係隨著距離Dist(m,n)而再生增益會做線性變化。藉由如此數列而獲得的折線曲線，係為表示再生增益MixGain(m,n)、與距離Dist(m,n)之映射的曲線。

例如，藉由上述數列而可獲得圖2所示的折線曲線。

在圖2中，縱軸係表示再生增益之值，橫軸係表示理想揚聲器與再生揚聲器之間的距離。又，折線CV11係表示折線曲線，折線曲線上的四角形，係表示構成再生增益之值的數列的1個數值。

在此例中，第n個再生揚聲器與第m個理想揚聲器之距離Dist(m,n)為DistM1時，則該第n個再生揚聲器之再生增益MixGain(m,n)，係被設成折線曲線上的DistM1時的增益之值-3.5dB。

又，距離Dist(m,n)為DistM2的再生揚聲器的再生增益MixGain(m,n)，係被設成折線曲線上的DistM2時的增益之值-8dB；距離Dist(m,n)為DistM3的再生揚聲器的再生增益MixGain(m,n)，係被設成折線曲線上的DistM3時的增益之值-16.5dB。

另一方面，再生增益之算出時所用的函數曲線，係藉由3個係數coef1、係數coef2、及係數coef3、和預定之下限的增益值MinGain而被表現。

此情況下，再生裝置係使用藉由係數coef1乃至係數coef3、增益值MinGain、及距離Dist(m,n)所表現的下式(8)所示之函數f(Dist(m,n))，計算以下的式(9)，算出關於第m個理想揚聲器的各再生揚聲器之再生增益MixGain(m,n)。

此外，於式(9)中，Cut_thre係為滿足下式 (10)的最小值。

【數10】f(Cut_thre)=MinGain=-21dB,f’(Cut_thre)<0．．．(10)

藉由此種函數f(Dist(m,n))等所表示的函數曲線，係為例如圖3所示的曲線。此外，於圖3中縱軸係表示再生增益之值，橫軸係表示理想揚聲器與再生揚聲器之間的距離。又，曲線CV21係表示函數曲線。

在圖3所示的函數曲線中，函數f(Dist(m,n))所示的再生增益之值一旦小於下限的增益值MinGain，則其以後的各距離Dist(m,n)上的再生增益之值係被設成「-∞」。此外，圖中的點線係表示，各距離Dist(m,n)上的原本之函數f(Dist(m,n))之值。

在此例中，第n個再生揚聲器與第m個理想揚聲器之距離Dist(m,n)為DistM1時，則該第n個再生揚聲器之再生增益MixGain(m,n)，係被設成函數曲線上的DistM1時的增益之值-6dB。

又，距離Dist(m,n)為DistM2的再生揚聲器的再生增益MixGain(m,n)，係被設成函數曲線上的DistM2時的增益之值-12dB；距離Dist(m,n)為DistM3的再生揚聲器的再生增益MixGain(m,n)，係被設成函數曲線上的DistM3時的增益之值-18dB。

此外，藉由函數曲線而求出再生增益MixGain(m,n)時，係數coef1乃至係數coef3之組合〔 coef1,coef2,coef3〕，係被設成例如〔8,-12,6〕或、〔1,-3,3〕、〔2,-5.3,4.2〕等。

藉由以上的處理，針對M個理想揚聲器之每一者，會分別獲得N個各再生揚聲器之再生增益MixGain(m,n)。這些再生揚聲器之再生增益之值，係越靠近理想揚聲器之距離Dist(m,n)則為越大的值，其聲音的音量也越大。此外，再生增益MixGain(m,n)，係在M>N時為混合增益。

〈關於處理STE3〉

然後，在處理STE3中，對於處理STE2所得到的M×N個之再生增益MixGain(m,n)，隨應於第n個再生揚聲器之配置位置而進行補正。

例如，來自位於使用者前方之音源的聲音，若從使用者後方聽見則會產生異樣感。相對於此，來自位於使用者後方之音源的聲音，即使從使用者前方被聽見，也不會產生很大的異樣感。

於是，隨著N個各再生揚聲器是相對於使用者而位於前方或後方等哪種位置，而將各再生揚聲器之再生增益予以補正，使得由再生揚聲器之位置所輸出的聲音，不會產生異樣感。亦即，理想揚聲器之距離Dist(m,n)為相同的、位於使用者之前方與後方的2個再生揚聲器，該理想揚聲器之音訊訊號再生時，會進行補正，以使得位於使用者後方的再生揚聲器之再生增益，小於前方的再生揚聲器之再生增益。

具體而言，首先再生裝置，係從詮釋資料取得表示相應於再生揚聲器之配置位置的是否必須補正再生增益的資訊，若取得的資訊是不需要補正再生增益之意旨的資訊，則不進行處理STE3。亦即，處理STE2之後，處理STE3就被略過而進行處理STE4。

另一方面，從詮釋資料所取得的資訊，是需要補正再生增益之意旨的資訊時，則再生裝置係進行和式(1)同樣之計算而求出N個各再生揚聲器、與空間原點C之距離Dist(n,C)。

此處，所謂空間原點C，係為再生揚聲器所被配置的空間上之基準的位置，例如空間原點C之位置，係為藉由水平方向角度θ=0、垂直方向角度γ=0、及距離r=r_u所表現的位置。此情況下，空間原點C之位置係會位於單位圓、亦即圖1的球PH11上，且位於使用者U11的正面。此種空間原點C之位置，係為理想的中央揚聲器之位置。

若針對N個再生揚聲器求出空間原點C之距離Dist(n,C)，則藉由下式(11)之計算而求出N個各再生揚聲器之補正係數spkr_pos_correction_coeffcient(n)。

此外，於式(11)中Max_spkr_pos_correction_coeffcient係表示，距離Dist(n,C)為最大(180°)時的補正係數。

然後，所被求出的補正係數spkr_pos_correction_coeffcient(n)，係被乘算關於第m個理想揚聲器的第n個再生揚聲器的再生增益MixGain(m,n)，變成補正後的再生增益MixGain_pos_corr(m,n)。亦即，進行下式(12)之計算。

此外，於式(12)中，MaxMixGain(n)係為關於第n個再生揚聲器的M個再生增益、亦即n之值為相同的再生增益MixGain(m,n)的最大值。於式(12)中，MaxMixGain(n)所被含有的項，係為了不要被spkr_pos_correction_coeffcient(n)進行過度補正所需的逆補正的項。

藉由以上的處理，就會獲得隨著再生揚聲器之配置位置而被適宜補正過的M×N個再生增益MixGain_pos_corr(m,n)。

此外，若不進行相應於再生揚聲器之配置位置的再生增益之補正，則再生增益MixGain(m,n)係被直接當成再生增益MixGain_pos_corr(m,n)。

〈關於處理STE4〉

又，在處理STE3之後所被進行的處理STE4中，對於全部再生揚聲器之再生增益是較小值的理想揚聲器之音訊訊號，至少於1個再生揚聲器中會補正再生增益，使其以預定之再生增益的下限值來再生音訊訊號。

亦即，處理STE3所得到的理想揚聲器之每一者的之再生增益、亦即m之值為相同的N個再生增益MixGain_pos_corr(m,n)的最大值MaxMixGain_i(m)會被求出，該最大值MaxMixGain_i(m)與下限值MixGain_MinThre會被比較。

然後，針對所定之第m個理想揚聲器，若最大值MaxMixGain_i(m)小於下限值MixGain_MinThre，則對關於該第m個理想揚聲器的N個再生增益MixGain_pos_corr(m,n)，加算補正值MinGain_correctioni(m)。此處，補正值MinGain_correctioni(m)，係如下式(13)所示，係為最大值MaxMixGain_i(m)與下限值MixGain_MinThre之差分。

藉由如此補正，會藉由至少1個再生揚聲器而將聲道m之音訊訊號以所定之最低再生增益而被再生，可防止特定聲道之聲音變成聽不見。

〈關於處理STE5〉

又，在處理STE5中，會使得輸出聲音全體之能量，接近於輸入聲音全體之能量的方式，來補正再生增益MixGain_pos_corr(m,n)。

首先，再生裝置係從詮釋資料讀出理想揚聲器的各聲道間的相對音壓之期望值SPR_i(m)，將其中音壓最大的理想揚聲器的絕對音壓假定為0dBFS，根據每一理想揚聲器的各期望值SPR_i(m)而計算各聲道的音訊訊號之聲音的音壓，求出輸入音訊訊號的聲音全體之功率值pow_i。

此處，功率值pow_i係為，藉由再生M個各聲道之音訊訊號而從理想揚聲器所輸出之聲音(以下亦稱作輸入聲音)的全體功率。又，以下，藉由再生N個各聲道之音訊訊號而從再生揚聲器所輸出的聲音，亦稱作輸出聲音。

接著，再生裝置係對處理STE4所得到之再生增益MixGain_pos_corr(m,n)，乘算期望值SPR_i(m)，求出各再生揚聲器的輸出聲音之音壓的期望值SPR_o(n)，根據期望值SPR_o(n)而求出輸出聲音全體的功率值pow_o。

然後，再生裝置係對處理STE4所得到的所有再生增益MixGain_pos_corr(m,n)，乘算輸入聲音與輸出聲音之功率值的比值(pow_o/pow_i)，進行輸出聲音全體的音壓補正。如此所得到的再生增益，係為每一理想揚聲器的各再生揚聲器的最終再生增益。

此處，雖然假定音壓最大的理想揚聲器的絕對音壓為0dB，而求出輸入聲音與輸出聲音之功率值的比值(pow_o/pow_i)，但其值係和使用實際的絕對音壓所求出的輸入聲音與輸出聲音之功率值的比值(pow_o/pow_i)為相同值。若如此假定輸入聲音的絕對音壓，則即使不知道實際的輸入聲音的絕對音壓，仍可求出輸入聲音與輸出聲音之功率值的比值(pow_o/pow_i)。此外，即使所假定之音壓值並非0dB而是其他任意值，結果所得之功率值的比仍為相同值。

〈關於LFE用的揚聲器〉

然後，說明，LFE用的聲道之音訊訊號的再生。

例如，LFE用的理想揚聲器之數目，係為0個、1個、或2個之其中一種，同樣第LFE用的再生揚聲器之數目也是0個、1個、或2個之其中一種。

LFE用的理想揚聲器之數目、或LFE用的再生揚聲器之數目皆為0個時，則LFE用的聲道之音訊訊號係為無法再生，該音訊訊號之增益係為-∞。

相對於此，LFE用的理想揚聲器或再生揚聲器之數目為1個或2個時，則再生裝置中係藉由例如圖4所示之再生增益，生成LFE用的各聲道之音訊訊號。

亦即，LFE用的理想揚聲器和LFE用的再生揚聲器皆為1個或2個的時候，LFE用的理想揚聲器之音訊訊號，係直接當成LFE用的再生揚聲器之音訊訊號而被再生。

又，LFE用的理想揚聲器為1個、LFE用的再生揚聲器為2個的情況，或LFE用的理想揚聲器為2個、LFE用的再生揚聲器為1個的情況下，則各聲道之音訊訊號係被均等分配。

亦即，相對於LFE用的理想揚聲器1個，而LFE用的再生揚聲器為2個時，理想揚聲器之音訊訊號係以相同再生增益而被增益調整，分別被2個再生揚聲器所再生。又，相對於LFE用的理想揚聲器2個，而LFE用的再生揚聲器為1個時，理想揚聲器之音訊訊號係以相同再生增益而被加總然後被當成1個音訊訊號，被再生揚聲器所再生。

〈再生裝置之構成例〉

接下來說明以上所說明的再生裝置的具體實施形態。

再生裝置，係為例如圖5所示之構成。

圖5所示之再生裝置11，係從未圖示的解碼器等接受詮釋資料與音訊訊號之供給，基於詮釋資料而進行音訊訊號的增益調整，將其結果所得到的音訊訊號，供給至揚聲器12-1乃至揚聲器12-N。

此外，在圖5中係僅圖示再生裝置11之中的用來再生非LFE用的聲道之音訊訊號所需的機能區塊，用來再生LFE用的聲道之音訊訊號所需的機能區塊之圖示係被省略。

又，在圖5中，假設非LFE用的M個各理想揚聲器所對應之M聲道之音訊訊號會被供給，這些M聲道之音訊訊號係被轉換成N聲道之音訊訊號而被輸出。然後，揚聲器12-1乃至揚聲器12-N，係對應於以上所說明的非LFE用的再生揚聲器。

以下，若沒有特別需要區別揚聲器12-1乃至揚聲器12-N時，則簡稱揚聲器12。又，各揚聲器12為係對應於以上所說明之再生揚聲器RSP11的揚聲器，因此也將揚聲器12稱作再生揚聲器12。

圖5所示之再生裝置11中係設有：距離計算部21、再生增益計算部22、補正部23、下限值補正部24、全體增益補正部25、及增益調整部26。又，增益調整部26係具備：增幅部31、增幅部32、及增幅部33。

對距離計算部21係供給著，詮釋資料中所含之非LFE用的各理想揚聲器之位置資訊、和各再生揚聲器12之位置資訊。距離計算部21，係基於理想揚聲器之位置資訊與再生揚聲器12之位置資訊而算出距離Dist(m,n)，供給至再生增益計算部22。

此處，所謂各揚聲器之位置資訊係為，由水平方向角度θ、垂直方向角度γ、及距離r所成之資訊。

又，距離計算部21，係因應需要而算出理想揚聲器側之補正值SoundPressureCorrection_im及延遲時間Delay_im而供給至增幅部31，並且，算出再生揚聲器12側之補正值SoundPressureCorrection_on及延遲時間Delay_on而供給至增幅部33。亦即，在距離計算部21中係進行處理STE1。

對再生增益計算部22係供給著詮釋資料中所含之曲線資訊和曲線索引，再生增益計算部22係使用曲線資訊或曲線索引、和從距離計算部21所供給之距離來算出再生增益MixGain(m,n)，供給至補正部23。亦即，再生增益計算部22中係進行處理STE2。

對補正部23係供給著，再生揚聲器12之位置資訊、和詮釋資料中所含之表示是否需要隨著再生揚聲器12之配置位置而補正再生增益的資訊、及補正係數Max_spkr_pos_correction_coeffcient。

補正部23，係基於這些所被供給之資訊，對從再生增益計算部22所供給之再生增益進行相應於再生揚聲器12之配置位置的補正，將其結果所得之再生增益MixGain_pos_corr(m,n)，供給至下限值補正部24。亦即，在補正部23中係進行處理STE3。

對下限值補正部24係供給著，詮釋資料中所含之再生增益的下限值MixGain_MinThre。下限值補正部24，係基於下限值MixGain_MinThre而進行從補正部23所供給之再生增益之補正，供給至全體增益補正部25。亦即，在下限值補正部24中係進行處理STE4。

對全體增益補正部25係供給著，詮釋資料中所含之理想揚聲器之各聲道間的相對音壓的期望值SPR_i(m)。全體增益補正部25，係基於期望值SPR_i(m)，而進行從下限值補正部24所供給之再生增益之補正，將其結果所得之最終的再生增益，供給至增幅部32。在全體增益補正部25中係進行處理STE5。

增益調整部26，係對從未圖示之解碼器所供給之M個理想揚聲器之音訊訊號，進行增益調整而生成N聲道之音訊訊號，將各聲道之音訊訊號供給至再生揚聲器12而再生出聲音。在增益調整部26中係進行處理STE6。

亦即，增幅部31，係基於從距離計算部21所供給之補正值及延遲時間，而對所被供給之M聲道之音訊訊號，適宜施行增益補正及延遲處理然後供給至增幅部32。

增幅部32，係對從增幅部31所供給之M聲道之音訊訊號，乘算從全體增益補正部25所供給之再生增益。又，增幅部32，係將已被再生增益所乘算之各理想揚聲器之音訊訊號予以加算，以生成N聲道之音訊訊號，供給至增幅部33。

增幅部33，係基於從距離計算部21所供給之補正值及延遲時間，而對從增幅部32所供給之N聲道之音訊訊號，適宜施行增益補正及延遲處理然後供給至再生揚聲器12。

〈降轉混音處理之說明〉

接下來，說明再生裝置11之動作。

一旦對再生裝置11供給各理想揚聲器之音訊訊號和詮釋資料，則再生裝置11係對LFE用的音訊訊號、和非LFE用的音訊訊號，分別生成供給至再生揚聲器的音訊訊號，並輸出之。

以下，參照圖6之流程圖，說明再生裝置11對非LFE用的音訊訊號所進行的降轉混音處理。

於步驟S11中，距離計算部21係基於詮釋資料中所含之非LFE用的理想揚聲器之位置資訊、和非LFE用的再生揚聲器12之位置資訊，而求出理想揚聲器與再生揚聲器12之距離Dist(m,n)，供給至再生增益計算部22。具體而言，係針對理想揚聲器與再生揚聲器12之每一組合而進行式(1)之計算，求出M×N個距離Dist(m,n)。

於步驟S12中，距離計算部21係因應需要，而求出理想揚聲器側與再生揚聲器12側的補正值及延遲時間。

具體而言，距離計算部21係針對距離r_im≠r_u的理想揚聲器，基於身為理想揚聲器之位置資訊的距離r_im而進行式(2)及式(3)之計算，算出補正值SoundPressureCorrection_im及延遲時間Delay_im而供給至增幅部31。

又，距離計算部21係針對距離r_on≠r_u的再生揚聲器，基於身為再生揚聲器12之位置資訊的距離r_on而進行式(4)及式(5)之計算，算出補正值SoundPressureCorrection_on及延遲時間Delay_on而供給至增幅部33。

於步驟S13中，再生增益計算部22係基於從距離計算部21所供給之距離Dist(m,n)，而針對每一理想揚聲器，求出各再生揚聲器12之再生增益。

例如，再生增益計算部22，係針對有理想揚聲器與再生揚聲器12之距離Dist(m,n)為「0」的再生揚聲器12存在的理想揚聲器，進行式(6)之計算，算出針對該理想揚聲器的各再生揚聲器12之再生增益MixGain(m,n)。

又，再生增益計算部22，針對沒有距離Dist(m,n)=0的再生揚聲器12存在的理想揚聲器，係獲得詮釋資料中所含之曲線資訊所示之曲線、亦即折線曲線或函數曲線。此時，再生增益計算部22，係參照曲線索引，因應需要而從詮釋資料讀出折線曲線或函數曲線。

再生增益計算部22係一旦獲得折線曲線或函數曲線，則基於所得到之曲線而計算對應於距離Dist(m,n)的增益值，將所求出之增益值，當成關於理想揚聲器之再生揚聲器12的再生增益MixGain(m,n)。此時，因應需要，會進行式(7)或式(9)之計算。

再生增益計算部22，係針對各理想揚聲器，一旦獲得每一再生揚聲器12的再生增益MixGain(m,n)，則將再生增益MixGain(m,n)供給至補正部23。

於步驟S14中，補正部23係基於詮釋資料中所含之表示是否需要補正再生增益的資訊，因應需要而將從再生增益計算部22所供給之再生增益，隨著再生揚聲器12之配置位置而進行補正，供給至下限值補正部24。

具體而言，補正部23，係使用各再生揚聲器12之位置資訊、和詮釋資料中所含之補正係數Max_spkr_pos_correction_coeffcient，來計算式(11)及式(12)，算出再生增益MixGain_pos_corr(m,n)。

於步驟S15中，下限值補正部24係因應需要，基於詮釋資料中所含之下限值MixGain_MinThre，將從補正部23所供給之再生增益予以補正，然後供給至全體增益補正部25。具體而言，因應需要而計算式(13)，對再生增益MixGain_pos_corr(m,n)加算補正值MinGain_correctioni(m)。

於步驟S16中，全體增益補正部25係進行輸出聲音全體的音壓補正。

亦即，全體增益補正部25，係基於詮釋資料中所含之期望值SPR_i(m)、和從下限值補正部24所供給之再生增益MixGain_pos_corr(m,n)，而算出輸入聲音與輸出聲音的全體之功率值的比值(pow_o/pow_i。然後，全體增益補正部25，係將功率值之比值(pow_o/pow_i)，乘算至再生增益MixGain_pos_corr(m,n)而當成最終的再生增益，供給至增幅部32。

於步驟S17中，增幅部31係基於從距離計算部21所供給之理想揚聲器側的補正值及延遲值，來進行音訊訊號的增益調整。

具體而言增幅部31係針對補正值和延遲值所供給的聲道m之音訊訊號，對音訊訊號乘算補正值SoundPressureCorrection_im，將其結果所得之音訊訊號以延遲時間Delay_im往時間方向做延遲然後供給至增幅部32。

於步驟S18中，增幅部32係基於從全體增益補正部25所供給之再生增益、和從增幅部31所供給之音訊訊號，而生成各再生揚聲器12的音訊訊號，供給至增幅部33。

具體而言，增幅部32係將再生揚聲器12所對應之N個的聲道之其中的1個當成注目聲道nc，則將關於注目聲道nc的各理想揚聲器之再生增益，乘算至這些理想揚聲器之音訊訊號。然後，增幅部32係將已被再生增益所乘算的各理想揚聲器之音訊訊號、亦即M個音訊訊號予以加總所得的1個音訊訊號，當作注目聲道nc之音訊訊號。藉由將N個各聲道當成注目聲道而進行同樣之處理，M個各理想揚聲器之音訊訊號就會被轉換成N個各再生揚聲器12的音訊訊號。

於步驟S19中，增幅部33係基於從距離計算部21所供給之再生揚聲器12側的補正值及延遲值，來進行從增幅部32所供給之音訊訊號的增益調整。

具體而言，增幅部33係針對補正值和延遲值有被供給的聲道n之音訊訊號，對音訊訊號乘算補正值SoundPressureCorrection_on，將其結果所得之音訊訊號，以延遲時間Delay_on在時間方向上做延遲然後供給至再生揚聲器12。

一旦各聲道之音訊訊號被再生揚聲器12所輸出，降轉混音處理係結束。又，在再生揚聲器12中，係基於從再生裝置11所供給之音訊訊號而再生出聲音。

如以上所述，再生裝置11，係隨著理想揚聲器之位置與實際再生揚聲器12之配置位置的距離而進行音訊訊號的增益調整(增益補正)。藉此，即使理想揚聲器與再生揚聲器12之位置有偏離的情況下，仍可抑制輸出聲音之音質與音像定位的劣化，可進行更具臨場感的音訊再生。

藉由以上所說明之處理，就可將已被輸入之任意1個以上的聲道之音訊訊號，以1個以上的任意個數之配置在任意位置的再生揚聲器，進行再生。又，即使所被輸入之各聲道之音訊訊號係為將各物件當成音源的音訊訊號的情況下，仍可藉由同樣的降轉混音處理，就能以正確的音像位置進行音訊再生。

〈關於編碼器和解碼器〉

接著說明，將被供給至再生裝置11詮釋資料予以編碼的編碼器，和將已被編碼之詮釋資料予以解碼的解碼器。

例如圖7所示，適用了本技術的音訊系統中，從編碼器61往解碼器62會供給詮釋資料，然後從解碼器62往再生裝置11會供給詮釋資料。

編碼器61，係從外部取得用來獲得詮釋資料所必須之資訊、和M個各理想揚聲器之音訊訊號，生成由已被編碼之詮釋資料與音訊訊號所成之位元串流。

編碼器61係具備：詮釋資料生成部71、音訊訊號編碼部72、及輸出部73。

詮釋資料生成部71，係從外部取得必要的資訊，並且將所取得之資訊因應需要而編碼，生成已被編碼之詮釋資料。

例如，詮釋資料中係含有：各理想揚聲器之位置資訊、理想揚聲器之其中的LFE用的理想揚聲器之數目(聲道數)、及曲線資訊、曲線索引。又，詮釋資料中係還含有：表示是否需要隨著再生揚聲器12之配置位置而補正再生增益的資訊、再生揚聲器12之配置所致之補正係數Max_spkr_pos_correction_coeffcient、增益的下限值MixGain_MinThre、及聲道間的相對音壓之期望值SPR_i(m)。

音訊訊號編碼部72，係將從外部所供給之音訊訊號予以編碼。輸出部73，係生成含有已被編碼之詮釋資料、和已被編碼之音訊訊號的位元串流，輸出至解碼器62。

又，解碼器62係具備：抽出部81、音訊訊號解碼部82、及輸出部83。解碼器62係將從編碼器61所發送過來的位元串流予以接收，抽出部81係從所接收之位元串流中，抽出詮釋資料和音訊訊號。此時，抽出部81係因應需要而進行詮釋資料的解碼。

音訊訊號解碼部82，係將已被抽出部81所抽出之音訊訊號，予以解碼。輸出部83，係將已被抽出部81所抽出之詮釋資料、和已被音訊訊號解碼部82所解碼之音訊訊號，供給至再生裝置11。

然後，從編碼器61往解碼器62輸出的位元串流中所描述的詮釋資料之一部分，係例如圖8所示。亦即，圖8係表示詮釋資料之一部分的語法。

在圖8的例子中，在標頭之開頭係配置有，表示降轉混音所必須之資訊是否有被包含在詮釋資料中的資訊「down mix coef exist flag」。

又，詮釋資料中係配置有曲線資訊「down mix coef mode」，其下還配置有曲線索引「polyline curve idx」或「function curve idx」。

「polyline curve idx」係表示折線曲線，其值若為2進位數「111」，則表示是新的折線曲線。此情況下，會描述用來獲得新的折線曲線所需的資訊「polyline curve coeffcient[j]」。

用來獲得新的折線曲線所需的資訊，係為例如圖2所示之折線CV11上的四角形的各點(以下稱作描述點)、亦即將構成數列之各值予以特定的資訊。

具體而言，例如再生增益軸(縱軸)係被16分割，定義有16條分割線。各描述點，係在縱軸之各分割線上被依序配置。

在詮釋資料內，描述點係以「0」來表示，表示各描述點是被配置在哪條分割線上的資訊，係以「1」來表示。

圖2中，假設從左起依序描述描述點，首先，表示從左數來第1個描述點是位於從上往下數來第幾條分割線上的資訊是以「1」之數值來描述，其後，描述有表示描述點的「0」。此處，由於從左數來第1個描述點是位於最上位之分割線上，因此只有描述了表示描述點的「0」。

又，其以後，表示該描述點是位於從上一描述點所位於之分割線起算往下數Q條分割線上的資訊是以Q個「1」而被描述，其後描述有表示描述點的「0」。

例如，從左數來第3個描述點是位於從第2 個描述點起往下2條之分割線上，因此2個「1」會被描述，其後會描述有1個「0」。又，從左數來第10個描述點係和第9個描述點位於相同分割線上，亦即位於往下0條之分割線上，因此不會描述「1」，僅描述1個「0」。

藉由上記方法而進行描述，若所有的描述點之描述都完成，則會描述1個「1」，表示折線曲線的資訊之描述係已結束。但是，描述點的數目較多，合起來就算使用64個「1」與「0」都無法完全描述的情況下，係一直描述直到「1」與「0」之數量達到64為止，其後就結束描述。

因此，用來獲得折線曲線所需之資訊從詮釋資料中讀出時，係直到讀出16個「1」，或合計64個「1」與「0」(亦即，「1」與「0」合計有64個)為止，依序讀出用來獲得各描述點所需的資訊，生成折線曲線。

又，「function curve idx」係表示函數曲線，其值若為2進位數「111」，則表示是新的函數曲線。此情況下，作為新的函數曲線之係數，會描述有「function_curve_coeffcient[i]」。

又，詮釋資料中所被描述的「minimun_gain_threshold_idx」，係為表示增益之下限值MixGain_MinThre的索引。再者，詮釋資料中所被描述的「gain_correction_coeffcient」，係為隨著再生揚聲器12之配置位置而補正再生增益時所必須之補正係數 Max_spkr_pos_correction_coeffcient。此處，Max_spkr_pos_correction_coeffcient之值為「1」時，係表示不需要隨著再生揚聲器12之配置位置來補正再生增益。

然後，詮釋資料中係還描述有，表示聲道間之相對音壓的期望值SPR_i(m)是否有被描述在詮釋資料內的資訊「sound_level_exist_flag」，隨著該「sound_level_exist_flag」之值而會描述有「channel sound level[i]」。「channel sound level[i]」，係為期望值SPR_i(m)。

〈編碼處理之說明〉

再來，說明編碼器61與解碼器62之動作。

首先，參照圖9的流程圖，說明編碼器61所進行的編碼處理。

於步驟S41中，詮釋資料生成部71，係從外部取得必要的資訊，並且進行所取得之資訊的編碼，以生成已被編碼之詮釋資料。例如，詮釋資料生成部71係生成對應於圖8所示之語法的詮釋資料。

於步驟S42中，音訊訊號編碼部72，係將從外部所供給之音訊訊號予以編碼。

於步驟S43中，輸出部73，係生成含有已被編碼之詮釋資料、和已被編碼之音訊訊號的位元串流，輸出至解碼器62。然後，一旦位元串流被輸出，編碼處理就結束。

如以上所述，編碼器61係生成含有理想揚聲器之位置資訊，或曲線資訊等的詮釋資料，並輸出之。藉由如此將理想揚聲器之位置資訊或曲線資訊所成之資訊當成詮釋資料而予以生成，在再生裝置11中，就可隨著理想揚聲器之位置與實際的再生揚聲器12之配置位置之距離來補正增益等，可進行適切的增益補正。其結果為，可進行更具臨場感之音訊再生。

〈解碼處理之說明〉

接著，參照圖10的流程圖，說明解碼器62所進行的解碼處理。

於步驟S71中，解碼器62係將從編碼器61所發送過來的位元串流予以接收，抽出部81係從所接收之位元串流中，抽出詮釋資料和音訊訊號。又，抽出部81係也進行詮釋資料的解碼。

於步驟S72中，音訊訊號解碼部82，係將已被抽出部81所抽出之音訊訊號，予以解碼。

於步驟S73中，輸出部83，係將已被解碼之詮釋資料、和已被解碼之音訊訊號，輸出至再生裝置11，解碼處理係結束。

如以上所述，解碼器62係將詮釋資料和音訊訊號予以解碼，將含有理想揚聲器之位置資訊、或曲線資訊等的詮釋資料和音訊訊號，輸出至再生裝置11。藉由如此將理想揚聲器之位置資訊或曲線資訊所成之資訊當成詮釋資料而予以輸出，在再生裝置11中，就可隨著理想揚聲器之位置與實際的再生揚聲器12之配置位置之距離來補正增益等，可進行適切的增益補正。其結果為，可進行更具臨場感之音訊再生。

順便一提，上述一連串處理，係可藉由硬體來執行，也可藉由軟體來執行。在以軟體來執行一連串之處理時，構成該軟體的程式，係可安裝至電腦。此處，電腦係包含：被組裝在專用硬體中的電腦，或藉由安裝各種程式而可執行各種機能的例如通用之電腦等。

圖11係以程式來執行上述一連串處理的電腦的硬體之構成例的區塊圖。

於電腦中，CPU501,ROM502,RAM503係藉由匯流排504而被彼此連接。

在匯流排504上係還連接有輸出入介面505。輸出入介面505上係連接有：輸入部506，輸出部507，記錄部508，通訊部509、及驅動機510。

輸入部506，係由鍵盤，滑鼠，麥克風，攝像元件等所成。輸出部507係由顯示器，揚聲器等所成。記錄部508，係由硬碟或非揮發性記憶體等所成。通訊部509係由網路介面等所成。驅動機510係驅動：磁碟，光碟，光磁碟，或半導體記憶體等之可移除式媒體511。

在如以上構成的電腦中，藉由CPU501而例如將記錄部508中所記錄之程式透過輸出入介面505及匯流排504，而載入至RAM503裡並加以執行，就可進行上述一連串處理。

電腦(CPU501)所執行的程式，係可記錄在例如封裝媒體等之可移除式媒體511中而提供。又，程式係可透過區域網路，網際網路，數位衛星播送這類有線或無線的傳輸媒介而提供。

在電腦中，程式係藉由將可移除式媒體511裝著至驅動機510，就可透過輸出入介面505，安裝至記錄部508。又，程式係可透過有線或無線之傳輸媒體，以通訊部509接收之，安裝至記錄部508。除此以外，程式係可事前安裝在ROM502或記錄部508中。

此外，電腦所執行的程式，係可為依照本說明書所說明之順序而在時間序列上進行處理的程式，也可平行地，或呼叫進行時等必要之時序上進行處理的程式。

又，本技術的實施形態係不限定於上述實施形態，在不脫離本技術主旨的範圍內可做各種變更。

例如，本技術係亦可將1個機能透過網路而分擔給複數台裝置，採取共通進行處理的雲端運算之構成。

又，上述的流程圖中所說明的各步驟，係可由1台裝置來執行以外，亦可由複數台裝置來分擔執行。

甚至，若1個步驟中含有複數處理的情況下，該1個步驟中所含之複數處理，係可由1台裝置來執行以外，也可由複數台裝置來分擔執行。

甚至，本技術係亦可採取以下構成。

〔1〕一種音訊訊號輸出裝置，具備：距離計算部，係計算出再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離；和增益計算部，係基於前記距離而計算出前記音訊訊號的再生增益；和增益調整部，係基於前記再生增益而進行前記音訊訊號的增益調整。

〔2〕如〔1〕所記載之音訊訊號輸出裝置，其中，前記增益計算部，係基於用來獲得相對於各前記距離的前記再生增益所需的曲線資訊，來計算前記再生增益。

〔3〕如〔2〕所記載之音訊訊號輸出裝置，其中，前記曲線資訊係為表示折線曲線或函數曲線的資訊。

〔4〕如〔1〕或〔2〕所記載之音訊訊號輸出裝置，其中，前記增益調整部，係在前記理想揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。

〔5〕如〔4〕所記載之音訊訊號輸出裝置，其中，前記增益調整部，係基於根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。

〔6〕如〔1〕或〔2〕所記載之音訊訊號輸出裝置，其中，前記增益調整部，係在前記實際揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。

〔7〕如〔6〕所記載之音訊訊號輸出裝置，其中，前記增益調整部，係基於根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。

〔8〕如〔1〕乃至〔7〕之任一項所記載之音訊訊號輸出裝置，其中，還具備：增益補正部，係基於理想中央揚聲器之位置、與前記實際揚聲器之位置的距離，來補正前記再生增益。

〔9〕如〔1〕乃至〔8〕之任一項所記載之音訊訊號輸出裝置，其中，還具備：下限值補正部，係在前記再生增益小於預定之下限值時，將前記再生增益予以補正。

〔10〕如〔1〕乃至〔9〕之任一項所記載之音訊訊號輸出裝置，其中，還具備：全體增益補正部，係根據以所被輸入之前記音訊訊號為基礎的輸入聲音之音壓的期望值、及前記再生增益，而算出以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎的輸出聲音之全體功率、和前記輸入聲音之全體功率的比值，基於前記比值而將前記再生增益予以補正。

〔11〕一種音訊訊號輸出方法，係含有以下步驟：計算出再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離；基於前記距離而計算出前記音訊訊號的再生增益；基於前記再生增益而進行前記音訊訊號的增益調整。

〔12〕一種程式，係令電腦執行包含以下步驟之處理：計算出再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離；基於前記距離而計算出前記音訊訊號的再生增益；基於前記再生增益而進行前記音訊訊號的增益調整。

〔13〕一種編碼裝置，係具備：補正資訊生成部，係生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；和編碼部，係將前記音訊訊號予以編碼；和輸出部，係將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出。

〔14〕一種編碼方法，係含有以下步驟：生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；將前記音訊訊號予以編碼；將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出。

〔15〕一種解碼裝置，係具備：抽出部，係從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和解碼部，係將前記已被編碼之前記音訊訊號予以解碼；和輸出部，係將已被解碼之前記音訊訊號及前記補正資訊，予以輸出。

〔16〕如〔15〕所記載之解碼裝置，其中，前記補正資訊係為前記理想揚聲器之位置資訊。

〔17〕如〔15〕或〔16〕所記載之解碼裝置，其中，前記補正資訊，係為用來獲得相對於各前記距離之增益所需的曲線資訊。

〔18〕如〔17〕所記載之解碼裝置，其中，前記曲線資訊係為表示折線曲線或函數曲線的資訊。

〔19〕一種解碼方法，係含有以下步驟：從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置、與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和將前記已被編碼之前記音訊訊號予以解碼；將已被解碼之前記音訊訊號及前記補正資訊，予以輸出。

Claims

一種音訊訊號輸出裝置，具備：距離計算部，係計算出再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離；和增益計算部，係基於前記距離而計算出前記音訊訊號的再生增益；和增益調整部，係基於前記再生增益而進行前記音訊訊號的增益調整；和全體增益補正部，係根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
如請求項1所記載之音訊訊號輸出裝置，其中，前記增益計算部，係基於用來獲得相對於各前記距離的前記再生增益所需的曲線資訊，來計算前記再生增益。
如請求項2所記載之音訊訊號輸出裝置，其中，前記曲線資訊係為表示折線曲線或函數曲線的資訊。
如請求項1所記載之音訊訊號輸出裝置，其中，前記增益調整部，係在前記理想揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。
如請求項4所記載之音訊訊號輸出裝置，其中，前記增益調整部，係基於根據從前記基準點到前記理想揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。
如請求項1所記載之音訊訊號輸出裝置，其中，前記增益調整部，係在前記實際揚聲器並非位於以所定基準點為中心之單位圓上的情況下，則藉由根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的增益，再次進行前記音訊訊號的增益調整。
如請求項6所記載之音訊訊號輸出裝置，其中，前記增益調整部，係基於根據從前記基準點到前記實際揚聲器為止之距離與前記單位圓之半徑而被決定的延遲時間而延遲前記音訊訊號。
如請求項1所記載之音訊訊號輸出裝置，其中，還具備：增益補正部，係基於理想中央揚聲器之位置，與前記實際揚聲器之位置的距離，來補正前記再生增益。
如請求項1所記載之音訊訊號輸出裝置，其中，還具備：下限值補正部，係在前記再生增益小於預定之下限值時，將前記再生增益予以補正。
如請求項1所記載之音訊訊號輸出裝置，其中，前記比值，係根據以所被輸入之前記音訊訊號為基礎的輸入聲音之音壓的期望值、及前記再生增益，而被算出。
一種音訊訊號輸出方法，係含有以下步驟：計算出再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離；基於前記距離而計算出前記音訊訊號的再生增益；基於前記再生增益而進行前記音訊訊號的增益調整；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
一種音訊訊號輸出程式，係令電腦執行包含以下步驟之處理：計算出再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離；基於前記距離而計算出前記音訊訊號的再生增益；基於前記再生增益而進行前記音訊訊號的增益調整；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
一種編碼裝置，係具備：補正資訊生成部，係生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；和編碼部，係將前記音訊訊號予以編碼；和輸出部；其中前記輸出部係基於前記距離而計算出前記音訊訊號的再生增益；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
一種編碼方法，係含有以下步驟：生成補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離，而補正前記音訊訊號之增益；將前記音訊訊號予以編碼；基於前記距離而計算出前記音訊訊號的再生增益；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；將含有前記補正資訊及已被編碼之前記音訊訊號的位元串流，予以輸出；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
一種解碼裝置，係具備：抽出部，係從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和解碼部，係將前記已被編碼之前記音訊訊號予以解碼；和輸出部；其中，前記輸出部係基於前記距離而計算出前記音訊訊號的再生增益；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；將已被解碼之前記音訊訊號及前記補正資訊，予以輸出；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。
如請求項15所記載之解碼裝置，其中，前記補正資訊係為前記理想揚聲器之位置資訊。
如請求項15所記載之解碼裝置，其中，前記補正資訊，係為用來獲得相對於各前記距離之增益所需的曲線資訊。
如請求項17所記載之解碼裝置，其中，前記曲線資訊係為表示折線曲線或函數曲線的資訊。
一種解碼方法，係含有以下步驟：從位元串流中抽出：補正資訊，其係用來隨著再生音訊訊號的理想揚聲器之位置，與再生前記音訊訊號的實際揚聲器之位置的距離而補正前記音訊訊號之增益；及已被編碼之前記音訊訊號；和將前記已被編碼之前記音訊訊號予以解碼；基於前記距離而計算出前記音訊訊號的再生增益；根據輸出聲音之全體功率與輸入聲音之全體功率的比值，而將前記再生增益予以補正；將已被解碼之前記音訊訊號及前記補正資訊，予以輸出；其中，前記輸出聲音之全體功率，係以藉由前記再生增益而被增益調整過的前記音訊訊號為基礎。