TW201610987A - 解碼裝置、解碼方法及程式 - Google Patents

解碼裝置、解碼方法及程式 Download PDF

Info

Publication number
TW201610987A
TW201610987A TW104119404A TW104119404A TW201610987A TW 201610987 A TW201610987 A TW 201610987A TW 104119404 A TW104119404 A TW 104119404A TW 104119404 A TW104119404 A TW 104119404A TW 201610987 A TW201610987 A TW 201610987A
Authority
TW
Taiwan
Prior art keywords
audio
decoding
buffer
bit stream
size
Prior art date
Application number
TW104119404A
Other languages
English (en)
Other versions
TWI652670B (zh
Inventor
山本優樹
知念徹
史潤宇
平林光浩
Original Assignee
新力股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新力股份有限公司 filed Critical 新力股份有限公司
Publication of TW201610987A publication Critical patent/TW201610987A/zh
Application granted granted Critical
Publication of TWI652670B publication Critical patent/TWI652670B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Communication Control (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本發明提供包含至少一緩衝區和至少一處理器的解碼裝置。該至少一處理器係配置用以至少部分地基於該至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。

Description

解碼裝置、解碼方法及程式 [相關案的交叉參考]
本案主張2014年6月26日申請的日本優先權專利申請案JP 2014-130898的利益,其全部內容併入本文中作為參考。
本技術關於解碼裝置、解碼方法及程式。特別的是,本技術關於能夠解碼位元流於具有不同硬體比例的設備中之解碼裝置、解碼方法及程式。
作為用於實施優於習知技術中的5.1-聲道環場再生之高現實感覺再生或轉移複數音頻元件(物件)的解碼技術,3D音頻標準已普遍使用(例如,參照NPL 1至3)。
於3D音頻標準中,用於儲存將提供的輸入位元流至解碼器之緩衝區的尺寸的最小值係界定為最小解碼器輸入緩衝區尺寸。例如,於NPL 3的段落4.5.3.1中係 界定為等於6144*NCC(位元)。
這裡,NCC係考慮聲道數量的縮寫,且指出包括於輸入位元流中的所有音頻元件中聲道對元件(CPE)的數量及單聲道對元件(SCE)兩倍之間的總和。
再者,SCE係儲存一聲道的音頻信號之音頻元件,而CPE係儲存設成對的二個聲道的音頻信號之音頻元件。因此,例如,包括於輸入位元流中的SCE的數量可以是5,而CPE的數量可以是3。於此例中,NCC=5+2*3=11。
如上述,於3D音頻標準中,當解碼器想要解碼輸入位元流時,係需要確保具有界定尺寸的最小緩衝區。
[引案列] [非專利文獻]
[NPL 1]ISO/IEC JTC1/SC29/WG11N14459,2014年4月,西班牙,瓦倫西亞,"ISO/IEC 23008-3/CD,3D音頻的本文"
[NPL 2]國際標準ISO/IEC 23003-3第一版2012-04-01資訊技術-視聽物件的編碼-第3部分:統一的語言和音頻編碼
[NPL 3]國際標準ISO/IEC 14496-3第四版2009-09-01資訊技術-視聽物件的編碼-第3部分:音頻
然而,於NPL 1的3D音頻標準中,SCE的數量及CPE的數量係實質上任意設定的。因此,為了解碼3D音頻標準所規定的所有位元流,將提供解碼器的最小解碼器輸入緩衝區尺寸係非常大於NPL 3中的標準的尺寸。
明確的是,於NPL 1中的3D音頻標準,SCE的數量及CPE的數量之間的總和可設定成最大65805。因此,最小解碼器輸入緩衝區尺寸的最大值透過以下運算式而表示:最小解碼器輸入緩衝區尺寸的最大值=6144*(0+65805*2)=808611840(位元),且係等於約100百萬位元組。
如上述,當作為最小所需緩衝區尺寸的最小解碼器輸入緩衝區尺寸係大時,這可能使具有小記憶體尺寸的平台難以確保具有界定尺寸的緩衝區。亦即,依據設備的硬體比例,可能難以安裝解碼器。
期望的是解碼位元流於具有不同硬體比例的設備中。
一些實施例係針對解碼裝置。該種解碼裝置包含:至少一緩衝區;及至少一處理器,配置成用以:至 少部分地基於該至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
一些實施例係針對解碼方法。該解碼方法包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
一些實施例係針對儲存處理器可執行指令的至少一非暫時性電腦可讀儲存媒體,當至少一處理器執行該等指令時,該等指令致使該至少一處理器實施解碼方法,該方法包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
依據本技術的實施例,這是可能解碼位元流於具有不同硬體比例的設備中。
應注意到,文中所述之功效不必要受限,且可以是本揭示所述的任一功效。
t1‧‧‧時間
t2‧‧‧時間
t3‧‧‧時間
t4‧‧‧時間
T11‧‧‧時段
T12‧‧‧時段
a1‧‧‧資料量
b1‧‧‧資料量
b2‧‧‧資料量
c1‧‧‧資料量
d1‧‧‧資料量
d2‧‧‧資料量
a1'‧‧‧總資料量
b1'‧‧‧資料量
b2'‧‧‧資料量
c1'‧‧‧資料量
d1'‧‧‧資料量
d2'‧‧‧資料量
T13‧‧‧時段
T14‧‧‧時段
AM1‧‧‧修正
AM2‧‧‧修正
RMT‧‧‧傳輸位元率調整處理
1‧‧‧聲道音源組
1‧‧‧物件音源組
2‧‧‧物件音源組
2‧‧‧聲道音源組
3‧‧‧物件音源組
3‧‧‧聲道音源組
11‧‧‧伺服器
12‧‧‧用戶端
21‧‧‧串流控制部
22‧‧‧存取處理部
23‧‧‧解碼器
71‧‧‧獲得部
72‧‧‧緩衝區尺寸計算部
73‧‧‧選擇部
74‧‧‧擷取部
75‧‧‧音頻緩衝區
76‧‧‧解碼部
77‧‧‧輸出部
111‧‧‧系統緩衝區
141‧‧‧通信部
142‧‧‧請求部
501‧‧‧中央處理單元
502‧‧‧唯讀記憶體
503‧‧‧隨機存取記憶體
504‧‧‧匯流排
505‧‧‧輸入/輸出介面
506‧‧‧輸入部
507‧‧‧輸出部
508‧‧‧儲存部
509‧‧‧通信部
510‧‧‧驅動器
511‧‧‧可移除媒體
[圖1]圖1係解說輸入位元流的組態之示意圖。
[圖2]圖2係解說輸入位元流的指定實例之示意圖。
[圖3]圖3係解說優先資訊之示意圖。
[圖4]圖4係解說傳輸位元率的調整之示意圖。
[圖5]圖5係解說傳輸位元率的調整之示意圖。
[圖6]圖6係解說傳輸位元率的調整之示意圖。
[圖7]圖7係解說尺寸資訊之示意圖。
[圖8]圖8係解說內容轉移系統的組態實例之示意圖。
[圖9]圖9係解說解碼器的組態實例之示意圖。
[圖10]圖10係解說解碼處理之流程圖。
[圖11]圖11係解說解碼器的組態實例之示意圖。
[圖12]圖12係解說解碼處理之流程圖。
[圖13]圖13係解說解碼器的組態實例之示意圖。
[圖14]圖14係解說解碼處理之流程圖。
[圖15]圖15係解說解碼器的組態實例之示意圖。
[圖16]圖16係解說解碼處理之流程圖。
[圖17]圖17係解說電腦的組態實例之示意圖。
以下,將參照圖式說明應用本技術之實施例。
[第一實施例]
於本技術的實施例中,具有各種可容許記憶體尺寸之解碼器,亦即,具有不同硬體比例之各種設備, 能夠解碼儲存的編碼多聲道音頻信號之輸入位元流。
於本技術的實施例中,輸入位元流中的音頻元件的複數組合係界定於輸入位元流中,且透過改變為音頻元件的每一組合所儲存將提供給解碼器的輸入位元流之緩衝區的尺寸的最小值,這是可能以不同硬體比例而實施解碼。
首先,將說明本技術的實施例的簡短概述。
[關於音頻元件的組合之附加界定]
於本技術的實施例中,於3D音頻標準中,可界定音頻元件的複數組合。在此,該複數組合係界定使得輸入位元流可透過具有各種可容許記憶體尺寸的解碼器而解碼。
例如,用於再生一內容的輸入位元流係由圖1所示的音頻元件所構成。應注意到,於圖式中,一矩形表示構成輸入位元流的一音頻元件。而且,SCE(i)(這裡i為整數)所標示的音頻元件表示第i SCE,而CPE(i)(這裡i為整數)所標示的音頻元件表示第i CPE。
如上述,SCE係用於解碼一聲道的音頻信號所需之資料,亦即,儲存透過編碼一聲道的音頻信號所獲得之編碼資料。再者,CPE係用於解碼設定成對的二個聲道的音頻信號所需之資料。
於圖1中,CPE(1)儲存用於2-聲道再生的環場音效之音頻元件。以下,由CPE(1)所形成的元件 組亦稱為聲道音源組1。
再者,SCE(1),CPE(2)及CPE(3)係儲存5-聲道再生的環場音效之音頻元件。以下,由SCE(1),CPE(2)及CPE(3)所形成的元件組亦稱為聲道音源組2。
SCE(2)至SCE(23)係儲存22-聲道再生的環場音效之音頻元件。以下,由SCE(2)至SCE(23)亦稱為聲道音源組3。
SCE(24)係儲存諸如作為物件(發聲材料)的日文之預定語言的互動式語音之音頻元件。以下,由SCE(24)所形成的元件組亦稱為物件音源組1。同樣的,SCE(25)係儲存作為物件的韓文的互動式語音之音頻元件。以下,由SCE(25)所形成的元件組亦稱為物件音源組2。
更者,SCE(26)至SCE(30)係儲存車輛聲音的音波及同樣物件之音頻元件。以下,由SCE(26)至SCE(30)所形成的元件組亦稱為物件音源組3。
當想要透過解碼輸入位元流而再生內容時,聲道音源組1至3與物件音源組1至3可以是任意組合,且內容可被再生。
於這例子中,於圖1的實例中,聲道音源組及物件音源組的音頻元件的組合係以下六個組合CM(1)至CM(6)。
組合CM(1)
聲道音源組1,物件音源組1,物件音源組3
組合CM(2)
聲道音源組1,物件音源組2,物件音源組3
組合CM(3)
聲道音源組2,物件音源組1,物件音源組3
組合CM(4)
聲道音源組2,物件音源組2,物件音源組3
組合CM(5)
聲道音源組3,物件音源組1,物件音源組3
組合CM(6)
聲道音源組3,物件音源組2,物件音源組3
這些組合CM(1)至CM(6)係設定為音頻元件的組合用於分別再生2-聲道日文、2-聲道韓文、5-聲道日文、5-聲道韓文、22-聲道日文與22-聲道韓文的內容。
於此例中,各別組合所需之解碼器的記憶體尺寸的大小的關係係如下。
組合CM(1)、CM(2)<組合CM(3)、CM(4)<組合CM(5)、CM(6)
音頻元件的這些組合可透過界定該等組合作為位元流語法予以實施。
[最小解碼器輸入緩衝區的定義的修正]
然而,於3D音頻標準中,透過修正下述的現行規則以便改變上述組合的每一者的最小解碼器輸入緩衝 區尺寸,輸入位元流可由各種可容許記憶體尺寸的解碼器而解碼。
[現行規則]
最小解碼器輸入緩衝區尺寸=6144*NCC(位元)
如上述,NCC指出包括於輸入位元流的所有音頻元件中之CPE的數量及SCE的數量兩倍之間的總和。於現行狀態中,假設設備具有自容許記憶體尺寸,亦即,小於最小解碼器輸入緩衝區尺寸(以下稱為必要緩衝區尺寸)的最大可容許緩衝區尺寸。於該設備中,即使當可能確保足夠緩衝區尺寸僅用於預定組合時,這是困難解碼輸入位元流。
因此,於本技術的實施例中,透過實施以下修正AM1或修正AM2,依據自硬體比例,亦即,可容許記憶體尺寸,該設備能夠透過使用適合它們本身的音頻元件的組合而解碼且再生內容(輸入位元流)。
[修正AM1]
於3D音頻標準所規定的規則中,NCC係包括於輸入位元流的所有音頻元件中之CPE的數量及SCE的數量兩倍之間的總和。於這替代中,NCC係包括於音頻元件的組合中作為包括於輸入位元流中的解碼目標的所有音頻元件之CPE的數量及SCE的數量兩倍之間的總和。
[修正AM2]
音頻元件的每一組合的最小解碼器輸入緩衝區尺寸(必要緩衝區尺寸)係界定為位元流語法。
透過實施修正AM1或AM2,這是可能解碼輸入位元流甚至於具有較小可容許記憶體尺寸在解碼器側上之設備中。因此,以下修正係必要用於解碼器側及編碼器側。
[解碼器的信號處理的修正]
透過比較自容許記憶體尺寸與輸入位元流中的音頻元件的每一組合的尺寸(必要緩衝區尺寸),解碼器指定滿足「自容許記憶體尺寸係等於或大於每一組合的尺寸」之條件之音頻元件的組合,且解碼器滿足該條件之任一組合的音頻元件。
在此,指定音頻元件的每一組合的必要緩衝區尺寸的方法可應用修正AM1或修正AM2。
亦即,於應用修正AM1的例子中,例如,解碼器可自儲存於所獲得輸入位元流中之資訊來指定音頻元件的組合,且可計算音頻元件的每一組合的必要緩衝區尺寸。再者,於應用修正AM2的例子中,解碼器可自輸入位元流讀取音頻元件的每一組合的必要緩衝區尺寸。
作為解碼目標的音頻元件的組合可以是在其必要緩衝區尺寸等於或小於可容許記憶體尺寸的組合中由 使用者所指定的組合。而且,作為解碼目標的音頻元件的組合可以是在其必要緩衝區尺寸等於或小於可容許記憶體尺寸的組合中透過預先設定所選定的組合。
以下,音頻元件的組合的必要緩衝區尺寸係等於或小於可容許記憶體尺寸的條件係稱為緩衝區尺寸條件。
作為解碼目標的音頻元件的組合可以在獲得輸入位元流之前選定,且可在獲得輸入位元流之後選定。亦即,本技術的實施例可應用於例如,諸如電視廣播的推送式內容傳輸系統,且可應用於動畫專家群(MPEG)典型地代表的托曳式內容傳輸系統-基於HTTP(DASH)系統的動態自適性串流。
[編碼器的作業規則的修正]
編碼器透過調整各時段的音頻元件(編碼資料)的位元量而實施編碼以解碼音頻元件的所有組合的每一者之修正的最小解碼器輸入緩衝區尺寸。
亦即,即使當解碼器選擇音頻元件的某一組合時,編碼器實施編碼同時調整分配成各時段的各聲道的編碼資料之位元量以在解碼器側的緩衝區尺寸係必要緩衝區尺寸時解碼音頻元件。在此,音頻元件可被解碼的片語意指,解碼可被實施而不會造成儲存設定為解碼目標的組合的音頻元件之緩衝區中之溢流及欠流兩者。
如上述,透過依據解碼器側的音頻元件的每 一組合的必要緩衝區尺寸而適當選擇音頻元件的組合,輸入位元流可由具有各種可容許記憶體尺寸的解碼器所解碼。亦即,解碼具有不同硬體尺度的各種裝置中的輸入位元流是可行的。
[使用物件優先資訊之傳輸位元率的降低]
於將本技術的實施例應用至全型內容傳輸系統的例子中,基於元資料及類似資料,透過選擇及獲得僅必要緩衝區尺寸,其係可能降低輸入位元流的傳輸位元率。換言之,透過致使解碼器不會獲得不必要緩衝區尺寸,其係可能降低輸入位元流的傳輸位元率。
這裡,MPEG-DASH所典型地代表的全型內容傳輸服務被考慮。以這方式,3D音頻的輸入位元流係以例如,指定圖案(1)或指定圖案(2)的以下二方法的任一者而指定給伺服器。
[指定圖案(1)]
3D音頻的輸入位元流的全部係指定為單流。
[指定圖案(2)]
3D音頻的輸入位元流係分開且指定用於音頻元件的每一組合。
更精確而言,於指定圖案(1)中例如,如圖1所示,所有組合的音頻元件,亦即,單輸入位元流係指定 給伺服器。輸入位元流包括構成所有聲道音源組及物件音源組的音頻元件。
於此例中,例如,於預先獲自伺服器及類似物的資訊及儲存於輸入位元流的標題中的資訊(元資料),解碼器能夠透過選擇音頻元件的組合作為解碼目標且自伺服器獲得僅所選組合的音頻元件來實施解碼。再者,一旦解碼器獲得輸入位元流,解碼器能夠透過自輸入位元流選擇必要音頻元件來實施解碼。
於指定圖案(1)的實例中,用於輸入位元流的各傳輸速度,亦即,用於各傳輸位元率,輸入位元流可提供且指定至伺服器。
於指定圖案(2)中,圖1所示的輸入位元流係分開用於音頻元件的每一組合,且例如,如圖2所示,可透過分割所獲得的各組合的位元流係指定至伺服器。
應注意到,於圖2中,以相似於圖1之方式,一矩形表示一音頻元件即SCE或CPE。
於此實例中,箭頭A11所示由組合CM(1)的組件所形成的位元流、箭頭A12所示由組合CM(2)的組件所形成的位元流和箭頭A13所示由組合CM(3)的組件所形成的位元流被指定。
再者,於伺服器中,箭頭A14所示由組合CM(4)的組件所形成的位元流、箭頭A15所示由組合CM(5)的組件所形成的位元流和箭頭A16所示由組合CM(6)的組件所形成的位元流被指定。
於此例中,解碼器透過自獲自伺服器及類似物的資訊來選擇音頻元件的組合作為解碼目標且自伺服器獲得所選組合的音頻元件予以實施。應注意到,甚至於指定圖案(2)的實例中,所分開輸入位元流可提供用於各傳輸位元率,且可指定至伺服器。
再者,指定圖案(1)所表示的單輸入位元流可在自伺服器傳輸至解碼器側時分開,且由僅所請求組合的音頻元件所形成之位元流可被傳輸。
當以這方式獲得僅作為解碼目標之音頻元件的組合時,可能降低傳輸位元率。
例如,如果僅自解碼器側獲得作為解碼目標之音頻元件的組合,基於儲存輸入位元流及類似物的元資料,音頻元件的組合可被選擇。在此,音頻元件的組合係基於例如,儲存作為輸入位元流中的元資料且表示可獲自輸入位元流的音頻元件的組合之資訊予以選擇。
除此之外,如果解碼器係致使不會獲得作為解碼目標的組合的音頻元件之中的不必要音頻元件,其可能進一步降低傳輸位元率。例如,這些不必要音頻元件可由使用者所指定,且可基於儲存於輸入位元流及類似物中的元資料予以選擇。
特別的是,如果不必要音頻元件係基於元資料而選擇,該選擇可基於優先資訊予以實施。優先資訊表示物件的優先(重要程度),亦即,音頻元件的優先。在此,優先資訊表示的是,當優先資訊的值較大時,音頻元 件的優先係更高,且該元件係更重要。
例如,於3D音頻標準中,用於各時段的各物件音源組,物件優先資訊(物件優先)係界定於輸入位元流中,且更明確地界定在EXT元件內側。特別的是,於3D音頻標準中,EXT元件係界定在語法層中係相同如SCE或CPE。
因此,再生內容的用戶端亦即,解碼器,讀取物件優先資訊,且發出指令給伺服器使得伺服器不會傳輸其值等於或小於用戶端中預先決定的界限值的物件的音頻元件。因此,自伺服器傳輸之輸入位元流(資料)可被致使不包括該指令所指定的物件音源組的音頻元件(SCE),且因此可能降低傳輸資料的位元率。
為了達成使用優先資訊之傳輸位元率的降低,以下二個處理係必要的:物件音源組的預擷取;及用於以所修正最小解碼器輸入緩衝區尺寸實施解碼的傳輸位元率調整處理。
[優先資訊的預擷取]
為了使用戶端(解碼器)請求伺服器不要傳輸特定物件的音頻元件,用戶端必須在傳輸的物件音源組的音頻元件之前讀取物件優先資訊。
如上述,3D音頻標準中,各物件優先資訊係包括於EXT元件。因此,為了預擷取物件優先資訊,例如,EXT元件可在以下所指定位置A(1)及A(2)予以 指定。應注意到,雖然不限於這種實例,如果優先資訊可被預擷取,EXT元件的所指定位置亦即,優先資訊可以是任何位置且可以任何方法獲得。
[所指定位置A(1)]
EXT元件係提供為單檔案,且因此用戶端在解碼的開始讀取對應於所有資料框或數個預擷取框的物件優先資訊。
[所指定位置A(2)]
EXT元件係指定給位元流中之框的標題,且用戶端讀取各時段的物件優先資訊。
例如,於所指定位置A(1)例如,如圖3的箭頭A21所示,單檔案(EXT元件)係記錄於伺服器中。於檔案中,構成內容之所有物件的各時段之優先資訊,亦即,所有物件的音頻元件被儲存。
於圖3中,寫入文字「EXT(1)」的單矩形表示單EXT元件。於實例中,用戶端(解碼器)在解碼的開始之前的任意時序自伺服器獲得EXT元件,且選擇不傳輸的音頻元件。
例如,於所指定位置A(2)中,如箭頭A22所示,EXT元件係指定至輸入位元流的框,且係記錄於伺服器中。在此,EXT元件下方的各矩形亦即,放置在圖式中下側上的各矩形,以相似於圖1的方式而表示的單音頻 元件(SCE或CPE)。
於此實例中,於記錄於伺服器中的輸入位元流,EXT元件係進一步指定至圖1所示的結構的標題。
因此,於此例中,用戶端(解碼器)於作為第一目標的時段來接收輸入位元流中的EXT元件且讀取優先資訊。然後基於優先資訊,用戶端選擇不傳輸的音頻元件,且請求(命令)伺服器不要傳輸音頻元件。
[傳輸位元率的調整處理]
接著,將說明用於以所修正最小解碼器輸入緩衝區尺寸來實施解碼之傳輸位元率調整處理。
例如,如以上伺服器所述,編碼器調整音頻元件(編碼資料)的位元量以便以在最小解碼器輸入緩衝區尺寸之中解碼指定至伺服器之輸入位元流的各音頻元件。
因此,當某一組合的音頻元件係選擇在解碼器側上時,例如,如圖4所示,即使當輸入位元流相繼解碼同時以必要緩衝區尺寸儲存於緩衝區時,欠流及溢流不會發生。
於圖4中,垂直軸表示每次在解碼器側上儲存於緩衝區中之輸入位元流的資料量,而水平軸表示時段。再者,於圖式中,對角線的斜率表示輸入位元流的傳輸位元率,且假設傳輸位元率係例如,輸入位元流或類似物的傳輸聲道的平均位元率。
於此實例中,資料[1]至資料[4]表示對應至各時段的音頻元件係接收自伺服器且儲存於緩衝區中之時段。a1,b1,b2,c1,c2,d1及d2分別表示預定時段中儲存於緩衝區中之資料件的量。再者,垂直軸中之BFZ表示最小解碼器輸入緩衝區尺寸。
於圖4中,當所接收音頻元件係儲存於解碼器的緩衝區中達BFZ的量時,啟動第一時段的音頻元件的解碼,且之後各時段的音頻元件的解碼係實施在固定時距。
例如,在時間t1,具有a1的量之第一時段的資料,亦即,第一時段的音頻元件係讀取自緩衝區且被解碼。同樣的是,分別在時間t2至t4,第二至第四時段的音頻元件係讀取自緩衝區且被解碼。
在此時,甚至在任何時間儲存於緩衝區中之音頻元件的資料量係等於或大於0,且係等於或小於BFZ。因此,欠流或溢流都不會發生。因此,內容係再生而無需及時連續中斷。
然而,即使選擇音頻元件的任何組合,在調整編碼資料的位元量時而實施之編碼係在解碼構成所選的組合的所有音頻元件之前題下而實施。亦即,不考慮構成基於優先資訊或類似物所選的組合之所有音頻元件的一部份未解碼之例子。
因此,如果作為解碼目標的組合的音頻元件之中的一些物件的音頻元件未解碼時,在編碼器側之各時 段的位元量未調整,且係不符合透過解碼於解碼器側上的各時段所消耗的位元量。然後,於一些例子中,溢流或欠流發生在解碼器側上,且係難以在上述所修正最小解碼器輸入緩衝區尺寸實施解碼。
因此,本技術的實施例中,在編碼器側上的位元量被調整,且係符合在解碼器側上所消耗的位元量。為了實施解碼在上述所修正最小解碼器輸入緩衝區尺寸實施解碼上述所修正最小解碼器輸入緩衝區尺寸實施解碼,實施以下傳輸位元率調整處理RMT(1)RMT(1)或RMT(2)。
[傳輸位元率調整處理RMT(1)]
未包括於各時段的傳輸資料中之物件的音頻元件的尺寸被讀取,停止傳輸的時段係計算自該尺寸,且該傳輸僅停止於該時段。
[傳輸位元率調整處理RMT(2)]
未包括於各時段的傳輸資料中之物件的音頻元件的尺寸被讀取,且作為傳輸目標的時段的傳輸率係基於尺寸而調整。
於傳輸位元率調整處理RMT(1)中,例如,如圖5所示,輸入位元流的傳輸僅停止於預定時段,因此實際地改變傳輸位元率。
於圖5中,垂直軸表示每次在解碼器側上儲 存緩衝區中之輸入位元流的資料量,而水平軸表示時段。再者,於圖5中,對應至圖4的例子中的部分係由相同參考符號及數字所表示,且因此說明將適當省略。
於一實例中,圖4中a1,b1,b2,c1,d1及d2所指的資料量係由a1',b1',b2',c1',d1'及d2'分別表示。
例如,第一時段之解碼目標的音頻元件的總資料量係於圖4中,但總資料量係a1'於圖5中因為未實施預定物件的音頻元件的解碼。
因此,僅於時段T11中,停止輸入位元流的傳輸。時段T11取決於:尺寸,物件的音頻元件的(資料量),未解碼的於第一訊框,亦即,基於優先資訊及類似物所選的;及輸入位元流的傳輸位元率,亦即,圖式中之對角線的斜率。
同樣的,亦於接著第一時段的時段中,於每一時段T12至T14中,停止輸入位元流的傳輸。
傳輸位元率控制可實施在伺服器側上,且可透過實施緩衝區控制在解碼器側上予以實施。
當位元率控制係實施在伺服器側上時,例如,解碼器可指示伺服器暫時停止輸入位元流的傳輸,且伺服器可計算傳輸停止時段以便暫時停止輸入位元流的傳輸。
當傳輸位元率控制係經由在解碼器側上的緩衝區控制而實施時,例如,在自儲存所接收輸入位元流的 系統緩衝區之傳輸音頻元件至解碼用的音頻緩衝區的時候,解碼器暫時停止音頻元件的傳輸(儲存)。
在此,系統緩衝區係視為例如,儲存不僅構成內容的語音的輸入位元流而且構成內容及類似物的視覺的輸入位元流之緩衝區。再者,音頻緩衝區係必要確保緩衝區尺寸等於或大於最小解碼器輸入緩衝區尺寸之解碼緩衝區。
相比之下,傳輸位元率調整處理RMT(2)中,例如,如圖6所示,輸入位元流的傳輸位元率係設定成可變的。
於圖6中,垂直軸表示每次在解碼器側上儲存於音頻緩衝區中之輸入位元流的資料量,而水平軸表示時段。再者,於圖6中,對應至圖4或5的例子的部分係由相同參考符號及數字所表示,且其說明將適當省略。
例如,第一時段的解碼目標的音頻元件的總資料量係a1,而總資料量係a1’於圖6中因為未實施預定物件的音頻元件的解碼。
因此,在獲得對應至第一訊框的音頻元件之後,於至時間t1的時段,音頻元件的傳輸係實施在新傳輸位元率。新傳輸位元率取決於:物件的音頻元件的尺寸,未解碼於第一訊框,亦即,基於優先資訊及類似物所選擇;及輸入位元流的傳輸位元率,亦即,圖式中的對角線的斜率。
同樣的,亦於其後的時段,輸入位元流的傳 輸係在新近計算的傳輸位元率予以實施。例如,較佳的是,新傳輸位元率係決定使得,於自時間t2至時間t3的時段,在時間t3儲存於音頻緩衝區中的音頻元件的總資料量係等於圖5的實例中之時間t3的例子之資料量。
傳輸位元率控制可實施在伺服器側上,且可透過實施緩衝區控制在解碼器側上而實施。
當位元率控制係實施在伺服器側上時,例如,解碼器可發出輸入位元流的新輸入位元流的指令至伺服器,且伺服器可計算新傳輸位元率。
當傳輸位元率控制係經由緩衝區控制而實施在解碼器側上時,例如,解碼器計算新傳輸位元率,且在新傳輸位元率自系統緩衝區傳輸音頻元件至音頻緩衝區。
在此,如果實施傳輸位元率調整處理RMT(1)或RMT(2),必要預擷取不是解碼目標之物件的音頻元件的尺寸。因此,於本技術的實施例中,表示音頻元件的尺寸之尺寸資訊係指定於例如,以下尺寸資訊布局SIL(1)至SIL(3)的任一者中。應注意到,尺寸資訊的布局可以是任何布局如果該布局可被預擷取。
[尺寸資訊布局SIL(1)]
尺寸資訊係提供作為單檔案,且因此用戶端讀取在解碼的啟動時對應至所有訊框或數個所預擷取訊框之音頻元件的尺寸。
[尺寸資訊布局SIL(2)]
尺寸資訊係指定至輸入位元流中之訊框的標題,且用戶端讀取各時段的尺寸資訊。
[尺寸資訊布局SIL(3)]
尺寸資訊係界定於音頻元件的標題中,且用戶端讀取各音頻元件的尺寸資訊。
於尺寸資訊布局SIL(1)中,例如,如圖7的箭頭A31所示,單檔案係記錄於伺服器中。於該檔案中,儲存構成內容之所有音頻元件的各時段的尺寸資訊。再者,於圖7中,寫入文字“尺寸”之橢圓形表示尺寸資訊。
於一實例中,例如,用戶端(解碼器)在解碼的啟動之前的任意時序自伺服器獲得尺寸資訊,且實施傳輸位元率調整處理RMT(1)或RMT(2)。
例如,於尺寸資訊布局SIL(2)中,如箭頭A32所示,尺寸資訊係指定至輸入位元流的訊框的標題,且記錄於伺服器中。在此,放置在尺寸資訊下方的各矩形以相似於圖3的例子的方式表示單音頻元件(SCE或CPE)或EXT元件。
於這實例中,於記錄於伺服器中的輸入位元流,尺寸資訊進一步指定至圖3的箭頭A22所示之結構的標題。
因此,於此例中,例如,用戶端(解碼器)先接收輸入位元流的尺寸資訊或EXT元件,選擇未傳輸 的音頻元件,且依據該選擇實施傳輸位元率調整處理RMT(1)或RMT(2)。
例如,於尺寸資訊布局SIL(3)中,如箭頭A33所示,尺寸資訊指定至音頻元件的標題部。因此,於此例中,例如,用戶端(解碼器)自音頻元件讀取尺寸資訊,且實施傳輸位元率調整處理RMT(1)或RMT(2)。
於以上說明的實例中,物件的音頻元件未傳輸,但本技術不限於該物件。即使當構成該等組合的任何音頻元件未傳輸時,在最小解碼器輸入緩衝區尺寸的解碼可以相似於上述物件的實例之方式予以實施。
如上述,輸入位元流中不是解碼目標的不必要音頻元件係選擇在元資料及類似物上以致未傳輸,因此可能降低傳輸位元率。
當構成輸入位元流的任意音頻元件未設定為解碼目標時,透過適當調整傳輸位元率,可在最小解碼器輸入緩衝區尺寸實施解碼。
<內容傳輸系統的組態實例>
接著,將說明應用上述的本技術之特定實施例。
以下,將說明本技術的實施例係應用至MPEG-DASH所規定的內容傳輸系統之示範性例子。於此例中,應用本技術的實施例之內容傳輸系統係配置成例如,如圖8所示。
圖8所示的內容傳輸系統包括伺服器11及用戶端12,且伺服器11及用戶端12係經由諸如網際網路的有線或無線通信網路相互連接。
於伺服器11中,例如,記錄複數傳輸位元率的每一者的位元流。位元流可透過分開用於音頻元件的每一組合之圖1所示的輸入位元流或圖2所示的輸入位元流而獲得。
再者,於伺服器11中,記錄參照圖3所述的EXT元件。EXT元件係為單檔案指定至輸入位元流或所分開輸入位元流的訊框的標題部分。再者,伺服器11中,記錄參照圖7所述的尺寸資訊。尺寸資訊作為單檔案指定至輸入位元流或所分開輸入位元流的訊框的標題部分或音頻元件的標題部分。
伺服器11傳輸輸入位元流、EXT元件、尺寸資訊或類似物至用戶端12以回應自用戶端12發出的請求。
再者,用戶端12自伺服器11接收輸入位元流,且解碼和複數該輸入位元流,因此串流化內容的再生。
應注意到,關於輸入位元流的接收,可接收全部輸入位元流,且僅可接收輸入位元流的分開部分。以下,當不必要特別地區別輸入位元流的全部和一部分時,它們簡稱為輸入位元流。
用戶端12具有串流控制部21、存取處理部 22及解碼器23。
串流控制部21控制用戶端12的整個作業。例如,串流控制部21自伺服器11接收EXT元件、尺寸資訊、其它控制資訊,且若需要基於供應至或接收自存取處理部22或解碼器23之資訊來控制串流再生。
為回應解碼器23或類似物的請求,存取處理部22請求伺服器11在預定傳輸位元率傳輸預定組合的音頻元件的輸入位元流,接收傳輸自伺服器11的輸入位元流,且供應輸入位元流至解碼器23。解碼器23解碼供自存取處理部22之輸入位元流同時若需要,與串流控制部21或存取處理部22互換資訊,且給予輸出至未顯示於圖式中或類似物之揚聲器。
<解碼器1的實例組態>
接著,將說明比圖8所示的解碼器23之更特定的組態。例如,解碼器23係更具體地配置如圖9所示。
圖9所示的解碼器23具有獲得部71、緩衝區尺寸計算部72、選擇部73、擷取部74、音頻緩衝區75、解碼部76及輸出部77。
於此實例中,例如,具有圖1所示的組態的預定傳輸位元率之輸入位元流係自存取處理部22供應至獲得部71。而且,存取處理部22能夠選擇各時段的傳輸位元率以例如,基於存取處理部22及類似物的通信網路 的狀況自伺服器11接收輸入位元流。亦即,可能改變用於各時段的傳輸位元率。
獲得部71自存取處理部22獲得輸入位元流,且供應輸入位元流至緩衝區尺寸計算部72及擷取部74。緩衝區尺寸計算部72基於供自獲得部71的輸入位元流計算音頻元件的每一組合之必要緩衝區尺寸,且供應必要緩衝區尺寸至選擇部73。
選擇部73比較解碼器23的可容許記憶體尺寸,亦即,音頻緩衝區75,與供自緩衝區尺寸計算部72的音頻元件的每一組合的必要緩衝區尺寸,選擇音頻元件的組合作為解碼目標,且供應選擇結果至擷取部74。
擷取部74基於供自選擇部73的選擇結果自供自獲得部71的輸入位元流來擷取所選組合的音頻元件,且供應音頻元件至音頻緩衝區75。
音頻緩衝區75係具有預先決定的預定可容許記憶體尺寸之緩衝區。音頻緩衝區75暫時保持音頻元件作為供自擷取部74的解碼目標,且供應音頻元件至解碼部76。解碼部76基於時段自音頻緩衝區讀取音頻元件,且實施解碼。而且,解碼部76基於透過解碼所獲得的音頻信號產生具有預定聲道組態的音頻信號,且供應音頻信號至輸出部77。輸出部77輸出供自解碼部76的音頻信號至後側揚聲器及類似物。
[解碼處理1的說明]
接著,將說明由圖9所示的解碼器23所實施的解碼處理。例如,解碼處理係實施用於每時段。
於步驟S11中,獲得部71自存取處理部22獲得輸入位元流,且供應輸入位元流至緩衝區尺寸計算部72及擷取部74。
於步驟S12中,緩衝區尺寸計算部72基於供自獲得部71的輸入位元流來計算音頻元件的每一組合的必要緩衝區尺寸,且供應必要緩衝區尺寸至選擇部73。
明確的說,緩衝區尺寸計算部72設定構成音頻元件的組合作為如同NCC的計算目標之CPE的數字和SCE的數字兩倍之間的總和,且計算NCC和6144的乘積作為必要緩衝區尺寸(最小解碼器輸入緩衝區尺寸)。
儲存於輸入位元流之音頻元件的選擇組合可透過參照元資料或類似物予以指定。再者,當表示組合用的必要緩衝區尺寸之資訊係儲存於輸入位元流中時,緩衝區尺寸計算部72自輸入位元流讀取表示必要緩衝區尺寸的資訊,且供應該資訊至選擇部73。
於步驟S13中,選擇部73基於供自緩衝區尺寸計算部72的必要緩衝區尺寸而選擇音頻元件的組合,且供應該選擇結果至擷取部74。
亦即,選擇部73比較解碼器23的可容許記憶體尺寸,亦即,音頻緩衝區75,與音頻元件的每一組合的必要緩衝區尺寸,且選擇滿足緩衝區尺寸條件的一組合作為解碼目標。然後選擇部73供應選擇結果至擷取部 74。
於步驟S14中,擷取部74自供自獲得部71的輸入位元流擷取由供自選擇部73的選擇結果所指定之組合的音頻元件。
於步驟S15中,解碼部76自音頻緩衝區75讀取對應至單時段的音頻元件,且解碼該等音頻元件,亦即,儲存音頻元件的編碼資料。
解碼部76基於透過解碼所獲得的音頻信號產生具有預定聲道組態的音頻信號,且供應音頻信號至輸出部77。例如,解碼部76分配物件的音頻信號進入對應至揚聲器的各聲道,且產生具有想要聲道組態的各聲道之音頻信號。
於步驟S16中,輸出部77輸出供自解碼部76的音頻信號至後側揚聲器及類似物,且結束解碼處理。
如上述,解碼器23基於自可容許記憶體尺寸及必要緩衝區尺寸而選擇音頻元件的組合,且實施解碼。因此,可能解碼輸入位元流於具有不同硬體比例的各種設備中。
[第二實施例] <解碼器2的組態實例>
於圖9所示的解碼器23的實例的說明中,選擇音頻元件的組合。然而,於解碼器23中,基於諸如優 先資訊的元資料,可以選擇不是解碼目標的不必要音頻元件。於這例子中,解碼器23係配置成例如,如圖11所示。再者,於圖11中,對應至圖9的例子的部分係由相同參考符號及數字所表示,且將適當地省略其說明。
圖11所示的解碼器23具有獲得部71、緩衝區尺寸計算部72、選擇部73、擷取部74、系統緩衝區111、音頻緩衝區75、解碼部76及輸出部77。圖11所示之解碼器23的組態係不同於圖9的解碼器23的組態,在於系統緩衝區111係新近提供。不然,圖11所示之解碼器23的組態係相同如圖9所示之解碼器23的組態。
圖11所示之解碼器23中,例如,供應具有圖1所示的組態之預定傳輸位元率的輸入位元流。
獲得部71自伺服器11獲得EXT元件及尺寸資訊,經由緩衝區尺寸計算部72而供應EXT元件至選擇部73,且經由擷取部74供應尺寸資訊至系統緩衝區111。
例如,如圖3的箭頭A21所指,如果EXT元件單獨記錄於伺服器11中,獲得部71在解碼的啟動之前的任意時序經由串流控制部21自伺服器11獲得EXT元件。
再者,例如,如圖3所示的箭頭A22所指,如果EXT元件係指定至輸入位元流的訊框標題,獲得部71供應輸入位元流至緩衝區尺寸計算部72。然後,緩衝區尺寸計算部72自輸入位元流讀取EXT元件,且供應 EXT元件至選擇部73。
以下,將在以下假設下繼續說明,如圖3所示的箭頭A21所指,EXT元件單獨記錄於伺服器11中,且EXT元件係預先供應至選擇部73。
例如,如圖7所示的箭頭A31所指,如果尺寸資訊係單獨記錄於伺服器11中,獲得部71在解碼的啟動之前的任意時序經由串流控制部21自伺服器11獲得尺寸資訊。
再者,例如,如圖7所示的箭頭A32或箭頭A33所指,如果尺寸資訊係指定至訊框的標題或指定至音頻元件的標題,獲得部71供應輸入位元流至擷取部74。然後,擷取部74自輸入位元流讀取尺寸資訊,且供應該資訊至系統緩衝區111。
以下,將在以下假設下繼續說明,如圖7所示的箭頭A31所指,尺寸資訊單獨記錄於伺服器11中,且尺寸資訊預先供應至系統緩衝區111。
選擇部73基於供自緩衝區尺寸計算部72的必要緩衝區尺寸來選擇音頻元件的組合。再者,選擇部73基於優先資訊自構成所選組合的音頻元件而選擇不是解碼目標的不必要音頻元件,亦即,未傳輸的音頻元件。優先資訊係包括於供自緩衝區尺寸計算部72的EXT元件中。
應注意到,不必要音頻元件可以是物件的音頻元件,且可以是不同的音頻元件。
選擇部73供應組合的選擇結果及不必要音頻元件的選擇結果至擷取部74。
擷取部74基於供自選擇部73的選擇結果自供自獲得部71的輸入位元流形成所選組合,擷取不同於不必要音頻元件的音頻元件,且供應音頻元件至系統緩衝區111。
系統緩衝區111基於預先供應自擷取部74的尺寸資訊經由上述傳輸位元率調整處理RMT(1)或RMT(2)而實施緩衝區控制,且供應供自擷取部74的音頻元件至音頻緩衝區75。應注意到,以下假設實施傳輸位元率調整處理RMT(1),將繼續說明。
[解碼處理2的說明]
接著,參照圖12的流程圖,將說明圖11所示的解碼器23所實施的解碼處理。應注意到,步驟S41及S42的處理係相同如圖10的步驟S11及S12的處理,且將省略其說明。
於步驟S43中,選擇部73基於包括於EXT元件中的優先資訊及供自緩衝區尺寸計算部72的必要緩衝區尺寸來選擇不必要音頻元件及音頻元件的組合。
例如,選擇部73實施如圖10的步驟S13的相同處理,且選擇音頻元件的組合。再者,選擇部73在所選組合的音頻元件中選擇其優先資訊的值等於或小於預定界限值的音頻元件作為不是解碼目標的不必要音頻元 件。
選擇部73供應組合的選擇結果及不必要音頻元件的選擇結果至擷取部74。
於步驟S44中,擷取部74基於供自選擇部73的選擇結果自供自獲得部71的輸入位元流而形成所選組合,擷取不同於不必要音頻元件的音頻元件,且供應音頻元件至系統緩衝區111。再者,擷取部74供應表示由選擇部73所選且不是解碼目標的不必要音頻元件之資訊至系統緩衝區111。
於步驟S45中,系統緩衝區111基於表示供自擷取部74的不必要音頻元件之資訊及預先供自擷取部74之尺寸資訊來實施緩衝區控制。
明確的說,系統緩衝區111基於供自擷取部74的資訊所指之音頻元件的尺寸資訊而計算停止傳輸的時段。然後系統緩衝區111傳輸供自擷取部74的音頻元件至音頻緩衝區75同時在適當時序停止音頻元件僅於所計算時序進入音頻緩衝區75的傳輸(儲存)。
當實施緩衝區控制時,之後,步驟S46及S47的處理且解碼處理結束。這些處理係相同如圖10的步驟S15及S16的處理,且因此將省略其說明。
如上述,解碼器23選擇音頻元件的組合,且基於尺寸資訊選擇不是解碼目標的音頻元件。因此,可能解碼輸入位元流於具有不同硬體比例的各種設備中。再者,透過經由緩衝區控制實施實際傳輸位元率,可實施在 最小解碼器輸入緩衝區尺寸的解碼。
[第三實施例] <解碼器3的組態實例>
於實例的以上說明中,作為解碼目標的組合的音頻元件係擷取自所獲得輸入位元流。然而,所選組合的音頻元件可獲自伺服器11。於此種例子中,解碼器23係配置成例如,如圖13所示。應注意到,於圖13中,對應至圖9的例子之部分係由相同參考符號及數字代表,且將省略其說明。
圖13所示的解碼器23具有通信部141、緩衝區尺寸計算部72、選擇部73、請求部142、音頻緩衝區75、解碼部76及輸出部77。
圖13所示之解碼器23的組態係不同於圖9的解碼器23的組態,在於獲得部71及擷取部74未被提供而通信部141及請求部142係新近提供。
通信部141經由串流控制部21或存取處理部22實施與伺服器11的通信。例如,通信部141接收表示可獲自伺服器11的音頻元件的組合之資訊,且供應資訊至緩衝區尺寸計算部72,或傳輸一傳輸請求至伺服器11。傳輸請求係用以傳輸供自請求部142的每一分開的輸入位元流的一部分之請求。再者,通信部141接收傳輸自伺服器11的每一分開輸入位元流的部分以回應傳輸請 求,且供應每一分開輸入位元流至音頻緩衝區75。
在此,表示可獲自伺服器11的音頻元件的組合之資訊係儲存於輸入位元流中例如,作為輸入位元流的元資料。於這狀態中,該資訊係記錄於伺服器11中作為單檔案。而且,在此,表示可獲自伺服器11的音頻元件的組合之資訊係記錄於伺服器11中作為單檔案。
請求部142基於作為供自選擇部73的解碼目標之音頻元件的組合的選擇結果而供應傳輸請求至通信部141。傳輸請求係用以傳輸由所選組合的音頻元件所形成之位元流的一部分之請求,亦即,每一分開輸入位元流的一部分。
[解碼處理3的說明]
接著,參照圖14的流程圖,將說明由圖13所示的解碼器23所實施之解碼處理。
於步驟S71中,通信部141接收表示可獲自伺服器11的音頻元件的組合之資訊,且供應資訊至緩衝區尺寸計算部72。
亦即,通信部141傳輸該傳輸請求用以經由串流控制部21傳輸表示可獲得的音頻元件的組合之資訊至伺服器11。再者,通信部141經由串流控制部21接收表示傳輸自伺服器11的音頻元件的組合之資訊以回應傳輸請求,且供應該資訊至緩衝區尺寸計算部72。
於步驟S72中,緩衝區尺寸計算部72基於供 自通信部141且表示可獲自伺服器11之音頻元件的組合之資訊,計算該資訊所表示的音頻元件的每一組合的必要緩衝區尺寸,且供應必要緩衝區尺寸至選擇部73。於步驟S72中,實施如圖10的步驟S12之相同處理。
於步驟S73中,選擇部73基於供自緩衝區尺寸計算部72的必要緩衝區尺寸選擇音頻元件的組合,且供應選擇結果至請求部142。於步驟S73中,實施圖10中的步驟S13之相同處理。在此時,選擇部73可選擇傳輸位元率。
當選擇音頻元件的組合時,請求部142供應傳輸請求至通信部141。傳輸請求係用以傳輸由供自選擇部73的選擇結果所表示的組合的音頻元件所形成的位元流之請求。例如,傳輸請求係用以傳輸圖2中的箭頭A11至A16的任一者所指的位元流之請求。
於步驟S74中,通信部141經由存取處理部22傳輸供自請求部142以傳輸位元流之傳輸請求至伺服器11。
然後,由所請求組合的音頻元件所形成之位元流係傳輸自伺服器11以回應傳輸請求。
於步驟S75中,通信部141經由存取處理部22自伺服器11接收位元流,且供應位元流至音頻緩衝區75。
當接收位元流時,之後,步驟S76及S77的處理且解碼處理結束。處理係相同如圖10的步驟S15及 S16的處理且因此將省略其說明。
如上述,解碼器23選擇音頻元件的組合,自伺服器11接收所選組合的位元流,且實施解碼。因此,可能解碼輸入位元流於具有不同硬體比例的各種設備中,且可能降低輸入位元流的傳輸位元率。
[第四實施例] <解碼器4的組態實例>
當所選組合的音頻元件獲自伺服器11時,組合的不必要音頻元件可被致使不傳輸。
於此種例子,解碼器23係配置成例如,如圖15所示。再者,於圖15中,對應至圖11或13的例子的部分係由相同參考符號及數字所代表,且將適當省略其說明。
圖15所示的解碼器23具有通信部141、緩衝區尺寸計算部72、選擇部73、請求部142、系統緩衝區111、音頻緩衝區75、解碼部76及輸出部77。於圖15所示的解碼器23的組態中,除了圖13所示的解碼器23的組態進一步提供。
於圖15所示的解碼器23中,選擇部73在構成組合的音頻元件之中選擇音頻元件的組合及未傳輸的不必要音頻元件,且供應選擇結果至請求部142。
在此,不必要音頻元件的選擇係基於例如, 包括於EXT元件中的優先資訊予以實施,但EXT元件可以任何方法獲得。
例如,如圖3的箭頭A21所指,如果EXT元件係單獨記錄於伺服器11中,通信部141在解碼的啟動之前的任意時序經由串流控制部21自伺服器11獲取EXT元件。然後通信部141經由緩衝區尺寸計算部72供應EXT元件至選擇部73。
再者,例如,如圖3的箭頭A22所指,如果EXT元件係指定至輸入位元流的框標題,通信部141自伺服器11先接收存在於輸入位元流的標題部分中的EXT元件,且供應EXT元件至緩衝區尺寸計算部72。然後緩衝區尺寸計算部72供應接收自通信部141的EXT元件至選擇部73。
以下,將在以下假設下繼續說明:如圖3的箭頭A21所指,EXT元件單獨記錄於伺服器11。
請求部142基於供應自選擇部73的選擇結果而供應傳輸請求至通信部141。傳輸請求係用以傳輸由構成所選組合且將不傳輸的音頻元件所形成之位元流之請求。
尺寸資訊係自通信部141供應至系統緩衝區111。
例如,如圖7的箭頭A31所指,如果尺寸資訊係單獨記錄於伺服器11中,通信部141在解碼的啟動之前的任意時間經由串流控制部21自伺服器11獲得尺寸 資訊,且供應該資訊至系統緩衝區111。
再者,例如,如圖7所示的箭頭A32或箭頭A33所指,如果尺寸資訊係指定至訊框的標題或指定至音頻元件的標題,通信部141供應接收自伺服器11的輸入位元流更明確地說每一分開輸入位元流的一部分至系統緩衝區111。
再者,如圖7所示的箭頭A33所指,如果尺寸資訊係指定至音頻元件的標題,設定不傳輸的音頻元件的位元流於選擇部73所選的組合中僅包括尺寸資訊。
系統緩衝區111基於尺寸資訊經由上述傳輸位元率調整處理RMT(1)或RMT(2)而實施緩衝區控制,且供應供自通信部141的音頻元件至音頻緩衝區75。應注意到,以下假設實施傳輸位元率調整處理RMT(1),將繼續說明。
[解碼處理4的說明]
接著,參照圖16的流程圖,將說明由圖15所示的解碼器23所實施的解碼處理。
於步驟S101中,通信部141接收EXT元件及代表可獲自伺服器11的音頻元件的組合之資訊,且供應EXT元件及該資訊至緩衝區尺寸計算部72。
亦即,通信部141傳輸傳輸請求用以經由串流控制部21傳輸EXT元件及表示可獲得的音頻元件的組合之資訊。再者,通信部141經由串流控制部21接收 EXT元件及表示傳輸自伺服器11的音頻元件的組合之該資訊以回應傳輸請求,且供應EXT元件及該資訊至緩衝區尺寸計算部72。再者,緩衝區尺寸計算部72供應接收自通信部141的EXT元件至選擇部73。
當獲得表示音頻元件的組合之資訊時,必要傳輸的音頻元件係經由步驟S102及S103的處理予以選擇。然而,處理係相同如圖12的步驟S42及S43的處理,且因此將省略其說明。
在此,於步驟S102中,必要緩衝區尺寸係基於表示音頻元件的組合之資訊予以計算。於步驟S103中,選擇部73所獲得的選擇結果係供應至請求部142。
再者,請求部142基於供應自選擇部73的傳輸請求而供應傳輸請求至通信部141。傳輸請求係用以傳輸由構成所選組合且將不傳輸的音頻元件所形成之位元流之請求。換言之,必要傳輸所選組合的音頻元件,且必要不傳輸該組合中所選不是解碼目標之不必要音頻元件。
於步驟S104中,通信部141經由存取處理部22供應傳輸請求至伺服器11。傳輸請求係供應自請求部142,且係用以傳輸由構成所選組合且將不傳輸的音頻元件所形成之位元流之請求。
然後為回應用以傳輸位元流的傳輸請求,位元流係傳輸自伺服器11。位元流係由構成所請求組合且設定傳輸的音頻元件所形成。
於步驟S105中,通信部141經由存取處理部 22自伺服器11接收位元流,且供應該位元流至系統緩衝區111。
當接收位元流時,之後,步驟S106至S108的處理且結束解碼處理。這些處理係相同如圖12的步驟S45至S47的處理,且因此將省略其說明。
如上述,解碼器23選擇音頻元件的組合,且基於優先資訊選擇不是解碼目標的不必要音頻元件。因此,可能解碼輸入位元流於具有不同硬體比例的各種設備中,且可能減少輸入位元流的傳輸位元率。再者,透過實施緩衝區控制,可以最小解碼器輸入緩衝區尺寸實施解碼。
然而,上述系列的處理可透過硬體實施,且可透過軟體實施。當該系列的處理係透過軟體實施時,構成軟體的程式係安裝於電腦中。在此,該電腦包括嵌入專用硬體中的電腦且例如,能夠透過安裝各種程式實施各種功能之一般個人電腦或類似物。
圖17係解說經由程式實施上述系列的處理之電腦的硬體的示範性組態之方塊圖。
於電腦中,中央處理單元(CPU)501、唯讀記憶體(ROM)502及隨機存取記憶體(RAM)503係經由匯流排504相互連接。
匯流排504係進一步連接至輸入/輸出介面505。輸入/輸出介面505係連接至輸入部506、輸出部507、儲存部508、通信部509及驅動器510。
輸入部506係由鍵盤、滑鼠、麥克風、成像元件及類似物所形成。輸出部507係由顯示器、揚聲器及類似物所形成。儲存部508係由硬碟、非揮發性記憶體及類似物所形成。通信部509係由網路介面及類似物所形成。驅動器510驅動可移除媒體511諸如磁碟、光碟、磁光碟或半導體記憶體。
於如上述所組構的電腦中,例如,CPU 501經由輸入/輸出介面505及匯流排504載入且執行儲存於儲存部508的程式於RAM 503中,因此實施上述系列的處理。
電腦(CPU 501)所執行之程式可提供於程式存於諸如套裝媒體的可移除媒體511之狀態中。再者,程式係經由諸如區域網路、網際網路或數位衛星廣播的有線或無線傳輸媒體予以提供。
於電腦中,程式可透過裝配可移除媒體511於驅動器510經由輸入/輸出介面505而安裝於儲存部508中。再者,程式可透過容許通信部509經由有線或無線傳輸媒體接收程式的儲存部508中。此外,程式可預先安裝於ROM 502或儲存部508中。
再者,電腦所執行的程式可以是程式以本說明書的說明的順序按時間先後實施處理,且可以是並行或於在諸如呼叫時序的必要時序實施處理的程式。
本技術的實施例不限於上述實施例,且可修飾成各種形式而不會背離本技術的技術領域。
例如,於本技術中,可能採取單功能係經由網路透過複數裝置共用且合作處理之雲端計算組態。
再者,上述流程圖所述的狀態不僅係透過單裝置所執行,可被複數個裝置共享並執行。
更者,當複數處理係包括於單步驟時,包括於單步驟中的該複數處理不僅透過單裝置所執行,且可透過複數裝置共用且執行。
一些實施例可包含以一或數個程式(例如,複數處理器可執行指令)所編碼的非暫時性電腦可讀儲存媒體(或多個非暫時性電腦可讀儲存媒體)(例如,電腦記憶體、一或數個磁碟片、光碟(CD)、光碟、數位光碟(DVD)、磁帶、快閃記憶體、現場可程式閘陣列的電路組態或其它半導體裝置中、或其它實體電腦儲存媒體),當執行在一或數個電腦或其它處理上時,該等程式實施執行上述的各種實施例之方法。自以上實例清楚的看出,非暫時性電腦可讀儲存媒體可保留資訊達足夠時間以提供非暫時性形式的電腦可執行指令。
本技術可具有以下組態。
<1>一種解碼裝置包括:選擇部,其基於緩衝區尺寸選擇音頻元件的一組合,每一尺寸係決定用於該等音頻元件的各組合及每一尺寸係必要用於該組合的音頻元件的解碼;及產生部,其透過解碼所選組合的該等音頻元件而產生音頻信號。
<2>依據<1>的解碼裝置,其中該選擇部自預先提供 用於相同內容的複數組合而選擇一組合。
<3>依據<2>或任何其它先前組態的解碼裝置,另包括通信部,其接收該選擇部在位元流之中所選擇之組合的位元流,每一位元流係提供用於該複數組合的每一者及該組合構成各組合的音頻元件。
<4>依據<1>或<2>或任何其它先前組態的解碼裝置,其中該選擇部在構成位元流的該複數音頻元件之中選擇數個音頻元件作為一組合。
<5>依據<4>或任何其它先前組態的解碼裝置,其中該選擇部基於該位元流的元資料選擇一組合。
<6>依據<5>或任何其它先前組態的解碼裝置,其中該選擇部基於表示預先決定作為該元資料的該複數組合之資訊及該等音頻元件的優先資訊的至少任一者選擇一組合。
<7>依據<4>至<6>的任一者或任何其它先前組態的解碼裝置,另包括擷取部,其自該位元流擷取由該選擇部所選擇之該組合的音頻元件。
<8>依據<4>至<6>的任一者或任何其它先前組態的解碼裝置,另包括通信部,其接收該選擇部所選之該組合的音頻元件。
<9>的任一者依據<5>或任何其它先前組態的解碼裝置,另包括緩衝區控制部,控制其基於未選擇作為解碼目標之該等音頻元件的尺寸而該產生部所解碼的該等音頻元件進入緩衝區的儲存。
<10>依據<9>或任何其它先前組態的解碼裝置,其中該選擇部自構成所選組合的音頻元件另選擇未選擇作為解碼目標的音頻元件,且其中該緩衝區控制部基於選擇部所選且不是解碼目標之音頻元件的尺寸,控制除了構成該選擇部所選的組合且不是解碼目標的音頻元件之音頻元件進入緩衝區的儲存。
<11>依據<10>或任何其它先前組態的解碼裝置,其中該選擇部基於音頻元件的優先資訊選擇不是解碼目標的音頻元件。
<12>一種解碼方法,包括:基於其每一者係決定用於音頻元件的各組合及其每一者係必要用於該組合的音頻元件的解碼之緩衝區尺寸來選擇該等音頻元件的一組合;及透過解碼所選組合的音頻元件而產生音頻信號。
<13>一種致使電腦執行處理的程式,包括:基於其每一者係決定用於音頻元件的各組合及其每一者係必要用於該組合的音頻元件的解碼之緩衝區尺寸來選擇該等音頻元件的一組合;及透過解碼所選組合的音頻元件而產生音頻信號。
<14>一種解碼裝置,包含:至少一緩衝區;及至少一處理器,配置成用以:至少部分地基於該至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
<15>依據<14>的解碼裝置,其中該至少一音頻元件 包含一組音頻元件,及其中該至少一處理器係配置用以自預定的複數組音頻元件選擇該組音頻元件。
<16>依據<15>或其它先前組態的解碼裝置,進一步包含通信部,配置用以接收對應於該組音頻元件中的音頻元件之該輸入位元流中的資料。
<17>依據<14>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以自該輸入位元流中的該多個音頻元件之中選擇複數音頻元件。
<18>依據<17>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以進一步基於該輸入位元流的元資料,選擇該複數音頻元件。
<19>依據<18>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以基於辨識預定的複數組音頻元件的資訊及該等音頻元件的優先資訊,選擇該複數音頻元件。
<20>依據<17>或其它先前組態的解碼裝置,其中該至少一處理器係進一步配置用以自該輸入位元流擷取該複數音頻元件。
<21>依據<17>或其它先前組態的解碼裝置,進一步包含通信部,配置用以接收對應於該複數音頻元件中的音頻元件之該輸入位元流中的資料。
<22>依據<18>或其它先前組態的解碼裝置,進一步包含緩衝區控制器,配置用以基於該複數音頻元件中未解碼的音頻元件的尺寸,控制儲存入透過解碼該複數音頻元 件的至少一者所獲得的至少一所解碼音頻元件的該至少一緩衝區。
<23>依據<22>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以選擇該複數音頻元件中未解碼的該等音頻元件。
<24>依據<23>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以基於該等音頻元件的優先資訊,選擇該複數音頻元件中未解碼的該等音頻元件。
<25>依據<14>或其它先前組態的解碼裝置,其中該至少一處理器係配置用以透過決定足以解碼該至少一音頻元件的緩衝區尺寸且比較該緩衝區尺寸與該至少一緩衝區的尺寸,選擇該至少一音頻元件。
<26>一種解碼方法,包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
<27>一種非暫時性電腦可讀儲存媒體,其儲存處理器可執行指令,當至少一處理器執行該等指令時,該等指令致使該至少一處理器實施解碼方法,該方法包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
熟悉此項技術者應了解到,各種修改、組合、次組合和變更可能發生,取決於屬於附加請求項或其 等效物的範圍內的設計必要條件和其它因素。
23‧‧‧解碼器
74‧‧‧擷取部
71‧‧‧獲得部
75‧‧‧音頻緩衝區
72‧‧‧緩衝區尺寸計算部
76‧‧‧解碼部
73‧‧‧選擇部
77‧‧‧輸出部

Claims (14)

  1. 一種解碼裝置,包含:至少一緩衝區;及至少一處理器,配置成用以:至少部分地基於該至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
  2. 如申請專利範圍第1項的解碼裝置,其中,該至少一音頻元件包含一組音頻元件,及其中,該至少一處理器係配置用以自複數個預定音頻元件組選擇該組音頻元件。
  3. 如申請專利範圍第2項的解碼裝置,進一步包含通信部,其配置用以接收對應於該組音頻元件中的音頻元件之該輸入位元流中的資料。
  4. 如申請專利範圍第1項的解碼裝置,其中,該至少一處理器係配置用以自該輸入位元流中的該多個音頻元件之中選擇複數音頻元件。
  5. 如申請專利範圍第4項的解碼裝置,其中,該至少一處理器係配置用以進一步基於該輸入位元流的元資料,選擇該複數音頻元件。
  6. 如申請專利範圍第5項的解碼裝置,其中,該至少一處理器係配置用以基於識別複數個預定音頻元件組的資訊及該等音頻元件的優先資訊的至少一者,選擇該複數音頻元件。
  7. 如申請專利範圍第4項的解碼裝置,其中,該至少一處理器係進一步配置用以自該輸入位元流擷取該複數音頻元件。
  8. 如申請專利範圍第4項的解碼裝置,其進一步包含通信部,配置用以接收對應於該複數音頻元件中的音頻元件之該輸入位元流中的資料。
  9. 如申請專利範圍第5項的解碼裝置,進一步包含緩衝區控制器,其配置用以基於該複數音頻元件中未解碼的音頻元件的尺寸,控制進入透過解碼該複數音頻元件的至少一者所獲得的至少一已解碼音頻元件的該至少一緩衝區的儲存。
  10. 如申請專利範圍第9項的解碼裝置,其中,該至少一處理器係配置用以選擇該複數音頻元件中未解碼的該等音頻元件。
  11. 如申請專利範圍第10項的解碼裝置,其中,該至少一處理器係配置用以基於該等音頻元件的優先資訊,選擇該複數音頻元件中未解碼的該等音頻元件。
  12. 如申請專利範圍第1項的解碼裝置,其中,該至少一處理器係配置用以透過決定足以解碼該至少一音頻元件的緩衝區尺寸且比較該緩衝區尺寸與該至少一緩衝區的尺寸,選擇該至少一音頻元件。
  13. 一種解碼方法,包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元 件;及透過解碼該至少一音頻元件,產生音頻信號。
  14. 一種非暫時性電腦可讀儲存媒體,其儲存處理器可執行指令,當至少一處理器執行該等指令時,該等指令致使該至少一處理器實施解碼方法,該方法包含:至少部分地基於解碼裝置的至少一緩衝區的尺寸,自輸入位元流中的多個音頻元件之中,選擇至少一音頻元件;及透過解碼該至少一音頻元件,產生音頻信號。
TW104119404A 2014-06-26 2015-06-16 解碼裝置、解碼方法及程式 TWI652670B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014130898A JP6432180B2 (ja) 2014-06-26 2014-06-26 復号装置および方法、並びにプログラム
JP2014-130898 2014-06-26

Publications (2)

Publication Number Publication Date
TW201610987A true TW201610987A (zh) 2016-03-16
TWI652670B TWI652670B (zh) 2019-03-01

Family

ID=53510958

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104119404A TWI652670B (zh) 2014-06-26 2015-06-16 解碼裝置、解碼方法及程式

Country Status (7)

Country Link
US (1) US10573325B2 (zh)
EP (1) EP3161824A1 (zh)
JP (1) JP6432180B2 (zh)
KR (1) KR20170021777A (zh)
CN (1) CN106463139B (zh)
TW (1) TWI652670B (zh)
WO (1) WO2015198556A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190141669A (ko) * 2017-04-26 2019-12-24 소니 주식회사 신호 처리 장치 및 방법, 및 프로그램
WO2019130763A1 (ja) * 2017-12-28 2019-07-04 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN111081226B (zh) * 2018-10-18 2024-02-13 北京搜狗科技发展有限公司 语音识别解码优化方法及装置
CN109814406B (zh) * 2019-01-24 2021-12-24 成都戴瑞斯智控科技有限公司 一种轨道模型电控仿真系统的数据处理方法及解码器架构
CN112118481B (zh) * 2020-09-18 2021-11-23 珠海格力电器股份有限公司 一种音频片段生成方法、装置、播放器及存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6904404B1 (en) * 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
JP2001134294A (ja) * 1999-11-10 2001-05-18 Toshiba Corp オーディオ信号のビットストリームの処理方法及び処理装置
JP2002156998A (ja) * 2000-11-16 2002-05-31 Toshiba Corp オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
KR100390841B1 (ko) * 2001-03-27 2003-07-10 주식회사 하이닉스반도체 피아이디 검출을 고속화하기 위한 피아이디 저장 및 비교장치 및 방법
JP3926730B2 (ja) * 2002-11-11 2007-06-06 日本電信電話株式会社 符号送受信システム
JP2005031289A (ja) * 2003-07-10 2005-02-03 Canon Inc 音声情報処理装置、プロセッサ負荷軽減方法、プログラム、及び記憶媒体
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
US20050096918A1 (en) * 2003-10-31 2005-05-05 Arun Rao Reduction of memory requirements by overlaying buffers
WO2005076622A1 (ja) * 2004-02-06 2005-08-18 Sony Corporation 情報処理装置および情報処理方法、プログラム、並びにデータ構造
CN101807403B (zh) * 2004-07-02 2012-11-21 日本电信电话株式会社 多信道信号编码方法、解码方法、装置
US8264960B2 (en) * 2005-05-31 2012-09-11 Broadcom Corporation Method and system for sharing AV/record resources in a programmable transport demultiplexer and PVR engine
US7810017B2 (en) * 2006-03-20 2010-10-05 Micron Technology, Inc. Variable sector-count ECC
CN101059958B (zh) * 2007-03-15 2010-12-15 上海交通大学 利用缓存来加快量化数据取得的编码和解码方法
PL3591650T3 (pl) * 2007-08-27 2021-07-05 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i urządzenie do wypełniania dziur widmowych
JP4477056B2 (ja) * 2007-12-05 2010-06-09 株式会社東芝 受信装置および受信方法
WO2009095839A1 (en) * 2008-01-28 2009-08-06 Nxp B.V. Device and method for decoding digital tv broadcast
CN101442586B (zh) * 2008-12-31 2012-06-27 中兴通讯股份有限公司 一种多媒体播放方法及播放终端
JP5358270B2 (ja) * 2009-04-28 2013-12-04 パナソニック株式会社 デジタル信号再生装置及びデジタル信号圧縮装置
JP5635097B2 (ja) * 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
CN102184739B (zh) * 2011-03-08 2012-11-07 深圳英飞拓科技股份有限公司 一种录像播放装置及方法
US9165558B2 (en) * 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
TWI517142B (zh) * 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program

Also Published As

Publication number Publication date
US20170140763A1 (en) 2017-05-18
CN106463139B (zh) 2021-03-12
WO2015198556A1 (en) 2015-12-30
KR20170021777A (ko) 2017-02-28
EP3161824A1 (en) 2017-05-03
US10573325B2 (en) 2020-02-25
JP6432180B2 (ja) 2018-12-05
JP2016010090A (ja) 2016-01-18
TWI652670B (zh) 2019-03-01
CN106463139A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
US20210326378A1 (en) Information processing apparatus and information processing method
TWI652670B (zh) 解碼裝置、解碼方法及程式
EP3074973B1 (en) Metadata for ducking control
JP2017526264A (ja) オーディオ処理システムおよび方法
KR20140018385A (ko) 적응형 오디오 시스템을 위한 동기화 및 전환 방법과 시스템
WO2013150437A1 (en) Methods and apparatus for segmenting, distributing, and resegmenting adaptive rate content streams
US10516914B2 (en) Method and system for implementing automatic audio optimization for streaming services
US10535355B2 (en) Frame coding for spatial audio data
JP7288760B2 (ja) インタラクティブなオーディオメタデータの操作
US11595056B2 (en) Encoding device and method, decoding device and method, and program
JP6798312B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
EP4136753B1 (en) Automated mixing of audio description
TW202242852A (zh) 適應性增益控制
JP7434610B2 (ja) 効率的なダッキング利得適用による改善されたメイン‐関連オーディオ体験
EP4288879A1 (en) System and method for providing enhanced audio for streaming video content
WO2017022461A1 (ja) 受信装置、送信装置、及び、データ処理方法
KR20150009476A (ko) 다채널 오디오 신호의 인코딩 방법 및 디코딩 방법, 그리고 상기 방법을 수행하는 인코더 및 디코더