TW201626803A - 可拼接與被拼接之音源資料流以及拼接器及其方法、以及音源編碼與解碼裝置及方法 - Google Patents

可拼接與被拼接之音源資料流以及拼接器及其方法、以及音源編碼與解碼裝置及方法 Download PDF

Info

Publication number
TW201626803A
TW201626803A TW104129409A TW104129409A TW201626803A TW 201626803 A TW201626803 A TW 201626803A TW 104129409 A TW104129409 A TW 104129409A TW 104129409 A TW104129409 A TW 104129409A TW 201626803 A TW201626803 A TW 201626803A
Authority
TW
Taiwan
Prior art keywords
unit
data stream
packet
sound source
source data
Prior art date
Application number
TW104129409A
Other languages
English (en)
Other versions
TWI625963B (zh
Inventor
賀博特 索瑪
羅伯特 貝里德特
史丹芬 克拉巨羅荷
馬克斯 努登朵夫
亞琴 昆慈
安卓斯 尼德米爾
米歇爾 卡拉茲奇門
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201626803A publication Critical patent/TW201626803A/zh
Application granted granted Critical
Publication of TWI625963B publication Critical patent/TWI625963B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/10Arrangements for replacing or switching information during the broadcast or the distribution
    • H04H20/103Transmitter-side switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/34Flow control; Congestion control ensuring sequence integrity, e.g. using sequence numbers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)
  • Telephonic Communication Services (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

音源拼接係藉由至少一截斷單元封包而更有效率,該截斷單元原包被插入至該音源資料流中以對一音源解碼器並為了一預設接取單元指示該預設接取單元所相關之一音源訊框之一端部分要在結束播出時被摒棄。

Description

可拼接與被拼接之音源資料流以及拼接器及其方法、以及音源編碼與解碼裝置及方法
本發明係關於音源拼接。
被編碼的音源通常以複數取樣的區塊來呈現,例如每一區塊(chunk)有1024、2048或4096個取樣。上述區塊在以下被稱為訊框(frame)。在MPEG音訊編解碼器(例如AAC或MPEG-H 3D音訊)的內容中,這些區塊/訊框被稱為細粒(granule),被編碼的區塊/訊框被稱為接取單元(access units,AU)並且被解碼的區塊被稱為組成單元(composition units,CU)。在傳輸系統中,音訊只能在這些被編碼區塊(接取單元)的細粒中呈現可接收的以及可定址的。然而更好的是,能夠在一些最後的粒度(granularity)來定址音源資料,特別是為了以下的目的,例如串流拼接或被編碼音源資料之配置的改變、以及與另一串流(例如一影音流)同步並對齊。
目前所知道的係為摒棄一編碼單元的一些取樣。例如,MPEG-4檔案格式具有所謂的編輯清單,其可用來摒棄一被編碼音源檔案/位元流之開始與結尾的音源取樣。但不利的是,上述編輯清單方法只能與MPEG-4檔案格式一同工作,亦即其係為專特檔案格式,而無法與例如MPEG-2傳輸串流之串流格式一同工作。除此之外,編輯清單係深深地嵌入MPEG-4檔案格式並因此而無法在操作中(on the fly)被串流拼接裝置輕易地修改。在AAC中,截斷資訊可以擴展本體(extension_payload)的形式而被插入資料流中。然而,上述在一被編碼AAC接取單元中的擴展本體係具有下列缺點,即截斷資訊深深地嵌入AAC接取單元中並且無法在操作中 (on the fly)被串流拼接裝置輕易地修改。
據此,本發明之一目的在於提供一種音源拼接的概念,其在許多方面能更有效率,例如在串流拼接器及/或音源解碼器之拼接過程之程序複雜性。
上述目的係藉由本說明書之獨立請求項之標的而達成。
本發明係由下面觀念所啟發,即音源拼接可藉由將至少一截斷單元封包插入音源資料流中以指向一音源解碼器以及與一預定接取單元有關之一音源訊框之一端部分(就如在播出時被摒棄的),而得到更高的效能。
依據本發明之一方面,一截斷單元封包係在開始時提供給一音源資料流,以使音源資料流在一時間粒度(temporal granularity)上並在一預定接取單元變得更容易被拼接,其中該時間粒度係比音源訊框長度更佳。如此,該至少一截斷單元封包係分別被定址到音源解碼器與串流拼接器。依據一實施例,一串流拼接器係簡單地尋找這樣一個截斷單元封包以便定位一個可能的拼接點。串流拼接器係據此設定截斷單元封包以指向與該預定接取單元相關之音源訊框之一端部分(其係在播出時被摒棄)、在預定接取單元的位置上切斷第一音源資料流、以及用另一音源資料流來拼接音源資料流,以便在預定接取單元的位置上彼此鄰接。當截斷單元封包已經被提供在可拼接音源資料流之內時,沒有額外的資料被拼接過程插入,並且位元率消耗係據此維持在不變的程度。
另一方面,一截斷單元封包可在拼接的時間點上被插入。不管是在一開始時就將一截斷單元封包提供給一音源資料流或是在拼接時間點上提供一截斷單元封包給該音源資料流,一被拼接音源資料流係具有這樣被插入其中的截斷單元封包,連同作為一尾端部分之端部分(在預定接取單元作為領先該拼接點之音源資料流之部分的情況中)以及作為一前端部分之端部分(在預定接取單元作為接續該拼接點之音源資料流之部分的情況中)。
10、30、40、110、120‧‧‧音源資料流
12、186‧‧‧音源訊號
14‧‧‧音源訊框
16‧‧‧本體封包
18‧‧‧接取單元
20‧‧‧順序
24‧‧‧時間郵戳資訊
26、86‧‧‧影音
28‧‧‧訊框
32、186‧‧‧音源訊號
34、56‧‧‧前端部分
42、58、112、114‧‧‧截斷單元封包
44‧‧‧尾端部分
46‧‧‧封包形式指標/截斷單元封包辨識器
48‧‧‧截斷長度元件
50、52‧‧‧旗標
54‧‧‧前端/尾端指示器
60‧‧‧小箭頭
70‧‧‧音源編碼器
72‧‧‧音源編碼核心
74‧‧‧截斷單元封包插入器
76‧‧‧拼接位置觸發器
80‧‧‧訊框光柵
82‧‧‧固定訊框光柵
84‧‧‧時間部分
88、90‧‧‧訊框
50‧‧‧旗標
100‧‧‧串流拼接器
102‧‧‧第一音源輸入介面
104‧‧‧第二音源輸入介面
106‧‧‧拼接點設定器
108‧‧‧拼接多工器
116‧‧‧介面
122‧‧‧外部時鐘
130‧‧‧加權迴路
132、142、172、178‧‧‧確認
134‧‧‧設定
136‧‧‧多工器切換
144、148、174、176、180、182‧‧‧步驟
146‧‧‧切換
160‧‧‧音源解碼器
162‧‧‧音源解碼核心
164‧‧‧音源截斷器
170‧‧‧檢測
184‧‧‧尾端
200‧‧‧觸發器
Tb、Te、Tframe‧‧‧時間郵戳
AUi、AUj‧‧‧接取單元
△t‧‧‧時間長度
本發明的優勢係為附屬項之對象。特別說來,本發明較佳實施例係依據下列圖式來說明。
圖中示意地出示:
圖1係示意地從上到下顯示一音源訊號,該音源資料流具有以該音源訊號之音源訊框為單位而被編碼於其內之該音源訊號,一影音係由一序列訊框與另一音源資料流及其被編碼於其內之音源訊號所組成,另該音源資料流及其被編碼於其內之音源訊號係潛在地從某一影音訊框開始而取代該初始音源訊號。
圖2係依據本發明之一實施例顯示一可拼接音源資料流之一示意圖,亦即一音源資料流被提供截斷單元封包以緩和拼接行動。
圖3係顯示一示意圖以描繪依據本發明之一實施例之一截斷單元封包。
圖4係示意地依據本發明另一實施例顯示一截斷單元封包,其中該截斷單元封包係可各別訊號化一前端部分與一尾端部分。
圖5係顯示依據本發明之一實施例之一音源編碼器之一方塊圖。
圖6係顯示本發明一實施例之一示意圖以描繪為了拼入與拼出時間點之一觸發來源,其係取決於一影音訊框光柵。
圖7係顯示依據本發明一實施例之一串流拼接器之一示意方塊圖,連同額外顯示串流拼接器接收圖2對音源資料流並據此輸出一被拼接音源資料流之圖式。
圖8係顯示圖7之串流拼接器之作動模式之一流程圖,以依據本發明一實施例將較低的音源資料流拼接到較高的音源資料流內。
圖9係顯示串流拼接器之作動模式之一流程圖,以依據本發明一實施例將從較低的音源資料流拼接回到較高的音源資料流。
圖10係顯示依據本發明之一實施例之一音源解碼器對一方塊示意圖,連同額外描繪該音源解碼器接收圖7之被拼接之音源資料流。
圖11係顯示圖10之音源解碼器之作動模式之一流程圖,以描繪接取單元之不同操控,其係取決於接取單元作為IPF接取單元及/或接取單元包含截斷單元封包。
圖12係顯示截斷單元封包之一語法之一例子。
圖13A到13C係顯示如何從一音源資料流拼接到另一音源資料流之不同例子,連同拼接時間點係由一影音所決定,其中一影音每秒有50訊框,一音源訊號係以48KHz、1024取樣寬細粒或音源訊框以及90KHz之一時間郵戳時間基準而被編碼於音源資料流內,使得一影音訊框時間等於1800時間基準時間記號(tick),而一音源訊框或音源細粒等於1920時間基準時間記號。
圖14係顯示一示意圖以描繪在一拼接時間點拼接兩個音源資料流之另一例子,該拼接時間點係藉由使用圖13A到13C之例示的訊框與取樣率並藉由一音源訊框光柵所決定。
圖15係顯示一示意圖以描繪依據本發明之一實施例之一編碼器行動,其係拼接不同編碼配置之兩個音源資料流。
圖16係顯示依據本發明之一實施例之使用拼接的不同例子。
圖17係顯示依據本發明之一實施例之支持不同編碼配置之一音源編碼器之一方塊圖。
圖1係例示一音源資料流之一部分以說明當要用另一音源資料流來拼接個別的音源資料流時所產生的問題。到這個程度,圖1之音源資料流係形成顯示在以下圖式中之音源資料流之一種基準。據此,與圖1之音源資料流有關之描述亦對以下所描述的音源資料流是有效的。
圖1的音源資料流係由標號10所指示。在圖1中,音源資料流係具有被編碼於其內之一音源訊號12。特別說來,音源訊號12係以音源訊框14的單位被編碼至音源資料流中,亦即音源訊號12之時間部分可如圖1所示的,並未互相重疊並且相互在時間上鄰接、或者亦可為相互重疊。音源訊號12以音源訊框14的單位被編碼至音源資料流10中之方法可有不同的選擇:可使用變換編碼以便將以音源訊框14為單位之音源訊號編碼至資料流10中。在此情況下,可有至少一頻譜分解變換被應用至音源訊框14之音源訊號,帶同至少一頻譜分解變換在時間上涵蓋到音源訊框14且延伸超過其前端與尾端。頻譜分解變換係數係包含在資料流內,以使解碼器能以反向變換的方式重現個別的訊框。相互與甚至超過音源訊號邊界 係重疊變換部分(音源訊號係以它們為單位而在頻譜上被分解)且藉由所謂的設窗函數而在編碼器側及/或解碼器側被設窗,以致在解碼器側之一所謂的重疊-相加過程(據此,反向地被變換且訊號化之頻譜組成變換係相互重疊且相加)顯示出音源訊號12之再現。
在另一實施例中,音源資料流10具有編碼於其內之音源訊號12,音源訊號12係以音源訊框14為單位並藉由使用線性預測來編碼。依據該線性預測,音源訊框係藉由使用線性預測係數與預測殘餘之被編碼表現而被編碼,其中並依序藉由使用長期預測(LTP)係數(例如LTP增益與LTP滯後)、編碼簿索引及/或一激勵之變換編碼(殘餘訊號)。甚至這裡,在解碼側之一音源訊框14之再現係可取決於一在前的訊框之一編碼、或例如從一音源訊框到另一音源訊框之時間上的預測、或為了變換編碼該激勵訊號或相似物之變換設窗之重疊。這裡係提及上述情況,因為其在下面的敘述中有一定的重要性。
為了傳輸與網絡操控目的,音源資料流10係由一序列的本體封包16組成。各本體封包16係對應屬於接取單元18之其中之一,其中音源資料流10係沿流順序20而被劃分為該等接取單元18。各接取單元18係與各別音源訊框14相關,就如由圖1之雙箭頭22所指出的。如圖1所示,音源訊框14之時間上的順序係可與資料流10中的相關音源訊框18之順序一致:接續另一訊框之一音源訊框14係可與在資料流10中之一接取單元相關,其中該接取單元係接續在資料流10中之另一音源訊框之接取單元。
亦即,如圖1所示,各接取單元18可具有至少一本體封包16。某一接取單元18之至少一本體封包16係具有編碼於其內之前述之編碼參數,該等編碼參數係描述相關的訊框14,並且就如頻譜分解變換係數、線性預測係數、及/或激勵訊號之一編碼。
音源資料流10亦可包含時間郵戳資訊24,其係指示資料流10之各接取單元18之時間郵戳ti以及在該時間郵戳ti時,與各接取單元18 AUi之音源訊框i會被播出。時間郵戳資訊24可如圖1所示,係被插入各接取單元18之其中一封包16以指示相關之音源訊框之時間郵戳,但其 他方式亦可被使用,例如一音源訊框之時間郵戳資訊ti可被插入相關之接取單元AUi之各封包。
由於封包化、接取單元劃分以及時間郵戳資訊24的緣故,音源資料流10特別適合被串流於編碼器與解碼器之間。亦即,圖1所示之音源資料流10係為串流格式之一音源資料流。圖1之音源資料流可例如為依據MPEG-H 3D Audio或MHAS之一音源資料流。
為了使傳輸/網絡操控更容易,封包16可具有相同的位元組並且不同形式的封包16可被分別出來。舉例來說,一些封包16可相關於一第一音源通道或一第一組音源通道,並可具有與其相關之一第一封包形式,而具有與其相關之另一封包形式之封包係具有被編碼於其內之另一音源通道或被編碼於其內之音源訊號12之另一組音源通道。甚至封包可為承載少量的改變資料之一封包形式,改變資料例如配置資料、有用或被使用之編碼參數或一系列的接取單元。甚至其他封包16可為承載對它們所屬於之接取單元有效之編碼參數之一封包形式,而其他本體封包係承載取樣值、變換係數、線性預測編碼係數或其他相似者之編碼。據此,各封包16可於其內具有一封包形式指示器,其可分別藉由中間網絡實體與解碼器而容易被取得。以下所描述的截斷單元封包可藉由封包形式而從本體封包被分辨出來。
只要音源資料流10被傳送,就沒有問題會發生。然而,想像一直到圖1中由τ所指示的時間點,音源訊號12將在解碼側被播出。例如,圖1係描繪時間點τ可藉由一外在的時鐘,例如一影音訊框時鐘,來決定。舉例來說,圖1係描繪一影音26係由一串訊框28以一時間對齊方式並依據音源訊號12而組成,且一個在另一個之上。舉例來說,時間郵戳Tframe可為一新場景、新程序或相似者之第一圖像之時間郵戳,並且據此較佳者係為音源訊號12在時間τ=Tframe時被切割並從那時起被另一音源訊號12取代,以例如表明新場景或程序之音調訊號。舉例來說,圖1係描繪一既存音源資料流30,其係以相同方式作為音源資料流10而被建構,亦即使用由至少一本體封包16所組成之接取單元18,其中伴隨或描述訊框28之圖像串之音源訊號32係在音源訊框14中開始於時間郵戳Tframe,並且第一音 源訊框14具有與時間郵戳Tframe一致之前端,亦即音源訊號32係以註冊於時間郵戳Tframe之播出之訊框14之前端而被播出。
然而,不利的是,音源資料流10之訊框14之訊框率係與影音26之訊框率不相關。據此,音源訊號12τ=Tframe落在某一訊框14之範圍內係為完全隨機的。換言之,只有可能的是,完全停止與音源訊框14,j相關且在τ範圍內之接取單元AUj,並且在音源資料流10之前一接取單元AUj-1附加音源資料流30之該序列接取單元18,藉此在音源訊號12之音源訊框j之前端部分34造成一弱音。
以下所描述之各種實施例係克服如上所述之缺失並且可處理拼接問題。
圖2展示出依據本發明之一實施例之一音源資料流。圖2之音源資料流係由標號40所表示。主要地,音源訊號40對構造係與上述之一音源資料流10一致,亦即音源資料流40包含一序列本體封包,也就是資料流40所分割成至少一接取單元18。各接取單元18係與音源訊號之音源訊框之其中之一相關,該音源訊框係以音源訊框14的單位被編碼至資料流40。除此之外,音源資料流40已被準備在與一預設接取單元相關之一音源訊框內被拼接。於此,係為例示之接取單元AUi與接取單元AUj。請先參照接取單元AUi。特別說來,音源資料流40係藉由具有插設於其內之一截斷單元封包42而呈現可被拼接,該截斷單元封包42係被設置以為接取單元AUi指出相關音源訊框i之一端部份,就如在播出時被摒棄的。截斷單元封包42之優點與效能係在以下被討論。然而,一些初步的敘述係依據截斷單元封包42之位置與其內容而被提供。舉例來說,雖然圖2顯示截斷單元封包42被置位於接取單元AUi內,亦即截斷單元封包42之一端部分所指出的,但截斷單元封包42亦可被置位於在接取單元AUi之前之任一接取單元。相似的,即使截斷單元封包42被置位於接取單元AUi內,截斷單元封包42亦可不被放置於接取單元AUi的第一個封包。
如圖3所示之實施例,由截斷單元封包42所指示的端部分係為一尾端部分44,亦即從音源訊號14內之一時間常數tinner一直到訊框14之尾端。換言之,依據圖3之實施例,沒有語法元件指出截斷單元封包 42所指示之端部分係為一前端部分或一尾端部分。然而,圖3之截斷單元封包42係包含一封包形式指標46以及一截斷長度元件48,封包形式指標46係指出封包42為一截斷單元封包,截斷長度元件48係指出一截斷長度,亦即尾端部分44之時間長度△t。截斷長度48可以音源取樣為單位或是以連續的音源取樣之n元組(tuples)來測量部分44之長度,其中n大於1並例如小於N,N為訊框14中的取樣數量。
以下會描述截斷單元封包42可選擇性地包含至少一旗標50、52。舉例來說,旗標50可為一拼出旗標,其係指出截斷單元封包42指出端部分44之接取單元AUi係用以作為一拼出點。旗標52可為一用於解碼器之旗標以指示現有接取單元AUi是否已被使用作為一拼出點。然而,旗標50、52僅為選擇性的。舉例來說,截斷單元封包42之存在可作為給串流拼接器與解碼器之一訊號,即截斷單元封包42所屬於之接取單元為適合拼出,並且截斷長度48設定為零可為給解碼器之一指示,即沒有截斷要被執行並且因此沒有拼出。
上面對於截斷單元封包42之敘述亦是對於任何截斷單元封包,如截斷單元封包58,為有效的。
如下所敘述的,一接取單元之一前端部分的指示亦可為需要的。在此實施例中,一截斷單元封包,如截斷單元封包58,可設定為指示如圖3所描繪之一尾端部分。這樣一個截斷單元封包58可藉由截斷單元封包之形式指標46而與例如截斷單元封包42之前端部分有所區別。換言之,不同的封包形式可依據指示尾端部分之截斷單元封包42以及指示前端部分之截斷單元封包。
由於完整性的緣故,圖4描繪一種可能性,即截斷單元封包42在除了圖3所示之語法元件之外,可更包含一前端/尾端指示器54以指示截斷長度48是否從音源訊框i之前端或尾端到音源訊框之內部而被測量,亦即端部分(其長度藉由截斷長度48所指示)係為一尾端部分44或一前端部分56。截斷單元封包之封包形式可為相同。
如下所述,截斷單元封包42可使接取單元AUi合適於拼出,這是由於如下所述之串流拼接器可設定尾端部分44以致從外在定義的 拼出時間τ(請參照圖1)開始,音源訊框之播出就被停止。從那時起,拼接的音源資料流之音源訊框可被播出。
然而,圖2亦描繪另一截斷單元封包58,其係插入音源資料流40中且可設定為指示接取單元AUj之一端部分係在播出中被摒棄。然而,此時,接取單元AUj,亦即接取單元AUj+1,已將其相關的音源訊框j以一種獨立於前接取單元AUj-1的方式編碼於其內,也就是沒有預測參考或內部的解碼器註冊器被設定為取決於前任接取單元AUj-1,或是沒有疊加程序提供需求給接取單元AUj-1之一再現,以正確地再現與播出接取單元AUj。為了將接取單元AUj從其他接取單元區別出來,接取單元AUj係藉由使用細線而標出。
圖2係描繪圖2之其他的接取單元具有編碼於其內之其相關的音源訊框,且是以一種方式使得它們的再現係取決於前任接取單元,並以一種觀點即正確的再現與音源訊框的播出在相關接取單元的基準上,僅是可實用於具有接取前任接取單元的例子中,就如同圖式中的小箭頭60從前任接取單元指向各接取單元。在接取單元AUj的例子中,從當前前任接取單元,即AUj-1,指向接取單元AUj之箭頭係被刪除以便指示接取單元AUj之當前結排的能力。舉例來說,為提該當前播出能力,接取單元AUj具有編碼於其內之額外資料,例如初始化該解碼器之內部暫存器之初始化資訊,該資料容許混疊消除資訊之一估測,該估測通常提由當前前任接取單元或相似者之反變換之時間重疊部分所提供。
接取單元AUi與AUj的功能不同。接取單元AUi就如下所述係由於截斷單元封包42所以適合作為一拼出點。換言之,一串流拼接器可在接取單元AUi切割音源資料流40,以附加從另一音源資料流,即一被拼接入之音源資料流,之接取單元。
這在接取單元AUj亦是可行的,是藉由截斷單元封包58可指示一尾端部分44而提供。附加的或另一種的,截斷單元封包58可設定為指示一前端部分,在此例子中,接取單元AUj適合作為一拼接(回)入情況。亦即,截斷單元封包58可指示音源訊框j之一前端部分未被播出,並且直到那時間點,即直到該尾端部分之尾端,(初步地)被拼接入之音源 資料流之音源訊號可被播出。
舉例來說,截斷單元封包42可將拼出旗標50設為零,而截斷單元封包58之拼出旗標50可設為零或1。一些例子可詳細地敘述如下並例如依據圖16。
需注意者,可拼入之接取單元AUj的存在是沒有需要的。舉例來說,要被拼接入之音源資料流可用以取代音源資料流40之播出並從時間常數τ開始,亦即沒有被拼接(回)入會發生在音源資料流40。然而,假使要被拼接入之音源資料流只是在初步時取代音源資料流40之音源訊號,則一拼入回到音源資料流40是必要的,並且在此例子中,對於任何拼出截斷單元封包42而言,都有一個拼入之截斷單元封包58,其係遵照資料流順序20。
圖5係顯示一音源編碼器70以產生圖2之音源資料流40。音源編碼器70包含一音源編碼核心72以及一截斷封包插入器74。音源編碼核心72係可將音源訊號12以例如上面及圖1所述之方式編碼至音源資料流40之本體封包,其中音源訊號12係以音源訊號之音源訊框為單位進入音源編碼核心72。亦即,音源編碼核心72可為一使用一重疊變換來編碼音源訊號12之變換編碼器,重疊變換例如為一改進離散餘弦變換,然後再編碼變換係數。其中,重疊變換之設窗可如上所述,在連續的音源訊框之間越過訊框邊界,藉此導致連續音源訊框及其相關接取單元之一互相依賴。或者,音源編碼器核心72可使用線性預測編碼來將音源訊號12編碼至資料流40中。舉例來說,音源編碼核心72係在訊框接訊框的基準上並使用額外編碼激勵訊號而對描述音源訊號12之頻譜包跡或一些它的前過濾版本之線性預測係數進行編碼。預測編碼的連續更新或關於激勵訊號編碼之重疊變換問題可導致在連續音源訊框與其相關接取單元之間的相互依賴。然而,其他編碼原則亦可被應用。
截斷單元封包插入器74係將例如圖2之截斷單元封包42與58插入至音源資料流40。如圖5所示,截斷單元封包插入器74可為此而回應一拼接位置觸發器76。舉例來說,拼接位置觸發器76可被告知影音中之場景或程式之改變或其他改變,亦即在訊框的序列中,可據此將這樣 新的場景或程式之任何第一訊框發訊號至截斷單元封包插入器74。舉例來說,音源訊號12不斷地表示影音之音源附加物,即影音中的個別場景或程式係被其他訊框序列或相似者所取代。舉例來說,設想代表一即時足球比賽之一影音以及音源訊號12為其相關之音調訊號。則拼接位置觸發器76可手動或自動操作以識別會被廣告,即廣告影像所取代之足球比賽之時間部分,並且觸發器76係據此將該等部分之開始發訊號至截斷單元封包插入器74,使得截斷單元封包插入器74可反應地插入一截斷單元封包42在這樣的一個位置,即關於與音源訊框相關之接取單元,其中影音潛在被取代部分之第一影音訊框係開始並位於該音源訊框之內。此外,觸發器76係在這種潛在被取代的部分之尾端上告知截斷單元封包插入器74,以便將一截斷單元封包58插入於與一音源訊框相關之一接取單元,其中這樣一個部分之端部係位於該音源訊框內。至於這樣的截斷單元封包58,音源編碼核心72亦對觸發器76反應,以便不同地或例外地將各別音源訊框以一種容許立即如上所述之播出的方式來編碼於這樣一個接取單元AUj(請參照圖2)。其間,亦即在影音被取代之部分的這樣可能性中,觸發器76可間歇地插入截斷單元封包58以為了作為一拼入點或拼出點。依據一實際的例子,觸發器76例如將這樣潛在被取代之部分之第一或開始訊框的時間郵戳以及這樣一個部分之最後或端部訊框的時間郵戳告知音源編碼器70,其中編碼器70係辨識音源訊框與相關的接取單元,依據該等接取單元,截斷單元封包插入與潛在地目前播出編碼將會藉由辨識那些音源訊框而發生,其中從觸發器76接收來的時間郵戳會落在該等音源訊框內。
為說明上述,請參照圖6,其係顯示固定的訊框光柵,其中音源編碼核心72係在訊框光柵工作,也就是在標號80之處,並與音源訊號12所屬於之一影音之固定訊框光柵82一同。出於影音86之一部分84係由一大括號來指示。該部分84係例如由一操作員人工決定,或是完全或部分由場景檢測來決定。第一與最後訊框88、90具有與其相關之時間郵戳Tb、Te,其係位於訊框光柵80之音源訊框i、j之內。據此,這些音源訊框14,亦即i、j,被截斷單元封包插入器74提供截斷單元封包,其中音源編碼核心72係使用目前播出模式以產生對應音源訊框j之接取單元。
需注意者,截斷單元封包插入器74可配置以原設定值插入截斷單元封包42、58。舉例來說,截斷長度語法元件48可被設定為零。至於拼入旗標50,其係選擇性的並同樣被截斷單元封包插入器74以如圖2至圖4所述之方式而被設定,亦即在那些以最後訊框或影音86之影像而被註冊的之外,指出截斷單元封包42與所有截斷單元封包58之拼出可能性。由於沒有任何拼接被應用中,所以拼接中旗標52係被設為零。
需注意者,依據圖6之音源編碼器,控制截斷單元封包插入之方式,亦即選擇要進行插入之接取單元之方式,就如依據圖5及圖6所揭示的,其僅為例示,並且其他可決定要進行插入之接取單元亦可被應用。舉例來說,各接取單元,每一N-th(N>2)接取單元或各IPF接取單元可被提供一對應的截斷單元封包。
雖然上面未詳細地說明,但是較佳者係為截斷單元封包係以未壓縮的形式被編碼,以使得一截斷單元封包之一點消耗(編碼位元率)係獨立於截斷單元封包之實際設定。已敘述過,值得注意編碼器可選擇性地包含一率控制器(未顯示於圖5),其係配置來記錄一被編碼音源緩衝器之一填滿等級,以便確定在解碼器側之一被編碼音源緩衝器不會有下溢以產生失速、亦不會上溢以產生封包12損失,其中資料流40係在解碼器側被接收。編碼器可例如控制/改變一量化步驟大小,以便遵守填滿等級,其係受最佳化率/失真測量的限制。特別說來,率控制器可藉由假設一預設傳輸容量/位元率而估測解碼器之被編碼音源緩衝器之填滿等級,其中預設傳輸容量/位元率可為定值或類似定值並且可例如一外部實體,例如一傳輸網絡,而被預先設定。資料流40之截斷單元封包之編碼率係由率控制器所考慮。如此,以圖2所示之形式,亦即以由編碼器70所產生之版本,資料流40以變化然而在其周圍的方式而保持預設位元率,以為補償編碼複雜度,假使音源訊號12在其率/失真比例連同未過載解碼器之被編碼音源填滿等級(導致上溢)與未降率解碼器之被編碼音源填滿等級(導致下溢)。然而,就如之前簡要地敘述過的,並且在下面會更多敘述的,每一拼出接取單元AUi,依據較佳實施例,係應該僅是對於小於它的音源訊框i之時間長度之一時間區間而對解碼器側之播出有所貢獻。就如在下面敘述會更清楚的, 一拼入之音源資料流之(前端)接取單元將取代各別拼出接取單元之後續接取單元,其中,拼入之音源資料流係以資料流40且在各別拼出接取單元,例如AUi,作為一拼接介面而被拼接。如此,從那時起,在編碼器70內所執行之位元率控制器係為過時的。除此之外,所述前端接取單元係較佳以一獨立性的方式被編碼,以便容許立即的播出,藉此消耗比non-IPF接取單元更多的被編碼位元率。如此,依據一實施例,編碼器70係計畫或安排率控制器,以致被記錄之在各別拼出接取單元端之填滿等級,亦即在其與當前後續接取單元之邊界,能假定為例如一預設值,例如1/4、或在最大填滿等級之3/4與1/8之間的值。藉由此量測,其他準備音源資料流之編碼器可取決於下面的事實,即解碼器之被編碼音源緩衝器填滿等級在開始接收它們自己的接取單元的時間時係位於預設值,以致這些其他編碼器可更據此發展率控制器。上述之音源資料流係應該在資料流40之拼出接取單元而被拼入資料流40。雖然目前為止的敘述係集中在資料流40之拼出接取單元,但是在預設被估測/被記錄填滿等級上之黏附亦可藉由率控制器並為了拼(回)入之接取單元,例如AUj,而被達到,即使在沒有扮演雙重角色,如拼入與拼出點,的情況下。如此,所述其他編碼器可相似地以一種方式控制它們的率控制器,以致被估測或被記錄的填滿等級假定為在它們的資料流之接取單元序列之一尾端接取單元之一預設填滿等級。同樣的情形可應用在依據拼出接取單元之編碼器70。這樣的尾端接取單元可應該形成拼接回之接取單元,其中拼回之接取單元應該以資料流40之拼入之接取單元,例如AUj,而形成一拼接點。如此,假使編碼器70之率控制器已經計畫或安排被編碼位元率,以致被估測/被記錄之填滿等級假定為在AUj(更好是在其後)預設填滿等級,則此位元率控制器甚至依然對拼接是在編碼與輸出資料流40之後所進行的情況是有效的。上述之預設填滿等級可藉由原設定而被編碼者所知,亦即在編碼者之間被同意。或者,各別接取單元可被提供一明確之被估測/被記錄填滿等級的訊號化,其係假定為就在各別拼入或拼出之接取單元之後。舉例來說,該值可在各別拼入或拼出之接取單元之截斷單元封包內被傳輸。這花費額外的側邊資訊,但編碼器之率控制器可在發展在拼入或拼出之接取單元之被估測/被記錄之填滿等級上被提供更 多的自由度。舉例來說,它可足夠,然後在拼入或拼出之接取單元之後,被估測/被記錄之填滿等級係低於某閥值,例如最大填滿之3/4,亦即解碼器之被編碼音源緩衝器之最大保證容量。
依據資料流40,這代表同樣的率控制係在一預設平均位元率周圍作變化,亦即它具有一平均位元率。可拼接音源資料流之實際位元率越過封包序列而變化,亦即在時間方面。預設平均位元率之(當前的)偏離可在時間上被整合。該被整合之偏離係在拼入與拼出之接取單元而被假定為在一預設區間內的值,該預設區間可小於被整合位元率偏離之一範圍(最大到最小)之1/2寬,或假定為一定值,例如對所有的拼入與拼出之接取單元皆為相同的值,其係可小於該被整合位元率偏離之一最大值的3/4。如上所述,該值可為原設定所預設。或者,該值並非為定值,並且對所有的拼入與拼出之接取單元非為相等,但可在資料流中被訊號化。
圖7顯示一串流拼接器以依據一實施例拼接音源資料流。串流拼接器係由標號100所表示,並包含一第一音源輸入介面102、一第二音源俞入介面104、一拼接點設定器106以及一拼接多工器108。
在介面102,串流拼接器期望接收一可拼接之音源資料流,亦即被提供至少一截斷單元封包之一音源資料流。在圖7中,係例示圖2之音源資料流在介面102進入串流拼接器100。
另一音源資料流110係期望在介面104被接收。取決於串流拼接器100之實施,在介面104進入之音源資料流110可為一非準備好的音源資料流,例如圖1所述的、或是如下所述之一準備好的音源資料流。
拼接點設定器106係配置以設定被包含在在介面102進入之資料流裡面之截斷單元封包,亦即在圖7之資料流40之截斷單元封包42、58,並且即使呈現在介面104進入之其他資料流110之截斷單元封包。其中,兩個這樣的截斷單元封包係如圖7所例示,亦即在音源資料流110之一前端或第一接取單元AU’1中之一截斷單元封包112、以及在音源資料流110之一最後或尾端接取單元AU’k中之一截斷單元封包114。特別說來,撇號係使用於圖7中以從音源資料流40之接取單元中區別出音源資料流110之接取單元。此外,在圖7所示之例子後,音源資料流110係假定為預 先被編碼且固定長度,亦即於此有K個接取單元,對應至K個音源訊框,K個音源訊框係一同在時間上涵蓋一時間區間,其中已被編碼至資料流40之音源訊號係在該時間區間內被取代。在圖7中,其係例如假定要被取代之該時間區間係從對應接取單元AUi之音源訊框延伸到對應接取單元AUj之音源訊框。
特別說來,拼接點設定器106係以如下所述之方式被配置來設定截斷單元封包,這樣一截斷會更清楚地實際發生。舉例來說,當在進入介面102、104之資料流之截斷單元之內之截斷長度48可被設定為零時,拼接點設定器106可將截斷單元封包之變換長度48之設定改變到一非零的值。以下係說明該值如何被決定的。
拼接多工器108係配置以在具有一截斷單元封包之一接取單元,例如具有截斷單元封包42之接取單元AUi,切割在介面102進入之音源資料流40,以得到該音源資料流40之一子序列本體封包,亦即圖7所例示之對應接取單元AUi之前的接取單元與接取單元AUi之子序列本體封包,並且然後以在介面104進入之其他音源資料流110之一序列本體封包來拼接此子序列,以致相互連續並在預設接取單元相互鄰設。舉例來說,拼接多工器108在接取單元AUi切割音源資料流40,以便包含屬於接取單元AUi之本體封包連同附加之開始於接取單元AU’1之音源資料流110之接取單元AU’,使得接取單元AUi與AU’1相互鄰設。如圖7所示,拼接多工器108在接取單元AUj包含截斷單元封包58之例子中有相似的作動。此時,拼接多工器108係將開始於屬於接取單元AUj之本體封包之資料流40附加於音源資料流110之端部,使得接取單元AU’k鄰設接取單元AUj
據此,拼接點設定器106設定接取單元AUi之截斷單元封包42以便指示在播出時要被摒棄的端部分係為一尾端部分,這是由於音源資料流40之音源訊號要從那時起初步地被編碼至音源資料流110之音源訊號所取代。在截斷單元封包58之例子中,情況是不同的。於此,拼接點設定器106設定截斷單元封包58以便指示在播出時要被摒棄的端部分為音源訊框之一前端部分,其中接取單元AUj係相關於該音源訊框。然而,需要回想,下面的事實,即截斷單元封包42有關於一尾端部分而截斷單元封包58 係有關於一前端部分,係已經藉由使用例如不同的截斷單元封包辨識器46而從入站的音源資料流40中可推論得到的,其中截斷單元封包辨識器46在一面上係為了截斷單元封包42並在另一面上係為了截斷單元封包58。
串流拼接器100係輸出被拼接之音源資料流,如此得到一輸出介面116,其中被拼接之音源資料流係由使用標號120所指示。
需注意者,拼接多工器108與拼接點設定器106在接取單元上之作動順序可不必如圖7所示。亦即,雖然圖7建議拼接多工器108有其連接於介面102與104之輸入並具有其經由拼接點設定器106而連接於輸出介面116之輸出,但是拼接多工器108與拼接點設定器106之間的順序可被切換。
在作動上,串流拼接器100可配置為在音源資料流40之內檢查拼入語法元件50,其係由截斷單元封包52、58所包含,以便在該拼入語法元件是否指示各別截斷單元封包為有關於一拼入接取單元的情況下進行切割與拼接作業。這表示下面的敘述,即到目前所描繪且在以下更詳細的描述之拼接程序可已經被截斷單元封包42所觸發,拼入旗標50係設定為1,如圖2所描述的。據此,該旗標設定為1係由串流拼接器100所檢測,如此,以下更詳細的描述但已經在上面敘述之拼入作業係被進行。
如上所述的,就著在拼入截斷單元封包,例如截斷單元封包42,以及拼出之截斷單元封包,例如截斷單元封包58,之間的辨別而言,拼接點設定器106可不需要改變任何在截斷單元封包內的設定。然而,拼接點設定器106設定要在播出時被摒棄之各別端部分之時間長度。為了此目的,拼接點設定器106可配置為設定端部分之一時間長度,其中截斷單元封包42、58、112、114係依據一外部時鐘而有關於該端部分。該外部時鐘122係例如起源於一影音訊框時鐘。舉例來說,假想被編碼至音源資料流40之音源訊號係代表伴隨一影音之一音調訊號,並且該影音係為圖6之影音86。更假想訊框88係被遇見,亦即該訊框開始一時間部分84且一廣告要被插入至該時間部分84。拼接點設定器106可已經檢測對應的接取單元AUi包含截斷單元封包42,但是外部時鐘122係在精確時間Tb通知拼接點設定器,其中該影音之原來的音調訊號應會在該精確時間Tb播出且被 編碼至資料流110之音源訊號所取代。舉例來說,該拼接點時間點可為對應要被該廣告影音所取代之第一影像或訊框之該時間點其中該廣告影音係依次由被編碼至資料流110之一音調訊號所伴隨。
為更詳細地描繪圖7之串流拼接器100之作動模式,請參照圖8所示,其係顯示串流拼接器100所進行之步驟序列。該程序係開始於一加權迴路130。亦即,串流拼接器100,例如拼接多工器108及/或拼接點設定器106,係為了一拼入點而確認音源資料流40,亦即為了一截斷單元封包42所屬於之一接取單元。在圖7之例子中,接取單元i係為通過確認132之第一接取單元,直到確認132迴路回到它自己。一旦拼入點接取單元AUi被檢測,其截斷單元封包,亦即42,係設定以記錄拼入點接取單元之尾端部分(其前端)連同從外部時鐘122所得到之時間點。在該拼接點設定器106之設定134之後,拼接多工器108係切換到另一資料流,亦即音源資料流110,使得在當前拼入接取單元AUi之後,資料流110之接取單元係被放置到輸出介面106,而不是音源資料流40之後續接取單元。假想從該拼入時間點起就要取代音源資料流40之音源訊號之音源訊號係以一種方式被編碼至音源資料流110,使得該音源訊號連同第一音源訊框之開始係被記錄,其中該第一音源訊框係相關於一第一接取單元AU’1,並且串流拼接器100係僅僅改編由音源資料流110所包含之時間郵戳資訊,使得相關於一第一接取單元AU’1之前訊框之一時間郵戳例如與該拼入時間點一致,亦即AUi的時間點加上相關於AUi之音源訊框之時間長度再減去尾端部分之時間長度,就如步驟134所設定的。亦即在多工器切換136之後,改編138係為連續被執行給資料流110之接取單元AU’之一工作。然而,在此時間之中,下面所敘述之拼出流程亦被執行。
特別來說,由串流拼接器100所執行的拼出流程係開始於一等待迴路,其中音源資料流110之接取單元係依據該等待迴路而不斷地被確認被提供一截斷單元封包114或作為音源資料流110之最後一個接取單元。該確認142係不斷地執行給接取單元AU’之序列。一旦拼出之接取單元被遇到,亦即圖7中的AU’k,則拼接點設定器106係設定該拼出接取單元之截斷單元封包114,以便記錄播出時要被摒棄之尾端部分,對應該接取 單元AUk之音源訊框連同從外部時鐘得到之一時間點,例如一影音訊框之一時間郵戳,亦即在編碼至音源資料流110之音調訊號所屬於之廣告之後的第一個。在該設定144之後,拼接多工器108從其輸入切換至其另一輸入,其中該資料流110係在第一個輸入被傳入。特別來說,該切換146係以一種方式進行,使得在被拼接之音源資料流120中,接取單元AUj立即跟隨接取單元AU’k。特別來說,接取單元AUj係為資料流40之接取單元,其音源訊框係在時間上與該拼入之接取單元AUi所相關之該音源訊框相距一時間量,該時間量係對應被編碼至資料流110之音源訊號之時間長度或從其偏離小於一預設量,例如音源資料流40之接取單元之音源訊框之一長度或一半長度。
下文中,拼接點設定器106在步驟148中設定接取單元AUj之截斷單元封包58以記錄在播出時要被摒棄之其前端部分連同該時間點,其中該時間點與接取單元AU’k之音源訊框之尾端部分已在步驟144中被記錄。藉該量測,接取單元AUj之音源訊框之時間郵戳係等於接取單元AU’k之音源訊框之時間郵戳加上接取單元AU’k之音源訊框之一時間長度再減去接取單元AU’k之音源訊框之尾端部分與接取單元AUj之音源訊框之前端部分的總和。上述事實藉由參照以下所述之例子會變得更清楚。
拼入流程亦是在該切換146之後才開始的。與乒乓球相似,串流拼接器100一方面在連續的音源資料流40與預設長度之音源資料流之間切換,以便取代預設部分,亦即那些具有在一邊之截斷單元封包與在另一邊之截斷單元封包58之接取單元之間的部分。然後再迴到音源資料流40。
從介面102到104之切換係由拼入流程所執行,而拼出流程係從介面104到102來進行。
然而,需注意者,圖7所提供的例子僅是為說明的目的。亦即,圖7之串流拼接器100並非受限於要被音源資料流110從一音源資料流40所取代之橋部分,其中該音源資料流110具有被編碼於其內之合適長度之音源訊號連同具有被編碼於其內之第一音源訊框之第一接取單元且被記錄於要被插入於要被取代之時間部分之音源訊號之開始。反而,串流拼接器可例如是用以僅是執行一個一次性的拼接程序。另外,音源資料流110 並非受限於具有其第一音源訊框,其係與要被拼接入之音源訊號之開始一同被記錄。反而,音源資料流110自己可起源於某些具有其自己的音源訊框時鐘之來源,該音源訊框時鐘係獨立於在音源資料流40之下的音源訊框時鐘而作動。在此例子中,從音源資料流40到音源資料流110之切換在除了圖8所示之步驟之外,亦可包含對應步驟148之設定步驟,即音源資料流110之截斷單元封包之設定。
需注意者,上述串流拼接器之作動之上面敘述可依據被拼接之音源資料流120之接取單元之時間郵戳而變化,其中,一截斷單元封包係指示在播出時要被摒棄之一前端部分。不留下接取單元原有的時間郵戳,反而是串流多工器108可配置來藉由將前端部分之時間長度增加到原有的時間郵戳而修改其原有的時間郵戳,藉此指出前端部分之尾端以及從哪個時間起該接取單元之音源訊框片斷要被實際的播出。這另一種方法將會藉由圖16之例子之時間郵戳來說明。
圖10係顯示依據本發明之一實施例之一音源解碼器160。舉例來說,音源解碼器160係顯示為接收由串流拼接器100所產生之被拼接之音源資料流120。然而,與該串流拼接器之敘述相似的是,圖10之音源解碼器160並非受限於接收圖7至圖9所說明之被拼接音源資料流120之種類,其中一基本音源資料流係初步原被其他音源資料流所取代,其他音源資料流係具有被編碼於其內之對應的音源訊號長度。
音源解碼器160包含一音源解碼核心162,其係接收被拼接之音源資料流與一音源截斷器164。音源解碼核心162以音源訊號整音源訊框為單位並從傳入之音源資料流120之本體封包之序列而進行音源訊號之再現。其中,如上所述的,本體封包係各別有關於接取單元之序列之其中之一,而被拼接之音源資料流120係被劃分為該等接取單元。各接取單元120係相關於該等音源訊框之其中之一,且音源解碼核心162係對每一音源訊框與相關之接取單元輸出再現之音源取樣。如上所述的,解碼可關涉一反頻譜變換並由於一疊加程序,或者選擇性地,預測的編碼觀念,並且音源解碼核心162可從一各別的接取單元再現音源訊框,同時額外地使用,即取決於一前任接取單元。然而,無論何時一當前的播出接取單元到達時, 例如接取單元AUj,音源解碼核心162係可使用額外的資料以容許一當前的播出,且不需要或期望從一先前的接取單元而來的任何資料。此外,如上所述的,音源解碼核心162可藉由使用線性預測解碼而作動。亦即,音源解碼核心162可使用包含在各接取單元內之線性預測係數,以形成一合成濾波器,並且可從接取單元來解碼一激勵訊號,其例如關涉變換解碼,即反變換、使用包含在各接取單元及/或預測編碼或內部狀態更新之指標的查表,然後提交激勵訊號以得到合成濾波器,或者另一種方式,即藉由使用一轉移函數而在頻域中塑形該激勵訊號以對應合成濾波器之轉移函數。音源截斷器164係對被插入至音源資料流120之截斷單元封包反應並且截斷與某一具有這樣截斷單元封包之接取單元相關之一音源訊框,以摒棄其端部分,其係被表示為在截斷單元封包之播出時被摒棄的。
圖11係顯示圖10之音源解碼器160之作動之一模式。當檢測170一新的接取單元時,音源解碼器係確認該接取單元是否為使用當前播出模式之一被編碼者。假使當前的接取單元為一當前播出訊框接取單元,該音源解碼核心162係對待該接取單元如同一獨立的資訊來源,以為了再現相關於目前的接取單元之音源訊框。亦即,如上所述的,音源解碼核心162可預先填滿內部暫存器,以在被編碼於該接取單元之資料的基準上,再現相關於一目前接取單元之音源訊框。額外地或另外地,音源解碼核心162抑制從任何前接取單元來使用預測,如同在non-IPF模式一樣。額外地或另外地,音源解碼核心162不會以任何前接取單元或其相關前音源訊框來進行任何疊加程序,以為了在當前接取單元之音源訊框之時間前端之混疊消除。反而,舉例來說,音源解碼核心162係從當前接取單元自己而得到時間混疊消除資訊。如此,假使確認172揭示出當前接取單元為一IPF接取單元,則IPF解碼模式174係由音源解碼核心162所執行,藉此得到當前音源訊框之再現。或者,假使確認172揭示出當前接取單元不是IPF接取單元,則音源解碼核心162係照例應用non-IPF解碼模式到當前的接取單元。亦即,在處理先前接取單元之後,音源解碼核心162之內部暫存器可被使用。另外地或額外地,一疊加程序可複使用,以幫助當前接取單元之音源訊框之時間尾端的再現。另外地或額外地,從前接取單元之預測可 被使用。non-IPF解碼176亦在當前接取單元之音源訊框之一再現中播出。下一個確認178係確認任何截斷是否要被進行。確認178係由音源截斷器164所執行。特別來說,音源截斷器164係確認當前接取單元是否具有一截斷單元封包以及該截斷單元封包是否指出在播出時要被摒棄之一端部分。舉例來說,音源截斷器164係確認一截斷單元封包是否為了當前接取單元而被包含在資料流中以及拼接中旗標52是否被設定及/或該截斷長度48是否不等於零。假使沒有截斷發生,則從步驟174或176再現的再現音源訊框係在步驟180中完全播出。然而,假使截斷要被執行,音源截斷器164係進行該截斷並且只有剩下的部分在步驟182中播出。在端部分由截斷單元封包指示為一尾端部分的例子中,再現的音源訊框之剩餘者的播出係開始於與該音源訊框相關之時間郵戳。在端部分由截斷單元封包指示為要在播出時被摒棄而作為一前端部分的例子中,音源訊框的剩餘者係在該音源訊框的時間郵戳加上前端部分的時間長度而被播出。亦即,當前音源訊框之剩餘者之播出係被前端部分之時間長度所延遲。然後,該程序係針對下一個接取單元而執行。
請參照圖10之實施例。音源解碼核心162係執行正常的non-IPF解碼176於接取單元AUi-1與AUi上。然而,後者具有截斷單元封包42。該截斷單元封包42係指示播出時要被摒棄之一尾端部分,並且據此該音源截斷器164係避免與接取單元AUi相關之音源訊框14之一尾端184被播出,亦即參與形成該輸出音源訊號186。以下,接取單元AU’1到達。同樣的係為一當前播出訊框接取單元並且因此由音源解碼核心162在步驟174所對待。需注意者,音源解碼核心163可例如包含開啟複數個它自己的舉例說明之能力。亦即,無論何時一IPF解碼被執行,其係關涉到音源解碼核心162之另一舉例說明之開啟。在任何情況中,如同接取單元AU’1係為一IPF接取單元,沒有關係的是其音源訊號係實際有關於一完全新的音源場景,這是相較於其前接取單元AUi-1與AUi。音源解碼核心162並不關心這件事。反而,接取單元AU’1作為一獨立的接取單元並且從它再現音源訊框。當前接取單元AUi之音源訊框之尾端部分之長度可能被串流拼接器100設定時,接取單元AU’1之音源訊框之開始係立即鄰設於接取單元AUi 之音源訊框之剩餘者之尾端。亦即,它們在過渡時間T1鄰設在接取單元AUi之音源訊框之中間的某個地方。一旦遇到接取單元AU’k,音源解碼核心162係在步驟176中解碼該接取單元,以揭示或再現該音源訊框,隨之該音源訊框係由於尾端部分之指示而在其尾端被其截斷單元封包114所截斷。如此,只有接取單元AU’k之音源訊框之剩餘者一直到尾端部分係被播出。然後,接取單元AUj係被在IPF解碼174中之音源解碼核心162所解碼,亦即以一種獨立的方式而獨立於接取單元AU’k並且從它得到的音源訊框係在其前端被截斷,同時它的截斷單元封包58係指示一前端部分。接取單元AU’k與AUj之音源訊框之剩餘者係在一過渡時間點T2相互鄰設。
上述之實施例係基本上使用一訊號化來描述某一音源訊框之許多音源取樣在解碼相關的接取單元之後,是否或如何被拼棄。上述之實施例可例如被應用來擴展一音源編解碼器,例如MPEG-H 3D Audio。MPEG-H 3D Audio標準係定義一獨立的串流格式來變換稱作MHAS之MPEG-H 3D音源資料。與上述一致,上述之截斷單元封包之截斷資料可在MHAS等級被訊號化。其中,它可被輕易地檢測且可在操作中由串流拼接裝置,例如圖7之串流拼接器100,而被容易地修改。這樣一個新的MHAS封包形式可例如用PACTYP_CUTRUNCATION來加標籤。該封包形式之本體可具有如圖12所示之語法。舉例來說,為使在圖12之特定語法例子與圖3及圖4之敘述之間的一致性更容易,圖3及圖4之標號已經被重覆使用以辨識圖12之對應的語法元件。其語義可如下所述:
isActive:假使為1,則截斷信息為有效的,假使為0,則解碼器應忽視該信息。
canSplice:告知一拼接裝置一拼接可開始或繼續(需注意者,這基本上為一廣告開始的旗標,但是因為它沒有帶任何資訊給解碼器,該拼接裝置可重設它為零)。
truncRight:假使為零,則從該接取單元截斷取樣,假使為1,則從該接取單元之開始截斷取樣。
nTruncSamples:要截斷之取樣的數量。
需注意者,MHAS串流保證一MHAS封包本體總是位元組 對齊的,所以該截斷資訊係容易在操作中取得並可容易被例如一串流拼接裝置插入、移除或修改。一MPEG-H 3D Audio串流可包含一MHAS封包形式連同PACTYP_CUTRUNCATION給每一接取單元或給接取單元之一合適子集合且isActive設為零。然後,一串流拼接裝置可依據其需要修改該MHAS封包。或者,一串流拼接裝置可容易插入這樣一個MHAS封包而不在其上增加大量的位元率,如同以下所描述的。MPEG-H 3D Audio之最大的細粒大小係遵4096個取樣,所以13位元對於nTruncSamples是足夠訊號化所有有意義的截斷值。nTruncSamples與3個1位元旗標一同佔據16位元或2位元組,以致不需要其他的位元組對齊。
圖13a至13c係描繪CU截斷之方法如何被使用來實施取樣精確串流拼接。
圖13a係顯示一影音流與一音源流。在第5個影音訊框時,節目係被初換至一不同的來源。影音與音源在新來源中的對齊係不同於在舊有的來源。為致能被解碼之音源之取樣精確切換,在舊有串流之最後一個CU之端部與在新串流之開始之PCM取樣必需被移除。在被解碼之PCM域中之一短期的交越衰減可能是需要的,以避免在輸出PCM訊號的故障。圖13a係顯示一例子連同具體的值。假使接取單元/CU之重疊由於一些原因而不被需要,則兩個可能的解法係揭示在圖13B與圖13C。新的串流之第一接取單元必需帶著配置資料給新的串流,並且所有的預先滾動是需要的以用新的配置來初始化解碼器。這可藉由一當前播出訊框(IPF)而達到,IPF係定義於MPEG-H 3D Audio標準中。
CU截斷方法的另一應用係為改變MPEG-H 3D Audio串流之配置。不同的MPEG-H 3D Audio串流可具有非常不同的配置,例如一立體聲節目可被一節目以11.1通道與額外音源目標跟隨。配置通常在一影音訊框邊界改變,該影音訊框邊界不與該音源流之細粒對齊。CU截斷之方法可被用來實施取樣精確音源配置改變,就如圖14所描繪的。
圖14係顯示一影音流與一音源流。在第5個影音訊框時,節目係切換至不同的配置。具有新的音源配置之第一個CU係與影音訊框對齊,其中該配置改變係發生在該影音訊框。為致取樣精確配置改變,在具 有舊有配置之最後一個CU之端部之音源PCM取樣必需被移除。具有新配置之第一個接取單元必需帶著新配置資料,並且所有的預先滾動是需要的以初始化具有新配置之解碼器。這可藉由一當前播出訊框(IPF)而達到,IPF係定義於MPEG-H 3D Audio標準中。一編碼器可從舊配置使用PCM音源取樣以為新配置編碼預先滾動並為了存在於兩種配置之通道。舉例來說,假使配置改變係從立體聲到11.1,則新11.1配置之左右通道可從舊有立體聲配置來使用從左邊與右邊的預先滾動資料。新11.1配置之其他通道使用零給預先滾動。圖15係描繪編碼器作動以及此例子之位元流產生。
圖16係顯示可拼接或被拼接之音源資料流的例子。如圖16A所示,舉例來說,圖16A係顯示一可拼接音源資料流之一部分,其係包含7個連續的接取單元AU1到AU7。第二與第六接取單元各被提供一截斷單元封包。藉由將旗標52設為零,兩者皆未被使用,亦即非活動中。接取單元AU6之截斷單元封包係由IPF形式之一接取單元所包含,亦即它係致能一個回到資料流內之拼接。在B,圖16係顯示A在插入一廣告之後之音源資料流。該廣告係編碼於接取單元AU’1到AU’4之一資料流。在C與D中,圖16係顯示相較於A與B之一修改過的例子。特別來說,接取單元AU1…之音源資料流之音源編碼器係決定改變在接取單元AU6之音源訊框之內的某處之編碼設定。據此,C之舊有的音源資料流係包含時間郵戳6.0之兩個接取單元,即AU6與AU’1連同各別的尾端部分與前端部分,其係被指示為要在播出時被摒棄的。於此,截斷活化已藉由音源編碼器來預設。然而,接取單元AU’1仍是可用於作為一被拼接回入之接取單元,並且這樣的可能性係描述於D。
E與F係描述在拼出點改變編碼設定之一例子。最後,在G與H中,圖16之A與B的例子係由提供給接取單元AU5之另一截斷單元封包而被擴展,其可作為一拼入或繼續點。
如上所述的,雖然就著在接取單元產生的過程中並在一非常早的階段將這些截斷單元封包之位元率消耗帶入考慮之能力方面,具有截斷單元封包之音源資料流之接取單元之預先提供是較佳的,然而這並非是強制的。舉例來說,圖7至圖9所述之串流拼接器可在下列方面被修改, 即串流拼接器藉由相較於一截斷單元封包之出現在第一介面102所傳入之音源資料流之其他方式來辨識拼入或拼出點。舉例來說,串流拼接器可對外部時鐘122有反應,並依據拼入與拼出點之檢測。依據這另一種方式,拼接點設定器106不會只設定截斷單元封包,亦會將它們插入資料流中。然而,需注意者,音源編碼器係受到任何準備工作的限制,即音源編碼器仍必需為著應作為被拼接回入點之接取單元而選擇IPF編碼模式。
最後,圖17係顯示較佳的拼接技術亦可被使用在能在不同的編碼配置之間進行改變之一音源編碼器之內。圖17之音源編碼器70係以與圖5相同的方式而構成,但此時音源編碼器70係回應於一配置改變觸發器200。亦即,如圖16之例子C所示,音源編碼器核心72繼續地將音源訊號12編碼至接取單元AU1到AU6中。在接取單元AU6之音源訊框之內的某處,配置改變時間點係由觸發器200所指示。據此,音源編碼器核心72,其係使用相同的音源訊框光柵,亦藉由使用一個新的配置,例如關涉更多被編碼音源通道或相似者之一音源編碼模式,來編碼接取單元AU6之當前的音源訊框。音源編碼器核心72係藉由使用新配置並額外使用IPF編碼模式而在另一時間編碼音源訊框。這播出在接取單元AU’1,其係立即跟隨一接取單元順序。兩個接取單元,即接取單元AU6與AU’1,係被截斷單元封包插入器74提供截斷單元封包,前者係具有指示為要在播出時被摒棄之一尾端部分,而後者係具有指示為要在播出時被摒棄之一前端部分。當其為一IPF接取單元時,後者亦可作為一被拼接回入點。
如上所述之所有實施例,需注意者,交越衰減可能會執行在解碼器並在從被拼接音源資料流之該子序列接取單元到一拼出接取單元(例如AUi)而再現之音源訊框之間,其係實際上應該在一方面上之該拼出接取單元之音源訊框之尾端部分之前端,以及從被拼接音源資料流之該子序列接取單元而再現之音源訊號,並從接續在拼出接取單元(例如AU’1)之接取單元,其可立即從後繼的接取單元之音源訊框之前端開始,或者在該後繼的接取單元之音源訊框之前端部分之尾端。亦即,在該時間點周圍或越過該時間點之一時間區間之內,其中當前連續的接取單元之該等部分,其係播出且相互鄰設,實際的播出音源訊號作為藉由解碼器而從被拼 接音源資料流被播出係可藉由當前鄰設之兩個接取單元之音源訊框之一組合而形成,並帶著在此時間區間在時間上不斷增加之後繼者接取單元之音源訊框之一組合的貢獻以及在時間區間內在時間上不斷減少之拼出接取單元之音源訊框之該組合貢獻。相似地,交越衰減可被執行於拼入接取單元,例如AUj與它們的當前之前接取單元(例如AU’k)之間,亦即藉由形成實際的播出音源訊號,其係藉由拼入接取單元之音源訊框與前任接取單元之音源訊框之一組合並在該時間點周圍與越過該時間點之一時間區間之內,在該時間點該拼入接取單元之音源訊框之前端部分以及前任接取單元之音源訊框之尾端部分係相互鄰設。
換言之,在上述實施例中,特別顯示藉由傳輸串流而開發可用帶寬的可能性,以及可用的解碼器MHz,即一種音源拼接點信息與它將取代之音源訊框一同被傳送。在拼接點附近之輸出音源與輸入音源二者皆被解碼並且在它們之間之一交越衰減係可被執行。音源拼接點信息僅告知解碼器要在哪裡進行交越衰減。這實際上係為一完美的拼接,因為該拼接正確地發生且被記錄在PCM域中。
如此,上面必述係特別揭示下列方面:
A1、可拼接的音源資料流40,包含:一序列本體封包16,各本體封包係對應屬於一序列接取單元18之其中之一,且該可拼接音源資料流係被劃分為該等接取單元18,各接取單元係對應相關於一音源訊號12之音源訊框14之其中之一,該音源訊號12係以音源訊框為單位而被編碼至該可拼接音源資料流;以及一截斷單元封包42、58,係被插入至可拼接音源資料流並可設定以便為一預設接取單元指出一音源訊框之一端部分44、56,該預設接取單元係相關於該音源訊框,該端部分係在播出時被摒棄。
A2、依據方面A1之可拼接音源資料流,其中該音源訊框之該端部分係為一尾端部分44。
A3、依據方面A1或A2之可拼接音源資料流,其中該可拼接音源資料流係更包含:另一截斷單元封包58,係被插入至該可拼接音源資料流並 且可被設定以便為另一預設接取單元指出另一音源訊框之一端部分44、56,另該預設接取單元係相關於另該音源訊框,該端部分係在播出時被摒棄。
A4、依據方面A3之可拼接音源資料流,其中另該音源訊框之該端部分係為一前端部分56。
A5、依據方面A3或A4之可拼接音源資料流,其中該截斷單元封包42與另該截斷單元封包58係各包含一拼出語法元件50,其係指示該截斷單元封包或另該截斷單元封包是否有關於一拼出接取單元。
A6、依據方面A3或A5之可拼接音源資料流,其中該預設接取單元例如AUi係將各相關之音源訊框以一種方式編碼於其內,使得其在解碼側之一再現係取決於在該預設接取單元之前之一接取單元,並且大部分的接取單元係將各相關之音源訊框以一種方式編碼於其內,使得其在解碼側之再現係取決於各前接取單元,並且另該預設接取單元AUj係將各相關之音源訊框以一種方式編碼於其內,使得其在解碼側之再現係獨立於在另該預設接取單元之前的接取單元,藉此容許當前的播出。
A7、依據方面A6之可拼接音源資料流,其中該截斷單元封包42與另該截斷單元封包58係各包含一拼出語法元件50,其係指示該截斷單元封包或另該截斷單元封包是否有關於一拼出接取單元,其中由該截斷單元封包所包含之該拼出語法元件50係指示該截斷單元封包係有關於一拼出接取單元以及由另該截斷單元封包所包含之該語法元件係指示另該截斷單元封包係無關於一拼出接取單元。
A8、依據方面A6之可拼接音源資料流,其中該截斷單元封包42與另該截斷單元封包58係各包含一拼出語法元件50,其係指示該截斷單元封包或另該截斷單元封包是否有關於一拼接接取單元,其中由該截斷單元封包所包含之該拼接語法元件50係指示該截斷單元封包係有關於一拼出接取單元以及由另該截斷單元封包所包含之該拼出語法元件係指示另該截斷單元封包亦有關於一拼出接取單元,其中另該截斷單元封包包含一前/尾端截斷語法元件54以及一截斷長度元件48,其中該前/尾端截斷語法元件係用以指示另該音源訊框之該端部分係為一尾端部分44或一前端部分 56,以及該截斷長度元件係用以指示另該音源訊框之該端部分之一長度△t。
A9、依據方面A1到A8之任一之可拼接音源資料流,其係被率控制以在一預設平圴位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元假定為在一預設區間之一值,其係小於該整合位元率偏離之一範圍的1/2寬,並在整個可拼接之音源資料流上變化。
A10、依據方面A1到A8之任一之可拼接音源資料流,其係被率控制以在一預設平均位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元假定為一固定值,其係小於該整合位元率偏離之一最大值的3/4,並在整個可拼接之音源資料流上變化。
A11、依據方面A1到A8之任一之可拼接音源資料流,其係被率控制以在一預設平均位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元與其他接取單元假定為一預設值,其中截斷單元封包係在可拼接音源資料流中呈現給該等其他接取單元。
B1、被拼接之音源資料流,包含:一序列本體封包16,各該本體封包係對應屬於一序列接取單元18之其中之一,其中該被拼接音源資料流係被劃分為該等接取單元18,且各該接取單元係對應相關於音源訊框14之其中之一;一截斷單元封包42、58、114,其係插入至該被拼接音源資料流並指示一音源訊框之一端部分44、56要在播出時被摒棄,其中一預設接取單元係相關於該音源訊框,其中在該序列本體封包之第一子序列本體封包中,各本體封包屬於一第一音源資料流之一接取單元AU#,該第一音源資料流已將一第一音源訊號以該第一音源訊號之音源訊框為單位編碼於其內,並且第一音源資料流之該等接取單元包含預設接取單元,並且在該序列本體封包之一第子二序列本體封包中,各本體封包屬於一第二音源資料流之接取單元AU’#,該第二音源資料流已將一第二音源訊號以該第二音源資料流之音源 訊框為單位編碼於其內,其中該第一與該第二子序列本體封包係為連續且在該預設接取單元相互鄰設,並且該端部分在該第一子序列處於該第二子序列之前的情況中係為一尾端部分44,以及該端部分在該第二子序列處於該第一子序列之前的情況中係為一前端部分56。
B2、依據方面B1之被拼接音源資料流,其中該第一子序列係在該第二子序列之前並且該端部分作為一尾端部分44。
B3、依據方面B1或B2之被拼接音源資料流,其中該被拼接音源資料流更包含另一截斷單元封包58,其係插入至該被拼接音源資料流並指示另一音源訊框之一前端部分58要在播出時被摒棄,另一預設接取單元AUj係與另該音源訊框相關,其中在該序列本體封包之一第三子序列本體封包中,各本體封包屬於一第三音源資料流之接取單元AU’’#,該第三音源資料流已將一第三音源訊號編碼於其內,或者屬於該第一音源資料流之接取單元AU#,且在該第一音源資料流之接取單元之後,該第一子序列本體封包係屬於該第一音源資料流,其中該第二音源資料流之接取單元係包含另該預設接取單元。
B4、依據方面B3之被拼接音源資料流,其中包含該預設接取單元之該被拼接音源資料流之大部分接取單元係已將各相關音源訊框以一種方式編碼於其內,使得在宗碼側之其一再現係取決於各前接取單元,其中該接取單元,例如是AUi+1,係緊接在該預設接取單元之後並形成該第二音源資料流之該等接取單元之一開始,且已將各相關音源訊框以一種方式編碼於其內,使得其再現係獨立於該預設接取單元,例如AUi,藉此容許當前的播出並且另該預設接取單元AUj已將另該音源訊框以一種方式編碼於其內,使得其再現係獨立於緊接在另該預設接取單元之前的接取單元,藉此容許當前的播出。
B5、依據方面B3或B4之被拼接音源資料流,其中該被拼接之音源資料流更包含再一截斷單元封包114,其係插入至該被拼接音源資料流並指示再一音源訊框之一尾端部分44要在播出時被摒棄,其中緊接在另該預設接取單元,例如AUj,之前的接取單元,例如AU’k,係與另該音 源訊框相關,其中該被拼接音源資料流包含時間郵戳資訊24,其係為該被拼接音源資料流之各接取單元指示各時間郵戳,在該時間郵戳時,與各別接取單元相關之該音源訊框係被播出,其中另該預設接取單元之一時間郵戳係等於緊接於另該預設接取單元之前之該接取單元之時間郵戳加上緊接在另該預設接取單元之前之該接取單元所相關整該音源訊框之一時間長度,再減去另該音源訊框之該前端部分與再該音源訊框之該尾端部分之一時間長度的總和或等於緊接在另該預設接取單元之前之該接取單元之該時間郵戳,加上緊接在另該預設接取單元之前之該接取單元所相關之該音源訊框之一時間長度,再減去再該音源訊框之該尾端部分之該時間長度。
B6、依據方面B2之被拼接音源資料流,其中該被拼接之音源資料流更包含再一截斷單元封包58,其係插入至該被拼接音源資料流並指示再一音源訊框之一前端部分56要在播出時被摒棄,其中緊接在該預設接取單元,例如AU’k,之後的接取單元,例如AUj,係與另該音源訊框相關,其中該被拼接音源資料流包含時間郵戳資訊24,其係為該被拼接音源資料流之各接取單元指示各時間郵戳,在該時間郵戳時,與各別接取單元相關之該音源訊框係被播出,其中緊接在該預設接取單元之後之該接取單元之一時間郵戳係等於該預設接取單元之時間郵戳加上該預設接取單元所相關之該音源訊框之一時間長度,再減去該預設接取單元所相關之該音源訊極之該尾端部分之以及另該接取單元之該前端部分之一時間長度之總和,或等於該預設接取單元之該時間郵戳加上該預設接取單元所相關之該音源訊框之一時間長度再減去該預設接取單元所相關之該音源訊框之該尾端部分之該時間長度。
B7、依據方面B6之被拼接音源資料流,其中該被拼接音源資料流之大部分的接取單元係已將各相關的音源訊框以一種方式編碼於其內,以致在解碼側之其一再現係取決於各緊接於前的接取單元,其中緊接於該預設接取單元之後並形成該第二音源資料流之該等接取單元之開始之該接取單元已將各相關之音源訊框以一種方式編碼於其內,使得在解碼側之其再現係獨立於該預設接取單元,藉此容許當前的播出。
B8、依據方面B7之被拼接音源資料流,其中該第一與第二 音源資料流藉由使用不同的編碼配置而被編碼,其中緊接於該預設接取單元並形成該第二音源資料流之該等接取單元之一開始之該接取單元係已將配置資料cfg編碼於其內以重新配置一解碼器。
B9、依據方面B4之被拼接音源資料流,其中該被拼接音源資料流更包含再另一截斷單元封包112,其係插入該被拼接音源資料流並指示緊接於該預設接取單元之後之該接取單元之相關之再另一音源訊框之一前端部分係要在播出時被摒棄,其中緊接於該預設接取單元之該接取單元之一時間郵戳係等於該預設接取單元之該時間郵戳加上與該預設接取單元相關之該音源訊碼之一時間長度再減去再另該音源訊框之該前端部分之一時間長度以及與該預設接取單元相關之該音源訊框之該尾端部分之一時間長度之總和,或者等於該預設接取單元之該時間郵戳加上與該預設接取單元相關之該音源訊框之一時間長度再減去與該預設接取單元相關之該音源訊框之該尾端部分之該時間長度。
B10、依據方面B4、B5或B9之被拼接音源資料流,其中緊接於該預設接取單元之後對該接取單元之一時間郵戳係等於該預設接取單元之該時間郵戳加上與該預設接取單元相關之該音源訊框之一時間長度再減去與該預設接取單元相關之該音源訊框之該尾端部分之一時間長度。
C1、用以拼接音源資料流之串流拼接器,包含:一第一音源輸入介面102,用以接收包含一序列本體封包16之一第一音源資料流40,各該本體封包係對應屬於一序列接取單元18之其中之一,該第一音源資料流係劃分為該等接取單元18,該第一音源資料流之各接取單元係對應相關於一第一音源訊號12之音源訊框14之其中之一,該第一音源訊號12係以該第一音源訊號之音源訊框為單位而被編碼於該第一音源資料流;一第二音源輸入介面104,用以接收包含一序列本體封包之一第二音源資料流110,各該本體封包係對應屬於一序列接取單元之其中之一,該第二音源資料流係劃分為該等接取單元,該第二音源資料流之各接取單元係對應相關於一第二音源訊號之音源訊框之其中之一,該第二音源訊號係以該第二音源訊號之音源訊框為單位而被編碼於該第二音源資料 流;一拼接點設定器;以及一拼接多工器,其中,該第一音源資料流更包含一截斷單元封包42、58,其係插入至該第一音源資料流並可設定來為一預設接取單元指示一預設接取單元所相關之一音源訊框之一端部分44、56要在播出時被摒棄,並且該拼接點設定器106係配置來設定該截斷單元封包42、58,使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分44、56要在播出時被摒棄,或者該拼接點設定器106係配置來將一截斷單元封包42、58插入至該第一音源資料流並設定該截斷單元封包42、58以為一預設接取單元指示該預設接取單元所相關之該音源訊框之一端部分44、56要在播出時被摒棄,並且設定該截斷單元封包42、58,使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分44、56要在播出時被摒棄;以及其中,該拼接多工器108係配置來在該預設接取單元切割該第一音源資料流以得到該第一音源資料流之一子序列本體封包,在該第一音源資料流中各本體封包係對應屬於該第一音源資料流之連續的接取單元之其中之一並包含該預設接取單元,並且拼接該第一音源資料流之該子序列本體封包以及該第二音源資料流之該序列本體封包,使得本體封包係為連續且在該預設接取單元相互鄰接,其中在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之前的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一尾端部分44,而在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之後的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一前端部分56。
C2、依據方面C1之串流拼接器,其中該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之該第二子序列之前,且該預設接取單元所相關之該音源訊框之該端部分係為一尾端部分44。
C3、依據方面C2之串流拼接器,其中該串流拼接器係配置以檢查由該截斷單元封包所包含之一拼出語法元件50,並在該拼出語法元件50是否指示該截斷單元封包有關於一拼出接取單元的情況中來執行該切割與拼接。
C4、依據方面C1到C3之任一之串流拼接器,其中該拼接點設定器係配置以設定該端部分之一時間長度以與一外部時鐘一致。
C5、依據方面C4之串流拼接器,其中該外部時鐘係為一影音訊框時鐘。
C6、依據方面C2之串流拼接器,其中該第二音源資料流具有,或者該拼接點設定器106藉由插入而造成,另一截斷單元封包114,其係插入該第二音源資料流110並可設定為指示該第二音源資料流110之一播出接取單元,例如AU’k,所相關之另一音源訊框之一端部分要在播出時被摒棄,並且該第一音源資料流更包含再一截斷單元封包58,其係插入該第一音源資料流40並可設定為指示再該預設接取單元,例如AUj,所相關之再一音源訊框之一端部分要在播出時被摒棄,其中在該預設接取單元,例如AUi,之該音源訊框與再該預設接取單元,例如AUj,之再該音源訊框之間之一時間距離係與在拼接後在該預設接取單元,例如AUi,之後之其一前端接取單元,例如AU’1,以及該尾端接取單元,例如AU’k之間之該第二音源訊號之一時間長度一致,其中該拼接點設定器106係配置來設定另該截斷單元封包114,以指示另該音源訊框之一尾端部分44要在播出時被摒棄,並設定再該截斷單元封包58以指示再該音源訊框之一前端部分要在播出時被摒棄,其中該拼接多工器108係配置以改編由該第二音源資料流110所包含並指示各接取單元一時間郵戳之時間郵戳資訊24,其中在該時間郵戳時,各接取單元所相關之該音源訊框係被播出,使得該第二音源資料流110之該前端接取單元所相關之一前端音源訊框之一時間郵戳係與該預設接取單元所相關對該音源訊框之時間郵戳加上該預設接取單元所相關之該音源訊框之該時間長度減去該預設接取單元所相關之該音源訊框之該尾端部分之該時間長度一致,並且該拼接點設定器106係配置以設置另該截斷單元封包114與再該截斷單元封包58,使得再該音源訊框之一時間郵戳係 等於另該音源訊框之該時間郵戳加上另該音源訊框之一時間長度減去另該音源訊框之該尾端部分與再該音源訊框之該前端部分之一時間長度的總和。
C7、依據方面C2之串流拼接器,其中該第二音源資料流110具有,或者該拼接點設定器106藉由插入而造成,另一截斷單元封包112,其係插入該第二音源資料流並可設定為指示該第二音源資料流之一前端接取單元,例如AU’1,所相關之另一音源訊框之一端部分要在播出時被摒棄,其中該拼接點設定器106係配置來設定另該截斷單元封包112,以指示另該音源訊框之一前端部分要在播出時被摒棄,其中由該第一與第二音源資料流所包含並指示各接取單元一時間郵戳之時間郵戳資訊24在時間上係對準,其中在該時間郵戳時,該第一與第二音源資料流之各接取單元所相關之該音源訊框要被播出,並且該拼接點設定器106係配置以設定另該截斷單元封包112,使得另該音源訊框之一時間郵戳減去該預設接取單元,例如AUi,所相關之該音源訊框之一時間長度再加上該前端部分之一時間長度係等於該預設接取單元所相關對該音源訊框之該時間郵戳加上該預設接取單元所相關之該音源訊框之一時間長度再減去該尾端部分之該時間長度。
D1、音源解碼器,包含:一音源解碼核心162係配置以從一音源資料流120之一序列本體封包16並以一音源訊號之音源訊框14為單位再現該音源訊號12,其中各本體封包係對應屬於一序列接取單元18之其中之一,該音源資料流係被劃分為該等接取單元18,其中各接取單元係相關於對應的音源訊框;以及一音源截斷器164,係配置以回應被插入至該音源資料流中之一截斷單元封包42、58、114,以截斷與一預設接取單元相關之一音源訊框,以在該音源訊號播出時摒棄其一端部分,該端部分係被該截斷單元封包指示為要在播出時被摒棄。
D2、依據方面D1之音源解碼器,其中該端部分係為一尾端部分44或一前端部分56。
D3、依據方面D1或D2之串流拼接器,其中該音源資料流之大部分的接取單元係已將各相關之音源訊框以一種方式編碼於其內,使得其該再現係取決於各緊接於前之接取單元,並且該音源解碼核心162係配置以取決於各緊接於前之接取單元而再現各該大部分接取單元所相關之該音源訊框。
D4、依據方面D3之串流拼接器,其中該預設接取單元已將各相關之音源訊框以一種方式編碼於其內,使得其再現係獨立於緊接於該預設接取單元之前之一接取單元,其中該音源解碼單元162係配置以獨立於緊接於該預設接取單元之前之該接取單元而再現該預設接取單元所相關之該音源訊框。
D5、依據方面D3或D4之串流拼接器,其中該預設接取單元已將配置資料編碼於其內,並且該音源解碼單元162係配置以使用該配置資料來依據該配置資料而配置解碼選項,並應用該等解碼選項以再現該預設接取單元以及緊接於該預設接取單元之後之連續的接取單元所相關之該等音源訊框。
D6、依據方面D1到D5之任一之串流拼接器,其中該音源資料流包含指示該音源資料流之各接取單元一時間郵戳,在該時間郵戳時,各接取單元所相關之該音源訊框係被播出,其中該音源解碼器係配置以藉由在時間上依據該時間郵戳資訊而對齊該等音源訊框之前端與該預設接取單元所相關之該音源訊框之省去的端部分而播出該等音源訊框。
D7、依據方面D1到D6之任一之串流拼接器,其係配置以執行一交越衰減於該端部分與該音源訊框之一剩餘部分之一連結處。
E1、音源編碼器,包含:一音源編碼核心72,係配置以將一音源訊號12以該音源訊號之音源訊框為單位編碼於一音源資料流40之本體封包16內,使得各本體封包對應屬於接取單元18之其中之一,該音源資料流係劃分為該等接取單元18,各接取單元係對應相關於該等音源訊框之其中之一,以及一截斷封包插入器74,係配置以將一截斷單元封包44、58插入至該音源資料流中,該截斷單元封包44、58係可設定以指示一預設接 取單元所相關之一音源訊框之一端部分要在播出時被摒棄。
E2、依據方面E1之音源編碼器,其中該音源編碼器係配置以產生依據方面A1到A9之任一之一可拼接音源資料流。
E3、依據方面E1或E2之音源編碼器,其中該音源編碼器係配置以取決於一外部時鐘而從該等接取單元選擇該預設接取單元。
E4、依據方面E3之音源編碼器,其中該外部時鐘係為一影音訊框時鐘。
E5、依據方面E1到E5之任一之音源編碼器,其係配置以執行一率控制,使得該音源資料流之一位元率係在一預設平均位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元假定為在一預設區間之一值,該預設區間係小於該整合位元率偏離之一範圍之1/2寬,該整合位元率偏離係在整個可拼接音源資料流上作變化。
E6、依據方面E1到E5之任一之音源編碼器,其係配置以執行一率控制,使得該音源資料流之一位元率係在一預設平均位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元假定為一小於該整合位元率偏離之一最大值之3/4之一固定值,該整合位元率偏離係在整個可拼接音源資料流上作變化。
E7、依據方面E1到E5之任一之音源編碼器,其係配置執行一率控制,使得該音源資料流之一位元率係在一預設平均位元率周圍變化或遵循該預設平均位元率,使得從該預設平均位元率之一整合位元率偏離係在該預設接取單元及其他接取單元上假定為一預設值,其中截斷單元封包係為了該等其他接取單元而被插入至該音源資料流。
E8、依據方面E1到E7之任一之音源編碼器,其係配置以藉由記錄一被編碼音源解碼器緩衝器填滿狀態而執行一率控制,使得一被記錄填滿狀態係在該預設接取單元上假定為一預設值。
E9、依據方面E8之音源編碼器,其中該預設值對接取單元是相同的,其中截斷單元封包係為了該等接取單元而被插入至該音源資料流中。
E10、依據方面E8之音源編碼器,其係配置以訊號化位於該音源資料流之內的該預設值。
雖然一些方面已被描述於上文中之一裝置,但清楚的是這些方面亦代表對應方法之一敘述,其中一方塊或元件係對應一方法步驟或一方法步驟之一特徵。類似地,描述於上文中的一方法步驟的方面亦代表一對應方塊或項目或一對應裝置之特徵之一描述。該等方法步驟之一些或全部可藉由(或使用)一硬體裝置而執行,例如一微處理器、一可編程電腦或一電子電路。在一些實施例中,最重要方法步驟之其中之一或更多可藉由這樣的裝置來執行。
本發明之被拼接或可拼接音源資料流可被儲存於一數位儲存媒體上,或可在一傳輸媒體,例如一無線傳輸媒體或一有線傳輸媒體,例如網際網路,而被傳輸。
取決於某些實施需求,本發明之實施例可藉由硬體或軟體而實施。該實施可藉由使用一數位儲存媒體,例如一軟碟、一DVD,藍光光碟、一CD、一唯讀記憶體、一可編程唯讀記憶體、一可消除程式化唯讀記憶體、一電子式可清除程式化唯讀記憶體或快閃記憶體來執行,並具有電子可讀控制訊號儲存於其上,其係與一可編程電腦系統合作(或具有合作性能),以致各方法被執行。因此,數位儲存媒體可為電腦可讀。
依據本發明的一些實施例係包含具有電子可讀控制訊號之一資料承載器,其少可與一可編程電腦系統合作,以致本發明之方法之其中之一係被執行。
一般而言,本發明之實施例可實施為一電腦程式產品連同一程式碼,當電腦程式產品在一電腦上執行時,該程式碼係可作動以執行該等方法之其中之一。該程式碼可例如被儲存於一機械可讀承載器上。
其他實施例係包含以執行本發明之方法之其中之一之電腦程式,其係儲存於一機械可讀承載器。
換言之,本發明方法之一實施例係因此為一電腦程式,當電腦程式執行於一電腦上時,其具有一程式碼以執行本發明方法之其中之一。
本發明方法之另一實施例係因此為一資料承截器(或一數位 儲存媒體或一電腦可讀媒體),其係包含,被記錄於其上,電腦程式以執行本發明方法之其中之一。該資料承截器、該數位儲存媒體或該被記錄媒體係為幫典型地具體的及/或非暫態的。
本發明方法之另一實施例係因此為一資料流或一序列訊號,其係代表用以執行本發明方法之其中之一之電腦程式。資料流或該序列訊號可例如配置以經由一資料通訊連接而被傳送,例如經由網際網路。
另一實施例包含一處理手段,例如一電腦或一可編程邏輯裝置,其係配置或合適於執行本發明方法之其中之一。
另一實施例包含一電腦,該電腦具有用以執行本發明方法之其中之一之電腦程式儲存於其上。
依據本發明之另一實施例係包含一裝置或一系統,其係配置以傳送(例如電子式或光學式)用以執行本發明方法之其中之一之一電腦程式到一接收器。該接收器可例如為一電腦、一行動裝置、一記憶體裝置或相似者。該裝置或該系統可例如包含一檔案伺服器以傳送該電腦程式至該接收器。
在一些實施例中,一可編程邏輯裝置(例如一現場可編程閘陣列)可被使用來執行本發明方法之一些或全部的功能性。在一些實施例中,一現場可編程閘陣列可與一微處理器合作以執行本發明方法之其中之一。一般而言,該等方法較佳係藉由任何硬體裝置來執行。
本發明敘述之裝置可藉由使用一硬體裝置、或使用一電腦、或使用一硬體裝置與一電腦之一組合而被實施。
本發明敘述之方法可藉由使用一硬體裝置、或使用一電腦、或使用一硬體裝置與一電腦之一組合而被實施。
上述實施例僅是為了說明本發明之原則。被了解的是本發明所描述之任何安排與細節之修改及變化對熟悉該項技藝者是顯而易見的。因此,本發明僅被申請專利範圍之概念所限制,並非受限於本發明所提及之例示的實施例之細節。
14‧‧‧音源訊框
16‧‧‧本體封包
18‧‧‧接取單元
20‧‧‧順序
40‧‧‧音源資料流
42、58‧‧‧截斷單元封包
60‧‧‧小箭頭
AUi、AUj‧‧‧接取單元

Claims (21)

  1. 一種可拼接的音源資料流(40),包含:一序列本體封包(16),各本體封包係對應屬於一序列接取單元(18)之其中之一,且該可拼接音源資料流係被劃分為該等接取單元(18),各接取單元係對應相關於一音源訊號(12)之音源訊框(14)之其中之一,該音源訊號(12)係以該等音源訊框為單位而被編碼至該可拼接音源資料流;以及一截斷單元封包(42;58),係被插入至該可拼接音源資料流並可設定以便為一預設接取單元指出該預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄。
  2. 依據申請專利範圍第1項之該可拼接音源資料流,其中該可拼接音源資料流係更包含:另一截斷單元封包(58),係被插入至該可拼接音源資料流並且可被設定以便為另一預設接取單元指示另該預設接取單元所相關之另一音源訊框之一端部分(44;56)要在播出時被摒棄。
  3. 依據申請專利範圍第2項之該可拼接音源資料流,其中該預設接取單元係將各該音源訊框以一種方式編碼於其內,使得其在解碼側之其一再現係取決於緊接在該預設接取單元之前之一接取單元,並且大部分的接取單元係將各相關之音源訊框以一種方式編碼於其內,使得其在解碼側之其再現係取決於各緊接於前之接取單元,並且另該預設接取單元係將各相關之音源訊框以一種方式編碼於其內,使得其在解碼側之再現係獨立於緊接於另該預設接取單元之前之接取單元,藉此容許當前的播出。
  4. 依據申請專利範圍第3項之該可拼接音源資料流,其中該截斷單元封包(42)與另該截斷單元封包(58)係各包含一拼出語法元件(50),其係指示該截斷單元封包或另該截斷單元封包是否有關於一拼出接取單元,其中由該截斷單元封包所包含之該拼出語法元件(50)係指示該截斷單元封包係有關於一拼出接取單元以及由另該截斷單元封包所包含之該語法元件係指示另該截斷單元封包係無關於一拼出接取單元。
  5. 依據申請專利範圍第3項之該可拼接音源資料流,其中該截斷單元封包 (42)與另該截斷單元封包(58)係各包含一拼出語法元件,其係指示該截斷單元封包或另該截斷單元封包是否有關於一拼出接取單元,其中由該截斷單元封包所包含之該語法元件(50)係指示該截斷單元封包係有關於一拼出接取單元以及由另該截斷單元封包所包含之該拼出語法元件係指示另該截斷單元封包亦有關於一拼出接取單元,其中另該截斷單元封包包含一前/尾端截斷語法元件(54)以及一截斷長度元件(48),其中該前/尾端截斷語法元件係用以指示另該音源訊框之該端部分係為一尾端部分(44)或一前端部分(56),以及該截斷長度元件係用以指示另該音源訊框之該端部分之一長度(△t)。
  6. 一種被拼接之音源資料流,包含:一序列本體封包(16),各該本體封包係對應屬於一序列接取單元(18)之其中之一,其中該被拼接音源資料流係被劃分為該等接取單元,且各該接取單元係對應相關於音源訊框(14)之其中之一;一截斷單元封包(42;58;114),其係插入至該被拼接音源資料流並指示一預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄,其中在該序列本體封包之第一子序列本體封包中,各本體封包屬於一第一音源資料流之一接取單元(AU#),該第一音源資料流已將一第一音源訊號以該第一音源訊號之音源訊框為單位編碼於其內,並且該第一音源資料流之該等接取單元包含預設接取單元,並且在該序列本體封包之一第二子序列本體封包中,各本體封包屬於一第二音源資料流之接取單元(AU’#),該第二音源資料流已將一第二音源訊號以該第二音源資料流之音源訊框為單位編碼於其內,其中該第一與該第二子序列本體封包係為連續且在該預設接取單元相互鄰設,並且該端部分在該第一子序列處於該第二子序列之前的情況中係為一尾端部分(44),以及該端部分在該第二子序列處於該第一子序列之前的情況中係為一前端部分(56)。
  7. 依據申請專利範圍第6項之被拼接音源資料流,其中該被拼接音源資料流更包含另一截斷單元封包(58),其係插入至該被拼接音源資料流並指 示另一預設接取單元所相關之另一音源訊框之一前端部分(58)要在播出時被摒棄,其中在該序列本體封包之一第三子序列本體封包中,各本體封包屬於一第三音源資料流之接取單元(AU”#),該第三音源資料流已將一第三音源訊號編碼於其內,或者屬於該第一音源資料流之接取單元(AU#),且在該第一音源資料流之接取單元之後,該第一子序列本體封包係屬於該第一音源資料流,其中該第二音源資料流之該等接取單元係包含另該預設接取單元。
  8. 依據申請專利範圍第7項之被拼接音源資料流,其中包含該預設接取單元之該被拼接音源資料流之大部分接取單元係已將各相關音源訊框以一種方式編碼於其內,使得其在解碼側之一再現係取決於各緊接於前之接取單元,其中緊接在該預設接取單元之後並形成該第二音源資料流之該等接取單元之一開始之該接取單元係已將各相關音源訊框以一種方式編碼於其內,使得其再現係獨立於該預設接取單元,藉此容許當前的播出,並且另該預設接取單元已將另該音源訊框以一種方式編碼於其內,使得其再現係獨立於緊接在另該預設接取單元之前的接取單元,藉此容許當前的播出。
  9. 依據申請專利範圍第7項之被拼接音源資料流,其中該被拼接之音源資料流更包含再一截斷單元封包(114),其係插入至該被拼接音源資料流並指示緊接於另該預設接取單元之前之該接取單元所相關之再一音源訊框之一尾端部分(44)要在播出時被摒棄,其中該被拼接音源資料流包含時間郵戳資訊(24),其係為該被拼接音源資料流之各接取單元指示各時間郵戳,在該時間郵戳時,與各別接取單元相關之該音源訊框係被播出,其中另該預設接取單元之一時間郵戳係等於緊接於另該預設接取單元之前之該接取單元之時間郵戳加上緊接在另該預設接取單元之前之該接取單元所相關之該音源訊框之一時間長度,再減去另該音源訊框之該前端部分與再該音源訊框之該尾端部分之一時間長度的總和。
  10. 依據申請專利範圍第8項之被拼接音源資料流,其中緊接在該預設接取單元之後之該接取單元之一時間郵戳係等於該預設接取單元之時間郵戳加上該預設接取單元所相關之該音源訊框之一時間長度,再減去 該預設接取單元所相關之該音源訊框之該尾端部分之一時間長度。
  11. 一種用以拼接音源資料流之串流拼接器,包含:一第一音源輸入介面(102),用以接收包含一序列本體封包(16)之一第一音源資料流(40),各該本體封包係對應屬於一序列接取單元(18)之其中之一,該第一音源資料流係劃分為該等接取單元(18),該第一音源資料流之各接取單元係對應相關於一第一音源訊號(12)之音源訊框(14)之其中之一,該第一音源訊號(12)係以該第一音源訊號之音源訊框為單位而被編碼於該第一音源資料流;一第二音源輸入介面(104),用以接收包含一序列本體封包之一第二音源資料流(110),各該本體封包係對應屬於一序列接取單元之其中之一,該第二音源資料流係劃分為該等接取單元,該第二音源資料流之各接取單元係對應相關於一第二音源訊號之音源訊框之其中之一,該第二音源訊號係以該第二音源訊號之音源訊框為單位而被編碼於該第二音源資料流;一拼接點設定器;以及一拼接多工器,其中,該第一音源資料流更包含一截斷單元封包(42;58),其係插入至該第一音源資料流並可設定來為一預設接取單元指示一預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄,並且該拼接點設定器(106)係配置來設定該截斷單元封包(42;58),使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分(44;56)要在播出時被摒棄,或者該拼接點設定器(106)係配置來將一截斷單元封包(42;58)插入至該第一音源資料流並設定該截斷單元封包(42;58)以為一預設接取單元指示一預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄,並且設定該截斷單元封包(42;58),使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分(44;56)要在播出時被摒棄;以及其中,該拼接多工器(108)係配置來在該預設接取單元切割該第一音源資料流以得到該第一音源資料流之一子序列本體封包,在該第一音 源資料流中各本體封包係對應屬於包含該預設接取單元之該第一音源資料流之連續的接取單元之其中之一,並且拼接該第一音源資料流之該子序列本體封包以及該第二音源資料流之該序列本體封包,使得本體封包係為連續且在該預設接取單元相互鄰接,其中在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之前的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一尾端部分(44),而在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之後的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一前端部分(56)。
  12. 依據申請專利範圍第11項之串流拼接器,其中該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之該第二子序列之前,且該預設接取單元所相關之該音源訊框之該端部分係為一尾端部分(44)。
  13. 依據申請專利範圍第11項之串流拼接器,其中該拼接點設定器係配置以設定該端部分之一時間長度以與一外部時鐘一致。
  14. 依據申請專利範圍第12項之串流拼接器,其中該第二音源資料流具有,或者該拼接點設定器(106)藉由插入而造成,另一截斷單元封包(114),其係插入該第二音源資料流(110)並可設定為指示該第二音源資料流(110)之一播出接取單元所相關之另一音源訊框之一端部分要在播出時被摒棄,並且該第一音源資料流更包含再一截斷單元封包(58),其係插入該第一音源資料流(40)並可設定為指示再該預設接取單元所相關之再一音源訊框之一端部分要在播出時被摒棄,其中在該預設接取單元之該音源訊框與再該預設接取單元之再該音源訊框之間之一時間距離係與在拼接後在該預設接取單元之後之其一前端接取單元以及該尾端接取單元之間之該第二音源訊號之一時間長度一致,其中該拼接點設定器(106)係配置來設定另該截斷單元封包(114),以指示另該音源訊框之一尾端部分(44)要在播出時被摒棄,並設定再該截斷單元封包(58)以指示再該音源訊框之一前端部分要在播出時被摒棄,其中該拼接多工器(108)係配置以改編由該第二音源資料流(110)所包含並指示各接 取單元一時間郵戳之時間郵戳資訊(24),其中在該時間郵戳時,各接取單元所相關之該音源訊框係被播出,使得該第二音源資料流(110)之該前端接取單元所相關之一前端音源訊框之一時間郵戳係與該預設接取單元所相關對該音源訊框之時間郵戳加上該預設接取單元所相關之該音源訊框之該時間長度減去該預設接取單元所相關之該音源訊框之該尾端部分之該時間長度一致,並且該拼接點設定器(106)係配置以設置另該截斷單元封包(114)與再該截斷單元封包(58),使得再該音源訊框之一時間郵戳係等於另該音源訊框之該時間郵戳加上另該音源訊框之一時間長度減去另該音源訊框之該尾端部分與再該音源訊框之該前端部分之一時間長度的總和。
  15. 依據申請專利範圍第12項之串流拼接器,其中該第二音源資料流(110)具有,或者該拼接點設定器(106)藉由插入而造成,另一截斷單元封包(112),其係插入該第二音源資料流並可設定為指示該第二音源資料流之一前端接取單元所相關之另一音源訊框之一端部分要在播出時被摒棄,其中該拼接點設定器(106)係配置來設定另該截斷單元封包(112),以指示另該音源訊框之一前端部分要在播出時被摒棄,其中由該第一與第二音源資料流所包含並指示各接取單元一時間郵戳之時間郵戳資訊(24)在時間上係對準,其中在該時間郵戳時,該第一與第二音源資料流之各接取單元所相關之該音源訊框要被播出,並且該拼接點設定器(106)係配置以設定另該截斷單元封包,使得另該音源訊框之一時間郵戳減去該預設接取單元所相關之該音源訊框之一時間長度再加上該前端部分之一時間長度係等於該預設接取單元所相關對該音源訊框之該時間郵戳加上該預設接取單元所相關之該音源訊框之一時間長度再減去該尾端部分之該時間長度。
  16. 一種音源解碼器,包含:一音源解碼核心(162)係配置以從一音源資料流(120)之一序列本體封包(16)並以一音源訊號之音源訊框(14)為單位而再現該音源訊號(12),其中各本體封包係對應屬於一序列接取單元(18)之其中之一,該音源資料流係被劃分為該等接取單元(18),其中各接取單元係相關於對應 的音源訊框;以及一音源截斷器(164),係配置以回應被插入至該音源資料流中之一截斷單元封包(42;58;114),以截斷與一預設接取單元相關之一音源訊框,以在該音源訊號播出時摒棄其一端部分,該端部分係被該截斷單元封包指示為要在播出時被摒棄。
  17. 一種音源編碼器,包含:一音源編碼核心(72),係配置以將一音源訊號(12)以該音源訊號之音源訊框為單位編碼於一音源資料流(40)之本體封包(16)內,使得各本體封包對應屬於接取單元(18)之其中之一,該音源資料流係劃分為該等接取單元(18),各接取單元係對應相關於該等音源訊框之其中之一,以及一截斷封包插入器(74),係配置以將一截斷單元封包(44;58)插入至該音源資料流中,該截斷單元封包(44;58)係可設定以指示一預設接取單元所相關之一音源訊框之一端部分要在播出時被摒棄。
  18. 一種用以拼接音源資料流之方法係包含一第一音源資料流(40),其係包含一序列本體封包(16),各本體封包係對應屬於一序列接取單元(18)之其中之一,且該第一音源資料流係被劃分為該等接取單元(18),該第一音源資料流之各接取單元係對應相關於一第一音源訊號(12)之音源訊框(14)之其中之一,該第一音源訊號(12)係以該第一音源訊號之音源訊框為單位而被編碼至該第一音源資料流;以及一第二音源資料流(110),其係包含一序列本體封包,各該本體封包係對應屬於一序列接取單元之其中之一,該第二音源資料流係劃分為該等接取單元,該第二音源資料流之各接取單元係對應相關於一第二音源訊號之音源訊框之其中之一,該第二音源訊號係以該第二音源訊號之音源訊框為單位而被編碼於該第二音源資料流;其中,該第一音源資料流更包含一截斷單元封包(42;58),其係插入至該第一音源資料流並可設定來為一預設接取單元指示一預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄,並且該方法 包含設定該截斷單元封包(42;58),使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分(44;56)要在播出時被摒棄,或者該方法包含將一截斷單元封包(42;58)插入至該第一音源資料流並設定該截斷單元封包(42;58)以為一預設接取單元指示一預設接取單元所相關之一音源訊框之一端部分(44;56)要在播出時被摒棄,並且設定該截斷單元封包(42;58),使得該截斷單元封包係指示該預設接取單元所相關之該音源訊框之一端部分(44;56)要在播出時被摒棄;以及該方法更包含在該預設接取單元切割該第一音源資料流(40),以得到該第一音源資料流之一子序列本體封包,在該第一音源資料流中各本體封包係對應屬於包含該預設接取單元之該第一音源資料流之連續的接取單元之其中之一,並且拼接該第一音源資料流之該子序列本體封包以及該第二音源資料流之該序列本體封包,使得本體封包係為連續且在該預設接取單元相互鄰接,其中在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之前的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一尾端部分(44),而在該第一音源資料流之該子序列本體封包位於該第二音源資料流之該序列本體封包之後的情況中,該預設接取單元所相關之該音源訊框之該端部分係為一前端部分(56)。
  19. 一種音源解碼方法,包含:從一音源資料流(120)之一序列本體封包(16)並以一音源訊號(12)之音源訊框(14)為單位而再現該音源訊號(12),其中各本體封包係對應屬於一序列接取單元(18)之其中之一,該音源資料流係被劃分為該等接取單元(18),其中各接取單元係相關於對應的音源訊框;以及回應被插入至該音源資料流中之一截斷單元封包(42;58;114),以截斷與一預設接取單元相關之一音源訊框,以在該音源訊號播出時摒棄其一端部分,該端部分係被該截斷單元封包指示為要在播出時被摒棄。
  20. 一種音源編碼方法,包含: 將一音源訊號(12)以該音源訊號之音源訊框為單位編碼於一音源資料流(40)之本體封包(16)內,使得各本體封包對應屬於接取單元(18)之其中之一,該音源資料流係劃分為該等接取單元(18),各接取單元係對應相關於該等音源訊框之其中之一,以及將一截斷單元封包(44;58)插入至該音源資料流中,該截斷單元封包(44;58)係可設定以指示一預設接取單元所相關之一音源訊框之一端部分要在播出時被摒棄。
  21. 一種電腦可讀數位儲存媒體,係具有一電腦程式儲存於其上,當執行於一電腦時,該電腦程式係具有用以執行依據申請專利範圍第18項到第20項之任一之一方法之一程式碼。
TW104129409A 2014-09-09 2015-09-04 應用於可拼接與被拼接之音源資料流之封包傳送方法、以及串流拼接器及其方法、以及音源編碼與解碼裝置及方法 TWI625963B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP14184141 2014-09-09
??14184141.1 2014-09-09
EP15154752.8A EP2996269A1 (en) 2014-09-09 2015-02-11 Audio splicing concept
??15154752.8 2015-02-11

Publications (2)

Publication Number Publication Date
TW201626803A true TW201626803A (zh) 2016-07-16
TWI625963B TWI625963B (zh) 2018-06-01

Family

ID=51542159

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104129409A TWI625963B (zh) 2014-09-09 2015-09-04 應用於可拼接與被拼接之音源資料流之封包傳送方法、以及串流拼接器及其方法、以及音源編碼與解碼裝置及方法

Country Status (15)

Country Link
US (5) US10511865B2 (zh)
EP (3) EP2996269A1 (zh)
JP (2) JP6605025B2 (zh)
KR (1) KR101997058B1 (zh)
CN (2) CN107079174B (zh)
AR (1) AR101783A1 (zh)
AU (1) AU2015314286C1 (zh)
CA (1) CA2960114C (zh)
ES (1) ES2969748T3 (zh)
MX (1) MX366276B (zh)
MY (1) MY189151A (zh)
RU (1) RU2696602C2 (zh)
SG (1) SG11201701516TA (zh)
TW (1) TWI625963B (zh)
WO (1) WO2016038034A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2996269A1 (en) 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept
CN111052752A (zh) * 2017-08-28 2020-04-21 杜比实验室特许公司 媒体感知导航元数据
CN108053821B (zh) * 2017-12-12 2022-09-06 腾讯科技(深圳)有限公司 生成音频数据的方法和装置
CN115691518A (zh) 2018-02-22 2023-02-03 杜比国际公司 用于处理嵌入在mpeg-h 3d音频流中的辅媒体流的方法及设备
CN112740325B (zh) * 2018-08-21 2024-04-16 杜比国际公司 即时播放帧(ipf)的生成、传输及处理的方法、设备及系统
CN109949792B (zh) * 2019-03-28 2021-08-13 优信拍(北京)信息科技有限公司 多音频的合成方法及装置
CN112837709B (zh) * 2021-02-24 2022-07-22 北京达佳互联信息技术有限公司 一种音频文件拼接的方法及装置
CN113516969B (zh) * 2021-09-14 2021-12-14 北京远鉴信息技术有限公司 一种拼接语音的鉴别方法、装置、电子设备及存储介质

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6806909B1 (en) * 1997-03-03 2004-10-19 Koninklijke Philips Electronics N.V. Seamless splicing of MPEG-2 multimedia data streams
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
JP3539615B2 (ja) 1998-03-09 2004-07-07 ソニー株式会社 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法
JP2000206994A (ja) 1999-01-20 2000-07-28 Victor Co Of Japan Ltd 音声符号化装置及び復号化装置
US20060093045A1 (en) * 1999-06-29 2006-05-04 Roger Anderson Method and apparatus for splicing
WO2001046957A1 (en) * 1999-12-22 2001-06-28 Sarnoff Corporation Method and apparatus for smoothing spliced discontinuous audio streams
US6792047B1 (en) * 2000-01-04 2004-09-14 Emc Corporation Real time processing and streaming of spliced encoded MPEG video and associated audio
US6678332B1 (en) 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US7096481B1 (en) * 2000-01-04 2006-08-22 Emc Corporation Preparation of metadata for splicing of encoded MPEG video and audio
US6907081B2 (en) * 2001-03-30 2005-06-14 Emc Corporation MPEG encoder control protocol for on-line encoding and MPEG data storage
JP4359499B2 (ja) * 2001-06-08 2009-11-04 アイピージー エレクトロニクス 503 リミテッド オーディオ信号の編集
EP1449365A2 (en) * 2001-07-09 2004-08-25 Visible World, Inc. System and method for seamless switching of compressed audio streams
US7496283B2 (en) * 2002-06-28 2009-02-24 Microsoft Corporation Methods and systems for processing digital data rate and directional playback changes
JP2004272054A (ja) 2003-03-11 2004-09-30 Toshiba Corp 圧縮音声データの編集方法、編集プログラム及び編集装置
US7400653B2 (en) * 2004-06-18 2008-07-15 Dolby Laboratories Licensing Corporation Maintaining synchronization of streaming audio and video using internet protocol
US7512705B2 (en) * 2004-12-01 2009-03-31 Hewlett-Packard Development Company, L.P. Truncating data units
JP4371127B2 (ja) 2006-07-14 2009-11-25 ソニー株式会社 再生装置、再生方法、プログラム
US8538565B2 (en) 2008-02-22 2013-09-17 Panasonic Corporation Music playing apparatus, music playing method, recording medium storing music playing program, and integrated circuit that implement gapless play
ES2434828T3 (es) * 2008-10-06 2013-12-17 Telefonaktiebolaget L M Ericsson (Publ) Método y aparato para el suministro de audio por multicanales alineados
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
US8743906B2 (en) * 2009-01-23 2014-06-03 Akamai Technologies, Inc. Scalable seamless digital video stream splicing
WO2010125583A2 (en) * 2009-04-28 2010-11-04 Vubites India Private Limited Method and apparatus for coordinated splicing of multiple streams
US8589999B1 (en) * 2009-08-11 2013-11-19 Arris Solutions, Inc. Methods and systems for splicing between media streams
US9031850B2 (en) 2009-08-20 2015-05-12 Gvbb Holdings S.A.R.L. Audio stream combining apparatus, method and program
PL2491555T3 (pl) * 2009-10-20 2014-08-29 Fraunhofer Ges Forschung Wielotrybowy kodek audio
SG182466A1 (en) * 2010-01-12 2012-08-30 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value
JP5719922B2 (ja) * 2010-04-13 2015-05-20 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ
US9094658B2 (en) 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US20110293021A1 (en) * 2010-05-28 2011-12-01 Jayant Kotalwar Prevent audio loss in the spliced content generated by the packet level video splicer
US9055305B2 (en) 2011-01-09 2015-06-09 Mediatek Inc. Apparatus and method of sample adaptive offset for video coding
US9008170B2 (en) 2011-05-10 2015-04-14 Qualcomm Incorporated Offset type and coefficients signaling method for sample adaptive offset
US9357235B2 (en) 2011-10-13 2016-05-31 Qualcomm Incorporated Sample adaptive offset merged with adaptive loop filter in video coding
WO2013074365A1 (en) 2011-11-18 2013-05-23 Dolby Laboratories Licensing Corporation Subjective based post-filter optimization
KR101638720B1 (ko) 2012-05-29 2016-07-20 미디어텍 인크. 샘플 어댑티브 오프셋 정보를 부호화하는 방법 및 장치
ES2781573T3 (es) 2012-06-08 2020-09-03 Sun Patent Trust Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, dispositivo de decodificación de imágenes, y dispositivo de codificación y decodificación de imágenes
EP3297283B1 (en) 2012-06-11 2019-09-04 Samsung Electronics Co., Ltd. Encoding and decoding videos sharing sao parameters according to a color component
US9596461B2 (en) 2012-11-26 2017-03-14 Qualcomm Incorporated Loop filtering across constrained intra block boundaries in video coding
KR20150009122A (ko) * 2013-07-15 2015-01-26 주식회사 케이티 지역 광고를 합성하는 서버 및 장치, 그리고 영상 스트림을 합성하는 서버
EP2996269A1 (en) 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept
US10057574B2 (en) 2015-02-11 2018-08-21 Qualcomm Incorporated Coding tree unit (CTU) level adaptive loop filter (ALF)
CN105989577B (zh) * 2015-02-17 2020-12-29 中兴通讯股份有限公司 一种图像校正的方法和装置
CN107736027B (zh) 2015-06-12 2021-06-01 松下知识产权经营株式会社 图像编码方法、图像解码方法、图像编码装置及图像解码装置
US10841581B2 (en) 2016-07-14 2020-11-17 Arris Enterprises Llc Region specific encoding and SAO-sensitive-slice-width-adaptation for improved-quality HEVC encoding
US10200687B2 (en) 2017-06-02 2019-02-05 Apple Inc. Sample adaptive offset for high dynamic range (HDR) video compression
CN107707915B (zh) 2017-09-30 2019-11-12 上海兆芯集成电路有限公司 采样点自适应偏移滤波的控制方法及其影像处理系统
CN110740246A (zh) * 2018-07-18 2020-01-31 阿里健康信息技术有限公司 一种图像矫正方法、移动设备和终端设备
CN111178278B (zh) * 2019-12-30 2022-04-08 上海商汤临港智能科技有限公司 视线方向确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
ES2969748T3 (es) 2024-05-22
RU2017111578A3 (zh) 2018-10-10
EP3192195B1 (en) 2024-01-03
US10511865B2 (en) 2019-12-17
US11882323B2 (en) 2024-01-23
US20170230693A1 (en) 2017-08-10
AR101783A1 (es) 2017-01-11
BR112017003288A2 (pt) 2017-11-28
AU2015314286A1 (en) 2017-04-13
EP3192195C0 (en) 2024-01-03
KR101997058B1 (ko) 2019-07-08
JP6605025B2 (ja) 2019-11-13
US20240129560A1 (en) 2024-04-18
US11025968B2 (en) 2021-06-01
SG11201701516TA (en) 2017-03-30
JP2017534898A (ja) 2017-11-24
EP3192195A1 (en) 2017-07-19
MX2017002815A (es) 2017-05-17
TWI625963B (zh) 2018-06-01
CN113038172A (zh) 2021-06-25
AU2015314286C1 (en) 2020-06-04
US20210352342A1 (en) 2021-11-11
RU2696602C2 (ru) 2019-08-05
EP4307686A2 (en) 2024-01-17
US11477497B2 (en) 2022-10-18
JP6920383B2 (ja) 2021-08-18
MX366276B (es) 2019-07-04
KR20170049592A (ko) 2017-05-10
CN107079174B (zh) 2021-02-05
EP4307686A3 (en) 2024-04-17
RU2017111578A (ru) 2018-10-10
US20230074155A1 (en) 2023-03-09
CN107079174A (zh) 2017-08-18
CA2960114A1 (en) 2016-03-17
JP2020008864A (ja) 2020-01-16
AU2015314286B2 (en) 2019-01-03
US20200195985A1 (en) 2020-06-18
MY189151A (en) 2022-01-28
CN113038172B (zh) 2023-09-22
EP2996269A1 (en) 2016-03-16
WO2016038034A1 (en) 2016-03-17
CA2960114C (en) 2019-08-20

Similar Documents

Publication Publication Date Title
TWI625963B (zh) 應用於可拼接與被拼接之音源資料流之封包傳送方法、以及串流拼接器及其方法、以及音源編碼與解碼裝置及方法
EP3149955B1 (en) Data processor and transport of user control data to audio decoders and renderers
US20230335146A1 (en) Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
KR101861941B1 (ko) 완벽 스플라이싱을 위한 인코딩된 오디오의 전송 스트림에의 삽입
KR20210043679A (ko) 즉시 재생 프레임(ipf)의 생성, 전송 및 처리를 위한 방법, 장치 및 시스템
BR112017003288B1 (pt) Conceito de combinação de áudio
GB2437101A (en) Method and apparatus for processing digitally encoded data streams