TWI545942B - 從單一容器輸出多語言音訊和相關的音訊之系統及方法 - Google Patents

從單一容器輸出多語言音訊和相關的音訊之系統及方法 Download PDF

Info

Publication number
TWI545942B
TWI545942B TW103112860A TW103112860A TWI545942B TW I545942 B TWI545942 B TW I545942B TW 103112860 A TW103112860 A TW 103112860A TW 103112860 A TW103112860 A TW 103112860A TW I545942 B TWI545942 B TW I545942B
Authority
TW
Taiwan
Prior art keywords
audio data
data sets
audio
multimedia container
primary
Prior art date
Application number
TW103112860A
Other languages
English (en)
Other versions
TW201511538A (zh
Inventor
于格 德聖薩維
葛瑞格利 麥蓋瑞
Original Assignee
杜比實驗室特許公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比實驗室特許公司 filed Critical 杜比實驗室特許公司
Publication of TW201511538A publication Critical patent/TW201511538A/zh
Application granted granted Critical
Publication of TWI545942B publication Critical patent/TWI545942B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Description

從單一容器輸出多語言音訊和相關的音訊之系統及方法 〔交叉參考相關應用〕
本申請書主張於2013/4/30申請之美國臨時專利申請書第61/817,417號的優先權,於此藉由引用其全文來合併之。
本發明有關視聽播放,與對從電腦網路下載之內容的特定應用。
除非本文另有指明,否則本章節所述之方法不是本申請書中之申請專利範圍的習知技術,且不因包含在本章節中而被認可為習知技術。
對照於購買實體媒體,消費者愈來愈多經由下載或串流來獲得線上內容。提供內容的示範線上服務包括Netflix Watch InstantlyTM服務、Apple iTunesTM服務、及Amazon Instant VideoTM服務。雖然從終端使用者的角度來看,串流和下載可能類似,但技術差異在於下載的內容係儲存於本地且接著從本地儲存器播放。累進下載(其 中當下載仍在進行中時可能開始內容之播放)更有助於從終端使用者的角度來看類似於串流。
本發明之實施例所解決的問題關於有關內容之相關的音訊。相關的音訊可能是用於視障使用者的音訊描述磁軌、導向器的註解磁軌、等等。將相關的音訊與主音訊作區分,主音訊係內容的主音軌,包括對話磁軌、音樂音軌和效果音軌。例如,AC3數位音訊壓縮標準定義兩個主要和六個相關的服務。主音訊服務係完整的主要(CM)及音樂和效果(ME);相關的服務係視障(VI)、聽障(HI)、對話(D)、註解(C)、緊急事故(E)、及語音(VO)。
針對如數位視訊光碟(DVD)的實體媒體,相關的內容(如音訊描述)可包括在實體媒體上。然而,這類相關的內容可能在與主音訊分離的容器中,且在此容器中,相關的內容可能預先混合較低品質(例如,立體聲)版本的主音訊。
另外,針對DVD,相關的內容可能不設置於實體媒體本身上,但可能經由串流或下載而於線上獲得。於是,當使用者切換至另一語言磁軌時,DVD播放器裝置必須協調用於兩種元件的新設定:用於來自DVD之新語言磁軌的DVD讀取器元件、以及用於對應相關的內容之網路元件(用於串流內容)或硬碟機元件(用於下載的 內容)。除了協調實體元件本身之外,協調也必須考慮涉及切換中的各種軟體層(裝置驅動器、作業系統、DVD播放器裝置控制程式、等等)。若上述協調係不完善的,則如雜訊或干擾的聽覺人工訊號可能導致對使用者體驗產生負面影響
這種情況係類似於當一個伺服器提供主音訊且另一個伺服器提供相關的音訊時於線上所獲得的內容。針對串流內容,客戶端播放器裝置必須將新的串流設定傳遞至伺服器裝置,其可能與其在不同時間開始的新流一起回應。針對下載的內容,客戶端播放器裝置必須協調用於本地儲存裝置的新讀取設定,其可能當從新位置讀取本地儲存裝置時引入聽覺人工訊號。
最後,可能有使用者介面的缺陷,其要求相關的內容之設定要與改變用於主內容之設定分開地改變。例如,使用者將主音訊從英語切換至法語,但相關的內容繼續為英語,直到它被單獨地改變為止。另一使用者介面的缺陷關於下載內容之管理。當與主內容分開地提供相關的內容時,使用者必須管理從其各別來源獲得主內容和相關的內容。
回應於上述缺點,本發明之實施例係針對播放來自單一媒體容器檔案的主內容和相關的內容。單一容器有助於確保同步相關的內容與主內容以及當加入播放相關的內容時的無縫轉換。當切換主內容時(例如,以另一語言輸出),實施例進一步自動地切換相關的內容。藉由 使用單一媒體容器檔案,媒體播放器裝置相較於許多現有的系統具有降低的聽覺人工訊號發生率。
根據一實施例,一種方法輸出多語音音訊和相關的音訊。方法包括儲存一多媒體容器。多媒體容器包括複數個主音訊資料集和複數個相關的音訊資料集。複數個主音訊資料集和複數個相關的音訊資料集係為複數個語言。方法更包括接收第一選擇資訊。第一選擇資訊對應於複數個語言的一第一選定語言。方法更包括從多媒體容器輸出一第一音訊資料流。第一音訊資料流對應於為第一選定語言之複數個主音訊資料集的一第一選定主音訊資料集。方法更包括接收第二選擇資訊。第二選擇資訊有關複數個相關的音訊資料集。方法更包括從多媒體容器輸出一第二音訊資料流。第二音訊資料流對應於為第一選定語言之複數個相關的音訊資料集之一第一選定相關的音訊資料集。
方法更包括接收第三選擇資訊。第三選擇資訊對應於複數個語言的一第二選定語言。方法更包括從多媒體容器輸出一第三音訊資料流而不是第一音訊資料流。第三音訊資料流對應於為第二選定語言之複數個主音訊資料集的一第二選定主音訊資料集。方法更包括從多媒體容器自動地輸出一第四音訊資料流而不是第二音訊資料流。第四音訊資料流對應於為第二選定語言之複數個相關的音訊資料集之一第二選定相關的資料集。
一種設備輸出多語言音訊和相關的音訊。設 備包括一處理器和一儲存裝置。儲存裝置係配置以儲存一多媒體容器。處理器係配置以控制設備以進行對應於上述方法的處理。
一種電腦程式控制(包括一處理器和一儲存裝置的)設備,用於輸出多語言音訊和相關的音訊。電腦程式根據上述方法來控制設備。電腦程式係儲存於一非暫態電腦可讀媒體中。
下面的詳細說明和附圖提供對本發明之性質和優點的進一步了解。
100‧‧‧媒體播放器裝置
102‧‧‧網路
104‧‧‧音訊/視訊接收器
106‧‧‧電視
108‧‧‧揚聲器
152‧‧‧信號
154‧‧‧視訊流
156‧‧‧音訊流
200‧‧‧容器
202‧‧‧元資料
204‧‧‧視訊資料
206‧‧‧主音訊資料
208‧‧‧相關的音訊資料
300‧‧‧容器
302‧‧‧元資料
304a‧‧‧視訊資料
304b‧‧‧視訊資料
304x‧‧‧視訊資料
306a‧‧‧主音訊資料
306b‧‧‧主音訊資料
306x‧‧‧主音訊資料
308a‧‧‧相關的音訊資料
308b‧‧‧相關的音訊資料
308x‧‧‧相關的音訊資料
316a‧‧‧主音訊磁軌部分
316b‧‧‧主音訊磁軌部分
316m‧‧‧主音訊磁軌部分
318a‧‧‧相關的音訊磁軌部分
318b‧‧‧相關的音訊磁軌部分
318m‧‧‧相關的音訊磁軌部分
320x‧‧‧其他相關的音訊磁軌部分
400‧‧‧方法
500‧‧‧控制程式
502‧‧‧分路器元件
504‧‧‧使用者介面元件
506‧‧‧視訊解碼器
508‧‧‧音訊解碼器
510‧‧‧HDMI發射器元件
520‧‧‧解碼器
522‧‧‧混合器
第1圖係顯示媒體播放器裝置和相關的元件之圖。
第2圖係顯示被媒體播放器裝置(參見第1圖)用來儲存內容之容器的邏輯佈置之圖。
第3A圖係顯示容器之實體佈置的圖。
第3B圖顯示關於第3A圖所示之視訊資料、主音訊資料和相關的音訊資料之更多細節。
第4圖係輸出多語音音訊和相關的音訊之方法的流程圖。
第5圖係用於媒體播放器裝置(參見第1圖)之控制程式的方塊圖。
【發明內容與實施方式】
本文所說明的是用於媒體播放的技術。在下面的說明中,為了解釋之目的,提出許多實例和具體細節以提供對本發明的全面性了解。然而,本領域之技藝者將清楚明白如申請專利範圍所定義之本發明可單獨地包括這些實例中的一些或所有特徵或結合下述之其他特徵,且可更包括本文所述之特徵和概念的修改和等效物。
在下面的說明中,詳述了各種方法、處理和程序。雖然可能以某種順序來說明特定步驟,但這樣的順序主要係為了方便和清楚。特定步驟可重覆超過一次,可發生在其他步驟之前或之後(即使另外以另一種順序來說明那些步驟),且可與其他步驟並行發生。只有當第一步驟必須在第二步驟開始之前完成時,才要求第二步驟在第一步驟之後。當從內文不清楚時,將特別指示上述情況。
在本文件中,使用「及」、「或」和「及/或」之詞。上述詞被解讀為具有相同意義;即,包含地。例如,「A及B」可能意味著至少下列之:「A且B」、「只有A」、「只有B」、「至少A且B」。作為另一實例,「A或B」可能意味著至少下列之:「只有A」、「只有B」、「A且B」、「至少A且B」。當預期互斥或時,將特別注意上述情況(例如,「A或B」、「A且B之至多一者」。
概述和一般描述
第1圖係顯示媒體播放器裝置100和相關的 元件(包括電腦網路102(例如,網際網路)、音訊/視訊接收器(AVR)104、電視106(例如,高解析度1080p電視)、及一或更多揚聲器108)之圖。第1圖之元件可部署於使用者的家庭中作為家庭影院系統。
媒體播放器裝置100通常與其他元件互動如下。媒體播放器裝置100存取電腦網路102以獲得內容或與內容相關的其他資訊。媒體播放器裝置100對AVR 104輸出內容作為視訊和音訊信號152。媒體播放器裝置100與AVR 104之間的連線可能是高解析度媒體介面(HDMI)連線。信號152中的音訊資料可能為脈衝編碼調變(PCM)格式。AVR 104在各種內容來源(如媒體播放器裝置100、DVD播放器裝置、藍光光碟裝置、光碟(CD)播放器裝置、無線電接收器裝置等)與各種輸出裝置(如電視106和揚聲器108)之間連接。AVR 104例如經由HDMI連線將視訊流154發送至電視106。AVR 104將音訊流156發送至揚聲器108,如同對揚聲器108進行一般放大和驅動功能。
音訊流156的構成會基於揚聲器108的數量和配置而有所不同。例如,針對單一揚聲器,音訊流156可能是單一單聲道音訊聲道。針對兩個揚聲器,音訊流156可能是兩個立體聲音訊聲道。AVR 104可將為環繞聲5.1格式的六個聲道發送至六個揚聲器(例如,左、中、右、右環繞、左環繞、和超低音揚聲器)、或將為環繞聲7.1格式的八個聲道發送至八個揚聲器。
媒體播放器裝置100包括處理器、記憶體、網路連線、和儲存系統。一般而言,儲存系統儲存媒體播放器裝置100經由網路連線(例如從網路102)獲得的內容。媒體播放器裝置100接著輸出如媒體播放器控制程式所控制的內容。控制程式可在軟體、韌體、硬體、或以上之組合中實作。使用者可經由使用者介面與控制程式互動。可使用來自Apple公司的Mac MiniTM電腦以實作媒體播放器裝置100。控制程式可實作成在OS X作業系統(Apple公司)上運行的應用程式。
另外,通用電腦可實作媒體播放器裝置100;用於電腦的監視器可當作電視106且電腦揚聲器可當作揚聲器108。同樣地,如行動電話或平板電腦的行動裝置可實作媒體播放器裝置100;螢幕可當作電視106且內建揚聲器或耳機可當作揚聲器108且輸出虛擬化環繞聲信號。
媒體播放器裝置100可(經由網路102)與各種服務互動以獲得內容,包括Netflix Watch InstantlyTM服務、Apple iTunesTM服務、和Amazon Instant VideoTM服務。
第2圖係顯示被媒體播放器裝置100(參見第1圖)用來儲存內容之容器200的邏輯佈置之圖。一般而言,一個容器儲存一部電影或場景。容器200包括元資料202、視訊資料204、主音訊資料206、和相關的音訊資料208。容器200可能也包含其他資料,為了簡要起見而省略了其討論。元資料202定義和描述容器200和容器200 中的內容。更具體來說,元資料202定義容器的資料(例如,視訊資料204、主音訊資料206、和相關的音訊資料208)之位置、和之間的關係。元資料202可包括媒體播放器裝置100用來同步容器的資料之讀取、處理、或輸出的同步資訊。元資料202可能也包括關於容器200的其他資料或內容,如電影名稱、期間、選單、磁軌列表、場景索引、封面影像等。
音訊資料204通常對應於內容的視覺元件。例如,視訊資料204可能是視訊的訊框。視訊資料204的確切格式可能根據各種編碼和壓縮功能而有所不同。例如,視訊資料204可能是高解析度(HD)視訊,如H.264、為23.976 fps的1080p。
主音訊資料206通常對應於內容的主音軌。主音軌通常包括各種對話磁軌,其中每個對話磁軌係為不同語言。例如,針對在美國生產的電影,預設主音軌將具有英語對話磁軌;其他主音軌將具有為西班牙語、法語、德語、葡萄牙語、日語、韓語等的對話磁軌。此外,針對單一語言,可能有例如具有不同格式(例如,7.1聲道環繞格式、立體聲格式等)、位元率(192 kbps、384 kbps等)、等等的多個磁軌。
相關的音訊資料208通常對應於超過主音訊磁軌的額外音訊磁軌。相關的音訊之一個實例係音訊描述磁軌(也稱為「視訊描述」或「描述視訊服務(DVS)」)。音訊描述磁軌描述用於視障使用者的視 訊。可能有對應於主音訊磁軌之每個語言的音訊描述磁軌。相關的音訊之另一實例係導向器的註解磁軌。通常,無論選擇哪個主音訊磁軌,導向器的註解磁軌係為單一語言。一般而言,當輸出音訊描述磁軌時,不輸出導向器的註解磁軌。
主音訊資料206和相關的音訊資料208可編碼為不同格式。例如,主音訊資料206可編碼為在192 kbps的5.1環繞聲聲道Dolby Digital PlusTM(DD+)格式、或在384 kbps的7.1環繞聲聲道DD+格式、等等。相關的音訊資料208可編碼為在64 kbps的單聲道DD+、在96 kbps的立體聲DD+、等等。
容器200可根據標準格式(例如,動畫專家群第4版(MPEG-4)第14部分格式(也稱為MP4格式)來佈置。
一般而言,相關的音訊資料208具有與主音訊資料206一樣多、或少於主音訊資料206的聲道。例如,若主音訊資料206係為5.1聲道格式,則相關的音訊資料208可能為單聲道、立體聲、5.1聲道格式、等等。若主音訊資料206係為立體聲格式,則相關的音訊資料208可能為單聲道、立體聲等,而不是5.1聲道格式。
一般而言,視訊資料204對應於單一視訊磁軌,其與其中一個對話磁軌同時地輸出。同樣地,當啟動時,其中一個音訊描述磁軌與視訊磁軌同時地輸出。再者,同步地輸出視訊和音訊磁軌,如下面進一步所論述。
第3A圖係顯示容器300之實體佈置的圖。有鑒於第2圖顯示邏輯結構,第3A圖顯示實體結構-資料如何實體上儲存或佈置於容器300中(例如,容器200係容器300的邏輯圖)。元資料302係位於容器300的「開端」(或「頂部」或「前部」)。視訊資料304(304a、304b等)、主音訊資料306(306a、306b等)、和相關的音訊資料308(308a、308b等)接著在元資料302之後以連續順序來交錯。一般而言,針對視訊資料(例如,304a)的給定部分,將被同步地(例如,在相同時間、同時地、等等)輸出之對應主音訊資料(例如,306a)和相關的音訊資料(例如,308a)係在視訊資料(例如,304b)的下一個部分之前被交錯。
這種佈置有助於媒體播放器裝置100(參見第1圖)進行累進下載。在累進下載中,媒體播放器裝置100首先下載元資料302,然後累進地下載交錯的視訊資料304、主音訊資料306、和相關的音訊308;起始於內容的開端,且以連續順序來繼續進行至結束。這使媒體播放器裝置100當已下載資料的預定量時能開始播放內容。例如,若預定量對應於30秒的內容,則媒體播放器裝置100可能在其已下載對應於前30秒之交錯的資料部分之後開始播放內容;在前30秒中,當此內容被輸出時,媒體播放器裝置100進行下載隨後之交錯的資料部分;等等。可根據各種因素(如對網路102的連線速度、內容的大小等)來調整預定量。
由於每個視訊資料部分係實體上接近於其對應主音訊部分和對應相關的音訊部分,因此可一起同時地讀取、處理、和同步地輸出三個部分之各者。
第3B圖顯示關於第3A圖所示之視訊資料、主音訊資料和相關的音訊資料(例如,304x、306x和308x)之更多細節。如在第3A圖中,交錯的視訊資料部分304x係關聯於交錯主音訊資料部分306x和交錯之相關的音訊資料部分308x。在每個音訊資料部分內的是磁軌部分。一般而言,第3B圖藉由在每個資料部分內顯示複數個主音訊磁軌和複數個相關的磁軌來對第3A圖加入更多細節。
更具體來說,主音訊資料部分306x包括m個主音訊磁軌部分316a、316b、316m、等等。M個主音訊磁軌部分對應於內容的m個主音軌。例如,內容可能具有為用於以英語、法語和德語對話之三種不同語言的主音軌。若磁軌部分316a對應於英語,則從所有交錯的主音訊資料部分306中每個為英語的主音訊磁軌部分的集合對應於為英語的整個主對話磁軌。
同樣地,相關的音訊資料部分308x包括m個相關的音訊磁軌部分318a、318b、318m、等等,其對應於內容的m個音訊描述磁軌。相關的音訊資料部分308x也可包括其他相關的音訊磁軌部分320x。其他相關的音訊磁軌部分320x可能對應於導向器的註解磁軌。如同主音訊資料部分306x,為給定語言的整個音訊描述磁軌對 應於從所有交錯之相關的音訊資料部分308中用於此語言之每個相關的音訊磁軌部分(例如,318a)之集合。
第4圖係輸出多語音音訊和相關的音訊之方法400的流程圖。方法400可藉由例如如一或更多電腦程式所控制之媒體播放器裝置100(參見第1圖)來實作。
在402中,儲存多媒體容器。多媒體容器包括主音訊資料集和相關的音訊資料集。主音訊資料集和相關的音訊資料集係為複數個語言。多媒體容器可能類似於容器200和300(參見第2-3圖)。可能根據累進下載來儲存多媒體容器。
在404中,接收第一選擇資訊。第一選擇資訊對應於複數個語言的第一選定語言。例如,用於第一選擇資訊的預設設定可能用於如容器中的元資料所指定之英語(或另一預設語言)。作為另一實例,使用者可藉由從如媒體播放器裝置100之使用者介面所顯示的一些可用語言中選擇一語言來提供第一選擇資訊。作為又一實例,可根據用於先前容器中之內容的先前使用者選擇來設定第一選擇資訊。
在406中,從多媒體容器輸出第一音訊資料流。第一音訊資料流對應於為第一選定語言之主音訊資料集的第一選定主音訊資料集。例如,媒體播放器裝置100可對AVR 104(參見第1圖)輸出第一音訊資料流作為視訊和音訊流152之其一者。
在408中,接收第二選擇資訊。第二選擇資 訊有關相關的音訊資料集。例如,使用者可藉由指示音訊描述將透過與媒體播放器裝置100的使用者介面互動而「開啟」來提供第二選擇資訊。
在410中,從多媒體容器輸出第二音訊資料流。第二音訊資料流對應於為第一選定語言之相關的音訊資料集之第一選定相關的音訊資料集。例如,若使用者在404中選擇了法語,則也以法語輸出音訊描述。
在412中,接收第三選擇資訊。第三選擇資訊對應於複數個語言的第二選定語言。例如,若在404中預設的是英語,則使用者可藉由經由媒體播放器裝置100的使用者介面選擇德語來提供第三選擇語言。
在414中,從多媒體容器輸出第三音訊資料流而不是第一音訊資料流。第三音訊資料流對應於為第二選定語言之主音訊資料集的第二選定主音訊資料集。例如,若使用者在412中選擇了德語,則主音訊切換至德語。
在416中,從多媒體容器自動地輸出第四音訊資料流而不是第二音訊資料流。第四音訊資料流對應於為第二選定語言之相關的音訊資料集之第二選定相關的資料集。注意切換是「自動的」,因為使用者不需要重新啟動(在408中完成的)音訊描述或選擇用於音訊描述的新語言作為額外的動作。例如,若使用者在412中選擇了德語,則音訊描述也自動地切換至德語。
回去參考第3B圖,由於相關的音訊部分與主 音訊部分交錯,因此當使用者改變語言選擇時(參見412),平滑切換由於部分在實體上接近而導致用於對話磁軌和音訊描述磁軌兩者的語言。另外,由於主音訊資料和相關的音訊資料係在單一容器(參見第2圖)中,因此當發生語言切換時,對這兩者包含了(如媒體播放器控制程式所管理之)相同的軟體和硬體層,進一步有助於平滑切換。
媒體播放器細節
本章節提供了關於媒體播放器裝置100(參見第1圖)的額外細節。
第5圖係用於媒體播放器裝置100(參見第1圖)之控制程式500(也稱為媒體播放器應用程式、媒體播放器、或簡稱為「應用程式」)的方塊圖。控制程式500控制媒體播放器裝置100操作為功能完整的Dolby Digital Plus啟動的媒體播放器。如上所論述(參見第1圖),控制程式500可藉由連接至7.1聲道AVR和1080p TV顯示器的Mac Mini電腦(例如,機型識別碼:Macmini5,1)來執行。應用程式可能被寫入以在OS X 10.8.x(Mountain Lion)上操作。應用程式可能是64位元的應用程式。
應用程式500包括分路器元件502、使用者介面元件504、視訊解碼器506、音訊解碼器508、和HDMI發射器元件510。分路器元件502讀取容器200中的視訊 和音訊資料,並解多工如使用者介面元件504所指示的各種音訊流。分路器元件502提供選定音訊流給音訊解碼器508,且提供視訊流給視訊解碼器元件506。
無論是否啟動音訊描述,且無論是否啟動導向器的註解,使用者介面元件504都接收各種使用者選擇,如用以選擇其中一個可用容器的檔案選擇、用以選擇對話磁軌的磁軌選擇器。使用者介面元件504也實作如使用者所選擇的其他播放器功能(如播放、暫停、尋找等),且將對應控制信號發送至其他元件。
視訊解碼器元件506讀取容器200中的視訊資料、解碼視訊資料、且提供解碼的視訊資料給HDMI發射器元件510。
音訊解碼器元件508可能是DD+音訊解碼器,且包括解碼器520和混合器522。解碼器520可能是DD+雙聲道解碼器。解碼器520接收選定主資料磁軌和選定相關的資料磁軌,並將其解碼為脈衝編碼調變(PCM)資料和混合元資料。混合器522從解碼器520接收PCM資料和混合元資料、根據混合元資料來混合PCM資料、且提供混合的音訊資料給HDMI發射器元件510。
HDMI發射器元件510接收解碼的視訊資料和混合的音訊資料,且將此資料包裝為HDMI輸出信號以從媒體播放器裝置100輸出。
應用程式控制媒體播放器裝置100操作為具有下列基本播放功能之功能完整的音訊/視訊播放器:播 放、暫停和篩檢(尋找功能)。媒體播放器支援解碼DD+音訊(5.1和7.1聲道)。應用程式經由HDMI輸出來輸出多聲道PCM音訊(當連接多聲道AVR時)。
媒體播放器剖析源容器(例如,MP4檔案)並識別各種主磁軌和其語言、以及各種相關的音訊磁軌。媒體播放器支援在可用主音訊磁軌之間切換。媒體播放器支援雙解碼兩個DD+音訊磁軌(例如,為5.1/7.1的主音訊、和為雙聲道之相關的音訊)。在雙解碼的情況下,媒體播放器混合主和相關的音訊以建立混合的音訊(例如,5.1或7.1,這取決於主音訊)。
當對於標題而言存在多個音訊描述磁軌時(例如,對於主音訊音軌中的每個語言有相配的音訊描述磁軌),應用程式在機罩下自動地挑選適當的音訊描述磁軌,即,應自動地選擇具有與目前啟動(播放)的主音訊音軌相同之媒體語言標籤的音訊描述磁軌。若僅存在一個音訊描述磁軌,則應用程式(根據使用者選擇來)啟動此音訊描述磁軌而無論主音訊的語言。
應用程式支援內容類型如下。一個支援的類型是僅具有一個音訊描述磁軌的內容(儘管對於主音訊而言有多個語言)。另一個支援的類型是具有相配數量之音訊描述磁軌與主音訊磁軌、以及相配語言(即,對每個主音訊語言而言,有為相同語言的對應音訊描述磁軌)的內容。無論在哪種情況下,也可能有導向器的註解磁軌;上述內容支援係特定關於音訊描述磁軌的數量,而不是關於 次要音訊磁軌的數量。
應用程式能夠識別容器中之每個音訊磁軌的語言(例如,藉由依賴於媒體語言元資料標籤)。應用程式能夠在「音訊描述」相關的音訊磁軌和在「導向器之註解」相關的音訊磁軌、以及其他類型之相關的音訊內容之間識別。例如,元資料可能包括與DD+磁軌格式相關的標籤(如「bsmod」標籤),其被應用程式用來識別相關的音訊內容之類型。
媒體播放器確保混合的音訊輸出不剪輯或超載。
應用程式能夠將來源內容降混至5.1聲道輸出或立體聲輸出。應用程式能夠辨識出下游AVR僅連接至5.1聲道揚聲器系統且能夠將任何7.1聲道音訊內容降混降至5.1。應用程式能夠辨識出只有立體聲輸出是可用的,且能夠將任何5.1聲道或7.1聲道音訊內容降混降至立體聲。
音訊解碼器508預設為在具有0%比例因子的列模式動態範圍控制(DRC)(即,最大動態範圍)中操作。應用程式能夠切換至無線電頻率(RF)模式DRC或可攜式模式DRC。
應用程式回應於來自下列來源的輸入事件:滑鼠移動和點擊、鍵盤映射、和紅外線信號(例如,如Apple RemoteTM裝置的遙控)。另外,當藉由移動裝置來實作應用程式時,應用程式回應於觸控輸入。
應用程式在啟動時自動地支援顯示解析度(以符合顯示裝置(例如,經由HDMI所連接之TV)的原有解析度。應用程式在啟動時於全螢幕右側啟動且在全螢幕中操作;另外,應用程式可能在視窗中啟動和操作。在啟動時,應用程式縮放視訊播放器以符合螢幕,使得整個視訊被顯示且使得視訊的縱橫比被保存。沒有要求在運行時間動態地適應以改變顯示器的解析度。
在播放期間,當到達內容結束時,應用程式自動地返回至內容選擇畫面。
當滑鼠游標保持在螢幕頂部超過1秒時,應用程式顯示OS X系統選單欄;在這種情況下,應用程式應該能夠藉由點擊:DD+電影>退出DD+電影來終止。
不需要用於應用程式的安裝程式,然而,若應用程式之安裝需要將相關的資源置放於檔案系統上的特定位置(對照於附隨在應用程式包裝內部的資源),則用於應用程式的安裝程式是需要的。
應用程式在任何時候都對使用者互動起反應。導航應用程式使用者介面UI(例如,在可用電影之間輪轉、或導航播放選單)係平滑且流暢的,且不緩慢。使用者介面控制之狀態(例如,強調的vs.非強調的)被立即地(例如,不到200ms)更新以沒有延遲地反映出使用者動作。
音訊和視訊在任何時候,即使是在多次切換音訊磁軌或多次致能和去能相關的音訊磁軌之後都保持同 步。
選擇新的語言磁軌快速地從目前音訊磁軌切換至新的語言磁軌而沒有雜訊或干擾。當切換至新的語言磁軌時,具有新磁軌的音訊播放立即地或不到1秒地回復。若切換至新的音訊磁軌需要超過200毫秒,則視訊流暫停,直到它能與音訊一起回復為止,使得不會失去音訊內容。
選擇相關的音訊磁軌在此磁軌中自動地混合主音訊而沒有雜訊和干擾。當致能或去能相關的音訊磁軌時,致能此磁軌、播放混合的音訊之操作立即地或在不超過1秒之後回復。
使用者介面控制桿的逐漸淡入和淡出係以平滑和流暢的方式來繪製。其中可適用的,使用者介面也對畫面轉換使用優美的動畫,例如,當來上下輪轉可用電影時、當從內容選擇畫面轉換成播放畫面且反之亦然(水平滑動動畫)時、及當在UI控制桿中顯示或隱藏上拉式選單(上/下滑動動畫)時。
當左右移動尋找手柄時,視訊顯示器定期地更新(例如,在視訊中顯示I訊框),使得使用者對剪輯對應於尋找的部分具有視覺反饋。
使用者介面細節
應用程式的使用者介面可能處於各種狀態。這些狀態包括在啟動時的初始畫面(狀態1)和播放畫面 (狀態2)。
狀態1:在啟動時的初始畫面
當應用程式啟動時,第一視圖呈現可用於觀看的電影資產,連同關於電影的相關技術資訊,尤其是音訊內容。在任何給定時間只有一個電影標題呈現於螢幕上以最大化螢幕真實狀態,雖然相鄰的電影標題海報在目前可見的電影海報上方及/或下方係稍微可見(暗淡)的。使用者能以滑鼠指標點擊在目前標題上方或下方之變暗的電影海報以輪轉電影。除了滑鼠之外,使用者還能如下從各種電影標題選擇:藉由按下鍵盤上的向上或向下箭頭鍵、或藉由按下遙控器上的向上或向下鍵。
應用程式從一個電影轉換成另一個電影如下。當使用者點擊目前電影上方或下方的暗淡海報時,第一文字消失。其次,在中心的電影海報逐漸變得暗淡。第三,所有電影海報向上滑動或向下滑動,直到關於被點擊之新電影的海報在螢幕中心為止。滑動動畫使用緩和進入/緩和離開時序曲線,即,動畫速度在中間時最快且在開端和末端趨緩。第四,新點擊的電影海報逐漸地變為全亮。第五,出現新的對應文字。所有這些步驟都能同步地發生,或至少有一些重疊(例如,文字消失能與電影變暗同時)。另外,當電影海報從中心向上滑動時,其對架子的反射成比例地向下滑動。且同樣地,當新的電影海報朝架子向下滑動時,其反射向上滑動,直到它碰到海報底部 為止。
使用者能藉由以滑鼠點擊電影海報、按下鍵盤上的輸入及/或按下遙控器上的「輸入」或「播放」來選擇電影。這將使用用於語言和附加物(例如,音訊描述等)的預設設定來立即地觸發電影之播放。播放可從電影的開端開始。另外,播放係根據「我離開之處回復」功能而開始。
狀態2:播放畫面
當開始播放時,控制桿係顯示於螢幕上,重疊在視訊訊框的頂部上。控制桿在3秒之後消失,除非有新的事件(滑鼠移動/點擊、鍵盤輸入、遠端信號等)。新的輸入事件維持螢幕上的控制桿或若它已消失的話就使它在原處。對控制桿的控制包括播放/暫停切換控制、語言磁軌選擇選單按鈕、附加物選擇選單按鈕、尋找桿、和退出按鈕。
使用者介面通常操作如下。使用者能使用滑鼠指標來點擊控制桿中的按鈕。使用者也能使用鍵盤箭頭以在不同控制之間導航且能使用輸入鍵以啟動控制。使用者也能按下鍵盤上的空格鍵。這作為對播放/暫停功能的直接控制,而無論使用者位於控制選單中的何處。若控制桿已消失,則按下空格鍵不應將控制桿帶回螢幕上;應只暫停或回復播放。
使用者也能使用遙控器上的箭頭按鈕來在不 同控制之間導航,且使用選擇按鈕以啟動控制。使用者也能按下遙控器上的播放/暫停按鈕以作為對播放/暫停功能的直接控制,而無論使用者位於控制選單中的何處。若控制桿已消失,則按下遙控器上的播放/暫停按鈕不應將控制桿帶回螢幕上;應只暫停或回復播放。
使用者能使用滑鼠指標來選擇尋找桿中的位置按鈕,且將其向左或向右拖曳以移至電影中的不同位置。即使未釋放滑鼠點擊,螢幕上的影像仍週期地追蹤此按鈕的移動位置。當釋放時,從新位置回復同步的音訊和視訊之播放。使用者也應能夠藉由按下和保持遙控器上的「右」或「左」按鈕來行使此尋找功能。「右」按鈕應在電影中向前移動位置按鈕,而「左」按鈕應向後移動位置。位置按鈕應藉由預定增量(例如,保持按下按鈕之每半秒增量10秒)來逐漸地移動。增量可能是用以跳過之視訊的I訊框之時間單位或預定量。沒有需要可使用鍵盤輸入方法控制的尋找桿。
當啟動(例如,點擊)用於語言或附加物的其中一個選單按鈕時,用於此控制的選單從選單按鈕向上滑動,而視訊播放繼續在重疊的控制之下。當選單已完成向上滑動轉換時,此選單上的區域藉由使用鍵盤或遙控器上的向上/向下箭頭、或藉由使用滑鼠指標而變成可導航的。
能藉由按下鍵盤上的輸入、遙控器上的「選擇」、或藉由以滑鼠點擊來選擇子選單項目。當點擊/選 擇/確認項目時,此選單子項目中之文字的顏色應簡要地用藍色強調以在返回至預設文字顏色之前確認使用者選擇。子選單面板也在1秒之後自動地向下滑回。
當啟動使用者介面控制桿上的選單按鈕時(例如,滑鼠正停留於按鈕上、或使用者已按下遙控器或鍵盤上的箭頭鍵,如準備被選擇/啟動的給定按鈕),按鈕在強調狀態下出現。也強調地出現子選單中之目前選定/啟動的項目,直到進行新選擇為止。
一般而言,控制之導航不中斷視訊和音訊播放(除非啟動退出按鈕)。
預設語言係第一語言磁軌。點擊新語言將音軌立即地切換至此聲道。關於附加物的預設係「關閉」的(例如,沒有任何導向器的註解或音訊描述磁軌應被啟動)。
根據一實施例,在任何給定時間只有啟動其中一個附加物。點擊導向器的註解子項目立即地開始混合此磁軌與主音訊磁軌。點擊音訊描述子項目立即地停止混合導向器的註解磁軌且反而開始在適當的音訊描述磁軌中混合。點擊「關閉」關閉了任何相關的音訊磁軌。一次應啟動不超過一個相關的音訊磁軌。
當已顯示選單面板時,點擊鍵盤上的「Esc」、或遙控器上的「選單」取消選單選擇且關閉選單面板。
點擊退出按鈕中斷播放且令使用者返回至初 始電影選擇畫面,顯示被選擇的最後電影。也能藉由按下鍵盤上的逸出「Esc」鍵或藉由按下遙控器上的「選單」按鈕來啟動退出控制。
使用者介面圖形資產特徵
使用者選擇內容以藉由閱覽關於電影海報的圖形及其相關的描述來觀看。
偏好項目視窗
應用程式具有可使用選單欄(點擊應用程式名稱且選擇「偏好項目...」選單項目)或使用「,」鍵盤捷徑來存取的「偏好項目」視窗。應用程式的偏好項目視窗不是模態的(即,它允許使用者繼續觀看且與其餘的應用程式互動以了解各種設定的影響)。一般而言,應用程式的偏好項目視窗不是可調整大小的,且其縮放和最小化按鈕被去能。當關閉且重新打開應用程式的偏好項目視窗時,應重新打開當使用者關閉它時所選擇的相同窗格,至少當應用程式繼續運行時。當使用者改變在偏好項目視窗中的設定時,改變立即地生效,而無需使用者點擊OK或Apply按鈕且無需等待使用者關閉視窗。被使用者設定的偏好項目/設定係永久的(即,它們在應用程式的整個過程以及在終止且重新啟動應用程式之後仍然係有效的)。
應用程式的偏好項目視窗應具有符合用於「一般」偏好項目窗格之下列描述的使用者介面。一般偏 好項目窗格包括用以選擇偏好語言的下拉式選單、用以選擇動態範圍壓縮(列模式、RF模式、和可攜式模式)的單選按鈕、及用以選擇輸出聲道之數量(7.1、5.1、立體聲、單聲道、等等)的下拉式選單。應用程式之偏好項目視窗的一般窗格提供改變DD+解碼器之DRC設定檔、選擇輸出聲道配置及選擇偏好(預設)語言的能力。
用於預設/偏好語言磁軌的控制預設為英語,且可能至少提供下列選擇:英語、法語、德語、西班牙語。應用程式藉由當首先開始播放電影時自動地選擇預設語言磁軌(若這種語言是可用的話)來遵從用於預設/偏好語言的控制。在播放剪輯/電影期間,若使用者選擇不同於預設的語言,則這種新語言在會談期間會被記住(即,直到終止應用程式為止)。
用於動態範圍壓縮的控制預設為具有0%比例因子的「列模式」DRC(即,最大動態範圍)。在0與100之間使用增量為1的滑件可調整比例因子。控制提供將DRC設定檔改變為RF模式或可攜式模式的能力。當選擇「可攜式模式」時,下拉式選單提供選擇介於-8、-11與-14 LKFS(其中-11 LKFS為預設的)之間之可攜式模式輸出等級的能力。當未選擇可攜式模式時,去能下拉式選單。當未選擇列模式時,去能用於比例因子的滑件。應用程式遵從使用者所設定的DRC設定檔。
應用程式的偏好項目視窗提供改變用於應用程式之輸出聲道的數量(介於立體聲(2聲道)輸出、5.1 聲道輸出與7.1聲道輸出之間)之能力。當選擇5.1或7.1時,應用程式經由HDMI輸出僅輸出音訊。當選擇5.1時,任何主或次要音訊磁軌於到達混合器之前在解碼器中被降混至5.1(即,只有解碼獨立子流)。當選擇立體聲時,任何主或次要音訊磁軌於到達混合器之前在DD+解碼器中被降混至立體聲。應用程式透過HDMI連結以及耳機埠、Sony/Philips數位互連格式(S/PDIF)輸出、和內建揚聲器(當可用時)來輸出立體聲音訊。
串流
雖然上面已描述了媒體播放器裝置100的累進下載特徵,但也可能配置以與串流內容(例如,來自Apple公司的超文字傳送協定(HTTP)直播(HLS))一起操作。
實作細節
應了解本文所述之各種技術可結合硬體或軟體或(在適當情況下)這兩者之組合來實作。因此,本發明之方法和設備、或其某些態樣或部分可能採取在有形媒體(如軟碟、CD-ROM、硬碟機、固態硬碟機、或任何其他機器可讀儲存媒體)中實作的程式碼(即,指令)之形式,其中當程式碼被載入至機器(如電腦)且被執行時,機器成為用於實現本發明的設備。在於可編程電腦上之程式碼執行的情況下,計算裝置通常包括處理器、處理器可 讀的儲存媒體(包括揮發性和非揮發性記憶體及/或儲存元件)、至少一輸入裝置、以及至少一輸出裝置。一或更多程式可能實作或利用結合本發明所述之程序(例如,透過使用API、可重覆使用的控制或之類)。這類程式最好以高階程序或物件導向編程語言來實作以與電腦系統通訊。然而,若需要的話,程式能以組合或機器語言來實作。在任何情況下,語言可能是編譯或轉譯語言,且結合硬體實作。
雖然示範實施例可能係指利用一或更多獨立電腦系統之內文中的本發明之態樣,但本發明並不侷限於此,而是可能結合任何計算環境(如網路或分散式計算環境)來實作。又,本發明之態樣可能在複數個處理晶片或裝置中或跨複數個處理晶片或裝置實作,且可能同樣跨複數個裝置來執行儲存器。這類裝置可包括個人電腦、網路伺服器、手持裝置、超級電腦、或整合至如汽車和飛機之其他系統中的電腦。
作為具體實例,媒體播放器裝置100(參見第1圖)可執行控制其操作(例如,用以接收、處理和輸出如上述之視訊和音訊資料)的軟體或韌體。裝置100可包括、連接至、或受控於經由網際網路連接至一或更多其他電腦的電腦。
上面的描述說明了本發明之各種實施例以及可能如何實作本發明之態樣的實例。上面的實例和實施例不應被視為是唯一的實施例,而是呈現來說明如下面的申 請專利範圍所定義之本發明的靈活性和優點。基於上述揭露和下面的申請專利範圍,本領域之那些技藝者將清楚明白其他佈置、實施例、實作及等效物,且可能在不脫離如申請專利範圍所定義之本發明的精神和範圍下採用之。
200‧‧‧容器
202‧‧‧元資料
204‧‧‧視訊資料
206‧‧‧主音訊資料
208‧‧‧相關的音訊資料

Claims (19)

  1. 一種輸出音訊的方法,包含:累進地下載一多媒體容器,其中該多媒體容器包括:複數個主音訊資料集和複數個相關的音訊資料集,其中該複數個主音訊資料集和該複數個相關的音訊資料集係為複數個語言,且在該多媒體容器中的該複數個主音訊資料集的資料元件與該複數個相關的音訊資料集之資料元件交錯;以及同步資訊,其同步該複數個主音訊資料集之其一者和該複數個相關的音訊資料集之其一者;接收第一選擇資訊,其中該第一選擇資訊對應於複數個語言的一第一語言;從該多媒體容器輸出一第一音訊資料流,其中該第一音訊資料流對應於為該第一語言之該複數個主音訊資料集的一第一主音訊資料集;及根據該同步資訊來與輸出該第一音訊資料流同時地從該多媒體容器輸出第二音訊資料流,其中該第二音訊資料流對應於為該第一語言之該複數個相關的音訊資料集之一第一相關的音訊資料集。
  2. 如申請專利範圍第1項所述之方法,更包含:接收第二選擇資訊,其中該第二選擇資訊有關該複數個相關的音訊資料集;接收第三選擇資訊,其中該第三選擇資訊對應於該複數個語言的一第二選定語言; 從該多媒體容器輸出一第三音訊資料流而不是該第一音訊資料流,其中該第三音訊資料流對應於為該第二選定語言之該複數個主音訊資料集的一第二選定主音訊資料集;及從該多媒體容器自動地輸出一第四音訊資料流而不是該第二音訊資料流,其中該第四音訊資料流對應於為該第二選定語言之該複數個相關的音訊資料集之一第二選定相關的資料集。
  3. 如申請專利範圍第2項所述之方法,其中自動地輸出該第四音訊資料流包含:與輸出該第三音訊資料流同時地從該多媒體容器自動地輸出該第四音訊資料流。
  4. 如申請專利範圍第1項所述之方法,更包含:同時地讀取該第一主音訊資料集的資料元件和該第一相關的音訊資料集之資料元件。
  5. 如申請專利範圍第2項所述之方法,更包含:同時地讀取該第二選定主音訊資料集的資料元件和該第二選定相關的音訊資料集之資料元件。
  6. 如申請專利範圍第2項所述之方法,其中自動地輸出該第四音訊資料流包含:根據該同步資訊來與輸出該第三音訊資料流同時地從該多媒體容器自動地輸出該第四音訊資料流。
  7. 如申請專利範圍第1項所述之方法,更包含:根據該同步資訊來同時地讀取該第一主音訊資料集的 資料元件和該第一相關的音訊資料集之資料元件。
  8. 如申請專利範圍第2項所述之方法,更包含:根據該同步資訊來同時地讀取該第二選定主音訊資料集的資料元件和該第二選定相關的音訊資料集之資料元件。
  9. 如申請專利範圍第1項所述之方法,其中該複數個相關的音訊資料集之其一者係關聯於該複數個主音訊資料集之其一者,且其中該複數個主音訊資料集之其一者的聲道數量不大於該複數個主音訊資料集之其一者的聲道數量。
  10. 如申請專利範圍第1項所述之方法,其中該多媒體容器包括元資料,其有關該複數個主音訊資料集和該複數個相關的音訊資料集。
  11. 如申請專利範圍第1項所述之方法,其中該多媒體容器包括元資料,其有關該複數個主音訊資料集和該複數個相關的音訊資料集,其中該元資料包括同步資訊,其同步該複數個主音訊資料集之其一者和該複數個相關的音訊資料集之其一者。
  12. 如申請專利範圍第2項所述之方法,其中該多媒體容器包括元資料,其有關該複數個主音訊資料集和該複數個相關的音訊資料集,更包含:依照該元資料來與輸出該第一音訊資料流同時地從該多媒體容器輸出該第二音訊資料流。
  13. 如申請專利範圍第1項所述之方法,其中該多媒 體容器包括元資料,其有關該複數個主音訊資料集和該複數個相關的音訊資料集,更包含:依照該元資料來交錯該多媒體容器中的該複數個主音訊資料集之資料元件與該複數個相關的音訊資料集之資料元件。
  14. 如申請專利範圍第1項所述之方法,其中該複數個相關的音訊資料集包括複數個音訊描述資料集。
  15. 如申請專利範圍第2項所述之方法,其中該複數個相關的音訊資料集包括一導向器的註解資料集,更包含:接收第四選擇資訊,其中該第四選擇資訊對應於該導向器的註解資料集;從該多媒體容器輸出一第五音訊資料流而不是該第四音訊資料流,其中該第五音訊資料流對應於該導向器的註解資料集。
  16. 如申請專利範圍第1項所述之方法,更包含:累進地下載該多媒體容器,其中輸出該第一音訊資料流包含在已累進地下載該多媒體容器的一預定量之後輸出該第一音訊資料流。
  17. 如申請專利範圍第1項所述之方法,更包含:累進地下載該多媒體容器,其中在已累進地下載該多媒體容器之後繼續輸出該第一音訊資料流。
  18. 一種用於處理一多媒體容器的設備,該設備包含: 一處理器,其配置以累進地下載該多媒體容器;一儲存裝置,其係耦接至該處理器且其係配置以儲存該多媒體容器,其中該多媒體容器包括複數個主音訊資料集、複數個相關的音訊資料集和同步資訊,其中該複數個主音訊資料集和該複數個相關的音訊資料集係為複數個語言,且在該多媒體容器中的該複數個主音訊資料集的資料元件與該複數個相關的音訊資料集之資料元件交錯,及其中在該同步資訊中其同步該複數個主音訊資料集之其一者和該複數個相關的音訊資料集之其一者;及一音訊解碼器,其在已累進地下載該多媒體容器的一預定量之後以及當累進地下載該多媒體容器時根據該同步資訊同時地從該多媒體容器輸出一第一和第二音訊資料流,其中該第一音訊資料流對應於為一第一語言之該複數個主音訊資料集的一主音訊資料集,且該第二音訊資料流對應於為該第一語言之該複數個相關的音訊資料集之一相關的音訊資料集。
  19. 一種儲存於一非暫態電腦可讀媒體中的電腦程式,用於控制一種包括一處理器和一儲存裝置的設備,用於輸出多語言音訊和相關的音訊,以執行處理,包含:累進地下載一多媒體容器,其中該多媒體容器包括:複數個主音訊資料集和複數個相關的音訊資料集,其中該複數個主音訊資料集和該複數個相關的音訊資料集係為複數個語言,且在該多媒體容器中的該複數個主音訊資料集的資料元件與該複數個相關的音訊資料集之資料元件 交錯;以及同步資訊,其同步該複數個主音訊資料集之其一者和該複數個相關的音訊資料集之其一者;接收第一選擇資訊,其中該第一選擇資訊對應於該複數個語言的一第一語言;從該多媒體容器輸出一第一音訊資料流,其中該第一音訊資料流對應於為該第一語言之該複數個主音訊資料集的一第一主音訊資料集;及根據該同步資訊來與輸出該第一音訊資料流同時地從該多媒體容器輸出第二音訊資料流,其中該第二音訊資料流對應於為該第一語言之該複數個相關的音訊資料集之一第一相關的音訊資料集。
TW103112860A 2013-04-30 2014-04-08 從單一容器輸出多語言音訊和相關的音訊之系統及方法 TWI545942B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361817471P 2013-04-30 2013-04-30

Publications (2)

Publication Number Publication Date
TW201511538A TW201511538A (zh) 2015-03-16
TWI545942B true TWI545942B (zh) 2016-08-11

Family

ID=50680202

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103112860A TWI545942B (zh) 2013-04-30 2014-04-08 從單一容器輸出多語言音訊和相關的音訊之系統及方法

Country Status (6)

Country Link
US (1) US9883136B2 (zh)
EP (1) EP2992683A1 (zh)
JP (2) JP2016524362A (zh)
CN (1) CN105453581B (zh)
TW (1) TWI545942B (zh)
WO (1) WO2014179003A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI699122B (zh) * 2018-11-13 2020-07-11 許祐豪 多聲道音訊控制系統

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10390059B2 (en) * 2014-09-04 2019-08-20 Comcast Cable Communications, Llc Latent binding of content based on user preference
US9681088B1 (en) * 2015-05-05 2017-06-13 Sprint Communications Company L.P. System and methods for movie digital container augmented with post-processing metadata
US10628439B1 (en) 2015-05-05 2020-04-21 Sprint Communications Company L.P. System and method for movie digital content version control access during file delivery and playback
TWI566173B (zh) * 2015-12-29 2017-01-11 瑞軒科技股份有限公司 音訊播放裝置及方法
CN108012176A (zh) * 2016-10-28 2018-05-08 深圳市中兴微电子技术有限公司 一种数据切换方法、装置及终端
US10580457B2 (en) * 2017-06-13 2020-03-03 3Play Media, Inc. Efficient audio description systems and methods
DE102017212340B3 (de) 2017-07-19 2018-11-22 Audi Ag Verfahren zum Übertragen eines Audiostroms
US11190855B2 (en) * 2017-08-30 2021-11-30 Arris Enterprises Llc Automatic generation of descriptive video service tracks
US10939182B2 (en) * 2018-01-31 2021-03-02 WowYow, Inc. Methods and apparatus for media search, characterization, and augmented reality provision
CN112189344A (zh) * 2018-05-29 2021-01-05 华为技术有限公司 一种从音视频文件中选择音轨的方法及装置
JP7259456B2 (ja) * 2019-03-25 2023-04-18 富士フイルムビジネスイノベーション株式会社 情報処理装置およびプログラム
CN114567812A (zh) * 2022-03-02 2022-05-31 北京字节跳动网络技术有限公司 音频播放方法、装置、系统、电子设备及存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5055939A (en) 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
US5130815A (en) 1990-07-20 1992-07-14 Mti Associates Method and apparatus for encoding a video signal having multi-language capabilities
US5576843A (en) 1993-10-29 1996-11-19 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple dialog audio tracks of a software carrier
US5469370A (en) 1993-10-29 1995-11-21 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple audio tracks of a software carrier
WO2004034276A1 (en) * 2002-10-11 2004-04-22 Matsushita Electric Industrial Co. Ltd. A method and apparatus for delivering programme-associated data to generate relevant visual displays for audio contents
US20060092938A1 (en) * 2003-02-26 2006-05-04 Koninklijke Philips Electronics N.V. System for broadcasting multimedia content
CN100489997C (zh) * 2003-04-24 2009-05-20 汤姆森特许公司 使用音频标识来创建播放列表
SE0302778D0 (sv) * 2003-10-17 2003-10-17 Ericsson Telefon Ab L M Container format for multimedia presentations
JP4517746B2 (ja) * 2004-06-25 2010-08-04 船井電機株式会社 デジタル放送受信装置
JP4968506B2 (ja) * 2005-03-04 2012-07-04 ソニー株式会社 再生装置、再生方法、およびプログラム
CN101156209B (zh) * 2005-04-07 2012-11-14 松下电器产业株式会社 记录媒体、再现装置、记录方法、再现方法
WO2006109716A1 (ja) * 2005-04-07 2006-10-19 Matsushita Electric Industrial Co., Ltd. 記録媒体、再生装置、記録方法、再生方法
JP4923751B2 (ja) * 2005-08-30 2012-04-25 ソニー株式会社 再生装置、並びに記録媒体及びその製造方法
DE102005053686B3 (de) * 2005-11-10 2007-05-31 Musictrace Gmbh Vorrichtung und Verfahren zum Überwachen eines Datensenders
JP2007274228A (ja) * 2006-03-30 2007-10-18 Sony Corp 通信システム、情報管理装置、情報管理方法、再生装置、情報処理方法、およびプログラム
EP2055107B1 (en) 2006-08-24 2013-05-15 Nokia Corporation Hint of tracks relationships for multi-stream media files in multiple description coding MDC.
US8265137B2 (en) 2008-07-31 2012-09-11 At&T Intellectual Property I, L.P. Adaptive language descriptors
WO2010045289A1 (en) * 2008-10-14 2010-04-22 Ripcode, Inc. System and method for progressive delivery of transcoded media content
CN101420349A (zh) * 2008-11-20 2009-04-29 四川长虹电器股份有限公司 实现多媒体文件同时下载并播放的方法
EP2209308B1 (en) * 2009-01-19 2016-01-13 Sony Europe Limited Television apparatus
JP5155441B2 (ja) * 2009-02-17 2013-03-06 パナソニック株式会社 再生方法、再生装置
US8131785B1 (en) * 2009-05-22 2012-03-06 Adobe Systems Incorporated Free space management for hierarchical data document
KR101104164B1 (ko) * 2009-09-21 2012-01-13 애니포인트 미디어 그룹 Bd―j규격을 지원하는 재생 장치를 위한 순차적 다운로드 서비스 제공 방법 및 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
CN101695131A (zh) * 2009-10-16 2010-04-14 深圳市五巨科技有限公司 一种移动终端播放在线音视频的方法和装置
US9037971B2 (en) 2010-09-15 2015-05-19 Verizon Patent And Licensing Inc. Secondary audio content by users
EP2622557B1 (en) * 2010-09-27 2019-07-17 Hulu, LLC Method and apparatus for providing directed advertising based on user preferences
US9398322B2 (en) 2011-04-27 2016-07-19 Time Warner Cable Enterprises Llc Multi-lingual audio streaming
US9680901B2 (en) * 2013-03-14 2017-06-13 Openwave Mobility, Inc. Method, apparatus and non-transitory computer medium for encoding data of a media file
US10476923B2 (en) * 2013-04-05 2019-11-12 Arris Enterprises Llc Filtering content for adaptive streaming
US9648348B2 (en) * 2013-10-23 2017-05-09 Qualcomm Incorporated Multi-layer video file format designs

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI699122B (zh) * 2018-11-13 2020-07-11 許祐豪 多聲道音訊控制系統

Also Published As

Publication number Publication date
US9883136B2 (en) 2018-01-30
TW201511538A (zh) 2015-03-16
CN105453581A (zh) 2016-03-30
JP2016524362A (ja) 2016-08-12
JP2017201809A (ja) 2017-11-09
EP2992683A1 (en) 2016-03-09
JP6506800B2 (ja) 2019-04-24
CN105453581B (zh) 2020-02-07
US20160080685A1 (en) 2016-03-17
WO2014179003A1 (en) 2014-11-06

Similar Documents

Publication Publication Date Title
TWI545942B (zh) 從單一容器輸出多語言音訊和相關的音訊之系統及方法
US11520479B2 (en) Mass media presentations with synchronized audio reactions
US10820035B2 (en) Methods for controlling presentation of content using a multi-media table
JP7387891B2 (ja) 動画ファイルの生成方法、装置、端末及び記憶媒体
EP2801208B1 (en) Method and system for synchronising content on a second screen
JP5268359B2 (ja) 少なくとも1つのメディアデータ処理装置を制御可能にする装置とその方法
US9558162B2 (en) Dynamic multimedia pairing
TWI571868B (zh) 用於定序內容之方法及裝置
WO2015043485A1 (zh) 一种显示方法及显示设备
CN112788383A (zh) 在不同的设备间同步媒体内容的方法、系统和存储介质
KR20150048660A (ko) 디스플레이 기기에서 복수의 서브 화면들을 제어하는 방법 및 이를 위한 디스플레이 장치
US9153217B2 (en) Simultaneously playing sound-segments to find and act-upon a composition
JP2014510425A (ja) 表示されたコンテンツに関連する追加コンテンツを提供する方法とシステム
BRPI0809014B1 (pt) métodos para programar um dispositivo de controle remoto programável e uma exibição em tela programável
WO2014164549A1 (en) System and method to provide supplemental content to a video player
US20210035583A1 (en) Smart device and method for controlling same
US20190114064A1 (en) Enabling undo on scrubber/seekbar ui widgets
KR20120023420A (ko) 컨텐츠 전환 방법 및 이를 수행하는 디스플레이 장치
CN113392260B (zh) 界面显示控制方法、装置、介质及电子设备
CN109218768A (zh) 一种内容服务的图形用户界面显示方法及显示终端
WO2020205757A1 (en) Media player supporting streaming protocol libraries for different media applications on a computer system
JP7420642B2 (ja) 動画再生装置および動画再生方法
CN114710697B (zh) 一种智能菜谱的录制方法及装置
WO2020125311A1 (zh) 智能电视的多媒体文件的展示方法、装置及存储介质
JP2011509482A (ja) 入力要素選択情報表示の方法及び装置