TWI485619B - 基於音訊輸出裝置之自動音訊組態 - Google Patents

基於音訊輸出裝置之自動音訊組態 Download PDF

Info

Publication number
TWI485619B
TWI485619B TW101101163A TW101101163A TWI485619B TW I485619 B TWI485619 B TW I485619B TW 101101163 A TW101101163 A TW 101101163A TW 101101163 A TW101101163 A TW 101101163A TW I485619 B TWI485619 B TW I485619B
Authority
TW
Taiwan
Prior art keywords
audio
decoding
format
decoded
bit
Prior art date
Application number
TW101101163A
Other languages
English (en)
Other versions
TW201246061A (en
Inventor
Anthony J Guetta
Douglas S Wyatt
Eric A Allamanche
William G Stewart
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of TW201246061A publication Critical patent/TW201246061A/zh
Application granted granted Critical
Publication of TWI485619B publication Critical patent/TWI485619B/zh

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00028Advanced audio coding [AAC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00057MPEG-1 or MPEG-2 audio layer III [MP3]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

基於音訊輸出裝置之自動音訊組態
本發明係關於音訊處理,且更具體而言,係關於取決於與音訊處理裝置相關聯之當前條件而判定音訊處理裝置是否應產生高品質或低品質音訊輸出。
本申請案係關於2011年1月11日申請之題為「AUTOMATIC AUDIO CONFIGURATION BASED ON AN AUDIO OUTPUT DEVICE」之臨時專利申請案第61/431,806號且主張其優先權之權利,該申請案之全部內容出於所有目的而以引用之方式併入,如同於本文中全面地揭示。
本申請案係關於2007年6月28日申請之題為「Data-Driven Media Management Within An Electronic Device」的美國申請案第11/824,320號,該申請案之全部內容特此出於所有目的而以引用之方式併入,如同於本文中全面地闡述。
計算裝置可常常處置多種類型之媒體的播放。可由計算裝置播放之媒體常常包括眾多形式/格式之視訊及眾多形式/格式之音訊。在此等計算裝置內,一或多個應用程式可播放媒體。可試圖在手持型計算裝置內播放媒體的應用程式類型的非限制性實例包括電話應用程式、web瀏覽器、電子郵件應用程式、多媒體訊息服務(MMS)、音樂播放器及視訊播放器。
判定音訊之感知品質的一因素為位元深度。在數位音訊中,位元深度指示針對每一音訊樣本記錄之位元的數目。位元深度直接對應於數位音訊資料之集合中之每一音訊樣本的解析度。位元深度愈大,針對每一音訊樣本分配之位元愈多,且因此,更多之資訊可用於產生具有更高之保真度的音訊。位元深度之常見實例包括以16位元記錄之CD品質音訊,及可支援多達24位元音訊之DVD音訊。因此,「16位元音訊」指代為16之位元深度,「24位元音訊」指代為24之位元深度,等等。
對於一些桌上型或膝上型電腦,使用者能夠經由音訊設定應用程式藉由選擇16位元或24位元作為位元深度來組態輸出裝置。然而,諸如手持型電子裝置(例如,行動電話及平板裝置)之較小音訊處理裝置通常僅產生16位元音訊,而不管連接至手持型裝置之輸出裝置(例如,整合式或內建式揚聲器、頭戴式耳機、USB音訊裝置)為何。僅產生16位元音訊之一原因為手持型裝置為功率受限之裝置且產生24位元音訊相對於產生16位元音訊需要額外處理。許多手持型裝置包括一或多個定點解碼器(例如,針對每一音訊格式(諸如,AAC)有一解碼器)。每一解碼器(硬體或軟體)包括簡單乘法及加法單元,該等單元中之每一者對整數操作且產生16位元音訊。因此,即使連接至手持型裝置之USB音訊裝置可能夠輸出基於24位元音訊的類比信號,USB音訊裝置所連接至之手持型裝置仍僅為該USB音訊裝置產生16位元音訊。
其他手持型裝置具有更大功率及更複雜之電路,該電路可對浮點數而非整數操作且可產生浮點音訊樣本。因此,傳統上存在的用於膝上型及桌上型電腦之相同解碼器可用於此等手持型裝置。若源音訊內容呈24位元,則在浮點域中操作准許維持源音訊內容之動態範圍且可產生高保真度之24位元音訊。
然而,取決於所連接之輸出裝置及對應於音訊處理裝置之狀態的其他因素,總是產生16位元音訊或總是產生24位元音訊之音訊處理裝置可具有一些缺點。舉例而言,一些輸出裝置可基於24位元音訊而非16位元音訊來產生顯著較好聽之音訊。因此,在將此等輸出裝置連接至音訊處理裝置時,總是將源音訊內容解碼成16位元音訊將不會實現可用之益處。作為另一實例,一些輸出裝置不會基於24位元音訊產生顯著較好聽之音訊(相比於16位元音訊)。因此,總是將源音訊內容解碼成24位元的好處可能在價值上配不上解碼成24位元音訊及/或對24位元音訊操作所需要之額外處理。
此章節中所描述之途徑為可推行之途徑,但不一定為先前已設想或推行之途徑。因此,除非另有指示,否則不應假定此章節中所描述之途徑中之任何者僅由於其包括於此章節中便應被當作先前技術。
在以下描述中,出於解釋之目的,闡述眾多特定細節以便提供對本發明之透徹理解。然而,將顯而易見,可在無此等特定細節之情況下實踐本發明。在其他例子中,以方塊圖形式展示熟知之結構及裝置以便避免不必要地混淆本發明。
一般概述
音訊處理裝置自複數個可能之解碼格式當中判定源音訊內容將解碼成之特定解碼格式。在進行選擇哪一解碼格式之判定時考慮一或多個因素。一因素可包括與為音訊輸出之目的地的輸出裝置相關聯之格式(亦即,「硬體格式」)。硬體格式之實例包括16位元音訊及24位元音訊。然而,本發明之實施例不限於此等特定位元深度。其他可能之位元深度包括(例如)8、32及不在位元組邊界上之其他位元深度(例如,20)。輸出裝置之非限制性實例包括內建式揚聲器、頭戴式耳機及USB音訊裝置。選擇哪一解碼格式之判定過程中之另一因素可包括在將經解碼音訊轉換成類比信號之前是否要對經解碼音訊執行某些操作。
在一些情況下,高品質音訊輸出(例如,對應於24位元音訊)之感知品質可歸因於各種因素而與較低品質音訊輸出(例如,對應於16位元音訊)之感知品質相同。一種此因素可為輸出裝置的限制或與輸出裝置相關聯之數位轉類比轉換器(DAC)之品質。因此,可能沒有理由進行用以產生高品質音訊輸出之額外處理,尤其是因為產生低品質音訊輸出將節省原本將用以產生24位元音訊之音訊處理裝置之資源(例如,處理時間及電力消耗)。舉例而言,不管對應數位音訊是16位元格式還是24位元格式,輸出至頭戴式耳機之類比音訊可具有相同之感知品質。
實例手持型裝置
本文中所描述之技術可應用於其中一或多個應用程式播放媒體之任何類型的電子裝置。舉例而言,電子裝置可為iOSTM 裝置,諸如iPhoneTM 、iPod TouchTM 、iPadTM 或Apple TVTM ,或任何其他類型之電子裝置。諸如個人數位助理(PDA)及行動電話之手持型電子裝置為可應用該等技術之電子裝置之實例。出於解釋之目的,將參考手持型裝置給出該等技術之實例,但應注意該等技術不限於此類裝置。
圖1描繪可實施本發明之實施例之實例手持型裝置100。手持型裝置100包含至少一顯示器102(其可或可不為觸敏式的),主揚聲器104、電話接收器/揚聲器108、用於頭戴式耳機(僅聽)或耳機(聽及說)之插口112、諸如(但不限於)藍芽之無線傳輸器/接收器116、線路輸出埠120(適合於由(例如)較大家用音響系統使用之銜接台),且亦包含使用者介面(UI)揚聲器124(例如,用於小鍵盤點選音)。亦可包括其他類型之揚聲器及音訊埠。
顯示器102之觸敏式版本可含有小鍵盤,該小鍵盤又可在被觸碰時產生聲音。
電話接收器/揚聲器108可類似於習知電話內使用之接收器。
手持型裝置100進一步包含靜音開關128及振動構件132。可藉由存取載入於裝置100上之軟體應用程式經由顯示器102獲得用於啟用/停用振動構件132之機構。
手持型裝置100可執行一或多個軟體應用程式(未圖示),該等軟體應用程式之非限制性實例包括用於電子郵件、電話、語音郵件、web瀏覽器、短訊息傳遞服務(SMS)、用於音樂或視訊之娛樂播放器、相機功能及幻燈片呈現(具有音樂伴奏)的應用程式。
UI揚聲器124可用於播放小鍵盤聲音(例如,點選)及通知使用者(例如,經由警告聲音)不准許進行某些步驟及按鍵動作。
音訊處理組件
圖2為描繪根據本發明之實施例之音訊處理裝置200的音訊處理組件的方塊圖。在實施例中,音訊處理裝置200為手持型裝置100。在圖2中,音訊處理裝置200包括音訊儲存器210、解碼器220、混音器230、數位轉類比轉換器(DAC)240及輸出裝置250。可以硬體、軟體或硬體及軟體之任何組合來實施解碼器220、混音器230及DAC 240中之每一者。
音訊儲存器210含有一或多個音訊檔案。含有於音訊儲存器210中之音訊檔案之非限制性實例包括音樂檔案、對應於系統產生之聲音的音訊檔案,及除了包括音訊資料之外亦包括視訊資料之多媒體檔案。含有於音訊儲存器210中之音訊檔案中的音訊資料可以不同格式編碼。不同格式之非限制性實例包括進階音訊編碼(AAC)、MPEG-1或MPEG-2音訊層3(MP3)、16位元脈碼調變(PCM)、24位元PCM、蘋果無損(Apple Lossless)、波形音訊檔案格式(WAV)及音訊互換檔案格式(AIFF)。
如圖2中所描繪,音訊檔案212被輸入至解碼器220。解碼器220解碼音訊檔案212之經編碼音訊資料以產生經解碼音訊222。在此階段,經解碼音訊資料之解碼格式的非限制性實例包括32位元浮點數、8.24定點整數、24位元整數及16位元整數。在實施例中,16位元整數被視為低品質,而32位元浮點數、8.24定點整數及24位元整數被視為高品質。
若音訊處理裝置200支援以多個格式編碼之音訊資料的儲存及播放,則音訊處理裝置200可對於每一經編碼之格式包括一解碼器。舉例而言,音訊處理裝置200可包括AAC解碼器及MP3解碼器。
經解碼音訊222被輸入至將多個音訊串流組合成單一音訊串流之混音器230。在圖2中描繪之實例中,音訊224亦被輸入至混音器230。音訊檔案212之實例為音樂檔案。在解碼音訊檔案212中之音訊資料的同時,可在音訊處理裝置200處接收電子郵件。電子郵件之接收可觸發系統聲音之產生,在由輸出裝置250播放對應音訊之前該系統聲音經表示為音訊224。音訊224可為經解碼音訊資料(且因此不需要解碼器220)或可為首先需要藉由解碼器220(或未圖示之另一解碼器)解碼的經編碼音訊資料(例如,來自另一音樂檔案)。
混音器230基於經解碼音訊222及音訊224產生混合之音訊232。音訊232可呈與上文描述之經解碼音訊222相同的格式,亦即32位元浮點數、8.24定點整數及16位元整數。若不需要混合多個音訊串流,則經解碼音訊222可被輸入至DAC 240而不通過混音器230。
經混合之音訊232被輸入至DAC 240,DAC 240將數位音訊資料轉換成傳輸至輸出裝置250之類比信號。在輸入至DAC 240之前,經混合之音訊232可需要轉換成DAC 240可辨識之不同格式。舉例而言,若經混合之音訊232基於32位元浮點數,則可取決於與每一輸出裝置250相關聯之硬體格式而將經混合之音訊232轉換成24位元格式或16位元格式。硬體格式之非限制性實例包括16位元格式及24位元格式。
在圖2中,DAC 240為音訊處理裝置200之組件。然而,音訊處理裝置200可包括零個DAC或多個DAC。若音訊處理裝置200不包括任何DAC,則連接至音訊處理裝置200之任何輸出裝置必須具有(或連接至)DAC。
在圖2中,輸出裝置250為音訊處理裝置200之組件。因此,輸出裝置250可為內建式揚聲器,諸如手持型裝置100之揚聲器108。在相關實施例中,輸出裝置250在裝置200之外部。在彼情形中,輸出裝置250可為(例如)頭戴式耳機、USB音訊裝置、高清晰度多媒體介面(HDMI)裝置、線路輸出揚聲器、立體聲藍芽(亦即,A2DP)配件、ad DisplayPort裝置或AirPlay接收器。音訊輸出裝置之類型及品質廣泛地變化。如本文中所提及,一些輸出裝置建置於音訊處理裝置(諸如,膝上型電腦或手持型裝置)中。其他輸出裝置在音訊處理裝置外部。外部輸出裝置可經由多種類型之埠(諸如,USB埠、Firewire埠、串列埠、並列埠、耳機插口、無線埠(例如,藍芽)等)連接至音訊處理裝置。
圖2未指示除了解碼及混合之外的可對數位音訊資料執行之所有可能的操作。因此,可對經解碼音訊222(亦即,在混音器230處理經解碼音訊222之前)及/或對混合之音訊232(亦即,在混音器230處理經解碼音訊222之後)執行一或多個操作。此等操作之非限制性實例包括按比例調整、等化、時間間距調整(例如,加速或減緩音訊)、取樣率轉換及動態範圍壓縮。等化為調整(例如,提昇或削減/衰減)信號內之某些頻率之強度的程序。
判定解碼格式
圖3為描繪根據本發明之實施例之用於判定某一音訊內容將解碼成的解碼格式之程序300的流程圖。可以硬體、軟體或硬體及軟體之組合來實施程序300。舉例而言,可使用具有包括邏輯元件之複數個元件之裝置(例如,可程式化邏輯陣列)來硬體實施程序300,其中元件經程式化/經組態以實施本文中描述之方法。作為替代,可藉由具有包括邏輯元件之元件的另一裝置(諸如,特殊應用積體電路(ASIC))來硬體實施程序300,該等元件經建構/經組態以實施本文中描述之方法。作為另一替代,可軟體實施程序300以使得以一指令集來闡述本文中描述之方法,該等指令儲存於機器可讀儲存媒體中且由一或多個計算裝置(諸如,圖4中描繪之樣本電腦系統)執行以進行本文中描述之方法。此等及其他實施為可能的。所有可能之實施皆在本發明之範疇內。
在步驟310,音訊處理裝置(例如,手持型裝置100)判定與輸出裝置相關聯之硬體格式(例如,16位元或24位元)。硬體格式由輸出裝置之能力支配。可將硬體格式中之一或多者傳達至音訊處理裝置,諸如在HDMI之狀況下。額外地或替代性地,基於對特定輸出裝置之所支援硬體格式之預先瞭解而將一或多個硬體格式儲存於音訊處理裝置上。舉例而言,建置於音訊處理裝置中之DAC晶片將支援硬體格式之特定集合。
可以儲存於音訊處理裝置上之複數個映射來反映硬體格式與輸出裝置之間的關聯。每一映射將一種類型之輸出裝置(或規定之埠)映射至一硬體格式。因此,一映射可將HDMI裝置與24位元硬體格式相關聯(例如,在HDMI裝置將彼硬體格式傳達至音訊處理裝置之後)。另一映射可將線路輸出埠與16位元硬體格式相關聯。
儘管每一輸出裝置皆要求16位元硬體格式,但某些輸出裝置及/或埠仍可被視為高品質(HQ)或低品質(LQ)。舉例而言,線路輸出埠及內建式揚聲器被視為LQ,而USB音訊裝置、AirPlay接收器及DisplayPort埠可被視為HQ。因此,在實施例中,輸出裝置或埠可與指示其為HQ抑或LQ之資料相關聯。此關聯可儲存於先前描述之映射內,或與該等映射分離。
在實施例中,即使輸出裝置(例如,頭戴式耳機)能夠處理24位元音訊(確切地說,與輸出裝置相關聯之DAC能夠處理24位元音訊),輸出裝置(例如,經由映射)仍可與不同硬體格式(16位元)相關聯。此情形可係歸因於輸出裝置未與具足夠品質之DAC相關聯的事實。可判定由輸出裝置播放之16位元音訊之感知品質與由相同輸出裝置播放的24位元音訊之感知品質相同。因此,不執行產生24位元音訊所需之額外處理的益處可超過來自24位元音訊之任何感知到的品質增加。
在步驟320,音訊處理裝置判定源音訊內容之編碼。若音訊處理裝置儲存且處理僅以單一格式(例如,AAC)來編碼之音訊資料,則此步驟可為可選的。然而,若音訊處理裝置儲存以一格式編碼之音訊資料的一集合及以另一格式編碼之音訊資料的另一集合,則音訊處理裝置判定源音訊內容之編碼格式。
在步驟330,音訊處理裝置基於硬體格式及編碼格式而判定音訊內容將解碼成之處理模式解碼格式。表100提供不同編碼格式、不同硬體格式及對應解碼格式之實例。本發明之實施例不限於表100中列出的硬體格式、編碼格式或解碼格式。
因此,根據表100,輸出裝置之保真度為判定源音訊內容將解碼成之解碼格式的重要因素。
舉例而言,若以16位元PCM格式編碼源音訊內容且輸出裝置與低品質硬體格式(例如,16位元)相關聯,則將解碼格式判定為16位元整數格式。或者,若輸出裝置被視為高品質,則將解碼格式判定為8.24定點整數格式。稍後,將呈8.24定點整數格式之音訊內容向下抖動並量化為16位元格式,且將16位元音訊傳輸至DAC。
作為另一實例,若以AAC格式編碼源音訊內容且輸出裝置被視為低品質,則將解碼格式判定為16位元整數格式。或者,若輸出裝置被視為高品質,則將解碼格式判定為32位元浮點數格式。
在實施例中,即使音訊處理裝置判定硬體格式為高品質且需要抖動為16位元整數格式,音訊處理裝置仍將源音訊內容解碼成16位元整數格式而不將源音訊內容解碼成8.24定點整數格式。因此,不需要抖動。在以下情形中此步驟可為有理由的:(1)不存在將與經解碼之源音訊內容混合之其他音訊串流,及(2)不對經解碼之源音訊內容執行某些操作。此等操作可包括應用音量、等化、時間間距調整、取樣率轉換及動態範圍壓縮。
「應用音量」指代自動地(以硬體或以軟體)提昇或衰減音訊樣本。應用音量之實例為iTunesTM 中之「聲音檢查」操作。若執行聲音檢查,則分析音樂庫以判定應用於每一音樂播放軌之音量調整以使得每一音樂播放軌以相同之感知音量位準播放。接著,對於特定歌曲,若應用聲音檢查且資料指示需要將某一音量應用於該特定歌曲以便感知為與另一歌曲一樣響亮,則將會將彼音量應用於該特定歌曲。
因此,在此實施例中,在步驟340,音訊處理裝置判定抖動是否被視為需要的(例如,根據表100)。若否,則程序繼續進行至步驟350。若是,則程序繼續進行至步驟360。
在步驟350,音訊處理裝置將源音訊內容解碼成經判定之解碼格式。
在步驟360,音訊處理裝置判定是否滿足一或多個準則。一或多個準則可包含(a)源音訊內容是否為未壓縮或無損壓縮之16位元音訊內容及(b)是否將不會對待解碼之源音訊內容執行某些操作。此等操作可包括按比例調整、混合、音量調整、等化及將其他音訊串流與待解碼之源音訊內容混合。
若滿足(a)及(b),則程序繼續進行至步驟370,其中將源音訊內容直接地解碼成16位元整數格式而不對經解碼之源音訊內容進行任何抖動。若(1)及(2)中之至少一者未被滿足,則程序繼續進行至步驟380。
在步驟380,將源音訊內容解碼成經判定之解碼格式(例如,24位元整數格式、32位元浮點數格式或8.24定點整數格式中之一者)且稍後將源音訊內容「向下抖動」為16位元整數格式。步驟380可包括對經解碼音訊執行(亦即,在抖動步驟之前)的額外操作(諸如按比例調整、混合、音量調整、等化等)。
改變硬體格式
在解碼音訊內容的同時,可改變經處理之音訊資料的目的地。舉例而言,在將藉由解碼特定音訊內容而產生之音訊資料串流傳輸至音訊處理裝置之內建式揚聲器的同時,裝置之使用者可將USB線(連接至USB音訊裝置)插入至裝置之USB埠中。在插入USB線之前,音訊處理裝置可能已基於內建式揚聲器被視為低品質輸出裝置之事實而判定將音訊解碼成16位元整數格式。然而,USB音訊裝置可被視為高品質輸出裝置。
在實施例中,「在串流中間」改變解碼格式。換言之,將特定音訊源之部分解碼成(例如)16位元整數格式。接著,在解碼特定音訊源之剩餘部分之前,解碼程序改變以使得將特定音訊源之剩餘部分解碼成(例如)32位元浮點數格式。僅在不會由於改變造成同步問題之情況下,才在串流中間改變解碼格式。若正在串流傳輸另一資料源(無論音訊或視訊)或者若使用者介面正在顯示音訊串流中之精確播放位置,則可發生同步問題。若是這樣,則兩個資料串流(例如)可能不再彼此同步。
在另一實施例中,僅在音訊串流(亦即,由源音訊內容產生)為完整之情況下或者在停止且重新開始播放時改變解碼格式。停止且重新開始源音訊內容之播放可在使用者(經由使用者介面)將播放位置移動至音訊串流中之另一位置時發生。
硬體概述
根據一實施例,藉由一或多個專用計算裝置來實施本文中描述之技術。專用計算裝置可包含經硬連線以執行該等技術之包括邏輯元件之複數個元件,或可包括經永久程式化以執行該等技術的數位電子裝置(諸如,一或多個特殊應用積體電路(ASIC)或場可程式化閘陣列(FPGA)),或可包括經程式化以依據韌體、記憶體、其他儲存器或組合中之程式指令執行該等技術的一或多個通用硬體處理器。此等專用計算裝置亦可將定製硬連線邏輯、ASIC或FPGA與定製程式化組合以完成該等技術。專用計算裝置可為桌上型電腦系統、攜帶型電腦系統、手持型裝置、網路連接裝置或併有硬連線及/或程式邏輯以實施該等技術之任何其他裝置。
舉例而言,圖4為說明可實施本發明之實施例之電腦系統400的方塊圖。電腦系統400包括匯流排402或用於傳達資訊之其他通信機構,及與匯流排402耦接的用於處理資訊的硬體處理器404。硬體處理器404可為(例如)通用微處理器。
電腦系統400亦包括主記憶體406(諸如,隨機存取記憶體(RAM)或其他動態儲存裝置),主記憶體406耦接至匯流排402以用於儲存資訊及待由處理器404執行之指令。主記憶體406亦可用於在待由處理器404執行之指令的執行期間儲存暫時變數或其他中間資訊。此等指令在儲存於可由處理器404存取之非暫時性儲存媒體中時,使電腦系統400成為經定製以執行指令中規定的操作之專用機器。
電腦系統400進一步包括耦接至匯流排402以用於儲存用於處理器404之靜態資訊及指令之唯讀記憶體(ROM)408或其他靜態儲存裝置。儲存裝置410(諸如,磁碟或光碟)經提供且耦接至匯流排402以用於儲存資訊及指令。
電腦系統400可經由匯流排402耦接至顯示器412(諸如,陰極射線管(CRT))以用於將資訊顯示給電腦使用者。包括文數字及其他鍵之輸入裝置414耦接至匯流排402以用於將資訊及命令選擇傳達至處理器404。另一類型之使用者輸入裝置為用於將方向資訊及命令選擇傳達至處理器404且用於控制顯示器412上的游標移動之游標控制416,諸如滑鼠、軌跡球或游標方向鍵。此輸入裝置通常在兩個軸(第一軸(例如,x)及第二軸(例如,y))上具有兩個自由度,其准許裝置規定在平面中之位置。
電腦系統400可使用與電腦系統組合而使電腦系統400成為專用機器或將電腦系統400程式化為專用機器之定製硬連線邏輯、一或多個ASIC或FPGA、韌體及/或程式邏輯來實施本文中描述之技術。根據一實施例,回應於處理器404執行含有於主記憶體406中之一或多個指令的一或多個序列而由電腦系統400執行本文中之技術。可將此等指令自另一儲存媒體(諸如,儲存裝置410)讀取至主記憶體406中。含有於主記憶體406中之指令的序列之執行使處理器404執行本文中描述之程序步驟。在替代實施例中,可使用硬連線電路來代替軟體指令或與軟體指令組合。
如本文中使用之術語「儲存媒體」指代儲存使機器以特定方式操作之資料及/或指令之任何非暫時性媒體。此儲存媒體可包含非揮發性媒體及/或揮發性媒體。非揮發性媒體包括(例如)光碟或磁碟,諸如儲存裝置410。揮發性媒體包括動態記憶體,諸如主記憶體406。常見形式之儲存媒體包括(例如)軟性磁碟、可撓性磁碟、硬碟、固態磁碟、磁帶或任何其他磁性資料儲存媒體、CD-ROM、任何其他光學資料儲存媒體、具有孔圖案之任何實體媒體、RAM、PROM及EPROM、FLASH-EPROM、NVRAM,任何其他記憶體晶片或匣。
儲存媒體與傳輸媒體相異,但可與傳輸媒體結合使用。傳輸媒體參與在儲存媒體之間傳送資訊。舉例而言,傳輸媒體包括同軸電纜、銅導線及光纖,包括包含匯流排402之導線。傳輸媒體亦可採用聲波或光波(諸如,在無線電波及紅外線資料通信期間產生之彼等波)之形式。
各種形式之媒體可涉及將一或多個指令之一或多個序列攜載至處理器404以用於執行。舉例而言,指令可最初攜載於遠端電腦之磁碟或固態磁碟上。遠端電腦可將指令載入至其動態記憶體中,且使用數據機經由電話線而發送指令。在電腦系統400本端之數據機可接收電話線上之資料且使用紅外線傳輸器將資料轉換成紅外線信號。紅外線偵測器可接收紅外線信號中攜載之資料且適當電路可將該資料放置於匯流排402上。匯流排402將該資料攜載至主記憶體406,處理器404自該主記憶體406擷取且執行指令。藉由主記憶體406接收之指令可視情況在藉由處理器404執行之前或之後儲存於儲存裝置410上。
電腦系統400亦包括耦接至匯流排402之通信介面418。通信介面418提供耦接至網路鏈路420之雙程資料通信,該網路鏈路420連接至區域網路422。舉例而言,通信介面418可為整合服務數位網路(ISDN)卡、纜線數據機、衛星數據機或提供與對應類型之電話線的資料通信連接之數據機。作為另一實例,通信介面418可為提供與相容LAN的資料通信連接之區域網路(LAN)卡。亦可實施無線鏈路。在任何此類實施中,通信介面418發送及接收攜載表示各種類型資訊之數位資料串流的電信號、電磁信號或光信號。
網路鏈路420通常提供經由一或多個網路的與其他資料裝置的資料通信。舉例而言,網路鏈路420可經由區域網路422提供與主機電腦424或由網際網路服務提供者(ISP)426操作之資料設備的連接。ISP 426又經由現通常稱作「網際網路」428之全球封包資料通信網路提供資料通信服務。區域網路422及網際網路428皆使用攜載數位資料串流之電信號、電磁信號或光信號。將數位資料攜載至電腦系統400且自電腦系統400攜載數位資料的經由各種網路之信號及在網路鏈路420上且經由通信介面418之信號為傳輸媒體之實例形式。
電腦系統400可經由網路、網路鏈路420及通信介面418發送訊息且接收包括程式碼之資料。在網際網路實例中,伺服器430可能經由網際網路428、ISP 426、區域網路422及通信介面418傳輸應用程式的所請求之程式碼。
所接收之程式碼可在接收時由處理器404執行及/或儲存於儲存裝置410或其他非揮發性儲存器中以用於稍後之執行。
在前述說明書中,已參考可在實施之間各不相同之眾多特定細節描述了本發明之實施例。因此本說明書及圖式應被認為具有說明性意義而非限制性意義。本發明之範疇之唯一及獨佔指示及申請者意欲當作本發明之範疇的是以請求項所提交之特定形式由本申請案提交之請求項集合之文字及等效範疇,包括任何後續校正。
100...手持型裝置
102...顯示器
104...主揚聲器
108...電話接收器/揚聲器
112...插口
116...無線傳輸器/接收器
120...線路輸出埠
124...使用者介面(UI)揚聲器
128...靜音開關
132...振動構件
200...音訊處理裝置
210...音訊儲存器
212...音訊檔案
220...解碼器
222...經解碼音訊
224...音訊
230...混音器
232...混合之音訊
240...數位轉類比轉換器(DAC)
242...類比信號
250...輸出裝置
300...用於判定某一音訊內容將解碼成的解碼格式之程序
310...步驟
320...步驟
330...步驟
340...步驟
350...步驟
360...步驟
370...步驟
380...步驟
400...電腦系統
402...匯流排
404...硬體處理器
406...主記憶體
408...唯讀記憶體(ROM)
410...儲存裝置
412...顯示器
414...輸入裝置
416...游標控制
418...通信介面
420...網路鏈路
422...區域網路
424...主機電腦
426...網際網路服務提供者(ISP)
428...網際網路
430...伺服器
圖1為描繪可實施本發明之實施例之手持型裝置的組件的方塊圖;
圖2為描繪根據本發明之實施例之裝置100的額外組件的方塊圖;
圖3為描繪根據本發明之實施例之用於判定經編碼的視訊內容之解碼格式之程序的流程圖;及
圖4為說明可實施本發明之實施例之電腦系統的方塊圖。
300...用於判定某一音訊內容將解碼成的解碼格式之程序
310...步驟
320...步驟
330...步驟
340...步驟
350...步驟
360...步驟
370...步驟
380...步驟

Claims (15)

  1. 一種方法,其包含:判定欲由一音訊處理裝置進行解碼之音訊內容之一編碼格式;由該音訊處理裝置判定一硬體格式,該硬體格式與經解碼音訊資料欲提供至之一輸出裝置相關聯,其中該輸出裝置耦接至該音訊處理裝置,且該輸出裝置具有一相關聯音訊保真度(fidelity);至少部分基於該硬體格式、該編碼格式及該音訊保真度,自複數個解碼格式判定音訊內容將解碼成之一解碼格式,其中該複數個解碼格式包含具有一第一位元深度(first bit depth)之至少一解碼格式及具有一第二位元深度(first bit depth)之至少一解碼格式,該第二位元深度大於該第一位元深度,且該解碼格式之位元深度係至少部分由該音訊保真度判定;及將該音訊內容之至少一部分解碼成該解碼格式;其中由該音訊處理裝置執行該方法。
  2. 如請求項1之方法,其中該音訊內容具有以下編碼格式中之一者:16位元脈碼調變(PCM)、24位元PCM、進階音訊編碼(AAC)、MP3、蘋果無損(Apple Lossless)、波形音訊檔案格式(WAV)或音訊互換檔案格式(AIFF)。
  3. 如請求項1之方法,其中將該音訊內容解碼成該解碼格式包含:至少部分基於該音訊內容產生一第一位元深度之經解 碼音訊的一第一版本;及至少部分基於經解碼音訊的該第一版本及一抖動處理產生低於該第一位元深度的一第二位元深度之經解碼音訊的一第二版本。
  4. 如請求項1之方法,其中該解碼格式基於一32位元浮點數、8.24定點整數、一24位元整數或一16位元整數。
  5. 如請求項1之方法,其中將該音訊內容解碼成該解碼格式進一步包含:判定在將由該解碼導致的經解碼音訊轉換成一類比信號之前是否將對該經解碼音訊執行一或多個操作中的至少一操作。
  6. 如請求項5之方法,其中將該音訊內容解碼成該解碼格式進一步包含:回應於判定在將該經解碼音訊轉換成一類比信號之前將對該經解碼音訊執行該一或多個操作中的至少一者:產生一第一位元深度之該經解碼音訊;對該經解碼音訊執行該至少一操作以產生第二音訊資料;及至少部分基於該第二音訊資料產生低於該第一位元深度之一第二位元深度的第三音訊資料。
  7. 如請求項5之方法,其中該音訊內容係依一第一位元深度,其中將該音訊內容解碼成該解碼格式進一步包含:回應於判定在將該經解碼音訊轉換成一類比信號之前將不對該經解碼音訊執行該一或多個操作中之任一者, 產生該第一位元深度之該經解碼音訊而不首先產生高於該第一位元深度之一第二位元深度的該經解碼音訊之一版本。
  8. 如請求項5之方法,其中該一或多個操作包括將該經解碼音訊與其他音訊資料混合,將音量應用於經解碼音訊,及等化該經解碼音訊。
  9. 如請求項1之方法,其中該解碼格式為一第一解碼格式,該方法進一步包含:在將該音訊內容之至少一部分解碼成該第一解碼格式的同時:判定該音訊內容之一第二部分將解碼成之一第二解碼格式,其中該第二解碼格式不同於該第一解碼格式,其中該第二部分不同於該部分;及將該音訊內容之該第二部分解碼成該第二解碼格式。
  10. 如請求項9之方法,其中將該音訊內容之該第二部分解碼成該第二解碼格式包含:判定在解碼該音訊內容之該部分的同時是否正在解碼任何其他資料內容;若判定在解碼該音訊內容之該部分的同時未正在解碼其他資料內容,則僅將該音訊內容之該第二部分解碼成該第二解碼格式。
  11. 一種方法,其包含:判定與一輸出裝置相關聯之一硬體格式; 判定音訊內容之一編碼格式;基於該硬體格式及該編碼格式,判定一解碼格式;判定是否需要抖動;若不需要抖動,則將該音訊內容解碼成該解碼格式,該解碼格式係基於該硬體格式與該編碼格式而判定;若需要抖動,則:判定是否滿足一或多個音訊內容或音訊處理準則;若滿足該一或多個準則,則自動地將該音訊內容解碼成不同於該經判定之解碼格式之一第二解碼格式;若不滿足該一或多個準則,則將該音訊內容解碼成一解碼格式以產生經解碼音訊資料且對該經解碼音訊資料執行一抖動操作。
  12. 如請求項11之方法,其中:將該音訊內容解碼成一第二解碼格式產生第二經解碼音訊資料;該方法進一步包含使該第二經解碼音訊轉換成一類比信號而不首先對該第二經解碼音訊資料執行該抖動操作。
  13. 如請求項11之方法,其中該一或多個準則包括(a)該音訊內容為未壓縮或無損壓縮之16位元音訊內容及(b)將不會對該音訊內容執行某些操作。
  14. 一或多種機器可讀媒體,其儲存指令,該等指令在由一或多個處理器執行時導致執行方法請求項1至13中之任一項。
  15. 一種音訊處理裝置,其包含包括邏輯元件之複數個元件,其中該複數個元件經組態以執行方法請求項1至13中之任一項。
TW101101163A 2011-01-11 2012-01-11 基於音訊輸出裝置之自動音訊組態 TWI485619B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161431806P 2011-01-11 2011-01-11
US13/116,895 US8989884B2 (en) 2011-01-11 2011-05-26 Automatic audio configuration based on an audio output device

Publications (2)

Publication Number Publication Date
TW201246061A TW201246061A (en) 2012-11-16
TWI485619B true TWI485619B (zh) 2015-05-21

Family

ID=46455869

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101101163A TWI485619B (zh) 2011-01-11 2012-01-11 基於音訊輸出裝置之自動音訊組態

Country Status (3)

Country Link
US (1) US8989884B2 (zh)
TW (1) TWI485619B (zh)
WO (1) WO2012097038A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5101292B2 (ja) 2004-10-26 2012-12-19 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103167187A (zh) * 2011-12-08 2013-06-19 旭丽电子(广州)有限公司 具有电话交换机功能的扩充装置
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN112185398A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US10194239B2 (en) * 2012-11-06 2019-01-29 Nokia Technologies Oy Multi-resolution audio signals
UA112249C2 (uk) 2013-01-21 2016-08-10 Долбі Лабораторіс Лайсензін Корпорейшн Аудіокодер і аудіодекодер з метаданими гучності та границі програми
JP6129348B2 (ja) 2013-01-21 2017-05-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 異なる再生装置を横断するラウドネスおよびダイナミックレンジの最適化
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
CN110083714B (zh) 2013-04-05 2024-02-13 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9521501B2 (en) 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
EP4060661B1 (en) 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
KR102314683B1 (ko) * 2017-07-12 2021-10-20 삼성전자주식회사 광 커넥터 및 디스플레이 장치의 제어방법
KR102491646B1 (ko) 2017-11-30 2023-01-26 삼성전자주식회사 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치
CN115103286A (zh) * 2022-04-29 2022-09-23 北京瑞森新谱科技股份有限公司 一种asio低延时声学检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200406096A (en) * 2002-07-16 2004-04-16 Dolby Lab Licensing Corp Improved low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
US20080312761A1 (en) * 2007-06-18 2008-12-18 Sony Corporation Audio playing apparatus and audio playing method
US20090060455A1 (en) * 2005-10-11 2009-03-05 Sony Corporation Apparatus and Method of Processing Information and Program
US20100188158A1 (en) * 2009-01-23 2010-07-29 Ainspan Herschel A Optimal dithering of a digitally controlled oscillator with clock dithering for gain and bandwidth control

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPO862197A0 (en) 1997-08-15 1997-09-11 Leisuretech Electronics Pty Ltd A distributed stereo system
US6574471B1 (en) 1998-02-03 2003-06-03 Ericsson Inc. Apparatus and method for handling incoming calls received by a portable intelligent communications device during a meeting
IL123819A (en) 1998-03-24 2001-09-13 Geo Interactive Media Group Lt Network media streaming
GB2363556B (en) 2000-05-12 2004-12-22 Global Silicon Ltd Digital audio processing
JP2001331419A (ja) 2000-05-19 2001-11-30 Nec Corp 電子メール着信機能付き折り畳み式携帯電話機
US6859845B2 (en) 2001-05-02 2005-02-22 Ati Technologies, Inc. System for resolving conflicts due to simultaneous media streams and method thereof
US7272232B1 (en) 2001-05-30 2007-09-18 Palmsource, Inc. System and method for prioritizing and balancing simultaneous audio outputs in a handheld device
US20030104782A1 (en) 2001-11-30 2003-06-05 Palm, Inc. Object tagging system and method
JP4002775B2 (ja) 2002-03-15 2007-11-07 アルパイン株式会社 音声出力処理装置
US20050180578A1 (en) 2002-04-26 2005-08-18 Cho Nam I. Apparatus and method for adapting audio signal
CN103001923B (zh) 2003-06-05 2016-03-30 英特特拉斯特技术公司 用于控制对在计算机系统上的电子内容片段的访问的方法和系统
US7561932B1 (en) 2003-08-19 2009-07-14 Nvidia Corporation System and method for processing multi-channel audio
US7653203B2 (en) 2004-01-13 2010-01-26 Bose Corporation Vehicle audio system surround modes
JP3966876B2 (ja) 2004-11-12 2007-08-29 株式会社東芝 通信端末装置
US7933365B2 (en) 2004-11-16 2011-04-26 Lg Electronics Inc. Enhanced VSB Viterbi decoder
EP1746522A3 (en) 2005-07-19 2007-03-28 Yamaha Corporation Acoustic design support apparatus, program and method
US20070203979A1 (en) 2006-02-14 2007-08-30 Walker Mark R Home communications server
US8363583B2 (en) 2006-12-15 2013-01-29 Qualcomm Incorporated Channel access scheme for ultra-wide band communication
JP4740104B2 (ja) 2006-12-25 2011-08-03 富士通テン株式会社 データ処理装置、データ処理システム、及び周辺装置
US20080183575A1 (en) 2007-01-31 2008-07-31 Vulcan Portals, Inc. Back-channel media delivery system
US20080186960A1 (en) 2007-02-06 2008-08-07 Access Systems Americas, Inc. System and method of controlling media streams in an electronic device
US9106553B2 (en) 2007-03-26 2015-08-11 Qualcomm Incorporated System and method for sharing resources and interfaces amongst connected computing devices
US7861008B2 (en) 2007-06-28 2010-12-28 Apple Inc. Media management and routing within an electronic device
US8171177B2 (en) 2007-06-28 2012-05-01 Apple Inc. Enhancements to data-driven media management within an electronic device
US8041438B2 (en) 2007-06-28 2011-10-18 Apple Inc. Data-driven media management within an electronic device
US8068925B2 (en) 2007-06-28 2011-11-29 Apple Inc. Dynamic routing of audio among multiple audio devices
US8111837B2 (en) 2007-06-28 2012-02-07 Apple Inc. Data-driven media management within an electronic device
US20090034750A1 (en) 2007-07-31 2009-02-05 Motorola, Inc. System and method to evaluate an audio configuration
KR20110032800A (ko) 2009-09-24 2011-03-30 삼성전자주식회사 저장장치 및 그 구동방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200406096A (en) * 2002-07-16 2004-04-16 Dolby Lab Licensing Corp Improved low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
US20090060455A1 (en) * 2005-10-11 2009-03-05 Sony Corporation Apparatus and Method of Processing Information and Program
US20080312761A1 (en) * 2007-06-18 2008-12-18 Sony Corporation Audio playing apparatus and audio playing method
US20100188158A1 (en) * 2009-01-23 2010-07-29 Ainspan Herschel A Optimal dithering of a digitally controlled oscillator with clock dithering for gain and bandwidth control

Also Published As

Publication number Publication date
WO2012097038A1 (en) 2012-07-19
US20120179279A1 (en) 2012-07-12
TW201246061A (en) 2012-11-16
US8989884B2 (en) 2015-03-24

Similar Documents

Publication Publication Date Title
TWI485619B (zh) 基於音訊輸出裝置之自動音訊組態
US10750284B2 (en) Techniques for presenting sound effects on a portable media player
US20110066438A1 (en) Contextual voiceover
JP2016509693A (ja) 新しいメディア装置に関する埋め込み音量メタデータを有する、および、有しないメディアの正規化音声再生のための方法と装置
CN105679345B (zh) 一种音频处理方法及电子设备
US20170289679A1 (en) Systems and methods for handling silence in audio streams
CN104184894A (zh) 一种卡拉ok的实现方法及系统
AU2014295217B2 (en) Audio processor for orientation-dependent processing
WO2022110943A1 (zh) 语音预览的方法及装置
US20130178964A1 (en) Audio system with adaptable audio output
US9230529B2 (en) Music reproducing apparatus
US10027994B2 (en) Interactive audio metadata handling
US9819429B2 (en) Efficient load sharing and accelerating of audio post-processing
TW201513652A (zh) 可攜式電子裝置及多媒體輸出方法
KR102605961B1 (ko) 고해상도 오디오 코딩
US20150100324A1 (en) Audio encoder performance for miracast
WO2017185602A1 (zh) 一种耳机模式切换方法和电子设备
WO2011093881A1 (en) Portable computer having multiple embedded audio controllers
JP7147742B2 (ja) 端末装置及び通信方法
US20190386674A1 (en) Error resiliency for entropy coded audio data
JP2015122709A (ja) 音楽再生装置、音楽再生システム、及び音楽再生プログラム
KR20060092389A (ko) Mp3 재생 기능을 구비한 휴대 단말기에서 멀티미디어 통화를 위한 장치 및 방법
GB2568274A (en) Audio stream dependency information
KR20110088721A (ko) 휴대용단말기에서 음원 재생시 음량제어 방법 및 장치
US20210173616A1 (en) Audio Video Navigation System for Vehicle and Method for Playing Media Thereof

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees