TWI630603B - 音頻內容之加速復原方法和相關聯裝置 - Google Patents
音頻內容之加速復原方法和相關聯裝置 Download PDFInfo
- Publication number
- TWI630603B TWI630603B TW103143393A TW103143393A TWI630603B TW I630603 B TWI630603 B TW I630603B TW 103143393 A TW103143393 A TW 103143393A TW 103143393 A TW103143393 A TW 103143393A TW I630603 B TWI630603 B TW I630603B
- Authority
- TW
- Taiwan
- Prior art keywords
- audio
- sample
- ptrb
- ptre
- ptrme
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 101150014928 ptrB gene Proteins 0.000 claims abstract description 3
- 238000011084 recovery Methods 0.000 claims description 82
- 238000004590 computer program Methods 0.000 claims description 8
- 230000036593 pulmonary vascular resistance Effects 0.000 description 27
- 230000001133 acceleration Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 244000240602 cacao Species 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/414—Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
- H04N21/4147—PVR [Personal Video Recorder]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4392—Processing of audio elementary streams involving audio buffer management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本發明係關於一種在音頻和/或視聽內容之接收器(PVR)內音頻內容之復原方法,該接收器(PVR)係適於該音頻內容之復原,該音頻內容係被接收編碼,含有連續音頻樣本(SAn)幅(Fn),以及在該幅(Fn)之音頻樣本(SAn)至少一部份上的指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)。
按照特別具體例,該音頻內容復原方法包括:˙從該幅(Fn)選擇音頻樣本,該所選定音頻樣本係由該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)識別;˙只復原該選定之樣本。
Description
本發明係關於視聽內容項之復原領域,尤指音頻成份以加速度復原。
許多接收和復原視聽內容用之機件,構成能夠局部記錄視聽內容項,及其隨後在接收時復原。此等機件通常設備記錄模組,諸如硬碟機,或快閃記憶器,特點為讀寫功能,相等於硬碟機儲存單位。
此等機件之使用者則可隨其喜歡或閒暇時,隨時觀看所記錄之視聽內容項。
有時候使用者認為有時間看視聽內容項,就開始看,若時間不夠,可以加速方式觀看。
方法存在可可容許以加速方式觀看,不會降等復原品質,意即不會讓使用者感受到加速顯示效果,且不會有音頻成份,在比自然期限更短的時間週期內發生的復原所變形。
此等技術就視頻而言,除去一些影像,巧妙經時分佈,而就音頻而言,使用專屬於加速音頻復原之技術。
於今以某些接收、記錄和復原設備,即可例如在40分鐘內觀看一小時的視聽內容。
就音頻快速復原而言,意即比額定期限更短之期限內,可把所用技術分類成三種方式操作。
第一種技術以對視頻成份同樣速度,讀取內容之音頻成份,相對於編碼之音頻成份產生音調畸變。加速把音頻復原移動到更高距率。
就商業觀點,此第一種技術被認為不能接收,因為導致大為降等復原品質。
第二種技術包含對所編碼之音頻成份施加處理,使在快速復
原之際,不會改變音調。此情況係例如當音頻成份更快速復原,而對音頻樣本施以頻率轉位。
此第二種技術就音頻復原品質而言,產生可接收的結果,但因要進行全部處理,需要實質處理器和記憶器資源,以系統載荷觀點,尤其是在即時多元課題法環境內,為其缺點。
第三種技術包含加速音頻復原,而除去組成音頻成份之音頻幅件。此法相當於例如使用WSOLA(波型相似性為基礎之同步化疊合加成)演算法之已知處理。
此第三種技術達成令人滿意的結果,像前一技術,但當接收和復原機件在其處理器和記憶器資源限制操作時,仍需要大量資源。
本案改進先前技術,擬議一種加速視聽內容項復原之方法,意即在比額定期限更短期間內,特別是一種加速音頻復原方法,進行以編碼水準所需之某種處理,而非在接收和復原機件內。
本案係尤其關於音頻和/或視聽內容接收器(PVR)內音頻內容之復原方法,該接收器係適於復原該音頻內容,該音頻係被接收編碼含有連續音頻樣本幅,以及在該幅之音頻樣本至少一部份上的指標型資訊。
按照一特別具體例,該方法包括:˙從該幅選擇音頻樣本,該所選定音頻樣本係由該指標型資訊識別;˙只復原該選定之樣本。
依靠具體例,可復原儲存於媒體上的音頻或視聽內容項,包含在接收器機件外之儲存器,諸如數位音頻或視頻磁碟,例如從通訊網路接收到串流內之音頻或視頻內容。
按照一特別具體例,該接收器適於以額定復原速度和至少比該額定復原速度大的復原速度,復原該音頻內容,其中該復原只有選定樣本是以大於該額定值的該至少一復原速度之一進行。
須知下述指標型資訊或指標,意指可用於在複數項中識別一項之任何資訊。因此,指標亦相當於「標誌」,可為等級、位置、指數、位址,或暫時指涉,諸如非限制性。
「相對於額定復原期限之加速復原期限」一辭,於此指按照
本文復原方法若干具體例,比音頻內容自然復原速度為短之音頻內容復原總期限。因此,按照本案復原方法之若干具體例,一分鐘的音頻內容可在40至50秒內復原。
其優點是可減少音頻或視聽內容項之復原期限,又能保存原有音調。因此,使用者可以比額定期限更少時間,觀看已按照此方法復原之所接收視聽內容項,都不會注意到音調變形,諸如移動至較高階暫存器。
按照一特別具體例,該指標型資訊是包含在頭標封包內,各該頭標封包係與該幅之一關聯。
按照一特別具體例,該指標型資訊包含,識別待復原或截斷的序列樣本開始之資料,和/或識別待復原或截斷的序列樣本結束之資料。
按照一特別具體例,復原方法又包括,把至少一第一音頻樣本與至少一第二音頻樣本混合,該至少一第一和該至少一第二音頻樣本,係選自音頻樣本上之該指標型資訊。
按照一特別具體例,該第一和第二樣本之該項混合,係以計算該第一和第二樣本之平均值進行。
按照一特別具體例,音頻樣本上之該指標型資訊包括,與待復原或截斷的樣本相關之指標,以及與待混合的選定樣本相關之指標。
按照一特別具體例,該指標型資訊包含,識別待混合序列樣本開始之資訊,和/或識別待混合序列樣本結束之資訊。
按照一特別具體例,該頭標封包各含若干集合之指標型資訊,各該集係分別與比該額定復原速度大的該復原速度之一可能數值關聯。
按照一特別具體例,復原方法使用一演算法,基於WSOLA法改變音頻樣本之連續。
雖然未明示,呈現的具體例可使用任何組合或次組合方式實施。例如在復原方法之一具體例中,頭標封包各含分別與比額定復原速度大的若干可能復原速度值關聯之若干件指標型資訊,可與另一具體例組合,後者之復原方法包括把至少一第一音頻樣本與至少一第二音頻樣本混合,至少一第一和至少一第二音頻樣本係選自音頻樣本上之指標型資訊。
凡技術專家閱讀本說明書容易想到之其他具體例,均包含在本案範圍內。
尤其是本案不限於根據WSOLA法編碼的連續音頻樣本之復原。
按照又一要旨,本案亦關係到視聽和/或音頻內容之接收解碼器,包括至少一處理器,構成復原音頻內容項,該音頻內容係接收編碼,並包括連續音頻樣本幅,和在該幅音頻樣本至少一部份上之指標型資訊。
按照一特別具體例,該至少一處理器係構成:˙從該幅選擇音頻樣本,該所選定音頻樣本係由該指標型資訊識別;˙復原該只有選定之樣本。
雖然未明說,該接收解碼器可構成在其任一具體例中,實施本案之復原方法。
按照又一要旨,本案亦關係音頻內容之編碼方法,該編碼音頻內容且包含連續音頻樣本幅,和該幅音頻樣本至少一部份上之指標型資訊。
按照一特別具體例,該編碼方法包括選擇待復原的音頻樣本,並利用該指標型資訊識別該選定之音頻樣本。
按照本案一具體例,編碼方法包括演算法,根據WSOLA法修飾連續之音頻樣本。
雖然未明說,該編碼方法可在與上述復原方法至少一具體例相容之具體例內實施。
按照又一要旨,本案亦涉及音頻和/或視聽內容之編碼器,包含至少一處理器,構成編碼音頻內容項,該所編碼音頻內容包含連續之音頻樣本幅,和在該幅音頻樣本至少一部份上之指標型資訊。按照一特別具體例,該至少一處理器構成為,選擇待復原之音頻樣本,並利用該指標型資訊識別該選定音頻樣本。
雖然未明說,該編碼器可構成其任一具體例中,實施本案之編碼方法。
按照又一要旨,本案係關於電腦程式製品,包括程式碼指令,當該程式利用電腦執行時,可在上述任一具體例中執行上述復原方法。
按照又一要旨,本案係關於電腦程式製品,包括程式碼指令,當程式以電腦執行時,可在上述任一具體例中,執行上述編碼方法。
按照又一要旨,本案係關於一種訊號,帶有串流,包括連續音頻樣本幅,和在該幅音頻樣本至少一部份上之指標型資訊。按照一特別具體例,該訊號含有按照本案標的編碼方法特別具體例之一所編碼資料。
按照又一要旨,本案係關於電腦可讀式儲存媒體,其上存有電腦程式,包括程式碼指令,當該程式利用電腦執行時,可在上述任一具體例內,執行本案之復原方法,或執行本案之編碼方法。
此等電腦可讀式儲存媒體,可採取電腦程式製品之形式,其上載錄至少一電腦可讀式儲存媒體,包括電腦可讀式和電腦可執行程式碼指令。
因此,在本專利申請案中,電腦可讀式儲存媒體視為非暫態儲存媒體,具有本質容量以儲存資訊,和本質容量致能復原所儲存資訊。
電腦可讀式儲存媒體可例如但非僅為一種系統、機件或電子、磁力、光學、電磁或紅外線裝備項,由半導體製成,或實施前述技術之組合。須知下述元件,提供電腦可讀式儲存媒體之特殊實施例,可應用本案原理者,基本上都可用來說明,並非構成列舉表單,為技術專家容易理解:可攜式電腦磁片、硬碟、ROM(唯讀記憶器)型記憶器、EPROM(可抹除程式規劃式唯讀記憶器)型可抹除記憶器或快閃記憶器、包括ROM記憶器之可攜式微型光碟(CD ROM)、光學儲存設備項、磁力儲存設備項,或前述元件之任何適當組合。
凡技術專家均容易明白,按照變化例,本發明要旨可利用機件、方法或電腦可讀式儲存媒體實施。因此,本發明要旨可在某些具體例內實施,以全部硬體組件之形式(例如電子組件或裝設組件之電子卡),或全部軟體組件之形式(包含例如韌體組件、「常駐」軟體程式、微碼等)。其他具體例可兼實施硬體組件和軟體組件。此外,此等硬體或軟體組件可在同一實體設備項內實施。
在本案內,「模組」一辭通常所指組件,相當於硬體組件或軟體組件。再者,本發明要旨可以電腦可讀式儲存媒體之形式實施。一或以上電腦可讀式儲存媒體之任何組合式均可用。
E‧‧‧編碼器
PVR‧‧‧接收記錄器裝置
L1,L2‧‧‧傳輸鏈路
S‧‧‧伺服器
BN‧‧‧寬頻網路
D‧‧‧復原裝置
Fn-1,Fn,Fn+1,Fn+2,Fn+3‧‧‧連續幅
Hn,Hn+1,Hn+2,Hn+3‧‧‧頭標
S1‧‧‧音頻串流
SAn,SAn+1,SAn+2‧‧‧連續樣本
PtrBn,PtrEn,PtrMBn,PtrMEn‧‧‧指示器
Hn‧‧‧頭標
FID‧‧‧資訊場
SPD‧‧‧復原速度
SP1,SP2‧‧‧速度識別場
Ptr1Bn,Ptr1En,Ptr1MBn,Ptr1MEn‧‧‧第一指標集合
Ptr2Bn,Ptr2En,Ptr2MBn,Ptr2MEn‧‧‧第二指標集合
S0‧‧‧系統啟用
S01‧‧‧接收第(n+1)幅
S2‧‧‧分析第n幅之頭標
S3‧‧‧選擇來自第n和(n+1)幅之樣本
S4‧‧‧遞增幅計數器
S5‧‧‧選擇要復原之樣本
S6‧‧‧識別要截斷之樣本
S7‧‧‧插入連續之音頻樣本
第1圖表示在實施一特別具體例編碼方法的編碼器,和實施一特別具體例復原方法的接收記錄器裝置間傳送視聽內容之系統;第2圖表示利用第1圖所示接收記錄器裝置使用一特別具體例復原方法復原之連續所編碼音頻幅;第3圖表示按照一特別具體例利用第1圖所示接收記錄器裝置實施的復原方法所用音頻幅及其頭標;第4圖表示按照一特別具體例編碼和/或復原方法所用音頻幅及其頭標之變化例;第5圖為方塊圖,繪示按照特別具體例音頻內容項復原方法選擇樣本之步驟;第6圖為方塊圖,繪示按照特別具體例音頻內容項編碼方法之若干步驟。
本案參照附圖所示說明如下,當可更為明白,並凸顯其他特點和優點。
在第1至6圖中,所示模組係功能性單位,相當於實體可分辨單位與否均可。例如,此等模組或其中部份,可一起組成於單一組件內,或構成同樣軟體之功能。反之,按照其他具體例,有些模組係由分開的實體組成。
第1圖表示一種系統,在實施本案一特別且非限制性具體例編碼方法之編碼器E,與實施本案一特別且非限制性具體例復原方法的接收記錄器裝置PVR間,傳送視聽內容。
按照本案一具體例,編碼器E接到來自一或以上之視聽來源之訊號,把訊號編碼於一或以上數位串流,利用傳輸鏈路L1,傳送到伺服器S。相當於一或以上視聽內容項之數位串流,儲存於視聽內容伺服器S,形成檔案。
在其他具體例中,所編碼串流可儲存於外部媒體,諸如USB磁碟機、外部硬碟機或微型光碟(CD)。視聽內容接收記錄器裝置PVR,利用寬頻網路BN連接到伺服器S。接收記錄器PVR構成在使用者控制下,得以選擇接收伺服器S上可得之視聽內容。接收記錄器PVR又利用鏈路
L2,連接到復原裝置D。復原裝置D構成容許顯示視聽內容項之視頻成份,並且復原視聽內容項之音頻成份。裝置D為例如電視機。鏈路L2為例如數位傳輸鏈路,可與標準HDMI(高解像度多媒體介面)相容,供連接設備。接收記錄器裝置PVR,包括儲存單位,適於局部儲存從伺服器S所接收一或以上視聽內容項,在接收後,容許使用者觀視所接收內容。接收記錄器裝置PVR包括執行專屬於接收解碼記錄器設備的接收、解多工化、緩衝、處理、解碼和復原功能之所有模組,通常亦稱為TV解碼器、TV記錄器或機上盒。裝置PVR尤其包括通訊介面,構成連接到寬頻網路,透過一件數據路引設備、解多工器模組、記憶器模組,控制單位,包括處理器、隨機存取記憶器、非無常性記憶器、解碼模組,和解碼後之視聽內容復原模組,以及所有相關模組和裝置,為技術專家所熟知。此等諸模組在此不予詳述,其說明無用於理解本發明。按照具體例之變化例,復原裝置D可包含在接收記錄器裝置PVR內。二裝置PVR和D均可創立為例如桌上型電腦、膝上型電腦、帶有記錄器之電視機、帶有顯示幕之接收器、無線電接收器、高保真度回放頻道,或智慧型電話機之形式。
第2圖表示使用本案復原方法,待利用第1圖所示接收記錄器裝置復原之連續編碼音頻幅。按照本案較佳具體例,視聽內容伺服器S上可得之視聽內容,包含至少一音頻成份和一視頻成份。音頻成份含連續樣本SA1,SA2,SA3,....,SAn,SAn+1,SAn+2,...SAn+i等,構成音頻串流S1。音頻串流S1以幅模態編碼,創立傳送和處理,尤其是致能逐幅依序處理音頻樣本SA1,SA2,SA3,....,SAn,SAn+1,SAn+2,...SAn+i。以幅模態編碼串流,是利用編碼器E進行,使音頻樣本SA1,SA2,SA3,....,SAn,SAn+1,SAn+2,...SAn+j包含在連續幅F1,F2,F3,....,Fn,Fn+1,Fn+2,...Fn+j內。各F1,F2,F3,....,Fn,Fn+1,Fn+2,...Fn+j幅包括一頭標,含處理幅可用之資訊,例如幅識別符、串流S1所帶視聽程式識別符、檢測傳輸錯誤之連續性記數器、幅內所含音頻樣本數指示符,與串流編碼有關之資訊,例如音頻抽樣頻率、受串流影響的音頻路引(頻道)數、樣本根據音頻頻道數在幅內之配置。
按照本案一具體例,利用編碼器E插入與選擇樣本相關資訊之前,自然串流S1係例如按照AC3 Dolby,MPEG-1 Layer 2或AAC格式,或其接續者之一編碼。
在某些具體例中,指標型資訊可利用視頻串流幅攜帶,應與音頻串流同時復原。在其他具體例,例如圖示具體例中,可由音頻幅本身攜帶。
因此,在圖示具體例中,各頭標本身宜在現時幅和次一幅之若干音頻樣本上含有指標型資訊,利用接收記錄器PVR致能選擇只供相當於音頻串流S1的音頻成份復原之樣本子集。
按照本案具體例,若干音頻樣本上之若干指標,用來劃分從幅所帶全部樣本選擇之樣本系列,而其他指標則用來劃分在其間混合之樣本系列。
在圖示具體例中,選擇音頻樣本子集,相當於省略一部份音頻樣本,宜利用截斷所編碼樣本開始和結束,以減少待復原之樣本數。由截斷所得至少部份幅,則利用疊合和混合銜接,並在從此等操作結果的音頻內容復原之際,令截斷效果滑順。
截斷所致音頻串流之復原,以及截斷幅內選定樣本之銜接,在相當於其創造時串流抽樣頻率之復原頻率,可使音頻內容在比其額定期限為短的時間內復原。須知額定期限意指串流在無選擇樣本子集存在內之復原。
所接收串流宜包括可用來選擇要保存樣本和要混合樣本之資訊,呈在若干樣本上指標之形式。指標存在於幅之頭標內,相對於加速復原速度加以界定。
此資訊宜存在於編碼串流S1內,使其不需要重大資源在接收記錄器裝置PVR內選擇樣本。事實上,實施演算法選擇樣本供內容項加速復原,諸如WSOLA演算法記載方法所為,需要重大系統資源,且往往構成對照之主要超載,並需要接收記錄器裝置之處理單位,諸如設備PVR。
按照板車較佳具體例,第2圖所示幅Fn之頭標,包含指標場,在幅Fn和Fn+1之樣本上。按照第2圖所示特別具體例,此等指標包含在樣本系列內要省略的第一樣本幅內之位置,以及次一幅Fn+1內要省略的樣本系列內之最後樣本位置。此等指標分別稱為PtrBn和PtrEn。由於截斷,且為使幅Fn最後剩餘元件和幅Fn+1首先剩餘元件間出現的不連續性滑順,把有些剩餘元件混合在一起。混合是對許多元件進行,根據技術專家已知
演算法,諸如WSOLA演算法界定。劃分截斷面積和混合面積之元件界定方法,在此不加說明,因為對於瞭解本案並非必要。因此,按照第2圖所示特別具體例,幅Fn頭標內所含指標PtrMBn和PtrMEn,分別指示選定元件(所以在要略去的樣本系列外,以PtrBn和PtrEn劃分),需加以混合,使不連續性滑順,並改進以加速度復原的品質。
按照第2圖所示特別具體例,從分別以指標PtrMBn和PtrBn劃分的幅Fn來之樣本,會與從利用指標PtrEn和PtrMEn劃分的幅Fn+1來之選定樣本成對混合。選擇樣本所得音頻串流,則包括較少樣本,因為PtrBn和PtrEn指標中間的連續指標已略去。頻率復原宜等於抽樣頻率,得以比額定期限更少的時間復原音頻內容。額定期限是幅內全部樣本在無選擇(省略)存在下抽樣頻率之復原期限。
按照第2圖所示具體例,要省略的一序列音頻樣本,在現時幅Fn開始,次一幅Fn+1結束。在其他具體例中,幅可包括在幅內開始和結束時省略之一或若干序列音頻樣本。幅亦可不包括要省略之音頻樣本,或是包括要在幅內開始和結束時省略之一或若干序列音頻樣本,和在幅內開始時省略而在結束時則否(或是結束時省略而在開始時則否)之一序列音頻樣本。在如此具體例中,指標型資訊(關係到要省略或混合之樣本)可含包括所指音頻樣本之幅數,和所屬幅內所指音頻樣本位置。
利用指標分別指示的樣本位置,視所需復原速度而定。因此,就額定復原速度,亦即額定期限而言,加速復原速度愈大(或復原期限愈小),選定樣本數愈少(或愈多),而省略樣本愈多(或愈少)。增加復原時間超過額定速度達20%,可得令人滿意的復原品質。
按照本案一具體例,各幅含若干指標集合,諸如上述,分別與復原速度之若干指數(加速因數)關聯。因此,幅頭標可含例如加速度因數×1.1之截斷和混合指標列表,然後是加速度因數×1.2之截段和混合指標列表,依次為因數×1.3、×1.4等。若幅頭標內存在複數集合指標,操作樣本選擇的接收記錄器PVR之控制單位,即會顧到相當於所需加速因數之指標集合,使用相當於由使用者要求所需復原之指標集合,進行樣本選擇。
視本案之具體例而定,當幅接到等級n+1 Fn+1,幅接到等級
n,接收記錄器PVR之控制單位,即分析幅在等級n Fn之頭標內容,尤其是讀取指標PtrBn和PtrEn,分別識別要省略樣本系列之限度,在幅Fn和Fn+1內之定位;以及指標PtrMBn和PtrMEn,識別必須混合之樣本系列限度,以便最佳限定因樣本幅截斷所致不連續性效果。
於接到幅Fn和Fn+1後,並扮演本案特別非限制性具體例,幅Fn之樣本從指標PtrEn-1到PtrBn,再複製到復原緩衝器(緩衝記憶器),位於指標PtrMBn和PtrBn間之樣本,再接續與位於指標PtrEn和PtrMEn間之樣本混合,例如取樣本之平均,混合所得數值繼先前複製值(樣本),書寫至復原緩衝器。當達到要混合的樣本系列限度時,在指標PtrMEn開始再複製樣本,並繼續到次一幅之指標PtrBn+1。與此選擇操作並行的復原過程,仍然在裝置PVR的控制單位之控制下,掃描復原緩衝器,以便饋送輸入到音頻解碼模組,並復原樣本選擇所致之音頻串流。當然,若幅之頭標含有若干指標集合,相當於若干可能復原速度,控制單位會讀取相當於界定復原速度之指標。此速度是由使用者選擇,利用為此所構成之使用者介面,尋求觀視相當於音頻串流S1之視聽內容。
第3圖顯示按照本案特別非限制性具體例,以接收記錄器裝置PVR實施之復原方法使用的音頻幅Fn及其頭標Hn。頭標Hn含有資訊場FID,可識別幅之等級n,即其在音頻串流S1內之位置。頭標Hn亦含場,以識別所需復原速度SPD。除界定加速復原速度和額定速度間關係之識別符外,此場本身含有界定是否在編碼時界定單一加速復原速度之場,亦即界定是否在頭標內只有單一指標集合,或是否在頭標內有複數連續指標集合。第3圖顯示情況是界定單一加速度,而單一指標集合界定要省略的樣本系列和要混合的樣本系列。
第4圖利用本案復原方法所用音頻幅Fn及其頭標Hn之變化例,在編碼中支援二加速復原速度。在此情況時,第一速度識別場SP1除與額定復原速度和第一加速度間速度比有關之資訊外,亦含有資訊指示編碼之加速度數為二,即二指標集合,用來截斷和混合頭標內後續之樣本。如第4圖所示,此在頭標Hn內,宣告二指標集合且編碼相當於第一集合的復原速度之場SP1,接著分別是第一指標集合Ptr1Bn,Ptr1En,Ptr1MBn,Ptr1MEn,然後是宣告第二指標集合且編碼相對應速度之場SP2,接著是第
二指標集合Ptr2Bn,Ptr2En,Ptr2MBn,Ptr2MEn。接收編碼串流之接收記錄器裝置PVR,適於按照操作者所選復原速度,可為額定速度(接收之樣本全部復原),或以場SP1或場SP2所指示速度,選擇樣本,若所需復原速度為SP1,為復原串流S1所載音頻內容而選擇樣本,是使用Ptr1Bn,Ptr1En,Ptr1MBn,Ptr1MEn指標進行。同理,若所需復原速度為SP2,選擇樣本所用指標為Ptr2Bn,Ptr2En,Ptr2MBn,Ptr2MEn。
第5圖為流程圖,表示按照本發明特別且非限制性具體例的音頻內容項復原方法,選擇樣本之步驟。
步驟S0相當於系統啟用,此時接收記錄器裝置PVR構成額定操作模態,使用者可開始觀視原先從伺服器S接到之視聽內容,以編碼器E加以編碼。視聽內容儲存於裝置PVR之儲存單位,諸如硬碟機,形成檔案,含有視頻串流和音頻串流。音頻串流為第2圖所示串流S1。
於步驟S01,從裝置PVR之儲存單位讀取記錄串流S1,把進內串流解多工化後,利用控制單位分析,尤其是分開音頻和視頻成份。
串流S1之連續幅Fn和Fn+1,於步驟S2連續讀取和分析,而在步驟S3時,控制單位選擇根據在步驟S2讀取之指標PtrBn,PtrEn,PtrMBn,PtrMEn,選擇樣本SAn子集。控制單位把選擇樣本再複製於復原緩衝器,若需要樣本混合,於此書寫混合操作結果。於步驟S4,遞增幅計數器,對後續幅重複樣本選擇過程,此時與選擇過程並行,復原過程放空復原緩衝器,把樣本送到含有音頻解碼模組之復原模組。復原緩衝器利用控制單位管理,做為巡迴緩衝器。視具體例而定,幅在等級n的頭標使用指標,指示要從等級n和等級n+1幅內選出的樣本。故在圖示特別具體例中,必須已接到至少二幅,以進行選擇和複製,混合後必要時,把選定樣本於復原緩衝器,在其內以指標劃分樣本系列。
換言之,按照所述具體例,本案一要旨包括在音頻程式接收器PVR內之音頻內容復原方法,適於以額定復原速度和大於額定復原速度之至少一復原速度,復原視聽內容。音頻內容接收並編碼於傳送串流S1內。以編碼器E所為編碼,傳送串流S1在幅Fn的音頻樣本至少一部份,含有連續之音頻樣本SAn和指標型資訊PtrMBn,PtrBn,PtrEn和PtrMEn之幅Fn。串流S1之復原方法包括:
˙在復原操作之前,從幅Fn選擇音頻樣本,所選擇音頻樣本,係以指標型資訊PtrMBn,PtrBn,PtrEn,PtrMEn加以識別;˙復原只有經選取和書寫於復原緩衝器內之樣本,使此等樣本之復原期限少於無選擇存在時完整幅之復原期限。
選擇和書寫於復原緩衝器之操作,包括在截斷面積之前和之後,音頻樣本之混合。因此,來自等級n幅,其位置以指標PtrMBn界定之樣本,與來自等級n+1幅,其位置以指標PtrEn界定之樣本混合。
接收記錄器PVR適於藉實施所述加速復原之方法,復原相當於所編碼音頻串流之音頻內容。其控制單位選擇要處理之樣本,加以複製到復原緩衝器,把樣本全部混合,然後把混合結果書寫於復原緩衝器,同時讀取復原緩衝器,以便復原從選擇和混合過程所得音頻串流。
故所述過程可在接收記錄器PVR內進行,編碼器E實施自然音頻內容項之編碼方法,創造音頻傳送串流,如第6圖所示,插入S7連續之音頻樣本和音頻樣本上指標型資訊之幅。編碼方法使用例如根據WSOLA演算法,包括選擇S5要復原之樣本,以及識別S6要截斷之樣本,和要利用指標型資訊混合之樣本。
在圖示具體例中,編碼器E把樣本上之指標插入音頻串流幅Fn之頭標場內,容許接收記錄器PVR再只有選擇由插入指標所識別之音頻樣本子集,以實施加速復原。
本案亦涉及編碼音頻訊號,形成音頻串流,含有例如插入於各幅內的連續音頻樣本和指標型資訊幅,容許此訊號之接收器識別要截斷之一或以上音頻樣本系列,終於是要混合之一或以上音頻樣本系列,都是由接收器用來加速復原音頻訊號,而不使音調失真。
本案不僅關於上述具體例,亦涉及容許音頻幅之接收器根據利用編碼插入於音頻串流內之資訊,僅選擇音頻樣本子集,再容許在比額定期限更短之期限內,復原音頻內容(例如不重大改變音頻聲調),使編碼中界定期限之內容項,可利用接收和復原裝置,在較短期限內復原。
按照本案具體例之變化例,待選擇的音頻樣本上之指標,係利用編碼器E插入音頻串流內,並利用裝置PVR以加水印方法摘取。
Claims (14)
- 一種音頻和/或視聽內容接收器(PVR)內音頻內容之復原方法,該接收器(PVR)係適於該音頻內容之復原,該音頻內容係接收編碼,且含有連續音頻樣本(SAn)之幅(Fn),和該幅(Fn)在音頻樣本(SAn)至少一部份上之指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn),該方法之特徵為包括:˙從該幅(Fn)選擇音頻樣本,該選定之音頻樣本係由該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)識別;˙只復原該選定之樣本者。
- 如申請專利範圍第1項之復原方法,其中該接收器(PVR)適於以額定復原速度和大於該額定復原速度之至少一復原速度,復原該音頻內容,且其中該只復原該選定之樣本,係以大於該額定值之該至少一復原速度,進行對該選定之樣本之復原者。
- 如申請專利範圍第1項之復原方法,其中該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)係包含在頭標封包(Hn)內,各該頭標封包(Hn)係與該幅(Fn)之一關聯者。
- 如申請專利範圍第1項之復原方法,其中又包括將該至少一第一音頻樣本與至少一第二音頻樣本混合,該至少一第一和該至少一第二音頻樣本,係選自音頻樣本上之該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)者。
- 如申請專利範圍第4項之復原方法,其中該音頻樣本上之指標型資訊,包括與要復原或截斷(PtrBn,PtrEn)樣本相關之指標,和要混合(PtrMBn,PtrMEn)的選定樣本相關之指標者。
- 如申請專利範圍第4項之復原方法,其中該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn),含有識別要混合樣本系列開始之資訊,和識別要混合樣本系列結束之資訊者。
- 如申請專利範圍第2項之復原方法,其中該頭標封包各含若干指標型資訊集合,各該集合分別與比該額定復原速度大的該復原速度之一可能數值(SP1,SP2)關聯者。
- 一種視聽和/或音頻內容之接收記錄器(PVR),包括至少一處理器,構成供復原音頻內容項,該音頻內容係接收編碼,且包括連續音頻樣本(SAn)之幅(Fn),和該幅(Fn)在音頻樣本(SAn)至少一部份上之指標型資訊(PtrBn, PtrEn,PtrMBn,PtrMEn),該至少一處理器之特徵為,構成:˙從該幅(Fn)選擇音頻樣本,該選定之音頻樣本係由該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)識別;˙只復原該選定之樣本者。
- 一種音頻內容之編碼方法,該編碼音頻內容包含連續音頻樣本(SAn)之幅(Fn),和該幅(Fn)在音頻樣本(SAn)至少一部份上之指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn),該編碼方法之特徵為,包括選擇要復原之音頻樣本,並利用該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)識別該選定之音頻樣本者。
- 一種電腦程式製品,其特徵為,包括程式碼指令,當該程式利用電腦執行時,可執行申請專利範圍第1項之復原方法者。
- 一種電腦可讀式儲存媒體,上面保存有電腦程式,包括程式碼指令,當該程式利用電腦執行時,可執行申請專利範圍第1項之復原方法者。
- 一種電腦程式或製品,其特徵為,包括程式碼指令,當該程式利用電腦執行時,可執行申請專利範圍第9項之編碼方法者。
- 一種電腦可讀式儲存媒體,上面保存有電腦程式,包括程式碼指令,當該程式利用電腦執行時,可執行申請專利範圍第9項之編碼方法者。
- 一種音頻和/或視聽內容之編碼器,包含至少一處理器,構成編碼音頻內容項,該所編碼音頻內容,含連續音頻樣本幅(Fn),和該幅(Fn)在音頻樣本(SAn)至少一部份上之指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn),該至少一處理器之特徵為,構成供選擇要復原之音頻樣本,並利用該指標型資訊(PtrBn,PtrEn,PtrMBn,PtrMEn)識別該選定之音頻樣本者。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??1362639 | 2013-12-16 | ||
FR1362639 | 2013-12-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201535357A TW201535357A (zh) | 2015-09-16 |
TWI630603B true TWI630603B (zh) | 2018-07-21 |
Family
ID=50780558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103143393A TWI630603B (zh) | 2013-12-16 | 2014-12-12 | 音頻內容之加速復原方法和相關聯裝置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9813689B2 (zh) |
EP (1) | EP2899723A1 (zh) |
JP (1) | JP2015132819A (zh) |
KR (1) | KR20150070039A (zh) |
CN (1) | CN104717544A (zh) |
TW (1) | TWI630603B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6185527B1 (en) * | 1999-01-19 | 2001-02-06 | International Business Machines Corporation | System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval |
US7506356B2 (en) * | 1999-07-08 | 2009-03-17 | Microsoft Corporation | Skimming continuous multimedia content |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5623344A (en) * | 1992-09-01 | 1997-04-22 | Hitachi America, Ltd. | Digital video recording device with trick play capability |
US6324337B1 (en) | 1997-08-01 | 2001-11-27 | Eric P Goldwasser | Audio speed search |
US6959220B1 (en) * | 1997-11-07 | 2005-10-25 | Microsoft Corporation | Digital audio signal filtering mechanism and method |
US8538886B1 (en) | 1998-08-31 | 2013-09-17 | Google Inc. | Watermarking system and methodology for digital multimedia content |
US6252919B1 (en) * | 1998-12-17 | 2001-06-26 | Neomagic Corp. | Re-synchronization of independently-clocked audio streams by fading-in with a fractional sample over multiple periods for sample-rate conversion |
US6868224B1 (en) | 1999-05-05 | 2005-03-15 | Ati International Srl | Method and apparatus for providing multimedia playback |
US6442517B1 (en) * | 2000-02-18 | 2002-08-27 | First International Digital, Inc. | Methods and system for encoding an audio sequence with synchronized data and outputting the same |
JP2002073093A (ja) * | 2000-09-05 | 2002-03-12 | Nippon Telegr & Teleph Corp <Ntt> | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 |
US8340972B2 (en) * | 2003-06-27 | 2012-12-25 | Motorola Mobility Llc | Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment |
US7464028B2 (en) | 2004-03-18 | 2008-12-09 | Broadcom Corporation | System and method for frequency domain audio speed up or slow down, while maintaining pitch |
US20080131075A1 (en) | 2006-12-01 | 2008-06-05 | The Directv Group, Inc. | Trick play dvr with audio pitch correction |
US8428443B2 (en) | 2007-03-12 | 2013-04-23 | At&T Intellectual Property I, L.P. | Systems and methods of providing modified media content |
US8891946B2 (en) | 2009-09-09 | 2014-11-18 | Netflix, Inc. | Accelerated playback of streaming media |
US9749676B2 (en) | 2010-06-08 | 2017-08-29 | Microsoft Technology Licensing, Llc | Virtual playback speed modification |
-
2014
- 2014-12-12 EP EP14197535.9A patent/EP2899723A1/en not_active Withdrawn
- 2014-12-12 TW TW103143393A patent/TWI630603B/zh not_active IP Right Cessation
- 2014-12-15 JP JP2014253285A patent/JP2015132819A/ja active Pending
- 2014-12-16 US US14/571,458 patent/US9813689B2/en not_active Expired - Fee Related
- 2014-12-16 CN CN201410784249.6A patent/CN104717544A/zh active Pending
- 2014-12-16 KR KR1020140181838A patent/KR20150070039A/ko not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6185527B1 (en) * | 1999-01-19 | 2001-02-06 | International Business Machines Corporation | System and method for automatic audio content analysis for word spotting, indexing, classification and retrieval |
US7506356B2 (en) * | 1999-07-08 | 2009-03-17 | Microsoft Corporation | Skimming continuous multimedia content |
Also Published As
Publication number | Publication date |
---|---|
KR20150070039A (ko) | 2015-06-24 |
JP2015132819A (ja) | 2015-07-23 |
US20150181190A1 (en) | 2015-06-25 |
US9813689B2 (en) | 2017-11-07 |
CN104717544A (zh) | 2015-06-17 |
EP2899723A1 (en) | 2015-07-29 |
TW201535357A (zh) | 2015-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4270379B2 (ja) | デジタル情報の効率的な伝送および再生 | |
US10129587B2 (en) | Fast switching of synchronized media using time-stamp management | |
RU2337415C2 (ru) | Информационный запоминающий носитель, содержащий записанные на нем данные текстовых субтитров, синхронизированные с аудиовизуальными данными, и способ и устройство для его воспроизведения | |
US20070001877A1 (en) | Information processing apparatus and decoding control method | |
WO2005103906A1 (ja) | 記録再生装置、およびコンテンツデータ保護システム | |
CN100568943C (zh) | 数据处理装置 | |
KR101051063B1 (ko) | 영상 수록 재생 장치, 영상 수록 방법, 영상 재생 방법 및 영상 수록 재생 방법 | |
TWI630603B (zh) | 音頻內容之加速復原方法和相關聯裝置 | |
US8213778B2 (en) | Recording device, reproducing device, recording medium, recording method, and LSI | |
KR100978995B1 (ko) | 정보 기록 처리 장치, 정보 재생 처리 장치, 및 방법, 및 기록 매체 | |
JP6089970B2 (ja) | 映像データ削減装置および再生装置 | |
JP2010170592A (ja) | 情報再生装置および情報再生方法 | |
US8442126B1 (en) | Synchronizing audio and video content through buffer wrappers | |
RU2690163C2 (ru) | Устройство обработки информации и способ обработки информации | |
JP5732483B2 (ja) | ディジタルデータ記録再生装置 | |
CN111131868B (zh) | 基于播放器的视频录制方法及装置 | |
CN111699530B (zh) | 记录装置及记录方法 | |
US10373650B2 (en) | Data transferring device and data transferring method | |
JP2008206076A (ja) | 再生装置および方法、並びにプログラム | |
JP2003235012A (ja) | ファイル及びコンテンツ管理 | |
JP2005117556A (ja) | トランスポートストリーム編集方法及び装置 | |
JP5782098B2 (ja) | ディジタルデータの記録再生方法及びディジタルデータの記録再生装置 | |
JP5685686B2 (ja) | 映像音声記録再生装置。 | |
JP2017163490A (ja) | 画像処理装置及び画像処理方法 | |
JP2015180102A (ja) | ディジタルデータ記録再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |