TWI644308B - Decoding device and method, and program - Google Patents
Decoding device and method, and program Download PDFInfo
- Publication number
- TWI644308B TWI644308B TW103143688A TW103143688A TWI644308B TW I644308 B TWI644308 B TW I644308B TW 103143688 A TW103143688 A TW 103143688A TW 103143688 A TW103143688 A TW 103143688A TW I644308 B TWI644308 B TW I644308B
- Authority
- TW
- Taiwan
- Prior art keywords
- gain
- value
- previous
- interpolation
- sample
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 113
- 238000012545 processing Methods 0.000 claims abstract description 108
- 238000004364 calculation method Methods 0.000 claims description 55
- 238000005516 engineering process Methods 0.000 abstract description 32
- 102100031476 Cytochrome P450 1A1 Human genes 0.000 description 18
- 101000941690 Homo sapiens Cytochrome P450 1A1 Proteins 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000012937 correction Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 4
- 238000012888 cubic function Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- ORFPWVRKFLOQHK-UHFFFAOYSA-N amicarbazone Chemical compound CC(C)C1=NN(C(=O)NC(C)(C)C)C(=O)N1N ORFPWVRKFLOQHK-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G11/00—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
- H03G11/008—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/002—Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Stereophonic System (AREA)
Abstract
本技術是有關於,能夠獲得較高音質之聲音的解碼裝置及方法、以及程式。
非多工化電路,係將輸入編碼列非多工化成為增益編碼列與訊號編碼列。訊號解碼電路,係將訊號編碼列予以解碼而輸出時間序列訊號。增益解碼電路係將增益編碼列予以解碼。亦即,增益解碼電路,係從增益編碼列,讀出時間序列訊號的所定之增益樣本位置的增益值及增益斜率值、和內插模式資訊。然後,內插處理部,係基於增益值及增益斜率值,隨應於內插模式資訊,藉由線性內插或非線性內插,而求出2個增益樣本位置間的各樣本位置之增益值。增益適用電路,係基於增益值而進行時間序列訊號的增益調整。本技術係可適用於解碼裝置。
Description
本技術係有關於解碼裝置及方法、以及程式,尤其是有關於,能夠獲得較高音質之聲音的解碼裝置及方法、以及程式。
先前,MPEG(Moving Picture Experts Group)AAC(Advanced Audio Coding)(ISO/IEC14496-3:2001)之音訊編碼技術中,可在位元串流中記錄降轉混音或DRC(Dinamic Range Compression)之輔助資訊,在再生側則可隨著其環境來使用輔助資訊(例如參照非專利文獻1)。
若使用如此的輔助資訊,則於再生側將聲音訊號進行降轉混音,藉由DRC就可進行適切的音量控制等等。
[非專利文獻1]Information technology Coding of
audiovisual objects Part 3:Audio(ISO/IEC 14496-3:2001)
例如在上述的編碼技術中,作為DRC之輔助資訊是可將音量控制所需之DRC增益資訊以聲音訊號之音框單位來加以指定,於再生側上,係基於該DRC增益資訊來進行聲音訊號之音量補正,就可獲得適切音量之聲音。
然而,此種DRC增益資訊所表示之增益,係對屬於時間訊號的聲音訊號之1音框內之各樣本,都會是相同值。亦即,1音框中所含之全樣本都是用相同增益而被補正。
因此,例如若音框間DRC增益資訊所表示之增益之大小有很大變化,則聲音訊號之時間波形的音框間之部分會變成不連續,會產生聽感上之劣化。
本技術係有鑑於此種狀況而研發,目的在於能夠獲得較高音質之聲音。
本技術之第1側面的解碼裝置,係具備:增益讀出部,係將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值,予以讀出;和內插資訊讀出部,係讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置
的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;和內插處理部,係基於前記增益樣本位置的前記增益值,將位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
可令前記增益讀出部係還讀出,表示前記增益樣本位置上的前記增益值之斜率的增益斜率值;可令前記內插處理部,在以非線性內插來求出前記增益值的情況下,基於前記增益樣本位置的前記增益值及前記增益斜率值,求出位於前記2個前記增益樣本位置之間的各樣本位置的前記增益值。
解碼裝置中,係可還設置有:限制處理部,係以使得前記增益值會變成所定之下限值以上之值或所定之上限值以下之值的方式,對以非線性內插而被求出之前記增益值,實施限制處理。
可令前記限制處理部實施,以0為下限值的限制處理、以1為下限值的限制處理、或以1為上限值的限制處理。
在解碼裝置中,係還設有:演算部,係於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對前記2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;可令
前記內插處理部,若前記內插資訊是表示要以線性內插來求出前記增益值的資訊,則以線性內插來求出前記增益值,若前記內插資訊是表示要以非線性內插來求出前記增益值的資訊,則隨應於前記差而用非線性內插或線性內插來求出前記增益值。
本技術之第1側面的解碼方法或程式,係含有以下步驟:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值予以讀出;讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;基於前記增益樣本位置的前記增益值,將位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
在本技術的第1側面中,時間序列訊號之至少2個增益樣本位置的已被編碼之增益值會被讀出;表示前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出的內插資訊,會被讀出;基於前記增益樣本位置的前記增益值,位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,會隨應於前記內插資訊而用線性內插或非線性內插而被求出。
本技術之第2側面的解碼裝置,係具備:增益讀出部,係將時間序列訊號之至少2個增益樣本位置的
已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;和演算部,係於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;和內插處理部,係隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
本技術之第2側面的解碼方法或程式,係含有以下步驟:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
在本技術的第2側面中,時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,會被讀出;於前記增益樣本位
置上,取該前記增益樣本位置的前記增益值,且具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線會被求出,針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,會被求出;隨應於前記差,位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,會用線性內插或非線性內插而被求出。
若依據本技術的第1側面及第2側面,則可獲得較高音質之聲音。
此外,並非一定限定於這裡所記載的效果,亦可為本揭露中所記載之任一效果。
11‧‧‧編碼裝置
21‧‧‧音壓位準計算電路
22‧‧‧增益計算電路
23‧‧‧增益編碼電路
24‧‧‧訊號編碼電路
25‧‧‧多工化電路
51‧‧‧解碼裝置
61‧‧‧非多工化電路
62‧‧‧訊號解碼電路
63‧‧‧增益解碼電路
64‧‧‧增益適用電路
71‧‧‧內插處理部
101‧‧‧限制處理部
131‧‧‧演算部
501‧‧‧CPU
502‧‧‧ROM
503‧‧‧RAM
504‧‧‧匯流排
505‧‧‧輸出入介面
506‧‧‧輸入部
507‧‧‧輸出部
508‧‧‧記錄部
509‧‧‧通訊部
510‧‧‧驅動機
511‧‧‧可移除式媒體
[圖1]增益之線性內插的說明圖。
[圖2]增益波形之例子的圖示。
[圖3]增益之非線性內插的說明圖。
[圖4]編碼裝置之構成例的圖示。
[圖5]說明編碼處理的流程圖。
[圖6]DRC特性的圖示。
[圖7]解碼裝置之構成例的圖示。
[圖8]說明解碼處理的流程圖。
[圖9]說明增益解碼處理的流程圖。
[圖10]解碼裝置之構成例的圖示。
[圖11]說明增益解碼處理的流程圖。
[圖12]增益波形之內插的說明圖。
[圖13]增益波形之內插的說明圖。
[圖14]增益波形之內插的說明圖。
[圖15]解碼裝置之構成例的圖示。
[圖16]說明增益解碼處理的流程圖。
[圖17]增益波形之內插的說明圖。
[圖18]說明增益解碼處理的流程圖。
[圖19]電腦之構成例的圖示。
以下,參照圖面,說明適用了本技術的實施形態。
本技術係有關於,將聲音訊號在再生側上進行音量補正時的增益值予以編碼,將增益值之編碼所得到的增益編碼列、和聲音訊號之編碼所得到的訊號編碼列予以多工化而傳輸的技術、及將這些增益編碼列和訊號編碼列予以解碼,進行聲音訊號之音量補正的技術。
在本技術中,作為音量補正所需之增益值,是對聲音訊號之音框內之每一樣本指定任意之值,藉此而可獲得較圓滑之時間波形的聲音。藉此,就可獲得無異樣感的高音質之聲音。此處,音量補正所需之增益值係可被設為dB值,也可被設為線性值,但在以下是假設增益值為線性值來繼續說明。
又,在增益值的編碼時,例如音框內之各樣本位置之增益值之中,增益波形之反曲點等的特徵性位置、或以所定間隔而排列的位置之增益值等,若僅將一部分之樣本位置之增益值加以編碼而當作增益編碼列,則亦可削減增益編碼列之編碼量。
此情況下,在增益編碼列之解碼側上,係必須要基於增益編碼列之解碼所得到的數個樣本位置之增益值,來獲得原本的增益波形。
此處,作為用來獲得原本的增益波形所需之手法,係考慮例如如圖1所示般地進行線性內插,以求出增益編碼列中所不含之樣本位置之增益值的手法。
此外,於圖1中縱軸及橫軸係分別表示增益值、及聲音訊號之音框內的樣本位置。
又,以下,在增益編碼列中,已被編碼之增益值所被包含的的樣本位置,特別亦稱為增益樣本位置。再者,在以下,增益編碼列中所含之已被編碼之樣本位置及增益值所表示的、增益波形上的點,也簡稱為增益樣本位置。
在圖1的例子中,增益樣本位置G11和增益樣本位置G12之資訊,係藉由增益編碼列之解碼而獲得。
此處,令音框內之第k個增益樣本位置之增益值為g[k],將從第k個增益樣本位置至第k+1個增益樣本位置的樣本軸方向之樣本長(樣本數),表示為T[k]。
此情況下,若令第k個增益樣本位置G11之樣本位置為n=0,則增益樣本位置G11係為座標(0,g[k])所表示的點,增益樣本位置G12係為座標(T[k],g[k+1])所表示的點。此處,n係為表示這是從音框之開頭起第n個樣本之位置的索引。
又,線性內插所得之、增益樣本位置G11與增益樣本位置G12之間的增益波形,係為直線L11所示的波形。亦即,在增益樣本位置G11與增益樣本位置G12之間,增益值係視為線性變化而藉由內插來求出各樣本位置之增益值。
可是,若藉由線性內插來推定增益波形,則例如圖2之曲線C11所示,試圖將圓滑的增益波形進行編碼時,增益波形之應編碼的點,亦即增益樣本位置之數目會變多。此外,於圖2中,縱軸及橫軸係分別表示增益值、及聲音訊號之音框內的樣本位置。
在此例子中,曲線C11所示之增益波形係呈圓滑的波形,因此在解碼側上,若想要以某種程度之精度來重現增益波形,則必須要較多增益樣本位置上的增益值之編碼。如此一來,將增益編碼列和訊號編碼列進行多工
化所得之位元串流的編碼量,亦即位元速率就會變高。
於是,在本技術中,為了能夠以較少編碼量來獲得較高音質之聲音,除了線性內插以外,還新適宜進行了非線性內插。亦即,線性內插和非線性內插之中,較適切之方式會被選擇而進行內插處理,生成增益波形。此外,非線性之內插係可為,例如採用2次函數或3次函數的內插。
例如,利用3次函數的非線性內插被進行時,作為圖1所示的增益樣本位置G11與增益樣本位置G12之間的增益波形,會獲得圖3之曲線C21所示的波形。此外,於圖3中縱軸及橫軸係分別表示增益值、及聲音訊號之音框內的樣本位置。又,圖3中,和圖1對應的部份,係標示同一符號,並適宜地省略其說明。
在此例子中,增益編碼列中係含有:表示增益樣本位置G11之樣本位置、增益值、及增益斜率值的資訊,和表示增益樣本位置G12之樣本位置、增益值、及增益斜率值的資訊。
此處,所謂增益斜率值,係為表示原本的增益波形之增益樣本位置上之斜率的資訊。以下,將第k個增益樣本位置之增益斜率值,以s[k]來表示。
在圖3中,箭頭D11係表示增益樣本位置G11之增益斜率值s[k],箭頭D12係表示增益樣本位置G12之增益斜率值s[k+1]。
在解碼側上,增益樣本位置G11與增益樣本
位置G12之間的增益波形是藉由利用3次函數的非線性內插而被求出,作為其結果而會獲得曲線C21所示之增益波形。
曲線C21所示之增益波形,係為例如通過增益樣本位置G11和增益樣本位置G12,且增益樣本位置G11及增益樣本位置G12上的斜率係分別為s[k]及s[k+1]的3次函數之曲線。
如此適宜地利用非線性內插,即使增益波形是圓滑的波形時,仍可以較少的增益樣本位置之編碼,亦即較少的編碼量,就能高精度地重現增益波形。
在本技術中,例如作為用來切換線性內插與非線性內插所需之參數,是把表示線性內插所致之內插方式或非線性內插所致之內插方式的內插模式資訊,包含在增益編碼列中。然後,在解碼側上,隨應於該內插模式資訊而進行線性內插與非線性內插之切換。
此處,內插模式資訊,係可為例如用來切換線性內插、2次函數所致之內插、3次函數所致之內插所需之2位元之索引,亦可為用來切換線性內插、和屬於非線性內插的3次函數所致之內插所需之1位元之旗標。亦即,內插模式資訊,係只要是表示增益波形之內插手法的資訊即可。
再者,在本技術中,當內插模式資訊是被設計成表示非線性內插所致之內插方式的資訊時,則針對每一增益樣本位置,除了增益值還會把增益斜率值包含在增
益編碼列中。
此處增益斜率值s[k],係表示每1樣本的增益值之變化。例如,第k個增益樣本位置之增益斜率值s[k],係為第k個增益樣本位置上的增益波形上的點、與第k個增益樣本位置的下個樣本位置上的增益波形上的點所連結的直線之斜率。此外,增益斜率值,係只要是表示增益波形上的增益樣本位置上之斜率的值即可,無論如何被求出都無妨。
此外,增益斜率值係可直接被儲存至增益編碼列,也可設計成,把增益斜率值之量化值、或增益斜率值之霍夫曼編碼值等之熵編碼值,儲存至增益編碼列。
再來說明,將2個增益樣本位置之間之各樣本位置之增益值進行線性內插的方法及進行非線性內插的方法之具體例。首先說明,進行線性內插的方法。
藉由內插模式資訊來進行線性內插時,在解碼側上,從增益編碼列就每一增益樣本位置而讀出增益值。
此處,令第k個增益樣本位置之索引為k,令從增益編碼列所讀出的、第k個增益樣本位置之增益值為g[k]。又,令從第k個增益樣本位置到第k+1個增益樣本位置之間的樣本長為T[k],作為表示第k+1個增益樣本位置之樣本位置的資訊,而把樣本長T[k]包含在增益編
碼列中。
現在,假設第k個增益樣本位置係為音框的開頭位置,亦即第n=0個樣本位置。如此情況下,位於第k個增益樣本位置、與第k+1個增益樣本位置之間的,從開頭起位於第n個(其中,0≦n<T[k])的樣本n之增益值g_interpolated[n],係藉由下式(1)而被算出。
【數1】g_interpolated[n]=a[k]×n+b[k] (0≦n<T[k])‧‧‧(1)
此外,於式(1)中,a[k]及b[k]係分別為藉由以下的式(2)及式(3)而被求出的值。
【數2】a[k]=(g[k+1]-g[k])/T[k]‧‧‧(2)
【數3】b[k]=g[k]‧‧‧(3)
亦即,a[k]及b[k]係表示,第k個與第k+1個增益樣本位置所連結之直線的斜率和切片。因此,在此例子中,如參照圖1所說明,在第k個與第k+1個增益樣本位置之間,增益值被視為呈線性變化,會藉由線性內插而求出各樣本n之增益值。
接著說明,第k個與第k+1個增益樣本位置之間的樣本n之增益值是藉由非線性內插而被求出的情形。此處,作為非線性內插,是假設進行3次函數所致之內插的情形為例子來繼續說明。
藉由內插模式資訊來進行非線性內插時,在解碼側上,從增益編碼列就每一增益樣本位置而讀出增益值和增益斜率值。
此處,和線性內插時同樣地,令第k個增益樣本位置之增益值為g[k],令第k個與第k+1個增益樣本位置之間的樣本長為T[k]。又,令第k個增益樣本位置之增益斜率值為s[k]。
現在,假設第k個增益樣本位置係為音框的開頭位置,亦即第n=0個樣本位置。如此情況下,位於第k個增益樣本位置、與第k+1個增益樣本位置之間的,從開頭起位於第n個(其中,0≦n<T[k])的樣本n之增益值g_interpolated[n],係藉由下式(4)而被算出。
【數4】g_interpolated[n]=c[k]×n3+d[k]×n2+e[k]×n+f[k] (0≦n<T[k])‧‧‧(4)
此外,於式(4)中,c[k]、d[k]、e[k]、及f[k],係分別為藉由以下的式(5)乃至式(8)而被求出的值。
【數5】c[k]=(1/T[k])×{(s[k+1]+s[k])/T[k]-2×(g[k+1]-g[k])/(T[k]2)}‧‧‧(5)
【數6】d[k]=3×(g[k+1]-g[k])-(s[k+1]+2×s[k])/T[k]‧‧‧(6)
【數7】e[k]=s[k]‧‧‧(7)
【數8】f[k]=g[k]‧‧‧(8)
在此例子中,如參照圖3所說明,在第k個與第k+1個增益樣本位置之間,視為增益值是藉由式(4)所示的3次函數而變化,以非線性內插,亦即3次函數所致之內插,來求出各樣本n之增益值。
如以上,適宜藉由非線性內插來求出增益值,就可將例如圖2所示的圓滑的增益波形,以較低之位元速率加以編碼,可提升編碼效率。
接著,說明適用了以上所說明之本技術之具體的實施形態。
圖4係適用了本技術之編碼裝置的一實施形
態之構成例的圖。
編碼裝置11係具有:音壓位準計算電路21、增益計算電路22、增益編碼電路23、訊號編碼電路24、及多工化電路25。
音壓位準計算電路21,係基於所被供給之多聲道之聲音訊號亦即輸入時間序列訊號,來計算構成輸入時間序列訊號的各聲道之音壓位準,將這些每一聲道之音壓位準之代表值,當作代表音壓位準而求出。
此外,音壓位準之代表值係針對輸入時間序列訊號之各音框而被求出。又,被音壓位準計算電路21視為處理單位的音框,係與後述之被訊號編碼電路24所處理的輸入時間序列訊號之音框同步,是長度被設成訊號編碼電路24中之音框以下的音框。
音壓位準計算電路21,係將已求出的代表音壓位準,供給至增益計算電路22。如此所得到的代表音壓位準係表示,例如11.1ch等之所定數之聲道的聲音訊號所成的輸入時間序列訊號之聲道的代表性音壓位準。
增益計算電路22,係基於從音壓位準計算電路21所供給之代表音壓位準來計算增益值,供給至增益編碼電路23。
此處,增益值,係為了使得解碼側上再生輸入時間序列訊號時能夠獲得最佳音量之聲音,而表示將輸入時間序列訊號進行音量補正時的增益值,在增益計算電路22中係針對音框內之每一樣本位置而算出增益值。
增益編碼電路23,係將從增益計算電路22所供給之增益值予以編碼,將其結果所得之增益編碼列,供給至多工化電路25。
此處,增益編碼列中係含有:用來獲得各增益樣本位置之增益值所需的增益資訊、和內插模式資訊。
訊號編碼電路24,係將已被供給之輸入時間序列訊號以所定之編碼方式,例如MEPG AAC所致之編碼手法為代表的一般之編碼手法,進行編碼,將其結果所得之訊號編碼列,供給至多工化電路25。
多工化電路25,係將從增益編碼電路23所供給之增益編碼列、和從訊號編碼電路24所供給之訊號編碼列予以多工化,將其結果所得之輸出編碼列,予以輸出。
接著說明,編碼裝置11的具體動作。
編碼裝置11,係若輸入時間序列訊號是僅被供給1音框份,則進行將該輸入時間序列訊號予以編碼而將輸出編碼列予以輸出的編碼處理。以下,參照圖5的流程圖,說明編碼裝置11所做的編碼處理。
於步驟S11中,音壓位準計算電路21係基於所被供給之輸入時間序列訊號,而算出輸入時間序列訊號的代表音壓位準,供給至增益計算電路22。
具體而言,音壓位準計算電路21,係計算構
成輸入時間序列訊號的各聲道之音壓位準,將這些聲道之音壓位準之代表值,當作代表音壓位準。
例如,音壓位準之計算方法,係和構成輸入時間序列訊號的聲道之聲音訊號之音框之最大值或RMS(Root Mean Square)相等,針對輸入時間序列訊號之音框,就構成輸入時間序列訊號的每一聲道,求出音壓位準。
又,作為被當成代表音壓位準的代表值之計算方法係可採用例如,將相同音框中的各聲道之音壓位準之中的最大值當作代表值的手法、或從各聲道之音壓位準以特定之計算式而算出1個代表值的手法等。具體而言,例如可以使用ITU-R BS.1770-2(03/2011)所記載之響度計算式來算出代表值。
於步驟S12中,增益計算電路22,係基於從音壓位準計算電路21所供給之代表音壓位準而算出增益值,供給至增益編碼電路23。
例如增益計算電路22,係依照上位之控制裝置所指定的DRC特性,而算出增益值。
上位之控制裝置所指定的DRC特性,係可設成例如圖6所示的DRC之特性。此外,於圖6中,橫軸係表示輸入音壓位準(dBFS),亦即代表音壓位準,縱軸係表示輸出音壓位準(dBFS),亦即將輸入時間序列訊號進行音壓位準補正(音量補正)時的補正後之音壓位準。
折線L31及折線L32,係分別表示輸出入音
壓位準之關係。例如,若依據折線L31所示的DRC特性,則當有0dBFS之代表音壓位準之輸入時,會被音量補正而使得輸入時間序列訊號之音壓位準成為-27dBFS。
另一方面,例如,若依據折線L32所示的DRC特性,則當有0dBFS之代表音壓位準之輸入時,會被音量補正而使得輸入時間序列訊號之音壓位準成為-21dBFS。
在增益計算電路22中,係依照此種折線L31或折線L32所表示之DRC特性而決定增益值。該增益值,係以與訊號編碼電路24之音框同步的增益波形,而被輸出。亦即,在增益計算電路22中,針對將輸入時間序列訊號之處理對象的音框予以構成的每一樣本,算出增益值。
更具體而言,例如增益計算電路22,係藉由計算下式(9),以求出音框J中的增益波形g(J,n)。
【數9】g(J,n)=A×Gt(J)+(1-A)×g(J,n-1)‧‧‧(9)
此外,於式(9)中,n係表示將音框長設成N時取得從0到N-1為止之值的樣本之位置,Gt(J)係表示上述DRC特性,亦即由輸入音壓位準和輸出音壓位準而定的音框J中的目標增益。
又,式(9)中的A係為由下式(10)而定的值。
【數10】A=1-exp(-1/(2×Fs×Tc(J)))‧‧‧(10)
於式(10)中,Fs係表示取樣頻率(Hz),Tc(J)係表示音框J中的時間常數,exp(x)係表示指數函數。又在式(9)中,作為n=0時的增益波形g(J,n-1),是使用上一個音框中的最後之樣本之增益值。
返回圖5之流程圖之說明,於步驟S13中,增益編碼電路23,係進行增益編碼處理,將從增益計算電路22所供給之增益值予以編碼。然後,增益編碼電路23,係將增益編碼處理所得到的增益編碼列,供給至多工化電路25。
例如,增益編碼電路23,係從增益計算電路22所供給之各樣本位置之增益值,亦即處理對象之音框之增益波形,抽出編碼對象的增益樣本位置。例如增益波形中的反曲點等之特徵性樣本係可被當成增益樣本位置,以所定間隔排列的各樣本亦可被當成增益樣本位置。
增益編碼電路23,係針對如此抽出的每一增益樣本位置,生成內插模式資訊和增益資訊。
例如增益編碼電路23,係藉由進行所謂的本地解碼,以生成內插模式資訊。
亦即,增益編碼電路23,係針對線性內插與非線性內插,分別藉由內插而生成彼此相鄰的2個增益樣本位置間之增益波形,算出該增益波形與實際之增益波形的差分。然後,增益編碼電路23,係將表示所求出之差
分為較小之內插方式的資訊,當作內插模式資訊而予以生成。
此外,究竟是要進行線性內插,或是要進行非線性內插,係亦可藉由其他任意方法來決定。例如,亦可處理對象之增益樣本位置、和其前一個增益樣本位置上增益值為相同,前一個增益樣本位置之增益斜率值為0的情況下就設為線性內插,其他情況下則設為非線性內插。又,亦可由上位的控制裝置來指定要用線性內插還是非線性內插。
又,增益編碼電路23,係針對各增益樣本位置,將表示樣本位置的樣本長T〔k〕、增益值g[k]、及增益斜率值s[k],因應需要而加以編碼,當作增益資訊。此外,內插模式資訊是表示線性內插所致之內插方式的資訊時,則會生成僅含有樣本長及增益值、不含增益斜率值的增益資訊。
增益編碼電路23,係將含有如此所得到的各增益樣本位置之增益資訊和內插模式資訊的增益編碼列,供給至多工化電路25。
步驟S14中,訊號編碼電路24,係將已被供給的輸入時間序列訊號依照所定之編碼方式進行編碼,將其結果所得之訊號編碼列,供給至多工化電路25。
於步驟S15中,多工化電路25,係將從增益編碼電路23所供給之增益編碼列、和從訊號編碼電路24所供給之訊號編碼列予以多工化,將其結果所得之輸出編
碼列,予以輸出。一旦如此1音框份之輸出編碼列是以位元串流的方式而被輸出,則編碼處理係結束。然後,進行下個音框之編碼處理。
如以上所述,編碼裝置11,係針對輸入時間序列訊號之音框內之每一樣本而求出增益值並抽出增益樣本位置,生成由各增益樣本位置之增益資訊和內插模式資訊所成的增益編碼列。
藉由如此於音框內針對每一樣本而決定增益值,於解碼側上,聲音訊號之音框間之時間波形就被圓滑地連接,可獲得較高音質之聲音。況且,藉由在增益編碼列中含有內插模式資訊,就可適宜地利用非線性內插,以較少的編碼量就能高精度地重現增益波形。
接著說明,將從編碼裝置11所輸出之輸出編碼列當作輸入編碼列而予以輸入,進行輸入編碼列之解碼的解碼裝置。
圖7係適用了本技術之解碼裝置的一實施形態之構成例的圖。
圖7所示的解碼裝置51係具有:非多工化電路61、訊號解碼電路62、增益解碼電路63、及增益適用電路64。
非多工化電路61,係將所被供給之輸入編碼列,亦即從編碼裝置11所接收的輸出編碼列,進行非多
工化,將其結果所得之訊號編碼列,供給至訊號解碼電路62,並且將增益編碼列,供給至增益解碼電路63。
訊號解碼電路62,係將從非多工化電路61所供給之訊號編碼列予以解碼,將其結果所得之時間序列訊號,供給至增益適用電路64。此處,時間序列訊號係為例如11.1ch或7.1ch之聲音訊號,構成時間序列訊號的各聲道之聲音訊號,係被設成PCM(Pulse Code Modulation)訊號。
增益解碼電路63,係將從非多工化電路61所供給之增益編碼列予以解碼,將其結果所得之增益值,供給至增益適用電路64。增益解碼電路63,係具有內插處理部71,內插處理部71,係基於從增益編碼列所得之增益資訊和內插模式資訊,藉由線性內插或非線性內插,算出時間序列訊號之各樣本位置之增益值。
增益適用電路64,係基於從增益解碼電路63所供給之增益值,進行從訊號解碼電路62所供給之時間序列訊號的增益調整,以將時間序列訊號進行音量補正,將其結果所得之輸出時間序列訊號予以輸出。
接下來,說明解碼裝置51之動作。
解碼裝置51,係一旦有輸入編碼列被僅供給1音框份,則進行將該輸入編碼列予以解碼然後將輸出時間序列訊號予以輸出的解碼處理。以下,參照圖8的流程
圖,說明解碼裝置51所致之解碼裝置。
於步驟S41中,非多工化電路61,係將從編碼裝置11所發送之輸入編碼列予以接收並予以非多工化,將其結果所得之訊號編碼列供給至訊號解碼電路62,並且,將增益編碼列供給至增益解碼電路63。
於步驟S42中,訊號解碼電路62,係將從非多工化電路61所供給之訊號編碼列予以解碼,將其結果所得之時間序列訊號,供給至增益適用電路64。
於步驟S43中,增益解碼電路63係進行增益解碼處理,將從非多工化電路61所供給之增益編碼列予以解碼,將其結果所得之處理對象之音框之各樣本位置之增益值,供給至增益適用電路64。此外,增益解碼處理的細節,將於後述。
於步驟S44中,增益適用電路64,係基於從增益解碼電路63所供給之增益值,進行從訊號解碼電路62所供給之時間序列訊號的增益調整,將所得之輸出時間序列訊號予以輸出。亦即,對時間序列訊號之各樣本乘算增益值,成為適切音量的輸出時間序列訊號。
一旦輸出時間序列訊號被輸出,則解碼處理就結束。
如以上所述,解碼裝置51,係將增益編碼列予以解碼,將所得到的各樣本位置之增益值,適用於時間序列訊號,而在時間領域上調整增益(音量)。藉由如此以按照每一樣本位置而定的增益值來進行增益調整,就可使
輸出時間序列訊號之音框間之時間波形圓滑地連接,可獲得較高音質之聲音。
而且,由於適宜利用非線性內插來獲得增益波形,因此即使增益波形是圓滑的波形時,仍可以較少編碼量來高精度地重現增益波形。
又,參照圖9之流程圖,說明對應於圖8之步驟S43之處理的增益解碼處理。
於步驟S71中,增益解碼電路63,係從非多工化電路61所供給之增益編碼列讀出處理對象的增益樣本位置之增益資訊,因應需要而將作為增益資訊而被含有的樣本長T[k]、增益值g[k]、及增益斜率值s[k],予以解碼。此外,若內插模式資訊所表示之內插方式是線性內插所致之內插方式,則增益資訊中係不含增益斜率值。
例如在增益編碼列中,各增益樣本位置之增益資訊和內插模式資訊,是按照從音框之開頭起算之距離較近的順序而被排列而儲存。增益解碼電路63,係從增益編碼列依序讀出增益資訊和內插模式資訊,因此從較靠近音框之開頭的增益樣本位置起,依序被視為處理對象之增益樣本位置。
於步驟S72中,增益解碼電路63,係從增益編碼列讀出處理對象的增益樣本位置之內插模式資訊。
此外,這裡雖然說明內插模式資訊是被增益
編碼列所包含的例子,但內插模式資訊亦可被包含在,各音框之輸入編碼列所被包含的位元串流的標頭等中,內插模式資訊亦可從上位的控制裝置等而被取得。
於步驟S73中,內插處理部71係判定,已被讀出之內插模式資訊所表示之內插方式,是否為線性內插所致之方式。
於步驟S73中,若判定為是線性內插所致之方式,則於步驟S74中,內插處理部71係進行線性內插而生成增益波形。
具體而言,內插處理部71係基於處理對象之增益樣本位置的增益值g[k]及樣本長T[k-1]、和位於比處理對象之增益樣本位置還要前1個音框之開頭側的增益樣本位置的增益值及樣本位置,進行和上述式(1)相同的計算,生成增益樣本位置間的增益波形。亦即,位於時間序列訊號之2個增益樣本位置之間的各樣本位置之增益值會被算出,這些各樣本位置之增益值所成的波形係被視為增益波形。
一旦如此獲得相鄰的2個增益樣本位置間之增益波形,則處理係前進至步驟S76。
相對於此,於步驟S73中,若判定為不是線性內插所致之方式,亦即是非線性內插所致之方式,則於步驟S75中,內插處理部71係進行非線性內插而生成增益波形。
具體而言,內插處理部71係基於處理對象之
增益樣本位置的增益值g[k]、樣本長T[k-1]、及增益斜率值s[k]、和位於比處理對象之增益樣本位置還要前1個音框之開頭側的增益樣本位置的增益值、樣本位置、及增益斜率值,進行和上述式(4)相同的計算,生成增益樣本位置間的增益波形。亦即,位於時間序列訊號之2個增益樣本位置之間的各樣本位置之增益值會被算出,這些各樣本位置之增益值所成的波形係被視為增益波形。
一旦如此獲得相鄰的2個增益樣本位置間之增益波形,則處理係前進至步驟S76。
於步驟S74或步驟S75中,一旦藉由內插而獲得增益樣本位置間的增益波形,則於步驟S76中,增益解碼電路63係判定是否已經將所有的增益樣本位置當作處理對象而進行過處理。
於步驟S76中,若判斷為尚未處理所有的增益樣本位置,則處理係返回步驟S71,重複上述處理。亦即,下個增益樣本位置係被選擇成為處理對象,增益波形會藉由內插而被求出。
相對於此,於步驟S76中,若判定為已經處理所有的增益樣本位置,則增益解碼電路63係將目前為止之處理所得到的各樣本位置的增益值所成之1音框份的增益波形,供給至增益適用電路64,增益解碼處理係結束。一旦增益解碼處理結束,則其後,處理係往圖8的步驟S44前進。
如以上,解碼裝置51,係隨應於內插模式資
訊而藉由線性內插或非線性內插來求出增益波形。如此,隨著內插模式資訊,適宜藉由非線性內插來獲得增益波形,就可以較少編碼量而高精度地重現增益波形。
此外,於以上係說明了,對每一增益樣本位置生成內插模式資訊,切換線性內插或非線性內插的例子,但亦可以1音框來生成1個內插模式資訊。此情況下,變成以音框單位來切換線性內插與非線性內插。
又,亦可以複數音框單位、或1檔案單位,來切換線性內插與非線性內插。例如以檔案單位來進行內插方式之切換時,例如在位元串流之標頭中儲存1個內插模式資訊。然後,內插處理部71,係以該內插模式資訊所表示之內插方式,亦即以線性內插或非線性內插之任一方式來進行各音框之內插處理,求出1檔案份的增益波形。
順便一提,非線性內插所得到的增益波形,係和線性內插所得到的增益波形不同,在2個增益樣本位置間之樣本位置上,會是比增益編碼列中所含之2個增益樣本位置之增益值還大、或還小的值。
例如在圖3所示的例子中,非線性內插所得之、曲線C21所表示之增益波形之一部分中,係為比增益樣本位置G11之增益值g[k]還小之增益值的部分。又,曲
線C21所表示之增益波形之一部分中,也有比增益樣本位置G12之增益值g[k+1]還大之增益值的部分。
因此,非線性內插所得到的增益值,有時候會是不適合當作增益值的負(minus)之值。於是,為了防止內插所得之增益值變成不適切的值,亦可藉由進行下式(11)之計算,對增益值進行以0為下限值的限制。
【數11】g_interpolated[n]=max(0,g_interpolated[n])‧‧‧(11)
在式(11)中,內插所求出的增益值g_interpolated[n]和0之中較大者,係成為最終的增益值g_interpolated[n]。因此,最終的增益值會是0以上之值,增益值不會變成負的值。
又,會有想要藉由增益調整(音量補正),來增幅(boost)時間序列訊號的情況、和壓抑(compress)時間序列訊號的情況。
例如欲將時間序列訊號予以增幅的時候,若增益值是小於1的值,則該增益值係為不適切的值。於是,令時間序列訊號增幅時,亦可藉由進行下式(12)之計算,而對增益值進行以1為下限值的限制。
【數12】g_interpolated[n]=max(1,g_interpolated[n])‧‧‧(12)
在式(12)中,內插所求出的增益值g_interpolated[n]和1之中較大者,係成為最終的增益值g_interpolated[n]。因此,增益值不會變成未滿1之值。換言之,增益值必定為下限值1以上之值。
再者,例如欲將時間序列訊號予以壓抑的時候,若增益值是大於1的值,則該增益值係為不適切的值。於是,令時間序列訊號壓抑時,亦可藉由進行下式(13)之計算,而對增益值進行以1為上限值的限制。
【數13】g_interpolated[n]=min(1,g_interpolated[n])‧‧‧(13)
在式(13)中,內插所求出的增益值g_interpolated[n]和1之中較小者,係成為最終的增益值g_interpolated[n]。因此,增益值不會變成大於1之值。換言之,增益值必定為上限值1以下之值。
式(12)或式(13)所示的限制處理被進行時,作為已被編碼之增益波形的相關之資訊,是只要將表示係為用來將增益波形予以增幅所需、還是壓抑所需的限制資訊,給予至增益解碼電路63即可。例如,限制資訊,係可從上位之控制裝置供給至增益解碼電路63,也可在增益編碼列或位元串流之標頭等中包含限制資訊。
以下假設是在增益編碼列中包含有限制資訊來繼續說明。此情況下,在圖5之步驟S13之處理中,會
生成含有限制資訊的增益編碼列。
藉由如以上對增益值實施限制處理,就可獲得較適切的增益值。藉此,較適切之增益調整(音量補正)係成為可能,其結果為,可獲得較高音質之聲音。
對增益值實施限制處理時,解碼裝置51係被構成為例如圖10所示。此外,圖10中,和圖7對應的部份,係標示同一符號,並適宜地省略其說明。
圖10所示的解碼裝置51之構成,係在對增益解碼電路63新設置了限制處理部101這點上,是與圖7之解碼裝置51不同,其他構成係和圖7之解碼裝置51相同構成。
限制處理部101,係對於藉由內插處理部71進行非線性內插而被算出的增益值,實施限制處理,成為最終的增益值。
接著說明,解碼裝置51是圖10所示的構成時所進行的增益解碼處理。
例如,在解碼裝置51中,進行參照圖8所說明過的解碼處理。但是,對應於步驟S43的增益解碼處理中,是進行圖11所示的增益解碼處理。以下,參照圖11的流程圖,說明圖10的解碼裝置51所致之增益解碼處
理。
此外,步驟S101乃至步驟S105之處理,係和圖9之步驟S71乃至步驟S75之處理相同,因此省略其說明。
於步驟S106中,限制處理部101,係對步驟S105之處理所得到的各樣本位置之增益值,進行上述式(11)之計算,以適宜變更增益值,使得增益值不會被成負值。
然後,限制處理部101,係對藉由式(11)之計算而被限制的增益值,再隨應於增益編碼列中所含之限制資訊,進行式(12)或式(13)之任一計算,以成為最終的增益值。
具體而言,若表示增益編碼列中所含之限制資訊係為增幅所需,則限制處理部101係藉由進行式(12)之計算,以使增益值不會變成未滿1之值。
相對於此,若表示增益編碼列中所含之限制資訊係為壓抑所需,則限制處理部101係藉由進行式(13)之計算,以使增益值不會變成大於1之值。
於步驟S104中藉由線性內插來生成增益波形,或於步驟S106中進行限制處理,則步驟S107的處理就被進行而結束增益解碼處理,但步驟S107之處理是和圖9的步驟S76之處理相同,因此省略其說明。
如以上,解碼裝置51,係對非線性內插所求出的增益值,實施限制處理。藉此,可以較適切的增益
值,來進行增益調整(音量補正)。因此,可獲得較高音質之聲音。
又,於以上說明中,雖然說明了針對每一增益樣本位置來切換以線性內插或非線性內插之任一內插方式來進行增益值之內插而獲得增益波形的例子,但亦可為,基本上是進行非線性內插,只有在特定條件下才會進行線性內插。
例如,考慮將圖12所示的折線L41所示之增益波形予以編碼,於解碼側上,以非線性內插獲得增益波形的情形。此外,於圖12中縱軸及橫軸係分別表示增益值、及樣本位置。
於編碼裝置11中,第k個增益樣本位置G21、和第k+1個增益樣本位置G22會被抽出,獲得含有這些增益樣本位置上之增益值、樣本長、及增益斜率值的增益編碼列。
此處,箭頭D21係表示增益樣本位置G21之增益斜率值s[k],箭頭D22係表示增益樣本位置G22之增益斜率值s[k+1]。
現在,假設在解碼裝置51中,基於增益編碼列中所含之增益值、樣本長、及增益斜率值而進行3次函數所致之非線性內插,獲得曲線C31所示之增益波形。
在此例子中,非線性內插所得到的曲線C31所示之增益波形、和折線L41所示的原本的增益波形之差分,係會變大。
在以非線性內插而求出增益波形的方式中,如此例所示,若對於增益值呈線性變化的增益波形進行編碼,則原本的增益波形和解碼時進行非線性內插而得的增益波形之差分會變大。
為了縮小該差分,需要在編碼裝置11中,將欲編碼的增益值和增益斜率值,算出非線性內插所得之增益波形而進行調整等之處理(本地解碼),而會導致編碼之處理量增加。
於是,在本技術中,在解碼裝置51中進行非線性內插的情況下,藉由在特定條件下會進行線性內插,就可以較少的編碼之處理量而較高精度地重現增益波形。
具體而言,例如藉由內插而求出第k個與第k+1個增益樣本位置之間的樣本位置之增益值的情況下,從這些增益樣本位置之增益值和增益斜率值,求出2個直線l[k]與直線l[k+1]之交點X[k,k+1]。
此處,直線l[k]係為,通過增益波形上的第k個增益樣本位置(點),具有增益斜率值s[k]所表示之斜率的直線。亦即,直線l[k],係當樣本軸方向之座標之值是和第k個增益樣本位置為相同值時,作為增益軸方向之座標之值是取第k個增益樣本位置之增益值g[k],且為具有增益斜率值s[k]所表示之斜率的直線。
同樣地直線l[k+1]係為,通過第k+1個增益樣本位置,具有增益斜率值s[k+1]所表示之斜率的直線。
然後,判定第k個或第k+1個增益樣本位置之其中任一者,和所被求出之交點X[k,k+1]之距離,是否為所定之閾值以下。此處之判定係為,例如以下的式(14)是否成立。
【數14】((d_sample[k]≦thre_sample)&&(d_gain[k]≦thre_gain))||((d_sample[k+1]≦thre_sample)&&(d_gain[k+1]≦thre_gain))‧‧‧(14)
此外,於式(14)中,d_sample[k]及d_sample[k+1]係分別表示,從第k個及第k+1個增益樣本位置起算,到交點X[k,k+1]的樣本軸方向之距離。又,d_gain[k]及d_gain[k+1]係分別表示,從第k個及第k+1個增益樣本位置起算,到交點X[k,k+1]的增益軸方向之距離,亦即增益值之差。
然後,thre_sample及thre_gain係分別表示,樣本軸方向之距離之閾值、及增益軸方向之距離之閾值。
因此,在式(14)中,距離d_sample[k]係為閾值thre_sample以下,且距離d_gain[k]係為閾值thre_gain以下時,或距離d_sample[k+1]係為閾值thre_sample以下,且距離d_gain[k+1]係為閾值thre_gain以下時,從增益樣本位置到交點X[k,k+1]為止之距離,就會是閾值以
下。
例如第k個增益樣本位置是音框之開頭位置,亦即第n=0個樣本位置時,則式(14)中的距離d_sample[k]、距離d_gain[k]、距離d_sample[k+1]、及距離d_gain[k+1],係分別由以下的式(15)乃至式(18)而求出。又,閾值thre_sample及閾值thre_gain,係設成例如閾值thre_sample=32,及閾值thre_gain=0.01等。
【數15】d_sample[k]=abs((g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1]))‧‧‧(15)
【數16】d_gain[k]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1]))‧‧‧(16)
【數17】d_sample[k+1]=abs((g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])-T[k])‧‧‧(17)
【數18】d_gain[k+1]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])+g[k]-g[k+1])‧‧‧(18)
此外,式(15)乃至式(18)中,abs(x)係表示求出x之絕對值。
若如此式(14)所示的條件式被判定為成立時,則藉由線性內插,亦即上述式(1)之計算,而求出增益波形。相對於此,若如此式(14)所示的條件式被判定為不成
立時,則藉由非線性內插,亦即上述式(4)之計算,而求出增益波形。
例如圖13所示,增益樣本位置G31、與增益樣本位置G32之間的各樣本位置之增益值是以內插而被求出的情況下,式(14)所示的條件式成立與否,係特定出交點CP11是否被包含在領域TR11或領域TR12之任一者中。此外,於圖13中縱軸及橫軸係分別表示增益值、及時間序列訊號之音框內的樣本位置。
在圖13中,增益樣本位置G31係表示第k個增益樣本位置,箭頭D31係表示增益樣本位置G31之增益斜率值s[k]。因此,直線L51係為直線l[k]。
同樣地增益樣本位置G32係表示第k+1個增益樣本位置,箭頭D32係表示增益樣本位置G32之增益斜率值s[k+1]。因此,直線L52係為直線l[k+1]。然後,直線L51和直線L52之交點亦即交點CP11係為交點X[k,k+1]。
現在,假設領域TR11,係以增益樣本位置G31為中心,且圖中,縱方向及橫方向之長度,係分別為2×thre_gain及2×thre_sample。同樣地,假設領域TR12,係以增益樣本位置G32為中心,且圖中,縱方向及橫方向之長度,係分別為2×thre_gain及2×thre_sample。
此時,交點CP11是位於領域TR11內,或交點CP11是位於領域TR12內的情況下,式(14)所示的條件式就會成立。圖13的例子中,交點CP11是位於領域
TR12內,因此式(14)所示的條件式係成立。
在圖13所示的例子中,欲重現(復原)的原本的增益波形,係應該是接近於由直線L51和直線L52所成之波形的波形才對。亦即,更詳言之,從增益樣本位置G31至交點CP11為止之間係為接近直線L51的波形,從交點CP11至增益樣本位置G32為止之間係為接近直線L52的波形才對。
可是,在此例子中由於交點CP11是位於領域TR12內,因此交點CP11與增益樣本位置G32之距離是非常短,原本的增益波形是可取近似成為增益樣本位置G31與增益樣本位置G32所連結之直線。
此情況下,增益樣本位置G31與增益樣本位置G32之間的增益波形中,由於可使增益值呈現幾乎線性變化,因此與其以非線性內插來求出增益波形,不如以線性內插來求出,可以較高精度地重現增益波形。於是,在本技術中當上述式(14)所示的條件式成立時,則藉由線性內插來求出增益波形。
因此,在圖13的例子中,增益樣本位置G31與增益樣本位置G32之間的各樣本位置之增益值係藉由線性內插而被求出,藉此而獲得例如圖14所示之增益波形。此外,圖14中,和圖13對應的部份,係標示同一符號,並適宜地省略其說明。
在圖14中,增益樣本位置G31和增益樣本位置G32所連結之直線L61,係被當成這些增益樣本位置
G31與增益樣本位置G32之間的增益波形而被求出。
又,例如上述的圖12所示的例子中,式(14)所示的條件式也成立,因此藉由線性內插而求出增益波形。
在圖12的例子中,由於交點X[k,k+1]是在增益樣本位置G22之位置因此式(14)係成立,增益樣本位置G21和增益樣本位置G22所連結之直線,係成為這些增益樣本位置間之增益波形。因此,在此例子中,原本的增益波形係被正確重現。
藉由如以上所示,在特定條件下進行線性內插,基本上係進行非線性內插的情況下,不會增加編碼之處理量,可較縮小原本的增益波形與解碼後之增益波形的差分。
而且,若為此種解碼方式,則僅藉由進行非線性內插的內插方式,就可對應線性及非線性之雙方之內插,因此不必在增益編碼列中包含內插模式資訊,可降低輸出編碼列之位元速率。亦即,可較為減少輸出編碼列之編碼量。
於特定條件下進行線性內插時,解碼裝置51係被構成例如圖15所示。此外,圖15中,和圖7對應的部份,係標示同一符號,並適宜地省略其說明。
圖15所示的解碼裝置51之構成,係在對增
益解碼電路63新設置了演算部131這點上,是與圖7之解碼裝置51不同,其他構成係和圖7之解碼裝置51相同構成。
演算部131,係計算上述式(14)所示的條件式。
接著說明,解碼裝置51是圖15所示的構成時所進行的增益解碼處理。
例如在編碼裝置11中,會進行參照圖5所說明的編碼處理,但在步驟S13之增益編碼處理中,會生成僅含增益資訊,不含內插模式資訊的增益編碼列,多工化所得到的輸出編碼列會被輸出。又,此情況下,增益資訊中係總是含有增益斜率值。
然後在解碼裝置51中,進行參照圖8所說明過的解碼處理。但是,對應於步驟S43的增益解碼處理中,是進行圖16所示的增益解碼處理。以下,參照圖16的流程圖,說明圖15的解碼裝置51所致之增益解碼處理。
此外,步驟S131之處理,係和圖9之步驟S71之處理相同,因此省略其說明。
於步驟S132中,演算部131係基於已被讀出的增益資訊,來計算式(14)所示的條件式。
亦即,演算部131係基於作為增益資訊而被
讀出的增益樣本位置之增益值、樣本長、及增益斜率值,來進行和上述式(15)乃至式(18)相同之計算。然後,演算部131係基於其結果所得之增益樣本位置至交點X[k,k+1]為止之距離來計算式(14)。
如此,進行式(15)乃至式(18)之計算,係為求出直線l[k]及直線l[k+1],並且求出這些直線之交點X[k,k+1],然後求出第k個及第k+1個增益樣本位置之每一者的增益值、與交點X[k,k+1]之增益值的差。然後,計算式(14)之條件式,係為判定增益樣本位置與交點X[k,k+1]之增益值之差是否為所定之閾值以下。
因此,在解碼裝置51中,係可隨應於增益樣本位置之增益值、和交點X[k,k+1]之增益值之差,藉由線性內插或非線性內插而求出2個增益樣本位置間之各樣本位置之增益值。
於步驟S133中,內插處理部71,係基於步驟S132中的條件式之計算結果,來判定是否進行線性內插。例如式(14)所表示之條件式成立時,判定為要進行線性內插。
於步驟S133中判定為要進行線性內插時,於步驟S134中,內插處理部71係進行線性內插而生成增益波形,其後,處理係前進至步驟S136。在步驟S134中,進行和圖9之步驟S74之處理相同之處理。
相對於此,於步驟S133中判定為不要進行線性內插時,於步驟S135中,內插處理部71係進行非線性
內插而生成增益波形,其後,處理係前進至步驟S136。此外,在步驟S135中,進行和圖9之步驟S75之處理相同之處理。
於步驟S134或步驟S135中,一旦生成增益波形,則步驟S136之處理會被進行而結束增益解碼處理,但步驟S136之處理係和圖9之步驟S76之處理相同,因此省略其說明。
如以上,解碼裝置51,係在特定條件下,藉由線性內插來生成增益波形。藉此,可以較少的處理量,較高精度地獲得原本的增益波形,同時,可使輸出編碼列之編碼量較為減少。
此外,在第3實施形態中,雖然說明在特定條件下進行線性內插,但亦可利用增益樣本位置與交點而將增益值進行線性內插。
亦即,在第3實施形態中,2個增益樣本位置間之各樣本位置之增益值,係藉由式(1)所致之線性內插而被算出。在該實施形態中,是取而代之,如圖17所示,2個直線L51及直線L52之交點CP11、和2個各增益樣本位置所連結的各個直線所成之波形,係成為線性內插所得到的增益波形。此外,圖17中,和圖13對應的部份,係標示同一符號,並適宜地省略其說明。
在此例子中,增益樣本位置G31和交點CP11所連結之直線,及增益樣本位置G32和交點CP11所連結之直線所成之折線L71,係成為增益樣本位置G31與增益樣本位置G32之間的增益波形。
在圖17所示之增益波形的例子中,若試圖要較為正確地重現增益波形,在以2個增益樣本位置所連結之直線進行線性內插的情況下,在增益波形之編碼時從增益樣本位置G31到增益樣本位置G32為止之區間中,必須要將增益樣本位置之數目設成3個以上。
亦即,在增益波形之編碼時,如果不將增益樣本位置G31、交點CP11、及增益樣本位置G32之樣本位置當作增益樣本位置,則編碼前之增益波形、和解碼所得之增益波形之差分(誤差),就會產生。
相對於此,利用交點CP11,將折線L71當作增益波形時,只需將增益樣本位置G31與增益樣本位置G32之2個位置當作增益樣本位置,就可使得編碼前之增益波形、和解碼所得之增益波形之差分縮小。因此,利用交點來進行線性內插的手法中,可減少增益樣本位置之數目,藉此可抑制輸出編碼列之位元速率較低,可提升編碼效率。
此外,利用交點來進行線性內插時,2個直線之交點,必須要位於2個增益樣本位置之間。
例如在圖17的例子中,在樣本軸方向上,交點CP11必須要位於增益樣本位置G31與增益樣本位置
G32之間。
因此,要進行非線性內插、或是進行線性內插之判定時所被使用的領域,係和圖13之例子與圖17之例子不同。在圖17的例子中,交點CP11是被領域TR21或領域TR22之任一者所包含時,會進行利用交點的線性內插。
此處,領域TR21係為圖13所示之領域TR11之右半部分之領域,亦即比領域TR11之中的增益樣本位置G31還要位於圖13中右側的領域。同樣地,領域TR22係為圖13所示之領域TR12之左半部分之領域,亦即比領域TR12之中的增益樣本位置G32還要位於圖13中左側的領域。
如此,利用交點的線性內插被進行時,對應於式(14)的條件式,係如下式(19)所示。亦即,下式(19)成立時,進行利用交點的線性內插。
【數19】((0<d_sample[k])&&(d_sample[k]≦thre_sample)&&(d_gain[k]≦thre_gain))||((0<d_sample[k+1])&&(d_sample[k+1]≦thre_sample)&&(d_gain[k+1]≦thre_gain))‧‧‧(19)
在式(19)中距離d_sample[k]係大於0而為閾值thre_sample以下,且距離d_gain[k]為閾值thre_gain以下時,或距離d_sample[k+1]係大於0而為閾值
thre_sample以下,且距離d_gain[k+1]為閾值thre_gain以下時,從增益樣本位置至交點X[k,k+1]為止之距離,就會是閾值以下。
例如第k個增益樣本位置是音框之開頭位置,亦即第n=0個樣本時,則式(19)中的距離d_sample[k]、距離d_gain[k]、距離d_sample[k+1]、及距離d_gain[k+1],係分別由以下的式(20)乃至式(23)而求出。
【數20】d_sample[k]=(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])‧‧‧(20)
【數21】d_gain[k]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1]))‧‧‧(21)
【數22】d_sample[k+1]=T[k]-(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])‧‧‧(22)
【數23】d_gain[k+1]=abs(s[k]×(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])+g[k]-g[k+1])‧‧‧(23)
若如此式(19)所示的條件式被判定為不成立時,則藉由非線性內插,亦即上述式(4)之計算,而求出增益波形。
相對於此,若如此式(19)所示的條件式被判定
為成立時,則藉由線性內插而求出增益波形。
例如第k個增益樣本位置是音框之開頭位置,亦即第n=0個樣本位置的情況下,若令交點X[k,k+1]之樣本位置,亦即從第k個增益樣本位置至交點X[k,k+1]為止之樣本長為T’[k],則樣本位置T’[k]係藉由下式(24)而被求出。
【數24】T’[k]=(g[k+1]-g[k]-s[k+1]×T[k])/(s[k]-s[k+1])‧‧‧(24)
又,位於第k個增益樣本位置、和交點X[k,k+1]之間的,位於從音框開頭起第n個(其中,0≦n<T’[k])的樣本n之增益值g_interpolated[n],係藉由下式(25)而被算出。
【數25】g_interpolated[n]=a1[k]×n+b1[k] (0≦n<T’[k])‧‧‧(25)
此外,於式(25)中,a1[k]及b1[k]係分別為藉由以下的式(26)及式(27)而被求出的值。
【數26】a1[k]=s[k]‧‧‧(26)
【數27】b1[k]=g[k]‧‧‧(27)
a1[k]及b1[k]係表示第k個增益樣本位置與交點X[k,k+1]所連結之直線之斜率及切片。因此,在此例子中,如參照圖17所說明,在第k個增益樣本位置G31與交點CP11之間,增益值被視為呈線性變化,會藉由線性內插而求出各樣本n之增益值。
再者,位於交點X[k,k+1]與第k+1個增益樣本位置之間的,位於從音框開頭起第n個(其中,T’[k]≦n<T[k])的樣本n之增益值g_interpolated[n],係藉由下式(28)而被算出。
【數28】g_interpolated[n]=a2[k]×n+b2[k] (T’[k]≦n<T[k])‧‧‧(28)
此外,於式(28)中,a2[k]及b2[k]係分別為藉由以下的式(29)及式(30)而被求出的值。
【數29】a2[k]=s[k+1]‧‧‧(29)
【數30】b2[k]=g[k+1]-s[k+1]×T[k]‧‧‧(30)
a2[k]及b2[k]係表示,交點X[k,k+1]與第k+1
個增益樣本位置所連結之直線之斜率及切片。因此,在此例子中,如參照圖17所說明,在交點CP11與第k+1個增益樣本位置G32之間,增益值被視為呈線性變化,會藉由線性內插而求出各樣本n之增益值。
如以上在特定條件下進行利用交點的線性內插時,在參照圖16所說明的增益解碼處理中,於步驟S132中,演算部131係基於已讀出之增益資訊,來計算式(19)所示的條件式。
然後,若式(19)所示的條件式成立時,則於驟S134中,內插處理部71係基於作為增益資訊而被讀出的增益樣本位置之增益值、樣本長、及增益斜率值,藉由式(24)而算出交點X[k,k+1]之樣本位置T’[k]。然後,內插處理部71,係使用所得的樣本位置T’[k]來進行式(25)及式(28)之計算,藉由線性內插而生成增益波形。
相對於此,若式(19)所示的條件式不成立,則於步驟S135中,內插處理部71係進行非線性內插而生成增益波形。
如此,於特定條件下進行利用交點的線性內插,就不會增加編碼時之處理量,可縮小編碼前之原本的增益波形、和解碼所得之增益波形之差分。
又,僅進行非線性內插的方式,就可對應線性及非線性之雙方之內插,因此不必在增益編碼列中包含內插模式資訊,可降低輸出編碼列之位元速率。亦即,可較為減少輸出編碼列之編碼量。
再者,在第3實施形態及第3實施形態之變形例1中係說明了,增益編碼列中不含內插模式資訊,基本上係進行非線性內插。
可是,亦可為在增益編碼列中含有內插模式資訊,基本上係藉由內插模式資訊所示之內插方式來求出增益波形,但若內插模式資訊所示之內插方式是非線性內插所致之方式時,則於特定條件下進行線性內插。
如此情況下,在解碼裝置51中,進行參照圖8所說明過的解碼處理。但是,對應於步驟S43的增益解碼處理中,是進行圖18所示的增益解碼處理。以下,參照圖18的流程圖,說明圖15的解碼裝置51所致之增益解碼處理。
此外,步驟S161乃至步驟S164之處理,係和圖9之步驟S71乃至步驟S74之處理相同,因此省略其說明。
於步驟S163中,若判定為是非線性內插所致之方式,則於步驟S165中,演算部131係基於已被讀出的增益資訊,來計算式(14)所示的條件式。
然後,其後,會進行步驟S166乃至步驟S168之處理,但這些處理係和圖16之步驟S133乃至步驟S135之處理相同,因此省略其說明。此外,在步驟S165
乃至步驟S168中,亦可進行第3實施形態所說明的處理,或可進行第3實施形態之變形例1中所說明之處理。再者,在非線性內插進行時,係亦可進行限制處理。
步驟S164、步驟S167、或步驟S168中一旦藉由內插而生成增益波形,則其後,處理係前進至步驟S169。
於步驟S169中,增益解碼電路63係判定是否已將所有的增益樣本位置當作處理對象而處理。
於步驟S169中,若判斷為尚未處理所有的增益樣本位置,則處理係返回步驟S161,重複上述處理。
相對於此,於步驟S169中,若判定為已經處理所有的增益樣本位置,則增益解碼電路63係將目前為止之處理所得到的各樣本位置的增益值所成之1音框份的增益波形,供給至增益適用電路64,增益解碼處理係結束。一旦增益解碼處理結束,則其後,處理係往圖8的步驟S44前進。
如以上,解碼裝置51,係隨應於內插模式資訊而藉由線性內插或非線性內插來求出增益波形。如此,隨著內插模式資訊,適宜藉由非線性內插來獲得增益波形,就可以較少編碼量而高精度地重現增益波形。
而且,即使內插模式資訊所示之內插方式是非線性內插所致之方式的情況下,仍藉由在特定條件下進行線性內插,就可以較少之編碼處理量,較高精度地重現原本之增益波形。又,可較為減少輸出編碼列之編碼量。
順便一提,上述一連串處理,係可藉由硬體來執行,也可藉由軟體來執行。在以軟體來執行一連串之處理時,構成該軟體的程式,係可安裝至電腦。此處,電腦係包含:被組裝在專用硬體中的電腦,或藉由安裝各種程式而可執行各種機能的例如通用之電腦等。
圖19係以程式來執行上述一連串處理的電腦的硬體之構成例的區塊圖。
於電腦中,CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503,係藉由匯流排504而被彼此連接。
在匯流排504上係還連接有輸出入介面505。輸出入介面505上係連接有:輸入部506、輸出部507、記錄部508、通訊部509、及驅動機510。
輸入部506,係由鍵盤、滑鼠、麥克風、攝像元件等所成。輸出部507係由顯示器、揚聲器等所成。記錄部508,係由硬碟或非揮發性記憶體等所成。通訊部509係由網路介面等所成。驅動機510係驅動:磁碟、光碟、光磁碟、或半導體記憶體等之可移除式媒體511。
在如以上構成的電腦中,藉由CPU501而例如將記錄部508中所記錄之程式透過輸出入介面505及匯流排504,而載入至RAM503裡並加以執行,就可進行上述一連串處理。
電腦(CPU501)所執行的程式,係可記錄在例如封裝媒體等之可移除式媒體511中而提供。又,程式係
可透過區域網路、網際網路、數位衛星播送這類有線或無線的傳輸媒體而提供。
在電腦中,程式係藉由將可移除式媒體511裝著至驅動機510,就可透過輸出入介面505,安裝至記錄部508。又,程式係可透過有線或無線之傳輸媒體,以通訊部509接收之,安裝至記錄部508。除此以外,程式係可事前安裝在ROM502或記錄部508中。
此外,電腦所執行的程式,係可為依照本說明書所說明之順序而在時間序列上進行處理的程式,也可平行地,或呼叫進行時等必要之時序上進行處理的程式。
又,本技術的實施形態係不限定於上述實施形態,在不脫離本技術主旨的範圍內可做各種變更。
例如,本技術係亦可將1個機能透過網路而分擔給複數台裝置,採取共通進行處理的雲端運算之構成。
又,上述的流程圖中所說明的各步驟,係可由1台裝置來執行以外,亦可由複數台裝置來分擔執行。
甚至,若1個步驟中含有複數處理的情況下,該1個步驟中所含之複數處理,係可由1台裝置來執行以外,也可由複數台裝置來分擔執行。
又,本說明書中所記載之效果僅為例示並非限定,亦可還有其他的效果。
甚至,本技術係亦可採取以下構成。
(1)
一種解碼裝置,係具備:增益讀出部,係將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值,予以讀出;和內插資訊讀出部,係讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;和內插處理部,係基於前記增益樣本位置的前記增益值,將位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
(2)
如(1)所記載之解碼裝置,其中,前記增益讀出部係還讀出,表示前記增益樣本位置上的前記增益值之斜率的增益斜率值;前記內插處理部,係在以非線性內插來求出前記增益值的情況下,基於前記增益樣本位置的前記增益值及前記增益斜率值,求出位於前記2個前記增益樣本位置之間的各樣本位置的前記增益值。
(3)
如(1)或(2)所記載之解碼裝置,其中,還具備:限制處理部,係以使得前記增益值會變成所定之下限值以上之值或所定之上限值以下之值的方式,對以非線性內插而被求出之前記增益值,實施限制處理。
(4)
如(3)所記載之解碼裝置,其中,前記限制處理部係實施,以0為下限值的限制處理、以1為下限值的限制處理、或以1為上限值的限制處理。
(5)
如(2)乃至(4)之任一項所記載之解碼裝置,其中,還具備:演算部,係於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對前記2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;前記內插處理部,係若前記內插資訊是表示要以線性內插來求出前記增益值的資訊,則以線性內插來求出前記增益值,若前記內插資訊是表示要以非線性內插來求出前記增益值的資訊,則隨應於前記差而用非線性內插或線性內插來求出前記增益值。
(6)
一種解碼方法,係含有以下步驟:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值予以讀出;讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;基於前記增益樣本位置的前記增益值,將位於前記時
間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
(7)
一種程式,係令電腦執行包含以下步驟之處理:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值予以讀出;讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;基於前記增益樣本位置的前記增益值,將位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
(8)
一種解碼裝置,係具備:增益讀出部,係將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;和演算部,係於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予
以求出;和內插處理部,係隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
(9)
一種解碼方法,係含有以下步驟:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
(10)
一種程式,係令電腦執行包含以下步驟之處理:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜
率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
Claims (8)
- 一種解碼裝置,係具備:增益讀出部,係將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;和演算部,係基於2個前記增益樣本位置的前記增益值及前記增益斜率值,而求出位於2個前記增益樣本位置之間的交點的增益樣本位置;和內插處理部,係將含有前記交點的位於前記時間序列訊號之前記2個前記增益樣本位置之間的前記增益值,用線性內插或非線性內插來加以求出。
- 如請求項1所記載之解碼裝置,其中,還具備:內插資訊讀出部,係讀出內插資訊,其係表示,前記時間序列訊號之各樣本位置的前記增益值是要用線性內插來加以求出,還是要以非線性內插來加以求出;前記內插處理部,係基於前記增益樣本位置的前記增益值,將位於前記時間序列訊號之2個前記增益樣本位置之間的各樣本位置的前記增益值,隨應於前記內插資訊而用線性內插或非線性內插來加以求出。
- 如請求項1所記載之解碼裝置,其中,前記增益讀出部係還讀出,表示前記增益樣本位置上的前記增益值之斜率的增益斜率值;前記內插處理部,係在以非線性內插來求出前記增益值的情況下,基於前記增益樣本位置的前記增益值及前記增益斜率值,求出位於前記2個前記增益樣本位置之間的各樣本位置的前記增益值。
- 如請求項1所記載之解碼裝置,其中,還具備:限制處理部,係以使得前記增益值會變成所定之下限值以上之值或所定之上限值以下之值的方式,對以非線性內插而被求出之前記增益值,實施限制處理。
- 如請求項4所記載之解碼裝置,其中,前記限制處理部係實施以0為下限值的限制處理、以1為下限值的限制處理、或以1為上限值的限制處理。
- 如請求項3所記載之解碼裝置,其中,還具備:演算部,係於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對前記2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;前記內插處理部,係若前記內插資訊是表示要以線性內插來求出前記增益值的資訊,則以線性內插來求出前記增益值,若前記內插資訊是表示要以非線性內插來求出前記增益值的資訊,則隨應於前記差而用非線性內插或線性內插來求出前記增益值。
- 一種解碼方法,係含有以下步驟:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
- 一種程式,係令電腦執行包含以下步驟之處理:將時間序列訊號之至少2個增益樣本位置的已被編碼之增益值、及表示前記增益值之斜率的增益斜率值,予以讀出;於前記增益樣本位置上,取該前記增益樣本位置的前記增益值,且求出具有該前記增益樣本位置之前記增益斜率值所表示之斜率的直線,並將針對2個前記增益樣本位置而分別求出之前記直線之交點的增益值、與前記2個前記增益樣本位置之各者的前記增益值的差,予以求出;隨應於前記差,而將位於前記時間序列訊號之前記2個前記增益樣本位置之間的各樣本位置的前記增益值,用線性內插或非線性內插來加以求出。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-272943 | 2013-12-27 | ||
JP2013272943 | 2013-12-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201537560A TW201537560A (zh) | 2015-10-01 |
TWI644308B true TWI644308B (zh) | 2018-12-11 |
Family
ID=53478428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103143688A TWI644308B (zh) | 2013-12-27 | 2014-12-15 | Decoding device and method, and program |
Country Status (14)
Country | Link |
---|---|
US (3) | US10692511B2 (zh) |
EP (2) | EP3608909B1 (zh) |
JP (4) | JP6593173B2 (zh) |
KR (3) | KR102356012B1 (zh) |
CN (1) | CN105849801B (zh) |
AU (1) | AU2014371411A1 (zh) |
BR (1) | BR112016014476B1 (zh) |
CA (2) | CA3162763A1 (zh) |
MX (1) | MX2016008172A (zh) |
MY (1) | MY188538A (zh) |
RU (2) | RU2764260C2 (zh) |
SG (1) | SG11201605015XA (zh) |
TW (1) | TWI644308B (zh) |
WO (1) | WO2015098564A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
IN2015MN01766A (zh) | 2013-01-21 | 2015-08-28 | Dolby Lab Licensing Corp | |
IL287218B (en) | 2013-01-21 | 2022-07-01 | Dolby Laboratories Licensing Corp | Audio encoder and decoder with program loudness and boundary metada |
EP2959479B1 (en) | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109903776B (zh) | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110675884B (zh) | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
AU2014371411A1 (en) * | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
EP3518236B8 (en) | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
CN110312146B (zh) * | 2019-06-06 | 2021-11-09 | 百度在线网络技术(北京)有限公司 | 音频处理方法、装置、电子设备和存储介质 |
KR20190085889A (ko) | 2019-06-28 | 2019-07-19 | 신원제 | 태양광 패널 청소기 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US20100083344A1 (en) * | 2008-09-30 | 2010-04-01 | Dolby Laboratories Licensing Corporation | Transcoding of audio metadata |
Family Cites Families (230)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4817151A (en) * | 1987-11-09 | 1989-03-28 | Broadcast Technology Partners | Selective decoder for compatible FM stereophonic system utilizing companding of difference signal |
JPH0364800A (ja) | 1989-08-03 | 1991-03-20 | Ricoh Co Ltd | 音声符号化及び復号化方式 |
JPH03254223A (ja) | 1990-03-02 | 1991-11-13 | Eastman Kodak Japan Kk | アナログデータ伝送方式 |
JP3137805B2 (ja) * | 1993-05-21 | 2001-02-26 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法 |
US6022222A (en) * | 1994-01-03 | 2000-02-08 | Mary Beth Guinan | Icon language teaching system |
JP2655485B2 (ja) * | 1994-06-24 | 1997-09-17 | 日本電気株式会社 | 音声セル符号化装置 |
JP3498375B2 (ja) | 1994-07-20 | 2004-02-16 | ソニー株式会社 | ディジタル・オーディオ信号記録装置 |
JP3189598B2 (ja) | 1994-10-28 | 2001-07-16 | 松下電器産業株式会社 | 信号合成方法および信号合成装置 |
US5640490A (en) * | 1994-11-14 | 1997-06-17 | Fonix Corporation | User independent, real-time speech recognition system and method |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5749064A (en) * | 1996-03-01 | 1998-05-05 | Texas Instruments Incorporated | Method and system for time scale modification utilizing feature vectors about zero crossing points |
JPH1020888A (ja) | 1996-07-02 | 1998-01-23 | Matsushita Electric Ind Co Ltd | 音声符号化・復号化装置 |
US6073100A (en) | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CN1144179C (zh) | 1997-07-11 | 2004-03-31 | 索尼株式会社 | 声音信号解码方法和装置、声音信号编码方法和装置 |
US5913194A (en) * | 1997-07-14 | 1999-06-15 | Motorola, Inc. | Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system |
JPH11168622A (ja) * | 1997-12-05 | 1999-06-22 | Canon Inc | 画像処理装置、画像処理方法および記憶媒体 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP3696091B2 (ja) | 1999-05-14 | 2005-09-14 | 松下電器産業株式会社 | オーディオ信号の帯域を拡張するための方法及び装置 |
JP4218134B2 (ja) * | 1999-06-17 | 2009-02-04 | ソニー株式会社 | 復号装置及び方法、並びにプログラム提供媒体 |
US6904405B2 (en) * | 1999-07-17 | 2005-06-07 | Edwin A. Suominen | Message recognition using shared language model |
JP3454206B2 (ja) | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
AU2000231602A1 (en) * | 2000-02-24 | 2001-09-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | System for estimating a non-linear characteristic of an amplifier |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP2002268698A (ja) | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
JP4231987B2 (ja) | 2001-06-15 | 2009-03-04 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体 |
JP2004521394A (ja) | 2001-06-28 | 2004-07-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 広帯域信号伝送システム |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
MXPA03002115A (es) | 2001-07-13 | 2003-08-26 | Matsushita Electric Ind Co Ltd | DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO. |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
JP3926726B2 (ja) | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
EP1701340B1 (en) | 2001-11-14 | 2012-08-29 | Panasonic Corporation | Decoding device, method and program |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US7013011B1 (en) * | 2001-12-28 | 2006-03-14 | Plantronics, Inc. | Audio limiting circuit |
CN1288625C (zh) | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
JP3815347B2 (ja) * | 2002-02-27 | 2006-08-30 | ヤマハ株式会社 | 歌唱合成方法と装置及び記録媒体 |
JP2003255973A (ja) | 2002-02-28 | 2003-09-10 | Nec Corp | 音声帯域拡張システムおよび方法 |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP2003316394A (ja) | 2002-04-23 | 2003-11-07 | Nec Corp | 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7555434B2 (en) | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
JP4728568B2 (ja) | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
ES2259158T3 (es) | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
EP1586045A1 (en) * | 2002-12-27 | 2005-10-19 | Nielsen Media Research, Inc. | Methods and apparatus for transcoding metadata |
CN1748443B (zh) | 2003-03-04 | 2010-09-22 | 诺基亚有限公司 | 多声道音频扩展支持 |
US7020448B2 (en) * | 2003-03-07 | 2006-03-28 | Conwise Technology Corporation Ltd. | Method for detecting a tone signal through digital signal processing |
CN1458646A (zh) * | 2003-04-21 | 2003-11-26 | 北京阜国数字技术有限公司 | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7277537B2 (en) * | 2003-09-02 | 2007-10-02 | Texas Instruments Incorporated | Tone, modulated tone, and saturated tone detection in a voice activity detection device |
KR20050027179A (ko) | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7844451B2 (en) | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
BRPI0415464B1 (pt) | 2003-10-23 | 2019-04-24 | Panasonic Intellectual Property Management Co., Ltd. | Aparelho e método de codificação de espectro. |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
US7148415B2 (en) * | 2004-03-19 | 2006-12-12 | Apple Computer, Inc. | Method and apparatus for evaluating and correcting rhythm in audio data |
CA2561352A1 (en) * | 2004-04-21 | 2005-11-17 | Dolby Laboratories Licensing Corporation | Audio bitstream format in which the bitstream syntax is described by an ordered transveral of a tree hierarchy data structure |
WO2005111568A1 (ja) | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
EP1939862B1 (en) | 2004-05-19 | 2016-10-05 | Panasonic Intellectual Property Corporation of America | Encoding device, decoding device, and method thereof |
DE602004028171D1 (de) | 2004-05-28 | 2010-08-26 | Nokia Corp | Mehrkanalige audio-erweiterung |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
TWI294119B (en) * | 2004-08-18 | 2008-03-01 | Sunplus Technology Co Ltd | Dvd player with sound learning function |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US20060106620A1 (en) | 2004-10-28 | 2006-05-18 | Thompson Jeffrey K | Audio spatial environment down-mixer |
SE0402651D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
JP4939424B2 (ja) | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
RU2404506C2 (ru) | 2004-11-05 | 2010-11-20 | Панасоник Корпорэйшн | Устройство масштабируемого декодирования и устройство масштабируемого кодирования |
ES2476992T3 (es) | 2004-11-05 | 2014-07-15 | Panasonic Corporation | Codificador, descodificador, método de codificación y método de descodificaci�n |
US7873515B2 (en) * | 2004-11-23 | 2011-01-18 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for error reconstruction of streaming audio information |
KR100657916B1 (ko) | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US7616710B2 (en) * | 2004-12-08 | 2009-11-10 | Electronics And Telecommunications Research Institute | Frequency offset estimating method and receiver employing the same |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
JP5224017B2 (ja) | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
KR100708121B1 (ko) | 2005-01-22 | 2007-04-16 | 삼성전자주식회사 | 음성 신호의 대역 확장 방법 및 장치 |
BRPI0607646B1 (pt) | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
WO2006108543A1 (en) | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
US20070005351A1 (en) | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100813259B1 (ko) | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
EP1921606B1 (en) | 2005-09-02 | 2011-10-19 | Panasonic Corporation | Energy shaping device and energy shaping method |
US7653146B2 (en) * | 2005-09-06 | 2010-01-26 | Liquid Xstream Systems Inc. | System and method for delivery of video, content on demand and IP packets |
RU2378790C1 (ru) * | 2005-09-27 | 2010-01-10 | Квэлкомм Инкорпорейтед | Методики масштабируемости на основе информации содержимого |
CN101273404B (zh) | 2005-09-30 | 2012-07-04 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
KR20080047443A (ko) | 2005-10-14 | 2008-05-28 | 마츠시타 덴끼 산교 가부시키가이샤 | 변환 부호화 장치 및 변환 부호화 방법 |
WO2007052088A1 (en) | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
EP2381440A3 (en) | 2005-11-30 | 2012-03-21 | Panasonic Corporation | Subband coding apparatus and method of coding subband |
JP4876574B2 (ja) | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP4863713B2 (ja) | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1977312A2 (en) * | 2006-01-16 | 2008-10-08 | Zlango Ltd. | Iconic communication |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7590523B2 (en) | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
JP4976381B2 (ja) | 2006-03-31 | 2012-07-18 | パナソニック株式会社 | 音声符号化装置、音声復号化装置、およびこれらの方法 |
JP4981123B2 (ja) * | 2006-04-04 | 2012-07-18 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整 |
WO2007126015A1 (ja) | 2006-04-27 | 2007-11-08 | Panasonic Corporation | 音声符号化装置、音声復号化装置、およびこれらの方法 |
ATE528750T1 (de) | 2006-05-10 | 2011-10-15 | Panasonic Corp | Kodierungsvorrichtung und -verfahren |
JP2007316254A (ja) * | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
JP2007333785A (ja) | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
KR101244310B1 (ko) | 2006-06-21 | 2013-03-18 | 삼성전자주식회사 | 광대역 부호화 및 복호화 방법 및 장치 |
US8010352B2 (en) | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
EP2063418A4 (en) | 2006-09-15 | 2010-12-15 | Panasonic Corp | AUDIO CODING DEVICE AND AUDIO CODING METHOD |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
JP5141180B2 (ja) | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
JP4930320B2 (ja) | 2006-11-30 | 2012-05-16 | ソニー株式会社 | 再生方法及び装置、プログラム並びに記録媒体 |
CN101548318B (zh) | 2006-12-15 | 2012-07-18 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
RU2406166C2 (ru) * | 2007-02-14 | 2010-12-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
JP2008261978A (ja) | 2007-04-11 | 2008-10-30 | Toshiba Microelectronics Corp | 再生音量自動調整方法 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
WO2009001874A1 (ja) | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
WO2009004727A1 (ja) | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 符号化装置、符号化方法および符号化プログラム |
JP5045295B2 (ja) | 2007-07-30 | 2012-10-10 | ソニー株式会社 | 信号処理装置及び方法、並びにプログラム |
US8041577B2 (en) | 2007-08-13 | 2011-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Method for expanding audio signal bandwidth |
US20090154726A1 (en) * | 2007-08-22 | 2009-06-18 | Step Labs Inc. | System and Method for Noise Activity Detection |
CN101939782B (zh) | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
PT2186089T (pt) | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
WO2009029033A1 (en) | 2007-08-27 | 2009-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
US8554349B2 (en) | 2007-10-23 | 2013-10-08 | Clarion Co., Ltd. | High-frequency interpolation device and high-frequency interpolation method |
JP4733727B2 (ja) | 2007-10-30 | 2011-07-27 | 日本電信電話株式会社 | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
US8352249B2 (en) | 2007-11-01 | 2013-01-08 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
EP2207166B1 (en) | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
US20090132238A1 (en) | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
CN101896968A (zh) | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
JP2009116275A (ja) | 2007-11-09 | 2009-05-28 | Toshiba Corp | 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置 |
WO2009066959A1 (en) | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
ES2629453T3 (es) | 2007-12-21 | 2017-08-09 | Iii Holdings 12, Llc | Codificador, descodificador y procedimiento de codificación |
WO2009084221A1 (ja) | 2007-12-27 | 2009-07-09 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
US8422569B2 (en) | 2008-01-25 | 2013-04-16 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
KR101413968B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
EP2259253B1 (en) | 2008-03-03 | 2017-11-15 | LG Electronics Inc. | Method and apparatus for processing audio signal |
KR101449434B1 (ko) | 2008-03-04 | 2014-10-13 | 삼성전자주식회사 | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 |
ES2796493T3 (es) | 2008-03-20 | 2020-11-27 | Fraunhofer Ges Forschung | Aparato y método para convertir una señal de audio en una representación parametrizada, aparato y método para modificar una representación parametrizada, aparato y método para sintetizar una representación parametrizada de una señal de audio |
US8085941B2 (en) * | 2008-05-02 | 2011-12-27 | Dolby Laboratories Licensing Corporation | System and method for dynamic sound delivery |
KR20090122142A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2294770B1 (en) | 2008-06-20 | 2013-08-07 | Rambus, Inc. | Frequency responsive bus coding |
US8532932B2 (en) * | 2008-06-30 | 2013-09-10 | Nellcor Puritan Bennett Ireland | Consistent signal selection by signal segment selection techniques |
CN102089816B (zh) | 2008-07-11 | 2013-01-30 | 弗朗霍夫应用科学研究促进协会 | 音频信号合成器及音频信号编码器 |
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
RU2510536C9 (ru) | 2008-08-08 | 2015-09-10 | Панасоник Корпорэйшн | Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра |
JP2010079275A (ja) | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
WO2010028292A1 (en) | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
US8407046B2 (en) | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
EP2359366B1 (en) * | 2008-12-15 | 2016-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and bandwidth extension decoder |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8463599B2 (en) | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP5511785B2 (ja) | 2009-02-26 | 2014-06-04 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP5564803B2 (ja) | 2009-03-06 | 2014-08-06 | ソニー株式会社 | 音響機器及び音響処理方法 |
CN101853663B (zh) | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CO6440537A2 (es) | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
US8392200B2 (en) | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
US8971551B2 (en) | 2009-09-18 | 2015-03-03 | Dolby International Ab | Virtual bass synthesis using harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
JP5223786B2 (ja) | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
US8515768B2 (en) | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5928539B2 (ja) | 2009-10-07 | 2016-06-01 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8600749B2 (en) | 2009-12-08 | 2013-12-03 | At&T Intellectual Property I, L.P. | System and method for training adaptation-specific acoustic models for automatic speech recognition |
US8447617B2 (en) | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
KR101423737B1 (ko) | 2010-01-21 | 2014-07-24 | 한국전자통신연구원 | 오디오 신호의 디코딩 방법 및 장치 |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
EP2545548A1 (en) | 2010-03-09 | 2013-01-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an input audio signal using cascaded filterbanks |
JP5375683B2 (ja) | 2010-03-10 | 2013-12-25 | 富士通株式会社 | 通信装置および電力補正方法 |
JP2011203483A (ja) | 2010-03-25 | 2011-10-13 | Yamaha Corp | 音声処理装置 |
WO2011121782A1 (ja) | 2010-03-31 | 2011-10-06 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
ES2942867T3 (es) | 2010-07-19 | 2023-06-07 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP2012058358A (ja) | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US8407020B1 (en) * | 2010-09-28 | 2013-03-26 | The United States Of America As Represented By The Secretary Of The Navy | Fast method to search for linear frequency-modulated signals |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012052802A1 (en) | 2010-10-18 | 2012-04-26 | Nokia Corporation | An audio encoder/decoder apparatus |
US8521541B2 (en) * | 2010-11-02 | 2013-08-27 | Google Inc. | Adaptive audio transcoding |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
EP2695161B1 (en) * | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
US9240191B2 (en) | 2011-04-28 | 2016-01-19 | Telefonaktiebolaget L M Ericsson (Publ) | Frame based audio signal classification |
JP6024077B2 (ja) * | 2011-07-01 | 2016-11-09 | ヤマハ株式会社 | 信号送信装置および信号処理装置 |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
CN103918030B (zh) | 2011-09-29 | 2016-08-17 | 杜比国际公司 | Fm立体声无线电信号中的高质量检测 |
US9354968B2 (en) * | 2011-09-30 | 2016-05-31 | Johnson Controls Technology Company | Systems and methods for data quality control and cleansing |
JP2013102411A (ja) * | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
US9583108B2 (en) * | 2011-12-08 | 2017-02-28 | Forrest S. Baker III Trust | Voice detection for automated communication system |
JP5810946B2 (ja) * | 2012-01-31 | 2015-11-11 | 富士通株式会社 | 特定通話検出装置、特定通話検出方法及び特定通話検出用コンピュータプログラム |
WO2013138633A1 (en) * | 2012-03-15 | 2013-09-19 | Regents Of The University Of Minnesota | Automated verbal fluency assessment |
US20150088528A1 (en) | 2012-04-13 | 2015-03-26 | Sony Corporation | Decoding apparatus and method, audio signal processing apparatus and method, and program |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
CA2843223A1 (en) | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
JPWO2014007097A1 (ja) | 2012-07-02 | 2016-06-02 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
BR112014004127A2 (pt) | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US9991861B2 (en) * | 2012-08-10 | 2018-06-05 | Bellevue Investments Gmbh & Co. Kgaa | System and method for controlled dynamics adaptation for musical content |
JP2014123011A (ja) | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
IN2015MN01766A (zh) * | 2013-01-21 | 2015-08-28 | Dolby Lab Licensing Corp | |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
-
2014
- 2014-12-12 AU AU2014371411A patent/AU2014371411A1/en not_active Abandoned
- 2014-12-12 JP JP2015554741A patent/JP6593173B2/ja active Active
- 2014-12-12 CA CA3162763A patent/CA3162763A1/en active Pending
- 2014-12-12 EP EP19199358.3A patent/EP3608909B1/en active Active
- 2014-12-12 EP EP14873206.8A patent/EP3089161B1/en active Active
- 2014-12-12 KR KR1020167015462A patent/KR102356012B1/ko active IP Right Grant
- 2014-12-12 MX MX2016008172A patent/MX2016008172A/es active IP Right Grant
- 2014-12-12 CN CN201480069805.XA patent/CN105849801B/zh active Active
- 2014-12-12 WO PCT/JP2014/082925 patent/WO2015098564A1/ja active Application Filing
- 2014-12-12 US US15/106,498 patent/US10692511B2/en active Active
- 2014-12-12 KR KR1020237009428A patent/KR20230042410A/ko not_active Application Discontinuation
- 2014-12-12 MY MYPI2016702261A patent/MY188538A/en unknown
- 2014-12-12 KR KR1020227002138A patent/KR102513009B1/ko active IP Right Grant
- 2014-12-12 RU RU2018132534A patent/RU2764260C2/ru active
- 2014-12-12 BR BR112016014476-7A patent/BR112016014476B1/pt active IP Right Grant
- 2014-12-12 SG SG11201605015XA patent/SG11201605015XA/en unknown
- 2014-12-12 RU RU2016124464A patent/RU2667627C1/ru active
- 2014-12-12 CA CA2934602A patent/CA2934602C/en active Active
- 2014-12-15 TW TW103143688A patent/TWI644308B/zh active
-
2019
- 2019-09-25 JP JP2019174075A patent/JP6753499B2/ja active Active
-
2020
- 2020-05-06 US US16/867,730 patent/US11705140B2/en active Active
- 2020-08-06 JP JP2020133606A patent/JP6927385B2/ja active Active
-
2021
- 2021-08-05 JP JP2021128702A patent/JP7215534B2/ja active Active
-
2023
- 2023-03-31 US US18/129,380 patent/US20230245665A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US20100083344A1 (en) * | 2008-09-30 | 2010-04-01 | Dolby Laboratories Licensing Corporation | Transcoding of audio metadata |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI644308B (zh) | Decoding device and method, and program | |
US11705139B2 (en) | Efficient coding of audio scenes comprising audio objects | |
USRE49107E1 (en) | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control | |
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
KR101760248B1 (ko) | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 | |
US9756448B2 (en) | Efficient coding of audio scenes comprising audio objects |