CN111630591A - 支持不同丢失消隐工具的集合的音频解码器 - Google Patents
支持不同丢失消隐工具的集合的音频解码器 Download PDFInfo
- Publication number
- CN111630591A CN111630591A CN201880086169.XA CN201880086169A CN111630591A CN 111630591 A CN111630591 A CN 111630591A CN 201880086169 A CN201880086169 A CN 201880086169A CN 111630591 A CN111630591 A CN 111630591A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- blanking
- audio
- missing
- plc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 113
- 230000003595 spectral effect Effects 0.000 claims abstract description 93
- 238000001228 spectrum Methods 0.000 claims abstract description 47
- 230000002123 temporal effect Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 62
- 238000001514 detection method Methods 0.000 claims description 24
- 238000011084 recovery Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 9
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000010363 phase shift Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 102100026205 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Human genes 0.000 description 12
- 101000691599 Homo sapiens 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Proteins 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 101100520231 Caenorhabditis elegans plc-3 gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100408464 Caenorhabditis elegans plc-1 gene Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/756—Media network packet handling adapting media to device capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
如果分配/选择基于下列两个度量来完成,则可以采用导致更令人愉悦的丢失消隐方式,将音频解码器的不同丢失消隐工具的相位集合的一个丢失消隐工具分配给待从数据流解码的音频信号的一部分,所述部分受丢失影响、亦即出自不同丢失消隐工具的集合的选择,所述两个度量为:已确定的第一度量对音频信号的频谱的频谱矩心的频谱位置进行测量、以及已确定的第二度量对音频信号的时间可预测性进行测量。分配或选择的丢失消隐工具可以接着用于恢复音频信号的所述部分。
Description
说明书
本申请涉及支持不同丢失消隐工具的集合的音频解码器。
封包丢失消隐(PLC)用于音频编解码,以使丢失或损毁的封包在从编码器传输至解码器期间消隐。PLC是在解码器侧处进行,并且通过在变换域中或时域中外推已解码信号来运作。理想情况下,消隐信号应该无伪影,并且应该具有与遗漏信号相同的频谱特性。
如[2]及[4]中所述,误差稳健音频编解码大致具有用于各种信号类型的多种消隐方法,例如:用于单音信号的语音作为示例,用于多音信号或噪声信号的音乐为示例。选择基于信号特征的集合,该组信号特征从比特流传输且解码、或在解码器中估计。
基于音调的PLC技术对于语音及单音信号大致产生良好结果。这些方法假设信号为局部平稳,并且通过使用外推音调周期合成周期信号来恢复丢失信号。这些技术广泛用于基于 CELP的语音编码,诸如ITU-T G.718[2]。它们亦可以用于PCM编码,诸如用于ITU-TG.711 [3],并且近来它们应用于基于DECT的音频编码,最佳示例为3GPP EVS标准[4]中的TCX 时域消隐、TCX TD-PLC。
音调滞后是用于基于音调的PLC的主要参数。此参数可以在编码器侧处估计,并且被编码在比特流中。在这种状况中,最后良好帧的音调滞后用于消隐目前丢失帧,诸如[2]及[4] 中所述。如果比特流中没有音调滞后,则可以通过对已解码信号运行音调检测算法,在解码器侧处估计音调滞后,诸如[3]中所述。
对于非周期性、非声调、似噪声信号,已发现一种低复杂度技术有效,其称为具有符号加扰的帧重复。该技术基于重复最后帧,并且将频谱系数乘以随机产生的符号,以使丢失帧消隐。可以在3GPP EVS标准[4]中发现具有符号加扰的MDCT帧重复的一个示例。
对于声调多音信号或复杂音乐信号,使用一种基于预测任何检测到的声调分量的频谱系数的相位的方法。此方法显示对平稳声调信号的一致性改善。声调分量由亦存在于先前所接收的(一个或多个)帧中的峰值所组成。属于声调分量的频谱系数的相位从最后所接收的(一个或多个)帧的功率谱确定。可以在3GPP EVS标准[4]中发现声调MDCT消隐的一个示例。
综上所述,已知不同PLC方法,但这些方法特定用于某些情况,亦即用于某些音频特性。也就是说,支持这些PLC方法中的数种方法之一音频编码器应该具有用以在遭遇帧或封包丢失时选择最适合PLC方法之一机制。该最适合PLC方法是用于该丢失信号最不引人注目的替代方法。
本申请的目的是提供一种音频解码概念,其允许包括不同丢失消隐工具的集合的音频解码器实现改良型丢失消隐。
此目的通过本申请的独立权利要求的目标内容来达成。
本发明的想法基于以下发现:如果分配/选择基于下列两个度量来完成,则可以采用导致更令人愉悦的丢失消隐的方式,将音频解码器的不同丢失消隐工具的相位集合中的一个丢失消隐工具分配给待从数据流解码的音频信号的一部分,所述部分受丢失影响、亦即出自不同丢失消隐工具的集合的选择,所述两个度量为:已确定的第一度量对音频信号的频谱的频谱矩心的频谱位置进行测量、以及已确定的第二度量对音频信号的时间可预测性进行测量。分配或选择的丢失消隐工具可以接着用于恢复音频信号的所述部分。
举例来说,基于前述第一度量及第二度量,可以将第一丢失消隐工具及第二丢失消隐工具中的一个丢失消隐工具分配给丢失部分,其中第一丢失消隐工具被配置用以通过使用取决于从数据流得出的音调值的周期性的周期信号所进行的音频信号合成来恢复音频信号,以及第二丢失消隐工具可以被配置用以通过检测音频信号的声调频谱分量、在声调频谱分量处进行相位检测、以及通过在取决于相位检测对信号之间的相互相移进行调整下,组合取决于声调频谱分量的周期性信号所进行的音频信号合成,来恢复音频信号。换句话说,基于第一度量及第二度量,可以将声调频域PLC工具及声调时域PLC工具中的一个分配给丢失部分。
根据实施例,对于丢失部分,分阶段进行分配/选择:确定对音频信号的频谱的声调性进行测量的第三度量,以及将出自该组不同丢失消隐工具的一个或多个丢失消隐工具的第一子集及第二子集中的一个子集分配给丢失部分,并且仅在将一个或多个丢失消隐工具的第一子集分配给丢失部分时,才基于出自此第一子集的第一度量及第二度量,为丢失部分分配一个PLC工具。否则,从第二子集中进行分配/选择。
本申请的有利方面为从属权利要求的主题。下文对照附图提出本申请的优选实施例,在附图中:
图1采用示意性方式示出根据本申请的实施例的音频解码器的框图;
图2示出根据实施例的图1的音频解码器的分配器32的操作模式的流程图;
图3示出图示根据实施例的用于确定图2中PLC分配的第一度量的频谱矩心检测的示意图;
图4示出图示根据实施例的用于确定图2的PLC分配的第二度量的时间可预测性检测的示意图;
图5示出用于图示图2的PLC 1的操作模式的示意图;
图6示出图示根据实施例的PLC 2的操作模式的示意图;
图7示出根据实施例的图2的分配操作的修改版本的流程图,其经延伸以便为封包丢失消隐PLC 1至PLC 3,从PLC工具的集合进行分配;以及
图8示出用于在三个PLC工具之中做决策的决策树,图7的实施例对应于该决策树。
图1示出根据本申请的实施例的音频解码器。如图中所示,音频解码器10被配置用以从数据流14解码音频信号12。可以根据任何适合的音频编解码,诸如基于时域的音频编解码或基于频域的音频编解码,将音频信号12编码在数据流14中。可以分别以帧18的时间部分16为单位,将音频信号12编码在数据流14中。更精确地说,可以在时间上将音频信号12细分成重叠或非重叠时间部分或间隔16,其各对应于将数据流14细分的帧18中的某一个。各帧18编码对应的时间部分16。举例来说,部分18可以含有关于线性预测系数的信息,其描述对应部分16内音频信号的频谱包络。另外,帧18可以具有在其中被编码的频谱系数,频谱系数描述部分16内音频信号12待定形的频谱,该频谱举例来说是由音频解码器10根据该帧中所含有的线性预测系数来定形。重叠相加过程也可能由音频解码器10用于从数据流14重构音频信号12。当然,该可能性也将适用于本文中所呈现的仅为了易于理解而运用的示例。
数据流14可以由音频解码器10以封包形式接收,亦即以封包为单位。将数据流14细分成帧18本身代表一种封包化,亦即帧18代表封包。另外,可以将数据流14包成传输流或媒体文件格式的封包,但这里不再详细检验这种情况。反而,应该足以陈述由音频解码器10对数据流14的接收容易造成数据或信号丢失,下文中称为封包丢失。也就是说,数据流14的某连续部分20可能在传输期间丢失,因此音频解码器10没接收到,致使对应部分遗漏,而且无法用于音频解码器10。结果是,音频解码器10遗漏数据流14中为了将对应于部分20的一部分22重构的信息。换句话说,音频解码器10无法根据例如在音频解码器的音频解码核心24中实施的正常音频解码过程将部分22从数据流14重构,因为数据流14的部分20有遗漏。反而,为了处理此类遗漏部分20,音频解码器10包括PLC工具28的集合 26,以便通过替代信号30恢复或合成部分22内的音频信号12。集合26所包括的PLC工具28的差异在于其对于不同音频信号特性的适合性。也就是说,将某一PLC工具用于恢复音频信号12的某一部分22内的替代信号30时的烦扰程度取决于该部分22处的音频信号特性,并且集合26内的PLC工具28针对音频信号特性的某一集合显示相互不同的烦扰程度。因此,音频解码器10包括分配器32,其将封包丢失消隐工具28的集合26中的一个丢失消隐工具分配给音频信号12受封包丢失影响的部分22,诸如数据流14的丢失部分22。分配器 32尝试将最佳PLC工具28分配给部分22,亦即导致最低烦扰的一个丢失消隐工具。
通过使用分配器32为部分22分配的PLC工具28所取得的替代信号30,一旦分配器32已将某一PLC工具28分配给音频信号12的丢失部分22,音频解码器10便使用分配的 PLC工具28来恢复音频信号的此部分22,藉此替代此部分22内的音频信号12,因为如果对应数据流部分22不会丢失,则会将其从音频数据流14重构。
如上已经指出的,向某一丢失部分22分配特定PLC工具28应该具有信号相依性,以便使丢失消隐尽可能少地造成烦扰。然而,信号相依性受限于数据流14在丢失数据流部分20前的部分,并且根据本文中所述的实施例,分配器32动作如下。
为了更加详细解释这一点,请参照图2。图2示出某一遗漏部分22的整体分配过程可能是由可能存在于音频解码器10中的丢失检测器34所触发。特别的是,如果由丢失检测器 34进行的丢失检测36显露数据流14的某部分20遗漏或丢失,如在38处检查的,则触发以下分配过程。进行确定40,以便确定对音频信号的频谱的频谱矩心的频谱位置进行测量的第一度量42。也就是说,分配器32确定音频信号的频谱的质心的频谱位置,请参照图3。音频解码器先于数据流顺序,从数据流14的丢失部分20前的一部分44,取回音频信号的频谱46。如以上对照图1所述,数据流14无论如何可能具有在频谱域中编码的音频信号12,以使得分配器32不需要频谱分解也能取得频谱46。举例来说,在丢失部分20之前,数据流14的最新接收的帧18或多于一个最新取回的帧18的频谱系数用于取得频谱46。如果使用多于一个帧18,则可以通过取平均来取得由分配器32所使用的频谱46。为了进行确定 40,确定此频谱46的质心,即对频谱46的频谱位置48进行测量的度量42。稍后呈现特定示例。
再者,由丢失检测所触发的分配过程包括音频信号的时间可预测性的确定50,以便取得此时间可预测性的度量52,细节请参照图4。如其中所示,根据实施例,时间可预测性检测50可以依赖于如从数据流14得出直到信号部分22的解码信号或音频信号12,信号部分22由于丢失数据流14的部分20而遗漏。换句话说,时间可预测性检测50可以基于紧接在丢失部分22前的部分50内的音频信号12,其丢失有待消隐,并且其自数据流14的部分44 进行解码。时间可预测性检测50可以采用如下方式完成:度量52用于信号部分50的自相似性或自相关的度量,如图4中54处所示。通过度量52所测量的信号50的自相似性所针对的相互位移s可以由分配器32采用不同方式来确定。举例来说,分配器32可以检验数据流14的丢失部分20前的部分44内一个或多个帧18中输送的对应音调参数。也就是说,可以用以测量自相似性的相互位移s可以对应于音调周期,音调周期具有基于数据流14中的参数(即部分44)所确定的音调。该音调周期位移处的自相似性或相关性56可以用作为第二度量52。
显然,可以分别切换进行确定40及50的顺序,或可以同时进行两检测。基于度量42及52,进行分配60。此分配60选择两个PLC工具28的用于部分22的丢失消隐。接着将此PLC工具,即所分配的一个PLC工具62,用于部分22的丢失消隐。
作为简要说明,应知,PLC工具28(通过分配60在之间进行选择)的数量可以大于2。
然而,根据下文进一步概述的实施例,可以将图2的PLC工具PLC 1描述为1,藉其使用声调时域封包丢失消隐来取得或恢复替代信号30,即部分22内的音频信号估计。换句话说,PLC 1可以是单音部分的音频信号恢复专用的封包丢失消隐。PLC 1可以使用周期性的周期信号来恢复音频信号12的遗漏部分22内的音频信号,周期信号取决于从数据流得出的音调参数或音调值,亦即,从数据流14的部分44(即数据流14的丢失部分20前的部分44) 得出。
第二PLC工具PLC 2可以专用于恢复多音类型的音频信号。此第二PLC工具PLC 2的消隐可以基于声调频域封包丢失消隐。
请参照图5及图6,将简要解释PLC 1及PLC 2的可能实施方式。
图5图示PLC 1。数据流14的丢失部分20前的部分44内帧18中输送的音调参数或音调值66用于设定周期信号70的周期性或周期长度68,接着将其用于形成替代、或用于消隐音频信号12的部分22内的丢失。音调参数或音调值66可以存在于数据流14中,以便由音频解码器10在正常音频解码的状况中,亦即无信号丢失的状况中,用于控制例如谐波滤波工具或类似者。也就是说,参数66无论如何都可以存在于数据流14中。否则,根据图5 进行PLC1的PLC工具28可以通过分析来确定音调周期68,诸如通过分析丢失部分22前面的已解码信号50来确定,或通过分析诸如图3所示频谱46等频谱的最近可存取版本来确定。
图6图示根据实施例的PLC 2。在这里,负责进行PLC 2的PLC工具28举例来说,使用如从数据流14的部分44取得的一个或两个或更多最新取得的频谱,以便检测或确定在其中的声调频谱分量,即频谱46中的峰值72、或分别在某一数量连续频谱或帧18的频谱中该位置或足够类似位置处出现的频谱46中的峰值72。足够类似位置可以是频谱距离低于某一阈值的位置。峰值72的频谱位置代表声调频谱分量,并且在这里,在这些频谱位置处,相位检测例如通过使用、或例如通过评估音频信号的功率谱来进行。接着,在其内有信号丢失待消隐的时间部分22内,形成信号组合,其周期性取决于声调频谱分量,以便产出增补信号30,其中组合信号之间的相互相移取决于相位检测来调整。举例来说,为各声调分量 72确定相位,或仅确定这些声调分量之间的相位差,并且形成信号作为部分22内的替代30,其通过这些声调分量72来合成,并且遵从相位差或相位。该组合可以在频谱域中形成,并且通过逆变换来得出替代信号30,或是在时域中直接通过新增例如适当相互位移的信号来形成,该相互相移反映所确定的相互相移。
如下文更加详述,分配60可以采用以下方式完成:选择PLC 1或将PLC 1分配给更有可能频谱位置48越低且时间可预测性越高的部分22,反之亦然,选择PLC 2或将PLC 2分配给更有可能频谱位置48越高且时间可预测性越低的部分22。更高频谱位置对应于更高频率,并且更低频谱位置对应于更低频率。藉此,依照这种方式,在部分22对应于已丢失语音的状况中更可能选择PLC 1,并且在部分22与多音信号或音乐有关的状况中更可能选择PLC 2。
为了完整起见,图7示出可以延伸图2的分配过程的事实。特别的是,如图2所示,分配60通过将分配60的分配或选择限制在PLC工具28的子集80上来完成。PLC工具28的集合26可以含有一个或多个PLC工具28的再一子集,诸如子集82,并且在受丢失检测36 触发时,声调性检测84可以先由分配器32使用,以便确定部分图22是否有关于声调部分。声调性确定84产出声调性度量或指示符86,并且此声调性度量指示符86可以通过使用数据流14的部分44内的一个或多个参数在84中取得,举例如通过检验部分44内的最新帧 18是否包括某一音调参数来取得,诸如是否包括如图5所述的音调值66。倘若不存在,这可以解读为音频信号目前为非声调信号的指示,并且倘若存在音调参数66,这可以解读为指出音频信号目前为声调信号。接着,此指示为声调性度量86。使用度量86在88处区别音频信号是否是为声调信号,并且如果其为非声调信号,则分配给部分22的PLC 62是分配自子集82。图7图示一个PLC工具28由子集82所包括,并且选择的是这个PLC工具的状况。然而,在这里,甚至可以再从子集82进行再一选择。如果在88处确认声调性,则相对如以上对照图2所述的子集80,进行基于确定40及50的分配60。
PLC 3可以是非声调PLC,诸如通过在有或没有重复修改的情况下使用帧重复来恢复用于部分22的音频信号的PLC,这时重复修改可以如上指出的涉及符号加扰,即最新所接收频谱的频谱系数的随机符号反转,诸如接着受逆变换并用于得出替代信号30的频谱46。
图8根据例如对应于图7的方式,可视化用于在PLC工具28中进行选择的决策树。进行决策A及B以从经设计用于不同信号类型的三种PLC方法PLC 1至PLC 3中,决策将要用于某一遗漏信号部分22的方法,以便获得最佳消隐效能。第一决策为决策A,是基于声调性。如果信号变为非声调性,则将PLC 3用于消隐。如果为声调性,则采用决策B。决策 B以上述对照图2及7的方式,基于度量42及52,检查声调信号特性,并且取决于该特性,选择PLC 1或PLC 2中的一个。如上所解释的,PLC 1可以是用于单音及/或语音信号的声调时域PLC,而PLC 2则可以是用于多音及/或音乐信号的声调频域PLC。
因此,图8的决策树将决策可视化,可以为不同信号类型,在三种PLC方法之间采取这些决策,以获得最佳消隐效能。可以通过检验信号类型分类,亦即通过将其用作为声调性指示符的指示、或通过从其得出该声调性指示符,来完成决策A,其可以对应于图7的检查88。信号类型分类可能存在于各帧18中,并且指出各帧的帧分类。可以在编码器侧对其进行计算,并且在比特流14中将其传输至音频解码器。甚至替代地,可以在解码器侧对其进行计算。然而,帧分类的计算非常复杂,并且可以要求由于帧分类的帧相依性而在每个帧中计算所有特征。因此,对于低复杂度应用,如果使用更简单方法则可以为优选的。如上指出的,有些音调参数66的存在性或不存在性可以用作为指示符86。
基于确定40及52而对应于分配60的决策B在PLC#1与PLC#2之间产出良好选择。在[6]中,此选择已基于频谱包络的稳定性测量而完成,其与信号的短期平稳性相关。然而,信号越平稳,PLC#1及PLC#2两个声调PLC方法的效能便都越好。这意味着平稳性因此不是适用于选择最佳声调消隐方法的准则。平稳性特征非常良好地指出声调性,然而,其无法辨别语音/单音与多音/音乐。
如上讨论的,有可能使用由分配器32所代表的PLC分类器来进行图8的决策树,其可以在逐帧基础上操作而无任何帧间相依性,因此仅需要低复杂度。其仅在帧丢失的状况下才可以计算其分类特征42及52,如38处所检测或检查的,因此不在帧18之中的无误差帧中新增内在复杂度偏移。
决策A可以基于声调性指示符86来完成,其可以是最后良好接收的音频帧中音调值的存在性。决策B可以通过使用在最后良好接收的音频帧上计算的频谱矩心48及长期预测增益56来完成。
决策B可以在最适合单音及类似语音信号的基于音调的时域消隐方法PLC#1与最适合多音或复杂音乐信号的频域方法PLC#2之间切换。决策B的分类的优点导因于以下事实:
·频谱矩心对于语音信号处于非常低频谱位置,而对于音乐信号处于更高频谱位置;
·长期预测增益较高对于如语音信号的单音及平稳信号为高增益,而对于如声调或复杂音乐信号的多音或更不平稳信号为低增益。
因此,特征42及52两者的加权组合可以用于决策B及分配过程60,并且导致语音/单音与多音/复杂音乐信号的可靠区别。同时,可以保持低复杂度。
如果音频解码器接收已损毁帧,或如果帧丢失,亦即遭遇丢失部分20,如38处检测的,则可进行以下操作,其中亦参照图2:
a.在88处,进行决策A,是否将如PLC#2或PLC#1的声调消隐方法用于消隐代表部分20的丢失/损毁的帧、或消隐对应部分22的丢失。决策A基于声调性指示符68,可以对其使用比特流中最后良好帧中音调值66的存在性。
b.对于否定决策A,不使用声调PLC。反而,在那种状况中使用另一PLC方法,即PLC#3。同样可使以用具有符号加扰的帧重复。
c.对于肯定决策A,将两种声调PLC方法PLC#1及PLC#2用于消隐丢失/损毁的帧。两种PLC方法可以是基于时域音调的PLC,诸如[4]的TCX TD-PLC,或可以是频域声调消隐,诸如[4]中的声调MDCT消隐,其中对应说明以参考方式并入本文。
对于肯定决策A,特征42及52可以采用以下方式,基于最后良好帧来计算:
·作为特征或度量52,可以在50中计算长期预测增益xcorr:
其中Tc是最后良好帧的音调值,并且x(k),k=0…N-1是最后良好帧的最后已解码时间样本,以及
其中NF可以是有限值,如最大音调值或帧长度(例如:10ms)。
·作为特征或度量42,可以在40中计算频谱矩心sc:
其中N是最后所接收频谱Xs_lastGood(k)的长度,并且|Xs_lastGood(k)|意味着量谱。
这两个计算的特征是通过以下公式来组合:
class=w1·xcorr+w2·sc+β
接着,除此以外,如果60及PLC#2中class>0,诸如频域声调消隐,则可以选择PLC#1,例如基于时域音调的PLC方法。
对照以上说明,应做出一些注记。举例来说,频谱(测量其频谱矩心以取得第一度量42)可以是所谓的加权版本,诸如预加强版本。举例来说,将此类加权用于使量化噪声适应于心理声学掩蔽阈值。换句话说,第一度量42可能测量音频信号的心理声学换算频谱(psychoacoustic scaled spectrum)的频谱矩心的频谱位置48。这在正常音频解码编码的下层音频解码核心24涉及数据流14无论如何具有在频谱域中编码的音频信号12(亦即在加权域中编码)的状况中可能尤其有帮助。另外或替代地,频谱(测量其频谱矩心以取得第一度量42)不一定是以如音频解码核心24中用于转变到时域的频谱分辨率一般高的频谱所代表的频谱。反而,其可更高或更低。甚至另外或替代地,应知,音频信号的频谱亦以比例因子彰显其本身。可能在数据流14中,连同频谱系数,传输此类比例因子,以便一起形成音频信号的频谱的编码表示。对于某一部分22,频谱系数根据比例因子来换算。频谱系数比比例因子更多。举例来说,将各比例因子分配给数个频谱带之一,即所谓的比例因子频谱带,音频信号的带宽划分成比例因子频谱带。因此,相较于数据流14中用以对量化频谱系数进行编码的频谱分辨率,比例因子依据某更低频谱分辨率下的包络为某一部分定义音频信号的频谱。甚而有可能数据流14中用以编码该比例因子的频谱分辨率甚低于解码核心24用以对频谱系数进行反量化的频谱分辨率。举例来说,解码核心24可能使编码中数据流14中的比例因子经受频谱内插,以取得如编码到数据流中的比例因子更高频谱分辨率的内插比例因子,并且将该内插比例因子用于反量化。编码在数据流中的比例因子及内插比例因子中的任一者可能用作为音频信号的频谱,其频谱矩心通过第一度量42来测量。这意味着:在通过使已解码音频信号经受会更进一步增加工作量的额外频谱分解来为矩心测量取得频谱的状况中,相较于以任何更高分辨率进行矩心测量,诸如以用来将频谱系数编码的分辨率、或某其他分辨率进行矩心测量,矩心测量变为待确定相当有运算效率,因为待进行用以确定第一度量的运算操作量低。因此,作为具体示例,可以基于已编码下采样比例因子SNS(频谱噪声整形)将第一度量及第二度量运算如下:
首先,可能将音调值Tc运算作为基础:
其中pitch_present及pitch_int由解码器从最后良好帧得出的比特流参数。可以将 pitch_present解读为声调性指示符。
作为第二度量,可以根据下式来运算长期预测增益xcorr:
其中x(k),k=0…N-1是最后已解码时间样本,并且N可以是预定长度值,诸如有限值,如最大音调值或帧长度NF(例如:10ms),例如
其中pitmin是最小音调值。因此,第二度量将会在最新所接收部分处与其本身运算为已解码音频时间信号的自相似性,以音调相互相移位。
作为第二度量,频谱矩心sc可以运算为:
其中fs是取样率,以及
并且Ifs是不均匀频带索引,即为各频带而定义下与上频率边界的频带索引,所采用的方式使得相关联的下与上边界之间的差异所定义的频带宽度彼此不同,诸如随着频率增加而增加,但该差异是可选的。可以将该频带索引定义成与音频信号的采样率/频率具有相依性。
再者,
其中scfQ-1(k)是储存在最后良好帧的比特流中的比例因子向量,以及gtilt是预定倾斜因子,可以将其设为默认值,并且有可能取决于音频信号的采样频率。应用项,以将在对数域中编码的比例因子返回线性域中。应用项以反转编码器侧预加强滤波器,其称为去加重滤波器。
在编码器侧计算并在比特流中传输比例因子向量。比例因子向量确定于MDCT系数每个频带的能量上,其中该频带为不均匀,并且遵循感知相关巴克标度(bark scale)(低频中较小,高频中较大)。将能量修匀、预加强及变换到对数域之后,在编码器侧处,将该能量从64个参数下采样至16个参数,以形成比例因子向量,之后将其编码并在比特流中传输。因此,sc是用于音频信号的频谱46的频谱矩心的频谱位置48的度量,在这里基于其频谱粗略采样版本来确定,亦即基于SNS参数来确定。
接着,可以凭借准则xcorr及sc来完成各种PLC方法之中的决策或选择。如果Tc=0(其意味着声调性指示符pitch_present=0),则可能选择具有符号加扰的帧重复。否则,将class 值计算如下:
如果class>0,则可能选择基于时域音调的PLC方法;否则,选择频域声调消隐。
因此,包括不同丢失消隐工具28的集合26且用于将音频信号12从数据流14解码的音频解码器可以被配置用以通过从数据流的最近非丢失部分中的比例因子得出频谱来确定40 对音频信号的频谱46的频谱矩心的频谱位置48进行测量的第一度量42、确定50对音频信号的时间可预测性进行测量的第二度量52、基于第一度量及第二度量将不同丢失消隐工具 28的集合26中的一个丢失消隐工具62分配32给音频信号12受丢失影响的一部分22、以及使用分配给部分22的一个丢失消隐工具62来恢复音频信号的部分22。如所述,频谱的得出可能涉及使编码在数据流中的比例因子经受频谱内插。另外或替代地,它们可以经受去加重滤波,亦即它们可能乘以去加重滤波器的转移函数。所产生的比例因子可以接着经受频谱矩心测量。接着也可以应用上述所有其他细节。也就是说,为了叙述并非旨在排他的示例:不同丢失消隐工具的集合26可以包括用于单音部分的音频信号恢复的第一丢失消隐工具、及用于多音部分的音频信号恢复的第二丢失消隐工具,并且该音频解码器可以被配置用以在基于第一度量及第二度量将不同丢失消隐工具的集合中的一个丢失消隐工具分配给音频信号的部分时,将第一丢失消隐工具分配给更有可能频谱矩心的频谱位置越低且时间可预测性越高的部分,以及将该第二丢失消隐工具分配给更有可能频谱矩心的频谱位置越高且时间可预测性越低的部分。另外或替代地,该音频解码器可被配置用以在基于第一度量及第二度量将不同丢失消隐工具的集合中的一个丢失消隐工具分配给音频信号受丢失影响的一部分22 时,对第一度量及第二度量42、52进行求和,以便取得标量总和值并且将标量总和值进行阈值处理。
虽然已在装置的上下文中说明一些方面,清楚可知的是,这些方面也代表对应方法的说明,其中框或设备对应于方法步骤或方法步骤的特征。类似的是,在方法步骤的上下文中说明的方面也代表对应设备的对应框或项目或特征的说明。方法步骤中有一些或全部可以通过 (或使用)硬件装置来执行,举例如:微处理器、可编程计算机或电子电路。在一些实施例中,最重要的方法步骤中有一个或多个可以通过此设备来执行。
取决于某些实施方式要求,本发明的实施例可以实施成硬件或软件。此实施方式可以使用数字储存介质来进行,例如软式磁盘、蓝光(Blu-Ray)、CD、ROM、PROM、EPROM、EEPROM或闪存,此数字储存介质上有储存电子可读控制信号,此电子可读控制信号与可编程计算机系统相配合(或能够相配合)而得以进行各方法。因此,数字储存介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,此电子可读控制信号能够与可编程计算机系统相配合而得以进行本文中所述方法之一。
一般而言,本发明的实施例可以实施成具有程序代码的计算机程序产品,当此计算机程序产品在计算机上执行时,此程序代码可运作来进行此方法之一。此程序代码可例如储存在机器可读载体上。
其他实施例包括用于进行本方法所述方法之一、储存在机器可读载体上的计算机程序。
换句话说,本发明的实施例因此是一种计算机程序,此计算机程序具有程序代码,当此计算机程序在计算机上运行时,此程序代码用于进行本文中所述方法之一。
本发明此方法的再一实施例因此是一种数据载体(或数字储存介质、或计算机可读媒体),其包括、其上有记录用于进行本文中所述方法之一的计算机程序。此数据载体、数字储存介质或经记录介质通常是有形和/或非暂时性。
本方法的再一实施例因此是数据流或信号序列,其代表用于进行本文中所述方法之一的计算机程序。此数据流或信号序列可以例如被配置来经由数据通信连接来传送,例如经由因特网传送。
再一实施例包括例如计算机的处理装置、或可编程逻辑设备,被配置来或适用于进行本文中所述方法之一。
再一实施例包括计算机,此计算机具有安装于其上用于进行本文中所述方法之一的计算机程序。
根据本发明的再一实施例包括设备或系统,其被配置来(例如以电子方式或以光学方式) 将用于本文中所述方法之一的计算机程序传送至接收器。此接收器举例而言,可以是计算机、移动设备、存储器设备或类似物。此装置或系统举例而言,可以包括用于传送此计算机程序至接收器的文件服务器。
在一些实施例中,可编程逻辑器件(例如可现场编程门阵列)可以用于进行本文中所述方法的功能的一些或全部。在一些实施例中,可现场编程门阵列可以与微处理器相配合,以便进行本文中所述方法之一。一般而言,此方法优选是通过任何硬件装置来进行。
本文中所述的装置可以使用硬件装置、或使用计算机、或使用硬件装置与计算机的组合来实施。
本文中所述的装置、或本文中所述装置的任何组件可以至少部分地实施成硬件和/或软件。
本文中所述的方法可以使用硬件装置、或使用计算机、或使用硬件装置与计算机的组合来进行。
本文中所述的方法、或本文中所述装置的任何组件可以至少部分地通过硬件和/或通过软件来进行。
上述实施例对于本发明的原理而言只具有说明性。理解的是,本文中所述布置与细节的修改及变型对于所属技术领域中的其他技术人员将会是显而易见的。因此,意图是仅受限于待决专利权利要求的范围,并且不受限于通过本文中实施例的说明及解释所呈现的特定细节。
[1]3GPP TS 26.445;Codec for Enhanced Voice Services(EVS);Detailedalgorithmic description。
[2]ITU-T G.718:Frame error robust narrow-band and wideband embeddedvariable bit-rate coding of speech and audio from 8-32kbit/s。
[3]ITU-T G.711Appendix I:A high quality low-complexity algorithm forpacket loss concealment with G.711。
[4]3GPP TS 26.447;Codec for Enhanced Voice Services(EVS);Errorconcealment of lost packets。
[5]Method and device for efficient frame erasure concealment inspeech codecs; WO2007073604(A1)―2007-07-05
[6]Selecting a Packet Loss Concealment Procedure;EP3111624 A1–2017-01-04。
Claims (20)
1.一种用于从数据流(14)解码音频信号(12)的音频解码器,音频解码器包括不同丢失消隐工具(28)的集合(26),并且被配置用以
确定(40)对音频信号的频谱(46)的频谱矩心的频谱位置(48)进行测量的第一度量(42),
确定(50)对音频信号的时间可预测性进行测量的第二度量(52),
基于第一度量及第二度量,将不同丢失消隐工具(28)的集合(26)中的一个丢失消隐工具(62)分配(32)给音频信号(12)受丢失影响的一部分(22),以及
使用分配给部分(22)的一个丢失消隐工具(62)来恢复音频信号的部分(22)。
2.如权利要求1所述的音频解码器,其中不同丢失消隐工具(28)的集合(26)包括下列中的一个或多个:
第一丢失消隐工具(PLC#1),用于通过使用取决于从数据流得出的音调值的周期性(68)的周期信号(70)所进行的音频信号合成来进行音频信号恢复,以及
第二丢失消隐工具(PLC#2),用于通过检测音频信号的声调频谱分量(72)、在声调频谱分量(72)处进行相位检测、以及通过组合取决于声调频谱分量(72)的周期性的信号与取决于相位检测对信号之间的相互相移进行调整所进行的音频信号合成,来进行音频信号恢复,以及
第三丢失消隐工具(PLC#3),用于通过在有或没有重复修改的情况下使用帧重复来进行音频信号恢复。
3.如权利要求1或2所述的音频解码器,其中不同丢失消隐工具的集合(26)包括:
第一丢失消隐工具(PLC#1),用于进行单音部分的音频信号恢复,以及
第二丢失消隐工具(PLC#2),用于进行多音部分的音频信号恢复。
4.如权利要求1或2所述的音频解码器,其中不同丢失消隐工具的集合(26)包括:
第一丢失消隐工具(PLC#1),用于使用声调时域封包丢失消隐进行音频信号恢复,以及
第二丢失消隐工具(PLC#2),用于使用声调频域封包丢失消隐进行音频信号恢复。
5.如权利要求1或2所述的音频解码器,其中不同丢失消隐工具的集合(26)包括:
第一丢失消隐工具(PLC#1),用于通过使用取决于从数据流得出的音调值的周期性的周期信号的音频信号合成来进行音频信号恢复,以及
第二丢失消隐工具(PLC#2),用于通过检测音频信号的声调频谱分量、在声调频谱分量处进行相位检测、以及通过组合取决于声调频谱分量的周期性信号与取决于相位检测对信号之间的相互相移进行调整所进行的音频信号合成,来进行音频信号恢复。
6.如权利要求5所述的音频解码器,其中音频解码器被配置用以:
通过使用数据流中输送的最近音调参数作为音调值,从数据流得出音调值(66)。
7.如权利要求5或6所述的音频解码器,其中音频解码器被配置用以:
通过识别从数据流的最近非丢失部分得出的一个或多个连续频谱(46)中的同位峰值,来进行声调频谱分量(72)的检测。
8.如权利要求7所述的音频解码器,其中数据流(14)在频谱域中具有编码在数据流内的最近非丢失部分。
9.如权利要求3-8中任一项所述的音频解码器,
其中音频解码器被配置用以在基于第一度量及第二度量将不同丢失消隐工具的集合中的一个丢失消隐工具分配给音频信号的部分时,将第一丢失消隐工具分配给更有可能频谱矩心的频谱位置越低且时间可预测性越高,以及将该第二丢失消隐工具分配给更有可能频谱矩心的频谱位置越高且时间可预测性越低的部分。
10.如前述权利要求中任一项所述的音频解码器,被配置用以:
进行丢失检测(36)以检测受丢失影响的部分(22),
响应于检测到受丢失影响的部分(22)的丢失检测,对于部分(22)进行第一度量及第二度量(42;52)的确定,以及禁止对于不受丢失影响的部分进行确定。
11.如权利要求1-10中任一项所述的音频解码器,还被配置用以:
确定(84)声调性指示符(86),声调性指示符(86)指示音频信号的声调性,
基于声调性指示符(86),将出自不同丢失消隐工具的集合(26)中的一个或多个丢失消隐工具的第一子集及第二子集(80,82)中的一个子集分配给音频信号的部分(22),第一子集及第二子集相互不相交,以及
基于第一度量及第二度量进行不同丢失消隐工具的集合中的一个丢失消隐工具向音频信号的所述部分的分配,其中如果将第一子集(80)分配给部分(22),则通过基于出自一个或多个丢失消隐工具的第一子集(80)的第一度量及第二度量,将不同丢失消隐工具的集合的一个丢失消隐工具(62)分配(60)给音频信号的所述部分,并且使用分配给部分(22)的一个丢失消隐工具(62)进行音频信号的部分(22)的恢复,以及如果将丢失消隐工具的第二子集(82)分配给部分(22),则使用出自丢失消隐工具的第二子集(82)中的一个丢失消隐工具来进行音频信号的所述部分的恢复。
12.如权利要求11所述的音频解码器,其中音频解码器被配置用以:
使用数据流中输送的参数作为第三度量。
13.如权利要求11或12所述的音频解码器,其中音频解码器被配置用以:
使用数据流的最近非丢失帧中音调参数(66)的存在性或不存在性作为第三度量。
14.如权利要求11-13中任一项所述的音频解码器,其中不同丢失消隐工具的集合(26)包括:
第一丢失消隐工具(PLC#1),用于通过使用取决于从数据流得出的音调值的周期性的周期信号所进行的音频信号合成来进行音频信号恢复,以及
第二丢失消隐工具(PLC#2),用于通过检测音频信号的声调频谱分量、在声调频谱分量处进行相位检测、以及通过组合取决于声调频谱分量的周期性的信号与取决于相位检测对信号之间的相互相移进行调整所进行的音频信号合成,来进行音频信号恢复,以及
第三丢失消隐工具(PLC#3),用于通过在有或没有重复修改的情况下使用帧重复来进行音频信号恢复,
其中第二子集(82)中包括第三丢失消隐工具,并且第一子集(80)中包括第二及第一与第二丢失消隐工具。
15.如前述权利要求中任一项所述的音频解码器,被配置用以通过频谱分量位置值的加权总和来确定第一度量(42),各加权在各频谱分量位置值处使用音频信号的频谱。
16.如前述权利要求中任一项所述的音频解码器,被配置用以通过对音频信号的自相似性进行测量的相关性度量来确定第二度量(52)。
17.如前述权利要求中任一项所述的音频解码器,被配置用以通过从音频信号得出音调以及将第二度量确定为以取决于所述音调的时间位移对音频信号的自相关进行测量的相关性度量,来确定(50)第二度量(52)。
18.如前述权利要求中任一项所述的音频解码器,被配置用以在基于第一度量及第二度量将不同丢失消隐工具的集合中的一个丢失消隐工具分配给音频信号受丢失影响的一部分(22)时,对第一度量及第二度量(42,52)进行求和,以便取得标量总和值并且将标量总和值进行阈值处理。
19.一种用于在从数据流(14)音频解码音频信号时进行丢失消隐的方法,方法包括
确定(40)对音频信号的频谱(46)的频谱矩心的频谱位置(48)进行测量的第一度量(42),
确定(50)对音频信号的时间可预测性进行测量的第二度量(52),
基于第一度量及第二度量,将不同丢失消隐工具(28)的集合(26)中的一个丢失消隐工具(62)分配(32)给音频信号(12)受丢失影响的一部分(22),以及
使用分配给部分(22)的一个丢失消隐工具(62)来恢复音频信号的部分(22)。
20.一种具有程序代码的计算机程序,用于当程序代码在处理器上运行时执行如权利要求19的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201142.1A EP3483878A1 (en) | 2017-11-10 | 2017-11-10 | Audio decoder supporting a set of different loss concealment tools |
EP17201142.1 | 2017-11-10 | ||
PCT/EP2018/080198 WO2019091924A1 (en) | 2017-11-10 | 2018-11-05 | Audio decoder supporting a set of different loss concealment tools |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111630591A true CN111630591A (zh) | 2020-09-04 |
CN111630591B CN111630591B (zh) | 2023-08-08 |
Family
ID=60301924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880086169.XA Active CN111630591B (zh) | 2017-11-10 | 2018-11-05 | 支持不同丢失消隐工具的集合的音频解码器 |
Country Status (19)
Country | Link |
---|---|
US (1) | US11315580B2 (zh) |
EP (3) | EP3483878A1 (zh) |
JP (1) | JP7073492B2 (zh) |
KR (1) | KR102424897B1 (zh) |
CN (1) | CN111630591B (zh) |
AR (1) | AR113571A1 (zh) |
AU (1) | AU2018363136B2 (zh) |
BR (1) | BR112020009117A2 (zh) |
CA (1) | CA3082268C (zh) |
ES (1) | ES2933273T3 (zh) |
FI (1) | FI3707705T3 (zh) |
MX (1) | MX2020004791A (zh) |
PL (1) | PL3707705T3 (zh) |
PT (1) | PT3707705T (zh) |
RU (1) | RU2759092C1 (zh) |
SG (1) | SG11202004223RA (zh) |
TW (2) | TWI704554B (zh) |
WO (1) | WO2019091924A1 (zh) |
ZA (1) | ZA202002522B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
WO2004114134A1 (en) * | 2003-06-23 | 2004-12-29 | Agency For Science, Technology And Research | Systems and methods for concealing percussive transient errors in audio data |
US20070118369A1 (en) * | 2005-11-23 | 2007-05-24 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US20080033718A1 (en) * | 2006-08-03 | 2008-02-07 | Broadcom Corporation | Classification-Based Frame Loss Concealment for Audio Signals |
US20080126096A1 (en) * | 2006-11-24 | 2008-05-29 | Samsung Electronics Co., Ltd. | Error concealment method and apparatus for audio signal and decoding method and apparatus for audio signal using the same |
EP2392003A1 (en) * | 2009-01-30 | 2011-12-07 | Telefonaktiebolaget LM Ericsson (publ) | Audio signal quality prediction |
US20150142452A1 (en) * | 2012-06-08 | 2015-05-21 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
US20150228287A1 (en) * | 2013-02-05 | 2015-08-13 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for controlling audio frame loss concealment |
US20160307576A1 (en) * | 2013-10-18 | 2016-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding of spectral coefficients of a spectrum of an audio signal |
US20160365097A1 (en) * | 2015-06-11 | 2016-12-15 | Zte Corporation | Method and Apparatus for Frame Loss Concealment in Transform Domain |
Family Cites Families (160)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
ATE503246T1 (de) | 2003-06-17 | 2011-04-15 | Panasonic Corp | Empfangsvorrichtung, sendevorrichtung und übertragungssystem |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
WO2005086139A1 (en) | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US9123350B2 (en) * | 2005-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
ATE447227T1 (de) | 2006-05-30 | 2009-11-15 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
EP2054882B1 (en) | 2006-08-15 | 2011-01-19 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US20110116542A1 (en) | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
CN101790757B (zh) | 2007-08-27 | 2012-05-30 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
JP5547081B2 (ja) | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
KR101162275B1 (ko) | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN102057424B (zh) | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
MX2011000369A (es) | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
TWI419148B (zh) | 2008-10-08 | 2013-12-11 | Fraunhofer Ges Forschung | 多解析度切換音訊編碼/解碼方案 |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CA2750795C (en) | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8352252B2 (en) * | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
ES2441069T3 (es) | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
WO2011044700A1 (en) | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
WO2011048118A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
PT2491553T (pt) | 2009-10-20 | 2017-01-20 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
KR101761629B1 (ko) | 2009-11-24 | 2017-07-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
MX2012008075A (es) | 2010-01-12 | 2013-12-16 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo. |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
ES2937066T3 (es) | 2010-07-20 | 2023-03-23 | Fraunhofer Ges Forschung | Decodificador de audio, procedimiento y programa informático para decodificación de audio |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101748760B1 (ko) | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
MX2013012301A (es) | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
EP2707873B1 (en) | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
CN103493130B (zh) * | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
WO2013149672A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US20130282373A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
CN103714821A (zh) * | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
KR101940740B1 (ko) * | 2013-10-31 | 2019-01-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
EP3063761B1 (en) | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
BR112016010197B1 (pt) | 2013-11-13 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
ES2827278T3 (es) * | 2014-04-17 | 2021-05-20 | Voiceage Corp | Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
PT3000110T (pt) | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
WO2016016724A2 (ko) | 2014-07-28 | 2016-02-04 | 삼성전자 주식회사 | 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치 |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017039422A2 (ko) | 2015-09-04 | 2017-03-09 | 삼성전자 주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 EP EP17201142.1A patent/EP3483878A1/en not_active Withdrawn
-
2018
- 2018-11-05 CA CA3082268A patent/CA3082268C/en active Active
- 2018-11-05 WO PCT/EP2018/080198 patent/WO2019091924A1/en active Search and Examination
- 2018-11-05 PT PT187966700T patent/PT3707705T/pt unknown
- 2018-11-05 CN CN201880086169.XA patent/CN111630591B/zh active Active
- 2018-11-05 MX MX2020004791A patent/MX2020004791A/es unknown
- 2018-11-05 BR BR112020009117-0A patent/BR112020009117A2/pt unknown
- 2018-11-05 AU AU2018363136A patent/AU2018363136B2/en active Active
- 2018-11-05 SG SG11202004223RA patent/SG11202004223RA/en unknown
- 2018-11-05 JP JP2020526135A patent/JP7073492B2/ja active Active
- 2018-11-05 FI FIEP18796670.0T patent/FI3707705T3/fi active
- 2018-11-05 PL PL18796670.0T patent/PL3707705T3/pl unknown
- 2018-11-05 EP EP22202282.4A patent/EP4152316A1/en active Pending
- 2018-11-05 EP EP18796670.0A patent/EP3707705B1/en active Active
- 2018-11-05 KR KR1020207015512A patent/KR102424897B1/ko active IP Right Grant
- 2018-11-05 ES ES18796670T patent/ES2933273T3/es active Active
- 2018-11-05 RU RU2020118968A patent/RU2759092C1/ru active
- 2018-11-09 TW TW107139910A patent/TWI704554B/zh active
- 2018-11-09 TW TW109131872A patent/TWI776236B/zh active
- 2018-11-12 AR ARP180103302A patent/AR113571A1/es active IP Right Grant
-
2020
- 2020-05-06 US US16/867,834 patent/US11315580B2/en active Active
- 2020-05-07 ZA ZA2020/02522A patent/ZA202002522B/en unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
WO2004114134A1 (en) * | 2003-06-23 | 2004-12-29 | Agency For Science, Technology And Research | Systems and methods for concealing percussive transient errors in audio data |
US20070118369A1 (en) * | 2005-11-23 | 2007-05-24 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US20080033718A1 (en) * | 2006-08-03 | 2008-02-07 | Broadcom Corporation | Classification-Based Frame Loss Concealment for Audio Signals |
US20080126096A1 (en) * | 2006-11-24 | 2008-05-29 | Samsung Electronics Co., Ltd. | Error concealment method and apparatus for audio signal and decoding method and apparatus for audio signal using the same |
EP2392003A1 (en) * | 2009-01-30 | 2011-12-07 | Telefonaktiebolaget LM Ericsson (publ) | Audio signal quality prediction |
US20150142452A1 (en) * | 2012-06-08 | 2015-05-21 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
US20150228287A1 (en) * | 2013-02-05 | 2015-08-13 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for controlling audio frame loss concealment |
US20160307576A1 (en) * | 2013-10-18 | 2016-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding of spectral coefficients of a spectrum of an audio signal |
US20160365097A1 (en) * | 2015-06-11 | 2016-12-15 | Zte Corporation | Method and Apparatus for Frame Loss Concealment in Transform Domain |
Non-Patent Citations (2)
Title |
---|
MK LEE等: "Speech quality estimation of voice over internet protocol codec using a packet loss impairment model", 《THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA》 * |
魏一方: "音频中的信息隐藏和隐藏分析技术研究", 《中国优秀硕士学位论文全文数据库》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111630591B (zh) | 2023-08-08 |
TW202125502A (zh) | 2021-07-01 |
TWI704554B (zh) | 2020-09-11 |
PL3707705T3 (pl) | 2023-02-20 |
TW201923749A (zh) | 2019-06-16 |
WO2019091924A1 (en) | 2019-05-16 |
EP3707705A1 (en) | 2020-09-16 |
SG11202004223RA (en) | 2020-06-29 |
JP7073492B2 (ja) | 2022-05-23 |
CA3082268C (en) | 2022-11-22 |
KR20200077575A (ko) | 2020-06-30 |
AU2018363136B2 (en) | 2021-10-07 |
MX2020004791A (es) | 2020-10-05 |
KR102424897B1 (ko) | 2022-07-25 |
EP3483878A1 (en) | 2019-05-15 |
PT3707705T (pt) | 2022-12-19 |
US20200265846A1 (en) | 2020-08-20 |
FI3707705T3 (fi) | 2023-01-31 |
AU2018363136A1 (en) | 2020-05-28 |
US11315580B2 (en) | 2022-04-26 |
EP3707705B1 (en) | 2022-10-19 |
EP4152316A1 (en) | 2023-03-22 |
RU2759092C1 (ru) | 2021-11-09 |
AR113571A1 (es) | 2020-05-20 |
BR112020009117A2 (pt) | 2020-10-13 |
CA3082268A1 (en) | 2019-05-16 |
TWI776236B (zh) | 2022-09-01 |
ES2933273T3 (es) | 2023-02-03 |
ZA202002522B (en) | 2021-05-26 |
JP2021502608A (ja) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11282529B2 (en) | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver, and system for transmitting audio signals | |
US11581003B2 (en) | Harmonicity-dependent controlling of a harmonic filter tool | |
KR101376762B1 (ko) | 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 | |
US20160358616A1 (en) | Methods for improving high frequency reconstruction | |
AU2018363701B2 (en) | Encoding and decoding audio signals | |
US20220284908A1 (en) | Encoder, decoder, encoding method and decoding method for frequency domain long-term prediction of tonal signals for audio coding | |
US11380341B2 (en) | Selecting pitch lag | |
CN111630591B (zh) | 支持不同丢失消隐工具的集合的音频解码器 | |
CN110998722B (zh) | 低复杂性密集瞬态事件检测和译码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |