CN1599983B - 用于检测谱的量化的方法和设备 - Google Patents

用于检测谱的量化的方法和设备 Download PDF

Info

Publication number
CN1599983B
CN1599983B CN02824110XA CN02824110A CN1599983B CN 1599983 B CN1599983 B CN 1599983B CN 02824110X A CN02824110X A CN 02824110XA CN 02824110 A CN02824110 A CN 02824110A CN 1599983 B CN1599983 B CN 1599983B
Authority
CN
China
Prior art keywords
spectrum
audio signal
amplitude
quantification
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN02824110XA
Other languages
English (en)
Other versions
CN1599983A (zh
Inventor
彼得·耶奥格·鲍姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
International Digital Madison Patent Holding SAS
Original Assignee
汤姆森许可贸易公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 汤姆森许可贸易公司 filed Critical 汤姆森许可贸易公司
Publication of CN1599983A publication Critical patent/CN1599983A/zh
Application granted granted Critical
Publication of CN1599983B publication Critical patent/CN1599983B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

公开了一种用于检测谱的量化的方法和设备。本发明包括已经根据心理声学原理压缩的音频数据的量化谱的获取。该谱可以借助于分类后(取对数后)的幅度大小的差别来识别。本发明的所要解决的问题是找到针对谱的量化度的灵敏指示符的基础。该计算的结果针对量化谱示出了:在相同量化等级的幅度处的几个较小值、以及在其中幅度已经达到较高的量化等级的位置处的明显峰值,而未量化的谱典型地类似于噪声。

Description

用于检测谱的量化的方法和设备
技术领域
本发明涉及一种音频编码和再次编码的方法和设备。
背景技术
按照符合心理声学原理的压缩方式来传送音频数据,并由接收机对该音频数据进行解码。对这些符合心理声学原理的解码后的数据重新压缩将造成质量的损失。如果可以检测并重用原始压缩的参数,则可以忽略这样的损失,例如,见EP-A-0746913。
用于检测这些针对使用谱的编解码器的这些参数的方法是利用不同参数的谱测试类计算。如果分析的参数(变换起始、窗类型、谱长度)与编解码器参数匹配,则所述的谱具有量化的外观。由于编解码器和分析计算的计算不精确性或不同的计算精度,量化后的谱看起来具有些微的噪声,即,相同量化等级的幅度将不具有相同的大小。
难度在于:谱是否具有“量化特性”,从而可以针对其对谱量化的影响,分析谱的不同参数。
由于压缩伴随着特定谱线的消失(参考在Herre,Jürgen;Michael Schug:Analysis of Decompressed Audio-The″InverseDecoder″,第109次AES会议,Los Angeles,2000年),对这些谱线进行计算,所述谱线小于阈值。
发明内容
本发明包括已经根据心理声学原理压缩的音频数据的量化谱的获取。该谱可以借助于分类后的(和取对数后的)幅度大小的差别来识别。
本发明的所要解决的问题是找到针对谱的量化度的灵敏指示符的基础。量化谱的结果示出了在相同量化等级的幅度处的几个较小值、以及在其中幅度已经达到较高的量化等级的位置处的明显峰值,而未量化的谱典型地类似于噪声。
在本发明的一个方面,提出了一种检测解码后的音频信号的谱的量化,以便检测和获取在编码所述音频信号时所使用的编码参数的方法,所述方法包括步骤:将解码后的音频信号的抽样转换到频域,从而使用作为测试参数的变换起始位置、窗类型或谱长度;在频域中对谱值的幅度进行分类;针对给定的测试参数的集合,评估分类后的谱值是否具有量化的外观。
在本发明的另一方面,提出了一种检测解码后的音频信号的谱的量化,以便检测和获取在编码所述音频信号时所使用的编码参数的设备,所述设备包括:谱转换器(1),用于将解码后的音频信号的抽样转换到频域,从而使用作为测试参数的变换起始位置、窗类型或谱长度;分类设备(2),用于在频域中对谱值的幅度进行分类;评估设备(4),用于针对给定的测试参数的集合评估分类后的谱值是否具有量化的外观。
原则上,本发明的方法适合于串联编解码器(tandem codecs)(解码-编码)。本发明还用在利用未知编解码器进行的逆向工程的过程中。
附图说明
参考附图来描述本发明的典型实施例,在附图中,
图1示出了解码后的音频信号的量化谱;
图2示出了未量化谱的幅度;
图3示出了分类后的图1)中的幅度;
图4示出了分类后的图2)中的幅度;
图5示出了从图3)中的差分后的分类谱;
图6示出了从图4)中的差分后的分类谱;
图7示出了检测器的简单方框图。
具体实施方式
图1示出了解码后的信号的量化谱的幅度。分析的参数(变换起始、窗类型、谱长度)与编解码器的参数匹配,因此,所述谱具有量化的外观。
与图1相比,图2示出了未量化的谱的幅度。因此,这些参数不与编解码器的参数匹配。
图3示出了从图1中的分类幅度,而图4示出了从图2中的未量化谱的分类幅度。
图5示出了从图3中的差分后的分类谱;而图6示出了从图4中的未量化谱的差分后的分类谱。
图5和6的比较将清楚地示出量化谱(图5)和非量化谱(图6)之间的差别。
下一个步骤是计算这些谱中的标量,这些标量将用作针对量化的指示符。
本发明将结合逆向编码器一起使用。通常,必须针对另一传输对编码和解码后的音频信号进行第二次编码。如果在第二编码器中的编码器参数与第一编码器中的编码器参数相同,则可以使编解码器的人为因素最小。逆向编码器设法获取这些参数。在这种情况下,如果谱看起来受到量化,则必须对其进行确定,这可以借助于本发明来实现。
逆向编码器的另一用途,因此也是本发明的另一用途在于再设计编解码器,以认证在知识产权领域的侵权。
图7示出了本发明的简单方框图。本发明的目的将时域抽样转换到频域,然后对频域中的幅度进行分类,之后,可选地对这些分类后的幅度取对数,并且最后评估分类后的谱值,例如,差分和检测第一峰值。

Claims (5)

1.一种检测解码后的音频信号的谱的量化,以便检测和获取在编码所述音频信号时所使用的编码参数的方法,所述方法包括步骤:
将解码后的音频信号的抽样转换(1)到频域,从而使用作为测试参数的变换起始位置、窗类型或谱长度;
在频域中对谱值的幅度进行分类(2);
针对给定的测试参数的集合,评估(4)分类后的谱值是否具有量化的外观。
2.根据权利要求1所述的方法,其特征在于:在所述评估步骤之前对谱值取对数(3)。
3.根据权利要求1或2所述的方法,其特征在于:对分类的谱值的幅度进行差分。
4.根据权利要求3所述的方法,其特征在于:为了确定所述谱的量化度,检测被分类并被差分的幅度中的第一峰值。
5.一种检测解码后的音频信号的谱的量化,以便检测和获取在编码所述音频信号时所使用的编码参数的设备,所述设备包括:
谱转换器(1),用于将解码后的音频信号的抽样转换到频域,从而使用作为测试参数的变换起始位置、窗类型或谱长度;
分类设备(2),用于在频域中对谱值的幅度进行分类;
评估设备(4),用于针对给定的测试参数的集合评估分类后的谱值是否具有量化的外观。
CN02824110XA 2001-12-06 2002-11-23 用于检测谱的量化的方法和设备 Expired - Fee Related CN1599983B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01250431A EP1318611A1 (en) 2001-12-06 2001-12-06 Method for retrieving a sensitive criterion for quantized spectra detection
EP01250431.2 2001-12-06
PCT/EP2002/013188 WO2003049306A1 (en) 2001-12-06 2002-11-23 Method for detecting the quantization of spectra

Publications (2)

Publication Number Publication Date
CN1599983A CN1599983A (zh) 2005-03-23
CN1599983B true CN1599983B (zh) 2010-04-14

Family

ID=8181620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02824110XA Expired - Fee Related CN1599983B (zh) 2001-12-06 2002-11-23 用于检测谱的量化的方法和设备

Country Status (8)

Country Link
US (1) US7318023B2 (zh)
EP (2) EP1318611A1 (zh)
JP (1) JP2005512137A (zh)
KR (1) KR100977961B1 (zh)
CN (1) CN1599983B (zh)
AU (1) AU2002356717A1 (zh)
DE (1) DE60203543T2 (zh)
WO (1) WO2003049306A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
KR101418248B1 (ko) 2007-04-12 2014-07-24 삼성전자주식회사 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
KR101317269B1 (ko) 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
TW202405797A (zh) * 2010-12-03 2024-02-01 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
US9311923B2 (en) * 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
EP2710588B1 (en) 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
US10726852B2 (en) 2018-02-19 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10733998B2 (en) 2017-10-25 2020-08-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services
US10629213B2 (en) 2017-10-25 2020-04-21 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US11049507B2 (en) 2017-10-25 2021-06-29 Gracenote, Inc. Methods, apparatus, and articles of manufacture to identify sources of network streaming services

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0309974A1 (de) * 1987-09-30 1989-04-05 Deutsche Thomson-Brandt GmbH Verfahren zur Übertragung eines Audio-Signals
US5535300A (en) * 1988-12-30 1996-07-09 At&T Corp. Perceptual coding of audio signals using entropy coding and/or multiple power spectra

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010047256A1 (en) * 1993-12-07 2001-11-29 Katsuaki Tsurushima Multi-format recording medium
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6529866B1 (en) * 1999-11-24 2003-03-04 The United States Of America As Represented By The Secretary Of The Navy Speech recognition system and associated methods

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0309974A1 (de) * 1987-09-30 1989-04-05 Deutsche Thomson-Brandt GmbH Verfahren zur Übertragung eines Audio-Signals
US5535300A (en) * 1988-12-30 1996-07-09 At&T Corp. Perceptual coding of audio signals using entropy coding and/or multiple power spectra

Also Published As

Publication number Publication date
EP1318611A1 (en) 2003-06-11
DE60203543T2 (de) 2005-09-15
CN1599983A (zh) 2005-03-23
EP1461871A1 (en) 2004-09-29
EP1461871B1 (en) 2005-03-30
US20050015241A1 (en) 2005-01-20
KR20050058262A (ko) 2005-06-16
WO2003049306A1 (en) 2003-06-12
US7318023B2 (en) 2008-01-08
JP2005512137A (ja) 2005-04-28
DE60203543D1 (de) 2005-05-04
KR100977961B1 (ko) 2010-08-24
AU2002356717A1 (en) 2003-06-17

Similar Documents

Publication Publication Date Title
KR100879976B1 (ko) 부호화 모델 선택
CN1599983B (zh) 用于检测谱的量化的方法和设备
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
US6311153B1 (en) Speech recognition method and apparatus using frequency warping of linear prediction coefficients
EP1667112B1 (en) Apparatus, method and medium for coding an audio signal using correlation between frequency bands
KR101764633B1 (ko) 오디오 신호 처리 방법 및 장치
JP2007523372A (ja) エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、周波数バンドのオーディオ信号を圧縮する方法、モジュール、およびコンピュータプログラム製品
JP2009511954A (ja) モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器
JP2005535920A (ja) バックエンドの音声検出装置を有する配信音声認識および方法
JP2000066691A (ja) オーディオ情報分類装置
JP2005512137A5 (zh)
US6954726B2 (en) Method and device for estimating the pitch of a speech signal using a binary signal
CN104091104B (zh) 多格式音频感知哈希认证的特征值提取及认证方法
CN101350198B (zh) 基于骨导的语音压缩水印方法
US6356213B1 (en) System and method for prediction-based lossless encoding
KR20090026504A (ko) 음성 신호의 스펙트럼 평가 방법 및 장치
WO1995020216A1 (en) Method and apparatus for indicating the emotional state of a person
JP2001007704A (ja) トーン成分データの適応オーディオ符号化方法
US20020095297A1 (en) Device and method for processing audio information
CN108877816A (zh) 基于qmdct系数的aac音频重压缩检测方法
CN105513600B (zh) 一种与时长相关的相同码率mp3双压缩检测方法
Bießmann et al. Estimating MP3PRO encoder parameters from decoded audio
JP2000268510A (ja) 符号化装置
CN109785848A (zh) 基于比例因子系数差值的aac双压缩音频检测方法
EP1143412A1 (en) Estimating the pitch of a speech signal using an intermediate binary signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: La France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190125

Address after: Paris France

Patentee after: International Digital Madison Patent Holding Co.

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

Effective date of registration: 20190125

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100414

Termination date: 20201123