CN111480198A - 用于标识网络流传输服务的源的方法、设备和制品 - Google Patents

用于标识网络流传输服务的源的方法、设备和制品 Download PDF

Info

Publication number
CN111480198A
CN111480198A CN201880081466.5A CN201880081466A CN111480198A CN 111480198 A CN111480198 A CN 111480198A CN 201880081466 A CN201880081466 A CN 201880081466A CN 111480198 A CN111480198 A CN 111480198A
Authority
CN
China
Prior art keywords
compression
artifact
configuration
trial
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880081466.5A
Other languages
English (en)
Inventor
Z·拉菲
M·克里默
B·金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nielsen Co US LLC
Original Assignee
Nielsen Co US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nielsen Co US LLC filed Critical Nielsen Co US LLC
Publication of CN111480198A publication Critical patent/CN111480198A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • H04H60/31Arrangements for monitoring the use made of the broadcast services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/65Arrangements characterised by transmission systems for broadcast
    • H04H20/76Wired systems
    • H04H20/82Wired systems using signals not modulated onto a carrier
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/95Arrangements characterised by the broadcast information itself characterised by a specific format, e.g. an encoded audio stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/003Digital PA systems using, e.g. LAN or internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

公开了用于标识网络流传输服务的源的方法、设备和制品。示例设备包括:编码格式标识器,该编码格式标识器从表示经解压缩的第二音频信号的所接收的第一音频信号标识压缩第三音频信号以形成该第二音频信号所使用的音频压缩配置;和源标识器,该源标识器基于标识出的音频压缩配置标识该第二音频信号的源。

Description

用于标识网络流传输服务的源的方法、设备和制品
技术领域
本公开总体上涉及网络流传输服务,并且更具体地,涉及用于标识网络流传输服务的源的方法、设备和制品。
背景技术
受众测量实体(AME)执行例如受众测量、受众分类、广告印象的测量、媒体暴露的测量等,并且将这样的测量信息与人口统计信息链接。AME可以基于注册的小组成员来确定媒体的受众参与度。也就是说,AME将同意接受监测的人纳入小组。AME然后监测那些小组成员以确定暴露给那些小组成员的媒体(例如,电视节目或广播节目、电影、DVD、广告、网站等)。
附图说明
图1例示了示例环境,在该示例环境中根据本发明的示例AME标识网络流传输服务的源。
图2是例示图1的示例编码格式标识器的示例实现方式的框图。
图3是例示图2的示例编码格式标识器的示例操作的图。
图4是示例得分和偏移的示例极坐标图。
图5是表示可以被实现为机器可读指令的示例过程的流程图,该机器可读指令可被执行以实现示例AME标识网络流传输服务的源。
图6是表示可以被实现为机器可读指令的另一示例过程的流程图,所述机器可读指令被执行以实现图1和/或图2的示例编码格式标识器以标识网络流传输服务的源。
图7例示了被构造为执行图6的示例机器可读指令以实现图1和/或图2的示例编码格式标识器的示例处理器平台。
尽可能地,将在整个附图和随附的书面描述中使用相同的附图标记来指代相同或相似的部件。在此包含的各个图中示出的连接线或者连接部旨在表示各个部件之间的示例功能关系和/或物理联接。
具体实施方式
当测量对媒体的暴露时,AME通常标识媒体的源(例如,电视节目或广播节目、电影、DVD、广告、网站等)。在一些示例中,媒体具有嵌入其中(例如,在音频信号部分中)的不易感知的受众测量代码,该受众测量代码允许确定媒体和媒体的源。然而,通过网络流传输媒体服务(例如,
Figure BDA0002543172050000021
AMAZON
Figure BDA0002543172050000022
APPLE
Figure BDA0002543172050000023
等)输送的媒体可能不包括受众测量代码,这使得媒体源的标识变得困难,导致难以确定媒体源。
已经有利地发现,在一些情况下,不同的流传输媒体源(例如,
Figure BDA0002543172050000024
Figure BDA0002543172050000025
AMAZON
Figure BDA0002543172050000026
APPLE
Figure BDA0002543172050000027
等)使用不同的音频压缩配置来存储和流传输它们所托管的媒体。在一些示例中,音频压缩配置是定义尤其音频编码格式(例如,MP1、MP2、MP3、AAC、AC-3、Vorbis、WMA、DTS等)、压缩参数、成帧参数等的一组一个或更多个参数。因为不同的源使用不同的音频压缩,所以可以基于应用于媒体的音频压缩来区分源(例如,被标识、被检测、被确定等)。媒体在播放期间被解压缩。在一些示例中,使用用于压缩假象的多个不同试用音频压缩配置来压缩经解压缩的音频信号。因为当特定音频压缩配置匹配原始编码期间使用的压缩时,压缩假象变得可检测(例如,可感知、可标识、可区别等),所以压缩假象的存在可用于将多个试用音频压缩配置中的一个标识为原始使用的音频压缩配置。在标识出压缩配置之后,AME可以推断音频的原始源。示例压缩假象是频谱图中的点之间的不连续、频谱图中的小(例如,低于阈值、相对于频谱图中的其它点而言)的多个点、频谱图中具有与其它值(例如,大量小值)不成比例的出现概率的一个或更多个值等。在两个或更多个源使用相同的音频压缩配置且与多个压缩假象相关联的示例中,音频压缩配置可以用以减少要考虑的源的数量。然后可以使用其它方法来在源之间进行区分。然而,为了简化说明,本文中所公开的示例假设多个源与多个不同音频压缩配置相关联。
所公开的示例通过标识应用于媒体(例如,应用于媒体的音频部分)的音频压缩来标识媒体的源。在一些示例中,音频压缩标识包括对音频信号已经历的压缩的标识,而与内容无关。压缩标识可以包括例如对编码音频数据的比特率、在时间-频率分析阶段使用的参数、音频信号中的在应用加窗和变换之前发生成帧的样本等的标识。如本文所公开的,从已解压缩并且使用诸如扬声器之类的音频装置输出并被记录的媒体能够标识音频压缩。经过有损压缩和解压缩的所记录的音频可以根据不同的试用音频压缩而被重新压缩。在一些示例中,得到最大压缩假象的试用重新压缩被标识为原始压缩该媒体所使用的音频压缩。标识出的音频压缩被用于标识媒体的源。虽然本文中所公开的示例仅部分地重新压缩音频,例如仅执行压缩的时间-频率分析阶段,但可以执行完整的重新压缩。
现在将详细参照本公开的非限定性示例,其示例例示出于附图中。下面通过参照附图来描述示例。
图1例示了示例环境100,在该示例环境100中根据本发明的示例AME 102标识网络流传输服务的源。为了提供媒体104(例如,歌曲、包括视频109和音频110的电影105、电视节目、游戏等),示例环境100包括一个或更多个流传输媒体源(例如,
Figure BDA0002543172050000031
AMAZON
Figure BDA0002543172050000032
APPLE
Figure BDA0002543172050000033
等),其示例在附图标记106处指定。为了从音频信号111形成经压缩的音频信号(例如,视频节目105的音频110),示例媒体源106包括示例音频压缩器112。在一些示例中,音频由音频压缩器112(或在别处实现的另一压缩器)压缩且存储于媒体数据存储108中以用于后续再调用和流传输。音频信号可由示例音频压缩器112使用任何数量和/或类型的音频压缩配置(例如,音频编码格式(例如,MP1、MP2、MP3、AAC、AC-3、Vorbis、WMA、DTS等)、压缩参数、成帧参数等)来压缩。可以使用任何数量和/或类型的数据结构将媒体存储在示例媒体数据存储108中。媒体数据存储108可以使用任何数量和/或类型的非易失性和/或易失性计算机可读存储装置和/或存储盘来实现。
为了呈现(例如,播放、输出、显示等)媒体,图1的示例环境100包括任何数量和/或类型的示例媒体呈现装置,其中的一个在附图标记114处指定。示例媒体呈现装置114包括但不限于游戏控制台、个人计算机、膝上型计算机、平板电脑、智能电话、电视机、机顶盒、或更一般地能够呈现媒体的任何装置。示例媒体源106使用任何数量和/或类型的示例公共和/或公共网络116或更一般地任何数量和/或类型的通信链路来向示例媒体呈现装置114提供媒体104(例如,包括经压缩的音频110的电影105)。
为了呈现(例如,播放、输出等)音频(例如,歌曲、视频的音频部分等),示例媒体呈现装置114包括示例音频解压缩器118和示例音频输出装置120。示例音频解压缩器118解压缩音频110以形成经解压缩的音频122。在一些示例中,音频压缩器112在经压缩的音频110中向音频解压缩器118指出音频压缩器112用来压缩该音频的音频压缩配置。经解压缩的音频122由示例音频输出装置120输出为可听信号124。示例音频输出装置120包括但不限于扬声器、音频放大器、耳机等。虽然未示出,但是示例媒体呈现装置114可以包括可以呈现诸如视频信号之类的信号的附加输出装置、端口等。例如,电视机包括显示板,机顶盒包括视频输出端口等。
为了记录可听音频信号124,图1的示例环境100包括示例记录器126。图1的示例记录器126是能够捕捉、存储和传送可听音频信号124的任何类型的装置。在一些示例中,记录器126由本申请的申请人Nielsen公司拥有和操作的人员计量器实现。在一些示例中,媒体呈现装置114是可以输出音频124并利用连接的或集成的麦克风记录音频124的装置(例如,个人计算机、膝上型计算机等)。在一些示例中,经解压缩的音频122在不被输出的情况下被记录。由示例音频记录器126记录的音频信号128被传送到示例AME 102用于分析。
为了标识与可听音频信号124相关联的媒体源106,示例AME 102包括示例编码格式标识器130和示例源标识器132。示例编码格式标识器130标识由音频压缩器112应用以形成经压缩的音频信号110的音频压缩。编码格式标识器130从由音频输出装置120输出并由音频记录器126记录的解压缩音频信号124标识音频压缩。已在音频压缩器112处经历有损压缩且在音频解压缩器118处经历解压缩的所记录的音频128由编码格式标识符130根据多个不同试用音频压缩类型及/或设定而重新压缩。在一些示例中,导致最大压缩假象的试用重新压缩被编码格式标识器130标识为在音频压缩器112处用于原始压缩该媒体的音频压缩。
图1的示例源标识器130使用标识出的音频压缩来标识媒体104的源106。在一些示例中,源标识器130使用查找表来标识与编码格式标识器130标识出的音频压缩相关联的媒体源106,或缩小用于标识媒体源106的搜索空间。媒体104和媒体源106的关联以及其他数据(例如时间、日期、受众、位置等)被记录在示例暴露数据库134中,以用于受众测量统计的后续发展。
图2是例示了图1的示例编码格式标识器130的示例实现的框图。图3是例示了图2的示例编码格式标识器130的示例操作的示图。为了便于理解,建议感兴趣的读者参考图3连同图2。只要可能,在图2和图3以及所附的书面描述中使用相同的附图标记指代相同或相似的部件。
为了存储(例如,缓冲、保持等)所记录的音频128的传入样本,示例编码格式标识器130包括示例缓冲器202。图2的示例缓冲器202可以使用任何数量和/或类型的非易失性和/或易失性计算机可读存储装置和/或存储盘来实现。
为了执行时间-频率分析,示例编码格式标识器130包括示例时间-频率分析器204。图2的示例时间-频率分析器204对所记录的音频128加窗(例如,缓冲器202的由滑动或移动窗界定的区段),且估计每一窗中的所记录的音频128的频谱内容。
为了获得示例缓冲器202的部分,示例编码格式标识器130包括示例加窗器206。图2的示例加窗器206可以被配置成从缓冲器202获得要处理的所记录的音频128的L个样本的窗S1:L,S2:L+1,SN/2+1:L+N/2(例如,区段、部分等)。示例加窗器206获得缓冲器202中的以指定起始偏移1,2,N/2+1开始的指定数量的样本。加窗器206可配置以将加窗函数应用于所获得的样本的窗S1:L,S2:L+1,SN/2+1:L+N/2以减少频谱泄漏。可以实现任何数量和/或类型的窗函数,包括例如矩形窗、正弦窗、斜窗、Kaiser-Bessel得到的窗等。
为了将所获得并由加窗器206加窗的样本转换为频谱图(在附图标记304、305和306处指定了其中的三个频谱图),图2的示例编码格式标识器130包括示例变换器210。变换器210可以计算任何数量和/或类型的变换,包括但不限于多相正交滤波(PQF)、修改的离散余弦变换(MDCT)、其混合等。示例变换器210将每个窗S1:L,S2:L+1,SN/2+1:L+N/2变换成对应的频谱图304、305、306。
为了计算压缩假象,图2的示例编码格式标识器130包括示例假象计算器212。图2的示例假象计算器212检测频谱图304-306中的小值(例如已经量化为零的值)。频谱图304-306中的小值表示压缩假象,并且在一些示例中用于确定试用音频压缩何时对应于由音频压缩器112(图1)应用的音频压缩。
为了计算频谱图304-306的值的平均,图2的假象计算器212包括示例平均器214。图2的示例平均器214计算样本块202的多个窗S1:L,S2:L+1,SN/2+1:L+N/2的对应频谱图304-306的值的平均A1,A2,…AN/2+1。平均器214可以计算各种均值,例如算术均值、几何均值等。假设音频内容在两个相邻频谱图304,305,…306之间保持近似相同,则平均A1,A2,…AN/2+1也将是类似的。然而,当音频压缩配置和成帧与在音频压缩器112处使用的那些匹配时,小值将出现在特定频谱图304-306中,并且将出现平均A1,A2,…AN/2+1之间的差D1,D2,…DN/2。在一些示例中,可以使用频谱图304-306中这些小值的存在和/或平均A1,A2,…AN/2+1之间的差D1,D2,…DN/2来标识试用音频压缩配置何时导致压缩假象。
为了检测小值,示例假象计算器212包括示例差分器216。图2的示例差分器216计算使用不同窗位置1,2,…N/2+1计算的频谱图304-306的平均A1,A2,…AN/2+1之间的差D1,D2,…DN/2。当频谱图304-306具有表示潜在压缩假象的小值时,其将具有比其它窗位置的频谱图304-306小的频谱图平均A1,A2,…AN/2+1。因此,其与其它窗位置的频谱图304-306的差D1,D2,…DN/2将大于频谱图304-306的其它对之间的差D1,D2,…DN/2。在一些示例中,差分器216计算绝对(例如,正值)差。
为了标识频谱图304-306的平均A1,A2,…AN/2+1之间的最大差D1,D2,…DN/2,图2的示例假象计算器212包括示例峰标识器218。图2的示例峰标识器218标识多个窗位置1,2,…N/2+1的最大的差D1,D2,…DN/2。最大的差D1,D2,…DN/2对应于由音频压缩器112使用的窗位置1,2,…N/2+1。如在图3的示例中所示,峰标识器218标识具有最大值的差D1,D2,…DN/2。如下文将解释的,在一些示例中,最大值被认为是置信得分308(例如,其值越大,则发现压缩假象的置信度越高),并且与偏移310(例如,1,2,…N/2+1)相关联,该偏移310表示与平均A1,A2,…AN/2+1相关联的窗S1:L,S2:L+1,SN/2+1:L+N/2的位置。示例峰标识器218将置信得分308和偏移310存储在编码格式得分数据存储220中。可以使用任何数量和/或类型的数据结构将置信得分308和偏移310存储在示例编码格式得分数据存储220中。可以使用任何数量和/或类型的非易失性和/或易失性计算机可读存储装置和/或存储盘来实现编码格式得分数据存储220。
差D1,D2,…DN/2中的峰标称地在信号中以每T个样本出现。在一些示例中,T是编码格式的时间-频率分析阶段的跳跃大小,其通常为窗长度L的一半。在一些示例中,来自较长音频记录的多个样本块的置信得分308和偏移310被组合,以增加编码格式标识的准确性。在一些示例中,忽略具有低于选定阈值的得分的块。在一些示例中,该阈值可以是根据差计算的统计量,例如,最大值除以均值。在一些示例中,也可以首先将差异归一化,例如通过使用标准得分。为了组合置信得分308和偏移310,示例编码格式标识器130包括示例后处理器222。图2的示例后处理器222将置信得分308和偏移310的对变换到极坐标。在一些示例中,置信得分308被变换成半径(例如,以分贝表示),并且偏移310被变换成角度(例如,以弧度表示,以其周期为模)。在一些示例中,示例后处理器222计算这些极坐标点的圆均值(即,在围绕原点的圆区域上计算的均值),并且获得平均极坐标点,该平均极坐标点的半径对应于总体置信得分224。在一些示例中,可通过将圆均值乘以得分高于选定阈值的块的数量来计算圆和。点对在圆中彼此越接近,并且它们离中心越远,则总体置信得分224越高。在一些示例中,后处理器222通过将圆均值与得分高于选定阈值的块的数量相乘来计算圆和。示例后处理器222使用任意数量和/或类型的数据结构将总体置信得分224存储在编码格式得分数据存储220中。图4示出了对于五种不同的音频压缩配置:MP3、AAC、AC-3、Vorbis和WMA,得分和偏移的示例对的示例极坐标图400。如图4中所示,AC-3编码格式具有多个点(例如,参见示例区域402中的示例点),这些点具有与其他编码格式类似的角度(例如,类似的窗偏移)和较大的得分(例如,较大的半径)。如果针对每个配置计算圆均值,则MP3、AAC、Vorbis和WMA的均值将接近原点,而AC-3的均值将区别于原点,这表示该音频128是用AC-3编码格式原始压缩的。
为了存储各组音频压缩配置,图2的示例编码格式标识器130包括示例压缩配置数据存储226。为了控制编码格式标识,图2的示例编码格式标识器130包括示例控制器228。为了标识应用于音频128的音频压缩,示例控制器228用不同的压缩配置来配置时间-频率分析器204。对于试用压缩配置(例如AC-3)与多个窗偏移中的每个的组合,时间-频率分析器204计算频谱图304-306。示例假象计算器212和示例后处理器222确定每个试用压缩配置的总体置信得分224。示例控制器228将多个试用压缩配置中具有最大总体置信得分224的一个试用压缩配置标识(例如选择)为已应用于音频128的压缩配置。
可以使用任何数量和/或类型的数据结构将压缩配置存储在示例压缩配置数据存储226中。压缩配置数据存储226可以使用任何数量和/或类型的非易失性和/或易失性计算机可读存储装置和/或存储盘来实现。图2的示例控制器228可以使用例如电路、逻辑回路、可编程处理器、可编程控制器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)和/或现场可编程逻辑器件(FPLD)中的每一种中的一个或更多个来实现。
虽然在图2中示出了编码格式标识器130的示例实现方式,但是可以附加地和/或另选地使用其他实现方式,诸如机器学习等。虽然在图2中例示了编码格式标识器130的示例方式,但是图2中例示的元件、处理和/或装置中的一个或更多个可以以任何其他方式来组合、划分、重新布置、省略、消除和/或以其他方式实施。此外,示例时间-频率分析器204、示例加窗器206、示例变换器210、示例假象计算机212、示例平均器214、示例差分器216、示例峰标识器218、示例后处理器222、示例控制器228和/或更一般地,图2的示例编码格式标识器130可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此,例如,示例时间-频率分析器204、示例加窗器206、示例变换器210、示例假象计算器212、示例平均器214、示例差分器216、示例峰标识器218、示例后处理器222,示例控制器228和/或更一般地,示例编码格式标识器130中的任一项可以由一个或更多个模拟或数字电路、逻辑回路、可编程处理器、可编程控制器、GPU、DSP、ASIC、PLD、FPGA和/或FPLD实现。当阅读本专利的任何设备或系统权利要求以涵盖纯软件和/或固件实现方式时,示例时间-频率分析器204、示例加窗器206、示例变换器210、示例假象计算器212、示例平均器214、示例差分器216、示例峰标识器218、示例后处理器222,示例控制器228和/或示例编码格式标识器130中的至少一项在此明确定义为包括非暂时性计算机可读存储装置或存储盘,诸如存储器、数字通用盘(DVD)、质密盘(CD)、蓝光盘等,其中包括该软件和/或该固件。更进一步地,图1的示例编码格式标识器130可以包括除了图2中所示的那些元件、处理和/或装置外或者代替的一个或更多个元件、处理和/或装置,和/或可以包括所例示的元件、处理和装置中的任何或全部中的超过一个。
在图5中示出了表示用于实现图1的示例AME 102的示例机器可读指令的流程图。在此示例中,机器可读指令包含用于由处理器(例如,下文结合图7所论述的示例处理器平台700中所示出的处理器710)执行的程序。该程序可以以存储在非暂时性计算机可读存储介质(如CD-ROM、软盘、硬盘驱动器、数字通用盘(DVD)、蓝光盘,或与处理器710相关联的存储器)上的软件来实施,但整个程序和/或其部分可以另选地通过除了处理器710以外的其它装置来执行,和/或按固件或专用硬件来实施。此外,尽管参考图5所例示的流程图描述了示例程序,可以另选地使用许多其他方法来实现示例AME 102。在一些示例中,可以改变各个框的执行顺序,以及/或者可以改变、消除或组合所描述的一些框。此外,和/或另选地,任何或所有框可以由一个或更多个硬件电路(例如,离散和/或集成模拟和/或数字电路、FPGA、ASIC、比较器、运算放大器(op-amp)、逻辑电路等)来实现,这些硬件电路被构造为在不执行软件或固件的情况下执行相应的操作。
图5的示例程序开始于框502,其中AME 102接收表示经解压缩的第二音频信号(例如示例音频信号110)的第一音频信号(例如,示例音频信号128)(框502)。示例编码格式标识器130从第一音频信号标识压缩第三音频信号(例如示例音频信号111)以形成第二音频信号时所使用的音频压缩配置(框504)。示例源标识器132基于标识出的音频压缩配置来标识第二音频信号的源(框506)。控制从图4的示例程序退出。
在图6中示出了表示用于实现图1和/或图2的示例编码格式标识器130的示例机器可读指令的流程图。在此示例中,机器可读指令包含用于由处理器(例如,下文结合图7所讨论的示例处理器平台700中所示出的处理器710)执行的程序。该程序可以以存储在非暂时性计算机可读存储介质(如CD-ROM、软盘、硬盘驱动器、数字通用盘(DVD)、蓝光盘,或与处理器710相关联的存储器)上的软件来实施,但整个程序和/或其部分可以另选地通过除了处理器710以外的其它装置来执行,和/或按固件或专用硬件来实施。此外,尽管参考图6所例示的流程图描述了示例程序,可以另选地使用许多其他方法来实现示例编码格式标识器130。在一些示例中,可以改变各个框的执行顺序,以及/或者可以改变、消除或组合所描述的一些框。此外,和/或另选地,任何或所有框可以由一个或更多个硬件电路(例如,离散和/或集成模拟和/或数字电路、FPGA、ASIC、比较器、运算放大器(op-amp)、逻辑电路等)来实现,这些硬件电路被构造为在不执行软件或固件的情况下执行相应的操作。
图6的示例程序开始于框602,其中对于每组试用压缩配置、每个样本块202(框603)和每个窗偏移M(框604),示例加窗器206创建窗SM:L+M(框606),并且示例变换器210计算窗SM:L+M的频谱图304-306(框608)。平均214计算频谱图304-306的平均AM(框610)。当已经为每个窗偏移M计算了频谱图304-306的平均AM时(框612),示例差216计算平均AM的对之间的差D1,D2,…DN/2(框614)。示例峰标识器218标识最大差(框616),并将最大的差作为得分308并将相关联的偏移M作为偏移310存储在编码格式得分数据存储220中(框618)。
当已经处理了所有块时(框620),示例后处理器222将当前考虑的试用编码格式参数集的得分308和偏移310对变换到极坐标,并且在极坐标中计算对的圆均值作为当前考虑的压缩配置的总体置信得分(框622)。
当已经处理了所有试用压缩配置时(框624),控制器228将具有最大总体置信得分的试用压缩配置组标识为由音频压缩器112应用的音频压缩(框626)。然后,控制从图6的示例程序退出。
另外或另选地,图6至图8的示例方法可以利用存储在非暂时性计算机和/或机器可读介质(如硬盘驱动器、闪速存储器、只读存储器、光盘、数字通用盘、高速缓冲存储器、随机存取存储器和/或其中存储信息达任何持续时间(例如,达延长时段、永久性地、短暂地、用于临时缓冲和/或用于信息的高速缓存)的任何其它存储装置或存储盘)上的编码指令(例如,计算机和/或机器可读指令)来实现。如在此使用的,术语“非暂时性计算机可读介质”被明确地限定成包括任何类型的计算机可读存储装置和/或存储盘,并且排除传播信号和排除传输介质。
图7是能够执行图6的指令以实现图1和/或图2的编码格式标识器130的示例处理器平台700的框图。处理器平台700可以是例如服务器、个人计算机、工作站或任何其他类型的计算装置。
所例示的示例的处理器平台900包括处理器710。所例示的示例的处理器710是硬件。例如,处理器710可以通过来自任何期望系列或制造方的一个或更多个集成电路、逻辑回路、微处理器或控制器来实现。硬件处理器可以是基于半导体(例如,基于硅)的器件。在该示例中,处理器实现示例时间-频率分析器204、示例加窗器206、示例变换器210、示例假象计算器212、示例平均器214、示例差分器216、示例峰标识器218、示例后处理器222和示例控制器228。
所例示的示例的处理器710包括本地存储器712(例如,缓存器)。所示例的示例的处理器710经由总线718与包括易失性存储器714和非易失性存储器716的主存储器通信。易失性存储器714可以通过同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、
Figure BDA0002543172050000101
动态随机存取存储器(RDRAM)、和/或任何其它类型的随机存取存储器装置来实现。非易失性存储器716可以通过闪速存储器和/或任何其它希望类型的存储器设备来实现。对主存储器714、716的访问由存储器控制器(未示出)控制。在该示例中,本地存储器712和/或存储器714实现缓冲器202。
所例示的示例的处理器平台700还包括接口电路720。接口电路720可以通过任何类型的接口标准来实现,诸如以太网接口、通用串行总线(USB)接口、
Figure BDA0002543172050000111
接口、近场通信(NFC)接口和/或外围组件接口(PCI)快速接口。
在所例示的示例中,一个或更多个输入装置722连接至接口电路720。该输入装置722准许用户将数据和命令输入到处理器712中。该输入装置例如可以通过音频传感器、麦克风、摄像机(静态或视频)、键盘、按钮、鼠标、触摸屏、触控板、轨迹球、等值点指示器和/或话音标识系统来实现。
一个或更多个输出装置724也连接至所例示的示例的接口电路920。该输出装置924例如可以通过显示装置(例如,发光二极管(LED)、有机发光二极管(OLED)、液晶显示器、阴极射线管显示器(CRT)、触摸屏、触控输出装置、打印机和/或扬声器)来实现。所例示的示例的接口电路720由此通常包括图形驱动器卡、图形驱动器芯片或图形驱动器处理器。
所例示的示例的接口电路720还包括诸如发送器、接收器、收发器、调制解调器和/或网络接口卡这样的通信装置,以易于经由网络926(例如,以太网连接、数字用户线路(DSL)、电话线、同轴线缆、蜂窝电话系统等)与外部机器(例如,任何种类的计算装置)交换数据。在Wi-Fi系统的一些示例中,接口电路720包括射频(RF)模块、天线、放大器、滤波器、调制器等。
所例示的示例的处理器平台700还包括:用于存储软件和/或数据的一个或更多个大规模存储装置728。这种大规模存储装置728的示例包括软盘驱动器、硬盘驱动器、CD驱动器、蓝光盘驱动器、独立盘冗余阵列(RAID)系统和DVD驱动器。
图6至图8的编码指令932可以存储在大规模存储装置728中、易失性存储器714中、非易失性存储器716中、和/或诸如CD或DVD这样的可去除的非暂时性计算机可读存储介质上。
从上文可以理解,已经公开了标识网络流传输服务的源的示例方法、设备和制品。从上文可以理解,已经公开了增强计算机的操作以提高标识网络流传输服务的源的正确性和可能性的方法、设备和制品。在一些示例中,基于用于执行网络流传输服务的源标识的上述技术,可以使计算机操作更高效、准确和鲁棒。即,通过使用这些处理,计算机通过相对快速地执行网络流传输服务的源标识可以更有效地工作。此外,本文公开的示例方法、设备和/或制品标识并克服了现有技术中执行网络流传输服务的源标识的不准确性和低能力。
本文公开了用于标识网络流传输服务的源的示例方法、设备和制品。另外的示例及其组合包括至少以下各项。
示例1是一种设备,包括:
编码格式标识器,所述编码格式标识器从表示经解压缩的第二音频信号的所接收的第一音频信号标识出压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;和
源标识器,所述源标识器基于标识出的音频压缩配置标识所述第二音频信号的源。
示例2是示例1的设备,所述设备还包括:
时间-频率分析器,所述时间-频率分析器根据第一试用压缩配置执行对所述第一音频信号的第一块的第一时间-频率分析,并且根据第二试用压缩配置执行对所述第一音频信号的所述第一块的第二时间-频率分析;
假象计算器,所述假象计算器确定从所述第一时间-频率分析得到的第一压缩假象,并且确定从所述第二时间-频率分析得到的第二压缩假象;和
控制器,所述控制器基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例3是示例2的设备,其中,所述控制器基于第一压缩假象和第二压缩假象在第一试用压缩配置和第二试用压缩配置之间的选择包括比较所述第一压缩假象和所述第二压缩假象。
示例4是示例2的设备,其中:
所述时间-频率分析器根据所述第一试用压缩配置执行对所述第一音频信号的第二块的第三时间-频率分析,且根据所述第二试用压缩配置执行对所述第一音频信号的所述第二块的第四时间-频率分析;
所述假象计算器确定从所述第三时间-频率分析得到的第三压缩假象,并且确定从所述第四时间-频率分析得到的第四压缩假象;并且
所述控制器基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例5是示例4的设备,所述设备还包括后处理器,所述后处理器组合所述第一压缩假象和所述第三压缩假象以形成第一得分,并组合所述第二压缩假象和所述第四压缩假象以形成第二得分,其中,所述控制器通过比较所述第一得分和所述第二得分在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例6是示例5的设备,其中,所述后处理器通过以下处理组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
示例7是示例1的设备,其中,所述第一音频信号在媒体呈现装置处被记录。
示例8是一种方法,所述方法包括以下步骤:
接收表示经解压缩的第二音频信号的第一音频信号;
从所述第一音频信号标识出压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;并且
基于标识出的音频压缩配置标识所述第二音频信号的源。
示例9是示例8的方法,其中,基于标识出的音频压缩配置标识第二音频信号的源包括:
基于标识出的音频压缩配置标识编码格式;并且
基于所述编码格式标识所述源。
示例10是示例8的方法,其中,从第一音频信号标识所述音频压缩配置包括:
根据第一试用压缩配置执行对所述第一音频信号的第一块的第一时间-频率分析;
确定从所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行对所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例11是示例10的方法,其中,基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择包括比较所述第一压缩假象和所述第二压缩假象。
示例12是示例10的方法,进一步包括:
根据所述第一试用压缩配置执行对所述第一音频信号的第二块的第三时间-频率分析;
确定从所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行对所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例13是示例12的方法,其中,基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置包括:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
示例14是示例13的方法,其中,组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分包括:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
示例15是示例8的方法,其中,所述第一音频信号在媒体呈现装置处被记录。
示例16是示例8的方法,其中,音频压缩配置指示时间-频率变换、窗函数或窗长度中的至少一项。
示例17是一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括指令,所述指令在被执行时使机器执行操作,所述操作包括:
接收表示经解压缩的第二音频信号的第一音频信号;
从所述第一音频信号标识压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;并且
基于标识出的音频压缩配置标识所述第二音频信号的源。
示例18是示例17的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理基于标识出的音频压缩配置标识所述第二音频信号的源:
基于标识出的音频压缩配置标识编码格式;并且
基于所述编码格式标识所述源。
示例19是示例17的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理从所述第一音频信号标识所述音频压缩配置:
根据第一试用压缩配置执行所述第一音频信号的第一块的第一时间-频率分析;
确定由所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例20是示例19的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器:
根据所述第一试用压缩配置执行所述第一音频信号的第二块的第三时间-频率分析;
确定由所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象,在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例21是示例20的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
示例22是示例21的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
实施例23是一种方法,所述方法包括以下步骤:
接收表示经解压缩的第二音频信号的第一音频信号,所述第二音频信号通过根据音频压缩配置压缩第三音频信号而形成;
根据第一试用压缩配置执行所述第一音频信号的第一块的第一时间-频率分析;
确定由所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例24是示例23的方法,其中,基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置的步骤包括比较所述第一压缩假象和所述第二压缩假象。
实施例25是实施例23的方法,所述方法还包括:
根据所述第一试用压缩配置执行所述第一音频信号的第二块的第三时间-频率分析;
确定由所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
示例26是示例25的方法,其中,基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置的步骤包括:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
示例27是示例26的方法,其中,组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分的步骤包括:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
“包含”和“包括”(及其所有形式和时态)在本文中被用作开放式术语。因此,每当权利要求在任何形式的“包含”或“包括”(例如,单数形式的包含、单数形式的包括、包含有、包括有、具有等)之后列出任何内容时,应当理解,可以存在附加的元件、项目等,而不落在相应权利要求的范围之外。如在此使用的,当短语“至少”被用作权利要求书前序部分中的过渡术语时,其和开放式术语“包括”按相同方式是开放的。诸如“和”、“或”、“和/或”等连词是包含性的,除非上下文另有明确规定。例如,“A和/或B”包括单独的A、单独的B和A连通B。在本说明书和所附权利要求中,单数形式“一”和“所述”不排除复数,除非上下文另有明确说明。
本文引用的任何参考文献(包括出版物、专利申请和专利)在此引入作为参考,其程度与单独地和具体地指示每个参考文献引入作为参考并在本文中全文阐述的程度相同。
虽然本文公开了某些示例方法、设备和制品,但是本专利的覆盖范围不限于此。相反,本专利涵盖完全落入本专利权利要求书的范围内的所有方法、设备和制品。

Claims (27)

1.一种设备,所述设备包括:
编码格式标识器,所述编码格式标识器从表示经解压缩的第二音频信号的所接收的第一音频信号标识出压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;和
源标识器,所述源标识器基于标识出的音频压缩配置标识所述第二音频信号的源。
2.根据权利要求1所述的设备,所述设备还包括:
时间-频率分析器,所述时间-频率分析器根据第一试用压缩配置执行对所述第一音频信号的第一块的第一时间-频率分析,并且根据第二试用压缩配置执行对所述第一音频信号的所述第一块的第二时间-频率分析;
假象计算器,所述假象计算器确定从所述第一时间-频率分析得到的第一压缩假象,并且确定从所述第二时间-频率分析得到的第二压缩假象;和
控制器,所述控制器基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
3.根据权利要求2所述的设备,其中,所述控制器基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间的选择包括比较所述第一压缩假象和所述第二压缩假象。
4.根据权利要求2所述的设备,其中:
所述时间-频率分析器根据所述第一试用压缩配置执行对所述第一音频信号的第二块的第三时间-频率分析,并且根据所述第二试用压缩配置执行对所述第一音频信号的所述第二块的第四时间-频率分析;
所述假象计算器确定从所述第三时间-频率分析得到的第三压缩假象,并且确定从所述第四时间-频率分析得到的第四压缩假象;并且
所述控制器基于第一压缩假象、第二压缩假象、第三压缩假象和第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
5.根据权利要求4所述的设备,所述设备还包括后处理器,所述后处理器组合所述第一压缩假象和所述第三压缩假象以形成第一得分,并且组合所述第二压缩假象和所述第四压缩假象以形成第二得分,其中,所述控制器通过比较所述第一得分和所述第二得分在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
6.根据权利要求5所述的设备,其中,所述后处理器通过以下处理组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
7.根据权利要求1所述的设备,其中,所述第一音频信号在媒体呈现装置处被记录。
8.一种方法,所述方法包括以下步骤:
接收表示经解压缩的第二音频信号的第一音频信号;
从所述第一音频信号标识出压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;并且
基于标识出的音频压缩配置标识所述第二音频信号的源。
9.根据权利要求8所述的方法,其中,基于标识出的音频压缩配置标识所述第二音频信号的源的步骤包括:
基于标识出的音频压缩配置标识编码格式;并且
基于所述编码格式标识所述源。
10.根据权利要求8所述的方法,其中,从所述第一音频信号标识所述音频压缩配置的步骤包括:
根据第一试用压缩配置执行所述第一音频信号的第一块的第一时间-频率分析;
确定由所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
11.根据权利要求10所述的方法,其中,基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择的步骤包括比较所述第一压缩假象和所述第二压缩假象。
12.根据权利要求10所述的方法,所述方法还包括:
根据所述第一试用压缩配置执行对所述第一音频信号的第二块的第三时间-频率分析;
确定由所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行对所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
13.根据权利要求12所述的方法,其中,基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置的步骤包括:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
14.根据权利要求13所述的方法,其中,组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分的步骤包括:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
15.根据权利要求8所述的方法,其中,所述第一音频信号在媒体呈现装置处被记录。
16.根据权利要求8所述的方法,其中,所述音频压缩配置指示时间-频率变换、窗函数或窗长度中的至少一项。
17.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括指令,所述指令在被执行时使机器执行操作,所述操作包括:
接收表示经解压缩的第二音频信号的第一音频信号;
从所述第一音频信号标识压缩第三音频信号以形成所述第二音频信号所使用的音频压缩配置;并且
基于标识出的音频压缩配置标识所述第二音频信号的源。
18.根据权利要求17所述的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理基于标识出的音频压缩配置标识所述第二音频信号的源:
基于标识出的音频压缩配置标识编码格式;并且
基于所述编码格式标识所述源。
19.根据权利要求17所述的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理从所述第一音频信号标识所述音频压缩配置:
根据第一试用压缩配置执行所述第一音频信号的第一块的第一时间-频率分析;
确定由所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
20.根据权利要求19所述的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器:
根据所述第一试用压缩配置执行所述第一音频信号的第二块的第三时间-频率分析;
确定由所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象,在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
21.根据权利要求20所述的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
22.根据权利要求21所述的非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括另外的指令,所述另外的指令在被执行时使得所述机器通过以下处理组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
23.一种方法,所述方法包括以下步骤:
接收表示经解压缩的第二音频信号的第一音频信号,所述第二音频信号通过根据音频压缩配置压缩第三音频信号而形成;
根据第一试用压缩配置执行所述第一音频信号的第一块的第一时间-频率分析;
确定由所述第一时间-频率分析得到的第一压缩假象;
根据第二试用压缩配置执行所述第一音频信号的所述第一块的第二时间-频率分析;
确定从所述第二时间-频率分析得到的第二压缩假象;并且
基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
24.根据权利要求23所述的方法,其中,基于所述第一压缩假象和所述第二压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置的步骤包括比较所述第一压缩假象和所述第二压缩假象。
25.根据权利要求23所述的方法,所述方法还包括:
根据所述第一试用压缩配置执行所述第一音频信号的第二块的第三时间-频率分析;
确定由所述第三时间-频率分析得到的第三压缩假象;
根据所述第二试用压缩配置执行所述第一音频信号的所述第二块的第四时间-频率分析;
确定从所述第四时间-频率分析得到的第四压缩假象;并且
基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置。
26.根据权利要求25所述的方法,其中,基于所述第一压缩假象、所述第二压缩假象、所述第三压缩假象和所述第四压缩假象在所述第一试用压缩配置和所述第二试用压缩配置之间进行选择来作为所述音频压缩配置的步骤包括:
组合所述第一压缩假象和所述第三压缩假象以形成第一得分;
组合所述第二压缩假象和所述第四压缩假象以形成第二得分;并且
比较所述第一得分和所述第二得分。
27.根据权利要求26所述的方法,其中,组合所述第一压缩假象和所述第三压缩假象以形成所述第一得分的步骤包括:
将所述第一压缩假象和与所述第一压缩假象相关联的第一偏移映射到第一极坐标;
将所述第三压缩假象和与所述第二压缩假象相关联的第二偏移映射到第二极坐标;并且
计算所述第一极坐标和所述第二极坐标的圆均值作为所述第一得分。
CN201880081466.5A 2017-10-25 2018-10-23 用于标识网络流传输服务的源的方法、设备和制品 Pending CN111480198A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/793,543 2017-10-25
US15/793,543 US10733998B2 (en) 2017-10-25 2017-10-25 Methods, apparatus and articles of manufacture to identify sources of network streaming services
PCT/US2018/057183 WO2019084065A1 (en) 2017-10-25 2018-10-23 METHODS, APPARATUS, AND MANUFACTURED ARTICLES FOR IDENTIFYING NETWORK CONTINUOUS DIFFUSION SERVICE SOURCES

Publications (1)

Publication Number Publication Date
CN111480198A true CN111480198A (zh) 2020-07-31

Family

ID=66171109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880081466.5A Pending CN111480198A (zh) 2017-10-25 2018-10-23 用于标识网络流传输服务的源的方法、设备和制品

Country Status (5)

Country Link
US (3) US10733998B2 (zh)
EP (1) EP3701522A4 (zh)
KR (1) KR102421425B1 (zh)
CN (1) CN111480198A (zh)
WO (1) WO2019084065A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10629213B2 (en) 2017-10-25 2020-04-21 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10726852B2 (en) 2018-02-19 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US10733998B2 (en) 2017-10-25 2020-08-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services
US11049507B2 (en) 2017-10-25 2021-06-29 Gracenote, Inc. Methods, apparatus, and articles of manufacture to identify sources of network streaming services
US11410680B2 (en) * 2019-06-13 2022-08-09 The Nielsen Company (Us), Llc Source classification using HDMI audio metadata

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2899107A1 (en) * 2003-12-30 2005-07-21 The Nielsen Company (Us), Llc Methods and apparatus to distinguish a signal originating from a local device from a broadcast signal
CN1668093A (zh) * 2004-03-09 2005-09-14 三星电子株式会社 使用音频/视频编解码器的音频/视频记录/再现系统
WO2006020560A2 (en) * 2004-08-09 2006-02-23 Nielsen Media Research, Inc Methods and apparatus to monitor audio/visual content from various sources
US20110224992A1 (en) * 2010-03-15 2011-09-15 Luc Chaoui Set-top-box with integrated encoder/decoder for audience measurement
CN102447893A (zh) * 2010-09-30 2012-05-09 北京沃安科技有限公司 手机视频实时采集和发布的方法及系统
CN103685793A (zh) * 2012-09-04 2014-03-26 美国博通公司 高保真音频数据的时移分配
CN105450496A (zh) * 2014-07-30 2016-03-30 阿里巴巴集团控股有限公司 社交应用中扩展内容来源的方法及系统、客户端和服务器
CN105681817A (zh) * 2016-01-05 2016-06-15 王成 一种智能终端视音频采集传输播放系统和方法
US9515904B2 (en) * 2011-06-21 2016-12-06 The Nielsen Company (Us), Llc Monitoring streaming media content

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5373460A (en) 1993-03-11 1994-12-13 Marks, Ii; Robert J. Method and apparatus for generating sliding tapered windows and sliding window transforms
US7020218B2 (en) 2001-06-18 2006-03-28 Arnesen David M Sliding-window transform with integrated windowing
US7328153B2 (en) * 2001-07-20 2008-02-05 Gracenote, Inc. Automatic identification of sound recordings
US6820141B2 (en) 2001-09-28 2004-11-16 Intel Corporation System and method of determining the source of a codec
EP1318611A1 (en) 2001-12-06 2003-06-11 Deutsche Thomson-Brandt Gmbh Method for retrieving a sensitive criterion for quantized spectra detection
US20030131350A1 (en) * 2002-01-08 2003-07-10 Peiffer John C. Method and apparatus for identifying a digital audio signal
WO2004006625A1 (en) 2002-07-08 2004-01-15 Koninklijke Philips Electronics N.V. Audio processing
CA2499967A1 (en) 2002-10-15 2004-04-29 Verance Corporation Media monitoring, management and information system
US7460684B2 (en) * 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
KR20060037403A (ko) * 2003-07-25 2006-05-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 및 비디오를 동기화시키기 위하여 핑거프린트들을생성하여 검출하는 방법 및 장치
CN1998168B (zh) * 2004-02-19 2011-04-06 兰德马克数字服务有限责任公司 用于广播源辨识的方法与装置
JP2008177748A (ja) 2007-01-17 2008-07-31 Oki Electric Ind Co Ltd 高周波信号検出回路
US8600531B2 (en) 2008-03-05 2013-12-03 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
US9313359B1 (en) * 2011-04-26 2016-04-12 Gracenote, Inc. Media content identification on mobile devices
GB2474508B (en) 2009-10-16 2015-12-09 Norwell Sa Audience measurement system
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
WO2012158705A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
WO2012177870A2 (en) * 2011-06-21 2012-12-27 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US8965774B2 (en) * 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
US8639178B2 (en) * 2011-08-30 2014-01-28 Clear Channel Management Sevices, Inc. Broadcast source identification based on matching broadcast signal fingerprints
US9049496B2 (en) 2011-09-01 2015-06-02 Gracenote, Inc. Media source identification
US8559568B1 (en) 2012-01-04 2013-10-15 Audience, Inc. Sliding DFT windowing techniques for monotonically decreasing spectral leakage
WO2013184520A1 (en) 2012-06-04 2013-12-12 Stone Troy Christopher Methods and systems for identifying content types
US9286902B2 (en) * 2013-12-16 2016-03-15 Gracenote, Inc. Audio fingerprinting
DE102014214143B4 (de) 2014-03-14 2015-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
US20150302086A1 (en) * 2014-04-22 2015-10-22 Gracenote, Inc. Audio identification during performance
US9641892B2 (en) 2014-07-15 2017-05-02 The Nielsen Company (Us), Llc Frequency band selection and processing techniques for media source detection
US9456075B2 (en) 2014-10-13 2016-09-27 Avaya Inc. Codec sequence detection
CN107077849B (zh) 2014-11-07 2020-09-08 三星电子株式会社 用于恢复音频信号的方法和设备
US9837101B2 (en) 2014-11-25 2017-12-05 Facebook, Inc. Indexing based on time-variant transforms of an audio signal's spectrogram
US9501568B2 (en) * 2015-01-02 2016-11-22 Gracenote, Inc. Audio matching based on harmonogram
KR102615903B1 (ko) 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들
US11468144B2 (en) 2017-06-15 2022-10-11 Regents Of The University Of Minnesota Digital signal processing using sliding windowed infinite fourier transform
US10733998B2 (en) 2017-10-25 2020-08-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services
US10726852B2 (en) 2018-02-19 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms
US11049507B2 (en) 2017-10-25 2021-06-29 Gracenote, Inc. Methods, apparatus, and articles of manufacture to identify sources of network streaming services
US10629213B2 (en) 2017-10-25 2020-04-21 The Nielsen Company (Us), Llc Methods and apparatus to perform windowed sliding transforms

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2899107A1 (en) * 2003-12-30 2005-07-21 The Nielsen Company (Us), Llc Methods and apparatus to distinguish a signal originating from a local device from a broadcast signal
CN1668093A (zh) * 2004-03-09 2005-09-14 三星电子株式会社 使用音频/视频编解码器的音频/视频记录/再现系统
WO2006020560A2 (en) * 2004-08-09 2006-02-23 Nielsen Media Research, Inc Methods and apparatus to monitor audio/visual content from various sources
US20110224992A1 (en) * 2010-03-15 2011-09-15 Luc Chaoui Set-top-box with integrated encoder/decoder for audience measurement
CN102447893A (zh) * 2010-09-30 2012-05-09 北京沃安科技有限公司 手机视频实时采集和发布的方法及系统
US9515904B2 (en) * 2011-06-21 2016-12-06 The Nielsen Company (Us), Llc Monitoring streaming media content
CN103685793A (zh) * 2012-09-04 2014-03-26 美国博通公司 高保真音频数据的时移分配
CN105450496A (zh) * 2014-07-30 2016-03-30 阿里巴巴集团控股有限公司 社交应用中扩展内容来源的方法及系统、客户端和服务器
CN105681817A (zh) * 2016-01-05 2016-06-15 王成 一种智能终端视音频采集传输播放系统和方法

Also Published As

Publication number Publication date
EP3701522A1 (en) 2020-09-02
US20230252999A1 (en) 2023-08-10
EP3701522A4 (en) 2021-08-04
US20190122673A1 (en) 2019-04-25
KR102421425B1 (ko) 2022-07-15
KR20200049887A (ko) 2020-05-08
US20210027792A1 (en) 2021-01-28
US11651776B2 (en) 2023-05-16
US10733998B2 (en) 2020-08-04
WO2019084065A1 (en) 2019-05-02

Similar Documents

Publication Publication Date Title
US11651776B2 (en) Methods, apparatus and articles of manufacture to identify sources of network streaming services
US11755642B2 (en) Detecting media watermarks in magnetic field data
US11948589B2 (en) Methods, apparatus, and articles of manufacture to identify sources of network streaming services
US10219034B2 (en) Methods and apparatus to detect spillover in an audience monitoring system
US11824507B2 (en) Methods and apparatus for volume adjustment
US11430454B2 (en) Methods and apparatus to identify sources of network streaming services using windowed sliding transforms
US10902542B2 (en) Detecting watermark modifications
JP2021500788A (ja) タイムスタンプトランジション分解能を改善するためのシステム及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40033892

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200731

WD01 Invention patent application deemed withdrawn after publication