CN114207606A - 使用hdmi音频元数据进行源分类 - Google Patents

使用hdmi音频元数据进行源分类 Download PDF

Info

Publication number
CN114207606A
CN114207606A CN202080052514.5A CN202080052514A CN114207606A CN 114207606 A CN114207606 A CN 114207606A CN 202080052514 A CN202080052514 A CN 202080052514A CN 114207606 A CN114207606 A CN 114207606A
Authority
CN
China
Prior art keywords
media
metadata
hdmi
uec
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080052514.5A
Other languages
English (en)
Inventor
R·E·泰勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nielsen Co US LLC
Original Assignee
Nielsen Co US LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nielsen Co US LLC filed Critical Nielsen Co US LLC
Publication of CN114207606A publication Critical patent/CN114207606A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • H04H60/31Arrangements for monitoring the use made of the broadcast services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43632Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wired protocol, e.g. IEEE 1394
    • H04N21/43635HDMI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • G11B2020/00028Advanced audio coding [AAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

公开了用于使用HDMI音频元数据进行源分类的方法、装置、系统和制品。示例装置包括元数据提取器,所述元数据提取器用于:从HDMI元数据提取音频编码参数的值,所述HDMI元数据是从媒体设备的被监测的HDMI端口获得的,所述HDMI元数据对应于从被监测的HDMI端口输出的媒体;将所提取的所述音频编码参数的值映射到一组定义的UEC中的第一唯一编码类(UEC),所述一组定义的UEC中的不同UEC对应于能够被包括在所述HDMI元数据中的所述音频编码参数的可能的值的不同组合;以及基于被映射到所述第一UEC的一个或更多个可能的媒体源来识别与从所述HDMI端口输出的所述媒体相对应的媒体源。

Description

使用HDMI音频元数据进行源分类
相关申请
本专利源于2020年4月30日提交的序列号为16/863,639的美国专利申请的继续申请,该序列号为16/863,639的美国专利申请要求于2019年6月13日提交的序列号为62/861,194的美国临时专利申请的权益。序列号为16/863,639的美国专利申请和序列号为62/861,194的美国临时专利申请各自的全部内容通过引用并入本文。本文要求序列号为16/863,639的美国专利申请和序列号为62/861,194的美国临时专利申请的优先权。
技术领域
本公开一般涉及媒体源分类,并且更具体地,涉及使用高清晰度多媒体接口(HDMI)音频元数据进行源分类。
背景技术
HDMI是一种传输接口,其是用于传输高清晰度视频、音频和相关媒体信号的常用视听标准。在一些示例中,HDMI定义了用于在诸如机顶盒、数字多功能盘(DVD)播放器、卫星接收器等数字音频/视频(A/V)源与诸如电视机、投影仪等A/V接收器/控制器或显示设备之间传送压缩或未压缩的视频和音频数据的接口。
附图说明
图1是示例系统的框图,该示例系统包括根据本公开的教导构造的用于使用HDMI音频数据执行源分类的示例媒体监测器。
图2是图1的示例媒体监测器的示例实现方式的框图。
图3是根据本公开的教导的包括HDMI音频元数据的参数的表,该HDMI音频元数据可以用于执行源分类。
图4是根据本公开的教导的表示机器可读指令的流程图,该机器可读指令可被执行来实现图1和/或图2的用于使用HDMI音频元数据执行源分类的媒体监测器。
图5是根据本公开的教导的示例处理器平台的框图,该处理器平台的结构被设计成执行图4的指令来实现用于使用HDMI音频元数据执行源分类的媒体监测器。
附图不是按比例绘制的。通常,在整个附图和所附书面描述中将使用相同的附图标记来表示相同或相似的零件。
当对可以被单独引用的多个元素或部件进行识别时,本文使用描述符“第一”、“第二”、“第三”等。除非基于它们的使用上下文另有规定或理解,否则这样的描述符不旨在灌输优先级、物理顺序或列表中的排列或时间顺序的任何含义,而仅仅用作用于单独地引用多个元素或部件的标签,以便于理解所公开的示例。在一些示例中,描述符“第一”可以用于指代具体实施方式的元素,而相同的元素在权利要求中可以用诸如“第二”或“第三”之类的不同描述符来指代。在这种情况下,应当理解这种描述符仅用于便于参考多个元素或部件。
具体实施方式
公开了使用HDMI音频元数据执行源分类的示例技术方案。这样的示例技术方案可以包括根据本公开的教导的使用HDMI音频元数据执行源分类的方法、装置、系统、制品(例如,物理存储介质)等中的一者或更多者。
IP/QAM混合机顶盒对来自通用QAM编码电缆通道(cable channel)和嵌入式因特网连接的DOCSIS/MoCA流传输客户端的内容进行解码。(如本文所使用的,IP指因特网协议,QAM指正交调幅,DOCSIS指有线电缆数据服务接口规范,并且MoCA指同轴电缆多媒体联盟。)不同于对具有无线局域网(LAN)连接(例如WiFi)或到因特网的以太网连接的设备的网络流量进行监测,由于DOCSIS/MoCA规范的复杂性以及缺乏执行这种监测的廉价商业现成(COTS)设备,对IP/QAM混合机顶盒的网络流量进行监测以识别内容源在本质上是困难的。因此,需要除网络流量监测之外的技术来识别与由IP/QAM混合机顶盒或其它这样的用户端设备(consumer premises equipment)进行的媒体呈现相关联的当前调谐或流传输的内容源。而且,这样的技术可能受限于用户端设备上的可用输出。此外,这种设备的模拟音频路径可能经受显著的可变性和/或劣化,这会对分析模拟音频以识别源的任何尝试产生不利影响。
本文公开的示例技术方案识别从HDMI音频编码元数据向消费者电子设备提供媒体的媒体源。典型的电缆通道和流传输媒体资产(例如,视频、节目、剧集、电影等)的音频以在一些情况下使用对于特定源(例如,电缆通道、流传输服务等)独有(unique)的参数的方式被编码。当这些参数是唯一(unique)的时,它们可以用于指定能够识别媒体资产(例如,视频、节目、剧集、电影等)的源的唯一编码类(UEC)。因为音频编码参数在源上被编码,因此HDMI元数据包含音频编码参数的数字副本。该元数据可以被直接从HDMI总线提取而不劣化,并且被映射到源。HDMI也通常是IP/QAM混合机顶盒上的可用输出(并且有时是仅有的输出),并且不经受其它类型的模拟音频分析(例如,基于麦克风拾音和/或模拟线路连接)中所固有的可变性和劣化。
本文公开的示例技术方案可以在专业级HDMI分析硬件和/或消费者级硬件上实现。例如,可以通过适配由受众(audience)测量系统(诸如由尼尔森公司(US),LLC采用的系统)使用的HDMI音频提取设备来实现本文公开的技术方案。例如,在这样的设备上执行的软件可以被修改,以提供由所公开的示例解决方案采用的元数据,以将音频指派到UEC,并且由此基于映射到UEC的源来识别音频源。
所公开的使用HDMI音频元数据来执行源分类的示例解决方案的另外的实现细节如下。数字音频编码将一组丰富的元数据嵌入音频流中,包括诸如比特率、对白音量偏移(dialog volume shift)、中心声道混合、比特流识别符等参数。这些参数由消费者电子设备(例如电视机)中的解码器使用以再现音频。所公开的示例技术方案利用这些嵌入式参数的组合来创建许多(例如,数十或某一其它数量的)唯一编码类(UEC),所述唯一编码类可以用于识别数字流传输资产和通用电缆通道(例如,源)两者的类别。一些UEC由许多源共享,因此对于消除彼此之间的歧义是没有用的。然而,其它UEC提供了源之间的有商业价值的区别。组成UEC的参数是在HDMI音频流的可公开访问的部分中找到的。可以使用在市场上可购买的、现成的音频提取器中找到的硬件来访问这些参数。HDMI对于数字媒体传输的通用可用性使得其成为访问这些参数的特别有用的渠道。
图1是根据本公开的教导构造的用于使用HDMI音频数据执行源分类的示例系统100的框图。图1的示例系统100监测由示例媒体源110提供以经由示例网络145在示例媒体设备150上呈现的媒体。图1的示例包括示例服务提供者120、示例媒体监测器165和受众测量实体的示例中央设施175。虽然图1的所示示例公开了作为因特网服务提供者的服务提供者120的示例实现方式,但是可以附加地或另选地使用服务提供者120的其它示例实现方式。例如,服务提供者120可以是有线服务提供者。
图1的所示示例的媒体源110对应于能够提供媒体以经由媒体设备150呈现的任何一个或更多个媒体源。由媒体源110提供的媒体可以提供任何类型的媒体,诸如音频、视频、多媒体等。附加地,媒体可以对应于实况媒体、流传输媒体、广播媒体、存储的媒体、点播内容等。在一些示例中,媒体源110可以是不需要从其接收媒体但在本地播放媒体的本地源(例如,DVD播放器、游戏控制台等)。
图1的所示示例的服务提供者120经由例如由媒体源110提供的IP/QAM混合机顶盒向媒体设备150提供媒体服务。在所示示例中,服务提供者120在向媒体设备150发送媒体之前修改由媒体源110提供的媒体。在所示示例中,服务提供者120包括示例媒体识别器125、示例代码转换器130、示例元数据嵌入器135以及示例媒体发送器140。
图1的所示示例的媒体识别器125由诸如执行指令的处理器之类的逻辑电路实现,但是它可以附加地或另选地由专用应用集成电路(ASIC)、可编程逻辑设备(PLD)和/或现场可编程逻辑设备(FPLD)、模拟电路和/或其它电路系统实现。图1的媒体识别器125从媒体源110获得的媒体提取计量数据(例如,签名、水印等)。例如,媒体识别器125可以实现由软件开发工具包(SDK)提供的功能,以提取嵌入在从媒体源110获得的媒体的音频和/或视频中的一个或更多个音频水印、一个或更多个视频(例如,图像)水印等。(例如,媒体可包括脉冲编码调制(PCM)音频数据或其它类型的音频数据、未压缩的视频/图像数据等)。
图1的示例媒体识别器125确定(例如,导出、解码、转换等)包括在媒体中或与嵌入在媒体中、与媒体相关联和/或与媒体一起发送的水印来识别的计量数据(例如,诸如媒体识别信息、源识别信息等),并且将该计量数据和/或水印本身转换为文本和/或二进制格式和/或其它数据类型(例如,文本、二进制等)以作为元数据插入到流传输媒体中。例如,代码/水印本身可以被提取并作为元数据插入例如ID3标签中的文本或二进制格式中。因此,包括在ID3标签中的元数据和/或媒体识别元数据可以是代码、水印和/或元数据的文本或二进制表示或由代码和/或水印识别的数据等。
图1的所示示例的示例代码转换器130由诸如执行指令的处理器之类的逻辑电路实现,但是可以附加地或另选地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,代码转换器130和媒体识别器125由相同的物理处理器实现。在所示示例中,代码转换器130采用任何适当的技术来将所接收的媒体转码和/或以其它方式处理成适于观看的形式(例如,流传输格式、机顶盒格式)。例如,所示示例的代码转换器130根据MPEG2音频/视频压缩对媒体进行转码以供经由HLS协议使用。在一些示例中,代码转换器130对与通用电缆通道相关联的媒体进行转码以符合AC-3音频编码。
图1的所示示例的元数据嵌入器135由诸如执行指令的处理器之类的逻辑电路实现,但是可以另外地和/或替代地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,代码转换器130、媒体识别器125和元数据嵌入器135中的一些或全部由相同的物理处理器实现。
在所示示例中,元数据嵌入器135将由媒体识别器125确定的元数据嵌入到要被包括在媒体中或以其它方式与媒体相关联的特定格式中。在一些示例中,元数据被嵌入到媒体的隐藏字幕传送流中。在一些示例中,元数据嵌入器135基于特定的编码格式(例如,AC-3)将元数据作为流传输媒体的一个或更多个数据字段嵌入。
在所示示例中,元数据嵌入器135嵌入元数据以定义UEC,所述UEC包含用于如本文所公开的UEC源分类的区别值。例如,元数据嵌入器135以组合方式嵌入以下参数中的一者或更多者,以定义可以分类源的不同UEC:IEC61937数据类型、比特率、对白归一化平均电平、比特流识别符以及中心混音电平。虽然在该示例中前面的参数是AC-3参数,但是在其它示例中,元数据嵌入器135可以嵌入针对其它类型的编码的元数据参数。在所示示例中,元数据嵌入器135按照使得每个源属于一个UEC的方式嵌入元数据。例如,通用电缆通道可能具有包括以下参数值的UEC:IEC61937数据类型=AC-3(其表明与AC-3编码相对应的数据类型);比特率=384(例如,表明比特率是每秒千比特);对白归一化平均电平=-24,比特流识别符=8,以及中心混音电平=-3,其可以表示为AC-3/384/-24/8/-3的UEC值。在一些示例中,来自特定流传输媒体源的诸如电影或连续剧情节之类的流传输媒体资产可以具有包括以下参数值的UEC:IEC61937数据类型=AC-3,比特率=640,对白归一化平均电平=-31,比特流识别符=4,以及中心混音电平=-3,其可以表示为AC-3/640/-31/4/-3的UEC值。在一些示例中,元数据嵌入器135按照使得多于一个源可以属于给定UEC的方式嵌入元数据。在一些示例中,可能存在多于一个UEC为AC-3/384/-24/8/-3的通用(例如,标准电缆)电缆通道,或者可能存在多于一个UEC为AC-3/640/-31/4/-3的电影。
在一些示例中,元数据嵌入器135插入与上述计量数据对应的元数据,以识别媒体内的特定事件,例如,当经由产品投放来显示广告时、当显示专用广告时、当媒体内发生特定事件时(例如,当电视游戏节目上的参赛者回答问题时、当电视电影从广告返回时等)等。附加地或另选地,元数据嵌入器135可以将元数据嵌入到单独的元数据文档中,诸如通过将元数据编码到M3U8或要与媒体相关联(例如,包括在媒体中、附加到媒体、在媒体之前发送等)的其它数据文件中。
图1的所示示例的媒体发送器140由诸如执行指令的处理器之类的逻辑电路实现,但是可以附加地或另选地由任何其它电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,代码转换器130、媒体识别器125、元数据嵌入器135和媒体发送器140中的一些或全部由相同的物理处理器实现。
媒体发送器140采用任何适当的技术来选择媒体和/或将媒体流式传输(stream)到请求设备,诸如媒体设备150。例如,所示示例的媒体发送器140选择已经由媒体识别器125识别、由代码转换器130转码并经历了由元数据嵌入器135进行的元数据嵌入的媒体。媒体发送器140然后使用任何协议经由网络145将媒体发送到媒体设备150,所述协议例如IP/QAM、DOCSIS/MoCA、媒体播放器版本4(MP4)、Adobe Flash(FLV)、运动图像专家组(MPEG)版本2(MPEG2、MPEG版本4(MPEG4))等。
在一些示例中,媒体识别器125、代码转换器130和/或元数据嵌入器130在来自媒体设备150的请求之前准备用于传输的媒体。在这样的示例中,已经准备好的媒体被存储在服务提供者120的数据存储部中(例如,诸如在闪存、磁介质、光介质等中)。在这样的示例中,当从媒体设备150接收到请求时,媒体发送器140准备传送流,以将准备好的媒体流式传输或以其它方式发送到媒体设备150。在一些示例中,媒体识别器125、代码转换器130和/或元数据嵌入器130响应于从媒体设备150接收的请求来准备用于传输的媒体。
所示示例的网络145是因特网。附加地或另选地,可以使用通信地链接服务提供者120和媒体设备的任何其它(一个或更多个)网络,例如IP/QAM、DOCSIS/MoCA、专用网络、局域网(LAN)、虚拟专用网络(VPN)等。网络145可以包括使用任何(一种或多种)类型的(一个或更多个)联网协议的任何数量的公共网络和/或专用网络。
图1的所示示例的媒体设备150是能够呈现由媒体发送器140经由网络145提供的媒体的设备。媒体设备150可以是例如电视机、机顶盒(诸如IP/QAM混合机顶盒)、DVD播放器、Apple
Figure BDA0003479505520000071
RokuTM媒体播放器、BoxeeTM媒体播放器、Sony PlayStationTM
Figure BDA0003479505520000072
等。在所示示例中,媒体设备150经由示例HDMI接口155(例如,HDMI电缆)输出媒体。然而,可以附加地或另选地使用任何其它数量、类型和/或格式的接口。在一些示例中,可以使用多个HDMI接口和/或电缆。例如,音频/视频接收器可以包括多个HDMI输出。虽然示出了单个媒体设备150,但是可以使用任何数量和/或类型的媒体设备。在所示示例中,媒体设备150输出元数据。在一些示例中,元数据作为媒体的一部分被接收(例如,嵌入在MPEG2传送流中)。然而,在一些示例中,元数据与媒体被分开地接收。当元数据与媒体被分开地接收时,媒体设备150在将媒体发送到显示器160之前将元数据多路传输到媒体中(例如,多路传输到传送流中)。图1的所示示例的显示器160是能够显示从媒体设备150接收的媒体的显示设备。在所示示例中,显示器160是电视机。然而,可以附加地或另选地使用任何其它数量和/或类型的显示器,例如三维电视机、高清晰度电视机、计算机监测器等。
在所示示例中,媒体监测器165拦截经由HDMI电缆155从媒体设备150发送到显示器160的HDMI数据。结合图2更详细地描述媒体监测器165的示例实现方式。图1的示例媒体监测器165包括示例媒体拦截器170。所示示例的媒体拦截器170用作允许媒体监测器165拦截HDMI数据的HDMI接头。在所示示例中,媒体拦截器170实现第一(例如,直通)路径,使得HDMI数据穿过媒体拦截器170到达显示器160,就像媒体拦截器170不存在一样。然而,媒体拦截器170还实现也向媒体监测器165提供HDMI数据(例如,复制的HDMI数据)的第二路径。在图1的所示示例中,媒体拦截器170与媒体监测器165分开。在一些示例中,媒体拦截器170经由电线将HDMI数据发送到图1的媒体监测器165。然而,媒体拦截器170可以以任何其它方式(例如无线地)将数据发送到媒体监测器165。示例媒体监测器165检查HDMI数据以识别元数据。元数据从示例媒体监测器165被发送到中央设施175以供分析。
在所示示例中,媒体拦截器170与媒体监测器165分开。媒体拦截器170以电力方式位于媒体设备150与显示器160之间。也即,将传统上从媒体设备150延伸到显示器160的电缆(例如HDMI电缆)改为从媒体设备150布线到媒体拦截器170。然后,将第二电缆从媒体拦截器170布线到显示器160。换言之,媒体拦截器170要在媒体设备与显示器中间拦截媒体流。在一些示例中,媒体拦截器170可以被称为与媒体设备150与显示器160之间的电连接件(例如,HDMI电缆)“内嵌(in-line)”。另外,当媒体拦截器170被实现为与媒体监测器165分开时,媒体拦截器170分割(split)由媒体设备150发送的信息并且将该信息发送到显示器160和媒体监测器165两者。在所示示例中,媒体拦截器170经由HDMI电缆将数据发送到媒体监测器165。然而,可以附加地或另选地使用任何其它类型和/或格式的数据接口。
在所示示例中,媒体监测器165被实现为与显示器160分开。然而,在一些示例中,媒体监测器165可以被实现为显示器160和/或媒体设备150的一部分和/或部件。例如,显示器160和/或媒体设备150可以与所包括的和/或作为可用附件的媒体监测器165一起出售。在一些示例中,媒体监测器165位于显示器的壳体内部。当媒体监测器165位于显示器的壳体内部时,可以用内部数据线(例如,总线)来替换本文提到的HDMI端口,以接收和/或拦截HDMI数据。
所示示例的中央设施175是受众测量实体(例如,尼尔森公司(US),LLC)的设施,并且包括用于经由网络145从媒体监测器165接收所报告的计量信息(例如,元数据)的接口。在所示示例中,中央设施175设有软件(例如,后台进程)以从媒体监测器165提取计量信息和/或元数据。例如,中央设施可以使用任何适当的技术来获得计量信息和/或元数据,例如HTTP安全协议(HTTPS)、文件传输协议(FTP)、安全文件传输协议(SFTP)、HTTP和/或HTTPSGET请求、HTTP和/或HTTPS POST请求等。在所示示例中,中央设施175存储并分析从多个不同媒体设备接收到的所提取的计量信息和/或元数据。例如,中央设施175可以通过媒体源110对计量信息和/或元数据进行分类和/或分组(例如,通过对与特定媒体源110相关联的所有计量数据进行分组)。在一些示例中,中央设施可以基于UEC的特定分类对计量信息进行分类和/或分组。附加地或另选地,可以执行对计量信息和/或元数据的任何其它处理。在一些示例中,中央设施175在接收到元数据之后将时间戳添加到元数据。执行时间戳(例如,记录事件发生的时间)使得能够准确地识别和/或关联所呈现的媒体和/或向呈现设备的用户呈现该媒体的时间。
在所示示例中,示例中央设施175包括一个或更多个媒体监测应用180,以处理源分类信息和/或由媒体监测器165输出的信息,从而基于该信息执行一个或更多个操作。例如,媒体监测应用180可以包括媒体信用应用,以便基于由媒体监测器165输出的媒体识别信息所表示的参考媒体资产来进行信用媒体曝光和/或对源进行分类。例如,监测应用180可以利用源分类信息来合并数据库中的简档,以减少存储器上的负担。附加地或另选地,媒体监测应用180可以包括一个或更多个动态广告插入应用,以利用由媒体监测器165输出的信息来选择伴随媒体、目标广告等,以提供给媒体设备150用于呈现。附加地或另选地,媒体监测应用180可以包括一个或更多个辅助媒体选择插入应用,以利用由媒体监测器165输出的信息来选择辅助媒体,以提供给辅助媒体设备(例如,诸如与一个或更多个专门小组成员相关联的智能电话和/或计算机),以便与由媒体设备150呈现的监测媒体相关联地呈现。
图2是图1的媒体监测器165的示例实现方式的框图。图2的所示示例的媒体监测器165包括示例媒体拦截器170、示例多路输出选择器220、示例元数据提取器230、示例元数据转换器240和示例发送器250。在图2的所示示例中,媒体拦截器170被表示为部分在媒体监测器165内部并且部分在媒体监测器165外部。该内部/外部描述旨在表示媒体拦截器170可以被实现为在媒体监测器165的外部(如图1中所述),但是媒体拦截器170可以附加地或另选地被实现为在媒体监测器165的内部。在一些示例中,示例多路输出选择器220、示例元数据提取器230和示例元数据转换器240中的一者或更多者可以被实现为在中央设施175处,而不是在媒体监测器165处。
图3的所示示例的示例媒体拦截器170包括一个或更多个HDMI端口。示例媒体拦截器170拦截经由HDMI从媒体设备150发送到显示器160的媒体。在所示示例中,媒体拦截器170包括第一示例端口205(例如,输入端口)以接收从媒体设备150发送的媒体。示例媒体拦截器170包括第二示例端口210(例如,输出端口)以将经由第一端口接收到的媒体发送到显示器160。在图2的所示示例中,媒体拦截器170被描述为在媒体监测器165的内部和外部。如上所述,可以使用媒体拦截器170的数个不同构造。例如,媒体拦截器170可以在媒体监测器的外部,并且将数据发送到媒体监测器165。也即,媒体拦截器170可以被认为是内嵌拦截器(in-line interceptor)。在一些示例中,多个媒体拦截器170可以用于例如监测多个媒体设备。在一些其它示例中,媒体拦截器170可以被实现为媒体监测器165的内部部件。媒体拦截器170拦截HDMI数据并且将其转发到示例多路输出选择器220。
图2的所示示例的示例多路输出选择器220由诸如执行指令的处理器之类的逻辑电路实现,但是它可以附加地或另选地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在所示示例中,示例多路输出选择器220从HDMI数据多路输出MPEG传送流。然而,多路输出选择器220可以从HDMI数据多路输出任何其它格式。此外,多路输出选择器220从传送流提取元数据。元数据被发送到元数据提取器230。
图2的所示示例的元数据提取器230由诸如执行指令的处理器之类的逻辑电路实现,但是它可以附加地或另选地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,多路输出选择器220和元数据提取器230由相同的物理处理器实现。在所示示例中,元数据提取器230从多路输出选择器220接收元数据。元数据提取器230解析该元数据以识别包含在其中的(一个或更多个)UEC。
在所示示例中,元数据提取器230识别元数据中指定的与由服务提供者120的元数据嵌入器135设定的参数相匹配的参数。例如,元数据提取器230识别元数据中指定的与广播演播室中的AC-3编码器中设定的参数相匹配的参数。在一些示例中,元数据提取器230识别在媒体被编码时由元数据嵌入器135设定以匹配由家庭中的媒体发出的参数的参数。
在所示示例中,元数据提取器230提取表示在UEC源分类中使用的区别值的元数据。例如,元数据提取器230从元数据提取参数,所述参数用于定义可以分类源的不同UEC,诸如IEC61937数据类型、比特率、对白归一化平均电平、比特流识别符、中心混音电平等,如上所述。此外,尽管在该示例中先前参数是AC-3参数,但是在其它示例解决方案中可以使用针对其它类型的编码的参数。再次,虽然在该示例中先前参数是AC-3参数,但在其它示例中,元数据提取器230可提取针对其它类型的编码的元数据参数。
在一些示例中,元数据提取器230从IEC61937数据类型(例如,音频流)的突发前导(burst preamble)提取元数据。在一些示例中,IEC61937数据类型包括传送参数(例如,突发前导)和许可编码音频数据(例如,编码前导)。在一些示例中,许可编码音频数据需要另外的处理和/或附加的处理设备来分析。相较之下,传送参数不需要任何附加的处理和/或处理设备。这样,从IEC61937数据类型的传送参数提取元数据的元数据提取器230改善了计算系统的操作,因为它消除了另外的处理并且不需要任何附加的处理设备。
在所示示例中,元数据提取器230提取元数据以基于UEC对源(例如,媒体源、服务提供者等)进行分类。例如,通用电缆通道可能具有包括以下参数值的UEC:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,以及中心混音电平=-3,其对应于AC-3/384/-24/8/-3的UEC值。在一些示例中,来自特定流传输媒体源的诸如电影或连续剧情节之类的流传输媒体资产可能具有包括以下参数值的UEC:IEC61937数据类型=AC-3,比特率=640,对白归一化平均电平=-31,比特流识别符=4,以及中心混音电平=-3,其对应于AC-3/640/-31/4/-3的UEC值。在一些示例中,多于一个源可属于一个给定UEC。在一些示例中,可能存在多于一个UEC值为AC-3/384/-24/8/-3的通用电缆通道,或者可能存在多于一个UEC值为AC-3/640/-31/4/-3的电影。
在所示示例中,定义的UEC提供有商业价值的、用于识别不同媒体源的区分器。例如,可以将UEC定义成没有通用电缆通道与任何流传输媒体资产共享的UEC。在这样的示例中,可以仅由UEC在流传输源与通用电缆通道之间进行区分,以确定源分类。这样,元数据提取器230从元数据提取参数以基于UEC对源进行分类。在所示示例中,元数据提取器230从元数据提取参数并生成包含参数的表。例如,元数据提取器230可提取元数据并生成编码参数到UEC类的映射。元数据提取器230可以将该映射存储和维持在一个或更多个数据结构(诸如与图3中示出的表300相对应的表数据结构)中。在图3的所示示例中,表300包括用于定义UEC的HDMI音频编码元数据的参数,该参数包括:EN:IEC61937数据类型(音频编码数据类型),EN:音频比特率(音频编码比特率),EN:对白归一化(对白电平)、Dolby BSID(比特流识别符)、Dolby CMixLev(中心混音电平)、Dolby LFEon(低频能量开启)、acmod/AMODE(音频压缩模式)。然而,可以使用任何其它类型的音频元数据来定义UEC。
在所示的示例表300中,列302列出了能够基于列5至列11中列出的不同参数的值来定义的不同UEC,这些UEC是元数据提取器230从由服务提供者120的元数据嵌入器135嵌入的HDMI音频编码元数据获得的。所示示例的元数据提取器230确定UEC的消歧置信度(disambiguation confidence)。如本文所使用的,消歧置信度是指定义的UEC唯一地识别对应的媒体源的能力。在一些示例中,元数据提取器230基于确定第一UEC(例如,从元数据提取的UEC)中与所定义的UEC中的多个值和/或参数相匹配的多个值来确定消歧置信度。这样,如果元数据提取器230确定第一UEC(例如,查询UEC)中的所有参数与来自已知媒体源的UEC的所有参数相匹配,则元数据提取器230确定消歧置信度为100%。同样,元数据提取器230将基于查询UEC中与具有已知媒体源的UEC中的参数不同的参数的数量而降低消歧置信度。例如,表300的列304表示定义的UEC唯一地识别表300的列306中列出的对应媒体源的消歧置信度(即,能力)。在所示示例中,100%的消歧置信度表明对应的UEC可以唯一地识别对应的媒体源,而50%的消歧置信度是指对应的UEC可以将源识别缩小到2个可能的源中的一个,而33%的消歧置信度是指对应的UEC可以将源识别缩小到3个可能的源中的一个。
在图2的所示示例中,元数据提取器230计算表明UEC对应于特定源的可能性的消歧置信度。例如,元数据提取器230可以对包括以下项的UEC进行分类:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,并且中心混音电平=-3(缩写为AC-3/384/-24/8/-3),如对应于特定服务提供者的。这样,当元数据提取器230提取元数据并将媒体识别为具有包括以下项的UEC时:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,并且中心混音电平=-3(缩写为AC-3/384/-24/8/-3),所示示例的元数据提取器230确定元数据(例如,对应于元数据的媒体)具有100%的消歧置信度并且对应于与该UEC相关联的特定服务提供者(例如,来自图3的表300中的列308的源)。所示示例的元数据提取器230用针对每个源的消歧置信度填充UEC映射数据结构(例如,诸如对应于表300的表),并将填充的表转发到元数据转换器240。
图2的示例元数据转换器240由诸如执行指令的处理器之类的逻辑电路实现,但是它可以附加地或另选地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,多路输出选择器220、元数据提取器230和元数据转换器240中的一些或全部由相同的物理处理器实现。在所示示例中,元数据转换器240将由元数据提取器230提取的信息和/或元数据转换为经转换的元数据格式,以便传输到中央设施175。例如,元数据转换器240可以对信息、元数据和/或元数据的部分进行加密、解密、压缩、修改等,以例如减少要发送到中央设施175的数据量。在所示示例中,元数据转换器240在转换元数据之前将时间戳添加到信息和/或元数据。执行时间戳(例如,记录事件发生的时间)使得能够准确地识别和/或关联在对应的(一处或多处)时间呈现给呈现设备的(一个或更多个)用户的媒体。
图3的所示示例的发送器250由诸如执行指令的处理器之类的逻辑电路实现,但是它可以附加地或另选地由任何其它逻辑电路、ASIC、DSP、FPGA和/或其它模拟和/或数字电路系统实现。在一些示例中,多路输出选择器220、元数据提取器230、元数据转换器240和发送器250中的一些或全部由相同的物理处理器实现。在所示示例中,发送器250经由例如因特网将经转换的信息和/或元数据发送到中央设施175。虽然在所示示例中基本上实时地发送经转换的信息和/或元数据,但是在一些示例中,在将经转换的信息和/或元数据发送到中央设施175之前,存储、高速缓存和/或缓冲经转换的信息和/或元数据。附加地或另选地,发送器250可以发送媒体监测器165和/或媒体设备150的识别符,以使得中央设施175能够将元数据与专门小组成员、一组专门小组成员、群体(demographic)等关联。在一些示例中,单独的收视计量器用于识别所监测设备的本地受众中的人员。在所示示例中,中央设施175与受众测量公司相关联,并且不涉及媒体到媒体设备的递送。在一些示例中,中央设施175在接收到经转换的信息和/或元数据之后施加时间戳。
尽管在图2中示出了实现图1的媒体监测器165的示例方式,但是图2中示出的元件、过程和/或设备中的一者或更多者可以以任何其它方式被组合、划分、重新布置、省略、消除和/或实现。此外,图2的示例媒体拦截器170、示例多路输出选择器220、示例元数据提取器230、示例元数据转换器240、示例发送器250和/或更一般地示例媒体监测器165可以通过硬件、软件、固件和/或硬件、软件和/或固件的任何组合来实现。因此,例如,示例媒体拦截器170、示例多路输出选择器220、示例元数据提取器230、示例元数据转换器240、示例发送器250和/或更一般地示例媒体监测器165中的任何一者都可以由一个或更多个模拟或数字电路、逻辑电路、可编程处理器、可编程控制器、图形处理单元(GPU)、数字信号处理器(DSP)、专用应用集成电路(ASIC)、可编程逻辑设备(PLD)和/或现场可编程逻辑设备(FPLD)实现。当阅读本专利的覆盖纯软件和/或固件实现方式的任何装置或系统权利要求时,示例媒体拦截器170、示例多路输出选择器220、示例元数据提取器230、示例元数据转换器240、示例发送器250和/或更一般地示例媒体监测器165中的至少一者由此被明确地定义为包括非暂时性计算机可读存储设备或存储盘,诸如包括软件和/或固件的存储器、数字多功能盘(DVD)、光盘(CD)、蓝光盘等。此外,图1的示例媒体监测器165可以包括除图2所示的那些之外或作为图2所示的那些替代的一个或更多个元件、过程和/或设备,和/或可包括所示元件、过程和设备中的任何或全部中的多于一者。如本文所使用的,短语“通信”包括其变型,涵盖直接通信和/或通过一个或更多个中间部件的间接通信,并且不需要直接物理(例如,有线)通信和/或持续通信,而是另外包括按照周期性间隔、调度间隔、非周期性间隔和/或一次性事件进行的选择性通信。
图4示出了表示用于实现图2的媒体监测器165的示例硬件逻辑、机器可读指令、硬件实现的状态机和/或其任何组合的流程图。机器可读指令可以是用于由计算机处理器(例如,下面结合图5讨论的示例处理器平台500中示出的处理器512)执行的一个或更多个可执行程序或可执行程序的部分。程序可以实施在非暂时性计算机可读存储介质(例如,CD-ROM、软盘、硬盘驱动器、DVD、蓝光盘或与处理器512相关联的存储器)上存储的软件中,但是整个程序和/或其部分可以另选地由除处理器512以外的设备执行和/或实现在固件或专用硬件中。此外,尽管参照图4所示的流程图描述了示例程序,但是可以替代地使用实现示例媒体监测器165的许多其它方法。例如,可以改变框的执行顺序,和/或可以改变、消除或组合所描述的框中的一些框。附加地或另选地,框中的任何框或所有框可以由一个或更多个硬件电路(例如,离散和/或集成的模拟和/或数字电路系统、FPGA、ASIC、比较器、运算放大器(op-amp)、逻辑电路等)来实现,所述一个或更多个硬件电路的结构被设计为在不执行软件或固件的情况下执行对应的操作。
本文描述的机器可读指令可以以压缩格式、加密格式、分段格式、编译格式、可执行格式、封装格式等中的一者或更多者来存储。如本文所述的机器可读指令可以被存储为数据(例如,指令的部分、代码、代码的表示等),该数据可以用于创建、制造和/或产生机器可执行指令。例如,机器可读指令可以被分段并存储在一个或更多个存储设备和/或计算设备(例如,服务器)上。机器可读指令可能需要安装、修改、适配、更新、组合、补充、配置、解密、解压缩、解包、分配、重新指派、编译等中的一者或更多者,以便使它们可由计算设备和/或其它机器直接读取、解释和/或执行。例如,机器可读指令可以存储在多个部分中,所述多个部分被各自压缩、加密并且存储在单独的计算设备上,其中所述部分在被解密、解压缩并且组合时形成实现诸如本文所描述的程序的一组可执行指令。
在另一示例中,机器可读指令可以按照它们可由计算机读取的状态被存储,但是需要添加库(例如,动态链接库(DLL))、软件开发工具包(SDK)、应用编程接口(API)等,以便对特定计算设备或其它设备执行指令。在另一示例中,在机器可读指令和/或对应的程序可以被整体或部分地执行之前,可能需要配置机器可读指令(例如,存储的设定、数据输入、记录的网络地址等)。因此,所公开的机器可读指令和/或对应的程序旨在涵盖这样的机器可读指令和/或程序,而不管该机器可读指令和/或程序在被存储或以其它方式处于静止或发送状态时的特定格式或状态。
本文描述的机器可读指令可以由任何过去、现在或将来的指令语言、脚本语言、编程语言等来表示。例如,机器可读指令可以使用以下语言的任何一种来表示:C、C++、Java、C#、Perl、Python、JavaScript、超文本标记语言(HTML)、结构化查询语言(SQL)、Swift等。
如上所述,图3的示例过程可以使用存储在非暂时性计算机和/或机器可读介质上的可执行指令(例如,计算机和/或机器可读指令)来实现,所述非暂时性计算机和/或机器可读介质诸如硬盘驱动器、闪存、只读存储器、光盘、数字多功能盘、高速缓存、随机存取存储器和/或存储信息达任意持续时间(例如,延长的时间段、永久地、短暂地、暂时缓冲和/或信息的高速缓存)的任何其它存储设备或存储盘。如本文所使用的,术语非暂时性计算机可读介质被明确地定义为包括任何类型的计算机可读存储设备和/或存储盘,并且排除传播信号和排除传输介质。
“包括(comprising)”和“包含(including)”(及其所有形式和时态)在此用作开放式术语。因此,无论何时权利要求采用任何形式的“包括”或“包含”(例如,包括(comprises)、包含(includes)、包括(comprising)、包含(including)、具有等)作为前序或在任何种类的权利要求叙述内,应理解,可存在附加元件、术语等而不落在对应权利要求或叙述的范围之外。如本文所使用的,当短语“至少”用作例如权利要求的前序部分中的过渡术语时,其以与术语“包括”和“包含”为开放式的相同方式为开放式的。当例如以诸如A、B和/或C的形式使用术语“和/或”时,是指A、B、C的任何组合或子集,例如(1)单独的A、(2)单独的B、(3)单独的C、(4)A与B、(5)A与C、(6)B与C以及(7)A与B和C。如在描述结构、部件、项目、对象和/或事物的上下文中使用的,短语“A和B中的至少一者”意在是指包括(1)至少一个A、(2)至少一个B和(3)至少一个A和至少一个B中的任一者的实现方式。类似地,如在描述结构、部件、项目、对象和/或事物的上下文中使用的,短语“A或B中的至少一者”意在是指包括(1)至少一个A、(2)至少一个B和(3)至少一个A和至少一个B中的任一者的实现方式。如在描述过程、指令、动作、活动和/或步骤的进行或执行的上下文中所使用的,短语“A和B中的至少一者”意在是指包括(1)至少一个A、(2)至少一个B和(3)至少一个A和至少一个B中的任一者的实现方式。类似地,如在描述过程、指令、动作、活动和/或步骤的进行或执行的上下文中所使用的,短语“A或B中的至少一者”意在是指包括(1)至少一个A、(2)至少一个B和(3)至少一个A和至少一个B中的任一者的实现方式。
如本文所使用的,单数引用(例如,“一”、“一个”、“第一”、“第二”等)不排除复数。如本文所使用的,术语“一”或“一个”实体是指该实体中的一个或更多个。术语“一”(或“一个”)、“一个或更多个”和“至少一个”在本文中可互换使用。此外,尽管分别列出,但是多个装置、元件或方法动作可以由例如单个单元或处理器来实现。另外,尽管各个特征可以被包括在不同的示例或权利要求中,但是这些特征可以被组合,并且包括在不同的示例或权利要求中并不意味着特征的组合是不可行的和/或不利的。
图4是表示可以被执行以实现图1和/或图2的示例媒体监测器165的示例机器可读指令400的流程图。在图4的所示示例中,当元数据提取器230定义与能够被包括在HDMI元数据中的音频编码参数的值的不同可能组合相对应的一组唯一编码类(UEC)时,开始执行示例机器可读指令400(框405)。如上所述,UEC可被映射到提供与音频编码参数相关联的媒体的不同的可能的媒体源。例如,元数据提取器230可以对包括以下项的UEC进行分类:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,并且中心混音电平=-3(缩写为AC-3/384/-24/8/-3),如对应于特定媒体源的。
元数据提取器230提取从被监测的HDMI端口获得的被包括在HDMI元数据中的音频编码参数的值(框410)。例如,元数据提取器230提取从媒体拦截器170获得的包括在HDMI元数据中的音频编码参数的值。
元数据提取器230将所提取的音频编码参数的值映射到特定UEC(框415)。例如,元数据提取器230可将所提取的音频编码参数的值映射到包括以下项的UEC:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,并且中心混音电平=-3(缩写为AC-3/384/-24/8/-3),如对应于特定媒体源的。这样,当元数据提取器230提取元数据并将所提取的值识别为具有包括以下项的UEC时:IEC61937数据类型=AC-3;比特率=384;对白归一化平均电平=-24,比特流识别符=8,并且中心混音电平=-3(缩写为AC-3/384/-24/8/-3),所示示例的元数据提取器230确定元数据(例如,与元数据对应的媒体)具有100%的消歧置信度并且与特定媒体源对应。
元数据提取器230基于被映射到特定UEC的(一个或更多个)可能的媒体源来识别与从HDMI端口输出的媒体相对应的媒体源(框420)。例如,元数据提取器230可以对包括以下项的UEC进行分类:IEC61937数据类型=AC-3,如对应于媒体源XYZ的。这样,当元数据提取器230提取元数据并将所提取的值识别为具有包括以下项的UEC时:IEC61937数据类型=AC-3,所示示例的元数据提取器230确定元数据对应于媒体源XYZ。一旦所有元数据都已被分类,过程400结束。
图5是结构被设计成执行图4的指令以实现图1和/或图2的媒体监测器165的示例处理器平台500的框图。处理器平台500可以是例如服务器、个人计算机、工作站、自学习机(例如,神经网络)、移动设备(例如,蜂窝电话、智能电话、诸如iPadTM之类的平板电脑)、个人数字助理(PDA)、因特网设备、DVD播放器、CD播放器、数字视频记录器、蓝光播放器、游戏控制台、个人视频记录器、机顶盒、耳机或其它可穿戴设备、或任何其它类型的计算设备。
所示示例的处理器平台500包括处理器512。所示示例的处理器512是硬件。例如,处理器512可以由一个或更多个集成电路、逻辑电路、微处理器、GPU、DSP或来自任何期望的系列或制造商的控制器来实现。硬件处理器可以是基于半导体(例如,基于硅)的设备。在该示例中,处理器512实现示例媒体拦截器170、示例多路输出选择器220、示例元数据提取器230、示例元数据转换器240、示例发送器250和/或更一般地示例媒体监测器165。
所示示例的处理器512包括本地存储器513(例如,高速缓存)。所示示例的处理器512经由总线518与包括易失性存储器514和非易失性存储器516的主存储器通信。易失性存储器514可以由同步动态随机存取存储器(SDRAM)、动态随机存取存储器(DRAM)、
Figure BDA0003479505520000181
动态随机存取存储器
Figure BDA0003479505520000182
和/或任何其它类型的随机存取存储器设备来实现。非易失性存储器516可以由闪存和/或任何其它期望类型的存储器设备来实现。对主存储器514、516的访问由存储器控制器来控制。
所示示例的处理器平台500还包括接口电路520。接口电路520可以由任何类型的接口标准来实现,诸如以太网接口、通用串行总线(USB)、
Figure BDA0003479505520000183
接口、近场通信(NFC)接口和/或PCI Express接口。
在所示示例中,一个或更多个输入设备522连接到接口电路520。输入设备522允许用户将数据和/或命令输入到处理器412中。输入设备可以由例如音频传感器、麦克风、摄像头(静物或视频)、键盘、按钮、鼠标、触摸屏、跟踪板、跟踪球、isopoint和/或语音识别系统来实现。
一个或更多个输出设备524也连接到所示示例的接口电路520。输出设备524可以例如由显示设备(例如,发光二极管(LED)、有机发光二极管(OLED)、液晶显示器(LCD)、阴极射线管显示器(CRT)、原地切换(IPS)显示器、触摸屏等)、触觉输出设备、打印机和/或扬声器来实现。因此,所示示例的接口电路520通常包括图形驱动器卡、图形驱动器芯片和/或图形驱动器处理器。
所示示例的接口电路520还包括通信设备,诸如发送器、接收器、收发器、调制解调器、常驻网关、无线接入点和/或网络接口,以便于经由网络526与外部机器(例如,任何种类的计算设备)交换数据。通信可以经由例如以太网连接、数字用户线路(DSL)连接、电话线连接、同轴电缆系统、卫星系统、现场线路无线系统、蜂窝电话系统等。
所示示例的处理器平台500还包括用于存储软件和/或数据的一个或更多个大容量存储设备528。这种大容量存储设备528的示例包含软盘驱动器、硬盘驱动器、光盘驱动器、蓝光盘驱动器、独立磁盘冗余阵列(RAID)系统及数字多功能光盘(DVD)驱动器。
图4的机器可执行指令532可以存储在大容量存储设备528中、易失性存储器514中、非易失性存储器516中和/或诸如CD或DVD之类的可移除非暂时性计算机可读存储介质上。
从上文将理解,已经公开了使用HDMI音频元数据来对媒体源进行分类的示例方法、装置和制品。所公开的方法、装置和制品通过提取HDMI音频元数据而不需要对音频元数据进行编码/解码来提高使用计算设备的效率。此外,本文公开的示例根据特定参数(例如,IEC61937突发前导)提取HDMI音频元数据,从而消除对HDMI音频元数据的后续处理的需要。因此,所公开的方法、装置和制品针对计算机的功能中的一个或更多个改进。
尽管本文公开了某些示例方法、装置和制品,但是本专利的覆盖范围不限于此。相反,本专利覆盖了完全落入本专利的权利要求的范围内的所有方法、装置和制品。
所附权利要求通过引用结合到本具体实施方式中,其中每个权利要求独立地作为本公开的单独实施方式。

Claims (20)

1.一种使用高清晰度多媒体接口(HDMI)音频元数据来执行源分类的装置,所述装置包括:
元数据提取器,所述元数据提取器用于:
从HDMI元数据提取音频编码参数的值,所述HDMI元数据是从媒体设备的被监测的HDMI端口获得的,所述HDMI元数据对应于从所述被监测的HDMI端口输出的媒体;
将所提取的所述音频编码参数的值映射到一组定义的唯一编码类(UEC)中的第一UEC,所述一组定义的UEC中的不同UEC对应于能够被包括在所述HDMI元数据中的所述音频编码参数的可能的值的不同组合;以及
基于被映射到所述第一UEC的一个或更多个可能的媒体源来识别与从所述HDMI端口输出的所述媒体相对应的媒体源。
2.根据权利要求1所述的装置,其中,所述HDMI元数据是在被解码之前提取的。
3.根据权利要求1所述的装置,其中,所述HDMI元数据被包括在从所述媒体设备的所述被监测的HDMI端口输出的音频流中。
4.根据权利要求3所述的装置,其中,所述音频流包括传送参数和许可编码音频数据。
5.根据权利要求4所述的装置,其中,所提取的值对应于所述传送参数。
6.根据权利要求1所述的装置,其中,所述元数据提取器用于在将所提取的所述音频编码参数的值映射到所述第一UEC时确定与所述第一UEC相关联的消歧置信度。
7.根据权利要求6所述的装置,其中,所述元数据提取器用于在确定所述消歧置信度时确定所述第一UEC中与定义的UEC中的多个值相匹配的多个值。
8.根据权利要求7所述的装置,其中,所述元数据提取器用于在识别所述媒体源时将所述媒体源识别为被映射到所述第一UEC。
9.一种包括指令的非暂时性计算机可读存储介质,所述指令在被执行时使一个或更多个处理器至少:
从HDMI元数据提取音频编码参数的值,所述HDMI元数据是从媒体设备的被监测的HDMI端口获得的,所述HDMI元数据对应于从所述被监测的HDMI端口输出的媒体;
将所提取的所述音频编码参数的值映射到一组定义的唯一编码类(UEC)中的第一UEC,所述一组定义的UEC中的不同UEC对应于能够被包括在所述HDMI元数据中的所述音频编码参数的可能的值的不同组合;以及
基于被映射到所述第一UEC的一个或更多个可能的媒体源来识别与从所述HDMI端口输出的所述媒体相对应的媒体源。
10.根据权利要求9所述的计算机可读介质,其中,所述HDMI元数据被包括在从所述媒体设备的所述被监测的HDMI端口输出的音频流中,所述音频流包括传送参数和许可编码音频数据。
11.根据权利要求10所述的计算机可读介质,其中,所提取的值对应于所述传送参数。
12.根据权利要求9所述的计算机可读介质,其中,所述指令在被执行时使所述一个或更多个处理器在将所提取的所述音频编码参数的值映射到所述第一UEC时确定与所述第一UEC相关联的消歧置信度。
13.根据权利要求12所述的计算机可读介质,其中,所述指令在被执行时使所述一个或更多个处理器在确定所述消歧置信度时确定所述第一UEC中与定义的UEC中的多个值相匹配的多个值。
14.根据权利要求13所述的计算机可读介质,其中,所述指令在被执行时使所述一个或更多个处理器在识别所述媒体源时将所述媒体源识别为被映射到所述第一UEC。
15.一种使用高清晰度多媒体接口(HDMI)音频元数据来执行源分类的方法,所述方法包括:
从HDMI元数据提取音频编码参数的值,所述HDMI元数据是从媒体设备的被监测的HDMI端口获得的,所述HDMI元数据对应于从所述被监测的HDMI端口输出的媒体;
将所提取的所述音频编码参数的值映射到一组定义的唯一编码类(UEC)中的第一UEC,所述一组定义的UEC中的不同UEC对应于能够被包括在所述HDMI元数据中的所述音频编码参数的可能的值的不同组合;以及
基于被映射到所述第一UEC的一个或更多个可能的媒体源来识别与从所述HDMI端口输出的所述媒体相对应的媒体源。
16.根据权利要求15所述的方法,其中,所述HDMI元数据被包括在从所述媒体设备的所述被监测的HDMI端口输出的音频流中,所述音频流包括传送参数和许可编码音频数据。
17.根据权利要求16所述的方法,其中,所提取的值对应于所述传送参数。
18.根据权利要求15所述的方法,其中,将所提取的所述音频编码参数的值映射到所述第一UEC包括确定与所述第一UEC相关联的消歧置信度。
19.根据权利要求18所述的方法,其中,确定所述消歧置信度包括确定所述第一UEC中与定义的UEC中的多个值相匹配的多个值。
20.根据权利要求19所述的方法,其中,识别所述媒体源包括将所述媒体源识别为被映射到所述第一UEC。
CN202080052514.5A 2019-06-13 2020-06-12 使用hdmi音频元数据进行源分类 Pending CN114207606A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962861194P 2019-06-13 2019-06-13
US62/861,194 2019-06-13
US16/863,639 2020-04-30
US16/863,639 US11410680B2 (en) 2019-06-13 2020-04-30 Source classification using HDMI audio metadata
PCT/US2020/037536 WO2020252341A1 (en) 2019-06-13 2020-06-12 Source classification using hdmi audio metadata

Publications (1)

Publication Number Publication Date
CN114207606A true CN114207606A (zh) 2022-03-18

Family

ID=73745543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080052514.5A Pending CN114207606A (zh) 2019-06-13 2020-06-12 使用hdmi音频元数据进行源分类

Country Status (4)

Country Link
US (2) US11410680B2 (zh)
EP (1) EP3984241A4 (zh)
CN (1) CN114207606A (zh)
WO (1) WO2020252341A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11907287B2 (en) 2019-06-13 2024-02-20 The Nielsen Company (Us), Llc Source classification using HDMI audio metadata

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006020560A2 (en) * 2004-08-09 2006-02-23 Nielsen Media Research, Inc Methods and apparatus to monitor audio/visual content from various sources
CN102985967A (zh) * 2010-11-02 2013-03-20 谷歌公司 自适应音频代码转换
US20140229970A1 (en) * 2013-02-14 2014-08-14 Jan Besehanic Methods and apparatus to measure exposure to streaming media
WO2014176019A1 (en) * 2013-04-23 2014-10-30 Dolby Laboratories Licensing Corporation Transmitting display management metadata over hdmi
KR20170067517A (ko) * 2015-12-08 2017-06-16 한국전자통신연구원 핑거프린트 처리 방법 및 핑거프린트 처리 장치
WO2019032570A1 (en) * 2017-08-09 2019-02-14 The Nielsen Company (Us), Llc METHODS AND APPARATUS FOR DETERMINING SOURCES OF MULTIMEDIA PRESENTATIONS
US20190122673A1 (en) * 2017-10-25 2019-04-25 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101411107B1 (ko) 2007-10-16 2014-06-27 엘지전자 주식회사 미디어 싱크 디바이스 및 그 제어방법
US20110274156A1 (en) * 2010-05-05 2011-11-10 Cavium Networks System and method for transmitting multimedia stream
US10546610B2 (en) * 2011-08-13 2020-01-28 Colin Leonard Systems and methods for dynamic audio processing
EP2936485B1 (en) * 2012-12-21 2017-01-04 Dolby Laboratories Licensing Corporation Object clustering for rendering object-based audio content based on perceptual criteria
DE102013211571B4 (de) * 2013-06-19 2016-02-11 Opticom Dipl.-Ing. Michael Keyhl Gmbh Konzept zur bestimmung der qualität eines mediadatenstroms mit variierender qualität-zu-bitrate
CN104244060B (zh) 2014-09-30 2018-12-11 英华达(南京)科技有限公司 一种收看高清有线电视节目的方法及装置
US20160162255A1 (en) * 2014-12-04 2016-06-09 Kabushiki Kaisha Toshiba Electronic device
JP7061567B2 (ja) * 2015-09-15 2022-04-28 インターデジタル マディソン パテント ホールディングス, エスアーエス 節電メディア・コンテンツを提供する方法および装置
KR102102453B1 (ko) * 2016-01-08 2020-04-20 주식회사 아이플래테아 시청률 산출 서버, 시청률 산출 방법, 및 시청률 산출 리모트 장치
US20190132652A1 (en) * 2016-04-18 2019-05-02 Verance Corporation System and method for signaling security and database population
US10579372B1 (en) * 2018-12-08 2020-03-03 Fujitsu Limited Metadata-based API attribute extraction
US11356747B2 (en) * 2018-12-21 2022-06-07 The Nielsen Company (Us), Llc Apparatus and methods to associate different watermarks detected in media
US11410680B2 (en) 2019-06-13 2022-08-09 The Nielsen Company (Us), Llc Source classification using HDMI audio metadata

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006020560A2 (en) * 2004-08-09 2006-02-23 Nielsen Media Research, Inc Methods and apparatus to monitor audio/visual content from various sources
CN102985967A (zh) * 2010-11-02 2013-03-20 谷歌公司 自适应音频代码转换
US20140229970A1 (en) * 2013-02-14 2014-08-14 Jan Besehanic Methods and apparatus to measure exposure to streaming media
WO2014176019A1 (en) * 2013-04-23 2014-10-30 Dolby Laboratories Licensing Corporation Transmitting display management metadata over hdmi
KR20170067517A (ko) * 2015-12-08 2017-06-16 한국전자통신연구원 핑거프린트 처리 방법 및 핑거프린트 처리 장치
WO2019032570A1 (en) * 2017-08-09 2019-02-14 The Nielsen Company (Us), Llc METHODS AND APPARATUS FOR DETERMINING SOURCES OF MULTIMEDIA PRESENTATIONS
US20190122673A1 (en) * 2017-10-25 2019-04-25 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to identify sources of network streaming services

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11907287B2 (en) 2019-06-13 2024-02-20 The Nielsen Company (Us), Llc Source classification using HDMI audio metadata

Also Published As

Publication number Publication date
US11410680B2 (en) 2022-08-09
WO2020252341A1 (en) 2020-12-17
US11907287B2 (en) 2024-02-20
EP3984241A4 (en) 2023-05-24
US20200395039A1 (en) 2020-12-17
EP3984241A1 (en) 2022-04-20
US20230065182A1 (en) 2023-03-02

Similar Documents

Publication Publication Date Title
US12010380B2 (en) Methods and apparatus to measure exposure to streaming media
US9313544B2 (en) Methods and apparatus to measure exposure to streaming media
US10698864B2 (en) Auxiliary manifest file to provide timed metadata
CN106134146B (zh) 处理连续的多周期内容
AU2012272876B2 (en) Methods and apparatus to measure exposure to streaming media
US9621963B2 (en) Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier
US20130291001A1 (en) Methods and apparatus to measure exposure to streaming media
US20140244828A1 (en) Methods and apparatus to measure exposure to streaming media
US9363519B2 (en) Detecting displayed channel using audio/video watermarks
KR102598237B1 (ko) 디지털 방송 서비스 방법 및 장치
CN113348672A (zh) 对流传输媒体内容进行监测的方法和装置
KR20170138994A (ko) 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
US11395050B2 (en) Receiving apparatus, transmitting apparatus, and data processing method
US11907287B2 (en) Source classification using HDMI audio metadata
KR20210025508A (ko) Atsc 3.0 기반의 방송 콘텐츠 전송 장치 및 방법과, 방송 콘텐츠 수신 장치 및 방법
US9160933B2 (en) Luminance based image capturing methods and apparatus
KR20120019743A (ko) Epg 정보 삽입 및 추출 장치와 이를 이용한 epg 정보 삽입 및 추출 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070071

Country of ref document: HK