CN101681664A - 用于在音频信号内确定时间点的方法 - Google Patents

用于在音频信号内确定时间点的方法 Download PDF

Info

Publication number
CN101681664A
CN101681664A CN200780052430A CN200780052430A CN101681664A CN 101681664 A CN101681664 A CN 101681664A CN 200780052430 A CN200780052430 A CN 200780052430A CN 200780052430 A CN200780052430 A CN 200780052430A CN 101681664 A CN101681664 A CN 101681664A
Authority
CN
China
Prior art keywords
sound signal
signed data
server
signal
client computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200780052430A
Other languages
English (en)
Other versions
CN101681664B (zh
Inventor
T·坎普
M·朱姆凯勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Deutschland GmbH
Original Assignee
Sony International Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony International Europe GmbH filed Critical Sony International Europe GmbH
Publication of CN101681664A publication Critical patent/CN101681664A/zh
Application granted granted Critical
Publication of CN101681664B publication Critical patent/CN101681664B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6581Reference data, e.g. a movie identifier for ordering a movie or a product identifier in a home shopping application
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/165Centralised control of user terminal ; Registering at central
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

用于在音频信号内确定时间点的方法(已经将所述音频信号从广播站传送到客户机以及服务器),其包含:在服务器处从所述音频信号中得到第一签名数据(E1,E2,…),其中将参考时间点与对应于所述第一签名数据的所述音频信号的起始或结束相关联;在客户机处从所述音频信号中得到第二签名数据(E1’,E2’,…;ET;ST),其中所述第二签名数据以与所述第一签名数据在服务器处同样的方式被得到;比较所述第一和第二签名数据;取决于所述比较步骤的结果,确定所述时间点(T)与所述参考时间点相等。

Description

用于在音频信号内确定时间点的方法
本发明涉及一种用于在音频信号内确定时间点的方法以及一种记录设备。
背景技术
如今存在用于记录从广播站广播的音频和/或视频信号的记录设备,例如带有硬盘驱动器或者磁盘驱动器的数字记录设备。然而在记录了音频和/或视频信号之后,用户可能不对所有的记录感兴趣。例如,用户可能希望从被记录的音频和/或视频信号中切掉广告,例如商业广告(commercials)。另外,被记录的音频和/或视频信号可以包含电影而用户可能希望在不用手动搜索电影的起始或结束的情况下开始观看该电影。
发明概述
本发明的目标是提供一种用于在音频信号内确定时间点的方法以及例如允许对被记录的音频和/或视频信号准确导航的记录设备。
该目标通过分别根据权利要求1、23以及28的方法以及记录设备实现。
附图概述
图1显示了在根据双向模式的操作的情况中的系统概观;
图2显示了用于解释双向模式的示图;
图3显示了解释根据双向模式的操作的流程图;
图4显示了客户机和服务器,其中客户机和服务器在两个方向上都与彼此通信(双向模式);
图5显示了在根据广播模式的操作的情况中的系统概观;
图6显示了用于解释广播模式的示图;以及
图7显示了用于解释根据广播模式的步骤的流程图。
具体实施方式
在下文中描述了本发明的实施方式。应注意在下文中所有描述的实施方式可以以任何方法组合,即没有限制某些描述的实施方式不可以与其他的组合,这很重要。
根据本发明一实施方式,用于在音频信号内确定时间点的方法(已经将所述音频信号从广播站传送到客户机(例如记录设备)以及到服务器)包含:在服务器处从音频信号中得到第一签名数据,其中第一签名数据描述所述音频信号的至少一个部分以及其中将参考时间点与所述音频信号的所述至少一个部分的起始或结束相关联。可以根据诸如举例来说在已公布的欧洲专利申请No.EP 1667106 A1(=EP申请No.0402888.1)中描述的预先确定的算法确定第一签名数据。
本方法也包含在客户机处从音频信号中得到第二签名数据,其中第二签名数据描述所述音频信号的至少一个部分以及以同样的方式被得到,例如根据与所述第一签名数据在服务器处同样的算法。换句话说,根据本发明一实施方式,在服务器处以及在客户机处分析了接收到的音频信号的部分以及对于这些部分中的至少一些,根据同样的算法确定了签名数据。可以比较第一和第二签名数据以及可以取决于比较步骤的结果将时间点确定为与所述参考时间点相等。因而,举例来说将对应于音频信号某部分的第一签名数据和第二签名数据相比较。如果确定所述第一签名数据与第二签名数据相似或者相同,则可认为在服务器处音频信号的部分与在客户机处音频信号的部分是一样的。从而,将在客户机侧的时间点设定到在服务器端的音频信号的部分的起始或结束时间。
在另一实施方式中,所述音频信号可以是电视信号的部分以及所述方法包含在客户机处记录所述电视信号。另外,将关于被记录的电视信号的节目信息从所述服务器传送到所述客户机是有可能的。例如,节目信息可以指示电视信号内电影或者广告块的起始和结束的准确时间。基于这种节目信息以及所述时间点,所述客户机可以控制被记录的电视信号的重放以使重放恰好在所希望的位置处开始(例如电影的起始)以及用户不感兴趣的电视信号部分(例如广告块)被切掉。而且,可以控制重放恰好在所希望的位置处结束。
因此,应该注意与音频信号相关的、整个说明书通篇描述的原则同样适用于包含音频信号或者音频数据的音频/视频信号,例如电视信号或者视频数据流。所以,可以将在本说明书中描述的任何特征或者细节应用于音频/视频信号、电视信号、视频数据流、音频信号流或者类似物。
在另一实施方式中,可以根据双向模式执行操作。在双向模式中客户机和服务器之间存在双向通信信道。根据双向模式一实施方式,可以将所述第二签名数据从客户机发送到服务器以及可以在服务器处完成比较步骤。从而,因为可以在服务器处完成要求高计算能力的比较步骤,所以可将客户机的计算能力维持低。
根据双向模式的另一实施方式,所述第二签名数据可以只对应于音频信号的一个被选定的部分。由于第二签名数据只需要对于音频信号的一个被选定的部分被确定,可以更进一步降低计算负担。
另外,所述第一签名数据可以包含多个子单元,其中从所述音频信号相应的部分中得到每个子单元,以及其中,在所述比较步骤中,对于每个子单元可以确定相似性量度,所述相似性量度描述相应的子单元与第二签名数据的相似程度,以及其中,在所述确定步骤中,可以将时间点确定为与最大程度相似的子单元的参考时间点相等,所述最大程度相似的子单元在所有子单元中具有最高的相似性量度。换句话说,可以将音频信号分割成不同的片段以及对于每个片段,确定签名数据。
从其中得到子单元的、音频信号的部分可以被选择为包含音频信号中的非无声(non-silent)段落。另外,被选定的部分可以被选择为包含音频信号的非无声段落。因而,签名数据可以更有特点以及不同签名数据之间的相似性可以更容易检测。
本发明一实施方式也可以允许根据广播模式的操作。在广播模式中,不需要有服务器和客户机之间的双向通信信道。只需要有从服务器到客户机的通信信道。如果没有从客户机到服务器的反向信道是可用的,这可以有帮助。
在广播模式中,可以将第一签名数据从服务器发送到客户机,并且在客户机处完成比较步骤。另外,可以将所述参考时间点从服务器发送到客户机,并且可以在客户机处完成确定步骤。
更进一步,第一签名数据可以对应于音频信号的至少一个被选定的部分。被选定的部分可以被选择为包含所述音频信号的非无声部分。通过选择非无声部分,因为签名数据可以对于音频信号的至少一个部分更具代表性和/或特征性,比较可以更容易。
在广播模式中,第二签名数据也可以包含多个子单元,其中从所述音频信号相应的部分中得到每个子单元,以及其中,在所述比较步骤中,对于每个子单元确定相似性量度,所述相似性量度描述相应的子单元与所述第一签名数据的相似程度,以及其中,在所述确定步骤中,可以将时间点确定为与最大程度相似的子单元的参考时间点相等,所述最大程度相似的子单元在所有子单元中具有最高的相似性量度。
在另一实施方式中,在所述客户机处提供本地时间是可能的,以及其中将每个子单元与本地时间点相关联,并且只对于具有围绕所述参考时间点的预先定义的时间范围内的本地时间点的子单元执行所述比较步骤。因为在客户机处可以有第二签名数据对其可用的、所述音频信号的大量的部分,所以这可以有帮助。例如,可以每10秒或者30秒或者任何预先确定的时间段得到第二签名数据一次。可以将所述音频信号相应的部分的起始或结束时间与客户机的本地时间相关联。在客户机已经从服务器收到第一签名数据连同相应的对应参考时间点之后,客户机可以只比较对应于具有在参考时间点附近的起始或结束时间的部分的、所述第二签名数据的子单元。
根据另一实施方式,只对于一个接近的子单元执行所述比较步骤也可以是可能的。该接近的子单元是所有子单元中具有与参考时间点最接近的本地时间点的子单元。换句话说,可以比较对应于子单元的、音频信号的部分的起始和/或结束时间和第一签名数据的参考时间点并且具有与参考时间点最接近的起始或结束时间的子单元/音频部分被选择。
如已经提及的,音频信号可以是视频/音频信号的部分并且可以执行本方法用于在视频/音频信号内确定时间点。所以,可以从视频/音频信号中提取音频信号,并且对于音频信号,执行得到、比较以及确定步骤。
本方法也可以包含将对应于音频信号或者电视信号的节目信息从服务器发送到客户机,并且基于节目信息选择用于重放的、音频信号或者电视信号的至少一部分。如果本方法被应用于视频/音频信号(例如电视节目),则节目信息可以对应于例如指示广播电影的起始和结束时间的电子节目(EPG)信息。在这种情况中,客户机可以基于被确定的时间点确定准确的电影起始和结束的时间。因为客户机已经确定所述音频信号的部分的准确的开始或结束时间,通过从已知的时间点计算相应的时间差来确定对应于被记录的视频/音频信号的、电影的起始和/或结束时间是有可能的。根据另一实施方式,节目信息包含广告块(例如商业广告)的起始和结束时间也可以是有可能的。当再现音频信号或者视频/音频信号时,通过从包含在音频信号或者电视信号中的广告的起始跳跃到其结束时间来切掉该广告是有可能的。通过删除不属于信号中所希望的部分(例如不属于电影的部分)的、被记录的信号的部分来修正被记录的音频/电视信号也是有可能的。
在一种实施方式中,记录设备可以包含接收装置,所述接收装置被配置用来从广播站接收音频信号并且还被配置用来从服务器接收计时信息,还包含重放装置,所述重放装置被配置用来取决于所述计时信息重放所述音频信号。
接收装置还可以被配置用来从所述服务器接收与所述音频信号有关的节目信息并且还被配置用来基于节目信息选择用于重放的、所述音频信号的至少一部分。
根据广播模式操作的记录设备可以包含接收装置,所述接收装置被配置用来从广播站接收音频信号并且还被配置用来从服务器接收第一签名数据以及至少一个参考时间点,已经从所述音频信号中得到所述第一签名数据,其中所述第一签名数据描述所述音频信号的至少一个部分,以及其中将所述参考时间点与所述音频信号的所述至少一个部分的起始或结束相关联。该设备还可以包含数据处理装置,所述数据处理装置被配置用来从音频信号中得到第二签名数据,其中第二签名数据描述所述音频信号的至少一个部分并且以同样的方式(例如根据与第一签名数据同样的算法)被得到,所述数据处理装置还被配置用来比较第一和第二签名数据并且取决于比较结果确定重放开始和/或结束时间。该记录设备还可包含配置用于根据该重放开始和/或结束时间来重放音频信号的重放装置。
图1显示了广播站100、客户机200以及服务器300。客户机200可以例如是诸如举例来说具有硬盘和/或数字多用盘(DVD)记录器的记录设备。广播站100将电视信号TV发送到客户机200以及服务器300。该电视信号TV包含音频信号。
图1显示了根据双向模式的本发明一实施方式。因而,在客户机200和服务器300之间有双向通信。在双向模式中,客户机200选择音频信号的至少一个部分并且得到第二签名数据ET。可以根据诸如举例来说在已公布的欧洲专利申请No.EP 1667106A1(=EP申请No.04 02888.1)中描述的预先确定的算法确定签名数据ET
从客户机200将第二签名数据ET发送到服务器300。备选地,客户机200也可以将音频信号的部分ST发送到服务器300。在这种情况中,可以不需要确定签名数据并且基于音频信号的一部分直接完成比较。
如图2中所见,服务器300连续确定用于有预先定义长度的、所述音频信号的部分的第一签名数据E1,E2,...并且比较接收到的第二签名数据ET和已得到的第一签名数据E1,E2,...。如果服务器确定第一签名数据E1,E2,...中的一个与第二签名数据ET匹配,则选择匹配的签名数据EX并且确定音频信号对应的部分的起始和/或结束时间。服务器300可以包含服务器时钟,所述服务器时钟提供用于确定对应于第一签名数据的、音频信号的部分的起始和/或结束时间的服务器时间。然后将匹配的第一签名数据的起始和/或结束时间发送到客户机。举例来说,在图1中将对应于与第二签名数据ET匹配的第一签名数据的音频信号的部分的起始时间t从服务器300发送到客户机200。
可选地,服务器300也可以将节目信息M(例如元数据或者类似物)传送到客户机200。节目信息M可以指示某音频节目、视频节目(电视节目)、电影或者类似物的起始和/或结束时间,或者也可以指示广告块的起始和结束时间。因为,在接收到对应于第二签名数据ET的音频信号的部分的起始时间t之后,客户机200可以基于起始时间t确定电影、音频节目或者广告块的起始和结束的准确位置。
图2显示了一个例子,在其中已经在客户机200和服务器300处接收到同样的音频信号。在图2的左手边显示了在客户机200处被接收到的音频信号,并且在图2的右手边显示了在服务器300处被接收到的音频信号。
如图2中所见,在客户机200处音频信号的部分ST被选择。可以选择部分ST以使音频信号本质上是非无声的。部分ST可以具有预先定义的长度,例如10秒、20秒或者30秒或者更长。对于部分ST,根据预先定义的算法得到第二签名数据ET
在图2左手边处的示图中,显示了对应于部分ST的起始的时间点T。确定时间点T是所希望的。如果时间点T已知,则如上所述在客户机200处贯穿被记录的音频信号和/或视频信号导航是可能的,例如在所希望的位置处开始重放或者切掉广告块。为了确定时间点T,将所述第二签名数据ET发送到服务器300。备选地或者另外地,可以将部分ST发送到服务器300。
在服务器300处,从广播站接收到的音频信号被分割为有预先定义长度的部分S1,S2,...。部分S1,S2,...的长度对应于客户机200处的部分ST的长度,举例来说,如图2的例子中所示该长度可以被选取为等于30秒。
在服务器处,准确的时间是已知的,在下文中也被称为服务器时间。服务器时间可以举例来说由高精度时钟或者接收准确时间信号的无线时钟确定。因而,在服务器处,部分S1,S2,...的准确起始和结束时间是已知的。在图2的例子中,部分S1在例如2006年11月11日周三于17:42:10时开始。由于每个部分S1,S2,...具有30秒的长度,每个部分S1,S2,...的起始和结束时间是已知的。
另外,在服务器300处对于每个部分S1,S2,...,以与所述第二签名数据在客户机200处同样的方式确定第一签名数据E1,E2,...。
比较接收到的第二签名数据ET和第一签名数据E1,E2,...。备选地,如果已经将部分ST从客户机200传送到服务器300,则部分ST将与每个部分S1,S2,...比较。
基于比较,确定第一签名数据E1,E2,...中的哪一个最接近地匹配到第二签名数据ET。最接近匹配的第一与第二签名数据随后被用来确定时间点T。在图2的例子中,第二签名数据ET与第一签名数据E4匹配。因为,对应于第一签名数据E4的部分S4开始于t=17:43:40时是已知的,可确定对应于部分ST的起始时间的时间点T在17:43:40时。
在图2的例子中,用户可能希望观看从17:45:00时至18:30:00时广播的电影”Bonanza”。因此,可以将电影”Bonanza”的起始和结束时间(即节目信息M)从服务器300传送到客户机200。由于客户机200知道部分ST的起始的准确时间是在17:43:40时,客户机200能够在电影”Bonanza”的音频/视频信号内确定准确的开始时间。
图3显示了关于可以被执行用来确定用于重放所希望的电影或者类似物的时间点和/或开始时间的步骤的流程图。
在图3的左手边显示了在客户机200处执行的步骤以及在图3的右手边显示了在服务器300处执行的步骤。
在步骤S300中,在客户机200处接收音频信号,例如电视信号的音频信号。在步骤S302中,音频信号的部分ST被选择。在步骤S304中,对于被选定的部分ST确定第二签名数据(在下文中也被称为标签或者客户机标签)ET。在步骤S306中,将标签ET发送到服务器300。
如在图3的右手边所见,在服务器300处步骤S308中,也接收同样的音频信号。另外,在步骤S310中,根据同样的算法/以与在客户机200处同样的方式确定标签E1,E2,...(在下文中也被称为服务器标签E1,E2,...)。在步骤S312中,从客户机200接收标签ET。另外,在步骤S314中,比较标签ET和服务器标签E1,E2,...。在步骤S314中,服务器标签E1,E2,...中的哪一个对应于客户机标签ET被确定。
然后,在步骤S316中,确定客户机标签ET的开始时间。客户机标签ET的开始时间对应于最接近地匹配到客户机标签ET的服务器标签的开始时间。然后,在步骤S318中,将开始时间t从服务器300发送到客户机200。另外,在步骤S320中,可以将元数据M(例如节目信息或者类似物)从服务器300传送到客户机200。在步骤S322中,客户机200可以基于开始时间t以及元数据M确定用于被用户选择的音频节目和/或视频节目(即所希望的电影)的重放的开始时间。
然后,在步骤S324中,重放在所希望的电影的起始处开始。
图4显示了客户机/服务器架构的可能的实施方式。
从广播站400将音频/视频信号402广播到客户机200和服务器300。客户机200可以包含接收装置404,所述接收装置404被配置用来接收音频-视频信号402并且还可以被配置用来从服务器300接收计时信息T。另外,客户机200可以包含重放装置,所述重放装置被配置用来取决于计时信息重放音频信号。可选地,客户机200还可以包含数据处理器408,所述数据处理器408被配置用来从音频-视频信号402得到签名数据,其中签名数据描述音频信号的至少一部分并且以预先确定的方式被得到。另外,客户机200可以包含被配置用来将签名数据ET发送到服务器300的发送装置。
服务器300可以包含被配置用来接收音频/视频信号402的接收装置412。另外,服务器300可以包含数据处理器414,所述数据处理器414被配置用来得到服务器标签E1,E2,...(比较上述的图2和图3)以及将这些标签与签名数据ET比较。
服务器300也可以包含发送装置416,所述发送装置416被配置用来将对应于客户机标签ET已被确定的起始时间的计时信息T发送到客户机200。
图5显示了一实施方式,其中广播站100将包含音频信号的电视信号传送到客户机500和服务器600。客户机500以及服务器600允许根据广播模式的操作。在广播模式中,只有从服务器600到客户机500的单向连接。换句话说,与双向模式形成对照,不需要有从客户机500到服务器600的反向连接。
简单来说,在广播模式中,服务器600基于电视信号TV确定服务器标签E1,E2,...并且将服务器标签E1,E2,...发送到客户机500。客户机500以与服务器600同样的方式(例如根据预先确定的同样的算法)确定客户机标签。为了确定对应于服务器标签E1,E2,...中的一个的起始或结束时间的时间点,客户机500比较被确定的客户机标签与服务器标签E1,E2,...。在广播模式中,服务器600还将起始和/或结束时间t1,t2,...传送到客户机500。起始和/或结束时间t1,t2,...对应于相应的服务器标签E1,E2,...的起始和/或结束时间。
因而,客户机500可以通过确定与服务器标签E1,E2,...最佳匹配的最接近匹配的客户机标签确定客户机标签的起始和/或结束时间。然后,客户机标签的起始和/或结束时间可以被设定为相应的服务器标签的起始和/或结束时间t。
在图6的左手边显示了包含在电视信号TV中的音频信号。在图6的右手边显示了对应于已在客户机500处被接收和记录的电视信号TV的音频信号。
在广播模式中,服务器600确定服务器标签E1,E2,...。例如,可以每五分钟或者每十分钟确定服务器标签一次。服务器标签E1,E2,...可以对应于音频信号的服务器部分S1,S2,...,其中部分S1,S2,...可以是有预先确定的长度的,例如10秒、20秒、30秒或者更长。
应该注意,尽管图6显示多个服务器标签E1,E2,...被确定,只确定一个服务器标签可以是足够的。
然后,将服务器标签E1,E2,...连同相应的起始和/或结束时间传送到客户机500。在图6的例子中,对应于服务器标签E1,E2,...的相应的部分S1,S2,...的起始时间被传送到服务器500。
在一备选的实施方式中,或者除服务器标签E1,E2,...以外,可以将部分S1,S2,...从服务器600传送到客户机500。
在客户机500处,如图6的右手边所示,举例来说每10秒确定客户机标签E1’,E2’,...一次。仅大约每分钟确定客户机标签E1’,E2’一次也是可能的。在这种情况中,客户机标签可能需要长于30秒。对应于客户机标签E1’,E2’,...的客户机部分S1’,S2’可以具有可与服务器部分S1,S2,...同样长度的预先确定的长度。
将服务器标签E1,E2,...与客户机标签进行比较E1’,E2’,...。
为了节省计算时间,某个服务器标签被选取用于比较是可能的。在客户机500处可以基于估计的本地时间确定所述某个服务器标签。例如在图6中,估计对应于客户机标签E1’的客户机部分S1’的起始开始于本地时间17:39:40时。服务器标签E1,E2,...中具有与这个估计的本地时间17:39:40时最接近的起始时间的服务器标签是开始于服务器时间17:40:00时的服务器标签E1。所以,将比较服务器标签E1和客户机标签E1’,E2’,...。因而,由于减少了所需要的比较的数量,则可以减少计算负担。穷举搜索是不需要的并且只需要比较服务器标签E1和客户机标签E1’,E2’,...。因此不需要将所有服务器标签E1,E2,...和所有客户机标签E1’,E2’,...比较。
在另一实施方式中,通过只比较客户机标签和某个服务器标签(那些客户机标签在该服务器标签的开始时间附近)减少所需要的计算时间也可以是有可能的。在附近意思是例如在相应的服务器标签的起始时间的预先确定的时间范围之内。
在一实施方式中,其中将服务器部分S1,S2,...从服务器600传送到客户机500,可以将服务器部分S1,S2,...与客户机部分S1’,S2’,...比较。用与使用标签时类似的方法,通过只比较被选定的服务器部分和具有如该服务器部分的起始时间的、接近的起始时间的客户机部分S1’,S2’减少计算负担是有可能的。
在图6的例子中,确定服务器标签E1与客户机标签E5’最接近地匹配。因而,确定对应于客户机标签E5’的客户机部分S5’开始于与服务器标签E1同样的时间,即于17:40:00时。
在另一实施方式中,将节目信息M从服务器600传送到客户机500是有可能的,该节目信息M指示例如音频节目、电影、广告等的起始和/或结束时间。在图6的例子中,节目信息M指示从17:45:00时到18:30:00时广播电影”Bonanza”。因而,客户机500可以在具有于17:40:00时的开始时间的客户机部分S5’的开始之后五分钟开始重放。
图7显示了在广播模式下可以在服务器600和客户机500处执行的步骤。
在步骤S700中,在服务器600处接收电视信号的音频信号。另外,如结合图6左手边所解释的,在步骤S702中确定服务器部分E1,E2,...。另外,在步骤S704中将服务器标签E1,E2,...连同标签相应的起始时间发送到客户机500。
客户机500处,在步骤S706中接收通过广播站100广播的电视信号的音频信号。另外,如借助(at hand of)图6右手边所解释的,在步骤S708中确定客户机标签E1’,E2’,...。然后,在步骤S710中从服务器600接收服务器标签E1,E2,...以及对应的起始时间。
然后,在步骤S712中,选择与相应的服务器标签E1,E2,...的开始时间接近的某些客户机标签E1’,E2’,...。当然,如结合图6右手边所解释的,只选择一个将被用于比较的服务器标签(在图6的例子中服务器标签E1)也是有可能的。
然后,在步骤S714中,将服务器标签E1,E2,...与被选定的客户机标签E1’,E2’,...比较。
在步骤S716中,基于比较结果确定被选定的客户机标签的起始时间或者一个最接近匹配的客户机标签的至少一个起始时间。
在服务器600处被执行的步骤S720中,将元数据M从服务器600发送到客户机500。
在步骤S718中,在客户机500处基于最接近匹配的客户机标签的起始时间以及元数据M确定用于重放的开始时间。
下述阐释可以帮助得到更好的理解。
根据本发明一实施方式,客户机设备(例如记录设备)可以从接收到的视频信号确定标签。可以将该标签发送到服务器,所述服务器确定在什么时间以及在哪个信道中放映节目。将这个信息发送到客户机。因而,可以达到被记录的视频信号到电视节目的准确定位。由于这种准确定位,给予诸如准确导航(例如切掉广告或者导航至电影内的某个场景)等服务可以是有可能的。
可以作为一种将服务出售给其客户机的服务业务或者作为对于希望为他们的记录设备添加特征(add features)的硬件制造商的附加业务给予该服务。
在所有的情况中,认为有中央数据库(元数据供应方),例如具有用于电视消费者的有关信息的服务器。这可以例如是商业广告或者广告的位置,但它也可以是关于哪个演员在电影中的哪个时间出现的信息、用于听力受损者的记录信息(transcript information)、双语字幕或者其他。在最简易的情况中,它可能仅仅是当前节目准确的开始和结束时间。所有这种额外的信息也可以被称为节目信息或者元数据。
如果信息仅是当前节目准确的开始和结束时间,被给予的额外的功能可以是对记录自动的以及秒分般准确的切分(second-split exactcutting)。
在更高级的例子中,可以与任何电影同步出现的字幕(例如作为用于外语学习者的服务)或者可以有到某个演员说话或者唱歌的位置的直接导航等。通过标记商业广告,用作为目标的(targeted)广告取代商业广告是有可能的:可以用对用户完全透明的任何其他商业广告填满原始记录中的商业广告间隙。
可以有两种模式:(基本的)双向模式,以及广播模式。
在双向模式中,首先用户完成他的记录,比如从17:55:00时到19:05:00时,因为他希望记录从18:00:00时到19:00:00时播放的电影。然后,记录设备从记录取出适当地被选定的音频小片,即音频信号的一部分并且将此发送到服务器。“适当地被选择”可以意为一段描述性的音频被选择并且不是使唯一识别(例如基于签名数据)困难的一段音频。例如,它可以是避免无声段落。
服务器使用该小片或者标签来识别该小片在音频流中被取自的准确位置。然后,服务器从它的数据库中计算与该小片有关的关于何时是该小片的准确开始和结束时间的信息,例如“这是”DesperateHousewives(绝望的主妇),233幕,它在那个小片被取之前2分34秒开始并且它在那个小片被取之后42分28秒结束”。
客户机设备则可以使用这个计时信息恰好在准确的起始和结束时间将”Desperate Housewives”的该幕切出。当然,服务器也可以传送额外的数据,像演员信息、系列信息(series information)以及类似物;并且所有这些将与”Desperate Housewives”的该幕一起被存储。如果将传送关于商业广告的在何处的信息,通过在重放期间跳过它们或者通过将它们从客户机设备中一起移除,这将马上允许屏蔽重放期间的所有商业广告。
在广播模式中,免除从客户机到服务器的反向连接可以是有可能的。在广播模式中,服务器在以规律的间隔对每个被支持的TV节目流采样(例如大约每5分钟对于10秒),并且计算指纹,即被采样的部分的标签。然后服务器可以将所有有关的元数据信息连同所有指纹一起下行(downstream)到客户机。客户机于本地以“服务器模式”运行指纹识别、搜索当前记录中的每个指纹。当然由于客户机已知记录的粗略时间以及信道并且能够因此将可能的指纹的数量减少到一至三个,所以不要求穷举搜索。一旦在本地记录中定位指纹,可以以与在双向模式的情况中同样的形式开始准确的对准以及另外的元数据使用。

Claims (32)

1.一种用于在音频信号内确定时间点(T)的方法,已经将所述音频信号从广播站传送到客户机以及服务器,所述方法包含:
在所述服务器处从所述音频信号中得到第一签名数据(E1,E2,...),其中所述第一签名数据描述所述音频信号的至少一个部分,以及其中将参考时间点与所述音频信号的所述至少一个部分的起始或结束相关联;
在所述客户机处从所述音频信号中得到第二签名数据(E1’,E2’,...;ET;ST),其中所述第二签名数据描述所述音频信号的至少一个部分并且以与所述第一签名数据在所述服务器处同样的方式被得到;
比较所述第一和第二签名数据;
取决于所述比较步骤的结果,将所述时间点(T)确定为与所述参考时间点相等。
2.根据权利要求1所述的方法,其中将所述第二签名数据(ET;ST)从所述客户机发送到所述服务器,并且在所述服务器处完成所述比较步骤。
3.根据权利要求2所述的方法,其中将所述参考时间点从所述服务器发送到所述客户机,并且在所述服务器处完成所述确定步骤。
4.根据权利要求2或3所述的方法,其中所述第二签名数据只对应于所述音频信号的一个被选定的部分。
5.根据前述权利要求中任何一项所述的方法,其中所述第一签名数据包含多个子单元,其中从所述音频信号相应的部分中得到每个子单元,以及其中,在所述比较步骤中,对于每个子单元确定相似性量度,所述相似性量度描述相应的子单元与所述第二签名数据的相似程度,以及其中,在所述确定步骤中,将所述时间点确定为与最大程度相似的子单元的参考时间点相等,所述最大程度相似的子单元在所有子单元中具有最高的相似性量度。
6.根据权利要求5所述的方法,其中,从其中得到所述子单元的、所述音频信号的所述部分被选择为包含所述音频信号的非无声段落。
7.根据权利要求4至6中任何一项所述的方法,其中所述被选定的部分被选择为包含所述音频信号的非无声段落。
8.根据权利要求1所述的方法,其中将所述第一签名数据(E1,E2,...)从所述服务器发送到所述客户机,并且在所述客户机处完成所述比较步骤。
9.根据权利要求8所述的方法,其中将所述参考时间点从所述服务器发送到所述客户机,并且在所述客户机处完成所述确定步骤。
10.根据权利要求8或9所述的方法,其中所述第一签名数据对应于所述音频信号的至少一个被选定的部分。
11.根据权利要求8或9所述的方法,其中所述第一签名数据对应于所述音频信号的多个被选定的部分。
12.根据权利要求10或11所述的方法,其中所述被选定的部分被选择为包含所述音频信号的非无声部分。
13.根据权利要求8至12中任何一项所述的方法,其中所述第二签名数据包含多个子单元,其中从所述音频信号相应的部分中得到每个子单元,以及其中,在所述比较步骤中,对于每个子单元确定相似性量度,所述相似性量度描述相应的子单元与所述第一签名数据的相似程度,以及其中,在所述确定步骤中,将所述时间点确定为与最大程度相似的子单元的参考时间点相等,所述最大程度相似的子单元在所有子单元中具有最高的相似性量度。
14.根据权利要求13所述的方法,其中在所述客户机处提供本地时间,以及其中将每个子单元与本地时间点相关联,以及其中只对于具有围绕所述参考时间点的预先定义的时间范围内的本地时间点的子单元执行所述比较步骤。
15.根据权利要求13所述的方法,其中在所述客户机处提供本地时间,以及其中将每个子单元与本地时间点相关联,以及其中只对于接近的子单元执行所述比较步骤,所述接近的子单元在所有子单元中具有与所述参考时间点最接近的本地时间点。
16.根据前述权利要求中任何一项所述的方法,其中所述音频信号是电视信号的部分以及所述方法是用于在所述电视信号内确定时间点(T)的方法。
17.根据权利要求16所述的方法,其中在所述客户机处记录所述电视信号以及所述时间点被用于控制被记录的电视信号的重放。
18.根据前述权利要求中任何一项所述的方法,其包含
将对应于所述音频信号的节目信息从所述服务器发送到所述客户机;
基于所述节目信息选择用于重放的、所述音频信号的至少一部分。
19.根据权利要求18所述的方法,其中所述节目信息包含至少一个起始时间和对应的结束时间,所述起始和结束时间指示被选择用于重放的、所述音频信号的一部分或者所述起始和结束时间指示不被选择用于重放的、所述音频信号的一部分。
20.根据权利要求19所述的方法,其中所述起始和结束时间对应于一段音乐和/或电影的起始和结束时间。
21.根据前述权利要求中任何一项所述的方法,其中,从其中得到所述第一和第二签名数据的、所述音频信号的所述至少一个部分具有预先定义的长度。
22.一种计算机可读介质,其包括使计算机执行用于在音频信号内确定时间点的方法的计算机程序指令,已经将所述音频信号从广播站传送到客户机以及服务器,所述方法包含:
在所述服务器处从所述音频信号中得到第一签名数据(E1,E2,...),其中所述第一签名数据描述所述音频信号的至少一个部分,以及其中将参考时间点与所述音频信号的所述至少一个部分的起始或结束相关联;
在所述客户机处从所述音频信号中得到第二签名数据(E1’,E2’,...;ET;ST),其中所述第二签名数据描述所述音频信号的至少一个部分并且以与所述第一签名数据在所述服务器处同样的方式被得到;
比较所述第一和第二签名数据;
取决于所述比较步骤的结果,将所述时间点(T)确定为与所述参考时间点相等。
23.一种记录设备,其包含
接收装置,所述接收装置被配置用来从广播站接收音频信号以及还被配置用来从服务器接收计时信息;
重放装置,所述重放装置被配置用来取决于所述计时信息重放所述音频信号。
24.根据权利要求23所述的记录设备,其中所述接收装置还被配置用来从所述服务器接收与所述音频信号有关的节目信息,以及基于所述节目信息选择用于重放的、所述音频信号的至少一部分。
25.根据权利要求24所述的记录设备,其中所述节目信息包含至少一个起始时间和对应的结束时间,所述起始和结束时间指示被选择用于重放的、所述音频信号的部分或者所述起始和结束时间指示不被选择用于重放的、所述音频信号的部分。
26.根据权利要求23至25中任何一项所述的记录设备,其包含
数据处理装置,所述数据处理装置被配置用来从所述音频信号中得到签名数据(ET),其中所述签名数据描述所述音频信号的至少一个部分以及以预先确定的方式被得到;
发送装置,所述发送装置被配置用来将所述签名数据(ET)发送到服务器。
27.根据权利要求23至26中任何一项所述的记录设备,其中所述音频信号是视频/音频信号的部分。
28.一种系统,其包含
根据权利要求23至27中任何一项所述的记录设备;以及
被配置用来提供所述计时信息的服务器。
29.一种记录设备,其包含
接收装置,所述接收装置被配置用来从广播站接收音频信号以及还被配置用来从服务器接收第一签名数据以及至少一个参考时间点,已经从所述音频信号中得到所述第一签名数据,其中所述第一签名数据描述所述音频信号的至少一个部分,以及其中将所述参考时间点与所述音频信号的所述至少一个部分的起始或结束相关联;
数据处理装置,所述数据处理装置被配置用来从所述音频信号中得到第二签名数据,其中所述第二签名数据描述所述音频信号的至少一个部分以及以与所述第一签名数据同样的方式被得到,所述数据处理装置还被配置用来比较所述第一和第二签名数据以及用来取决于所述比较结果确定重放开始和/或结束时间;
重放装置,所述重放装置被配置用来根据所述重放开始和/或结束时间重放所述音频信号。
30.一种用于在电视信号内确定时间点的方法,已经将所述电视信号从广播站传送到客户机以及服务器,所述方法包含:
在所述服务器处从所述电视信号中得到第一签名数据,其中所述第一签名数据描述所述电视信号的至少一个部分,以及其中将参考时间点与所述电视信号的所述至少一个部分的起始或结束相关联;
在所述客户机处从所述电视信号中得到第二签名数据,其中所述第二签名数据描述所述电视信号的至少一个部分以及以与所述第一签名数据在所述服务器处同样的方式被得到;
比较所述第一和第二签名数据;
取决于所述比较步骤的结果,将所述时间点确定为与所述参考时间点相等。
31.一种用于在电视信号内确定时间点的方法,其包含:
在服务器处从所述电视信号中得到第一签名数据,其中将参考时间点与所述第一签名数据的起始或结束相关联;
在所述客户机处从所述电视信号中得到第二签名数据,其中所述第二签名数据以与所述第一签名数据在所述服务器处同样的方式被得到;
比较所述第一和第二签名数据;
取决于所述比较步骤的结果,将所述时间点确定为与所述参考时间点相等。
32.根据权利要求31所述的方法,其中,在所述客户机处记录所述电视信号以及所述时间点被用来控制被记录的电视信号的重放。
CN2007800524306A 2007-03-31 2007-11-30 用于在音频信号内确定时间点的方法 Expired - Fee Related CN101681664B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP07006767.3 2007-03-31
EP07006767A EP1975938A1 (en) 2007-03-31 2007-03-31 Method for determining a point in time within an audio signal
PCT/EP2007/010426 WO2008119372A1 (en) 2007-03-31 2007-11-30 Method for detemining a point in time within an audio signal

Publications (2)

Publication Number Publication Date
CN101681664A true CN101681664A (zh) 2010-03-24
CN101681664B CN101681664B (zh) 2013-05-01

Family

ID=38358052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800524306A Expired - Fee Related CN101681664B (zh) 2007-03-31 2007-11-30 用于在音频信号内确定时间点的方法

Country Status (6)

Country Link
US (1) US8620466B2 (zh)
EP (1) EP1975938A1 (zh)
JP (1) JP2010523068A (zh)
KR (1) KR20090122463A (zh)
CN (1) CN101681664B (zh)
WO (1) WO2008119372A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426439A (zh) * 2013-05-08 2013-12-04 杭州联汇数字科技有限公司 一种广播电视音频信号内容一致性检测方法
CN104521229A (zh) * 2012-10-22 2015-04-15 尼尔森(美国)有限公司 用于音频媒体测量系统的时钟校正和/或同步的方法和系统
CN107211174A (zh) * 2015-02-09 2017-09-26 三星电子株式会社 显示设备及其信息提供方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2487499B (en) * 2008-02-21 2013-02-27 Snell Ltd Method of comparing audio data
GB2457694B (en) * 2008-02-21 2012-09-26 Snell Ltd Method of Deriving an Audio-Visual Signature
US20110067066A1 (en) 2009-09-14 2011-03-17 Barton James M Multifunction Multimedia Device
JP5568953B2 (ja) * 2009-10-29 2014-08-13 ソニー株式会社 情報処理装置、シーン検索方法及びプログラム
US8682145B2 (en) * 2009-12-04 2014-03-25 Tivo Inc. Recording system based on multimedia content fingerprints
US20110137976A1 (en) * 2009-12-04 2011-06-09 Bob Poniatowski Multifunction Multimedia Device
GB2479711A (en) * 2010-04-01 2011-10-26 British Broadcasting Corp Determining playback points in recorded media content
CN105493422A (zh) * 2013-06-20 2016-04-13 汤姆逊许可公司 用于辅助内容的分布式播放的同步的系统和方法
US10014006B1 (en) 2013-09-10 2018-07-03 Ampersand, Inc. Method of determining whether a phone call is answered by a human or by an automated device
US9053711B1 (en) 2013-09-10 2015-06-09 Ampersand, Inc. Method of matching a digitized stream of audio signals to a known audio recording
WO2019046065A1 (en) 2017-08-28 2019-03-07 Dolby Laboratories Licensing Corporation NAVIGATION METADATA WITH MULTIMEDIA CONTENT AWARENESS
US10958301B2 (en) 2018-09-18 2021-03-23 Roku, Inc. Audio synchronization of a dumb speaker and a smart speaker using a spread code
US10992336B2 (en) 2018-09-18 2021-04-27 Roku, Inc. Identifying audio characteristics of a room using a spread code
US10931909B2 (en) 2018-09-18 2021-02-23 Roku, Inc. Wireless audio synchronization using a spread code

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058376B2 (en) * 1999-01-27 2006-06-06 Logan James D Radio receiving, recording and playback system
US20020120925A1 (en) 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
WO2004061711A1 (en) * 2003-01-06 2004-07-22 Koninklijke Philips Electronics N.V. Method and apparatus for similar video content hopping
US20040240562A1 (en) * 2003-05-28 2004-12-02 Microsoft Corporation Process and system for identifying a position in video using content-based video timelines
US20050044561A1 (en) * 2003-08-20 2005-02-24 Gotuit Audio, Inc. Methods and apparatus for identifying program segments by detecting duplicate signal patterns
JP4296503B2 (ja) * 2004-10-04 2009-07-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
EP1667106B1 (en) * 2004-12-06 2009-11-25 Sony Deutschland GmbH Method for generating an audio signature
JP4534791B2 (ja) * 2005-02-23 2010-09-01 ソニー株式会社 Cm検索方法、cm検索結果受給方法、cm検索装置、cm検索結果受給装置及びcm録画予約システム
JP2006270634A (ja) * 2005-03-24 2006-10-05 Victor Co Of Japan Ltd デジタル放送同期再生装置、ストリーム同期再生装置及びストリーム同期再生システム
JP4459179B2 (ja) * 2005-03-30 2010-04-28 株式会社東芝 情報処理装置及びその方法
JP2007041864A (ja) * 2005-08-03 2007-02-15 Nippon Telegr & Teleph Corp <Ntt> メタデータ取得・管理方法及び装置及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104521229A (zh) * 2012-10-22 2015-04-15 尼尔森(美国)有限公司 用于音频媒体测量系统的时钟校正和/或同步的方法和系统
CN103426439A (zh) * 2013-05-08 2013-12-04 杭州联汇数字科技有限公司 一种广播电视音频信号内容一致性检测方法
CN103426439B (zh) * 2013-05-08 2016-04-27 杭州联汇数字科技有限公司 一种广播电视音频信号内容一致性检测方法
CN107211174A (zh) * 2015-02-09 2017-09-26 三星电子株式会社 显示设备及其信息提供方法

Also Published As

Publication number Publication date
KR20090122463A (ko) 2009-11-30
US8620466B2 (en) 2013-12-31
JP2010523068A (ja) 2010-07-08
US20100040342A1 (en) 2010-02-18
EP1975938A1 (en) 2008-10-01
WO2008119372A1 (en) 2008-10-09
CN101681664B (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN101681664B (zh) 用于在音频信号内确定时间点的方法
CN101483767B (zh) 记录和回放设备以及记录和回放方法
CN101490762B (zh) 用于播放音频-视频内容的设备和方法
CN100413330C (zh) 内容喜好程度计算方法和内容接收装置
US7853122B2 (en) Device for reproducing content such as video information and device for receiving content
JP4842944B2 (ja) ビデオ又はオーディオデータのストリームからのコンテンツ選択
US8036261B2 (en) Feature-vector generation apparatus, search apparatus, feature-vector generation method, search method and program
KR100903160B1 (ko) 신호처리장치 및 방법
US20070248334A1 (en) Recording and reproduction apparatus and recording and reproduction method
KR20180105750A (ko) 오디오 핑커프린트 기반의 비디오 멀티-매칭 검출 및 명확화를 통한 미디어 채널 식별
WO2005114450A1 (en) Methods and apparatus for identifying media content
WO2007029479A1 (ja) 記録再生装置、記録再生方法、記録再生プログラムおよびコンピュータに読み取り可能な記録媒体
US20090158307A1 (en) Content processing apparatus, content processing method, program, and recording medium
EP2773108B1 (en) Reception device, reception method, program, and information processing system
EP1293914A2 (en) Apparatus, method and processing program for summarizing image information
US20030033602A1 (en) Method and apparatus for automatic tagging and caching of highlights
US20050273515A1 (en) Apparatus and mehtod for replacing a media content item
US20180210906A1 (en) Method, apparatus and system for indexing content based on time information
EP2621180A2 (en) Electronic device and audio output method
JP4480654B2 (ja) 番組検索システム
JP4293105B2 (ja) 情報処理装置および方法、並びにプログラム
JP6713229B2 (ja) Cm情報生成装置、cm情報生成方法、及びプログラム
EP1958202B1 (fr) Procede d&#39;identification d&#39;un document enregistre par affichage et selection d&#39;images clefs, et recepteur associe
US20060192846A1 (en) Menu generator device and menu generating method for complementing video/audio signals with menu information
EP2811416A1 (en) An identification method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130501

Termination date: 20151130

EXPY Termination of patent right or utility model