CN1871856A - 用于控制音频信号的播放的方法和装置 - Google Patents

用于控制音频信号的播放的方法和装置 Download PDF

Info

Publication number
CN1871856A
CN1871856A CNA2004800310407A CN200480031040A CN1871856A CN 1871856 A CN1871856 A CN 1871856A CN A2004800310407 A CNA2004800310407 A CN A2004800310407A CN 200480031040 A CN200480031040 A CN 200480031040A CN 1871856 A CN1871856 A CN 1871856A
Authority
CN
China
Prior art keywords
audio signal
text
signal
audio
close caption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004800310407A
Other languages
English (en)
Inventor
马修·托马斯·加曼
威廉姆·S·梅瑟尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ClearPlay Inc
Original Assignee
ClearPlay Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ClearPlay Inc filed Critical ClearPlay Inc
Publication of CN1871856A publication Critical patent/CN1871856A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4542Blocking scenes or portions of the received content, e.g. censoring scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/09Arrangements for device control with a direct linkage to broadcast information or to broadcast space-time; Arrangements for control of broadcast-related services
    • H04H60/13Arrangements for device control affected by the broadcast information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/48Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4545Input to filtering algorithms, e.g. filtering a region of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuits Of Receivers In General (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Television Receiver Circuits (AREA)

Abstract

根据本发明的装置和方法包括一种通过对相关的闭路字幕信号和相关的音频信号的共同分析来控制音频信号重播的方法。通过对照用户所确认的不良文本,鉴别闭路字幕信号中的不良文本或其它指定文本。在鉴别所述不良文本之后,分析音频信号以鉴别该不良文本所对应的音频部分。在鉴别出该音频部分后,控制该音频信号以静音原本可听见的不良文本。

Description

用于控制音频信号的播放的方法和装置
有关申请的交叉参考
本申请为非临时申请,要求于2003年8月26日提交的名称为“基于相关音频信号分析的媒体内容过滤;采用有关闭路字幕信号以辅助分析(Filtering of Media Content Based On the Analysis of theAssociated Audio Signal;Using Associated Closed CaptioningSignal to Aid in the Analysis)”的临时申请60/497,769的优先权,特此将该临时申请通过引用合并于此。
技术领域
本发明一般涉及播放和音频/视频展示(presentation),尤其是涉及一种过滤音频信号中不良文字的方法和装置。
背景技术
直播和录制的电视及广播节目、电影和各种音频展示时常包含有亵渎、诽谤,以及其他被特定的人认为是不良的单词或短语。在一些场合里,人们会因不良语言的出现而主动回避展示。此外,家长们也经常试图让他们的孩子免受这类语言的影响。
现已存在对包括不良单词的整个短语进行静音的产品。可是,对整个短语静音经常会产生大量的不完整语言片断——导致观众难以理解和增加观众的挫折感。总的后果通常是降低音频展示的质量。
一般的电视机、机顶盒或类似物都包括有各种处理元件,以接收包括音频分量和视频分量的电视信号,并播放该音频分量和显示该视频分量。然而,该处理元件是专用于音频/视频信号的处理,很少有多余的带宽去执行其他的操作。
本发明的一个方案是针对技术背景而构思形成。本发明涉及一种用于控制音频信号的播放的装置和方法,无论该音频信号是独立的还是形成音频/视频信号的一部分。根据本发明的具体实施例经配置后可仅仅静音音频流中的不良单词。稍微改进现有物理平台或无需改进,本发明的另一个实施例可适于在诸如电视处理器、机顶盒及类似物的传统音频/视频处理设备上运行,若有特殊应用的需要,也适于实时运行。本发明具体实施例的细节将在下面作详细讨论。
发明内容
本发明的一个方案涉及一种控制音频信号的播放的方法,其包括接收闭路字幕信号和分析闭路字幕信号是否含指定文本。在鉴别该指定文本的基础上,分析音频信号,作为从闭路字幕信号中鉴别指定文本的一功能。然后控制该指定文本所对应的音频信号的重播。
控制重播的操作可包括(1)减弱与所述闭路字幕信号中指定文本所对应的音频信号部分;(2)完全删除与所述闭路字幕信号中指定文本所对应的音频信号部分;(3)发出至少一条用于使与所述闭路字幕信号中指定文本所对应的音频信号部分减弱的命令;(4)以及,在音频信号中插入至少一个控制码,用于使闭路字幕信号中指定文本所对应的音频信号部分减弱。
本方法进一步包括将指定文本转换成该指定文本的语音表示的操作;进一步地,本方法可包括时间延长所述指定文本的语音表示来定义指定文本的时间延长语音表示。对于该语音表示,确定至少一个能量值以定义该指定文本的可比较形式。同样地,本方法可包括确定至少一个音频信号的能量值来定义音频信号的可比较形式。
分析音频信号的操作进一步包括将指定文本的可比较形式和音频信号的可比较形式进行比较的操作。由此,本方法进一步包括鉴别与指定文本所对应音频信号部分的操作。
该指定文本可为空格、字母、单词、短语、句子、控制码和符号。进一步地,该指定文本可由用户选出。最后,该指定文本可从被认为是不良的文本中选出。
在一些具体的实例中,鉴别指定文本的操作进一步包括鉴别在先文本的操作,所述在先文本在时间上位于指定文本之前。因而作为鉴别闭路字幕信号中指定文本的一功能的分析音频信号的操作进一步包括作为鉴别闭路字幕信号中在先文本的一功能的分析音频信号。进一步,所述控制指定文本所对应音频信号的重播操作进一步包括控制与在先文本所对应的音频信号的重播。
本发明的另外一个方案涉及控制音频信号的播放的方法,其包括:将闭路字幕文本信号的指定部分转换成指定部分的音频等效(equivalent);将闭路字幕文本信号指定部分的音频等效与音频信号进行比较以鉴别该闭路字幕信号的指定部分所对应的音频信号部分;以及控制该闭路字幕信号的指定部分所对应音频信号部分的重播。
该控制重播的操作进一步包括(1)减弱闭路字幕信号指定部分所对应的音频信号部分;(2)完全删除闭路字幕信号指定部分所对应的音频信号部分;(3)发出至少一个用于使闭路字幕信号指定部分所对应的音频信号部分减弱的命令;(4)以及,在音频信号中插入至少一个控制码,该控制码适用于使闭路字幕信号指定部分所对应的音频信号减弱。
第二种方法可以包括将闭路字幕信号指定部分转换成闭路字幕信号指定部分语音表示的操作。另外,该方法包括时间延长所述闭路字幕信号指定文本的语音表示来描述一个时间延长语音表示的操作。对于语音表示,包括时间延长版本,本方法可以包括确定至少一个语音表示的能量值来定义闭路字幕信号指定部分的可比较形式。
为了比较,第二种方法可包括确定至少一个音频信号的能量值以定义音频信号的可比较形式。同样地,该比较操作可进一步包括将闭路字幕信号指定部分的可比较形式与音频信号的可比较形式进行比较的操作。而且,该比较操作可进一步包括鉴别闭路字幕信号指定部分所对应的音频信号部分。
关于在此所讨论的任何一种方法,一种包括若干计算机可执行指令的处理器可以被配置以实现所述各种方法。
本发明的第三个方案涉及控制音频信号的重播的方法,其包括有:接收至少一个不良单词的指示;鉴别闭路字幕信号中至少一个不良单词;以及鉴别音频信号中至少一个不良单词,作为鉴别闭路字幕信号中至少一个不良单词的一个功能。
通过第三种方法,或其他方法,能控制音频信号的音频表示,作为鉴别操作的一个功能。
第三种方法进一步包括静音(muting)至少一个不良单词所对应的音频信号部分的音频表示。另外,该第三种方法涉及鉴别位于不良单词之前的闭路字幕信号部分。所述在先部分可从包括空格、字母、单词、短语、符号和闭路字幕控制信号的集合中选出。
第三种方法可以包括鉴别音频信号中至少一个不良单词,作为鉴别闭路字幕信号中的至少一个不良单词的操作,以及鉴别位于该不良单词之前的闭路字幕信号部分的操作的一功能。控制操作作为鉴别位于不良单词之前的闭路字幕信号部分的一功能。本方法还另外地包括使音频表示静音的操作,作为鉴别音频流中位于不良单词之前的闭路字幕信号部分的一功能。此外,本方法还包括结束静音,作为鉴别音频信号中至少一个不良单词的一功能。
本发明的第四个方案涉及控制音频表示的重播的方法,其包括:接收至少一个不良单词的指示;接收音频信号;在存储器中存储该音频信号;处理该存储的音频信号以确定在音频信号中是否存在至少一个不良单词;以及控制音频信号的音频表示,作为处理操作的一功能。该控制的操作可以包括:(1)减弱与至少一个不良单词所对应的音频信号部分;(2)完全删除与该至少一个不良单词所对应的音频信号部分;(3)在音频信号中插入至少一个控制码,该控制码用于使与至少一个不良单词所对应的音频信号减弱。另外,该处理操作可以包括分析至少一个声道的音频信号。
附图说明
图1是描述根据本发明的一种处理装置的框图;
图2是描述一种根据本发明通过监控对应闭路字幕信号中是否含有指定文本,然后鉴别出指定文本所对应的音频信号部分来控制音频信号重播的方法的流程图;
图3是描述一种根据本发明的用于监控闭路字幕信号来确定闭路字幕信号是否包含指定文本的方法的流程图;
图4是描述一种根据本发明的对闭路字幕流文本应用字符-发音算法来定义文本的语音表示的方法的流程图;
图5是描述一种根据本发明的分析音频信号时间片段以赋予能量值的方法的流程图;
图6是描述一种根据本发明的比较该闭路字幕信号文本的可比较形式与音频信号的可比较形式以控制音频信号的重播,如通过静音音频信号的某些部分的方法的流程图;
图7是描述一种根据本发明的比较闭路字幕信号文本的可比较形式与音频信号的可比较形式的方法的流程图;以及
图8是根据本发明的用于对准以及比较闭路字幕信号文本的可比较形式与音频信号可比较形式的时间对准和计分程序的示意图。
具体实施方式
本发明的方案涉及电视接收机、有线或卫星电视机顶盒、录像机、DVD播放器,或其他诸如经配置可接收或处理音频流的音频信号处理装置。在一个特定的实施中,音频信号处理装置经配置可静音音频流中的某些单词,例如被特定的听众/观众认为是不良的单词。根据本发明的装置或方法可以提供一种机制,由此用户可指出各种被认为是不良的单词。根据本发明的一个具体实施例分析闭路字幕流以检测不良的单词或短语,将闭路字幕单词转换成音频表示,然后比较该闭路字幕的音频表示和音频流以鉴别音频流中的不良单词。当鉴别出不良单词时,本发明的具体实施例静音不良单词的音频表示。
图1-8以及后续的讨论的目的在于简短全面地描述一种适于本发明具体实施例实施的计算或信号处理环境。尽管并不必需,但本发明具体实施例是在计算机可执行指令的一般场合进行描述的,例如由一个或多个诸如电视处理器的处理元件执行的程序模块。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例行程序、程序、对象、分量和数据结构等。计算机可执行指令、关联数据结构和程序模块表示用于执行此处公开的方法步骤的程序代码方法(means)的实例。如此可执行指令或关联数据结构的特定次序表示用于实现如此步骤中所描述操作的对应动作的实例。此外,由处理单元执行的程序代码方法(means)提供一种处理器技术方案的实例。
图1是描述一种根据本发明的处理器平台10的详细实施方式的框图。本处理器平台实现闭路字幕分析器12和音频流分析器14。闭路字幕分析器经配置可接收和处理来自传统音频/视频电视信号的闭路字幕流。此处所使用的“闭路字幕”指描述音频信号的文本表示的信号。该音频信号可为模拟或数字,可被编码,以及可伴随视频信号。闭路字幕可包括字母、空格、单词、短语以及符号。在数字环境下,闭路字幕可进一步包括数据包、网络命令和链接,以及其他数据。在一个特定的实例中,闭路字幕指符合EIA-608或EIA-708B字幕标准,或有关闭路字幕标准的信号。闭路字幕可在模拟或数字电视广播传输、有线电视、卫星中提供,也可由诸如DVD以及类似物的存储媒体源传输,配合所存储的音频信号。通常,对于模拟电视信号,闭路字幕流存在于电视信号的场消隐期(VBI)中的第21行数据区。处理器平台10包括传统的闭路字幕解码器。所述闭路字幕分析器经配置可接收已解码的闭路字幕信号。然而,闭路字幕分析器也可配置有解码器。对于数字电视信号,由于数字电视信号没有VBI,所以闭路字幕不能从VBI中得到。相反地,该闭路字幕信号与编码的数字电视信号多路复用。对于数字电视信号,该闭路字幕可由数字电视接收平台来选取。
闭路字幕分析器可被配置为接收一列由特定用户所确定的不良单词。该用户可以通过在屏(onscreen)选择过程挑选出不良单词,借助这种过程用户可以从一列所有可能的不良单词中挑选出多种不良单词。在基于电视的具体实施例中,通过根据本发明配置的电视机、机顶盒和接收器等的遥控器,用户对提供有不良单词列表的在屏菜单进行操作,并且挑选出特定的不良单词。作为选择地,用户也可通过键盘或其他一些诸如遥控器上的箭头键的文本输入设备,结合字母表的屏幕显示,直接输入不良单词。
除“不良单词”外,本发明的具体实施例经配置可检测和控制任何文本的重播。闭路字幕分析器12将闭路字幕流中的每个单词与用户所确定的不良单词列表进行比较。在对闭路字幕流单词和不良单词之间的比较鉴别后,将不良单词列表传送至音频流分析器14。
取决于本发明特定实施的不良单词列表可仅仅包括已确定的不良文本,不良文本和在先文本,或包括对不良文本和在先文本设有标记的全部闭路字幕流。在此使用的术语“文本”指闭路字幕流的任何一种分量,如字母、单词、空格、短语、符号和控制码。单词列表被发送至闭路字幕单词音频器16,该闭路字幕单词音频器进一步处理该文本以产生一种能与音频信号比较的文本形式或音频信号的比较形式,也指如下讨论的如音频等效的某些形式。对于其他处理元件,音频器可为独立的处理元件,电视处理器,闭路字幕分析器或音频流分析器的功能部分。单独显示该部分能更好地描述本发明的图1具体实施例的功能元件。
音频流分析器14经配置可接收音频流,如模拟或数字电视信号的音频部分。音频流分析器14包括模拟-数字转换元件,以便若音频流不是数字化格式时,对音频流数字化。音频流分析器经配置可处理各种算法,如下将详细讨论,用于比较数字化音频流和由闭路字幕分析器确定的不良单词列表,以及控制音频流中不良单词的重播。在一些实施中,控制重播包括静音不良单词。通过定义一种修正的音频流,其中不良单词所对应的音频信号已删除或其振幅或大小或其它方面已削弱;借助嵌入在音频展示中的静音命令来鉴别不良单词,使后续处理元件读取该音频流并且由此静音不良音频;以及发出与音频展示同步的静音命令,使得该音频展示中不包含不良单词的可听见形式,从而实现静音。以下讨论描述了各种与音频信号不良单词的重播有关的闭路字幕分析器和音频流分析器的运行方式。闭路字幕分析器12和音频流分析器可能在同一个处理器中编码,或在各自的处理器中编码,或由不同的硬件结构所确定。
图2是描述一种根据本发明的音频展示(如静音不良单词)播放控制的方法的流程图。如上所述,该闭路字幕分析器接收来自音频展示(操作200)中的闭路字幕流,该音频展示可为包括有在场消隐期第21行加上闭路字幕的标准模拟电视信号。在本发明的一个具体实施例中,在相关音频流之前或同一时刻接收闭路字幕流。接着,该闭路字幕分析器搜索闭路字幕流用于不良单词的列表(操作210)。不良单词由用户/观众确定并存储在与闭路字幕分析器相互通讯的存储器中。在确定闭路字幕文本中的不良单词后,闭路字幕分析器将不良单词和位于不良单词之前的单词发送至音频流分析器。例如,在电影“飘”(“Gone WithThe Wind”)中,克拉克·盖博(Clark Gable)对维维安·利(VivianLeigh)说“Frankly Scarlett,I don′t give a damn.”,如果用户指出“damn”是不良单词,那么单词“damn”将被存储在不良单词列表中。当接收该引用对白的闭路字幕信号时,闭路字幕分析器将鉴别出单词“damn”已被当前用户所反对,并且将该单词“damn”和在先单词“a”发送给音频流分析器。
为了正确比较不良单词(最初是文本形式)和音频流,不良文本和在先文本被转换成可与音频信号进行比较的形式(操作220)。在一个实施中,在音频器内,利用将文本转换成语音表示的字母-语音算法对在先文本和不良文本进行处理。其次,语音表示具有的特点是文本的平均或典型的持续时间,以及单词的标准总能量和在不同频带中特定能量的表示,从而可提供文本的音频等效。在处理闭路字幕文本的同时,或最好在处理闭路字幕文本之后,将音频流处理成可比较的形式(操作230)。如下讨论的一个实例中,该音频流经处理以确定音频流在离散时间间隔的总能量和在特定频带的特定能量。该闭路字幕文本处理和音频流处理提供具有可比较形式的闭路字幕文本和音频流。
一旦以相同格式表示不良文本、在先文本和音频流,就可鉴别音频流中的不良文本(操作240)。同样地,不良文本可与音频流中的特定音频片段相匹配。当鉴别出不良文本和在先文本之间与音频流相互匹配时,静音命令或其他静音处理发生作用以使音频流和关联的电视处理器静音不良音频(操作250)。因此,如图2所描述的方法,允许电视或其他音频或音频/视频设备播放通常已静音的不良单词、短语或音频的音频片段。此处使用的术语“静音”意在指音频片断的音量已降低,但没必要降低到零的状态。在本发明的一些具体实施例中,音频片断中已静音的单词或短语是听得到的,但是已静音单词的音量要小于相邻单词的音量。
图3是描述一种用于分析闭路字幕文本来确定是否包括有被用户确定为不良单词或短语的特定方法的流程图。在本发明的一个特定实施中,在不良单词选择过程中,用户可选择要从音频展示中去除的特定单词,和要从音频展示中去除的词根。将不良词根存储在词根过滤列表中。“词根”通常指某些不良单词,如“damn”,这些不良单词可能是许多不良单词和短语的词根,如“damnit”和“***damnit”。通过该词根过滤列表,可过滤和去除展示的音频部分中所包括所述词根的任何单词。完整的不良单词将存储于排除单词列表中。
用户可通过各种机制选择不良单词。在一个实施中,在例如电视监控器的屏幕上显示屏幕选择菜单。该菜单包括众多潜在的不良单词和短语,用户使用可与屏幕菜单相通讯的遥控器单独地或组合地挑选出这些不良单词和短语。菜单也可包括不良单词的分组和分级。
参见图3,闭路字幕分析器将闭路字幕文本流与词根进行比较(操作300)。当接收每个单词时,逐词依次地进行比较。该比较也可以按闭路字幕流逐段地执行。该闭路字幕文本的开始和结束都包括有指示显示闭路字幕片段时间的标记。本发明的具体实施例经配置可分析在标记之间出现的文本片段。如果闭路字幕流中的文本包括一个不良词根,那么包括该词根的文本与在先单词一同被标识为不良。接着,将闭路字幕流与排除单词过滤列表相比较(操作310)。任何不良文本和在先文本都被做上标记。下面将会更为详细地讨论,先于不良文本的文本用于鉴别静音的开始(也就是,先于不良单词的单词音频片段的结束是静音的开始)。除了做标记外,也可能加载在先单词,然后再加载不良单词至先进先出(FIFO)缓存器。然后按FIFO中的顺序将在先单词和不良单词依次处理成一种比较形式。当出现与在先文本相匹配的音频时,丢弃该音频。接着,当出现与不良文本相匹配的音频时,删除该音频。于是,由于闭路字幕和相关音频之间存在时序关系,因此,从闭路字幕中单词的鉴别到音频的静音的操作可按照FIFO中的顺序执行。
在一些实施中,进一步分析不良文本,不管其来自词根列表还是排除单词列表,依靠其使用场合来确定该不良文本实际上是可接受的单词还是不良的单词(操作330)。例如,如果使用在有关“dog”(“狗”)的讨论场合中,而不是其他场合,单词“bitch”是可允许的。为了确定单词是否允许,在一个实施中,比较闭路字幕短语中的所有其他单词以试图确定单词使用的上下文关系。那么,例如,如果单词“dog”在相同的短语中被提及,那么这个单词是可接受的而不能被鉴别为不良单词。其他方法已在2004年10月23日提交的名称为“基于与媒体内容相关联的信息的家长控制过滤设置(Parental Control FilterSettings Based on Information Associated with the MediaContent)”的美国临时专利申请No.60/481,548中提出且描述,特此通过引用合并于此。
如果存在不匹配,那么处理器确定是否检测到闭路字幕流的结束(步骤340)。如上所述,闭路字幕流通常包括指示闭路字幕片段开始和闭路字幕片段结束的指示器。在上阐述的例子中,一个闭路字幕片段包括短语“Frankly Scarlett,I don′t give a damn”。关于该音频片段的闭路字幕文本将包括在单词“Frankly”之前的指示器和紧跟单词“damn”的指示器。如果检测到短语的结束,倘若不良单词来自音频展示,那么将清空文本缓冲器和流静音分析器。在逐词操作的FIFO装置中,不需要执行操作340。如果没有检测到短语的结束,那么将对照如上引用的词根列表和排除单词列表分析随后的单词。
图4是描述本发明的一种实施的流程图,在该实施中,将不良的闭路字幕文本和在先文本逐字母地转换成作为音频等效的语音表示,并将其作为提供不良文本过程的一部分。在图4所示流程图的特定例子中,采用字母到声音算法将在先文本和不良文本的文本表示转换成语音表示。现有众多的字母到声音算法。在一个实例中,语音表示可分成五种基本类别,包括空格类;元音、双元音和半元音类;停顿类;鼻音类,以及摩擦音、耳语和塞擦音类。
在第一操作步骤中,分析文本以确定其是否包括空格(操作400)。空格可由持续的沉默或缺少有关语音的特性而得以确定。如果字母到声音算法确定该文本包括一个空格,那么赋予该文本一个“-”(操作405)。下一步,分析文本以确定其是否包括一个元音、双元音或半元音(操作410)。一般地,元音、双元音和半元音具有低频时呈现高电平的特性。一个实例包括元音a,e,i,o,u,和这些字母的组合,如″ou,″″ow,″″oi,″,以及半元音w,l,r,和y。而且,元音、双元音和半元音可分成高频元音,如在单词″beet″中出现的″ee″,以及如在单词″boot″中出现的″oo″的低频元音。如果字母到声音的算法确定一个单词的字母中包括一个元音,那么赋予该单词一个″V″(操作415)。下一步,分析在先文本或不良文本以确定其是否包括停顿(操作420)。停顿具有的特征为在一阵声音后嘴巴完全闭上一小段时间。在一个实例中,诸如p,t和k的无声停顿与诸如b,d和g的有声停顿存在明显区别。如果字母到声音算法确定单词的字母中包括有停顿,那么赋予该单词一个S(操作425)。下一步,分析在先文本或不良文本以确定是否包括鼻音(操作430)。鼻音的典型特征为来自鼻腔而不是嘴巴的较低频率的声音,如m,n和ng的发音。如果字母到声音算法确定文本包括一个鼻音,那么赋予该文本一个″N″(操作435)。最后,分析在先文本或不良文本以确定是否包括摩擦音、耳语或塞擦音。摩擦音、耳语和塞擦音的特点为能量集中在较高频率,以及通过狭窄的通道对呼出气体的挤压,如与字母v,ph,z,zh(如在″azure″中),f,s,sh,j,ch,和h相关联的发音。如果字母到声音算法确定文本包括一个摩擦音、耳语或塞擦音,那么赋予该文本一个″F″(操作445)。每个单词都被完全特性化;因此,在操作450中,算法确定该单词是否完整。如果不完整,将从第一操作400开始继续分析。
通过字母到声音算法对在先文本和不良文本的分析给短语或单词赋予一个上述标识,也就是,--,V,S,N,和F。就这样,短语″FranklyScarlett,I don′t give a damn″被转化成一串符号。在先单词″a″包括紧跟空格标识之后的标识″V ″,然后单词damn由符号S,V,和N所标识,其中,S代表字母″d″的停顿,V代表元音″a″,以及N代表鼻音字母″mn″。
图5是描述一种分析或处理音频信号方法的流程图,为音频信号与闭路字幕信号中已确定为不良文本的可比较形式进行比较做准备。首先,音频流分析器接收数字化的音频信号,并分割该音频信号成一连串20毫秒的部分(操作500)。每个20毫秒的模拟或数字化时间信号在下文被称为“语音片段”。音频流分析器计算每个语音片段的总能量(操作510)。在一个实例中,时间片段的总能量是振幅的平方和,该振幅被可用于平均信号强度归一化的长期能量平均所归一化。另外,进一步确定语音片段在不同频段的能量(操作520至540)。在一个实例中,音频分析器确定在150-1500Hz频段(操作520),在1500-3000Hz频段(操作530),在3000Hz以上频段(操作540)中语音片段的能量。在一个实例中,每个能带的测量被归一化为总能量的百分比。通过数字滤波后求和以确定频带,如采用快速傅立叶变换,完成这样的能量测定。作为选择地,也可采用cepstral系数方法,而不采用频带能量。
总能量和频带能量的测定规定了可收集充分信息来判别描述关于闭路字幕文本的语音类别(也就是--,V,S,N和F)的四个显著特征。人们可以知道,语音不是单个4位数的能量表示,而是在包含声音的一个时间间隔内的关于每个时间片断的一连串4位数的能量表示。
图6是描述一种比较在先文本和不良文本的可比较形式与音频流的可比较形式以确定何时发生静音的方法的流程图。为了正确地比较文本和音频信号,可进一步处理文本,以延长文本的语音符号表示至声音类型的平均持续时间,并进一步使其与合适的声音能量特征相关联。如上所述,音频信号被分解成20毫秒的时间片段,而每个20毫秒的时间片段的特征在于总能量和三个特殊频段的能量。同样地,音频信号的主要特点也在于时间和能量。因此,在先文本和不良文本的语音表示具有的进一步特点是为了比较音频信号的时间和能量的目的。
首先,时间延长在先文本和不良文本的语音表示,使之与声音类型的平均持续时间相关联(步骤600)。每种类型的声音平均持续时间可由试验来确定。比如,如果元音声音平均持续160毫秒,那么它将在8个20毫秒的时间片段上重复。在时间延长的操作中,每个符号都进行在该符号的平均持续时间上的延长。同样地,一个元音被延长至160毫秒。因而,例如,在″damn″中的语音表示为″V″的″a″将被延长至160毫秒。
除了每个语音表示的时间长度外,每个语音表示还与总能量值,以及与音频信号(也就是,150-1500Hz,1500-3000Hz,和3000Hz以上)相同频带中的能量值相关联(操作610)。在一个实例中,对于每个语音符号,在每个给定的时间间隔上给出一个典型的能量值的矩阵。因此,例如,对于平均时间为160毫秒的元音声音,针对在160毫秒的范围内的能量值给出一个能量矩阵。对于每个语音符号,可通过对在该语音符号中出现的各种符号和字母的不同发音的试验产生该矩阵或“模板”。同样地,该矩阵可包括关于每个语音符号的许多不同的语音表示。矩阵化技术公开并描述在Meisel发表的“群集分析和无监督学习(ClusterAnalysis and Unsupervised Learning)”中,面向计算机的模式识别方法,学院出版社,1972,特此通过引用合并于此。
当闭路字幕文本具有可比较形式时,它将与音频流的可比较形式进行比较(使用能量值)(操作620)。如果相匹配(操作630),那么将消音码或命令设置于跟随在先文本结尾的音频流中(步骤630)。本发明的三种不同配置均可实现已匹配的在先文本指示之后的静音。在一种配置中,在检测到在先文本结尾的同时,音频分析器发出静音命令。静音命令使得音频即刻静音。如果命令与音频流相比存在一定的延时,那么采用各种延时方法以充分延迟命令,以使之能与音频流的实际播放同步。在另一种配置中,调整音频流以致删除或减弱在先语音结束之后的音频数据。直到检测到不良文本的结尾时才停止删除或减弱。最后,在第三种可选择配置中,数字命令被嵌入至在先文本与不良文本之间的音频流中。在检测到音频流中的静音命令后,根据嵌入至数字化的音频流中的命令代码即刻静音该音频。
当在先文本比较后,将来自不良文本的音频比较形式与来自音频流的比较形式进行比较(操作650)。当检测到相匹配之后(操作660),在不良语言的结尾处发出第二个静音码或命令(操作670)。在发出静音音频命令的一个具体实施例中,在不良语言的结尾处,发出再一次以正常的音量播放音频的命令,也就是,使静音无效。在减弱或删除数字化音频流的一个具体实施例中,当检测到不良单词的结尾后,删除或减弱将中止,并且不再修改音频流。最后,在数字化音频流中采用综合命令的具体实施例中,在音频流中跟随不良单词的结尾处嵌入随后非静音的命令。
图7是描述一种将无论是在先文本还是不良文本的可比较形式与音频流的可比较形式进行比较的方法的流程图。第一步操作涉及文本(预测信号)的可比较形式与音频信号(检测信号)的可比较形式之间的时间对准(操作700)。在一个特定的实施中,可借助通常被称为动态时间扭曲算法的得到广泛认可的模板匹配语音识别系统来完成时间对准。
图8描述了一种在检测(observed)的信号与预测信号之间基于动态时间扭曲算法的时间对准实例。该预测信号根据此处图4、图6中的操作600和610所描述的方法产生。该检测的信号根据此处有关图5所描述的方法产生。如上讨论,该检测信号是涉及总能量和150-1500Hz频带、1500-3000Hz频带和3000Hz频带以上的能量的一组四维矢量。而且,每个四维矢量都包括20毫秒片段。在图8的实例中,存在14个20毫秒时间片段和相关联的四维矢量(x1-x14)。动态时间扭曲算法通过使用“计分”来测量在预测值与检测值之间的匹配从而得出预测信号的序列(-FFFVVVVVVVNN)对检测信号的最佳匹配,利用总分值可确定最佳匹配方法。该动态时间扭曲算法也考虑到并不希望将一个预测值“扩展”到太多的实际值,或反之亦然。结果可能是一个与所预测的如上所述的时间间隔实际值相匹配的最佳分配。如果是这样的话,算法预测正在匹配的短语,例如,在先短语,结束于检测信号片段X14处,而且当匹配到在先文本时,在该时间片段后应当开始静音。因此,在处理期间,当检测到在先文本的结尾时,借助于在此讨论的任何一种方法开始静音。如果音频不能和语音适当匹配,例如由于错误、草率的操录或过强的背景噪声,那么该分值将指示不良匹配,以及根据该分值将不采取操作。
作为时间对准的一部分,通过比较单个检测时间片段(具有四个特征值)和预测时间片段的匹配来产生分值,预测时间的特点在于它是五种语音类别中的一种,如vowel(V)。如在前章节中所记录的将文本转换成音频等效,一种选择是采用每个特征的标准值,例如,通过在设计阶段对类别的标准实例取平均。然后,分值是标准值对检测值的最佳匹配。该匹配通过简单的“距离”测量值进行测量,每个特征的差值的平方和:用矢量符号,‖xoberved-xtarget2,给出距离的平方。如果匹配准确,分值应为0。最佳匹配由最低总分值进行分类。对特征不同地加权存在差异,例如,对总能量的加权要大于对每个频段的能量加权,若这样能够改善性能的话。如先前建议,如果对语音的每个类别存在一个以上的标准实例(模板),分值应为这类别所有模板的最小量:
Mini[‖xoberved-xtarget-i2]
总之,通过选择计分操作和诸如可采用计分操作的动态时间扭曲算法,指定出测定短语结尾时间的算法。
本发明的一个可选具体实施例并不涉及闭路字幕信号的分析。相反地,接收音频信号,并将其储存在存储器中。然后将储存的音频信号采用语音识别算法进行处理。该语音识别算法可考虑到振幅、频率、波长和许多分析音频信号时的其他因素。每一个已通过语音识别算法鉴别的单词、短语与由用户指定的不良单词,和/或由用户指定的不良词根进行比较。通过对存储的信号片段进行操作,或在存储信号中嵌入静音码,直接削弱在存储器中已匹配的音频片断。
如果音频信号包括有语音单词和其他声音,如背景噪声、音乐、环境噪声等,那么可采用各种过滤技术将语音单词与其他声音相分离。另外,对于多通道音频信号,如,中间声道,前声道,后声道等,那么可单独分析各个音频通道。通常,在多声道音频信号中中间声道包括有大量或全部的语音单词。同样地,可仅对中间通道进行充分的分析。
本发明的具体实施例可包括专用或通用计算机,该计算机包括各种计算机硬件、电视系统、音频系统、和/或前述的组合。这些具体实施例如上所详细讨论。然而,无论如何,所描述的具体实施例都应当认为是本发明的示例而不作为本发明范围的限制。
落入本发明范围的具体实施例也包括计算机可读媒体,该计算机可读媒体可装载或持有计算机可执行指令,或其上可存储数据结构。这种计算机可读媒体为任何一种可被通用或专用计算机,如电视机、机顶盒等的处理元件,访问的现有媒体。举例来说,但并不限制其范围,这种计算机可读媒体包括RAM、ROM、EEPROM、CD-ROM、DVD、或其他光盘存储器、磁盘存储器或其他磁盘存储设备、或其他任何用于装载或存储形如计算机可执行指令或数据结构的所需程序代码方法的媒介,该媒介可被通用或专用计算机访问。当在连接着计算机的网络或其他通信链路或连接(硬布线、无线、或硬布线和无线的组合)上传递或提供信息时,计算机完全可以把该连接看作计算机可读媒介。因此,任何这样的连接都可被严格地称为计算机可读媒介。上述的组合也应当被包括在计算机可读媒介的范围内。例如,计算机可执行指令包括使得通用计算机、专用计算机、或专用处理装置处理一定操作或一组操作的指令或数据。
图1和相关讨论的目的在于提供简明扼要地描述一种实现本发明的合适的计算环境。虽然并不必需,但本发明是在计算机可执行指令的一般场合中进行描述的,该计算机可执行指令如由一个或多个诸如电视机处理器的处理元件所执行的程序模块。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例行程序、程序、对象、组件、数据结构等。计算机可执行指令、相关数据结构和程序模块表示用于执行此处所公开方法的各个步骤的程序代码方法的实例。这种可执行指令或相关数据结构的特定次序表示用于执行如此步骤中所描述操作的对应动作的实例。而且,由处理单元执行的程序代码方法提供一个处理器方法的实例。

Claims (52)

1、一种用于控制音频信号播放的方法,包括有:
接收闭路字幕信号;
分析该闭路字幕信号是否含指定文本;
鉴别该指定文本;
分析音频信号作为鉴别来自闭路字幕信号中指定文本的一功能;以及
控制该指定文本所对应的音频信号的重播。
2、根据权利要求1所述的方法,其中所述控制重播的操作进一步包括减弱与闭路字幕信号中的指定文本对应的音频信号部分。
3、根据权利要求1所述的方法,其中所述控制重播的操作进一步包括基本删除与所述闭路字幕信号中的指定文本对应的音频信号部分。
4、根据权利要求1所述的方法,其中所述控制重播的操作进一步包括发出至少一条适用于使与所述闭路字幕信号中的指定文本对应的音频信号部分减弱的命令。
5、根据权利要求1所述的方法,其中所述控制重播的操作进一步包括在音频信号中插入至少一个控制码,该控制码适用于使与闭路字幕信号中的指定文本对应的音频信号部分减弱。
6、根据权利要求1所述的方法,进一步包括将所述指定文本转换成该指定文本的语音表示的操作。
7、根据权利要求6所述的方法,进一步包括时间延长所述指定文本语音表示来定义该指定文本的时间延长语音表示。
8、根据权利要求7所述的方法,进一步包括确定至少一个指定文本的时间延长语音表示的能量值来定义该指定文本的可比较形式。
9、根据权利要求8所述的方法,进一步包括确定至少一个音频信号的能量值来定义音频信号的可比较形式。
10、根据权利要求9所述的方法,其中分析音频信号的操作进一步包括将指定文本的可比较形式和音频信号的可比较形式进行比较的操作。
11、根据权利要求10所述的方法,其中所述比较操作进一步包括鉴别与指定文本所对应的音频信号部分。
12、根据权利要求1所述的方法,其中所述指定文本从包括空格、字母、单词、短语、句子、控制码和符号的组中选出。
13、根据权利要求1所述的方法,其中指定文本由用户选择。
14、根据权利要求1所述的方法,其中所述指定文本从被认为是不良的文本中选择。
15、根据权利要求1所述的方法,其中鉴别指定文本的操作进一步包括鉴别在先文本的操作,该在先文本在时间上位于指定文本之前。
16、根据权利要求15所述的方法,其中所述分析音频信号作为鉴别来自闭路字幕信号中的指定文本的一个函数的操作进一步包括分析音频信号,作为来自鉴别闭路字幕信号中的在先文本一个函数。
17、根据权利要求16所述的方法,其中所述与控制指定文本所对应的音频信号的重播操作进一步包括控制与在先文本所对应的音频信号的重播。
18、根据权利要求6所述的方法,其中所述将指定文本转换成指定文本的语音表示的操作包括对指定文本运用字符-发音算法。
19、根据权利要求1所述的方法,其中分析音频信号作为鉴别来自闭路字幕信号中指定文本的一功能包括采用动态时间扭曲算法。
20、一种包括多个计算机可执行指令被配置为能执行权利要求1所述方法的处理器。
21、根据权利要求6所述的方法,进一步包括确定至少一个指定文本的语音表示的能量值来定义指定文本的可比较形式。
22、根据权利要求21所述的方法,进一步包括确定至少一个音频信号的能量值来定义音频信号的可比较形式。
23、根据权利要求22所述的方法,其中分析音频信号的操作进一步包括将指定文本的可比较形式与音频信号的可比较形式进行比较的操作。
24、根据权利要求23所述的方法,其中所述比较操作进一步包括鉴别与指定文本对应的音频信号部分。
25、一种用于控制音频信号播放的方法,其包括:
将闭路字幕文本信号的指定部分转换成该指定部分的音频等效;
将该闭路字幕文本信号的指定部分的音频等效与音频信号进行比较,以鉴别与该闭路字幕信号的指定部分所对应的音频信号部分;以及
控制与该闭路字幕信号的指定部分对应的音频信号部分的重播。
26、根据权利要求25所述的方法,其中该控制重播的操作进一步包括减弱与闭路字幕信号的指定部分对应的音频信号部分。
27、根据权利要求25所述的方法,其中该控制重播的操作进一步包括基本上删除与闭路字幕信号的指定部分对应的音频信号部分。
28、根据权利要求25所述的方法,其中该控制重播的操作进一步包括发出至少一个用于使与闭路字幕信号指定部分对应的音频信号部分减弱的命令。
29、根据权利要求25所述的方法,其中该控制重播的操作进一步包括在音频信号中插入至少一个控制码,该控制码适用于使与闭路字幕信号的指定部分对应的音频信号部分减弱。
30、根据权利要求25所述的方法,其中将闭路字幕文本信号的指定部分转换成指定部分的音频等效的操作进一步包括将闭路字幕信号的指定部分转换成闭路字幕信号的指定部分的语音表示的操作。
31、根据权利要求30所述的方法,进一步包括时间延长闭路字幕信号指定部分的语音表示以定义时间延长语音表示。
32、根据权利要求31所述的方法,进一步包括确定至少一个时间延长语音表示的能量值以定义闭路字幕信号指定部分的可比较形式。
33、根据权利要求32所述的方法,进一步包括确定至少一个音频信号的能量值以定义该音频信号的可比较形式。
34、根据权利要求33所述的方法,其中该比较的操作进一步包括将闭路字幕信号指定部分的可比较形式与音频信号的可比较形式进行比较的操作。
35、根据权利要求34所述的方法,其中该比较的操作进一步包括鉴别出与闭路字幕信号指定部分对应的音频信号部分。
36、一种包括多个计算机可执行指令经配置后实现权利要求25所述方法的处理器。
37、一种控制音频信号重播的方法,其包括:
接收至少一个不良单词的指示;
鉴别闭路字幕信号中的至少一个不良单词;以及
鉴别音频信号中至少一个不良单词,作为鉴别闭路字幕信号中至少一个不良单词的操作的一功能。
38、根据权利要求37所述的方法,进一步包括控制音频信号的音频表示,作为鉴别操作的一功能。
39、根据权利要求38所述的方法,进一步包括静音与至少一个不良单词所对应的音频信号部分的音频表示。
40、根据权利要求38所述的方法,进一步包括鉴别位于不良单词之前的闭路字幕信号部分。
41、根据权利要求40所述的方法,其中该在先部分可从包括空格、字母、单词、短语、符号、和闭路字幕控制信号的组中选出。
42、根据权利要求40所述的方法,进一步包括鉴别音频信号中至少一个不良单词作为鉴别闭路字幕信号中至少一个不良单词的操作,和鉴别先于不良单词的闭路字幕信号部分的操作的一功能。
43、根据权利要求42所述的方法,其中控制操作作为鉴别先于不良单词的闭路字幕信号部分的一功能。
44、根据权利要求43所述的方法,进一步包括使音频表示静音,作为鉴别音频流中先于不良单词的闭路字幕信号部分的一功能。
45、根据权利要求44所述的方法,进一步包括结束静音,作为鉴别音频流中至少一个不良单词的功能。
46、一种包括多个计算机可执行指令的经配置后实现权利要求37所述方法的处理器。
47、一种控制音频表示重播的方法,其包括:
接收至少一个不良单词的指示;
接收音频信号;
在存储器中存储该音频信号;
处理已储存的音频信号以确定音频信号中是否存在至少一个不良单词;以及
控制音频信号的音频表示,作为处理操作的一功能。
48、根据权利要求47所述的方法,其中控制操作进一步包括减弱与至少一个不良单词对应的音频信号部分。
49、根据权利要求47所述的方法,其中控制操作进一步包括基本上删除与至少一个不良单词对应的音频信号部分。
50、根据权利要求47所述的方法,其中控制操作进一步包括在音频信号中插入至少一个控制码,该控制码用于使与至少一个不良单词所对应的音频信号减弱。
51、根据权利要求46所述的方法,其中该处理操作进一步包括分析至少一个声道的音频信号。
52、一种包括多个计算机可执行指令的经配置后实现权利要求47所述方法的处理器。
CNA2004800310407A 2003-08-26 2004-08-26 用于控制音频信号的播放的方法和装置 Pending CN1871856A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49776903P 2003-08-26 2003-08-26
US60/497,769 2003-08-26

Publications (1)

Publication Number Publication Date
CN1871856A true CN1871856A (zh) 2006-11-29

Family

ID=34216150

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004800310407A Pending CN1871856A (zh) 2003-08-26 2004-08-26 用于控制音频信号的播放的方法和装置

Country Status (10)

Country Link
US (3) US20050086705A1 (zh)
EP (1) EP1665792A4 (zh)
JP (1) JP2007504495A (zh)
KR (1) KR20060123072A (zh)
CN (1) CN1871856A (zh)
AU (1) AU2004267864B2 (zh)
BR (1) BRPI0413407A (zh)
CA (1) CA2536260A1 (zh)
MX (1) MXPA06002241A (zh)
WO (1) WO2005020034A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103945272A (zh) * 2013-01-23 2014-07-23 腾讯科技(北京)有限公司 一种视频交互方法、装置和系统
CN104285452A (zh) * 2012-03-14 2015-01-14 诺基亚公司 空间音频信号滤波
CN111935541A (zh) * 2020-08-12 2020-11-13 北京字节跳动网络技术有限公司 视频修正方法、装置、可读介质及电子设备
CN114979787A (zh) * 2022-05-17 2022-08-30 北京量子之歌科技有限公司 一种直播回放管理方法、装置、设备及存储介质
US11921889B2 (en) 2020-10-13 2024-03-05 International Business Machines Corporation Selective display of sensitive data

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558472B2 (en) 2000-08-22 2009-07-07 Tivo Inc. Multimedia signal processing system
US6233389B1 (en) 1998-07-30 2001-05-15 Tivo, Inc. Multimedia time warping system
WO2001022729A1 (en) 1999-09-20 2001-03-29 Tivo, Inc. Closed caption tagging system
US6889383B1 (en) * 2000-10-23 2005-05-03 Clearplay, Inc. Delivery of navigation data for playback of audio and video content
US6898799B1 (en) * 2000-10-23 2005-05-24 Clearplay, Inc. Multimedia content navigation and playback
US7975021B2 (en) 2000-10-23 2011-07-05 Clearplay, Inc. Method and user interface for downloading audio and video content filters to a media player
US8117282B2 (en) 2004-10-20 2012-02-14 Clearplay, Inc. Media player configured to receive playback filters from alternative storage mediums
US7895633B2 (en) 2004-11-19 2011-02-22 Tivo Inc. Method and apparatus for secure transfer and playback of multimedia content
EP1900125A1 (en) * 2005-04-14 2008-03-19 Thomson Licensing Automatic replacement of objectionable audio content from audio signals
WO2006113742A2 (en) 2005-04-18 2006-10-26 Clearplay, Inc. Apparatus, system and method for associating one or more filter files with a particular multimedia presentation
US8086168B2 (en) * 2005-07-06 2011-12-27 Sandisk Il Ltd. Device and method for monitoring, rating and/or tuning to an audio content channel
US8577684B2 (en) * 2005-07-13 2013-11-05 Intellisist, Inc. Selective security masking within recorded speech utilizing speech recognition techniques
US20070168853A1 (en) * 2006-01-05 2007-07-19 Jarman Matthew T Apparatus, system and method for creation, delivery and utilization of recommended multimedia filter settings
US20070250852A1 (en) * 2006-03-23 2007-10-25 Sbc Knowledge Ventures, Lp System and method of editing video content
US7661121B2 (en) 2006-06-22 2010-02-09 Tivo, Inc. In-band data recognition and synchronization system
US7873982B2 (en) * 2006-06-22 2011-01-18 Tivo Inc. Method and apparatus for creating and viewing customized multimedia segments
US8041025B2 (en) * 2006-08-07 2011-10-18 International Business Machines Corporation Systems and arrangements for controlling modes of audio devices based on user selectable parameters
US8156518B2 (en) * 2007-01-30 2012-04-10 At&T Intellectual Property I, L.P. System and method for filtering audio content
US8103506B1 (en) * 2007-09-20 2012-01-24 United Services Automobile Association Free text matching system and method
ITMI20080794A1 (it) * 2008-04-30 2009-11-01 Colby S R L Metodo e sistema per convertire parlato in testo
US9077933B2 (en) 2008-05-14 2015-07-07 At&T Intellectual Property I, L.P. Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system
US9202460B2 (en) * 2008-05-14 2015-12-01 At&T Intellectual Property I, Lp Methods and apparatus to generate a speech recognition library
JP5816085B2 (ja) 2008-07-04 2015-11-17 ブックトラック ホールディングス リミテッド サウンドトラックを作成してプレイする方法及びシステム
US8086611B2 (en) 2008-11-18 2011-12-27 At&T Intellectual Property I, L.P. Parametric analysis of media metadata
CN101834929B (zh) * 2009-03-13 2014-03-26 深圳富泰宏精密工业有限公司 音频播放系统及方法
US8438596B2 (en) 2009-04-08 2013-05-07 Tivo Inc. Automatic contact information transmission system
US8730301B2 (en) * 2010-03-12 2014-05-20 Sony Corporation Service linkage to caption disparity data transport
CN103828385A (zh) * 2011-09-30 2014-05-28 英特尔公司 采用模式匹配的媒体内容分级管理
US9026544B2 (en) 2012-01-24 2015-05-05 Arrabon Management Services, LLC Method and system for identifying and accessing multimedia content
US8965908B1 (en) 2012-01-24 2015-02-24 Arrabon Management Services Llc Methods and systems for identifying and accessing multimedia content
US9098510B2 (en) 2012-01-24 2015-08-04 Arrabon Management Services, LLC Methods and systems for identifying and accessing multimedia content
US8996543B2 (en) 2012-01-24 2015-03-31 Arrabon Management Services, LLC Method and system for identifying and accessing multimedia content
US8804035B1 (en) * 2012-09-25 2014-08-12 The Directv Group, Inc. Method and system for communicating descriptive data in a television broadcast system
US9134952B2 (en) * 2013-04-03 2015-09-15 Lg Electronics Inc. Terminal and control method thereof
TWI508033B (zh) * 2013-04-26 2015-11-11 Wistron Corp 語言學習方法與裝置以及電腦可讀記錄媒體
KR20150021258A (ko) * 2013-08-20 2015-03-02 삼성전자주식회사 디스플레이장치 및 그 제어방법
US9116630B2 (en) 2013-08-30 2015-08-25 Nimble Storage, Inc. Method and system for migrating data between storage devices of a storage array
JP6596924B2 (ja) * 2014-05-29 2019-10-30 日本電気株式会社 音声データ処理装置、音声データ処理方法、及び、音声データ処理プログラム
US10276166B2 (en) * 2014-07-22 2019-04-30 Nuance Communications, Inc. Method and apparatus for detecting splicing attacks on a speaker verification system
CN104635927A (zh) * 2015-01-27 2015-05-20 深圳富泰宏精密工业有限公司 互动显示系统及方法
CN107690089A (zh) * 2016-08-05 2018-02-13 阿里巴巴集团控股有限公司 数据处理方法、直播方法及装置
US10349136B2 (en) 2017-03-22 2019-07-09 Opentv, Inc. User-initiated transitioning between media content versions
JP6787491B2 (ja) * 2017-06-28 2020-11-18 ヤマハ株式会社 音発生装置及び方法
EP3776410A4 (en) * 2018-04-06 2021-12-22 Korn Ferry SYSTEM AND PROCEDURE FOR INTERVIEW TRAINING WITH TIME-ADAPTED FEEDBACK
US10834462B2 (en) * 2018-09-17 2020-11-10 International Business Machines Corporation System and method for context detection of objectionable speech in video
US11089163B2 (en) * 2019-03-18 2021-08-10 Avaya Inc. Automated queuing system and queue management
US11087744B2 (en) 2019-12-17 2021-08-10 Spotify Ab Masking systems and methods
US11122341B1 (en) 2020-11-24 2021-09-14 International Business Machines Corporation Contextual event summary annotations for video streams
US11941320B2 (en) 2021-09-28 2024-03-26 Arlo Technologies, Inc. Electronic monitoring system having modified audio output

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3581029A (en) * 1968-09-10 1971-05-25 Douglas G Noiles Tv on time control
US4085422A (en) * 1973-10-31 1978-04-18 Hokuryo Denko Co., Ltd. Fee-charging apparatus for television sets
US4012583A (en) * 1975-03-03 1977-03-15 Motorola, Inc. Pay TV control system
US4081754A (en) * 1977-01-31 1978-03-28 Jackson Joseph N Programmable television receiver controllers
US4246495A (en) * 1978-10-05 1981-01-20 Jerome Pressman Television monitor and control
US4569026A (en) * 1979-02-05 1986-02-04 Best Robert M TV Movies that talk back
NL7908476A (nl) * 1979-11-21 1981-06-16 Philips Nv Inrichting voor interaktieve beeldweergave.
US4348696A (en) * 1980-09-08 1982-09-07 Beier Galen C Television viewing control device
US4386436A (en) * 1981-02-27 1983-05-31 Rca Corporation Television remote control system for selectively controlling external apparatus through the AC power line
JPS58502179A (ja) * 1981-12-19 1983-12-15 シヤ−ド フレデリツク ウイリアム テレビジョンセットの出力を編集する方法および装置
US4520404A (en) * 1982-08-23 1985-05-28 Kohorn H Von System, apparatus and method for recording and editing broadcast transmissions
IT1156544B (it) * 1982-11-08 1987-02-04 Olivetti & Co Spa Metodo ed apparecchiatura di riconoscimento fonetico di parole
US4570192A (en) * 1982-11-30 1986-02-11 Sony Corporation Video recording and/or reproducing apparatus with edit control circuit
US4538188A (en) * 1982-12-22 1985-08-27 Montage Computer Corporation Video composition method and apparatus
US4685003A (en) * 1983-12-02 1987-08-04 Lex Computing & Management Corporation Video composition method and apparatus for providing simultaneous inputting and sorting of video source material
US4506387A (en) * 1983-05-25 1985-03-19 Walter Howard F Programming-on-demand cable system and method
US4566033A (en) * 1983-08-11 1986-01-21 Reidenouer Linda L Television viewing time regulator
JPS60234232A (ja) * 1984-05-07 1985-11-20 Matsushita Electric Ind Co Ltd 光デイスクおよびそのトラツキング方法
US4644515A (en) * 1984-11-20 1987-02-17 Resolution Research, Inc. Interactive multi-user laser disc system
US4729044A (en) * 1985-02-05 1988-03-01 Lex Computing & Management Corporation Method and apparatus for playing serially stored segments in an arbitrary sequence
US4685131A (en) * 1985-03-11 1987-08-04 General Instrument Corp. Program blocking method for use in direct broadcast satellite system
JPH0746429B2 (ja) * 1985-06-21 1995-05-17 オリンパス光学工業株式会社 光学式記録再生装置
US4689619A (en) * 1985-12-26 1987-08-25 General Instrument Corporation Method and apparatus for polling subscriber terminals
US4754342A (en) * 1986-04-11 1988-06-28 Cmx Corporation Video editing system having virtual memory
US4766547A (en) * 1986-04-14 1988-08-23 Transfer Technologies, Inc. Computer controlled conveyor system
US4750213A (en) * 1986-06-09 1988-06-07 Novak Albert P Method and system for editing unwanted program material from broadcast signals
US4930160A (en) * 1987-09-02 1990-05-29 Vogel Peter S Automatic censorship of video programs
US4995078A (en) * 1988-06-09 1991-02-19 Monslow H Vincent Television broadcast system for selective transmission of viewer-chosen programs at viewer-requested times
GB2219886A (en) * 1988-06-15 1989-12-20 Philips Nv Recording and playback apparatus
US4891694A (en) * 1988-11-21 1990-01-02 Bell Communications Research, Inc. Fiber optic cable television distribution system
US4949187A (en) * 1988-12-16 1990-08-14 Cohen Jason M Video communications system having a remotely controlled central source of video and audio data
US5532732A (en) * 1988-12-23 1996-07-02 Gemstar Development Corporation Apparatus and methods for using compressed codes for monitoring television program viewing
CA2005070C (en) * 1988-12-23 1999-04-27 Henry C. Yuen Apparatus and method for using encoded video recorder/player timer preprogramming information
US5109482A (en) * 1989-01-11 1992-04-28 David Bohrman Interactive video control system for displaying user-selectable clips
US4947244A (en) * 1989-05-03 1990-08-07 On Command Video Corporation Video selection and distribution system
JPH0374139A (ja) * 1989-05-16 1991-03-28 Sony Corp 電源状態検出装置
US5122886A (en) * 1989-06-19 1992-06-16 Pioneer Electronic Corporation Selective information playback from recording medium based on user input content codes
JP2789723B2 (ja) * 1989-10-20 1998-08-20 ソニー株式会社 画像検索装置
US5218672A (en) * 1990-01-19 1993-06-08 Sony Corporation Of America Offline editing system with user interface for controlling edit list generation
US5130792A (en) * 1990-02-01 1992-07-14 Usa Video Inc. Store and forward video system
US4956825A (en) * 1990-02-05 1990-09-11 Wilts Charles H Device for monitoring the rate of use of an electrical appliance
US5101364A (en) * 1990-02-09 1992-03-31 Massachusetts Institute Of Technology Method and facility for dynamic video composition and viewing
JP2536947B2 (ja) * 1990-02-23 1996-09-25 パイオニア株式会社 ディスクの記録及び読取方法
JPH04105269A (ja) * 1990-08-24 1992-04-07 Sony Corp ディスク記録装置及びディスク記録再生装置
US5231310A (en) * 1990-09-05 1993-07-27 Oh Soo Young Electrical and electronic appliance lock
KR0178536B1 (ko) * 1991-03-11 1999-04-15 강진구 동종 프로그램 채널 선택방법
US5195135A (en) * 1991-08-12 1993-03-16 Palmer Douglas A Automatic multivariate censorship of audio-video programming by user-selectable obscuration
US5210611A (en) * 1991-08-12 1993-05-11 Keen Y. Yee Automatic tuning radio/TV using filtered seek
US5199077A (en) * 1991-09-19 1993-03-30 Xerox Corporation Wordspotting for voice editing and indexing
JPH0528190U (ja) * 1991-09-19 1993-04-09 コステム株式会社 外部遠隔操作対応型画像提供装置
US5724091A (en) * 1991-11-25 1998-03-03 Actv, Inc. Compressed digital data interactive program system
US6553178B2 (en) * 1992-02-07 2003-04-22 Max Abecassis Advertisement subsidized video-on-demand system
US5610653A (en) * 1992-02-07 1997-03-11 Abecassis; Max Method and system for automatically tracking a zoomed video image
US5953485A (en) * 1992-02-07 1999-09-14 Abecassis; Max Method and system for maintaining audio during video control
US5434678A (en) * 1993-01-11 1995-07-18 Abecassis; Max Seamless transmission of non-sequential video segments
US6208805B1 (en) * 1992-02-07 2001-03-27 Max Abecassis Inhibiting a control function from interfering with a playing of a video
US5331353A (en) * 1992-03-10 1994-07-19 Mindmaster Inc. Device for limiting the amount of time an electrical appliance such as a television may be used
US5223924A (en) * 1992-05-27 1993-06-29 North American Philips Corporation System and method for automatically correlating user preferences with a T.V. program information database
US5333275A (en) * 1992-06-23 1994-07-26 Wheatley Barbara J System and method for time aligning speech
US5333091B2 (en) * 1993-01-08 1996-12-17 Arthur D Little Enterprises Method and apparatus for controlling a videotape player to automatically scan past recorded commercial messages
US5987211A (en) * 1993-01-11 1999-11-16 Abecassis; Max Seamless transmission of non-sequential video segments
JPH06309801A (ja) * 1993-04-28 1994-11-04 Toshiba Corp ディスク記録再生方式
US5949471A (en) * 1993-07-29 1999-09-07 Gemstar Development Corporation Apparatus and method for improved parental control of television use
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
ATE236485T1 (de) * 1993-10-29 2003-04-15 Time Warner Entertainm Co Lp System und verfahren zur wiedergabesteuerung mehrerer, auf einer optischen platte gespeicherten kinofilme
US5387942A (en) * 1993-11-24 1995-02-07 Lemelson; Jerome H. System for controlling reception of video signals
GB2290684A (en) * 1994-06-22 1996-01-03 Ibm Speech synthesis using hidden Markov model to determine speech unit durations
US5805771A (en) * 1994-06-22 1998-09-08 Texas Instruments Incorporated Automatic language identification method and system
US5886746A (en) * 1994-12-13 1999-03-23 Gemstar Development Corporation Method for channel scanning
US5778135A (en) * 1994-12-30 1998-07-07 International Business Machines Corporation Real-time edit control for video program material
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
JP3065227B2 (ja) * 1995-03-10 2000-07-17 ソニー株式会社 視聴制限装置および視聴制限方法
US5543851A (en) * 1995-03-13 1996-08-06 Chang; Wen F. Method and apparatus for translating closed caption data
US5659366A (en) * 1995-05-10 1997-08-19 Matsushita Electric Corporation Of America Notification system for television receivers
US5872588A (en) * 1995-12-06 1999-02-16 International Business Machines Corporation Method and apparatus for monitoring audio-visual materials presented to a subscriber
JP3416007B2 (ja) * 1995-12-06 2003-06-16 インターナショナル・ビジネス・マシーンズ・コーポレーション オーディオビジュアル・マテリアルをスクリーニングする装置及び方法
US20030093790A1 (en) * 2000-03-28 2003-05-15 Logan James D. Audio and video program recording, editing and playback systems using metadata
US5870708A (en) * 1996-10-10 1999-02-09 Walter S. Stewart Method of and apparatus for scanning for and replacing words on video cassettes
US6177931B1 (en) * 1996-12-19 2001-01-23 Index Systems, Inc. Systems and methods for displaying and recording control interface with television programs, video, advertising information and program scheduling information
US5987525A (en) * 1997-04-15 1999-11-16 Cddb, Inc. Network delivery of interactive entertainment synchronized to playback of audio recordings
US6181364B1 (en) * 1997-05-16 2001-01-30 United Video Properties, Inc. System for filtering content from videos
KR100234265B1 (ko) * 1997-06-17 1999-12-15 윤종용 캡션 데이터 처리 회로 및 그 방법
US6972802B2 (en) * 1997-10-21 2005-12-06 Bray J Richard Language filter for home TV
US6166780A (en) * 1997-10-21 2000-12-26 Principle Solutions, Inc. Automated language filter
US6075550A (en) * 1997-12-23 2000-06-13 Lapierre; Diane Censoring assembly adapted for use with closed caption television
US6100916A (en) * 1998-05-20 2000-08-08 Lucent Technologies Inc. System and method for subscriber controlled signal blocking
US6553566B1 (en) * 1998-08-27 2003-04-22 X Out Corporation Viewer controlled multi-function system for processing television signals
US6504990B1 (en) * 1998-11-12 2003-01-07 Max Abecassis Randomly and continuously playing fragments of a video segment
US6408128B1 (en) * 1998-11-12 2002-06-18 Max Abecassis Replaying with supplementary information a segment of a video
JP3361066B2 (ja) * 1998-11-30 2003-01-07 松下電器産業株式会社 音声合成方法および装置
US6243676B1 (en) * 1998-12-23 2001-06-05 Openwave Systems Inc. Searching and retrieving multimedia information
US6192340B1 (en) * 1999-10-19 2001-02-20 Max Abecassis Integration of music from a personal library with real-time information
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
US20020072915A1 (en) * 1999-12-29 2002-06-13 Bower Ian L. Hyperspeech system and method
US6351596B1 (en) * 2000-01-07 2002-02-26 Time Warner Entertainment Co, Lp Content control of broadcast programs
US6771885B1 (en) * 2000-02-07 2004-08-03 Koninklijke Philips Electronics N.V. Methods and apparatus for recording programs prior to or beyond a preset recording time period
JP3515039B2 (ja) * 2000-03-03 2004-04-05 沖電気工業株式会社 テキスト音声変換装置におけるピッチパタン制御方法
US7263484B1 (en) * 2000-03-04 2007-08-28 Georgia Tech Research Corporation Phonetic searching
US6505153B1 (en) * 2000-05-22 2003-01-07 Compaq Information Technologies Group, L.P. Efficient method for producing off-line closed captions
GB0015233D0 (en) * 2000-06-21 2000-08-16 Canon Kk Indexing method and apparatus
US6898799B1 (en) * 2000-10-23 2005-05-24 Clearplay, Inc. Multimedia content navigation and playback
US20020086269A1 (en) * 2000-12-18 2002-07-04 Zeev Shpiro Spoken language teaching system based on language unit segmentation
US7058889B2 (en) * 2001-03-23 2006-06-06 Koninklijke Philips Electronics N.V. Synchronizing text/visual information with audio playback
US7143353B2 (en) * 2001-03-30 2006-11-28 Koninklijke Philips Electronics, N.V. Streaming video bookmarks
DE10138408A1 (de) * 2001-08-04 2003-02-20 Philips Corp Intellectual Pty Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
CN1324556C (zh) * 2001-08-31 2007-07-04 株式会社建伍 生成基音周期波形信号的装置和方法及处理语音信号的装置和方法
US7043431B2 (en) * 2001-08-31 2006-05-09 Nokia Corporation Multilingual speech recognition system using text derived recognition models
GB2391143A (en) * 2002-04-17 2004-01-28 Rhetorical Systems Ltd Method and apparatus for scultping synthesized speech
US7162475B2 (en) * 2002-04-17 2007-01-09 Ackerman David M Method for user verification and authentication and multimedia processing for interactive database management and method for viewing the multimedia
CA2502412A1 (en) * 2002-06-26 2004-01-08 Custom Speech Usa, Inc. A method for comparing a transcribed text file with a previously created file
AU2003280474A1 (en) * 2002-06-28 2004-01-19 Conceptual Speech, Llc Multi-phoneme streamer and knowledge representation speech recognition system and method
US7360234B2 (en) * 2002-07-02 2008-04-15 Caption Tv, Inc. System, method, and computer program product for selective filtering of objectionable content from a program
US20040024599A1 (en) * 2002-07-31 2004-02-05 Intel Corporation Audio search conducted through statistical pattern matching
US20040044532A1 (en) * 2002-09-03 2004-03-04 International Business Machines Corporation System and method for remote audio caption visualizations
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
US20040073428A1 (en) * 2002-10-10 2004-04-15 Igor Zlokarnik Apparatus, methods, and programming for speech synthesis via bit manipulations of compressed database
US6961704B1 (en) * 2003-01-31 2005-11-01 Speechworks International, Inc. Linguistic prosodic model-based text to speech
US20040210443A1 (en) * 2003-04-17 2004-10-21 Roland Kuhn Interactive mechanism for retrieving information from audio and multimedia files containing speech
US7305341B2 (en) * 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment
US6889393B1 (en) * 2003-07-09 2005-05-10 Jim Rinaldo Combined portable stool and toilet
US7904296B2 (en) * 2003-07-23 2011-03-08 Nexidia Inc. Spoken word spotting queries
US7437290B2 (en) * 2004-10-28 2008-10-14 Microsoft Corporation Automatic censorship of audio data for broadcast

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104285452A (zh) * 2012-03-14 2015-01-14 诺基亚公司 空间音频信号滤波
US11089405B2 (en) 2012-03-14 2021-08-10 Nokia Technologies Oy Spatial audio signaling filtering
CN103945272A (zh) * 2013-01-23 2014-07-23 腾讯科技(北京)有限公司 一种视频交互方法、装置和系统
CN103945272B (zh) * 2013-01-23 2018-03-06 腾讯科技(北京)有限公司 一种视频交互方法、装置和系统
CN111935541A (zh) * 2020-08-12 2020-11-13 北京字节跳动网络技术有限公司 视频修正方法、装置、可读介质及电子设备
CN111935541B (zh) * 2020-08-12 2021-10-01 北京字节跳动网络技术有限公司 视频修正方法、装置、可读介质及电子设备
US11921889B2 (en) 2020-10-13 2024-03-05 International Business Machines Corporation Selective display of sensitive data
CN114979787A (zh) * 2022-05-17 2022-08-30 北京量子之歌科技有限公司 一种直播回放管理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US20160029084A1 (en) 2016-01-28
BRPI0413407A (pt) 2006-10-10
WO2005020034A2 (en) 2005-03-03
AU2004267864B2 (en) 2009-07-02
CA2536260A1 (en) 2005-03-03
US9762963B2 (en) 2017-09-12
MXPA06002241A (es) 2006-08-31
AU2004267864A1 (en) 2005-03-03
US20050086705A1 (en) 2005-04-21
US9066046B2 (en) 2015-06-23
US20090204404A1 (en) 2009-08-13
EP1665792A2 (en) 2006-06-07
EP1665792A4 (en) 2007-11-28
WO2005020034A3 (en) 2006-02-09
KR20060123072A (ko) 2006-12-01
JP2007504495A (ja) 2007-03-01

Similar Documents

Publication Publication Date Title
CN1871856A (zh) 用于控制音频信号的播放的方法和装置
CN1185623C (zh) 消费类电子设备的音控方法
EP1531478A1 (en) Apparatus and method for classifying an audio signal
US7742680B2 (en) Apparatus and method for processing signals
US9767825B2 (en) Automatic rate control based on user identities
EP2017827B1 (en) Music section detecting method and its device, data recording method, and its device
US20060078292A1 (en) Apparatus and method for embedding content information in a video bit stream
CN1862970A (zh) 音频解码装置
TW200402654A (en) A system and method for providing user control over repeating objects embedded in a stream
JP4712812B2 (ja) 記録再生装置
US7680654B2 (en) Apparatus and method for segmentation of audio data into meta patterns
US20110235811A1 (en) Music track extraction device and music track recording device
US20070192089A1 (en) Apparatus and method for reproducing audio data
JP2008020767A (ja) 記録再生装置および方法、プログラム、並びに記録媒体
JP2008108166A (ja) 楽曲選択装置、楽曲選択方法
US20050201495A1 (en) Reproducing apparatus and method for controlling the same
JP4854030B2 (ja) 映像分類装置および受信装置
JP2001094965A (ja) マルチメディア端末機器
JP2006303868A (ja) 信号属性判定装置、信号属性判定方法、情報信号記録装置、情報信号記録方法、情報信号再生装置、情報信号再生方法、情報信号記録再生装置および情報信号記録再生方法並びに記録媒体
CN115053289A (zh) 用于对话可懂度评估的方法和装置
JP2008111866A (ja) 音声分類装置及びコンピュータプログラム
Lacey et al. Audio Extraction from Silicor Technologies' Digital Video Recorder File Format
JP2004004343A (ja) 音声のスピーチ/ポーズ区間検出装置
JP2011004197A (ja) 録画再生装置及び再生方法
JP2011211738A (ja) 映像再生装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20061129