CN1581282A - 隐藏字幕控制装置及其所用的方法 - Google Patents

隐藏字幕控制装置及其所用的方法 Download PDF

Info

Publication number
CN1581282A
CN1581282A CNA2004100574977A CN200410057497A CN1581282A CN 1581282 A CN1581282 A CN 1581282A CN A2004100574977 A CNA2004100574977 A CN A2004100574977A CN 200410057497 A CN200410057497 A CN 200410057497A CN 1581282 A CN1581282 A CN 1581282A
Authority
CN
China
Prior art keywords
closed caption
voice
playback
level
reference value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100574977A
Other languages
English (en)
Other versions
CN100431342C (zh
Inventor
桃崎浩平
山本幸一
正井康之
矢岛真人
阿部一彦
笹岛宗彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1581282A publication Critical patent/CN1581282A/zh
Application granted granted Critical
Publication of CN100431342C publication Critical patent/CN100431342C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • H04N5/44504Circuit details of the additional information generator, e.g. details of the character or graphics signal generator, overlay mixing circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Graphics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种隐藏字幕显示控制器,用来与控制音频信号语音对应的隐藏字幕的显示模式,所述控制器包括:用来分析语音的语音品质的分析单元;检查单元配置为根据分析单元的分析结果,按照给定的一条规则,检查语音收听电平;确定单元按照检查单元的检查结果,确定显示模式。

Description

隐藏字幕控制装置及其所用的方法
相关申请的交叉引用
本申请基于2003年8月15日提交的、2003-207621号在先日本专利申请,并要求以其作为优先权基础,其全部内容在此引用作为参考。
技术领域
本发明涉及一种隐藏字幕控制装置以及所用的一种方法,该装置用于嵌入或者连接到一台视频回放装置、一台音频回放装置、一台视频录放装置或者一台音频录放装置,并且控制着隐藏字幕和其他字符信息的显示。
背景技术
在电视广播或DVD(数字万能盘)等视频内容的回放中,伴随着视频提供了隐藏字幕信息,用于理解音频信息输出。在电视广播的情况下,隐藏字幕信息由视频信号中嵌入的图文电视信号形成,并且使用垂直消隐期中插入的标识信号(VBI信号)传送。在DVD等情况下,可以把多语种的隐藏字幕信息与视频和音频录制在一起。另外,在数字高清广播的情况下,可以把隐藏字幕信息作为子视频信息传送。
可以设想,不仅对于听力有损伤的人士或者说听力不健全的人士,而且对于听力正常的人士,在难以听清影像对应的语音时,使用隐藏字幕信息很有效。例如,在有些情况下语音中混杂的背景噪声或音乐(BGM)会干扰语音内容的听取。另外,自不必说在要听取的语音速度很快的情况下,还有在语音速度极慢的情况下,即使听力正常的人士也难以准确地听清这些语音。
在常规的视频回放装置或信息显示设备中,迄今为止还没有出现一种技术,按照听取语音内容的难度,对于语音内容等对应的隐藏字幕信息的显示模式进行控制。
另一方面,已经知道了几种分析音频信息的技术。例如,关于确定背景噪声,一种以消除噪声为目的的估计输入音频信噪比的方法是公知的(例如,参考日本专利申请公开号7-306695)。另外,关于确定音乐,一种基于音频数据自相关系数的的方法是公知的(例如,参考日本专利申请公开号5-113797)。此外,关于估计语音速度,一种基于语音信号动态特性的方法是公知的(例如,参考日本专利申请公开号5-289691)。
本发明的一个目的是提供一种隐藏字幕控制装置以及所用的方法,该装置能甚至在难以听清音频输出中语音的情况下,显示补充的隐藏字幕信息,从而使语音的内容恰当地、准确地传递给观众,或者能控制隐藏字幕的显示模式。
发明内容
本发明的一个方面提供了一种隐藏字幕显示控制器,以便控制音频信号语音对应的隐藏字幕的显示模式,所述控制器包括:产生表示隐藏字幕的隐藏字幕影像的隐藏字幕发生器;被配置为分析语音的语音品质的分析单元;被配置为根据分析单元的分析结果,按照给定的一条规则,检查语音的语音收听电平的检查单元;被配置为按照检查单元的检查结果,确定隐藏字幕影像的显示模式的确定单元。
本发明的另一个方面提供了一种隐藏字幕显示的控制方法,用于控制音频信号中包括的、与音频信号的语音对应的隐藏字幕的显示模式,所述方法包括:分析语音的语音品质;根据分析结果,按照给定的规则,检查语音收听电平;以及按照一个检查结果,确定显示模式。
附图简要说明
图1是一幅框图,显示了依据本发明第一个实施例的隐藏字幕控制装置的示意结构;
图2是一个表格,显示了第一个实施例的隐藏字幕显示控制器中提供的一套规则的实例;
图3A至图3D是示意图,显示了第一个实施例中控制隐藏字幕显示的若干实例;
图4是一幅示意图显示了第一个实施例中控制隐藏字幕显示的另一个实例;
图5是一幅框图,显示了依据本发明第二个实施例的视频回放装置的示意结构;
图6是一个表格,显示了第二个实施例的隐藏字幕显示控制器中提供的一套规则的实例;
图7是一幅流程图,显示了第二个实施例的隐藏字幕显示控制器中的处理流程;
图8是一幅流程图,显示了图7的步骤S101中详细的处理流程;
图9是一幅框图,显示了依据本发明第三个实施例的隐藏字幕控制装置的示意结构;
图10是一幅框图,显示了依据本发明第四个实施例的隐藏字幕控制装置的示意结构;
图11是一幅框图,显示了依据本发明第五个实施例的内容播放机的示意结构;
图12是一幅框图,显示了依据本发明第六个实施例的视频回放装置的示意结构;
图13是一幅框图,显示了依据本发明第七个实施例的音频回放装置的示意结构;
图14是一幅框图,显示了依据本发明第八个实施例的音频回放装置的示意结构;
图15是一幅框图,显示了依据本发明第九个实施例的音频回放装置的示意结构;
图16是一幅框图,显示了依据本发明第一个实施例的隐藏字幕控制装置的另一种示意结构;
图17是一幅框图,显示了依据本发明第一个实施例的隐藏字幕控制装置的再一种示意结构;
图18是一幅框图,显示了依据本发明第三个实施例的隐藏字幕控制装置的另一种示意结构;
图19是一幅框图,显示了依据本发明第三个实施例的隐藏字幕控制装置的再一种示意结构。
具体实施方式
现在将参考这些附图,介绍本发明的若干实施例。注意,在这些实施例的说明中,“声音信号”和“声音数据”意味着一般的信号和数据,表示任意的声音,包括背景声音(背景噪声、背景音乐等等),而不限于人的嗓音。另外,从人类的语言器官或语音合成器发出的嗓音,称为“语音”。声音信号和声音数据都表示语音和背景声音混合其中的声音。注意,“声音信号”和“声音数据”可以分别读作“音频信号”和“音频数据”。另外,“影像信号”和“影像数据”可以分别读作“视频信号”和“视频数据”。
另外,“隐藏字幕信息”从原理上是字符信息,比如话语或歌词的内容,播放机要把它随着语音信号或视频信号同步回放和显示。这些语音信号(音频数据)、视频信号(视频数据)和隐藏字幕信息各自表达的内容,具有密不可分的关系。从原理上说,播放机要把这三者相互同步回放。这一点与后面将要介绍的其他实施例相同。
(第一个实施例)
依据本发明第一个实施例的隐藏字幕控制装置在使用时,连接到一台视频回放装置,它接收并回放广播的视频、音频和隐藏字幕信息。作为视频回放装置的一个具体实例,在第一个实施例中,这是例如一台电视接收机。隐藏字幕信息通过嵌入视频信号传送,或者作为子视频传送,并且由电视接收机接收。
图1是一幅框图,显示了依据第一个实施例的隐藏字幕控制装置的示意结构。这台装置具有一个音频输入端子11、一个视频输入端子21和一个字符信息输入端子27。11、21和27这些输入端子通过电缆等途径,分别连接到电视接收机对应的一个音频输出端子、一个视频输出端子和一个字符信息输出端子。在电视接收机通过天线等途径接收广播电波时,电视接收机对收到的电波进行解调,并且从上述输出端子,分别输出语音信号、视频信号和隐藏字幕信息。
作为与其主要部分有关的所公开部件,本实施例的隐藏字幕控制装置具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23以及一个隐藏字幕视频发生器24;分析器12分析音频输入端子11输入的语音信号;传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示。隐藏字幕视频发生器24具有字符字体数据,并且根据字符信息输入端子27输入的隐藏字幕信息,再使用字符字体数据,产生隐藏字幕字符的图片信号。然后,发生器24通过使隐藏字幕字符的影像信号与视频输入端子21输入的影像信号同步,产生隐藏字幕视频信号。采用例如电脑软件,也能够实现依据本发明的隐藏字幕控制装置。在这种情况下,隐藏字幕控制所用的一个程序执行的过程,使一台电脑用作一台隐藏字幕控制装置。
作为输出隐藏字幕之视频和音频有关的所公开部件,本实施例的隐藏字幕控制装置具有一个音频输出端子13和一个视频输出端子25,音频输出端子13用于输出语音品质分析器12输入的语音信号,视频输出端子25用于输出隐藏字幕视频发生器24产生的、要与语音信号同步的隐藏字幕视频信号。注意,虽然音频输出端子13并非必不可少,因为从例如电视接收机能够回放音频,但是用于监控的一付耳机或者另一台音频回放机可以连接到音频输出端子13。另外,配备了音频输出端子13之后,就可以在输入到语音品质分析器12之前的一个位置,从音频输入端子11上分离出来。视频输出端子25的输出可以连接到例如另一台显示设备以便进行监控。另外,视频输出端子25的输出也可以再输入,以便返回到电视接收机的视频输入端子。自不必说,从音频输出端子13和视频输出端子25的输出,分别都可以提供给另一台监控用显示设备或电视接收机的音频输入端子和视频输入端子。
另外,在字符信息输入端子27之处,字符信息可以嵌入视频输入端子21输入的图片信号中,重叠的字符信息可以在隐藏字幕视频发生器24处提取出来,并可以产生一个隐藏字幕视频信号。
此外,还可以配备一个隐藏字幕信号处理器39,以取代隐藏字幕视频发生器24。在这种情况下,隐藏字幕信号处理器39配置为能够把字符信息嵌入视频输出端子25输出的视频信号。在隐藏字幕显示控制器23的控制下,可以切换的仅有是否把字符信息嵌入视频信号中。另外,控制信息经过处理之后,隐藏字幕的字符信息也可以按照隐藏字幕显示控制器23的控制,再次嵌入视频信号。在这种情况下,连接到视频输出端子25的一台显示设备,提取视频信号中嵌入的字符信息,以便产生隐藏字幕视频信号(图16)。
另外,也可以防止把字符信息引入视频输出端子25。不然,也可以另外配备一台字符信息显示设备68或一个字符信息输出端子29(图17)。
它配置为符合一台装置的输入/输出端子,该装置要连接到本实施例的隐藏字幕控制装置的前级和后级。
语音品质分析器12在分析中,对于输入语音信号中包括的背景声音水平和语音的速度进行估计。背景声音包括背景噪声和背景音乐,通过使用例如日本专利申请公开号7-306695或5-113797中公开的方法,能够估计其水平。另外,通过使用例如日本专利申请公开号5-289691中公开的方法,能够估计语音的速度。以这种方式估计的背景声音的水平和语音的速度,语音品质分析器12输出为两个分析结果数值,以便用于对输入语音信号中包括的语音进行语音收听电平检查。
噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平。优选情况下,话筒放置在电视接收机中扬声器(或者连接到音频输出端子13的另一台音频回放机中扬声器)的音频输出难以影响之处。这时,最好是引用从音频输入端子11输入的语音信号,根据语音信号来估计除了回放声音以外的环境声音,这能够改善噪声探测精度。
隐藏字幕显示控制器23具有一套规则,用于为了检查一种语音的听取难度而进行的语音收听电平检查,对语音品质分析器12获得的分析结果数值和噪声传感器14探测到的环境噪声电平,隐藏字幕显示控制器23应用这套规则,对输入语音信号中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着隐藏字幕视频发生器24。
如图2所示,在这套规则中,表示语音听取难度的语音收听电平,由三种类型的检查参考值表达,包括背景声音、环境噪声和语音速度,这套规则包括第一条规则至第四条规则。在检查中,考察语音品质分析器12获得的分析结果数值和噪声传感器14探测到的环境噪声电平,与检查参考值相比,是否满足第一条规则至第四条规则中的至少一条。如果它们不满足第一条规则至第四条规则中的任何一条,就否认语音听取困难。换言之,该语音不难听取,所以不进行隐藏字幕控制。注意,隐藏字幕通常处于不显示状态。
这套规则中包括的第一条规则至第四条规则解释如下。
第一条规则:如果语音信号(包括背景噪声和背景音乐)中包括的背景声音水平不低于一个固定的参考值,就使隐藏字幕处于显示状态。
第二条规则:按照环境噪声电平确定一个可变的参考值。如果语音信号中包括的背景声音水平不低于可变的参考值,就使隐藏字幕处于显示状态。第二条规则与第一条规则的不同之处在于,参考值不是固定的,而是可变的。
第三条规则:如果环境噪声电平不低于一个固定的参考值,就使隐藏字幕处于显示状态。
第四条规则:如果语音信号中包括的语音速度处于一个固定的参考范围以外,就使隐藏字幕处于显示状态。
按照第一条规则和第二条规则,由于语音信号中包括背景声音而难以听清语音时,按照第三条规则,由于环境噪声(例如在观看期间开始鸣响的电话铃声等)而难以听清语音时,以及按照第四条规则,由于语音的速度(例如音频信号中发言者的讲话速度(语音速度)太快或太慢等情况)而难以听清语音时,在各自情况下,使隐藏字幕视频与音频同步输出、显示。所以,因为听取语音受到隐藏字幕显示的支持,就不存在观众(用户)受干扰而不理解所说内容的情况。
注意,本实施例可以修改如下。例如,即使不使用第二条规则和第三条规则,也就是仅仅使用有关背景声音和语音速度的第一条规则和第四条规则,因为仍然能够获得隐藏字幕显示控制的效果,所以在考虑到产品成本等因素时,它也可以配置为不配备噪声传感器14。
另外,即使仅仅使用背景声音水平(第一条规则)或语音速度(第四条规则),也能够获得隐藏字幕显示控制的效果。所以,可以简化语音品质分析器12,仅仅分析或者背景声音水平,或者语音速度。
优选情况下,表示语音听取难度的语音收听电平,由多个参数(因素)的若干函数表达,对这些函数求值,并且根据求值的结果,进行隐藏字幕控制。例如,假若不仅考虑了背景声音或语音速度,而且考虑了若干参数,比如嗓音低的程度、语调弱化的程度、国际长途或移动电话中的嗓音、回声高的程度、同时说话的发言者的数目、外语、方言、口音等因素,就能够改善检查的质量。
优选情况下,在这套规则的各条规则中,参考值的参数和函数能够设定或调整为正在观看的用户所期望的数值。例如,一个中年或老年早期的用户可能把语音速度的参考范围设定得比一个年轻用户更慢。另外可以设想,按照听力把背景声音的一个参考值设定得相当低。对于需要隐藏字幕补充信息的听力障碍用户,本实施例的效果优于对于正常听力的用户。可以设想,通过使用头戴耳机或耳机进行观看的用户,可能把环境噪声的参考值设定得更高,或者把由于环境噪声而对有关可变参考值的效应设定得更小。
由隐藏字幕显示控制器23确定的隐藏字幕信息显示模式,不限于仅仅是图3A所示的一种不显示模式和一种显示模式。例如,隐藏字幕一般设定为处于显示状态,这时隐藏字幕字符的尺寸设定为比标准尺寸小。如果语音收听电平检查结果满足一条规则,隐藏字幕的字符就可以改变为一种标准尺寸(图3B)。如果检查结果不满足任何规则,隐藏字幕字符也可以设定为一种标准尺寸,在满足一条规则时,把隐藏字幕字符的尺寸放大(图3C),在满足一条规则时,可以把隐藏字幕字符的显示行数增多(图4D)。
此外,对于构成这套规则的每条规则,通过提供若干层级,对表示语音听取难度的各个级别进行求值,例如,如图4所示,隐藏字幕字符的显示模式可以按照语音收听电平(语音品质)的一个层级进行改变。在这个实例中,如果求值结果为最难以听取,隐藏字幕字符就以最大尺寸显示。
(第二个实施例)
依据本发明第二个实施例的隐藏字幕控制装置,安装在一台视频回放装置的内部,它回放存储介质中存储的视频、音频和隐藏字幕信息。作为视频回放装置的一个具体实例,第二个实施例使用了例如一台DVD播放机。视频回放装置比如DVD播放机可以由视频录放装置比如DVD录像机或硬盘录像机取代。
图5是一幅框图,显示了一台DVD播放机的示意结构,其中内建了依据第二个实施例的隐藏字幕控制装置。这台DVD播放机包括一个驱动机构(未显示),以便安装一种存储介质31进行数据读取,存储介质31上记录着视频、音频和隐藏字幕信息。
另外,提供了一个音频回放器件(音频播放机)33、一个视频回放器件(视频播放机)34、一个隐藏字幕回放器件35和一个回放控制器32;音频回放器件33用于从存储介质31读取和回放音频数据;视频回放器件34用于从存储介质31读取和回放图片数据;隐藏字幕回放器件35用于从存储介质31读取和回放隐藏字幕信息;回放控制器32从一个操作面板、一台遥控设备等输入一个回放控制信号(表示用户对回放音频数据和视频数据提供的一条指令),并且控制着音频数据和视频数据的回放。回放控制信号表示了回放状态,比如至少一种回放音量和一种回放速度。
作为隐藏字幕显示控制有关的所公开部件,本实施例的DVD播放机具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23以及一个隐藏字幕视频发生器24;语音品质分析器12用于分析音频回放器件33回放的音频数据;噪声传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示;隐藏字幕视频发生器24具有字符字体数据,用于接收隐藏字幕回放器件35回放的隐藏字幕信息,并且使用字符字体数据产生隐藏字幕字符的影像数据。隐藏字幕视频发生器24通过使隐藏字幕字符的影像数据与视频回放器件34回放的视频数据同步,从而产生隐藏字幕视频信号。
作为与输出隐藏字幕视频和音频有关的所公开部件,依据本实施例的DVD播放机还具有一个音频输出器件63和一个视频输出器件65,音频输出器件63输出语音品质分析器12输入的音频数据,视频输出器件65输出隐藏字幕视频发生器24产生的隐藏字幕视频信号。一个声音器件,比如一个扬声器,连接到音频输出器件63,一个显示视频的显示器件连接到视频输出器件65。注意,它可能是一种整合结构,这些声音器件和显示器件位于DVD播放机的外壳中。
语音品质分析器12进行的分析类似于第一个实施例。也就是,语音品质分析器12对输入音频数据中包括的背景声音水平和语音速度进行估计,并且输出这两个分析结果数值,以便对输入音频数据中包括的语音进行语音收听电平检查时使用。
另外,噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平,如同第一个实施例。考虑到产品成本等因素时,也可以去除噪声传感器14。
隐藏字幕显示控制器23具有一套规则,用于语音收听电平检查,对于语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到回放控制器32的回放控制信号表示的回放状态,隐藏字幕控制器23应用这套规则,对输入音频数据中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着隐藏字幕视频发生器24。
如图6所示,在本实施例中,这套规则由五种类型的检查参考值来表示语音听取难度,包括背景声音、环境噪声、回放音量、语音速度和回放速度。这套规则包括第一条规则至第十五条规则。在检查中,考察语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到回放控制器32的回放控制信号表示的回放状态,与检查参考值相比,是否满足第一条规则至第十五条规则中的至少一条。如果它们不满足第一条规则至第十五条规则中的任何一条,就否认语音听取困难。换言之,该语音不难听取,所以不进行隐藏字幕控制。隐藏字幕一般处于不显示状态。
这套规则中包括的第一条规则至第十五条规则解释如下。
第一条规则:如果音频数据(包括背景噪声和背景音乐)中包括的背景声音水平不低于一个固定的参考值,就使隐藏字幕处于显示状态。
第二条规则:按照环境噪声电平确定一个可变的参考值。如果音频数据中包括的背景声音水平不低于可变的参考值,就使隐藏字幕处于显示状态。第二条规则与第一条规则的不同之处在于,参考值不是固定的,而是可变的。
第三条规则:如果环境噪声电平不低于一个固定的参考值,就使隐藏字幕处于显示状态。
第四条规则:如果音频数据中包括的语音速度处于一个固定的参考范围以外,就使隐藏字幕处于显示状态。
第五条规则:按照回放音频数据的状态中的回放音量,确定一个可变的参考值。如果音频数据中包括的背景声音水平不低于可变的参考值,就使隐藏字幕处于显示状态。
第六条规则:按照回放音频数据的状态中的回放音量和环境噪声电平,确定一个可变的参考值。如果音频数据中包括的背景声音水平不低于可变的参考值,就使隐藏字幕处于显示状态。
第七条规则:按照音频数据中包括的背景声音水平,确定一个可变的参考值。如果回放音频数据的状态中的回放音量低于可变的参考值,就使隐藏字幕处于显示状态。
第八条规则:按照音频数据中包括的背景声音水平和环境噪声电平,确定一个可变的参考值。如果回放音频数据的状态中的回放音量低于可变的参考值,就使隐藏字幕处于显示状态。
第九条规则:按照回放音频数据的状态中的回放速度,确定一个可变的参考范围。如果音频数据中包括的语音速度处于可变的参考范围以外,就使隐藏字幕处于显示状态。
第十条规则:按照音频数据中包括的语音速度,确定一个可变的参考范围。如果回放音频数据的状态中的回放速度处于可变的参考范围以外,就使隐藏字幕处于显示状态。
第十一条规则:如果回放音频数据的状态中的回放速度处于一个固定的参考范围以外,就使隐藏字幕处于显示状态。
第十二条规则:如果回放状态为倒退,就使隐藏字幕处于显示状态。
第十三条规则:如果回放状态为暂停,就使隐藏字幕处于显示状态。
第十四条规则:如果回放音量为静音,或者不高于一个固定的参考值,就使隐藏字幕处于显示状态。
第十五条规则:按照环境噪声电平确定一个可变的参考值。如果回放音量不高于可变的参考值,就使隐藏字幕处于显示状态。
按照第一条、第二条、第五条和第六条规则,由于音频数据中包括的背景声音太强而难以听清语音时,就显示隐藏字幕。按照第三条规则,由于环境噪声太强而难以听清语音时,就显示隐藏字幕。按照第七条、第八条、第十四条和第十五条规则,由于回放音量太低而难以听清语音时,就显示隐藏字幕。按照第四条和笫九条规则,由于语音速度太快或太慢而难以听清语音时,就显示隐藏字幕。按照第十条至第十三条规则,由于回放速度太快或太慢而难以听清语音时,就显示隐藏字幕。如果不使用第二条、第三条、第六条、第八条和第十五条规则(其检查参考值为环境噪声),也就是即使仅仅使用第一条、第四条、第五条、第七条和第九条至第十四条规则(其检查参考值为背景声音、回放速度、语音速度和回放速度)时,仍然能够获得隐藏字幕显示控制的效果。所以,考虑到产品成本等因素时,也可以去除噪声传感器14。
下一步,将参考图7中的流程图,介绍隐藏字幕显示控制器23中的处理流程。
首先,应用第一条、第二条、第五条和第六条规则,对于背景声音水平(作为语音品质分析器12获得的分析结果数值)进行检查(步骤S101)。下一步,应用第三条规则,对于噪声传感器14探测到的环境噪声电平进行检查(步骤S102)。下一步,应用第四条和第九条规则,对于语音速度(作为语音品质分析器12获得的分析结果数值)进行检查(步骤S103)。下一步,应用第七条、第八条、第十四条和第十五条规则,对于回放控制器32发出的回放控制信号表示的回放音量进行检查(步骤S104)。下一步,应用笫十条至第十三条规则,对于回放控制器32发出的回放控制信号表示的回放速度进行检查(步骤S105)。最后,根据上述各个步骤的检查结果,确定隐藏字幕的显示模式,并且控制隐藏字幕视频发生器24(步骤S106)。
此处将参考图8中的流程图,使用上述的步骤S101作为一个实例,介绍详细的处理流程。
首先,把音频数据中包括的背景声音的一个水平Ab(它已经事先设定)与一个固定的参考值Ab0进行对比(步骤S111)。当Ab高于Ab0时,就按照第一条规则,设定隐藏字幕操作模式1(步骤S191)。下一步,按照环境噪声电平An,计算一个可变的参考值Fbn(An)(步骤S120)。把这个参考值Fbn(An)与背景声音水平Ab进行对比(步骤S121)。当Ab高于Fbn(An)时,就按照第二条规则,设定隐藏字幕操作模式1(步骤S191)。下一步,按照回放音量Av,计算一个可变的参考值Fbv(Av)(步骤S150)。把这个参考值Fbv(Av)与背景声音水平Ab进行对比(步骤S151)。当Ab高于Fbv(Av)时,就按照第五条规则,设定隐藏字幕操作模式1(步骤S191)。下一步,按照环境噪声电平An和回放音量Av,计算一个可变的参考值Fbnv(An,Av)(步骤S160)。把这个参考值Fbnv(An,Av)与背景声音水平Ab进行对比(步骤S161)。当Ab高于Fbnv(An,Av)时,就按照第六条规则,设定隐藏字幕操作模式1(步骤S191)。最后,如果任何条件都不满足,就设定隐藏字幕操作模式0(步骤S190)。
(第三个实施例)
依据本发明第三个实施例的隐藏字幕控制装置,连接到一台视频回放装置,它回放存储介质中存储的视频、音频和隐藏字幕信息。作为视频回放装置的一个具体实例,第三个实施例使用了例如一台DVD播放机。视频回放装置比如DVD播放机可以由视频录放装置比如DVD录像机或硬盘录像机取代。
图9是一幅框图,显示了内建的、依据本发明第三个实施例的隐藏字幕控制装置的示意结构。这台装置具有一个音频输入端子11、一个视频输入端子21、一个控制信息输入端子26和一个字符信息输入端子27。这些输入端子通过电缆等,分别连接到DVD播放机对应的一个音频输出端子、一个视频输出端子、一个控制信息输出端子和一个字符信息输出端子。用户通过操作面板、遥控设备等,对DVD播放机进行回放操作时,从安装在播放机上的存储介质中,读取和回放音频数据、视频数据和隐藏字幕信息的数据。把回放的数据输入到隐藏字幕控制装置的音频输入端子11、视频输入端子21和字符信息输入端子27。用户通过操作面板、遥控设备等的操作,在回放时提供的控制信息,输入到控制信息输入端子26。这项控制信息表示了多种控制信息,比如回放时的回放音量和回放速度,而且不限于特定的信息。另外,该控制信息可能是表示用户回放操作的信息,也可能是按照一种回放操作,表示DVD播放机操作状态的信息。
作为与其主要部分有关的所公开部件,本实施例的隐藏字幕控制装置具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23以及一个隐藏字幕视频发生器24,分析器12分析音频输入端子11输入的音频数据,传感器14具有一个话筒,用于探测环境噪声电平,隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示,隐藏字幕视频发生器24具有字符字体数据,并且从字符信息输入端子27接收隐藏字幕信息,再使用字符字体数据,产生隐藏字幕字符的影像数据。隐藏字幕视频发生器24通过使隐藏字幕字符的影像数据与视频输入端子21输入的视频数据同步,产生隐藏字幕视频信号。
作为输出隐藏字幕之视频和音频有关的所公开部件,本实施例的隐藏字幕控制装置还具有一个音频输出端子13和一个视频输出端子25,音频输出端子13用于输出语音品质分析器12输入的音频数据,视频输出端子25用于输出隐藏字幕视频发生器24产生的隐藏字幕图片数据。音频输出端子13连接到一部扬声器,视频输出端子25连接到一台显示设备。输入到视频输入端子21的用于传送的视频数据,图片信号中嵌入的字符信息可以取代从字符信息输入端子27输入的隐藏字幕信息。隐藏字幕视频发生器24提取重叠的字符信息,并且产生隐藏字幕视频信号。
此外,隐藏字幕信号处理器39可以取代隐藏字幕视频发生器24,并且把字符信息嵌入从视频输出端子25输出的视频信号。在这种情况下,按照隐藏字幕显示控制器23的控制,切换的仅有是否把字符信息嵌入视频信号中。另外,控制信息经过处理之后获得的隐藏字幕的字符信息,也按照隐藏字幕显示控制器23的控制,嵌入视频信号。在这种情况下,连接到视频输出端子25的一台显示设备,提取视频信号中嵌入的字符信息,以便产生隐藏字幕视频信号(图18)。
另外,字符信息也可以不输入视频输出端子25,而是另外配备字符信息输出端子29(图19)。
可以把以上配置选为符合一台装置的输入/输出端子规格,该装置要连接到本实施例的隐藏字幕控制装置的前级和后级。
本实施例的隐藏字幕控制装置可以包含一台个人电脑(PC)。
语音品质分析器12进行类似于第一个实施例中的分析。也就是说,语音品质分析器12对于输入音频数据中包括的背景声音水平和语音的速度进行估计,并且把它们输出为两个分析结果数值,以便确定输入音频数据中包括之语音的语音收听电平。另外,噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平,如同第一个实施例。考虑到产品成本等因素时,也可以去除噪声传感器14。
隐藏字幕显示控制器23具有一套与第二个实施例相同的规则(参见图6),并且对语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到控制信息输入端子26的回放控制信号表示的回放状态,应用这套规则,对输入音频数据中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着隐藏字幕视频发生器24。在检查中,考察语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到控制信息输入端子26的回放控制信号表示的回放状态,与检查参考值相比,是否满足第一条规则至第十五条规则中的至少一条。
(第四个实施例)
依据本发明第四个实施例的隐藏字幕控制装置,连接到一台音频回放装置,它回放存储介质中存储的音频和隐藏字幕信息。作为音频回放装置的一个具体实例,第四个实施例使用了例如一台MD(迷你光盘)播放机。MD播放机可以由CD(光盘)播放机取代。另外,音频回放装置还可以由具有记录功能的音频录放装置取代,比如MD录音机或IC存储器录音机。
图10是一幅框图,显示了依据本发明第四个实施例的隐藏字幕控制装置的示意结构。这台装置具有音频输入端子11、控制信息输入端子26和字符信息输入端子27。这些输入端子通过电缆等,分别连接到MD播放机对应的音频输出端子、控制信息输出端子和字符信息输出端子。用户通过操作面板、遥控设备等,对MD播放机进行回放操作时,从安装在播放机的存储介质中,读取和回放音频数据和隐藏字幕信息的数据。把回放的数据输入到隐藏字幕控制装置的音频输入端子11和字符信息输入端子27。用户通过操作面板、遥控设备等的操作,在回放时提供的控制信息,输入到控制信息输入端子26。这项控制信息表示了回放有关的多种控制信息,比如回放音量和回放速度,而且不限于特定的信息。
作为与其主要部分有关的所公开部件,本实施例的隐藏字幕控制装置具有一个语音品质分析器12、一个噪声传感器14以及一个隐藏字幕显示控制器23;分析器12分析音频输入端子11输入的音频数据;传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示。
作为与输出音频和隐藏字幕有关的所公开部件,本实施例的隐藏字幕控制装置具有一个字符信息显示器件68和一个音频输出端子13;显示器件68在隐藏字幕显示控制器23的控制下,显示从字符信息输入端子27输入的隐藏字幕信息;音频输出端子13用于输出语音品质分析器12输入的音频数据。音频输出端子13连接到一部扬声器等设备。字符信息显示器件68是由例如液晶显示器件形成的。
语音品质分析器12进行类似于第一个实施例中的分析。也就是说,语音品质分析器12对于输入音频数据中包括的背景声音水平和语音的速度进行估计,并且把它们输出为两个分析结果数值,用于对输入音频数据中包括之语音的语音收听电平检查。另外,噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平,如同第一个实施例。考虑到产品成本等因素时,也可以去除噪声传感器14。
隐藏字幕显示控制器23具有一套与第二个实施例相同的规则(参见图6),并且对语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到控制信息输入端子26的回放控制信号表示的回放状态,应用这套规则,对输入音频数据中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着字符信息显示器件68。在检查中,考察语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及输入到控制信息输入端子26的回放控制信号表示的回放状态,与检查参考值相比,是否满足第一条规则至第十五条规则中的至少一条。此外,本实施例的隐藏字幕控制装置还可以连接到一台音频回放装置,它接收并回放广播的音频和隐藏字幕信息。作为音频回放装置的一个具体实例,使用了例如一台无线电广播接收机。在这种情况下,可以不包括控制信息输入端子26。
(第五个实施例)
依据本发明第五个实施例的隐藏字幕控制装置,安装在一台内容播放机的内部,它接收并回放视频内容,包括广播的视频、音频和隐藏字幕信息。
图11是一幅框图,显示了一台内容播放机的示意结构,其中内建了依据第五个实施例的隐藏字幕控制装置。这台内容播放机可以包含例如一台个人电脑(PC),它包括一个内容接收器41、一个音频回放器件43、一个视频回放器件44、一个回放控制器42以及一个隐藏字幕回放器件45;内容接收器41通过电脑网络等途径,接收传送的视频内容;音频回放器件43从内容接收器41收到的内容中分离出音频数据并进行回放;视频回放器件44从内容接收器41收到的内容中分离出视频数据并进行回放;用户从操作面板、遥控设备等提供的一个信号表示回放音频数据和视频数据的一条指令,输入回放控制器42后,就控制着音频数据和视频数据的回放;隐藏字幕回放器件45从内容接收器41收到的内容中分离出隐藏字幕信息并进行回放。
另外,作为与隐藏字幕显示控制有关的所公开部件,本实施例的内容播放机具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23以及一个隐藏字幕视频发生器24;语音品质分析器12用于分析音频回放器件43回放的音频数据;噪声传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示;隐藏字幕视频发生器24具有字符字体数据,用于接收隐藏字幕回放器件45回放的隐藏字幕信息,并且使用字符字体数据产生隐藏字幕字符的图片数据,以及通过使隐藏字幕字符的影像数据与视频回放器件44回放的视频数据同步,从而产生隐藏字幕视频信号。
作为与输出隐藏字幕视频和音频有关的所公开部件,本实施例的内容播放机具有一个音频输出器件63和一个视频输出器件65;音频输出器件63包括例如一部扬声器,根据语音品质分析器12输入的音频数据,输出语音;视频输出器件65包括例如一个显示器件,根据隐藏字幕视频发生器24产生的隐藏字幕图片数据,输出影像。
语音品质分析器12进行类似于第一个实施例的分析。也就是,语音品质分析器12对输入音频数据中包括的背景声音水平和语音速度进行估计,并且把它们输出为两个分析结果数值,以便对输入音频数据中包括的语音进行语音收听电平检查时使用。另外,噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平,如同第一个实施例。考虑到产品成本等因素时,也可以去除噪声传感器14。
隐藏字幕显示控制器23具有一套与第二个实施例相同的规则(参见图6),用于语音收听电平检查,对于语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及从回放控制器42输入的回放控制信号表示的回放状态,隐藏字幕控制器23应用这套规则,对输入音频数据中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着隐藏字幕视频发生器24。在检查中,考察语音品质分析器12获得的分析结果数值、噪声传感器14探测到的环境噪声电平以及来自回放控制器42的回放控制信号表示的回放状态,与检查参考值相比,是否满足第一条规则至第十五条规则中的至少一条。
(第六个实施例)
依据本发明第六个实施例的隐藏字幕控制装置,安装在一台视频回放装置的内部,它接收并回放广播的视频、音频和隐藏字幕信息。作为视频回放装置的一个具体实例,第六个实施例使用了例如一台电视接收机。隐藏字幕信息通过嵌入视频信号传送,或者作为子视频传送,并由电视接收机接收。
图12是一幅框图,显示了一台电视接收机的示意结构,其中内建了依据本发明第六个实施例的隐藏字幕控制装置。这台电视接收机具有一部广播接收器51、一个音频解调器53、一个视频解调器54和一个隐藏字幕解调器55;广播接收器51接收通过无线电波、电缆等途径传送的广播信号;音频解调器53从广播接收器51收到的广播信号中解调出语音信号;视频解调器54从广播接收器51收到的广播信号中解调出图片信号;隐藏字幕解调器55从广播接收器51收到的广播信号中解调出隐藏字幕信息。
作为与隐藏字幕显示控制有关的所公开部件,本实施例的电视接收机具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23以及一个隐藏字幕视频发生器24;分析器12分析音频解调器52解调出的语音信号;传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示;隐藏字幕视频发生器24具有字符字体数据,并且接收隐藏字幕解调器55解调出的隐藏字幕信息,再使用字符字体数据,产生隐藏字幕字符的影像数据。隐藏字幕视频发生器24通过使隐藏字幕字符的影像数据与视频解调器54解调出的视频数据同步,产生隐藏字幕视频信号。
作为与输出音频和视频有关的所公开部件,本实施例的电视接收机还具有一个音频输出器件63,包括例如一部扬声器,根据语音品质分析器12输入的语音信号,输出语音。另外,还配备了视频输出器件65,包括例如一个液晶或CRT类型的显示器件,根据隐藏字幕视频发生器24产生的隐藏字幕图片信号,输出视频。
语音品质分析器12进行类似于第一个实施例的分析。也就是,语音品质分析器12对输入语音信号中包括的背景声音水平和语音速度进行估计,并且把它们输出为两个分析结果数值,以便对输入语音信号中包括的语音进行语音收听电平检查时使用。另外,噪声传感器14利用配备的一个话筒,提取视听环境中的声音,并且为观众探测环境噪声电平,如同第一个实施例。考虑到产品成本等因素时,也可以去除噪声传感器14。
隐藏字幕显示控制器23具有一套与第一个实施例相同的规则(参见图2),用于语音收听电平检查,对于语音品质分析器12获得的分析结果数值和噪声传感器14探测到的环境噪声电平,隐藏字幕控制器23应用这套规则,对输入语音信号中包括的语音进行语音收听电平检查。根据这项检查的结果,隐藏字幕显示控制器23确定隐藏字幕信息的一种显示模式,并且控制着隐藏字幕视频发生器24。在检查中,考察语音品质分析器12获得的分析结果数值和噪声传感器14探测到的环境噪声水,与检查参考值相比,是否满足第一条规则至第四条规则中的至少一条。
(第七个实施例)
依据本发明第四个实施例的隐藏字幕控制装置,安装在一台音频回放装置内,它回放存储介质中存储的音频和隐藏字幕信息。作为音频回放装置的一个具体实例,第七个实施例使用了例如一台MD(迷你光盘)播放机。MD播放机可以由CD(光盘)播放机取代。另外,音频回放装置还可以由具有记录功能的音频录放装置取代,比如MD录音机或IC存储器录音机。
图13是一幅框图,显示了一台MD播放机的示意结构,其中内建了依据本发明第七个实施例的隐藏字幕控制装置。这台MD播放机具有一个驱动机构(未显示),以便安装一种存储介质31进行数据读取,存储介质31上记录着音频和隐藏字幕信息。
另外,提供了一个音频回放器件33、一个隐藏字幕回放器件35和一个回放控制器32;音频回放器件33用于从存储介质31读取和回放音频数据;隐藏字幕回放器件35用于从存储介质31读取和回放字符影像数据;回放控制器32从一个操作面板、一台遥控设备等输入一个回放控制信号(表示用户对回放音频数据提供的一条指令),并且控制着音频数据的回放。回放控制信号表示了回放状态,比如至少一种回放音量或一种回放速度。
作为隐藏字幕显示控制有关的所公开部件,本实施例的MD播放机具有一个语音品质分析器12、一个噪声传感器14、一个隐藏字幕显示控制器23;语音品质分析器12用于分析音频回放器件33回放的音频数据;噪声传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示。
作为与输出音频和隐藏字幕有关的所公开部件,本实施例的MD播放机还具有一个字符信息显示器件68和一个音频输出器件63;字符信息显示器件68在隐藏字幕显示控制器23的控制下,显示出隐藏字幕回放器件35回放的隐藏字幕信息;音频输出器件63输出语音品质分析器12输入的音频数据。字符信息显示器件68是由例如一片液晶显示器件形成的。一个声音器件,比如一个扬声器,连接到音频输出器件63。音频器件可以整合地配备在MD播放机的外壳中。
(第八个实施例)
依据本发明第八个实施例的隐藏字幕控制装置,安装在一台内容播放机的内部,它接收并回放音频内容,包括广播的音频和隐藏字幕信息。
图14是一幅框图,显示了一台内容播放机的示意结构,其中内建了依据第八个实施例的隐藏字幕控制装置。这台内容播放机可以包含例如一台个人电脑(PC),它包括一台内容接收器41、一个音频回放器件43、一台回放控制器42以及一个隐藏字幕回放器件45;内容接收器41通过电脑网络等途径,接收传送的音频内容;音频回放器件43从内容接收器41收到的内容中分离出音频数据并进行回放;用户从操作面板、遥控设备等提供的一个信号表示回放音频数据的一条指令,输入回放控制器42后,就控制着音频数据的回放;隐藏字幕回放器件45从内容接收器41收到的内容中分离出隐藏字幕信息并进行回放。
作为与隐藏字幕显示控制有关的所公开部件,本实施例的内容播放机具有一个语音品质分析器12、一个噪声传感器14和一个隐藏字幕显示控制器23;语音品质分析器12用于分析音频回放器件43回放的音频数据;噪声传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示。
作为输出音频和隐藏字幕有关的所公开部件,本实施例的内容播放机具有一个字符信息显示器件68和一个音频输出器件63;字符信息显示器件68在隐藏字幕显示控制器23的控制下,显示出隐藏字幕回放器件45回放的隐藏字幕信息;音频输出器件63输出语音品质分析器12输入的音频数据。字符信息显示器件68包含例如一片液晶显示器件。一个声音器件,比如一个扬声器,连接到音频输出器件63。声音器件可以整合地配备在内容播放机的外壳中。
(第九个实施例)
依据本发明第九个实施例的隐藏字幕控制装置,安装在一台音频回放装置的内部,它接收并回放广播的音频和隐藏字幕信息。作为音频回放装置的一个具体实例,第九个实施例使用了例如FM字符多路广播对应的一台无线电广播接收机。隐藏字幕信息通过嵌入FM广播无线电波波段,随语音信号一起传送。无线电接收机可以陆地数字音频广播接收机取代。隐藏字幕信息作为数据广播传送。
图15是一幅框图,显示了一台无线电广播接收机的示意结构,其中内建了依据本发明第九个实施例的隐藏字幕控制装置。这台无线电广播接收机具有一部广播接收器51、一个音频解调器53和一个隐藏字幕解调器55,广播接收器51接收通过无线电波、电缆等途径传送的广播信号,音频解调器53从广播接收器51收到的广播信号中解调出语音信号,隐藏字幕解调器55从广播接收器51收到的广播信号中解调出隐藏字幕信息。
作为与隐藏字幕显示控制有关的所公开部件,本实施例的无线电广播接收机具有一个语音品质分析器12、一个噪声传感器14和一个隐藏字幕显示控制器23;分析器12分析音频解调器52解调出的语音信号;传感器14具有一个话筒,用于探测环境噪声电平;隐藏字幕显示控制器23按照若干规则,控制着隐藏字幕信息的显示。
作为与输出音频和隐藏字幕有关的所公开部件,本实施例的无线电广播接收机具有一个字符信息显示器件68和一个音频输出器件63;字符信息显示器件68在隐藏字幕显示控制器23的控制下,显示隐藏字幕解调器55解调出的隐藏字幕信息,音频输出器件63输出语音品质分析器12输入的语音信号。字符信息显示器件68包含例如一片液晶显示器件。一个声音器件,比如一个扬声器,连接到音频输出器件63。声音器件可以整合地配备在无线电广播接收机的外壳中。
如上所述,本发明介绍了一种隐藏字幕控制装置及所用的方法,该装置能在甚至难以听清音频输出中语音的情况下,显示出补充的隐藏字幕信息,以便把音频内容恰当而准确地传递给观众,或者能控制着隐藏字幕的显示模式。
对于本领域的技术人员,不难设想出其它的优点和修改。所以,从广义上来说,本发明并不限于本文所示和介绍的特定细节和代表性实施例。因此,对于附带的权利要求书及其相当内容定义的一般发明概念,在不脱离其实质和范围的情况下,可以作出多种修改。

Claims (19)

1.一种隐藏字幕显示控制器,用于与控制音频信号语音对应的隐藏字幕的显示模式,该控制器包括:
隐藏字幕发生器,用于产生表示隐藏字幕的隐藏字幕影像;
分析单元,配置为分析语音的语音品质;
检查单元,配置为根据分析单元的分析结果,按照给定的规则,检查语音的语音收听电平;以及
确定单元,配置为按照检查单元的检查结果,确定隐藏字幕影像的显示模式。
2.根据权利要求1的隐藏字幕显示控制器,进一步包括噪声传感器,用于探测环境噪声电平,而且检查单元包括使用环境噪声电平的参考值检查语音收听电平的装置。
3.根据权利要求1的隐藏字幕显示控制器,进一步包括控制信号输入单元,用于输入表示语音的回放音量或其回放速度的回放控制信号,而且检查单元被配置为按照回放音量的参考值和回放速度的参考值其中之一,检查语音收听电平。
4.根据权利要求1的隐藏字幕显示控制器,其中,检查单元包括使用背景声音电平的参考值和语音速度其中之一检查语音收听电平的装置。
5.根据权利要求4的隐藏字幕显示控制器,进一步包括噪声传感器,用于探测环境噪声电平,而且检查单元包括使用环境噪声电平的参考值检查语音收听电平的装置。
6.根据权利要求5的隐藏字幕显示控制器,进一步包括控制信号输入单元,用于输入表示语音的回放音量或其回放速度的回放控制信号,而且检查单元被配置为按照回放音量的参考值和回放速度的参考值其中之一,检查语音收听电平。
7.根据权利要求4的隐藏字幕显示控制器,进一步包括控制信号输入单元,用于输入表示语音的回放音量或其回放速度的回放控制信号,而且检查单元被配置为按照回放音量的参考值和回放速度的参考值其中之一,检查语音收听电平。
8.根据权利要求1的隐藏字幕显示控制器,其中,确定单元包括,当检查单元确定语音收听电平难以让人听清时把显示模式从不显示隐藏字幕切换为显示隐藏字幕的装置。
9.根据权利要求1的隐藏字幕显示控制器,其中,确定单元被配置为,当检查单元确定语音收听电平为难以让人听清时放大隐藏字幕的尺寸。
10.根据权利要求1的隐藏字幕显示控制器,其中,确定单元包括,当检查单元确定语音收听电平难以让人听清时增加隐藏字幕的字符行数的装置。
11.一种使用数字视频盘的数字视频盘播放机,所述数字视频盘上存储包括视频数据、包括语音的音频数据和隐藏字幕数据的数字信息,所述数字视频播放机包含:配置为从数字信息中提取视频数据的视频播放机单元,配置为读出音频数据以产生音频信号的音频播放机单元,以及对其提供音频信号的权利要求1的隐藏字幕显示控制器。
12.根据权利要求11的数字视频盘播放机,进一步包括噪声传感器,用于探测环境噪声电平,而且检查单元包括使用环境噪声电平的参考值检查语音收听电平的装置。
13.根据权利要求11的数字视频盘播放机,进一步包括控制信号输入单元,用于输入表示语音的回放音量或其回放速度的回放控制信号,而且检查单元配置为按照回放音量的参考值和回放速度的参考值其中之一,检查语音收听电平。
14.根据权利要求11的数字视频盘播放机,其中,检查单元包括使用背景声音电平的参考值和语音速度其中之一检查语音收听电平的装置。
15.一种用于回放内容的内容播放机,所述回放的内容包括视频数据、包括语音的音频数据和隐藏字幕数据,所述内容播放机包含:用来接收内容的内容接收器,被配置为从内容中分离视频数据的视频播放机单元,被配置为从内容中分离音频数据以产生音频信号的音频播放机单元,以及对其提供音频信号的权利要求1的隐藏字幕显示控制器。
16.根据权利要求15的内容播放机,进一步包括噪声传感器,用于探测环境噪声电平,而且检查单元包括使用环境噪声电平的参考值检查语音收听电平的装置。
17.根据权利要求15的内容播放机,进一步包括控制信号输入单元,用于输入表示语音的回放音量或其回放速度的回放控制信号,而且检查单元被配置为按照回放音量的参考值和回放速度的参考值其中之一,检查语音收听电平。
18.根据权利要求15的内容播放机,其中,检查单元包括使用背景声音电平的参考值和语音速度其中之一检查语音收听电平的装置。
19.一种隐藏字幕显示的控制方法,用于控制音频信号中包括的并与音频信号的语音对应的隐藏字幕的显示模式,所述方法包括:
分析语音的语音品质;
根据分析结果,按照给定的规则,检查语音收听电平;以及
按照检查结果,确定显示模式。
CNB2004100574977A 2003-08-15 2004-08-13 隐藏字幕控制装置及其所用的方法 Expired - Fee Related CN100431342C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP207621/2003 2003-08-15
JP2003207621A JP4128916B2 (ja) 2003-08-15 2003-08-15 字幕制御装置および方法ならびにプログラム

Publications (2)

Publication Number Publication Date
CN1581282A true CN1581282A (zh) 2005-02-16
CN100431342C CN100431342C (zh) 2008-11-05

Family

ID=34131440

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100574977A Expired - Fee Related CN100431342C (zh) 2003-08-15 2004-08-13 隐藏字幕控制装置及其所用的方法

Country Status (3)

Country Link
US (2) US7467088B2 (zh)
JP (1) JP4128916B2 (zh)
CN (1) CN100431342C (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1905618B (zh) * 2005-07-25 2010-06-16 三星电子株式会社 用于显示隐藏字幕数据的广播接收装置及其方法
US8212924B2 (en) 2009-05-12 2012-07-03 Himax Technologies Limited System and method for processing multimedia data using an audio-video link
CN103477648A (zh) * 2011-03-31 2013-12-25 索尼爱立信移动通讯有限公司 在呈现多媒体内容的同时呈现消息传送内容的系统和方法
WO2014079259A1 (zh) * 2012-11-26 2014-05-30 深圳Tcl新技术有限公司 电视机及其cc模式识别显示方法、装置
CN105828118A (zh) * 2016-03-22 2016-08-03 乐视网信息技术(北京)股份有限公司 视频推送方法及装置
WO2018112789A1 (en) * 2016-12-21 2018-06-28 Arris Enterprises Llc Automatic activation of closed captioning for low volume periods
CN110324702A (zh) * 2019-07-04 2019-10-11 三星电子(中国)研发中心 视频播放过程中的信息推送方法和装置

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7239693B2 (en) * 2003-06-30 2007-07-03 Bellsouth Intellectual Property Corporation Network-based timed ring suppression
US7113586B2 (en) * 2003-06-30 2006-09-26 Edward Michael Silver Caller controlled network-based timed ring suppression
US7443967B1 (en) 2003-09-29 2008-10-28 At&T Intellectual Property I, L.P. Second communication during ring suppression
JP2006081061A (ja) * 2004-09-13 2006-03-23 Alpine Electronics Inc 音声出力装置及び音声/映像出力装置
JP4127274B2 (ja) * 2005-03-22 2008-07-30 日本電気株式会社 電話音声認識システム
JP2006279592A (ja) 2005-03-29 2006-10-12 Toshiba Corp 放送受信機
JP2007129663A (ja) * 2005-11-07 2007-05-24 Sharp Corp 再生装置
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
EP1816860A1 (en) * 2006-02-03 2007-08-08 Advanced Digital Broadcast S.A. Method and system for controlling of transfer of information contained in signal received by digital television receiver
JP2007300323A (ja) * 2006-04-28 2007-11-15 Sharp Corp 字幕表示制御システム
KR101158436B1 (ko) * 2006-06-21 2012-06-22 엘지전자 주식회사 디지털 방송과 부가 정보의 동기 제어 방법 및 이를구현하기 위한 디지털 방송용 단말기
JP2008005405A (ja) * 2006-06-26 2008-01-10 Funai Electric Co Ltd テレビ受像機および映像表示装置
US8041025B2 (en) * 2006-08-07 2011-10-18 International Business Machines Corporation Systems and arrangements for controlling modes of audio devices based on user selectable parameters
JP4980018B2 (ja) * 2006-09-21 2012-07-18 パナソニック株式会社 字幕生成装置
JP5222543B2 (ja) * 2007-12-10 2013-06-26 株式会社日立製作所 テレビジョン装置
US7487096B1 (en) * 2008-02-20 2009-02-03 International Business Machines Corporation Method to automatically enable closed captioning when a speaker has a heavy accent
KR101513615B1 (ko) * 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
US9131191B2 (en) * 2008-09-18 2015-09-08 VIZIO Inc. Synchronizing operational states of closed captioning and audio mute
US8359399B2 (en) 2008-10-16 2013-01-22 Echostar Technologies L.L.C. Method and device for delivering supplemental content associated with audio/visual content to a user
KR101622688B1 (ko) * 2008-12-02 2016-05-19 엘지전자 주식회사 3차원 캡션 디스플레이 방법 및 이를 구현하기 위한 3차원 디스플레이 장치
US8325276B2 (en) * 2009-08-26 2012-12-04 Samsung Electronics Co., Ltd. System and method for real-time video content sharing with synchronization via closed-caption metadata
KR20110025123A (ko) * 2009-09-02 2011-03-09 삼성전자주식회사 비디오 영상 배속 재생 방법 및 장치
US8458758B1 (en) * 2009-09-14 2013-06-04 The Directv Group, Inc. Method and system for controlling closed captioning at a content distribution system
JP2012070150A (ja) * 2010-09-22 2012-04-05 Sharp Corp コンテンツ再生装置、方法、及びプログラム
KR101830656B1 (ko) * 2011-12-02 2018-02-21 엘지전자 주식회사 이동 단말기 및 이의 제어방법
US9210360B2 (en) * 2012-12-28 2015-12-08 Echostar Uk Holdings Limited Volume level-based closed-captioning control
US10321204B2 (en) * 2014-07-11 2019-06-11 Lenovo (Singapore) Pte. Ltd. Intelligent closed captioning
KR102187195B1 (ko) * 2014-07-28 2020-12-04 삼성전자주식회사 주변 소음에 기초하여 자막을 생성하는 동영상 디스플레이 방법 및 사용자 단말
JP6635049B2 (ja) * 2014-12-26 2020-01-22 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US9596429B2 (en) * 2015-05-08 2017-03-14 Echostar Technologies L.L.C. Apparatus, systems and methods for providing content when loud background noise is present
US9967631B2 (en) * 2015-11-11 2018-05-08 International Business Machines Corporation Automated audio-based display indicia activation based on viewer preferences
CN105872431B (zh) * 2016-04-20 2019-03-12 武汉华星光电技术有限公司 显示模组的噪点检测装置及噪点检测方法
KR20190091265A (ko) * 2016-12-05 2019-08-05 소니 주식회사 정보 처리 장치, 정보 처리 방법, 및 정보 처리 시스템
US10917687B2 (en) * 2017-12-13 2021-02-09 Google Llc Methods, systems, and media for presenting caption information based on volume setting adjustments
US11064264B2 (en) * 2018-09-20 2021-07-13 International Business Machines Corporation Intelligent rewind function when playing media content
US10965888B1 (en) * 2019-07-08 2021-03-30 Snap Inc. Subtitle presentation based on volume control
US11290786B2 (en) 2019-09-13 2022-03-29 Dish Network L.L.C. Systems and methods for controlling closed captioning
EP4073792A1 (en) * 2019-12-09 2022-10-19 Dolby Laboratories Licensing Corp. Adjusting audio and non-audio features based on noise metrics and speech intelligibility metrics
US20220272284A1 (en) * 2021-02-25 2022-08-25 Rovi Guides, Inc. Systems and methods for improved video captions
US20240022682A1 (en) * 2022-07-13 2024-01-18 Sony Interactive Entertainment LLC Systems and methods for communicating audio data

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3074046B2 (ja) 1991-10-21 2000-08-07 沖電気工業株式会社 音声・楽音識別回路
JP2976998B2 (ja) 1992-04-10 1999-11-10 日本電信電話株式会社 発話速度測定装置
CN1062103C (zh) * 1992-10-12 2001-02-14 株式会社金星社 控制字幕显示的设备和方法
US5327176A (en) * 1993-03-01 1994-07-05 Thomson Consumer Electronics, Inc. Automatic display of closed caption information during audio muting
JPH07123376A (ja) 1993-10-20 1995-05-12 Hitachi Ltd 文字多重放送受信装置
JP3256619B2 (ja) * 1993-12-24 2002-02-12 株式会社東芝 文字情報表示装置
JP3196191B2 (ja) * 1994-01-14 2001-08-06 船井電機株式会社 文字多重放送デコーダ内蔵機器
JPH07226907A (ja) 1994-02-15 1995-08-22 Sony Corp 映像信号再生装置及び映像記録媒体
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
JPH096529A (ja) 1995-06-21 1997-01-10 Nec Corp コードレスマウス
US5995709A (en) * 1996-12-27 1999-11-30 Victor Company Of Japan, Ltd. MPEG decoder and optical video disc player using the same
US6785649B1 (en) * 1999-12-29 2004-08-31 International Business Machines Corporation Text formatting from speech
JP2002247498A (ja) * 2001-02-16 2002-08-30 Toshiba Corp 情報再生装置
US20020154246A1 (en) * 2001-04-19 2002-10-24 Hawkins Bret David Method and apparatus for control of auxiliary video information display
JP4209099B2 (ja) 2001-09-05 2009-01-14 アルパイン株式会社 ディスク再生装置
US20060114757A1 (en) * 2002-07-04 2006-06-01 Wolfgang Theimer Method and device for reproducing multi-track data according to predetermined conditions
JP4170808B2 (ja) 2003-03-31 2008-10-22 株式会社東芝 情報表示装置、情報表示方法及びプログラム
JP2005064592A (ja) 2003-08-14 2005-03-10 Fuji Photo Film Co Ltd 携帯通信端末
KR101041810B1 (ko) * 2004-08-27 2011-06-17 엘지전자 주식회사 영상기기 및 그의 자동 캡션 수행 방법

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1905618B (zh) * 2005-07-25 2010-06-16 三星电子株式会社 用于显示隐藏字幕数据的广播接收装置及其方法
US8212924B2 (en) 2009-05-12 2012-07-03 Himax Technologies Limited System and method for processing multimedia data using an audio-video link
CN101887709B (zh) * 2009-05-12 2016-03-02 奇景光电股份有限公司 利用影音链接处理多媒体数据的多媒体处理器及处理方法
CN103477648A (zh) * 2011-03-31 2013-12-25 索尼爱立信移动通讯有限公司 在呈现多媒体内容的同时呈现消息传送内容的系统和方法
CN103477648B (zh) * 2011-03-31 2018-08-14 索尼移动通信株式会社 在呈现多媒体内容的同时呈现消息传送内容的系统和方法
WO2014079259A1 (zh) * 2012-11-26 2014-05-30 深圳Tcl新技术有限公司 电视机及其cc模式识别显示方法、装置
CN105828118A (zh) * 2016-03-22 2016-08-03 乐视网信息技术(北京)股份有限公司 视频推送方法及装置
WO2017161740A1 (zh) * 2016-03-22 2017-09-28 乐视控股(北京)有限公司 视频推送方法及装置
WO2018112789A1 (en) * 2016-12-21 2018-06-28 Arris Enterprises Llc Automatic activation of closed captioning for low volume periods
US11109095B2 (en) 2016-12-21 2021-08-31 Arris Enterprises Llc Automatic activation of closed captioning for low volume periods
CN110324702A (zh) * 2019-07-04 2019-10-11 三星电子(中国)研发中心 视频播放过程中的信息推送方法和装置
CN110324702B (zh) * 2019-07-04 2022-06-07 三星电子(中国)研发中心 视频播放过程中的信息推送方法和装置

Also Published As

Publication number Publication date
JP2005064599A (ja) 2005-03-10
US20090074378A1 (en) 2009-03-19
JP4128916B2 (ja) 2008-07-30
US7925509B2 (en) 2011-04-12
US20050038661A1 (en) 2005-02-17
CN100431342C (zh) 2008-11-05
US7467088B2 (en) 2008-12-16

Similar Documents

Publication Publication Date Title
CN1581282A (zh) 隐藏字幕控制装置及其所用的方法
CN1232107C (zh) 字幕提取装置
CN102208187B (zh) 对大致无声的媒体内容呈现加注音频水印的方法和设备
CN1812524A (zh) 使用集中式信号处理的集成多媒体信号处理系统
CN1933507A (zh) 移动终端设备
US6539210B1 (en) Automatic assignment and tuning of radio call letters to radio presets
CN101047777A (zh) 视频和音频处理系统、视频处理装置、音频处理装置、输出装置以及控制该系统的方法
US9756437B2 (en) System and method for transmitting environmental acoustical information in digital audio signals
JPWO2015097831A1 (ja) 電子機器、制御方法およびプログラム
CN101080069A (zh) 在电子设备中接收数字多媒体广播的装置和方法
CN1681359A (zh) 拾音装置,拾音方法及记录介质
CN1739138A (zh) 信息传输方法及设备、信息记录或再现方法及设备、以及记录介质
CN1581942A (zh) 具有声级控制功能的视频显示装置及其控制方法
TWI528351B (zh) 聲音處理之方法及開放式播音裝置
CN105188008A (zh) 一种测试音频输出单元的方法及装置
CN101061720A (zh) 电视广播接收设备与接收电视广播的方法
CN108153508A (zh) 一种音频处理的方法及装置
CN1710942A (zh) 具有组合模式设置功能的广播接收设备及其方法
JP2008177734A (ja) デジタル放送コンテンツ再生装置
CN1816223B (zh) 电子装置的无线低音音响系统
CN101076101A (zh) 组合系统及其控制方法
TWI286418B (en) Radio receiving apparatus and method
JP2005333191A (ja) 携帯端末型テレビジョン受信装置
CN106330366A (zh) 一种基于播放设备的dab与fm切换控制方法及系统
CN1625304A (zh) 音频信号的显示控制装置和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081105

Termination date: 20100813