CN108366305A - 一种不带字幕的码流通过语音识别显示字幕的方法及系统 - Google Patents

一种不带字幕的码流通过语音识别显示字幕的方法及系统 Download PDF

Info

Publication number
CN108366305A
CN108366305A CN201810123157.1A CN201810123157A CN108366305A CN 108366305 A CN108366305 A CN 108366305A CN 201810123157 A CN201810123157 A CN 201810123157A CN 108366305 A CN108366305 A CN 108366305A
Authority
CN
China
Prior art keywords
subtitle
language
module
speech recognition
top box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810123157.1A
Other languages
English (en)
Inventor
廖佳秋
王小艳
邱国苗
何志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jiali Extension Technology Co Ltd
Original Assignee
Shenzhen Jiali Extension Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jiali Extension Technology Co Ltd filed Critical Shenzhen Jiali Extension Technology Co Ltd
Priority to CN201810123157.1A priority Critical patent/CN108366305A/zh
Publication of CN108366305A publication Critical patent/CN108366305A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本发明公开了一种不带字幕的码流通过语音识别显示字幕的方法及系统。本发明可以实现根据用户在节目语言设置界面设置好语言,并且传送命令给机顶盒,机顶盒再自动的根据语音识别设备进行监听节目,把一些不带字幕的节目源识别出来,并且按照预先设置好的节目语言用转码器转化成对应的文字形式,显示在当前播放节目的上面,便于一些有听说障碍的用户对当前播放节目内容的理解,也便于用户在一些喧嚣的场所中更加容易理解节目的内容。省去人机交流的繁琐的语音操作,机顶盒自动的更新节目字幕给用户。界面设计比较友好,能提供节目语言设置界面给用户,效果能满足用户的需求。其智能化程度高、操作方便、设计人性化、使用效果好。

Description

一种不带字幕的码流通过语音识别显示字幕的方法及系统
技术领域
本发明涉及广播电视技术领域,尤其涉及一种不带字幕的码流通过语音识别显示字幕的方法及系统。
背景技术
随着数字电视机的日益普及,除了传统的电视节目外,通过利用先进的数字电视技术为广大用户提供更多的信息服务,是广播电视事业发展的必然趋势。
字幕(subtitle)作为一种简便而直观的信息提供途径,其重要性主要体现在两个方面。一是字幕可以为听力有障碍的人提供另一个"语音"信息途径;二是字幕功能可以通过简单的后期制作(如多语言显示),配合电视节目的全球化推广提供便捷的平台;三是在一些喧闹的场景,也便于用户理解所观看节目的内容。但是对于不带字幕的码流,目前机顶盒还没有集成某种功能去显示字幕。
在机顶盒的技术领域中,已经集成了语音识别技术,这种技术大多数属于人机操作技术,必须通过用户来命令,语音设备进行识别,最后机顶盒响应命令。从操作角度来说,步骤还是有点繁琐的。另外,从用户角度来说这种传统的语音识别技术还是不能满足一些特殊的的用户需求。比如一些听说有障碍的用户。
针对以上的背景,特此开发出一种不带字幕的码流通过语音识别显示出来的技术,此技术能有效的解决了以上问题,是电视用户急需的一种数字电视技术。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种不带字幕的码流通过语音识别显示字幕的方法及系统,帮助用户更方便更清楚的知道节目的内容,真正的普及到所有的用户。并且设计出友好的选择节目语言界面,提供给用户多语言方面的支持,是语音识别技术在机顶盒上的一次创新和发展。
为实现上述目的,本发明提供了一种不带字幕的码流通过语音识别显示字幕的方法,包括以下步骤:
步骤1、在机顶盒系统中建立一个语言数据库,并且根据各国的语言代码进行初始化,以供用户对节目的语言需求做出响应;
步骤2、在机顶盒系统中建立一个语音数据库,并且根据预制的语音辨识程序组进行初始化,以供辨别出最准确的语音;
步骤3、不带字幕的码流传送至机顶盒CPU处理,机顶盒解析出音频数据,并经播放器播放;
步骤4、语音识别子系统的降噪声模块对机顶盒CPU处理后的音频数据进行降噪声处理,然后经语音识别模块语音识别处理之后,再通过语言解码模块进行语言转码转化成用户需要的文本数据;
步骤5、根据语言解码模块转化的文本数据,叠加字幕在当前播放节目的画面上,利用OSD(On-Screen Display)即屏幕菜单式调节方式的界面显示技术来显示字幕,字幕位置属性是动态的,由实时的文本数据长度决定。
进一步地,所述步骤1具体为:在字幕语言选择中选择要显示的字幕的语言,并且保存到机顶盒的固态存储器;根据用户输入的字幕语言,从预先定义的语言数据库中匹配出相同的语言,以供字幕的语言文字显示。
进一步地,所述步骤2具体为:在机顶盒系统里面合入语音辨别的程序组,机顶盒预制一些语音信息,提取语音模板,最后将语音信息保存到语音数据库中。
进一步地,所述步骤4具体为:
(1)降噪声模块将机顶盒收集到的音频数据送到降噪声模块进行去除噪声处理,通过滤波减弱、消除信号中噪声信号的频谱成分,增强信号的信噪比,然后传送给语音识别模块;
(2)语音识别模块对降噪声模块处理后的音频数据进行识别,并把识别出的数据保存到机顶盒的存储模块中,通过与之前步骤2中创建的语音数据库中的数据进行比较,匹配出最准确的音频数据;
(3)音频数据经过语音识别处理之后,识别出来的结果传送至机顶盒保存起来,然后根据步骤1所示的方法匹配出语言类型,然后根据这种语言类型来进行语言转码,转出对应的文本数据。
进一步地,所述步骤5具体为:
(1)先得到获取到数据的时间信息,并通过这个时间信息与音频同步,在每次解析完之后,显示模块创建相关的OSD区域,分配内存空间,把解析完的数据连同该数据要显示的时间PTS送到显示缓冲区,根据当前系统时钟和存储的PTS创建一个定时器,如果显示时间已经超过了系统时间,那么显示缓冲区的数据就要清空掉;反之,当显示时间到的时候,定时器被触发,显示内容输出到OSD缓冲区,并结合显示持续时间来进行字幕的显示;
(2)字幕的显示位置属性是由实时的文本数据长度决定的,始终根据文本数据的长度来设置字幕图层显示的位置,通过设置了一个动态的坐标值来实现,设定字幕的显示坐标为(X,Y,W,H)(X是横坐标,Y是纵坐标,W是字幕长度,H是字幕高度),屏幕的尺寸宽度是OSD SCREEN MAX WIDTH,文本数据的长度为SCREEN_WIDTH,那么字幕显示的横坐标是X=(OSD_SCREEN_MAX_WIDTH-SCREEN_WIDTH)>>1。
一种不带字幕的码流通过语音识别显示字幕的系统,包括:
机顶盒主板,包括CPU和与CPU相连接的交互模块、存储模块;
语音识别子系统,包括降噪声模块和与降噪声模块输出端连接的语音识别模块;
显示终端,包括语言解码模块和与语言解码模块输出端连接的显示模块;
所述信号传输模块输出端连接CPU,所述CPU输出端连接降噪声模块,所述语音识别模块输出端连接语言解码模块;其中:
信号传输模块,用于传输数字音频数据到CPU;
CPU,用于处理和更新音频数据;
交互模块,用于与系统进行交互,包括建立语言数据库、建立语音数据库、字幕语言设置;
存储模块,用于存储音频数据和字幕语言;
降噪声模块,用于通过滤波减弱、消除音频数据中噪声信号的频谱成分,增强信号的信噪比;
语音识别模块,对降噪声模块处理后的音频数据进行识别,并把识别出的数据保存到机顶盒的存储模块中;
语言解码模块,用于按照用户的字幕语言设置来进行语言转码,转出对应的文本数据。
进一步地,所述存储模块为FLASH存储器。
进一步地,所述降噪声模块为数字滤波器。
进一步地,所述交互模块为遥控器或者触摸屏。
进一步地,所述显示终端为液晶显示屏或者电视机。
本发明的有益效果是:
本发明可以实现根据用户在节目语言设置界面设置好语言,并且传送命令给机顶盒,机顶盒再自动的根据语音识别设备进行监听节目,把一些不带字幕的节目源识别出来,并且按照预先设置好的节目语言用转码器转化成对应的文字形式,显示在当前播放节目的上面,便于一些有听说障碍的用户对当前播放节目内容的理解,也便于用户在一些喧嚣的场所中更加容易理解节目的内容。其智能化程度高、操作方便、设计人性化、使用效果好。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的方法流程图。
图2是本发明的系统结构框图。
图3是本发明的语音识别流程图。
图4是本发明的字幕显示流程图。
具体实施方式
如图1所示,本发明提供了一种不带字幕的码流通过语音识别技术显示字幕的方法和系统,主要由机顶盒、语音识别子系统组成。语音识别子系统包括降噪声模块和语音识别模块。过程包括:机顶盒把不带字幕的码流的音频解析出来,并通过电视播放声音;用户对节目的字幕语言进行设置,机顶盒对用户设置语言的需求响应;语音识别子系统对音频数据进行去噪声处理识别出来,通过语言解码转化成用户需求的语言文字信息;最后将文字信息以叠加方式显示在当前播放节目的画面上。
本发明的一种不带字幕的码流通过语音识别显示字幕的方法,包括步骤:
步骤1、在系统中建立一个语言数据库,并且根据各国的语言代码进行初始化,以供用户对节目的语言需求做出响应,包括:
用户在字幕(Subtitle)语言选择中选择要显示的字幕的语言,并且保存到机顶盒的固态存储器(FLASH);
根据用户输入的Subtitle语言,从预先定义的数据库中匹配出相同的语言,以供字幕的语言文字显示;
步骤2、在系统中建立一个语音的数据库,并且根据预制的语音辨识程序组进行初始化,以供辨别出最准确的语音;
步骤3、机顶盒CPU接收处理音频数据,包括:
实时的更新音频数据,并且传送至机顶盒中央处理器(CPU);
步骤4、语音识别子系统对机顶盒接收到的音频数据进行降噪声处理,信号经语音识别模块处理之后通过语言转码转化成用户需要的语言文字,包括:
降噪声模块去除噪声之后传送给语音识别模块;
语音识别设备对语音进行识别;
按照用户的字幕语言设置来进行语言转码,转出对应的文本数据;
步骤5、根据语言设备识别出来的文本数据,叠加字幕在当前播放节目的画面上,包括:
利用OSD(On-Screen Display)即屏幕菜单式调节方式的界面显示技术来显示字幕;
字幕位置属性是动态的,由实时的文本数据长度决定的;
步骤1所述的建立一个语言数据库包括:
建立一个语言数据库,并且根据国际标准的语言代码来进行初始化。在每次用户通过Subtitle语言设置界面进行语言选择的时候,将这次设置的数据保存到机顶盒的FLASH中,这样能确保每次重新开机之后都能记住用户设置。接着,从语言数据库中匹配出用户设置的语言,以供后面显示字幕的语言做准备。
步骤2中所述的在系统中建立一个语音的数据库,并且根据预制的语音辨识程序组进行初始化,包括:
首先建立一个语音的数据库,并且在机顶盒系统里面合入语音辨别的程序组,机顶盒可以预制一些语音信息,比如预制一些用户经常观看的节目语音,提取语音模板,最后将这些语音保存到这个语音数据库中。这个步骤是为了后面让语音数据库中的数据和采集到的音频数据进行匹配,尽量使最终输出的语音更准确。
步骤3所述机顶盒CPU接收处理音频数据,步骤包括:
不带字幕的流传送至机顶盒,机顶盒解析出音频数据,并经播放器播放。同时,机顶盒将这些音频数据数据保存起来。这些音频数据是实时的,所以要增加一个定时器(Timer)去不断的更新这些音频数据数据,以保证机顶盒获取到的音频数据是最新的。
步骤5所述语音识别子系统对机顶盒接收到的音频数据进行降噪声处理,信号经语音识别模块处理之后通过语言转码转化成用户需要的语言文字,步骤包括:
(1)降噪声模块是一个数字滤波器,能通过滤波减弱、消除信号中噪声信号的频谱成分,增强信号的信噪比,使语音识别模块能更快速更准确的识别语音。首先将机顶盒收集到的音频数据送到降噪声模块进行去除噪声处理,最后传送给语音识别模块;
(2)语音识别模块是用USB接口与机顶盒连接起来的。对语音识别设备进行移植安装到机顶盒,并适配好与机顶盒的通信方式。机顶盒开机之后,机顶盒系统能自动识出该设备,当降噪的音频数据传送至语音识别模块之后,语音识别模块能对音频数据进行识别,并把识别出的数据保存到机顶盒的FLASH中,通过与之前步骤2中创建的语音数据库中的数据进行比较,匹配出最准确的音频数据;具体的实现过程如下图3所示。
(3)经过语音识别设备处理之后,识别出来的结果将传送至机顶盒保存起来。然后根据步骤1所示的方法匹配出语言类型,然后根据这种语言类型来进行语言转码,转出对应的文本数据。
步骤5根据语言设备识别出来的文本数据,叠加字幕在当前播放节目的画面上。这个步骤包括:
(1)由步骤4得到字幕的文本信息之后,利用OSD(On-Screen Display)即屏幕菜单式调节方式的界面显示技术来显示字幕。为了控制字幕在屏幕上的正常显示,需要利用OSD驱动模块提供的区域操作功能。在该字幕显示实现中使用的函数模块依次是:OSD模块初始化、OSD内存清空、OSD图层创建、OSD图层显示、OSD图层销毁、OSD内存释放。在机顶盒系统中以回调函数的形式利用这些函数模块。在系统初始化中,必须先初始化OSD模块,获取OSD层的设备id,注册OSD图层创建回调函数、OSD图层显示回调函数、OSD图层销毁回调函数和OSD内存释放回调函数。把这些函数以指针的形式保存在全局变量中,当需要相应的OSD服务时,就通过函数指针调用相应的函数。
字幕显示要根据由语音设备实时解析出来的文本数据来显示:先得到获取到数据的时间信息,并通过这个时间信息与音频同步。在每次解析完之后,显示模块创建相关的OSD区域,分配内存空间,把解析完的数据连同该数据要显示的时间PTS(PresentationTime Stamp,显示时间戳)送到显示缓冲区。此时,根据当前系统时钟STC(System TimeClock,系统时序时钟)和存储的PTS创建一个定时器,如果显示时间已经超过了系统时间,那么显示缓冲区的数据就要清空掉;反之,当显示时间到的时候,定时器被触发,显示内容输出到OSD缓冲区,并结合显示持续时间来进行字幕的显示。显示状态流程如图4所示。
(1)字幕的显示位置属性是由实时的文本数据长度决定的,始终根据文本数据的长度来设置字幕图层显示的位置。这里主要设置了一个动态的坐标值来实现,设定字幕的显示坐标为(X,Y,W,H)(X是横坐标,Y是纵坐标,W是字幕长度,H是字幕高度),屏幕的尺寸宽度是OSD_SCREEN_MAX_WIDTH。文本数据的长度为SCREEN_WIDTH。那么我们的Subtitle字幕显示的横坐标是X=(OSD_SCREEN_MAX_WIDTH-SCREEN_WIDTH)>>1,这样设置就可以让字幕始终能在屏幕的下中央位置显示,是整个屏幕让用户看起来比较舒服。
如图2所示,本发明的实现方法对应一种不带字幕的码流通过语音识别显示字幕的系统,包括:
机顶盒主板,包括CPU和与CPU相连接的交互模块、存储模块;
语音识别子系统,包括降噪声模块和与降噪声模块输出端连接的语音识别模块;
显示终端,包括语言解码模块和与语言解码模块输出端连接的显示模块;
所述信号传输模块输出端连接CPU,所述CPU输出端连接降噪声模块,所述语音识别模块输出端连接语言解码模块;其中:
CPU,用于处理和更新音频数据;
交互模块,用于用于与系统进行交互,包括建立语言数据库、建立语音数据库、字幕语言设置;
存储模块,用于存储音频数据和字幕语言;
降噪声模块,用于通过滤波减弱、消除音频数据中噪声信号的频谱成分,增强信号的信噪比;
语音识别模块,对降噪声模块处理后的音频数据进行识别,并把识别出的数据保存到机顶盒的存储模块中;
语言解码模块,用于按照用户的字幕语言设置来进行语言转码,转出对应的文本数据。
其中,所述存储模块为FLASH存储器,所述降噪声模块为数字滤波器,所述交互模块为遥控器或者触摸屏,所述显示终端为液晶显示屏或者电视机。
综上所述,本发明的优势在于:
第一,省去人机交流的繁琐的语音操作,机顶盒自动的更新节目字幕给用户。
第二,本发明的界面设计比较友好,能提供节目语言设置界面给用户,效果能满足用户的需求。
第三,对于一些不带字幕的节目源,用语音识别技术显示出来,能以更好的方式把节目内容传达给用户;不但充分照顾到一些有听说障碍的用户,还能适用于一些喧嚣的场所。
通过本发明可以实现根据用户在节目语言设置界面设置好语言,并且传送命令给机顶盒,机顶盒再自动的根据语音识别设备进行监听节目,把一些不带字幕的节目源识别出来,并且按照预先设置好的节目语言用转码器转化成对应的文字形式,显示在当前播放节目的上面,便于一些有听说障碍的用户对当前播放节目内容的理解,也便于用户在一些喧嚣的场所中更加容易理解节目的内容。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种不带字幕的码流通过语音识别显示字幕的方法,其特征在于,包括以下步骤:
步骤1、在机顶盒系统中建立一个语言数据库,并且根据各国的语言代码进行初始化,以供用户对节目的语言需求做出响应;
步骤2、在机顶盒系统中建立一个语音数据库,并且根据预制的语音辨识程序组进行初始化,以供辨别出最准确的语音;
步骤3、不带字幕的码流传送至机顶盒CPU处理,机顶盒解析出音频数据,并经播放器播放;
步骤4、语音识别子系统的降噪声模块对机顶盒CPU处理后的音频数据进行降噪声处理,然后经语音识别模块语音识别处理之后,再通过语言解码模块进行语言转码转化成用户需要的文本数据;
步骤5、根据语言解码模块转化的文本数据,叠加字幕在当前播放节目的画面上,利用OSD(On-Screen Display)即屏幕菜单式调节方式的界面显示技术来显示字幕,字幕位置属性是动态的,由实时的文本数据长度决定。
2.如权利要求1所述的一种不带字幕的码流通过语音识别显示字幕的方法,其特征在于,所述步骤1具体为:在字幕语言选择中选择要显示的字幕的语言,并且保存到机顶盒的固态存储器;根据用户输入的字幕语言,从预先定义的语言数据库中匹配出相同的语言,以供字幕的语言文字显示。
3.如权利要求1所述的一种不带字幕的码流通过语音识别显示字幕的方法,其特征在于,所述步骤2具体为:在机顶盒系统里面合入语音辨别的程序组,机顶盒预制一些语音信息,提取语音模板,最后将语音信息保存到语音数据库中。
4.如权利要求1所述的一种不带字幕的码流通过语音识别显示字幕的方法,其特征在于,所述步骤4具体为:
(1)降噪声模块将机顶盒收集到的音频数据送到降噪声模块进行去除噪声处理,通过滤波减弱、消除信号中噪声信号的频谱成分,增强信号的信噪比,然后传送给语音识别模块;
(2)语音识别模块对降噪声模块处理后的音频数据进行识别,并把识别出的数据保存到机顶盒的存储模块中,通过与之前步骤2中创建的语音数据库中的数据进行比较,匹配出最准确的音频数据;
(3)音频数据经过语音识别处理之后,识别出来的结果传送至机顶盒保存起来,然后根据步骤1所示的方法匹配出语言类型,然后根据这种语言类型来进行语言转码,转出对应的文本数据。
5.如权利要求1所述的一种不带字幕的码流通过语音识别显示字幕的方法,其特征在于,所述步骤5具体为:
(1)先得到获取到数据的时间信息,并通过这个时间信息与音频同步,在每次解析完之后,显示模块创建相关的OSD区域,分配内存空间,把解析完的数据连同该数据要显示的时间PTS送到显示缓冲区,根据当前系统时钟和存储的PTS创建一个定时器,如果显示时间已经超过了系统时间,那么显示缓冲区的数据就要清空掉;反之,当显示时间到的时候,定时器被触发,显示内容输出到OSD缓冲区,并结合显示持续时间来进行字幕的显示;
(2)字幕的显示位置属性是由实时的文本数据长度决定的,始终根据文本数据的长度来设置字幕图层显示的位置,通过设置了一个动态的坐标值来实现,设定字幕的显示坐标为(X,Y,W,H)(X是横坐标,Y是纵坐标,W是字幕长度,H是字幕高度),屏幕的尺寸宽度是OSD_SCREEN_MAX_WIDTH,文本数据的长度为SCREEN_WIDTH,那么字幕显示的横坐标是X=(OSD_SCREEN_MAX_WIDTH-SCREEN_WIDTH)>>1。
6.一种不带字幕的码流通过语音识别显示字幕的系统,其特征在于,包括:
机顶盒主板,包括CPU和与CPU相连接的交互模块、存储模块;
语音识别子系统,包括降噪声模块和与降噪声模块输出端连接的语音识别模块;
显示终端,包括语言解码模块和与语言解码模块输出端连接的显示模块;
所述信号传输模块输出端连接CPU,所述CPU输出端连接降噪声模块,所述语音识别模块输出端连接语言解码模块;其中:
CPU,用于处理和更新音频数据;
交互模块,用于用于与系统进行交互,包括建立语言数据库、建立语音数据库、字幕语言设置;
存储模块,用于存储音频数据和字幕语言;
降噪声模块,用于通过滤波减弱、消除音频数据中噪声信号的频谱成分,增强信号的信噪比;
语音识别模块,对降噪声模块处理后的音频数据进行识别,并把识别出的数据保存到机顶盒的存储模块中;
语言解码模块,用于按照用户的字幕语言设置来进行语言转码,转出对应的文本数据。
7.如权利要求6所述的一种不带字幕的码流通过语音识别显示字幕的系统,其特征在于:所述存储模块为FLASH存储器。
8.如权利要求6所述的一种不带字幕的码流通过语音识别显示字幕的系统,其特征在于:所述降噪声模块为数字滤波器。
9.如权利要求6所述的一种不带字幕的码流通过语音识别显示字幕的系统,其特征在于:所述交互模块为遥控器或者触摸屏。
10.如权利要求6所述的一种不带字幕的码流通过语音识别显示字幕的系统,其特征在于:所述显示终端为液晶显示屏或者电视机。
CN201810123157.1A 2018-02-07 2018-02-07 一种不带字幕的码流通过语音识别显示字幕的方法及系统 Pending CN108366305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810123157.1A CN108366305A (zh) 2018-02-07 2018-02-07 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810123157.1A CN108366305A (zh) 2018-02-07 2018-02-07 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Publications (1)

Publication Number Publication Date
CN108366305A true CN108366305A (zh) 2018-08-03

Family

ID=63005202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810123157.1A Pending CN108366305A (zh) 2018-02-07 2018-02-07 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Country Status (1)

Country Link
CN (1) CN108366305A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936764A (zh) * 2019-03-20 2019-06-25 四川九州电子科技股份有限公司 基于机顶盒操作系统实现的多语言切换方法及系统
CN110493655A (zh) * 2019-08-16 2019-11-22 深圳市易汇软件有限公司 一种在dvb节目中定制字幕的方法
CN113808441A (zh) * 2021-08-03 2021-12-17 郑州科技学院 便携式外语单词练习器

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1141538A (ja) * 1997-07-17 1999-02-12 Nec Home Electron Ltd 音声認識文字表示装置
CN1870728A (zh) * 2005-05-23 2006-11-29 北京大学 自动加配字幕的方法和系统
CN101076077A (zh) * 2007-06-18 2007-11-21 中兴通讯股份有限公司 一种在iptv机顶盒上实现滚动字幕的系统、方法及网络
CN101599292A (zh) * 2008-06-05 2009-12-09 三星电子(中国)研发中心 在dvd-vr格式盘片上播放字幕数据的方法
CN101753915A (zh) * 2008-12-04 2010-06-23 索尼株式会社 数据处理设备、数据处理方法及程序
CN102014258A (zh) * 2009-09-07 2011-04-13 艾比尔国际多媒体有限公司 多媒体字幕显示系统与方法
CN102111601A (zh) * 2009-12-23 2011-06-29 大猩猩科技股份有限公司 内容可适性的多媒体处理系统与处理方法
CN102196209A (zh) * 2010-03-05 2011-09-21 深圳Tcl新技术有限公司 一种电视节目的字幕隐藏方法
CN202652435U (zh) * 2012-06-29 2013-01-02 广西工学院 一种自动生成字幕的数字电视机顶盒
CN103327397A (zh) * 2012-03-22 2013-09-25 联想(北京)有限公司 一种媒体文件的字幕同步显示方法及系统
CN103544978A (zh) * 2013-11-07 2014-01-29 上海斐讯数据通信技术有限公司 一种多媒体文件制作、播放方法及智能终端
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN104038804A (zh) * 2013-03-05 2014-09-10 三星电子(中国)研发中心 基于语音识别的字幕同步装置和方法
CN104754397A (zh) * 2015-03-16 2015-07-01 深圳市九洲电器有限公司 数字电视隐藏字幕显示方法及系统
WO2015142628A1 (en) * 2014-03-19 2015-09-24 Microsoft Technology Licensing, Llc Closed caption alignment
US20160198234A1 (en) * 2009-08-17 2016-07-07 At&T Intellectual Property I, L.P. Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment
CN106713974A (zh) * 2015-11-12 2017-05-24 中兴通讯股份有限公司 数据转换方法和装置
CN106792145A (zh) * 2017-02-22 2017-05-31 杭州当虹科技有限公司 一种音视频自动叠加字幕的方法和装置
CN106791913A (zh) * 2016-12-30 2017-05-31 深圳市九洲电器有限公司 数字电视节目同声翻译输出方法及系统
CN106888392A (zh) * 2017-02-14 2017-06-23 广东九联科技股份有限公司 一种机顶盒自动翻译系统及方法
CN107222792A (zh) * 2017-07-11 2017-09-29 成都德芯数字科技股份有限公司 一种字幕叠加方法及装置
CN107277646A (zh) * 2017-08-08 2017-10-20 四川长虹电器股份有限公司 一种音视频资源的字幕配置系统

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1141538A (ja) * 1997-07-17 1999-02-12 Nec Home Electron Ltd 音声認識文字表示装置
CN1870728A (zh) * 2005-05-23 2006-11-29 北京大学 自动加配字幕的方法和系统
CN101076077A (zh) * 2007-06-18 2007-11-21 中兴通讯股份有限公司 一种在iptv机顶盒上实现滚动字幕的系统、方法及网络
CN101599292A (zh) * 2008-06-05 2009-12-09 三星电子(中国)研发中心 在dvd-vr格式盘片上播放字幕数据的方法
CN101753915A (zh) * 2008-12-04 2010-06-23 索尼株式会社 数据处理设备、数据处理方法及程序
US20160198234A1 (en) * 2009-08-17 2016-07-07 At&T Intellectual Property I, L.P. Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment
US20170061986A1 (en) * 2009-08-17 2017-03-02 At&T Intellectual Property I, L.P. Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment
CN102014258A (zh) * 2009-09-07 2011-04-13 艾比尔国际多媒体有限公司 多媒体字幕显示系统与方法
CN102111601A (zh) * 2009-12-23 2011-06-29 大猩猩科技股份有限公司 内容可适性的多媒体处理系统与处理方法
CN102196209A (zh) * 2010-03-05 2011-09-21 深圳Tcl新技术有限公司 一种电视节目的字幕隐藏方法
CN103327397A (zh) * 2012-03-22 2013-09-25 联想(北京)有限公司 一种媒体文件的字幕同步显示方法及系统
CN202652435U (zh) * 2012-06-29 2013-01-02 广西工学院 一种自动生成字幕的数字电视机顶盒
CN104038804A (zh) * 2013-03-05 2014-09-10 三星电子(中国)研发中心 基于语音识别的字幕同步装置和方法
CN103561217A (zh) * 2013-10-14 2014-02-05 深圳创维数字技术股份有限公司 一种生成字幕的方法及终端
CN103544978A (zh) * 2013-11-07 2014-01-29 上海斐讯数据通信技术有限公司 一种多媒体文件制作、播放方法及智能终端
WO2015142628A1 (en) * 2014-03-19 2015-09-24 Microsoft Technology Licensing, Llc Closed caption alignment
CN104754397A (zh) * 2015-03-16 2015-07-01 深圳市九洲电器有限公司 数字电视隐藏字幕显示方法及系统
CN106713974A (zh) * 2015-11-12 2017-05-24 中兴通讯股份有限公司 数据转换方法和装置
CN106791913A (zh) * 2016-12-30 2017-05-31 深圳市九洲电器有限公司 数字电视节目同声翻译输出方法及系统
CN106888392A (zh) * 2017-02-14 2017-06-23 广东九联科技股份有限公司 一种机顶盒自动翻译系统及方法
CN106792145A (zh) * 2017-02-22 2017-05-31 杭州当虹科技有限公司 一种音视频自动叠加字幕的方法和装置
CN107222792A (zh) * 2017-07-11 2017-09-29 成都德芯数字科技股份有限公司 一种字幕叠加方法及装置
CN107277646A (zh) * 2017-08-08 2017-10-20 四川长虹电器股份有限公司 一种音视频资源的字幕配置系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936764A (zh) * 2019-03-20 2019-06-25 四川九州电子科技股份有限公司 基于机顶盒操作系统实现的多语言切换方法及系统
CN110493655A (zh) * 2019-08-16 2019-11-22 深圳市易汇软件有限公司 一种在dvb节目中定制字幕的方法
CN113808441A (zh) * 2021-08-03 2021-12-17 郑州科技学院 便携式外语单词练习器

Similar Documents

Publication Publication Date Title
US8045054B2 (en) Closed captioning language translation
CN108449640B (zh) 直播视频输出控制方法、装置及存储介质、终端
CN201319640Y (zh) 一种可实时同步翻译的数字电视接收终端
US8893169B2 (en) Systems and methods for selectively obscuring portions of media content using a widget
CN106340294A (zh) 基于同步翻译的新闻直播字幕在线制作系统
US9285945B2 (en) Method and apparatus for displaying multi-task interface
US20160066055A1 (en) Method and system for automatically adding subtitles to streaming media content
CN106791913A (zh) 数字电视节目同声翻译输出方法及系统
US20030046075A1 (en) Apparatus and methods for providing television speech in a selected language
US20020140718A1 (en) Method of providing sign language animation to a monitor and process therefor
CN110769265A (zh) 一种同声字幕翻译方法、智能电视及存储介质
CN102802044A (zh) 视频处理方法、终端及字幕服务器
CN102055941A (zh) 视频播放器及视频播放方法
CN101453589A (zh) 支持多语言应用环境的装置与方法
CN108366305A (zh) 一种不带字幕的码流通过语音识别显示字幕的方法及系统
CN105828166A (zh) 一种终端屏幕显示内容的录制方法及终端
KR20110062982A (ko) 실시간 방송 컨텐츠의 방송 요약 정보 생성 방법 및 장치와, 그 제공방법 및 방송 수신 장치
CN112601101A (zh) 一种字幕显示方法、装置、电子设备及存储介质
CN113965813B (zh) 直播间内的视频播放方法、系统、设备及介质
CN103945258A (zh) 一种频道切换方法及电视接收装置
WO2014105074A1 (en) Method and apparatus for using contextual content augmentation to provide information on recent events in a media program
JP2010044776A (ja) 民生用電子装置のユーザインターフェースを修正する方法、対応する装置、信号及び、データキャリア
US20100045866A1 (en) Methods and systems for providing auxiliary viewing options
CN111107283B (zh) 一种信息显示方法、电子设备及存储介质
CN100588226C (zh) 机顶盒及其视频输出控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180803

RJ01 Rejection of invention patent application after publication