CN101867742A - 一种基于声控控制下的电视系统 - Google Patents

一种基于声控控制下的电视系统 Download PDF

Info

Publication number
CN101867742A
CN101867742A CN201010186375A CN201010186375A CN101867742A CN 101867742 A CN101867742 A CN 101867742A CN 201010186375 A CN201010186375 A CN 201010186375A CN 201010186375 A CN201010186375 A CN 201010186375A CN 101867742 A CN101867742 A CN 101867742A
Authority
CN
China
Prior art keywords
module
control
parameter
television system
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010186375A
Other languages
English (en)
Inventor
罗笑南
陆剑华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201010186375A priority Critical patent/CN101867742A/zh
Publication of CN101867742A publication Critical patent/CN101867742A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明实施例公开了一种基于声控控制下的电视系统,所述电视系统包括:音频识别模块、媒体处理模块、业务主控模块,其中:所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。实施本发明,通过声控即可完成对电视系统的控制和管理功能,为用户的生活提供便利,也丰富了人们控制数字电视的能力,增加了用户与数字电视之间的互动性,满足了用户的需求和体验度。

Description

一种基于声控控制下的电视系统
技术领域
本发明涉及数字家庭应用技术领域,具体涉及基于声控控制下的电视系统。
背景技术
随着计算机技术、模式识别等技术的发展,适应不同场合的语音识别系统相继被开发出来,语音识别及处理技术已经越来越突现出其强大的技术优势。近三十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域的应用越来越广泛。
在许多政府部门、商业机构,语音识别技术的应用,可免除大量操作人员的重复劳动,既经济又方便。如:语音邮件、IP电话和IP传真、电子商务、自动语音应答系统、自动语音信箱、基于IP的语音、数据、视频的CTI系统、综合语音、数据服务系统、自然语音识别系统、专家咨询信息服务系统、寻呼服务、故障服务、秘书服务、多媒体综合信息服务、专业特别服务号(168自动信息服务系统,112、114、119等信息查询系统)等。因此,广大用户希望能够利用现代语音识别技术和数字机顶盒技术结合,使电视用户也享受声控带来的乐趣。
目前应用最为广泛的为特定人的语音识别系统,在不是该特定人声控命令,或者背景嘈杂的环境下,改语音识别的识别率低,而且不容易分辨声控命令。
发明内容
本发明提出一种基于声控控制下的电视系统,旨在通过该声控方式即可实现对电视系统的管理和控制等功能。
为了实现发明目的,本发明实施例提供了一种基于声控控制下的电视系统,所述电视系统包括:音频识别模块、媒体处理模块、业务主控模块,其中:
所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;
所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;
所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。
所述所述的音频识别模块包括:
预处理模块,用于对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重处理;
特征提取模块,用于计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理;
特征库存储模块,用于为用户提供输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库;
识别模块,用于将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则得出最终的识别结果。
所述判别规则包括:构词规则,语法规则。
所述关键特征参数包括:线性预测LPC参数、线谱对LSP参数、LPCC、MFCC、ASCC、感觉加权的线性预测PLP参数、动态差分参数和高阶信号谱类特征、Mel频率倒谱系数(MFCC)参数。
本发明实施例具有如下有益效果,通过声控即可完成对电视系统的控制和管理功能,为用户的生活提供便利,也丰富了人们控制数字电视的能力,增加了用户与数字电视之间的互动性,满足了用户的需求和体验度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的基于声控控制下的电视系统结构示意图;
图2为本发明实施例中的图1中音频识别模块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例应理解为仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种浏览器测试系统及其方法,能够大大提高浏览器测试的效率和结果的可靠性。以下分别进行详细说明。
图1示出了本发明实施例中的基于声控控制下的电视系统结构示意图,包括:
音频识别模块、媒体处理模块、业务主控模块,其中:
所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;
所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;
所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。
其中:图2示出了本发明实施例中音频识别模块的结构示意图,该音频识别模块包括:
预处理模块,用于对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重处理;
特征提取模块,用于计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理;关键特征参数包括:线性预测LPC参数、线谱对LSP参数、LPCC、MFCC、ASCC、感觉加权的线性预测PLP参数、动态差分参数和高阶信号谱类特征、Mel频率倒谱系数MFCC参数等等。
特征库存储模块,用于为用户提供输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库;判别规则包括:构词规则,语法规则。
识别模块,用于将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则得出最终的识别结果。
具体的可以知道,该音频识别模块具有如下功能:
预处理流程:对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。
特征提取流程:负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理。现在较常用的特征参数有线性预测(LPC)参数、线谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶信号谱类特征等[1]。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和鲁棒性而应用广泛。
训练阶段流程:用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库。
识别阶段流程:将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则和专家知识(如构词规则,语法规则等)得出最终的识别结果。
对于本发明实施例中的数据流方式如下:
业务处理模块接收音频识别模块发出的命令,如果发出的是情景命令,业务处理模块调用业务显示模块,对命令进行解释,并显示主节目菜单;
业务处理模块接收音频识别模块发出的命令,如果发出的是电视点播命令,业务处理模块调用图形模块,对命令进行解释,并显示已有的点播节目让观众选择;
业务处理模块接收音频识别模块发出的命令,如果发出的是网络命令,业务处理模块调用网络模块,对命令进行解释,并提供股市行情、票务信息、电子报纸、热门网站等各种信息及软件在线升级功能让观众选择;
业务处理模块接收音频识别模块发出的命令,业务处理模块调用视频语音模块,对命令进行解释,然后完成数字电视视频功能对话。
对于音频识别模块,在观众发出命令后,音频识别模块对声音进行采集,加以判断和分析,看看是否合法操作,如果是合法操作,对命令进行解释,然后发送命令到业务主控模块。
业务主控模块接受命令后,对需要的模块进行调用,通过该模块的调用完成所需功能。
综上,通过声控即可完成对电视系统的控制和管理功能,为用户的生活提供便利,也丰富了人们控制数字电视的能力,增加了用户与数字电视之间的互动性,满足了用户的需求和体验度本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种基于标签转换的浏览器,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于声控控制下的电视系统,其特征在于,所述电视系统包括:音频识别模块、媒体处理模块、业务主控模块,其中:
所述音频识别模块用于对声控命令的采集、识别、分析和对命令反馈;
所述业务主控模用于接收数字电视信号,并进行数字电视信号的交互;
所述媒体处理模块用于根据响应音频识别模块中的命令反馈,并在数字电视终端上显示出命令对应的媒体文件和相关信息。
2.如权利要求1所述的基于声控控制下的电视系统,其特征在于,所述所述的音频识别模块包括:
预处理模块,用于对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重处理;
特征提取模块,用于计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理;
特征库存储模块,用于为用户提供输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库;
识别模块,用于将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则得出最终的识别结果。
3.如权利要求2所述的基于声控控制下的电视系统,其特征在于,所述判别规则包括:构词规则,语法规则。
4.如权利要求2所述的基于声控控制下的电视系统,其特征在于,所述关键特征参数包括:线性预测LPC参数、线谱对LSP参数、LPCC、MFCC、ASCC、感觉加权的线性预测PLP参数、动态差分参数和高阶信号谱类特征、Mel频率倒谱系数MFCC参数。
CN201010186375A 2010-05-21 2010-05-21 一种基于声控控制下的电视系统 Pending CN101867742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010186375A CN101867742A (zh) 2010-05-21 2010-05-21 一种基于声控控制下的电视系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010186375A CN101867742A (zh) 2010-05-21 2010-05-21 一种基于声控控制下的电视系统

Publications (1)

Publication Number Publication Date
CN101867742A true CN101867742A (zh) 2010-10-20

Family

ID=42959277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010186375A Pending CN101867742A (zh) 2010-05-21 2010-05-21 一种基于声控控制下的电视系统

Country Status (1)

Country Link
CN (1) CN101867742A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013254A (zh) * 2010-11-17 2011-04-13 广东中大讯通信息有限公司 一种数字电视语音识别人机交互系统及方法
CN102427558A (zh) * 2011-09-27 2012-04-25 深圳市九洲电器有限公司 一种机顶盒的声控方法及机顶盒
CN103366740A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 语音命令识别方法及装置
CN103404127A (zh) * 2011-03-03 2013-11-20 惠普发展公司,有限责任合伙企业 音频关联系统和方法
WO2014190496A1 (en) * 2013-05-28 2014-12-04 Thomson Licensing Method and system for identifying location associated with voice command to control home appliance
CN104517607A (zh) * 2014-12-16 2015-04-15 佛山市顺德区美的电热电器制造有限公司 滤除语音控制电器中的噪声的方法及语音控制电器
CN105225663A (zh) * 2015-08-26 2016-01-06 成都视达科信息技术有限公司 一种利用声控进行多屏互动设备定位连接的方法及系统
US9959865B2 (en) 2012-11-13 2018-05-01 Beijing Lenovo Software Ltd. Information processing method with voice recognition
CN109545220A (zh) * 2019-01-15 2019-03-29 安徽大尺度网络传媒有限公司 一种人工智能语音识别系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1243388A (zh) * 1998-04-21 2000-02-02 国际商业机器公司 用于标识和选择电视系统的信息流段的系统和方法
CN1694162A (zh) * 2005-03-31 2005-11-09 金庆镐 语音识别分析系统及服务方法
CN1968363A (zh) * 2005-11-18 2007-05-23 佳能株式会社 信息处理设备和信息处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1243388A (zh) * 1998-04-21 2000-02-02 国际商业机器公司 用于标识和选择电视系统的信息流段的系统和方法
CN1694162A (zh) * 2005-03-31 2005-11-09 金庆镐 语音识别分析系统及服务方法
CN1968363A (zh) * 2005-11-18 2007-05-23 佳能株式会社 信息处理设备和信息处理方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013254A (zh) * 2010-11-17 2011-04-13 广东中大讯通信息有限公司 一种数字电视语音识别人机交互系统及方法
CN103404127A (zh) * 2011-03-03 2013-11-20 惠普发展公司,有限责任合伙企业 音频关联系统和方法
CN103404127B (zh) * 2011-03-03 2017-02-15 惠普发展公司,有限责任合伙企业 音频关联系统和方法
US10528319B2 (en) 2011-03-03 2020-01-07 Hewlett-Packard Development Company, L.P. Audio association systems and methods
CN102427558A (zh) * 2011-09-27 2012-04-25 深圳市九洲电器有限公司 一种机顶盒的声控方法及机顶盒
CN103366740A (zh) * 2012-03-27 2013-10-23 联想(北京)有限公司 语音命令识别方法及装置
CN103366740B (zh) * 2012-03-27 2016-12-14 联想(北京)有限公司 语音命令识别方法及装置
US9959865B2 (en) 2012-11-13 2018-05-01 Beijing Lenovo Software Ltd. Information processing method with voice recognition
WO2014190496A1 (en) * 2013-05-28 2014-12-04 Thomson Licensing Method and system for identifying location associated with voice command to control home appliance
CN104517607A (zh) * 2014-12-16 2015-04-15 佛山市顺德区美的电热电器制造有限公司 滤除语音控制电器中的噪声的方法及语音控制电器
CN105225663A (zh) * 2015-08-26 2016-01-06 成都视达科信息技术有限公司 一种利用声控进行多屏互动设备定位连接的方法及系统
CN109545220A (zh) * 2019-01-15 2019-03-29 安徽大尺度网络传媒有限公司 一种人工智能语音识别系统

Similar Documents

Publication Publication Date Title
CN101867742A (zh) 一种基于声控控制下的电视系统
US10878824B2 (en) Speech-to-text generation using video-speech matching from a primary speaker
CN111128223B (zh) 一种基于文本信息的辅助说话人分离方法及相关装置
WO2020211354A1 (zh) 基于说话内容的说话者身份识别方法、装置及存储介质
CN111508474B (zh) 一种语音打断方法、电子设备及存储装置
US6775651B1 (en) Method of transcribing text from computer voice mail
CN110049270A (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
TWI711967B (zh) 播報語音的確定方法、裝置和設備
CN107844586A (zh) 新闻推荐方法和装置
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
KR20120038000A (ko) 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템
CN104867492A (zh) 智能交互系统及方法
CN103165131A (zh) 语音处理系统及语音处理方法
CN104252464A (zh) 信息处理方法和装置
CN107430851A (zh) 发言提示装置、发言提示方法以及程序
CN106302987A (zh) 一种音频推荐方法及设备
JP2003255979A (ja) データ編集方法、データ編集装置、データ編集プログラム
CN109710799B (zh) 语音交互方法、介质、装置和计算设备
CN112468665A (zh) 一种会议纪要的生成方法、装置、设备及存储介质
CN113782026A (zh) 一种信息处理方法、装置、介质和设备
JP2015094811A (ja) 通話録音可視化システムおよび通話録音可視化方法
CN113709291A (zh) 音频处理方法、装置、电子设备及可读存储介质
CN114065720A (zh) 会议纪要生成方法、装置、存储介质及电子设备
CN103067579A (zh) 辅助在线语音聊天方法和装置
CN109065018B (zh) 一种面向智能机器人的故事数据处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101020