CN107958668B - 智能电视的声控选播方法、声控选播系统 - Google Patents

智能电视的声控选播方法、声控选播系统 Download PDF

Info

Publication number
CN107958668B
CN107958668B CN201711352347.2A CN201711352347A CN107958668B CN 107958668 B CN107958668 B CN 107958668B CN 201711352347 A CN201711352347 A CN 201711352347A CN 107958668 B CN107958668 B CN 107958668B
Authority
CN
China
Prior art keywords
voice
program
loudspeaker
module
intelligent television
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711352347.2A
Other languages
English (en)
Other versions
CN107958668A (zh
Inventor
纪琦华
蒲珂
曾泽基
方宏
李哲山
李飞
胡彬
魏明
鲁豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cbc Cloud Technology Co ltd
Original Assignee
Cbc Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cbc Cloud Technology Co ltd filed Critical Cbc Cloud Technology Co ltd
Priority to CN201711352347.2A priority Critical patent/CN107958668B/zh
Publication of CN107958668A publication Critical patent/CN107958668A/zh
Application granted granted Critical
Publication of CN107958668B publication Critical patent/CN107958668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及一种智能电视的声控选播方法,包括:S10、智能电视端语音命令提取模块获取特定的语音启动指令,开始降低当前播放节目的第一扬声器音量或调至静音,在预定时间内,智能电视端检测是否有具体的语音命令,如有,则至S20;如无,则调回当前播放节目的扬声器音量;S20、智能电视端获取具体的语音命令,将原始语音信号转换成语音脉冲序列,并通过语音识别提取语音特征矢量,判断该命令的具体类目,其中,所述类目包括操作指令的直接执行和操作指令通过第二扬声器的询问执行;S30、根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问。该方法设于智能电视端,通过特定的语音启动指令开启声控命令,语音操作方便、灵活。

Description

智能电视的声控选播方法、声控选播系统
技术领域
本发明涉及智能电视的选台领域,具体涉及一种智能电视的声控选播方法及相应的声控选播系统。
背景技术
当前的智能电视进行选台时都是利用遥控器在同一电视显示屏幕实现的,选台可以在显示屏幕上切换,或者进行缩小的画中画选择,或者其他占用显示主屏幕的方式来实现。现有技术智能电视在电视显示屏幕上的选台方法均是在主屏幕来显示实现,影响了用户正常观看节目。
针对上述技术问题,现有通过改进遥控器或者通过移动设备控制来实现智能选台,如专利CN201310729636.5公开的智能电视的选台系统,通过截取节目图片发送到与其网络连接的智能设备的屏幕上供用户进行选台,所选台的命令返回给智能电视实现选台,通过外部智能设备来进行电视选台,避免了直接在电视屏幕上进行选台操作,不会影响用户正常观看电视节目。但是,该方法中的外部智能设备使用并不如遥控器方便,需要将外部智能设备进行解锁、打开相应APP等操作,使操作更为复杂。
另一方面,现有技术还有通过在遥控器上增加声控装置实现智能遥控电视,具体的,通过在遥控器上设置语音命令提取单元和语音识别单元,获取操作者相应的语音命令,通过建立语音样品,将语音命令与控制电视机功能的字段进行换算,获得相应的控制指令,并传输至电视机的选台服务模块进行相应的选台操作。该方法虽然实现了便捷的声控操作,但是其需要与遥控器近距离“对话”下达指令,不能随时随地控制选台,且其语音控制功能局限,录入信息刻板,需要操作者熟悉其功能分配与各个字段的对应关系,方可准确实现操作。
发明内容
本发明的目的在于提出一种智能电视的声控选播方法及声控选播系统,直接设于智能电视端,通过特定的语音启动指令开启声控命令,语音操作方便、灵活,即便在无遥控装置时也可顺利进行资源切换操作或设置。
为实现上述目的,本发明所采用的技术方案是一种智能电视的声控选播方法,所述方法至少包括
S10、智能电视端语音命令提取模块获取特定的语音启动指令,开始降低当前播放节目的第一扬声器音量或调至静音,在预定时间内,智能电视端检测是否有具体的语音命令,如有,则至S20;如无,则调回当前播放节目的扬声器音量,继续播放;
S20、智能电视端获取具体的语音命令,将原始语音信号转换成语音脉冲序列,并通过语音识别提取语音特征矢量,判断该命令的具体类目,其中,所述类目包括操作指令的直接执行和操作指令通过第二扬声器的询问执行;
S30、根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问。
本发明声控选播方法的一个优选方案中,所述步骤S20包括
智能电视端在预定时间内采集语音命令,语音命令提取模块将原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量;
语音命令识别模块对标准语音特征矢量进行执行关键词的提取;
判断执行关键词是否与预设字段完全符合,完全符合,则直接执行对应字段号的控制命令;不完全符合,则按照设定的信息提示通过第二扬声器向操作者询问,待采集操作者再次下达语音命令。
进一步的,所述执行关键词包括动作和对象,所述动作为各个指令的执行动作,所述对象为动作执行的对象,包括节目资源名称、节目指南界面以及设置中各项功能名称;
判断执行关键词时,动作和对象与预设字段均符合预设字段时,即为完全符合;其中,当仅所述动作符合预设字段,且对象判断为节目资源名称时,智能电视端根据最新语音模板库中的节目资源标准信息,寻找对应的节目资源;
如与最新语音模板库的节目资源获得最佳匹配,即获得语音识别的最佳结果,根据该结果输出相应的控制信号;
如与最新语音模板库的节目资源无法获得最佳匹配,则对原节目资源名称的标准语音特征矢量进行二次匹配,根据二次匹配判断是否有该节目的关联性资源,如有,则进行关联性大小排列,并通过第二扬声器询问操作者是否播放关联性最大的节目;如无,则通过外网搜索相关的节目资源,同时获取对应的节目资源播放许可的信息,通过第二扬声器将搜索信息告知操作者;其中,所述搜索信息包括节目名称、来源、是否可播放。
另一个改进的技术方案中,所述执行关键词中的动作还包括“推荐”及其同义词,对象还包括节目类别,所述节目类别包括电视剧、电影、纪录片、体娱节目、动画片、直播频道、网络剧以及小视频;
智能电视端预先通过各个节目类别的历史播放记录判断用户的喜好程度,在获取“推荐”指令时,根据具体的节目类别获取用户喜好程度更大的相关节目,通过第二扬声器询问操作者是否播放;如智能电视端无法判断用户对某类节目的喜好程度,则通过网络连接获取社交平台中相应类别节目推荐力度较大的节目,通过第二扬声器询问操作者是否播放。
进一步的,所述步骤S10中,所述智能电视端获取特定的语音指令后,触发指示灯闪烁命令,设于智能电视边框侧的指示灯闪烁1~2s;
所述特定的语音启动指令可以通过系统设置进行个性化设定,或者采用默认的特定语音。
本发明声控选播方法还可为用户提供舒适的交流环境,具体的,还包括对噪音环境的监控,操作方法为:
S1、智能电视端的噪音监测模块随时获取当前环境噪音,并分析当前环境噪音的分贝大小;
S2、音量评估模块评估当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,进一步判断当前第一扬声器播放的音量是否为干扰音量,如是,则降低当前播放节目的第一扬声器音量或调至静音。
本发明另一方面还提供了一种智能电视的声控选播系统,所述系统至少包括设于智能电视端的
语音命令提取模块,配置为在电视话音及其他噪音背景下,识别特定的语音启动指令,且在语音指令启动后,在低分贝噪音下完全提取操作者的语音命令信息;
语音前级处理模块,用于将获取的原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量;
语音命令识别模块,采用语音信号识别集成的专用语音芯片,对标准语音特征矢量进行特征提取和最佳特征矢量匹配,获取语音识别的结果;
所述语音命令识别模块具体包括关键词提取单元、关键词类目分析单元、预设字段比对单元以及预设字段存储单元;所述关键词提取单元用于对语音内容的分段、停词,获取动作和对象相关的词语;所述关键词类目分析单元用于识别关键词的具体类目,判断其是操作指令的直接执行还是操作指令通过第二扬声器的询问执行;所述预设字段比对单元将获取的动作和对象相关的词语与预先建立的语音字段的具体进行比对,获取相应的控制对象和控制命令;所述预设字段存储单元用于对预设的语音字段的存储;
语音提示模块,根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问;
语音输出模块,在所述关键词类目分析单元判断得关键词的具体类目属于询问执行时,通过第二扬声器向操作者发出询问;
选播控制模块,根据所述语音命令识别模块获取的控制对象和控制命令,执行相应的调出界面、播放视频或其他设置操作;
扬声器协调模块,配置为在获取特定的语音启动指令后,开始降低当前播放节目的第一扬声器音量或调至静音;并在预定时间内,未检测到具体的语音命令时,调回当前播放节目的扬声器音量,继续播放;
其中,所述第一扬声器和第二扬声器与所述语音命令提取模块的送话器分别设于智能电视的两端。
在本发明智能电视的声控选播系统的另一个改进方案中,所述系统还包括资源推荐模块和指示灯控制模块;
所述资源推荐模块包括喜好资源推荐单元和平台资源推荐单元,所述喜好资源推荐单元根据各个节目类别的历史播放记录判断用户的喜好程度;所述平台资源推荐单元通过网络连接获取社交平台中相应类别节目推荐力度较大的节目;
所述指示灯控制模块配置为智能电视端获取特定的语音指令后,触发指示灯闪烁命令,设于智能电视边框侧的指示灯闪烁1~2s。
进一步的,所述语音命令提取模块还被配置为监测当前环境噪音音量;所述系统还包括音量评估模块,用于对接收的环境噪音音量大小进行评估,并判断当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,则通过选播控制模块降低当前播放节目的第一扬声器音量或调至静音。
本发明的有益效果在于:
本发明方法中的声控选播装置设于智能电视端,操作者在无遥控器的情况下,也可随时随地通过语音控制。该方法通过特定的语音启动指令开启智能电视端的语音命令操作,该特定的语音启动指令可以为默认的“某某电视”或者个性化为其设置名称,提高用户操作体验;在开启智能电视端的语音命令操作时才对相应的语音进行录入,同时降低第一扬声器音量或调至静音,避免多路环境噪音对语音命令操作录入的影响。
本发明方法的语音录入形式更为多元化,智能提取语音信息的动作和对象关键词,在无法回馈相应执行动作时,通过询问操作进一步确定相关的语音信息;设有模糊化的语音词语搜索功能,即便操作者无法提供完整资源名称时也可进行相关的搜索操作;此外,该方法还设有推荐功能,提高用户体验。
该方法的语音识别、语音分析及相应的资源搜索等操作内部独立运行,第一扬声器用于节目播放,第二扬声器用于语音询问,使操作者在步骤S20操作期间仍可收看当前的播放节目,不影响当前用户观看节目。
附图说明
图1为本发明智能电视的声控选播方法的一个实施方式的示意图;
图2为本发明获取语音识别结果操作步骤的示意图;
图3为本发明执行关键词具体操作步骤的示意图;
图4为本发明推荐类节目具体操作步骤的示意图;
图5为本发明智能电视的声控选播系统的一种实施方式结构示意图;
图6为本发明智能电视的声控选播系统的另一种实施方式结构示意图。
具体实施方式
下面结合附图和实施例,对本发明智能电视的声控选播方法及系统的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围;有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由各权利要求限定。
图1为本发明智能电视的声控选播方法的一种实施方式,该方法包括
S10、智能电视端语音命令提取模块获取特定的语音启动指令,开始降低当前播放节目的第一扬声器音量或调至静音,在预定时间内,智能电视端检测是否有具体的语音命令,如有,则至S20;如无,则调回当前播放节目的扬声器音量,继续播放;
需要说明的是,所述特定的语音启动指令可以通过系统设置进行个性化设定,或者采用默认的特定语音。举例说明默认的特定语音为“XX电视”;系统设置则可将“XX电视”修改为“声控”“DD”“小明”等个性化但日常使用频率少且发音清晰地词语。智能电视在开机状态下,其语音命令提取模块的拾音器始终保证连通状态,当其获取相应的语音启动指令时,随即触发进行录音状态。
在所述智能电视端获取特定的语音指令时,指示灯闪烁命令触发,设于智能电视边框侧的指示灯闪烁1~2s;该闪烁提示即向操作者反馈语音命令提取模块已成功获取特定的语音启动指令,并进入实际语音录入状态。
其中,所述预定时间为3~5s。
S20、智能电视端获取具体的语音命令,将原始语音信号转换成语音脉冲序列,并通过语音识别提取语音特征矢量,判断该命令的具体类目,其中,所述类目包括操作指令的直接执行和操作指令通过第二扬声器的询问执行;
其中,图2所示,所述步骤S20包括
S21、智能电视端在预定时间内采集语音命令,语音命令提取模块将原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量;
S22、语音命令识别模块对标准语音特征矢量进行执行关键词的提取;
S23、判断执行关键词是否与预设字段完全符合,完全符合,则直接执行对应字段号的控制命令;不完全符合,则按照设定的信息提示通过第二扬声器向操作者询问,待采集操作者再次下达语音命令。
需要说明的是,语音命令识别模块进行执行关键词的提取是将获取的标准语音特征矢量与语音模板库中的预设字段模型进行比较,获取最佳标准特征矢量,即将原始语音信息的关键词处理后与预设字段模型参数评估后获取最佳匹配;一般的,经该处理后的最佳标准特征矢量即为执行关键词。
在执行方案中,所述执行关键词包括动作和对象,所述动作为各个指令的执行动作,如“播放”“打开”“调高”“调低”“关掉”“切换”等等;所述对象为动作执行的对象,包括节目名称、节目指南界面以及设置中各项功能名称,如“三国演义”“开国大典”“BBC纪录片”“电视剧”“动画片”“儿童剧”“音量”“亮度”“主界面”“电视剧界面”等等。
所述执行关键词包括动作和对象,所述动作为各个指令的执行动作,所述对象为动作执行的对象,包括节目资源名称、节目指南界面以及设置中各项功能名称。图3示出了执行关键词的具体操作步骤。
判断执行关键词时,动作和对象与预设字段均符合预设字段时,即为完全符合;其中,当仅所述动作符合预设字段,且对象判断为节目资源名称时,智能电视端根据最新语音模板库中的节目资源标准信息,寻找对应的节目资源。
如与最新语音模板库的节目资源获得最佳匹配,即获得语音识别的最佳结果,根据该结果输出相应的控制信号。
如与最新语音模板库的节目资源无法获得最佳匹配,则对原节目资源名称的标准语音特征矢量进行二次匹配,根据二次匹配判断是否有该节目的关联性资源,如有,则进行关联性大小排列,并通过第二扬声器询问操作者是否播放关联性最大的节目;如无,则通过外网搜索相关的节目资源,同时获取对应的节目资源播放许可的信息,通过第二扬声器将搜索信息告知操作者;其中,所述搜索信息包括节目名称、来源、是否可播放。
需要说明的是,智能电视端的语音模板库与节目资源同步更新,即当智能电视端上传有新的节目资源时,相应的节目资源名称即录入语音模板库;当智能电视端将原有的节目资源删除时,相应的节目资源名称从语音模板库中删除。
例如,动作为“播放”,节目资源名称为“芈月传奇”,智能电视端将“芈月传奇”与最新语音模板库中的节目资源标准信息进行匹配;最新语音模板库的节目资源中含有“芈月传”的资源信息,即获得最佳匹配,为语音识别的最佳结果,根据该结果输出相应的控制信号,即直接播放芈月传的资源。又如,动作为“播放”,节目资源名称为“西游记86版”,最新语音模板库的节目资源中不含有“西游记86版”的资源信息,则进行关联性大小搜索,搜索结果有“新西游记”“西游降魔”,并且“新西游记”关联性更大,则智能电视通过第二扬声器询问操作者是否播放“新西游记”。
在一些实施例中,所述执行关键词中的动作还包括“推荐”“介绍”及其同义词,对象还包括节目类别,所述节目类别包括电视剧、电影、纪录片、体娱节目、动画片、直播频道、网络剧以及小视频,如图4所示。
智能电视端预先通过各个节目类别的历史播放记录判断用户的喜好程度,在获取“推荐”指令时,根据具体的节目类别获取用户喜好程度更大的相关节目,通过第二扬声器询问操作者是否播放;如智能电视端无法判断用户对某类节目的喜好程度,则通过网络连接获取社交平台中相应类别节目推荐力度较大的节目,通过第二扬声器询问操作者是否播放。
例如,操作者发出“推荐一部电视剧”的指令,语音命令提取模块获得的对象项目为“电视剧”,智能电视端预先通过历史播放记录获取用户对具体类型的电视剧的喜好程度,将判断获得的喜好程度最佳的电视剧推送给操作者,并询问“是否播放”,操作者下达“是”的命令后即执行相应的电视剧播放。又如,此前的电视机并未播放过纪录片影片,操作者发出“推荐一部纪录片影片”的指令时,语音命令提取模块获得的对象项目为“纪录片”,智能电视端无法通过历史播放记录获取用户对具体类型的电视剧的喜好程度,此时则通过网络连接获取社交平台中相应类别节目推荐力度较大的节目,在所述推荐力度较大的节目中又以包含在当前电视机节目列表的节目为优先推荐,并询问“是否播放”,操作者下达“是”的命令后即执行相应的纪录片播放。
还需要说明的是,在步骤S20整个操作过程中,智能电视的显示屏持续播放当前节目,且节目声音播放的第一扬声器保持静音或低音状态,从而保证语音命令提取模块能更好地获取目标语音。
S30、根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问。
本发明智能电视的声控选播方法的一个改进方案,所述方法还包括
S1、智能电视端的噪音监测模块随时获取当前环境噪音,并分析当前环境噪音的分贝大小;
S2、音量评估模块评估当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,进一步判断当前第一扬声器播放的音量是否为干扰音量,如是,则降低当前播放节目的第一扬声器音量或调至静音。
所述标准范围按照实际情况进行设定;在智能电视端播放节目情况下,噪音监测模块实时对周围环境音进行监测,在噪音分贝值超出设定的标准范围同时,判断当前节目的音量大小,如当前节目音量大小对所述“环境噪音”造成干扰,则通过选播控制模块降低第一扬声器音量或调至静音,从而避免对人们交流声音的干扰。
图5为本发明智能电视的声控选播系统的一种实施方式,所述系统至少包括设于智能电视端的语音命令提取模块1、语音前级处理模块2、语音命令识别模块3、语音提示模块4、语音输出模块5、选播控制模块6以及扬声器协调模块7。
语音命令提取模块1配置为在电视话音及其他噪音背景下,识别特定的语音启动指令,且在语音指令启动后,在低分贝噪音下完全提取操作者的语音命令信息。
语音前级处理模块2用于将获取的原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量。
语音命令识别模块3采用语音信号识别集成的专用语音芯片,对标准语音特征矢量进行特征提取和最佳特征矢量匹配,获取语音识别的结果。
所述语音命令识别模块3具体包括关键词提取单元30、关键词类目分析单元31、预设字段比对单元32以及预设字段存储单元33;所述关键词提取单元30用于对语音内容的分段、停词,获取动作和对象相关的词语;所述关键词类目分析单元31用于识别关键词的具体类目,判断其是操作指令的直接执行还是操作指令通过第二扬声器的询问执行;所述预设字段比对单元32将获取的动作和对象相关的词语与预先建立的语音字段的具体进行比对,获取相应的控制对象和控制命令;所述预设字段存储单元33用于对预设的语音字段的存储。
语音提示模块4根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问。
语音输出模块5在所述关键词类目分析单元31判断得关键词的具体类目属于询问执行时,通过第二扬声器向操作者发出询问。
选播控制模块6根据所述语音命令识别模块3获取的控制对象和控制命令,执行相应的调出界面、播放视频或其他设置操作。
扬声器协调模块7配置为在获取特定的语音启动指令后,开始降低当前播放节目的第一扬声器音量或调至静音;并在预定时间内,未检测到具体的语音命令时,调回当前播放节目的扬声器音量,继续播放。
其中,所述第一扬声器和第二扬声器与所述语音命令提取模块的送话器分别设于智能电视的两端。
图6示出了本发明智能电视的声控选播系统的另一种实施方式,在系统上述技术方案基础上,系统还包括资源推荐模块8、指示灯控制模块9、噪音监测模块10和音量评估模块11。
所述资源推荐模块8包括喜好资源推荐单元80和平台资源推荐单元81,所述喜好资源推荐单元80根据各个节目类别的历史播放记录判断用户的喜好程度;所述平台资源推荐单元81通过网络连接获取社交平台中相应类别节目推荐力度较大的节目。
所述指示灯控制模块9配置为智能电视端获取特定的语音指令后,触发指示灯闪烁命令,设于智能电视边框侧的指示灯闪烁1~2s。
所所述噪音监测模块10被配置为监测当前环境噪音音量;所述音量评估模块11,用于对接收的环境噪音音量大小进行评估,并判断当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,则通过选播控制模块6降低当前播放节目的第一扬声器音量或调至静音。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种智能电视的声控选播方法,所述方法至少包括
S10、智能电视端语音命令提取模块获取特定的语音启动指令,开始降低当前播放节目的第一扬声器音量或调至静音,在预定时间内,智能电视端检测是否有具体的语音命令,如有,则至S20;如无,则调回当前播放节目的扬声器音量,继续播放;
S20、智能电视端获取具体的语音命令,将原始语音信号转换成语音脉冲序列,并通过语音识别提取语音特征矢量,判断该命令的具体类目,获取最终的语音识别结果;其中,所述类目包括操作指令的直接执行和操作指令通过第二扬声器的询问执行;具体包括:
智能电视端在预定时间内采集语音命令,语音命令提取模块将原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量;
语音命令识别模块对标准语音特征矢量进行执行关键词的提取;
判断执行关键词是否与预设字段完全符合,完全符合,则直接执行对应字段号的控制命令;不完全符合,则按照设定的信息提示通过第二扬声器向操作者询问,待采集操作者再次下达语音命令;
其中,所述执行关键词包括动作和对象,所述动作为各个指令的执行动作,所述对象为动作执行的对象,包括节目资源名称、节目指南界面以及设置中各项功能名称;
判断执行关键词时,动作和对象与预设字段均符合预设字段时,即为完全符合;其中,当仅所述动作符合预设字段,且对象判断为节目资源名称时,智能电视端根据最新语音模板库中的节目资源标准信息,寻找对应的节目资源;
如与最新语音模板库的节目资源获得最佳匹配,即获得语音识别的最佳结果,根据该结果输出相应的控制信号;
如与最新语音模板库的节目资源无法获得最佳匹配,则对原节目资源名称的标准语音特征矢量进行二次匹配,根据二次匹配判断是否有该节目的关联性资源,如有,则进行关联性大小排列,并通过第二扬声器询问操作者是否播放关联性最大的节目;如无,则通过外网搜索相关的节目资源,同时获取对应的节目资源播放许可的信息,通过第二扬声器将搜索信息告知操作者;其中,所述搜索信息包括节目名称、来源、是否可播放;
S30、根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问;
所述方法还包括
S1、智能电视端的噪音监测模块随时获取当前环境噪音,并分析当前环境噪音的分贝大小;
S2、音量评估模块评估当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,进一步判断当前第一扬声器播放的音量是否为干扰音量,如是,则降低当前播放节目的第一扬声器音量或调至静音。
2.如权利要求1所述的智能电视的声控选播方法,其特征在于,所述执行关键词中的动作还包括“推荐”及其同义词,对象还包括节目类别,所述节目类别包括电视剧、电影、纪录片、体娱节目、动画片、直播频道、网络剧以及小视频;
智能电视端预先通过各个节目类别的历史播放记录判断用户的喜好程度,在获取“推荐”指令时,根据具体的节目类别获取用户喜好程度更大的相关节目,通过第二扬声器询问操作者是否播放;如智能电视端无法判断用户对某类节目的喜好程度,则通过网络连接获取社交平台中相应类别节目推荐力度较大的节目,通过第二扬声器询问操作者是否播放。
3.如权利要求1所述的智能电视的声控选播方法,其特征在于,所述步骤S10中,所述智能电视端获取特定的语音指令后,触发指示灯闪烁命令,设于智能电视边框侧的指示灯闪烁1~2s;
所述特定的语音启动指令可以通过系统设置进行个性化设定,或者采用默认的特定语音。
4.如权利要求1所述的智能电视的声控选播方法,其特征在于,所述预定时间为3~5s,在预定时间内检测有具体的语音命令时,在步骤S20操作过程中,智能电视的显示屏持续播放当前节目,且节目声音播放的第一扬声器保持静音或低音状态。
5.一种应用于权利要求1所述方法的智能电视的声控选播系统,其特征在于,所述系统至少包括设于智能电视端的
语音命令提取模块(1),配置为在电视话音及其他噪音背景下,识别特定的语音启动指令,且在语音指令启动后,在低分贝噪音下完全提取操作者的语音命令信息;
语音前级处理模块(2),用于将获取的原始语音信号转换成语音脉冲序列,并滤除干扰信号,提取语音特征矢量并转化成标准语音特征矢量;
语音命令识别模块(3),采用语音信号识别集成的专用语音芯片,对标准语音特征矢量进行特征提取和最佳特征矢量匹配,获取语音识别的结果;
所述语音命令识别模块(3)具体包括关键词提取单元(30)、关键词类目分析单元(31)、预设字段比对单元(32)以及预设字段存储单元(33);所述关键词提取单元(30)用于对语音内容的分段、停词,获取动作和对象相关的词语;所述关键词类目分析单元(31)用于识别关键词的具体类目,判断其是操作指令的直接执行还是操作指令通过第二扬声器的询问执行;所述预设字段比对单元(32)将获取的动作和对象相关的词语与预先建立的语音字段的具体进行比对,获取相应的控制对象和控制命令;所述预设字段存储单元(33)用于对预设的语音字段的存储;
语音提示模块(4),根据语音识别的结果输出相应的控制信号或向操作者进行当前状态的说明和询问;
语音输出模块(5),在所述关键词类目分析单元(31)判断得关键词的具体类目属于询问执行时,通过第二扬声器向操作者发出询问;
选播控制模块(6),根据所述语音命令识别模块(3)获取的控制对象和控制命令,执行相应的调出界面、播放视频或其他设置操作;
扬声器协调模块(7),配置为在获取特定的语音启动指令后,开始降低当前播放节目的第一扬声器音量或调至静音;并在预定时间内,未检测到具体的语音命令时,调回当前播放节目的扬声器音量,继续播放;
其中,所述第一扬声器和第二扬声器与所述语音命令提取模块的送话器分别设于智能电视的两端。
6.如权利要求5所述的智能电视的声控选播系统,其特征在于,所述系统还包括资源推荐模块(8)和指示灯控制模块(9);
所述资源推荐模块(8)包括喜好资源推荐单元(80)和平台资源推荐单元(81),所述喜好资源推荐单元(80)根据各个节目类别的历史播放记录判断用户的喜好程度;所述平台资源推荐单元(81)通过网络连接获取社交平台中相应类别节目推荐力度较大的节目;
所述指示灯控制模块(9)配置为智能电视端获取特定的语音指令后,触发指示灯闪烁命令,设于智能电视边框侧的指示灯闪烁1~2s。
7.如权利要求5所述的智能电视的声控选播系统,其特征在于,所述系统还包括噪音监测模块(10)和音量评估模块(11);
所述噪音监测模块(10)被配置为监测当前环境噪音音量;所述音量评估模块(11),用于对接收的环境噪音音量大小进行评估,并判断当前环境噪音的分贝大小是否超出标准范围,如超出标准范围的上限,则通过选播控制模块(6)降低当前播放节目的第一扬声器音量或调至静音。
CN201711352347.2A 2017-12-15 2017-12-15 智能电视的声控选播方法、声控选播系统 Active CN107958668B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711352347.2A CN107958668B (zh) 2017-12-15 2017-12-15 智能电视的声控选播方法、声控选播系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711352347.2A CN107958668B (zh) 2017-12-15 2017-12-15 智能电视的声控选播方法、声控选播系统

Publications (2)

Publication Number Publication Date
CN107958668A CN107958668A (zh) 2018-04-24
CN107958668B true CN107958668B (zh) 2022-04-19

Family

ID=61957798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711352347.2A Active CN107958668B (zh) 2017-12-15 2017-12-15 智能电视的声控选播方法、声控选播系统

Country Status (1)

Country Link
CN (1) CN107958668B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019188723A (ja) * 2018-04-26 2019-10-31 京セラドキュメントソリューションズ株式会社 画像処理装置、動作制御方法
CN109451338A (zh) * 2018-12-12 2019-03-08 央广视讯传媒股份有限公司 一种语音遥控电视的方法、装置、电子设备及可读介质
CH716065A1 (de) * 2019-04-03 2020-10-15 Jk Holding Gmbh Vorrichtung zum Einwirken auf zumindest Teile eines Körpers.
CN112053696A (zh) * 2019-06-05 2020-12-08 Tcl集团股份有限公司 一种语音交互的方法、装置及终端设备
CN110265015A (zh) * 2019-06-24 2019-09-20 付金龙 一种通过语音控制音量的方法、系统及翻译机
CN112333532A (zh) * 2020-07-30 2021-02-05 深圳Tcl新技术有限公司 基于语义的播放节目方法、装置、终端及可读存储介质
CN113301415A (zh) * 2021-04-30 2021-08-24 当趣网络科技(杭州)有限公司 适于视频播放状态下的语音搜索方法
CN114025214A (zh) * 2021-09-27 2022-02-08 北京智象信息技术有限公司 一种基于电视操作系统的近场语音识别方法及系统
CN116095377A (zh) * 2022-12-30 2023-05-09 无锡威达智能电子股份有限公司 一种基于语音识别的遥控器控制方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009204732A (ja) * 2008-02-26 2009-09-10 Toshiba Corp 音声認識装置、音声認識辞書作成方法およびプログラム
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备
CN104660655A (zh) * 2013-11-25 2015-05-27 腾讯科技(上海)有限公司 一种对终端进行控制的方法、装置及系统
CN106650359A (zh) * 2016-12-30 2017-05-10 中广热点云科技有限公司 一种用于对象信息采集和信息匹配的系统及方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1893593A (zh) * 2005-07-01 2007-01-10 汤京乐 语音识别与通信技术结合的选台及选节目的电视遥控器
JP2007324866A (ja) * 2006-05-31 2007-12-13 Funai Electric Co Ltd 電子機器及びテレビ受像機
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
CN103024581A (zh) * 2012-12-26 2013-04-03 Tcl集团股份有限公司 智能电视及其节目交互实现方法、系统
CN103108233A (zh) * 2013-01-22 2013-05-15 广东星海数字家庭产业技术研究院有限公司 一种高清互动电影播放系统及实现方法
CN104469455B (zh) * 2014-11-29 2018-01-02 福建捷联电子有限公司 一种智能手持终端遥控智能电视机的装置及其控制方法
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN106227498A (zh) * 2016-07-21 2016-12-14 乐视控股(北京)有限公司 一种语音控制的方法和装置
CN106454431B (zh) * 2016-10-14 2017-09-05 合肥工业大学 电视节目推荐方法和系统
CN106921913A (zh) * 2017-05-03 2017-07-04 成都星火聚点科技有限公司 一种智能音乐播放装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009204732A (ja) * 2008-02-26 2009-09-10 Toshiba Corp 音声認識装置、音声認識辞書作成方法およびプログラム
CN103425668A (zh) * 2012-05-16 2013-12-04 联想(北京)有限公司 信息检索方法及电子设备
CN104660655A (zh) * 2013-11-25 2015-05-27 腾讯科技(上海)有限公司 一种对终端进行控制的方法、装置及系统
CN106650359A (zh) * 2016-12-30 2017-05-10 中广热点云科技有限公司 一种用于对象信息采集和信息匹配的系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Technology to control volume balance between voices and background sounds for TV products based on sound source separation technology;Tadashi, A 等;《Toshiba Leading Innovation》;20140601;第69卷(第6期);第52-57页 *
基于智能电视非特定语音控制系统的设计;王森 等;《信息技术》;20170625(第6期);第58-61页 *

Also Published As

Publication number Publication date
CN107958668A (zh) 2018-04-24

Similar Documents

Publication Publication Date Title
CN107958668B (zh) 智能电视的声控选播方法、声控选播系统
US20200211559A1 (en) Apparatus, system, and method for generating voice recognition guide by transmitting voice signal data to a voice recognition server which contains voice recognition guide information to send back to the voice recognition apparatus
KR102304052B1 (ko) 디스플레이 장치 및 그의 동작 방법
US20240046934A1 (en) Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof
US20140195230A1 (en) Display apparatus and method for controlling the same
KR20140092634A (ko) 전자장치와 그 제어방법
US20070216538A1 (en) Method for Controlling a Media Content Processing Device, and a Media Content Processing Device
JP2007215046A (ja) 情報処理装置、情報処理方法、情報処理プログラム、および記録媒体
CN106686442A (zh) 电视节目搜索方法及装置
KR20190051379A (ko) 전자 장치 및 그 제어 방법
KR102384209B1 (ko) 전자 장치 및 이의 제어 방법
CN112567757A (zh) 具备通知功能的电子装置及电子装置的控制方法
KR102460927B1 (ko) 음성인식 시스템, 음성인식 서버 및 디스플레이장치의 제어방법
EP2926548A1 (en) Method and device for selecting a desirable channel when powered-on
CN112866793A (zh) 一种媒体模式切换方法、装置、设备和存储介质
KR102237832B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR102420155B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR102667407B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR20190140890A (ko) 디스플레이 장치 및 디스플레이 장치의 제어 방법
KR20040059224A (ko) 음성 입력 리모컨을 이용한 방송 컨텐츠 검색 시스템 및방법
WO2021004309A1 (zh) 电子设备及检索服务选定方法
KR102379049B1 (ko) 서버 및 그의 제어 방법
KR102118195B1 (ko) 서버 및 그의 제어 방법
KR20200062156A (ko) 서버 및 그의 제어 방법
KR101001000B1 (ko) 시각장애자를 위한 선호채널 서비스 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant