CN108040264A - 一种用于电视节目选台的音箱语音控制方法及设备 - Google Patents

一种用于电视节目选台的音箱语音控制方法及设备 Download PDF

Info

Publication number
CN108040264A
CN108040264A CN201711083991.4A CN201711083991A CN108040264A CN 108040264 A CN108040264 A CN 108040264A CN 201711083991 A CN201711083991 A CN 201711083991A CN 108040264 A CN108040264 A CN 108040264A
Authority
CN
China
Prior art keywords
speaker
channel
cloud server
sent
audio file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711083991.4A
Other languages
English (en)
Other versions
CN108040264B (zh
Inventor
付丽红
汪洲洋
肖凯祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suning Commerce Group Co Ltd
Original Assignee
Suning Commerce Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suning Commerce Group Co Ltd filed Critical Suning Commerce Group Co Ltd
Priority to CN201711083991.4A priority Critical patent/CN108040264B/zh
Publication of CN108040264A publication Critical patent/CN108040264A/zh
Application granted granted Critical
Publication of CN108040264B publication Critical patent/CN108040264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/239Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
    • H04N21/2393Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4108Peripherals receiving signals from specially adapted client devices characterised by an identification number or address, e.g. local network address
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42221Transmission circuitry, e.g. infrared [IR] or radio frequency [RF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L2012/2847Home automation networks characterised by the type of home appliance used
    • H04L2012/2849Audio/video appliances

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明实施例公开了一种用于电视节目选台的音箱语音控制方法及设备,涉及智能家电技术领域,能够降低音箱的智能化改造成本。本发明包括:接收音箱发送的音频文件,并根据所述音频文件确定操作信息;利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令;将所述操作指令向所述音箱发送,以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。本发明适用于智能家电中的音箱智能化改造。

Description

一种用于电视节目选台的音箱语音控制方法及设备
技术领域
本发明涉及智能家电技术领域,尤其涉及一种用于电视节目选台的音箱语音控制方法及设备。
背景技术
近几年来,智能家电领域中各类产品层出不穷、种类繁多,但是智能家电的主要设计思路依旧是设计一种普通家电产品+智能模块的结合体。这其中,音箱就是对于传统音箱加装智能模块进行升级的产物。
在对音箱进行智能化改造后,也在传统音箱播放、接收声音的基础功能上,借助音箱中的智能模块发展出了语音识别等进阶功能。而业内各大厂商也在不断完善音箱的语音识别功能,从而将音箱作为一种信息输入的端口设备融入智能家居系统。比如:通过增强音箱上的处理芯片,使之能够搭载Alexa、Siri等人工智能并增强语音识别的功能,从而进一步通过音箱控制智能家居系统中其他家电,比如控制灯具、电视、空调的开关。
但是,这类音箱也存在一些缺陷,比如:由于为了搭载Alexa、Siri等人工智能并增强语音识别的功能,需要采用高性能的处理芯片,通常就需要使用与智能手机中相同性能的芯片,使得音箱的成本居高不下。降低了音箱的性价比,且限制了音箱在智能家居领域中的应用范围。
发明内容
本发明的实施例提供一种用于电视节目选台的音箱语音控制方法及设备,能够降低音箱的智能化改造成本。
本实施例中,由云端服务器接收音箱发送的音频文件,并根据所述音频文件确定操作信息;并利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令;之后将所述操作指令向所述音箱发送,以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
本发明实施例提供的用于电视节目选台的音箱语音控制方法及设备,通过云端服务器处理音箱上报的音频文件,并装换为相应的控制信号返回给音箱,再由音箱通过控制信号控制多媒体播放设备,从而降低了音箱对于处理性能的要求,音箱不再需要搭载高性能的处理芯片也能够实现对于多媒体播放设备的控制,最终降低音箱的智能化改造成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1a、图1b、1c为本发明实施例提供的系统架构的一种可能的实现方式的示意图;
图2为本发明实施例提供的云端服务器侧执行的方法流程示意图;
图3、4、5为本发明实施例提供具体实例的交互示意图;
图6为本发明实施例提供的音箱侧执行的方法流程示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本发明实施例具体可以实现在一种如图1a所示的系统中,其中包括:云端服务器、多媒体播放设备、用户终端和音箱。
音箱(或称为音箱),如图1b所示,用于接收用户发出的语音信号(比如:用户说出的话语“开启电视”、“关闭电视”等),当检测到用户的有效语音信号输入后,将采集到的语音转换为音频文件,并上传到云端进行处理;音箱中至少还包括红外发射器,可对外发送不同码值的红外信号。
用户终端具体可以实做成单独一台设备,或整合于各种不同的媒体数据播放系统中,诸如智能手机、平板电脑(Tablet Personal Computer)、膝上型电脑(LaptopComputer)、个人数字助理(personal digital assistant,简称PDA)或可穿戴式设备(Wearable Device)等。用户终端上可以通过安装的应用程序或者APP,用于配置音箱与可控家电设备,比如通过APP配置后的家电设备会建立与注册在云端服务器的用户终端的绑定关系;以及建立多媒体播放设备与音箱的绑定关系。
多媒体播放设备具体指的是各类家电设备,例如可被红外控制的电视、并向、空调等家电设备。多媒体播放设备可以是没有进行过智能化改造的家电设备,这类家电设备通常会配套遥控器,并被固定码值的红外信号控制,若音箱发出的红外信号为相应的码值,则多媒体播放设备显然也会被音箱发出的红外信号控制。多媒体播放设备也可以是进行了智能化改造的智能家电设备,比如:多媒体播放设备中配置了无线通信模块,比如WIFI模块,以及串口模块,在多媒体播放设备的存储器中可以安装操作系统,操作系统用于控制无线通信模块的信息交互。其中,串口模块用于通过现有的串口协议与设备主板进行通信,具体可以由多媒体播放设备的生产商根据多媒体播放设备的具体型号、类型采用现有的串口协议,本地程序也可以由多媒体播放设备的生产商自行编写。
云端服务器:功能如图1c所示,包含语音识别,语义理解,存储/调用用户终端绑定关系,存储/查询不同电视台的频道列表,存储/查询不同设备的红外码。云端服务器具体可以是单独作成的服务器设备,比如:机架式、刀片、塔式或者机柜式的服务器设备,也可以采用工作站、大型计算机等具备较强计算能力硬件设备;也可以是由多个服务器设备组成的服务器集群。云端服务器具体用于进行接入校验,实现用户终端应用与多媒体播放设备的绑定;云端服务器一般被部署在机房中,通过脚本文件处理和分析上下行数据,通过网络连接实现和用户终端以及音箱的通信。
在本实施例中,音箱还通过互联网连接云端服务器,使得多媒体播放设备和用户终端通过音箱与云端服务器进行数据交互,从而实现相应的业务功能,比如接收云端服务器发送的控制信号,并向多媒体播放设备转发该控制信号,其中控制信号具体可以是不同码值的红外信号。
本发明实施例提供一种用于电视节目选台的音箱语音控制方法,具体可以实现在如图1a所示的云端服务器上。如图2所示,该方法包括:
S101、接收音箱发送的音频文件,并根据所述音频文件确定操作信息。
其中,所述音频文件由所述音箱根据所接受到的语音信号生成,所述音箱与云端服务器通过网络连接。音箱接收用户发出的语音信号(比如:用户说出的“开启电视”、“关闭电视”等话语),当检测到用户的有效语音信号输入后,将采集到的语音转换为音频文件,之后音箱再将音频文件向云端服务器发送。操作信息具体可以包括:表示特定意义的关键词或者字符。
S102、利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令。
其中,频道标识可以是电视台的台号,或者其他标识信息。通常的频道标识由当地的管理机构比如广电总局发布,当地用户在选台时,使用的是同一频道标识。比如在南通地区,南通一台的台号为1,中央一套的台号为4;
在控制模板中至少记录了:操作关键词和字符表中的各字符对应的红外指令;以便于云端服务器根据从操作信息中提取的操作关键词和字符查询得到对应的红外指令。操作指令则可以理解为多个红外指令的组合,比如:操作指令为操作关键词“换台”对应的红外指令和字符“02”的对应的红外指令的组合,该操作指令用于控制多媒体播放设备(如智能电视)跳转至台号为02的频道。
S103,将所述操作指令向所述音箱发送。
以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
例如:本实施例应用到电视控制的场景中,通过音箱发送红外码控制电视,如图3所示,红外控制步骤包括了:
用户唤醒音箱,发出语音指令;音箱端收到语音指令后上传到云端服务器,云端服务器完成1)语音识别2)语义解析;若发现为家电设备控制信号,则调用用户已绑定的设备列表,查询该操作信息对应的红外码,如图4所示;若发现为电视控制信号(功能选择指令),则找到EPG(Electronic Program Guide,电子节目指南)频道列表中电视频道,再将电视转为对应台号,最后将台号转化为红外码组合,如图5所示;云端服务器将查询到的红外码发至音箱端;音箱端调用本地的红外发射器发射该红外码;电视设备在收到指令后对应操作。
在目前已有的技术中,音箱难以实现更加精细的操作,用户对家用电器控制依然主要通过遥控器、家用电器上的控制面板。如果遥控器不在用户身边,用户需要花费时间寻找遥控器;而且遥控器控制按键较多,型号规格不统一,操作起来需要花费时间进行学习熟悉相关按键功能。并且,对于音箱的智能化改造的成本也很高,其中,通常都要在音箱上实现人工智能并增强语音识别的功能,需要采用价格昂贵的高性能的处理芯片,并且在实际应用中,由于各大厂商控制标准的不一致问题,往往需要用户购买成套的或者同一品牌的电器。这些缺陷都降低了音箱的性价比,且限制了音箱在智能家居领域中的应用范围。
本发明实施例提供的用于电视节目选台的音箱语音控制方法,通过云端服务器处理音箱上报的音频文件,并装换为相应的控制信号返回给音箱,再由音箱通过控制信号控制多媒体播放设备,从而降低了音箱对于处理性能的要求,音箱不再需要搭载高性能的处理芯片也能够实现对于多媒体播放设备的控制,最终降低音箱的智能化改造成本。
可选的,在本实施例中,还包括:
S104,当所述操作信息中已包括频道标识时,则利用所述操作信息中的频道标识通过控制模板确定操作指令。
例如:用户直接说出了所需电视台的台号。以便于减少操作过程中分析并获取频道标识的过程,提高用户的操作效率。
在本实施例中,提供一种步骤S101的具体实现方式,所述接收音箱发送的音频文件,根据所述音频文件确定操作信息,包括:
对所述音频文件执行语音识别流程,得到语音翻译文本,对所述语音翻译文本执行语义理解流程,得到关键词信息。
根据所述关键词信息生成所述操作信息。
具体的,云端服务器在接收到音频文件之后,可以先对音频文件执行语音识别流程,比如采用现有的ASR技术(Automatic Speech Recognition,自动语音识别技术),将音频文件转换为包含了文字和字符的文本数据(文本数据中包括了表示相应语义的字符串,字符串中具体可以划分出表示不同语义的词组),之后对文本数据执行语义理解流程,比如采用现有的NLU技术(Natural Language Understanding,自然语言理解)从文本数据中提取包含特定含义的关键词和字符。
其中,所述关键词信息包括了:操作关键词、节目关键词和频道关键词中的至少一项。操作关键词具体可以是“换台”、“开启”、“关闭、“待机”、“重复播放”、“回放”等用于表示操作动作的关键词;节目关键词具体可以是“新闻联播”、“XX大本营”等具体节目的名称;频道关键词具体可以是“央视一套”、“纪录片频道”、“北京一台”等电视台/电视频道的名称。由于用户实际说出的,往往包括了具体节目的名称、具体频道的名称或包括具体的频道编号,因此关键词信息中往往包括了上述3中关键词中的至少一项。
S102、利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令。
S103,将所述操作指令向所述音箱发送。
通过不同种类的关键词,生成最终的操作信息,相比单一的操作关键词,比如相对于现有技术中音箱仅通过“开启”、“关闭”控制家电开关的简单控制方式,本实施例中的音箱能够实现更加精细化的控制,尤其是应用在电视机的应用场景中,实现了用户通过发声选台的功能。
具体的,在所述控制模板中至少记录了:操作关键词和字符表中的各字符对应的红外指令。在得到关键词信息之后,还包括:
S105,在所述控制模板中,确定所述关键词信息中的操作关键词对应的红外指令。
在步骤S102中,所述通过控制模板利用所述频道标识生成操作指令,包括:
解析得到所述频道标识中的字符,并通过查询所述控制模板,确定所述频道标识中的字符对应的红外指令。
按照所述频道标识中的字符顺序,组合各字符对应的红外指令。
其中,控制信号具体可以是用于控制多媒体播放设备的红外码,控制模板具体可以是用于控制多媒体播放设备的红外码库,并在云端服务器以关键词-控制信号、或者字符-控制信号的映射表形式存储。云端服务器可以查询控制模板中的语义词组-控制信号的映射表。例如:频道标识为一串数字,比如“096”,则频道标识中的字符为“0”、“9”和“6”,云端服务器依次得到“0”、“9”和“6”对应的红外指令,并组合3个字符对应的红外指令。其中,所谓的“组合”红外指令可以理解为,将各字符对应的红外指令,按照频道标识中的字符顺序,进行简单拼接,以便于音箱可以根据简单拼接的红外指令,生成向多媒体播放设备依次输入“0”、“9”和“6”的控制信号。
利用各字符对应的红外指令的组合结果和操作关键词对应的红外指令,生成所述操作指令。
其中,所生成的操作指令包括了按照频道标识中的字符顺序组合的红外指令,也包括了操作关键词对应的红外指令。
通过不同种类的关键词,生成最终的操作信息,相比单一的操作关键词,比如仅通过“开启”、“关闭”开控制多媒体播放设的开关,本实施例能够实现功能更加多样化地控制方式,并可以实现较为细致的命令输入,比如输入数字和简单字符,也便于设计功能更多、更加复杂的控制方案。
在本实施例中,提供一种步骤S102的具体实现方式,所述利用所述操作信息确定频道标识,包括:
当所述关键词信息中存在频道关键词时,在频道名称-标识列表中,查询所述频道关键词对应的频道标识。
其中,频道名称-标识列表中记录频道名称与频道标识的对应关系。频道名称-标识列表具体可以存储在云端服务器中,由于不同地区的电视台系统和广电系统,对于本地的电视台的编号不一样,因此在云端服务器中可以根据不同地域,维护对应各个地区的频道名称-标识列表,并根据用户的地理位置选择相应的频道名称-标识列表。从而适应不同地区的电视台台号的管理规则。
在本实施例中,若操作信息中存在节目关键词,则说明用户的语音输入中包含了用户所希望观看的节目,云端服务器可以利用频道节目单查询目前正在播放该节目的频道。具体包括:
当所述关键词信息中存在节目关键词时,在频道节目单中,查询当前正在播放所述节目关键词指向的节目的频道名称。之后,通过所述频道名称-标识列表,获取所述查询得到的频道名称对应的频道标识。
其中,云端服务器可以根据从操作信息中提取的节目关键词,比如:用户所需节目的名称,通过节目关键词-频道名称-频道标识的顺序,查询得到频道标识,其中节目关键词与频道名称的对应关系,通常记录在频道节目单(EPG)中,频道节目单可以存储在云端服务器,并根据每天的更新数据实时更新。
频道名称-频道标识的对应关系,记录在频道名称-标识列表中。在云端服务器中可以根据不同地域,维护对应各个地区的频道名称-标识列表,并根据用户的地理位置选择相应的频道名称-标识列表。
云端服务器可以通过频道节目单,查询在播放用户所需节目的频道,并获取频道名称。若有多个频道同时都在播放用户所需节目,则可以随机选择其一、或者选择最早或晚播放该节目的频道。
云端服务器通过节目关键词(比如节目名称),自动为用户查询得到正在播放该节目的频道,避免了用户手动查询,节省了用户的时间精力,也提高了用户的体验度。
可选的,若操作信息中存在节目关键词,则说明用户的语音输入中包含了用户所希望观看的节目,云端服务器可以利用频道节目单查询即将播放该节目的频道。具体包括:
当所述关键词信息中存在节目关键词时,在已播放所述节目关键词指向的节目的频道中,查询播放时间点距离当前时间在第一预设时间范围内的频道名称。通过所述频道名称-标识列表,获取所述查询得到的频道名称对应的频道标识。
其中,第一预设时间范围可以由用户设定,并记录在云端服务器中的用户数据中,例如:用户操作用户设备,设定第一预设时间范围为半小时,则当所述关键词信息中存在节目关键词时,在播放计划中存在所述节目关键词指向的节目的频道中,查询会在半小时内播放用户所需节目的频道。
云端服务器通过节目关键词(比如节目名称),自动为用户查询得到预备播放该节目的频道,避免了用户手动查询,节省了用户的时间精力,也提高了用户的体验度。
可选的,若操作信息中存在节目关键词,则说明用户的语音输入中包含了用户所希望观看的节目,云端服务器可以利用频道节目单查询已经播放该节目的频道。具体包括:
当所述关键词信息中存在节目关键词时,在预备播放所述节目关键词指向的节目的频道中,查询播放时间点距离当前时间在第二预设时间范围内的频道名称。
通过所述频道名称-标识列表,获取所述查询得到的频道名称对应的频道标识。
其中,第二预设时间范围可以由用户设定,并记录在云端服务器中的用户数据中,例如:用户操作用户设备,设定第二预设时间范围为15分钟,则当所述关键词信息中存在节目关键词时,在已播放所述节目关键词指向的节目的频道中,查询已开始播放时间15分钟内的频道。
云端服务器通过节目关键词(比如节目名称),自动为用户查询得到已经播放该节目一定时间的频道,避免了用户手动查询,节省了用户的时间精力。同时,也便于用户使用大多数机顶盒自带的节目回放功能,以便重播所需节目,从而提高了用户的体验度。
在本实施例中,频道名称-标识列表、控制模板等,具体可以由云端服务器在用户绑定账号时设定。以绑定控制模板的流程为例,还包括:
接收用户终端发送的绑定请求,并确定所述绑定请求指向的多媒体播放设备。根据所述绑定请求指向的多媒体播放设备的品类信息和品牌信息,调取控制模板。之后,建立所调取的控制模板与所述音箱之间的对应关系。例如:用户通过智能手机(即用户终端),向云端服务器发送绑定请求,所述绑定请求用于触发云端服务器将所述音箱和多媒体播放设备绑定至用户的账号。
例如,具体可以实现为如图4所示的设备绑定流程,其中:
1、用户在手机APP端发起设备绑定流程,其中,用户的手机作为所述用户终端;
2、APP中提示用户选择对应的品类和品牌;
3、用户选择后,APP调取对应红外控制模板,让用户发送特定指令,该指令会从APP端发送至音箱端,音箱端进而控制红外发射器发出特定红外码。用户反馈是否成功,如果失败,跳至4,否则进入5;
4、重新选择一套控制模板,跳至3;
5、APP向云端服务器发起匹配成功指令,云端服务器记录下这套红外控制模板,即认为该用户帐号下已绑定了这套红外控制模板的设备,其中,在云端服务器中可以预先存储不同类型和型号的多媒体播放设备的红外控制模板,以便于APP调取并执行3至4。
在云端服务器中,可以存储各个品类和品牌的多媒体播放设备的控制模板,并根据绑定请求中记载的品类信息和品牌信息,识别绑定用户账号的多媒体播放设备,并提取相应的控制模板。以便于云端服务器能够支持不同型号和品牌的多媒体播放设备,可以针对不同的用户的不同类型的电器绑定相应的红外码库,解决了各大厂商控制标准的不一致问题,用户不再需要购买成套的或者同一品牌的电器。从而提高了音箱的性价比,扩大了音箱在智能家居领域中的应用范围。
在本实施例中,频道名称-标识列表、控制模板等,具体可以由云端服务器在用户绑定账号时设定。以绑定频道名称-标识列表流程为例,还包括:
接收用户终端发送的绑定请求,并确定所述绑定请求对应的地域标识。之后,获取所述地域标识对应的频道名称-标识列表,并建立所调取的频道名称-标识列表与所述音箱之间的对应关系。
在实际应用中,由于不同省份、地级市等行政区域中,机顶盒都属于当地广电部门管理,不同地域的频道号码(即台号/频道标识)是不一样的。本实施例中,识别机顶盒的地域标识,并根据地域标识获取当地正确的频道顺序。
在云端服务器中,可以存储各个地域标识对应的频道名称-标识列表,并根据绑定请求中记载的地域标识,识别绑定用户账号的多媒体播放设备所在的地域,并提取相应的频道名称-标识列表。以便于云端服务器能够支持不同地域的多媒体播放设备,提高本实施例的使用范围。
可选的,频道名称-标识列表、控制模板等由云端服务器在设定完毕后,可以发送给音箱,并存储在音箱的本地存储器。具体包括:
在建立所调取的控制模板与所述音箱之间的对应关系之后,将所调取的控制模板向所述音箱发送,以便于存储在所述音箱的本地存储器;
和/或,在建立所调取的频道名称-标识列表与所述音箱之间的对应关系之后,将所调取的频道名称-标识列表向所述音箱发送,以便于存储在所述音箱的本地存储器。
以便于音箱也可以在离线状态下,不同过云端服务器也可以实现频道名称-频道标识的查询功能,从而满足用户用语言通过音箱控制多媒体播放设备的需求。
本发明还提供一种用于电视节目选台的音箱语音控制方法,具体可以执行在如图1a所示的音箱上,如图6所示的,其中包括:
S201,采集用户的操作语音,并生成音频文件向云端服务器发送。
S202,接收所述云端服务器发送的操作指令,并利用所述操作指令生成控制信号。
其中,所述操作指令,是由所述云端服务器通过控制模板利用所述频道标识生成的;所述频道标识,是由所述云端服务器通过从所述音频文件中提取的操作信息确定的。
S203,通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
本发明实施例提供的用于电视节目选台的音箱语音控制方法,通过云端服务器处理音箱上报的音频文件,并装换为相应的控制信号返回给音箱,再由音箱通过控制信号控制多媒体播放设备,从而降低了音箱对于处理性能的要求,音箱不再需要搭载高性能的处理芯片也能够实现对于多媒体播放设备的控制,最终降低音箱的智能化改造成本。
可选的,还包括:
接收所述云端服务器发送的控制模板,并存储在所述音箱的本地存储器,所述控制模板中至少记录了:操作关键词和字符表中的各字符对应的红外指令。
和/或,接收所述云端服务器发送的频道名称-标识列表,并存储在所述音箱的本地存储器,所述频道名称-标识列表中记录频道关键词与频道标识之间的对应关系。
以便于音箱也可以在离线状态下,不同过云端服务器也可以实现频道名称-频道标识的查询功能,从而满足用户用语言通过音箱控制多媒体播放设备的需求。
本发明还提供一种云端服务器,该云端服务器可以实现在如图1a所示的系统中,该云端服务器至少包括:
存储模块,其中存储有计算机程序;
处理模块,其被配置为运行所述存储模块中存储的计算机程序,以使得:
接收音箱发送的音频文件,并根据所述音频文件确定操作信息;
利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令;
将所述操作指令向所述音箱发送,以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
本发明实施例提供云端服务器,通过云端服务器处理音箱上报的音频文件,并装换为相应的控制信号返回给音箱,再由音箱通过控制信号控制多媒体播放设备,从而降低了音箱对于处理性能的要求,音箱不再需要搭载高性能的处理芯片也能够实现对于多媒体播放设备的控制,最终降低音箱的智能化改造成本。
本发明还提供一种音箱设备,该音箱设备可以实现在如图1a所示的系统中,该音箱设备至少包括:
音箱外壳、主板、通信模块、红外发射器、扬声器和麦克风,主板设置在音箱外壳中,扬声器和麦克风连接主板;
主板上设置有微控制器(MCU),所述微控制器(MCU)进一步包括:
存储模块,其中存储有计算机程序;
处理模块,其被配置为运行所述存储模块中存储的计算机程序,以使得:
利用所述麦克风采集用户的操作语音,并生成音频文件向云端服务器发送;
利用所述通信模块接收所述云端服务器发送的操作指令,并利用所述操作指令生成控制信号,所述操作指令,是由所述云端服务器通过控制模板利用所述频道标识生成的;所述频道标识,是由所述云端服务器通过从所述音频文件中提取的操作信息确定的;
利用所述红外发射器向多媒体播放设备发送所述控制信号。
本发明实施例提供音箱设备,通过云端服务器处理音箱上报的音频文件,并装换为相应的控制信号返回给音箱,再由音箱通过控制信号控制多媒体播放设备,从而降低了音箱对于处理性能的要求,音箱不再需要搭载高性能的处理芯片也能够实现对于多媒体播放设备的控制,最终降低音箱的智能化改造成本。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种用于电视节目选台的音箱语音控制方法,其特征在于,包括:
接收音箱发送的音频文件,并根据所述音频文件确定操作信息;
利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令;
将所述操作指令向所述音箱发送,以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
2.根据权利要求1所述的方法,其特征在于,还包括:
当所述操作信息中已包括频道标识时,则利用所述操作信息中的频道标识通过控制模板确定操作指令。
3.根据权利要求1所述的方法,其特征在于,所述接收音箱发送的音频文件,根据所述音频文件确定操作信息,包括:
对所述音频文件执行语音识别流程,得到语音翻译文本,对所述语音翻译文本执行语义理解流程,得到关键词信息,所述关键词信息包括了:操作关键词、节目关键词和频道关键词中的至少一项;
根据所述关键词信息生成所述操作信息。
4.根据权利要求3所述的方法,其特征在于,所述利用所述操作信息确定频道标识,包括:
当所述关键词信息中存在频道关键词时,在频道名称-标识列表中,查询所述频道关键词对应的频道标识。
5.根据权利要求1所述的方法,其特征在于,还包括:
接收用户终端发送的绑定请求,并确定所述绑定请求指向的多媒体播放设备;
根据所述绑定请求指向的多媒体播放设备的品类信息和品牌信息,调取控制模板;
建立所调取的控制模板与所述音箱之间的对应关系。
6.根据权利要求5所述的方法,其特征在于,还包括:
在建立所调取的控制模板与所述音箱之间的对应关系之后,将所调取的控制模板向所述音箱发送,以便于存储在所述音箱的本地存储器;
和/或,在建立所调取的频道名称-标识列表与所述音箱之间的对应关系之后,将所调取的频道名称-标识列表向所述音箱发送,以便于存储在所述音箱的本地存储器。
7.一种用于电视节目选台的音箱语音控制方法,其特征在于,包括:
采集用户的操作语音,并生成音频文件向云端服务器发送;
接收所述云端服务器发送的操作指令,并利用所述操作指令生成控制信号,所述操作指令,是由所述云端服务器通过控制模板利用所述频道标识生成的;所述频道标识,是由所述云端服务器通过从所述音频文件中提取的操作信息确定的;
通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
8.根据权利要求7所述的方法,其特征在于,还包括:
接收所述云端服务器发送的控制模板,并存储在所述音箱的本地存储器,所述控制模板中至少记录了:操作关键词和字符表中的各字符对应的红外指令;
和/或,接收所述云端服务器发送的频道名称-标识列表,并存储在所述音箱的本地存储器,所述频道名称-标识列表中记录频道关键词与频道标识之间的对应关系。
9.一种云端服务器,其特征在于,包括:
存储模块,其中存储有计算机程序;
处理模块,其被配置为运行所述存储模块中存储的计算机程序,以使得:
接收音箱发送的音频文件,并根据所述音频文件确定操作信息;
利用所述操作信息确定频道标识,并通过控制模板利用所述频道标识生成操作指令;
将所述操作指令向所述音箱发送,以便于所述音箱利用所述操作指令生成控制信号,并通过所安装的红外发射器向多媒体播放设备发送所述控制信号。
10.一种音箱设备,其特征在于,包括:
音箱外壳、主板、通信模块、红外发射器、扬声器和麦克风,主板设置在音箱外壳中,扬声器和麦克风连接主板;
主板上设置有微控制器(MCU),所述微控制器(MCU)进一步包括:
存储模块,其中存储有计算机程序;
处理模块,其被配置为运行所述存储模块中存储的计算机程序,以使得:
利用所述麦克风采集用户的操作语音,并生成音频文件向云端服务器发送;
利用所述通信模块接收所述云端服务器发送的操作指令,并利用所述操作指令生成控制信号,所述操作指令,是由所述云端服务器通过控制模板利用所述频道标识生成的;所述频道标识,是由所述云端服务器通过从所述音频文件中提取的操作信息确定的;
利用所述红外发射器向多媒体播放设备发送所述控制信号。
CN201711083991.4A 2017-11-07 2017-11-07 一种用于电视节目选台的音箱语音控制方法及设备 Active CN108040264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711083991.4A CN108040264B (zh) 2017-11-07 2017-11-07 一种用于电视节目选台的音箱语音控制方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711083991.4A CN108040264B (zh) 2017-11-07 2017-11-07 一种用于电视节目选台的音箱语音控制方法及设备

Publications (2)

Publication Number Publication Date
CN108040264A true CN108040264A (zh) 2018-05-15
CN108040264B CN108040264B (zh) 2021-08-17

Family

ID=62092752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711083991.4A Active CN108040264B (zh) 2017-11-07 2017-11-07 一种用于电视节目选台的音箱语音控制方法及设备

Country Status (1)

Country Link
CN (1) CN108040264B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597514A (zh) * 2018-06-15 2018-09-28 深圳市大地动画传媒有限公司 一种多功能智能学习机
CN108882103A (zh) * 2018-07-18 2018-11-23 北京小米移动软件有限公司 智能音箱、声音采集设备及智能音箱系统
CN110570839A (zh) * 2019-09-10 2019-12-13 中国人民解放军陆军军医大学第一附属医院 基于人机交互的智能监护系统
CN110989408A (zh) * 2019-12-09 2020-04-10 深圳市康冠商用科技有限公司 一种设备控制方法、装置、设备及可读存储介质
CN111009112A (zh) * 2019-12-24 2020-04-14 杭州涂鸦信息技术有限公司 一种基于音频设备的红外控制方法及其系统和装置
CN111935523A (zh) * 2020-08-17 2020-11-13 百度在线网络技术(北京)有限公司 频道控制方法、装置、设备及存储介质
CN112153440A (zh) * 2020-10-10 2020-12-29 Vidaa美国公司 一种显示设备及显示系统
CN112152890A (zh) * 2019-06-28 2020-12-29 海信视像科技股份有限公司 一种基于智能音箱的控制系统及方法
CN113115084A (zh) * 2020-01-13 2021-07-13 百度在线网络技术(北京)有限公司 电视频道的控制方法、装置、设备及存储介质
CN116170482A (zh) * 2023-02-20 2023-05-26 上汽通用五菱汽车股份有限公司 一种生态设备控制方法、车载生态网关和车辆

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964842A (zh) * 2010-09-13 2011-02-02 复旦大学 一种基于手机终端的自组织视频同步分享播放器
CN102868764A (zh) * 2012-10-02 2013-01-09 马青川 一种基于云计算的由不独立专用终端构成的个人信息系统
CN103200461A (zh) * 2013-01-14 2013-07-10 易程(苏州)智能系统有限公司 一种多台播放终端同步播放系统及播放方法
CN103248939A (zh) * 2012-02-03 2013-08-14 海尔集团公司 一种实现多屏同步显示的方法及系统
CN104754372A (zh) * 2014-02-26 2015-07-01 苏州乐聚一堂电子科技有限公司 同步节拍特效系统及同步节拍特效处理方法
CN104951077A (zh) * 2015-06-24 2015-09-30 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法、装置和终端设备
US20160334228A1 (en) * 2015-05-13 2016-11-17 Telenav, Inc. Navigation system with output control mechanism and method of operation thereof

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964842A (zh) * 2010-09-13 2011-02-02 复旦大学 一种基于手机终端的自组织视频同步分享播放器
CN103248939A (zh) * 2012-02-03 2013-08-14 海尔集团公司 一种实现多屏同步显示的方法及系统
CN102868764A (zh) * 2012-10-02 2013-01-09 马青川 一种基于云计算的由不独立专用终端构成的个人信息系统
CN103200461A (zh) * 2013-01-14 2013-07-10 易程(苏州)智能系统有限公司 一种多台播放终端同步播放系统及播放方法
CN104754372A (zh) * 2014-02-26 2015-07-01 苏州乐聚一堂电子科技有限公司 同步节拍特效系统及同步节拍特效处理方法
US20160334228A1 (en) * 2015-05-13 2016-11-17 Telenav, Inc. Navigation system with output control mechanism and method of operation thereof
CN104951077A (zh) * 2015-06-24 2015-09-30 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法、装置和终端设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597514A (zh) * 2018-06-15 2018-09-28 深圳市大地动画传媒有限公司 一种多功能智能学习机
CN108882103A (zh) * 2018-07-18 2018-11-23 北京小米移动软件有限公司 智能音箱、声音采集设备及智能音箱系统
CN112152890A (zh) * 2019-06-28 2020-12-29 海信视像科技股份有限公司 一种基于智能音箱的控制系统及方法
CN110570839A (zh) * 2019-09-10 2019-12-13 中国人民解放军陆军军医大学第一附属医院 基于人机交互的智能监护系统
CN110989408A (zh) * 2019-12-09 2020-04-10 深圳市康冠商用科技有限公司 一种设备控制方法、装置、设备及可读存储介质
CN111009112A (zh) * 2019-12-24 2020-04-14 杭州涂鸦信息技术有限公司 一种基于音频设备的红外控制方法及其系统和装置
CN111009112B (zh) * 2019-12-24 2021-04-27 杭州涂鸦信息技术有限公司 一种基于音频设备的红外控制方法及其系统和装置
CN113115084A (zh) * 2020-01-13 2021-07-13 百度在线网络技术(北京)有限公司 电视频道的控制方法、装置、设备及存储介质
CN111935523A (zh) * 2020-08-17 2020-11-13 百度在线网络技术(北京)有限公司 频道控制方法、装置、设备及存储介质
CN111935523B (zh) * 2020-08-17 2022-07-22 百度在线网络技术(北京)有限公司 频道控制方法、装置、设备及存储介质
CN112153440A (zh) * 2020-10-10 2020-12-29 Vidaa美国公司 一种显示设备及显示系统
CN112153440B (zh) * 2020-10-10 2023-04-25 Vidaa美国公司 一种显示设备及显示系统
CN116170482A (zh) * 2023-02-20 2023-05-26 上汽通用五菱汽车股份有限公司 一种生态设备控制方法、车载生态网关和车辆

Also Published As

Publication number Publication date
CN108040264B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN108040264A (zh) 一种用于电视节目选台的音箱语音控制方法及设备
CN102572569B (zh) 机顶盒、互联网电视及智能控制信号的处理方法
CN105392035A (zh) 一种智能电视机播放节目切换系统及方法
CN105025051A (zh) 一种云端语音服务提供方法和系统
CN103634644A (zh) 通过语音进行智能电视频道切换的方法和系统
CN102833582B (zh) 采用语音搜索音视频资源的方法
CN102130900A (zh) 一种三屏互动的实现方法及装置
CN103517135B (zh) 一种连续播放mp4格式视频文件的方法、系统及电视
CN108932948A (zh) 音频数据处理方法、装置、计算机设备和计算机可读存储介质
CN110333840A (zh) 推荐方法、装置、电子设备和存储介质
CN103208285A (zh) 基于移动通讯终端语音交互的家电控制方法及系统
CN105846865A (zh) 用于蓝牙音频传输的方法、设备和系统
CN110139127A (zh) 音频文件播放方法、服务器、智能音箱及播放系统
CN103269450B (zh) 一种面向Android智能电视的多媒体系统
CN106533511A (zh) 一种智能蓝牙通信方法和智能蓝牙系统
CN102298590A (zh) 家庭互联信息显示系统和方法、及显示终端和服务器
CN104796738A (zh) 信息联动方法、装置、服务端和系统
CN104866650A (zh) 一种创建抽象设备的方法和装置
CN107483993A (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN105721672B (zh) 一种智能手机与原车主机的双屏互控方法及其系统
CN202503622U (zh) 机顶盒、互联网电视及智能控制信号的处理系统
CN110278480A (zh) 电视机频道预置方法、装置、计算机设备及可读存储介质
CN102946555B (zh) 一种定向接收数据广播业务的控制方法及系统
CN101959053A (zh) 电视系统及在其上实现电视增值业务的方法
CN105323391A (zh) 一种自动语音菜单播报方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 210000, 1-5 story, Jinshan building, 8 Shanxi Road, Nanjing, Jiangsu.

Applicant after: SUNING GROUP Co.,Ltd.

Address before: 210042 Suning Headquarters, No. 1 Suning Avenue, Xuanwu District, Nanjing City, Jiangsu Province

Applicant before: SUNING COMMERCE GROUP Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant