CN104363517B - 基于电视场景及语音助手的语音切换方法及系统 - Google Patents

基于电视场景及语音助手的语音切换方法及系统 Download PDF

Info

Publication number
CN104363517B
CN104363517B CN201410634253.4A CN201410634253A CN104363517B CN 104363517 B CN104363517 B CN 104363517B CN 201410634253 A CN201410634253 A CN 201410634253A CN 104363517 B CN104363517 B CN 104363517B
Authority
CN
China
Prior art keywords
information
software
scene
voice
voice assistant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410634253.4A
Other languages
English (en)
Other versions
CN104363517A (zh
Inventor
黄海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201410634253.4A priority Critical patent/CN104363517B/zh
Publication of CN104363517A publication Critical patent/CN104363517A/zh
Application granted granted Critical
Publication of CN104363517B publication Critical patent/CN104363517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及基于电视场景及语音助手的语音切换方法及系统,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由电视播放软件进行切换执行。本发明基于电视场景及语音助手的语音切换方法及系统,根据电视的实时场景信息进行对其进行操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件分开独立运行,可以一个语音助手与多个电视播放软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。

Description

基于电视场景及语音助手的语音切换方法及系统
技术领域
本发明涉及一种语音切换方法及系统,尤其涉及一种基于电视场景及语音助手的语音切换方法及系统。
背景技术
尽管智能手机、网络等新兴科技大大改变了人们的生产和生活,但在家庭中,电视还是具有不可取代的信息传输地位。随着科技的发展,电视技术也得到了长足的发展,目前电视发展到智能化阶段,智能电视越来越广泛应用到人们生活中。随着语音技术的发展,语音电视也越来越走近人们的生活。目前在语音电视通常采用在电视播放模块中内嵌语音软件进行语音控制操作,多数只能进行具体操作项目进行操作,由于场景信息是根据电视软件的实时运行而变化,因此,现有内嵌操作不能针对电视的实时场景信息进行对其进行操作和使用。另外,对于在智能电视平台装载多个电视播放软件,则每个电视播放软件均进行复杂的语音内嵌开发才能进行使用,同时,在软件进行加载时,会占用大量的内存,特别是同时加载几个电视播放软件时,需要大量的内存资源,影响系统的运行效果。随着语音识别的程度越来越高,语音引擎也越来越庞大,语音控制也越来越智能化,这需要语音引擎本身不断的更新和发展,语音内嵌显然大大限制了语音控制的发展。
发明内容
本发明解决的技术问题是:构建一种基于电视场景及语音助手的语音切换方法及系统,克服现有技术不能针对电视的实时场景信息进行对其进行操作和使用以及影响系统的运行效果,限制语音控制在电视上的发展的技术问题。
本发明的技术方案是:提供一种基于电视场景及语音助手的语音切换方法,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,语音切换方法包括如下步骤:
获取场景信息:所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的场景元素信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景状态模板的信息对应的项目。
本发明的进一步技术方案是:所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接或者所述电视播放软件和所述语音助手通过专有协议建立通信连接。
本发明的进一步技术方案是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
本发明的技术方案是:构建一种基于电视场景及语音助手的语音切换系统,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述电视播放软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、切换模块,所述语音助手包括获取所述电视播放软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述电视播放软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的场景元素信息传送到所述电视播放软件,所述切换模块切换到所述场景元素信息对应的项目;若所述电视播放软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,所述切换模块切换到所述场景状态模板的信息对应的项目。
本发明的进一步技术方案是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述电视播放软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
本发明的技术效果是:构建一种基于电视场景及语音助手的语音切换方法及系统,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手将匹配的场景元素信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景状态模板的信息对应的项目。本发明基于电视场景及语音助手的语音切换方法及系统,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由电视播放软件进行切换操作。本发明基于电视场景及语音助手的语音切换方法及系统,根据电视的实时场景信息进行对其进行切换操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件分开独立运行,可以一个语音助手与多个电视播放软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
附图说明
图1为本发明的结构示意图。
图2为本发明的优选实施方式结构示意图。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实施方式是:提供一种基于电视场景及语音助手的语音切换方法,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,语音切换方法包括如下步骤:
获取场景信息:所述语音助手2获取所述电视播放软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息。
具体实施过程如下:所述语音助手2获取所述电视播放软件1运行的场景信息方式包括两种方式:一种方式是所述电视播放软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述电视播放软件1采集的场景信息,由所述电视播放软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景元素信息或场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
输入语音:所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换。
具体实施过程如下:通过外部语音输入设备输入语音信息,所述语音助手2采集所述语音信息,然后对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
匹配执行:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件1运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,则所述语音助手2将匹配的场景元素信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景状态模板的信息对应的项目。
具体实施过程如下:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述语音助手2将匹配的场景元素信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景元素信息对应的项目。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述电视播放软件1,所述电视播放软件1切换到该“快乐大本营”的节目,再进行选择执行等操作。
所述电视播放软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景状态模板的信息对应的项目并执行。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述语音助手2将“音量加大”发送到所述电视播放软件1,然后所述电视播放软件1切换到音量加大的操作并执行。
如图1所示,本发明的优选实施方式是:所述电视播放软件1和所述语音助手2进行信息传输过程中,所述电视播放软件1和所述语音助手2通过以下两种方式建立通信连接。所述电视播放软件1和所述语音助手2通过所述电视播放软件1的预留接口建立通信连接或者所述电视播放软件1和所述语音助手2通过专有协议建立通信连接。所述语音助手2获取采集运行的场景信息包括两种方式:所述电视播放软件1向所述语音助手2传输或者所述语音助手2直接向所述电视播放软件1采集。针对所述电视播放软件1采集运行的场景信息,所述电视播放软件1与所述语音助手2建立通信连接,然后由所述电视播放软件1将采集的运行场景信息传输到所述语音助手2。所述语音助手2也可以通过所述电视播放软件1预留的接口与所述电视播放软件1建立通信连接,所述语音助手2直接向所述电视播放软件1采集获取所述电视播放软件1的运行场景信息。所述语音助手2根据所述电视播放软件1的预留接口与所述电视播放软件1建立通信连接。目前,大多数软件为一些特殊功能,均预留一些通信接口,比如:一些软件为老人看不清楚而预留进行语音朗读的接口,或者,一些软件为盲人预留的辅助操作接口等。所述语音助手2通过所述电视播放软件1的这些功能接口与所述电视播放软件1建立通信连接。所述语音助手2与所述电视播放软件1通过专有协议建立通信连接。通过构建所述语音助手2与所述电视播放软件1通信的专有协议,实现所述语音助手2与所述电视播放软件1的通信连接。
如图1所示,本发明的优选实施方式是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。具体实施过程如下:所述电视播放软件1为多种独立运行的电视播放软件,所述语音助手2与当前活动的所述电视播放软件1配合工作。若当前环境只有一个所述电视播放软件1运行,则所述语音助手2与当前的所述电视播放软件1配合工作,若当前系统环境有多个所述电视播放软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述电视播放软件1,然后所述语音助手2与当前的所述电视播放软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,可以直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述电视播放软件1,由所述电视播放软件1显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
如图1所示,本发明的具体实施方式是:构建一种基于电视场景及语音助手的语音切换系统,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,所述电视播放软件1包括采集场景信息的采集模块11、与所述语音助手进行通信的通信模块12、切换模块13,所述语音助手2包括获取所述电视播放软件1运行的场景信息的信息获取模块21、采集语音信息的语音采集模块22、进行语音识别转换的语音识别模块23、匹配模块24、传输模块25,所述信息获取模块21获取所述电视播放软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块22采集语音信息,所述语音识别模块23对所述语音信息进行语音识别转换;所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述传输模块25将匹配的场景元素信息传送到所述电视播放软件1,所述切换模块13切换到所述场景元素信息对应的项目;若所述电视播放软件1运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,所述切换模块13切换到所述场景状态模板的信息对应的项目。
如图1所示,本发明的具体实施过程是:所述信息获取模块21获取所述电视播放软件1运行的场景信息方式包括两种方式:一种方式是所述电视播放软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述电视播放软件1采集的场景信息,由所述电视播放软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景元素信息或场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
通过外部语音输入设备输入语音信息,所述语音采集模块22采集所述语音信息,然后语音识别模块23对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述传输模块25将匹配的场景元素信息传送到所述电视播放软件1,由所述切换模块13切换到所述场景元素信息对应的项目。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述电视播放软件1,所述切换模块13切换到该“快乐大本营”的节目,然后由用户进行选择、点击等执行操作。
所述电视播放软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述切换模块13切换到所述场景状态模板的信息对应的项目。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述传输模块25将“音量加大”发送到所述电视播放软件1,然后所述切换模块13切换到音量加大并执行。
如图1所示,本发明的优选实施方式是:所述电视播放软件1包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。具体实施过程如下:所述电视播放软件1为多种独立运行的电视播放软件,所述语音助手2与当前活动的所述电视播放软件1配合工作。若当前环境只有一个所述电视播放软件1运行,则所述语音助手2与当前的所述电视播放软件1配合工作,若当前系统环境有多个所述电视播放软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述电视播放软件1,然后所述语音助手2与当前的所述电视播放软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,由第二信息输出模块26直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述电视播放软件1,由所述第一信息输出模块14显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
本发明的技术效果是:构建一种基于电视场景及语音助手的语音切换方法及系统,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,所述语音助手2获取所述电视播放软件1运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换;所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,由所述语音助手2将匹配的场景元素信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1切换到所述场景状态模板的信息对应的项目。本发明基于电视场景及语音助手2的语音切换方法及系统,所述电视播放软件1与所述语音助手2独立运行,所述语音助手2获取所述电视播放软件1运行的场景信息,所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景元素信息和场景状态信息和语音信息,由电视播放软件1进行切换执行。本发明基于电视场景及语音助手2的语音切换方法及系统,根据电视的实时场景信息进行对其进行操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件1分开独立运行,可以一个语音助手2与多个电视播放软件1配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种基于电视场景及语音助手的语音切换方法,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,其特征在于,所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接,即:所述语音助手通过所述电视播放软件的预留接口采集所述电视播放软件运行的场景信息,所述电视播放软件所述语音助手通过专有协议建立通信连接,即:所述电视播放软件后台采集自身运行的场景信息,由所述电视播放软件传送到所述语音助手完成场景信息的获取,所述场景信息包括场景元素信息或场景状态信息,所述场景元素信息包括运行详情界面呈现的可视信息,运行详情界面的文字信息为最主要的信息,所述场景状态信息主要包括运行界面涉及的操作信息,语音切换方法包括如下步骤:
获取场景信息:所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配切换:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景元素信息与所述语音识别结果相同,则所述语音助手将匹配的场景元素信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件切换到所述场景状态模板的信息对应的项目。
2.根据权利要求1所述基于电视场景及语音助手的语音切换方法,其特征在于,所述电视播放软件和所述语音助手通过专有协议建立通信连接。
3.根据权利要求1所述基于电视场景及语音助手的语音切换方法,其特征在于,所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
4.根据权利要求1所述基于电视场景及语音助手的语音切换方法,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
5.根据权利要求1所述基于电视场景及语音助手的语音切换方法,其特征在于,所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
6.一种基于电视场景及语音助手的语音切换系统,其特征在于,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接或者所述电视播放软件和所述语音助手通过专有协议建立通信连接,所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接,即:所述语音助手通过所述电视播放软件的预留接口采集所述电视播放软件运行的场景信息,所述电视播放软件所述语音助手通过专有协议建立通信连接,即:所述电视播放软件后台采集自身运行的场景信息,由所述电视播放软件传送到所述语音助手完成场景信息的获取,所述场景信息包括场景元素信息或场景状态信息,
所述场景元素信息包括运行详情界面呈现的可视信息,运行详情界面的文字信息为最主要的信息,所述场景状态信息主要包括运行界面涉及的操作信息,所述电视播放软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、切换模块,所述语音助手包括获取所述电视播放软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述电视播放软件运行的场景信息,所述场景信息包括场景元素信息或场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景元素信息与所述语音识别结果在相关信息上相同或相似,所述传输模块将匹配的场景元素信息传送到所述电视播放软件,所述切换模块切换到所述场景元素信息对应的项目;若所述电视播放软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,所述切换模块切换到所述场景状态模板的信息对应的项目。
7.根据权利要求6所述基于电视场景及语音助手的语音切换系统,其特征在于,所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
8.根据权利要求6所述基于电视场景及语音助手的语音切换系统,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
9.根据权利要求8所述基于电视场景及语音助手的语音切换系统,其特征在于,所述电视播放软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
CN201410634253.4A 2014-11-12 2014-11-12 基于电视场景及语音助手的语音切换方法及系统 Active CN104363517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410634253.4A CN104363517B (zh) 2014-11-12 2014-11-12 基于电视场景及语音助手的语音切换方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410634253.4A CN104363517B (zh) 2014-11-12 2014-11-12 基于电视场景及语音助手的语音切换方法及系统

Publications (2)

Publication Number Publication Date
CN104363517A CN104363517A (zh) 2015-02-18
CN104363517B true CN104363517B (zh) 2018-05-11

Family

ID=52530733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410634253.4A Active CN104363517B (zh) 2014-11-12 2014-11-12 基于电视场景及语音助手的语音切换方法及系统

Country Status (1)

Country Link
CN (1) CN104363517B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102390853B1 (ko) * 2015-03-26 2022-04-27 삼성전자주식회사 컨텐츠 제공 방법 및 이를 수행하는 전자 장치
CN106469040B (zh) 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
CN112188254A (zh) * 2020-09-29 2021-01-05 深圳创维-Rgb电子有限公司 基于电视端的视频播放倍速切换处理方法、装置
CN113628622A (zh) * 2021-08-24 2021-11-09 北京达佳互联信息技术有限公司 语音交互方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1968363A (zh) * 2005-11-18 2007-05-23 佳能株式会社 信息处理设备和信息处理方法
CN101516005A (zh) * 2008-02-23 2009-08-26 华为技术有限公司 一种语音识别频道选择系统、方法及频道转换装置
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和系统
CN102802031A (zh) * 2012-07-13 2012-11-28 李映红 针对电视节目的交互系统和方法
CN103227946A (zh) * 2013-04-09 2013-07-31 海信集团有限公司 电视场景切换的方法及电视
CN103472990A (zh) * 2013-08-27 2013-12-25 小米科技有限责任公司 设备控制方法、装置和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120134507A1 (en) * 2010-11-30 2012-05-31 Dimitriadis Dimitrios B Methods, Systems, and Products for Voice Control

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1968363A (zh) * 2005-11-18 2007-05-23 佳能株式会社 信息处理设备和信息处理方法
CN101516005A (zh) * 2008-02-23 2009-08-26 华为技术有限公司 一种语音识别频道选择系统、方法及频道转换装置
CN102395013A (zh) * 2011-11-07 2012-03-28 康佳集团股份有限公司 一种对智能电视机的语音控制方法和系统
CN102802031A (zh) * 2012-07-13 2012-11-28 李映红 针对电视节目的交互系统和方法
CN103227946A (zh) * 2013-04-09 2013-07-31 海信集团有限公司 电视场景切换的方法及电视
CN103472990A (zh) * 2013-08-27 2013-12-25 小米科技有限责任公司 设备控制方法、装置和设备

Also Published As

Publication number Publication date
CN104363517A (zh) 2015-02-18

Similar Documents

Publication Publication Date Title
CN104516709B (zh) 基于软件运行场景及语音助手的语音辅助方法及系统
CN104506944B (zh) 基于电视场景及语音助手的语音交互辅助方法及系统
CN104461446B (zh) 基于语音交互的软件运行方法及系统
CN102196207B (zh) 语音控制电视机的方法、装置和系统
CN110111787A (zh) 一种语义解析方法及服务器
CN104506906B (zh) 基于电视场景元素及语音助手的语音交互辅助方法及系统
CN104363517B (zh) 基于电视场景及语音助手的语音切换方法及系统
CN111628916B (zh) 一种智能音箱与电子设备协作的方法及电子设备
WO2023083262A1 (zh) 基于多设备提供服务的方法、相关装置及系统
CN107170446A (zh) 语义处理服务器及用于语义处理的方法
CN110115835A (zh) 基于Android系统的云游戏运行方法及服务器
CN103353882A (zh) 用于在多媒体系统中提供用户接口服务的装置和方法
CN104506901B (zh) 基于电视场景状态及语音助手的语音辅助方法及系统
CN113497909A (zh) 一种设备交互的方法和电子设备
WO2021244452A1 (zh) 一种多设备交互的方法及系统
CN102929385A (zh) 语音控制应用程序的方法
CN107071541A (zh) 用于外围上下文管理的方法和设备
WO2023005711A1 (zh) 一种服务的推荐方法及电子设备
CN112422514B (zh) 多媒体数据传输方法、装置、智能家居设备及存储介质
CN106166387B (zh) 电子玩具的控制方法、装置和电子玩具
CN105903191A (zh) 跨终端的数据处理方法及系统
CN117221503A (zh) 数字人移动终端全息投影系统
CN115079810A (zh) 信息处理方法与装置、主控设备和受控设备
CN107483993A (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN113784186B (zh) 终端设备、服务器和通信控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant