CN104506901B - 基于电视场景状态及语音助手的语音辅助方法及系统 - Google Patents

基于电视场景状态及语音助手的语音辅助方法及系统 Download PDF

Info

Publication number
CN104506901B
CN104506901B CN201410634286.9A CN201410634286A CN104506901B CN 104506901 B CN104506901 B CN 104506901B CN 201410634286 A CN201410634286 A CN 201410634286A CN 104506901 B CN104506901 B CN 104506901B
Authority
CN
China
Prior art keywords
information
voice
software
scene
voice assistant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410634286.9A
Other languages
English (en)
Other versions
CN104506901A (zh
Inventor
黄海兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201410634286.9A priority Critical patent/CN104506901B/zh
Publication of CN104506901A publication Critical patent/CN104506901A/zh
Application granted granted Critical
Publication of CN104506901B publication Critical patent/CN104506901B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/443OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
    • H04N21/4432Powering on the client, e.g. bootstrap loading using setup parameters being stored locally or received from the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand

Abstract

本发明涉及基于电视场景状态及语音助手的语音辅助方法及系统,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景状态信息和语音信息,由电视播放软件进行操作执行。本发明基于电视场景状态及语音助手的语音辅助方法及系统,根据电视的实时场景信息进行对其进行操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件分开独立运行,可以一个语音助手与多个电视播放软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。

Description

基于电视场景状态及语音助手的语音辅助方法及系统
技术领域
本发明涉及一种语音交互辅助方法及系统,尤其涉及一种基于电视场景状态及语音助手的语音辅助方法及系统。
背景技术
尽管智能手机、网络等新兴科技大大改变了人们的生产和生活,但在家庭中,电视还是具有不可取代的信息传输地位。随着科技的发展,电视技术也得到了长足的发展,目前电视发展到智能化阶段,智能电视越来越广泛应用到人们生活中。随着语音技术的发展,语音电视也越来越走近人们的生活。目前在语音电视通常采用在电视播放模块中内嵌语音软件进行语音控制操作,多数只能进行具体操作项目进行操作,由于场景信息是根据电视软件的实时运行而变化,因此,现有内嵌操作不能针对电视的实时场景信息进行对其进行操作和使用。另外,对于在智能电视平台装载多个电视播放软件,则每个电视播放软件均进行复杂的语音内嵌开发才能进行使用,同时,在软件进行加载时,会占用大量的内存,特别是同时加载几个电视播放软件时,需要大量的内存资源,影响系统的运行效果。随着语音识别的程度越来越高,语音引擎也越来越庞大,语音控制也越来越智能化,这需要语音引擎本身不断的更新和发展,语音内嵌显然大大限制了语音控制的发展。
发明内容
本发明解决的技术问题是:构建一种基于电视场景状态及语音助手的语音辅助方法及系统,克服现有技术不能针对电视的实时场景信息进行对其进行操作和使用以及影响系统的运行效果,限制语音控制在电视上的发展的技术问题。
本发明的技术方案是:提供一种基于电视场景状态及语音助手的语音辅助方法,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件执行所述场景状态模板的信息对应的项目。
本发明的进一步技术方案是:所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接或者所述电视播放软件和所述语音助手通过专有协议建立通信连接。
本发明的进一步技术方案是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
本发明的技术方案是:构建一种基于电视场景状态及语音助手的语音辅助系统,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述电视播放软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述电视播放软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述电视播放软件运行的场景信息,所述场景信息包括场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,所述执行模块执行所述场景状态模板的信息对应的项目。
本发明的进一步技术方案是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
本发明的进一步技术方案是:还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
本发明的进一步技术方案是:所述电视播放软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
本发明的技术效果是:构建一种基于电视场景状态及语音助手的语音辅助方法及系统,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景状态信息;所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件执行所述场景状态模板的信息对应的项目。本发明基于电视场景状态及语音助手的语音辅助方法及系统,所述电视播放软件与所述语音助手独立运行,所述语音助手获取所述电视播放软件运行的场景信息,所述语音助手将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景状态信息和语音信息,由电视播放软件进行操作执行。本发明基于电视场景状态及语音助手的语音辅助方法及系统,根据电视的实时场景信息进行对其进行操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件分开独立运行,可以一个语音助手与多个电视播放软件配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
附图说明
图1为本发明的结构示意图。
图2为本发明的优选实施方式结构示意图。
具体实施方式
下面结合具体实施例,对本发明技术方案进一步说明。
如图1所示,本发明的具体实施方式是:提供一种基于电视场景状态及语音助手的语音辅助方法,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手2获取所述电视播放软件1运行的场景信息,所述场景信息包括场景状态信息。
具体实施过程如下:所述语音助手2获取所述电视播放软件1运行的场景信息方式包括两种方式:一种方式是所述电视播放软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述电视播放软件1采集的场景信息,由所述电视播放软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
输入语音:所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换。
具体实施过程如下:通过外部语音输入设备输入语音信息,所述语音助手2采集所述语音信息,然后对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
匹配执行:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1执行所述场景状态模板的信息对应的项目。
具体实施过程如下:所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配。所述电视播放软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1执行所述场景状态模板的信息对应的项目。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述语音助手2将“音量加大”发送到所述电视播放软件1,然后所述电视播放软件1执行音量加大的操作。
所述场景信息还包括场景元素信息,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述传输模块25将匹配的场景元素信息传送到所述电视播放软件1,由所述执行模块13执行所述场景元素信息对应的项目。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述电视播放软件1,所述执行模块13执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
如图1所示,本发明的优选实施方式是:所述电视播放软件1和所述语音助手2进行信息传输过程中,所述电视播放软件1和所述语音助手2通过以下两种方式建立通信连接。所述电视播放软件1和所述语音助手2通过所述电视播放软件1的预留接口建立通信连接或者所述电视播放软件1和所述语音助手2通过专有协议建立通信连接。所述语音助手2获取采集运行的场景信息包括两种方式:所述电视播放软件1向所述语音助手2传输或者所述语音助手2直接向所述电视播放软件1采集。针对所述电视播放软件1采集运行的场景信息,所述电视播放软件1与所述语音助手2建立通信连接,然后由所述电视播放软件1将采集的运行场景信息传输到所述语音助手2。所述语音助手2也可以通过所述电视播放软件1预留的接口与所述电视播放软件1建立通信连接,所述语音助手2直接向所述电视播放软件1采集获取所述电视播放软件1的运行场景信息。所述语音助手2根据所述电视播放软件1的预留接口与所述电视播放软件1建立通信连接。目前,大多数软件为一些特殊功能,均预留一些通信接口,比如:一些软件为老人看不清楚而预留进行语音朗读的接口,或者,一些软件为盲人预留的辅助操作接口等。所述语音助手2通过所述电视播放软件1的这些功能接口与所述电视播放软件1建立通信连接。所述语音助手2与所述电视播放软件1通过专有协议建立通信连接。通过构建所述语音助手2与所述电视播放软件1通信的专有协议,实现所述语音助手2与所述电视播放软件1的通信连接。
如图1所示,本发明的优选实施方式是:所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。具体实施过程如下:所述电视播放软件1为多种独立运行的电视播放软件,所述语音助手2与当前活动的所述电视播放软件1配合工作。若当前环境只有一个所述电视播放软件1运行,则所述语音助手2与当前的所述电视播放软件1配合工作,若当前系统环境有多个所述电视播放软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述电视播放软件1,然后所述语音助手2与当前的所述电视播放软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,可以直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述电视播放软件1,由所述电视播放软件1显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
如图1所示,本发明的具体实施方式是:构建一种基于电视场景状态及语音助手的语音辅助系统,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,所述电视播放软件1包括采集场景信息的采集模块11、与所述语音助手进行通信的通信模块12、执行模块13,所述语音助手2包括获取所述电视播放软件1运行的场景信息的信息获取模块21、采集语音信息的语音采集模块22、进行语音识别转换的语音识别模块23、匹配模块24、传输模块25,所述信息获取模块21获取所述电视播放软件1运行的场景信息,所述场景信息包括场景状态信息;所述语音采集模块22采集语音信息,所述语音识别模块23对所述语音信息进行语音识别转换;所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述传输模块25将匹配的场景元素信息传送到所述电视播放软件1,所述执行模块13执行所述场景元素信息对应的项目;若所述电视播放软件1运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,所述执行模块13执行所述场景状态模板的信息对应的项目。
如图1所示,本发明的具体实施过程是:所述信息获取模块21获取所述电视播放软件1运行的场景信息方式包括两种方式:一种方式是所述电视播放软件1后台采集自身运行的场景信息,这种信息采集方式全面、准确、快速,为首选方式。另外一种方式是:所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,这种方式要根据预留接口的功能决定采集信息的程度。针对所述电视播放软件1采集的场景信息,由所述电视播放软件1传送到所述语音助手2完成场景信息的获取。针对所述语音助手2通过所述电视播放软件1的预留接口采集所述电视播放软件1运行的场景信息,其本身即是场景信息获取的过程。所述场景信息包括场景状态信息。所述场景元素信息包括运行详情界面呈现的可视信息,具体包括运行界面的文字信息、图片信息、视频信息名称等,运行详情界面的文字信息为最主要的信息。所述场景状态信息主要包括运行界面涉及的操作信息,比如:播放视频、播放音乐、操作游戏等相关运行信息。具体实施例中,根据这些信息,通常将采集的元素信息多转换为文字信息。
通过外部语音输入设备输入语音信息,所述语音采集模块22采集所述语音信息,然后语音识别模块23对所述语音信息进行语音识别转换。具体实施例中,语音识别转换结果包括文字信息,也可以涉及操作信息。比如:打开快乐大本营,则语音识别转换结果涉及操作信息,也包括文字信息。
所述匹配模块24将语音识别转换结果与获取的场景信息进行匹配,主要从各自己相关信息的发音、文字、文字含义或者操作信息进行匹配,所述场景元素信息包括场景元素信息的名称、场景元素信息所在的类型、场景元素信息所涉及的制作人员、场景元素信息涉及的内容信息中的一种或多种。所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,比如:当前场景元素信息为“快乐大本营”,从“快乐大本营”的发音、文字进行相同或相似匹配,也可以从其所属类型上进行匹配,如:“快乐大本营”为综艺节目,还可以从其主持人上进行信息的匹配,还可以从其所属电视台上进行信息匹配等。另一种方式是:匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。比如:当前场景元素信息为“快乐大本营”,可以取其部分信息“快乐”和“大本营”进行匹配,若语音识别结果中包括“快乐”或者“大本营”,则也可以将“快乐大本营”匹配为相关。匹配相关后,所述传输模块25将匹配的场景元素信息传送到所述电视播放软件1,由所述执行模块13执行所述场景元素信息对应的项目。比如场景元素信息中有显示“快乐大本营”的节目,匹配相关后,所述语音助手2将“快乐大本营”信息传输到所述电视播放软件1,所述执行模块13执行该“快乐大本营”的节目,执行结果包括选择、点击等操作。
所述电视播放软件1运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手2调用预先构建的该项目信息的场景状态模板,则所述传输模块25根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述执行模块13执行所述场景状态模板的信息对应的项目。举例如下:若当前采集的场景状态信息为“播放非诚勿扰”,则所述语音助手2调用预先构建的视频播放器模块,视频播放器模块包括“播放”、“快进”、“快退”、“音量加大”、“音量减小”、“对比度增大”、“对比度减小”等相关视频播放涉及到的操作信息,若语音识别结果的信息包括“增大音量”,从其含义理解,应为“音量加大”,则所述传输模块25将“音量加大”发送到所述电视播放软件1,然后所述执行模块13执行音量加大的操作。
如图1所示,本发明的优选实施方式是:所述电视播放软件1包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。具体实施过程如下:所述电视播放软件1为多种独立运行的电视播放软件,所述语音助手2与当前活动的所述电视播放软件1配合工作。若当前环境只有一个所述电视播放软件1运行,则所述语音助手2与当前的所述电视播放软件1配合工作,若当前系统环境有多个所述电视播放软件1运行,则所述语音助手2通过当前系统,比如安卓系统,获取系统环境中的当前的所述电视播放软件1,然后所述语音助手2与当前的所述电视播放软件1建立通信连接,进行相关工作。
如图2所示,本发明的优选实施方式是:还包括网络服务器3,所述语音助手2将采集的场景信息上传到所述网络服务器3,所述网络服务器3将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手2。若场景信息为“非诚勿扰”,所述网络服务器3预先存储有“非诚勿扰”的相关信息,比如,“非诚勿扰”的介绍信息、“非诚勿扰”的主持人相关信息,“非诚勿扰”的歌曲链接信息等信息,所述网络服务器3将“非诚勿扰”相关的这些信息传输到所述语音助手2,所述语音助手2将这些信息组织成信息列表,由第二信息输出模块26直接显示输出,供用户使用,包括查看、播放等操作;也可以传输到所述电视播放软件1,由所述第一信息输出模块14显示输出,供使用;还可以传输到移动终端,由移动终端显示输出,供使用。
本发明的技术效果是:构建一种基于电视场景状态及语音助手的语音辅助方法及系统,包括电视播放软件1、语音助手2,所述电视播放软件1与所述语音助手2独立运行,所述语音助手2获取所述电视播放软件1运行的场景信息,所述场景信息包括场景状态信息;所述语音助手2采集语音信息,所述语音助手2对所述语音信息进行语音识别转换;所述语音助手2将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件1运行的场景元素信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,由所述语音助手2将匹配的场景元素信息传送到所述电视播放软件1,由所述电视播放软件1执行所述场景元素信息对应的项目;若所述软件运行的场景状态信息与所述语音识别结果在发音、文字、文字含义或者操作信息上相关,所述语音助手2调用预先构建的该项目信息的场景状态模板,由所述语音助手2根据语音信息将相应场景状态模板的信息传送到所述电视播放软件1,由所述电视播放软件1执行所述场景状态模板的信息对应的项目。本发明基于电视场景及语音助手2的语音交互辅助方法及系统,所述电视播放软件1与所述语音助手2独立运行,所述语音助手2获取所述电视播放软件1运行的场景信息,所述语音助手2将语音识别转换结果与获取的场景信息进行匹配,然后对于匹配的场景信息,根据场景状态信息和语音信息,由电视播放软件1进行操作执行。本发明基于电视场景及语音助手2的语音交互辅助方法及系统,根据电视的实时场景信息进行对其进行操作和使用,使语音电视真正迈向智能化,同时,与电视播放软件1分开独立运行,可以一个语音助手2与多个电视播放软件1配合使用,大大节约系统资源。另外,方便对语音引擎进行更新和创新,促进语音技术在智能化方面的发展。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于电视场景状态及语音助手的语音辅助方法,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接或者所述电视播放软件和所述语音助手通过专有协议建立通信连接,其特征在于,语音交互辅助方法包括如下步骤:
获取场景信息:所述语音助手获取所述电视播放软件运行的场景信息,所述场景信息包括场景状态信息;
输入语音:所述语音助手采集语音信息,所述语音助手对所述语音信息进行语音识别转换;
匹配执行:所述语音助手将语音识别转换结果与获取的场景信息进行匹配;若所述软件运行的场景状态信息与所述语音识别结果匹配结果在相关信息上相同或相似,则所述语音助手调用预先构建的该项目信息的场景状态模板,则所述语音助手根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,由所述电视播放软件执行所述场景状态模板的信息对应的项目。
2.根据权利要求1所述基于电视场景状态及语音助手的语音辅助方法,其特征在于,所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
3.根据权利要求1所述基于电视场景状态及语音助手的语音辅助方法,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
4.根据权利要求1所述基于电视场景状态及语音助手的语音辅助方法,其特征在于,所述相关信息上相同或相似包括在相关信息在发音、文字、文字含义、所属类型或操作信息上相同或相似,或者匹配双方各自部分信息在发音、文字、文字含义、所属类型或操作信息上相同或相似。
5.一种基于电视场景状态及语音助手的语音辅助系统,其特征在于,包括电视播放软件、语音助手,所述电视播放软件与所述语音助手独立运行,所述电视播放软件和所述语音助手通过所述电视播放软件的预留接口建立通信连接或者所述电视播放软件和所述语音助手通过专有协议建立通信连接,所述电视播放软件包括采集场景信息的采集模块、与所述语音助手进行通信的通信模块、执行模块,所述语音助手包括获取所述电视播放软件运行的场景信息的信息获取模块、采集语音信息的语音采集模块、进行语音识别转换的语音识别模块、匹配模块、传输模块,所述信息获取模块获取所述电视播放软件运行的场景信息,所述场景信息包括场景状态信息;所述语音采集模块采集语音信息,所述语音识别模块对所述语音信息进行语音识别转换;所述匹配模块将语音识别转换结果与获取的场景信息进行匹配;若所述电视播放软件运行的场景状态信息与所述语音识别结果在相关信息上相同或相似,所述语音助手调用预先构建的该项目信息的场景状态模板,由所述传输模块根据语音信息将相应场景状态模板的信息传送到所述电视播放软件,所述执行模块执行所述场景状态模板的信息对应的项目。
6.根据权利要求5基于电视场景状态及语音助手的语音辅助系统,其特征在于,所述电视播放软件包括多种独立运行的电视播放软件,所述语音助手与当前活动的所述电视播放软件配合工作。
7.根据权利要求5基于电视场景状态及语音助手的语音辅助系统,其特征在于,还包括网络服务器,所述语音助手将采集的场景信息上传到所述网络服务器,所述网络服务器将所述场景信息与预先存储的信息进行匹配,将匹配的信息传送到所述语音助手。
8.根据权利要求7基于电视场景状态及语音助手的语音辅助系统,其特征在于,所述电视播放软件包括第一信息输出模块或者所述语音助手包括第二信息输出模块。
CN201410634286.9A 2014-11-12 2014-11-12 基于电视场景状态及语音助手的语音辅助方法及系统 Active CN104506901B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410634286.9A CN104506901B (zh) 2014-11-12 2014-11-12 基于电视场景状态及语音助手的语音辅助方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410634286.9A CN104506901B (zh) 2014-11-12 2014-11-12 基于电视场景状态及语音助手的语音辅助方法及系统

Publications (2)

Publication Number Publication Date
CN104506901A CN104506901A (zh) 2015-04-08
CN104506901B true CN104506901B (zh) 2018-06-15

Family

ID=52948605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410634286.9A Active CN104506901B (zh) 2014-11-12 2014-11-12 基于电视场景状态及语音助手的语音辅助方法及系统

Country Status (1)

Country Link
CN (1) CN104506901B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106101789B (zh) * 2016-07-06 2020-04-24 深圳Tcl数字技术有限公司 终端的语音交互方法及装置
CN108062212A (zh) * 2016-11-08 2018-05-22 沈阳美行科技有限公司 一种基于场景的语音操作方法及装置
CN107316641B (zh) * 2017-06-30 2021-06-15 联想(北京)有限公司 一种语音控制方法及电子设备
CN113556604B (zh) * 2020-04-24 2023-07-18 深圳市万普拉斯科技有限公司 音效调节方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118382A1 (en) * 2005-11-18 2007-05-24 Canon Kabushiki Kaisha Information processing apparatus and information processing method
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及系统
CN103324729A (zh) * 2013-06-27 2013-09-25 北京小米科技有限责任公司 一种推荐多媒体资源的方法和装置
CN103686275A (zh) * 2013-12-06 2014-03-26 Tcl集团股份有限公司 一种智能电视遥控装置及其设置方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070118382A1 (en) * 2005-11-18 2007-05-24 Canon Kabushiki Kaisha Information processing apparatus and information processing method
CN102510426A (zh) * 2011-11-29 2012-06-20 安徽科大讯飞信息科技股份有限公司 个人助理应用访问方法及系统
CN103324729A (zh) * 2013-06-27 2013-09-25 北京小米科技有限责任公司 一种推荐多媒体资源的方法和装置
CN103686275A (zh) * 2013-12-06 2014-03-26 Tcl集团股份有限公司 一种智能电视遥控装置及其设置方法

Also Published As

Publication number Publication date
CN104506901A (zh) 2015-04-08

Similar Documents

Publication Publication Date Title
CN104516709B (zh) 基于软件运行场景及语音助手的语音辅助方法及系统
US10650816B2 (en) Performing tasks and returning audio and visual feedbacks based on voice command
CN104506944B (zh) 基于电视场景及语音助手的语音交互辅助方法及系统
US10311877B2 (en) Performing tasks and returning audio and visual answers based on voice command
CN103811007B (zh) 显示装置、语音获取装置及其语音识别方法
CN104461446B (zh) 基于语音交互的软件运行方法及系统
CN111095892B (zh) 电子装置及其控制方法
CN104506906B (zh) 基于电视场景元素及语音助手的语音交互辅助方法及系统
CN106101789A (zh) 终端的语音交互方法及装置
CN105161106A (zh) 智能终端的语音控制方法、装置及电视机系统
CN103730116A (zh) 在智能手表上实现智能家居设备控制的系统及其方法
CN104506901B (zh) 基于电视场景状态及语音助手的语音辅助方法及系统
CN102779509A (zh) 语音处理设备和语音处理方法
CN107071541A (zh) 用于外围上下文管理的方法和设备
CN105554588A (zh) 支持闭路字幕的内容接收装置和显示装置
CN104363517B (zh) 基于电视场景及语音助手的语音切换方法及系统
CN102929385A (zh) 语音控制应用程序的方法
CN109637534A (zh) 语音遥控方法、系统、受控装置及计算机可读存储介质
CN110968362B (zh) 应用运行方法、装置及存储介质
CN103269445A (zh) 智能电视系统及其控制方法
CN107483993A (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN113784186B (zh) 终端设备、服务器和通信控制方法
CN114465975B (zh) 一种内容推送方法、装置、存储介质和芯片系统
CN111950288B (zh) 一种命名实体识别中的实体标注方法及智能设备
WO2011000749A1 (en) Multimodal interaction on digital television applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant