CN112489647A - 语音助手控制方法、移动终端及存储介质 - Google Patents
语音助手控制方法、移动终端及存储介质 Download PDFInfo
- Publication number
- CN112489647A CN112489647A CN202011331212.XA CN202011331212A CN112489647A CN 112489647 A CN112489647 A CN 112489647A CN 202011331212 A CN202011331212 A CN 202011331212A CN 112489647 A CN112489647 A CN 112489647A
- Authority
- CN
- China
- Prior art keywords
- voice assistant
- mobile terminal
- voice
- information
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000003993 interaction Effects 0.000 claims abstract description 38
- 230000002618 waking effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 208000016354 hearing loss disease Diseases 0.000 claims description 6
- 230000006870 function Effects 0.000 description 20
- 238000001514 detection method Methods 0.000 description 12
- 208000032041 Hearing impaired Diseases 0.000 description 11
- 238000004891 communication Methods 0.000 description 11
- 230000002452 interceptive effect Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 241000238558 Eucarida Species 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 235000013350 formula milk Nutrition 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
- H04L9/3226—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
- H04L9/3231—Biological data, e.g. fingerprint, voice or retina
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本申请提供了一种语音助手控制方法、移动终端及存储介质,该方法通过检测预设触发事件,获取使用状态信息,基于使用状态信息从至少一个语音助手中确定目标语音助手,最后唤醒目标语音助手进行人机交互。由于是检测到预设触发事件便获取使用状态信息,并基于使用状态信息确定目标语音助手的,这使得最后用于人机交互的目标语音助手是适配于移动终端使用状态的,能够满足所处场景的使用需求。另一方面,场景不同对应移动终端的使用状态是不同的,基于使用状态信息确定目标语音助手的方式可以对不同的场景提供不同的语音助手进行人机交互服务,由此可见本申请提供的语音助手控制方法可解决现有技术中用户对不同的场景需提供不同交互服务的技术问题。
Description
技术领域
本申请涉及电子技术领域,具体涉及一种语音助手控制方法、移动终端及存储介质。
背景技术
随着语音识别技术的发展和人们对于语音交互的需求增加,语音助手这一智能应用应运而生,其可以与用户实现智能对话、即时问答,帮助用户解决疑难问题。可以理解的是,用户对不同的场景将需要提供不同的交互服务,然而,一些实现中,电子设备通常只内置有一个语音助手,这将难以满足用户对不同场景的需求。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
针对上述技术问题,本申请提供一种语音助手控制方法、移动终端及存储介质,可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
为解决上述技术问题,本申请提供一种语音助手控制方法,包括:
S11、检测到预设触发事件,则获取使用状态信息;
S12、基于使用状态信息从至少一个语音助手中确定目标语音助手;
S13、唤醒目标语音助手进行人机交互。
可选地,使用状态信息包括以下至少一种:时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备。
可选地,目标语音助手包括以下至少一种:工作语音助手、驾驶语音助手、听障语音助手、儿童语音助手或老年人语音助手。
可选地,步骤S12包括:
基于使用状态信息判断应用场景;
确定应用场景所对应的预设语音助手为目标语音助手。
可选地,步骤S11中检测到预设触发事件包括以下至少一种::
采集语音信息,若判断语音信息中包括预设关键词,则确定检测到预设触发事件;
检测到使用状态信息满足预设条件,则确定检测到预设触发事件;
检测到语音助手模式切换为开启状态,则确定检测到预设触发事件。
可选地,步骤12包括:基于所述使用状态信息判断应用场景,确定所述应用场景所对应的预设语音助手为所述目标语音助手。
可选地,步骤S13之前还包括:
获取生物特征信息;
基于生物特征信息调整目标语音助手的语音特点。
可选地,生物特征信息包括以下至少一种:声纹信息、指纹信息、人脸信息。
本申请实施例还提供了一种语音助手控制方法,包括:
S21、检测到预设触发事件,则获取生物特征信息;
S22、基于生物特征信息从至少一个语音助手中确定目标语音助手;
S23、唤醒目标语音助手进行人机交互。
可选地,步骤S21中检测到预设触发事件包括以下至少一种::
采集语音信息,若判断语音信息中包括预设关键词,则确定检测到预设触发事件;
检测到使用状态信息满足预设条件,则确定检测到预设触发事件;
检测到多语音助手模式切换为开启状态,则确定检测到预设触发事件。
可选地,目标语音助手包括以下至少一种:女声语音助手、男声语音助手、听障语音助手、儿童语音助手或老年人语音助手。
可选地,S22之后,语音助手控制方法还包括:
获取使用状态信息;
基于使用状态信息判断应用场景;
根据应用场景更新目标语音助手。
可选地,使用状态信息包括以下至少一种:时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备。
可选地,生物特征信息包括以下至少一种:声纹信息、指纹信息、人脸信息。
本申请还提供一种移动终端,包括:存储器、处理器,其中,存储器上存储有语音助手控制程序,语音助手控制程序被处理器执行时实现如上述方法的步骤。
本申请还提供一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述方法的步骤。
如上,本申请提供的语音助手控制方法可以通过检测预设触发事件,获取使用状态信息,之后基于使用状态信息从至少一个语音助手中确定目标语音助手,最后唤醒目标语音助手进行人机交互,由于是检测到预设触发事件便获取使用状态信息,并基于使用状态信息确定目标语音助手的,这使得最后确定用于人机交互的目标语音助手是适配于移动终端使用状态的,即能够满足移动终端所处场景的使用需求。另一方面,场景不同对应移动终端的使用状态信息是不同的,可见基于使用状态信息确定目标语音助手的方式可以针对不同的场景提供不同的语音助手进行人机交互服务,综上,本申请提供的语音助手控制方法可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为实现本申请各个实施例的一种移动终端的硬件结构示意图;
图2为本申请实施例提供的一种通信网络系统架构图;
图3是本申请实施例提供的第一种语音助手控制方法的流程示意图;
图4是本申请实施例提供的一种语音助手的设置界面示意图;
图5是本申请实施例提供的第二种语音助手控制方法的流程示意图;
图6是本申请实施例提供的第三种语音助手控制方法的流程示意图;
图7是本申请实施例提供的第四种语音助手控制方法的流程示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本申请使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的,或意味着任一个或任何组合。例如,“包括以下至少一个:A、B、C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”,再如,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
需要说明的是,在本文中,采用了诸如S11、S12等步骤代号,其目的是为了更清楚简要地表述相应内容,不构成顺序上的实质性限制,本领域技术人员在具体实施时,可能会先执行S12后执行S11等,但这些均应在本申请的保护范围之内。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
移动终端可以以各种形式来实施。例如,本申请中描述的移动终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本申请的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本申请各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。可选地,光传感器包括环境光传感器及接近传感器,可选地,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。可选地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。可选地,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。可选地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,可选地,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,可选地,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本申请实施例,下面对本申请的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本申请实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
可选地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。可选地,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。可选地,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本申请不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端硬件结构以及通信网络系统,提出本申请各个实施例。
本申请实施例提供了一种语音助手控制方法,请参见图3,该语音助手控制方法包括:
S11、检测到预设触发事件,则获取使用状态信息。
预设触发事件是指预先设置的事件,当检测到该事件发生则触发移动终端获取使用状态信息。使用状态信息可以指用户在使用移动终端以及没有使用移动终端所产生的数据,包括时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备。基于这些使用状态信息可以预判断移动终端所处的应用场景,基于移动终端上语音助手与应用场景的对应关系,可以确定当下应用场景最为适配的语音助手,这样便可以针对不同的应用场景提供不同的语音助手进行人机交互服务。对于使用状态信息的获取方式,时间、位置信息是移动终端上现有的数据,是可以直接从移动终端上获取到的。生物特征信息属于用户数据,在用户通过锁屏认证等方式录入指纹信息、声纹信息、人脸信息的情况下,可以直接从移动终端上获取到这些生物特征信息,基于这些生物特征信息移动终端可以确定当前用户是哪位,由此在提供语音助手功能时移动终端可以按照该用户的特点以及使用习惯提供适配于该用户的语音助手服务,这样可以提高用户满意度。
预设触发事件可以是检测到语音助手模式切换为开启状态,在该示例下,可以是将用户在开启语音助手模式,即将语音助手模式由关闭状态切换为开启状态;预设触发事件也可以是检测到使用状态信息满足预设条件,在该示例下,可以是在检测到移动终端上的时间、位置信息、生物特征信息等的使用状态信息满足预设条件,可以是在检测到移动终端处于驾驶状态(外接车载设备),也可以是检测到移动终端外接音频设备等;预设触发事件还可以是移动终端采集语音信息,且语音信息中包括预设关键词,在该示例下,若用户在使用移动终端的时候发出一段语音,移动终端可以采集这段语音并解析得到其中的语音信息,若判断该语音信息中包括有预设关键词,则可以判断检测到了预设触发事件的发生。预设关键词是预先设置的关键词,用于与语音信息进行匹配,若匹配成功则确定移动终端检测到了预设触发事件的发生,即采集到的语音信息中包括有预设关键词,此时移动终端将继续执行下一步骤。例如,移动终端采集到的语音信息中包括“小爱同学”,或者“Hi,Siri”等的预设关键词时则确定检测到预设触发事件。
S12、基于使用状态信息从至少一个语音助手中确定目标语音助手。
在本申请实施例中,移动终端上预设内置有至少一个语音助手,包括一般语音助手,工作语音助手、驾驶语音助手、户外语音助手、听障语音助手以及儿童语音助手、男声语音助手、女声语音助手、老年人语音助手等,请参见图4,图4为本申请实施例提供的一种语音助手设置界面示意图,这些语音助手与使用状态信息对应,因此在获取使用状态信息之后可以基于此确定出目标语音助手。目标语音助手则是从这些多种类的语音助手中确定的、最终用于与用户进行人机交互的语音助手。此处介绍这几个语音助手的异同:
工作语音助手,可以理解的是若用户处于工作状态,移动终端会提供较低声量的语音服务从而可以尽可能的减少对周围的影响(工作语音助手所提供的语音声量较低)。此外,用户处于工作状态时,为了不影响周围同事用户可以采用输入文字替代发出语音的方式输入信息给移动终端,移动终端可以基于工作语音助手输出文字信息与用户进行交互。当然,若在该示例下用户外接了音频设备,例如耳机,则移动终端可以基于工作语音助手输出语音信息与用户进行交互。当用户处于工作状态并需要与客户进行电话的时候,工作语音助手可以获取用户与客户的通话,并将通话过程转换为文字信息进行记录。
驾驶语音助手,即在驾驶状态下移动终端提供的语音服务,可以理解的是在驾驶环境下用户双手收到限制,整个交互过程完全基本都是通过语音实现,而又由于用户在开车,则可以提供语速较缓语音服务确保用户能够接受到基于语音传递的信息,同时,移动终端显示通知信息的字体将可以切换为比一般状态更大号的字体,方便用户在驾驶状态下查看移动终端上的信息。
户外语音助手,在户外应用场景下移动终端提供语音服务,在户外环境移动终端需要提供更大音量语音服务,因此在移动终端通过获取环境音、定位等移动终端上的使用状态信息而确定用户处于户外的话,一旦当语音助手被唤醒,移动终端可以提供音量更大语音服务以与用户进行交互。
听障语音助手,可以是移动终端(通过生物特征信息)判断当前用户为听障人士后提供的、适用于听障人士的语音服务,该类语音助手可以将他人输入的语音转化为手语,由移动终端上的虚拟人物将手语比划出来让用户了解别人在说什么,当然,在例如视频通话情况下也可以是移动识别听障人士所比划的手语,并将手语翻译称为文字、语音等的内容,以帮助不会手语的人了解听障人士所想要表达什么。
儿童语音助手,可理解的是儿童的视听能力有限,移动终端在提供语音服务时需要提供语速较缓语音服务,甚至提供童声的语音服务。此外,移动终端需要加载儿童相关的资源,以为其提供合适的语音交互内容,同时,还需要屏蔽一些儿童不适宜的内容。
一般语音助手,为一般情况下移动终端可以提供的语音服务,其为非工作应用场景、非驾驶应用场景、非户外应用场景等的场景下移动终端可提供的语音服务。
男声语音助手、女声语音助手即语音助手所提供的语音是男声或女声,或者一些具有特定音色的声音。当然,在一些示例中移动终端还能提供老年人语音助手,能够提供大音量的语音服务,当然在一些示例中所显示的通知消息字体也可以是大号字体,以及可以将接受到的通知消息通过语音的方式播放给用户。可以理解的是,男声、女声、老年人等的语音助手可以与工作语音助手、驾驶语音助手、听障语音助手等重叠,例如在移动终端提供工作语音助手服务的时候,是以女声的方式提供语音服务的。
S13、唤醒目标语音助手进行人机交互。
可以理解的是,随着用户的移动,移动终端上的使用状态信息是在不断变化的,当使用状态数所对应的应用场景切换到另外一应用场景时,移动终端可以提供适配于切换后的应用场景的语音助手以为用户提供交互服务。
基于本申请实施例提供的语音助手控制方法,最后确定用于人机交互的目标语音助手是适配于移动终端使用状态的,即能够满足移动终端所处场景的使用需求。另一方面,场景不同对应移动终端的使用状态信息是不同的,可见基于使用状态信息确定目标语音助手的方式可以针对不同的场景提供不同的语音助手进行人机交互服务,可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
下文将基于上述对语音助手控制方法的介绍,继续介绍本发明提供的语音助手控制方法的其他可实施方式。
本申请实施例还提供了一种语音助手控制方法,请参见图5,该方法可以应用于移动终端,该移动终端上内置有至少一个语音助手,该语音助手控制方法包括:
S101、移动终端采集语音信息,若判断语音信息中包括预设关键词,则确定检测到预设触发事件。
若用户在使用移动终端的时候发出一段语音,移动终端可以采集这段语音并解析得到其中的语音信息,若判断该语音信息中包括有预设关键词,则可以判断移动终端检测到了预设触发事件的发生,此时可触发执行下一步骤S102。预设关键词是预先设置的关键词,用于与语音信息进行匹配,若匹配成功则确定移动终端检测到了预设触发事件的发生,即采集到的语音信息中包括有预设关键词,此时移动终端将继续执行下一步骤S102。例如,移动终端采集到的语音信息中包括“小爱同学”,或者“Hi,Siri”等的预设关键词时则确定检测到预设触发事件。
在另外的一些示例下,确定移动终端检测到预设触发事件还可以是:检测到语音助手模式切换为开启状态,则确定移动终端检测到预设触发事件。在该示例下,可以是将用户在开启语音助手模式,即将语音助手模式由关闭状态切换为开启状态时,确定检测到预设触发事件,此时可以继续执行本申请实施例提供的语音助手控制方法的步骤。
在其他的一些示例下,确定移动终端检测到预设触发事件还可以是:检测到使用状态信息满足预设条件。可以是在检测到移动终端上的时间、位置信息、生物特征信息等的使用状态信息满足预设条件,可以是在检测到移动终端处于驾驶状态(外接车载设备),也可以是检测到移动终端外接音频设备等,确定移动终端检测到预设触发事件。对于位置信息,可以是检测到移动终端处于某地址范围时确定检测到预设触发事件,例如,可以是在检测到移动终端处于学校地址100米范围内时,确定检测到预设触发事件,在该示例下即为确定移动终端进入校园,若语音助手被唤醒则其可以提供工作语音助手。对于生物特征信息,一个移动终端可以被多个用户使用,可以通过获取用户的生物特征信息(指纹信息、声纹信息、人脸信息)确定当前使用移动终端的用户是哪一位,这样便可以提供该用户所使用的语音服务。在该示例下即是确定生物特征信息(使用状态信息)为某一用户则可以判断使用状态信息满足预设条件,即检测到预设触发事件。例如,一家四口有一个共用的移动终端,母亲喜欢用男声语音助手,父亲喜欢用女声语音助手,他们4岁的宝宝则是用儿童语音助手,宝宝奶奶则可以用老年人语音助手,具体提供何种语音服务则需基于获取到的生物特征信息来确定。可以理解的是,可以基于移动终端是否接入驾驶设备中的外接设确定移动终端是否处于驾驶状态,例如若确定移动终端与车载蓝牙连接则可以确定移动终端处于驾驶状态,当然在另外一些示例下还可以结合移动终端GPS定位的移动速度等的信息确定移动终端(用户)处于驾驶状态。同样的,可以通过是否外接音频设备确定是否检测到预设触发事件。
此处通过检测时间来确定检测到预设触发事件进行详细举例说明。可以理解的是,用户使用移动终端是具有一定时间周期的,例如,每个工作日的9:00至18:00用户正在工作,该段时间为用户的工作时间,因此在检测到移动终端的时间处于工作日的9:00至18:00,则可以判断为处于工作时间(此时用户处于工作状态),此时可以确定为检测到预设触发事件。当然,每天晚上的20:00至22:00用户一般在打游戏,则该段时间为游戏时间,因此在检测到时间为20:00至22:00时,可以判断处于用户处于游戏时间,可以确定检测到预设触发事件。当然,仅以时间处于在预设时间段便得出用户处于某个状态的结论可能是不准确的,因此在一些示例中还可以加上位置信息来进行确定,对于工作时间的示例,还可以是检测到移动终端所处位置在距离公司地址预设范围内,且在当前时间为工作时间(工作日的9:00至18:00),才确定用户处于工作状态(当前时间处于工作时间),若用户在工作时间开启语音助手,则可以开启对应于工作时间的工作语音助手(在本申请实施例中,移动终端上预设内置有至少一个语音助手,包括工作语音助手、驾驶语音助手、听障语音助手以及儿童语音助手、男声语音助手、女声语音助手等,不同语音助手可以提供不同模式、不同特点的语音服务,具体的差别可以见后文)。
S102、获取使用状态信息。
使用状态信息可以指用户在使用移动终端以及没有使用移动终端所产生的数据,包括时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备。基于这些使用状态信息可以预判断移动终端所处的应用场景,基于移动终端上语音助手与应用场景的对应关系,可以确定当下应用场景最为适配的语音助手,这样便可以针对不同的应用场景提供不同的语音助手进行人机交互服务。
对于使用状态信息的获取方式,时间、位置信息是移动终端上现有的数据,是可以直接从移动终端上获取到的。生物特征信息属于用户数据,在用户通过锁屏认证等方式录入指纹信息、声纹信息、人脸信息的情况下,可以直接从移动终端上获取到这些生物特征信息,基于这些生物特征信息移动终端可以确定当前用户是哪位,由此在提供语音助手功能时移动终端可以按照该用户的特点以及使用习惯提供适配于该用户的语音助手服务,这样可以提高用户满意度。
S103、基于使用状态信息判断应用场景。
S104、确定应用场景所对应的预设语音助手为目标语音助手。
应用场景包括一般场景、工作应用场景,驾驶应用场景,户外应用场景,对应这些应用场景移动终端中内置包括一般语音助手、工作语音助手、驾驶语音助手、户外语音助手,可以给用户提供语音助手交互服务,不同语音助手的详细介绍可见后文。在这些应用场景下,移动终端还可以提供女声语音助手、男声语音助手、老年人语音助手以及儿童语音助手。在一些示例下,女声、男声、老年人、以及儿童语音助手是可以与一般语音助手、工作语音助手、驾驶语音助手、户外语音助手进行重叠提供语音服务的,例如,移动终端提供工作语音助手的同时可以以男声(男声语音助手)提供语音服务,在提供户外语音助手的同时可以以老年人语音助手提供语音服务。
使用状态信息包括时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备,基于这些使用状态信息可以确定移动终端的应用场景。若获取到的使用状态信息为时间,且移动终端判断获取到的时间处于预设事件时间段,则可以确定移动终端(用户)处于预设事件中。例如,若确定时间为工作时间段(工作日的9:00至18:00),则可以确定当前处于工作应用场景,对应的可以将移动终端上的工作语音助手确定为步骤S104中的目标语音助手。在另外的一些示例下,若获取到的使用状态信息包括时间、位置信息,且移动终端确定时间处于预设事件时间段,位置信息处于预设地址的一定范围,则才能确定移动终端(用户)处于预设事件中。例如,当位置信息为预设地点公司范围100米内,当前时间处于工作时间则可以确定当下处于工作应用场景。当然,在工作应用场景下,若检测到移动终端外接了音频设备,则移动终端可以将一般语音助手确定为目标语音助手,提供常规的语音服务。
在一些示例下,可以通过判断移动终端是否接入车载设备,或者移动终端位置的移动速度是否超过预设阈值等的方式来确定移动终端(用户)是否处于驾驶状态,若是则可以确定移动终端处于驾驶应用场景,若在该应用场景下确定检测到预设触发事件,则移动终端可以提供驾驶语音助手。在另外的一些示例下,可以通过获取到的用户的生物特征新信息确定移动终端的当前使用用户,为该用户提供其习惯使用的语音助手。
在本申请实施例中,移动终端上预设内置有至少一个语音助手,包括一般语音助手,工作语音助手、驾驶语音助手、户外语音助手、听障语音助手以及儿童语音助手、男声语音助手、女声语音助手、老年人语音助手等,这些语音助手与移动终端的应用场景对应,因此在步骤S103基于使用状态信息确定应用场景之后,可以基于应用场景从至少一个语音助手中确定出目标语音助手,即目标语音助手则是从这些多种类的语音助手中确定的、最终用于与用户进行人机交互的语音助手。此处介绍这几个语音助手的异同:
工作语音助手,可以理解的是若用户处于工作状态,移动终端会提供较低声量的语音服务从而可以尽可能的减少对周围的影响(工作语音助手所提供的语音声量较低)。此外,用户处于工作状态时,为了不影响周围同事用户可以采用输入文字替代发出语音的方式输入信息给移动终端,移动终端可以基于工作语音助手输出文字信息与用户进行交互。当然,若在该示例下用户外接了音频设备,例如耳机,则移动终端可以基于工作语音助手输出语音信息与用户进行交互。当用户处于工作状态并需要与客户进行电话的时候,工作语音助手可以获取用户与客户的通话,并将通话过程转换为文字信息进行记录。
驾驶语音助手,即在驾驶状态下移动终端提供的语音服务,可以理解的是在驾驶环境下用户双手收到限制,整个交互过程完全基本都是通过语音实现,而又由于用户在开车,则可以提供语速较缓语音服务确保用户能够接受到基于语音传递的信息,同时,移动终端显示通知信息的字体将可以切换为比一般状态更大号的字体,方便用户在驾驶状态下查看移动终端上的信息。
户外语音助手,在户外应用场景下移动终端提供语音服务,在户外环境移动终端需要提供更大音量语音服务,因此在移动终端通过获取环境音、定位等移动终端上的使用状态信息而确定用户处于户外的话,一旦当语音助手被唤醒,移动终端可以提供音量更大语音服务以与用户进行交互。
听障语音助手,可以是移动终端(通过生物特征信息)判断当前用户为听障人士后提供的、适用于听障人士的语音服务,该类语音助手可以将他人输入的语音转化为手语,由移动终端上的虚拟人物将手语比划出来让用户了解别人在说什么,当然,在例如视频通话情况下也可以是移动识别听障人士所比划的手语,并将手语翻译称为文字、语音等的内容,以帮助不会手语的人了解听障人士所想要表达什么。
儿童语音助手,可理解的是儿童的视听能力有限,移动终端在提供语音服务时需要提供语速较缓语音服务,甚至提供童声的语音服务。此外,移动终端需要加载儿童相关的资源,以为其提供合适的语音交互内容,同时,还需要屏蔽一些儿童不适宜的内容。
一般语音助手,为一般情况下移动终端可以提供的语音服务,其为非工作应用场景、非驾驶应用场景、非户外应用场景等的场景下移动终端可提供的语音服务。
男声语音助手、女声语音助手即语音助手所提供的语音是男声或女声,或者一些具有特定音色的声音。当然,在一些示例中移动终端还能提供老年人语音助手,能够提供大音量的语音服务,当然在一些示例中所显示的通知消息字体也可以是大号字体,以及可以将接受到的通知消息通过语音的方式播放给用户。可以理解的是,男声、女声、老年人等的语音助手可以与工作语音助手、驾驶语音助手、听障语音助手等重叠,例如在移动终端提供工作语音助手服务的时候,是以女声的方式提供语音服务的。
S105、获取生物特征信息。
S106、基于生物特征信息调整目标语音助手的语音特点。
S107、唤醒目标语音助手进行人机交互。
移动终端的用户可以有多个,可以通过生物特征信息确定移动终端的当前使用用户,生物特征信息指人体固有生理特征,包括声纹信息、指纹信息、人脸信息等,基于这些生理特征可以进行个人身份鉴定。可以理解的是,每个用户的移动终端使用习惯是不同的,移动终端可以记录每一个用户的使用设置,并在判断当前使用用户之后,可以提供该用户常用的、合适的语音服务。例如,在移动终端解锁时获取了用户的指纹信息,便可以根据指纹信息确定当下使用移动终端的人具体是哪一位用户,进而可以查找该用户的历史语音助手使用情况,在检测到预设触发事件时唤醒该用户在对应的应用场景下的语音助手来提供合适的交互服务。
可以理解的是,随着用户的移动,移动终端上的使用状态信息是在不断变化的,当使用状态数所对应的应用场景切换到另外一应用场景时,移动终端可以提供适配于切换后的应用场景的语音助手以为用户提供交互服务。
本申请提供的语音助手控制方法由于是检测到预设触发事件便获取使用状态信息,并基于使用状态信息确定目标语音助手的,这使得最后确定用于人机交互的目标语音助手是适配于移动终端使用状态的,即能够满足移动终端所处场景的使用需求。另一方面,场景不同对应移动终端的使用状态信息是不同的,可见基于使用状态信息确定目标语音助手的方式可以针对不同的场景提供不同的语音助手进行人机交互服务,综上,本申请提供的语音助手控制方法可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
本申请实施例还提供了一种语音助手控制方法,请参见图6,语音助手控制方法包括:
S21、检测到预设触发事件,则获取生物特征信息。
预设触发事件是指预先设置的事件,当检测到该事件发生则触发移动终端获取生物特征信息。生物特征信息指人体固有生理特征,包括声纹信息、指纹信息、人脸信息等,基于这些生理特征可以进行个人身份鉴定。可以理解的是,每个用户的移动终端使用习惯是不同的,移动终端可以记录每一个用户的使用设置,并在判断当前使用用户之后,可以提供该用户常用的、合适的语音服务。例如,在移动终端解锁时获取了当前用户的指纹信息,便可以根据指纹信息确定当下使用移动终端的人具体用户B,进而可以查找该用户B的历史语音助手使用情况,于是,在检测到预设触发事件时,可以唤醒该用户B在对应的应用场景下提供合适交互服务的语音助手。
预设触发事件可以是检测到语音助手模式切换为开启状态,在该示例下,可以是将用户在开启语音助手模式,即将语音助手模式由关闭状态切换为开启状态;预设触发事件也可以是检测到使用状态信息满足预设条件,在该示例下,可以是在检测到移动终端上的时间、位置信息、生物特征信息等的使用状态信息满足预设条件,可以是在检测到移动终端处于驾驶状态(外接车载设备),也可以是检测到移动终端外接音频设备等;预设触发事件还可以是移动终端采集语音信息,且语音信息中包括预设关键词,在该示例下,若用户在使用移动终端的时候发出一段语音,移动终端可以采集这段语音并解析得到其中的语音信息,若判断该语音信息中包括有预设关键词,则可以判断检测到了预设触发事件的发生。预设关键词是预先设置的关键词,用于与语音信息进行匹配,若匹配成功则确定移动终端检测到了预设触发事件的发生,即采集到的语音信息中包括有预设关键词,此时移动终端将继续执行下一步骤。例如,移动终端采集到的语音信息中包括“小爱同学”,或者“Hi,Siri”等的预设关键词时则确定检测到预设触发事件。
S22、基于生物特征信息从至少一个语音助手中确定目标语音助手。
对于生物特征信息,一个移动终端可以被多个用户使用,可以通过获取用户的生物特征信息(指纹信息、声纹信息、人脸信息)确定当前使用移动终端的用户是哪一位,这样便可以提供该用户所使用的语音服务。
在本申请实施例中,移动终端上预设内置有至少一个语音助手,包括一般语音助手,工作语音助手、驾驶语音助手、户外语音助手、听障语音助手以及儿童语音助手、男声语音助手、女声语音助手、老年人语音助手等,目标语音助手则是从这些多种类的语音助手中确定的、最终用于与用户进行人机交互的语音助手。这几个语音助手的详细介绍可见本申请中其他实施例中对其的介绍。可以理解的是,基于生物特征信息可以确定移动终端的当前使用用户,又由于移动终端上存储有每个用户的语音助手使用习惯,则是可以基于生物特征信息从移动终端内置的语音助手中确定最后适配于当前用户进行语音交互服务的语音助手的。例如,用户A经常使用工作语音助手,则在移动终端确定触发了预设触发事件且触发预设触发事件的是用户A,则可以确定工作语音助手为目标语音助手。
S23、唤醒目标语音助手进行人机交互。
可以理解的是,随着用户的移动,移动终端上的使用状态信息是在不断变化的,当使用状态数所对应的应用场景切换到另外一应用场景时,移动终端可以提供适配于切换后的应用场景的语音助手以为用户提供交互服务。
本申请提供的语音助手控制方法由于是检测到预设触发事件便获取生物特征信,并基于生物特征信息确定目标语音助手的,这使得最后确定用于人机交互的目标语音助手是适配于移动终端使用状态的,即能够满足移动终端所处场景的使用需求,可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
本申请实施例还提供了一种语音助手控制方法,请参见图7,该方法包括:
S201、检测到多语音助手模式切换为开启状态,则确定检测到预设触发事件。
在本申请实施例中,移动终端具有多语音助手模式(移动终端内部预先内置有至少一个语音助手),在开启状态下可以为用户提供不同的语音服务。用户可以通过移动终端上触控开关、物理开启实现将多语音助手模式切换为开启状态,在切换的时候则可以确定检测预设触发事件发生。
在另外的一些示例下,确定检测到预设触发事件还可以是采集用户输入的语音,解析得到其中的语音信息,若判断语音信息中包括有预设关键词,则可以确定检测到预设触发事件。若用户在使用移动终端的时候发出一段语音,移动终端可以采集这段语音并解析得到其中的语音信息,若判断该语音信息中包括有预设关键词,则可以判断检测到了预设触发事件的发生。预设关键词是预先设置的关键词,用于与语音信息进行匹配,若匹配成功则确定移动终端检测到了预设触发事件的发生,即采集到的语音信息中包括有预设关键词,此时移动终端将继续执行下一步骤。例如,移动终端采集到的语音信息中包括“小爱同学”,或者“Hi,Siri”等的预设关键词时则确定检测到预设触发事件。
在其他的一些示例下,确定检测到预设触发事件还可以是移动终端检测到使用状态信息满足预设条件。在该示例下,可以是在检测到移动终端上的时间、位置信息、生物特征信息等的使用状态信息满足预设条件,可以是在检测到移动终端处于驾驶状态(外接车载设备),也可以是检测到移动终端外接音频设备等的时候,确定检测到预设触发事件。
S202、获取生物特征信息。
生物特征信息属于用户数据,在用户通过锁屏认证等方式录入指纹信息、声纹信息、人脸信息的情况下,可以直接从移动终端上获取到这些生物特征信息,基于这些生物特征信息移动终端可以确定当前用户是哪位,由此在提供语音助手功能时移动终端可以按照该用户的特点以及使用习惯提供适配于该用户的语音助手服务,这样可以提高用户满意度。
S203、基于生物特征信息从至少一个语音助手中确定目标语音助手。
在本申请实施例中,移动终端上预设内置有至少一个语音助手,包括一般语音助手,工作语音助手、驾驶语音助手、户外语音助手、听障语音助手以及儿童语音助手、男声语音助手、女声语音助手、老年人语音助手等,这几个语音助手的详细介绍可见本申请中其他实施例中对其的介绍。可以理解的是,基于生物特征信息可以确定移动终端的当前使用用户,又由于移动终端上存储有每个用户的语音助手使用习惯,则是可以基于生物特征信息从移动终端内置的语音助手中确定最后适配于当前用户进行语音交互服务的语音助手的。目标语音助手则是从这些多种类的语音助手中确定的、最终用于与用户进行人机交互的语音助手。例如,用户A经常使用工作语音助手,则在移动终端确定触发了预设触发事件且触发预设触发事件的是用户A,则可以确定工作语音助手为目标语音助手。
S204、获取使用状态信息。
使用状态信息可以指用户在使用移动终端以及没有使用移动终端所产生的数据,包括时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备。基于这些使用状态信息可以预判断移动终端所处的应用场景,基于移动终端上语音助手与应用场景的对应关系,可以确定当下应用场景最为适配的语音助手,这样便可以针对不同的应用场景提供不同的语音助手进行人机交互服务。对于使用状态信息的获取方式,时间、位置信息是移动终端上现有的数据,是可以直接从移动终端上获取到的。生物特征信息属于用户数据,在用户通过锁屏认证等方式录入指纹信息、声纹信息、人脸信息的情况下,可以直接从移动终端上获取到这些生物特征信息,基于这些生物特征信息移动终端可以确定当前用户是哪位,由此在提供语音助手功能时移动终端可以按照该用户的特点以及使用习惯提供适配于该用户的语音助手服务,这样可以提高用户满意度。
S205、基于使用状态信息判断应用场景。
使用状态信息包括时间、位置信息、生物特征信息、是否处于驾驶状态,和/或是否外接音频设备,基于这些使用状态信息可以确定移动终端的应用场景。若获取到的使用状态信息为时间,且移动终端判断获取到的时间处于预设事件时间段,则可以确定移动终端(用户)处于预设事件中。例如,若确定时间为工作时间段(工作日的9:00至18:00),则可以确定当前处于工作应用场景,对应的可以将移动终端上的工作语音助手确定为步骤S104中的目标语音助手。在另外的一些示例下,若获取到的使用状态信息包括时间、位置信息,且移动终端确定时间处于预设事件时间段,位置信息处于预设地址的一定范围,则才能确定移动终端(用户)处于预设事件中。例如,当位置信息为预设地点公司范围100米内,当前时间处于工作时间则可以确定当下处于工作应用场景。当然,在工作应用场景下,若检测到移动终端外接了音频设备,则移动终端可以将一般语音助手确定为目标语音助手,提供常规的语音服务。
在一些示例下,可以通过判断移动终端是否接入车载设备,或者移动终端位置的移动速度是否超过预设阈值等的方式来确定移动终端(用户)是否处于驾驶状态,若是则可以确定移动终端处于驾驶应用场景,若在该应用场景下确定检测到预设触发事件,则移动终端可以提供驾驶语音助手。在另外的一些示例下,可以通过获取到的用户的生物特征新信息确定移动终端的当前使用用户,为该用户提供其习惯使用的语音助手。
S206、根据应用场景更新目标语音助手。
基于生物特征信息确定目标语音助手是基于当前用户的使用习惯来进行确定的,是脱离应用场景的,可以理解的是在不同的应用场景中用户对语音助手能提供的需求是不同的,所以可以在步骤S205判断应用场景之后,可以基于应用场景进一步的确定目标语音助手并更新。
应用场景包括一般场景、工作应用场景,驾驶应用场景,户外应用场景,对应这些应用场景,移动终端中内置包括一般语音助手、工作语音助手、驾驶语音助手、户外语音助手,可以给用户提供语音助手交互服务。在这些应用场景下,移动终端还可以提供女声语音助手、男声语音助手、老年人语音助手以及儿童语音助手。在一些示例下,女声、男声、老年人、以及儿童语音助手是可以与一般语音助手、工作语音助手、驾驶语音助手、户外语音助手进行重叠提供语音服务的,例如,移动终端提供工作语音助手的同时可以以男声(男声语音助手)提供语音服务,在提供户外语音助手的同时可以以老年人语音助手提供语音服务。
S207、唤醒目标语音助手进行人机交互。
本申请提供的语音助手控制方法由于是检测到预设触发事件便获取生物特征信,并基于生物特征信息确定目标语音助手的,这使得最后确定用于人机交互的目标语音助手是适配于移动终端使用状态的,即能够满足移动终端所处场景的使用需求,可以解决现有技术中用户对不同的场景需要提供不同交互服务的技术问题。
本申请还提供一种移动终端设备,终端设备包括存储器、处理器,存储器上存储有语音助手控制程序,语音助手控制程序被处理器执行时实现上述任一实施例中的语音助手控制方法的步骤。
本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有语音助手控制程序,语音助手控制程序被处理器执行时实现上述任一实施例中的语音助手控制方法的步骤。
在本申请提供的移动终端和计算机可读存储介质的实施例中,包含了上述语音助手控制方法各实施例的全部技术特征,说明书拓展和解释内容与上述方法的各实施例基本相同,在此不做再赘述。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机执行如上各种可能的实施方式中的方法。
本申请实施例还提供一种芯片,包括存储器和处理器,存储器用于存储计算机程序,处理器用于从存储器中调用并运行计算机程序,使得安装有芯片的设备执行如上各种可能的实施方式中的方法。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请中,对于相同或相似的术语概念、技术方案和/或应用场景描述,一般只在第一次出现时进行详细描述,后面再重复出现时,为了简洁,一般未再重复阐述,在理解本申请技术方案等内容时,对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等,可以参考其之前的相关详细描述。
在本申请中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本申请技术方案的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本申请记载的范围。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本申请每个实施例的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种语音助手控制方法,其特征在于,所述方法包括:
S11、检测到预设触发事件,则获取使用状态信息;
S12、基于所述使用状态信息从至少一个语音助手中确定目标语音助手;
S13、唤醒所述目标语音助手进行人机交互。
2.如权利要求1所述的方法,其特征在于,包括以下至少一种:
所述使用状态信息包括以下至少一种:时间、位置信息、生物特征信息、是否处于驾驶状态、和/或是否外接音频设备;
所述目标语音助手包括以下至少一种:工作语音助手、驾驶语音助手、听障语音助手、儿童语音助手或老年人语音助手。
3.如权利要求1所述的方法,其特征在于,所述步骤S11中检测到预设触发事件包括以下至少一种:
采集语音信息,若判断所述语音信息中包括预设关键词,则确定检测到预设触发事件;
检测到使用状态信息满足预设条件,则确定检测到预设触发事件;
检测到语音助手模式切换为开启状态,则确定检测到预设触发事件。
4.如权利要求1至3中任一项所述的方法,其特征在于,包括以下至少一种:
所述步骤S12包括:基于所述使用状态信息判断应用场景,确定所述应用场景所对应的预设语音助手为所述目标语音助手;
所述步骤S13之前还包括:获取生物特征信息,基于所述生物特征信息调整所述目标语音助手的语音特点。
5.一种语音助手控制方法,其特征在于,所述方法包括:
S21、检测到预设触发事件,则获取生物特征信息;
S22、基于所述生物特征信息从至少一个语音助手中确定目标语音助手;
S23、唤醒所述目标语音助手进行人机交互。
6.如权利要求5所述的方法,其特征在于,所述步骤S21中检测到预设触发事件包括以下至少一种:
采集语音信息,若判断所述语音信息中包括预设关键词,则确定检测到预设触发事件;
检测到使用状态信息满足预设条件,则确定检测到预设触发事件;
检测到多语音助手模式切换为开启状态,则确定检测到预设触发事件。
7.如权利要求5或6所述的方法,其特征在于,包括以下至少一种:
所述目标语音助手包括以下至少一种:女声语音助手、男声语音助手、听障语音助手、儿童语音助手或老年人语音助手;
所述生物特征信息包括以下至少一种:声纹信息、指纹信息、人脸信息。
8.如权利要求7所述的方法,其特征在于,所述S22之后,所述语音助手控制方法还包括:
获取使用状态信息;
基于所述使用状态信息判断应用场景;
根据所述应用场景更新所述目标语音助手。
9.一种移动终端,其特征在于,所述移动终端包括:存储器、处理器,其中,所述存储器上存储有语音助手控制程序,所述语音助手控制程序被所述处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011331212.XA CN112489647A (zh) | 2020-11-24 | 2020-11-24 | 语音助手控制方法、移动终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011331212.XA CN112489647A (zh) | 2020-11-24 | 2020-11-24 | 语音助手控制方法、移动终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112489647A true CN112489647A (zh) | 2021-03-12 |
Family
ID=74933955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011331212.XA Pending CN112489647A (zh) | 2020-11-24 | 2020-11-24 | 语音助手控制方法、移动终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112489647A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113225433A (zh) * | 2021-03-26 | 2021-08-06 | 北京海纳川汽车部件股份有限公司 | 车辆语音提醒方法、装置、电子设备及存储介质 |
WO2022217590A1 (zh) * | 2021-04-16 | 2022-10-20 | 深圳传音控股股份有限公司 | 语音提示方法、终端及存储介质 |
-
2020
- 2020-11-24 CN CN202011331212.XA patent/CN112489647A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113225433A (zh) * | 2021-03-26 | 2021-08-06 | 北京海纳川汽车部件股份有限公司 | 车辆语音提醒方法、装置、电子设备及存储介质 |
WO2022217590A1 (zh) * | 2021-04-16 | 2022-10-20 | 深圳传音控股股份有限公司 | 语音提示方法、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109036420B (zh) | 一种语音识别控制方法、终端及计算机可读存储介质 | |
CN107807767B (zh) | 一种通讯业务的处理方法、终端及计算机可读存储介质 | |
CN108184023B (zh) | 屏幕状态控制方法、移动终端及计算机可读存储介质 | |
CN107463243B (zh) | 一种屏幕控制方法、移动终端和计算机可读存储介质 | |
CN107832032B (zh) | 锁屏显示方法及移动终端 | |
CN112533189A (zh) | 传输方法、移动终端及存储介质 | |
CN109302528B (zh) | 一种拍照方法、移动终端及计算机可读存储介质 | |
CN108376239B (zh) | 一种人脸识别方法、移动终端及存储介质 | |
CN108234751B (zh) | 一种自动检测危险方法、移动终端及计算机可读存储介质 | |
CN112612598A (zh) | 防沉迷方法、移动终端及计算机可读存储介质 | |
CN112489647A (zh) | 语音助手控制方法、移动终端及存储介质 | |
CN109683797B (zh) | 一种显示区控制方法、设备及计算机可读存储介质 | |
CN113314120B (zh) | 处理方法、处理设备及存储介质 | |
CN109167880B (zh) | 双面屏终端控制方法、双面屏终端及计算机可读存储介质 | |
CN112437472A (zh) | 一种网络切换方法、设备及计算机可读存储介质 | |
CN109561221B (zh) | 一种通话控制方法、设备及计算机可读存储介质 | |
CN109656498B (zh) | 一种显示控制方法、柔性屏终端及计算机可读存储介质 | |
CN107995365B (zh) | 终端输出提示音的方法、移动终端及计算机可读存储介质 | |
CN108134879B (zh) | 根据用户习惯调节移动终端状态的方法、移动终端及介质 | |
CN107315523B (zh) | 一种分屏处理方法、移动终端及计算机可读存储介质 | |
CN112532787B (zh) | 耳机音频数据处理方法、移动终端及计算机可读存储介质 | |
CN115277922A (zh) | 处理方法、智能终端及存储介质 | |
CN114095617A (zh) | 噪音处理方法、智能终端及存储介质 | |
CN110287381B (zh) | 页面控件节点的查找方法、终端及计算机可读存储介质 | |
CN109451181B (zh) | 信息显示方法、双屏移动终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |