CN110428831A - 一种语音助手多场景交互方法 - Google Patents
一种语音助手多场景交互方法 Download PDFInfo
- Publication number
- CN110428831A CN110428831A CN201910679628.1A CN201910679628A CN110428831A CN 110428831 A CN110428831 A CN 110428831A CN 201910679628 A CN201910679628 A CN 201910679628A CN 110428831 A CN110428831 A CN 110428831A
- Authority
- CN
- China
- Prior art keywords
- voice
- state
- scene
- mobile phone
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000003825 pressing Methods 0.000 claims abstract description 17
- 238000011017 operating method Methods 0.000 claims abstract description 7
- 239000000725 suspension Substances 0.000 claims abstract description 6
- 230000004913 activation Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000002618 waking effect Effects 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72469—User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72484—User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种语音助手多场景交互方法,具体涉及智能语音领域,一种语音助手多场景交互方法,包括单击输入状态和长按输入状态,语音助手多场景交互方法包括以下操作步骤:S1、首先进行输入语音内容,语音进行自动识别并储存,S2、然后用户根据需求,单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理;本发明通过悬浮框或实体按键的长按、短按,用户可以自由选择使用哪种方案;悬浮按钮会根据不同应用场景,展示不同方式及交互方式,语音助手反馈会根据不同场景而反馈不同形式。
Description
技术领域
本发明涉及智能语音技术领域,更具体地说,本发明涉及一种语音助手多场景交互方法。
背景技术
语音助手已经逐渐成为手机随机标配系统。智能语音在家居、智能穿戴设备上也开始了长足的发展。
但目前智能语音交互方案主要还停留在两个方向,1.纯语音输入输出交互2.类siri独立语音助手交互体系。目前认为智能语音应该是个建立在现有GUI体系下的一套辅助GUI的系统。在不同GUI场景下,语音助手的显示及辅助方式应该是不同的,另外目前存在两种语音助手使用逻辑:1.问答逻辑;2.先记录后推荐逻辑。
无论上述的语音方案还是语音逻辑在使用过程中只能采取一种语音功能,导致在使用过程中的灵活性差,无法针对实际情况得到最符合用户目前状态的帮助,实用价值低。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种语音助手多场景交互方法,通过悬浮框或实体按键的长按、短按,用户可以自由选择使用哪种方案,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种语音助手多场景交互方法,包括单击输入状态和长按输入状态,语音助手多场景交互方法包括以下操作步骤:
S1、首先进行输入语音内容,语音进行自动识别并储存,
S2、然后用户根据需求,单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理;
S3、根据用户需求,长按唤醒语音系统并根据手机场景模块对S1中语音信息进行智能语音处理。
智能语音问答模块包括以下操作步骤:
A1、根据手机场景模块的不同,智能语音系统自动识别场景;
A2、智能语音系统场景模块的不同,给予相对应的声音画面回复;
其中,场景模块包括远程状态、息屏状态、锁屏状态、桌面状态和应用使用状态,所述远程状态无法使用长按唤醒输入方式。
在一个优选地实施方式中,所述智能语音问答模块操作包括以下步骤:
B1、用户语音唤醒语音系统,此时根据语音场景提供对应的悬浮框对语音进行展示;
B2、无法识别并提醒用户二次按键发出语音指示或识别指示并完成指示等待下步指示;
B3、三秒内无指示将关闭悬浮框和语音系统,三秒内有指示将回到B2回答问题并等待下步指示。
在一个优选地实施方式中,传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态,对于记录进行处理的逻辑,语音记录悬浮框位于最上层。
在一个优选地实施方式中,所述远程状态为手机远离用户状态,所述息屏状态为手机屏幕关闭状态,所述锁屏状态为手机屏幕打开锁定状态,所述桌面状态为手机解锁为使用应用状态,所述应用使用状态为手机应用使用状态。
在一个优选地实施方式中,所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关,当打开悬浮框状态后,唤醒语音系统时。
在一个优选地实施方式中,长按输入方式可以为包括对悬浮键的长时间点击输入方式、底部输入键长按输入方式和特定声音词输入方式中的其中一种。
本发明的技术效果和优点:
1、本发明同时存在两种智能语音交互逻辑,灵活性强;
2、本发明通过悬浮框或实体按键的长按方式、短按方式,用户可以自由选择使用哪种方案;
3、本发明悬浮按钮会根据不同应用场景,展示不同方式及交互方式。
4、本发明语音助手反馈会根据不同场景而反馈不同形式,根据语音内容的不同,反馈不同形式,然后用户可以通过GUI或语音的方式进行交互。
附图说明
图1为本发明的案件语音输入流程示意图。
图2为本发明的底部键输入流程示意图。
图3为本发明的悬浮键输入流程示意图。
图4为本发明的智能语音问答模块框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如附图1与附图4所示的一种语音助手多场景交互方法,包括单击输入状态和长按输入状态,语音助手多场景交互方法包括以下操作步骤:
S1、首先进行输入语音内容,语音进行自动识别并储存,
S2、然后用户根据需求,单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理;
S3、根据用户需求,长按唤醒语音系统并根据手机场景模块对S1中语音信息进行智能语音处理。
智能语音问答模块包括以下操作步骤:
A1、根据手机场景模块的不同,智能语音系统自动识别场景;
A2、智能语音系统场景模块的不同,给予相对应的声音画面回复;
其中,场景模块包括远程状态、息屏状态、锁屏状态、桌面状态和应用使用状态,所述远程状态无法使用长按唤醒输入方式。
在一个优选地实施方式中,所述智能语音问答模块操作包括以下步骤:
B1、用户语音唤醒语音系统,此时根据语音场景提供对应的悬浮框对语音进行展示;
B2、无法识别并提醒用户二次按键发出语音指示或识别指示并完成指示等待下步指示;
B3、三秒内无指示将关闭悬浮框和语音系统,三秒内有指示将回到B2回答问题并等待下步指示。
传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态,对于记录进行处理的逻辑,语音记录悬浮框位于最上层,所述远程状态为手机远离用户状态,所述息屏状态为手机屏幕关闭状态,所述锁屏状态为手机屏幕打开锁定状态,所述桌面状态为手机解锁为使用应用状态,所述应用使用状态为手机应用使用状态,所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关,当打开悬浮框状态后,唤醒语音系统时,长按输入方式可以为包括对悬浮键的长时间点击输入方式。
实施例2
具体与实施例1的区别为底部输入键长按方式。
实施例3
具体与实施例1的区别为特定声音词输入方式
采用上述技术手段,将长按方式扩展为三种手段激活,极大的增加了该装置激活的灵活性,方便了用户根据自己来决定实用哪种技术手段,极大的增加了该装置的便捷性。
最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种语音助手多场景交互方法,包括单击输入状态和长按输入状态,其特征在于:语音助手多场景交互方法包括以下操作步骤:
S1、首先进行输入语音内容,语音进行自动识别并储存,
S2、然后用户根据需求,单击唤醒语音系统并对储存的对S1中语音信息进行传统语音方式处理;
S3、根据用户需求,长按唤醒语音系统并根据手机场景模块对S1中语音信息进行智能语音处理。
智能语音问答模块包括以下操作步骤:
A1、根据手机场景模块的不同,智能语音系统自动识别场景;
A2、智能语音系统场景模块的不同,给予相对应的声音画面回复;
其中,场景模块包括远程状态、息屏状态、锁屏状态、桌面状态和应用使用状态,所述远程状态无法使用长按唤醒输入方式。
2.根据权利要求1所述的一种语音助手多场景交互方法,其特征在于:所述智能语音问答模块操作包括以下步骤:
B1、用户语音唤醒语音系统,此时根据语音场景提供对应的悬浮框对语音进行展示;
B2、无法识别并提醒用户二次按键发出语音指示或识别指示并完成指示等待下步指示;
B3、三秒内无指示将关闭悬浮框和语音系统,三秒内有指示将回到B2回答问题并等待下步指示。
3.根据权利要求1所述的一种语音助手多场景交互方法,其特征在于:传统语音系统的语音语意处理和对记录进行语音语意处理的方式是出于两种不同UI状态,对于记录进行处理的逻辑,语音记录悬浮框位于最上层。
4.根据权利要求1所述的一种语音助手多场景交互方法,其特征在于:所述远程状态为手机远离用户状态,所述息屏状态为手机屏幕关闭状态,所述锁屏状态为手机屏幕打开锁定状态,所述桌面状态为手机解锁为使用应用状态,所述应用使用状态为手机应用使用状态。
5.根据权利要求1所述的一种语音助手多场景交互方法,其特征在于:所述智能语音系统中激活的悬浮框在语音激活逻辑前可以自主设置开关,当打开悬浮框状态后,唤醒语音系统时。
6.根据权利要求1所述的一种语音助手多场景交互方法,其特征在于:长按输入方式可以为包括对悬浮键的长时间点击输入方式、底部输入键长按输入方式和特定声音词输入方式中的其中一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910679628.1A CN110428831A (zh) | 2019-07-26 | 2019-07-26 | 一种语音助手多场景交互方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910679628.1A CN110428831A (zh) | 2019-07-26 | 2019-07-26 | 一种语音助手多场景交互方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110428831A true CN110428831A (zh) | 2019-11-08 |
Family
ID=68412476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910679628.1A Pending CN110428831A (zh) | 2019-07-26 | 2019-07-26 | 一种语音助手多场景交互方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110428831A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013037097A (ja) * | 2011-08-05 | 2013-02-21 | Seiko Epson Corp | 音声処理装置 |
CN204206278U (zh) * | 2014-11-28 | 2015-03-11 | 朱卫军 | 一种便于控制语音助手的手机 |
CN107644642A (zh) * | 2017-09-20 | 2018-01-30 | 广东欧珀移动通信有限公司 | 语义识别方法、装置、存储介质及电子设备 |
CN109036411A (zh) * | 2018-09-05 | 2018-12-18 | 深圳市友杰智新科技有限公司 | 一种智能终端语音交互控制方法及装置 |
CN109669754A (zh) * | 2018-12-25 | 2019-04-23 | 苏州思必驰信息科技有限公司 | 语音交互窗口的动态显示方法、具有伸缩式交互窗口的语音交互方法及装置 |
CN109801625A (zh) * | 2018-12-29 | 2019-05-24 | 百度在线网络技术(北京)有限公司 | 虚拟语音助手的控制方法、装置、用户设备及存储介质 |
-
2019
- 2019-07-26 CN CN201910679628.1A patent/CN110428831A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013037097A (ja) * | 2011-08-05 | 2013-02-21 | Seiko Epson Corp | 音声処理装置 |
CN204206278U (zh) * | 2014-11-28 | 2015-03-11 | 朱卫军 | 一种便于控制语音助手的手机 |
CN107644642A (zh) * | 2017-09-20 | 2018-01-30 | 广东欧珀移动通信有限公司 | 语义识别方法、装置、存储介质及电子设备 |
CN109036411A (zh) * | 2018-09-05 | 2018-12-18 | 深圳市友杰智新科技有限公司 | 一种智能终端语音交互控制方法及装置 |
CN109669754A (zh) * | 2018-12-25 | 2019-04-23 | 苏州思必驰信息科技有限公司 | 语音交互窗口的动态显示方法、具有伸缩式交互窗口的语音交互方法及装置 |
CN109801625A (zh) * | 2018-12-29 | 2019-05-24 | 百度在线网络技术(北京)有限公司 | 虚拟语音助手的控制方法、装置、用户设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI469910B (zh) | 簡單節點式運輸系統之控制方法與裝置 | |
CN104951093B (zh) | 通过自定义按键实现调用程序或功能的移动终端及其方法 | |
CN105957530A (zh) | 一种语音控制方法、装置和终端设备 | |
CN105468145A (zh) | 一种基于手势和语音识别的机器人人机交互方法和装置 | |
CN107430501A (zh) | 对语音触发进行响应的竞争设备 | |
CN104599669A (zh) | 一种语音控制方法和装置 | |
CN106067873A (zh) | 电子设备及其呼叫处理方法 | |
CN104965596A (zh) | 语音操控系统 | |
CN105354003B (zh) | 一种基于移动终端和车载终端互联的显示方法及装置 | |
CN103477590B (zh) | 基于管理规则的配置方法和设备 | |
CN109474658A (zh) | 用外部设备支持任务运行的电子设备、服务器和记录介质 | |
CN106681160A (zh) | 智能设备控制方法及装置 | |
CN107808191A (zh) | 虚拟人多模态交互的输出方法和系统 | |
CN108377422A (zh) | 一种多媒体内容的播放控制方法、装置及存储介质 | |
CN109450745A (zh) | 信息处理方法、装置、智能控制系统以及智能网关 | |
WO2017141530A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN109616111A (zh) | 一种基于语音识别的场景交互控制方法 | |
CN106339384A (zh) | 存储过程的转换方法及装置 | |
WO2019140697A1 (zh) | 一种对讲分机智能机器人装置 | |
CN112054946B (zh) | 一种基于多模态信息融合的智能家居控制方法及其系统 | |
CN108648754A (zh) | 语音控制方法及装置 | |
CN104252287A (zh) | 一种交互装置和基于交互装置的提高表达能力的方法 | |
CN110853430B (zh) | 基于智能家居的学习辅导方法、设备及存储介质 | |
CN103176698A (zh) | 在输入法面板上动态显示执行操作按钮的方法及系统 | |
TW201145991A (en) | Method of storing control signals of remote device and an electronic device using the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191108 |
|
WD01 | Invention patent application deemed withdrawn after publication |