CN109683792A - 一种语音交互方法、装置、存储介质及移动终端 - Google Patents
一种语音交互方法、装置、存储介质及移动终端 Download PDFInfo
- Publication number
- CN109683792A CN109683792A CN201811575125.1A CN201811575125A CN109683792A CN 109683792 A CN109683792 A CN 109683792A CN 201811575125 A CN201811575125 A CN 201811575125A CN 109683792 A CN109683792 A CN 109683792A
- Authority
- CN
- China
- Prior art keywords
- voice
- press event
- screen press
- mobile terminal
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 230000003993 interaction Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 6
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 230000001960 triggered effect Effects 0.000 abstract description 9
- 238000003825 pressing Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/041—Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
- G06F3/0414—Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means using force sensing means to determine a position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例提供一种语音交互方法、装置、存储介质及移动终端,所述方法包括:检测屏幕按压事件;若所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;待所述屏幕按压事件结束,对所述语音内容进行识别,得到识别结果;根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。本申请所提供的语音交互方法,将压力触控技术应用到语音交互中,能够根据用户在移动终端屏幕上的按压操作触发语音交互,帮助用户精确指定语音交互的操作对象和语音交互的起始点及终止点,有效提高了语音交互的使用效率、提升了移动终端的用户体验。
Description
技术领域
本申请属于语音处理技术领域,具体涉及一种语音交互方法、装置、存储介质及移动终端。
背景技术
随着移动终端技术的快速发展,语音交互在移动终端上的普及程度越来越广,成为用户在使用移动终端时经常使用的主流交互方式之一。
但是目前常用的语音交互方式还存在语音操作对象难以精确指定和语音交互起始点和结束点难以明确的问题,影响了语音交互的使用效率和用户体验。
发明内容
本申请实施例提供一种语音交互方法,能够精确指定用户与移动终端进行语音交互时语音操作的对象,提升语音交互的使用效率和移动终端的用户体验。
第一方面,本申请实施例提供一种语音交互方法,应用于移动终端,包括:
检测屏幕按压事件;
若所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待所述屏幕按压事件结束,对所述语音内容进行识别,得到识别结果;
根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
第二方面,本申请实施例提供一种语音交互装置,应用于移动终端,包括:
检测模块,用于检测屏幕按压事件;
语音输入模块,用于当所述屏幕按压事件发生的位置支持语音操作时启动语音侦听,以接收用户输入的语音内容;
语音识别模块,用于待所述屏幕按压事件结束后对所述语音内容进行识别,得到识别结果;
执行模块,用于根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例第一方面提供的所述语音交互方法。
第四方面,本申请实施例提供一种移动终端,所述移动终端包括处理器和存储器,所述存储器用于存储可执行程序代码,所述处理器通过读取所述存储器中存储的可执行程序代码以执行以下步骤:
检测屏幕按压事件;
若所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待所述屏幕按压事件结束,对所述语音内容进行识别,得到识别结果;
根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
本申请所提供的语音交互方法,将压力触控技术应用到语音交互中,能够根据用户在移动终端屏幕上的按压操作触发语音交互,帮助用户精确指定语音交互的操作对象和语音交互的起始点及终止点,有效提高了语音交互的使用效率、提升了移动终端的用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的语音交互方法的一种流程示意图;
图2是本申请实施例提供的语音交互方法的一个使用场景示意图;
图3是本申请实施例提供的语音交互方法的另一个使用场景示意图;
图4是本申请实施例提供的语音交互方法的另一种流程示意图;
图5是本申请实施例提供的语音交互装置的结构示意图;
图6是本申请实施例提供的移动终端的一种结构示意图;
图7是本申请实施例提供的移动终端的另一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种语音交互方法、装置、存储介质及移动终端,以下分别进行详细说明。
为便于理解本申请的技术方案,以下先对本申请的技术方案和语音交互的相关背景做简单介绍:
用户在使用带触控屏幕的移动终端(如平板电脑、智能手机和智能手表等)时,一般以触控交互为主。通常状况下,用户为了达到某个操作目的,如果采用触控交互,需要执行多步触控操作。比如用户想用智能手机打电话给联系人X,需要先打开通讯录,然后在联系人列表中找到联系人X,点击进入联系人X的详细信息页面,最后点击拨号,非常繁琐。但是如果采用语音交互,则只需要开启语音交互后,说出类似“打电话给X”的指令即可,非常方便,因此语音交互在移动终端上得以普及。
当前语音交互在移动终端上的普及程度越来越广,成为用户在使用移动终端时经常使用的主流交互方式之一。但是目前的语音交互技术还面临着许多问题,比如语音操作对象难以精确指定、语音交互起始点和结束点难以明确,这些问题影响着语音交互的使用效率和用户体验。而本申请的技术方案将压力触控技术应用到语音交互中,帮助用户精确指定语音交互的操作对象和语音交互的起始点及结束点,为用户更有效率地使用语音交互功能提供帮助。
请参阅图1,图1为本申请实施例提供的语音交互方法的一种流程示意图。该语音交互方法可以应用于移动终端,该语音交互方法的流程可以包括:
步骤101,检测屏幕按压事件。
本申请实施例中,移动终端的语音交互是由用户按压屏幕上的某个元素所触发的,故需要检测该移动终端的屏幕上是否有按压操作,此步骤主要由压力触控输入模块(Force Touch)完成。
在一种实施方式中,压力触控模块可以由触摸屏(Touch Panel)和压力传感器(Force Touch Sensor)组成。当用户按压该触摸屏上的某个元素时,该压力传感器可以获取到用户按压的强度,通过该移动终端的事件系统,用户按压操作的位置和按压强度将被上报给移动终端。
步骤102,若该屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容。
本申请实施例中,用户可以按压移动终端屏幕上的任意位置,每个位置都有其对应的用户界面(User Interface,UI)组件,但并不是每个用户界面组件都支持语音操作。比如,若用户此时在使用平板电脑进行微信通讯,则在聊天页面,除了页面顶部的菜单栏和页面底部的输入框,中间的空白部分是不支持语音操作的。若用户在移动终端的屏幕上按压的位置所对应的用户界面组件支持语音操作,亦即该屏幕按压事件发生的位置支持语音操作,则会触发该移动终端的语音交互,该移动终端将启动语音侦听,以便接收用户输入的语音内容。
步骤103,待该屏幕按压事件结束,对该语音内容进行识别,得到识别结果。
本申请实施例中,若用户触发移动终端的语音交互后,持续按压该移动终端的屏幕,则该移动终端默认用户还未完成语音输入,将持续开启语音侦听。当该移动终端检测到该屏幕按压事件结束,则该移动终端判断用户已完成语音输入,将关闭语音侦听,对用户已经输入的语音内容执行下一步的识别操作并得到识别结果。
在一种实施方式中,为了节约移动终端的功耗,该移动终端可以设置一个屏幕按压事件持续时长的上限阈值,比如两分钟。当该屏幕按压事件的持续时长超过该上限阈值,则认为该屏幕按压事件属于用户误触,而不是用户想要执行的触发移动终端的语音交互的操作。
步骤104,根据该识别结果和该屏幕按压事件发生的位置执行相应的操作。
本申请实施例中,移动终端的语音交互是由用户按压屏幕上的某个元素所触发的,将用户所触发的屏幕按压事件在屏幕上发生的位置所对应的对象作为该移动终端的语音交互的操作对象,因此可以精确指定该移动终端的语音交互的操作对象;移动终端根据用户输入的该语音内容的识别结果,对用户所触发的屏幕按压事件在屏幕上发生的位置所对应的对象执行相应的操作,因此可以精确指定该移动终端的语音交互的起始点和结束点。
请参阅图2至图3,图2至图3为本申请实施例提供的语音交互方法的一个使用场景示意图。
用户想使用智能手机约朋友张三到家里看球,可以打开通讯录,在通讯录列表中找到联系人“张三”,然后按压屏幕上显示“张三”的位置,如图2所示。此时智能手机检测到屏幕按压事件,并且该屏幕按压事件发生的位置支持语音操作,则该智能手机开启语音侦听。用户说出“晚上来我家一起看球”的语音内容,被该智能手机侦听到,经过识别,该智能手机将执行给“张三”发送短信息“晚上来我家一起看球”的操作,如图3所示。用户只需在短信息发送页面点击发送按钮来确认操作即可。
本申请所提供的语音交互方法,将压力触控技术应用到语音交互中,能够根据用户在移动终端屏幕上的按压操作触发语音交互,帮助用户精确指定语音交互的操作对象和语音交互的起始点及终止点,有效提高了语音交互的使用效率、提升了移动终端的用户体验。
在一种实施方式中,对该语音内容进行识别,得到识别结果,包括:对该语音内容进行语音识别,得到该语音内容对应的文字内容;对该文字内容进行语义解析,得到该文字内容对应的解析结果;将该解析结果作为该识别结果。
在一种实施方式中,对该语音内容进行语音识别,包括:判断该移动终端本地是否存在离线语音识别模型;若是,则调用该离线语音识别模型对该语音内容进行语音识别。
在一种实施方式中,判断该移动终端本地是否存在离线语音识别模型之后,还包括:若否,则连接云端语音识别服务器对该语音内容进行语音识别。
在一种实施方式中,检测屏幕按压事件之后,还包括:判断该屏幕按压事件是否满足预设条件;若该屏幕按压事件满足该预设条件且该屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容。
在一种实施方式中,该预设条件,包括:该屏幕按压事件的持续时长达到第一预设值或该屏幕按压事件的压力值达到第二预设值或该屏幕按压事件的持续时长达到第一预设值且该屏幕按压事件的压力值达到第二预设值。
请参阅图4,图4为本申请实施例提供的语音交互方法的另一种流程示意图。该语音交互方法可以应用于移动终端,该语音交互方法的流程可以包括:
步骤401,检测屏幕按压事件。
本申请实施例中,移动终端的语音交互是由用户按压屏幕上的某个元素所触发的,故需要检测该移动终端的屏幕上是否有按压操作,此步骤主要由压力触控输入模块(Force Touch)完成。
在一种实施方式中,压力触控模块可以由触摸屏(Touch Panel)和压力传感器(Force Touch Sensor)组成。当用户按压该触摸屏上的某个元素时,该压力传感器可以获取到用户按压的强度,通过该移动终端的事件系统,用户触控操作的位置和按压强度将被上报给移动终端。
步骤402,判断该屏幕按压事件是否满足预设条件。是则执行步骤403,否则返回步骤401。
本申请实施例中,为避免移动终端将用户误触屏幕和用户在屏幕上的点击操作误判为语音交互的触发信号,可以设置一个预设条件。若该屏幕按压事件满足该预设条件,则该移动终端将该屏幕按压事件识别为语音交互的触发信号,执行下一步操作;若该屏幕按压事件不满足该预设条件,则该移动终端不将该屏幕按压事件识别为语音交互的触发信号,继续检测下一个屏幕按压事件。
在一种实施方式中,可以将该预设条件设为该屏幕按压事件的持续时长达到第一预设值,亦即为该屏幕按压事件的持续时长设置一个第一下限阈值。当用户按压该移动终端的屏幕的时间超过该第一下限阈值时,该移动终端将确认用户需要采用语音交互。
在一种实施方式中,可以将该预设条件设为该屏幕按压事件的压力值达到第二预设值,亦即为该屏幕按压事件的压力值设置一个第二下限阈值。当用户按压该移动终端的屏幕的力度超过该第二下限阈值时,该移动终端将确认用户需要采用语音交互。
需要说明的是,本申请实施例中的预设条件并不限于此,还可以是其他方式,比如可以将该预设条件设为该屏幕按压事件的持续时长达到第一预设值且该屏幕按压事件的压力值达到第二预设值。当用户按压该移动终端的屏幕的时间超过该第一下限阈值(第一预设值)且用户按压该移动终端的屏幕的力度超过该第二下限阈值(第二预设值)时,该移动终端将确认用户需要采用语音交互。
步骤403,判断该屏幕按压事件发生的位置是否支持语音操作。是则执行步骤404,否则返回步骤401。
本申请实施例中,用户可以按压移动终端屏幕上的任意位置,每个位置都有其对应的用户界面(UI,User Interface)组件,但并不是每个用户界面组件都支持语音操作。比如,若用户此时在使用平板电脑进行微信通讯,则在聊天页面,除了页面顶部的菜单栏和页面底部的输入框,中间的空白部分是不支持语音操作的。若用户在移动终端的屏幕上按压的位置所对应的用户界面组件支持语音操作,亦即该屏幕按压事件发生的位置支持语音操作,则会触发该移动终端的语音交互,该移动终端将执行下一步操作;若用户在移动终端的屏幕上按压的位置所对应的用户界面组件不支持语音操作,亦即该屏幕按压事件发生的位置不支持语音操作,则不会触发该移动终端的语音交互,该移动终端将继续检测下一个屏幕按压事件。
步骤404,启动语音侦听以接收用户输入的语音内容。
本申请实施例中,若该屏幕按压事件满足预设条件且该屏幕按压事件发生的位置支持语音操作,则该移动终端启动语音侦听,接收用户输入的语音内容。
步骤405,判断该屏幕按压事件是否结束。是则执行步骤406,否则执行步骤404。
本申请实施例中,若用户触发移动终端的语音交互后,持续按压该移动终端的屏幕,则该移动终端默认用户还未完成语音输入,将持续开启语音侦听。当该移动终端检测到该屏幕按压事件结束,则该移动终端判断用户已完成语音输入,将关闭语音侦听,对用户已经输入的语音内容执行下一步操作。
在一种实施方式中,为了节约移动终端的功耗,该移动终端可以设置一个屏幕按压事件持续时长的上限阈值,比如两分钟。当该屏幕按压事件的持续时长超过该上限阈值,则认为该屏幕按压事件属于用户误触,而不是用户想要执行的触发该移动终端的语音交互的操作。
步骤406,对用户输入的该语音内容进行语音识别。
本申请实施例中,当屏幕按压事件结束后,移动终端默认用户已完成语音输入,将关闭语音侦听,对用户输入的语音内容进行语音识别,得到该语音内容相对应的文字内容。
在一种实施方式中,该语音识别过程可以由移动终端本地的离线语音识别模型完成;在一种实施方式中,该语音识别过程也可以由云端语音识别服务器完成。
步骤407,对该语音识别的结果进行语义解析。
本申请实施例中,当用户输入的该语音内容经过语音识别,得到该语音内容相对应的文字内容后,移动终端将会对该文字内容进行语义解析,得到该文字内容相对应的解析结果。
在一种实施方式中,该解析结果以XML或JSON格式呈现,包括语义所属的类型、意图(intent)和实体(entity),以便该移动终端根据该解析结果执行相应的操作。
步骤408,根据该语义解析的结果执行相应的操作。
本申请实施例中,移动终端的语音交互是由用户按压屏幕上的某个元素所触发的,将用户所触发的屏幕按压事件在屏幕上发生的位置所对应的对象作为该移动终端的语音交互的操作对象,因此可以精确指定该移动终端的语音交互的操作对象;移动终端根据用户输入的该语音内容的识别结果,对用户所触发的屏幕按压事件在屏幕上发生的位置所对应的对象执行相应的操作,因此可以精确指定该移动终端的语音交互的起始点和结束点。
请参阅图5,图5是本申请实施例提供的语音交互装置的结构示意图。该语音交互装置可以应用于移动终端,该语音交互装置可以包括:检测模块501、语音输入模块502、语音识别模块503和执行模块504。
检测模块501,用于检测屏幕按压事件;
语音输入模块502,用于当该屏幕按压事件发生的位置支持语音操作时启动语音侦听,以接收用户输入的语音内容;
语音识别模块503,用于待该屏幕按压事件结束后对该语音内容进行识别,得到识别结果
执行模块504,用于根据该识别结果和该屏幕按压事件发生的位置执行相应的操作。
在一种实施方式中,在对该语音内容进行识别,得到识别结果时,语音识别模块503可以用于:对该语音内容进行语音识别,得到该语音内容对应的文字内容;对该文字内容进行语义解析,得到该文字内容对应的解析结果;将该解析结果作为该识别结果。
在一种实施方式中,在对该语音内容进行语音识别时,语音识别模块503可以用于:判断该移动终端本地是否存在离线语音识别模型;若是,则调用该离线语音识别模型对该语音内容进行语音识别。
在一种实施方式中,在判断该移动终端本地是否存在离线语音识别模型之后,语音识别模块503还可以用于:若否,则连接云端语音识别服务器对该语音内容进行语音识别。
在一种实施方式中,在检测屏幕按压事件之后,检测模块501还可以用于:判断该屏幕按压事件是否满足预设条件;若该屏幕按压事件满足该预设条件且该屏幕按压事件发生的位置支持语音操作,则语音输入模块502启动语音侦听,以接收用户输入的语音内容。
在一种实施方式中,该预设条件,包括:该屏幕按压事件的持续时长达到第一预设值或该屏幕按压事件的压力值达到第二预设值或该屏幕按压事件的持续时长达到第一预设值且该屏幕按压事件的压力值达到第二预设值。
本申请实施例提供一种计算机可读的存储介质,其上存储有计算机程序,当该计算机程序在计算机上执行时,使得该计算机执行如本申请实施例第一方面提供的语音交互方法中的步骤。
本申请实施例还提供一种移动终端,包括存储器,处理器,该处理器通过调用该存储器中存储的计算机程序,用于执行本申请实施例提供的语音交互方法中的步骤。
请参阅图6,图6为本申请实施例提供的移动终端的一种结构示意图。移动终端可以包括存储器601和处理器602等部件。本领域技术人员可以理解,图6中示出的移动终端结构并不构成对该移动终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储器601可以用于存储应用程序和数据。存储器601存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器602通过运行存储在存储器601内的应用程序,从而执行各种功能应用以及数据处理。
处理器602是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器601内的应用程序,以及调用存储在存储器601内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。
在本申请实施例中,移动终端中的处理器602会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器601中,并由处理器602来运行存储在存储器601中的应用程序,从而执行:
检测屏幕按压事件;
若该屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待该屏幕按压事件结束,对该语音内容进行识别,得到识别结果;
根据该识别结果和该屏幕按压事件发生的位置执行相应的操作。
请参阅图7,图7为本申请实施例提供的移动终端的另一种结构示意图。与图6所示移动终端的区别在于,移动终端除了存储器601和处理器602,还可以包括输入单元603、输出单元604和电源605等部件。
其中,输入单元603可用于接收输入的数字、字符信息或用户特征信息(比如指纹、声纹、人脸信息或虹膜信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入等。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器602,并能接收处理器602发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
输出单元604可用于输出由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。输出单元604可包括扬声器和显示面板等,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。
进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器602以确定触摸事件的类型,随后处理器602根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图7中,触敏表面与显示面板是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
移动终端还包括给各个部件供电的电源605(比如电池),优选的,电源可以通过电源管理系统与处理器602逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源605还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,移动终端中的处理器602会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器601中,并由处理器602来运行存储在存储器601中的应用程序,从而执行:
检测屏幕按压事件;
若该屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待该屏幕按压事件结束,对该语音内容进行识别,得到识别结果;
根据该识别结果和该屏幕按压事件发生的位置执行相应的操作。
在一种实施方式中,在对该语音内容进行识别,得到识别结果时,处理器602可以执行:对该语音内容进行语音识别,得到该语音内容对应的文字内容;对该文字内容进行语义解析,得到该文字内容对应的解析结果;将该解析结果作为该识别结果。
在一种实施方式中,在对该语音内容进行语音识别时,处理器602可以执行:判断该移动终端本地是否存在离线语音识别模型;若是,则调用该离线语音识别模型对该语音内容进行语音识别。
在一种实施方式中,在判断该移动终端本地是否存在离线语音识别模型之后,处理器602还可以执行:若否,则连接云端语音识别服务器对该语音内容进行语音识别。
在一种实施方式中,在检测屏幕按压事件之后,处理器602还可以执行:判断该屏幕按压事件是否满足预设条件;若该屏幕按压事件满足该预设条件且该屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容。
在一种实施方式中,该预设条件,包括:该屏幕按压事件的持续时长达到第一预设值或该屏幕按压事件的压力值达到第二预设值或该屏幕按压事件的持续时长达到第一预设值且该屏幕按压事件的压力值达到第二预设值。
本申请实施例提供的移动终端与上文实施例中的语音交互方法属于同一构思,在该移动终端上可以运行该语音交互方法实施例中提供的任一方法,其具体实现过程详见该语音交互方法实施例,此处不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对语音交互方法的详细描述,此处不再赘述。
需要说明的是,对本申请实施例提供的语音交互方法而言,本领域普通技术人员可以理解实现本申请实施例提供的语音交互方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,如存储在存储器中,并被至少一个处理器执行,在执行过程中可包括如该语音交互方法的实施例的流程。其中,该存储介质可为磁碟、光盘、只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)等。
对本申请实施例的该语音交互装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。该集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,该存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种语音交互方法、装置、存储介质以及移动终端进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种语音交互方法,应用于移动终端,其特征在于,包括:
检测屏幕按压事件;
若所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待所述屏幕按压事件结束,对所述语音内容进行识别,得到识别结果;
根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音内容进行识别,得到识别结果,包括:
对所述语音内容进行语音识别,得到所述语音内容对应的文字内容;
对所述文字内容进行语义解析,得到所述文字内容对应的解析结果;
将所述解析结果作为所述识别结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述语音内容进行语音识别,包括:
判断所述移动终端本地是否存在离线语音识别模型;
若是,则调用所述离线语音识别模型对所述语音内容进行语音识别。
4.根据权利要求3所述的方法,其特征在于,所述判断所述移动终端本地是否存在离线语音识别模型之后,还包括:
若否,则连接云端语音识别服务器对所述语音内容进行语音识别。
5.根据权利要求1所述的方法,其特征在于,所述检测屏幕按压事件之后,还包括:
判断所述屏幕按压事件是否满足预设条件;
若所述屏幕按压事件满足所述预设条件且所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容。
6.根据权利要求5所述的方法,其特征在于,所述预设条件,包括:
所述屏幕按压事件的持续时长达到第一预设值和/或所述屏幕按压事件的压力值达到第二预设值。
7.一种语音交互装置,应用于移动终端,其特征在于,包括:
检测模块,用于检测屏幕按压事件;
语音输入模块,用于当所述屏幕按压事件发生的位置支持语音操作时启动语音侦听,以接收用户输入的语音内容;
语音识别模块,用于待所述屏幕按压事件结束后对所述语音内容进行识别,得到识别结果;
执行模块,用于根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
8.根据权利要求7所述的装置,其特征在于,所述语音识别模块,包括:
语音识别单元,用于对所述语音内容进行语音识别,得到所述语音内容对应的文字内容;
语义解析单元,用于对所述文字内容进行语义解析,得到所述文字内容对应的解析结果。
9.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至6任一项所述的语音交互方法中的步骤。
10.一种移动终端,所述移动终端包括处理器和存储器;其中,所述存储器用于存储可执行程序代码,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以执行以下步骤:
检测屏幕按压事件;
若所述屏幕按压事件发生的位置支持语音操作,则启动语音侦听,以接收用户输入的语音内容;
待所述屏幕按压事件结束,对所述语音内容进行识别,得到识别结果;
根据所述识别结果和所述屏幕按压事件发生的位置执行相应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811575125.1A CN109683792A (zh) | 2018-12-21 | 2018-12-21 | 一种语音交互方法、装置、存储介质及移动终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811575125.1A CN109683792A (zh) | 2018-12-21 | 2018-12-21 | 一种语音交互方法、装置、存储介质及移动终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109683792A true CN109683792A (zh) | 2019-04-26 |
Family
ID=66188702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811575125.1A Pending CN109683792A (zh) | 2018-12-21 | 2018-12-21 | 一种语音交互方法、装置、存储介质及移动终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109683792A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728982A (zh) * | 2019-10-11 | 2020-01-24 | 上海博泰悦臻电子设备制造有限公司 | 基于语音触屏的信息交互方法、系统、存储介质、车载终端 |
CN110764684A (zh) * | 2019-10-11 | 2020-02-07 | 上海博泰悦臻电子设备制造有限公司 | 基于语音触屏融合的即时交互方法、系统、存储介质、车载终端 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140282045A1 (en) * | 2013-03-15 | 2014-09-18 | American Megatrends, Inc. | Method and apparatus of remote management of computer system using voice and gesture based input |
CN106060244A (zh) * | 2016-05-16 | 2016-10-26 | 珠海市魅族科技有限公司 | 一种即时通讯的语音传输方法和装置 |
CN106775214A (zh) * | 2016-11-29 | 2017-05-31 | 珠海市魅族科技有限公司 | 一种文字编辑方法及装置 |
CN106990887A (zh) * | 2016-01-21 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 信息输入方法、装置及终端设备 |
CN107491286A (zh) * | 2017-07-05 | 2017-12-19 | 广东艾檬电子科技有限公司 | 移动终端的语音输入方法、装置、移动终端及存储介质 |
CN107864289A (zh) * | 2017-11-17 | 2018-03-30 | 珠海市魅族科技有限公司 | 一种语音输入方法和装置、终端、可读存储介质 |
CN107977183A (zh) * | 2017-11-16 | 2018-05-01 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置及设备 |
-
2018
- 2018-12-21 CN CN201811575125.1A patent/CN109683792A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140282045A1 (en) * | 2013-03-15 | 2014-09-18 | American Megatrends, Inc. | Method and apparatus of remote management of computer system using voice and gesture based input |
CN106990887A (zh) * | 2016-01-21 | 2017-07-28 | 阿里巴巴集团控股有限公司 | 信息输入方法、装置及终端设备 |
CN106060244A (zh) * | 2016-05-16 | 2016-10-26 | 珠海市魅族科技有限公司 | 一种即时通讯的语音传输方法和装置 |
CN106775214A (zh) * | 2016-11-29 | 2017-05-31 | 珠海市魅族科技有限公司 | 一种文字编辑方法及装置 |
CN107491286A (zh) * | 2017-07-05 | 2017-12-19 | 广东艾檬电子科技有限公司 | 移动终端的语音输入方法、装置、移动终端及存储介质 |
CN107977183A (zh) * | 2017-11-16 | 2018-05-01 | 百度在线网络技术(北京)有限公司 | 语音交互方法、装置及设备 |
CN107864289A (zh) * | 2017-11-17 | 2018-03-30 | 珠海市魅族科技有限公司 | 一种语音输入方法和装置、终端、可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110728982A (zh) * | 2019-10-11 | 2020-01-24 | 上海博泰悦臻电子设备制造有限公司 | 基于语音触屏的信息交互方法、系统、存储介质、车载终端 |
CN110764684A (zh) * | 2019-10-11 | 2020-02-07 | 上海博泰悦臻电子设备制造有限公司 | 基于语音触屏融合的即时交互方法、系统、存储介质、车载终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108174612B (zh) | 用于利用基于先前输入强度的强度阈值对触摸输入进行处理和消除歧义的设备和方法 | |
CN102221957B (zh) | 电子设备的操作控制的方法及电子设备 | |
CN108463792A (zh) | 一种防误触方法及终端 | |
WO2019062910A1 (zh) | 一种复制和粘贴的方法、数据处理装置和用户设备 | |
US20140002396A1 (en) | Information processing method, information processing apparatus and electronic device | |
CN105511781B (zh) | 启动应用程序的方法、装置和用户设备 | |
KR20180026983A (ko) | 전자 장치 및 그 제어 방법 | |
CN109583356A (zh) | 指纹识别方法及相关产品 | |
US10558840B2 (en) | Fingerprint recognition method and electronic device | |
CN108733298B (zh) | 触控信息的处理方法、装置、存储介质及电子设备 | |
AU2013201063A1 (en) | Hybrid touch screen device and method for operating the same | |
WO2014206101A1 (zh) | 一种基于手势的会话处理方法、装置及终端设备 | |
CN107390923B (zh) | 一种屏幕防误触方法、装置、存储介质和终端 | |
WO2017161634A1 (zh) | 一种快捷操作的实现方法及终端设备 | |
US20240077948A1 (en) | Gesture-based display interface control method and apparatus, device and storage medium | |
CN109669662A (zh) | 一种语音输入方法、装置、存储介质及移动终端 | |
WO2022022566A1 (zh) | 图形码识别方法、装置和电子设备 | |
CN112587925A (zh) | 引导信息的显示方法、装置、存储介质及计算机设备 | |
CN109189953A (zh) | 一种多媒体文件的选择方法及装置 | |
CN102710846A (zh) | 基于压力感应实现电子书翻页的系统及方法 | |
CN109976654A (zh) | 一种显示屏内容调整方法、装置、移动终端及存储介质 | |
WO2016173307A1 (zh) | 一种消息复制方法和装置、以及智能终端 | |
CN113791725A (zh) | 触控笔操作的识别方法、智能终端及计算机可读存储介质 | |
CN109683792A (zh) | 一种语音交互方法、装置、存储介质及移动终端 | |
CN109634487B (zh) | 信息显示方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190426 |