CN109981443A - 语音交互方法、装置及终端设备 - Google Patents

语音交互方法、装置及终端设备 Download PDF

Info

Publication number
CN109981443A
CN109981443A CN201910152611.0A CN201910152611A CN109981443A CN 109981443 A CN109981443 A CN 109981443A CN 201910152611 A CN201910152611 A CN 201910152611A CN 109981443 A CN109981443 A CN 109981443A
Authority
CN
China
Prior art keywords
voice
interaction message
message
interaction
application program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910152611.0A
Other languages
English (en)
Inventor
梁正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201910152611.0A priority Critical patent/CN109981443A/zh
Publication of CN109981443A publication Critical patent/CN109981443A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/06Message adaptation to terminal or network requirements
    • H04L51/066Format adaptation, e.g. format conversion or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/224Monitoring or handling of messages providing notification on incoming messages, e.g. pushed notifications of received messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/234Monitoring or handling of messages for tracking messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72442User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72469User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephone Function (AREA)

Abstract

本发明实施例提供了一种语音交互方法、装置及终端设备,涉及终端技术领域。本发明实施例监听第一应用程序接收的消息;在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件;在满足预设播放条件的情况下,播放第一交互消息。因此,能够通过语音方式对交互消息进行播报,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的使用体验。

Description

语音交互方法、装置及终端设备
技术领域
本发明实施例涉及终端技术领域,尤其涉及一种语音交互方法、装置及终端设备。
背景技术
随着移动终端的普及,移动终端已成为人们工作和生活中的必需品, ASR(中文:语音识别,英文:Automatic Speech Recognition)技术与TTS (中文:文本转语音,英文:Text To Speech)技术也日趋成熟,移动终端利用这两个技术实现播报信息与发送信息的功能,实现人们日常生活中的各类信息交互,例如文字聊天、语音聊天。
目前,为了更好的便利用户使用,避免用户在无法手动操作移动终端时,带来的不便,在移动终端接收到来电时,能够通过语音助手来询问用户进行下一步操作。
但是,用户通常会倾向于使用多媒体短信/微信的方式进行信息交互,也就是说接收到来电的频率低于多媒体信息短信/微信交互的频率,因而在用户不便于手动操作的情况下,更不利于手动输入信息,从而难以实现通过多媒体短信/微信进行信息交互以及对交互操作进行控制。
发明内容
本发明实施例提供一种语音交互方法、装置及终端设备,以解决现有的交互软件无法解放双手的问题。
为了解决上述技术问题,本发明是这样实现的:一种语音交互方法,应用于终端设备,所述方法包括:
监听第一应用程序接收的消息;
在监听到所述第一应用程序接收到第一交互消息的情况下,判断是否满足所述第一交互消息的预设播放条件;
在所述第一交互消息满足所述预设播放条件的情况下,播放所述第一交互消息;
其中,所述第一应用程序是所述终端设备上的应用程序,所述预设播放条件包括所述第一交互消息的发起方具有预设权限和/或接收到针对所述第一交互消息的播放指令。
本发明实施例提供了一种语音交互装置,应用于终端设备,所述装置包括:
消息监听模块,用于监听第一应用程序接收的消息;
条件判断模块,用于在监听到所述第一应用程序接收到第一交互消息的情况下,判断是否满足所述第一交互消息的预设播放条件;
消息播放模块,用于在所述第一交互消息满足所述预设播放条件的情况下,播放所述第一交互消息;
其中,所述第一应用程序是所述终端设备上的应用程序,所述预设播放条件包括所述第一交互消息的发起方具有预设权限和/或接收到针对所述第一交互消息的播放指令。
本发明实施例还提供了一种终端设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的语音交互方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述的语音交互方法的步骤。
在本发明实施例中,监听第一应用程序接收的消息;在监听到所述第一应用程序接收到第一交互消息的情况下,判断所述第一交互消息是否满足预设播放条件;在所述第一交互消息满足所述预设播放条件的情况下,播放所述第一交互消息。因此,能够利用语音方式对交互消息进行播报,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的使用体验。
附图说明
图1示出了本发明实施例一的一种语音交互方法的流程图;
图2示出了本发明实施例二的一种语音交互方法的流程图;
图3示出了本发明实施例三的一种语音交互装置的结构框图;
图4示出了本发明实施例三的一种语音交互装置的结构框图;
图5示出了本发明实施例四的终端设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明实施例一的一种语音交互方法的流程图,应用于终端设备,具体可以包括如下步骤:
步骤101,监听第一应用程序接收的消息。
在本发明实施例中,终端设备可以是任意移动终端,例如是手机、平板电脑、可穿戴设备以及智能终端等,第一应用程序是该终端设备上的任一应用程序。可以预先在终端设备上设置需要监听的第一应用程序,例如是微信、信息、Whatsapp等应用程序,利用本申请的技术方案持续对第一应用程序所接收的信息进行监听,例如设置一个监听周期,1分钟,每隔一分钟对应查询第一应用程序的消息接收情况,以对应执行之后的操作步骤。
步骤102,在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件。
其中,预设播放条件包括第一交互消息的发起方具有预设权限和/或接收到针对第一交互消息的播放指令。
在本发明实施例中,第一交互消息是其他用户通过第一应用程序发送给终端设备的用户的,当监听到该第一交互消息之后,例如可以通过终端设备上的安装的语音助手程序或者是集成在终端设备上的某个应用程序(第一应用程序)上的语音助手功能,本发明不作具体限制。该语音助手程序(功能)能够利用TTS(Text To Speech,从文本到语音)将收到的第一交互消息通过语音或者响铃方式进行提示以及将第一交互消息以对应的方式进行播放。
示例地,在进行第一交互消息的播放之前,先对播放条件进行判断,例如语音助手程序(功能)利用语音方式询问用户:“接收到第一用户发送的信息,是否需要语音播放”,或者“有新消息,是否需要语音播放”等,在接收到用户对于上述询问肯定的答复之后,则确定收到播放指令,即满足预设播放条件。或者,还可以对第一应用程序预设自动读取名单,当第一交互消息为自动读取名单上的用户发出时,即说明该用户作为第一交互消息的发起方具有预设权限,满足读取条件,则直接对该第一交互消息进行播放,也就是进行步骤103的操作。
此外,还可以对应每个第一应用程序分别设置对应的自动读取名单,对名单上的用户进行标记,当监听到标记的用户通过第一应用程序向终端设备的用户发送交互消息后,则确定满足预设播放条件,直接播放该交互消息;而若接收到的第一交互消息是其他非标记用户发送的情况下,则可以进行语音询问,以确认是否需要进行播放。对应每个不同的应用程序可以设置不同的标记用户,灵活设置以满足用户的不同需求。
步骤103,在满足预设播放条件的情况下,播放第一交互消息。
在本发明实施例中,根据上一步骤发出的询问,用户回复的对应操作,例如是“播放”,则利用语音助手程序(功能)对第一交互消息进行语音播放。
示例地,在播放第一交互消息之前,还可以根据第一交互消息的内容的类型对应执行转换之后再进行播放。
类型一,在第一交互消息包括语音内容或文本内容的情况下,播放该语音内容或该文本内容对应的语音。
也就是说,需要将第一交互消息的文本内容中的文字部分转换为语音,再进行播放;若文本内容即为语音形式的内容,则直接播放该第一交互消息。
类型二,在第一交互消息包括视频的情况下,播放视频。
类型三,在第一交互消息包括图片的情况下,显示图片,和/或,根据图片的内容确定对应的图片语音内容,并播放图片语音内容。
示例地,第一交互消息中包括图片,利用现有的图像识别网络模型进行图像内容的简单识别,例如识别出图片中为“哈哈笑”的表情,可以对应生成一个哈哈哈笑的语音,播放给用户;或者将图像识别结果应用语音进行说明,例如“对方发送了一个哈哈哈笑的表情”等。
在本发明实施例中,监听第一应用程序接收的消息;在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件;在满足预设播放条件的情况下,播放第一交互消息。因此,能够通过语音方式对交互消息进行播报,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的使用体验。
参照图2,示出了本发明实施例二的一种语音交互方法的流程图,具体可以包括如下步骤:
步骤201,监听第一应用程序接收的消息。
步骤202,在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件。
步骤203,在满足预设播放条件的情况下,提示用户选择信息处理方式。
其中,信息处理方式包括:通过语音方式播放第一交互消息、通过弹窗的方式展示第一交互消息以及忽略第一交互消息中的至少一种。
也就是说,在确定要进行第一交互消息的播放之后,可以利用语音助手程序(功能)提示用户选择对应的信息处理方式。例如当用户在开会或者其他不方便收听语音信息的场景下,用户可以设置选择弹窗的方式展示第一交互消息,并设置一个较晚的再次提示时间;或者当用户在开车或者其他不方便操作移动终端的情况下,可以设置通过语音方式播放第一交互消息。
需要说明的是,用户对于信息处理方式的选择可以是针对每一个交互消息的,也可以是针对所有交互信息的,也就是说可以预先设置信息处理方式为通过语音方式播放,之后每个交互消息都通过语音方式进行播放;还可以在接收到第一交互消息的情况下,再询问用户对应的信息处理方式,之后对应处理该第一交互消息,之后再接收到了新的交互消息之后,再次询问获取对应的处理方式。本申请不做具体限制。
步骤204,播放第一交互消息。
示例地,利用上述步骤203确定了该第一交互消息的处理方式之后,则根据该处理方式对第一交互消息进行播放。
步骤205,提示用户用语音进行回复操作。
在本发明实施例中,通过语音助手程序(功能)播放第一交互消息之后,还可以提示用户用语音对第一交互信息进行回复,例如输出提示语音:“是否进行语音快速回复”或者“请输入语音回复内容”等。
步骤206,接收语音输入。
在本发明实施例中,在接收到用户根据语音提示对于第一交互消息的回复信息之后,等待并获取用户的用于回复第一交互消息的语音输入,例如用户语音输入为“帮我回复一个哈哈笑的表情”,通过语义识别采集到“帮我回复”,对应查找“哈哈笑”的表情,作为对第一交互消息的回复;或者用户语音输入为“帮我删除该信息”,同样根据“帮我删除”的语音,对应删除第一交互消息;又或者用户语音输入为“帮我回复好的,一会见”,对应生成的第一交互消息的回复为“好的,一会见”,利用 ASR技术,将用户的语音输入转换为文字信息,生成为第一交互消息所对应的第一应用程序的文字信息。
此外,还可以根据第一交互消息的发送时间进行判断,是否要对第一交互消息进行回复,例如:
判断语音输入的接收时刻距离提示的提示时刻之间的间隔是否符合预设条件,也就是预设一个时间间隔,例如30分钟,当用户的语音输入的接收时刻距离第一交互消息的提示时刻之间的间隔超过30分钟,说明第一交互消息已经过期,可以不进行回复,并进行标记提示用户晚些时间进行处理;若在30分钟内,接收到语音输入,则说明间隔符合预设条件,继续进行下面步骤的操作,也就是执行第一交互消息的回复。
步骤207,根据语音输入,对第一交互消息进行回复。
在本发明实施例中,根据上一步骤206所获取到的语音输入,通过语义识别确定对第一交互消息的回复信息之后,对应回复该第一交互消息,例如“好的,一会见”。
在本发明的实施例中,该步骤还可以包括:
子步骤A,根据语音输入,确定回复指令。
子步骤B,按照回复指令,对第一交互消息进行回复。
也就是说,需要对用户的语音输入进行语义识别,以确定回复指令,例如是否回复以及若回复的话回复内容等信息,并且对应第一交互信息确定对应的应用程序,例如第一交互信息是微信用户发送来的,对应的回复操作对象为微信,语音助手程序(功能)需要与微信建立信息交互绑定操作,允许语音助手程序(功能)获取微信内的设置信息和消息内容,例如语音助手程序(功能)可以将对第一交互信息的回复生成为一个链接,以分享的方式将该链接分享至第一交互信息的对话框中;或者直接生成一个文本消息,再复制黏贴到第一交互信息的对话框中等,以实现对第一交互信息的回复。
此外,还可以设置快捷回复内容,便于用户快捷回复,该快捷回复的内容可以是图片、表情或者文字等内容,本申请不做具体限制。
在本发明实施例中,监听第一应用程序接收的消息;在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件;在满足预设播放条件的情况下,播放第一交互消息。因此能够语音方式对交互消息进行播报,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的使用体验。
参照图3,示出了本发明实施例三的一种语音交互装置的结构框图,该装置300应用于终端设备,包括:
消息监听模块310,用于监听第一应用程序接收的消息。
条件判断模块320,用于在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件。
消息播放模块330,用于在满足预设播放条件的情况下,播放第一交互消息;
其中,第一应用程序是终端设备上的应用程序,预设播放条件包括第一交互消息的发起方具有预设权限和/或接收到针对第一交互消息的播放指令。
参照图4,在图3的基础上,可选的,装置300还包括:
语音接收模块340,用于在播放第一交互消息的步骤之后,接收语音输入。
消息回复模块350,用于根据语音输入,对第一交互消息进行回复。
可选的,消息回复模块350,包括:
确定子模块351,用于根据语音输入,确定回复指令。
消息回复子模块352,用于响应于回复指令,对第一交互消息进行回复。
可选的,装置300,还包括:
回复提示模块,用于在接收语音输入的步骤之前,提示用户用语音进行回复操作。
条件判断模块,用于接收语音输入的步骤之后,判断语音输入的接收时刻距离提示的提示时刻之间的时间间隔是否符合预设条件。
执行模块,用于如果时间间隔符合预设条件,则执行根据语音输入,对第一交互消息进行回复的步骤。
可选的,消息播放模块330,用于:
在第一交互消息包括语音内容或文本内容的情况下,播放语音内容或文本内容对应的语音;
在第一交互消息包括视频的情况下,播放视频;
在第一交互消息包括图片的情况下,显示图片,和/或,根据图片的内容确定对应的图片语音内容,并播放图片语音内容。
可选的,所述装置300还包括方式提示模块360,用于:
用于在播放第一交互消息的步骤之前,提示用户选择信息处理方式;信息处理方式包括:通过语音方式播放第一交互消息,通过弹窗的方式展示第一交互消息,忽略第一交互消息中的至少一种。
本发明实施例提供的装置能够实现图1至图2的方法实施例中终端设备的各个过程,为避免重复,这里不再赘述。
在本发明实施例中,监听第一应用程序接收的消息;在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件;在满足预设播放条件的情况下,播放第一交互消息。因此能够语音方式对交互消息进行播报,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的使用体验。
参照图5,示出了本发明实施例四的终端设备的硬件结构示意图。
该终端设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元 507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的终端设备结构并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,终端设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于监听第一应用程序接收的消息;在监听到第一应用程序接收到第一交互消息的情况下,判断第一交互消息是否满足预设播放条件;在满足预设播放条件的情况下,进而控制音频输出单元503播放第一交互消息。
在本发明实施例中,对第一交互消息以语音方式进行提示,解放用户双手,避免由于无法手动操作终端导致的不便利,提升用户的对终端设备的使用效率。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
终端设备通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与终端设备500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041 对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元 506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042 可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
终端设备500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在终端设备500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display, LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元 507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键 (比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071 检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现终端设备的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现终端设备的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与终端设备500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到终端设备500内的一个或多个元件或者可以用于在终端设备500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
终端设备500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,终端设备500包括一些未示出的功能模块,在此不再赘述。
实施例五
优选的,本发明实施例还提供一种终端设备,包括处理器510,存储器 509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述语音交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
实施例六
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音交互方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (13)

1.一种语音交互方法,应用于终端设备,其特征在于,所述方法包括:
监听第一应用程序接收的消息;
在监听到所述第一应用程序接收到第一交互消息的情况下,判断所述第一交互消息是否满足预设播放条件;
在所述第一交互消息满足所述预设播放条件的情况下,播放所述第一交互消息;
其中,所述第一应用程序是所述终端设备上的应用程序,所述预设播放条件包括所述第一交互消息的发起方具有预设权限和/或接收到针对所述第一交互消息的播放指令。
2.根据权利要求1所述的方法,其特征在于,在所述播放所述第一交互消息的步骤之后,还包括:
接收语音输入;
根据所述语音输入,对所述第一交互消息进行回复。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音输入,对所述第一交互消息进行回复,包括:
根据所述语音输入,确定回复指令;
按照所述回复指令,对所述第一交互消息进行回复。
4.根据权利要求2所述的方法,其特征在于,在所述接收语音输入的步骤之前,还包括:
提示用户用语音进行回复操作;
在所述接收语音输入的步骤之后,还包括:
判断所述语音输入的接收时刻距离所述提示的提示时刻之间的时间间隔是否符合预设条件;
如果所述时间间隔符合所述预设条件,则执行所述根据所述语音输入,对所述第一交互消息进行回复的步骤。
5.根据权利要求1所述的方法,其特征在于,所述播放所述第一交互消息,包括:
在所述第一交互消息包括语音内容或文本内容的情况下,播放所述语音内容或者所述文本内容对应的语音;
在所述第一交互消息包括视频的情况下,播放所述视频;
在所述第一交互消息包括图片的情况下,显示所述图片,和/或,根据所述图片的内容确定对应的图片语音内容,并播放所述图片语音内容。
6.根据权利要求1所述的方法,其特征在于,在所述播放所述第一交互消息的步骤之前,所述方法还包括:
提示用户选择信息处理方式;所述信息处理方式包括:通过语音方式播放所述第一交互消息、通过所述弹窗的方式展示所述第一交互消息以及忽略所述第一交互消息中的至少一种。
7.一种语音交互装置,应用于终端设备,其特征在于,所述装置包括:
消息监听模块,用于监听第一应用程序接收的消息;
条件判断模块,用于在监听到所述第一应用程序接收到第一交互消息的情况下,判断所述第一交互消息是否满足预设播放条件;
消息播放模块,用于在所述第一交互消息满足所述预设播放条件的情况下,播放所述第一交互消息;
其中,所述第一应用程序是所述终端设备上的应用程序,所述预设播放条件包括所述第一交互消息的发起方具有预设权限和/或接收到针对所述第一交互消息的播放指令。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
语音接收模块,用于在所述播放所述第一交互消息的步骤之后,接收语音输入;
消息回复模块,用于根据所述语音输入,对所述第一交互消息进行回复。
9.根据权利要求8所述的装置,其特征在于,所述消息回复模块,包括:
确定子模块,用于根据所述语音输入,确定回复指令;
消息回复子模块,用于按照所述回复指令,对所述第一交互消息进行回复。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
回复提示模块,用于在所述接收语音输入的步骤之前,提示用户用语音进行回复操作;
条件判断模块,用于所述接收语音输入的步骤之后,判断所述语音输入的接收时刻距离所述提示的提示时刻之间的时间间隔是否符合预设条件;
执行模块,用于如果所述时间间隔符合所述预设条件,则执行所述根据所述语音输入,对所述第一交互消息进行回复的步骤。
11.根据权利要求7所述的装置,其特征在于,所述消息播放模块,用于:
在所述第一交互消息包括语音内容或文本内容的情况下,播放所述语音内容或所述文本内容对应的语音;
在所述第一交互消息包括视频的情况下,播放所述视频;
在所述第一交互消息包括图片的情况下,显示所述图片,和/或,根据所述图片的内容确定对应的图片语音内容,并播放所述图片语音内容。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
方式提示模块,用于在所述播放所述第一交互消息的步骤之前,提示用户选择信息处理方式;所述信息处理方式包括:通过语音方式播放所述第一交互消息、通过所述弹窗的方式展示所述第一交互消息以及忽略所述第一交互消息中的至少一种。
13.一种终端设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的语音交互方法的步骤。
CN201910152611.0A 2019-02-28 2019-02-28 语音交互方法、装置及终端设备 Pending CN109981443A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910152611.0A CN109981443A (zh) 2019-02-28 2019-02-28 语音交互方法、装置及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910152611.0A CN109981443A (zh) 2019-02-28 2019-02-28 语音交互方法、装置及终端设备

Publications (1)

Publication Number Publication Date
CN109981443A true CN109981443A (zh) 2019-07-05

Family

ID=67077662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910152611.0A Pending CN109981443A (zh) 2019-02-28 2019-02-28 语音交互方法、装置及终端设备

Country Status (1)

Country Link
CN (1) CN109981443A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110493123A (zh) * 2019-09-16 2019-11-22 腾讯科技(深圳)有限公司 即时通讯方法、装置、设备及存储介质
CN112540742A (zh) * 2020-12-02 2021-03-23 广州朗国电子科技有限公司 Ai互动定制用户专属显示屏显示效果的方法
CN113179202A (zh) * 2020-01-09 2021-07-27 上海博泰悦臻电子设备制造有限公司 用于分享数据的方法、电子设备和计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035453A1 (en) * 2009-08-06 2011-02-10 Oracle International Corporation Automatic rules-based messaging system based on analysis of text and/or associated metadata
CN104125132A (zh) * 2013-04-25 2014-10-29 腾讯科技(深圳)有限公司 一种语音消息的播放方法和装置
CN107360320A (zh) * 2017-06-30 2017-11-17 维沃移动通信有限公司 一种移动终端控制方法及移动终端
CN107623794A (zh) * 2017-10-27 2018-01-23 维沃移动通信有限公司 一种语音数据的处理方法、装置及移动终端
CN107896278A (zh) * 2017-11-10 2018-04-10 珠海市魅族科技有限公司 文本通知信息的语音提示方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110035453A1 (en) * 2009-08-06 2011-02-10 Oracle International Corporation Automatic rules-based messaging system based on analysis of text and/or associated metadata
CN104125132A (zh) * 2013-04-25 2014-10-29 腾讯科技(深圳)有限公司 一种语音消息的播放方法和装置
CN107360320A (zh) * 2017-06-30 2017-11-17 维沃移动通信有限公司 一种移动终端控制方法及移动终端
CN107623794A (zh) * 2017-10-27 2018-01-23 维沃移动通信有限公司 一种语音数据的处理方法、装置及移动终端
CN107896278A (zh) * 2017-11-10 2018-04-10 珠海市魅族科技有限公司 文本通知信息的语音提示方法、装置及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110493123A (zh) * 2019-09-16 2019-11-22 腾讯科技(深圳)有限公司 即时通讯方法、装置、设备及存储介质
CN113179202A (zh) * 2020-01-09 2021-07-27 上海博泰悦臻电子设备制造有限公司 用于分享数据的方法、电子设备和计算机存储介质
CN112540742A (zh) * 2020-12-02 2021-03-23 广州朗国电子科技有限公司 Ai互动定制用户专属显示屏显示效果的方法

Similar Documents

Publication Publication Date Title
CN109525707A (zh) 一种音频播放方法及移动终端
CN110177296A (zh) 一种视频播放方法及移动终端
CN108540655A (zh) 一种来电显示处理方法及移动终端
CN110062104A (zh) 应用程序启动方法、装置及移动终端
CN108521520A (zh) 一种通话处理方法及移动终端
CN108989558A (zh) 终端通话的方法及装置
CN107908705A (zh) 一种信息推送方法、信息推送装置及移动终端
CN108135033A (zh) 一种蓝牙连接方法及移动终端
CN109525712A (zh) 一种信息处理方法、移动终端及车载设备
CN109993821A (zh) 一种表情播放方法及移动终端
CN109144703A (zh) 一种多任务的处理方法及其终端设备
CN109981443A (zh) 语音交互方法、装置及终端设备
CN110012172A (zh) 一种来电处理方法及终端设备
CN108512992A (zh) 一种信息处理方法及装置
CN109257498A (zh) 一种声音处理方法及移动终端
CN107835495A (zh) 一种消息提示方法、装置及移动终端
CN108124061A (zh) 音频数据的存储方法及装置
CN109981904A (zh) 一种音量控制方法及终端设备
CN108009031A (zh) 一种应用程序的控制方法及移动终端
CN109348035A (zh) 一种电话号码的识别方法和终端设备
CN109639738A (zh) 语音数据传输的方法及终端设备
CN109743454A (zh) 一种通话处理方法及移动终端
CN110062281A (zh) 一种播放进度调节方法及其终端设备
CN109474747A (zh) 一种信息提示方法及移动终端
CN109982273A (zh) 一种信息回复方法及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705