CN116052666A - 语音消息处理方法、装置、系统、电子装置和存储介质 - Google Patents

语音消息处理方法、装置、系统、电子装置和存储介质 Download PDF

Info

Publication number
CN116052666A
CN116052666A CN202310189610.XA CN202310189610A CN116052666A CN 116052666 A CN116052666 A CN 116052666A CN 202310189610 A CN202310189610 A CN 202310189610A CN 116052666 A CN116052666 A CN 116052666A
Authority
CN
China
Prior art keywords
target terminal
response data
terminal
voice message
message processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310189610.XA
Other languages
English (en)
Inventor
徐文
顾群
鄢小慧
王梁昊
张灵箭
王钰
吴一遥
陈泽
赖於领
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202310189610.XA priority Critical patent/CN116052666A/zh
Publication of CN116052666A publication Critical patent/CN116052666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请涉及一种语音消息处理方法、装置、系统、电子装置和存储介质,其中,该语音消息处理方法包括:获取基于第一终端采集的语音信号,根据语音信号生成交互信息,并发送交互信息至第一目标终端,其中,第一终端包括智能音箱;获取反馈信息;其中,在第一目标终端在线的情况下,反馈信息包括对应于第一目标终端的响应数据;在第一目标终端不在线的情况下,反馈信息包括对应于第二目标终端的响应数据,其中,第二目标终端与第一目标终端关联。第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据。通过本申请,解决了用户之间消息无法及时传达的问题,实现了用户之间政务办公语音消息的闭环交互与及时传递。

Description

语音消息处理方法、装置、系统、电子装置和存储介质
技术领域
本申请涉及语音消息处理技术领域,特别是涉及一种语音消息处理方法、装置、系统、电子装置和存储介质。
背景技术
智能音箱是一种集音频播放和语音识别的电子设备,使用智能音箱互相发送语音消息,可以极大地解放双手,提升沟通效率。但是,相关技术的智能音箱通讯系统,当发送方发送语音消息至接收方时,接收方用户可能不在智能音箱旁边,导致接收方无法响应语音消息,造成语音消息无法及时传达的现象。
针对相关技术中存在用户之间语音消息无法及时传达的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种语音消息处理方法、装置、系统、电子装置和存储介质,以解决相关技术中用户之间语音消息无法及时传达的问题。
第一个方面,在本实施例中提供了一种语音消息处理方法,包括:
获取基于第一终端采集的语音信号,根据所述语音信号生成交互信息,并发送所述交互信息至第一目标终端,其中,所述第一终端包括智能音箱;
获取反馈信息;
其中,在所述第一目标终端在线的情况下,所述反馈信息包括对应于所述第一目标终端的响应数据;在所述第一目标终端不在线的情况下,所述反馈信息包括对应于第二目标终端的响应数据,其中,所述第二目标终端与所述第一目标终端关联。
所述第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据,其中,所述第一类型响应数据根据所述第一目标终端的用户输入指令生成,所述第二类型响应数据在所述第一目标终端无用户输入指令的情况下生成。
在其中的一些实施例中,在获取第二类型响应数据之后,所述方法还包括:
获取对应于所述第二目标终端的响应数据。
在其中的一些实施例中,所述第二目标终端的响应数据包括:
第三类型响应数据或者第四类型响应数据,其中,所述第三类型响应数据通过用户输入的指令生成,所述第四类型响应数据在用户未输入指令的情况下生成。
在其中的一些实施例中,所述第二目标终端包括至少一种通信通道。
在其中的一些实施例中,获取所述反馈信息包括:以多媒体形式展示所述反馈信息。
在其中的一些实施例中,所述交互信息包括:对应所述第一目标终端的用户身份信息、所述语音消息的内容。
第二个方面,在本实施例中提供了一种语音消息处理装置,包括:
发送模块,获取基于第一终端采集的语音信号,根据所述语音信号生成交互信息,并发送所述交互信息至第一目标终端;
接收模块,获取反馈信息;
其中,在所述第一目标终端在线的情况下,所述反馈信息包括对应于所述第一目标终端的响应数据;在所述第一目标终端不在线的情况下,所述反馈信息包括对应于第二目标终端的响应数据,其中,所述第二目标终端与所述第一目标终端关联。
第三个方面,在本实施例中提供了一种语音消息处理系统,包括:第一终端、第一目标终端、第二目标终端、服务器;其中,至少所述第一终端与所述服务器连接,所述第一终端通过所述服务器与所述第一目标终端和/或者所述第二目标终端通信,所述第一终端用于执行第一方面任一项所述的语音消息处理方法。
在其中的一些实施例中,在所述服务器检测到所述第一目标终端在线的情况下,所述服务器发送所述第一目标终端的响应数据至所述第一终端;
在所述服务器检测到所述第一目标终端不在线的情况下,所述服务器发送所述第二目标终端的响应数据至所述第一终端。
在其中的一些实施例中,在所述服务器检测到所述第一目标终端在线的情况下,若所述第一目标终端无用户输入指令,则所述服务器发送所述第二目标终端的响应数据至所述第一终端。
在其中的一些实施例中,所述第一目标终端的响应数据包括:所述第一目标终端生成的回复内容、所述第一目标终端接受或者拒绝响应的信息、所述第一目标终端超时未收到用户输入指令的信息。
在其中的一些实施例中,所述第二目标终端的响应数据包括:所述第二目标终端接受或者拒绝响应的信息、所述第二目标终端超时未收到用户输入指令的信息所述服务器。
第四个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的语音消息处理方法。
第五个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的语音消息处理方法。
与相关技术相比,在本实施例中提供的语音消息处理方法,包括:获取基于第一终端采集的语音信号,根据语音信号生成交互信息,并发送交互信息至第一目标终端,其中,第一终端包括智能音箱;获取反馈信息;其中,在第一目标终端在线的情况下,反馈信息包括对应于第一目标终端的响应数据;在第一目标终端不在线的情况下,反馈信息包括对应于第二目标终端的响应数据,其中,第二目标终端与第一目标终端关联,其中,第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据,其中,第一类型响应数据根据第一目标终端的用户输入指令生成,第二类型响应数据在第一目标终端无用户输入指令的情况下生成。解决了用户之间消息无法及时传达的问题,实现了用户之间政务办公语音消息的闭环交互与及时传递。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是一个实施例中语音消息处理系统的结构示意图一;
图2是一个实施例中语音消息处理方法的终端的硬件结构框图;
图3是一个实施例中语音消息处理方法的流程图一;
图4是一个实施例中语音消息处理系统的结构示意图二;
图5是一个实施例中语音消息处理方法的流程图二;
图6是一个实施例中语音消息处理装置的结构框图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
在一个实施例中,提供了一种语音消息处理系统,请参阅图1,为本实施例提供的一种语音消息处理系统的结构示意图,该语音消息处理系统包括:第一终端、第一目标终端、第二目标终端、服务器;其中,至少第一终端与服务器连接,第一终端通过服务器与第一目标终端和/或第二目标终端通信。服务器能够在第一终端和第一目标终端或者第二目标终端之间转发消息。在服务器检测到第一目标终端在线的情况下,服务器发送第一目标终端的响应数据至第一终端;在服务器检测到第一目标终端不在线的情况下,服务器发送第二目标终端的响应数据至第一终端。示例性地,服务器与第一目标终端连接,若第一目标终端定时发送心跳包给服务器,则服务器判断第一目标终端在线,并将交互信息发送给第一目标终端;若第一目标终端未能定时发送心跳包给服务器,则服务器判断第一目标终端不在线,并将交互信息发送给第二目标终端。可选地,服务器向第二目标终端发送交互信息的方法包括电话拨打及短信发送。
相应地,本实施例还提供了一种语音消息处理方法,可以在终端、计算机或者类似的运算装置中执行,请参阅图2,为本实施例提供的一种语音消息处理方法的终端的硬件结构框图。如图2所示,终端可以包括一个或多个(图2中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图2所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图2中所示更多或者更少的组件,或者具有与图2所示出的不同配置。存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的语音消息处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(RadioFrequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
结合图2,语音消息处理方法的终端可以是第一终端,请参阅图3,为本实施例提供的一种语音消息处理方法的流程图,以该方法应用于第一终端为例进行说明,该流程包括如下步骤:
步骤S201,获取基于第一终端采集的语音信号,根据语音信号生成交互信息,并发送交互信息至第一目标终端,其中,所述第一终端包括智能音箱。
第一终端、第一目标终端包括具备语音识别能力的智能终端,如智能音箱、。用户通过语音唤醒第一终端,第一终端识别用户发送语音消息的意图,得到包括用户身份信息和语音消息的内容的交互信息,根据用户身份信息确定与用户身份信息对应的第一目标终端,实现通过语音选择用户并发送消息的效果,以简化用户操作。
示例性地,智能音箱A将采集的语音信号的意图理解为消息对象和消息内容发送给服务器:用户对智能音箱A说“跟张三说来我办公室一下”,智能音箱A识别到该意图为发送语音消息,并拆解得到语音消息对象的用户身份信息为张三,语音消息的内容为“来我办公室一下”。用户也可以在对智能音箱A下达的语音指令中携带唤醒词,智能音箱A在接收到唤醒词后,才触发上述执行步骤,即根据语音信号生成交互信息,并发送交互信息至智能音箱B。
步骤S202,获取反馈信息;其中,在第一目标终端在线的情况下,反馈信息包括对应于第一目标终端的响应数据;在第一目标终端不在线的情况下,反馈信息包括对应于第二目标终端的响应数据,其中,第二目标终端与第一目标终端关联。
第二目标终端与第一目标终端对应同一用户身份信息。当第一目标终端在线时,第一终端发送的交互信息将传递给第一目标终端并得到反馈信息;当第一目标终端不在线时,第一目标终端无法即时反馈,因此交互信息将传递给第二目标终端,并得到来自第二目标终端的反馈信息。
步骤S203,第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据,其中,第一类型响应数据根据第一目标终端的用户输入指令生成,第二类型响应数据在第一目标终端无用户输入指令的情况下生成。
第一类型响应数据中第一目标终端的用户输入指令包括对应交互信息的回复内容,预设的接收信息和拒绝信息。若第一目标终端在预设时间内未接收到用户的交互反馈信息,第一终端则将收到自动生成的第二类型响应数据,以表示第一目标终端的用户未收到语音消息。
相关技术中,当发送方发送语音消息至接收方时,接收方用户可能不在智能音箱旁边,导致接收方无法响应语音消息,造成语音消息无法及时传达的现象,此外,发送方也无法收到反馈消息,双方消息传达的即时性较差。而通过上述步骤S201至S203,第一终端通过语音识别和语义理解,发送语音消息到第一目标终端或第二目标终端;当第一目标终端在线时,可实时收到回复;当第一目标终端不在线时,可通过第二目标终端呼叫目标用户。保证可以实时将语音消息传达给目标用户,并及时得到对应反馈信息,使得用户之间能够形成语音消息闭环交互,保证双方消息传达的即时性,解决了用户之间消息无法及时传达的问题,实现了“有问必答(达)”的有益效果。
在一个实施例中,在获取第二类型响应数据之后,方法还包括:获取对应于第二目标终端的响应数据。当第一终端接收到第二类型响应数据时,代表预设时间内用户未通过第一目标终端回复第一终端发出的交互信息。因此,在第一终端接收到第二类型响应数据之后,与第一目标终端关联的第二目标终端会接收到交互信息,且第一终端接收到对应第二目标终端的响应数据。
示例性地,智能音箱B包括语音消息界面,语音消息界面上可显示对应智能音箱A的语音消息来源,语音消息内容,以及“好的”与“正在忙”按钮。智能音箱B的用户可以在智能音箱B的语音消息界面直接回复,智能音箱A接收到对应的回复信息,智能音箱A接收到对应的接受信息;或者智能音箱B的用户点击“正在忙”按钮,智能音箱A接收到对应的拒绝信息。若智能音箱B在线,但预设时间内用户未与智能音箱B的语音消息界面交互,智能音箱A会接收到第二类响应数据,得到超时未响应信息。
在一个实施例中,第二目标终端的响应数据包括:第三类型响应数据或者第四类型响应数据,其中,第三类型响应数据通过用户输入的指令生成,第四类型响应数据在用户未输入指令的情况下生成。可选地,第二目标终端包括至少一种通信通道。
第三类型响应数据中第二目标终端的用户输入指令包括对应交互信息的回复内容,第二目标终端预设的接收信息和拒绝信息。若第二目标终端在预设时间内未接收到用户的交互反馈信息,第一终端则将收到自动生成的第四类型响应数据,以表示第二目标终端的用户在预设时间内未回应。
示例性地,第二目标终端包括移动电话。当智能音箱B不在线时,会通过拨打电话和发送短信两种方式向移动电话传达智能音箱A的交互信号。若移动电话对应的用户拒绝接听电话,或者,用户接听电话后,未在拨号页面输入数字“1”并挂断电话,则表示用户正在忙,智能音箱A接收到对应的拒绝信息;若接起电话并且在拨号页面输入数字“1”,则表示好的,智能音箱A接收到对应的接受信息;若电话超时未接通,则智能音箱A接收到超时未响应的信息。
在一个实施例中,获取反馈信息包括:以多媒体形式展示反馈信息。可选地,第一终端接收到反馈信息后,可语音播放交互信息的交互结果。
在一个实施例中,交互信息包括:对应第一目标终端的用户身份信息、语音消息的内容。第一终端可以根据采集的语音信号,可以识别并拆分语音信号,理解第一终端用户发送语音消息的意图,并根据交互信息中第一目标终端的用户身份信息,传达交互信息至对应的第一目标终端,或与第一目标终端关联的第二目标终端。
请继续参阅图1,在一个实施例中,在服务器检测到第一目标终端在线的情况下,若第一目标终端无用户输入指令,则服务器发送第二目标终端的响应数据至第一终端。若第一目标终端在线,但超过预设时间第一目标终端未收到用户输入指令,第一目标终端告知服务器无人回应,服务器向第二目标终端发送交互信息。
在一个实施例中,第一目标终端的响应数据包括:第一目标终端生成的回复内容、第一目标终端接受或者拒绝响应的信息、第一目标终端超时未收到用户输入指令的信息。第二目标终端的响应数据包括:第二目标终端接受或者拒绝响应的信息、第二目标终端超时未收到用户输入指令的信息服务器。
示例性地,智能音箱B收到语音消息时,通过语音消息界面展示交互信息,其中,语音消息界面上显示与智能音箱A对应的消息来源,消息内容,“好的”和“正在忙”按钮。智能音箱B的用户可在语音消息界面回复交互信息,服务器接收到反馈并分别向智能音箱A发送回复内容;在语音消息界面点击“好的”按钮,服务器接收到反馈,并分别向智能音箱A发送接受响应的信息;在语音消息界面点击“正在忙”按钮,服务器接收到反馈,并分别向智能音箱A发送拒绝响应的信息;当超过预设时间,语音消息界面仍无人点击时,服务器接收到反馈,向智能音箱A发送超时未响应结果,并通过电话拨打及短信发送的方法向移动电话发送交互信息。
当智能音箱B不在线时,服务器对移动电话进行电话拨打及短信发送。移动电话的用户拒绝接听,或者,接听电话后未在拨号页面输入数字“1”情况下挂断电话,相当于在智能音箱B点击“正在忙”按钮,移动电话反馈给服务器拒绝响应的信息;移动电话的用户接听电话,并在拨号页面输入数字“1”相当于在智能音箱B点击“好的”按钮,移动电话反馈给服务器接受响应的信息;电话超时未响应时,服务器获取到超时未响应结果。智能音箱A接收并播放出服务器返回的反馈信息。
在一个实施例中,请参阅图4,为本实施例提供的另一种语音消息处理系统的结构示意图,如图4所示:第一终端为智能音箱发送设备,第一目标终端为智能音箱接收设备,语音消息处理系统包括智能音箱发送设备、服务器、电话系统、智能音箱接收设备。
智能音箱发送设备用于采集发送者语音信号和识别发送者的意图,得到语音消息,并将语音消息通过服务器中转发送给智能音箱接收设备。
服务器用于中转语音消息,并判断用户是否在线,并根据用户是否在线的判断结果判断是否需要发起电话呼叫。具体的,服务器用于判断语音消息处理形式,首先根据用户心跳判断用户是否在线,当用户在线时,则将语音消息发送给智能音箱接收设备,当用户不在线时,则对用户进行电话呼叫并获取电话呼叫后的反馈消息。
智能音箱接收设备用于接收发送者的语音消息,并进行播报发送者发送的语音消息。如果用户没有处理消息,则通知服务器向第二目标终端发起电话呼叫。
电话系统用于给消息接收者拨打电话,并反馈给服务器消息接收者的反馈消息。具体的,当智能音箱接收设备不在线时,拨打电话给用户,当用户接听电话并回复1时,反馈给服务器表示收到消息,当用户接听电话不反馈或未接电话时,反馈给服务器表示消息未收到。
相应地,请参阅图5,为本实施例提供的另一种语音消息处理方法的流程图,该方法包括如下步骤:
步骤S501,智能音箱发送设备接收用户发送的语音消息指令;
步骤S502,智能音箱发送设备发送语音消息给服务器;
步骤S503,服务器判断智能音箱接收设备是否在线。在判断到智能音箱接收设备在线的情况下,执行步骤S504;在判断到智能音箱接收设备不在线的情况下,执行步骤S508。服务器与智能音箱建立连接,智能音箱定时发送心跳包给服务器,服务器根据心跳包判断智能音箱是否在线;
步骤S504,服务器发送语音消息给智能音箱接收设备。智能音箱接收设备收到语音消息时,展示语音消息界面;语音消息界面上显示消息来源,消息内容,“好的”和“正在忙”按钮;
步骤S505,判断智能音箱接收设备是否进行反馈。在判断到智能音箱接收设备已反馈的情况下,执行步骤S506;在判断到智能音箱接收设备未反馈的情况下,执行步骤S508。智能音箱接收设备包括智能音箱或者手机,接收者可在智能音箱接收设备在线界面或在手机上进行回复对应的语音消息。智能音箱接收设备的反馈包括:在智能音箱接收设备在线界面回复与语音消息对应的回复内容,用户可在智能音箱接收设备的语音消息界面点击“好的”或者“正在忙”按钮进行回复;
步骤S506,服务器反馈智能音箱接收设备的对应状态给智能音箱发送设备。智能音箱发送设备收到的反馈消息包括:好的,正在忙或未响应结果;
步骤S507,智能音箱接收设备告知服务器超时未反馈;
步骤S508,服务器调用电话系统进行对接收者的移动通信设备进行电话呼叫,并发送短信;
步骤S509,根据智能音箱接收设备的用户的交互结果,反馈给智能音箱发送设备,其中,用户的交互结果包括智能音箱接收设备的用户对象接到电话但挂断时,反馈给服务器表示正在忙;智能音箱接收设备的用户接到电话,反馈给服务器表示好的;智能音箱接收设备的用户未接电话,服务器获取到超时未响应结果。
本实施例的语音消息处理方法可用于政务办公应用场景,第一终端包括具备语音识别能力的终端、如智能音箱以及其他现有的具备用于政务办公系统的语音交互能力的智能终端等。第一目标终端为位于桌面办公时使用的智能终端,不便于开会携带。在政务办公场景下,会议繁多,该语音消息处理方法在用户不在办公桌前的情况下,通过电话拨打、短信发送的方式,使语音消息可以实时传达至第一目标终端的接收人,通过语音消息的完整闭环反馈使第一终端的发送人可以达到快速找人的目的。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中还提供了一种语音消息处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
在一个实施例中,提供了一种语音消息处理装置,请参阅图6,为本实施例提供的一种语音消息处理装置的结构框图,该装置包括:
发送模块,获取基于第一终端采集的语音信号,根据语音信号生成交互信息,并发送交互信息至第一目标终端;
接收模块,获取反馈信息;其中,在第一目标终端在线的情况下,反馈信息包括对应于第一目标终端的响应数据;在第一目标终端不在线的情况下,反馈信息包括对应于第二目标终端的响应数据,其中,第二目标终端与第一目标终端关联。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
步骤S201,获取基于第一终端采集的语音信号,根据语音信号生成交互信息,并发送交互信息至第一目标终端。
步骤S202,获取反馈信息;其中,在第一目标终端在线的情况下,反馈信息包括对应于第一目标终端的响应数据;在第一目标终端不在线的情况下,反馈信息包括对应于第二目标终端的响应数据,其中,第二目标终端与第一目标终端关联。
步骤S203,第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据,其中,第一类型响应数据根据第一目标终端的用户输入指令生成,第二类型响应数据在第一目标终端无用户输入指令的情况下生成。
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
此外,结合上述实施例中提供的语音消息处理方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种语音消息处理方法。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (14)

1.一种语音消息处理方法,其特征在于,包括:
获取基于第一终端采集的语音信号,根据所述语音信号生成交互信息,并发送所述交互信息至第一目标终端,其中,所述第一终端包括智能音箱;
获取反馈信息;
其中,在所述第一目标终端在线的情况下,所述反馈信息包括对应于所述第一目标终端的响应数据;在所述第一目标终端不在线的情况下,所述反馈信息包括对应于第二目标终端的响应数据,其中,所述第二目标终端与所述第一目标终端关联;
其中,所述第一目标终端的响应数据包括:第一类型响应数据或者第二类型响应数据,其中,所述第一类型响应数据根据所述第一目标终端的用户输入指令生成,所述第二类型响应数据在所述第一目标终端无用户输入指令的情况下生成。
2.根据权利要求1所述的语音消息处理方法,其特征在于,在获取第二类型响应数据之后,所述方法还包括:
获取对应于所述第二目标终端的响应数据。
3.根据权利要求1或权利要求2所述的语音消息处理方法,其特征在于,所述第二目标终端的响应数据包括:
第三类型响应数据或者第四类型响应数据,其中,所述第三类型响应数据通过用户输入的指令生成,所述第四类型响应数据在用户未输入指令的情况下生成。
4.根据权利要求1所述的语音消息处理方法,其特征在于,所述第二目标终端包括至少一种通信通道。
5.根据权利要求1所述的语音消息处理方法,其特征在于,获取所述反馈信息包括:以多媒体形式展示所述反馈信息。
6.根据权利要求1所述的语音消息处理方法,其特征在于,所述交互信息包括:对应所述第一目标终端的用户身份信息、所述语音消息的内容。
7.一种语音消息处理装置,其特征在于,包括:
发送模块,获取基于第一终端采集的语音信号,根据所述语音信号生成交互信息,并发送所述交互信息至第一目标终端;
接收模块,获取反馈信息;
其中,在所述第一目标终端在线的情况下,所述反馈信息包括对应于所述第一目标终端的响应数据;在所述第一目标终端不在线的情况下,所述反馈信息包括对应于第二目标终端的响应数据,其中,所述第二目标终端与所述第一目标终端关联。
8.一种语音消息处理系统,其特征在于,包括:第一终端、第一目标终端、第二目标终端、服务器;其中,至少所述第一终端与所述服务器连接,所述第一终端通过所述服务器与所述第一目标终端和/或所述第二目标终端通信,所述第一终端用于执行权利要求1至权利要求6中任一项所述的语音消息处理方法。
9.根据权利要求8所述的语音消息处理系统,其特征在于,
在所述服务器检测到所述第一目标终端在线的情况下,所述服务器发送所述第一目标终端的响应数据至所述第一终端;
在所述服务器检测到所述第一目标终端不在线的情况下,所述服务器发送所述第二目标终端的响应数据至所述第一终端。
10.根据权利要求9所述的语音消息处理系统,其特征在于,在所述服务器检测到所述第一目标终端在线的情况下,若所述第一目标终端无用户输入指令,则所述服务器发送所述第二目标终端的响应数据至所述第一终端。
11.根据权利要求9所述的语音消息处理系统,其特征在于,所述第一目标终端的响应数据包括:所述第一目标终端生成的回复内容、所述第一目标终端接受或者拒绝响应的信息、所述第一目标终端超时未收到用户输入指令的信息。
12.根据权利要求9所述的语音消息处理系统,其特征在于,所述第二目标终端的响应数据包括:所述第二目标终端接受或者拒绝响应的信息、所述第二目标终端超时未收到用户输入指令的信息所述服务器。
13.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至权利要求6中任一项所述的语音消息处理方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至权利要求6中任一项所述的语音消息处理方法的步骤。
CN202310189610.XA 2023-02-21 2023-02-21 语音消息处理方法、装置、系统、电子装置和存储介质 Pending CN116052666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310189610.XA CN116052666A (zh) 2023-02-21 2023-02-21 语音消息处理方法、装置、系统、电子装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310189610.XA CN116052666A (zh) 2023-02-21 2023-02-21 语音消息处理方法、装置、系统、电子装置和存储介质

Publications (1)

Publication Number Publication Date
CN116052666A true CN116052666A (zh) 2023-05-02

Family

ID=86129705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310189610.XA Pending CN116052666A (zh) 2023-02-21 2023-02-21 语音消息处理方法、装置、系统、电子装置和存储介质

Country Status (1)

Country Link
CN (1) CN116052666A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112447179A (zh) * 2019-08-29 2021-03-05 中国移动通信有限公司研究院 一种语音交互方法、装置、设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110850736A (zh) * 2019-11-12 2020-02-28 北京声智科技有限公司 一种控制方法及系统
CN112399022A (zh) * 2019-07-30 2021-02-23 阿里巴巴集团控股有限公司 数据处理方法、装置、设备和存储介质
CN113921002A (zh) * 2020-07-09 2022-01-11 华为技术有限公司 一种设备控制方法及相关装置
CN114172757A (zh) * 2021-12-13 2022-03-11 海信视像科技股份有限公司 服务器、智能家居系统及多设备语音唤醒方法
CN115457955A (zh) * 2022-07-29 2022-12-09 青岛海尔科技有限公司 分布式唤醒的决策方法、装置、存储介质及电子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399022A (zh) * 2019-07-30 2021-02-23 阿里巴巴集团控股有限公司 数据处理方法、装置、设备和存储介质
CN110850736A (zh) * 2019-11-12 2020-02-28 北京声智科技有限公司 一种控制方法及系统
CN113921002A (zh) * 2020-07-09 2022-01-11 华为技术有限公司 一种设备控制方法及相关装置
CN114172757A (zh) * 2021-12-13 2022-03-11 海信视像科技股份有限公司 服务器、智能家居系统及多设备语音唤醒方法
CN115457955A (zh) * 2022-07-29 2022-12-09 青岛海尔科技有限公司 分布式唤醒的决策方法、装置、存储介质及电子装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112447179A (zh) * 2019-08-29 2021-03-05 中国移动通信有限公司研究院 一种语音交互方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US8630208B1 (en) Muting of communication session participants
US10397341B2 (en) Method and apparatus for migrating active communication session between terminals
CN105611055B (zh) 通话方法及装置
MX2012011620A (es) Transicion entre llamadas de circuito conmutado y videollamadas.
CN102938787A (zh) 事件源设备和事件展示设备及相关方法
WO2023284454A1 (zh) 蓝牙连接的提示方法、装置、设备、存储介质及程序产品
CN103929349A (zh) 一种添加即时消息联系人的方法、装置和系统
CN101364923A (zh) 一种共享方法及其终端设备
CN108924033A (zh) 一种多角色参与的社交型智能音箱交互方法和系统
CN116052666A (zh) 语音消息处理方法、装置、系统、电子装置和存储介质
CN101375585B (zh) 通信系统、无线通信终端和显示控制方法
CN110602683A (zh) 蓝牙控制方法、装置、移动终端及存储介质
KR20140127700A (ko) 다자간 통화 단말 및 상기 단말에서의 다자간 통화 전환 방법
US8639222B2 (en) Message transmission method and message transmission system
CN105100352A (zh) 获取联系人信息的方法及装置
US11601546B2 (en) Event notification
WO2023045784A1 (zh) 通话控制方法、装置、电子设备及计算机可读存储介质
WO2023025150A1 (zh) 一种通话方法、电子设备及系统
CN103905483A (zh) 音视频共享方法、设备和系统
CN111800836B (zh) 一种通信方法、装置、电子设备及存储介质
CN113923722A (zh) 数据传输方法、装置及存储介质
CN113271385A (zh) 一种呼叫转移方法
US20110164559A1 (en) Cellular and landline interface to cordless call routing system
CN111132017B (zh) 一种通信终端的通信方法、电子设备及存储介质
CN103119892B (zh) 在通用型即插即用使能的电话装置和广域网装置之间进行会议消息传递的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230502