CN110798327B - 消息处理方法、设备及存储介质 - Google Patents

消息处理方法、设备及存储介质 Download PDF

Info

Publication number
CN110798327B
CN110798327B CN201910833322.7A CN201910833322A CN110798327B CN 110798327 B CN110798327 B CN 110798327B CN 201910833322 A CN201910833322 A CN 201910833322A CN 110798327 B CN110798327 B CN 110798327B
Authority
CN
China
Prior art keywords
voice
text
messages
conversation
session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910833322.7A
Other languages
English (en)
Other versions
CN110798327A (zh
Inventor
田元
沈奕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910833322.7A priority Critical patent/CN110798327B/zh
Publication of CN110798327A publication Critical patent/CN110798327A/zh
Application granted granted Critical
Publication of CN110798327B publication Critical patent/CN110798327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/18Commands or executable codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种消息处理方法、设备及存储介质,属于信息处理领域。所述方法包括:显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,对依次获取的语音会话消息进行播放。本申请通过将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。

Description

消息处理方法、设备及存储介质
技术领域
本申请涉及信息处理领域,特别涉及一种消息处理方法、设备及存储介质。
背景技术
目前,随着互联网技术的快速发展,即时通信软件已经成为了人们沟通交流的重要工具,人们可以通过在即时通信软件的会话界面中输入会话消息来与其他人进行沟通交流,所输入的会话信息可以为文本会话消息,也可以为语音会话消息。
在相关技术中,当终端通过会话界面接收到文本会话消息时,一般只能以文字形式将文本会话消息显示在会话界面中,文本会话消息的展示形式较为单一,而且,当用户不识字或视力较差时,用户将无法及时获知消息内容,导致沟通效率较低。
发明内容
本申请提供了一种消息处理方法、设备及存储介质,可以解决相关技术的文本会话消息的展示形式较为单一及不识字或视力较差的用户无法及时获知消息内容的问题。所述技术方案如下:
一方面,提供了一种消息处理方法,应用于终端,所述方法包括:
显示群组会话界面,所述群组会话界面中存在文本会话消息;
当基于所述群组会话界面接收到文本转语音操作时,依次获取所述群组会话界面中的多个参考文本会话消息对应的语音会话消息,参考文本会话消息对应的语音会话消息是对参考文本会话消息进行语音转换得到;
对依次获取的语音会话消息进行播放。
另一方面,提供了一种消息处理方法,应用于服务器,所述方法包括:
接收终端依次发送的语音转换请求,依次发送的语音转换请求携带所述终端从显示的群组会话界面中依次获取的参考文本会话消息,且依次发送的语音转换请求是所述终端在基于显示的群组会话界面接收到文本播放指令时发送的;
根据接收的语音转换请求,对所述终端从显示的群组会话界面中依次获取的参考文本会话消息进行语音转换,并将转换得到的语音会话消息依次发送给所述终端,以指示所述终端对接收到的语音会话消息进行播放。
另一方面,提供了一种消息处理装置,应用于终端,所述装置包括:
显示模块,用于显示群组会话界面,所述群组会话界面中存在文本会话消息;
获取模块,用于当基于所述群组会话界面接收到文本转语音操作时,依次获取所述群组会话界面中的多个参考文本会话消息对应的语音会话消息,参考文本会话消息对应的语音会话消息是对参考文本会话消息进行语音转换得到;
播放模块,用于对依次获取的语音会话消息进行播放。
另一方面,提供了一种消息处理装置,应用于服务器,所述装置包括:
接收模块,用于接收终端依次发送的语音转换请求,依次发送的语音转换请求携带所述终端从显示的群组会话界面中依次获取的参考文本会话消息,且依次发送的语音转换请求是所述终端在基于显示的群组会话界面接收到文本播放指令时发送的;
转换模块,用于根据接收的语音转换请求,对所述终端从显示的群组会话界面中依次获取的参考文本会话消息进行语音转换,并将转换得到的语音会话消息依次发送给所述终端,以指示所述终端对接收到的语音会话消息进行播放。
另一方面,提供了一种计算机设备,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述所述的消息处理方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现上述所述的消息处理方法。
另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的消息处理方法。
本申请提供的技术方案至少可以带来以下有益效果:
本申请实施例中,通过显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,并对依次获取的语音会话消息进行播放,可以将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的另一种实施环境示意图;
图3是本申请实施例提供的一种消息处理方法的流程图;
图4是本申请实施例提供的一种会话界面中的播放图标示意图;
图5是本申请实施例提供的一种文字转语音选项设置示意图;
图6是本申请实施例提供的一种播放速度选项的设置示意图;
图7是本申请实施例提供的一种提示用户输入语音的示意图;
图8是本申请实施例提供的一种语音信号切割示意图;
图9是本申请实施例提供的一种显示当前语音播放速度的示意图;
图10是本申请实施例提供的另一种消息处理方法的流程图;
图11是本申请实施例提供的又一种消息处理方法的流程图;
图12是本申请实施例提供的一种语音处理系统的逻辑结构示意图;
图13是本申请实施例提供的一种接口流程示意图;
图14是本申请实施例提供的一种消息处理装置的结构示意图;
图15是本申请实施例提供的另一种消息处理装置的结构示意图;
图16是本申请实施例提供的一种终端的结构框图;
图17是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的消息处理方法进行详细的解释说明之前,先对本申请实施例提供的应用场景进行介绍。
本申请实施例提供的消息处理方法应用于用户阅读会话界面中的文本会话消息的场景中。会话界面中可以包括文本会话消息或语音会话消息,对于其中的文本会话界面,当用户不识字或视力较差时,用户将无法及时阅读和获取消息内容。为了方便用户阅读会话界面中的文本会话消息,本申请提供了一种能够自动将会话界面中的文本会话消息转换为语音消息,并播放给用户的消息处理方法,详见如下图3、图10-图11实施例。
可选地,本申请实施例提供的方法应用于群聊场景中,用于对群组会话界面中的文本会话消息进行播放。当然,本申请实施例提供的消息处理方法也可以应用于其他场景,本申请实施例对此不做限定。
需要说明的是,本申请中的术语“第一”和“第二”等是为了区别不同对象,而不是用于描述特定顺序。
接下来对本申请实施例提供的实施环境进行介绍。
图1是本申请实施例提供的一种实施环境的示意图,如图1所示,该实施环境包括终端10,终端10可以是手机、平板电脑或计算机等设备。终端10中安装有通信软件,该通信软件用于为用户提供会话界面,以便用户基于会话界面与其他用户进行沟通交流。该通信软件可以为即时通信软件或社交软件等。该会话界面可以为双人会话界面或群组会话界面。可选地,终端10可以为会话界面提供文字转语音服务的服务。
图2是本申请实施例提供的另一种实施环境的示意图,如图2所示,该实施环境包括终端10和服务器20,终端10和服务器20可以通过有线网络或无线网络进行通信。终端10可以是手机、平板电脑计算机等设备,终端10中安装有通信软件,该通信软件用于为用户提供会话界面,以便用户基于会话界面与其他用户进行沟通交流。该通信软件可以为即时通信软件或社交软件等。该会话界面可以为双人会话界面或群组会话界面。服务器20可以为通信软件的后台服务器,或专门为通信软件的会话界面提供文字转语音服务的服务器。
图3是本申请实施例提供的一种消息处理方法的流程图,该方法应用于上述图1或图2所述的终端中。请参考图3,该方法包括如下步骤。
步骤301:显示群组会话界面,群组会话界面中存在文本会话消息。
群组会话界面用于支持两个或两个以上的用户进行聊天交流。可选地,群组会话界面为通信软件的群组会话界面,该通信软件可以为即时通信软件或社交软件等。
文本会话消息为文字形式的会话消息,可以为终端的当前用户自己在群组会话界面中输入的消息,也可以为除当前用户之外的群成员发送的消息,本申请实施例对此不做限定。
可选地,终端可以检测到用户打开群组会话界面的操作时,显示该群组会话界面。之后,用户可以在该群组会话界面中与其他群成员进行沟通交流,也可以查看该群组会话界面的会话消息。
步骤302:当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,参考文本会话消息对应的语音会话消息是对参考文本会话消息进行语音转换得到。
可选地,群组会话界面上显示有播放选项,当检测到对播放选项的触发操作时,确定接收到文本转语音操作。该播放选项用于指示终端以语音形式依次播放该群组会话界面的参考文本会话消息。该播放选项可以为图标、控件或文字等形式,该播放选项可以显示在群组会话界面的任意位置。该触发操作可以为对播放选项的点击操作或长按操作等。
示例的,请参考图4,可以在群组会话界面的上方显示播放图标。当用户想要对当前会话界面中的文本会话消息以语音形式进行播放时,可以点击该播放图像,以指示进行文字转语音操作。
可选地,在群组会话界面上显示播放选项之前,可以先检测该群组会话界面的文字转语音功能是否开启,当检测到该群组会话界面的文字转语音功能已开启时,在群组会话界面上显示播放选项。比如,当检测到对该群组会话界面的文字转语音功能的开启操作时,在群组会话界面中显示播放选项。
可选地,该群组会话界面的设置界面提供有文字转语音功能,用户可以在该群组会话界面的设置界面开启文字转语音功能。示例的,该群组会话界面的设置界面可以如图5所示,用户可以通过点击文字转语音功能对应的按钮,开启文字转语音功能。可选地,各个群组会话界面的文字转语音功能可以分别开启,也可以统一进行开启,本申请实施例对此不做限定。
参考文本会话消息为群组会话界面中需要进行文字转语音的文本会话消息,且当基于群组会话界面接收到文本转语音操作时,该群组会话界面中的参考文本会话消息可以依次被转换为语音并播放。也即是,用户只需执行一次文字转语音操作,即可将该群组会话界面中的多个参考文本会话消息连续进行语音转换和播放。
可选地,该参考文本会话消息可以为参考发送者的文本会话消息、话题相同的文本会话消息、群组会话界面当前显示的文本会话消息、群组会话界面当前显示的除该终端的用户发送的文本会话消息之外的文本会话消息、群组会话界面中已播放的文本会话消息之后的文本会话消息、群组会话界面中已播放的文本会话消息之后的除该终端的用户发送的文本会话消息之外的文本会话消息、与搜索关键词相关的文本会话消息中的至少一种。
其中,话题相同的多个文本会话消息可以对群组会话界面中的文本会话消息进行语义分析得到。可选地,可以对群组会话界面中的文本会话消息进行语义分析,得到会话相同的多个参考文本会话消息,然后依次获取这多个参考文本会话消息对应的语音会话消息。
其中,群组会话界面中已播放的文本会话消息之后的文本会话消息是指从上一次播放的最后一个文本会话消息之后的文本会话消息。也即是,本申请实施例中,可以从上一次播放到的最后一条文本会话消息之后的一条文本会话消息开始依次进行语音转换和播放。
其中,搜索关键词可以为用户搜索的关键词。作为一个示例,用户可根据关键词搜索与关键词相关的文本会话消息进行文本转语音操作。
本申请实施例中,可以由终端对参考文本会话消息进行语音转换,得到参考文本会话消息对应的语音会话消息,以可以由终端将待转换的参考文本会话消息发送给服务器,由服务器对参考文本会话消息进行语音转换,再将转换得到的语音会话消息返回给终端。也即是,获取群组会话界面中的多个参考文本会话消息对应的语音会话消息有以下两种实现方式:
第一种实现方式:依次对所述群组会话界面中的参考文本会话消息进行语音转换,得到语音会话消息。
第二种实现方式:依次向服务器发送语音转换请求,且依次发送的语音转换请求携带从所述群组会话界面中依次获取的参考文本会话消息,用于请求所述服务器对依次获取的参考文本会话消息进行语音转换,得到语音会话消息;依次接收所述服务器根据依次发送的语音转换请求返回的语音会话消息。
需要说明的是,以上两种实现方式将在下述图10和图11两个实施例中分别进行详细解释,故在此不做赘述。
步骤303:对依次获取的语音会话消息进行播放。
也即是,终端可以将群组会话界面中的多个参考语音会话消息依次转换为语音并进行播放,使得用户仅需一次文字转语音操作,即可连续收听到当前的文本会话消息对应的语音。
可选地,在终端对依次获取的语音会话消息进行播放时,可以在群组会话界面上显示播放图标,用于指示当前正在对文本会话消息进行语音播放。
需要说明的是,若用户对群组会话界面进行上滑或下拉等操作,可改变该群组会话界面所显示的文本会话消息。本申请实施例中,在对群组会话界面当前显示的参考文本会话消息播放完成之后,终端可以自动对下一页的参考文本会话消息依次进行语音转换和播放,也可以在检测到对群组会话界面的上滑操作时,再对新显示的参考文本会话消息依次进行语音转换和播放,若未检测到新显示的参考文本会话,则停止进行语音转换和播放。
可选地,对目标文本会话消息的触发操作可以为点击操作、长按操作或者按压压力满足预设条件的按压操作等。比如,触发操作可以为按压压力大于压力阈值的按压操作即重按操作,或者按压压力小于压力阈值的按压操作即轻按操作。
可选地,在对文本会话消息对应的语音会话消息进行播放时,还可以设置语音会话消息的播放速度,按照设置的播放速度对语音会话消息进行播放。语音会话消息的播放速度可以由终端默认设置,可以由用户预先设置,也可以在播放的过程中进行设置,本申请实施例对此不做限定。通过设置语音会话消息的播放速度,可以提高播放语音会话消息的灵活性,满足用户的多样化需求。
可选地,当检测到播放速度设置操作时,可以在群组会话界面中显示多个播放速度选项,当检测到对播放速度选项的选择操作时,将选择的播放速度选项作为语音会话消息的播放速度。该多个播放速度选项对应于不同的播放速度,比如,该多个播放速度选项可以包括0.5倍速、1倍速、1.5倍速、2倍速和用户语速等,如图6所示。其中,用户语速是指与用户语速匹配的语音播放速度。
可选地,还可以将语音会话消息的播放速度设置为与用户语速匹配的播放速度。可选地,终端可以获取用户的语音信息,对用户的语音信息进行分析,得到用户的语速,确定与用户的语速匹配的语音播放速度,将与用户的语速匹配的语音播放速度作为语音会话消息的播放速度。
可选地,终端可以在检测到语速匹配的设置操作时,获取用户的语音信息。比如,群组会话界面提供有语速匹配的设置入口,当检测到对该入口的触发操作时,获取用户的语音信息。可选地,可以获取用户输入的语音信息,比如当检测到对该入口的触发操作时,可以显示语音录入图标,当检测到对语音录入图标的触发操作时,对用户输入的语音进行录制,得到用户的语音信息。
作为一个示例,图7为用户输入语音信息的示意图,用户可以根据输入提示将自己的语音输入到终端,终端将根据用户输入的语音分析用户的语速,将用户的语速与语音会话消息的播放速度进行匹配。
可选地,上述多个播放速度选项还可以包括语速匹配选项,该语速匹配选项用于将语音消息的播放速度设置为与用户的语速匹配的语音播放速度。与用户的语速匹配的语音播放速度可以提前设置,也可以实时设置,本申请实施例对此不做限定。
在对语音会话消息的播放速度进行处理时,可以通过对语音会话消息进行切割和删除一些特征来达到加速的播放效果,以及通过对语音会话消息进行切割和增加一些特征来达到减速的播放效果。
可选地,在对依次获取的语音会话消息进行播放的过程中,当接收到播放速度调整指令时,可以按照调整后的播放速度,对依次获取的语音会话消息进行播放。
对语音会话信号的播放速度的调整,可以由终端自己来进行处理,也可以由服务器进行处理。也即是,按照调整后的播放速度,对依次获取的语音会话消息进行播放可以包括以下两种实现方式:
第一种实现方式:根据调整后的播放速度,对依次获取的语音会话消息进行倍速处理,对倍速处理后的语音会话消息进行播放。
可选地,若调整后的播放速度大于调整前的播放速度,则按照调整后的播放速度,对目标语音会话消息进行切割,在每个切割点删除相邻音元,得到倍速处理后的语音会话消息。若调整后的播放速度小于调整前的播放速度,则按照调整后的播放速度,对目标语音会话消息进行切割,在每个切割点插入与相邻音元相似的音元,得到倍速处理后的语音会话消息。
也即是,可以通过在语音会话消息中插入或删除相邻音元的方式,实现语音信号的减速和加速处理。
第二种实现方式:向服务器发送播放速度调整请求,播放速度调整请求携带调整后的播放速度,用于请求服务器对依次获取的语音会话消息进行倍速处理;接收服务器发送的倍速处理后的语音会话消息,对倍速处理后的语音会话消息进行播放。
其中,音元为语音信息的基本结构单元,根据幅值和频率的不同,音元有着多种形状结构,由于一段语音信号中的音元的基音周期不同,可根据AMDF (Average MagnitudeDifference Function,平均幅度差函数法)来识别音元的基音周期,基于音元的基音周期来识别音元的切割点,因此可通过在一段语音信号中删除或插入形状相似或相同的音元来改变语音播放速度。
作为一个示例,可以通过AMDF算法识别基音周期,比如通过以下公式(1) 识别基音周期:
Figure RE-GDA0002266671910000101
其中,τ是语音信号的采样时间间隔,s(i)是语音信号采样序列,s(i+τ) 是采样间隔时长为τ的语音信号采样序列,amdf(τ)为基音周期。
作为一个示例,请参考图8,图8为语音信号切割示意图。如图8所示,可以将一段语音信号的多个音元合并为一帧,在帧与帧之间进行删除或者插入音元的操作,以达到调整播放速度的效果。将前后两帧的重复帧称为帧移,如图8所示,原始语音信号的帧移为sa,进行删除音元操作后的语音信号的帧移为ss,通过删除音元可以将前后两帧的帧移变短,达到加速的播放效果。
可选地,在终端依次播放获取的语音会话消息的过程中,还可以在群组会话界面中提示当前语音播放速度。图9为群组会话界面的语音播放示意图,在语音播放过程中,可以在群组会话界面中提示当前语音播放速度为1.5倍速。
需要说明的是,本申请实施例仅是以对群组会话界面中的参考文本会话消息依次进行语音转换和播放为例进行说明,而在其他实施例中,用户还可以仅对某个文本会话消息进行语音转换和播放。比如,当检测到对群组会话界面中显示的目标文本会话消息的触发操作时,获取目标文本会话消息对应的语音会话消息,并对目标文本会话消息对应的语音会话消息进行播放。
本申请实施例中,通过显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,并对依次获取的语音会话消息进行播放,可以将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。
图10是本申请实施例提供的另一种消息处理方法的流程图,该方法应用于终端中,请参考图10,该方法包括如下步骤:
步骤1001:显示群组会话界面,群组会话界面中存在文本会话消息。
需要说明的是,步骤1001与上述步骤301同理,具体实现过程可以参考上述步骤301的相关描述,本申请实施例在此不再赘述。
步骤1002:当基于群组会话界面接收到文本转语音操作时,依次对群组会话界面中的参考文本会话消息进行语音转换,以获取语音会话消息。
可选地,终端可以采用相同音色,依次对群组会话界面中的参考文本会话消息进行语音转换,得到以相同隐私进行模拟的语音会话消息。
可选地,终端也可以采用不同的音色,对群组会话界面中不同发送者的文本会话消息进行语音转换,得到以不同音色进行模拟的语音会话消息。也即是,针对不同的发送者,可以采用不同的音色对其文本会话消息进行播放。比如,对发送者1、发送者2、发送者3和发送者4的文本会话消息,分别采用女声1、女声2、男声1和男声2进行语音转换和播放。
可选地,对于群组会话界面中不同发送者的文本会话消息,还可以根据每个发送者的属性信息,确定与每个发送者匹配的音色;按照与每个发送者匹配的音色,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色进行模拟的语音会话消息。
可选地,与每个发送者匹配的音色可以为与每个发送者的年龄、性别以及其他属性中的至少一种匹配的音色。如此,可以模拟与对应年龄或性别等属性匹配的语音。
可选地,还可以根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者的匹配的语气;然后按照与每个发送者的匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息。
其中,每个发送者的文本会话消息的上下文消息可以为上下文文本会话消息,也可以为上下文语音会话消息。也即是,可以根据文本会话消息的上下文消息,来模拟文本会话消息的发送者的说话语气,使得播放的语音会话消息更加形象。
步骤1003:对依次获取的语音会话消息进行播放。
需要说明的是,本申请实施例仅是以对群组会话界面中的参考文本会话消息依次进行语音转换和播放为例进行说明,而在其他实施例中,用户还可以仅对某个文本会话消息进行语音转换和播放。比如,当终端检测到对群组会话界面中显示的目标文本会话消息的触发操作时,对目标文本会话消息进行转换,得到目标文本会话消息对应的语音会话消息,并对该语音会话消息进行播放。
终端对文本会话消息进行文本转语音处理以及语音播放速度的处理提高了用户的沟通效率。
本申请实施例中,通过显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,并对依次获取的语音会话消息进行播放,可以将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。
图11是本申请实施例提供的另一种消息处理方法的流程图,该方法应用于终端和服务器的交互中,请参考图11,该方法包括如下步骤:
步骤1101:终端显示群组会话界面,群组会话界面中存在文本会话消息。
需要说明的是,步骤1101与上述步骤301同理,具体实现过程可以参考上述步骤301的相关描述,本申请实施例在此不再赘述。
步骤1102:终端当基于群组会话界面接收到文本转语音操作时,依次向服务器发送语音转换请求,依次发送的语音转换请求携带从群组会话界面中依次获取的参考文本会话消息。
其中,依次发送的语音转换请求用于请求服务器对依次获取的参考文本会话消息进行语音转换,得到语音会话消息,并将转换得到的语音会话消息发送给终端。
步骤1103:服务器接收终端依次发送的语音转换请求,根据接收的语音转换请求,对终端从显示的群组会话界面中依次获取的参考文本会话消息进行语音转换,并将转换得到的语音会话消息依次发送给终端,以指示终端对接收到的语音会话消息进行播放。
其中,依次发送的语音转换请求携带终端从显示的群组会话界面中依次获取的参考文本会话消息,且依次发送的语音转换请求是终端在基于显示的群组会话界面接收到文本播放指令时发送的。
可选地,服务器在对依次获取的参考文本会话消息进行语音转换时,可以采用不同的音色,对群组会话界面中不同发送者的文本会话消息进行语音转换,得到以不同音色进行模拟的语音会话消息。
可选地,对于群组会话界面中不同发送者的文本会话消息,可以根据每个发送者的属性信息,确定与每个发送者匹配的音色;按照与每个发送者匹配的音色,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色进行模拟的语音会话消息。
可选地,还可以根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者的匹配的语气;然后按照与每个发送者的匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息。
步骤1104:终端依次接收服务器根据依次发送的语音转换请求返回的语音会话消息,并对依次接收的语音会话消息进行播放。
需要说明的是,本申请实施例仅是以对群组会话界面中的参考文本会话消息依次进行语音转换和播放为例进行说明,而在其他实施例中,用户还可以仅对某个文本会话消息进行语音转换和播放。比如,当终端检测到对群组会话界面中显示的目标文本会话消息的触发操作时,向服务器发送语音转换请求,该语音转换请求携带目标文本会话消息,服务器接收到该语音转换请求后,对目标文本会话消息进行转换,得到目标文本会话消息对应的语音会话消息,并将该语音会话消息发送给终端,由终端进行播放。
作为另一实施例,在终端与服务器进行交互时,可通过不同的模块和接口来实现文字转语音功能。图12是本申请实施例提供的一种语音处理系统的逻辑结构示意图,如图12所示,这些接口主要包括终端的文本转语音模块、终端的声音速度处理模块、服务器的语音播放模块和终端的播放文本转语音模块四个模块。其中,#set_transfer_voice、#transfer_voice_on、#set_voice_speed、 #sever_set_transfer_voice、#sever_set_transfer_speed、#input_text_msg、 #output_voice_msg和#show_msg_help为接口名称,指示服务类型。图13是本申请实施例提供的一种接口流程示意图。
终端的文本转语音模块:#set_transfer_voice接口用于获取哪个用户(user id)在哪个会话(dialog id)开启了文本转语音选项,#transfer_voice_on负责与服务器进行交互,使得服务器得到哪个用户在哪个会话开启了文本转语音选项的信息。
终端的声音速度处理模块:#set_voice_speed负责与服务器交互,使得服务器得到用户在什么时间设置了语音播放速度,语音播放速度为多少倍速,若用户想要设置语音播放速度为与自己语音速度匹配的语音播放速度,则 #set_voice_speed接口可以将用户输入的语音素材传送给服务器。
服务器的语音播放模块:由#sever_set_transfer_voice接口和终端进行通信, #sever_set_transfer_speed接口获取当前会话中的语音播放速度及用户语音播放速度,当用户开启文字转语音选项时,input_text_msg接口会将当前文本会话消息和语音库进行匹配,转为语音,#output_voice_msg接口为文本会话消息提供语音形式的播放。
终端的播放文本转语音模块:#show_msg_help接口用于播放语音内容。
示例的,表1为用户设置开启文本转语音功能后服务器获取的终端信息:
表1
UserID(用户ID) dialogID(会话ID) transfer_voice_on(功能指示信息)
1 111 on
1 112 on
示例的,表2为用户设置播放速度后服务器获取的播放速度设置信息:
表2
Figure RE-GDA0002266671910000141
本申请实施例中,通过显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,并对依次获取的语音会话消息进行播放,可以将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。
图14是本申请实施例提供的一种消息处理装置的结构示意图,应用于终端,该消息处理装置可以由软件、硬件或者两者的结合实现成为终端的部分或者全部,该终端可以为图1或图2所示的终端。请参考图14,该装置包括:显示模块1401、获取模块1402和播放模块1403。
显示模块1401,用于显示群组会话界面,该群组会话界面中存在文本会话消息;
获取模块1402,用于当基于该群组会话界面接收到文本转语音操作时,依次获取该群组会话界面中的多个参考文本会话消息对应的语音会话消息,参考文本会话消息对应的语音会话消息是对参考文本会话消息进行语音转换得到;
播放模块1403,用于对依次获取的语音会话消息进行播放。
可选地,该获取模块1402用于:
可选地,多个参考文本会话消息为参考发送者的多个文本会话消息、话题相同的多个文本会话消息、群组会话界面当前显示的多个文本会话消息、以及群组会话界面中已播放的文本会话消息之后的多个文本会话消息中的至少一种,话题相同的多个文本会话消息是对群组会话界面中的文本会话消息进行语义分析得到。
可选地,该获取模块1402包括:
第一转换单元,用于依次对该群组会话界面中的参考文本会话消息进行语音转换,得到语音会话消息。
可选地,该第一转换单元用于:
第一转换子单元,采用不同的音色,对所述群组会话界面中不同发送者的文本会话消息进行语音转换,得到以不同音色进行模拟的语音会话消息。
可选地,该第一转换单元用于:
对于群组会话界面中不同发送者的文本会话消息,根据每个发送者的属性信息,确定与每个发送者匹配的音色;
按照与每个发送者匹配的音色,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色进行模拟的语音会话消息。
可选地,该第一转换单元用于:
根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者的匹配的语气;
按照与每个发送者的匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息。
图15是本申请实施例提供的另一种消息处理装置的结构示意图,应用于服务器,该消息处理装置可以由软件、硬件或者两者的结合实现成为服务器的部分或者全部,该服务器可以为图2所示的服务器。请参考图15,该装置包括:接收模块1501和转换模块1502。
接收模块1501,用于接收终端依次发送的语音转换请求,依次发送的语音转换请求携带所述终端从显示的群组会话界面中依次获取的参考文本会话消息,且依次发送的语音转换请求是所述终端在基于显示的群组会话界面接收到文本播放指令时发送的;
转换模块1502,用于根据接收的语音转换请求,对所述终端从显示的群组会话界面中依次获取的参考文本会话消息进行语音转换,并将转换得到的语音会话消息依次发送给所述终端,以指示所述终端对接收到的语音会话消息进行播放。
可选地,该1502模块包括:
第二转换单元,用于依次向服务器发送语音转换请求,且依次发送的语音转换请求携带从所述群组会话界面中依次获取的参考文本会话消息,用于请求所述服务器对依次获取的参考文本会话消息进行语音转换,得到语音会话消息;依次接收所述服务器根据依次发送的语音转换请求返回的语音会话消息。
可选地,该第二转换单元用于:
采用不同的音色,对所述群组会话界面中不同发送者的文本会话消息进行语音转换,得到以不同音色进行模拟的语音会话消息。
可选地,该第二转换单元用于:
对于群组会话界面中不同发送者的文本会话消息,根据每个发送者的属性信息,确定与每个发送者匹配的音色;
按照与每个发送者匹配的音色,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色进行模拟的语音会话消息。
可选地,该第二转换单元用于:
根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者的匹配的语气;
按照与每个发送者的匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息。
在本申请实施例中,通过显示群组会话界面,当基于群组会话界面接收到文本转语音操作时,依次获取群组会话界面中的多个参考文本会话消息对应的语音会话消息,并对依次获取的语音会话消息进行播放,可以将群组会话界面中的文本会话消息转换为语音形式播放给用户,扩展了文本会话消息的展示形式,解决了对于视力不好或不识字的用户来说无法及时文本会话消息的消息内容的问题,提高了用户的沟通效率。而且,用户只需执行一次文本转语音操作,即可将群组会话界面中的多个文本会话消息依次转换为语音并播放,简化了用户的操作,提高了消息获取效率。
需要说明的是:上述实施例提供的消息处理装置在对文本消息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的消息处理装置与消息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图16是本申请实施例提供的一种终端1600的结构框图。该终端1600可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1600包括有:处理器1601和存储器1602。
处理器1601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1601可以采用DSP(Digital Signal Processing,数字信号处理)、 FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA (Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器 1601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1601所执行以实现本申请中方法实施例提供的消息处理方法。
在一些实施例中,终端1600还可选包括有:外围设备接口1603和至少一个外围设备。处理器1601、存储器1602和外围设备接口1603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1603相连。具体地,外围设备包括:射频电路1604、触摸显示屏1605、摄像头1606、音频电路1607、定位组件1608和电源1609中的至少一种。
外围设备接口1603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1601和存储器1602。在一些实施例中,处理器1601、存储器1602和外围设备接口1603被集成在同一芯片或电路板上;在一些其他实施例中,处理器1601、存储器1602和外围设备接口1603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1605是触摸显示屏时,显示屏1605还具有采集在显示屏1605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1601进行处理。此时,显示屏1605 还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1605可以为一个,设置终端1600的前面板;在另一些实施例中,显示屏1605可以为至少两个,分别设置在终端1600的不同表面或呈折叠设计;在再一些实施例中,显示屏1605可以是柔性显示屏,设置在终端1600的弯曲表面上或折叠面上。甚至,显示屏1605还可以设置成非矩形的不规则图形,也即异形屏。显示屏1605可以采用LCD(Liquid Crystal Display,液晶显示屏)、 OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1606用于采集图像或视频。可选地,摄像头组件1606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1601进行处理,或者输入至射频电路 1604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1601或射频电路1604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1607还可以包括耳机插孔。
定位组件1608用于定位终端1600的当前地理位置,以实现导航或LBS (LocationBased Service,基于位置的服务)。定位组件1608可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1609用于为终端1600中的各个组件进行供电。电源1609可以是交流电、直流电、一次性电池或可充电电池。当电源1609包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1600还包括有一个或多个传感器1610。该一个或多个传感器1610包括但不限于:加速度传感器1611、陀螺仪传感器1612、压力传感器1613、指纹传感器1616、光学传感器1615以及接近传感器1616。
加速度传感器1611可以检测以终端1600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1611可以用于检测重力加速度在三个坐标轴上的分量。处理器1601可以根据加速度传感器1611采集的重力加速度信号,控制触摸显示屏1605以横向视图或纵向视图进行用户界面的显示。加速度传感器1611还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1612可以检测终端1600的机体方向及转动角度,陀螺仪传感器1612可以与加速度传感器1611协同采集用户对终端1600的3D动作。处理器1601根据陀螺仪传感器1612采集的数据,可以实现如下功能:动作感应 (比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1613可以设置在终端1600的侧边框和/或触摸显示屏1605的下层。当压力传感器1613设置在终端1600的侧边框时,可以检测用户对终端1600 的握持信号,由处理器1601根据压力传感器1613采集的握持信号进行左右手识别或快捷操作。当压力传感器1613设置在触摸显示屏1605的下层时,由处理器1601根据用户对触摸显示屏1605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1616用于采集用户的指纹,由处理器1601根据指纹传感器1616 采集到的指纹识别用户的身份,或者,由指纹传感器1616根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1601授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1616可以被设置终端1600的正面、背面或侧面。当终端1600上设置有物理按键或厂商Logo时,指纹传感器1616可以与物理按键或厂商Logo集成在一起。
光学传感器1615用于采集环境光强度。在一个实施例中,处理器1601可以根据光学传感器1615采集的环境光强度,控制触摸显示屏1605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1605的显示亮度;当环境光强度较低时,调低触摸显示屏1605的显示亮度。在另一个实施例中,处理器1601 还可以根据光学传感器1615采集的环境光强度,动态调整摄像头组件1606的拍摄参数。
接近传感器1616,也称距离传感器,通常设置在终端1600的前面板。接近传感器1616用于采集用户与终端1600的正面之间的距离。在一个实施例中,当接近传感器1616检测到用户与终端1600的正面之间的距离逐渐变小时,由处理器1601控制触摸显示屏1605从亮屏状态切换为息屏状态;当接近传感器 1616检测到用户与终端1600的正面之间的距离逐渐变大时,由处理器1601控制触摸显示屏1605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图16中示出的结构并不构成对终端1600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图17是本发明实施例提供的一种服务器1700的结构示意图,该服务器1700 可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)1701和一个或一个以上的存储器1702,其中,所述存储器1702中存储有至少一条指令,所述至少一条指令由所述处理器1701 加载并执行以实现上述各个方法实施例提供的消息处理方法。当然,该服务器 1700还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1700还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性的实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述消息处理方法。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于实现上述消息处理方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种消息处理方法,其特征在于,应用于终端中,所述方法包括:
显示群组会话界面,所述群组会话界面中存在文本会话消息;
当基于所述群组会话界面接收到文本转语音操作时,依次获取所述群组会话界面中的多个参考文本会话消息对应的语音会话消息,参考文本会话消息对应的语音会话消息是对参考文本会话消息进行语音转换得到,所述群组会话界面中的多个参考文本会话消息包括不同发送者的文本会话消息;所述群组会话界面中的多个参考文本会话消息对应的语音会话消息是所述终端获取的,或者是所述终端向服务器发送语音转换请求,由所述服务器基于所述语音转换请求获取并返回给所述终端的,所述语音转换请求携带所述群组会话界面中的多个参考文本会话消息;
对依次获取的语音会话消息进行播放;
所述依次获取所述群组会话界面中的多个参考文本会话消息对应的语音会话消息,包括:
对于所述群组会话界面中不同发送者的文本会话消息,根据每个发送者的属性信息,确定与每个发送者匹配的音色;根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者匹配的语气;按照与每个发送者匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息;
所述对依次获取的语音会话消息进行播放之前,还包括:
获取用户的语音信息,对所述语音信息进行分析,得到所述用户的语速,确定与所述用户的语速匹配的语音播放速度,将与所述用户的语速匹配的语音播放速度确定为调整后的播放速度;
相应地,所述对依次获取的语音会话消息进行播放,包括:
当接收到播放速度调整指令时,根据所述调整后的播放速度,对依次获取的语音会话消息进行倍速处理,或者向所述服务器发送播放速度调整请求,由所述服务器对依次获取的语音会话消息进行倍速处理,并返回给所述终端,所述播放速度调整请求携带所述调整后的播放速度;
对倍速处理后的语音会话消息进行播放。
2.根据权利要求1所述的方法,其特征在于,所述多个参考文本会话消息为参考发送者的多个文本会话消息、话题相同的多个文本会话消息、所述群组会话界面当前显示的多个文本会话消息、以及所述群组会话界面中已播放的文本会话消息之后的多个文本会话消息中的至少一种,所述话题相同的多个文本会话消息是对所述群组会话界面中的文本会话消息进行语义分析得到。
3.一种消息处理方法,其特征在于,应用于服务器中,所述方法包括:
接收终端依次发送的语音转换请求,依次发送的语音转换请求携带所述终端从显示的群组会话界面中依次获取的参考文本会话消息,且依次发送的语音转换请求是所述终端在基于显示的群组会话界面接收到文本播放指令时发送的,所述依次获取的参考文本会话消息包括不同发送者的文本会话消息;
根据接收的语音转换请求和每个发送者的属性信息,确定与每个发送者匹配的音色;根据每个发送者的属性信息,以及每个发送者的文本会话消息的上下文消息,确定与每个发送者匹配的语气;按照与每个发送者匹配的音色和语气,对每个发送者的文本会话消息进行语音转换,得到以与每个发送者匹配的音色和语气进行模拟的语音会话消息,并将转换得到的语音会话消息依次发送给所述终端,以指示所述终端对接收到的语音会话消息进行播放;
所述将转换得到的语音会话消息依次发送给所述终端,包括:
接收终端在接收到播放速度调整指令时发送的播放速度调整请求,所述播放速度调整请求携带调整后的播放速度;根据调整后的播放速度,对依次获取的语音会话消息进行倍速处理,并将倍速处理后的语音会话消息发送给所述终端进行播放,所述调整后的播放速度为与用户的语速匹配的语音播放速度,所述与用户的语速匹配的语音播放速度是所述终端基于所述用户的语速确定的,所述用户的语速是所述终端通过对获取的用户的语音信息进行分析得到的。
4.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至2任一所述的方法或者如权利要求3所述的方法。
5.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至2任一所述的方法或者如权利要求3所述的方法。
CN201910833322.7A 2019-09-04 2019-09-04 消息处理方法、设备及存储介质 Active CN110798327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910833322.7A CN110798327B (zh) 2019-09-04 2019-09-04 消息处理方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910833322.7A CN110798327B (zh) 2019-09-04 2019-09-04 消息处理方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110798327A CN110798327A (zh) 2020-02-14
CN110798327B true CN110798327B (zh) 2022-09-30

Family

ID=69427196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910833322.7A Active CN110798327B (zh) 2019-09-04 2019-09-04 消息处理方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110798327B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111835621A (zh) * 2020-07-10 2020-10-27 腾讯科技(深圳)有限公司 会话消息处理方法、装置、计算机设备及可读存储介质
CN113689854B (zh) * 2021-08-12 2024-01-23 深圳追一科技有限公司 语音会话方法、装置、计算机设备和存储介质
CN114566164A (zh) * 2022-02-23 2022-05-31 成都智元汇信息技术股份有限公司 基于公共交通的人工播报音频自适应方法、显示终端及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602608A (zh) * 2001-12-11 2005-03-30 西门子公司 用于把文本数据转换为语音输出的系统
CN101075983A (zh) * 2006-12-15 2007-11-21 腾讯科技(深圳)有限公司 即时语音通信终端、服务器、系统和即时语音通信方法
CN106209583A (zh) * 2016-06-30 2016-12-07 乐视控股(北京)有限公司 一种消息输入方法、装置及其用户终端
CN106302996A (zh) * 2016-07-29 2017-01-04 腾讯科技(深圳)有限公司 消息显示方法及装置
CN106357509A (zh) * 2016-08-31 2017-01-25 维沃移动通信有限公司 一种对已接收消息进行查看的方法及移动终端
CN106470146A (zh) * 2015-08-17 2017-03-01 腾讯科技(深圳)有限公司 即时通信应用中文本转换为语音的方法和装置
CN106789602A (zh) * 2017-03-15 2017-05-31 广东欧珀移动通信有限公司 语音播放控制方法、终端及移动终端
CN107124352A (zh) * 2017-05-26 2017-09-01 维沃移动通信有限公司 一种语音信息的处理方法及移动终端
CN107634898A (zh) * 2017-08-18 2018-01-26 上海云从企业发展有限公司 通过电子通信设备上的聊天工具来实现真人语音信息通信
CN107707454A (zh) * 2017-09-19 2018-02-16 广东小天才科技有限公司 一种基于即时通信或社交应用的信息处理方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW442740B (en) * 1998-12-18 2001-06-23 Inventec Corp Method for changing articulation speed
US20040267531A1 (en) * 2003-06-30 2004-12-30 Whynot Stephen R. Method and system for providing text-to-speech instant messaging
CN103514922B (zh) * 2012-06-29 2016-05-11 致伸科技股份有限公司 音频播放的方法、媒体控制器、媒体播放器及媒体服务器
CN105869626B (zh) * 2016-05-31 2019-02-05 宇龙计算机通信科技(深圳)有限公司 一种语速自动调节的方法及终端
CN109379497B (zh) * 2018-12-28 2023-07-07 深圳市欣易辰信息科技有限公司 语音信息播放方法、移动终端及计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1602608A (zh) * 2001-12-11 2005-03-30 西门子公司 用于把文本数据转换为语音输出的系统
CN101075983A (zh) * 2006-12-15 2007-11-21 腾讯科技(深圳)有限公司 即时语音通信终端、服务器、系统和即时语音通信方法
CN106470146A (zh) * 2015-08-17 2017-03-01 腾讯科技(深圳)有限公司 即时通信应用中文本转换为语音的方法和装置
CN106209583A (zh) * 2016-06-30 2016-12-07 乐视控股(北京)有限公司 一种消息输入方法、装置及其用户终端
CN106302996A (zh) * 2016-07-29 2017-01-04 腾讯科技(深圳)有限公司 消息显示方法及装置
CN106357509A (zh) * 2016-08-31 2017-01-25 维沃移动通信有限公司 一种对已接收消息进行查看的方法及移动终端
CN106789602A (zh) * 2017-03-15 2017-05-31 广东欧珀移动通信有限公司 语音播放控制方法、终端及移动终端
CN107124352A (zh) * 2017-05-26 2017-09-01 维沃移动通信有限公司 一种语音信息的处理方法及移动终端
CN107634898A (zh) * 2017-08-18 2018-01-26 上海云从企业发展有限公司 通过电子通信设备上的聊天工具来实现真人语音信息通信
CN107707454A (zh) * 2017-09-19 2018-02-16 广东小天才科技有限公司 一种基于即时通信或社交应用的信息处理方法及装置

Also Published As

Publication number Publication date
CN110798327A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
WO2019114514A1 (zh) 在直播间显示音高信息的方法及装置、存储介质
CN109327608B (zh) 歌曲分享的方法、终端、服务器和系统
CN110061900B (zh) 消息显示方法、装置、终端及计算机可读存储介质
CN110572716B (zh) 多媒体数据播放方法、装置及存储介质
CN109346111B (zh) 数据处理方法、装置、终端及存储介质
CN111445901B (zh) 音频数据获取方法、装置、电子设备及存储介质
CN113411680B (zh) 多媒体资源播放方法、装置、终端及存储介质
CN111061405B (zh) 录制歌曲音频的方法、装置、设备及存储介质
CN110109608B (zh) 文本显示方法、装置、终端及存储介质
CN110798327B (zh) 消息处理方法、设备及存储介质
CN111613213B (zh) 音频分类的方法、装置、设备以及存储介质
CN111276122A (zh) 音频生成方法及装置、存储介质
CN111628925A (zh) 歌曲交互方法、装置、终端及存储介质
CN111081277B (zh) 音频测评的方法、装置、设备及存储介质
CN111092991B (zh) 歌词显示方法及装置、计算机存储介质
CN114245218A (zh) 音视频播放方法、装置、计算机设备及存储介质
CN110136752B (zh) 音频处理的方法、装置、终端及计算机可读存储介质
CN112069350A (zh) 歌曲推荐方法、装置、设备以及计算机存储介质
CN111554314A (zh) 噪声检测方法、装置、终端及存储介质
CN113301444B (zh) 视频处理方法、装置、电子设备及存储介质
CN114827651A (zh) 信息处理方法、装置、电子设备及存储介质
CN113744736A (zh) 命令词识别方法、装置、电子设备及存储介质
CN111314205A (zh) 即时通信匹配的方法、装置、系统、设备以及存储介质
CN112311652A (zh) 消息发送方法、装置、终端及存储介质
CN111613252B (zh) 音频录制的方法、装置、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant