CN110830368A - 即时通讯消息发送方法及电子设备 - Google Patents
即时通讯消息发送方法及电子设备 Download PDFInfo
- Publication number
- CN110830368A CN110830368A CN201911159719.9A CN201911159719A CN110830368A CN 110830368 A CN110830368 A CN 110830368A CN 201911159719 A CN201911159719 A CN 201911159719A CN 110830368 A CN110830368 A CN 110830368A
- Authority
- CN
- China
- Prior art keywords
- background music
- target
- audio file
- file data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例提供了一种即时通讯消息发送方法及电子设备,其中,该方法包括:基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
Description
技术领域
本发明涉及电子设备技术领域,尤其涉及一种即时通讯消息发送方法及电子设备。
背景技术
目前,随着移动通信技术的快速发展,电子设备(如智能手机等)已成为人们日常生活中必不可少的电子消费品,随着智能手机越来越普及化,同时,智能手机的功能不断升级、优化,智能手机已经融入生活的各个方面,用户经常在各种场合各种地点使用智能手机。
其中,智能技术的发展也导致用户对电子设备功能的要求越来越高,现在的即时通信手段非常丰富,例如,电话,短信,使用即时通讯软件进行即时交互等等,随着即时通讯软件的功能不断丰富,即时通讯软件已在人们日常生活中使用的主要聊天工具,目前,在使用即时通讯软件进行即时对话过程中,能够通过文字、图片和语音等方式进行聊天交互,但目前的语音聊天交互方式比较单一,只是单纯的将用户语音作为即时通讯消息发送给对方,难以符合当前用户对电子设备个性化的要求。
由此可知,现有技术中的利用即时通讯软件进行语音交互过程,在即时通讯对话框中发送的语音信息形式比较单一,不能满足用户个性化需求,因此,需要设计一个丰富语音聊天方式的功能。
发明内容
本发明实施例的目的是提供一种即时通讯消息发送方法及电子设备,以解决现有技术中的利用即时通讯软件进行语音交互过程,在即时通讯对话框中发送的语音信息形式比较单一,不能满足用户个性化需求的问题。
为了解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例提供了一种即时通讯消息发送方法,包括:
基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
发送包含所述目标音频文件数据的即时通讯消息。
第二方面,本发明实施例提供了一种电子设备,包括:
背景音乐确定模块,用于基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
目标音频文件生成模块,用于根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
即时通讯消息发送模块,用于发送包含所述目标音频文件数据的即时通讯消息。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的即时通讯消息发送方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的即时通讯消息发送方法的步骤。
本发明实施例中的即时通讯消息发送方法及电子设备,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的即时通讯消息发送方法的第一种流程示意图;
图2为本发明实施例提供的即时通讯消息发送方法的第二种流程示意图;
图3为本发明实施例提供的即时通讯消息发送方法的第三种流程示意图;
图4a为本发明实施例提供的即时通讯消息发送方法中确定备选背景音乐的一种实现原理示意图;
图4b为本发明实施例提供的即时通讯消息发送方法中发送即时通讯消息的一种效果示意图;
图5a为本发明实施例提供的即时通讯消息发送方法中确定备选背景音乐的另一种实现原理示意图;
图5b为本发明实施例提供的即时通讯消息发送方法中发送即时通讯消息的另一种效果示意图;
图6为本发明实施例提供的即时通讯消息发送方法的第四种流程示意图;
图7为本发明实施例提供的即时通讯消息发送方法的第五种流程示意图;
图8为本发明实施例提供的电子设备的模块组成示意图;
图9为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明实施例提供了一种即时通讯消息发送方法及电子设备,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
图1为本发明实施例提供的即时通讯消息发送方法的第一种流程示意图,图1中的方法能够由电子设备执行,特别由电子设备其中设置的程序模块执行,如图1所示,该方法至少包括以下步骤:
S101,基于即时通讯对话的对话特征信息,确定目标背景音乐;
其中,上述对话特征信息可以是即时通讯会话相关的原始会话信息,该对话特征信息可以包括:对话内容信息、所在对话群组名称、当前对话时间信息、对话位置信息中至少一项,该对话内容信息包括:在即时通讯对话框中输入的语音、文字和图片中至少一项;
具体的,通过上述即时通讯对话的对话特征信息,确定出对话的关键词和对话场景信息,根据该对话的关键词和对话场景信息,确定出用户情绪,将与确定出的用户情绪匹配度最大的背景音乐确定为目标背景音乐;或者先根据确定出的用户情绪,确定多个备选的背景音乐,再根据用户针对显示的多个备选的背景音乐的选择操作,确定目标背景音乐。
S102,根据确定出的目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
具体的,在确定出目标背景音乐后,可以获取待发送的目标用户的语音信息,直接将该目标背景音乐和目标用户的语音信息进行合成,得到目标音频文件数据;也可以在播放目标背景音乐的过程中,将收录的目标背景音乐和用户语音信息进行合成,得到目标音频文件数据,即播放该目标背景音乐,以及打开麦克风,收录目标用户的语音信息和该目标背景音乐,得到目标音频文件数据。其中,还可以增加对音频文件数据进行完整性检测,若确定音频文件数据完整,则将该音频文件数据确定为目标音频文件数据;
具体的,在录制过程中,若检测到生成的音频文件数据中的背景音乐录制不完整或用户语音录制不完整,则丢弃当前的音频文件数据,重新打开麦克风,并提示用户重新输入语音信息并进行录制,将录制完整的音频文件数据确定为目标音频数据文件,或关闭外放功能,只收录用户语音作为目标音频文件数据。
S103,发送包含目标音频文件数据的即时通讯消息;
具体的,针对目标音频文件数据的生成过程,将目标背景音乐和目标用户的语音信息进行合成得到音频文件数据,可以直接将该合成后的音频文件确定为目标音频文件数据,也可以先对该合成后的音频文件数据进行预设处理,将处理后的音频文件数据确定为目标音频文件数据,其中,该预设处理包括:变声处理、或者去噪声处理,从而满足不同用户对音频文件数据进行处理的个性化需求。
本发明实施例中,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
进一步,针对确定目标背景音乐的具体过程,通过先确定对话有效信息,再根据对话有效信息确定多个备选的背景音乐,从而确定目标背景音乐,如图2所示,上述S101,基于即时通讯对话的对话特征信息,确定目标背景音乐,具体包括:
S1011,基于即时通讯对话的对话特征信息,确定对话有效信息;
其中,上述对话特征信息包括:对话内容信息、所在对话群组名称、当前对话时间信息、对话位置信息中至少一项,上述对话有效信息包括:对话场景信息和/或对话关键词,其中,该对话场景信息包括:对话双方所属关系、时间、地点和对话环境中至少一项,该对话关键词包括:针对图片智能识别出来的关键词、针对语音识别的关键词和针对文字识别出来的关键词至少一项,该对话环境包括:幽默环境、严肃环境和搞笑环境至少一项;
具体的,可以通过对即时通讯会话相关的原始会话信息进行分析,提取出表征目标用户当前情绪类型的对话有效信息,其中,该对话有效信息的确定过程可以是:在获取即时通讯对话的对话特征信息之后,根据对话群组名称和对话内容信息确定对话场景信息,以及根据该对话内容信息,确定对话关键词,从而基于对话场景信息和对话关键词中至少一项确定对话有效信息。
S1012,根据对话有效信息,确定多个备选背景音乐;
具体的,在确定出上述对话场景信息和对话关键词之后,可以在背景音乐库中基于该对话场景信息和对话关键词匹配出对应的多个背景音乐,即确定出多个备选背景音乐,并在进行即时通讯的对话界面展示该多个备选背景音乐,以供用户根据需求进行目标背景音乐的选取;其中,考虑到匹配出的多个备选背景音乐的数量可能比较多,因此,可以按照音乐热度由大到小的顺序展示预设数量个备选背景音乐,若接收到备选背景音乐的更新请求,再按照音乐热度由大到小的顺序在未展示的备选背景音乐中选取下一批展示的预设数量个备选背景音乐,以实现按需对展示的备选背景音乐进行实时更新,其中,该音乐热度可以是根据点击率、播放率、下载率等确定的。
S1013,基于多个备选背景音乐,确定目标背景音乐;
具体的,针对上述确定出的多个备选背景音乐,在接收到用户针对某个备选背景音乐的选择操作之后,确定该备选背景音乐为目标背景音乐。
其中,为了进一步提高备选背景音乐的匹配准确地,引入用户情绪类型,基于用户情绪类型进行背景音乐的匹配,基于此,上述S1012,根据所述对话有效信息,确定多个备选背景音乐,具体包括:
步骤一,根据对话有效信息,确定目标用户的用户情绪类型;
具体的,在确定出上述对话场景信息和对话关键词之后,先根据该对话场景信息和对话关键词,确定目标用户的用户情绪类型,并显示在进行即时通讯的对话界面中,若在预设时间内接收到用户的更改操作,说明该目标用户的用户情绪类型不符合当前用户的需求,则选取另外的备选用户情绪类型作为目标用户的用户情绪类型;
需要说明的是,确定目标背景音乐的过程也可以是:根据上述对话场景信息和对话关键词直接确定出目标用户的用户情绪类型,并根据该目标用户的用户情绪类型匹配出相关度最高的背景音乐直接作为目标背景音乐;
在一个具体的实施例中,根据对话有效信息,确定出目标用户的情绪类型为高兴情绪,基于该高兴情绪匹配相关度最高的背景音乐《生日快乐》,并将背景音乐《生日快乐》确定为目标背景音乐。
步骤二,确定与用户情绪类型相匹配的多个备选背景音乐;
在确定出目标用户的用户情绪类型之后,基于该用户情绪类型自动匹配多个备选背景音乐,并在进行即时通讯的对话界面展示该多个备选背景音乐。
若首次展示的多个备选背景音乐不符合用户的要求,需要重新匹配备选背景音乐,基于此,如图3所示,上述S1013,基于多个备选背景音乐,确定目标背景音乐,具体包括:
S10131,判断在预设时间内是否接收到针对多个备选背景音乐的更新请求。
若判断结果为是,则执行S10132,更新当前显示的多个备选背景音乐;
以及S10133,在接收针到对更新后的多个备选背景音乐的选择操作之后,将该选择操作针对的备选背景音乐确定为目标背景音乐;
具体的,如果在预设时间段内接收到用户针对第一预设位置的触控操作,则确定预设时间内接收到针对多个备选背景音乐的更新请求,此时说明当前为用户展示的多个备选背景音乐均不符合用户需求,需要重新确定备选背景音乐,并展示重新确定的多个备选背景音乐,具体的,可以在与确定出的情绪类型匹配的多个背景音乐中,选取除上一次确定出的多个备选背景音乐之外的其他预设数量个备选背景音乐,以便用户根据实际需求选取所需的背景音乐作为目标背景音乐;
进一步的,为了提高用户使用体验,减少备选背景音乐重复选取时间,如果多次为用户推荐的备选背景音乐均无法满足用户的需求,则说明确定出的情绪类型可能不准确,需要重新进行用户情绪类型的确定,因此,备选背景音乐的更新次数小于预设次数阈值、或针对确定出的情绪类型向用户展示的备选背景音乐的总数量小于预设数量阈值;
对应的,若备选背景音乐的更新次数大于预设次数阈值、或针对确定出的情绪类型向用户展示的备选背景音乐的总数量大于预设数量阈值,或者,在预设时间段内接收到用户针对第二预设位置的触控操作,则说明首次确定的情绪类型不符合用户的要求,即识别出的对话关键词的准确度低,此时,需要重新对上述对话特征信息进行识别;进一步的,在对该对话特征信息重新识别之后,再次确定用户情绪类型,以及根据更新后的用户情绪类型匹配多个备选背景音乐并在进行即时通讯的对话界面展示以供用户选择,在接收到针对更新后的多个备选背景音乐的选择操作之后,将该选择操作针对的备选背景音乐确定为目标背景音乐。
若判断结果为否,则执行S10134,在接收到针到对多个备选背景音乐的选择操作之后,将该选择操作针对的备选背景音乐确定为目标背景音乐;
若在预设时间内接收到针对首次展示的多个备选背景音乐中的某个背景音乐的选择操作,确定该背景音乐为目标背景音乐;
在一个具体的实施例中,针对目标背景音乐的确定过程,如图4a所示,在一个外汇项目组群中,基于对话内容信息中的语音信息识别出来对话关键词为“要怎么办”,基于对话内容中的文字信息识别出对话关键词“跌破7、要完”,以及基于聊天群的名称识别出对话场景信息为“同事关系、搞笑和问答”;进而确定出该实施例的对话有效信息为“要怎么办”、“跌破7、要完”和“同事关系、搞笑和问答”;
根据上述对话有效信息确定目标用户的用户情绪为伤感情绪,基于该伤感情绪确定出排序靠前的3首备选背景音乐分别为《凉凉》、《从头再来》、《说好不哭》,并将该三首背景音乐在进行即时通讯的对话界面中展示,并在接收到针对背景音乐《凉凉》对应的试听按键的点击操作之后,播放该背景音乐《凉凉》;在该背景音乐《凉凉》播放完毕后2秒,接收到用户针对背景音乐《凉凉》对应的选择按键的选择操作,说明背景音乐《凉凉》满足用户的需求,确定该背景音乐《凉凉》为目标背景音乐,其中,为了便于用户区分,在即时通讯对话框中将该伤感情绪对应的图标由第一颜色变为第二颜色,以及将背景音乐《凉凉》对应的选择按键对应的图标由第一颜色变为第二颜色;
需要说明的是,在图4a中,若在预设时间内接收到用户针对“重新匹配背景音乐”对应的按键的点击操作之后,则说明用户有针对为用户展示的多个备选背景音乐的更新请求,在与该伤感情绪匹配的背景音乐中重新选取待展示的预设数量的备选背景音乐,例如,选取除上一次展示的3个备选背景音乐《凉凉》、《从头再来》、《说好不哭》之外的排序靠前的3个备选背景音乐,并在进行即时通讯的对话界面展示;对应的,若在预设时间内在接收到用户针对“重新识别用户情绪”对应的按键的点击操作,则说明首次确定的情绪类型不符合用户的要求,即识别出的关键词不符合用户的要求,针对图4a的对话特征信息,可以对该对话特征信息中的对话内容信息中的文字信息的“人民币兑美元”进行识别,再次确定用户情绪类型,匹配并在进行即时通讯的对话界面展示多个备选背景音乐,在接收到针对更新后的多个备选背景音乐的选择操作之后,将该选择操作针对的备选背景音乐确定为目标背景音乐;
进一步的,在将带有目标背景音乐的即时通讯消息发送给聊天对象之后,将给聊天对象一种新奇、惊讶的感觉,达到个性化聊天的效果,如图4b所示,基于图4a中给出的实例,将背景音乐《凉凉》作为目标背景音乐,并将同时录制有该背景音乐《凉凉》和用户语音的音频文件数据作为即时通讯消息发送至即时通讯对话框,以便即时通讯消息接收方在播放该即时通讯消息时更具有对话情景带入感。
在另一个具体的实施例中,针对目标背景音乐的确定过程,如图5a所示,在与用户名称为“微商牛哥”的用户的对话中,基于对话内容信息中的图片信息识别出对话关键字为“法拉利跑车”,基于该对话关键字“法拉利跑车”确定出对话关键词“漂移”,基于用户名称“微商牛哥”确定出对话关键词“微商”,以及基于对话内容信息中的文字信息确定对话场景信息为“炫耀、朋友和年底”,进而确定出该实施例的对话有效信息为“法拉利跑车、漂移、微商”和“炫耀、朋友、年底”;
根据上述对话有效信息确定出目标用户的用户情绪为亢奋情绪,基于该亢奋情绪确定出排序靠前的3首备选背景音乐分别为《老大》、《头文字d》、《人人弹起》,并将该三首背景音乐在进行即时通讯的对话界面展示,在接收到针对背景音乐《老大》对应的试听按键的点击操作之后,播放该背景音乐《老大》;在该背景音乐《老大》播放完毕后2秒,接收到用户针对背景音乐《老大》对应的选择按键的选择操作,说明背景音乐《老大》满足用户的需求,确定该背景音乐《老大》为目标背景音乐,其中,为了便于用户区分,在即时通讯对话框中将该伤感情绪对应的图标由第一颜色变为第二颜色,以及将背景音乐《老大》对应的选择按键对应的图标由第一颜色变为第二颜色;
需要说明的是,对应的,在图5a中,若在预设时间内接收到用户针对“重新匹配背景音乐”对应的按键的点击操作之后,则说明用户有针对为用户展示的多个备选背景音乐的更新请求,在与对该亢奋情绪匹配的背景音乐中重新选取待展示的预设数量的备选背景音乐,例如,选取除上一次展示出的3个备选背景音乐《老大》、《头文字d》、《人人弹起》之外的排序靠前的3个备选背景音乐,并在进行即时通讯的对话界面展示;对应的,若在预设时间内在接收到用户针对“重新识别用户情绪”对应的按键的点击操作,则说明首次确定的情绪类型不符合用户的要求,即识别出的关键词不符合用户的要求,针对图5a的对话特征信息,可以对该对话特征信息中的对话内容信息中的文字信息的“年终奖”进行识别,再次确定用户情绪类型,匹配并在即时通讯的对话界面展示多个备选背景音乐,在接收到针对更新后的多个备选背景音乐的选择操作之后,将该选择操作针对的备选背景音乐确定为目标背景音乐;
进一步的,在将带有目标背景音乐的即时通讯消息发送给聊天对象之后,将给聊天对象一种新奇、惊讶的感觉,达到个性化聊天的效果,如图5b所示,基于图5a中给出的实例,如果将背景音乐《老大》作为目标背景音乐,并将同时录制有歌曲背景音乐《老大》和用户语音的音频文件数据作为即时通讯消息发送至即时通讯对话框,以便即时通讯消息接收方在播放该即时通讯消息时更具有对话情景带入感。
进一步的,为了满足不同用户对目标音频文件数据的个性化处理需求,基于此,如图6所示,上述S102,根据确定出的目标背景音乐和目标用户的语音信息,生成目标音频文件数据,具体包括:
S1021,接收用于表征请求语音变声的第一输入;
S1022,响应于第一输入,对基于目标背景音乐和目标用户的语音信息得到的音频文件数据进行变声处理,得到变声后的音频文件数据;
S1023,将变声后的音频文件数据确定为目标音频文件数据。
具体的,先基于目标背景音乐和目标用户的语音信息,生成原始音频文件数据,若在预设时间内检测到语音变声请求,则在该原始音频文件数据中,根据目标用户所选取的变声类型对用户语音信息进行变声处理,得到变声后的音频文件数据;其中,该变声类型可以包括:壮汉音、萝莉音、金属音、惊悚音和口吃中任一项,再将包含变声后的音频文件数据的即时通讯消息发送给用户的聊天对象。
具体的,若在预设时间内未检测到语音变声请求,则将该基于目标背景音乐和目标用户的语音信息得到的原始音频文件数据确定为目标音频文件数据,并将包含该目标音频文件数据的即时通讯消息发送给聊天对象。
在一个具体的实施例中,比如,在图4a中,若在预设时间内接收到用户针对“变声”对应的按键的点击操作,则说明用户觉得用户语音原声搭配背景音乐《凉凉》生成的目标音频文件作为即时通讯消息不够丰富,对用户语音进行变声操作,若此时用户对用户语音变声类型的要求为将用户语音变为萝莉音,则得到变为萝莉音的用户语音的目标音频文件数据,并将该目标音频文件数据确定为即时通讯消息发送给聊天对象;对应的,若接收到用户针对“原声”对应的按键的点击操作,则将原始音频文件数据作为即时通讯消息发送给聊天对象。
进一步的,针对将目标背景音乐和目标用户的语音信息进行合成得到的原始音频文件数据的过程,可能包含有周边其他用户的语音信息等噪音信息,因此,需要对该原始音频文件数据进行去噪声操作,得到目标音频文件数据;其中,考虑到每个人的声纹特征具有唯一性,进而能够通过对音频文件数据中包含的多个声纹特征进行识别,并展示声纹特征标识与语音关键词之间的对应关系,以便接收用户针对该对应关系选取的噪音信息对应的声纹特征,再自动基于该噪音信息对应的声纹特征对音频文件进行去噪音处理,这样在将噪音录制到音频文件数据的情况,无需重新录制用户语音,实现了自动去噪音处理,基于此,上述S102,根据确定出的目标背景音乐和目标用户的语音信息,生成目标音频文件数据,具体包括:
步骤一,接收用于表征请求音频去噪音的第二输入;
步骤二,响应于第二输入,确定待消除的噪音音频对应的声纹特征信息;
步骤三,基于确定出的声纹特征信息,对基于目标背景音乐和目标用户的语音信息得到的音频文件数据进行剪辑处理,得到去噪音后的音频文件数据;
步骤四,将去噪音后的音频文件数据确定为目标音频文件数据。
具体的,先基于目标背景音乐和目标用户的语音信息,生成原始音频文件数据,若在预设时间内检测到去噪声请求,则展示声纹特征与关键词之间的对应关系,其中,该对应关系包括:原始音频文件数据中包含的多个声纹特征信息、以及每个声纹特征信息对应的关键词;在接收到用户基于该对应关系所输入的选择操作之后,将该用户选择的关键词对应的声纹特征信息确定为待消除的噪音音频对应的目标声纹特征信息;将该目标声纹特征信息对应的噪音音频从原始音频文件数据中剔除,得到去噪音后的音频文件数据。
在一个具体的实施例中,若目标用户处于比较嘈杂的环境下,在自动确定出目标背景音乐为《凉凉》之后,播放背景音乐《凉凉》,并录制该背景音乐《凉凉》和用户语音,在录制过程中同时录制进了背景音乐《凉凉》、用户语音“你好”等、以及路人的“哈哈”笑声等,在检测到用户去噪声请求之后,展示音频文件数据中包含的多个声纹特征标识与各自对应的关键词,例如,显示声纹特征1---“凉凉”、声纹特征2---“你好”、和声纹特征3---“哈哈”,如果接收到针对“声纹特征3---“哈哈””的选择操作,则将声纹特征3确定为待消除的噪音音频对应的声纹特征信息,因此,可以确定该声纹特征3对应的所有音频信息为噪音音频,进而消除该声纹特征3对应的所有音频信息,将消除噪音音频后的音频文件数据确定为目标音频文件数据。
在一个具体的实施例中,如图7所示,给出了本发明实施例提供的即时通讯消息发送方法的第五种流程示意图,上述即时通讯消息发送方法具体包括:
S701,基于即时通讯对话的对话特征信息,确定对话有效信息;
S702,根据对话有效信息,确定目标用户的用户情绪类型;
S703,确定与用户情绪类型相匹配的多个备选背景音乐;
S704,判断在第一预设时间内是否接收到针对多个备选背景音乐的更新请求;
若判断结果为是,则执行S705,更新当前显示的多个备选背景音乐;
以及S706,在接收针到对更新后的多个备选背景音乐的选择操作之后,将上述选择操作针对的备选背景音乐确定为目标背景音乐;
若判断结果为否,则执行S707,在接收到针对多个备选背景音乐的选择操作之后,将选择操作针对的备选背景音乐确定为目标背景音乐;
S708,在播放目标背景音乐时,录制目标背景音乐和目标用户的语音信息,得到原始音频文件数据;
S709,判断在第二预设时间内是否检测到对原始音频文件数据的语音变声请求;
若判断结果为是,则执行S710,对原始音频文件数据进行变声处理,将变声后的原始音频文件数据确定为目标音频文件数据;
若判断结果为否,则执行S711,将原始音频文件确定为目标音频文件数据;
S712,发送包含目标音频文件数据的即时通讯消息。
本发明实施例中的即时通讯消息发送方法,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
对应上述实施例提供的种即时通讯消息发送方法,基于相同的技术构思,本发明实施例还提供了一种电子设备,图8为本发明实施例提供的电子设备的第一种模块组成示意图,该电子设备用于执行图1至图7描述的种即时通讯消息发送方法,如图8所示,该电子设备包括:
背景音乐确定模块801,用于基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
目标音频文件生成模块802,用于根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
即时通讯消息发送模块803,用于发送包含所述目标音频文件数据的即时通讯消息。
可选地,上述背景音乐确定模块801,具体用于:
基于即时通讯对话的对话特征信息,确定对话有效信息,其中,所述对话有效信息包括:对话场景信息和/或对话关键词;
根据所述对话有效信息,确定多个备选背景音乐;
基于所述多个备选背景音乐,确定目标背景音乐。”
可选地,上述背景音乐确定模块801,进一步具体用于:
根据所述对话有效信息,确定目标用户的用户情绪类型;
确定与所述用户情绪类型相匹配的多个备选背景音乐。
可选地,上述背景音乐确定模块801,还进一步具体用于:
接收针对所述多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐;
或者,
若在预设时间段内接收到针对所述多个备选背景音乐的更新请求,则更改当前显示的多个备选背景音乐,并接收针对更新后的多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐。
可选地,上述目标音频文件生成模块802,具体用于:
接收用于表征请求语音变声的第一输入;
响应于所述第一输入,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行变声处理,得到变声后的音频文件数据;
将所述变声后的音频文件数据确定为目标音频文件数据。
可选地,上述目标音频文件生成模块802,还具体用于:
接收用于表征请求音频去噪音的第二输入;
响应于所述第二输入,确定待消除的噪音音频对应的声纹特征信息;
基于所述声纹特征信息,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行剪辑处理,得到去噪音后的音频文件数据;
将所述去噪音后的音频文件数据确定为目标音频文件数据。
本发明实施例中的电子设备,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
本发明实施例提供的电子设备能够实现上述种即时通讯消息发送方法对应的实施例中的各个过程,为避免重复,这里不再赘述。
需要说明的是,本发明实施例提供的电子设备与本发明实施例提供的种即时通讯消息发送方法基于同一发明构思,因此该实施例的具体实施可以参见前述种即时通讯消息发送方法的实施,重复之处不再赘述。
对应上述实施例提供的种即时通讯消息发送方法,基于相同的技术构思,本发明实施例还提供了一种电子设备,该设备用于执行上述的种即时通讯消息发送方法,图9为实现本发明各个实施例的一种电子设备的硬件结构示意图,图9所示的电子设备100包括但不限于:射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
处理器110,用于:
基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
发送包含所述目标音频文件数据的即时通讯消息。
本发明实施例提供了一种即时通讯消息发送方法及电子设备,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
其中,处理器110,还用于:
所述基于即时通讯对话的对话特征信息,确定目标背景音乐,包括:
基于即时通讯对话的对话特征信息,确定对话有效信息,其中,所述对话有效信息包括:对话场景信息和/或对话关键词;
根据所述对话有效信息,确定多个备选背景音乐;
基于所述多个备选背景音乐,确定目标背景音乐。
其中,处理器110,还用于:
根据所述对话有效信息,确定目标用户的用户情绪类型;
确定与所述用户情绪类型相匹配的多个备选背景音乐。
其中,处理器110,还用于:
接收针对所述多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐;
或者,
若在预设时间段内接收到针对所述多个备选背景音乐的更新请求,则更新当前显示的多个备选背景音乐,并接收针对更新后的多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐。
其中,处理器110,还用于:
接收用于表征请求语音变声的第一输入;
响应于所述第一输入,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行变声处理,得到变声后的音频文件数据;
将所述变声后的音频文件数据确定为目标音频文件数据。
其中,处理器110,还用于:
接收用于表征请求音频去噪音的第二输入;
响应于所述第二输入,确定待消除的噪音音频对应的声纹特征信息;
基于所述声纹特征信息,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行剪辑处理,得到去噪音后的音频文件数据;
将所述去噪音后的音频文件数据确定为目标音频文件数据。
本发明实施例中的电子设备100,基于即时通讯对话的对话特征信息,确定目标背景音乐;根据该目标背景音乐和目标用户的语音信息,生成目标音频文件数据;再发送包含该目标音频文件数据的即时通讯消息。本发明实施例中,通过向用户智能推荐与当前即时交互场景相匹配的背景音乐,并且基于该背景音乐和用户的语音信息,得到目标音频文件数据,再将该目标音频文件数据作为即时通讯消息发送至消息接收方,这样能够提供在用户语音信息中添加背景音乐的个性化需求,增强即时通讯的交互多样化和互动乐趣,使得对方更具有对话情景带入感,提升用户使用体验。
需要说明的是,本发明实施例提供的电子设备100能够实现上述即时通讯消息发送方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
应理解的是,本发明实施例中,射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块102为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元103可以将射频单元101或网络模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与电子设备100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103包括扬声器、蜂鸣器以及受话器等。
输入单元104用于接收音频或视频信号。输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或网络模块102进行发送。麦克风1042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。
电子设备100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在电子设备100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板1071可覆盖在显示面板1061上,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图9中,触控面板1071与显示面板1061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元108为外部装置与电子设备100连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备100内的一个或多个元件或者可以用于在电子设备100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
电子设备100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备100包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器110,存储器109,存储在存储器109上并可在所述处理器110上运行的计算机程序,该计算机程序被处理器110执行时实现上述即时通讯消息发送方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
进一步地,对应上述实施例提供的即时通讯消息发送方法,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器110执行时实现如上述即时通讯消息发送方法实施例的各步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
可以理解的是,本发明实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本发明所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本发明实施例所述功能的模块(例如过程、函数等)来实现本发明实施例所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (14)
1.一种即时通讯消息发送方法,应用于电子设备,其特征在于,所述方法包括:
基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
发送包含所述目标音频文件数据的即时通讯消息。
2.根据权利要求1所述的方法,其特征在于,所述基于即时通讯对话的对话特征信息,确定目标背景音乐,包括:
基于即时通讯对话的对话特征信息,确定对话有效信息,其中,所述对话有效信息包括:对话场景信息和/或对话关键词;
根据所述对话有效信息,确定多个备选背景音乐;
基于所述多个备选背景音乐,确定目标背景音乐。
3.根据权利要求2所述的方法,其特征在于,所述根据所述对话有效信息,确定多个备选背景音乐,包括:
根据所述对话有效信息,确定目标用户的用户情绪类型;
确定与所述用户情绪类型相匹配的多个备选背景音乐。
4.根据权利要求2所述的方法,其特征在于,所述基于所述多个备选背景音乐,确定目标背景音乐,包括:
接收针对所述多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐;
或者,
若在预设时间段内接收到针对所述多个备选背景音乐的更新请求,则更新当前显示的多个备选背景音乐,并接收针对更新后的多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据,包括:
接收用于表征请求语音变声的第一输入;
响应于所述第一输入,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行变声处理,得到变声后的音频文件数据;
将所述变声后的音频文件数据确定为目标音频文件数据。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据,包括:
接收用于表征请求音频去噪音的第二输入;
响应于所述第二输入,确定待消除的噪音音频对应的声纹特征信息;
基于所述声纹特征信息,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行剪辑处理,得到去噪音后的音频文件数据;
将所述去噪音后的音频文件数据确定为目标音频文件数据。
7.一种电子设备,其特征在于,包括:
背景音乐确定模块,用于基于即时通讯对话的对话特征信息,确定目标背景音乐,其中,所述对话特征信息包括:对话内容信息、所在对话群组名称、对话时间信息、对话位置信息中至少一项;
目标音频文件生成模块,用于根据所述目标背景音乐和目标用户的语音信息,生成目标音频文件数据;
即时通讯消息发送模块,用于发送包含所述目标音频文件数据的即时通讯消息。
8.根据权利要求7所述的电子设备,其特征在于,所述背景音乐确定模块,具体用于:
基于即时通讯对话的对话特征信息,确定对话有效信息,其中,所述对话有效信息包括:对话场景信息和/或对话关键词;
根据所述对话有效信息,确定多个备选背景音乐;
基于所述多个备选背景音乐,确定目标背景音乐。
9.根据权利要求8所述的电子设备,其特征在于,所述背景音乐确定模块,进一步具体用于:
根据所述对话有效信息,确定目标用户的用户情绪类型;
确定与所述用户情绪类型相匹配的多个备选背景音乐。
10.根据权利要求8所述的电子设备,其特征在于,所述背景音乐确定模块,还进一步具体用于:
接收针对所述多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐;
或者,
若在预设时间段内接收到针对所述多个备选背景音乐的更新请求,则更新当前显示的多个备选背景音乐,并接收针对更新后的多个备选背景音乐的选择操作,将所述选择操作针对的所述备选背景音乐确定为目标背景音乐。
11.根据权利要求7所述的电子设备,其特征在于,所述目标音频文件生成模块,具体用于:
接收用于表征请求语音变声的第一输入;
响应于所述第一输入,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行变声处理,得到变声后的音频文件数据;
将所述变声后的音频文件数据确定为目标音频文件数据。
12.根据权利要求7所述的电子设备,其特征在于,所述目标音频文件生成模块,还具体用于:
接收用于表征请求音频去噪音的第二输入;
响应于所述第二输入,确定待消除的噪音音频对应的声纹特征信息;
基于所述声纹特征信息,对基于所述目标背景音乐和目标用户的语音信息得到的音频文件数据进行剪辑处理,得到去噪音后的音频文件数据;
将所述去噪音后的音频文件数据确定为目标音频文件数据。
13.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的即时通讯消息发送方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的即时通讯消息发送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911159719.9A CN110830368B (zh) | 2019-11-22 | 2019-11-22 | 即时通讯消息发送方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911159719.9A CN110830368B (zh) | 2019-11-22 | 2019-11-22 | 即时通讯消息发送方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110830368A true CN110830368A (zh) | 2020-02-21 |
CN110830368B CN110830368B (zh) | 2022-05-06 |
Family
ID=69558498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911159719.9A Active CN110830368B (zh) | 2019-11-22 | 2019-11-22 | 即时通讯消息发送方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110830368B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112367242A (zh) * | 2020-10-23 | 2021-02-12 | 维沃移动通信(杭州)有限公司 | 信息显示方法、装置、设备和介质 |
CN112732156A (zh) * | 2020-12-30 | 2021-04-30 | 维沃移动通信有限公司 | 信息显示方法、装置和电子设备 |
CN112910761A (zh) * | 2021-01-29 | 2021-06-04 | 北京百度网讯科技有限公司 | 即时通讯方法、装置、设备、存储介质以及程序产品 |
CN113923517A (zh) * | 2021-09-30 | 2022-01-11 | 北京搜狗科技发展有限公司 | 一种背景音乐生成方法、装置及电子设备 |
CN115497489A (zh) * | 2022-09-02 | 2022-12-20 | 深圳传音通讯有限公司 | 语音交互方法、智能终端及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1933495A (zh) * | 2005-09-14 | 2007-03-21 | 联想(北京)有限公司 | 通信终端以及通信方法 |
US20100302254A1 (en) * | 2009-05-28 | 2010-12-02 | Samsung Electronics Co., Ltd. | Animation system and methods for generating animation based on text-based data and user information |
CN104022942A (zh) * | 2014-06-26 | 2014-09-03 | 北京奇虎科技有限公司 | 处理交互式消息的方法、客户端、电子设备及系统 |
CN104144097A (zh) * | 2013-05-07 | 2014-11-12 | 百度在线网络技术(北京)有限公司 | 语音消息传输系统、发送端、接收端及语音消息传输方法 |
CN105208056A (zh) * | 2014-06-18 | 2015-12-30 | 腾讯科技(深圳)有限公司 | 信息交互的方法及终端 |
CN105989165A (zh) * | 2015-03-04 | 2016-10-05 | 深圳市腾讯计算机系统有限公司 | 在即时聊天工具中播放表情信息的方法、装置及系统 |
CN106506437A (zh) * | 2015-09-07 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法,及设备 |
CN106531149A (zh) * | 2016-12-07 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 信息处理方法及装置 |
CN109246308A (zh) * | 2018-10-24 | 2019-01-18 | 维沃移动通信有限公司 | 一种语音处理方法及终端设备 |
CN109347721A (zh) * | 2018-09-28 | 2019-02-15 | 维沃移动通信有限公司 | 一种信息发送方法及终端设备 |
US20190087491A1 (en) * | 2017-09-15 | 2019-03-21 | Yahoo Holdings, Inc. | Conversation summary |
CN109525725A (zh) * | 2018-11-21 | 2019-03-26 | 三星电子(中国)研发中心 | 一种基于情绪状态的信息处理方法和装置 |
CN109885713A (zh) * | 2019-01-03 | 2019-06-14 | 刘伯涵 | 基于语音情绪识别的表情图像推荐方法以及装置 |
CN110019286A (zh) * | 2017-07-19 | 2019-07-16 | 中国移动通信有限公司研究院 | 一种基于用户社交关系的表情推荐方法及装置 |
CN110166351A (zh) * | 2019-06-06 | 2019-08-23 | 王东 | 一种基于即时通讯的交互方法、装置和电子设备 |
-
2019
- 2019-11-22 CN CN201911159719.9A patent/CN110830368B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1933495A (zh) * | 2005-09-14 | 2007-03-21 | 联想(北京)有限公司 | 通信终端以及通信方法 |
US20100302254A1 (en) * | 2009-05-28 | 2010-12-02 | Samsung Electronics Co., Ltd. | Animation system and methods for generating animation based on text-based data and user information |
CN104144097A (zh) * | 2013-05-07 | 2014-11-12 | 百度在线网络技术(北京)有限公司 | 语音消息传输系统、发送端、接收端及语音消息传输方法 |
CN105208056A (zh) * | 2014-06-18 | 2015-12-30 | 腾讯科技(深圳)有限公司 | 信息交互的方法及终端 |
CN104022942A (zh) * | 2014-06-26 | 2014-09-03 | 北京奇虎科技有限公司 | 处理交互式消息的方法、客户端、电子设备及系统 |
CN105989165A (zh) * | 2015-03-04 | 2016-10-05 | 深圳市腾讯计算机系统有限公司 | 在即时聊天工具中播放表情信息的方法、装置及系统 |
CN106506437A (zh) * | 2015-09-07 | 2017-03-15 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法,及设备 |
CN106531149A (zh) * | 2016-12-07 | 2017-03-22 | 腾讯科技(深圳)有限公司 | 信息处理方法及装置 |
CN110019286A (zh) * | 2017-07-19 | 2019-07-16 | 中国移动通信有限公司研究院 | 一种基于用户社交关系的表情推荐方法及装置 |
US20190087491A1 (en) * | 2017-09-15 | 2019-03-21 | Yahoo Holdings, Inc. | Conversation summary |
CN109347721A (zh) * | 2018-09-28 | 2019-02-15 | 维沃移动通信有限公司 | 一种信息发送方法及终端设备 |
CN109246308A (zh) * | 2018-10-24 | 2019-01-18 | 维沃移动通信有限公司 | 一种语音处理方法及终端设备 |
CN109525725A (zh) * | 2018-11-21 | 2019-03-26 | 三星电子(中国)研发中心 | 一种基于情绪状态的信息处理方法和装置 |
CN109885713A (zh) * | 2019-01-03 | 2019-06-14 | 刘伯涵 | 基于语音情绪识别的表情图像推荐方法以及装置 |
CN110166351A (zh) * | 2019-06-06 | 2019-08-23 | 王东 | 一种基于即时通讯的交互方法、装置和电子设备 |
Non-Patent Citations (2)
Title |
---|
MUHAMMAD EHSAN RANA,等: ""An Enterprise Instant Messaging (EIM) solution to cater issues associated with instant messaging (IM) in business"", 《2015 IEEE STUDENT CONFERENCE ON RESEARCH AND DEVELOPMENT (SCORED)》 * |
晁建嵩: ""基于跨媒体语义匹配的的相册背景音乐推荐"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112367242A (zh) * | 2020-10-23 | 2021-02-12 | 维沃移动通信(杭州)有限公司 | 信息显示方法、装置、设备和介质 |
CN112367242B (zh) * | 2020-10-23 | 2022-08-30 | 维沃移动通信(杭州)有限公司 | 信息显示方法、装置、设备和介质 |
CN112732156A (zh) * | 2020-12-30 | 2021-04-30 | 维沃移动通信有限公司 | 信息显示方法、装置和电子设备 |
CN112910761A (zh) * | 2021-01-29 | 2021-06-04 | 北京百度网讯科技有限公司 | 即时通讯方法、装置、设备、存储介质以及程序产品 |
CN113923517A (zh) * | 2021-09-30 | 2022-01-11 | 北京搜狗科技发展有限公司 | 一种背景音乐生成方法、装置及电子设备 |
CN113923517B (zh) * | 2021-09-30 | 2024-05-07 | 北京搜狗科技发展有限公司 | 一种背景音乐生成方法、装置及电子设备 |
CN115497489A (zh) * | 2022-09-02 | 2022-12-20 | 深圳传音通讯有限公司 | 语音交互方法、智能终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110830368B (zh) | 2022-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110830368B (zh) | 即时通讯消息发送方法及电子设备 | |
CN110740262A (zh) | 背景音乐的添加方法、装置及电子设备 | |
CN110989847B (zh) | 信息推荐方法、装置、终端设备及存储介质 | |
CN110830362B (zh) | 一种生成内容的方法、移动终端 | |
CN111738100B (zh) | 一种基于口型的语音识别方法及终端设备 | |
CN109993821B (zh) | 一种表情播放方法及移动终端 | |
CN111491123A (zh) | 视频背景处理方法、装置及电子设备 | |
CN108494947A (zh) | 一种图像分享方法及移动终端 | |
CN110706679B (zh) | 一种音频处理方法及电子设备 | |
CN108632446A (zh) | 一种信息提示方法及移动终端 | |
CN108763475B (zh) | 一种录制方法、录制装置及终端设备 | |
CN110286980A (zh) | 一种日程创建方法及移动终端 | |
CN107919138A (zh) | 一种语音中的情绪处理方法及移动终端 | |
CN107979687A (zh) | 一种壁纸切换方法、移动终端 | |
CN108668024A (zh) | 一种语音处理方法及终端 | |
CN107862059A (zh) | 一种歌曲推荐方法及移动终端 | |
CN111835621A (zh) | 会话消息处理方法、装置、计算机设备及可读存储介质 | |
CN110932964A (zh) | 一种信息的处理方法及装置 | |
CN111341317B (zh) | 唤醒音频数据的评价方法、装置、电子设备及介质 | |
CN111491058A (zh) | 工作模式的控制方法、电子设备和存储介质 | |
CN113573143B (zh) | 音频播放方法和电子设备 | |
WO2019120030A1 (zh) | 信息推送方法以及装置、终端及存储介质 | |
CN108710521A (zh) | 一种便签生成方法和终端设备 | |
CN111240783A (zh) | 一种背景界面更新方法及电子设备 | |
CN111416955B (zh) | 一种视频通话方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |