语音评论修饰方法、系统、介质和电子设备
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种语音评论修饰方法、系统、介质和电子设备。
背景技术
随着通信技术的发展,人们的社交行为和需求不断发生着变化。目前,“弹幕文化”兴起,用户乐于在观看视频,漫画等多媒体信息的同时,实时发表评论以及阅读其他用户的评论,即通过弹幕的形式进行社交。
为了满足用户的需求,各个视频网站纷纷提供弹幕功能,在播放视频的同时显示用户的评论留言,增加观看视频的用户之间的互动感。然而,这种互动形式单一,用户的评论内容比较枯燥,缺乏用户粘性。
因此,在长期的研发当中,发明人对社交媒体中的语音评论问题进行了大量的研究,提出了一种语音评论修饰方法,以解决上述技术问题之一。
发明内容
本发明的目的在于提供一种语音评论修饰方法、系统、介质和电子设备,能够解决上述提到的至少一个技术问题。具体方案如下:
根据本发明的具体实施方式,第一方面,本发明提供一种语音评论修饰方法,该方法包括获取用户当前语音评论;识别所述语音评论中的关键词组;上传所述关键词组至服务端,以使所述服务端从预置特效数据库中获取与所述关键词组对应的目标语音特效;接收所述服务端发送的所述目标语音特效;合成所述语音评论及所述目标语音特效,生成待播放语音评论。
根据本发明的具体实施方式,第二方面,本发明提供一种语音评论修饰系统,包括:语音获取模块,用于获取用户当前语音评论;语音识别模块,用于识别所述语音评论中的关键词组;词组上传模块,用于上传所述关键词组至服务端,以使所述服务端从预置特效数据库中获取与所述关键词组对应的目标语音特效;特效接收模块,用于接收所述服务端发送的所述目标语音特效;特效合成模块,用于合成所述语音评论及所述目标语音特效,生成待播放语音评论。
根据本发明的具体实施方式,第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上任一项所述的语音评论修饰方法。
根据本发明的具体实施方式,第四方面,本发明提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一项所述的语音评论修饰方法。
与现有技术相比,本发明实施例的上述方案通过给语音评论增加特效,叠加到评论图片上,能够提供具有更加丰富的互动方式,增加互动趣味性;进一步增加用户粘度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明实施例的一种语音评论修饰方法的实施流程图;
图2示出了根据本发明实施例的获取用户当前语音评论的方法流程图;
图3示出了根据本发明实施例的识别所述语音评论中的关键词组的方法流程图;
图4示出了根据本发明实施例的在服务端生成特效数据库的方法流程图;
图5示出了根据本发明实施例的所述服务端从预置特效数据库中匹配获取与所述关键词组对应的目标语音特效的方法流程图;
图6示出了根据本发明实施例的在所述目标语音特效选择一种或多种语音特效的方法流程图;
图7示出了根据本发明实施例的所述合成所述语音评论及所述目标语音特效,生成待播放语音评论的方法流程图;
图8示出了根据本发明实施例的一种语音评论修饰系统的结构示意图;
图9示出了根据本发明实施例的所述服务端系统的结构示意图;
图10示出了根据本发明的实施例的电子设备连接结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
下面结合附图详细说明本发明的可选实施例。
实施例1
参阅图1所示,为本发明实施例提供的一种语音评论修饰方法的实施流程图,该方法应用于客户端。所述语音评论修饰方法可以包括如下步骤:
S100,获取用户当前语音评论;
在该步骤中,所述语音评论通过客户端的一语音评论组件进行录制,其中,当所述客户端的浏览页面停留时长达到预设阈值时,在所述浏览页面内发表内容区域周边显示所述语音评论组件。本实施例中,用户在客户端浏览发表内容的过程中,当用户浏览的页面停留时长达到预设阈值时,显示所述语音评论组件给用户,且所述语音评论组件显示于所述发表内容区域的下方,使用户界面简洁清晰。用户通过显示的语音评论组件进行录音,当用户松手或达到所述语音评论组件的最大录制时长时生成语音评论,并发送至服务端或云端。
具体的,请参阅图2,所述获取用户当前语音评论,包括:
S101,提供用于修饰当前语音评论的修饰控件;
S102,响应于对所述修饰控件的操作,获取用户当前语音评论。其中,所述修饰控件用于对当前语音评论进行修饰。若用户选择修饰当前语音评论,则触控所述修饰控件,客户端接收到用户的修饰指令后,则会获取用户当前语音评论并进行修饰;若用户不对当前语音评论进行修饰,则忽视所述修饰控件即可。
S110,识别所述语音评论中的关键词组;
在该步骤中,客户端获取到所述语音评论后,对所述语音评论进行识别,获取所述语音评论中的关键词组。具体的,所述识别所述语音评论中的关键词组,包括:识别所述语音评论中表达人类情感的关键词组,其中,所述表达人类情感的关键词组包括但不限于祝福、思念、感恩及爱情,比如,生日快乐,情人节快乐,我想你,我爱你,讨厌等等。
本实施例中,请参阅图3,所述识别所述语音评论中的关键词组,包括:
S111,客户端将所述语音评论转换成文本信息;
S112,通过图像识别技术在客户端预置的词组数据库中匹配与所述文本信息一致的目标词组;
S113,若所述文本信息匹配成功,则获取所述目标词组。其中,所述词组数据库中记录了用于表达人类情感的常见词组。当然,所述识别所述语音评论的方法不限于上述实施方法,比如,也可通过声学模型和语言模型分别对所述语音评论信号直接进行语音识别,获得所述语音评论中的关键词组。其中,声学模型和语言模型的具体的识别方法和现有技术中的相同,在此不再赘述。另一实施例中,当匹配失败时,在所述词组数据库中新增所述关键词组。
S120,上传所述关键词组至服务端,以使所述服务端从预置特效数据库中匹配获取与所述关键词组对应的目标语音特效;
在执行步骤S110之后,将所述关键词组发送至服务端,所述服务端进行识别匹配。具体的,在所述接收客户端发送的关键词组的步骤之前,所述服务端需预先生成一特效数据库。请参阅图4,所述生成特效数据库,包括:
S121,生成表达人类情感的常见词组与至少一个语音特效的映射关系。其中,所述表达人类情感的常见词组与所述客户端预置的所述词组数据库中记录的内容一致。所述至少一个语音特效是指对于一个所述常见词组可生成多个不同的语音特效,比如,对于“生日快乐”词组,可对应鼓掌、音乐、气泡等特效;对于“生气”词组,可对应“哼哼”音效或林志玲版本的生气音效。
S122,存储所述映射关系至所述特效数据库。其中,所述特效数据库存储的语音特效越多,用户的选择性就会越多,从而能够进一步增加互动的丰富多彩性。
具体的,请参阅图5,所述服务端从预置特效数据库中匹配获取与所述关键词组对应的目标语音特效,包括:
S123,接收所述关键词组;
S124,在特效数据库中识别与所述关键词组表达一致的所述常用词组。具体的,根据图像识别技术识别所述特效数据库中与所述关键词组对应的常用词组。
S125,获取与所述目标词组存在映射关系的目标语音特效。具体的,基于所述表达人类情感的常见词组与至少一个语音特效的映射关系,在获取到目标词组后,即可获取对所述目标词组对应的目标语音特效。所述服务端获取的目标语音特效包括一种或者多种语音特效。
S130,接收所述服务端发送的所述目标语音特效。
本实施例中,请参阅图6,在所述接收所述服务端发送的所述目标语音特效的步骤之后,还包括:
S131,提供用于对所述目标语音特效进行选择的特效选择控件;
S132,响应于对所述特效选择控件的操作,在所述目标语音特效中选择一种或多种语音特效。
在另一些实施例中,可根据客户端设置的最多特效合成数量自动进行选择语音特效。
在另一些实施例中,上述在所述目标语音特效中选择一种或多种语音特效的步骤可应用于所述服务端。也就是说,客户端接收的所述目标语音特效为已选择的语音特效。
S140,合成所述语音评论及所述目标语音特效,生成待播放语音评论。
具体的,请参阅图7,所述合成所述语音评论及所述目标语音特效,生成待播放语音评论,包括:
S141,提供用于合成所述语音评论及所述目标语音特效的合成控件;
S142,响应于对所述合成控件的操作,对所述语音评论及所述目标语音特效进行合成,生成待播放语音评论。
具体的,所述合成所述语音评论及所述目标语音特效的方式包括:
第一种,将所述目标语音特效合成于所述语音评论之后,生成待播放语音评论。也就是说,在语音评论内容播放结束的节点插入所述目标语音特效。比如,所述语音评论内容为“生日快乐”,所述目标语音特效为“鼓掌”,当播放生日快乐语音结束后,会自动播放鼓掌的音效。
第二种,将所述目标语音特效合成为所述语音评论的背景声音,生成待播放语音评论。也就是说,在所述语音评论内容播放的同时加载所述目标语音特效作为背景自动播放。比如,所述语音评论内容为“生日快乐”,所述目标语音特效为一段音乐,当播放生日快乐语音时,会同时伴随着美妙的音乐。当然,所述合成方式也不限于上述两种方式,可根据需要任意匹配。
进一步,所述方法包括:在被评论内容的位置区域播放所述待播放语音评论。其中,所述待播放语音评论可自动播放,也可通过一播放控件进行播放,优选的,所述播放控件可通过气泡上浮的形式显示语音评论。
本发明实施例提供的语音评论修饰方法通过给语音评论增加特效,叠加到评论图片上,能够提供具有更加丰富的互动方式,增加互动趣味性;进一步增加用户粘度。
实施例2
请参阅图8,本发明实施例提供一种语音评论修饰系统800的结构流程图,该系统800应用于客户端。所述语音评论修饰系统800包括:语音获取模块810,语音识别模块820,词组上传模块830,特效接收模块840及特效合成模块850。
所述语音获取模块810,用于获取用户当前语音评论。具体的,所述语音评论通过客户端的一语音评论组件进行录制,其中,当所述客户端的浏览页面停留时长达到预设阈值时,在所述浏览页面内发表内容区域周边显示所述语音评论组件。本实施例中,用户在客户端浏览发表内容的过程中,当用户浏览的页面停留时长达到预设阈值时,显示所述语音评论组件给用户,且所述语音评论组件显示于所述发表内容区域的下方,使用户界面简洁清晰。用户通过显示的语音评论组件进行录音,当用户松手或达到所述语音评论组件的最大录制时长时生成语音评论。
本实施例中,所述语音获取模块810可以提供用于修饰当前语音评论的修饰控件,其中,所述修饰控件用于对当前语音评论进行修饰。所述语音获取模块810可以响应于对所述修饰控件的操作,获取用户当前语音评论。具体的,若用户选择修饰当前语音评论,则触控所述修饰控件,所述语音获取模块810接收到用户的语音修饰指令后,会获取用户当前语音评论并进行修饰;若用户不对当前语音评论进行修饰,则忽视所述修饰控件即可。
所述语音识别模块820,用于识别所述语音评论中的关键词组。
具体的,所述语音获取模块810获取到所述语音评论后,所述语音识别模块820对所述语音评论进行识别,从而获取所述语音评论中的关键词组。本实施例中,所述语音识别模块820进一步包括:
转换子模块821,用于客户端将所述语音评论转换成文本信息;
匹配子模块822,用于通过图像识别技术在客户端预置的词组数据库中匹配与所述文本信息一致的目标词组;
获取子模块823,用于当所述文本信息匹配成功时,获取所述目标词组。其中,所述词组数据库中记录了用于表达人类情感的常见词组。当然,所述语音识别模块820识别所述语音评论的方法不限于上述实施方法,比如,也可通过声学模型和语言模型分别对所述语音评论信号直接进行语音识别,获得所述语音评论中的关键词组。其中,声学模型和语言模型的具体的识别方法和现有技术中的相同,在此不再赘述。
另一实施例中,当所述文本信息匹配失败时,在所述词组数据库中新增所述关键词组。
所述词组上传模块830,用于上传所述关键词组至服务端,以使所述服务端从预置特效数据库中匹配获取与所述关键词组对应的目标语音特效。
在所述语音识别模块820识别获取关键词组之后,所述词组上传模块830将所述关键词组发送至服务端,以使所述服务端进行识别匹配。具体的,在服务端接收所述词组上传模块830上传的关键词组之前,所述服务端预先生成一特效数据库。请参阅图9,所述服务端包括:
生成模块910,用于生成表达人类情感的常见词组与至少一个语音特效的映射关系。其中,所述表达人类情感的常见词组与所述客户端预置的所述词组数据库中记录的内容一致。所述至少一个语音特效是指对于一个所述常见词组可生成多个不同的语音特效,比如,对于“生日快乐”词组,可对应鼓掌、音乐、气泡等特效;对于“生气”词组,可对应“哼哼”音效或林志玲版本的生气音效。
存储模块920,用于存储所述映射关系至所述特效数据库。其中,所述特效数据库存储的语音特效越多,用户的选择性就会越多,从而能够进一步增加互动的丰富多彩性。
具体的,所述服务端进一步包括:
词组接收模块930,用于接收所述关键词组;
词组识别模块940,用于在特效数据库中识别与所述关键词组一致的常用词组。具体的,根据图像识别技术识别所述特效数据库中与关键词组对应的常用词组。
特效获取模块950,用于获取与所述常用词组存在映射关系的目标语音特效。具体的,基于所述常见词组与至少一个语音特效的映射关系,在所述词组识别模块940获取到目标词组后,所述特效获取模块 950即可获取对所述目标词组对应的目标语音特效。所述服务端获取的目标语音特效包括一种或者多种语音特效。
所述特效接收模块840,用于接收所述服务端发送的所述目标语音特效,并将所述目标语音特效显示给用户。
具体的,所述系统800进一步包括一特效选择模块860,所述特效选择模块860可以提供用于对所述目标语音特效进行选择的特效选择控件;所述特效选择模块860还可以响应于对所述特效选择控件的操作,在所述目标语音特效中选择一种或多种语音特效。
在另一些实施例中,所述特效选择模块860可根据客户端设置的最多特效合成数量自动进行选择语音特效。
在另一些实施例中,所述特效选择模块860可应用于所述服务端。也就是说,客户端接收的所述目标语音特效为已选择的语音特效。
所述特效合成模块850,用于合成所述语音评论及所述目标语音特效,生成待播放语音评论。
具体的,所述特效合成模块850可以提供用于合成所述语音评论及所述目标语音特效的合成控件;还可以响应于对所述合成控件的操作,对所述语音评论及所述目标语音特效进行合成,获取待播放语音评论。
具体的,所述合成所述语音评论及所述目标语音特效的方式包括:
第一种,将所述目标语音特效合成于所述语音评论之后,生成待播放语音评论。也就是说,在语音评论内容播放结束的节点插入所述目标语音特效。比如,所述语音评论内容为“生日快乐”,所述目标语音特效为“鼓掌”,当播放生日快乐语音结束后,会自动播放鼓掌的音效。
第二种,将所述目标语音特效合成为所述语音评论的背景声音,生成待播放语音评论。也就是说,在所述语音评论内容播放的同时加载所述目标语音特效作为背景自动播放。比如,所述语音评论内容为“生日快乐”,所述目标语音特效为一段音乐,当播放生日快乐语音时,会同时伴随着美妙的音乐。当然,所述合成方式也不限于上述两种方式,可根据需要任意匹配。
进一步,所述系统800包括一语音播放模块870,用于在被评论内容的位置区域播放所述待播放语音评论。其中,所述语音播放模块870 可自动播放所述待播放语音评论,也可通过一播放控件进行播放。优选的,所述播放控件可通过气泡上浮的形式显示语音评论。
本发明实施例提供的语音评论修饰系统800通过给语音评论增加特效,叠加到评论图片上,能够提供具有更加丰富的互动方式,增加互动趣味性;进一步增加用户粘度。
实施例3
本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的语音评论修饰方法。
实施例4
本实施例提供一种电子设备,该设备用于语音评论修饰,所述电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取用户当前语音评论;
识别所述语音评论中的关键词组;
上传所述关键词组至服务端,以使所述服务端从预置特效数据库中匹配获取与所述关键词组对应的目标语音特效;
接收所述服务端发送的所述目标语音特效;
合成所述语音评论及所述目标语音特效,生成待播放语音评论。
实施例8
下面参考图10,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图 10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有电子设备操作所需的各种程序和数据。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1008也连接至总线1004。
通常,以下装置可以连接至I/O接口1008:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置 1006;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置 1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从ROM 1002被安装。在该计算机程序被处理装置 1001执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器 (ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。