CN117133271A - 基于区块链的电商平台购物和智能语音评价方法及系统 - Google Patents

基于区块链的电商平台购物和智能语音评价方法及系统 Download PDF

Info

Publication number
CN117133271A
CN117133271A CN202311384664.8A CN202311384664A CN117133271A CN 117133271 A CN117133271 A CN 117133271A CN 202311384664 A CN202311384664 A CN 202311384664A CN 117133271 A CN117133271 A CN 117133271A
Authority
CN
China
Prior art keywords
voice
commodity
evaluation
voice signal
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311384664.8A
Other languages
English (en)
Inventor
高锡波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jidaoer Technology Co ltd
Original Assignee
Beijing Jidaoer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jidaoer Technology Co ltd filed Critical Beijing Jidaoer Technology Co ltd
Priority to CN202311384664.8A priority Critical patent/CN117133271A/zh
Publication of CN117133271A publication Critical patent/CN117133271A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Abstract

本发明公开了一种基于区块链的电商平台购物和智能语音评价方法及系统,涉及语音分析技术领域。该方法包括:采集身份识别语音信号,进行声纹识别;获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,合成为商品介绍语音信号,并播放;获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;获取用户的商品评价语音信号,进行声纹识别;对商品评价语音信号进行识别,以得到商品评价文字信息;对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;将核心数据上链存储。本发明结合多种智能模型,进行精准有效的语音处理,提升消费者的购物和评价体验;对核心信息上链存储,提升数据的安全性。

Description

基于区块链的电商平台购物和智能语音评价方法及系统
技术领域
本发明涉及语音分析技术领域,具体而言,涉及一种基于区块链的电商平台购物和智能语音评价方法及系统。
背景技术
随着互联网的高速发展和深度普及,消费者可以通过电商平台完成网上商品选购及支付,使得购物过程变得更加便捷、高效。然而,电商平台往往无法实现商品的高质量语音介绍,同时商品评价过程主要依靠消费者手动输入文字信息,显著降低了消费者的购物和评价体验。更重要的是,购物和评价过程产生的核心数据不能被有效存储,降低了整个系统的安全性。
随着信息技术的不断更新换代,能够为商品的高质量语音介绍和智能语音评价提供直接的支持;同时,区块链技术作为近年来的新兴技术,能够为系统的安全性提供直接的支持。因此,提出一种基于区块链的电商平台购物和智能语音评价方法及系统有非常重要的价值和意义。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种基于区块链的电商平台购物和智能语音评价方法及系统,结合基于回声消除的优质等分语音信号选取式声纹识别模型、基于多语音去噪算法智能叠加的匹配式语音合成模型、基于语音质量评估和语义分析相结合的差异性语音编码模型,进行精准有效的语音处理,进而提升消费者的购物和评价体验;同时,利用区块链技术对核心信息上链存储,提升数据的安全性。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明提供一种基于区块链的电商平台购物和智能语音评价方法,包括以下步骤:
用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;
获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
首先,本发明提出了基于回声消除的优质等分语音信号选取式声纹识别模型,对用户的身份信息进行识别;该模型首先对语音信号进行回声消除,在此基础上选取最优质的一段等分语音信号并对其进行声纹识别,显著提升了身份识别的精准度。其次,本发明提出了基于多语音去噪算法智能叠加的匹配式语音合成模型,对商品介绍语音信号进行合成;该模型先以语谱图比对的方式,在多个合成语音信号中保留最优质的合成语音信号作为目标合成语音信号。在此基础上通过多种语音去噪算法智能叠加的方式,以较低的计算资源消耗实现目标合成语音信号的高质量去噪,从而能够获取更加优质的商品介绍语音信号。再次,本发明提出了基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码;该模型充分考虑了语音质量和语义内容,对不同的语音信号利用编码维度不同的自编码器进行编码,不仅保证了语音编码质量而且显著降低了存储资源消耗。最后,本发明利用了区块链技术,将用户身份信息、购买的商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果进行上链存储,提升了系统的安全性。
基于第一方面,进一步地,上述利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别的方法包括以下步骤:
对身份识别语音信号进行回声消除处理,对处理后的身份识别语音信号进行多等分处理,以得到多段等分语音信号;
利用语音质量感知评价算法对多段等分语音信号分别进行评价,以得到并根据对应的评价结果确定最优质等分语音信号;
对最优质等分语音信号进行声纹识别,以得到用户身份信息。
基于第一方面,进一步地,上述利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号的方法包括以下步骤:
利用多种语音合成模型对该商品的文字介绍信息合成为多个不同的介绍语音信号;
获取并将每个介绍语音信号的语谱图和身份识别语音信号的语谱图进行比对,生成并根据比对结果确定目标合成语音信号;
选取多种不同语音去噪算法依次对目标合成语音信号进行语音去噪,并计算去噪后的目标合成语音信号的峰值信噪比;
计算相邻两次的去噪后的目标合成语音信号的峰值信噪比的差值,若差值小于预置的阈值,则结束语音去噪,并将当前去噪后的目标合成语音信号作为最终的商品介绍语音信号。
基于第一方面,进一步地,上述利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码的方法包括以下步骤:
利用语音质量感知评价算法对商品评价语音信号进行评估,以得到语音质量评估结果;
对商品评价文字信息进行语义分析,以得到语义分析结果;
若语音质量评估结果为语音质量低或语义分析结果中包含预置的易混淆词汇,则利用高维度自编码器对商品评价语音信号进行编码;
若语音质量评估结果为语音质量高或语义分析结果中不包含预置的易混淆词汇,则利用低维度自编码器对商品评价语音信号进行编码。
第二方面,本发明提供一种基于区块链的电商平台购物和智能语音评价系统,包括声纹识别模块、语音合成模块、购买支付模块、评价识别模块、语音编码模块以及数据上链模块,其中:
声纹识别模块,用于当用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;还用于获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
语音合成模块,用于获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
购买支付模块,用于获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;
评价识别模块,用于利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
语音编码模块,用于利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
数据上链模块,用于获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
本系统通过声纹识别模块、语音合成模块、购买支付模块、评价识别模块、语音编码模块以及数据上链模块等多个模块的配合,结合基于回声消除的优质等分语音信号选取式声纹识别模型、基于多语音去噪算法智能叠加的匹配式语音合成模型、基于语音质量评估和语义分析相结合的差异性语音编码模型,进行精准有效的语音处理,进而提升消费者的购物和评价体验;同时,利用区块链技术对核心信息上链存储,提升数据的安全性。首先,本发明提出了基于回声消除的优质等分语音信号选取式声纹识别模型,对用户的身份信息进行识别;该模型首先对语音信号进行回声消除,在此基础上选取最优质的一段等分语音信号并对其进行声纹识别,显著提升了身份识别的精准度。其次,本发明提出了基于多语音去噪算法智能叠加的匹配式语音合成模型,对商品介绍语音信号进行合成;该模型先以语谱图比对的方式,在多个合成语音信号中保留最优质的合成语音信号作为目标合成语音信号。在此基础上通过多种语音去噪算法智能叠加的方式,以较低的计算资源消耗实现目标合成语音信号的高质量去噪,从而能够获取更加优质的商品介绍语音信号。再次,本发明提出了基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码;该模型充分考虑了语音质量和语义内容,对不同的语音信号利用编码维度不同的自编码器进行编码,不仅保证了语音编码质量而且显著降低了存储资源消耗。最后,本发明利用了区块链技术,将用户身份信息、购买的商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果进行上链存储,提升了系统的安全性。
第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明至少具有如下优点或有益效果:
1、本发明提出了基于回声消除的优质等分语音信号选取式声纹识别模型,对用户的身份信息进行识别;该模型首先对语音信号进行回声消除,在此基础上选取最优质的一段等分语音信号并对其进行声纹识别,显著提升了身份识别的精准度。
2、本发明提出了基于多语音去噪算法智能叠加的匹配式语音合成模型,对商品介绍语音信号进行合成;该模型先以语谱图比对的方式,在多个合成语音信号中保留最优质的合成语音信号作为目标合成语音信号。在此基础上通过多种语音去噪算法智能叠加的方式,以较低的计算资源消耗实现目标合成语音信号的高质量去噪,从而能够获取更加优质的商品介绍语音信号。
3、本发明提出了基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码;该模型充分考虑了语音质量和语义内容,对不同的语音信号利用编码维度不同的自编码器进行编码,不仅保证了语音编码质量而且显著降低了存储资源消耗。
4、本发明利用了区块链技术,将用户身份信息、购买的商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果进行上链存储,提升了系统的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于区块链的电商平台购物和智能语音评价方法的流程图;
图2为本发明实施例一种基于区块链的电商平台购物和智能语音评价系统的原理框图;
图3为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、声纹识别模块;200、语音合成模块;300、购买支付模块;400、评价识别模块;500、语音编码模块;600、数据上链模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例
如图1所示,第一方面,本发明实施例提供一种基于区块链的电商平台购物和智能语音评价方法,包括以下步骤:
S1、用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
进一步地,包括:对身份识别语音信号进行回声消除处理,对处理后的身份识别语音信号进行多等分处理,以得到多段等分语音信号;利用语音质量感知评价算法对多段等分语音信号分别进行评价,以得到并根据对应的评价结果确定最优质等分语音信号;对最优质等分语音信号进行声纹识别,以得到用户身份信息。
在本发明的一些实施例中,某用户用手机进入电商平台,任意发出一段语音(不低于3秒钟即可),手机的音视频设备自动提取该语音信号,作为身份识别语音信号。)利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,得到用户的身份信息并自动登录到该用户在电商平台的个人系统中。
基于回声消除的优质等分语音信号选取式声纹识别模型具体包括:先对身份识别语音信号进行回声消除处理,此后将该语音信号等分为5段。利用语音质量感知评价(PESQ)算法对5段等分语音信号分别进行评价,并对最优质的一段等分语音信号进行声纹识别,得到用户的身份信息。
S2、获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
进一步地,包括:利用多种语音合成模型对该商品的文字介绍信息合成为多个不同的介绍语音信号;获取并将每个介绍语音信号的语谱图和身份识别语音信号的语谱图进行比对,生成并根据比对结果确定目标合成语音信号;选取多种不同语音去噪算法依次对目标合成语音信号进行语音去噪,并计算去噪后的目标合成语音信号的峰值信噪比;计算相邻两次的去噪后的目标合成语音信号的峰值信噪比的差值,若差值小于预置的阈值,则结束语音去噪,并将当前去噪后的目标合成语音信号作为最终的商品介绍语音信号。
在本发明的一些实施例中,当用户点击电商平台的某一商品时,系统自动检索到该商品的文字介绍信息。利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该款商品的文字介绍信息合成商品介绍语音信号,并利用手机的音视频设备对商品介绍语音信号进行播放。
基于多语音去噪算法智能叠加的匹配式语音合成模型具体包括:利用多种语音合成模型将该款商品的文字介绍信息合成多个不同的语音信号,将每个合成语音信号的语谱图和身份识别语音信号的语谱图进行比对,哪个合成语音信号的语谱图和身份识别语音信号的语谱图相似度最高,则将哪个合成语音信号保留,并将其定义为目标合成语音信号。选取一种语音去噪算法,对目标合成语音信号进行语音去噪,去噪后计算目标合成语音信号的峰值信噪比。接下来,选取另外一种语音去噪算法,继续对目标合成语音信号进行去噪,去噪后计算目标合成语音信号的峰值信噪比。不断地进行上述过程,当利用一种新的语音去噪算法对目标合成语音信号继续进行去噪,如果去噪后目标合成语音信号的峰值信噪比没有显著提升,不再利用新的语音去噪算法继续对目标合成语音信号进行去噪,并将当前去噪后的目标合成语音信号作为商品介绍语音信号。
S3、获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;如果用户听完商品语音介绍后决定购买该商品,则进行线上付款,卖家在买家完成付款后对商品进行发货。
S4、获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
在本发明的一些实施例中,买家收到商品并经过一段的时间的实际使用后,使用手机进入电商平台并通过口述的方式对该商品进行评价,手机的音视频设备直接提取该语音信号作为商品评价语音信号。利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,得到用户的身份信息并自动登录到该用户在电商平台的个人系统中。利用语音识别模型对商品评价语音信号进行识别,得到商品评价文字信息,并将商品评价文字信息自动录入电商平台的评价系统中。
利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别具体包括:先对商品评价语音信号进行回声消除处理,此后将该语音信号等分为5段。利用语音质量感知评价(PESQ)算法对5段等分语音信号分别进行评价,并对最优质的一段等分语音信号进行声纹识别,得到用户的身份信息。
S5、利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
S6、利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
进一步地,包括:利用语音质量感知评价算法对商品评价语音信号进行评估,以得到语音质量评估结果;对商品评价文字信息进行语义分析,以得到语义分析结果;若语音质量评估结果为语音质量低或语义分析结果中包含预置的易混淆词汇,则利用高维度自编码器对商品评价语音信号进行编码;若语音质量评估结果为语音质量高或语义分析结果中不包含预置的易混淆词汇,则利用低维度自编码器对商品评价语音信号进行编码。
在本发明的一些实施例中,利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,得到商品评价语音信号编码结果(说明:为了防止商品评价文字信息识别有误或被非法修改,故需要对商品评价语音信号进行编码并和其它核心信息一同上链存储)。
基于语音质量评估和语义分析相结合的差异性语音编码模型具体包括:利用语音质量感知评价(PESQ)算法对商品评价语音信号进行评估,并对商品评价文字信息(前面利用语音识别模型已经得到)进行语义分析,如果语音信号的质量较低或商品评价文字信息中含有易混淆词汇(例如,商品评价文字信息为‘衣服收到了,尺寸适合’,‘适合’和‘失和’发音较为相似在语音识别过程中容易混淆,因此‘适合’属于易混淆词汇),利用高维度自编码器对商品评价语音信号进行编码;如果语音信号的质量较高且商品评价文字信息中不含有易混淆词汇,利用低维度自编码器对商品评价语音信号进行编码。注:高维度自编码器可以得到维度较高的语音编码结果,低维度自编码器可以得到维度较低的语音编码结果。
S7、获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
首先,本发明提出了基于回声消除的优质等分语音信号选取式声纹识别模型,对用户的身份信息进行识别;该模型首先对语音信号进行回声消除,在此基础上选取最优质的一段等分语音信号并对其进行声纹识别,显著提升了身份识别的精准度。其次,本发明提出了基于多语音去噪算法智能叠加的匹配式语音合成模型,对商品介绍语音信号进行合成;该模型先以语谱图比对的方式,在多个合成语音信号中保留最优质的合成语音信号作为目标合成语音信号。在此基础上通过多种语音去噪算法智能叠加的方式,以较低的计算资源消耗实现目标合成语音信号的高质量去噪,从而能够获取更加优质的商品介绍语音信号。再次,本发明提出了基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码;该模型充分考虑了语音质量和语义内容,对不同的语音信号利用编码维度不同的自编码器进行编码,不仅保证了语音编码质量而且显著降低了存储资源消耗。最后,本发明利用了区块链技术,将用户身份信息、购买的商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果进行上链存储,提升了系统的安全性。
如图2所示,第二方面,本发明实施例提供一种基于区块链的电商平台购物和智能语音评价系统,包括声纹识别模块100、语音合成模块200、购买支付模块300、评价识别模块400、语音编码模块500以及数据上链模块600,其中:
声纹识别模块100,用于当用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;还用于获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
语音合成模块200,用于获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
购买支付模块300,用于获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;
评价识别模块400,用于利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
语音编码模块500,用于利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
数据上链模块600,用于获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
本系统通过声纹识别模块100、语音合成模块200、购买支付模块300、评价识别模块400、语音编码模块500以及数据上链模块600等多个模块的配合,结合基于回声消除的优质等分语音信号选取式声纹识别模型、基于多语音去噪算法智能叠加的匹配式语音合成模型、基于语音质量评估和语义分析相结合的差异性语音编码模型,进行精准有效的语音处理,进而提升消费者的购物和评价体验;同时,利用区块链技术对核心信息上链存储,提升数据的安全性。首先,本发明提出了基于回声消除的优质等分语音信号选取式声纹识别模型,对用户的身份信息进行识别;该模型首先对语音信号进行回声消除,在此基础上选取最优质的一段等分语音信号并对其进行声纹识别,显著提升了身份识别的精准度。其次,本发明提出了基于多语音去噪算法智能叠加的匹配式语音合成模型,对商品介绍语音信号进行合成;该模型先以语谱图比对的方式,在多个合成语音信号中保留最优质的合成语音信号作为目标合成语音信号。在此基础上通过多种语音去噪算法智能叠加的方式,以较低的计算资源消耗实现目标合成语音信号的高质量去噪,从而能够获取更加优质的商品介绍语音信号。再次,本发明提出了基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码;该模型充分考虑了语音质量和语义内容,对不同的语音信号利用编码维度不同的自编码器进行编码,不仅保证了语音编码质量而且显著降低了存储资源消耗。最后,本发明利用了区块链技术,将用户身份信息、购买的商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果进行上链存储,提升了系统的安全性。
如图3所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (7)

1.一种基于区块链的电商平台购物和智能语音评价方法,其特征在于,包括以下步骤:
用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;
获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
2.根据权利要求1所述的一种基于区块链的电商平台购物和智能语音评价方法,其特征在于,所述利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别的方法包括以下步骤:
对身份识别语音信号进行回声消除处理,对处理后的身份识别语音信号进行多等分处理,以得到多段等分语音信号;
利用语音质量感知评价算法对多段等分语音信号分别进行评价,以得到并根据对应的评价结果确定最优质等分语音信号;
对最优质等分语音信号进行声纹识别,以得到用户身份信息。
3.根据权利要求1所述的一种基于区块链的电商平台购物和智能语音评价方法,其特征在于,所述利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号的方法包括以下步骤:
利用多种语音合成模型对该商品的文字介绍信息合成为多个不同的介绍语音信号;
获取并将每个介绍语音信号的语谱图和身份识别语音信号的语谱图进行比对,生成并根据比对结果确定目标合成语音信号;
选取多种不同语音去噪算法依次对目标合成语音信号进行语音去噪,并计算去噪后的目标合成语音信号的峰值信噪比;
计算相邻两次的去噪后的目标合成语音信号的峰值信噪比的差值,若差值小于预置的阈值,则结束语音去噪,并将当前去噪后的目标合成语音信号作为最终的商品介绍语音信号。
4.根据权利要求1所述的一种基于区块链的电商平台购物和智能语音评价方法,其特征在于,所述利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码的方法包括以下步骤:
利用语音质量感知评价算法对商品评价语音信号进行评估,以得到语音质量评估结果;
对商品评价文字信息进行语义分析,以得到语义分析结果;
若语音质量评估结果为语音质量低或语义分析结果中包含预置的易混淆词汇,则利用高维度自编码器对商品评价语音信号进行编码;
若语音质量评估结果为语音质量高或语义分析结果中不包含预置的易混淆词汇,则利用低维度自编码器对商品评价语音信号进行编码。
5.一种基于区块链的电商平台购物和智能语音评价系统,其特征在于,包括声纹识别模块、语音合成模块、购买支付模块、评价识别模块、语音编码模块以及数据上链模块,其中:
声纹识别模块,用于当用户进入电商平台时,采集并将用户初始语音信号作为身份识别语音信号,并利用基于回声消除的优质等分语音信号选取式声纹识别模型,对身份识别语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;还用于获取用户的商品评价语音信号,利用基于回声消除的优质等分语音信号选取式声纹识别模型,对商品评价语音信号进行声纹识别,以得到并根据用户身份信息登录至该用户在电商平台的个人系统中;
语音合成模块,用于获取用户点击商品信号,并在预置的商品文字介绍库中提取对应商品的文字介绍信息,利用基于多语音去噪算法智能叠加的匹配式语音合成模型,将该商品的文字介绍信息合成为商品介绍语音信号,并播放该商品介绍语音信号;
购买支付模块,用于获取并根据用户购买商品支付信息生成商品订单,对商品进行发货;并记录付款时间;
评价识别模块,用于利用预置的语音识别模型对商品评价语音信号进行识别,以得到商品评价文字信息,并将该商品评价文字信息录入电商平台的评价系统中;
语音编码模块,用于利用基于语音质量评估和语义分析相结合的差异性语音编码模型,对商品评价语音信号进行编码,以得到商品评价语音信号编码结果;
数据上链模块,用于获取并将用户身份信息、购买商品名称、付款时间、商品评价文字信息、商品评价语音信号编码结果上传至区块链。
6.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-4中任一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
CN202311384664.8A 2023-10-25 2023-10-25 基于区块链的电商平台购物和智能语音评价方法及系统 Pending CN117133271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311384664.8A CN117133271A (zh) 2023-10-25 2023-10-25 基于区块链的电商平台购物和智能语音评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311384664.8A CN117133271A (zh) 2023-10-25 2023-10-25 基于区块链的电商平台购物和智能语音评价方法及系统

Publications (1)

Publication Number Publication Date
CN117133271A true CN117133271A (zh) 2023-11-28

Family

ID=88852976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311384664.8A Pending CN117133271A (zh) 2023-10-25 2023-10-25 基于区块链的电商平台购物和智能语音评价方法及系统

Country Status (1)

Country Link
CN (1) CN117133271A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084128A (ja) * 1999-12-17 2001-03-30 Akihiro Matsuo インターネット商店における音声の活用方法
CN108154409A (zh) * 2016-12-05 2018-06-12 天脉聚源(北京)科技有限公司 一种互联网购物评价的方法和系统
CN108389098A (zh) * 2017-02-03 2018-08-10 北京京东尚科信息技术有限公司 语音购物方法以及系统
CN109545219A (zh) * 2019-01-09 2019-03-29 北京新能源汽车股份有限公司 车载语音交互方法、系统、设备及计算机可读存储介质
WO2019100607A1 (zh) * 2017-11-21 2019-05-31 平安科技(深圳)有限公司 基于语音识别的交易方法、服务器及计算机可读存储介质
TWI672042B (zh) * 2018-06-20 2019-09-11 崑山科技大學 智慧型商品介紹系統及其方法
JP2020017031A (ja) * 2018-07-24 2020-01-30 クリーム株式会社 音声データ提供システム及びプログラム
CN111597300A (zh) * 2020-04-03 2020-08-28 厦门快商通科技股份有限公司 基于语音识别的购物车管理方法、系统及移动终端
CN113592604A (zh) * 2021-08-04 2021-11-02 温州方安物联科技有限公司 一种应用了vr技术的电商平台
CN113921017A (zh) * 2021-12-14 2022-01-11 深圳市声扬科技有限公司 语音同一性的检验方法、装置、电子设备及存储介质
CN115662444A (zh) * 2022-12-14 2023-01-31 北京惠朗时代科技有限公司 基于人工智能的电子印章语音交互式应用方法及系统
CN116777569A (zh) * 2023-08-21 2023-09-19 北京赛博日新科技有限公司 基于区块链的商品大数据语音介绍和智能结账方法及系统
CN116884428A (zh) * 2023-09-05 2023-10-13 北京赛博日新科技有限公司 基于区块链的线上诊疗及音视频数据智能优化方法和系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084128A (ja) * 1999-12-17 2001-03-30 Akihiro Matsuo インターネット商店における音声の活用方法
CN108154409A (zh) * 2016-12-05 2018-06-12 天脉聚源(北京)科技有限公司 一种互联网购物评价的方法和系统
CN108389098A (zh) * 2017-02-03 2018-08-10 北京京东尚科信息技术有限公司 语音购物方法以及系统
WO2019100607A1 (zh) * 2017-11-21 2019-05-31 平安科技(深圳)有限公司 基于语音识别的交易方法、服务器及计算机可读存储介质
TWI672042B (zh) * 2018-06-20 2019-09-11 崑山科技大學 智慧型商品介紹系統及其方法
JP2020017031A (ja) * 2018-07-24 2020-01-30 クリーム株式会社 音声データ提供システム及びプログラム
CN109545219A (zh) * 2019-01-09 2019-03-29 北京新能源汽车股份有限公司 车载语音交互方法、系统、设备及计算机可读存储介质
CN111597300A (zh) * 2020-04-03 2020-08-28 厦门快商通科技股份有限公司 基于语音识别的购物车管理方法、系统及移动终端
CN113592604A (zh) * 2021-08-04 2021-11-02 温州方安物联科技有限公司 一种应用了vr技术的电商平台
CN113921017A (zh) * 2021-12-14 2022-01-11 深圳市声扬科技有限公司 语音同一性的检验方法、装置、电子设备及存储介质
CN115662444A (zh) * 2022-12-14 2023-01-31 北京惠朗时代科技有限公司 基于人工智能的电子印章语音交互式应用方法及系统
CN116777569A (zh) * 2023-08-21 2023-09-19 北京赛博日新科技有限公司 基于区块链的商品大数据语音介绍和智能结账方法及系统
CN116884428A (zh) * 2023-09-05 2023-10-13 北京赛博日新科技有限公司 基于区块链的线上诊疗及音视频数据智能优化方法和系统

Similar Documents

Publication Publication Date Title
CN101506874B (zh) 情感检测方法、情感检测装置
CN115860882A (zh) 基于区块链的智慧城市商品大数据智能选购方法及系统
CN110348930A (zh) 业务对象数据处理方法、业务对象信息的推荐方法和装置
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN116739704A (zh) 基于人工智能的电商平台兴趣分析式商品推荐方法及系统
CN115662444B (zh) 基于人工智能的电子印章语音交互式应用方法及系统
CN108899033A (zh) 一种确定说话人特征的方法及装置
CN110347786B (zh) 一种语义模型的调优方法及系统
CN112199451A (zh) 商品识别方法、装置、计算机设备及存储介质
CN116777569A (zh) 基于区块链的商品大数据语音介绍和智能结账方法及系统
CN110827040A (zh) 一种消费者诉求解决方法和系统
Lee et al. Many-to-many unsupervised speech conversion from nonparallel corpora
CN117133271A (zh) 基于区块链的电商平台购物和智能语音评价方法及系统
CN112182126A (zh) 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质
CN108712683B (zh) 一种数据传输方法、弹幕信息生成方法及装置
KR102337502B1 (ko) 온라인 상의 비정상 상품 후기 검출 방법 및 장치
CN111127129A (zh) 一种商品交易系统及方法
CN115131108A (zh) 一种电商商品筛选系统
CN113362110A (zh) 营销信息的推送方法、装置、电子设备和可读介质
CN113869969A (zh) 问答信息处理、商品信息展示方法、设备及存储介质
CN113963440A (zh) 一种客户购买意愿分析方法及装置
CN110795537A (zh) 一种确定目标商品的改进策略的方法、装置、设备和介质
Sreehari et al. Automatic speaker recognition using stationary wavelet coefficients of lp residual
CN111048065A (zh) 文本纠错数据生成方法及相关装置
CN113722442B (zh) 基于关键词识别的联动性分析方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination