CN115018633A - 一种业务推荐方法、装置、计算机设备及存储介质 - Google Patents
一种业务推荐方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN115018633A CN115018633A CN202210752143.2A CN202210752143A CN115018633A CN 115018633 A CN115018633 A CN 115018633A CN 202210752143 A CN202210752143 A CN 202210752143A CN 115018633 A CN115018633 A CN 115018633A
- Authority
- CN
- China
- Prior art keywords
- service
- voice
- call
- target
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000008451 emotion Effects 0.000 claims abstract description 68
- 230000008909 emotion recognition Effects 0.000 claims description 66
- 238000012545 processing Methods 0.000 claims description 23
- 238000002372 labelling Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 claims description 16
- 230000006854 communication Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 210000000554 iris Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Computer Interaction (AREA)
- Child & Adolescent Psychology (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Hospice & Palliative Care (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例公开了一种业务推荐方法、装置、计算机设备及存储介质。本方案在业务推荐人员与客户人员基于业务推荐的通话过程中,获取客户人员的语音信息,进而根据语音信息以及语音信息对应的文本信息识别客户人员的情绪,若识别出客户人员的情绪为正面情绪,则从通话语音中获取语音信息对应的通话语音段,然后根据通话语音段对应的通话文本段识别出客户人员感兴趣的目标业务,向业务推荐人员展示目标业务,以使业务推荐人员基于目标业务向客户人员进行推荐,可以提高业务推荐的成功率。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种业务推荐方法、装置、计算机设备及存储介质。
背景技术
随着金融科技和社会经济的快速发展,银行涉及的业务范围越来越广泛。为了拓展客户群体,当推出新的业务时,需要向客户进行业务推荐,可以通过电话等方式进行推荐。但是,在向客户推荐业务时,仅根据当前业务场景对客户进行业务推荐,无法贴合客户的实际业务需求,导致业务推荐成功率较低。
发明内容
本申请实施例提供一种业务推荐方法、装置、计算机设备及存储介质,可以提高业务推荐的成功率。
本申请实施例提供了一种业务推荐方法,包括:
在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段;
基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音;
对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段;
基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息;
根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。
相应的,本申请实施例还提供了一种业务推荐装置,包括:
第一获取单元,用于在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段;
第一识别单元,用于基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
第二获取单元,用于若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音;
标注单元,用于对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段;
第二识别单元,用于基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息;
展示单元,用于根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。
在一些实施例中,该装置还包括:
第三识别单元,用于若基于所述标注后通话文本段未识别出所述客户人员感兴趣的目标业务,则对所述多个语音段中所述目标语音段的下一语音段进行情绪识别;
第三获取单元,用于若所述下一语音段的情绪识别结果为正向情绪,则基于所述目标语音段和所述下一语音段在通话过程中的时间获取所述目标语音段和所述下一语音段对应的通话语音段,返回执行对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段的步骤。
在一些实施例中,第一识别单元包括:
第一转换子单元,用于基于语音识别技术对所述目标语音段进行文本转换,得到所述文本段;
提取子单元,用于基于所述目标语音段提取语音特征,以及基于所述文本段提取文本特征;
第一处理子单元,用于通过预设情绪识别模型对所述语音特征与所述文本特征信息进行处理,得到所述目标语音段对应的正向情绪分值;
第一确定子单元,用于基于所述正向情绪分值得到所述情绪识别结果。
在一些实施例中,第二获取单元包括:
第一获取子单元,用于获取所述目标语音段对应的目标时间段;
第二获取子单元,用于获取所述通话过程中在所述目标时间段出现的通话语音,得到所述通话语音段。
在一些实施例中,标注单元包括:
第二转换子单元,用于基于语音识别技术对所述通话语音段进行文本转换,得到所述通话文本段;
第二确定子单元,用于从所述通话文本段中确定所述业务推荐方对应的第一通话文本,以及所述客户人员对应的第二通话文本;
标注子单元,用于通过第一标注方式对所述第一通话文本进行标注,以及通过第二标注方式对所述第二通话文本进行标注,得到所述标注后通话文本段。
在一些实施例中,第二识别单元包括:
第二处理子单元,用于对所述标注后通话文本段进行语义识别处理,得到所述标注后通话文本段对应的语义信息;
第三确定子单元,用于若所述语义信息中存在业务信息,则基于所述业务信息对应的业务得到所述目标业务,以及基于所述业务信息中的业务维度得到所述业务属性信息。
在一些实施例中,展示单元包括:
第三获取子单元,用于从所述若干业务类型中获取所述目标业务的次级业务;
第四获取子单元,用于从所述若干业务类型中获取与所述业务属性信息关联的关联业务;
第四确定子单元,用于基于所述次级业务以及所述关联业务,得到所述联想业务。
相应的,本申请实施例还提供了一种计算机设备,包括存储器,处理器及存储在储存器上并可在处理器上运行的计算机程序,其中,处理器执行本申请实施例任一提供的业务推荐方法。
相应的,本申请实施例还提供了一种存储介质,存储介质存储有多条指令,指令适于处理器进行加载,以执行如上的业务推荐方法。
本申请实施例在业务推荐人员与客户人员基于业务推荐的通话过程中,获取客户人员的语音信息,进而根据语音信息以及语音信息对应的文本信息识别客户人员的情绪,若识别出客户人员的情绪为正面情绪,则从通话语音中获取语音信息对应的通话语音段,然后根据通话语音段对应的通话文本段识别出客户人员感兴趣的目标业务,向业务推荐人员展示目标业务,以使业务推荐人员基于目标业务向客户人员进行推荐,可以提高业务推荐的成功率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种业务推荐方法的流程示意图。
图2为本申请实施例提供的另一种业务推荐方法的流程示意图。
图3为本申请实施例提供的一种业务推荐装置的结构框图。
图4为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种业务推荐方法、装置、存储介质及计算机设备。具体地,本申请实施例的业务推荐方法可以由计算机设备执行,其中,该计算机设备可以为服务器等设备。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
例如,该计算机设备可以是服务器,该服务器可以在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段;基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果;若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段,通话语音段包括业务推荐方与客户人员的部分通话语音;对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段;基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息;根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。
基于上述问题,本申请实施例提供一种业务推荐方法、装置、计算机设备及存储介质,可以提高业务推荐的成功率。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本申请实施例提供一种业务推荐方法,该方法可以由终端或服务器执行,本申请实施例以业务推荐方法由服务器执行为例来进行说明。
请参阅图1,图1为本申请实施例提供的一种业务推荐方法的流程示意图。该业务推荐方法的具体流程可以如下:
101、在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段。
在本申请实施例中,业务提供方指的是可以为用户提供业务服务的一方,比如银行等。其中,业务服务可以包括多种,比如,业务办理、业务咨询、业务推荐等。业务推荐方与客户人员的通话过程可以指的是业务提供方与客户人员基于业务服务进行的电话沟通过程。
其中,客户人员的语音信息指的是通话过程中采集的客户人员的语音。在采集客户人员的语音信息时,可以基于设定的时间间隔进行采集,比如,每隔1分钟采集一次客户的语音信息,则每一次采集的语音信息可以为前一分钟的语音信息等。
在本申请实施例中,语音信息为完整的语音音频,在语音信息的时长较长的情况下,为了提高语音识别处理效率,可以将语音信息切分为多个语音片段,也即语音段。可以包括多种切分方式,比如,可以设定语音片段的时长,基于语音片段时长将语音信息切分为多个语音段。
一实施例中,为了避免将一句完整对话切分开,可以将语音信息通过ASR(Automatic Speech Recognition,自动语音识别)技术转换为文本信息,基于文本信息的中连续一句话以及每一句话对应的时间戳将语音信息切分为多个语音段,每一语音段对应连续一句对话。
其中,对于时间长度大于15秒的音频片段,再通过估算该片段语速的方法进一步进行切分。具体方法包括:根据音频片段时长和ASR转换的文本信息,估算该文本语句的语速=片段时长/片段字数,从离片段文本中间最近分句(以文本中逗号、句号、问号等停顿符号为依据)开始切分文本。通过切分后文本的字数乘以估算语速来确定音频的切断点。最后在以0.5秒作为缓冲区间,在切断点+0.5秒作为前一个分句的结束时间,切断点-0.5秒作为后一个分句的开始时间。如果切分后还存在时间长度大于15秒的片段,则对大于15秒的片段继续按上述方法进行切分。切分完后得到客户人员的语音信息的多个音频段,然后将多个音频段按照时间先后顺序进行排序,得到存在时序关系的多个语音段,比如,语音段1,语音段2,语音段3。
102、基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果。
在本申请实施例中,为了实时识别客户人员的情绪信息,可以对通话过程中客户人员的语音信息按照通话时间顺序依次进行情绪识别处理,从而保证在通话开始时直至通话结束可以识别客户人员的情绪变化情况。
例如,多个语音段按照时序关系排序为:语音段1,语音段2,语音段3,则从多个语音段中获取时序在前的语音段,得到目标语音段可以为:语音段1。
在一些实施例中,为了提高情绪识别的准确率,步骤“对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果”,可以包括以下操作:
基于语音识别技术对目标语音段进行文本转换,得到文本段;
基于目标语音段提取语音特征,以及基于文本段提取文本特征;
通过预设情绪识别模型对语音特征与文本特征信息进行处理,得到目标语音段对应的正向情绪分值;
基于正向情绪分值得到情绪识别结果。
具体的,通过语音识别技术将目标语音段转换为该目标语音段对应的文本段。
在本申请实施例中,通过文本特征提取模型对文本段进行特征提取,得到文本段对应的文本特征,以及通过语音特征提取模型对目标语音段进行特征提取,得到目标语音段对应的语音特征。
例如,将文本段输入文本特征提取模型,通过文本特征提取模型对文本信息进行特征提取,得到文本段的文本特征;将目标语音段输入语音特征提取模型,通过语音特征提取模型对目标语音段进行特征提取,得到目标语音段的语音特征。
其中,语音特征提取模型以Meta开源的语音预训练模型XLSR-53为基础开发。XLSR-53是Meta采用自监督语音预训练模型 wav2vec2(由Meta公司开源的一种语音预训练模型)结构,在53 种语言共5万6千小时数据上训练得到的多语言语音预训练模型。
其中,对文本特征提取模型的训练可以包括:使用公开的中文文本预训练模型chinese-BERT-wwm(开源的中文BERT模型)为初始模型,仅使用情绪训练数据的文本信息,对chinese-BERT-wwm模型继续训练了60epochs。其中,使用了Adam优化器,学习率设置为0.00001的exponential decay。模型的损失函数和初始模型 chinese-BERT-wwm保持一样。
在本申请实施例中,预设情绪识别模型可以基于语音信息和语音信息对应的文本信息预测语音信息和文本信息的正向情绪。
具体的,将文本特征和语音特征输入预设情绪识别模型,首先,通过预设情绪识别模型对文本特征和语音特征进行特征融合处理,得到文本特征和语音特征的融合后特征,然后通过预设情绪识别模型计算融合后特征在正向情绪上的得分,得到当前客户人员的正向情绪分值。比如,正向情绪分值的取值可以为:-1,0,1。其中,-1和0代表非正向情绪,1代表正向情绪。
例如,通过预设情绪识别模型识别出客户人员的正向情绪分值可以为-1,则可以确定客户人员的情绪识别结果为:非正向情绪。
又例如,通过预设情绪识别模型识别出客户人员的正向情绪分值可以为1,则可以确定客户人员的情绪识别结果为:正向情绪。
103、若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段。
具体的,当识别出客户人员的情绪为正向情绪时,也即表示客户人员与业务推荐方的沟通态度较积极,则可以对客户人员出现正向情绪的通话进行分析,以确定是否存在客户人员感兴趣的内容(业务)。
其中,通话语音段指的是业务推荐方与客户人员在通话过程中的部分对话语音,也即包括双方对话的语音。
在一些实施例中,步骤“基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段”,可以包括以下操作:
获取目标语音段对应的目标时间段;
获取通话过程中在目标时间段出现的通话语音,得到通话语音段。
其中,目标时间段指的是目标语音段对应的起始时间以及结束时间。在采集语音信息时,可以获取语音信息对应的时间信息,以此在将语音信息切分为多个语音段时,可以确定各个语音段对应的时间段。
例如,获取目标语音段对应的起始时间可以为:8时10分9秒,以及结束时间可以为:8时11分9秒,得到目标语音段对应的目标时间段可以为:8时10分9秒-8时11分9秒。
其中,在通话过程中记录实时的时间信息,当确定目标语音段对应的目标时间段后,可以从通话过程中客户人员与业务提供方在目标时间段的对话语音,得到通话语音段。
例如,目标时间段可以为:8时10分9秒-8时11分9秒,则从客户人员与业务提供方的通话语音中,获取目标时间段可以为:8时 10分9秒-8时11分9秒对应的通话语音,得到通话语音段。
104、对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段。
在一些实施例中,为了将通话语音段中的客户人员的音频与业务提供方的音频区分,步骤“对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段”,可以包括以下操作:
基于语音识别技术对通话语音段进行文本转换,得到通话文本段;
从通话文本段中确定业务推荐方对应的第一通话文本,以及客户人员对应的第二通话文本;
通过第一标注方式对第一通话文本进行标注,以及通过第二标注方式对第二通话文本进行标注,得到标注后通话文本段。
具体的,将通话语音段通过语音识别技术转换为文本,得到通话语音段对应的通话文本段。
其中,在将通话语音段转换为通话文本段时,可以通过语音识别技术识别通话语音段中各句语音对应的说话对象,可以通过音色识别等方式识别说话对象。
例如,通话语音段中包括:第一句语音,第二句语音,第三句语音和第四句语音,通过语音识别技术分别对各句语音进行文本转换以及说话对象识别,得到第一句语音对应的文本为第一文本,对应的说话对象为客户人员;第二句语音对应的文本为第二文本,对应的说话对象为业务提供方,第三句语音对应的文本为第三文本,对应的说话对象为客户人员;第四句语音对应的文本为第四文本,对应的说话对象为客户人员。
进一步的,根据每一句语音对应的说话对象对该句语音对应文本进行标注。其中,第一标注方式指的是对业务推荐方对应的文本,也即第一通话文本,标注业务推荐方,第二标注方式指的是对客户人员对应的文本,也即第二通话文本,标注客户人员。得到标注后的通话文本段如下:
{第一句语音:第一文本,业务提供方;
第二句语音:第二文本,业务提供方;
第三句语音:第三文本,业务提供方;
第四句语音:第四文本,业务提供方}。
105、基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息。
在一些实施例中,为了识别出客户人员感兴趣的业务,步骤“基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息”,可以包括以下操作:
对标注后通话文本段进行语义识别处理,得到标注后通话文本段对应的语义信息;
若语义信息中存在业务信息,则基于业务信息对应的业务得到目标业务,以及基于业务信息中的业务维度得到业务属性信息。
其中,对于标注后通话文本段可以进行语义识别处理,可以通过语义识别模型对标注后通话文本段进行语义识别,得到标注后通话文本段对应的语音信息。具体的,对于标注后通话文本段首先进行文本预处理,包括:中文分词,去停用词等,得到预处理后文本,将预处理后文本输入预设语义识别模型,提取关键词特征,对关键词特征进行处理,输出语义信息。
其中,业务信息包括业务相关的内容,比如,业务信息可以包括:业务名称,业务类型,业务使用等与业务相关的内容。
在识别出标注后通话文本对应的语义信息后,可以判断语义信息中是否包括业务信息。若语义信息中包括业务信息,则可以根据获取与该业务信息对应的业务,得到目标业务。
例如,语义信息可以为“客户:业务A包括哪些内容呢”,可以确定语义信息中存在业务信息,且语义信息中的业务信息为:业务 A,则可以确定目标业务为:业务A。
其中,业务维度也即业务属性,业务可以包括多种业务属性,比如,业务属性可以包括:业务办理条件,业务使用场景等。
例如,语义信息可以为“客户:业务A的办理条件是什么”,可以确定语义信息中包括:目标业务A,以及业务属性:办理条件。
在一些实施例中,若语义信息中仅包括业务名称,则可以根据语音信息确定目标业务;或者,若语义信息中仅包括业务属性,则可以根据语音信息确定业务属性信息。
在一些实施例中,为了提高识别客户人员感兴趣的业务信息,该方法还可以包括以下步骤:
若基于标注后通话文本段未识别出客户人员感兴趣的目标业务,则对多个语音段中目标语音段的下一语音段进行情绪识别;
若下一语音段的情绪识别结果为正向情绪,则基于目标语音段和下一语音段在通话过程中的时间获取目标语音段和下一语音段对应的通话语音段,返回执行对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段的步骤。
具体的,对目标语音段对应的标注后通话文本进行语义识别,得到的语义信息中若不包括业务信息,也即为识别出客户感兴趣的业务,则可以继续对语音信息中多个语音段中目标语音段的下一语音段进行情绪识别。
例如,语音信息中多个语音段按照时序排列,包括:语音段1,语音段2,语音段3,目标语音段可以为:语音段1,则下一语音段可以为:语音段2。
进一步的,对语音段2进行文本转换,得到语音段2对应的文本段2,通过预设情绪识别模型对语音段2以及文本段2进行情绪识别,得到语音段2与文本段2对应的情绪识别结果,若情绪识别结果指示语音段2对应正向情绪,则可以基于目标语音段和下一语音段在通话过程中的时间获取目标语音段和下一语音段对应的通话语音段。
例如,目标语音段对应的时间可以为:8时10分9秒-8时11分 9秒;语音段2对应的时间可以为:8时11分9秒-8时12分9秒。则可以从客户人员与业务提供方的通话语音中,获取8时10分9秒 -8时12分9秒对应的通话语音,得到目标语音段与语音段2对应的通话语音段。然后执行对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段的步骤。以此,可以结合多个文本段的上下文语音识别客户人员感兴趣的业务,提高识别准确率。
106、根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。
其中,业务联想指的是基于目标业务和/或业务属性信息,从多个业务类型中,获取与目标业务和/或业务属性信息存在关系的业务。
在本申请实施例中,与客户人员进行通话的业务提供方为客服人员或者业务人员。在银行场景中,由于业务类型繁多,一客服人员或者业务人员负责一种类型的业务,则对于非自身负责的业务类型可能不太熟悉。
例如,银行中包括的业务类型可以为:业务类型A,业务类型B 以及业务类型C。其中,业务类型A可以由业务人员a负责,业务类型B可以由业务人员b负责,以及业务类型C可以由业务人员c负责。那么,业务人员a对于业务类型B和业务类型C可能不太了解,业务人员b对于业务类型A和业务类型C可能不太了解,业务人员c 对于业务类型A和业务类型B可能不太了解。此时,为了方便业务人员为客户人员推荐更多的业务,可以进行业务联想,以获取当前业务人员不了解的业务,对客户人员进行推荐。
在一些实施例中,为了提高业务推荐效率,步骤“根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务”,可以包括以下操作:
从若干业务类型中获取目标业务的次级业务;
从若干业务类型中获取与业务属性信息关联的关联业务;
基于次级业务以及关联业务,得到联想业务。
其中,若干类型业务指的是业务提供方提供的所有类型的业务。目标业务可以为一级业务,一级业务下可以包括多个子业务,也即目标业务的次级业务。
例如,目标业务可以为:理财业务,理财业务下包括的理财子业务可以为:基金业务,保险业务等。
具体的,从若干业务类型中获取与业务属性信息关联的关联业务,指的是从业务提供方提供的所有类型的业务获取与业务属性信息相似的业务,得到关联业务。
例如,业务属性信息可以为:办理条件为学生。然后从若干业务类型中获取办理条件为学生的业务,比如:助学贷款等,从而得到与业务属性信息关联的关联业务。
在本申请实施例中,从若干业务类型中获取目标业务以及业务属性信息的联系业务不限与上述获取方式,可以根据设置不同的组合条件或者根据实际业务场景的需求,从若干业务类型确定联想业务。
进一步的,向业务推荐方展示目标业务和联想业务。
具体的,在确定目标业务和联想业务之后,可以获取目标业务的业务详情信息,以及联想业务的业务详情信息。其中,业务详情信息可以包括业务类型,业务使用等多种业务信息。然后通过业务提供方的终端设备向业务提供方展示目标业务的业务详情信息,以及联想业务的业务详情信息,以使业务提供方根据业务详情信息对客户人员进行业务推荐,从而向客户人员推荐感兴趣度较高的业务,可以提高业务推荐的成功率。
本申请实施例公开了一种业务推荐方法,该方法包括:在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段;基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果;若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段,通话语音段包括业务推荐方与客户人员的部分通话语音;对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段;基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息;根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。以此,可以提高向客户人员进行业务推荐的成功率。
根据上述介绍的内容,下面将举例来进一步说明本申请的业务推荐方法。请参阅图2,图2为本申请实施例提供的另一种业务推荐方法的流程示意图,以该业务推荐方法应用于服务器为例,具体流程可以如下:
201、在业务推荐人员与客户人员的通话过程中,服务器获取客户人员的语音信息。
在本申请实施例中,应用场景可以为银行的业务推荐人员与客户人员基于银行业务进行电话通话。在业务推荐人员与客户人员进行通话时,服务器可以通过设置在业务推荐人员一侧的语音采集设备采集业务推荐人员的语音,得到客户人员的语音信息。
202、服务器对所述语音信息以及所述语音信息对应的文本信息进行情绪识别处理,得到客户人员的情绪识别结果。
具体的,通过ASR技术对语音信息进行文本转换处理,得到语音信息对应的文本信息。
进一步的,将文本信息输入文本特征提取模型,通过文本特征提取模型对文本信息进行特征提取,得到文本信息的文本特征;将语音信息输入语音特征提取模型,通过语音特征提取模型对语音信息进行特征提取,得到语音信息的语音特征。然后,通过预设情绪识别模型对文本特征和语音特征进行情绪识别处理,计算语音信息和文本信息对应的正向情绪分值,然后根据正向情绪分值与各预设正向情绪分值对应的情绪结果,确定正向情绪分值是否为正向情绪。
例如,多个预设正向情绪分值可以为:-1,0,1。其中,-1和0 代表非正向情绪,1代表正向情绪。
203、若情绪识别结果为正面情绪,则服务器从通话语音中获取语音信息对应的通话语音段。
其中,通话语音段指的是业务推荐人员与客户人员在通话过程中的部分对话语音,也即包括双方对话的语音。
具体的,获取客户人员的语音信息对应的时间信息,比如时间信息可以为包括起始时间和结束时间的时间段,然后从业务推荐人员和客户人员的通话语音中获取在该时间段对应的通话语音,得到通话语音段。
例如,获取客户人员的语音信息对应的时间信息:14时10分9 秒-14时11分9秒,则从客户人员与业务推荐人员的通话语音中,获取14时10分9秒-14时11分9秒这一时段对应的通话语音,得到通话语音段。
204、服务器从通话语音段的通话文本段中提取业务关键词,基于业务关键词确定客户人员感兴趣的目标业务。
进一步的,通过ASR技术对通话语音段进行文本转换处理,得到通话语音段对应的通话文本段。然后从通话文本段中提取业务关键词。
其中,业务关键词指的是与银行支持办理的业务的相关词汇。具体的,可以对通话文本段进行分词处理,得到通话文本段对应的词汇序列,然后从词汇序列中过滤掉无用词汇(如语气词等),得到处理后词汇序列,然后对处理后词汇序列中的词汇进行分析,判断是否存在与业务相关的关键词,若存在,则筛选出来,从而得到业务关键词。
然后,获取与业务关键词对应的业务信息,根据业务信息分析业务名称,得到客户人员感兴趣的目标业务。
205、服务器从多个预设业务中获取与目标业务相关的其他业务,向业务推荐人员展示目标业务与其他业务。
其中,多个预设业务指的是银行支持办理的多个业务。
具体的,从多个预设业务中获取与目标业务相关的其他业务可以是获取业务类型与目标业务相关的业务,然后获取客户人员已办理的业务信息,从与目标业务的业务类型相关的业务中筛选出客户人员未办理的业务,得到其他业务。
进而向业务推荐人员展示目标业务与其他业务的业务信息,可以为业务详情介绍等,以使业务推荐人员根据目标业务与其他业务的业务信息对客户人员进行更多业务推荐,提高业务推荐范围;同时向客户人员推荐兴趣度较高的业务,可以提高业务推荐的成功率。
本申请实施例公开了一种业务推荐方法,该方法包括:在业务推荐人员与客户人员的通话过程中,服务器获取客户人员的语音信息,对所述语音信息以及所述语音信息对应的文本信息进行情绪识别处理,得到客户人员的情绪识别结果,若情绪识别结果为正面情绪,则服务器从通话语音中获取语音信息对应的通话语音段,从通话语音段的通话文本段中提取业务关键词,基于业务关键词确定客户人员感兴趣的目标业务,从多个预设业务中获取与目标业务相关的其他业务,向业务推荐人员展示目标业务与其他业务。以此,可以基于多个关联业务对客户人员同时进行推荐,从而提高业务推荐效率。
为便于更好的实施本申请实施例提供的业务推荐方法,本申请实施例还提供一种基于上述业务推荐方法的业务推荐装置。其中名词的含义与上述业务推荐方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请实施例提供的一种业务推荐装置的结构框图,该装置包括:
第一获取单元301,用于在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段;
第一识别单元302,用于基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
第二获取单元303,用于若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音;
标注单元304,用于对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段;
第二识别单元305,用于基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息;
展示单元306,用于根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。
在一些实施例中,该装置还可以包括:
第三识别单元,用于若基于所述标注后通话文本段未识别出所述客户人员感兴趣的目标业务,则对所述多个语音段中所述目标语音段的下一语音段进行情绪识别;
第三获取单元,用于若所述下一语音段的情绪识别结果为正向情绪,则基于所述目标语音段和所述下一语音段在通话过程中的时间获取所述目标语音段和所述下一语音段对应的通话语音段,返回执行对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段的步骤。
在一些实施例中,第一识别单元302可以包括:
第一转换子单元,用于基于语音识别技术对所述目标语音段进行文本转换,得到所述文本段;
提取子单元,用于基于所述目标语音段提取语音特征,以及基于所述文本段提取文本特征;
第一处理子单元,用于通过预设情绪识别模型对所述语音特征与所述文本特征信息进行处理,得到所述目标语音段对应的正向情绪分值;
第一确定子单元,用于基于所述正向情绪分值得到所述情绪识别结果。
在一些实施例中,第二获取单元303可以包括:
第一获取子单元,用于获取所述目标语音段对应的目标时间段;
第二获取子单元,用于获取所述通话过程中在所述目标时间段出现的通话语音,得到所述通话语音段。
在一些实施例中,标注单元304可以包括:
第二转换子单元,用于基于语音识别技术对所述通话语音段进行文本转换,得到所述通话文本段;
第二确定子单元,用于从所述通话文本段中确定所述业务推荐方对应的第一通话文本,以及所述客户人员对应的第二通话文本;
标注子单元,用于通过第一标注方式对所述第一通话文本进行标注,以及通过第二标注方式对所述第二通话文本进行标注,得到所述标注后通话文本段。
在一些实施例中,第二识别单元305可以包括:
第二处理子单元,用于对所述标注后通话文本段进行语义识别处理,得到所述标注后通话文本段对应的语义信息;
第三确定子单元,用于若所述语义信息中存在业务信息,则基于所述业务信息对应的业务得到所述目标业务,以及基于所述业务信息中的业务维度得到所述业务属性信息。
在一些实施例中,展示单元306可以包括:
第三获取子单元,用于从所述若干业务类型中获取所述目标业务的次级业务;
第四获取子单元,用于从所述若干业务类型中获取与所述业务属性信息关联的关联业务;
第四确定子单元,用于基于所述次级业务以及所述关联业务,得到所述联想业务。
本申请实施例公开了一种业务推荐装置,通过第一获取单元301 在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段,第一识别单元302基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果,第二获取单元303若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音,标注单元304对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段,第二识别单元305基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息,展示单元306根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。以此,可以提高业务推荐的成功率。
相应的,本申请实施例还提供一种计算机设备,该计算机设备可以为服务器。如图4所示,图4为本申请实施例提供的计算机设备的结构示意图。该计算机设备400包括有一个或者一个以上处理核心的处理器401、有一个或一个以上计算机可读存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中,处理器401与存储器402电性连接。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器401是计算机设备400的控制中心,利用各种接口和线路连接整个计算机设备400的各个部分,通过运行或加载存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备400的各种功能和处理数据,从而对计算机设备400 进行整体监控。
在本申请实施例中,计算机设备400中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段;
基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段,通话语音段包括业务推荐方与客户人员的部分通话语音;
对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段;
基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息;
根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图4所示,计算机设备400还包括:触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中,处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解,图 4中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的消息或提供给用户的消息以及计算机设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸消息,并将它转换成触点坐标,再送给处理器401,并能接收处理器401发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器 401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。
在本申请实施例中,通过处理器401执行游戏应用程序在触控显示屏403上生成图形用户界面,图形用户界面上的虚拟场景中包含至少一个技能控制区域,技能控制区域中包含至少一个技能控件。该触控显示屏403用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。
射频电路404可用于收发射频信号,以通过无线通信与网络设备或其他计算机设备建立无线通讯,与网络设备或其他计算机设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与计算机设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路405接收后转换为音频数据,再将音频数据输出处理器401处理后,经射频电路404以发送给比如另一计算机设备,或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔,以提供外设耳机与计算机设备的通信。
输入单元406可用于接收输入的数字、字符消息或用户特征消息 (例如指纹、虹膜、面部消息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源407用于给计算机设备400的各个部件供电。可选的,电源 407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图4中未示出,计算机设备400还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
由上可知,本实施例提供的计算机设备,通过在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段;基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果;若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段,通话语音段包括业务推荐方与客户人员的部分通话语音;对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段;基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息;根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种业务推荐方法中的步骤。例如,该计算机程序可以执行如下步骤:
在业务推荐方与客户人员的通话过程中,获取客户人员的语音信息,并将语音信息划分为存在时序关系的多个语音段;
基于时序关系,对多个语音段中时序在前的目标语音段以及目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
若情绪识别结果为正向情绪,则基于目标语音段在通话过程中的时间获取目标语音段对应的通话语音段,通话语音段包括业务推荐方与客户人员的部分通话语音;
对通话语音段的通话文本段分别采用不同的标注方式标注业务推荐方与客户人员通话文本,得到标注后通话文本段;
基于标注后通话文本段识别客户人员感兴趣的目标业务,以及目标业务下客户人员感兴趣的业务属性信息;
根据目标业务以及业务属性信息,在若干业务类型中进行业务联想,得到目标业务的联想业务,并为业务推荐方展示目标业务和联想业务。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种业务推荐方法中的步骤,因此,可以实现本申请实施例所提供的任一种业务推荐方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种业务推荐方法、装置、存储介质及计算机设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种业务推荐方法,其特征在于,所述方法包括:
在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段;
基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音;
对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段;
基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息;
根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若基于所述标注后通话文本段未识别出所述客户人员感兴趣的目标业务,则对所述多个语音段中所述目标语音段的下一语音段进行情绪识别;
若所述下一语音段的情绪识别结果为正向情绪,则基于所述目标语音段和所述下一语音段在通话过程中的时间获取所述目标语音段和所述下一语音段对应的通话语音段,返回执行对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段的步骤。
3.根据权利要求1所述的方法,其特征在于,所述对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果,包括:
基于语音识别技术对所述目标语音段进行文本转换,得到所述文本段;
基于所述目标语音段提取语音特征,以及基于所述文本段提取文本特征;
通过预设情绪识别模型对所述语音特征与所述文本特征信息进行处理,得到所述目标语音段对应的正向情绪分值;
基于所述正向情绪分值得到所述情绪识别结果。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,包括:
获取所述目标语音段对应的目标时间段;
获取所述通话过程中在所述目标时间段出现的通话语音,得到所述通话语音段。
5.根据权利要求1所述的方法,其特征在于,所述对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段,包括:
基于语音识别技术对所述通话语音段进行文本转换,得到所述通话文本段;
从所述通话文本段中确定所述业务推荐方对应的第一通话文本,以及所述客户人员对应的第二通话文本;
通过第一标注方式对所述第一通话文本进行标注,以及通过第二标注方式对所述第二通话文本进行标注,得到所述标注后通话文本段。
6.根据权利要求1所述的方法,其特征在于,所述基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息,包括:
对所述标注后通话文本段进行语义识别处理,得到所述标注后通话文本段对应的语义信息;
若所述语义信息中存在业务信息,则基于所述业务信息对应的业务得到所述目标业务,以及基于所述业务信息中的业务维度得到所述业务属性信息。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,包括:
从所述若干业务类型中获取所述目标业务的次级业务;
从所述若干业务类型中获取与所述业务属性信息关联的关联业务;
基于所述次级业务以及所述关联业务,得到所述联想业务。
8.一种业务推荐装置,其特征在于,所述装置包括:
第一获取单元,用于在业务推荐方与客户人员的通话过程中,获取所述客户人员的语音信息,并将所述语音信息划分为存在时序关系的多个语音段;
第一识别单元,用于基于所述时序关系,对所述多个语音段中时序在前的目标语音段以及所述目标语音段对应的文本段进行情绪识别,得到情绪识别结果;
第二获取单元,用于若所述情绪识别结果为正向情绪,则基于所述目标语音段在通话过程中的时间获取所述目标语音段对应的通话语音段,所述通话语音段包括所述业务推荐方与所述客户人员的部分通话语音;
标注单元,用于对所述通话语音段的通话文本段分别采用不同的标注方式标注所述业务推荐方与所述客户人员通话文本,得到标注后通话文本段;
第二识别单元,用于基于所述标注后通话文本段识别所述客户人员感兴趣的目标业务,以及所述目标业务下所述客户人员感兴趣的业务属性信息;
展示单元,用于根据所述目标业务以及所述业务属性信息,在若干业务类型中进行业务联想,得到所述目标业务的联想业务,并为所述业务推荐方展示所述目标业务和所述联想业务。
9.一种计算机设备,包括存储器,处理器及存储在存储器上并在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至7任一项所述的业务推荐方法。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的业务推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210752143.2A CN115018633A (zh) | 2022-06-28 | 2022-06-28 | 一种业务推荐方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210752143.2A CN115018633A (zh) | 2022-06-28 | 2022-06-28 | 一种业务推荐方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115018633A true CN115018633A (zh) | 2022-09-06 |
Family
ID=83079510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210752143.2A Pending CN115018633A (zh) | 2022-06-28 | 2022-06-28 | 一种业务推荐方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115018633A (zh) |
-
2022
- 2022-06-28 CN CN202210752143.2A patent/CN115018633A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10909328B2 (en) | Sentiment adapted communication | |
CN109348275B (zh) | 视频处理方法和装置 | |
US10764431B1 (en) | Method for conversion and classification of data based on context | |
CN115083434B (zh) | 一种情绪识别方法、装置、计算机设备及存储介质 | |
JP2017016566A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN111666380A (zh) | 一种智能呼叫方法、装置、设备和介质 | |
EP3872652A2 (en) | Method and apparatus for processing video, electronic device, medium and product | |
CN112951275B (zh) | 语音质检方法、装置、电子设备及介质 | |
CN112699645B (zh) | 语料标注方法、装置及设备 | |
CN113450759A (zh) | 语音生成方法、装置、电子设备以及存储介质 | |
CN111651571A (zh) | 基于人机协同的会话实现方法、装置、设备及存储介质 | |
WO2022260794A1 (en) | Reducing biases of generative language models | |
CN114095782A (zh) | 一种视频处理方法、装置、计算机设备及存储介质 | |
CN110610003A (zh) | 用于辅助文本标注的方法和系统 | |
CN110245334A (zh) | 用于输出信息的方法和装置 | |
CN112434953A (zh) | 一种基于计算机数据处理的客服人员考核方法和装置 | |
CN115798459A (zh) | 音频处理方法、装置、存储介质及电子设备 | |
CN115101053A (zh) | 基于情绪识别的对话处理方法、装置、终端及存储介质 | |
CN113505606B (zh) | 一种培训信息获取方法、装置、电子设备及存储介质 | |
CN114171063A (zh) | 一种实时话务客户情绪分析辅助方法及系统 | |
CN115018633A (zh) | 一种业务推荐方法、装置、计算机设备及存储介质 | |
CN114240250A (zh) | 一种职业评测的智能管理方法及系统 | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN114118937A (zh) | 基于任务的信息推荐方法、装置、电子设备及存储介质 | |
WO2023272833A1 (zh) | 一种数据检测方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |