CN118134499A - 一种基于线上产品智能送策的智能客服系统 - Google Patents
一种基于线上产品智能送策的智能客服系统 Download PDFInfo
- Publication number
- CN118134499A CN118134499A CN202410239393.5A CN202410239393A CN118134499A CN 118134499 A CN118134499 A CN 118134499A CN 202410239393 A CN202410239393 A CN 202410239393A CN 118134499 A CN118134499 A CN 118134499A
- Authority
- CN
- China
- Prior art keywords
- similarity
- user
- question
- intelligent
- questions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008859 change Effects 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000009411 base construction Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 54
- 238000012549 training Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000001960 triggered effect Effects 0.000 claims description 4
- 230000008901 benefit Effects 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于线上产品智能送策的智能客服系统,涉及人工智能技术领域,包括问答知识库构建以及多模型构建;问答知识库构建,根据用户会问到的问题种类、相似问题、问句模板在内的多维度数据,对用户的问答语料进行搜集,形成基于智能送策的问答知识库;多模型构建,通过搭建多个模型,用于对问题相似度的测算,从而对用户问题进行直接回答或相似问题推荐,实现智能回复。该基于线上产品智能送策的智能客服系统,通过设置先进的自然语言处理技术,高效准确地检索政策信息,并向用户提供快速准确的答案,用户可以轻松地查询政策内容、了解政策变化、获取政策解读等信息,无需等待人工客服的处理,大大提高了信息获取的效率和便利性。
Description
技术领域
本发明涉及人工智能技术领域,具体为一种基于线上产品智能送策的智能客服系统。
背景技术
随着线上产品的蓬勃发展,特别是在政策查询领域,用户经常需要及时获取政策相关信息以解决问题或了解政策变化。然而,传统的人工客服往往面临着信息处理速度慢、工作效率低下等挑战。而基于大规模自然语言处理的智能客服系统,则能够智能高效且准确的检索结果,进而回答用户提出的大量重复问题,大大减少了人工客服的工作量。当前智能客服系统在理解用户提出的问题时,仍然存在语义理解和意图理解的局限性。特别是对于复杂或含糊不清的问题,系统可能无法准确把握用户意图,导致回答不够准确或满意。
为了解决上述问题,研究开发智能客服问答系统具有很大的实用价值和应用需求。因此,我们提出了一种基于线上产品智能送策的智能客服系统。
发明内容
针对现有技术的不足,本发明提供了一种基于线上产品智能送策的智能客服系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于线上产品智能送策的智能客服系统,包括问答知识库构建以及多模型构建;
问答知识库构建,根据用户会问到的问题种类、相似问题、问句模板在内的多维度数据,对用户的问答语料进行搜集,形成基于智能送策的问答知识库;
多模型构建,通过搭建多个模型,用于对问题相似度的测算,从而对用户问题进行直接回答或相似问题推荐,实现智能回复;
该智能客服系统构建的模型包括意图识别模型、语义相似度模型以及检索模型;
所述意图识别模型,用于实时预测用户的问题意图,对不同问题意图进行针对性回复;
所述检索模型,用于计算用户问题与问答知识库问题的相似度,给用户检索相似的问题,匹配用户输入的问题的答案;
所述语义相似度模型,为检索模型提供约束作用,防止检索模型出现毫不相关的问题被检索到。
进一步优化本技术方案,所述基于智能送策的问答知识库包括但不限于政策查询分类、政策的有效时间、政策的开始日期及结束日期、问题分类、问题其余问法以及答案。
进一步优化本技术方案,所述意图识别模型中的训练数据来源通过人工构建政策领域用户问题q及对应的用户意图i;
通过大规模bert预训练语言模型做问题编码向量,通过bert编码后的向量加入Dense层,通过上述构建的意图模型结构,将意图识别训练数据加载到意图识别模型中进行训练微调预测用户意图,具体构建内容如下所示:
使用BERT预训练语言模型进行问题编码,以得到:
编码向量(X=\text{BERT}(q))
然后,通过加入Dense层进行意图识别,即:
(\text{Intention}(X)=WX+b)
其中,(q)为用户提出的问题;(i)为用户的意图;(X)为通过BERT模型编码后的问题向量;(W)为Dense层的权重;(b)为Dense层的偏置项;(\text{BERT}(q))为BERT预训练模型用于将问题(q)转换为高维空间中的向量;(\text{Intention}(X))为通过Dense层处理后的意图识别结果。
进一步优化本技术方案,所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,包括对问题进行分词,过滤停用词,使用知网短语相似库(sim_dict)以及自定义短语相似库(phrase_dict)来计算短语相似度,最后通过平均相似值得到最终的语义相似度。
进一步优化本技术方案,所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,(q1),(q2)为需要计算相似度的问题对;(q1_list),(q2_list)为分词并过滤停用词后的问题列表;sim_dict为知网短语相似库;phrase_dict为自定义政策领域短语相似度库;similarity_list为累计的短语相似值列表;phrase((q1),(q2))为两个问题的语义相似度计算结果;
具体包括以下流程:
1)输入问题对q1、q2;
2)对q1、q2进行分词并过滤停用词的操作,得到q1_list,q2_list;
3)采用知网短语相似库sim_dict,计算常用短语相似度;
4)构建自定义短语相似库字典phrase_dict计算政策领域短语相似度:通过标注的政策领域问题对,进行分词检查,构建政策领域短语相似度,如短语:
phrase_dict={('政策解读','解读政策'):1,('信息变更','变更信息'):1,('服务电话','客服热线'):1,,('来益','送策'):0.95,('免费','收费'):0.7,...};
遍历q1_list里的短语Wi,通过sim_dict和phrase_dict累计Wi和q2_list的相似值得到similarity_list,对相似的列表进行取平均值得到Phrase(q1,q2)结果。
进一步优化本技术方案,所述检索模型采用SimBERT检索相似预训练模型进行编码,加入人工构建的政策领域问题对q1、q2,设置更小的学习率进行对SimBERT微调,然后SimBERT模型微调后的模型进行问题编码q1_vectors=SimBERT(q1)、q2_vectors=SimBERT(q2),计算2个问题对q1、q2的余弦相似度,similarity1=cos(q1_vectors,q2_vectors),获得问题对句子的相似结果,然后再通过构建短语相似度算法,计算q1,q2的短语相似度similarity2=phrase(q1,q2),将similarity1及similarity2的联合概率作为检索相似度的输出similarity=similarity1*similarity2,即:
similarity=SimBERT_similarity(q1,q2)
加入短语相似度用于给SimBERT检索结果加入约束,从而保证在模型检索时出现检索相似度很高。
进一步优化本技术方案,所述余弦相似度公式如下所示:
(\cos(x,y)=\frac{x\cdoty}{||x||\cdot||y||})
用于计算两个向量之间的余弦相似度,其中(x)和(y)是向量,(x\cdoty)是向量的点积,(||x||)和(||y||)分别是向量的模长;(x\cdoty)为向量(x)和(y)的点积,计算为(x_1y_1+x_2y_2+\ldots+x_ny_n);(||x||)为向量(x)的模长,计算为(\sqrt{x_1^2+x_2^2+\ldots+x_n^2});(\cos(x,y))为向量(x)和(y)之间的余弦相似度,取值范围在([-1,1])之间,值越接近1表示两个向量越相似。
进一步优化本技术方案,所述智能客服系统在问答数据时,包括以下具体步骤:
S1、构建问答知识库;
S2、在知识库上读取问答语料,利用训练好的检索模型编码模块对问答语料进行特征编码;
S3、对相似问题聚类,建立相似问题id库;
S4、对用户输入的问题进行意图识别,意图识别到明确的用户意图,直接返回语料库里设置的各意图答案;
S5、对用户输入问题,意图模型未识别到明确用户意图,则计算用户输入问题编码后的向量与语料库向量里的所有向量的中心距离,中心距离从大到小进行排序,取排序后的语料库数据的前500个问题作为检索候选问题,将候选的语料库问题,输入到检索模型中,计算每个候选问题和用户输入的问题相似度,设置问题阈值相似度;
S6、对于用户输入的问题,与候选问题相似度的最大值有高于0.9的,将选取相似值最高的值作为直接回复该候选问题对应的语料答案,对介于0.75和0.9之前的,返回一个问题列表,长度限制为5,作为询问引导用户查看,如果候选不存在,则触发兜底话术回复用户;
S7、进行知识库的再完善。
进一步优化本技术方案,所述步骤S5中,设置问题阈值相似度后,经多次验证,将阈值低于0.75的候选问题过滤掉,未过滤的候选问题将做为相似问题,存储到相似问题id库中。
进一步优化本技术方案,所述步骤S7中,将低于阈值的用户问题,人工检查相似问题库,看是否有符合答案的,有则把对应id,关联答案,如果没有,则人工新增该问题答案,加入知识库。
与现有技术相比,本发明提供了一种基于线上产品智能送策的智能客服系统,具备以下有益效果:
1、该基于线上产品智能送策的智能客服系统,通过设置先进的自然语言处理技术,高效准确地检索政策信息,并向用户提供快速准确的答案,用户可以轻松地查询政策内容、了解政策变化、获取政策解读等信息,无需等待人工客服的处理,大大提高了信息获取的效率和便利性。
2、该基于线上产品智能送策的智能客服系统,还具有24/7全天候在线的特点,用户可以随时随地通过线上渠道进行咨询,无需受限于传统客服的工作时间和地点,不仅能够提高政策查询的效率和准确性,还能够为用户提供更便捷、更快速、更全面的服务体验,从而推动政策查询服务向智能化、高效化的方向发展。
附图说明
图1为本发明提出的一种基于线上产品智能送策的智能客服系统的一种问答知识库示例图;
图2为本发明提出的一种基于线上产品智能送策的智能客服系统的业务处理流程图;
图3为本发明提出的一种基于线上产品智能送策的智能客服系统的数据处理流程图。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
一种基于线上产品智能送策的智能客服系统,包括问答知识库构建以及多模型构建。
问答知识库构建,根据用户会问到的问题种类、相似问题、问句模板在内的多维度数据,对用户的问答语料进行搜集,形成基于智能送策的问答知识库。
如图1所示,所述基于智能送策的问答知识库包括但不限于政策查询分类、政策的有效时间、政策的开始日期及结束日期、问题分类、问题其余问法以及答案。
多模型构建,通过搭建多个模型,用于对问题相似度的测算,从而对用户问题进行直接回答或相似问题推荐,实现智能回复。
该智能客服系统构建的模型包括意图识别模型、语义相似度模型以及检索模型。
所述意图识别模型,用于实时预测用户的问题意图,对不同问题意图进行针对性回复。
所述意图识别模型中的训练数据来源通过人工构建政策领域用户问题q及对应的用户意图i;
通过大规模bert预训练语言模型做问题编码向量,通过bert编码后的向量加入Dense层,通过上述构建的意图模型结构,将意图识别训练数据加载到意图识别模型中进行训练微调预测用户意图,具体构建内容如下所示:
使用BERT预训练语言模型进行问题编码,以得到:
编码向量(X=\text{BERT}(q))
然后,通过加入Dense层进行意图识别,即:
(\text{Intention}(X)=WX+b)
其中,(q)为用户提出的问题;(i)为用户的意图;(X)为通过BERT模型编码后的问题向量;(W)为Dense层的权重;(b)为Dense层的偏置项;(\text{BERT}(q))为BERT预训练模型用于将问题(q)转换为高维空间中的向量;(\text{Intention}(X))为通过Dense层处理后的意图识别结果。
所述检索模型,用于计算用户问题与问答知识库问题的相似度,给用户检索相似的问题,匹配用户输入的问题的答案。
所述检索模型采用SimBERT检索相似预训练模型进行编码,加入人工构建的政策领域问题对q1、q2,设置更小的学习率进行对SimBERT微调,然后SimBERT模型微调后的模型进行问题编码q1_vectors=SimBERT(q1)、q2_vectors=SimBERT(q2),计算2个问题对q1、q2的余弦相似度,similarity1=cos(q1_vectors,q2_vectors),获得问题对句子的相似结果,然后再通过构建短语相似度算法,计算q1,q2的短语相似度similarity2=phrase(q1,q2),将similarity1及similarity2的联合概率作为检索相似度的输出similarity=similarity1*similarity2,即:
similarity=SimBERT_similarity(q1,q2)
加入短语相似度用于给SimBERT检索结果加入约束,从而保证在模型检索时出现检索相似度很高。
所述余弦相似度公式如下所示:
(\cos(x,y)=\frac{x\cdoty}{||x||\cdot||y||})
用于计算两个向量之间的余弦相似度,其中(x)和(y)是向量,(x\cdoty)是向量的点积,(||x||)和(||y||)分别是向量的模长;(x\cdoty)为向量(x)和(y)的点积,计算为(x_1y_1+x_2y_2+\ldots+x_ny_n);(||x||)为向量(x)的模长,计算为(\sqrt{x_1^2+x_2^2+\ldots+x_n^2});(\cos(x,y))为向量(x)和(y)之间的余弦相似度,取值范围在([-1,1])之间,值越接近1表示两个向量越相似。
所述语义相似度模型,为检索模型提供约束作用,防止检索模型出现毫不相关的问题被检索到。
所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,包括对问题进行分词,过滤停用词,使用知网短语相似库(sim_dict)以及自定义短语相似库(phrase_dict)来计算短语相似度,最后通过平均相似值得到最终的语义相似度。
所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,(q1),(q2)为需要计算相似度的问题对;(q1_list),(q2_list)为分词并过滤停用词后的问题列表;sim_dict为知网短语相似库;phrase_dict为自定义政策领域短语相似度库;similarity_list为累计的短语相似值列表;phrase((q1),(q2))为两个问题的语义相似度计算结果;
具体包括以下流程:
1)输入问题对q1、q2;
2)对q1、q2进行分词并过滤停用词的操作,得到q1_list,q2_list;
3)采用知网短语相似库sim_dict,计算常用短语相似度;
4)构建自定义短语相似库字典phrase_dict计算政策领域短语相似度:通过标注的政策领域问题对,进行分词检查,构建政策领域短语相似度,如短语:
phrase_dict={('政策解读','解读政策'):1,('信息变更','变更信息'):1,('服务电话','客服热线'):1,,('来益','送策'):0.95,('免费','收费'):0.7,...};
遍历q1_list里的短语Wi,通过sim_dict和phrase_dict累计Wi和q2_list的相似值得到similarity_list,对相似的列表进行取平均值得到Phrase(q1,q2)结果。
实施例二:
如图2和图3所示,基于实施例一所述的智能客服系统在问答数据时,包括以下具体步骤:
S1、构建问答知识库;
S2、在知识库上读取问答语料,利用训练好的检索模型编码模块对问答语料进行特征编码;
S3、对相似问题聚类,建立相似问题id库;
S4、对用户输入的问题进行意图识别,意图识别到明确的用户意图,直接返回语料库里设置的各意图答案;
S5、对用户输入问题,意图模型未识别到明确用户意图,则计算用户输入问题编码后的向量与语料库向量里的所有向量的中心距离,中心距离从大到小进行排序,取排序后的语料库数据的前500个问题作为检索候选问题,将候选的语料库问题,输入到检索模型中,计算每个候选问题和用户输入的问题相似度,设置问题阈值相似度,经多次验证,将阈值低于0.75的候选问题过滤掉,未过滤的候选问题将做为相似问题,存储到相似问题id库中;
S6、对于用户输入的问题,与候选问题相似度的最大值有高于0.9的,将选取相似值最高的值作为直接回复该候选问题对应的语料答案,对介于0.75和0.9之前的,返回一个问题列表,长度限制为5,作为询问引导用户查看,如果候选不存在,则触发兜底话术回复用户;
S7、进行知识库的再完善,将低于阈值的用户问题,人工检查相似问题库,看是否有符合答案的,有则把对应id,关联答案,如果没有,则人工新增该问题答案,加入知识库。
实施例三:
基于实施例一和二所述的基于线上产品智能送策的智能客服系统,输入输出过程样例如下:
1、用户输入问题:怎么查找政策呢?
2、语料库问题及语料库构建的字典:
语料库问题答案字典:{q1:a1,q2:a2,q3:a3,q4,a4,...}
意图问题字典:{‘政策查询’:A1,’政策匹配’:A2,’忘记密码’:A3,...}
q1=’如何查找政策’
q2=’政策匹配的记录怎么看’
q3=’密码忘记了,如何修改密码’
用户问题编码:v=SimBERT(‘怎么查找政策呢?’),其中v的shape为(784,)
语料库问题编码:
v1=SimBERT(q1)
V2=SimBERT(q2)
V3=SimBERT(q3)
3、意图识别:
用户输入问题意图:intention_v=intention(v)
从而通过意图模型计算出意图类别的概率分布为‘政策查询’的概率等于0.88,为’政策匹配’的概率等于0.09,为’忘记密码’的概率等于0.00012,为...的概率等于...,所以可以得到用户的意图是政策查找,置信度为0.88。
意图识别的概率阈值设置为0.87,我们计算出的用户意图概率是0.88,大于所设阈值,所以这里从意图字典里返回键为政策查询的值A1。
如果在我们的意图识别的概率达不到所设阈值,会触发检索模型的计算。
4、问题检索:
Similarity1=SimBERT_similarity(v,v1)
Similarity2=SimBERT_similarity(v,v2)
Similarity3=SimBERT_similarity(v,v3)
从而计算出Similarity1=0.92,similarity2=0.73,similarity3=0.48
我们设置的候选问题阈值小于0.75的会过滤掉,所以这里similarity2,similarity3的值都小于0.75,q2,q3过滤掉,剩下q1,由于q1的similarity1大于0.9,这里我们直接返回a1,注:如果没有大于0.9的情况,将返回的不是精准匹配答案,而是返回候选问题集[q1],供用户点选。
5、上述情况没有返回结果给到用户,则触发兜底话术。
兜底话术示例如下:
设置一段固定回复的模板,进行回复用户:
如:您好!很抱歉。该问题小赋没有听懂,还在努力学习中。
本发明的有益效果是:
1、该基于线上产品智能送策的智能客服系统,通过设置先进的自然语言处理技术,高效准确地检索政策信息,并向用户提供快速准确的答案,用户可以轻松地查询政策内容、了解政策变化、获取政策解读等信息,无需等待人工客服的处理,大大提高了信息获取的效率和便利性。
2、该基于线上产品智能送策的智能客服系统,还具有24/7全天候在线的特点,用户可以随时随地通过线上渠道进行咨询,无需受限于传统客服的工作时间和地点,不仅能够提高政策查询的效率和准确性,还能够为用户提供更便捷、更快速、更全面的服务体验,从而推动政策查询服务向智能化、高效化的方向发展。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于线上产品智能送策的智能客服系统,其特征在于,包括问答知识库构建以及多模型构建;
问答知识库构建,根据用户会问到的问题种类、相似问题、问句模板在内的多维度数据,对用户的问答语料进行搜集,形成基于智能送策的问答知识库;
多模型构建,通过搭建多个模型,用于对问题相似度的测算,从而对用户问题进行直接回答或相似问题推荐,实现智能回复;
该智能客服系统构建的模型包括意图识别模型、语义相似度模型以及检索模型;
所述意图识别模型,用于实时预测用户的问题意图,对不同问题意图进行针对性回复;
所述检索模型,用于计算用户问题与问答知识库问题的相似度,给用户检索相似的问题,匹配用户输入的问题的答案;
所述语义相似度模型,为检索模型提供约束作用,防止检索模型出现毫不相关的问题被检索到。
2.根据权利要求1所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述基于智能送策的问答知识库包括但不限于政策查询分类、政策的有效时间、政策的开始日期及结束日期、问题分类、问题其余问法以及答案。
3.根据权利要求1所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述意图识别模型中的训练数据来源通过人工构建政策领域用户问题q及对应的用户意图i;
通过大规模bert预训练语言模型做问题编码向量,通过bert编码后的向量加入Dense层,通过上述构建的意图模型结构,将意图识别训练数据加载到意图识别模型中进行训练微调预测用户意图,具体构建内容如下所示:
使用BERT预训练语言模型进行问题编码,以得到:
编码向量(X=\text{BERT}(q))
然后,通过加入Dense层进行意图识别,即:
(\text{Intention}(X)=WX+b)
其中,(q)为用户提出的问题;(i)为用户的意图;(X)为通过BERT模型编码后的问题向量;(W)为Dense层的权重;(b)为Dense层的偏置项;(\text{BERT}(q))为BERT预训练模型用于将问题(q)转换为高维空间中的向量;(\text{Intention}(X))为通过Dense层处理后的意图识别结果。
4.根据权利要求1所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,包括对问题进行分词,过滤停用词,使用知网短语相似库(sim_dict)以及自定义短语相似库(phrase_dict)来计算短语相似度,最后通过平均相似值得到最终的语义相似度。
5.根据权利要求4所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述语义相似度模型在计算两个问题(q1)和(q2)之间的语义相似度时,(q1),(q2)为需要计算相似度的问题对;(q1_list),(q2_list)为分词并过滤停用词后的问题列表;sim_dict为知网短语相似库;phrase_dict为自定义政策领域短语相似度库;similarity_list为累计的短语相似值列表;phrase((q1),(q2))为两个问题的语义相似度计算结果;
具体包括以下流程:
1)输入问题对q1、q2;
2)对q1、q2进行分词并过滤停用词的操作,得到q1_list,q2_list;
3)采用知网短语相似库sim_dict,计算常用短语相似度;
4)构建自定义短语相似库字典phrase_dict计算政策领域短语相似度:通过标注的政策领域问题对,进行分词检查,构建政策领域短语相似度,如短语:
phrase_dict={('政策解读','解读政策'):1,('信息变更','变更信息'):1,('服务电话','客服热线'):1,,('来益','送策'):0.95,('免费','收费'):0.7,...};
遍历q1_list里的短语Wi,通过sim_dict和phrase_dict累计Wi和q2_list的相似值得到similarity_list,对相似的列表进行取平均值得到Phrase(q1,q2)结果。
6.根据权利要求1所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述检索模型采用SimBERT检索相似预训练模型进行编码,加入人工构建的政策领域问题对q1、q2,设置更小的学习率进行对SimBERT微调,然后SimBERT模型微调后的模型进行问题编码q1_vectors=SimBERT(q1)、q2_vectors=SimBERT(q2),计算2个问题对q1、q2的余弦相似度,similarity1=cos(q1_vectors,q2_vectors),获得问题对句子的相似结果,然后再通过构建短语相似度算法,计算q1,q2的短语相似度similarity2=phrase(q1,q2),将similarity1及similarity2的联合概率作为检索相似度的输出similarity=similarity1*similarity2,即:
similarity=SimBERT_similarity(q1,q2)
加入短语相似度用于给SimBERT检索结果加入约束,从而保证在模型检索时出现检索相似度很高。
7.根据权利要求6所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述余弦相似度公式如下所示:
(\cos(x,y)=\frac{x\cdoty}{||x||\cdot||y||})
用于计算两个向量之间的余弦相似度,其中(x)和(y)是向量,(x\cdot y)是向量的点积,(||x||)和(||y||)分别是向量的模长;(x\cdoty)为向量(x)和(y)的点积,计算为(x_1y_1+x_2y_2+\ldots+x_ny_n);(||x||)为向量(x)的模长,计算为(\sqrt{x_1^2+x_2^2+\ldots+x_n^2});(\cos(x,y))为向量(x)和(y)之间的余弦相似度,取值范围在([-1,1])之间,值越接近1表示两个向量越相似。
8.根据权利要求1所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述智能客服系统在问答数据时,包括以下具体步骤:
S1、构建问答知识库;
S2、在知识库上读取问答语料,利用训练好的检索模型编码模块对问答语料进行特征编码;
S3、对相似问题聚类,建立相似问题id库;
S4、对用户输入的问题进行意图识别,意图识别到明确的用户意图,直接返回语料库里设置的各意图答案;
S5、对用户输入问题,意图模型未识别到明确用户意图,则计算用户输入问题编码后的向量与语料库向量里的所有向量的中心距离,中心距离从大到小进行排序,取排序后的语料库数据的前500个问题作为检索候选问题,将候选的语料库问题,输入到检索模型中,计算每个候选问题和用户输入的问题相似度,设置问题阈值相似度;
S6、对于用户输入的问题,与候选问题相似度的最大值有高于0.9的,将选取相似值最高的值作为直接回复该候选问题对应的语料答案,对介于0.75和0.9之前的,返回一个问题列表,长度限制为5,作为询问引导用户查看,如果候选不存在,则触发兜底话术回复用户;
S7、进行知识库的再完善。
9.根据权利要求8所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述步骤S5中,设置问题阈值相似度后,经多次验证,将阈值低于0.75的候选问题过滤掉,未过滤的候选问题将做为相似问题,存储到相似问题id库中。
10.根据权利要求8所述的一种基于线上产品智能送策的智能客服系统,其特征在于,所述步骤S7中,将低于阈值的用户问题,人工检查相似问题库,看是否有符合答案的,有则把对应id,关联答案,如果没有,则人工新增该问题答案,加入知识库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410239393.5A CN118134499A (zh) | 2024-03-04 | 2024-03-04 | 一种基于线上产品智能送策的智能客服系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410239393.5A CN118134499A (zh) | 2024-03-04 | 2024-03-04 | 一种基于线上产品智能送策的智能客服系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118134499A true CN118134499A (zh) | 2024-06-04 |
Family
ID=91231079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410239393.5A Pending CN118134499A (zh) | 2024-03-04 | 2024-03-04 | 一种基于线上产品智能送策的智能客服系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118134499A (zh) |
-
2024
- 2024-03-04 CN CN202410239393.5A patent/CN118134499A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804521B (zh) | 一种基于知识图谱的问答方法及农业百科问答系统 | |
CN115238101B (zh) | 一种面向多类型知识库的多引擎智能问答系统 | |
CN110765277B (zh) | 一种基于知识图谱的移动端的在线设备故障诊断方法 | |
CN109635083B (zh) | 一种用于搜索ted演讲中话题式查询的文档检索方法 | |
CN109829104A (zh) | 基于语义相似度的伪相关反馈模型信息检索方法及系统 | |
CN107122413A (zh) | 一种基于图模型的关键词提取方法及装置 | |
CN108304372A (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
CN110674252A (zh) | 一种面向司法领域的高精度语义搜索系统 | |
CN112270188B (zh) | 一种提问式的分析路径推荐方法、系统及存储介质 | |
CN112463944B (zh) | 一种基于多模型融合的检索式智能问答方法及装置 | |
CN116628173B (zh) | 一种基于关键字提取的智能客服信息生成系统及生成方法 | |
CN116127095A (zh) | 一种序列模型与知识图谱结合的问答方法 | |
CN117171333A (zh) | 一种电力文件问答式智能检索方法及系统 | |
CN112507109A (zh) | 一种基于语义分析与关键词识别的检索方法和装置 | |
CN112632250A (zh) | 一种多文档场景下问答方法及系统 | |
CN115599899A (zh) | 基于飞行器知识图谱的智能问答方法、系统、设备及介质 | |
CN110851584A (zh) | 一种法律条文精准推荐系统和方法 | |
CN112487274A (zh) | 一种基于文本点击率的搜索结果推荐方法及系统 | |
CN111666374A (zh) | 一种在深度语言模型中融入额外知识信息的方法 | |
CN117539996A (zh) | 一种基于用户画像的咨询问答方法及系统 | |
CN118035440A (zh) | 一种企业关联档案管理目标知识特征推荐方法 | |
CN114493783A (zh) | 一种基于双重检索机制的商品匹配方法 | |
CN112131246B (zh) | 基于自然语言语义解析的数据中心智能查询统计方法 | |
CN117290482A (zh) | 一种知识库检索方法和装置 | |
CN115964466A (zh) | 基于四层特征向量匹配模型的智能问答方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |