CN112163066A - 人工智能模型训练方法、知识点推送方法、装置和介质 - Google Patents
人工智能模型训练方法、知识点推送方法、装置和介质 Download PDFInfo
- Publication number
- CN112163066A CN112163066A CN202010933268.6A CN202010933268A CN112163066A CN 112163066 A CN112163066 A CN 112163066A CN 202010933268 A CN202010933268 A CN 202010933268A CN 112163066 A CN112163066 A CN 112163066A
- Authority
- CN
- China
- Prior art keywords
- customer service
- artificial intelligence
- intelligence model
- knowledge
- characteristic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 title claims abstract description 38
- 238000012216 screening Methods 0.000 claims description 17
- 230000006854 communication Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 11
- 206010000234 Abortion spontaneous Diseases 0.000 claims description 4
- 238000000137 annealing Methods 0.000 claims description 4
- 238000001816 cooling Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 4
- 208000015994 miscarriage Diseases 0.000 claims description 4
- 208000000995 spontaneous abortion Diseases 0.000 claims description 4
- 230000008569 process Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 238000013316 zoning Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种人工智能模型训练方法、知识点推送方法、装置和介质,人工智能模型训练方法包括获取点击日志,获取客服知识点的访问权重,爬取知识点本体,确定知识点本体的需求权重,获取内容特征信息和客户特征信息,训练人工智能模型等步骤。通过执行人工智能模型训练方法,可以训练得到合适的人工智能,作为执行知识点推送方法的基础,训练所得的人工智能模型能够根据客服对话中的内容特征信息和客户特征信息等信息输出客服知识点,能够有效应对客服领域用户提出的咨询存在大量实体名称相同的知识点这一特征,降低一次性产生大量的可推送知识点的可能性,提高客服知识点查询的正确率和命中率。本发明广泛应用于知识推送技术领域。
Description
技术领域
本发明涉及知识推送技术领域,尤其是一种人工智能模型训练方法、知识点推送方法、装置和介质。
背景技术
电信、电商、票务和网游等领域,通常设置客服来为用户提供服务。无论是人工客服还是机器客服,通常都通过语音电话或者文字聊天等方式与用户进行沟通。在提供客服服务的过程中,用户可能提出涉及知识点的咨询,如果由机器客服提供服务,计算机系统可以查询出用户咨询到的知识点然后推送给用户,如果由人工客服提供服务,客服人员也可以借助计算机系统查询出用户咨询到的知识点然后推送给用户,即客服服务过程中通常会涉及如何准确推送知识点的问题。现有技术通过三元组进行知识点推送,其原理在于,只要知识点符合三元组中的两个实体名称,就推送该知识点。但在电信等领域,用户提出的咨询通常存在大量实体名称相同的知识点,因此现有技术容易一次性产生大量的可推送知识点,命中率较低,难以高效率地向用户提供准确的知识点。
发明内容
针对上述至少一个技术问题,本发明的目的在于提供一种人工智能模型训练方法、知识点推送方法、装置和介质。
一方面,本发明实施例包括一种人工智能模型训练方法,包括:
获取客服对话中对知识库访问而产生的点击日志;所述知识库用于存储客服知识点;
获取所述客服知识点在所述知识库中的访问权重;
对所述知识库中通过爬虫抓取出所述客服知识点;被抓取出的所述客服知识点作为知识点本体存储于本体库;
根据所述访问权重,确定所述知识点本体的需求权重;
获取所述客服对话的内容特征信息和客户特征信息;
以所述内容特征信息、客户特征信息和需求权重为所述人工智能模型的输入,以所述点击日志为所述人工智能模型的期望输出,训练所述人工智能模型。
进一步地,所述获取客服对话中对知识库访问而产生的点击日志,包括:
当所述知识库的展示页面被点击,将所述点击对应的对话文本、客服人员工号和客户身份信息记录为所述点击日志;
或
当通过发送短信进行所述客服对话,通过预设的关联关系表查询所述短信对应的点击日志。
进一步地,所述访问权重与所述客服知识点的点击频次正相关。
进一步地,所述对所述知识库中通过爬虫抓取出所述客服知识点,包括:
使用TF/IDF算法从所述客服对话中提取出普通关键词和特有关键词;所述普通关键词为对应TF/IDF权重小于第一阈值的关键词,所述特有关键词为对应TF/IDF权重大于或等于第一阈值的关键词;
对所述特有关键词进行内部匹配;
对所述普通关键词和所述特有关键词进行外部匹配;
获取所述内部匹配和所述外部匹配所形成的规则对。
进一步地,所述对所述知识库中通过爬虫抓取出所述客服知识点,还包括:
根据筛选条件对所述规则对进行筛选,经过所述筛选后保留的所述规则对作为所述内容特征信息;所述筛选条件包括覆盖率高于第二阈值且误推率低于第三阈值。
进一步地,所述根据所述访问权重,确定所述知识点本体的需求权重,包括:
根据记忆遗忘曲线,使用退火算法、半衰期算法或牛顿冷却算法对所述访问权重进行反向衰减,获得所述需求权重。
进一步地,所述内容特征信息包括通话呼叫状态、通话文本、沟通意图分类、坐席语速、坐席声音困惑情绪、坐席声音困惑情绪与触发本体的文本距离、困惑词与触发本体的文本距离、坐席在检索框中输入的关键词、坐席语言困惑词及困惑程度;
所述客户特征信息包括现有订购的套餐信息、客户标签、语音使用状态、话费使用状态、欠费状态、流量使用状态、近期客户套餐退订状态、近期客户套餐更换状态和近期客户套餐新办状态。
另一方面,本发明实施例还包括一种客服对话中的知识点推送方法,包括:
获取所述客服对话的内容特征信息和客户特征信息;
将所述内容特征信息、客户特征信息输入到人工智能模型;所述人工智能模型经过实施例中所述的人工智能模型训练方法训练;
从所述人工智能模型的输出结果中获取客服知识点;
推送所述客服知识点。
另一方面,本发明实施例还包括一种计算机装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行实施例所述方法。
另一方面,本发明实施例还包括一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行实施例所述方法。
本发明的有益效果是:通过执行人工智能模型训练方法,可以训练得到合适的人工智能,作为执行知识点推送方法的基础,训练所得的人工智能模型能够根据客服对话中的内容特征信息和客户特征信息等信息输出客服知识点,能够有效应对客服领域用户提出的咨询存在大量实体名称相同的知识点这一特征,降低一次性产生大量的可推送知识点的可能性,提高客服知识点查询的正确率和命中率。
附图说明
图1为实施例中人工智能模型训练方法的流程图;
图2为实施例中客服对话中的知识点推送方法的流程图。
具体实施方式
本实施例中,使用经过训练的人工智能模型来推送知识点。所使用的人工智能模型可以是卷积神经网络等。
本实施例中,执行知识点推送方法前,执行人工智能模型训练方法,以训练得到所要使用的人工智能模型。
本实施例中,以电信行业的客服为例来对人工智能模型训练方法和知识点推送方法进行说明。客服可以是人工客服,也可以是机器客服,可以通过电话方式向用户提供客服服务,也可以通过对话框文字聊天的方式提供客服服务。本实施例中,有时称人工客服为坐席。
本实施例中,参照图1,人工智能模型训练方法包括以下步骤:
P1.获取客服对话中对知识库访问而产生的点击日志;所述知识库用于存储客服知识点;
P2.获取所述客服知识点在所述知识库中的访问权重;
P3.对所述知识库中通过爬虫抓取出所述客服知识点;被抓取出的所述客服知识点作为知识点本体存储于本体库;
P4.根据所述访问权重,确定所述知识点本体的需求权重;
P5.获取所述客服对话的内容特征信息和客户特征信息;
P6.以所述内容特征信息、客户特征信息和需求权重为所述人工智能模型的输入,以所述点击日志为所述人工智能模型的期望输出,训练所述人工智能模型。
本实施例中,步骤P1,即获取客服对话中对知识库访问而产生的点击日志这一步骤,包括以下步骤P101-P103:
P101:建设知识库,具体包括:在服务器中,储存电信相关知识点的文本;
P102:在坐席服务的通话过程中,通过网页的形式呈现知识库页面,当坐席点击某个电信知识点时,记录本次点击涉及的通话文本,坐席工号,客户相关信息等信息,得到点击日志,其中,通过科大讯飞开放的语音识别接口api,可以将通话录音转化为通话文本、坐席工号和客户信息等,都记录在电信客户信息数据库中,可以由电话号码检索到,点击日志可以通过mongodb在后台进行储存,后台及前台页面的技术沟通方法可以通过ajax进行沟通,例如:坐席在通话过程中,与客户的沟通内容提到:“请问现在有哪些套餐比较流行,我听说最近5g的套餐很火,请问有什么5g相关的套餐推荐吗?”,这个时候坐席因为对5g并不熟悉,因此搜索了知识库中的5g相关知识点,并且在页面中打开“5G畅享融合套餐”这个知识点,知识库页面通过ajax技术与后台服务器的mongodb进行连接,将本次点击日志涉及的通话文本,坐席工号,客户相关信息等,送入mongodb数据库中进行储存,得到点击日志。
P103:也可以通过客服在通过过程中的短信拍送行为记录点击日志,原理是,在通话过程中,坐席经常会为客户派发短信,为客户提供相关服务,而这些短信其实与很多知识点有关联,通过预设短信与知识点的关联关系表,当坐席向客户手机派发短信时,记录该短信代表的知识点与通话文本关联,也可以记录到日志中。步骤P103与步骤P102是异曲同工的原理。
本实施例中,知识库用于存储客服知识点包括其他常用工具、投诉处理指引、系统操作指引、营销指引、终端操作指引、标准应答、服务承诺、其他服务规范、全业务处理规范、事故预处理流程、特殊客户处理规范、坐席操作规范、故障预处理、宽带二次预处理、设备知识、业务规范、渠道服务、最新热点、天翼、我的e家、10000知道、爱问、IM客服、电粉联盟、短信营业厅、欢go网站、其他渠道、社会渠道、手机QQ网上营业厅、天翼流量800、微信/微信公众号、营业厅、掌上营业厅、中国电信视频直播客服、5G视频类、操作指引类、产品介绍类、自助排障类、案例分享、常用查询、处理指引、分公司知识点、服务规范、服务技巧、IM客服专用、案例库、规章制度、其他学习栏目、公话卡类业务、固定电话、号码百事通、互联网业务、互联星空、客户密码、其他业务、全业务统一规范、特服号码、天翼客户俱乐部、卫星业务、信息安全、移动业务、增值业务、长途业务、帐务计费、知识共享、专区、行业应用、商务领航、云和IDC、资源出租、315专区、季度营销方案、优惠促销和最新问题解释口径等。
本实施例中,可以将步骤P2中的访问权重设定为与客服知识点的点击频次正相关的数值,可选地,可以将步骤P2中的访问权重设定为客服知识点的点击频次。例如,工号为50000的坐席,这个月点击某个知识点点击了100次,那么他的权重系数即为100,权重越高,意味着坐席已经对这个知识点认识越深。
本实施例中,步骤P3,即对所述知识库中通过爬虫抓取出所述客服知识点这一步骤,包括:
P301.使用TF/IDF算法从所述客服对话中提取出普通关键词和特有关键词;所述普通关键词为对应TF/IDF权重小于第一阈值的关键词,所述特有关键词为对应TF/IDF权重大于或等于第一阈值的关键词;
P302.对所述特有关键词进行内部匹配;
P303.对所述普通关键词和所述特有关键词进行外部匹配;
P304.获取所述内部匹配和所述外部匹配所形成的规则对。
步骤P301中,通过TF/IDF判断,TF/IDF权重高为特有关键词,特有关键词低为普通关键词。针对某知识点的特有关键词和针对所有知识点的普通关键词,得到抽取结果,例如“129元”、“畅享”和“5g”等关键词为5G畅享融合套餐这个知识点的特有关键词,而“流量”是所有知识点的普通关键词。
步骤P302和P303中,内部匹配是指特有关键词与特有关键词的匹配,外部匹配是指特有关键词与普通关键词的匹配。本实施例中,“129元”和“畅享”这两个关键词是特有关键词,“流量”这个关键词是普通关键词,因此“129元”和“畅享”的匹配是内部匹配,“129元”和“流量”的匹配是外部匹配。每次内部匹配或外部匹配都可以形成一个规则对,本实施例中的规则对也可被称为知识点本体,这些知识点本体被存储在本体库中。
本实施例中,步骤P3,即对所述知识库中通过爬虫抓取出所述客服知识点这一步骤,还包括:
P305.根据筛选条件对所述规则对进行筛选,经过所述筛选后保留的所述规则对作为所述内容特征信息;所述筛选条件包括覆盖率高于第二阈值且误推率低于第三阈值。
步骤P305中,对根据覆盖率设置第二阈值,对误推率设置第三阈值。其中,覆盖率的含义是:选定规则对,点击中包含某知识点的测试文本中,推送数量占测试文本的比重;误推率的含义是:选定规则对,点击中不包含某知识点的测试文本中,推送数量占测试文本的比重。筛选条件为“覆盖率高于第二阈值且误推率低于第三阈值”的意义是:如果一个规则对的覆盖率高于第二阈值且误推率低于第三阈值,则该规则对会在筛选过程后被保留下来,反之,该规则对在筛选过程后会被筛除掉。
通过执行步骤P305,可以对规则对进行初步筛选。由于规则对的筛选阈值,能提供的覆盖率提高越高越好,会造成的误推率越低越好,对造成的覆盖率及误推率各提供一个阈值,高于覆盖率阈值低于误推率阈值,即可取。经过对规则对的初步筛选,可以在不影响推送效果的基础上,减少需要处理的数据量。
本实施例中,步骤P4,即根据所述访问权重,确定所述知识点本体的需求权重这一步骤,包括:
P401.根据记忆遗忘曲线,使用退火算法、半衰期算法或牛顿冷却算法对所述访问权重进行反向衰减,获得所述需求权重。
本实施例中,执行步骤P401的原理是:根据艾宾浩斯记忆遗忘曲线,坐席对点击次数越多的客服知识点越熟悉,因此点击次数越大的客服知识点越不需要推送给坐席。根据记忆遗忘曲线,使用退火算法、半衰期算法或牛顿冷却算法对访问权重进行反向衰减后,所获得的需求权重符合艾宾浩斯记忆遗忘曲线所描述的特征,即点击次数越大的客服知识点被推送给坐席的概率越低,点击次数越小的客服知识点被推送给坐席的概率越高。
本实施例中,从客服对话中获取的内容特征信息包括通话呼叫状态、通话文本、沟通意图分类、坐席语速、坐席声音困惑情绪、坐席声音困惑情绪与触发本体的文本距离、困惑词与触发本体的文本距离、坐席在检索框中输入的关键词、坐席语言困惑词及困惑程度。
在通话过程中,坐席与客户的通话:“客户:你刚刚说我现在的套餐是5g畅享套餐,那我这种套餐一个月有多少流量阿?坐席:嗯?请稍等一下,您这个套餐呢……嗯?好像是50g一个月呢?稍等我确认一下。”,根据步骤P3得到的5g---套餐---5g畅享套餐这个本体,直接推送知识点“5g畅享套餐”到达坐席客户端页面进行展示,所述坐席客户端页面如图前台页面所示,坐席在通话过程中可以通过点击推送的知识点跳转到知识库页面,查阅知识点的相关内容。同时,获取内容特征信息,例如:
通话是呼入还是呼出状态:判断本通通话是客户主动打入还是,坐席自己打给客户的,更具主动性。
本实施例中,沟通意图包括:
在客服和用户对话系统的应用过程中,用户可能会有多种意图,相应地会触发客服和客户对话系统中的多个业务类型,业务类型包括查询类、办理类和咨询类三种,每个业务类型下涉及的用户意图有多种,例如查询类下有查询账单、查询积分等,办理类下有充值手机话费、重置密码等;咨询类下有咨询宽带故障、咨询宽带续费等。因而,客服领域对话系统的一个关键任务就是正确地将用户的输入分类到相应业务类型下的具体意图(即识别出用户输入到对话系统执行某个动作之间的一个映射关系)中,从而达到识别和理解用户要表达的意图,帮助提高语言、语音导航系统的语义识别能力。
本实施例中,从客服对话中获取的客户特征信息包括现有订购的套餐信息、客户标签、语音使用状态、话费使用状态、欠费状态、流量使用状态、近期客户套餐退订状态、近期客户套餐更换状态和近期客户套餐新办状态。
本实施例中,通过执行步骤P1-P5获得内容特征信息、客户特征信息、需求权重和点击日志等数据,用于对人工智能模型进行训练。在训练过程中,对人工智能模型设定训练次数和损失函数收敛阈值等训练参数,以内容特征信息、客户特征信息和需求权重作为人工智能模型的输入数据,以点击日志作为人工智能模型的期望输出数据,执行多轮训练,使得人工智能模型的参数收敛,从而完成对人工智能模型的训练。
本实施例中,将经过训练的人工智能模型安装在每个人工客服所使用的个人电脑上,或者将经过训练的人工智能模型安装在服务器上,每个人工客服所使用的个人电脑均可以访问服务器以向人工智能模型输入数据以及接收人工智能模型输出的数据。也可以将经过训练的人工智能模型安装在运行机器客服程序的计算机系统上,机器客服程序与人工智能模型之间设有数据接口,使得机器客服程序与人工智能模型之间可以交换数据。
在完成人工智能模型的训练和安装后,可以执行客服对话中的知识点推送方法。参照图2,客服对话中的知识点推送方法包括以下步骤:
S1.获取客服对话的内容特征信息和客户特征信息;
S2.将内容特征信息、客户特征信息输入到人工智能模型;
S3.从人工智能模型的输出结果中获取客服知识点;
S4.推送客服知识点。
本实施例中,执行步骤S1时,有以下几种情况:当人工客服或者机器客服通过文字聊天的方式与用户进行客服对话,人工客服或者机器客服所使用的计算机系统可以直接从文字聊天所产生的文字信息中获取内容特征信息和客户特征信息。当人工客服或者机器客服通过语音电话的方式与用户进行客服对话,人工客服或者机器客服所使用的计算机系统可以先将语音内容转换成文字内容,然后从语音文字转换所产生文字信息中获取内容特征信息和客户特征信息。
本实施例中,执行步骤S2时,如果是人工客服,可由坐席手动将内容特征信息和客户特征信息输入至人工智能模型,如果是机器客服,可由计算机程序通过数据接口将内容特征信息和客户特征信息输入至人工智能模型。
本实施例中,执行步骤S4时,如果是人工客服,可以将人工智能模型所输出的客服知识点显示在坐席所使用的计算机,由坐席阅读之后为用户作出解答,如果是机器客服,可由计算机程序将人工智能所输出的客服知识点经过语义转换后或者直接输出至终端,通过语音或者文字的形式向用户显示,为用户作出解答。
本实施例中,通过执行人工智能模型训练方法,可以训练得到合适的人工智能,作为执行知识点推送方法的基础,训练所得的人工智能模型能够根据客服对话中的内容特征信息和客户特征信息等信息输出客服知识点,能够有效应对客服领域用户提出的咨询存在大量实体名称相同的知识点这一特征,降低一次性产生大量的可推送知识点的可能性,提高客服知识点查询的正确率和命中率。
本实施例中,一种计算机装置,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行实施例中的人工智能模型训练方法或客服对话中的知识点推送方法,实现与实施例所述的相同的技术效果。
本实施例中,一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行实施例中的人工智能模型训练方法或客服对话中的知识点推送方法,实现与实施例所述的相同的技术效果。
需要说明的是,如无特殊说明,当某一特征被称为“固定”、“连接”在另一个特征,它可以直接固定、连接在另一个特征上,也可以间接地固定、连接在另一个特征上。此外,本公开中所使用的上、下、左、右等描述仅仅是相对于附图中本公开各组成部分的相互位置关系来说的。在本公开中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。此外,除非另有定义,本实施例所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。本实施例说明书中所使用的术语只是为了描述具体的实施例,而不是为了限制本发明。本实施例所使用的术语“和/或”包括一个或多个相关的所列项目的任意的组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本公开范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。本实施例所提供的任何以及所有实例或示例性语言(“例如”、“如”等)的使用仅意图更好地说明本发明的实施例,并且除非另外要求,否则不会对本发明的范围施加限制。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本实施例描述的过程的操作,除非本实施例另外指示或以其他方式明显地与上下文矛盾。本实施例描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本实施例所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。
计算机程序能够应用于输入数据以执行本实施例所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
Claims (10)
1.一种人工智能模型训练方法,其特征在于,包括:
获取客服对话中对知识库访问而产生的点击日志;所述知识库用于存储客服知识点;
获取所述客服知识点在所述知识库中的访问权重;
对所述知识库中通过爬虫抓取出所述客服知识点;被抓取出的所述客服知识点作为知识点本体存储于本体库;
根据所述访问权重,确定所述知识点本体的需求权重;
获取所述客服对话的内容特征信息和客户特征信息;
以所述内容特征信息、客户特征信息和需求权重为所述人工智能模型的输入,以所述点击日志为所述人工智能模型的期望输出,训练所述人工智能模型。
2.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述获取客服对话中对知识库访问而产生的点击日志,包括:
当所述知识库的展示页面被点击,将所述点击对应的对话文本、客服人员工号和客户身份信息记录为所述点击日志;
或
当通过发送短信进行所述客服对话,通过预设的关联关系表查询所述短信对应的点击日志。
3.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述访问权重与所述客服知识点的点击频次正相关。
4.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述对所述知识库中通过爬虫抓取出所述客服知识点,包括:
使用TF/IDF算法从所述客服对话中提取出普通关键词和特有关键词;所述普通关键词为对应TF/IDF权重小于第一阈值的关键词,所述特有关键词为对应TF/IDF权重大于或等于第一阈值的关键词;
对所述特有关键词进行内部匹配;
对所述普通关键词和所述特有关键词进行外部匹配;
获取所述内部匹配和所述外部匹配所形成的规则对。
5.根据权利要求4所述的人工智能模型训练方法,其特征在于,所述对所述知识库中通过爬虫抓取出所述客服知识点,还包括:
根据筛选条件对所述规则对进行筛选,经过所述筛选后保留的所述规则对作为所述内容特征信息;所述筛选条件包括覆盖率高于第二阈值且误推率低于第三阈值。
6.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述根据所述访问权重,确定所述知识点本体的需求权重,包括:
根据记忆遗忘曲线,使用退火算法、半衰期算法或牛顿冷却算法对所述访问权重进行反向衰减,获得所述需求权重。
7.根据权利要求1所述的人工智能模型训练方法,其特征在于:
所述内容特征信息包括通话呼叫状态、通话文本、沟通意图分类、坐席语速、坐席声音困惑情绪、坐席声音困惑情绪与触发本体的文本距离、困惑词与触发本体的文本距离、坐席在检索框中输入的关键词、坐席语言困惑词及困惑程度;
所述客户特征信息包括现有订购的套餐信息、客户标签、语音使用状态、话费使用状态、欠费状态、流量使用状态、近期客户套餐退订状态、近期客户套餐更换状态和近期客户套餐新办状态。
8.一种客服对话中的知识点推送方法,其特征在于,包括:
获取所述客服对话的内容特征信息和客户特征信息;
将所述内容特征信息、客户特征信息输入到人工智能模型;所述人工智能模型经过如权利要求1-7任一项所述方法训练;
从所述人工智能模型的输出结果中获取客服知识点;
推送所述客服知识点。
9.一种计算机装置,其特征在于,包括存储器和处理器,所述存储器用于存储至少一个程序,所述处理器用于加载所述至少一个程序以执行权利要求1-8任一项所述方法。
10.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-8任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010933268.6A CN112163066B (zh) | 2020-09-08 | 2020-09-08 | 人工智能模型训练方法、知识点推送方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010933268.6A CN112163066B (zh) | 2020-09-08 | 2020-09-08 | 人工智能模型训练方法、知识点推送方法、装置和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163066A true CN112163066A (zh) | 2021-01-01 |
CN112163066B CN112163066B (zh) | 2023-12-05 |
Family
ID=73858333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010933268.6A Active CN112163066B (zh) | 2020-09-08 | 2020-09-08 | 人工智能模型训练方法、知识点推送方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163066B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115171453A (zh) * | 2022-06-13 | 2022-10-11 | 广东电网有限责任公司 | 一种基于智能电网的人工客服训练方法及客服系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299235A (zh) * | 2018-09-19 | 2019-02-01 | 平安科技(深圳)有限公司 | 知识库搜索方法、装置及计算机可读存储介质 |
CN109446410A (zh) * | 2018-09-19 | 2019-03-08 | 平安科技(深圳)有限公司 | 知识点推送方法、装置及计算机可读存储介质 |
KR20190117840A (ko) * | 2018-03-27 | 2019-10-17 | 주식회사 머니브레인 | 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체 |
CN111241357A (zh) * | 2020-01-14 | 2020-06-05 | 中国平安人寿保险股份有限公司 | 对话训练方法、装置、系统及存储介质 |
CN111309883A (zh) * | 2020-02-13 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的人机对话方法、模型训练方法及装置 |
-
2020
- 2020-09-08 CN CN202010933268.6A patent/CN112163066B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190117840A (ko) * | 2018-03-27 | 2019-10-17 | 주식회사 머니브레인 | 대화 이해 ai 시스템에 의한 고객 상담의 제공 중에 사람 상담 직원으로 하여금 해당 고객을 위한 이후 상담을 진행하도록 전환하는 방법 및 컴퓨터 판독가능 기록 매체 |
CN109299235A (zh) * | 2018-09-19 | 2019-02-01 | 平安科技(深圳)有限公司 | 知识库搜索方法、装置及计算机可读存储介质 |
CN109446410A (zh) * | 2018-09-19 | 2019-03-08 | 平安科技(深圳)有限公司 | 知识点推送方法、装置及计算机可读存储介质 |
CN111241357A (zh) * | 2020-01-14 | 2020-06-05 | 中国平安人寿保险股份有限公司 | 对话训练方法、装置、系统及存储介质 |
CN111309883A (zh) * | 2020-02-13 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的人机对话方法、模型训练方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115171453A (zh) * | 2022-06-13 | 2022-10-11 | 广东电网有限责任公司 | 一种基于智能电网的人工客服训练方法及客服系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112163066B (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10057419B2 (en) | Intelligent call screening | |
US10142477B2 (en) | System and method for social message classification based on influence | |
KR101872863B1 (ko) | 채팅봇을 이용한 비즈니스 지원 방법 | |
CN107957992B (zh) | 一种用户反馈信息的自动处理方法及系统 | |
US10346635B2 (en) | System and method for data management and task routing based on data tagging | |
CN106790004B (zh) | 基于人工智能的客服辅助实时提示系统 | |
US9020138B1 (en) | Targeted issue routing | |
US9300482B2 (en) | Cross-channel conversations with context aware transition between channels | |
CN110347863B (zh) | 话术推荐方法和装置及存储介质 | |
CN111831799A (zh) | 信息处理方法、信息处理装置和信息处理系统 | |
US20160307172A1 (en) | Method, apparatus and system for processing information | |
US10554812B2 (en) | Identifying and controlling unwanted calls | |
CN107634947A (zh) | 限制恶意登录或注册的方法和装置 | |
CN106776973A (zh) | 黑名单数据生成方法和装置 | |
US20220366427A1 (en) | Systems and methods relating to artificial intelligence long-tail growth through gig customer service leverage | |
CN106685799A (zh) | 基于CoreSeek的多平台微信服务的通知发送方法 | |
US11763318B2 (en) | Systems and methods relating to providing chat services to customers | |
CN114005440A (zh) | 基于语音交互的问答方法、系统、电子设备及存储介质 | |
CN112163066B (zh) | 人工智能模型训练方法、知识点推送方法、装置和介质 | |
CN106485520B (zh) | 跨渠道通讯控制方法及服务器 | |
CN113342961A (zh) | 客户电话投诉处理方法、系统、设备及存储介质 | |
CN107608979B (zh) | 识别用户潜在求助的知识点的方法及装置 | |
CN117636540A (zh) | 智能柜取件异常处理方法、客户端及电子设备 | |
CN106874312B (zh) | 用户界面的获取方法及装置 | |
CN106331389A (zh) | 短信收信人的确定方法、装置和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |