CN113434656A - 电商客服匹配方法及其相应的装置、设备、介质 - Google Patents
电商客服匹配方法及其相应的装置、设备、介质 Download PDFInfo
- Publication number
- CN113434656A CN113434656A CN202110822772.3A CN202110822772A CN113434656A CN 113434656 A CN113434656 A CN 113434656A CN 202110822772 A CN202110822772 A CN 202110822772A CN 113434656 A CN113434656 A CN 113434656A
- Authority
- CN
- China
- Prior art keywords
- question
- intention
- text
- similar
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Human Computer Interaction (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开一种电商客服匹配方法及其相应的装置、设备、介质,该方法包括:调用文本特征提取器提取电商平台用户的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据意图查询相似问列表筛选出与意图预关联的相似问的句向量构造为知识特征矩阵;基于提问特征矩阵与知识特征矩阵计算相似度,根据相似度定位至与该提问文本最相似的相似问;根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。本申请的客服系统运算效率高,响应迅速,开销较小,特别适合服务于基于独立站的跨境电商平台。
Description
技术领域
本申请实施例涉及电商信息技术领域,尤其涉及一种电商客服匹配方法及其相应的装置、设备、介质。
背景技术
随着自然语言处理技术的进步和工程落地经验的积累,智能客服系统近年来在各行业中,已经逐渐应用于实际业务场景、服务于实际客户,降低了人工客服的压力和成本。在电商领域,衍生出了这样一种场景:作为平台提供方,希望为商家赋能,提供智能客服完整的技术解决方案,商家无需技术背景,经过少量配置便可启用智能客服,极大减轻了售后压力。然而在实际的业务场景中,商家会遇到一个问题——其所配置的智能客服知识库的完整性和质量,会直接影响智能客服解决客户问题的能力范围和客户满意度。技术上,我们称之为知识库的冷启动问题。
一种可行的思路是,平台方提供预先配置好的官方意图,供商家订阅,进而可决定是否启用,以解决商家初始知识库为空的问题。然而在技术上,会面临一些挑战。
首先,构造商家知识库的过程繁琐低效。并非所有的官方意图都是商家所需要的,商家理应能灵活选择所需要的意图。例如,假设官方意图有1000个,而对商家有用的可能只有其中的十分之一,即100个。那么,如何让商家尽可能完整地筛选那些对其有用的官方意图,同时又不至于操作太过繁琐(比如刚才的例子中,不应该让商家去勾选100个),对业务逻辑实现和知识库结构设计都是一个挑战;
其次,应尽量避免冗余,包括操作的冗余和存储的冗余。设想这样一种很可能发生的场景:官方意图有1000个,每个意图有10个相似问。现有1万个商家启用了智能客服,并平均订阅了500个官方意图。倘若我们对每个商家,平均都复制一份500个官方意图及其对应的相似问(5000个),意味着我们将达到5000万个相似问,而且每个相似问都可能还有一个高维(如768维)的句向量。无论对于知识库管理操作,还是对于存储系统,抑或是检索操作,都是不小的压力。
另外,数据组织不应依赖强耦合关系。商家知识库内部的数据表之间的强耦合关系,也对知识库结构、操作逻辑、相似问匹配逻辑的设计带来诸多挑战。例如,当对官方意图进行增、删、改操作时,关联于该官方意图的商家,应确保其知识库得到同步,同理,当进行相似问匹配时,需要同步考虑官方意图和自定义意图之间的整合,等等。
此外,当前的提问与回复之间的匹配技术仍有待提升。如果按照传统的思路来尝试为电商平台提供一个标准接口,基于关键词提取和规则匹配的方式来实现针对提问文本进行回复,这种方式本身具有弊端,往往忽略语义层面的信息,交互性较差;如果用深度模型,按照多数专利思路,需要根据不同知识库训练不同模型,这样会带来较大的服务器费用以及维护成本也会较高。
由此可见,对于基电商平台而言,如何优化其客服系统提供技术方案,仍是有待挖掘的空间。
发明内容
本申请的目的针对现有技术中存在的至少部分不足而提供一种电商客服匹配方法及其相应的装置、计算机设备及存储介质。
为解决上述技术问题,本申请采用的一个技术方案是:
本申请提供一种电商客服匹配方法,包括如下步骤:
调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;
从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据;
基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问;
根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。
具体化的实施例中,调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵,包括如下步骤:
获取电商平台用户在商家实例调起客服系统而提交的提问文本;
基于所述提问文本构造编码向量;
调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为句向量;
构造提问特征矩阵,向其中添加所述的句向量。
具体化的实施例中,从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,包括如下步骤:
根据所述商户实例查询所述订阅列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例所订阅的特定领域相应的多个意图及每个意图相应的回复文本;
根据所述商户实例查询所述自定义意图列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例自定义的关联于该特定领域的多个意图及每个意图相应的回复文本;
将筛选出的两组数据记录合并至同一商户汇总意图列表中;
根据所述汇总意图列表中的每个意图,查询相似问列表筛选出与该些意图预关联的相似问的句向量;
将筛选出的句向量构造为知识特征矩阵。
具体化的实施例中,基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问,包括如下步骤:
求取知识特征矩阵的转置矩阵;
将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的相似问的相似度;
从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的相似问。
具体化的实施例中,根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问,包括如下步骤:
根据定位出的所述相似问在相似问列表中查找到其相对应的意图;
查询该汇总意图列表获取与查找到的意图相映射的回复文本;
向所述电商平台用户推送所述的回复文本。
扩展的实施例中,所述电商客服匹配方法还包括如下步骤:
响应官方意图发布指令,向所述官方意图列表中添加指定领域的新增意图的数据记录,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,并为所述相似问提取并关联其句向量,将该新增意图的数据记录同步至订阅列表中并建立起其与在先已订阅该领域的商户实例之间的映射关系。
扩展的实施例中,所述电商客服匹配方法还包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
获取电商平台预设的相似问列表的任一相似问作为训练样本;
在对所述训练样本构造出编码向量的基础上,调用利用BERT模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;
调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的相似问所关联的意图作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
为解决上述技术问题,本申请采用的另一技术方案是:
本申请提供一种电商客服匹配装置,其包括:提问获取模块、知识获取模块、相似匹配模块以及应答处理模块,其中,所述提问获取模块,用于调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;所述知识获取模块,用于从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据;所述相似匹配模块,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问;所述应答处理模块,用于根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。
具体化的实施例中,所述提问获取模块包括:提问解析子模块,用于获取电商平台用户在商家实例调起客服系统而提交的提问文本;提问编码编码子模块,用于基于所述提问文本构造编码向量;提问特征子模块,用于调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为句向量;提问矩阵子模块,用于构造提问特征矩阵,向其中添加所述的句向量。
具体化的实施例中,所述知识获取模块包括:订阅筛选子模块,用于根据所述商户实例查询所述订阅列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例所订阅的特定领域相应的多个意图及每个意图相应的回复文本;自定筛选子模块,用于根据所述商户实例查询所述自定义意图列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例自定义的关联于该特定领域的多个意图及每个意图相应的回复文本;意图汇总子模块,用于将筛选出的两组数据记录合并至同一商户汇总意图列表中;向量获取子模块,用于根据所述汇总意图列表中的每个意图,查询相似问列表筛选出与该些意图预关联的相似问的句向量;知识矩阵子模块,用于将筛选出的句向量构造为知识特征矩阵。
具体化的实施例中,所述相似匹配模块包括:矩阵转置子模块,用于求取知识特征矩阵的转置矩阵;矩阵相乘子模块,用于将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的相似问的相似度;元素定位子模块,用于从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的相似问。
具体化的实施例中,所述应答处理模块包括:意图反查子模块,用于根据定位出的所述相似问在相似问列表中查找到其相对应的意图;回复反查子模块,用于查询该汇总意图列表获取与查找到的意图相映射的回复文本;回复推送子模块,用于向所述电商平台用户推送所述的回复文本。
扩展的实施例中,所述电商客服匹配装置还包括意图发布模块,用于响应官方意图发布指令,向所述官方意图列表中添加指定领域的新增意图的数据记录,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,并为所述相似问提取并关联其句向量,将该新增意图的数据记录同步至订阅列表中并建立起其与在先已订阅该领域的商户实例之间的映射关系。
扩展的实施例中,所述电商客服匹配装置还包括模型训练模块,其包括:样本提取子模块,用于获取电商平台预设的相似问列表的任一相似问作为训练样本;样本提取子模块,用于在对所述训练样本构造出编码向量的基础上,调用利用BERT模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;分类监督子模块,用于调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的相似问所关联的意图作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
为解决上述技术问题,本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述电商客服匹配方法的步骤。
为解决上述技术问题本申请实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述电商客服匹配方法的步骤。
与现有技术相比,本申请具有如下优点:
本申请中,各商户实例配置形成的知识库,被分散在由电商平台集中维护的多个表格中,主要包括官方意图列表、订阅列表、相似问列表,而商户实例自定义的内容则主要体现在所述的相似问列表及其自定义意图列表,每一个商户实例通过预设其自身所指定的特定领域来获取该领域相关联的意图,而平台方则可通过所述的官方意图列表、订阅列表、相似问列表中每一张列表来集中维护平台上所有商户实例相应的数据记录。根据这一实现,一个商户实例对应的知识库的各部分数据被合理解耦,弱化不同列表之间、不同商户实例之间数据的依赖关系,避免因数据变动导致同步效率低下;而平台官方则可更为高效集中地基于少数列表来实现技术支持和服务响应,确保可灵活扩展,在部署多个服务实例的情况下,依然可保证知识库的一致性;特别是通过为意图标注领域隶属关系来细化意图的组织粒度,一方面避免用户在配置知识库过程中逐个选择意图导致繁琐低效,另一方面还可尽量避免操作冗余和存储冗余。可见,对于电商平台这种需要实时响应海量并发的用户提问需求的应用场景而言,本申请有利于全面提升电商平台客服系统在后台的运行表现,也有利于提升其在软件工程中的组织开发效率,并且,由于减少了冗余、降低了耦合,还可既降低机器成本与维护成本。
此外,本申请涉及匹配服务的实现部分,一方面构造出提问特征矩阵用于存储用户的提问文本相对应的文本特征句向量,另一方面可以利用商户实例订阅的意图的相似问的句向量来构造知识特征矩阵,两方面的向量由于采用同一文本特征提取器提取而被统一为同一维度,且在归一化根据余弦相似度公式分解,可基于提问特征矩阵与知识特征矩阵执行快速高效的矩阵乘法操作求取余弦相似度。这一过程计算量小、语义丰富、内存占用低,时间复杂度得到量级降低。最终根据相似度进一步确定出与提问文本相适配的回复文本。整个过程中,计算机运行业务逻辑标准统一,运算高效,方便编程实现,获取结果迅速,实现成本较低,便于部署在电子商务之类的互联网平台中对海量商户实例所接收到的用户提问进行精准高效的智能应答,提升电商平台的后台服务性能。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的电商客服匹配方法的基本流程示意图;
图2为本申请的电商客服匹配方法构造提问特征矩阵的流程示意图;
图3为本申请的电商客服匹配方法构造知识特征矩阵的流程示意图;
图4为本申请的电商客服匹配方法获得相似矩阵的流程示意图;
图5为本申请的电商客服匹配方法根据回复文本应答用户的流程示意图;
图6为本申请的电商客服匹配方法响应官方意图发布指令的流程示意图;
图7为本申请的电商客服匹配方法中文本特征提取器的训练流程示意图;
图8为本申请的电商客服匹配装置的基本结构示意图;
图9为本申请一个实施例的计算机设备的基本结构框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请部分技术方案可部署在云端服务器,其可以与业务上相关的服务器实现数据通信连接以协调在线服务,还可与其他相关服务器构成逻辑上相关联的服务机群,来为相关的终端设备例如智能手机、个人计算机、第三方服务器等提供服务。所述的智能手机和个人计算机均可通过公知的网络接入方式接入互联网,与本申请的服务器建立数据通信链路,以便访问和使用所述服务器所提供的服务。
对于服务器而言,一般通过提供在线服务的服务引擎开放相应的程序接口供各种终端设备进行远程调用,本申请中适于部署于服务器的相关技术方案,便可以此种方式实现于服务器中。
本申请所称的计算机程序,即应用程序,以计算机程序语言开发而成,安装于计算机设备中,包括服务器、终端设备等,用于实现本申请所限定的相关功能,除非特别指定,否则与其所采用的开发语言无关。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的技术方案多部署为电商平台的客服系统,其所适用的一个应用场景是一种基于独立站的跨境电商平台的智能化客服,不同于传统的电子商务平台,跨境电商平台为各个商家自建独立网站,在其独立网站中运行由平台方提供后台支持的商户实例,通过该商户实例的运行而实现线上店铺。访问各家商户实例的用户所属的用户账号体系,由跨境电商平台集中统一支持和维护,除此之外,跨境平台方还会为各个商户实例提供其他后台支持,包括提供本申请所实现的自动客服系统的支持。
所述的自动客服系统,能够根据各个商户实例的预先配置而构造出每个商户实例相对应的知识库,这个知识库是一个逻辑对象,知识库与商户实例一般一一对应配置,基在数据库实际实现时的结构关系是通过该客服系统统一部署来实现的。
本申请的客服系统为支持各商户实例配置其知识库,配置有如下列表:官方意图列表、自定义意图列表、相似问列表、订阅列表,这些列表中,每一个列表均可视为一个独立的存储单元,便不受表的形式的约束,其字段的设计可以遵循数据库第一、二、三范式来实施。每个列表中存储多个数据记录,每个数据记录存储实现本申请的技术方案所需的最少且必要的信息。
所述的官方意图列表,用于存储电商平台官方标准化制定的多个意图相应的数据记录,在其数据记录中,至少包含意图、意图所属的领域、该意图相对应的回复文本等信息。一般而言,一个意图只能属于一个领域,而一个领域可以包含多个意图,因此,“领域”一项在“意图”的基础之上增加了一层逻辑组织结构。据此可知,官方意图列表是一个独立的存储单元,其编辑权限一般只开放给电商平台的管理用户使用,而对所述的商户实例则仅开放只读权限,以便商户实例能够从官方意图列表中复制意图用于创建和维护订阅列表。
所述的自定义意图列表,用于存储商户实例提交的自定义的意图相应的数据记录,所有的商户实例的商家自定义的意图均被存储至自定义意图列表中,因此无需为每一商户实例创建专用的自定义意图列表,方便客服系统实现集中式的自定义意图管理。同理,所述自定义意图列表的数据记录,其字段结构可以至少包括如下各项:自定义的意图、自定义意图所属的商户实例(通常以其ID来表示,下同)、自定义意图所属的领域(默认为商户实例预先关联的特定领域)、与该意图相映射的回复文本。部分更方便商户实例管理的实施例中,还可以在所述数据记录中设置启用状态字段,以便根据商户实例的设置而启用或关闭其相应的自定义意图。可以看出,自定义意图列表汇总存储了电商平台的所有商户实例的自定义意图,无需为各商户实例自定义意图之需而创建独立的存储空间。
所述的相似问列表,用于存储每一个意图相对应的多个相似问及其相应的句向量,也即,无论对于官方意图列表中的意图,还是对于自定义意图列表中的意图,与这些意图相关的所有相似问的数据记录,均存储于所述的相似问列表中,因此,其字段主要包括:相似问、相似问的句向量,相似问所属的意图。可以理解,相似问列表由此构成一个涵盖整个电商平台各商户实例所需的集中存储单元,客服系统同理无需为每一商户实例专门创建其独立的存储单元,即使如此,仍然可以通过一个相似问查到其相对应的句向量以及其所属的意图。所述的句向量用于表示从其相应的相似句中进行文本特征提取获得的文本特征,本申请将在后文中进一步揭示,暂且按下不表。
所述的订阅列表,用于存储各个商户实例对所述官方意图列表中的领域及意图的订阅关系数据记录,因此,可以包括如下数据项:商户实例、该商户实例所预关联的领域即商户实例的特定领域、商户实例在其特定领域下从官方意图列表中选定的各个具体意图、与所选定的意图相映射的回复文本等。在部分实施例中,还可以设置启用状态相对应的数据项,以便通过该数据项来表示同一商户实例预关联的多个领域中,何一具体领域构成其当前正在采用的所述的特定领域,通常来说,同一商户实例只允许其将一个领域设置为启用,而使其在同一时刻仅适用一个所述的特定领域。订阅列表也是一独立的存储单元进行调用的,所有商户实例的订阅关系数据记录均存储于其中,而不必另行构成每一商户实例相对应的订阅列表。当商户实例适用一个领域时,后台便将该领域相对应的意图相关的数据记录从官方意图列表中复制到订阅列表中,因此,订阅列表中的意图,一般是官方意图列表中意图的副本。
通过以上对本申请的数据组织结构的揭示,可以理解,对于本申请的每一个商户实例而言,无需开辟专门的存储对象用于存储其专属的知识库,其知识库涉及的各种数据均被分布式存储于所述各个列表相对应的存储单元中,实现分布式存储。而对于电商客服系统而言,由于无需为商户实例单独设置存储对象用于为其构造知识库,则无需维护海量的存储对象,只集中维护所述的各个列表即可,故此,客服系统对各商户实例的知识库的组织和访问的高效性不言而喻。以下揭示的各个实施例中,涉及对本申请的上述数据组织结构的调用,该数据组织结构的更多优点将在这些实施例的说明中得以进一步展现。
请参阅图1所示本申请的电商客服匹配方法在其典型实施例中的基本流程示意图,本申请提供的一种电商客服匹配方法,被编程为应用程序,部署于服务器中,主要服务于电子商务平台,尤其是基于独立站的跨境电商平台,供其满足自动应答访问各商户实例的用户所提出的问题的需要,实现全平台的智能客户标准化实现机制,其包括如下步骤:
步骤S1100、调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵:
所述的提问文本,一般通过用户在商户实例中调用客服系统,调出自动客服界面,由用户在该客服界面中输入,然后发送提交给本申请电商平台的客服系统后台处理,由此即可被本申请的技术方案所获取。可以理解,用户在客服界面中输入所述的提问文本的目的,在于获取一个在语义上相适配的回复文本,以解决用户的现实疑问。所述提问文本包含着一种解决问题的意图,所述回复文本则通常是商户实例所配置的知识库中的一个回复文本,在本申请中,所述的知识库并非专属的存储对象,而是分布式存储于多存储列表中的。
获得用户提交的提问文本之后,为了便于后续操作,可以对其实施格式化预处理等操作,本领域技术人员可以采用多种公知的处理方式实现这些操作,形成格式化后结果。
对于格式化后结果,为了便于本申请所调用的文本特征提取器进行语义学习,便应该文本特征提取器的规范转换为该文本特征提取器适于处理的编码向量,以便输入给该文本特征提取器做进一步的处理。
本申请中,推荐采用经过预训练至收敛状态的BERT模型来实现所述的文本特征提取器,BERT模型基于注意力机制实现,具有深层语义理解能力,适于为本申请的提问文本提取文本特征。为其提供的编码向量通常包括三个方面的编码向量,即字向量(TokenEmbeddings)、位置向量(Position Embeddings)、文本向量(Segment Embeddings),这几个向量的加和即构成编码向量。对于一个输入,构造为一个所述的编码向量输入给文本特征提取器即可。当然,本领域技术人员也可以采用其他能够实现同等功能的模型来替换BERT模型,只要据此构造的文本特征提取器能够依据格式化后结果提取出提问文本中的文本特征即可。
所述的文本特征提取器从提问文本中提取的文本特征,为了后续构造矩阵的方便,可被归一化处理而表述为一个维度确定的句向量,例如768维的句向量,该句向量也可视为一个1*768的提问特征矩阵,或者另行独立构造一个提问特征矩阵,将该句向量添加其中即可。
可以理解,如果用户提交的内容中包含多个提问文本,理论上还可将其分解为多个提问文本,针对每个提问文本进行特征提取,从而获得多个句向量,将其添加到所述的提问特征矩阵中,为兼顾提问特征矩阵中存在多个提问文本相对应的句向量的情况,此处示例表示该提问特征矩阵的尺寸为B*768大小。
步骤S1200、从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据:
适应本申请所需,可以为每一商户实例的知识库构造出一个相对应的知识特征矩阵,由于本申请前文已揭示商户实例的知识库是分布式存储在本申请的数据组织结构所实现的多个列表中的,因此,该知识特征矩阵的构造需要借助本申请前文揭示的数据组织结构所实现的各个列表来进行。
由于所述订阅列表包括了具体商户实例到该商户实例所订阅的官方意图之间的映射关系数据,所述自定义意图列表也包含了具体商户实例到该商户实例所自定义的意图之间的映射关系数据,且该商户实例一般已经预先标注其特定领域,因此,可以从订阅列表与自定义意图列表中,将一个商户实例所指定的特定领域的意图提取出来,通常也关联地将与所述相映射的回复文本也提取出来,由此便获得了商户实例的关联于其启用的特定领域的多个意图。
由于所述相似问列表中存储了商户实例在启用的特定领域下的意图与其相似问及相似问的句向量之间的映射关系数据,因此,进一步根据从订阅列表、自定义意图列表中提取出来的多个意图,便可以从相似问列表中筛选出与所述各个意图相对应的相似问的句向量。
获得一个商户实例所启用的特定领域之下的所有官方意图、自定义意图相对应的相似问的句向量之后,将这些句向量添加到该商户实例相对应的空矩阵中,便构成了所述的知识特征矩阵,其本质上包含了一个商户实例所定义的知识库的所有相似问的文本特征。
同理,所述相似问的句向量是采用如前所述的文本特征提取器预先进行文本特征提取而得的,可以是在录入相似问之后即调用该文本特征提取器提取出相应的句向量,最后将该句向量与其相应的相似问关联存储于相似列表中。
至此,可以看出,该知识特征矩阵与所述提问特征矩阵具有相同的组织结构,其包含多个句向量,每个句向量是一个相似问的文本特征,这一句向量的维数与提问特征矩阵中句向量的维数相同,例如前述的768维,设该知识特征矩阵中有N个相似问,则其矩阵尺度为N*768。其中,N值的大小,一般视乎商户实例的知识库内相关联的相似问的总量而定,是预先对商户实例的知识库内的相似问进行特征提取而构建的。
经过上述的处理,所述提问文本、相似问的文本特征均被表示为具有相同维度的句向量,分别对应存储在提问特征矩阵、知识特征矩阵中。至此,设相似问的总数为N,则知识特征矩阵为N*768的线性空间,与B*768的提问特征矩阵具有相同的句向量长度,两者句向量长度相同,方便后续的计算。
为了便于后续的索引,可以将相似问在所述相似问列表中的寻址信息,以及该相似问的句向量在所述知识特征矩阵中的索引标识提取出来,构造成映射关系数据,存储于一个索引库中,以供后续可依据所述的索引标识反向在相似问列表中定位到相应的相似问。
可以看出,本申请中,对应每一商户实例所定义的知识库,由于其知识库内数据是分布式存储而不提供独立存储的知识库对象,但每一商户实例相对应的知识特征矩阵却可以动态高效构建。
当用户在一个商户实例的客户界面中进行交互时,后台服务器自然而然可以获知该商户实例,由此即可根据该商户实例操作本申请的各个列表,进而确定与该商户实例的知识库相关联的各项数据,最终依据相似问列表中的相似问的句向量来实现所述知识特征矩阵的构造
步骤S1300、基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问:
本申请基于余弦相似度算法原理来实现提问特征矩阵与知识特征矩阵之间相似度的计算。根据余弦相似度原理,将B*768的提问特征矩阵与N*768的知识特征矩阵两个向量矩阵进行矩阵相乘所得到的相似矩阵,可以反映两者的相似度。
需要注意的是,提问特征矩阵与知识特征矩阵均是以相同的结构存储提问文本、相似问的行分量的,因此,在应用余弦相似度算法时,需将知识特征矩阵转置后再与提问特征矩阵做矩阵乘法运算,即如,将B*768的提问特征矩阵与N*768维的知识特征矩阵的768*N的转置矩阵进行矩阵相乘,获得B*N的相似矩阵。可以理解,所述的相似矩阵中,其每个句向量存储单个所述提问文本分别与所有相似问相比的相似度,其每个元素反映一个提问文本与一个相似问之间的相似度。
该相似矩阵中的元素数值,其数值越高,表征提问文本与相似问之间的相似度越高;其数值越低,表征提问文本与相似问之间的相似度越低。
尽管该相似矩阵的这一数值意义非常直观,但未必方便运算,因而,可以根据实际情况进一步对其适用归一化操作,对该相似矩阵做适当的变换,使得所述的相似度可以映射到一个诸如[0,1]的线性空间,再行利用。可以理解,转换后所得的相似矩阵,依然是B*N的矩阵。
可以看出,矩阵变换运算的效率相对于其他计算方式是非常高的,有利于节约系统运存开销,对于需要处理海量的并发用户提问的客服系统而言,其作用不言而喻。
确定所述的相似矩阵之后,便可获得了每个提问文本到知识特征矩阵中各个相似问之间的相似度,据此,可以以提问文本为单位,对相似矩阵中的各个元素进行聚类,获得每个提问文本与多个具有相似度关联的相似问之间的相似度数据,在此基础上,可以对每个提问文本的多个相似度数据进行排序,确定出其中最相似的元素,即在所述的相似矩阵中与该提问文本相对应的相似度最大的元素,该元素的行坐标指向具体提问文本,而其列坐标则指向具体的相似问,由此便获得了与用户提交的提问文本相对应的相似问的索引标识,即在知识特征矩阵中定位出了相对应的相似问。
除以应用余弦相似度算法来实现相似度计算,也可以采用多种其他公知的算法来替换实现提问文本的句向量与相似问的句向量之间的相似度计算,典型的如距离算法之类。本领域技术人员应当理解,无论适用何种算法,对于本申请在数据组织结构方面所体现的创造精神,均不构成影响。
步骤S1400、根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问:
根据所述的相似问的索引标识查询此前所预构建的索引库,便可在相似问列表中反向查询出该相似问的具体位置,据此可进一步确定出其相关联的意图,根据该意图倒查获取与其相映射的回复文本,进而可将回复文本输出至相应的用户处,以应答该用户的提问。
由本实施例的详细揭示可以看出,电商平台为其平台内所有的商户实例的自动客服提供了标准化的业务逻辑,通过对平台内的所有商户实例的知识库进行系统化的组织以及运用该业务逻辑,使得其客服系统更适于基于独立站的跨境电商平台实现自动客服功能。
本申请一方面构造出提问特征矩阵用于存储用户的提问文本相对应的文本特征句向量,另一方面对应该用户正在访问的商家实例的知识库预构造有知识特征矩阵用于存储该知识库中的相似问的文本特征句向量,两方面的向量被统一为同一维度,然后基于提问特征矩阵与知识特征矩阵执行快速高效的矩阵乘法操作求取提问文本与该知识库中各相似问的相似度,这一过程计算量小、语义丰富、内存占用低,最终根据相似度进一步确定出与提问文本相适配的回复文本。整个过程中,计算机运行业务逻辑标准统一,运算高效,方便编程实现,获取结果迅速,实现成本较低,便于部署在电子商务之类的互联网平台中对海量商户实例所接收到的用户提问进行精准高效的智能应答,提升基于独立站的跨境电商平台的后台服务性能。
此外,结合本典型实施例对本申请的各个列表的调用可知:本申请中各商户实例配置形成的知识库,被分散在由电商平台集中维护的多个表格中,主要包括官方意图列表、订阅列表、相似问列表,而商户实例自定义的内容则主要体现在所述的相似问列表及其自定义意图列表,每一个商户实例通过预设其自身所指定的特定领域来获取该领域相关联的意图,而平台方则可通过所述的官方意图列表、订阅列表、相似问列表中每一张列表来集中维护平台上所有商户实例相应的数据记录。根据这一实现,一个商户实例对应的知识库的各部分数据被合理解耦,弱化不同列表之间、不同商户实例之间数据的依赖关系,避免因数据变动导致同步效率低下;而平台官方则可更为高效集中地基于少数列表来实现技术支持和服务响应,确保可灵活扩展,在部署多个服务实例的情况下,依然可保证知识库的一致性;特别是通过为意图标注领域隶属关系来细化意图的组织粒度,一方面避免用户在配置知识库过程中逐个选择意图导致繁琐低效,另一方面还可尽量避免操作冗余和存储冗余。可见,对于电商平台这种需要实时响应海量并发的用户提问需求的应用场景而言,本申请有利于全面提升电商平台客服系统在后台的运行表现,也有利于提升其在软件工程中的组织开发效率,并且,由于减少了冗余、降低了耦合,还可既降低机器成本与维护成本。
请参阅图2,具体化的一个实施例中,所述步骤S1100,包括如下步骤:
步骤S1110、获取电商平台用户在商家实例调起客服系统而提交的提问文本:
如前所述,通过接收正在电商平台的某一商户实例访问的用户所提交的聊天消息,可以从中获取其提问文本。
步骤S1120、基于所述提问文本构造编码向量:
适应BERT模型输入的需要,BERT模型通过查询字向量表将提问文本中的每个字转换为一维向量,作为模型输入。此外,模型输入除了字向量,还包含另外两个部分:文本向量与位置向量。所述的文本向量的取值在模型训练过程中自动学习,用于刻画文本的全局语义信息,并与单字/词的语义信息相融合。所述的位置向量:由于出现在文本不同位置的字/词所携带的语义信息存在差异(比如:“我想你”和“你想我”),因此,BERT模型对不同位置的字/词分别附加一个不同的向量以作区分。BERT模型将字向量、文本向量和位置向量的加和作为模型输入所需的编码向量。
步骤S1130、调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为句向量:
同理,本申请推荐采用BERT模型或其升级版本所实现的文本特征提取器来对所述的编码向量进行特征提取,从而获得相应的文本特征,例如BERT模型可以将文本特征归一化输出为1*768的句向量。
步骤S1140、构造提问特征矩阵,向其中添加所述的句向量:
在内存中构造一个用于存放由所述提问文本提取出来的句向量的空矩阵,将提取出来的句向量添加至该空矩阵中,便完成所述提问特征矩阵的构造。
本实施例进一步给出了较优的实施方式,能够深化对提问文本的语义理解,使得格式化后结果及文本特征均具有较高的语义理解能力,能够进一步提升根据本申请所实现的客服系统的智能化程度。
请参阅图3,具体化的一个实施例中,所述步骤S1200,包括如下步骤:
步骤S1210、根据所述商户实例查询所述订阅列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例所订阅的特定领域相应的多个意图及每个意图相应的回复文本:
如前所述,当用户调用客服系统时,客户系统在后台可获得用户正在访问的商户实例,例如以商户实例的ID的形式表示,据此,可以根据该商户实例调用客服系统的订阅列表,由于订阅列表中存储了商户实例处于启用的特定领域,以及该特定领域下的多个数据记录,每个数据记录包括一个官方意图及与具体意图相应的回复文本,两者一一对应映射,由此,查询该订阅列表便可获得与该商户实例已启用的特定领域内的所有意图所在的数据记录,也即获得了属于该商户实例的知识库中的一部分数据,即其继承的官方意图与回复文本之间映射关系数据。
步骤S1220、根据所述商户实例查询所述自定义意图列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例自定义的关联于该特定领域的多个意图及每个意图相应的回复文本:
同理,根据所述的商户实例进一步对所述的自定义意图列表进行查询,可以筛选出其中与该商户实例已启用的特定领域的所有自定义意图所在的数据记录,也即获得了属于该商户实例的知识库中的另一部分数据,即其自定义的意图与回复文本之间的映射关系数据。
步骤S1230、将筛选出的两组数据记录合并至同一商户汇总意图列表中:
在先获得的意图与回复文本之间的映射关系数据,为了便于其所属的商户实例在后续处理过程中专用,可以将两种所述的映射关系数据进行合并,构造出汇总意图列表。
步骤S1240、根据所述汇总意图列表中的每个意图,查询相似问列表筛选出与该些意图预关联的相似问的句向量:
构造出所述的汇总意图列表之后,所述汇总意图列表实际上便包含了其相应的商户实例的知识库的映射关系,具体是指该商户实例定义知识库所获得所有意图的关系,据此可以借助所述的相似问列表来获取该商户实例的知识库应有的所有相似问,构成该知识库的另一部分数据。由于对相似问的操作是基于其句向量进行的,因此,此处是根据汇总意图列表中的所有意图,从所述相似问列表中筛选出属于各个意图的所有相似问所对应的句向量,而不必调用相似问数据项本身的文本。如前所述,相似问的句向量是经过本申请的所述文本特征提取器预先提取的,因此,其句向量具有如前所述的归一化后的标准维度,例如前述的1*768的尺度。
步骤S1250、将筛选出的句向量构造为知识特征矩阵:
为了构造所述的知识特征矩阵,根据筛选出的相似问总数N,以及其句向量的维度例如768,构造出N*768的空矩阵,然后将各个句向量逐一添加到该空矩阵中,便构成所述的知识特征矩阵。
本实施例进一步实现了对商户实例、订阅列表、自定义意图列表、汇总意图列表、相似问列表、知识特征矩阵之间的映射关系的组织和利用,使得电商平台后台对客服系统相关数据的组织和调度更为有序,充分发挥本申请的技术思路的优势,方便后续根据知识特征矩阵进行高效运算,有助于提升客服系统响应海量并发提问请求的能力。
请参阅图4,具体化的实施例中,所述步骤S1300,包括如下步骤:
步骤S1310、求取知识特征矩阵的转置矩阵:
可以理解,由于知识特征矩阵如前所述为N*768的矩阵,而提问特征矩阵为B*768的矩阵,为了获得B*N的相似矩阵,此处先行对知识特征矩阵做变换,获得其768*N的转置矩阵。
步骤S1320、将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的相似问的相似度:
根据线性代数原理,将提问特征矩阵与所述的转置矩阵做矩阵相乘后,便获得B*N的相似矩阵,又,根据余弦相似度原理,相似矩阵中的元素表征一个提问文本bn和与其相比较的相似问nn之间的相似度,因此,相似矩阵中存储的正是每个提问文本分别与各个相似问之间的相似度数据。相似矩阵中的每个元素,其坐标信息具有指示作用,其中,行坐标指示具体提问文本,其列坐标指示具体相似问,根据一个元素所处坐标,可以确定其相对应的提问文本和相似问,并确定两者之间的相似度。
步骤S1330、从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的相似问:
如前所述,确定所述的相似矩阵之后,便获得了每个提问文本到知识特征矩阵中各个相似问之间的相似度,据此,可以以提问文本为单元,对相似矩阵中的各个元素进行聚类,获得每个提问文本与多个具有相似度关联的相似问之间的相似度数据,为方便计算运算,每个提问文本相对应的这些相似度数据,可以记入一个候选子集ln中,每个候选子集的元素可以采用对值表示为{{x1,y1},d},其中{x1,y1}表示该元素在相似矩阵中的坐标,x1表示具体提示文本所在的行坐标,y1表示对应的相似问所在的列坐标,d表示该提问文本与该相似问之间的具体相似度。
在此基础上,可以根据相似度对每个候选子集中的对值进行自大至小的排序,其中最大的对值即为最高相似度的元素,由此便获得了与用户提交的提问文本相对应的相似问的索引标识y1,可以用于确定出具体的相似问。若需要在时间复杂度上进一步优化,则无需排序:在只需获取相似度最高1个意图时,只需找到最大对值即可;在需要获取相似度最高的K个相似问对应的意图时,只需采用Top K算法即可,典型的如基于快速排序或堆实现的Top K算法之类。
本实施例进一步给出以矩阵实现相似度计算的具体方案,可以看出,其计算效率非常高,对于电商平台来说,用于处理海量并发提问请求时,将取得特别高效的效果,方便对用户提问做出即时响应。
请参阅图5,具体化的一个实施例中,在前述形成汇总意图列表的基础上,所述步骤S1400,包括如下步骤:
步骤S1410、根据定位出的所述相似问在相似问列表中查找到其相对应的意图:
考察本申请的技术方案的实现过程,可以看出,在构建所述的N*768的知识特征矩阵的过程中,构造有一个索引库,索引库中将相似问在相似问列表中的寻址信息与该相似问在该知识特征矩阵中的索引标识之间建立了对应关系,因此,给出一个相似问在该知识特征矩阵中的索引标识(行号),便可查询索引库确定其相应的寻址信息,利用这一寻址信息可以去相似问列表中查找其对应的意图。
当B*768的提问特征矩阵与N*768的知识特征矩阵的768*N的转置矩阵进行矩阵相乘之后,便获得了B*N的相似矩阵,此时,提问文本按行B对应不变,而相似问则按列N对应。因此,知识特征矩阵中的行号被一一对应传递到相似矩阵中作为列号。
进而,即使在前一实施例中,当构造所述的候选子集的过程中,通过建立集合中的对值,在对值中包含了相似矩阵中的行号x1和列号y1,也可以看出,这些集合均继承了所述相似问的行号的对应关系。
根据这一过程可以看出,索引库中,相似问的索引标识在本申请技术方案的整个过程的各个环节均被对应传递,因此,通过所述的集合的每个对值中的y1,即可查询索引库获取到与其相对应的相似问的寻址信息。
根据所述的相似问的寻址信息查询此前所预构建的索引库,便可反向查询出该相似问在所述的相似问列表中的具体位置,据此可进一步确定出其相关联的意图。
步骤S1420、查询该汇总意图列表获取与查找到的意图相映射的回复文本:
由于所述的汇总意图列表中存储了各个意图与其相应的回复文本之间的映射关系数据,因此,根据意图便可在该汇总意图列表中确定出所述的回复文本。在其他实施例中,如果不设置所述的汇总意图列表,则可直接去订阅列表或者自定义意图列表中查找该意图,再根据意图与其回复文本之间的映射关系,获得相应的回复文本。
步骤S1430、向所述电商平台用户推送所述的回复文本:
获得所述的回复文本之后,可以按需对其进行格式化处理,然后直接推送给所述的电商平台用户,以使其被显示至该用户正在聊天的客服界面中。当然,如果该用户已经退出客服界面,该回复文本也会相应被存储至其消息记录中。
本实施例给出更为细致的方便编程实现的实例,可以更为高效地从所述相似矩阵中确定与所述提问文本相对应的具有最高相似度的相似问,然后根据相似问查询汇总意图列表,从汇总意图列表中查询出相对应的回复文本,以之应答相关用户。由于本申请实现了基于深度语义学习的技术思路,使得根据相似矩阵查找到的回复文本能够体现语义上的高度关联,故而进一步提升了客服系统的智能化程度。
请参阅图6,本申请的电商客服匹配方法还包括如下步骤:
步骤S1500、响应官方意图发布指令,向所述官方意图列表中添加指定领域的新增意图的数据记录,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,并为所述相似问提取并关联其句向量,将该新增意图的数据记录同步至订阅列表中并建立起其与在先已订阅该领域的商户实例之间的映射关系:
当电商平台需要新增官方意图时,便需编辑所述的官方意图列表。后台管理用户可以将需要新增的意图的相关信息一并提交,一般包括意图所属的指定领域、表示意图本身的表达文本、该意图相对应的一个或多个相似问等。
电商系统后台接收到管理用户触发的所述官方意图发布指令后,响应于该指令,在所述的官方意图列表中创建一个新的数据记录,然后向其中相应的数据项添加所述的意图及其相映射的回复文本,将该意图关联其指定的领域,然后,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,同时将调用所述的文本特征提取器对该相似问提取出的句向量也与该相似问关联存储至相应的数据记录中。
需要注意的是,考虑到部分商户实例从官方意图列表中复制了至少一个领域的意图的副本,因此,在完成所述官方意图列表的更新之后,还应将该新增意图的数据记录同步至订阅了该意图所属的领域的商户实例的知识库中,具体是通过所述订阅列表,检索到与该指定领域相关的商户实例,为各个商户实例添加该指定领域的所述新增意图。
通过本实施例可以看出,当客服系统需要对官方意图列表进行更新时,客服系统只需对几个列表进行集中式操作即可,不需对多个存储单元进行繁杂的操作,运算量低,运算时间短,整体效能高。
与此同理,对各个列表的数据的更新,例如一个商户实例新增知识库影响到订阅列表的变动;又如商户实例删除一个自定义意图,仅需从自定义意图列表和相似问列表中删除对应数据即可,不会影响全局,如此等等,均能取得本实施例同等的优势。
请参阅图7,本申请的电商客服匹配方法还包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
步骤S2100、获取电商平台预设的相似问列表的任一相似问作为训练样本:
如前所述,采用BERT模型用于实现本实施例的文本特征提取器,针对BERT模型,需要预先实施训练,将其训练至收敛状态,以便高效服务于本申请的各个实施例的技术方案。
较佳的方式是将电商平台中所述相似问列表中的相似问视为训练样本库,因此,本实施例中可以获取该相似问列表的全量相似问用于训练,相似问被作为训练样本使用,而与其相映射的意图,则可作为BERT模型连接分类器之后的监督标签。
步骤S2200、在对所述训练样本构造出编码向量的基础上,调用利用BERT模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征:
与本申请前述各实施例同理,训练样本可预先构造为相应的编码向量,以便为BERT模型提供输入。BERT模型根据其自身的实现逻辑对输入的编码向量进行文本特征提取,最终获得相应的文本特征。
步骤S2300、调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的相似问所关联的意图作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练:
为了实现对BERT模型的任务训练,其输出的文本特征被馈入一个Softmax()多分类器进行分类,以便获得其到各个意图相对应的分类的评分。由于所述的意图在分类器中被作为监督标签采用,因此,分类器将根据监督标签的监督,向BERT模型反向传播,以修正其权重参数,直至整个损失函数达致收敛,最终完成训练。可以理解,所述损失函数基于交叉熵实现即可。
本实施例进一步给出了实现本申请的技术方案所需的文本特征提取器的训练过程,针对电商客服系统提出一个智能客服解决方案,通过训练一个深度学习的分类模型,进行参数共享,可以看出,由于在训练过程中采用了电商平台的全量相似问进行训练,BERT模型更容易收敛,由此获得的文本特征提取器,其表示学习能力更强,更能精准地为提问文本匹配到相适配的相似问所属的意图,有助于提升自动客服的内容匹配度,提升用户交互体验。
请参阅图8,本申请实施例还提供一种电商客服匹配装置,其包括:提问获取模块1100、知识获取模块1200、相似匹配模块1300以及应答处理模块1400,其中,所述提问获取模块1100,用于调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;所述知识获取模块1200,用于从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据;所述相似匹配模块1300,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问;所述应答处理模块1400,用于根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。
具体化的实施例中,所述提问获取模块1100包括:提问解析子模块,用于获取电商平台用户在商家实例调起客服系统而提交的提问文本;提问编码编码子模块,用于基于所述提问文本构造编码向量;提问特征子模块,用于调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为句向量;提问矩阵子模块,用于构造提问特征矩阵,向其中添加所述的句向量。
具体化的实施例中,所述知识获取模块1200包括:订阅筛选子模块,用于根据所述商户实例查询所述订阅列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例所订阅的特定领域相应的多个意图及每个意图相应的回复文本;自定筛选子模块,用于根据所述商户实例查询所述自定义意图列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例自定义的关联于该特定领域的多个意图及每个意图相应的回复文本;意图汇总子模块,用于将筛选出的两组数据记录合并至同一商户汇总意图列表中;向量获取子模块,用于根据所述汇总意图列表中的每个意图,查询相似问列表筛选出与该些意图预关联的相似问的句向量;知识矩阵子模块,用于将筛选出的句向量构造为知识特征矩阵。
具体化的实施例中,所述相似匹配模块1300包括:矩阵转置子模块,用于求取知识特征矩阵的转置矩阵;矩阵相乘子模块,用于将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的相似问的相似度;元素定位子模块,用于从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的相似问。
具体化的实施例中,所述应答处理模块1400包括:意图反查子模块,用于根据定位出的所述相似问在相似问列表中查找到其相对应的意图;回复反查子模块,用于查询该汇总意图列表获取与查找到的意图相映射的回复文本;回复推送子模块,用于向所述电商平台用户推送所述的回复文本。
扩展的实施例中,所述电商客服匹配装置还包括意图发布模块,用于响应官方意图发布指令,向所述官方意图列表中添加指定领域的新增意图的数据记录,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,并为所述相似问提取并关联其句向量,将该新增意图的数据记录同步至订阅列表中并建立起其与在先已订阅该领域的商户实例之间的映射关系。
扩展的实施例中,所述电商客服匹配装置还包括模型训练模块,其包括:样本提取子模块,用于获取电商平台预设的相似问列表的任一相似问作为训练样本;样本提取子模块,用于在对所述训练样本构造出编码向量的基础上,调用利用BERT模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;分类监督子模块,用于调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的相似问所关联的意图作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
本申请实施例还提供计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种电商客服匹配方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种电商客服匹配方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中各个模块/子模块的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有电商客服匹配装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例的电商客服匹配方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请基于矩阵操作和对客服系统的数据组织结构的有序组织实现对智能客服问答匹配的运算和判决,运算效率高,响应迅速,开销较小,特别适合服务于基于独立站的跨境电商平台。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种电商客服匹配方法,其特征在于,包括如下步骤:
调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;
从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据;
基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问;
根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。
2.根据权利要求1所述的电商客服匹配方法,其特征在于,调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵,包括如下步骤:
获取电商平台用户在商家实例调起客服系统而提交的提问文本;
基于所述提问文本构造编码向量;
调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为句向量;
构造提问特征矩阵,向其中添加所述的句向量。
3.根据权利要求1所述的电商客服匹配方法,其特征在于,从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,包括如下步骤:
根据所述商户实例查询所述订阅列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例所订阅的特定领域相应的多个意图及每个意图相应的回复文本;
根据所述商户实例查询所述自定义意图列表,筛选出其中与该商户实例相对应的数据记录,该数据记录至少包含该商户实例自定义的关联于该特定领域的多个意图及每个意图相应的回复文本;
将筛选出的两组数据记录合并至同一商户汇总意图列表中;
根据所述汇总意图列表中的每个意图,查询相似问列表筛选出与该些意图预关联的相似问的句向量;
将筛选出的句向量构造为知识特征矩阵。
4.根据权利要求1所述的电商客服匹配方法,其特征在于,基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问,包括如下步骤:
求取知识特征矩阵的转置矩阵;
将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的相似问的相似度;
从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的相似问。
5.根据权利要求3所述的电商客服匹配方法,其特征在于,根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问,包括如下步骤:
根据定位出的所述相似问在相似问列表中查找到其相对应的意图;
查询该汇总意图列表获取与查找到的意图相映射的回复文本;
向所述电商平台用户推送所述的回复文本。
6.根据权利要求1所述的电商客服匹配方法,其特征在于,本方法还包括如下步骤:
响应官方意图发布指令,向所述官方意图列表中添加指定领域的新增意图的数据记录,将与该意图相关联的一个或多个相似问的数据记录添加至所述相似问列表中,并为所述相似问提取并关联其句向量,将该新增意图的数据记录同步至订阅列表中并建立起其与在先已订阅该领域的商户实例之间的映射关系。
7.根据权利要求1所述的电商客服匹配方法,其特征在于,本方法包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
获取电商平台预设的相似问列表的任一相似问作为训练样本;
在对所述训练样本构造出编码向量的基础上,调用利用BERT模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;
调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的相似问所关联的意图作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
8.一种电商客服匹配装置,其特征在于,其包括:
提问获取模块,用于调用文本特征提取器提取电商平台用户在商家实例调起客服系统而提交的提问文本的文本特征作为句向量,以该句向量构造提问特征矩阵;
知识获取模块,用于从客服系统的订阅列表及自定义意图列表中筛选出该商户实例预关联于特定领域的多个意图,根据所述意图查询相似问列表筛选出与所述意图预关联的相似问的句向量,将筛选出的句向量构造为知识特征矩阵,所述句向量为所述文本特征提取器对相似问提取的文本特征,所述订阅列表包含所述商户实例及其特定领域,及依据该特定领域从官方意图列表中复制的意图,及与所复制的意图相映射的回复文本之间的映射关系数据;
相似匹配模块,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,根据相似度定位至与该提问文本最相似的相似问;
应答处理模块,用于根据该相似问查询相似问列表确定其对应的意图,根据该意图获取与其相映射的回复文本以之应答用户提问。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述的电商客服匹配方法的步骤。
10.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述的电商客服匹配的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110822772.3A CN113434656B (zh) | 2021-07-21 | 2021-07-21 | 电商客服匹配方法及其相应的装置、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110822772.3A CN113434656B (zh) | 2021-07-21 | 2021-07-21 | 电商客服匹配方法及其相应的装置、设备、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113434656A true CN113434656A (zh) | 2021-09-24 |
CN113434656B CN113434656B (zh) | 2023-04-25 |
Family
ID=77761226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110822772.3A Active CN113434656B (zh) | 2021-07-21 | 2021-07-21 | 电商客服匹配方法及其相应的装置、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113434656B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012116512A1 (zh) * | 2011-02-28 | 2012-09-07 | 北京航空航天大学 | 基于多特征匹配的服务发现方法及系统 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN111125331A (zh) * | 2019-12-20 | 2020-05-08 | 京东方科技集团股份有限公司 | 语义识别方法、装置、电子设备及计算机可读存储介质 |
CN111159346A (zh) * | 2019-12-27 | 2020-05-15 | 深圳物控智联科技有限公司 | 基于意图识别的智能答疑方法、服务器及存储介质 |
CN111708869A (zh) * | 2020-05-12 | 2020-09-25 | 北京明略软件系统有限公司 | 人机对话的处理方法及装置 |
CN111767737A (zh) * | 2019-05-30 | 2020-10-13 | 北京京东尚科信息技术有限公司 | 文本意图相似度确定方法、装置、电子设备和存储介质 |
CN112182186A (zh) * | 2020-09-30 | 2021-01-05 | 完美世界(北京)软件科技发展有限公司 | 智能客服的运行方法、装置以及系统 |
CN112182175A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
CN112307164A (zh) * | 2020-10-15 | 2021-02-02 | 江苏常熟农村商业银行股份有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN112487810A (zh) * | 2020-12-17 | 2021-03-12 | 税友软件集团股份有限公司 | 一种智能客服服务方法、装置、设备及存储介质 |
CN112507704A (zh) * | 2020-12-15 | 2021-03-16 | 中国联合网络通信集团有限公司 | 多意图识别方法、装置、设备及存储介质 |
CN112949297A (zh) * | 2021-02-25 | 2021-06-11 | 深圳追一科技有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
-
2021
- 2021-07-21 CN CN202110822772.3A patent/CN113434656B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012116512A1 (zh) * | 2011-02-28 | 2012-09-07 | 北京航空航天大学 | 基于多特征匹配的服务发现方法及系统 |
CN110162611A (zh) * | 2019-04-23 | 2019-08-23 | 苏宁易购集团股份有限公司 | 一种智能客服应答方法及系统 |
CN111767737A (zh) * | 2019-05-30 | 2020-10-13 | 北京京东尚科信息技术有限公司 | 文本意图相似度确定方法、装置、电子设备和存储介质 |
CN111125331A (zh) * | 2019-12-20 | 2020-05-08 | 京东方科技集团股份有限公司 | 语义识别方法、装置、电子设备及计算机可读存储介质 |
CN111159346A (zh) * | 2019-12-27 | 2020-05-15 | 深圳物控智联科技有限公司 | 基于意图识别的智能答疑方法、服务器及存储介质 |
CN111708869A (zh) * | 2020-05-12 | 2020-09-25 | 北京明略软件系统有限公司 | 人机对话的处理方法及装置 |
CN112182175A (zh) * | 2020-09-25 | 2021-01-05 | 北京字节跳动网络技术有限公司 | 智能问答方法、装置、设备及可读存储介质 |
CN112182186A (zh) * | 2020-09-30 | 2021-01-05 | 完美世界(北京)软件科技发展有限公司 | 智能客服的运行方法、装置以及系统 |
CN112307164A (zh) * | 2020-10-15 | 2021-02-02 | 江苏常熟农村商业银行股份有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN112507704A (zh) * | 2020-12-15 | 2021-03-16 | 中国联合网络通信集团有限公司 | 多意图识别方法、装置、设备及存储介质 |
CN112487810A (zh) * | 2020-12-17 | 2021-03-12 | 税友软件集团股份有限公司 | 一种智能客服服务方法、装置、设备及存储介质 |
CN112949297A (zh) * | 2021-02-25 | 2021-06-11 | 深圳追一科技有限公司 | 意图识别方法、装置、计算机设备和计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
吴炎等: "基于BERT的语义匹配算法在问答系统中的应用", 《仪表技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113434656B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107735804B (zh) | 用于不同标记集合的转移学习技术的系统和方法 | |
CN113792786A (zh) | 商品对象自动分类方法及其装置、设备、介质、产品 | |
CN113962224A (zh) | 命名实体识别方法及其装置、设备、介质、产品 | |
CN114840869A (zh) | 基于敏感度识别模型的数据敏感度识别方法及装置 | |
CN114548092A (zh) | 客服会话调度方法及其装置、设备、介质、产品 | |
CN114218426A (zh) | 音乐视频推荐方法及其装置、设备、介质、产品 | |
CN114265921A (zh) | 问答知识库构建方法及其装置、设备、介质、产品 | |
CN116414964A (zh) | 智能客服问答知识库构建方法、装置、设备及介质 | |
US20230095077A1 (en) | Personalized search based on account attributes | |
CN113434656B (zh) | 电商客服匹配方法及其相应的装置、设备、介质 | |
CN114049484A (zh) | 商品图像检索方法及其装置、设备、介质、产品 | |
CN115018548A (zh) | 广告文案预测方法及其装置、设备、介质、产品 | |
CN115510116A (zh) | 数据目录构建方法、装置、介质及设备 | |
CN115080039A (zh) | 前端代码生成方法、装置、计算机设备、存储介质和产品 | |
US20230142351A1 (en) | Methods and systems for searching and retrieving information | |
CN114581202A (zh) | 装修样式定制方法及其装置、设备、介质、产品 | |
CN113722446A (zh) | 电力系统操作数据生成方法、装置、计算机设备 | |
CN113434657B (zh) | 电商客服应答方法及其相应的装置、设备、介质 | |
CN112948561A (zh) | 一种问答知识库自动扩建的方法和装置 | |
CN113807148B (zh) | 文本识别匹配方法和装置、终端设备 | |
CN113806537B (zh) | 商品类目分类方法及其装置、设备、介质、产品 | |
CN111241089B (zh) | Erp系统二次开发方法、系统、装置及可读存储介质 | |
US20240045910A1 (en) | Identifying an implementation of a user-desired interaction using machine learning | |
US20210141777A1 (en) | Information management apparatus, information processing apparatus, and non-transitory computer readable medium | |
CN113807148A (zh) | 文本识别匹配方法和装置、终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |