CN113434657B - 电商客服应答方法及其相应的装置、设备、介质 - Google Patents

电商客服应答方法及其相应的装置、设备、介质 Download PDF

Info

Publication number
CN113434657B
CN113434657B CN202110822933.9A CN202110822933A CN113434657B CN 113434657 B CN113434657 B CN 113434657B CN 202110822933 A CN202110822933 A CN 202110822933A CN 113434657 B CN113434657 B CN 113434657B
Authority
CN
China
Prior art keywords
question
text
matrix
knowledge
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110822933.9A
Other languages
English (en)
Other versions
CN113434657A (zh
Inventor
许强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202110822933.9A priority Critical patent/CN113434657B/zh
Publication of CN113434657A publication Critical patent/CN113434657A/zh
Application granted granted Critical
Publication of CN113434657B publication Critical patent/CN113434657B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开一种电商客服应答方法及其相应的装置、设备、介质,该方法包括:获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;获取该用户指定的商户实例的知识库相对应的知识特征矩阵,其中每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。本申请基于矩阵操作和知识库的有序组织实现对智能客服问答匹配的高效运算和迅速判决,特别适合服务于基于独立站的跨境电商平台。

Description

电商客服应答方法及其相应的装置、设备、介质
技术领域
本申请实施例涉及电商信息技术领域,尤其涉及一种电商客服应答方法及其相应的装置、设备、介质。
背景技术
目前,对于基于知识库问答,多数都是针对一个知识库,一个单一场景进行问答,问答的方法有的是基于关键字词进行回复,有的是通过神经网络进行模型训练,然后依据模型的预测进行回复。
但是,在实际场景中,大多都是基于不同用户在不同知识库进行问答,比如在海外跨境电商的智能客服场景就是如此。跨境电商平台上,不同商家由于彼此市场定位不同,所销售的品类也不同,所以每个商家定义的知识库通常都是不一样的。
对于电商平台方的后台技术支持来说,为了实现标准化服务,通常希望能够提供一个标准化的业务逻辑,通过该业务逻辑开放标准接口给到各个商家进行标准化调用,以此来实现对全平台用户咨询的支持,同时又希望能兼顾各个商家的店铺的具体知识库的对应关系,如此期望简化开发难度,降低实现成本,而且确保服务成效。
如果按照传统的思路来尝试为电商平台提供一个标准接口,基于关键词提取和规则匹配的方式来实现针对提问文本进行回复,这种方式本身具有弊端,往往忽略语义层面的信息,交互性较差;如果用深度模型,按照多数专利思路,需要根据不同知识库训练不同模型,这样会带来较大的服务器费用以及维护成本也会较高。
由此可见,对于基于独立站的跨境电商平台而言,如何为其客服系统提供技术支持,仍是有待挖掘的空间。
发明内容
本申请的目的针对现有技术中存在的至少部分不足而提供一种电商客服应答方法及其相应的装置、计算机设备及存储介质。
为解决上述技术问题,本申请采用的一个技术方案是:
本申请提供一种电商客服应答方法,包括如下步骤:
获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;
获取该用户指定的商户实例的知识库相对应的知识特征矩阵,其中每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;
基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;
根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。
具体化的实施例中,获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,包括如下步骤:
获取电商平台用户的提问文本;
基于所述提问文本构造编码向量;
调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;
构造提问特征矩阵,向其中添加所述的行向量。
具体化的实施例中,获取该用户指定的商户实例的知识库相对应的知识特征矩阵,包括如下步骤:
获取用户正在访问的商户实例所对应的实例标识;
根据该实例标识查询映射关系表确定与该实例标识相对应的知识库;
获取该知识库相对应的知识特征矩阵。
扩展的实施例中,本方法还包括构造所述知识库的知识特征矩阵的步骤,其包括如下具体步骤:
获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射;
对每一知识库中的每一提问范本构造相应的编码向量;
调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;
将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵。
具体化的实施例中,基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,包括如下步骤:
求取知识特征矩阵的转置矩阵;
将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的提问范本的相似度。
具体化的实施例中,根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问,包括如下步骤:
从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的提问范本;
根据确定出的所述提问范本在该商户实例的知识库中查找到其标准提问;
获取与查找到的标准提问相映射的答案文本;
向所述电商平台用户推送所述的答案文本。
扩展的实施例中,本方法还包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
获取电商平台预设的所有知识库中的任一提问范本作为训练样本;
在对所述训练样本构造出编码向量的基础上,调用利用Bert模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;
调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的提问范本所关联的标准提问作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
为解决上述技术问题,本申请采用的另一技术方案是:
本申请提供一种电商客服应答装置,其包括提问获取模块、知识获取模块、相似计算模块以及应答处理模块,其中:所述提问获取模块,用于获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;所述知识获取模块,用于获取该用户指定的商户实例的知识库相对应的知识特征矩阵,其中每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;所述相似计算模块,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;所述应答处理模块,用于根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。
具体化的实施例中,所述提问获取模块包括:文本获取子模块,用于获取电商平台用户的提问文本;文本编码子模块,用于基于所述提问文本构造编码向量;特征提取子模块,用于调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;提问特征子模块,用于构造提问特征矩阵,向其中添加所述的行向量。
具体化的实施例中,所述知识获取模块包括:实例获取子模块,用于获取用户正在访问的商户实例所对应的实例标识;知识库确定子模块,用于根据该实例标识查询映射关系表确定与该实例标识相对应的知识库;知识特征子模块,用于获取该知识库相对应的知识特征矩阵。
扩展的实施例中,本装置还包括知识构造模块,其包括:全量采集子模块,用于获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射;全量编码子模块,用于对每一知识库中的每一提问范本构造相应的编码向量;全量提取子模块,用于调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;全量构造子模块,用于将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵。
具体化的实施例中,所述相似计算模块包括:转置计算子模块,用于求取知识特征矩阵的转置矩阵;矩阵相乘子模块,用于将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的提问范本的相似度。
具体化的实施例中,所述应答处理模块包括:元素匹配子模块,用于从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的提问范本;标准查找子模块,用于根据确定出的所述提问范本在该商户实例的知识库中查找到其标准提问;答案获取子模块,用于获取与查找到的标准提问相映射的答案文本;答案推送子模块,用于向所述电商平台用户推送所述的答案文本。
扩展的实施例中,本装置还包括训练执行模块,其包括:样本获取子模块,用于获取电商平台预设的所有知识库中的任一提问范本作为训练样本;训练特征子模块,用于在对所述训练样本构造出编码向量的基础上,调用利用Bert模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;训练分类子模块,用于调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的提问范本所关联的标准提问作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
为解决上述技术问题,本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述电商客服应答方法的步骤。
为解决上述技术问题本申请实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述电商客服应答方法的步骤。
与现有技术相比,本申请具有如下优点:
本申请一方面构造出提问特征矩阵用于存储用户的提问文本相对应的文本特征行向量,另一方面对应该用户正在访问的商家实例的知识库预构造有知识特征矩阵用于存储该知识库中的提问范本的文本特征行向量,两方面的向量被统一为同一维度,然后基于提问特征矩阵与知识特征矩阵执行快速高效的矩阵乘法操作求取提问文本与该知识库中各提问范本的相似度,这一过程计算量小、语义丰富、内存占用低,最终根据相似度进一步确定出与提问文本相适配的答案文本。整个过程中,计算机运行业务逻辑标准统一,运算高效,方便编程实现,获取结果迅速,实现成本较低,便于部署在电子商务之类的互联网平台中对海量商户实例所接收到的用户提问进行精准高效的智能应答,提升基于独立站的跨境电商平台的后台服务性能。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的电商客服应答方法的基本流程示意图;
图2为本申请的电商客服应答方法构造提问特征矩阵的流程示意图;
图3为本申请的电商客服应答方法获取知识特征矩阵的流程示意图;
图4为本申请的电商客服应答方法构造知识特征矩阵的流程示意图;
图5为本申请的电商客服应答方法计算相似度获得相似矩阵的流程示意图;
图6为本申请的电商客服应答方法确定答案文本的流程示意图;
图7为本申请的电商客服应答方法中文本特征提取器的训练流程示意图;
图8为本申请的电商客服应答装置的基本结构示意图;
图9为本申请一个实施例的计算机设备的基本结构框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请部分技术方案可部署在云端服务器,其可以与业务上相关的服务器实现数据通信连接以协调在线服务,还可与其他相关服务器构成逻辑上相关联的服务机群,来为相关的终端设备例如智能手机、个人计算机、第三方服务器等提供服务。所述的智能手机和个人计算机均可通过公知的网络接入方式接入互联网,与本申请的服务器建立数据通信链路,以便访问和使用所述服务器所提供的服务。
对于服务器而言,一般通过提供在线服务的服务引擎开放相应的程序接口供各种终端设备进行远程调用,本申请中适于部署于服务器的相关技术方案,便可以此种方式实现于服务器中。
本申请所称的计算机程序,即应用程序,以计算机程序语言开发而成,安装于计算机设备中,包括服务器、终端设备等,用于实现本申请所限定的相关功能,除非特别指定,否则与其所采用的开发语言无关。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
请参阅图1所示本申请的电商客服应答方法在其典型实施例中的基本流程示意图,本申请提供的一种电商客服应答方法,被编程为应用程序,部署于服务器中,主要服务于电子商务平台,尤其是基于独立站的跨境电商平台,供其满足自动应答访问各商户实例的用户所提出的问题的需要,实现全平台的智能客户标准化实现机制,其包括如下步骤:
步骤S1100、获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;
本申请所适用的一个应用场景是一个基于独立站的跨境电商平台,不同于传统的电子商务平台,跨境电商平台为各个商家自建独立网站,在其独立网站中运行由平台方提供后台支持的商户实例,通过该商户实例的运行而实现线上店铺。访问各家商户实例的用户所属的用户账号体系,由跨境电商平台集中统一支持和维护,除此之外,跨境平台方还会为各个商户实例提供其他后台支持,包括提供本申请所实现的自动客户系统的支持。为此,平台方适应各个品类提供有一系列的多个知识库模板,各个商家可以在后台调用其所销售产品相对应的知识库模板,选取模板中的一些预设的提问范本,来构造适于自有的商户实例相关联的知识库。商户实例的知识库既可以与其中一个模板的内容完全相同,也可以不同,既可以选取多个模板,也可包含自定义内容,均不影响本申请的实施。可以理解,知识库模板与据此所定义的知识库,具有相同的组织结构,典型的,包括多个标准提问,每个标准提问均与一个答案文本相映射,构成映射关系数据;对于同一标准提问,可能存在一个或多个与之相关联的相似提问,无论是标准提问还是相似提问,均被以提问范本的形式表示,所述提示范本一般是适应某国语言以自然语言表述而成的问句。
所述的提问文本,一般通过用户在商户实例中调出自动客服界面,由用户在该客服界面中输入,然后发送提交给本申请电商平台的后台处理,由此即可被本申请的技术方案所获取。可以理解,用户在客服界面中输入所述的提问文本的目的,在于获取一个在语义上相适配的答案文本,以解决用户的现实疑问。这一答案文本,通常是商户实例所对应的知识库中的一个答案文本。
获得用户提交的提问文本之后,为了便于后续操作,可以对其实施格式化预处理操作,本领域技术人员可以采用多种公知的处理方式实现这些操作,形成格式化后结果。
对于格式化后结果,为了便于本申请所调用的文本特征提取器进行语义学习,便应该文本特征提取器的规范转换为该文本特征提取器所能处理的编码向量,以便输入给该文本特征提取器做进一步的处理。
本申请中,推荐采用经过预训练至收状态的Bert模型来实现所述的文本特征提取器,Bert模型基于注意力机制实现,具有深层语义理解能力,适于为本申请的提问文本提取文本特征。为其提供的编码向量通常包括三个方面的编码向量,即字向量、位置向量、文本向量,这几个向量的加和即构成编码向量。对于一个输入,构造为一个所述的编码向量输入给文本特征提取器即可。当然,本领域技术人员也可以采用其他能够实现同等功能的模型来替换Bert模型,只要据此构造的文本特征提取器能够依据格式化后结果提取出提问文本中的文本特征即可。
所述的文本特征提取器从提问文本中提取的文本特征,被表述为一个维度确定的行向量,例如512维的行向量,该行向量也可视为一个1*512的提问特征矩阵,或者另行独立构造一个提问特征矩阵,将该行向量添加其中即可。
可以理解,如果用户提交的内容中包含多个提问文本,理论上还可将其分解为多个提问文本,针对每个提问文本进行特征提取,从而获得多个行向量,将其添加到所述的提问特征矩阵中,为兼顾提问特征矩阵中存在多个提问文本相对应的行向量的情况,此处示例表示该提问特征矩阵的尺寸为B*512大小。
步骤S1200、获取该用户指定的商户实例的知识库相对应的知识特征矩阵,其中每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同:
适应本申请所需,为每一商户实例的知识库预构造有一个相对应的知识特征矩阵,该知识特征矩阵与所述提问特征矩阵具有相同的组织结构,其包含多个行向量,每个行向量是一个提问范本的文本特征,这一行向量的维数与提问特征矩阵中行向量的维数相同,例如前述的512维,设该知识特征矩阵中有N个提问范本,则其矩阵尺度为N*512。其中,N值的大小,一般视乎商户实例的知识库内提问范本的总量而定,是预先对商户实例的知识库内的提问范本进行特征提取而构建的。
为了构造这一知识特征矩阵,需预先收集商户实例预配置的知识库,然后调用文本特征提取器对其进行特征提取。
为了确保知识特征矩阵中的行向量与提问特征矩阵中的行向量具有相同维度,与构造提问特征矩阵时一样,采用相同的文本特征提取工具,对各知识库中的各个提问范本进行文本特征提取,最终也一样归一化为例如512维的行向量,添加到知识特征矩阵中,由此完成为一个知识库构造其相应的知识特征矩阵。
经过上述的处理,所述提问文本、提问范本的文本特征均被表示为具有相同维度的行向量,分别对应存储在提问特征矩阵、知识特征矩阵中。至此,设提问范本的总数为N,则知识特征矩阵为N*512的线性空间,与B*512的提问特征矩阵具有相同的行向量长度,两者行向量长度相同,方便后续的计算。
为了便于后续的索引,可以将提问范本在相应的知识库中的寻址信息,或称索引标识,以及该提问范本在所述知识特征矩阵中的索引标识提取出来,构造成映射关系数据,存储于一个索引库中,以供后续可依据所述的索引标识反向在相应的知识库中定位到相应的提问范本。
对应每一商户实例所关联的知识库,均可执行本步骤的操作,以便为电商平台中的每一商户实例的知识库都构造一个相应的知识特征矩阵,以候随时调用。
当用户在一个商户实例的客户界面中进行交互时,后台服务器自然而然可以获知该商户实例,由此即可根据该商户实例确定与其相关联的知识库,进而确定与该知识库相关联的知识特征矩阵,由此而获取到该知识特征矩阵。
步骤S1300、基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵:
本申请基于余弦相似度算法原理来实现提问特征矩阵与知识特征矩阵之间相似度的计算。根据余弦相似度原理,将B*512的提问特征矩阵与N*512的知识特征矩阵两个向量矩阵进行矩阵相乘所得到的相似矩阵,可以反映两者的相似度。
需要注意的是,提问特征矩阵与知识特征矩阵均是以相同的结构存储提问文本、提问范本的行分量的,因此,在应用余弦相似度算法时,需将知识特征矩阵转置后再与提问特征矩阵做矩阵乘法运算,即如,将B*512的提问特征矩阵与N*512维的知识特征矩阵的512*N的转置矩阵进行矩阵相乘,获得B*N的相似矩阵。可以理解,所述的相似矩阵中,其每个行向量存储单个所述提问文本分别与所有提问范本相比的相似度,其每个元素反映一个提问文本与一个提问范本之间的相似度。
该相似矩阵中的元素数值,其数值越高,表征提问文本与提问范本之间的相似度越高;其数值越低,表征提问文本与提问范本之间的相似度越低。
尽管该相似矩阵的这一数值意义非常直观,但未必方便运算,因而,可以根据实际情况进一步对其适用归一化操作,对该相似矩阵做适当的变换,使得所述的相似度可以映射到一个诸如[0,1]的线性空间,再行利用。可以理解,转换后所得的相似矩阵,依然是B*N的矩阵。
可以看出,矩阵变换运算的效率相对于其他计算方式是非常高的,有利于节约系统运存开销,对于需要处理海量的并发用户提问的客服系统而言,其作用不言而喻。
步骤S1400、根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问:
确定所述的相似矩阵之后,便可获得了每个提问文本到知识库中各个提问范本之间的相似度,据此,可以以提问文本为单位,对相似矩阵中的各个元素进行聚类,获得每个提问文本与多个具有相似度关联的提问范本之间的相似度数据,在此基础上,可以对每个提问文本的多个相似度数据进行排序,确定出其中最相似的元素,即在所述的相似矩阵中与该提问文本相对应的相似度最大的元素,该元素的行坐标是指向具体提问文本,而其列坐标则指向具体的提问范本,由此便获得了与用户提交的提问文本相对应的提问范本的索引标识。
根据所述的提问范本的索引标识查询此前所预构建的索引库,便可反向查询出该提问范本在所述的商户实例相关联的知识库中的具体位置,据此可进一步确定出其相关联的标准提问,根据该标准提问确定出对应的答案文本,进而可将答案文本输出至相应的用户处,以应答该用户的提问。
由本实施例的详细揭示可以看出,电商平台为其平台内所有的商户实例的自动客服提供了标准化的业务逻辑,通过对平台内的所有商户实例的知识库进行系统化的组织以及运用该业务逻辑,使得其客服系统更适于基于独立站的跨境电商平台实现自动客服功能。
本申请一方面构造出提问特征矩阵用于存储用户的提问文本相对应的文本特征行向量,另一方面对应该用户正在访问的商家实例的知识库预构造有知识特征矩阵用于存储该知识库中的提问范本的文本特征行向量,两方面的向量被统一为同一维度,然后基于提问特征矩阵与知识特征矩阵执行快速高效的矩阵乘法操作求取提问文本与该知识库中各提问范本的相似度,这一过程计算量小、语义丰富、内存占用低,最终根据相似度进一步确定出与提问文本相适配的答案文本。整个过程中,计算机运行业务逻辑标准统一,运算高效,方便编程实现,获取结果迅速,实现成本较低,便于部署在电子商务之类的互联网平台中对海量商户实例所接收到的用户提问进行精准高效的智能应答,提升基于独立站的跨境电商平台的后台服务性能。
请参阅图2,具体化的实施例中,所述步骤S1100,包括如下步骤:
步骤S1110、获取电商平台用户的提问文本:
如前所述,通过接收正在电商平台的某一商户实例访问的用户所提交的聊天消息,可以获取其提问文本。
步骤S1120、基于所述提问文本构造编码向量:
适应Bert模型输入的需要,BERT模型通过查询字向量表将提问文本中的每个字转换为一维向量,作为模型输入。此外,模型输入除了字向量,还包含另外两个部分:文本向量与位置向量。所述的文本向量的取值在模型训练过程中自动学习,用于刻画文本的全局语义信息,并与单字/词的语义信息相融合。所述的位置向量:由于出现在文本不同位置的字/词所携带的语义信息存在差异(比如:“我想你”和“你想我”),因此,BERT模型对不同位置的字/词分别附加一个不同的向量以作区分。BERT模型将字向量、文本向量和位置向量的加和作为模型输入所需的编码向量。
步骤S1130、调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量:
同理,本申请推荐采用Bert模型或其升级版本所实现的文本特征提取器来对所述的编码向量进行特征提取,从而获得相应的文本特征,例如Bert模型可以将文本特征输出为1*512的行向量。
步骤S1140、构造提问特征矩阵,向其中添加所述的行向量:
在内存中构造一个用于存放由所述提问文本提取出来的行向量的空矩阵,将提取出来的行向量添加至该空矩阵中,便完成所述提问特征矩阵的构造。
本实施例进一步给出了较优的实施方式,能够深化对提问文本的语义理解,使得格式化后结果及文本特征均具有较高的语义理解能力,能够进一步提升根据本申请所实现的客服系统的智能化程度。
请参阅图3,具体化的实施例中,所述步骤S1200,包括如下步骤:
步骤S1210、获取用户正在访问的商户实例所对应的实例标识:
当所述客服界面被用户调用时,后台的客户系统会获取用户调用时所提供的商户实例的实例标识。
步骤S1220、根据该实例标识查询映射关系表确定与该实例标识相对应的知识库:
商户实例与其所配置的知识库之间的映射关系数据通常被存储于一个映射关系表中,因此,以商户实例的实例标识查询该映射关系表,便可确定出与该商户实例相关联的知识库。
步骤S1230、获取该知识库相对应的知识特征矩阵:
同理,知识库与其知识特征矩阵之间存在一一对应的映射关系,根据该知识库(通常是基标识),便可获取到此前为之预构建的知识特征矩阵。
本实施例进一步实现了对商户实例、知识库、知识特征矩阵之间的映射关系的组织,使得电商平台后台对客服系统相关数据的组织和调度更为有序,有助于提升客服系统响应海量并发提问请求的能力。
请参阅图4,扩展的实施例中,本方法还包括构造所述知识库的知识特征矩阵的步骤,其包括如下具体步骤:
步骤S2100、获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射:
为了方便电商平台集中化为其平台上海量的知识库构造相应的知识特征矩阵,便需集中获取平台中所有商户实例预关联的知识库,尽可能全面地获取所有知识库。所述知识库的具体组织结构请参阅前文,此处恕不赘述。
步骤S2200、对每一知识库中的每一提问范本构造相应的编码向量:
同理,参照前文,可以调用前文各实施例所揭示的算法或工具,集中地对每一知识库中的每一提问范本进行格式化处理,然后构造出其相对应的编码向量。
步骤S2300、调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量:
同理,调用前文各实施例所采用的相同的文本特征提取器对每一编码向量进行特征提取,便可获得相应的文本特征,文本特征表示为前文各实施例所述的具有确定维度的行向量。
步骤S2400、将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵:
由于所述的知识特征矩阵是与每个商户实例的知识库一一对应的,因此,依据同一知识库中的提问范本所提取的文本特征行向量便被添加到同一相应的知识特征矩阵中,最终完成所有知识库的知识特征矩阵的构建,将知识特征矩阵与知识库进行关联存储即可供后续调用。
本实施例适应电商平台在升级系统或者初次配置的需要而给出对平台内的知识库进行集中式表示学习的实现方式,可以进一步体现出高效性。
请参阅图5,具体化的实施例中,所述步骤S1300,包括如下步骤:
步骤S1310、求取知识特征矩阵的转置矩阵:
可以理解,由于知识特征矩阵如前所述为N*512的矩阵,而提问特征矩阵为B*512的矩阵,为了获得B*N的相似矩阵,此处先行对知识特征矩阵做变换,获得其512*N的转置矩阵。
步骤S1320、将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的提问范本的相似度:
根据线性代数原理,将提问特征矩阵与所述的转置矩阵做矩阵相乘后,便获得B*N的相似矩阵,又,根据余弦相似度原理,相似矩阵中的元素表征一个提问文本bn和与其相比较的提问范本nn之间的相似度,因此,相似矩阵中存储的正是每个提问文本分别与各个提问范本之间的相似度数据。相似矩阵中的每个元素,其坐标信息具有指示作用,其中,行坐标指示具体提问文本,其列坐标指示具体提问范本,根据一个元素所处坐标,可以确定其相对应的提问文本和提问范本,并确定两者之间的相似度。
本实施例进一步给出以矩阵实现相似度计算的具体方案,可以看出,其计算效率非常高,对于电商平台来说,用于处理海量并发提问请求时,将取得特别高效的效果,方便对用户提问做出即时响应。
请参阅图6,具体化的实施例中,所述步骤S1400,包括如下步骤:
步骤S1410、从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的提问范本:
如前所述,确定所述的相似矩阵之后,便可获得了每个提问文本到知识库中各个提问范本之间的相似度,据此,可以以提问文本为单位,对相似矩阵中的各个元素进行聚类,获得每个提问文本与多个具有相似度关联的提问范本之间的相似度数据,为方便计算运算,每个提问文本相对应的这些相似度数据,可以记入一个候选子集ln中,每个候选子集的元素可以采用对值表示为{{x1,y1},d},其中{x1,y1}表示该元素在相似矩阵中的坐标,x1表示具体提示文本所在的行坐标,y1表示对应的提问范本所在的列坐标,d表示该提问文本与该提问范本之间的具体相似度。
在此基础上,可以根据相似度对每个候选子集中的对值进行自大至小的排序,其中最大的对值即为最高相似度的元素,由此便获得了与用户提交的提问文本相对应的提问范本的索引标识y1,可以用于确定出具体的提问范本。
步骤S1420、根据确定出的所述提问范本在该商户实例的知识库中查找到其标准提问:
考察本申请的技术方案的实现过程,可以看出,在构建所述的N*512的知识特征矩阵的过程中,构造有一个索引库,索引库中将提问范本的寻址信息与该提问范本在该知识特征矩阵中的排序行号(索引标识)之间建立了对应关系,因此,给出一个提问范本在该知识特征矩阵中的行号,便可查询索引库确定其相应的寻址信息,利用这一寻址信息可以去知识库中查找其标准提问。
当B*512的提问特征矩阵与N*512的知识特征矩阵的512*N的转置矩阵进行矩阵相乘之后,便获得了B*N的相似矩阵,此时,提问文本按行B对应不变,而提问范本则按列N对应。因此,知识特征矩阵中的行号被一一对应传递到相似矩阵中作为列号。
进而,当构造所述的候选子集的过程中,通过建立集合中的对值,在对值中包含了相似矩阵中的行号x1和列号y1,由此可见,这些集合均继承了所述提问范本的行号的对应关系。
根据这一过程可以看出,索引库中,提问范本的索引标识在本申请技术方案的整个过程的各个环节均被对应传递,因此,通过所述的集合的每个对值中的y1,即可查询索引库获取到与其相对应的提问范本的寻址信息。
根据所述的提问范本的寻址信息查询此前所预构建的索引库,便可反向查询出该提问范本在所述的商户实例相关联的知识库中的具体位置,据此可进一步确定出其相关联的标准提问。
步骤S1430、获取与查找到的标准提问相映射的答案文本:
由于商户实例预配置的所述知识库中存储了各个标准提问与其相应的答案文本的映射关系数据,因此,根据标准提问便可在该知识库中确定出所述的答案文本。
步骤S1440、向所述电商平台用户推送所述的答案文本:
获得所述的答案文本之后,可以按需对其进行格式化处理,然后直接推送给所述的电商平台用户,以使其被显示至该用户正在聊天的客服界面中。当然,如果该用户已经退出客服界面,该答案文本也会相应被存储至其消息记录中。
本实施例给出更为细致的方便编程实现的实例,可以更为高效地从所述相似矩阵中确定与所述提问文本相对应的具有最高相似度的提问范本,然后根据提问范本查询商户实例相对应的知识库,从知识库中查询出相对应的答案文本应答相关用户。由于本申请实现了基于深度语义学习的技术思路,使得根据相似矩阵查找到的答案文本能够体现语义上的高度关联,故而进一步提升了客服系统的智能化程度。
请参阅图7,扩展的实施例中,本方法还包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
步骤S3100、获取电商平台预设的所有知识库中的任一提问范本作为训练样本:
如前所述,采用Bert模型用于实现本实施例的文本特征提取器,针对Bert模型,需要预先实施训练,将其训练至收敛状态,以便高效服务于本申请的各个实施例的技术方案。
较佳的方式是将电商平台中各商户实例所预先配置的知识库视为训练样本库,因此,本实施例中可以获取电商平台中的全量知识库用于训练,其中的提问范本,包括标准提问及其相似提问,均被作为训练样本使用,而其中的标准提问,则可作为Bert模型连接分类器之后的监督标签。
步骤S3200、在对所述训练样本构造出编码向量的基础上,调用利用Bert模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征:
与本申请前述各实施例同理,训练样本可预先构造为相应的编码向量,以便为Bert模型提供输入。Bert模型根据其自身的实现逻辑对输入的编码向量进行文本特征提取,最终获得相应的文本特征。
步骤S3300、调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的提问范本所关联的标准提问作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
为了实现对Bert模型的任务训练,其输出的文本特征被馈入一个Softmax()多分类器进行分类,以便获得其到各个标准提问相对应的分类的评分。由于标准提问在分类器中被作为监督标签采用,因此,分类器将根据监督标签的监督,向Bert模型反向传播,以修正其权重参数,直至整个损失函数达致收敛,最终完成训练。可以理解,所述损失函数基于交叉熵实现即可。
本实施例进一步给出了实现本申请的技术方案所需的文本特征提取器的训练过程,针对多商家多知识库提出一个智能客服解决方案,通过训练一个深度学习的分类模型,进行参数共享,可以看出,由于在训练过程中采用了电商平台的全量知识库进行训练,Bert模型更容易收敛,由此获得的文本特征提取器,其表示学习能力更强,更能精准地为提问文本匹配到相适配的提问范本,有助于提升自动客服的内容匹配度,提升用户交互体验。
请参阅图8,本申请实施例还提供一种电商客服应答装置,其包括提问获取模块1100、知识获取模块1200、相似计算模块1300以及应答处理模块1400,其中:所述提问获取模块,用于获取电商平台用户的提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;所述知识获取模块,用于获取该用户指定的商户实例的知识库相对应的知识特征矩阵,其中每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;所述相似计算模块,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;所述应答处理模块,用于根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。
具体化的实施例中,所述提问获取模块1100包括:文本获取子模块,用于获取电商平台用户的提问文本;文本编码子模块,用于基于所述提问文本构造编码向量;特征提取子模块,用于调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;提问特征子模块,用于构造提问特征矩阵,向其中添加所述的行向量。
具体化的实施例中,所述知识获取模块1200包括:实例获取子模块,用于获取用户正在访问的商户实例所对应的实例标识;知识库确定子模块,用于根据该实例标识查询映射关系表确定与该实例标识相对应的知识库;知识特征子模块,用于获取该知识库相对应的知识特征矩阵。
扩展的实施例中,本装置还包括知识构造模块,其包括:全量采集子模块,用于获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射;全量编码子模块,用于对每一知识库中的每一提问范本构造相应的编码向量;全量提取子模块,用于调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;全量构造子模块,用于将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵。
具体化的实施例中,所述相似计算模块1300包括:转置计算子模块,用于求取知识特征矩阵的转置矩阵;矩阵相乘子模块,用于将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的提问范本的相似度。
具体化的实施例中,所述应答处理模块1400包括:元素匹配子模块,用于从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的提问范本;标准查找子模块,用于根据确定出的所述提问范本在该商户实例的知识库中查找到其标准提问;答案获取子模块,用于获取与查找到的标准提问相映射的答案文本;答案推送子模块,用于向所述电商平台用户推送所述的答案文本。
扩展的实施例中,本装置还包括训练执行模块,其包括:样本获取子模块,用于获取电商平台预设的所有知识库中的任一提问范本作为训练样本;训练特征子模块,用于在对所述训练样本构造出编码向量的基础上,调用利用Bert模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;训练分类子模块,用于调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的提问范本所关联的标准提问作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
本申请实施例还提供计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种电商客服应答方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种电商客服应答方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中各个模块/子模块的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有电商客服应答装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例的电商客服应答方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请基于矩阵操作和知识库的有序组织实现对智能客服问答匹配的运算和判决,运算效率高,响应迅速,开销较小,特别适合服务于基于独立站的跨境电商平台。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (8)

1.一种电商客服应答方法,其特征在于,包括如下步骤:
获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射;
用于对每一知识库中的每一提问范本构造相应的编码向量;
用于调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;
用于将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵,将商品实例的实体标识与其知识库相映射存储于映射关系表中;
获取基于独立站的跨境电商平台用户的多个提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;
根据该用户指定的独立站相对应的商户实例的实例标识查询映射关系表确定相应的知识库,获取该知识库相对应的知识特征矩阵,其中,所述知识库根据所述跨境电商平台所提供的知识库模板所构造,每个商户实例的知识库均预构造有相对应的知识特征矩阵,每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;
基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;
根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。
2.根据权利要求1所述的电商客服应答方法,其特征在于,获取基于独立站的跨境电商平台用户的多个提问文本的文本特征,构造提问特征矩阵,包括如下步骤:
获取电商平台用户的提问文本;
基于所述提问文本构造编码向量;
调用预训练的文本特征提取器对所述编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;
构造提问特征矩阵,向其中添加所述的行向量。
3.根据权利要求1所述的电商客服应答方法,其特征在于,基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵,包括如下步骤:
求取知识特征矩阵的转置矩阵;
将提问特征矩阵与所述转置矩阵进行矩阵相乘获得相似矩阵,该相似矩阵中元素的数值表征提问文本与该元素所处坐标相对应的提问范本的相似度。
4.根据权利要求1中所述的电商客服应答方法,其特征在于,根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问,包括如下步骤:
从相似矩阵中查询定位到与该提问文本具有最高相似度的元素,根据该元素的坐标信息确定相对应的提问范本;
根据确定出的所述提问范本在该商户实例的知识库中查找到其标准提问;
获取与查找到的标准提问相映射的答案文本;
向所述电商平台用户推送所述的答案文本。
5.根据权利要求1或2所述的电商客服应答方法,其特征在于,本方法包括对所述文本特征提取器实施预训练的步骤,其包括如下迭代执行的步骤:
获取电商平台预设的所有知识库中的任一提问范本作为训练样本;
在对所述训练样本构造出编码向量的基础上,调用利用Bert模型实现的文本特征提取器,进行文本特征提取,获得相应的文本特征;
调用分类模型对每一文本特征进行分类获得分类结果,利用训练样本所指向的提问范本所关联的标准提问作为所述分类结果的监督标签,反向传播修正文本特征提取器的权重参数,直至其损失函数达致收敛以完成训练。
6.一种电商客服应答装置,其特征在于,其包括:
全量采集子模块,用于获取所有商户实例预关联的所有知识库,每个知识库包括表示为提问范本形式的多个标准提问与多个相似提问,每个标准提问与其自身语义相似的多个相似提问相关联,与其对应的答案文本相映射;
全量编码子模块,用于对每一知识库中的每一提问范本构造相应的编码向量;
全量提取子模块,用于调用预训练的文本特征提取器对每一编码向量进行特征提取,获得相应的文本特征,该文本特征被表示为行向量;
全量构造子模块,用于将同一知识库的所述行向量添加至为该知识库构造的同一知识特征矩阵,将商品实例的实体标识与其知识库相映射存储于映射关系表中;
提问获取模块,用于获取基于独立站的跨境电商平台用户的多个提问文本的文本特征,构造提问特征矩阵,其中每个行向量存储单个所述的文本特征;
知识获取模块,用于根据该用户指定的独立站相对应的商户实例的实例标识查询映射关系表确定相应的知识库,获取该知识库相对应的知识特征矩阵,其中,所述知识库根据所述跨境电商平台所提供的知识库模板所构造,每个商户实例的知识库均预构造有相对应的知识特征矩阵,每个行向量存储所述知识库中单个提问范本的文本特征,知识特征矩阵与提问特征矩阵的行向量维度相同;
相似计算模块,用于基于提问特征矩阵与知识特征矩阵计算相似度以获得相似矩阵;
应答处理模块,用于根据相似度定位至与该提问文本最相似的提问范本,输出与该提问范本相对应的答案文本以应答用户提问。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项权利要求所述的电商客服应答方法的步骤。
8.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至5中任一项权利要求所述的电商客服应答的方法的步骤。
CN202110822933.9A 2021-07-21 2021-07-21 电商客服应答方法及其相应的装置、设备、介质 Active CN113434657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110822933.9A CN113434657B (zh) 2021-07-21 2021-07-21 电商客服应答方法及其相应的装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110822933.9A CN113434657B (zh) 2021-07-21 2021-07-21 电商客服应答方法及其相应的装置、设备、介质

Publications (2)

Publication Number Publication Date
CN113434657A CN113434657A (zh) 2021-09-24
CN113434657B true CN113434657B (zh) 2023-04-07

Family

ID=77761209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110822933.9A Active CN113434657B (zh) 2021-07-21 2021-07-21 电商客服应答方法及其相应的装置、设备、介质

Country Status (1)

Country Link
CN (1) CN113434657B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321419A (zh) * 2019-06-28 2019-10-11 神思电子技术股份有限公司 一种融合深度表示与交互模型的问答匹配方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092988B2 (en) * 2012-11-16 2015-07-28 International Business Machines Corporation Multi-dimensional feature merging for open domain question answering
US20220043972A1 (en) * 2019-02-25 2022-02-10 Nippon Telegraph And Telephone Corporation Answer generating device, answer learning device, answer generating method, and answer generating program
CN109918491B (zh) * 2019-03-12 2022-07-29 焦点科技股份有限公司 一种基于知识库自学习的智能客服问句匹配方法
CN111125328B (zh) * 2019-12-12 2023-11-07 深圳数联天下智能科技有限公司 文本处理方法及相关设备
CN111737433A (zh) * 2020-06-24 2020-10-02 支付宝(杭州)信息技术有限公司 一种用户问题的聚类解答方法和系统
CN112182180A (zh) * 2020-09-27 2021-01-05 京东方科技集团股份有限公司 问答处理的方法、电子设备、计算机可读介质
CN112307164A (zh) * 2020-10-15 2021-02-02 江苏常熟农村商业银行股份有限公司 信息推荐方法、装置、计算机设备和存储介质
CN112418875B (zh) * 2020-10-21 2024-03-26 航天信息股份有限公司 跨平台税务智能客服语料迁移方法及装置
CN112527972A (zh) * 2020-12-25 2021-03-19 东云睿连(武汉)计算技术有限公司 基于深度学习的智能客服聊天机器人实现方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321419A (zh) * 2019-06-28 2019-10-11 神思电子技术股份有限公司 一种融合深度表示与交互模型的问答匹配方法

Also Published As

Publication number Publication date
CN113434657A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
US10650311B2 (en) Suggesting resources using context hashing
CN110866042B (zh) 表格智能查询方法、装置及计算机可读存储介质
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN114428845A (zh) 智能客服自动应答方法及其装置、设备、介质、产品
CN114065750A (zh) 商品信息匹配、发布方法及其装置、设备、介质、产品
CN113962224A (zh) 命名实体识别方法及其装置、设备、介质、产品
CN113792786A (zh) 商品对象自动分类方法及其装置、设备、介质、产品
CN114840869A (zh) 基于敏感度识别模型的数据敏感度识别方法及装置
CN112906361A (zh) 文本数据的标注方法和装置、电子设备和存储介质
CN115730597A (zh) 多级语义意图识别方法及其相关设备
CN115689672A (zh) 聊天式商品导购方法及其装置、设备、介质
CN116303558A (zh) 查询语句生成方法、数据查询方法及生成模型训练方法
CN115062134A (zh) 知识问答模型训练及知识问答方法、装置和计算机设备
CN114626926A (zh) 商品搜索类目识别方法及其装置、设备、介质、产品
CN108021556A (zh) 用于获取信息的方法及装置
CN114265921A (zh) 问答知识库构建方法及其装置、设备、介质、产品
CN110990527A (zh) 自动问答方法及装置、存储介质及电子设备
CN112598039B (zh) 获取nlp分类领域阳性样本方法及相关设备
CN116186295B (zh) 基于注意力的知识图谱链接预测方法、装置、设备及介质
CN116414964A (zh) 智能客服问答知识库构建方法、装置、设备及介质
CN113434657B (zh) 电商客服应答方法及其相应的装置、设备、介质
CN111813899A (zh) 基于多轮会话的意图识别方法及装置
CN116955561A (zh) 问答方法、装置、电子设备以及存储介质
CN115129804A (zh) 地址联想方法及其装置、设备、介质、产品
CN114398883B (zh) 演示文稿生成方法、装置、计算机可读存储介质及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant