CN117271787A - 知识库构建、智能客服实现与知识问答方法、设备及介质 - Google Patents
知识库构建、智能客服实现与知识问答方法、设备及介质 Download PDFInfo
- Publication number
- CN117271787A CN117271787A CN202311084748.XA CN202311084748A CN117271787A CN 117271787 A CN117271787 A CN 117271787A CN 202311084748 A CN202311084748 A CN 202311084748A CN 117271787 A CN117271787 A CN 117271787A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- merchant
- target
- information
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000009411 base construction Methods 0.000 title claims abstract description 29
- 239000000463 material Substances 0.000 claims abstract description 157
- 230000004044 response Effects 0.000 claims abstract description 26
- 239000013598 vector Substances 0.000 claims description 54
- 239000012634 fragment Substances 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 18
- 230000004308 accommodation Effects 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 15
- 230000016571 aggressive behavior Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 description 201
- 230000008569 process Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013486 operation strategy Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Computer Interaction (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种知识库构建、智能客服实现与知识问答方法、设备及介质。在本申请实施例中,可展示知识内容录入界面,并响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容;根据该至少一个知识主题及其对应的文本内容,构建该目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。在这种实施方式中,减轻了对商家用户根据用户咨询问题配置触发规则以及对应触发规则的回答内容等操作的依赖,商家用户只需执行基础知识素材的上传操作即可指导智能客服实现智能问答,极大减轻了商家的配置工作量,简化了商家用户的操作复杂度,从而降低了智能客服的运营成本。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种知识库构建、智能客服实现与知识问答方法、设备及介质。
背景技术
随着互联网技术的发展,用户在线上购物平台能看到越来越丰富的品类。对于旅游行业来说,履约环节占比重,用户诉求个性化强,商品单价高,消费者更倾向于在前置咨询环节充分和商家沟通,确保商品可以满足自己需求。对于商家而言,需要投入大量人工客服提供咨询服务,而售前环节大量的用户问题存在重复性,于是衍生出了智能客服产品,为商家解决重复咨询的承接问题,释放人工客服成本。
目前,智能客服的实现依赖商家根据用户咨询问题配置触发规则以及对应触发规则的回答。例如,触发规则1:用户问题包含“你好”时,返回答案=“你好,请问有什么问题”;触发规则2:用户问题包含“如何退款”时,返回答案=“可以在订单详情页点击退款按钮”;等等。对商家来说,需要逐个查看用户历史会话信息,并逐个梳理问题和答案的映射关系,配置工作量大,商家运营智能客服的成本高,致使商家对智能客服的使用率较低。
发明内容
本申请的多个方面提供一种知识库构建、智能客服实现与知识问答方法、设备及介质,用以提供一种简便的知识库构建方案,简化商家的配置工作,降低智能客服的运营成本。
本申请实施例提供一种用于智能客服的知识库构建方法,包括:响应知识库构建请求,展示知识内容录入界面;响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,所述基础知识素材包含至少一个知识主题及其对应的文本内容;根据所述至少一个知识主题及其对应的文本内容,构建所述目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。
可选地,所述智能客服场景基于符合预设参数量范围的语言模型实现,所述语言模型基于所述目标知识库生成所述智能客服场景中用户问题的答案信息。
可选地,响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,包括以下至少一种操作:响应目标商家在所述知识内容录入界面上的信息录入操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的基础知识素材;响应目标商家在所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,所述目标文档中包含基础知识素材;响应目标商家在所述知识内容录入界面上的线上触发操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取基础知识素材。
可选地,所述知识内容录入界面包括商家知识选项和商品知识选项,所述商家知识选项对应有信息录入控件和文本上传控件,所述商品知识选项对应有信息录入控件、文本上传控件和线上触发控件;其中,响应目标商家在所述知识内容录入界面上的信息录入操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的基础知识素材,包括:响应对所述商家知识选项及其对应的信息录入控件的选择操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的商家维度的基础知识素材;和/或,响应对所述商品知识选项及其对应的信息录入控件的选择操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的商品维度的基础知识素材;其中,响应所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,所述目标文档中包含基础知识素材,包括:响应对所述商家知识选项及其对应的文本上传控件的选择操作,获取所述目标商家上传的第一目标文档,所述第一目标文档中包含商家维度的基础知识素材;和/或,响应对所述商品知识选项及其对应的文本上传控件的选择操作,获取所述目标商家上传的第二目标文档,所述第二目标文档中包含商品维度的基础知识素材;其中,响应所述知识内容录入界面上的线上触发操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取基础知识素材,包括:响应对所述商品知识选项及其对应的线上触发控件的选择操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取商品维度的基础知识素材。
可选地,从所述服务链接对应的服务页面中获取商品维度的基础知识素材,包括:从所述服务链接对应的服务页面中,获取各个商品的详情页面和/或对应的问答页面;从各个商品的详情页面和/或问答页面中,获取各个商品相关的知识主题以及对应的文本内容,作为商品维度的基础知识素材。
可选地,响应所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,包括:响应所述知识内容录入界面上的文本上传操作,获取所述目标商家日常积累的宣传文档、会议文档和/或培训文档,作为目标文档。
可选地,根据所述至少一个知识主题对应的文本内容,构建所述目标商家应用于大语言模型的目标知识库,包括:对所述至少一个知识主题对应的文本内容进行分词处理,以得到所述至少一个知识主题各自对应的多个文本片段;对所述至少一个知识主题及其各自对应的多个文本片段进行向量化处理,以得到所述至少一个知识主题各自对应的主题向量以及多个文本片段向量;根据所述至少一个知识主题各自对应的主题向量以及多个文本片段向量,构建所述目标商家应用于大语言模型的目标知识库。
可选地,在旅游场景下,所述至少一个知识主题及其对应的文本内容至少包括:至少一种交通知识主题以及每种交通知识主题下用于描述交通攻略的文本内容;至少一种住宿知识主题以及每种住宿知识主题下用于描述住宿攻略的文本内容;以及,至少一种游玩知识主题以及每种游玩知识主题下用于描述度假攻略的文本内容。
可选地,所述至少一种交通知识主题包括:飞机航班信息和/或票价信息;所述至少一种住宿知识主题包括:酒店位置和/或房价信息;所述至少一种游玩知识主题包括:景区信息、游玩路线信息和/或签证信息。
本申请实施例还提供一种智能客服实现方法,包括:响应知识库构建请求,展示知识内容录入界面;响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,所述基础知识素材包含至少一个知识主题及其对应的文本内容;根据所述至少一个知识主题及其对应的文本内容,构建所述目标商家的目标知识库;将所述目标知识库与符合预设参数量范围的语言模型关联,以使所述语言模型在智能客服场景中生成与用户问题匹配的答案信息;其中,所述语言模型被所述目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
本申请实施例还提供一种知识问答方法,包括:接收用户问题信息,所述用户问题信息对应于目标商家;基于知识召回策略从所述目标商家的目标知识库中获取与所述用户问题信息适配的知识主题及其对应的文本片段;其中,所述目标知识库采用本申请实施例提供的知识库构建方法构建得到;根据所述知识主题及其对应的文本片段以及提示词模版,生成提示词;将所述提示词输入符合预设参数量范围的语言模型,以使所述语言模型生成与所述用户问题信息匹配的答复信息。
本申请实施例还提供一种电子设备,包括:存储器和处理器;所述存储器用于存储一条或多条计算机指令;所述处理器用于执行所述一条或多条计算机指令以用于:执行本申请实施例提供的方法中的步骤。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被处理器执行时能够实现本申请实施例提供的方法中的步骤。
本申请实施例中,在智能客服实现过程中优化构建目标商家的目标知识库的方式,可展示知识内容录入界面,并响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容;根据该至少一个知识主题及其对应的文本内容,构建该目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。在这种实施方式中,减轻了对商家用户根据用户咨询问题配置触发规则以及对应触发规则的回答内容等操作的依赖,商家用户只需执行基础知识素材的上传操作即可指导智能客服实现智能问答,极大减轻了商家的配置工作量,简化了商家用户的操作复杂度,从而降低了智能客服的运营成本。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一示例性实施例提供的用于智能客服的知识库构建方法的流程示意图;
图2为本申请一示例性实施例提供的知识内容录入界面以及配置项的示意图;
图3为本申请一示例性实施例提供的智能客服实现方法的流程示意图;
图4-1为本申请另一示例性实施例提供的智能客服实现方法的流程示意图;
图4-2为本申请一示例性实施例提供的智能客服的问答执行流程图;
图5为本申请一示例性实施例提供的智能问答方法的流程示意图;
图6为本申请一示例性实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
针对现有技术中,商家运营智能客服的成本较高,从而致使商家对智能客服的使用率较低的技术问题,本申请实施例提供一种解决方案,以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请一示例性实施例提供的用于智能客服的知识库构建方法的流程示意图。如图1所示,该方法主要包括如下步骤:
步骤101、响应知识库构建请求,展示知识内容录入界面。
步骤102、响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容。
步骤103、根据该至少一个知识主题及其对应的文本内容,构建该目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。
本实施例可由终端设备执行,该终端设备可以是商家用户侧的电脑、智能手机等设备。终端设备可基于其上运行的商家客户端程序或者浏览器,向商家用户提供知识库构建服务。
其中,终端设备可响应知识库构建请求,展示知识内容构建页面。其中,知识库构建请求,可以由用户事件触发,也可以由系统事件触发,以下将分别进行说明。在一些实施例中,终端设备可通过触摸面板、物理按键或者麦克风组件等输入组件,获取商家用户发起的知识库创建请求。例如,终端设备可在商家客户端的任一页面上展示一构建知识库控件,若检测到对该知识库构建控件的触发操作,则可确定获取到了商家用户的知识库创建请求。在另一些实施例中,知识库构建服务可按照周期触发知识库构建操作,在新周期到达时,可触发定时器事件。若检测到定时器事件,则可确定获取到了知识库创建请求。
知识内容构建页面可提供录入知识内容的操作入口。响应目标商家在知识内容录入界面上的录入操作,可获取目标商家对应的基础知识素材。其中,基础知识素材是指目标商家在日常应用中积累的原始的知识素材,可以是与目标商家相关的各种基础知识素材,例如可以目标商家日常使用的会议文档、宣传文档、培训文档等,也可以是目标商家发布的商品知识信息(例如商品详情信息),以及围绕商品的问答知识信息、评论知识信息等。其中,基础知识素材可包含至少一个知识主题及其对应的文本内容。其中,知识主题,用于描述或者概括知识对应的主要内容、知识范围或者知识层面。知识主题对应的文本内容,用于对知识主题相关的知识信息进行详细描述。可选地,在实际应用中,目标商家可以按照知识主题+文本内容的结构进行知识素材的组织、管理和积累。
基于知识内容构建页面,在步骤102中,可获取多种不同应用场景的知识主题及其对应的文本内容。其中,该多个场景可包括:旅游场景、电商场景、家政场景、在线教育场景等等。以下将以旅游场景为例进行示例性说明。
以旅游场景为例,获取到的该至少一个知识主题及其对应的文本内容可至少包括:至少一种交通知识主题以及每种交通知识主题下用于描述交通攻略的文本内容;至少一种住宿知识主题以及每种住宿知识主题下用于描述住宿攻略的文本内容;以及,至少一种游玩知识主题以及每种游玩知识主题下用于描述游玩攻略的文本内容。在本申请实施例中,交通知识是指旅游场景中与出行交通相关的知识内容,例如,至少一种交通知识主题包括:飞机航班信息和/或票价信息等;宿主知识是指旅游场景中与住宿相关的知识内容,例如至少一种住宿知识主题包括:酒店位置和/或房价信息等;游玩知识是指除交通和宿主之外的其它度假信息,例如,至少一种游玩知识主题包括:景区信息、游玩路线信息和/或签证信息。其中,以签证信息为例,知识主题为:刚去过xx国家还可以在申请xx国家的签证吗?该知识主题对应的文本内容为:正常来说,3个月内申请过一次电子签证的话,3个月内多次申请,属于频繁申请,需要具体说下是什么时候出境以及目前在哪里,具体请私信我们客服咨询。以游玩路线信息为例,知识主题为:第一次去xx城市推荐去哪里游玩?该知识主题对应的文本内容为:可以先从A景点出发,在去往B景点,行程大致一天;第二天可以去C景点,游玩结束后,如果喜欢购物在去往临近的D商场,D商场是当地有名的商场,集购物、餐饮和休闲娱乐为一体,适合旅游结束后的释放放松;第三天建议去E景点去领略一下当地的人文风情。
以家政场景为例,获取到的该至少一个知识主题及其对应的文本内容可至少包括:至少一种保洁知识主题以及每种保洁知识主题下用于描述保洁技巧的文本内容;至少一种育儿知识主题以及每种育儿知识主题下用于描述婴幼儿护理技术的文本内容。
在本实施例中,目标商家可基于多种实施方式录入基础知识素材,以下将进行示例性说明。
在一些示例性的实施例A中,终端设备展示的内容录入界面可包括信息录入区,该信息录入区用于向商家用户提供信息录入的文本输入框,如图2所示的知识内容输入框。可选地,可响应目标商家在知识内容录入界面上的信息录入操作,获取该目标商家在内容录入界面的信息录入区内输入的基础知识素材。
可选地,该知识内容录入界面可包括商家知识选项和商品知识选项,该商家知识选项对应有信息录入控件,该商品知识选项对应有信息录入控件。其中,商家知识选项用于录入商家维度的基础知识素材,商品知识选项用于录入商品维度的基础知识素材。其中,商家维度的基础知识素材,包括商家在经营店铺的过程中积累与商家以及店铺有关的原始知识信息,包括商家的资质、经营策略、店铺特色以及商家的附加服务等相关知识。其中,商品维度的基础知识素材,包括关于商品的原始知识信息。例如,目标商家为旅行社商家时,目标商家的店铺中出售景区门票,则商品维度的基础知识素材可包括:景区门票价格、景区开放时间、景区内的设施、景区的介绍文档等信息。
在一些实施例中,可响应对该商家知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商家维度的基础知识素材。
在另一些实施例中,可响应对该商品知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商品维度的基础知识素材。
在又一些实施例中,可响应对该商家知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商家维度的基础知识素材;并可响应对该商品知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商品维度的基础知识素材。
以下将继续结合图2进行示例性说明。如图2所示,知识类型配置项包含商家类型选项或者商品类型选项。其中,商家类型选项对应商家知识选项,商品类型选项对应商品知识选项。如图2所示,录入方式配置项包括上传本地文档、线上录入以及在线文档等可选项。当商家类型选项以及线上录入选项被选中时,可认为检测到了对该商家知识选项及其对应的信息录入控件的选择操作,可获取目标商家在知识内容输入框中录入的商家维度的基础知识素材,如图2所示的知识点和回答。当商品类型选项以及线上录入选项被选中时,可认为检测到了对该商品知识选项及其对应的信息录入控件的选择操作,可获取目标商家在知识内容输入框中录入的商品维度的基础知识素材,如图2所示的知识点和回答。
在此说明,在一可选实施例中,目标商家在内容录入界面录入的商家维度的基础知识素材和/或商品维度的基础知识素材可以是目标商家直接从已积累的包含基础知识素材的文档、网页或应用页面上拷贝得到的,进一步简化目标商家构建知识库的操作,提高构建知识库的效率。
在一些示例性的实施例B中,终端设备展示的内容录入界面可提供上传文本的操作入口。可选地,可响应目标商家在该知识内容录入界面上的文本上传操作,获取该目标商家上传的目标文档,该目标文档中包含基础知识素材。其中,目标文档的格式可以是xml格式、doc格式、docx格式、pdf格式、tex格式等等,本实施例不做限制。
可选地,获取到的目标商家上传的目标文档,可包括目标商家日常积累的宣传文档、会议文档和/或培训文档,作为目标文档。通常,目标文档具有主题以及特定的内容格式。基于对文档主题以及内容格式的解析,可确定文档对应的知识主题以及文本内容。
可选地,知识内容录入界面可包括商家知识选项和商品知识选项,商家知识选项对应有文本上传控件,商品知识选项对应有文本上传控件。
在一些实施例中,可响应对该商家知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第一目标文档,该第一目标文档中包含商家维度的基础知识素材。
在另一些实施例中,可响应对该商品知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第二目标文档,该第二目标文档中包含商品维度的基础知识素材。
在又一些实施例中,可响应对该商家知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第一目标文档,该第一目标文档中包含商家维度的基础知识素材;并可响应对该商品知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第二目标文档,该第二目标文档中包含商品维度的基础知识素材。
其中,第一文档的数量可以是一个或者多个,第二文档的数量也可以是一个或者多个,本实施例不做限制。通常,被上传的第一文档和第二文档为终端设备的本地文档。
以下将继续结合图2进行示例性说明。如图2所示,录入方式配置项包括上传本地文档、线上录入以及在线文档等可选项。当商家类型选项以及上传本地文档选项被选中时,可认为检测到了对该商家知识选项及其对应的文本上传控件的选择操作,可获取目标商家上传的文档作为第一目标文档。当商品类型选项以及上传本地文档选项被选中时,可认为检测到了对该商品知识选项及其对应的文本上传控件的选择操作,可获取目标商家上传的文档作为第二目标文档。
在一些示例性的实施例C中,终端设备展示的内容录入界面可提供获取线上知识素材的操作入口。可选地,可响应目标商家在该知识内容录入界面上的线上触发操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取基础知识素材。
可选地,该知识内容录入界面还可包括商品知识选项对应的线上触发控件。
相应地,可响应对该商品知识选项及其对应的线上触发控件的选择操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取商品维度的基础知识素材。可选地,从该服务链接对应的服务页面中,获取各个商品的详情页面和/或对应的问答页面,并从各个商品的详情页面和/或问答页面中,获取各个商品相关的知识主题以及对应的文本内容,作为商品维度的基础知识素材。
以下将继续结合图2进行示例性说明。如图2所示,录入方式配置项包括上传本地文档、线上录入以及在线文档等可选项。当商品类型选项以及在线文档选项被选中时,可认为检测到了对该商品知识选项及其对应的线上触发控件的选择操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取商品维度的基础知识素材。
可选地,在从商品的详情页面上提取商品维度的基础知识素材时,可对该商品的详情页面进行文本识别,得到商品文本信息。例如,可采用OCR(Optical CharacterRecognition,光学字符识别)技术对商品的详情页面中的字符进行识别,得到商品文本信息。又例如,可从商品的详情页面的前端代码中,获取用于描述商品信息的字符,得到商品文本信息。
获取到商品文本信息后,可从该商品文本信息中,匹配与商品属性以及商品属性值对应的文本信息,得到商品维度的基础知识素材。其中,不同行业领域中的商品具有不同的商品属性。例如,沿用前述例子,酒店服务出售场景中,酒店产品的属性可包括:品牌、价格、设施、房型、地址、风格等。景区票务出售场景中,景区门票的属性通常包括:价格、游览时间、地址、项目等属性。可选地,在这种实施方式中,可预先获取不同行业领域中的不同商品的属性。进而,可采用正则匹配的方式从商品文本信息中匹配与属性对应的关键词,作为商品属性对应的文本信息。匹配到属性对应的关键词后,可将该关键词所在的句子或者段落,作为商品属性值对应的文本信息。其中,获取到的商品属性对应的文本信息以及商品属性值对应的文本信息,可作为一条商品维度的基础知识素材。可选地,在这种实施方式中,可采用键-值对格式存储提取到的基础知识素材。例如,酒店产品的一条商品维度的基础知识素材可记录为:{key:风格;value:商务}。
基于这种实施方式,可自动地从商品的详情页面上提取商品维度的基础知识素材,降低了对商家用户手动配置操作的依赖,进一步降低了智能客服的训练成本和使用成本。
基于前述各实施例提供的方法获取至少一个知识主题对应的文本内容后,在步骤103中,可根据该至少一个知识主题及其对应的文本内容,构建目标商家应的目标知识库。
可选地,在构建目标知识库的过程中,可对至少一个知识主题对应的文本内容进行分词处理,以得到该至少一个知识主题各自对应的多个文本片段。可选地,在分词处理过程中,可按照设定的文本切分规则,对该文本内容进行切分,得到多个文本片段。可选地,该设定的文本切分规则,可包括按照标点符号进行切分的规则。例如,可按照句号对文本内容进行切分,得到多个句子。在这种切分方式中,一个文本片段可包括一个句子。可选地,该设定的文本切分规则,可包括按照回车符或者换行符进行切分的规则。例如,可按照回车符或者换行符对文本内容进行切分,得到多个文本片段。在这种切分方式中,一个文本片段可包括一个或者多个句子。
分词处理后,可对分词处理得到的该至少一个知识主题及其各自对应的多个文本片段进行向量化处理,以得到该至少一个知识主题各自对应的主题向量以及多个文本片段向量。基于向量化处理,可将知识主题以及知识主题对应的多个文本片段映射到向量空间,从而便于在向量空间中筛选与知识主题具有较高关联度的有效知识。
根据该至少一个知识主题各自对应的主题向量以及多个文本片段向量,可构建目标知识库。可选地,在构建目标知识库时,针对任一知识主题,可计算主题向量与多个文本片段向量之间的相关度。
其中,任意两个向量之间的相关度可基于两个向量的余弦相似度计算得到,或者可基于这两个向量的内积计算得到,本实施例不做限制。针对任一知识主题,可根据该知识主题对应的主题向量与该多个文本片段向量之间的相关度,从该多个文本片段中选择与该知识主题匹配的至少一个文本片段。例如,可从多个文本片段中,选择与知识主题的相关度大于设定阈值的一个或者多个文本片段。或者,可从多个文本片段中,选择与知识主题的相关度分数排序靠前的一个或者多个文本片段,本实施例不做限制。
根据知识主题与筛选出的一个或者多个文本内容,可生成知识点对,并将该知识点对添加到目标商家的目标知识库。在本实施例中,通过对文本内容进行分解,将基础知识素材分解成长度更小的信息片段,并从长度更小的信息片段中抽取与知识主题对应的知识信息。进而,可在基础知识素材的数据量较为庞大的情况下,准确地提取出知识相关度较高的知识点对。基于这种实施方式,商家用户在上传知识信息时,可无需对知识信息进行人工筛选,进一步简化了商家的操作。
可选地,智能客服场景可基于符合预设参数量范围的语言模型实现,在一些场景中,当语言模型的参数量比较大时,例如具有数百万到数十亿的参数,该语言模型又可称为“大语言模型”。其中,该语言模型是一种人工智能模型,被训练成理解和生成人类语言,在本实施例中,语言模型可基于目标知识库生成智能客服场景中用户问题的答案信息。其中,该语言模型可实现为LLMs(Large Language Models,大语言模型),例如GLM(GeneralLanguage Model,通用语言生成模型)、ChatGLM-6B(基于GLM架构的语言对话模型)或者上述模型的变形模型等,本实施例对此不做限制。上述语言模型,可在输入的提示词的触发下,输出与提示词适配的文本信息。在此说明,本申请实施例可以采用具有使用权限且开源的语言模型,也可以采用自研的语言模型。
在本实施例中,在智能客服实现过程中优化构建目标商家的目标知识库的方式,可展示知识内容录入界面,并响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容;根据该至少一个知识主题及其对应的文本内容,构建该目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。在这种实施方式中,减轻了对商家用户根据用户咨询问题配置触发规则以及对应触发规则的回答内容等操作的依赖,商家用户只需执行基础知识素材的上传操作即可指导智能客服实现智能问答,极大减轻了商家的配置工作量,简化了商家用户的操作复杂度,从而降低了智能客服的运营成本。
除前述实施例之外,本申请实施例还提供一种智能客服实现方法,如图3所示,该方法主要包括以下步骤:
步骤301、响应知识库构建请求,展示知识内容录入界面。
步骤302、响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容。
步骤303、根据该至少一个知识主题及其对应的文本内容,构建该目标商家的目标知识库。
步骤304、将该目标知识库与符合预设参数量范围的语言模型关联,以使该语言模型在智能客服场景中生成与用户问题匹配的答案信息;其中,该语言模型被该目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
其中,步骤301~步骤304的可选实施方式可参考前述实施例的记载,此处不再赘述。
在步骤304中,将目标知识库与符合预设参数量范围的语言模型关联时,可将目标知识库的地址提供给语言模型,或者将目标知识库的数据导入语言模型对应的数据库,进而语言模型可基于目标知识库训练智能客服。基于目标知识库,语言模型可在智能客服场景中生成与用户问题匹配的答案信息。
以下将结合附图,对智能客服实现方法进行进一步示例性说明。
图4-1为本申请另一示例性实施例提供的智能客服实现方法的流程示意图。如图4-1所示,该方法主要包括如下步骤:
步骤401、通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材,并从至少一个数据源获取商品维度的基础知识素材。
步骤402、对该商家维度的基础知识素材和该商品维度的基础知识素材进行知识点提取,以得到该目标商家的目标知识库;其中,该语言模型被该目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
步骤403、将该目标知识库应用于语言模型以及与该语言模型适配的知识召回策略和提示词模版,以得到该目标商家的智能客服。
本申请实施例可由客服训练装置执行,用于训练可供商家用户使用的智能客服。其中,客服训练装置可独立运行在终端设备上,该终端设备可以是商家侧的电脑、智能手机等设备。该客服训练装置也可运行在终端设备以及服务器组成的交互系统中,该服务器可以是常规服务器、云服务器或者虚拟化数据中心等,本实施例不做限制。其中,当独立运行在终端设备上时,客服训练装置可包括运行在终端设备上的商家客户端。基于商家客户端,终端设备可在商家用户所在的边缘侧实现智能客服的训练。当运行在交互系统中时,客服训练装置可包括运行在终端设备上的商家客户端以及运行在服务器上的服务端程序。基于商家客户端和服务端程序之间的交互可实现智能客服的训练。以下将进行具体说明。
在本实施例中,训练智能客服,需获取商家维度的基础知识素材以及商品维度的知识信息,以构建商家对应的知识库。其中,商家维度的基础知识素材,是指商家在经营店铺的过程中积累与商家以及店铺有关的未经加工的原始知识信息,包括商家的资质、经营策略、店铺特色以及商家的附加服务等相关知识。例如,目标商家为酒店商家时,商家维度的基础知识素材,可包括酒店商家的品牌授权文件、酒店商家的接送客服务方式、酒店商家的活动参与方式、酒店商家积累的酒店周围兴趣点信息等。等等。例如,目标商家为旅行社商家时,商家维度的基础知识素材可包括:旅行社制定的旅游线路、旅行社提供的交通方式、旅行社的签证办理时长、旅游目的地的游玩攻略等。其中,商品维度的基础知识素材,是指关于商品的的原始知识信息。例如,目标商家为旅行社商家时,目标商家的店铺中出售景区门票,则商品维度的基础知识素材可包括:景区门票价格、景区开放时间、景区内的设施等信息。
为了简化智能客服实现过程,本申请实施例优化了商家对应知识库的构建过程。一方面,客服训练装置可通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材。在一些可选的实施例中,该对外提供的信息上传接口,可以包括商家客户端程序提供的信息上传页面。可选地,可在商家客户端展示新增知识控件。响应该目标商家对该新增知识控件的触发操作,可展示知识内容录入界面。其中,知识内容录入界面可包括至少一个配置项,以供配置知识信息。
可选地,该至少一个配置项可包括:商家标识配置项、录入方式配置项、知识类型配置项以及知识内容配置项中的至少一种。其中,商家标识配置项用于配置商家标识,以对知识信息对应的商家进行记录。其中,录入方式配置项用于配置知识信息的录入方式。在本实施例中,知识信息的录入方式可包括但不限于:上传本地文档、在线录入或者输入文档地址等。其中,上传的本地文档可以是多种格式,例如可以是xml格式、doc格式、docx格式、pdf格式、tex格式等等,本实施例不做限制。其中,知识类型配置项用于配置知识类型,该知识类型可包括商家类型或者商品类型。其中,知识内容配置项用于配置具体的知识内容。在一些实施例中,当录入方式为在线录入时,可通过知识配置项提供录入知识内容的入口,以供商家用户在线录入知识信息。可选地,知识内容录入界面还可展示在线录入的知识信息的格式提示信息。例如,展示的格式提示信息可以为:请按照“知识点-答案”的格式输入知识信息。进而,可通过格式提示信息对商家用户的录入内容进行格式约束。
继续参见图2进行示例性说明。图2对商家客户端程序展示的知识内容录入界面进行了示意,如图2所示,该知识内容录入界面可包括商家名称配置项、录入方式配置项、知识类型配置项以及知识内容配置项。其中,录入方式配置项包括上传本地文档、线上录入以及在线文档等可选项。其中,线上录入选项被选中时,可展示知识内容配置项对应的输入框。基于该输入框,商家用户可输入一条或者多条基础知识素材。
展示该至少一个配置项后,可检测商家用户的配置操作,并根据该目标商家对该知识内容录入界面中的该至少一种配置项的配置操作,获取该目标商家上传的知识信息。其中,目标商家在对上述至少一个配置项进行配置的过程中,可将知识类型配置项的值配置为商家类型或者商品类型。即,目标商家上传的知识信息可包括:商家维度的知识信息以及商品维度的知识信息中的至少一种。基于此,获取到目标商家上传的知识信息后,可从该目标商家上传的知识信息中,识别出商家类型的知识,得到该商家维度的基础知识素材。其中,基础知识素材,是指商家用户输入的尚未加工的、原始的知识信息。
在上述实施例中,可选地,从该基础知识素材中,识别出商家类型的知识时,可从该目标商家上传的知识信息中,确定知识类型配置项为商家类型的第一知识信息。其中,采用“第一”对知识信息进行限定,仅用于便于描述并与后文出现的相似或相同概念进行区分,并不对知识信息的获取顺序或者数量构成限制,后续不再对此重复说明。
在一种可选的实施方式中,商家用户上传的每一条知识信息可采用结构化文本进行记录,例如该结构化文本的格式可以为:{商家标识配置项:配置值;录入方式配置项:配置值;知识类型配置项:配置值;知识内容配置项:配置值}。针对每一条知识信息,可从其结构化文本中提取出知识类型配置项的配置值,并判断该配置值是否为商家类型。若该配置值为商家类型,则可将这条知识信息作为第一知识信息。
获取第一知识信息后,可从该第一知识信息中,确定该知识内容配置项对应的第一配置内容。例如,第一知识信息采用上述的结构化文本进行记录时,可从第一知识信息对应的结构化文本中提取出知识内容配置项对应的配置值,并根据配置值确定第一配置内容。其中,知识信息的录入方式不同时,知识内容配置项对应的配置值不同,获取第一配置内容的方式也不同。以下将分别进行说明。
可选地,录入方式配置项的配置值为上传本地文档时,知识内容配置项的配置值为商家用户上传的本地文档的存储地址。在这种情况下,可在根据该存储地址读取商家用户上传的本地文档,作为第一配置内容。
可选地,录入方式配置项的配置值为在线录入时,知识内容配置项的配置值为商家用户输入的“知识点-答案”文本。在这种情况下,可直接将知识内容配置项的配置值作为第一配置内容。
可选地,当录入方式配置项的配置值为输入文档地址时,知识内容配置项的配置值为在线文档的URL(Uniform Resource Locator,统一资源定位符)。在这种情况下,可根据该URL读取商家用户指定的在线文档,作为第一配置内容。
获取到第一配置内容后,可识别该第一配置内容的文件格式,并采用该文件格式对应的文件解析方式,对该第一配置内容进行解析,得到该商家维度的基础知识素材。例如,若第一配置内容为商家用户上传的本地文档,则可根据本地文档的文件后缀识别文件格式,例如可以为xml格式、doc格式、pdf格式等。确定本地文档的文件格式后,可根据文件格式对应的文件解析方式,对本地文档进行解析,得到商家维度的基础知识素材。其中,解析得到的商家维度的基础知识素材可采用键-值对(key-value)格式存储。例如,旅行社商家的一条商家维度的基础知识素材可记录为:{key:签证办理时长;value:7~10个工作日}。又例如,酒店商家的一条商家维度的基础知识素材可记录为:{key:会员权益;value:享受双倍积分}。
基于这种实施方式,商家用户只需执行信息上传操作,而无需关注上传的信息的格式,简化了商家用户的配置操作。
在本实施例中,构建商家对应的知识库,除获取商家维度的知识信息之外,还可以获取商家关联的商品维度的知识信息,提高知识库中知识点的丰富度。关于商品维度的知识信息的获取,本申请实施例也进行了优化,不再依赖商家配置触发规则以及对应的回答内容等操作,而是从一个或者多个数据源获取商家关联的商品维度的基础知识素材。其中,该一个或多个数据源可包括:商家用户的配置数据以及商品信息中的至少一种。以下将进行示例性说明。
在一些示例性的实施例中,可通过对外提供的信息上传接口接收目标商家上传的商品维度的基础知识素材。这里的信息上传接口(例如信息上传页面)可以是上文数据源的一种示例。基于前述实施例的记载可知,商家用户在通过信息上传接口上传知识信息时,可对知识内容录入界面中的至少一个配置项进行配置。其中,该至少一个配置项包括知识类型配置项,该知识类型配置项的配置值可包括:商家类型或者商品类型。基于此,可从该目标商家上传的知识信息中,确定知识类型配置项为商品类型的第二知识信息。例如,针对商家用户上传的每一条知识信息,可从其结构化文本中提取出知识类型配置项的配置值,并判断该配置值是否为商品类型。若该配置值为商品类型,则可将这条知识信息作为第二知识信息。
获取第二知识信息后,可从该第二知识信息中,确定该知识内容配置项对应的第二配置内容。例如,第二知识信息采用前述实施例记载的结构化文本进行记录时,可从第二知识信息对应的结构化文本中提取出知识内容配置项对应的配置值,并根据配置值确定第二配置内容。其中,知识信息的录入方式不同时,知识内容配置项对应的配置值不同,获取第二配置内容的方式也不同。其中,第二配置内容的确定方式,可参见前述实施例的记载第一配置内容的确定方式,此处不赘述。确定第二配置内容后,可识别该第二配置内容的文件格式,并采用该文件格式对应的文件解析方式,对该第二配置内容进行解析,得到该商品维度的基础知识素材。
其中,解析得到的商品维度的基础知识素材可采用键-值对格式存储。例如,旅行社商家提供的一款跟团游商品的一条商品维度的基础知识素材可记录为:{key:往返交通方式;value:飞机}。
在另一些示例性的实施例中,可从该目标商家对应的商品的详情页面上获取商品维度的基础知识素材。商品的详情页面是上文中数据源的一种示例。其中,目标商家对应的商品的详情页面,包括目标商家的线上店铺中出售的一种或者多种商品的详情介绍页。通常,商品的详情页面采用图文以及图表的方式展示商品的详情信息。不同行业领域中的商品的详情信息不同。例如,在酒店服务出售场景中,酒店产品的详情信息通常包括酒店的地址、停车场信息、酒店设置、房型等信息。例如,在景区票务出售场景中,景区门票的详情信息通常包括景区的地址、开园/闭园时间、园内项目、园内服务等信息。
可选地,在从商品的详情页面上提取商品维度的基础知识素材时,可对该商品的详情页面进行文本识别,得到商品文本信息。例如,可采用OCR技术对商品的详情页面中的字符进行识别,得到商品文本信息。又例如,可从商品的详情页面的前端代码中,获取用于描述商品信息的字符,得到商品文本信息。
获取到商品文本信息后,可从该商品文本信息中,匹配与商品属性以及商品属性值对应的文本信息,得到商品维度的基础知识素材。其中,不同行业领域中的商品具有不同的商品属性。例如,沿用前述例子,酒店服务出售场景中,酒店产品的属性可包括:品牌、价格、设施、房型、地址、风格等。景区票务出售场景中,景区门票的属性通常包括:价格、游览时间、地址、项目等属性。可选地,在这种实施方式中,可预先获取不同行业领域中的不同商品的属性。进而,可采用正则匹配的方式从商品文本信息中匹配与属性对应的关键词,作为商品属性对应的文本信息。匹配到属性对应的关键词后,可将该关键词所在的句子或者段落,作为商品属性值对应的文本信息。其中,获取到的商品属性对应的文本信息以及商品属性值对应的文本信息,可作为一条商品维度的基础知识素材。可选地,在这种实施方式中,可采用键-值对格式存储提取到的基础知识素材。例如,酒店产品的一条商品维度的基础知识素材可记录为:{key:风格;value:商务}。
基于这种实施方式,可自动地从商品的详情页面上提取商品维度的基础知识素材,降低了对商家用户手动配置操作的依赖,进一步降低了智能客服的训练成本和使用成本。
基于前述各实施例获取商家维度的基础知识素材和商品维度的基础知识素材后,可对获取到的基础知识素材进行知识点加工,以生成目标商家的目标知识库。其中,商家维度的基础知识素材和商品维度的基础知识素材的加工步骤相似,以下将以任意维度的基础知识素材为例进行示例性说明。
在一些示例性的实施例中,对任一基础知识素材,可识别该基础知识素材中的知识主题以及文本内容。可选地,可根据知识信息的存储格式,从基础知识素材中识别出知识主题以及文本内容。其中,知识信息的存储格式,可包括前述实施例记载的键-值对格式。针对任一条知识信息,可从该知识信息对应的键-值对中,提取键(key)对应的文本作为知识主题,并提取值(value)对应的文本作为文本内容。
获取到文本内容后,可按照设定的文本切分规则,对该文本内容进行切分,得到多个文本片段。可选地,设定的文本切分规则,可包括按照标点符号进行切分的规则。例如,可按照句号对文本内容进行切分,得到多个句子。在这种切分方式中,一个文本片段可包括一个句子。可选地,设定的文本切分规则,可包括按照回车符或者换行符进行切分的规则。例如,可按照回车符或者换行符对文本内容进行切分,得到多个文本片段。在这种切分方式中,一个文本片段可包括一个或者多个句子。
切分得到多个文本片段后,可对该知识主题以及该多个文本片段进行向量化处理,得到知识主题的主题向量以及多个文本内容文本片段向量。基于这种方式,可将知识主题和多个文本片段映射到向量空间,从而便于在向量空间中分析知识主题和文本片段的知识相关度。可选地,可计算知识主题的主题向量与多个文本内容文本片段向量之间的相关度。
其中,任意两个向量之间的相关度可基于两个向量的余弦相似度计算得到,或者可基于这两个向量的内积计算得到,本实施例不做限制。根据该知识主题的主题向量与该多个文本内容文本片段向量之间的相关度,从该多个文本片段中选择与该知识主题匹配的至少一个文本片段。例如,可从多个文本片段中,选择与知识主题的相关度大于设定阈值的一个或者多个文本片段。或者,可从多个文本片段中,选择与知识主题的相关度分数排序靠前的一个或者多个文本片段,本实施例不做限制。
根据该知识主题与筛选出的一个或者多个文本内容,可生成知识点对,并将该知识点对添加到目标商家的目标知识库。在本实施例中,通过对文本内容进行分解,将基础知识素材分解成长度更小的信息片段,并从长度更小的信息片段中抽取与知识主题对应的知识信息。进而,可在基础知识素材的数据量较为庞大的情况下,准确地提取出知识相关度较高的知识点对。基于这种实施方式,商家用户在上传知识信息时,可无需对知识信息进行人工筛选,进一步简化了商家的操作。
在前述实施例中,记载了从基础知识素材中提取知识点对,并将提取到的知识点对添加到目标商家的目标知识库的可选实施方式。在一些示例性的实施例中,可将知识库划分为私域知识库以及通用知识库。前述实施例记载的目标商家的目标知识库,可以是目标商家的私域知识库。其中,私域知识库是指目标商家专用的、不对外共享的知识库。不同商家具有各自的私域知识库,且不同商家的私域知识库相互隔离,进而可降低目标商家的知识信息被泄露的风险,提升目标商家的知识信息的安全性。
其中,通用知识库是指多商家共享的知识库。通用知识库用于实现通用知识信息的共享,从而减少知识信息的重复收集操作,进一步降低商家用户的知识信息配置成本。在这种实施方式中,根据知识主题以及与该知识主题匹配的至少一个文本片段生成知识点对之后,可进一步判断该知识点对是否为通用知识;若为通用知识,则可将该知识点对添加到通用知识库中,以使得共用该语言模型的多个商家共用该知识点对。
在一些可选的实施方式中,可获取该知识点对在不同商家用户之间的出现比例,并根据该知识点对在不同商家用户之间的出现比例,判断该知识点对是否为通用知识。其中,知识点对在不同商家用户之间的出现比例,可根据该知识点对对应的不同商家用户的数量以及商家用户的总数量确定。在从多个商家用户的基础知识素材中提取出知识点对之后,可对提取出的知识点对计算相似度,并确定相似度大于设定相似度阈值的知识点对作为相同知识点对。可选的地,对于同一商家用户而言,可对该商家用户对应的相同的知识点对进行去重处理。
可选地,对于不同的商家用户而言,可统计相同知识点对在不同商家用户之间的出现比例。某一知识点对在不同商家用户之间的出现比例大于设定比例阈值,则确定该知识点对为通用知识,并可将该知识点对添加到通用知识库中。例如,获取到10个商家用户的基础知识素材后,分别对10个商家用户的基础知识素材进行知识点提取,得到10个商家用户各自的知识点对。若10个商家用户中,6个商家用户具有相同的知识点对,则可确定该知识点对在不同商家用户的出现比例为60%。若设定的比例阈值为50%,则可确定该知识点对为通用知识。
在另一些可选的实施方式中,可获取该知识点对与商品固有属性的关联度。根据该知识点对在不同商家用户之间的出现比例和/或该知识点对与商品固有属性的关联度,判断该知识点对是否为通用知识;若为是,则将该知识点对添加到通用知识库中。
其中,商品固有属性,是指商品自身具有的产品属性,该产品属性不由商家用户设置。例如,在票务出售场景中,被出售的商品为景区门票,景区门票的固有属性包括:景区的开放时间、景区的设施、景区的购票条件等。上述固有属性由景区管理者制定,不由商家用户设置。当多个商家用户售卖同一景区的门票时,可共享景区相关的知识信息,以降低重复配置操作的次数。例如,在酒店场景中,被出售的商品为房间使用权,该房间使用权的固有属性可包括:酒店的防火要求、酒店的违禁物品要求、酒店的入住证件要求等。上述固有属性依据相关规章制度确定,不受商家用户设置。
基于此,在这种实施方式中,可获取该知识点对对应的商品的固有属性,并计算该知识点对与该商品的固有属性的关联度。可选地,可从CPV(Category-Property-Value,商品类目-属性-属性值的知识体系)中获取该知识点对对应的商品的多个固有属性。可选地,可将该知识点对中的知识主题以及商品的多个固有属性分别映射到向量空间,得到知识主题的主题向量以及多个属性向量。分别计算该知识主题的主题向量与多个属性向量之间的余弦相似度、欧氏距离或者内积,得到多个关联度。若多个关联度中的最大值大于某一关联度阈值,则可确定该知识点对为商品的通用知识。
在又一些可选的实施方式中,可根据知识点对在不同商家用户之间的出现比例以及该知识点对与商品固有属性的关联度,判断该知识点对是否为通用知识;若为是,则将该知识点对添加到通用知识库中。例如,可在知识点对的出现比例大于设定比例阈值,且知识点对与商品固有属性的关联度大于设定关联度阈值时,确定该知识点对为通用知识。
基于上述实施方式,可在对基础知识素材进行加工后,进一步判断加工得到的知识点对是否为通用知识,进而可自动地对知识进行分类。分类得到的通用知识可用于在多个商家用户之间实现知识共享,从而降低知识信息的配置成本。
值得说明的是,基于前述各实施例构建目标知识库后,可在指定事件的触发下,对目标知识库进行动态更新,以提升知识信息的实时度。
可选地,客服训练装置可响应指定事件的触发操作,通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材,并从至少一个数据源获取商品维度的基础知识素材。对该商家维度的基础知识素材和该商品维度的基础知识素材进行知识点提取,以更新该目标商家的目标知识库。其中,该指定事件可包括:数据源更新事件、定时事件、该目标商家触发的知识库更新事件。其中,数据源更新事件,可以是已上架商品的详情页面的更新事件,或者商品上架事件,本实施例包含但不限于此。其中,定时事件,用于按照设定周期对目标知识库进行自动更新。在目标知识库更新的过程中,还可对提取出的知识点对执行分类操作,并根据分类得到的通用知识更新通用知识库。具体实施方式可参考前述实施例的记载,此处不再赘述。
基于前述各实施例记载实施方式获取目标知识库后,可将目标知识库应用于语言模型以及与语言模型适配的知识召回策略和提示词模版,以得到目标商家的智能客服。其中,语言模型为预训练大模型,该预训练大模型可实现为LLMs,例如LLaVA、GLM、ChatGLM-6B、ChatGPT模型(例如GPT-4)或者上述模型的变形模型等,本实施例对此不做限制。上述语言模型,可在输入的提示词的触发下,输出与提示词适配的文本信息。
基于智能客服,可在多种消费场景下,向目标商家的消费者用户(包括潜在消费者)提供智能的售前、售中或者售后自助服务。以下将结合图4-2进行示例性说明。
可选地,在智能客服上线运行后,可接收目标商家对应的用户问题信息,并基于知识召回策略从目标知识库中获取与用户问题信息适配的至少一个知识点对。可选地,该知识召回策略,可以是按照关键词匹配的策略,或者,可以是相似度匹配策略。其中,关键词匹配策略是指,获取用户问题信息对应的关键词,并采用关键词在目标知识库中进行正则匹配的策略。基于关键词匹配策略,可从目标知识库中匹配到包含关键词的一个或者多个知识点对,作为与用户问题信息适配的知识点对。其中,相似度匹配策略是指,获取用户问题信息在向量空间中的表达,得到用户问题向量,如图4-2所示。在知识召回环节,可对用户问题向量与目标知识库中的知识点对的向量进行相似度计算,得到相似度分数。根据相似度分数,选择与用户问题信息匹配的知识点对。
在一些可选的实施例中,还可以进一步根据知识召回策略,从通用知识库中获取与用户问题信息适配的至少一个知识点对。通用知识库中的知识召回方式与目标知识库中的知识召回方式类似,此处不再赘述。基于这种实施方式,可从商家用户的私域知识库以及多商家共享的通用知识库中获取知识信息,进而可提升知识信息的召回率,提升智能客服的对话能力。
如图4-2所示,确定与用户问题信息匹配的至少一个知识点对后,可根据该至少一个知识点对以及与语言模型适配的提示词模版,生成提示词。其中,提示词模板用于将提示词的结构或者内容类型进行标准化或者固化。可选地,提示词模板可至少包括指令以及内容两个部分。其中,指令部分用于填写需指示语言模型处理的任务。其中,内容部分,通常为具体的被处理的对象。例如,根据知识点K和提示词模板生成的提示词可以表达为:{指令=请根据以下知识点生成答复信息;内容=知识点K}。可选地,提示词模板还可包括输出条件,该输出条件可用于指示语言模型的输出数据的格式、输出数据的字数要求等。例如,根据知识点K和提示词模板生成的提示词可以表达为:{指令=请根据以下知识点,生成JSON格式的答复信息;内容=知识点K}。将提示词输入语言模型,得到语言模型输出的与用户问题信息匹配的答复信息,并将答复信息反馈至用户。进而,完成了对用户问题的自动答复。
在一些示例性的实施例中,在将知识库应用于语言模型之前,可根据不同商家用户所属的行业领域,对语言模型进行微调,得到适配不同行业领域的语言模型。继续以目标商家为例,可确定目标商家所属的目标行业领域,并获取目标行业领域中的样本知识点对。根据目标行业领域中的样本知识点对,可对语言模型进行微调,得到目标行业领域对应的语言模型。该语言模型在处理目标行业的文本生成任务时,能够使得生成的文本符合目标行业领域的问答风格以及术语要求。例如,目标商家属于景区票务行业时,可获取景区票务行业中的样本知识点对对语言模型进行微调,得到景区票务行业对应的语言模型。该微调后的语言模型,可被景区票务行业中的多个商家用户共享。又例如,目标商家属于出行票务行业时,可获取出行票务行业中的样本知识点对对语言模型进行微调,得到出行票务行业对应的语言模型。该微调后的语言模型,可被出行票务行业中的多个商家用户共享。基于上述不同的微调方式,可使得景区票务行业对应的语言模型以及出行票务行业对应的语言模型能够学习各自行业领域的票务知识,从而更加准确地向各自行业领域中的用户提供自动问答服务。
在一些示例性的实施例中,在将知识库应用于与语言模型适配的知识召回策略和提示词模版之前,可根据智能客服的应用场景,确定差异化的知识召回策略。以下将继续以目标商家为例进行说明。
可选地,在将目标商家的目标知识库应用于语言模型适配的知识召回策略之前,可确定目标商家的应用场景,该应用场景可以是目标商家所属的目标行业领域中下的应用场景。例如,在景区票务行业中,应用场景可包括:票务售前咨询场景以及售后退票场景。在出行票务行业中,应用场景可包括:票务售前咨询场景、保险理赔场景、售后改签场景以及售后退票场景等等。以目标行业领域中的任一目标应用场景为例,可根据目标商家的目标应用场景的场景类型,确定与语言模型适配的知识召回策略。其中,例如,在票务售前咨询场景中,用户的咨询通常与商品的关键知识强关联,因此可将此场景对应的知识召回策略确定为按照关键词匹配的策略。在票务售后咨询场景中,用户的咨询通常与商品的使用以及售后技术支持强关联,这类咨询通常具有较少的关键词,因此可将此场景对应的知识召回策略确定为按照相似度匹配的策略。
在这种实施方式中,基于差异化的知识召回策略,可根据应用场景的特点,更加准确地根据用户问题信息筛选出匹配的知识点,从而提升语言模型生成的答复信息的可靠性。
在一些示例性的实施例中,在将知识库应用于与语言模型适配的提示词模版之前,还可根据智能客服的应用场景,构建差异化的提示词模板。以下将继续以目标商家为例进行说明。
可选地,在将目标商家的目标知识库应用于语言模型适配的提示词模版之前,可确定目标商家的应用场景,该应用场景可以是目标商家所属的目标行业领域中下的应用场景。例如,在景区票务行业中,应用场景可包括:票务售前咨询场景以及售后退票场景。在出行票务行业中,应用场景可包括:票务售前咨询场景、保险理赔场景、售后改签场景以及售后退票场景等等。以目标行业领域中的任一目标应用场景为例,可获取目标应用场景中的样本知识库,并利用目标应用场景中的样本知识库,构建与该语言模型适配的提示词模版。例如,在景区票务行业中的票务售前咨询场景中,可获取人工客服在售前咨询过程中所采用的话术模板,作为样本知识。根据获取到的样本知识,可构建该票务售前咨询场景中的提示词模板。在构建提示词模板时,可抽取大量话术模板中的通用格式以及通用内容,并将抽取到的通用格式和通用内容固化为提示词模板中的固定内容。例如,在景区票务行业中的票务售前咨询场景中,构建的提示词模板可以是:{指令=请根据以下知识点生成答复信息,答复信息的语言风格需要亲切、热情,且需要包含欢迎选购的相关话术;内容=知识点K1}。例如,在景区票务行业中的票务售后退票场景中,构建的提示词模板可以是:{指令=请根据以下知识点生成答复信息,且答复信息需包含退款路径的相关话术;内容=知识点K2}。
在这种实施方式中,基于差异化的提示词模板,可在不同行业领域中的不同应用场景中生成不同的提示词,并使得语言模型生成不同的答复信息。从而,可根据不同应用场景,提供差异化的客服服务,提升智能客服在不用应用场景中的泛化性能。
除前述实施例之外,本申请实施例还提供一种知识问答方法。图5示意了本申请一示例性实施例提供的知识问答方法的流程示意图,如图5所示,该方法包括:
步骤501、接收用户问题信息,该用户问题信息对应于目标商家。
步骤502、基于知识召回策略从该目标商家的目标知识库中获取与该用户问题信息适配的知识主题及其对应的文本片段。
步骤503、根据该知识主题及其对应的文本片段以及提示词模版,生成提示词。
步骤504、将该提示词输入符合预设参数量范围的语言模型,以使该语言模型生成与该用户问题信息匹配的答复信息。
其中,目标知识库的构建方法,可参考前述各实施例的记载,此处不赘述。
本申请实施例的执行主体可以为智能客服。该智能客服可实现为运行在终端设备上的程序组件,或者可实现为运行在服务器上的服务组件,本实施例不做限制。若实现为服务器上的服务组件,则该服务组件可响应其他一个或者多个程序组件的调用操作,向其他一个或者多个应用程序组件提供共享的智能客服问答服务。
基于智能客服,可向目标商家的消费者用户(包括潜在消费者)提供智能的售前、售中或者售后自助服务。可选地,在接收目标商家对应的用户问题信息,并基于知识召回策略从目标知识库中获取与用户问题信息适配的至少一个知识主题及其对应的文本片段。可选地,该知识召回策略,可以是按照关键词匹配的策略,或者,可以是相似度匹配策略。其中,关键词匹配策略是指,获取用户问题信息对应的关键词,并采用关键词在目标知识库中进行正则匹配的策略。基于关键词匹配策略,可从目标知识库中匹配到包含关键词的一个或者多个知识主题及其对应的文本片段,作为与用户问题信息适配的知识主题及其对应的文本片段。其中,相似度匹配策略是指,获取用户问题信息在向量空间中的表达,得到用户问题向量。计算用户问题向量与目标知识库中的知识主题及其对应的文本片段的向量进行相似度计算,得到相似度分数。根据相似度分数,选择与用户问题信息匹配的知识主题及其对应的文本片段。
确定与用户问题信息匹配的至少一个知识主题及其对应的文本片段后,可根据该至少一个知识主题及其对应的文本片段以及与语言模型适配的提示词模版,生成提示词。其中,提示词模板用于将提示词的结构或者内容类型进行标准化或者固化。可选地,提示词模板可至少包括指令以及内容两个部分。其中,指令部分用于填写需指示语言模型处理的任务。其中,内容部分,通常为具体的被处理的对象。例如,根据知识点K和提示词模板生成的提示词可以表达为:{指令=请根据以下知识点生成答复信息;内容=知识点K}。可选地,提示词模板还可包括输出条件,该输出条件可用于指示语言模型的输出数据的格式、输出数据的字数要求等。例如,根据知识点K和提示词模板生成的提示词可以表达为:{指令=请根据以下知识点,生成JSON格式的答复信息;内容=知识点K}。将提示词输入语言模型,得到语言模型输出的与用户问题信息匹配的答复信息。进而,完成了对用户问题的自动答复。
例如,用户问题信息可以为:刚去过K国还可以再在申请K国签证吗?
语言模型输出的答复信息可以为:正常来说,3个月内申请过一次电子签证的话,3个月内多次申请,属于频繁申请,需要具体说下是什么时候出境以及目前在哪里,具体请私信我们客服咨询。
本实施例中,智能客服使用的知识库的构建操作对商家用户的依赖极大降低,有利于降低智能客服的运营成本,并提升智能客服的使用率。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101至步骤103的执行主体可以为设备A;又比如,步骤101和102的执行主体可以为设备A,步骤103的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。另外,本申请涉及的各种模型(包括但不限于语言模型或大模型)是符合相关法律法规和标准规定的。
除前述实施例记载的智能客服实现方法以及智能问答方法之外,本申请实施例还可提供一种电子设备,该电子设备可用于执行前述各实施例记载的方法。图6为本申请一示例性实施例提供的电子设备的结构示意图,如图6所示,该点子设备主要包括:存储器61以及处理器62。
存储器61,用于存储计算机程序,并可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器61可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
在一些示例性的实施例中,图6示意的电子设备还可用于执行用于智能客服的知识库构建方法,其中,处理器62与存储器61耦合,用于执行存储器61中的计算机程序以用于:响应知识库构建请求,展示知识内容录入界面;响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容;根据该至少一个知识主题及其对应的文本内容,构建该目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。
可选地,该智能客服场景基于符合预设参数量范围的语言模型实现,该语言模型基于该目标知识库生成该智能客服场景中用户问题的答案信息。
可选地,处理器62在响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材时,具体用于执行以下至少一种操作:响应目标商家在该知识内容录入界面上的信息录入操作,获取该目标商家在该内容录入界面的信息录入区内输入的基础知识素材;响应目标商家在该知识内容录入界面上的文本上传操作,获取该目标商家上传的目标文档,该目标文档中包含基础知识素材;响应目标商家在该知识内容录入界面上的线上触发操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取基础知识素材。
可选地,该知识内容录入界面包括商家知识选项和商品知识选项,该商家知识选项对应有信息录入控件和文本上传控件,该商品知识选项对应有信息录入控件、文本上传控件和线上触发控件;其中,处理器62在响应目标商家在该知识内容录入界面上的信息录入操作,获取该目标商家在该内容录入界面的信息录入区内输入的基础知识素材时,具体用于:响应对该商家知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商家维度的基础知识素材;和/或,响应对该商品知识选项及其对应的信息录入控件的选择操作,获取该目标商家在该内容录入界面的信息录入区内输入的商品维度的基础知识素材;其中,处理器62在响应该知识内容录入界面上的文本上传操作,获取该目标商家上传的目标文档,该目标文档中包含基础知识素材时,具体用于:响应对该商家知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第一目标文档,该第一目标文档中包含商家维度的基础知识素材;和/或,响应对该商品知识选项及其对应的文本上传控件的选择操作,获取该目标商家上传的第二目标文档,该第二目标文档中包含商品维度的基础知识素材;其中,处理器62在响应该知识内容录入界面上的线上触发操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取基础知识素材时,具体用于:响应对该商品知识选项及其对应的线上触发控件的选择操作,确定该目标商家在应用平台上注册的服务链接,从该服务链接对应的服务页面中获取商品维度的基础知识素材。
可选地,处理器62在从该服务链接对应的服务页面中获取商品维度的基础知识素材时,具体用于:从该服务链接对应的服务页面中,获取各个商品的详情页面和/或对应的问答页面;从各个商品的详情页面和/或问答页面中,获取各个商品相关的知识主题以及对应的文本内容,作为商品维度的基础知识素材。
可选地,处理器62在响应该知识内容录入界面上的文本上传操作,获取该目标商家上传的目标文档时,具体用于:响应该知识内容录入界面上的文本上传操作,获取该目标商家日常积累的宣传文档、会议文档和/或培训文档,作为目标文档。
可选地,处理器62在根据该至少一个知识主题对应的文本内容,构建该目标商家应用于大语言模型的目标知识库时,具体用于:对该至少一个知识主题对应的文本内容进行分词处理,以得到该至少一个知识主题各自对应的多个文本片段;对该至少一个知识主题及其各自对应的多个文本片段进行向量化处理,以得到该至少一个知识主题各自对应的主题向量以及多个文本片段向量;根据该至少一个知识主题各自对应的主题向量以及多个文本片段向量,构建该目标商家应用于大语言模型的目标知识库。
可选地,在旅游场景下,该至少一个知识主题及其对应的文本内容至少包括:至少一种交通知识主题以及每种交通知识主题下用于描述交通攻略的文本内容;至少一种住宿知识主题以及每种住宿知识主题下用于描述住宿攻略的文本内容;以及,至少一种游玩知识主题以及每种游玩知识主题下用于描述度假攻略的文本内容。
可选地,该至少一种交通知识主题包括:飞机航班信息和/或票价信息;该至少一种住宿知识主题包括:酒店位置和/或房价信息;该至少一种游玩知识主题包括:景区信息、游玩路线信息和/或签证信息。
在一些示例性的实施例中,图6示意的电子设备还可用于执行智能客服实现方法,其中,处理器62与存储器61耦合,用于执行存储器61中的计算机程序以用于:响应知识库构建请求,展示知识内容录入界面;响应目标商家在该知识内容录入界面上的录入操作,获取该目标商家对应的基础知识素材,该基础知识素材包含至少一个知识主题及其对应的文本内容;根据该至少一个知识主题及其对应的文本内容,构建该目标商家的目标知识库;将该目标知识库与符合预设参数量范围的语言模型关联,以使该语言模型在智能客服场景中生成与用户问题匹配的答案信息;其中,该语言模型被该目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
在一些示例性的实施例中,图6示意的电子设备还可用于执行知识问答方法,其中,处理器62与存储器61耦合,用于执行存储器61中的计算机程序以用于:接收用户问题信息,该用户问题信息对应于目标商家;基于知识召回策略从该目标商家的目标知识库中获取与该用户问题信息适配的知识主题及其对应的文本片段;其中,该目标知识库采用本申请实施例提供的知识库构建方法构建得到;根据该知识主题及其对应的文本片段以及提示词模版,生成提示词;将该提示词输入符合预设参数量范围的语言模型,以使该语言模型生成与该用户问题信息匹配的答复信息。
在一些示例性的实施例中,图6示意的电子设备可用于执行智能客服实现方法,其中,处理器62,与存储器61耦合,用于执行存储器61中的计算机程序,以用于:通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材,并从至少一个数据源获取商品维度的基础知识素材;对该商家维度的基础知识素材和该商品维度的基础知识素材进行知识点提取,以得到该目标商家的目标知识库;将该目标知识库应用于语言模型以及与该语言模型适配的知识召回策略和提示词模版,以得到该目标商家的智能客服;其中,该语言模型被该目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
可选地,处理器62在通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材时,具体用于:在商家客户端展示新增知识控件;响应该目标商家对该新增知识控件的触发操作,展示知识内容录入界面;根据该目标商家对该知识内容录入界面中的该至少一种配置项的配置操作,获取该目标商家上传的知识信息;从该目标商家上传的知识信息中,识别出商家类型的知识,得到该商家维度的基础知识素材。
可选地,处理器62在从该基础知识素材中,识别出商家类型的知识,得到该商家维度的基础知识素材时,具体用于:从该目标商家上传的知识信息中,确定知识类型配置项为商家类型的第一知识信息;从该第一知识信息中,确定该知识内容配置项对应的第一配置内容;识别该第一配置内容的文件格式;采用该文件格式对应的文件解析方式,对该第一配置内容进行解析,得到该商家维度的基础知识素材。
可选地,处理器62在从至少一个数据源获取商品维度的基础知识素材时,具体用于:从该目标商家上传的知识信息中,确定知识类型配置项为商品类型的第二知识信息;从该第二知识信息中,确定该知识内容配置项对应的第二配置内容;识别该第二配置内容的文件格式;采用该文件格式对应的文件解析方式,对该第二配置内容进行解析,得到该商品维度的基础知识素材。
可选地,处理器62在从至少一个数据源获取商品维度的基础知识素材时,具体用于:从该目标商家对应的商品的详情页面上获取商品维度的基础知识素材。
可选地,处理器62在从该目标商家对应的商品的详情页面上获取商品维度的基础知识素材时,具体用于:对该商品的详情页面进行文本识别,得到商品文本信息;从该商品文本信息中,匹配与商品属性以及商品属性值对应的文本信息,得到商品维度的基础知识素材。
可选地,处理器62在对该商家维度的基础知识素材和该商品维度的基础知识素材进行知识点提取,以得到该目标商家的目标知识库时,具体用于:对任一基础知识素材,识别该基础知识素材中的知识主题以及文本内容;按照设定的文本切分规则,对该文本内容进行切分,得到多个文本片段;对该知识主题以及该多个文本片段进行向量化处理,得到知识主题的主题向量以及多个文本内容文本片段向量;根据该知识主题的主题向量与该多个文本内容文本片段向量之间的相关度,从该多个文本片段中选择与该知识主题匹配的至少一个文本片段;根据该知识主题与该至少一个文本片段生成知识点对,并将该知识点对添加到该目标知识库。
可选地,处理器62在根据该知识主题与该至少一个文本片段生成知识点对之后,还用于:根据该知识点对在不同商家用户之间的出现比例和/或该知识点对与商品固有属性的关联度,判断该知识点对是否为通用知识;若为是,则将该知识点对添加到通用知识库中;其中,该通用知识库被共用该语言模型的多个商家共用。
可选地,处理器62在在将该目标知识库应用于语言模型以及与该语言模型适配的知识召回策略和提示词模版之前,还用于:利用该目标商家所属目标行业领域中的样本知识点对,对该语言模型进行微调;和/或,根据该目标商家的目标应用场景的场景类型,确定与该语言模型适配的知识召回策略,该目标应用场景是该目标行业领域下的任一应用场景;和/或,根据该目标商家的目标应用场景中的样本知识库,构建与该语言模型适配的提示词模版。
可选地,处理器62在在得到该目标商家的智能客服之后,还用于:接收该目标商家对应的用户问题信息;基于该知识召回策略从该目标知识库中获取与该用户问题信息适配的至少一个知识点对;根据该至少一个知识点对以及该提示词模版,生成提示词;将该提示词输入语言模型,得到语言模型输出的与该用户问题信息匹配的答复信息。
可选地,处理器62在还用于:响应指定事件的触发操作,通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材,并从至少一个数据源获取商品维度的基础知识素材;对该商家维度的基础知识素材和该商品维度的基础知识素材进行知识点提取,以更新该目标商家的目标知识库;其中,该指定事件包括:数据源更新事件、定时事件或者该目标商家触发的知识库更新事件。
进一步,如图6所示,该电子设备还包括:通信组件63、显示器64、电源组件65、音频组件66等其它组件。图6中仅示意性给出部分组件,并不意味着电子设备只包括图6所示组件。另外,图6中虚线框内的组件为可选组件,而非必选组件,具体可视电子设备的产品形态而定。本实施例的电子设备可以实现为台式电脑、笔记本电脑或智能手机等终端设备,也可以是常规服务器、云服务器或服务器阵列等服务端设备。
在本申请实施例中,电子设备在构建目标商家的目标知识库时,可通过对外提供的信息上传接口接收目标商家上传的商家维度的基础知识素材,并从至少一个数据源获取商品维度的基础知识素材;对商家维度的基础知识素材和商品维度的基础知识素材进行知识点提取,得到目标商家的目标知识库。在这种实施方式中,减轻了对商家用户根据用户咨询问题配置触发规则以及对应触发规则的回答内容等操作的依赖,商家用户只需执行基础知识素材的上传操作即可指导智能客服实现智能问答,极大减轻了商家的配置工作量,简化了商家用户的操作复杂度,从而降低了智能客服的运营成本。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由电子设备执行的各步骤。
上述存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random-Access Memory,SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read Only Memory,EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM),可编程只读存储器(Programmable Read-Only Memory,PROM),只读存储器(Read-Only Memory,ROM),磁存储器,快闪存储器,磁盘或光盘。
上述通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(Near Field Communication,NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(Radio Frequency Identification,RFID)技术,红外数据协会(InfraredData Association,IrDA)技术,超宽带(Ultra Wide Band,UWB)技术,蓝牙(BlueTooth,BT)技术和其他技术来实现。
上述显示器包括屏幕,其屏幕可以包括液晶显示器(Liquid Crystal Display,LCD)和触摸面板(TouchPanel,TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。
上述电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(Microphone,MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(Central ProcessingUnit,CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-change Random AccessMemory,PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(Digital Video Disc,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (13)
1.一种用于智能客服的知识库构建方法,其特征在于,包括:
响应知识库构建请求,展示知识内容录入界面;
响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,所述基础知识素材包含至少一个知识主题及其对应的文本内容;
根据所述至少一个知识主题及其对应的文本内容,构建所述目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息。
2.根据权利要求1所述的方法,其特征在于,所述智能客服场景基于符合预设参数量范围的语言模型实现,所述语言模型基于所述目标知识库生成所述智能客服场景中用户问题的答案信息。
3.根据权利要求1所述的方法,其特征在于,响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,包括以下至少一种操作:
响应目标商家在所述知识内容录入界面上的信息录入操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的基础知识素材;
响应目标商家在所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,所述目标文档中包含基础知识素材;
响应目标商家在所述知识内容录入界面上的线上触发操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取基础知识素材。
4.根据权利要求3所述的方法,其特征在于,所述知识内容录入界面包括商家知识选项和商品知识选项,所述商家知识选项对应有信息录入控件和文本上传控件,所述商品知识选项对应有信息录入控件、文本上传控件和线上触发控件;
其中,响应目标商家在所述知识内容录入界面上的信息录入操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的基础知识素材,包括:
响应对所述商家知识选项及其对应的信息录入控件的选择操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的商家维度的基础知识素材;和/或,响应对所述商品知识选项及其对应的信息录入控件的选择操作,获取所述目标商家在所述内容录入界面的信息录入区内输入的商品维度的基础知识素材;
其中,响应所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,所述目标文档中包含基础知识素材,包括:
响应对所述商家知识选项及其对应的文本上传控件的选择操作,获取所述目标商家上传的第一目标文档,所述第一目标文档中包含商家维度的基础知识素材;和/或,响应对所述商品知识选项及其对应的文本上传控件的选择操作,获取所述目标商家上传的第二目标文档,所述第二目标文档中包含商品维度的基础知识素材;
其中,响应所述知识内容录入界面上的线上触发操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取基础知识素材,包括:
响应对所述商品知识选项及其对应的线上触发控件的选择操作,确定所述目标商家在应用平台上注册的服务链接,从所述服务链接对应的服务页面中获取商品维度的基础知识素材。
5.根据权利要求4所述的方法,其特征在于,从所述服务链接对应的服务页面中获取商品维度的基础知识素材,包括:
从所述服务链接对应的服务页面中,获取各个商品的详情页面和/或对应的问答页面;
从各个商品的详情页面和/或问答页面中,获取各个商品相关的知识主题以及对应的文本内容,作为商品维度的基础知识素材。
6.根据权利要求3所述的方法,其特征在于,响应所述知识内容录入界面上的文本上传操作,获取所述目标商家上传的目标文档,包括:
响应所述知识内容录入界面上的文本上传操作,获取所述目标商家日常积累的宣传文档、会议文档和/或培训文档,作为目标文档。
7.根据权利要求1所述的方法,其特征在于,根据所述至少一个知识主题及其对应的文本内容,构建所述目标商家应的目标知识库,以供生成智能客服场景中用户问题的答案信息,包括:
对所述至少一个知识主题对应的文本内容进行分词处理,以得到所述至少一个知识主题各自对应的多个文本片段;
对所述至少一个知识主题及其各自对应的多个文本片段进行向量化处理,以得到所述至少一个知识主题各自对应的主题向量以及多个文本片段向量;
根据所述至少一个知识主题各自对应的主题向量以及多个文本片段向量,构建所述目标商家应用于大语言模型的目标知识库。
8.根据权利要求1-7任一项所述的方法,其特征在于,在旅游场景下,所述至少一个知识主题及其对应的文本内容至少包括:
至少一种交通知识主题以及每种交通知识主题下用于描述交通攻略的文本内容;
至少一种住宿知识主题以及每种住宿知识主题下用于描述住宿攻略的文本内容;以及
至少一种游玩知识主题以及每种游玩知识主题下用于描述游玩攻略的文本内容。
9.根据权利要求8所述的方法,其特征在于,所述至少一种交通知识主题包括:飞机航班信息和/或票价信息;所述至少一种住宿知识主题包括:酒店位置和/或房价信息;所述至少一种游玩知识主题包括:景区信息、游玩路线信息和/或签证信息。
10.一种智能客服实现方法,其特征在于,包括:
响应知识库构建请求,展示知识内容录入界面;
响应目标商家在所述知识内容录入界面上的录入操作,获取所述目标商家对应的基础知识素材,所述基础知识素材包含至少一个知识主题及其对应的文本内容;
根据所述至少一个知识主题及其对应的文本内容,构建所述目标商家的目标知识库;
将所述目标知识库与符合预设参数量范围的语言模型关联,以使所述语言模型在智能客服场景中生成与用户问题匹配的答案信息;
其中,所述语言模型被所述目标商家所属应用平台上的多个商家共用,且不同商家具有各自的知识库。
11.一种知识问答方法,其特征在于,包括:
接收用户问题信息,所述用户问题信息对应于目标商家;
基于知识召回策略从所述目标商家的目标知识库中获取与所述用户问题信息适配的知识主题及其对应的文本片段;其中,所述目标知识库采用权利要求1-9任一项所述的方法构建;
根据所述知识主题及其对应的文本片段以及提示词模版,生成提示词;
将所述提示词输入符合预设参数量范围的语言模型,以使所述语言模型生成与所述用户问题信息匹配的答复信息。
12.一种电子设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储一条或多条计算机指令;
所述处理器用于执行所述一条或多条计算机指令以用于:执行权利要求1-11任一项所述的方法中的步骤。
13.一种存储有计算机程序的计算机可读存储介质,其特征在于,计算机程序被处理器执行时能够实现权利要求1-11任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311084748.XA CN117271787A (zh) | 2023-08-25 | 2023-08-25 | 知识库构建、智能客服实现与知识问答方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311084748.XA CN117271787A (zh) | 2023-08-25 | 2023-08-25 | 知识库构建、智能客服实现与知识问答方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117271787A true CN117271787A (zh) | 2023-12-22 |
Family
ID=89201703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311084748.XA Pending CN117271787A (zh) | 2023-08-25 | 2023-08-25 | 知识库构建、智能客服实现与知识问答方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117271787A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633196A (zh) * | 2024-01-24 | 2024-03-01 | 浙江阿里巴巴机器人有限公司 | 问答模型构建方法及项目问答方法 |
-
2023
- 2023-08-25 CN CN202311084748.XA patent/CN117271787A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117633196A (zh) * | 2024-01-24 | 2024-03-01 | 浙江阿里巴巴机器人有限公司 | 问答模型构建方法及项目问答方法 |
CN117633196B (zh) * | 2024-01-24 | 2024-04-30 | 浙江阿里巴巴机器人有限公司 | 问答模型构建方法及项目问答方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775494B2 (en) | Multi-service business platform system having entity resolution systems and methods | |
US11715289B2 (en) | Generating multi-perspective responses by assistant systems | |
US11657094B2 (en) | Memory grounded conversational reasoning and question answering for assistant systems | |
Narangajavana Kaosiri et al. | User-generated content sources in social media: A new approach to explore tourist satisfaction | |
RU2745632C1 (ru) | Серверное устройство автоматизированного ответа, оконечное устройство, система ответа, способ ответа и программа | |
US20220206993A1 (en) | Multi-service business platform system having custom object systems and methods | |
US11995112B2 (en) | System and method for information recommendation | |
Veltri | Digital social research | |
US20220067115A1 (en) | Information processing method, apparatus, electrical device and readable storage medium | |
US11676220B2 (en) | Processing multimodal user input for assistant systems | |
US20190138637A1 (en) | Automated document assistant using quality examples | |
CN114756122A (zh) | 确定用于执行动作的代理的方法、计算设备和存储介质 | |
Gümüş et al. | The effect of customers’ attitudes towards chatbots on their experience and behavioural intention in Turkey | |
US20210263978A1 (en) | Intelligent interface accelerating | |
US9767417B1 (en) | Category predictions for user behavior | |
US9767204B1 (en) | Category predictions identifying a search frequency | |
Kreutzer et al. | Fields of application of artificial intelligence—customer service, marketing and sales | |
EP3557500A1 (en) | Building customized user profiles based on conversational data | |
Anwar Hridoy et al. | Localized twitter opinion mining using sentiment analysis | |
CN117271787A (zh) | 知识库构建、智能客服实现与知识问答方法、设备及介质 | |
Sabharwal et al. | Developing Cognitive Bots Using the IBM Watson Engine: Practical, Hands-on Guide to Developing Complex Cognitive Bots Using the IBM Watson Platform | |
CN108829470A (zh) | 用于增加与社交网络中的职位公告/优选职位的用户交互的专用用户界面和过程 | |
US20130066700A1 (en) | Group transaction processing using a social stream | |
Paas et al. | Adoption of services and apps on mobile phones by micro-entrepreneurs in Sub-Saharan Africa | |
EP3557498A1 (en) | Processing multimodal user input for assistant systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |