CN112486947A - 一种知识库构建方法、装置、电子设备及可读存储介质 - Google Patents

一种知识库构建方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112486947A
CN112486947A CN202011306989.0A CN202011306989A CN112486947A CN 112486947 A CN112486947 A CN 112486947A CN 202011306989 A CN202011306989 A CN 202011306989A CN 112486947 A CN112486947 A CN 112486947A
Authority
CN
China
Prior art keywords
target service
knowledge
knowledge base
user
hierarchy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011306989.0A
Other languages
English (en)
Inventor
董劲麟
范会善
王炼
罗贤桂
炊向军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202011306989.0A priority Critical patent/CN112486947A/zh
Publication of CN112486947A publication Critical patent/CN112486947A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及机器人智能客服技术领域,具体涉及一种知识库构建方法、装置、电子设备及可读存储介质。所述方法包括:获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;根据构建的目标服务知识包构建目标服务知识库。

Description

一种知识库构建方法、装置、电子设备及可读存储介质
技术领域
本发明涉及机器人智能客服技术领域,具体涉及一种知识库构建方法、装置、电子设备及可读存储介质。
背景技术
目前很多企业的服务业务均是利用对话机器人技术实现智能客服,并将这样的技术应用在了手机客户端、企业微信、网络银行、网站、短信等多种渠道。智能客服的开展目前均是采用知识库问答方式,知识库问答方法通过先进的人工智能技术结合传统的模式匹配方法确保了智能客服能获得很高的准确率,但是由于知识库里面的全部内容都需要业务人员进行维护配置,所以人工维护成本极高。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的技术方案如下:
第一方面,本申请实施例公开了一种知识库构建方法,所述方法包括:
获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
根据构建的目标服务知识包构建目标服务知识库。
进一步地,所述企业目标服务组成结构信息包括:所述目标服务组成的层级结构和/或类型结构。
进一步地,所述获取目标服务组成的层级结构包括:
获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。
进一步地,所述获取目标服务组成的类型结构包括:获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户、目标服务电话服务接口、目标服务短信服务接口。
进一步地,在完成所述知识库构建后,所述方法还包括:
接收用户输入的问题;其中所述用户输入的问题内容包括有所述目标服务的结构单元信息;
根据预设解析规则,解析用户输入的问题;
解析完成后,根据所述问题中包含的结构单元信息在所述知识库中定位与所述用户问题相关联的知识包;
在相关联的知识包括中搜索与所述用户问题关联的知识点;
根据预设匹配算法,计算所述知识点与所述用户问题的匹配度;
当所述匹配度值满足预设阈值时,输出所述知识点至用户的智能终端。
进一步地,所述预设解析规则包括但限于:对所述用户输入的问题进行词法分析、句法分析和/或上下文分析。其中,对用户输入的问题进行词法分析进一步包括:利用CRF模型对用户问题进行分词,使用MaxEntmo模型进行对所述分词进行词性标注。
可选地,在对所述用户输入的问题进行解析之前,所述方法还包括:按照预处理规则,对所述用户输入的问题进行预处理。进一步地,所述预处理规则包括但不限于:对所述用户输入的问题进行前后缀处理、拼音纠错、词典纠正处理。
另一方面本申请实施例提供了一种知识库构建装置,所述装置包括:查询模块和构建模块;其中,
所述查询模块,用于获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
所述构建模块,用于根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
所述构建模块,还用于根据构建的目标服务知识包构建目标服务知识库。
进一步地,所述查询模块具体用于查询:所述目标服务组成的层级结构和/或类型结构。
进一步地,所述查询模块获取目标服务组成的层级结构包括:所述查询模块获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。
进一步地,所述查询模块获取目标服务组成的类型结构包括:所述查询模块获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户、目标服务电话服务接口、目标服务短信服务接口。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述任一实施例中所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
本申请实施例提供的知识库构建方案利用了知识渠道间的共性、地区地点的层级关系以及业务的分类特性构建了一个多层级的知识库结构,把知识点划分成知识包,每个渠道知识库由层级知识包组成。新接入的渠道可以利用原有的知识包进行构建学习,只需要调整极少的知识包即可对外服务,相较现有技术的知识库通过一条条知识的保存,不同维度入口的答案是在一条知识里面扩展,知识点添加及修订只能逐条进项而言,本申请的方案提高了知识库接入、构建和维护的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种知识库构建方法的流程示意图;
图2为本申请实施例提供的一种知识库的结构示意图;
图3为本申请实施例提供的一种知识库构建装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,其中的“第一”“第二”等只是为了介绍清楚方案而进行的对象区分定义,并不对对象本身进行限制,当然“第一”和“第二”限定的对象可能是同一个终端、设备和用户等,也可能是同一种终端、设备和用户。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
此外应理解,本申请实施例中“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一(项)个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c,其中a、b、c可以是单个,也可以是多个。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
目前现有技术中的知识库构建方案如背景技术中介绍的存在着维护成本高的问题,这是因为知识库问答首先要建立一个业务知识库,知识库中最主要包括词库及知识点。词库是由业务人员配置的同义词库,每一条记录由词类名及其同义词组成。知识点由标准问、标准答案、扩展问及其他元素组成,扩展问可以是普通的问题,也可以是由词类构成的模板。标准答案可以根据不同的渠道入口、位置等多维度设置。客户在前端渠道发送问题到机器人,机器人接收到句子后进行一系列的预处理动作,并进行分词。分词结果与快速与知识点进行匹配计算,如最高的匹配度结果大于预设阀值则判定为命中,返回该问题在对应渠道的答案。这样的方案是通过把问题与答案形成一对多的关系,实现了同一个问题在不同维度有不同的答案。知识库问答方法通过先进的人工智能技术结合传统的模式匹配方法确保了智能客服能获得很高的准确率,但是由于知识库里面的全部内容都需要业务人员进行维护配置,所以人工维护成本极高。针对与银行等金融机构的业务来说,假如知识库里面有1万条知识点,每接入一个渠道就要对应的增加一万个问题答案,有的渠道还区分地区(分行)、地点(网点)等维度,当知识库需要接入新渠道时,业务配置周期就需要很长的工期。基于此,本发明的以下实施例就是提供一种知识库构建方法以解决上述至少之一的缺陷。
为了更清楚地介绍本申请的技术方案,以下介绍一些下述实施例可能涉及到的概念、术语或装置,以帮助理解本申请公开的知识库构建方案:
知识点:知识点是知识、理论、道理、思想等的相对独立的最小单元。
问答对:知识点的一种表现形式,由一对问题及其对应的答案组成。
标准问:问答对中问题的标准问法
扩展问:与标准问题语义相同或相近的问法
知识库:知识工程中结构化、易操作、易利用、全面有组织的知识集群,是针对某一领域问题求解的需要,采用某种知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。
知识包:由一条或多条有功能特征的知识点组成的知识单元。
知识包组:由一个或多个知识包通过排列的方式组成的知识结构。
对话机器人:是一个用来模拟人类对话或聊天的程序,通过机器学习和人工智能等技术让机器理解人的语言,并基于知识库进行对答。
CRF(Conditional Random Fields,条件随机场)模型,被用于中文分词和词性标注等词法分析工作,一般序列分类模型常常采用隐马尔可夫模型(HMM),像基于类的中文分词。
MaxEnt:最大熵模型(Maximum Entropy Models)。
图1示出了本申请实施例提供的一种知识库构建的流程示意图,如图1所示,该方法主要可以包括:
S101、获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
在进一步地,所述获取目标服务组成的层级结构包括:获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。例如对于银行卡开户行信息查询的智能客户服务中,在建立相应的知识库时首先需要确定用户的A银行储蓄卡的开户行信息查询这一服务可能涉及的层级机构,确定层级结构的过程为:
首先获取A银行组织结构根据公司服务关联性包括为总行、分行、支行等;其中分行中又可以按照地区分布划分为各省、各市以及各区,其中总行、每个分行都可以称之为一个结构单元,那么相应的,可以为总行相关的服务建立一个知识包、为每一个分行构建相应的知识包,在根据这些知识包所对应的服务结构单元的层级关系构建,把这些知识包组成为具有层级逻辑关系的知识库,当然,对于业务类型和层级完全重叠的知识包可只保留一个,在构建的知识库中,所述一个知识包可映射多个结构单元,一个结构单元也可以映射多少知识包。
在进一步的可选实施例中,所述获取目标服务组成的类型结构包括:获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户(例如企业微信等微门户平台)、目标服务电话服务接口、目标服务短信服务接口,一个接口类型为一个结构单元。再以A银行储蓄卡开户行的查询信息为例,机器智能客服可以通过A银行客户端进行、可以A银行企业微信进行、可以电话或短信查询进行,每一个接口渠道可以称之为一个结构单元,一个结构单元可以相应的构建一个知识包,同样对于业务类型和层级完全重叠的知识包可只保留一个,在构建的知识库中,所述一个知识包可映射多个结构单元,一个结构单元也可以映射多少知识包。
S102、根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
S103、根据构建的目标服务知识包构建目标服务知识库。
为了更清楚地介绍本申请实施例所述的知识库构建方法,下面以银行服务为例,对知识库的构建逻辑进行示例性的说明。在银行机器智能客服中,按照上述实施例构建的知识库是多层级结构的,如图2所示,层级结构可以是顶层为渠道(即服务开展的接口类型),第二层为分行(服务的层级结构),第三层为网点,末级节点为知识包组,知识包组是由知识包排列组合而成,知识包在组合中的顺序为机器人检索顺序,以上四层结构就组成了一个银行机器智能客服的知识库。在具体应用中,客户通过前端渠道向机器人提问时,前端渠道会上送客户问题、渠道编号、分行号、网点机构号等信息,机器人在对应的知识库中寻找知识答案。机器人根据渠道上送的参数定位到末级节点,在该节点的知识包组中逐个检索知识包,通过算法计算出知识包中匹配度最高的知识点,并返回该知识点的答案。
在进一步的可选实施例中,在完成所述知识库构建后,利用所述构建的知识库的方式为:
步骤1、接收用户输入的问题;其中所述用户输入的问题内容包括有所述目标服务的结构单元信息;例如,上送客户问题到智能机器人应用,并附带渠道ID,分行号,网点机构号等信息。
步骤2、按照预处理规则,对所述用户输入的问题进行预处理。在进一步的可选实施例中,所述预处理规则包括但不限于:对所述用户输入的问题进行前后缀处理、拼音纠错、词典纠正处理。
步骤3、根据预设解析规则,解析用户输入的问题;在进一步的可选实施例中,所述预设解析规则包括但限于:对所述用户输入的问题进行词法分析、句法分析和/或上下文分析。其中,对用户输入的问题进行词法分析进一步包括:利用CRF模型对用户问题进行分词,使用MaxEntmo模型进行对所述分词进行词性标注。词法分析结束后机器人智能客服搜索引擎进行句法分析及上下文关联分析。
步骤4、解析完成后,根据所述问题中包含的结构单元信息在所述知识库中定位与所述用户问题相关联的知识包,例如根据客户问题附带的渠道ID,分行号,网点机构号定位对应的知识包。
步骤5、在相关联的知识包括中搜索与所述用户问题关联的知识点;
步骤6、根据预设匹配算法,计算所述知识点与所述用户问题的匹配度;
步骤7、当所述匹配度值满足预设阈值时,输出所述知识点至用户的智能终端。
基于图1所示的知识库构建方法,另一方面本申请实施例提供了一种知识库构建装置,如图3所示,装置可以包括:所述装置包括:301查询模块和302构建模块;其中,
所述301查询模块,用于获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
所述302构建模块,用于根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
所述302构建模块,还用于根据构建的目标服务知识包构建目标服务知识库。
在进一步的可选实施例中,所述301查询模块具体用于查询:所述目标服务组成的层级结构和/或类型结构。
在进一步的可选实施例中,所述301查询模块获取目标服务组成的层级结构包括:所述301查询模块获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。
在进一步的可选实施例中,所述301查询模块获取目标服务组成的类型结构包括:所述301查询模块获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户、目标服务电话服务接口、目标服务短信服务接口。
可以理解的是,本实施例中的知识库构建装置的上述各组成设备具有实现图1中所示的实施例中的方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或装置。上述模块和装置可以是软件和/或硬件,上述各模块和装置可以单独实现,也可以多个模块和装置集成实现。对于上述各模块和装置的功能描述具体可以参见图1中所示实施例中的方法的对应描述,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
可以理解的是,本发明实施例示意的结构并不构成对知识库构建装置的具体结构的具体限定。在本申请另一些实施例中,知识库构建装置可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
本申请实施例提供了一种电子设备,包括处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本申请任一实施方式中所提供的知识库构建方法。
作为一个示例,图4示出了本申请实施例所适用的一种电子设备的结构示意图,如图4所示,该电子设备400包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。可选的,电子设备400还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个。可以理解的是,本发明实施例示意的结构并不构成对电子设备400的具体结构的具体限定。在本申请另一些实施例中,电子设备400可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实。可选地,电子设备还可以包括显示屏405,用于显示图像,或需要时接收用户的操作指令。
其中,处理器401应用于本申请实施例中,用于实现上述方法实施例所示的方法。收发器404可以包括接收机和发射机,收发器404应用于本申请实施例中,用于执行时实现本申请实施例的电子设备与其他设备通信的功能。
处理器401可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
处理器401也可以包括一个或多个处理单元,例如:处理器401可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphicsprocessingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是电子设备400的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器401中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器401中的存储器为高速缓冲存储器。该存储器可以保存处理器401刚用过或循环使用的指令或数据。如果处理器401需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器401的等待时间,因而提高了系统的效率。
处理器401可以运行本申请实施例提供的知识库构建方法,以便于降低用户的操作复杂度、提高终端设备的智能化程度,提升用户的体验。处理器401可以包括不同的器件,比如集成CPU和GPU时,CPU和GPU可以配合执行本申请实施例提供的知识库构建方法,比如知识库构建方法中部分算法由CPU执行,另一部分算法由GPU执行,以得到较快的处理效率。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘),也可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flashstorage,UFS),或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现本申请任一实施方式中所提供的知识库构建方法。
存储器403可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器401通过运行存储在存储器403的指令,从而执行电子设备400的各种功能应用以及数据处理。存储器403可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,应用程序的代码等。存储数据区可存储电子设备400使用过程中所创建的数据(比如相机应用采集的图像、视频等)等。
存储器403还可以存储本申请实施例提供的知识库构建方法对应的一个或多个计算机程序。该一个或多个计算机程序被存储在上述存储器403中并被配置为被该一个或多个处理器401执行,该一个或多个计算机程序包括指令,上述指令可以用于执行上述相应实施例中的各个步骤。
当然,本申请实施例提供的知识库构建方法的代码还可以存储在外部存储器中。这种情况下,处理器401可以通过外部存储器接口运行存储在外部存储器中的知识库构建方法的代码,处理器401可以控制运行知识库构建流程。
显示屏405包括显示面板。显示面板可以采用液晶显示屏(liquid crystaldisplay,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备400可以包括1个或N个显示屏405,N为大于1的正整数。显示屏405可用于显示由用户输入的信息或提供给用户的信息以及各种图形用户界面(graphical userinterface,GUI)。例如,显示屏405可以显示照片、视频、网页、或者文件等。
本申请实施例提供的电子设备,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的知识库构建方法。
本申请实施例提供的计算机可读存储介质,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的方法。本申请实施例提供的计算机程序产品,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供的知识库构建方案利用了知识渠道间的共性、地区地点的层级关系以及业务的分类特性构建了一个多层级的知识库结构,把知识点划分成知识包,每个渠道知识库由层级知识包组成。新接入的渠道可以利用原有的知识包进行构建学习,只需要调整极少的知识包即可对外服务,相较现有技术的知识库通过一条条知识的保存,不同维度入口的答案是在一条知识里面扩展,知识点添加及修订只能逐条进项而言,本申请的方案提高了知识库接入、构建和维护的效率。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块或单元的划分,仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以丢弃,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,还可以做出若干改进和润饰,这些变化、替换、改进和润饰也应视为都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (15)

1.一种知识库构建方法,其特征在于,所述方法包括:
获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
根据构建的目标服务知识包构建目标服务知识库。
2.根据权利要求1所述的知识库构建方法,其特征在于,所述企业目标服务组成结构信息包括:
所述目标服务组成的层级结构和/或类型结构。
3.根据权利要求2所述的知识库构建方法,其特征在于,所述获取目标服务组成的层级结构包括:
获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。
4.根据权利要求2或3所述的知识库构建方法,其特征在于,所述获取目标服务组成的类型结构包括:
获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户、目标服务电话服务接口、目标服务短信服务接口。
5.根据权利要求4所述的知识库构建方法,其特征在于,在完成所述知识库构建后,所述方法还包括:
接收用户输入的问题;其中所述用户输入的问题内容包括有所述目标服务的结构单元信息;
根据预设解析规则,解析用户输入的问题;
解析完成后,根据所述问题中包含的结构单元信息在所述知识库中定位与所述用户问题相关联的知识包;
在相关联的知识包括中搜索与所述用户问题关联的知识点;
根据预设匹配算法,计算所述知识点与所述用户问题的匹配度;
当所述匹配度值满足预设阈值时,输出所述知识点的答案至用户的智能终端。
6.根据权利要求5所述的知识库构建方法,其特征在于,所述预设解析规则包括但限于:
对所述用户输入的问题进行词法分析、句法分析和/或上下文分析。
7.根据权利要求6所述的知识库构建方法,其特征在于,所述对用户输入的问题进行词法分析进一步包括:
利用CRF模型对用户问题进行分词,使用MaxEnt模型进行对所述分词进行词性标注。
8.根据权利要求7所述的知识库构建方法,其特征在于,在对所述用户输入的问题进行解析之前,所述方法还包括:
按照预处理规则,对所述用户输入的问题进行预处理。
9.根据权利要求8所述的知识库构建方案,其特征在于,所述预处理规则包括但不限于:
对所述用户输入的问题进行前后缀处理、拼音纠错、词典纠正处理。
10.一种知识库构建装置,其特征在于,所述装置包括:查询模块和构建模块;其中,
所述查询模块,用于获取企业目标服务组成结构信息;其中所述组成结构中包括至少一个结构单元;
所述构建模块,用于根据所述组成结构信息构建目标服务知识包;其中一个结构单元与至少一个知识包存在映射关系;
所述构建模块,还用于根据构建的目标服务知识包构建目标服务知识库。
11.根据权利要求10所述的知识库构建装置,其特征在于,所述查询模块具体用于查询:所述目标服务组成的层级结构和/或类型结构。
12.根据权利要求11所述的知识库构建装置,其特征在于,所述查询模块获取目标服务组成的层级结构包括:
所述查询模块获取目标服务所涉及的组织机构层级;其中所述组织结构层级维度包括地区和/或组织上下级关系;其中一个结构层级中至少包括一个结构单元。
13.根据权利要求11或12所述的知识库构建装置,其特征在于,所述查询模块获取目标服务组成的类型结构包括:
所述查询模块获取访问目标服务的接口类型信息;其中所述接口类型信息包括:目标服务客户端、目标服务微门户、目标服务电话服务接口、目标服务短信服务接口。
14.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行权利要求1-9中任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9中任一项所述的方法。
CN202011306989.0A 2020-11-20 2020-11-20 一种知识库构建方法、装置、电子设备及可读存储介质 Pending CN112486947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011306989.0A CN112486947A (zh) 2020-11-20 2020-11-20 一种知识库构建方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011306989.0A CN112486947A (zh) 2020-11-20 2020-11-20 一种知识库构建方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN112486947A true CN112486947A (zh) 2021-03-12

Family

ID=74932014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011306989.0A Pending CN112486947A (zh) 2020-11-20 2020-11-20 一种知识库构建方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112486947A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282731A (zh) * 2021-06-09 2021-08-20 中国农业银行股份有限公司 一种知识数据的维护方法和装置
CN113569019A (zh) * 2021-05-24 2021-10-29 恩亿科(北京)数据科技有限公司 基于聊天对话进行知识提取的方法、系统、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569019A (zh) * 2021-05-24 2021-10-29 恩亿科(北京)数据科技有限公司 基于聊天对话进行知识提取的方法、系统、设备及存储介质
CN113569019B (zh) * 2021-05-24 2024-04-30 恩亿科(北京)数据科技有限公司 基于聊天对话进行知识提取的方法、系统、设备及存储介质
CN113282731A (zh) * 2021-06-09 2021-08-20 中国农业银行股份有限公司 一种知识数据的维护方法和装置

Similar Documents

Publication Publication Date Title
WO2021217935A1 (zh) 问题生成模型的训练方法、问题生成方法及其相关设备
CN109670163B (zh) 信息识别方法、信息推荐方法、模板构建方法及计算设备
US20220198327A1 (en) Method, apparatus, device and storage medium for training dialogue understanding model
CN110945500A (zh) 键值记忆网络
EP3926531A1 (en) Method and system for visio-linguistic understanding using contextual language model reasoners
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
WO2020233131A1 (zh) 问答处理方法、装置、计算机设备和存储介质
CN110795541B (zh) 文本查询方法、装置、电子设备及计算机可读存储介质
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
JP7295200B2 (ja) 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
CN112486947A (zh) 一种知识库构建方法、装置、电子设备及可读存储介质
CN112612845A (zh) 一种组织机构视图实现方法、装置、电子设备及可读存储介质
CN112101042A (zh) 文本情绪识别方法、装置、终端设备和存储介质
CN112182312A (zh) 一种机构名称匹配方法、装置、电子设备及可读存储介质
US20200004786A1 (en) Corpus generating method and apparatus, and human-machine interaction processing method and apparatus
CN111508502A (zh) 使用多标记结构的转录纠正
CN111444313B (zh) 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN116249971A (zh) 集束搜索中的动态高速缓存管理
WO2022141872A1 (zh) 文献摘要生成方法、装置、计算机设备及存储介质
CN113704434A (zh) 知识库问答方法、电子设备及可读存储介质
US20220198358A1 (en) Method for generating user interest profile, electronic device and storage medium
US11972218B1 (en) Specific target-oriented social media tweet sentiment analysis method
CN111506717B (zh) 问题答复方法、装置、设备及存储介质
US20230065965A1 (en) Text processing method and apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination