CN107748795B - 一种构建知识库的方法、系统及装置 - Google Patents
一种构建知识库的方法、系统及装置 Download PDFInfo
- Publication number
- CN107748795B CN107748795B CN201711071605.XA CN201711071605A CN107748795B CN 107748795 B CN107748795 B CN 107748795B CN 201711071605 A CN201711071605 A CN 201711071605A CN 107748795 B CN107748795 B CN 107748795B
- Authority
- CN
- China
- Prior art keywords
- content
- reply
- reply content
- knowledge base
- merged
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种构建知识库的方法,接收包含有问题编号及问题编号对应的回复内容编号的入库请求;判断入库请求中是否包括多个回复内容编号;如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库;否则,根据回复内容编号获取对应的回复内容并保存到知识库。可以看出,回复内容编号可以是一个,也可以是多个,当回复内容编号为多个时,将对应的多个回复内容进行合并,再保存到数据库。这种构建知识库的方法,使问题对应的回复内容更加全面。本发明还公开了一种构建知识库的系统及装置,效果如上。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种构建知识库的方法、系统及装置。
背景技术
随着计算机技术的不断发展,越来越多的知识问答系统渗透人们的生活。人们可以通过问答系统提问,其他人通过问答系统回复问题。为了便于查询已解决过的问题及对应的准确的回复,对于问答系统,还需要构建知识库。
用户可以通过提问、回复及采纳回复的方式,搜集遇到的问题的解决方法,但是以往构建知识库时,做法较单一,例如,只能对某个人的某条回复内容进行采纳,采纳时也只能对整条回复内容进行完全采纳,从而导致采纳的回复内容不全面且准确度不高。
因此,如何构建知识库,使问题对应的回复内容更加全面,是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种构建知识库的方法、系统及装置,在构建知识库时,使问题对应的回复内容更加全面。
为了解决上述技术问题,本发明提供一种构建知识库的方法,包括:
接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求;
判断所述入库请求中是否包括多个所述回复内容编号;
如果是,根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并后保存到知识库;
否则,根据所述回复内容编号获取对应的回复内容并保存到所述知识库。
优选地,所述根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并后保存到知识库具体包括:
根据所述入库请求依次判断各所述回复内容编号是否存在对应的标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并合并;否则,根据所述回复内容编号获取对应的所述回复内容;
将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库;
相对应地,所述根据所述回复内容编号获取对应的回复内容并保存到所述知识库具体包括:
根据所述入库请求判断所述回复内容编号是否存在对应的所述标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各所述标注内容并合并后保存到所述知识库;否则,根据所述回复内容编号获取所述回复内容并保存到所述知识库。
优选地,所述将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库具体为:
按照预置的编排格式将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库。
优选地,所述根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并合并具体为:
根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并按照预置的编排格式合并。
优选地,所述预置的编排格式具体为插入分段符号的编排格式。
优选地,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
根据所述问题编号对应的问题标题获取关键词并建立所述关键词与问题的关联关系;
保存所述关键词及所述关联关系到所述知识库。
优选地,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
向管理后台发送所述入库请求,以便审核人员对所述入库请求进行再次审核;
接收到审核确认消息后,进入所述判断所述入库请求中是否包括多个回复内容编号的步骤。
优选地,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
停止接收所述问题的回复。
本发明还提供一种构建知识库的系统,包括:
问题管理模块,用于接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求;
知识审核模块,用于判断所述入库请求中是否包括多个回复内容编号;如果是,根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并;否则,根据所述回复内容编号获取对应的回复内容;
知识库模块,用于保存所述回复内容或合并后的各所述回复内容。
本发明还提供一种构建知识库的装置,包括处理器,所述处理器用于执行存储器中存储的程序时实现上述任一种构建知识库的方法的步骤。
本发明提供的构建知识库的方法,接收包含有问题编号及问题编号对应的回复内容编号的入库请求;判断入库请求中是否包括多个回复内容编号;如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库;否则,根据回复内容编号获取对应的回复内容并保存到知识库。可以看出,回复内容编号可以是一个,也可以是多个,当回复内容编号为多个时,将对应的多个回复内容进行合并,再保存到数据库。也就是说,用户可以根据需要选取回复中的一条或多条,相比于现有技术只能选取回复中的一条并构建知识库的方法,本发明提供的构建知识库的方法,使问题对应的回复内容更加全面。本发明提供的构建知识库的系统及装置,效果如上。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种构建知识库的方法的流程图;
图2为本发明实施例提供的另一种构建知识库的方法的流程图;
图3为本发明实施例提供的另一种构建知识库的方法的流程图;
图4为本发明实施例提供的另一种构建知识库的方法的流程图;
图5为本发明实施例提供的一种构建知识库的系统的结构图;
图6为本发明实施例提供的另一种构建知识库的系统的结构图;
图7为本发明实施例提供的一种构建知识库的装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动的前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的目的是提供一种构建知识库的方法、系统及装置,在构建知识库时,使问题对应的回复内容更加全面。
为了使本领域的技术人员更好的理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种构建知识库的方法的流程图,如图1所示,构建知识库的方法包括以下步骤:
S10:接收包含有问题编号及问题编号对应的回复内容编号的入库请求。
可以先接收用户发布的问题,再接收对该问题的回复,这里,对问题回复的人可以是发布问题的用户,也可以是其他用户,本发明对此不作限定。问题、问题编号、问题的回复内容、回复内容编号可以保存在数据库中。当然,数据库中还可以保存问题标题、发布时间、发布人、回复时间、回复人等信息。
接收包含有问题编号及对应的回复内容编号的入库请求,回复内容编号对应的回复内容是发布问题的用户从所有回复内容中选择出的满意的回复内容。
S11:判断入库请求中是否包括多个回复内容编号。
回复内容编号可以是一个,说明发布问题的用户对所有回复内容中的一条比较满意,回复内容编号也可以是多个,说明发布问题的用户对所有回复内容中的多条回复内容比较满意。回复内容编号用以区分问题的各个回复内容。
需要说明的是,多个回复内容编号是指大于或等于2的正整数个回复内容编号。
如果是,进入步骤S12,否则,进入步骤S13。
S12:根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库。
对于入库请求中包括多个回复内容编号的情况,可以根据各回复内容编号从数据中查找对应的各回复内容,并将得到的各回复内容进行合并,合并后保存到知识库。
S13:根据回复内容编号获取对应的回复内容并保存到知识库。
对于入库请求中包括一个回复内容编号的情况,可以根据回复内容编号从数据库中查找对应的回复内容,并将得到的回复内容保存到知识库。
对于入库请求中包括多个回复内容编号的情况,下面以一个具体的例子对本发明提供的构建知识库的方法进行详细说明,例如对于问题:“在税务局申领发票需要什么资料?”,问题发布者比较满意的其中一条回复内容为“税务登记证和两份纳税人领购发票票种核定申请表。”,该回复内容对应的回复内容编号为001;问题发布者满意的另一条回复内容为“经办人的身份证明及复印件和财务专用章和发票专用章印模。”,该回复内容对应的回复内容编号为002。因此入库请求中包括回复内容编号001和002,根据回复内容编号从数据库中查找到回复内容,进行合并,合并后的结果为“税务登记证和两份纳税人领购发票票种核定申请表。经办人的身份证明及复印件和财务专用章或发票专用章印模。”,并将合并后的结果保存到数据库中,方便用户查询类似的问题及对应的回复内容。
接收包含有问题编号及对应的回复内容编号的入库请求;判断入库请求中是否包括多个回复内容编号;如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库;否则,根据回复内容编号获取对应的回复内容并保存到知识库。可以看出,回复内容编号可以是一个,也可以是多个,当回复内容编号为多个时,对对应的多个回复内容进行合并,再保存到数据库。也就是说,用户可以根据需要选取回复中的一条或多条,本实施例提供的构建知识库的方法,构建知识库时,问题对应的回复内容更加全面。
图2为本发明实施例提供的另一种构建知识库的方法的流程图,如图2所示,在上述实施例的基础上,入库请求中包括多个回复内容编号时,步骤S12具体包括:
S20:根据入库请求依次判断各回复内容编号是否存在对应的标注内容编号。
入库请求中可以包括标注内容编号,对应的,数据库中还可以保存有回复内容对应的标注内容和标注内容编号。根据入库请求判断各回复内容编号是否存在对应的标注内容编号,如果是,进入步骤S21,如果否,进入步骤S22。
具体地,可以通过判断回复内容编号对应的标注内容编号部分是否为空,若为空,说明该回复内容不存在标注内容,如果不为空,说明该回复内容存在标注内容。
S21:根据各标注内容编号获取与回复内容编号对应的各标注内容并合并。
执行完步骤S21后,进入步骤S23。
如果一个回复内容编号存在对应的标注内容编号,对于该回复内容编号及对应的各标注内容编号,查询数据库,获取各标注内容,并对获取到的各标注内容进行合并。
需要说明的是,一个回复内容编号可以对应一个标注内容编号,说明对应的回复内容中包括一条标注内容。一个回复内容编号也可以对应多个标注内容编号,说明回复内容中存在多条标注内容。本发明对此不作限定。
如果回复内容编号存在一个对应的标注内容编号,根据标注内容编号查询数据库,获取标注内容,将该标注内容合并后仍然是对应的这一条标注内容。如果回复内容编号存在大于或等于2个对应的标注内容编号,依次根据各标注内容编号获取各标注内容,并将获取到的标注内容进行合并。
S22:根据回复内容编号获取对应的回复内容。
执行完步骤S22后,进入步骤S23。
如果回复内容编号不存在对应的标注内容编号,查询数据库,并根据回复内容编号获取对应的整条回复内容。
S23:将各回复内容编号对应的各合并后的标注内容或各回复内容合并,并保存到知识库。
对于每个回复内容编号,要么得到合并后的标注内容,要么得到回复内容,将各回复内容编号对应的各合并后的标注内容或者各回复内容合并,并保存到知识库。
相对应地,在上述实施例的基础上,入库请求中包括一个回复内容编号,步骤S13具体包括:
S24:根据入库请求判断回复内容编号是否存在对应的标注内容编号。
判断入库请求中是否存在标注内容编号,如果是,进入步骤S25,如果否,进入步骤S26。
具体地,可以通过判断回复内容编号对应的标注内容编号部分是否为空,若为空,说明该回复内容不存在标注内容,如果不为空,说明该回复内容存在标注内容。
S25:根据各标注内容编号获取与回复内容编号对应的各标注内容并合并后保存到知识库。
根据各标注内容编号及回复内容编号,查询数据库,获取该回复内容对应的各标注内容,合并后保存到数据库。
需要说明的是,一个回复内容编号可以对应一个标注内容编号,说明对应的回复内容中包括一条标注内容。一个回复内容编号也可以对应多个标注内容编号,说明回复内容中存在多条标注内容。本发明对此不作限定。
S26:根据回复内容编号获取回复内容并保存到知识库。
根据回复内容编号,查询数据库,获取该回复内容编号对应的回复内容,并保存到数据库。
为了使本领域技术人员更好的理解本实施例提供的构建知识库的方法,以一个具体的例子进行详细说明,对于问题:“在税务局申领发票需要什么资料?”,问题发布者比较满意的一条回复内容为“税务登记证和两份纳税人领购发票票种核定申请表。”,该回复内容对应的回复内容编号为001,对于该回复内容,问题发布者认为“税务登记证”是需要的,而“两份纳税人领购发票票种核定申请表”是不需要的,所以对该回复内容的“税务登记证”进行标记,即“税务登记证”为标记内容,标记内容编号为0011;问题发布者满意的另一条回复内容为“经办人的身份证明及复印件和财务专用章和发票专用章印模。”,该回复内容对应的回复内容编号为002,问题发布人认为“经办人的身份证明及复印件”和“发票专用章印模”是需要的,而“财务专用章”是不需要的,所以对该回复内容的“经办人的身份证明及复印件”和“和发票专用章印模”进行标记,“经办人的身份证明及复印件”对应的标记内容编号为0021,“和发票专用章印模”对应的标记内容编号为0022。
因此入库请求中包括回复内容编号001和002、以及回复内容编号001对应的标记内容编号0011、回复内容编号002对应的标记内容编号0021和0022。在构建知识库时,根据回复内容编号001对应的标记内容编号0011,通过查询数据库,找到回复内容编号001对应的标记内容,及“税务登记证”。再根据回复内容编号002对应的标记内容编号0021和0022,通过查询数据库,找到回复内容编号002对应的标记内容并将标记内容合并,即为“经办人的身份证明及复印件和发票专用章印模”。然后,再将回复内容编号001和回复内容编号002得到的“税务登记证”和“经办人的身份证明及复印件和发票专用章印模”进行合并,即为“税务登记证经办人的身份证明及复印件或发票专用章印模”。
本实施例提供的创建知识库的方法,判断回复内容编号是否存在对应的标记内容,如果有标记内容,获取标记内容,如果没有,获取回复内容。可以看出,该方法可以根据需要选取回复内容中的一部分内容进行标注,并将标注内容保存到知识库。创建知识库时,准确度更高。
在上述实施例的基础上,为了在查询知识库时,知识库中保存的内容更加友好地展示出来,作为优选地实施方式,步骤23具体为,按照预置的编排格式将各回复内容编号对应的各合并后的标注内容或各回复内容合并,并保存到知识库。
优选地,预置的编排格式具体为插入分段符号的编排格式。当然,预置的编排格式还可以是其他形式,如插入句号等,本发明在此不再赘述。
在上述实施例的基础上,为了在查询数据库时,知识库中保存的内容更加友好地展示出来,作为优选地实施方式,根据各标注内容编号获取与回复内容编号对应的各标注内容并合并具体为,根据各标注内容编号获取与回复内容编号对应的各标注内容并按照预置的编排格式合并。
需要说明的是,预置的编排格式与上述实施例提到的预置的编排格式可以相同,也可以不相同,都可以实现本发明的目的。
为了使本领域技术人员更好地理解,下面以一个具体的例子进行详细说明。入库请求中包括一个回复内容编号,该回复内容编号存在两个标注内容编号,根据标注内容编号获取到的一个标注内容为“小规模纳税人一般只能开具普通发票,不可以开具增值税专用发票。”,获取到的另一个标注内容为“在升级之后小规模企业及个体可使用税控设备开具增值税普通发票,依然不可开具增值税专用发票,仅一般纳税人可以开具。”预置的编排格式为插入分段符号的编排格式。合并后的标注内容可以显示为:
“小规模纳税人一般只能开具普通发票,不可以开具增值税专用发票。
在升级之后小规模企业及个体可使用税控设备开具增值税普通发票,依然不可开具增值税专用发票,仅一般纳税人可以开具。”
可以看出,按照预置的编排格式对各标注内容合并之后,显示更加友好。
在上述实施例的基础上,将问题及对应的回复保存到知识库后,为了便于用户查询,接收包含有问题编号及问题编号对应的回复内容编号的入库请求后,进一步包括,根据问题编号对应的问题标题获取关键词并建立关键词与问题的关联关系,保存关键词及关联关系到知识库。
根据问题编号,找到对应的问题标题,获取问题标题中的关键词,建立关键词与问题的关联关系,并保存关键词及关联关系到数据库,以便用户输出关键词时,显示知识库中保存的问题及回复。例如,问题的标题为“纳税人如何申领发票?”,获取关键词“申领发票”,当用户查询知识库并输入“申领发票”时,根据关键词与该问题的关联关系,将该问题展示给用户。
图3为本发明实施例提供的另一种构建知识库的方法的流程图,如图3所示,在上述实施例的基础上,在步骤S10之后,进一步包括:
S30:向管理后台发送入库请求,以便审核人员对入库请求进行再次审核。
向管理后台发送入库请求,审核人员可以通过管理后台查看入库请求,审核人员可以对回复内容编号对应的回复内容进行校对修改,也可以对标注内容进行增减或编辑等操作。
S31:接收审核确认消息,并进入步骤S11。
接收入库请求的审核确认消息,接收到审核确认消息,说明问题编号、回复内容编号及标注内容编号对应的问题标题、回复内容、标注内容已通过审核,可以进行后续步骤。
这样,就可以对问题或回复内容或标注内容进行进一步的审核,进一步确保最终保存到知识库中的回复内容的有效性和准确性。
在上述实施例的基础上,接收到包含有问题编号及问题编号对应的回复内容编号的入库请求后,进一步包括,停止接收问题的回复。
接收到入库请求后,说明发布问题的用户已经有满意的回复内容,为了避免持续接收不必要的回复,接收到入库请求后,就不再接收该问题编号对应的问题的回复。
下面以从用户发布问题到将问题及回复内容保存到知识库的过程为例,对本发明提供的构建知识库的方法进行详细介绍。结合图4所示,图4为本发明提供的另一种构建知识库的方法的流程图,包括:
S40:接收发布的问题并展示问题。
问题发布者可以发布问题,然后将发布的问题展示给其他用户,以便其他用户对问题进行解答。
S41:接收对问题的回复。
接收其他用户对问题的回复。
S42:接收结束问题的消息。
当问题发布者对回复中的一条或多条比较满意时,可以选择结束问题。
S10:接收包含有问题编号及问题编号对应的回复内容编号的入库请求。
问题发布者提交入库请求,入库请求中包括问题编号和满意的回复内容对应的回复内容编号。
S30:向管理后台发送入库请求,以便审核人员对入库请求进行再次审核。
审核人员通过管理后台查看入库请求,对符合入库条件的请求进行确认,并发送审核确认消息。
S31:接收审核确认消息。
接收审核人员发送的审核确认消息。
S11:判断入库请求中是否包括多个回复内容编号。
如果是,进入步骤S12,否则,进入步骤S13。
S12:根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库。
对于入库请求中包括多个回复内容编号的情况,可以根据各回复内容编号从数据中查找对应的各回复内容,并将得到的各回复内容进行合并,合并后保存到知识库。
S13:根据回复内容编号获取对应的回复内容并保存到知识库。
对于入库请求中包括一个回复内容编号的情况,可以根据回复内容编号从数据库中查找对应的回复内容,并将得到的回复内容保存到知识库。
接收问题及问题对应的回复,当问题发布者对回复内容满意后,结束问题,并接收问题对应的入库请求,根据入库请求判断是否存在多个回复内容编号,如果是,获取各回复内容编号对应的各回复内容进行合并,并保存到知识库。否则,获取回复内容编号对应的回复内容并保存到知识库。可以看出,保存到知识库中的回复内容可以是一条,也可以是多条,确保了问题对应的回复内容更加全面。
在上述实施例的基础上,为了更加方便快捷地满足用户的需要,作为优选地实施方式,步骤S40后进一步包括,从知识库中查询现有的知识内容,如果已有类似的问题,则将问题及对应的回复内容展示给问题发布者,并不再进行后续步骤。如果没有类似的问题,则执行后续步骤。
在上述实施例的基础上,作为优选的实施方式,用户也可以直接将遇到的问题及问题的回复内容上传到知识库,而不需要再通过其他用户进行解答。取代步骤S40、S41和S42的是,接收问题及问题对应的回复内容,并进入步骤S10。
用户已经知道问题对应的回复内容,不再需要其他用户进行解答时,接收用户发送的问题及对应的回复内容,并进入接收包含有问题编号及问题编号对应的回复内容编号的入库请求的步骤。
上文中对于构建知识库的方法的实施例进行了详细描述,基于上述实施例描述的构建知识库的方法,本发明实施例提供一种与该方法对应的构建知识库的系统。由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参照方法部分的实施例描述,这里不再详细赘述。
图5为本发明实施例提供的一种构建知识库的系统的结构图,如图5所示,包括:
问题管理模块50,用于接收包含有问题编号及问题编号对应的回复内容编号的入库请求。
知识审核模块51,用于判断入库请求中是否包括多个回复内容编号;如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并;否则,根据回复内容编号获取对应的回复内容。
知识库模块52,用于保存回复内容或合并后的各回复内容。
问题管理模块接收包含有问题编号及对应的回复内容编号的入库请求;知识审核模块判断入库请求中是否包括多个回复内容编号;如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并;否则,根据回复内容编号获取对应的回复内容,知识库模块保存回复内容或合并后的各回复内容。可以看出,回复内容编号可以是一个,也可以是多个,当回复内容编号为多个时,将对应的多个回复内容进行合并,再保存到数据库。也就是说,用户可以根据需要选取回复中的一条或多条,本实施例提供的构建知识库的系统,构建知识库时,问题对应的回复内容更加全面。
在上述实施例的基础上,知识审核模块51具体用于判断入库请求中是否包括多个回复内容编号;如果入库请求包括多个回复内容编号,根据入库请求依次判断各回复内容编号是否存在对应的标注内容编号;如果是,根据各标注内容编号获取与回复内容编号对应的各标注内容并合并;否则,根据回复内容编号获取对应的回复内容;将各回复内容编号对应的各合并后的标注内容或各回复内容合并,并保存到知识库;如果入库请求包括一个回复内容编号,根据入库请求判断回复内容编号是否存在对应的标注内容编号;如果是,根据各标注内容编号获取与回复内容编号对应的各标注内容并合并后保存到知识库;否则,根据回复内容编号获取回复内容并保存到知识库。
在上述实施例的基础上,为了进一步确保最终保存到知识库中的回复内容的有效性和准确性,作为优选地实施方式,知识审核模块51还可以用于向审核人员展示入库请求,以便审核人员对入库请求进行再次审核,并接收审核确认的消息。
知识审核模块51可以用于将入库请求展示给审核人员,审核人员可以对回复内容编号对应的回复内容进行校对修改,也可以对标注内容编号对应的标注内容进行删减或编辑。
在上述实施例的基础上,为了便于用户查询,知识审核模块51还可以用于根据问题编号对应的问题标题获取关键词并建立关键词与问题的关联关系,保存关键词及关联关系到知识库。
下面以通过构建知识库的系统从发布问题到将问题及回复内容保存到知识库的过程为例,对本发明提供的构建知识库的系统进行详细介绍。结合图6所示,图6为本发明提供的另一种构建知识库的系统的结构图,包括:
问题展示模块60,用于对发布的问题进行展示并接收其他用户对问题的回复。
问题管理模块50,用于接收发布的问题、结束问题的消息以及入库请求。
知识审核模块51,用于将入库请求展示给审核人员,以便审核人员对入库请求进行再次审核,接收审核确认消息,判断入库请求中是否包括多个回复内容编号,如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并;否则,根据回复内容编号获取对应的回复内容。
知识库模块52,用于保存回复内容或合并后的各回复内容。
问题管理模块接收问题,问题展示模块接收问题对应的回复,当问题发布者对回复内容满意后,通过问题管理模块结束问题,问题管理模块接收问题对应的入库请求,知识审核模块将入库请求展示给审核人员以便进行再次审核,接收到审核确认消息后根据入库请求判断是否存在多个回复内容编号,如果是,获取各回复内容编号对应的各回复内容进行合并,并保存到知识库。否则,获取回复内容编号对应的回复内容并保存到知识库。可以看出,保存到知识库模块中的回复内容可以是一条,也可以是多条,确保了问题对应的回复内容更加全面。
在上述实施例的基础上,为了更加方便快捷地满足用户的需要,作为优选地实施方式,问题管理模块50还可以用于从知识库模块52中查询现有的知识内容,如果已经有类似的问题,则将问题及对应的回复内容展示给问题发布者。
在上述实施例的基础上,在一些具体实施方式中,问题管理模块50还可以用于直接接收用户发布的问题及问题对应的回复内容。
上文中对于构建知识库的方法的实施例进行了详细描述,基于上述实施例描述的构建知识库的方法,本发明实施例还提供了一种与该方法对应的构建知识库的装置。由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参照方法部分的实施例描述,这里不再详细赘述。
图7为本发明实施例提供的一种构建知识库的装置的结构图,如图7所示,包括:
存储器70和处理器71。
存储器70,用于存储计算机程序。
处理器71,用于执行存储器70中存储的计算机程序时,可以实现如下步骤:
接收包含有问题编号及问题编号对应的回复内容编号的入库请求。
判断入库请求中是否包括多个回复内容编号。
如果是,根据各回复内容编号获取对应的各回复内容,并将各回复内容合并后保存到知识库。
否则,根据回复内容编号获取对应的回复内容并保存到知识库。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
判断入库请求中是否包括多个回复内容编号。
如果入库请求中包括多个回复内容编号,根据入库请求依次判断各回复内容编号是否存在对应的标注内容编号;如果是,根据各标注内容编号获取与回复内容编号对应的各标注内容并合并;否则,根据回复内容编号获取对应的回复内容;将各回复内容编号对应的各合并后的标注内容或各回复内容合并,并保存到知识库。
如果入库请求中包括一个回复内容编号,根据入库请求判断回复内容编号是否存在对应的标注内容编号;如果是,根据各标注内容编号获取与回复内容编号对应的各标注内容并合并后保存到知识库;否则,根据回复内容编号获取回复内容并保存到知识库。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
按照预置的编排格式将各回复内容编号对应的各合并后的标注内容或各回复内容合并,并保存到知识库。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
根据各标注内容编号获取与回复内容编号对应的各标注内容并按照预置的编排格式合并。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
根据问题编号对应的问题标题获取关键词并建立关键词与问题的关联关系。
保存关键词及关联关系到知识库。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
向管理后台发送入库请求,以便审核人员对入库请求进行再次审核。
接收审核确认消息,并进入判断入库请求中是否包括多个回复内容编号的步骤。
在本发明的一些实施例中,上述处理器71,还可以用于执行存储器70中的计算机程序实现如下步骤:
停止接收问题的回复。
以上对本发明所提供的构建知识库的方法、系统及装置进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明都是与其它实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何变体意在涵盖非排他性的包含,从而使得包括一系列的要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (9)
1.一种构建知识库的方法,其特征在于,包括:
接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求;
判断所述入库请求中是否包括多个所述回复内容编号;
如果是,根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并后保存到知识库;
否则,根据所述回复内容编号获取对应的回复内容并保存到所述知识库;
所述根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并后保存到知识库具体包括:
根据所述入库请求依次判断各所述回复内容编号是否存在对应的标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并合并;否则,根据所述回复内容编号获取对应的所述回复内容;
将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库;
相对应地,所述根据所述回复内容编号获取对应的回复内容并保存到所述知识库具体包括:
根据所述入库请求判断所述回复内容编号是否存在对应的所述标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各所述标注内容并合并后保存到所述知识库;否则,根据所述回复内容编号获取所述回复内容并保存到所述知识库。
2.根据权利要求1所述的方法,其特征在于,所述将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库具体为:
按照预置的编排格式将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并合并具体为:
根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并按照预置的编排格式合并。
4.根据权利要求3所述的方法,其特征在于,所述预置的编排格式具体为插入分段符号的编排格式。
5.根据权利要求1所述的方法,其特征在于,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
根据所述问题编号对应的问题标题获取关键词并建立所述关键词与问题的关联关系;
保存所述关键词及所述关联关系到所述知识库。
6.根据权利要求1所述的方法,其特征在于,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
向管理后台发送所述入库请求,以便审核人员对所述入库请求进行再次审核;
接收到审核确认消息后,进入所述判断所述入库请求中是否包括多个回复内容编号的步骤。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求后,进一步包括:
停止接收所述问题的回复。
8.一种构建知识库的系统,其特征在于,包括:
问题管理模块,用于接收包含有问题编号及所述问题编号对应的回复内容编号的入库请求;
知识审核模块,用于判断所述入库请求中是否包括多个回复内容编号;如果是,根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并;否则,根据所述回复内容编号获取对应的回复内容;
知识库模块,用于保存所述回复内容或合并后的各所述回复内容;
根据各所述回复内容编号获取对应的各回复内容,并将各所述回复内容合并后保存到知识库具体包括:
根据所述入库请求依次判断各所述回复内容编号是否存在对应的标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各标注内容并合并;否则,根据所述回复内容编号获取对应的所述回复内容;
将各所述回复内容编号对应的各合并后的所述标注内容或各所述回复内容合并,并保存到所述知识库;
相对应地,根据所述回复内容编号获取对应的回复内容并保存到所述知识库具体包括:
根据所述入库请求判断所述回复内容编号是否存在对应的所述标注内容编号;
如果是,根据各所述标注内容编号获取与所述回复内容编号对应的各所述标注内容并合并后保存到所述知识库;否则,根据所述回复内容编号获取所述回复内容并保存到所述知识库。
9.一种构建知识库的装置,其特征在于,包括处理器,所述处理器用于执行存储器中存储的程序时实现如权利要求1至7任一项所述构建知识库的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711071605.XA CN107748795B (zh) | 2017-11-03 | 2017-11-03 | 一种构建知识库的方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711071605.XA CN107748795B (zh) | 2017-11-03 | 2017-11-03 | 一种构建知识库的方法、系统及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107748795A CN107748795A (zh) | 2018-03-02 |
CN107748795B true CN107748795B (zh) | 2021-09-10 |
Family
ID=61253650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711071605.XA Active CN107748795B (zh) | 2017-11-03 | 2017-11-03 | 一种构建知识库的方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107748795B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8200656B2 (en) * | 2009-11-17 | 2012-06-12 | International Business Machines Corporation | Inference-driven multi-source semantic search |
EP2622592A4 (en) * | 2010-09-28 | 2017-04-05 | International Business Machines Corporation | Providing answers to questions using multiple models to score candidate answers |
CN106445905B (zh) * | 2015-08-04 | 2019-05-21 | 阿里巴巴集团控股有限公司 | 问答数据处理、自动问答方法及装置 |
CN106649258A (zh) * | 2016-09-22 | 2017-05-10 | 北京联合大学 | 一种智能的问答系统 |
CN106844506A (zh) * | 2016-12-27 | 2017-06-13 | 竹间智能科技(上海)有限公司 | 一种人工智能对话的知识检索方法及知识库自动完善方法 |
CN107092692A (zh) * | 2017-04-24 | 2017-08-25 | 深圳市云软信息技术有限公司 | 知识库的更新方法及智能客服系统 |
-
2017
- 2017-11-03 CN CN201711071605.XA patent/CN107748795B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107748795A (zh) | 2018-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230153466A1 (en) | Data processing systems for cookie compliance testing with website scanning and related methods | |
US20200356695A1 (en) | Data processing systems for verification of consent and notice processing and related methods | |
Srivastava et al. | Assurance on XBRL instance document: A conceptual framework of assertions | |
US11520928B2 (en) | Data processing systems for generating personal data receipts and related methods | |
JP5494675B2 (ja) | 解析方法、解析装置及び解析プログラム | |
US20170076246A1 (en) | Recommendations for Workflow alteration | |
Jones | Institutional repositories: content and culture in an open access environment | |
US11586700B2 (en) | Data processing systems and methods for automatically blocking the use of tracking tools | |
JP5494730B2 (ja) | 管理サーバ及び情報配信システム | |
US8209217B1 (en) | Author-focused tools for scheduling an event associated with an author or with a work of the author | |
Chogo et al. | Exploring Factors Affecting Mobile Money Adoption in Tanzania. | |
US20080319782A1 (en) | Methods of collecting and visualizing group information | |
Griffiths | Information Audit: Towards common standards and methodology | |
US20160171635A1 (en) | Automated Contract Terms Negotiating System and Method | |
Choi et al. | Validation of project management information systems for industrial construction projects | |
CN106384255B (zh) | 一种创建信息码推广信息的方法和装置 | |
CN108984766B (zh) | 一种政策解读的方法及装置 | |
Smith | Open access infrastructure | |
Glasser | Broken links and failed access | |
Marocco et al. | An operational framework for implementing digital systems in public administrations’ processes in the design phase | |
CN107748795B (zh) | 一种构建知识库的方法、系统及装置 | |
Negandhi et al. | Mobile-based effective vaccine management tool: An m-health initiative implemented by UNICEF in Bihar | |
Pitso et al. | Exploring e-procurement adoption in the context of a developing country: the case of Lesotho | |
Smith-Yoshimura et al. | Addressing the Challenges with Organizational Identifiers and ISNI. | |
Morgan et al. | The case of the pilfered paper: Implications of online writing assistance and web-based plagiarism detection services |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |