CN114116736A - 知识库更新、更新验证和基于知识库的搜索方法及装置 - Google Patents

知识库更新、更新验证和基于知识库的搜索方法及装置 Download PDF

Info

Publication number
CN114116736A
CN114116736A CN202010906665.4A CN202010906665A CN114116736A CN 114116736 A CN114116736 A CN 114116736A CN 202010906665 A CN202010906665 A CN 202010906665A CN 114116736 A CN114116736 A CN 114116736A
Authority
CN
China
Prior art keywords
search
knowledge base
user
behavior data
updating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010906665.4A
Other languages
English (en)
Inventor
李闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiaoi Robot Technology Co Ltd
Original Assignee
Shanghai Xiaoi Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiaoi Robot Technology Co Ltd filed Critical Shanghai Xiaoi Robot Technology Co Ltd
Priority to CN202010906665.4A priority Critical patent/CN114116736A/zh
Publication of CN114116736A publication Critical patent/CN114116736A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种知识库更新方法、知识库更新验证方法、基于知识库的搜索方法、知识库更新装置、知识库更新验证装置、基于知识库的搜索装置,以及电子设备和计算机可读存储介质,解决了在知识库中搜索知识数据的准确率、召回率以及效率均较低,验证在知识库中搜索知识数据的准确率、召回率以及效率的方法的验证结果不全面,无法反应真实用户实际搜索的准确率、召回率以及效率,用户体验不佳的问题。该知识库更新方法包括:根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果;采集所述用户在所述搜索后的操作行为,以获取搜索后行为数据;以及根据所述搜索后行为数据,对所述知识库进行更新。

Description

知识库更新、更新验证和基于知识库的搜索方法及装置
技术领域
本申请涉及知识库及搜索技术领域,具体涉及一种知识库更新方法、知识库更新验证方法、基于知识库的搜索方法、知识库更新装置、知识库更新验证装置、基于知识库的搜索装置,以及电子设备和计算机可读存储介质。
背景技术
目前政府、企业内部一般将海量的知识数据存储在数据库,在数据库中进行搜索的搜索技术已经成为用户查找知识必不可少的工具。而衡量搜索结果质量的标准主要是准确率和召回率。准确率又称查准率,主要用于评价搜索结果的准确性,即搜索结果中与搜索词相关的文件的数量与搜索结果中与搜索词不相关的文件的数量的比率。召回率又称查全率,主要用于评价搜索结果的全面性,即搜索结果中的与搜索词相关的文件的数量与知识库中的与搜索词相关的所有文件的数量的比率。
由于数据库中的知识数据较多,在知识库中搜索知识数据的准确率、召回率以及效率均较低。而且当前验证在知识库中搜索知识数据的准确率、召回率的方法,主要是通过使用预设的测试样例进行搜索,得到搜索结果,然后分析搜索的准确率、召回率以及效率,验证结果不全面,无法反应真实用户实际搜索的准确率、召回率以及效率,用户体验不佳。
发明内容
有鉴于此,本申请实施例提供了一种知识库更新方法、知识库更新验证方法、基于知识库的搜索方法、知识库更新装置、知识库更新验证装置、基于知识库的搜索装置,以及电子设备和计算机可读存储介质,解决了在知识库中搜索知识数据的准确率、召回率以及效率均较低,验证在知识库中搜索知识数据的准确率、召回率以及效率的方法的验证结果不全面,无法反应真实用户实际搜索的准确率、召回率以及效率,用户体验不佳的问题。
根据本申请的一个方面,本申请一实施例提供的一种知识库更新方法包括:根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果;采集所述用户在所述搜索后的操作行为,以获取搜索后行为数据;以及根据所述搜索后行为数据,对所述知识库进行更新。
根据本申请的另一个方面,本申请一实施例提供一种知识库更新验证方法,所述知识库基于如上述实施例中任一所述的知识库更新方法建立,其中,所述知识库更新验证方法包括:根据第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的有效性评分的总和;根据所述第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的总有效次数;以及计算所述有效性评分的总和与所述总有效次数的比值;将所述比值与预设系统有效性阈值进行比对,得到验证结果。
根据本申请的另一个方面,本申请一实施例提供一种基于知识库的搜索方法,所述知识库通过如上述实施例中所述的知识库更新方法建立;其中,所述基于知识库的搜索方法包括:获取用户输入的第一搜索条件;对所述第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词;识别每个所述第一搜索词的词性;以及根据预设的词性条件,在所述知识库中对所述第一搜索词及其词性进行搜索,得到搜索结果,其中,所述词性条件包括多个词性分类,每个所述词性分类对应一个搜索优先级或不参与匹配信息。
根据本申请的另一个方面,本申请一实施例提供的一种知识库更新装置包括:搜索模块,配置为根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果;采集模块,配置为采集所述用户在所述搜索后的操作行为,以获取搜索后行为数据;以及更新模块,配置为根据所述搜索后行为数据,对所述知识库进行更新。
根据本申请的另一个方面,本申请一实施例提供一种知识库更新验证装置,所述知识库基于如上述实施例中所述的知识库更新装置建立;其中,所述知识库更新验证装置包括:有效性评分总和获取模块,配置为根据第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的有效性评分的总和;总有效次数获取模块,配置为根据所述第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的总有效次数;有效性获取模块,配置为计算所述有效性评分的总和与所述总有效次数的比值;以及验证模块,配置为将所述比值与预设系统有效性阈值进行比对,得到验证结果。
根据本申请的另一个方面,本申请一实施例提供一种基于知识库的搜索装置,其特征在于,所述知识库基于如上述实施例中所述的知识库更新装置建立;其中,所述基于知识库的搜索装置包括:获取模块,配置为获取用户输入的第一搜索条件;提取模块,配置为对所述第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词;识别模块,配置为识别每个所述第一搜索词的词性;以及搜索结果获取模块,配置为根据预设的词性条件,在所述知识库中对所述第一搜索词及其词性进行搜索,得到搜索结果,其中,所述词性条件包括多个词性分类,每个所述词性分类对应一个搜索优先级或不参与匹配信息。
根据本申请的另一个方面,本申请一实施例提供的一种电子设备包括:处理器;以及存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上述实施例中任一所述的知识库更新方法。
根据本申请的另一个方面,本申请一实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上述实施例中任一所述的知识库更新方法。
本申请实施例提供了一种知识库更新方法、知识库更新验证方法、基于知识库的搜索方法、知识库更新装置、知识库更新验证装置、基于知识库的搜索装置,以及电子设备和计算机可读存储介质。该知识库更新方法根据用户的搜索后行为数据,对知识库进行更新,由于用户的搜索后行为数据相对测试样例更具真实性,更加多样化,也具有更好的参考价值,因此,根据用户的搜索后行为数据,对知识库的内容进行增加、删除或修改等更新操作,使更新后的知识库内容更加丰富、有条理,从而使在知识库中进行搜索时,搜索的准确率、召回率以及效率均较高。
该知识库更新验证方法,基于上述的知识库更新方法建立,通过分析用户的搜索后行为数据,得到验证结果,验证结果全面,反应了真实用户实际搜索的准确率、召回率以及效率,提高了用户的使用体验。
该基于知识库的搜索方法,知识库是通过上述实施例中知识库更新方法建立,在内容更加丰富、有条理的更新后的知识库中进行搜索,且在搜索时参考了第一搜索词的词性,进一步提高了搜索的准确率。
附图说明
图1所示为本申请一实施例提供的一种知识库更新方法的流程示意图。
图2所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图3所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图4所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图5所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图6所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图7所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图8所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。
图9所示为本申请一实施例提供的一种知识库更新验证方法的流程示意图。
图10所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。
图11所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。
图12所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。
图13所示为本申请一实施例提供的一种基于知识库的搜索方法的流程示意图。
图14所示为本申请一实施例提供的一种知识库更新装置的结构示意图。
图15所示为本申请另一实施例提供的一种知识库更新装置的结构示意图。
图16所示为本申请一实施例提供的一种知识库更新验证装置的结构示意图。
图17所示为本申请另一实施例提供的一种知识库更新验证装置的结构示意图。
图18所示为本申请一实施例提供的一种基于知识库的搜索装置的结构示意图。
图19所示为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为本申请一实施例提供的一种知识库更新方法的流程示意图。如图1所示,该知识库更新方法包括如下步骤:
步骤101:根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果。
知识库可以是包括知识数据的知识集群。第一搜索条件可以是词串,例如,可以是“信用卡”,也可以是“信用卡,储蓄卡”,还可以是“信用卡储蓄卡”,也可以是短语或句子,例如,可以是“如何办理信用卡?”,也可以是“办理信用卡”。根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果,可以是在获取到用户输入的第一搜索条件后,根据第一搜索条件在知识库中匹配与第一搜索条件相关的知识内容,最后将匹配到的与第一搜索条件相关的知识内容输出为搜索结果。例如,第一搜索条件为“信用卡”,在知识库中匹配与“信用卡”相关的知识内容,匹配到的可以是包含“信用卡”三个字的知识内容,也可以是包含“信用卡”的近义词的知识内容,例如,包含近义词“贷记卡”的知识内容,最后,可以将包含“信用卡”和“贷记卡”的知识内容输出为搜索结果。
步骤102:采集用户在搜索后的操作行为,以获取搜索后行为数据。
搜索后行为数据可以是用户点击搜索按钮后,对展示出来的内容进行的操作,可以是对搜索结果进行的操作,例如点击搜索结果,也可以是对推荐内容进行的操作,例如点击推荐内容的链接。
在一实施例中,推荐内容可以是收藏链接、知识栏目链接或知识分类链接。收藏链接,可以是用户将之前浏览的知识内容保存成一个收藏链接,当需要再次查看之前浏览的内容时,只需要点击收藏链接,便可进入之前浏览的内容所在的页面。知识栏目链接,可以是将一些常用的知识、新的知识、特殊的知识等知识内容做成链接,以栏目的形式展示出来,用户通过点击知识栏目链接,便可看到知识栏目的详细内容或全部内容。知识分类链接,可以是根据知识所属的类别,将知识分类展示,通过点击知识分类链接,便可进入比当前知识分类更详细的分类或进入详细的知识内容页面。推荐内容可以在用户没有搜索到想要找的内容或无搜索目的时,主动为用户推送知识,提高了用户的使用体验。
在一实施例中,该知识库更新方法还包括:采集以下信息中的部分或全部信息:用户工号、用户姓名、搜索时间。采集信息可采用埋点的方式采集。埋点是一种数据采集方式,可以是通过在需要采集信息的位置植入代码实现。通过采集以上信息,可以使知识库中的知识内容更加全面,提高用户的使用体验。
步骤103:根据搜索后行为数据,对知识库进行更新。
根据获取的搜索后行为数据,可以分析出用户的搜索意图是什么,然后根据用户的搜索意图对知识库的内容进行增加、删除或修改等更新操作。例如,搜索结果中有多个条目,每个条目是一个可以单独推送给用户的基本的知识单元。获取的搜索后行为数据是用户点击了搜索结果中的一个条目,可以将用户点击了的条目与用户输入的第一搜索条件进行关联,即对知识库的内容增加关联关系,从而使下次用户再次以相同的第一搜索条件进行搜索时,用户点击了的条目可以被优先的推送给用户。再例如,可以获取多个用户的搜索后行为数据,如果有多个用户都使用相同的第一搜索条件进行了搜索,可以统计出搜索结果中被用户点击最多的条目,然后将此条目与该相同的第一搜索条件进行关联,即对知识库的内容增加关联关系,从而使下次有用户再次以该相同的第一搜索条件进行搜索时,该条目可以被优先的推送给用户。
具体而言,多个用户使用第一搜索条件“信用卡”进行了搜索,得到的搜索结果中有5个条目,第一个条目被用户点击了5次,第二个条目被用户点击了8次,第三个条目被用户点击了3次,第四个条目被用户点击了10次,第五个条目被用户点击了1次,那么可以把第四个条目与“信用卡”进行关联,再有用户使用“信用卡”进行搜索时,第一个条目可以被优先的推送给用户。
由此可见,本申请实施例提供的一种知识库更新方法,根据用户的搜索后行为数据,对知识库进行更新,由于用户的搜索后行为数据相对测试样例更具真实性,更加多样化,也具有更好的参考价值,因此,根据用户的搜索后行为数据,对知识库的内容进行增加、删除或修改等更新操作,使更新后的知识库内容更加丰富、有条理,从而使在知识库中进行搜索时,搜索的准确率、召回率以及效率均较高。
图2所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图2所示,图1所示实施例中的步骤103包括如下步骤:
步骤201:当搜索后行为数据中没有包括对搜索结果进行操作的数据时,根据用户输入的第一搜索条件,向知识库补充与第一搜索条件相关的知识内容。
具体地,当搜索后行为数据中没有包括对搜索结果进行操作的数据时,即用户点击搜索后,没有对搜索结果进行操作,此时,可以认为得到的搜索结果并不是用户想要的结果,从而可以认为知识库中没有与该用户输入的第一搜索条件相关的知识内容,因此,需要向知识库补充与第一搜索条件相关的知识内容。例如,用户使用第一搜索条件为“信用卡”进行搜索,然后没有对得到的搜索结果进行操作,可以认为知识库中没有与“信用卡”相关的知识内容,从而可以从其它数据库或网络等地方查找与“信用卡”相关的知识内容,然后将查找到的与“信用卡”相关的知识内容补充到知识库。
通过向知识库补充与第一搜索条件相关的知识内容,可以使知识库的知识内容更加丰富,更好的为各种第一搜索条件提供相关的搜索结果,提高用户的使用体验。
图3所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图3所示,图1所示实施例中的步骤103包括如下步骤:
步骤301:当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,对知识库进行更新。
搜索结果可以通过排序列表展示,排序列表包括多个排序区间。多个排序区间包括第一排序区间和第二排序区间。排序列表配置为第一排序区间中的搜索结果比第二排序区间中的搜索结果更优先推送给用户进行展示。当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,可以分析出第一排序区间中的搜索结果并不符合用户的搜索意图,即优先推送给用户进行展示的搜索结果并不符合用户的搜索意图,因此,需要对知识库进行更新,具体的更新方法可以是调整搜索结果的排序列表的排列顺序,也可以是在知识库中增加与用户使用的第一搜索条件相关的知识内容。
通过当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,对知识库进行更新,可以优化搜索结果的排序列表或丰富知识库的知识内容,使更接近用户搜索意图的搜索结果更优先的推送给用户,提高搜索的准确率和效率。
图4所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图4所示,图1至图3所示实施例中的步骤101包括如下步骤:
步骤401:基于用户输入的第一搜索条件获取第一搜索词。
由于用户输入的第一搜索条件可能是词串、短语、句子或标点符号等内容,因此,需要对用户输入的第一搜索条件进行提取,从而得到第一搜索词。例如,用户输入的第一搜索条件是“信用卡”时,得到的第一搜索词即为“信用卡”。用户输入的第一搜索条件是“信用卡,储蓄卡”或“信用卡储蓄卡”时,得到的第一搜索词即为“信用卡”和“储蓄卡”。用户输入的第一搜索条件是“如何办理信用卡”或“办理信用卡”时,得到的第一搜索词即为“办理”和“信用卡”。用户输入的第一搜索条件是“办理白色的信用卡”时,得到的第一搜索词即为“办理”、“白色的”和“信用卡”。即,将用户输入的第一搜索条件提取为单个的词。
步骤402:根据第一搜索词在知识库中进行搜索得到搜索结果。
具体地,可以是将第一搜索词与知识库中的知识内容进行匹配,匹配出包括第一搜索词的搜索结果。
通过基于用户输入的第一搜索条件获取第一搜索词,并根据第一搜索词在知识库中进行搜索得到搜索结果,可以将用户输入的各种格式的第一搜索条件转换为固定格式的第一搜索词,且第一搜索词可以比第一搜索条件更加简短,有利于与知识库中的知识内容进行匹配,提高搜索的准确率。
图3所示实施例中的步骤301包括如下步骤:
步骤501:当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,根据用户对第二排序区间中的搜索结果进行操作的数据,在知识库中记录第一搜索词和该用户进行了操作的搜索结果之间的第一关联关系。
例如,用户使用第一搜索词在知识库中进行搜索,得到的搜索结果包括5个条目,5个条目通过排序列表展示出来,排序列表中的第一个条目和第二个条目被展示在第一排序区间中,第三个条目、第四个条目和第五个条目被展示在第二排序区间中,即第一个条目和第二个条目比第三个条目、第四个条目和第五个条目更优先推送给用户进行展示。用户点击了第三个条目,可以在知识库中记录第一搜索词和第三个条目之间的第一关联关系,从而可以将第三个条目的排列顺序向前调整,例如调整到第二个条目的前面,从而使再有用户使用该第一搜索词进行搜索时,第三个条目可以被优先的推送给用户,提高用户的使用体验。
图5所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图5所示,图3所示实施例中的步骤301进一步包括如下步骤:
步骤502:当第一关联关系被记录的次数超过预设阈值时,在知识库中记录第一搜索词和该用户进行了操作的搜索结果之间的第二关联关系。
预设阈值可以由用户或搜索引擎的开发者根据具体的应用需求进行设置,本申请对预设阈值的大小不做具体限定。当第一关联关系被记录的次数超过预设阈值时,在知识库中记录第一搜索词和该用户进行了操作的搜索结果之间的第二关联关系,更加充分的验证了该第一搜索词和用户进行了操作的搜索结果之间的关联性,进一步提高了搜索的准确率。
在一实施例中,优先推送与第一搜索词有第二关联关系的搜索结果。因为当第一关联关系被记录的次数超过预设阈值时,可以认为该第一搜索词和用户进行了操作的搜索结果之间的关联关系,比第一关联关系只被记录一次的关联关系的关联性更强,因此,优先推送与第一搜索词有第二关联关系的搜索结果,可以提高搜索的准确率,提高用户的使用体验。
图6所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图6所示,图1至图5所示实施例中的步骤102包括如下步骤:
步骤601:在第一预设时间段内,采集用户在搜索后的操作行为,以获取搜索后行为数据。
由于用户搜索到搜索结果后,可能需要对搜索结果进行浏览,然后再决定是否对搜索结果进行操作,或对哪项搜索结果进行操作,因此,需要设定一个采集用户搜索后的操作行为的时间段,即在用户得到搜索结果后的一段时间内采集搜索后行为数据,即在第一预设时间段内采集搜索后行为数据。
应当理解,第一预设时间段可以是5秒,也可以是10秒,第一预设时间段的时间长短可根据具体的应用需求进行选择,本申请不做具体限定。
通过在第一预设时间段内,采集用户在搜索后的操作行为,以获取搜索后行为数据,可以使采集的搜索后行为数据更加准确。
图7所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图7所示,图1所示实施例中的步骤103包括如下步骤:
步骤701:当搜索后行为数据中包括用户对推荐内容进行操作的数据时,基于用户操作的推荐内容在知识库中补充知识内容。
如图1所示实施例中的描述,推荐内容可以是收藏链接、知识栏目链接或知识分类链接。推荐内容可以在用户没有搜索到想要找的内容或无搜索目的时,主动为用户推送知识。用户对推荐内容进行操作,可以认为被用户操作了的推荐内容符合用户的搜索意图,即被用户操作了的推荐内容是用户想要所搜到的内容,因此,可以基于用户操作的推荐内容在知识库中补充知识内容。
具体而言,可以在其他数据库里搜索与用户操作的推荐内容相关的知识内容,补充到知识库中,也可以连网搜索与用户操作的推荐内容相关的知识内容,补充到知识库中,只要补充的知识内容与推荐内容相关即可,本申请对补充知识内容的方式不做具体限定。
通过基于用户操作的推荐内容在知识库中补充知识内容,可以使补充的知识内容更加符合用户的搜索意图,当用户再次以相同或相似的第一搜索条件在知识库中进行搜索时,可以得到符合用户的搜索意图的搜索结果,提高了搜索的准确率,提高了用户的使用体验。
图8所示为本申请另一实施例提供的一种知识库更新方法的流程示意图。如图8所示,图1所示实施例中的步骤103包括如下步骤:
步骤801:当搜索后行为数据中包括用户对推荐内容进行操作的数据时,在知识库中记录第一搜索词与用户操作的推荐内容的第三关联关系。
由于用户对推荐内容进行操作,可以认为被用户操作了的推荐内容符合用户的搜索意图,即被用户操作了的推荐内容是用户想要所搜到的内容,因此,可以在知识库中记录第一搜索词与用户操作的推荐内容的第三关联关系。通过在知识库中记录第一搜索词与用户操作的推荐内容的第三关联关系,可以使用户再次以第一搜索词进行搜索时,被用户操作的推荐内容可以优先推送给客户,从而使符合用户搜索意图的搜索结果更优先的推送给用户,提高搜索的准确率和效率。
图9所示为本申请一实施例提供的一种知识库更新验证方法的流程示意图。如图9所示,该知识库更新验证方法包括如下步骤:
步骤901:根据第二预设时间段内的多个搜索后行为数据,获取第二预设时间段内的多个搜索的有效性评分的总和。
第二预设时间段可以是采集多个搜索后行为数据的一段时间。第二预设时间段可以是24小时,可以是48小时,也可以是50小时,第二预设时间段的时间长短可根据实际需求进行选择,本申请对第二预设时间段的时间长短不做具体限定。
根据搜索后行为数据,可以对搜索的有效性进行评分。第二预设时间段内的多个搜索的有效性评分的总和,可以是将第二预设时间段内的多个搜索的有效性评分相加,得到第二预设时间段内的多个搜索的有效性评分的总和。
步骤902:根据第二预设时间段内的多个搜索后行为数据,获取第二预设时间段内的多个搜索的总有效次数。
第二预设时间段内的多个搜索的总有效次数,可以是第二预设时间段内的多个搜索的搜索次数总和,也可以是第二预设时间段内的多个搜索的有效搜索的次数总和。具体地,有效搜索次数总和可以是搜索次数总和与第二预设时间段内的无效搜索次数总和的差值。无效搜索可以是用户输入一个第一搜索条件后,连续进行两次搜索操作,那么其中的一次搜索操作会被判定为无效搜索。应当理解,具体的无效搜索的情况可以根据具体的应用情况进行选择,本申请不做具体限定。
步骤903:计算有效性评分的总和与总有效次数的比值。
有效性评分的总和与总有效次数的比值可以是系统有效性值,即第二预设时间段内的有效性评分的总和与总有效次数的比值可以是系统有效性值。
步骤904:将比值与预设系统有效性阈值进行比对,得到验证结果。
预设系统有效性阈值可以是用户根据实际需求进行选择的数值,即预设系统有效性阈值可由用户设定。将比值与预设系统有效性阈值进行比对,可以是将系统有效性值与预设系统有效性阈值进行比对,若系统有效性值小于或等于预设系统有效性阈值,则知识库更新验证的结果是知识库更新不满足用户对系统有效性的需求;若系统有效性值大于预设系统有效性阈值,则知识库更新验证的结果是知识库更新满足用户对系统有效性的需求。
通过将比值与预设系统有效性阈值进行比对,得到验证结果,可以根据验证结果得到实际的系统有效性与用户对系统有效性需求的差距,从而给出系统有效性低的警示,方便提高系统有效性。
图10所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。如图10所示,图9所示实施例中的步骤901包括如下步骤:
步骤1001:当对应一次搜索的搜索后行为数据中没有包括对搜索结果进行操作的数据时,该一次搜索的有效性评分为第一评分。
具体地,根据对应一次搜索的搜索后行为数据对搜索的有效性进行评分。对应一次搜索的搜索后行为数据中没有包括对搜索结果进行操作的数据,即用户没有对搜索结果进行操作,可认为搜索结果并不是用户想要得到的知识内容,可以给第一评分一个较低的分数,例如,第一评分可以是0分。应当理解,第一评分也可以是其它数值,例如0.1分,第一评分的数值可根据具体地应用场景进行选择,本申请对第一评分的数值不作限定。
步骤1002:当对应一次搜索的搜索后行为数据只包括用户对第一排序区间中的搜索结果进行操作的数据时,该一次搜索的有效性评分为第二评分。
对应一次搜索的搜索后行为数据只包括用户对第一排序区间中的搜索结果进行操作的数据,即用户只对第一排序区间中的搜索结果进行了操作,可认为第一排序区间中的搜索结果是用户想要得到的知识内容,即搜索结果的推送顺序符合用户的搜索意图,可以给第二评分一个较高的分数,例如,如果评分范围是0至1分,第二评分可以是1分。应当理解,第二评分也可以是其它数值,例如0.9分,第二评分的数值可根据具体地应用场景进行选择,本申请对第二评分的数值不作限定。
步骤1003:当对应一次搜索的搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,该一次搜索的有效性评分为第三评分。
对应一次搜索的搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据,即用户对第二排序区间中的搜索结果进行了操作,可认为第一排序区间中的搜索结果不是用户想要得到的知识内容,而第二排序区间中的搜索结果是用户想要得到的知识内容,即搜索结果的推送顺序不符合用户的搜索意图,但是搜索结果中有用户想要得到的知识内容,可以给第三评分一个位于评分范围中间部分的分数,例如,如果评分范围是0至1分,第三评分可以是0.5分。应当理解,第三评分也可以是其它数值,例如0.6分,第三评分的数值可根据具体地应用场景进行选择,本申请对第三评分的数值不作限定。
步骤1004:将第二预设时间段内的多个搜索的有效性评分进行求和,其中,第一评分小于第三评分,且第三评分小于第二评分。
将第二预设时间段内的多个搜索的有效性评分进行求和,可以是将第二预设时间段内的多个搜索的多个第一评分、多个第二评分和多个第三评分相加,得到第二预设时间段内的多个搜索的有效性评分总和。第一评分、第二评分和第三评分都是根据搜索后行为数据得到的,根据步骤1001至步骤1003中对搜索后行为数据和搜索的有效性评分的分析,可以使第一评分小于第三评分,且第三评分小于第二评分。
通过使不同的搜索后行为数据,对应不同的搜索的有效性评分,可以对搜索的有效性有直观的了解,且方便计算搜索的有效性。
图11所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。如图11所示,图9所示实施例中的步骤902包括如下步骤:
步骤1101:判断对应一次搜索的搜索后行为数据中是否包括对搜索结果进行操作的数据,如果是,总有效次数增加一次,如果否,执行步骤1102。
如果对应一次搜索的搜索后行为数据中包括对搜索结果进行操作的数据,即用户对搜索结果进行了操作,可以认为该搜索是有效的,因此,总有效次数增加一次。如果对应一次搜索的搜索后行为数据中没有包括对搜索结果进行操作的数据,即用户没有对搜索结果进行操作,需要继续对搜索后行为数据进行分析,即执行步骤1102。
步骤1102:判断用户是否根据第一搜索条件在知识库中再次进行了搜索,如果是,总有效次数保持不变,如果否,执行步骤1103。
如果用户根据第一搜索条件在知识库中再次进行了搜索,可以认为用户使用第一搜索条件进行了2次搜索操作。由于使用同样的第一搜索条件得到的搜索结果是一样的,所以2次搜索操作得到的是相同的搜索结果,因此,可以认为该2次搜索操作中有一次是无效的搜索,即对再次进行的搜索不记录搜索次数,即总有效次数保持不变。如果用户没有根据第一搜索条件在知识库中再次进行搜索,需要继续对搜索后行为数据进行分析,即执行步骤1103。
步骤1103:判断用户是否在该一次搜索后基于第二搜索条件进行了搜索,如果是,总有效次数保持不变,如果否,总有效次数增加一次。
如果用户在该一次搜索后基于第二搜索条件进行了搜索,即用户没有对根据第一搜索条件进行搜索得到的搜索结果进行操作,然后又根据第二搜索条件进行了搜索,可以认为用户本意是想使用第二搜索条件进行搜索,输入第一搜索条件是误操作,在这种情况下,可认为使用第一搜索条件进行的搜索是无效搜索,即使用第一搜索条件进行的搜索不记录搜索次数,即总有效次数保持不变。如果用户没有在该一次搜索后基于第二搜索条件进行搜索,可以认为用户本意是想使用第一搜索条件进行搜索,因此,总有效次数增加一次。
步骤1104:获取第二预设时间段内的多个搜索的总有效次数。
获取在第二预设时间段内的多个搜索的总有效次数,即将第二预设时间段内的多个搜索的有效搜索次数相加,得到总有效次数。
通过根据不同的搜索后行为数据,判断搜索的有效性,获得总有效次数,可以使搜索的总次数更加真实可靠,方便计算搜索的有效性。
图12所示为本申请另一实施例提供的一种知识库更新验证方法的流程示意图。如图12所示,图9至图11所示实施例的知识库更新验证方法进一步包括:
步骤1201:获取多个第二预设时间段内的多个比值。
由于有效性评分的总和与总有效次数的比值可以是系统有效性值,即第二预设时间段内的有效性评分的总和与总有效次数的比值可以是系统有效性值。每个第二预设时间段可以对应一个比值,即对应一个系统有效性值。因此,多个第二预设时间段对应多个系统有效性值。
步骤1202:根据多个第二预设时间段内的多个比值生成搜索的有效性变化趋势图。
具体地,可以将多个第二预设时间段对应的多个比值以图表的形式展示成趋势图,例如,趋势图可以折线图的形式展示,折线图的横轴可以表示多个第二预设时间段,折线图的纵轴可以表示与多个第二预设时间段对应的多个比值。应当理解,趋势图还可以柱形图的形式展示,本申请对趋势图的展示形式不做具体限定。
通过生成搜索的有效性变化趋势图,可以更加直观的展示出搜索的有效性的变化趋势,提高用户的使用体验。
图13所示为本申请一实施例提供的一种基于知识库的搜索方法的流程示意图。如图13所示,该基于知识库的搜索方法包括如下步骤:
步骤1301:获取用户输入的第一搜索条件。
用户在进行搜索时,会输入第一搜索条件,例如,用户想要搜索信用卡相关内容时,输入的第一搜索条件可以是“信用卡”,也可以是“信用卡,储蓄卡”,还可以是“信用卡储蓄卡”,用户想要搜索如何办理信用卡时,输入的第一搜索条件可以是“如何办理信用卡?”,也可以是“办理信用卡”,还可以是“办理白色的信用卡”。即,用户可以在搜索框内输入词串、短语、句子或标点符号等内容,且不限制用户的输入格式。
步骤1302:对第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词。
由于用户输入的第一搜索条件可能是词串、短语、句子或标点符号等内容,因此,需要对用户输入的内容进行提取,从而得到第一搜索词。例如,用户输入的第一搜索条件是“信用卡”时,得到的第一搜索词即为“信用卡”。用户输入的第一搜索条件是“信用卡,储蓄卡”或“信用卡储蓄卡”时,得到的第一搜索词即为“信用卡”和“储蓄卡”。用户输入的第一搜索条件是“如何办理信用卡”或“办理信用卡”时,得到的第一搜索词即为“办理”和“信用卡”。用户输入的第一搜索条件是“办理白色的信用卡”时,得到的第一搜索词即为“办理”、“白色的”和“信用卡”。即,将用户输入的第一搜索条件提取为单个的词。
步骤1303:识别每个第一搜索词的词性。
得到第一搜索词后,对第一搜索词的词性进行识别。例如,第一搜索词是“办理”、“白色的”和“信用卡”,识别的第一搜索词“办理”的词性为动词,识别的第一搜索词“白色的”的词性为形容词,识别的“信用卡”的第一搜索词为名词。
步骤1304:根据预设的词性条件,在知识库中对第一搜索词及其词性进行搜索,得到搜索结果,其中,词性条件包括多个词性分类,每个词性分类对应一个搜索优先级或不参与匹配信息。
知识库可以是包括知识数据的知识集群。预设的词性条件可以是预先设定的关于词性的搜索规则。词性条件可以包括搜索优先级由高到低的多个词性分类,每个词性分类对应一个搜索优先级。例如,词性分类可以包括名词、动词、形容词,名词的搜索优先级可以是最高的,动词的搜索优先级低于名词的搜索优先级,形容词的搜索优先级低于副词的搜索优先级。对应不参与匹配信息的词性分类不参与搜索,例如,词性分类还可以包括副词,副词可以不参与搜索。
由此可见,本申请实施例提供的一种基于知识库的搜索方法,根据用户输入的第一搜索条件,得到至少一个第一搜索词,并识别每个第一搜索词的词性,根据预设的词性条件,在知识库中对第一搜索词及其词性进行搜索,得到搜索结果。词性条件包括多个词性分类,每个词性分类对应一个搜索优先级或不参与匹配信息。通过使每个词性分类对应一个搜索优先级,可以将最重要的词性设置为最高优先级,根据词性分类对应的搜索优先级进行搜索,可以先根据搜索优先级最高的词性对应的第一搜索词进行搜索,得到的搜索结果,搜索的准确率较高。当没有优先级最高的词性或根据优先级最高的词性对应的第一搜索词进行搜索没有得到搜索结果时,可以继续根据下一优先级的第一搜索词进行搜索,直到得到搜索结果,从而提高搜索结果中与第一搜索词相关的文件的数量与搜索结果中与第一搜索词不相关的文件的数量的比率,且搜索结果中的与第一搜索词相关的文件的数量与知识库中的与第一搜索词相关的所有文件的数量的比率不会因此降低,即在不降低搜索召回率的同时提高了搜索的准确率。
图14所示为本申请一实施例提供的一种知识库更新装置的结构示意图。如图14所示,该知识库更新装置140包括:搜索模块1401、采集模块1402和更新模块1403。搜索模块1401配置为:根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果。采集模块1402配置为:采集用户在搜索后的操作行为,以获取搜索后行为数据。更新模块1403配置为:根据搜索后行为数据,对知识库进行更新。
在一实施例中,更新模块1403进一步配置为:当搜索后行为数据中没有包括对搜索结果进行操作的数据时,根据用户输入的第一搜索条件,向知识库补充与第一搜索条件相关的知识内容。
在一实施例中,更新模块1403进一步配置为:当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,对知识库进行更新。
图15所示为本申请另一实施例提供的一种知识库更新装置的结构示意图。如图15所示,搜索模块1401包括:获取搜索词单元1501和获取搜索结果单元1502。获取搜索词单元1501配置为:基于用户输入的第一搜索条件获取第一搜索词。获取搜索结果单元1502配置为:根据第一搜索词在知识库中进行搜索得到搜索结果。
在一实施例中,更新模块1403进一步配置为:当搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,根据用户对第二排序区间中的搜索结果进行操作的数据,在知识库中记录第一搜索词和该用户进行了操作的搜索结果之间的第一关联关系。
在一实施例中,更新模块1403进一步配置为:当第一关联关系被记录的次数超过预设阈值时,在知识库中记录第一搜索词和该用户进行了操作的搜索结果之间的第二关联关系。
在一实施例中,采集模块1402进一步配置为:在第一预设时间段内,采集用户在搜索后的操作行为,以获取搜索后行为数据。
在一实施例中,更新模块1403进一步配置为:当搜索后行为数据中包括用户对推荐内容进行操作的数据时,基于用户操作的推荐内容在知识库中补充知识内容。
在一实施例中,更新模块1403进一步配置为:当搜索后行为数据中包括用户对推荐内容进行操作的数据时,在知识库中记录第一搜索词与用户操作的推荐内容的第三关联关系。
图16所示为本申请一实施例提供的一种知识库更新验证装置的结构示意图。如图16所示,该知识库更新验证装置160包括:有效性评分总和获取模块1601、总有效次数获取模块1602、有效性获取模块1603和验证模块1604。有效性评分总和获取模块1601配置为:根据第二预设时间段内的多个搜索后行为数据,获取第二预设时间段内的多个搜索的有效性评分的总和。总有效次数获取模块1602配置为:根据第二预设时间段内的多个搜索后行为数据,获取第二预设时间段内的多个搜索的总有效次数。有效性获取模块1603配置为:计算有效性评分的总和与总有效次数的比值。验证模块1604配置为:将比值与预设系统有效性阈值进行比对,得到验证结果。
在一实施例中,有效性评分总和获取模块1601进一步配置为:当对应一次搜索的搜索后行为数据中没有包括对搜索结果进行操作的数据时,该一次搜索的有效性评分为第一评分;当对应一次搜索的搜索后行为数据只包括用户对第一排序区间中的搜索结果进行操作的数据时,该一次搜索的有效性评分为第二评分;当对应一次搜索的搜索后行为数据中包括用户对第二排序区间中的搜索结果进行操作的数据时,该一次搜索的有效性评分为第三评分;将第二预设时间段内的多个搜索的有效性评分进行求和;其中,第一评分小于第三评分,且第三评分小于第二评分。
在一实施例中,总有效次数获取模块1602进一步配置为:当对应一次搜索的搜索后行为数据包括对搜索结果进行操作的数据时,总有效次数增加一次;当对应一次搜索的搜索后行为数据中没有包括对搜索结果进行操作的数据时,判断用户是否根据第一搜索条件在知识库中再次进行了搜索;当用户根据第一搜索条件在知识库中再次进行了搜索时,总有效次数保持不变;当用户没有根据用户输入的第一搜索条件在知识库中再次进行搜索时,判断用户是否在该一次搜索后基于第二搜索条件进行了搜索;当用户基于第二搜索条件进行了搜索时,总有效次数保持不变;当用户并未基于第二搜索条件进行了搜索时,总有效次数增加一次;获取第二预设时间段内的多个搜索的总有效次数。
图17所示为本申请另一实施例提供的一种知识库更新验证装置的结构示意图。如图17所示,该知识库更新验证装置160还包括:趋势图生成模块1701。趋势图生成模块1701配置为:获取多个第二预设时间段内的多个比值,以及根据多个第二预设时间段内的多个比值生成搜索的有效性变化趋势图。
图18所示为本申请一实施例提供的一种基于知识库的搜索装置的结构示意图。如图18所示,该基于知识库的搜索装置180包括:获取模块1801、提取模块1802、识别模块1803、搜索结果获取模块1804。获取模块1801配置为:获取用户输入的第一搜索条件。提取模块1802配置为:对第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词。识别模块1803配置为:识别每个第一搜索词的词性。搜索结果获取模块1804配置为:根据预设的词性条件,在知识库中对第一搜索词及其词性进行搜索,得到搜索结果,其中,词性条件包括多个词性分类,每个词性分类对应一个搜索优先级或不参与匹配信息。
图19所示为本申请一实施例提供的电子设备的结构示意图。如图19所示,该电子设备190包括:一个或多个处理器1901和存储器1902;以及存储在存储器1902中的计算机程序指令,计算机程序指令在被处理器1901运行时使得处理器1901执行如上述任一实施例的知识库更新方法方法。
处理器1901可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备190中的其他组件以执行期望的功能。
存储器1902可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器1901可以运行程序指令,以实现上文的本申请的各个实施例的知识库更新方法中的步骤以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如常用第一搜索词、常用第一搜索条件、常用知识数据等信息。
在一个示例中,电子设备190还可以包括:输入装置1903和输出装置1904,这些组件通过总线系统和/或其他形式的连接机构(图19中未示出)互连。
例如,在该电子设备190是单机设备时,该输入装置1903可以是通信网络连接器,用于从外部的可移动设备接收所采集的输入信号。此外,该输入装置1903还可以包括例如键盘、鼠标、麦克风等等。
该输出装置1904可以向外部输出各种信息,例如可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图19中仅示出了该电子设备190中与本申请有关的组件中的一些,省略了诸如总线、输入装置/输出接口等组件。除此之外,根据具体应用情况,电子设备190还可以包括任何其他适当的组件。
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行如上述任一实施例的知识库更新方法中的步骤。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本申请各种实施例的知识库更新方法中的步骤。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器((RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的装置和设备的方框图仅作为示例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些装置和设备。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种知识库更新方法,其特征在于,包括:
根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果;
采集所述用户在所述搜索后的操作行为,以获取搜索后行为数据;以及
根据所述搜索后行为数据,对所述知识库进行更新。
2.根据权利要求1所述的知识库更新方法,其特征在于,所述搜索结果通过排序列表展示,所述排序列表包括多个排序区间,其中,所述多个排序区间包括第一排序区间和第二排序区间,其中,所述排序列表配置为所述第一排序区间中的所述搜索结果比所述第二排序区间中的所述搜索结果更优先推送给所述用户进行展示;
其中,所述根据所述搜索后行为数据,对所述知识库进行更新包括:
当所述搜索后行为数据中包括所述用户对所述第二排序区间中的所述搜索结果进行操作的数据时,对所述知识库进行更新。
3.根据权利要求2所述的知识库更新方法,其特征在于,所述根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果包括:
基于所述用户输入的所述第一搜索条件获取第一搜索词;以及
根据所述第一搜索词在所述知识库中进行搜索得到所述搜索结果;
其中,所述当所述搜索后行为数据中包括所述用户对所述第二排序区间中的所述搜索结果进行操作的数据时,对所述知识库进行更新包括:
当所述搜索后行为数据中包括所述用户对所述第二排序区间中的所述搜索结果进行操作的数据时,根据所述用户对所述第二排序区间中的所述搜索结果进行操作的数据,在所述知识库中记录所述第一搜索词和该所述用户进行了操作的所述搜索结果之间的第一关联关系。
4.根据权利要求3所述的知识库更新方法,其特征在于,所述当所述搜索后行为数据中包括所述用户对所述第二排序区间中的所述搜索结果进行操作的数据时,对所述知识库进行更新进一步包括:
当所述第一关联关系被记录的次数超过预设阈值时,在所述知识库中记录所述第一搜索词和该所述用户进行了操作的所述搜索结果之间的第二关联关系。
5.根据权利要求4所述的知识库更新方法,其特征在于,所述根据所述第一搜索词在所述知识库中进行搜索得到所述搜索结果包括:
优先推送与所述第一搜索词有所述第二关联关系的搜索结果。
6.根据权利要求1至5中任一所述的知识库更新方法,其特征在于,所述搜索结果采用链接的方式展示,其中,所述操作包括:点击所述搜索结果的所述链接。
7.根据权利要求1所述的知识库更新方法,其特征在于,所述根据用户输入的搜索条件在知识库中进行搜索得到搜索结果包括:
基于所述用户输入的所述第一搜索条件获取第一搜索词;以及
根据所述第一搜索词在所述知识库中进行搜索得到所述搜索结果;
其中,所述根据所述搜索后行为数据,对所述知识库进行更新进一步包括:
当所述搜索后行为数据中包括所述用户对所述推荐内容进行操作的数据时,在所述知识库中记录所述第一搜索词与所述用户操作的所述推荐内容的第三关联关系。
8.一种知识库更新验证方法,其特征在于,所述知识库基于如权利要求1-5中任一所述的知识库更新方法建立,其中,所述知识库更新验证方法包括:
根据第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的有效性评分的总和;
根据所述第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的总有效次数;
计算所述有效性评分的总和与所述总有效次数的比值;以及
将所述比值与预设系统有效性阈值进行比对,得到验证结果。
9.根据权利要求8所述的知识库更新验证方法,其特征在于,所述搜索结果通过排序列表展示,所述排序列表包括多个排序区间,其中,所述多个排序区间包括第一排序区间和第二排序区间,其中,所述排序列表配置为所述第一排序区间中的所述搜索结果比所述第二排序区间中的所述搜索结果更优先推送给所述用户进行展示;
所述根据第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的有效性评分的总和包括:
当对应一次所述搜索的所述搜索后行为数据中没有包括对所述搜索结果进行操作的数据时,该一次所述搜索的所述有效性评分为第一评分;
当对应一次所述搜索的所述搜索后行为数据只包括所述用户对所述第一排序区间中的所述搜索结果进行操作的数据时,该一次所述搜索的所述有效性评分为第二评分;
当对应一次所述搜索的所述搜索后行为数据中包括所述用户对所述第二排序区间中的所述搜索结果进行操作的数据时,该一次所述搜索的所述有效性评分为第三评分;以及
将所述第二预设时间段内的多个所述搜索的有效性评分进行求和;
其中,所述第一评分小于所述第三评分,且所述第三评分小于所述第二评分。
10.根据权利要求8所述的知识库更新验证方法,其特征在于,所述根据所述第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的总有效次数包括:
当对应一次所述搜索的所述搜索后行为数据包括对所述搜索结果进行操作的数据时,所述总有效次数增加一次;
当对应一次所述搜索的所述搜索后行为数据中没有包括对所述搜索结果进行操作的数据时,判断所述用户是否根据所述第一搜索条件在所述知识库中再次进行了所述搜索;
当所述用户根据所述第一搜索条件在所述知识库中再次进行了所述搜索时,所述总有效次数保持不变;
当所述用户没有根据所述用户输入的所述第一搜索条件在所述知识库中再次进行所述搜索时,判断所述用户是否在该一次所述搜索后基于第二搜索条件进行了所述搜索;
当所述用户基于所述第二搜索条件进行了所述搜索时,所述总有效次数保持不变;
当所述用户并未基于所述第二搜索条件进行了所述搜索时,所述总有效次数增加一次。
11.一种基于知识库的搜索方法,其特征在于,所述知识库通过如权利要求1所述的知识库更新方法建立;
其中,所述基于知识库的搜索方法包括:
获取用户输入的第一搜索条件;
对所述第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词;
识别每个所述第一搜索词的词性;以及
根据预设的词性条件,在所述知识库中对所述第一搜索词及其词性进行搜索,得到搜索结果,其中,所述词性条件包括多个词性分类,每个所述词性分类对应一个搜索优先级或不参与匹配信息。
12.一种知识库更新装置,其特征在于,包括:
搜索模块,配置为根据用户输入的第一搜索条件在知识库中进行搜索得到搜索结果;
采集模块,配置为采集所述用户在所述搜索后的操作行为,以获取搜索后行为数据;以及
更新模块,配置为根据所述搜索后行为数据,对所述知识库进行更新。
13.一种知识库更新验证装置,其特征在于,所述知识库基于如权利要求12中所述的知识库更新装置建立;
其中,所述知识库更新验证装置包括:
有效性评分总和获取模块,配置为根据第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的有效性评分的总和;
总有效次数获取模块,配置为根据所述第二预设时间段内的多个所述搜索后行为数据,获取所述第二预设时间段内的多个所述搜索的总有效次数;
有效性获取模块,配置为计算所述有效性评分的总和与所述总有效次数的比值;以及
验证模块,配置为将所述比值与预设系统有效性阈值进行比对,得到验证结果。
14.一种基于知识库的搜索装置,其特征在于,所述知识库基于如权利要求12中所述的知识库更新装置建立;
其中,所述基于知识库的搜索装置包括:
获取模块,配置为获取用户输入的第一搜索条件;
提取模块,配置为对所述第一搜索条件进行第一搜索词提取处理,得到至少一个第一搜索词;
识别模块,配置为识别每个所述第一搜索词的词性;以及
搜索结果获取模块,配置为根据预设的词性条件,在所述知识库中对所述第一搜索词及其词性进行搜索,得到搜索结果,其中,所述词性条件包括多个词性分类,每个所述词性分类对应一个搜索优先级或不参与匹配信息。
15.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1至5中任一所述的知识库更新方法。
16.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至5中任一所述的知识库更新方法。
CN202010906665.4A 2020-09-01 2020-09-01 知识库更新、更新验证和基于知识库的搜索方法及装置 Pending CN114116736A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010906665.4A CN114116736A (zh) 2020-09-01 2020-09-01 知识库更新、更新验证和基于知识库的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010906665.4A CN114116736A (zh) 2020-09-01 2020-09-01 知识库更新、更新验证和基于知识库的搜索方法及装置

Publications (1)

Publication Number Publication Date
CN114116736A true CN114116736A (zh) 2022-03-01

Family

ID=80360625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010906665.4A Pending CN114116736A (zh) 2020-09-01 2020-09-01 知识库更新、更新验证和基于知识库的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN114116736A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049326A (zh) * 2022-12-22 2023-05-02 广州奥咨达医疗器械技术股份有限公司 医疗器械知识库构建方法、电子设备及存储介质
CN117093698A (zh) * 2023-10-19 2023-11-21 四川蜀天信息技术有限公司 基于知识库的对话生成方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049326A (zh) * 2022-12-22 2023-05-02 广州奥咨达医疗器械技术股份有限公司 医疗器械知识库构建方法、电子设备及存储介质
CN116049326B (zh) * 2022-12-22 2024-03-08 广州奥咨达医疗器械技术股份有限公司 医疗器械知识库构建方法、电子设备及存储介质
CN117093698A (zh) * 2023-10-19 2023-11-21 四川蜀天信息技术有限公司 基于知识库的对话生成方法、装置、电子设备及存储介质
CN117093698B (zh) * 2023-10-19 2024-01-23 四川蜀天信息技术有限公司 基于知识库的对话生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
WO2019091026A1 (zh) 知识库文档快速检索方法、应用服务器及计算机可读存储介质
US8090724B1 (en) Document analysis and multi-word term detector
US9535911B2 (en) Processing a content item with regard to an event
US10552467B2 (en) System and method for language sensitive contextual searching
US9449075B2 (en) Guided search based on query model
KR100544514B1 (ko) 검색 쿼리 연관성 판단 방법 및 시스템
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
CN107102993B (zh) 一种用户诉求分析方法和装置
US11436282B2 (en) Methods, devices and media for providing search suggestions
US20130282704A1 (en) Search system with query refinement
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
EP3690676A1 (en) Method, apparatus, computer device and storage medium for verifying community question answer data
CN110716991B (zh) 基于电子书的实体关联信息的展示方法及电子设备
WO2020253391A1 (zh) 一种基于数据分析的预检信息交互方法及相关设备
CN114116736A (zh) 知识库更新、更新验证和基于知识库的搜索方法及装置
CN115630144A (zh) 一种文档搜索方法、装置及相关设备
CN104881446A (zh) 搜索方法及装置
Juan An effective similarity measurement for FAQ question answering system
JP4116599B2 (ja) 質問応答システム、方法及びプログラム
CN112861510A (zh) 纪要处理方法、装置、设备和存储介质
CN111339272A (zh) 代码缺陷报告检索方法及装置
CN110555212A (zh) 基于自然语言处理的文档校验方法、装置和电子设备
CN113032549B (zh) 一种文档排序方法、装置、电子设备及存储介质
KR101614551B1 (ko) 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법
KR102298397B1 (ko) 인용 유형 기반의 인용 관계 분석 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination