CN112214664A - 知识库的构建方法、装置、电子设备和存储介质 - Google Patents

知识库的构建方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112214664A
CN112214664A CN201910626294.1A CN201910626294A CN112214664A CN 112214664 A CN112214664 A CN 112214664A CN 201910626294 A CN201910626294 A CN 201910626294A CN 112214664 A CN112214664 A CN 112214664A
Authority
CN
China
Prior art keywords
weight
entity
initial
determining
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910626294.1A
Other languages
English (en)
Inventor
秦珍珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910626294.1A priority Critical patent/CN112214664A/zh
Publication of CN112214664A publication Critical patent/CN112214664A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种知识库的构建方法、装置、电子设备和存储介质,应用于大数据处理领域。所述方法包括:获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息;基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库,本实施例构建的知识库能够真实的反映用户的兴趣。

Description

知识库的构建方法、装置、电子设备和存储介质
技术领域
本发明涉及大数据处理领域,涉及但不限于一种知识库的构建方法、装置、电子设备和存储介质。
背景技术
在信息爆炸时代,个性化的服务能够帮助用户更加快速地获取到用户感兴趣的信息,极大的提高用户体验。良好的用户兴趣模型是提供个性化服务的关键。
目前,较为常用的用户兴趣模型是向量空间模型(Value Stream Mapping,VSM),将用户兴趣表示为一个n维特征向量{(T1,W1),(T2,W2).......(Tn,Wn)},其中Tn表示一个兴趣实体,Wn表示用户对该兴趣实体的兴趣度,但向量空间模型无法真实描述用户的兴趣。在人类认知中,知识点之间存在一定的关联性,现实世界的知识通过相互连接,构成一个网状知识库。向量空间模型只描述了用户的兴趣知识集合,类似一个散点图,兴趣之间的关联性不可知,因此无法真实的表示用户的兴趣。
而针对上述问题,目前尚无有效解决方案。
发明内容
有鉴于此,本发明实施例期望提供一种知识库的构建方法、装置、电子设备和存储介质。
本发明实施例的技术实施例是这样实现的:
本发明实施例提供一种知识库的构建方法,所述方法包括:
获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息;
基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;
确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;
基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
在上述方案中,所述确定所述初始知识库中每个第一实体节点的第一权值,包括:
获得所述第一实体节点对应的初始第一权值;
获得所述第一实体节点相关的访问信息,基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
在上述方案中,所述获得所述第一实体节点对应的初始第一权值,包括:
获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
在上述方案中,所述基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值,包括:
基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;
基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;
其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
在上述方案中,基于访问时间更新所述初始第一权值,生成第一权值,包括:
基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;
基于所述第一影响因子和所述初始第一权值获得第一权值。
在上述方案中,所述方法还包括:
基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在上述方案中,所述基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值,包括:
获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;
基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在上述方案中,所述确定两个第一实体节点之间的关联关系的第二权值,包括:
确定两个第一实体节点之间的关联关系的初始第二权值;
分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度;
基于所述语义关联度更新所述初始第二权值为第二权值。
本发明实施例提供一种知识库的构建装置,所述装置包括:获取单元和确定单元,其中:
所述获取单元,用于获得用户的历史行为数据;基于所述历史行为数据确定所述用户的兴趣信息;基于公共知识库获得所述兴趣信息映射的第一实体节点;
所述确定单元,用于基于所述获取单元获得的第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
在上述方案中,所述确定单元,包括:获取子单元和确定子单元,其中:
所述获取子单元,用于获得所述第一实体节点对应的初始第一权值;还用于获得所述第一实体节点相关的访问信息;
所述确定子单元,用于基于所述获取子单元获得所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
在上述方案中,所述获取子单元,还用于获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
在上述方案中,所述确定子单元,还用于基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
在上述方案中,所述确定子单元,还用于基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;基于所述第一影响因子和所述初始第一权值获得第一权值。
在上述方案中,所述装置还包括:更新单元,用于基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在上述方案中,所述更新单元,还用于获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在上述方案中,所述确定单元,还包括更新子单元,
所述确定子单元,还用于确定两个第一实体节点之间的关联关系的初始第二权值;
所述获取子单元,还用于分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度;
所述更新子单元,用于基于所述获取子单元获得的所述语义关联度更新所述初始第二权值为第二权值。
本发明实施例提供一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述所述方法的任一步骤。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述所述方法的任一步骤。
本发明实施例提供的知识库的构建方法、装置、电子设备和存储介质,其中,通过公共知识库获得第一实体节点确定用户的初始知识库,确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库,本实施例构建的知识库包含了实体节点之间的关联关系以及具有关联关系的两个实体节点之间的关联程度,相比于向量空间模型,能够表示用户兴趣的感兴趣程度,以及兴趣之间的关联程度,可以真实的模拟人类思维对知识的理解,也即真实的反映用户的兴趣。
附图说明
图1A为本发明实施例知识库的构建方法实现流程示意图;
图1B为本发明实施例知识库的构建方法的一种应用场景中的公共知识库示意图;
图1C为本发明实施例知识库的构建方法的一种应用场景中的用户的初始知识库示意图;
图2为本发明实施例知识库的构建方法又一实现流程示意图;
图3A为本发明实施例知识库的构建装置的组成结构示意图;
图3B为本发明实施例又一种知识库的构建装置的组成结构示意图;
图4为本发明实施例中电子设备的一种硬件实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对发明的具体技术方案做进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例提出一种知识库的构建方法,图1A为本发明实施例知识库的构建方法实现流程示意图,如图1A所示,该方法包括:
步骤S101:获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息。
需要说明的是,所述用户的历史行为数据为记录用户在当前时间之前的所有行为数据,作为一种示例,该历史行为数据可以是用户搜索和/或浏览的文本数据。
这里,基于所述历史行为数据确定所述用户的兴趣信息,其中,所述用户的兴趣信息可以是对所述历史行为数据进行提炼的信息,例如归纳概括得到的信息,也可以是所述历史行为数据相关联的信息,例如由历史行为数据联想到的一系列有语义关联性的信息,在此不做具体限定。
作为一种示例,可以为根据用户的历史行为数据,通过知识推荐相关的应用软件或网络方法挖掘出用户感兴趣的知识,该知识推荐相关的应用软件或网络方法可以为维基百科(Wikipedia),网络学习模型深度游走(text-associated Deep Walk,TADW),作为一种示例,当用户搜索和/或浏览的文本数据为“姚明”时,通过知识推荐相关的应用软件或网络方法可以挖掘出用户的兴趣信息为“篮球”、“NBA”等一系列信息。
作为另一种示例,当历史行为数据为用户多次搜索和/或浏览的文本数据时,基于所述历史行为数据确定所述用户的兴趣信息可以为将用户多次搜索和/或浏览的文本数据中多个相关的内容作为用户的兴趣信息。
步骤S102:基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系。
这里,所述多个实体节点和所述多个第一实体节点均为公共知识库中的节点。所述公共知识库是汇聚目前所有实体知识的一种知识网络,该知识网络是根据实体知识与实体知识的语义关联性进行连接成网络体系,为了方便理解,这里举例说明,图1B为本发明实施例知识库的构建方法的一种应用场景中的公共知识库示意图,如图1B所示,椭圆形表示实体节点,实体节点之间的连线表示关联关系。
作为一种实施方式,所述公共知识库可以通过网络应用或创作共享类网站获得,例如:语义网应用服务(DBPedia)、创作共享类网站(Freebase)。所述公共知识库包括多个实体节点,作为一种示例,该实体节点可以为“姚明”、“篮球”、“NBA”等等;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系,其中,所述任意两个实体节点之间具有关联关系可以为两个实体节点之间存在一定的语义关联性,作为一种示例,“姚明”与“NBA”之间存在一定的语义关联性,“NBA”与“篮球”之间存在一定的语义关联性。
本实施例中,所述基于公共知识库获得所述兴趣信息映射的第一实体节点,包括:将所述兴趣信息映射到公共知识库后获得对应的第一实体节点。作为一种实施方式,可以将所述兴趣信息通过实体映射服务映射到公共知识库后获得第一实体节点,所述实体映射服务可以为人工智能服务平台开放平台的实体标注服务,该实体标注服务可以向用户提供分词、词性标注、命名实体识别等功能,并识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。具体的,可以将所述兴趣信息通过实体映射服务映射到公共知识库中得到多个实体节点,基于所述多个实体节点确定第一实体节点,该实体映射服务映射关系可以为一对一映射关系和/或一对多映射关系,为了方便理解,下面分别进行示例说明。
示例一,当所述兴趣信息为“篮球”、“姚明”时,如果该映射关系为一对一映射关系,得到的实体节点为“篮球”、“姚明”,再基于“篮球”、“姚明”相关联的实体节点确定第一实体节点,例如与“篮球”、“姚明”相关联的实体节点有“NBA”、“火箭队”等,该第一实体节点可以为“篮球”、“姚明”、“NBA”、“火箭队”等。
示例二,当所述兴趣信息为“篮球”、“姚明”时,如果该映射关系为一对多映射关系,可以将“篮球”进行一对多映射得到的实体节点可以为“篮球”、“体育”、“NBA”、“姚明”、“火箭队”等,再将“姚明”进行一对多映射得到的实体节点可以为“姚明”、“篮球”、“火箭队”、“NBA”等,再将多个实体节点合并在一起确定第一实体节点,该第一实体节点可以为“体育”、“篮球”、“姚明”、“NBA”、“火箭队”等。
示例三,如果映射关系可以为一对一映射关系和一对多映射关系,即为所述兴趣信息中的部分信息一对一映射,部分信息一对多映射,将示例一和示例二进行结合,为节省篇幅,这里不再赘述。
本实施例中,所述初始知识库可以根据实际情况确定,可以是公共知识库中提取出的多个第一实体节点形成的,作为一种示例,所述初始知识库可以理解为从公共知识库中,抽取用户兴趣信息映射的多个第一实体节点组成的网络子图。为了方便理解,这里举例说明,图1C为本发明实施例知识库的构建方法的一种应用场景中的用户的初始知识库示意图,如图1C所示,所述初始知识库为图1B中的一部分,椭圆形表示第一实体节点,第一实体节点之间的连线表示关联关系。
步骤S103:确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度。
这里,所述第一权值表征用户对所述第一实体节点的兴趣程度,所述第一权值越大表明用户对所述第一实体节点的兴趣程度越高,所述第一权值越小表明用户对所述第一实体节点的兴趣程度越低;确定所述初始知识库中每个第一实体节点的第一权值即确定用户对所述第一实体节点的兴趣程度,作为一种实施方式,可以通过所述第一实体节点对应的初始第一权值和所述第一实体节点相关的访问信息确定所述第一实体节点的第一权值。
所述第二权值表明对应的两个第一实体节点之间的关联程度,所述第二权值越大表明对应的两个第一实体节点之间的关联程度越高,所述第二权值越小表明对应的两个第一实体节点之间的关联程度越小;确定两个第一实体节点之间的关联关系的第二权值即确定对应的两个第一实体节点之间的关联程度,作为一种实施方式,可以通过两个第一实体节点之间的关联关系的初始第二权值和所述两个第一实体节点的语义关联度确定两个第一实体节点之间的关联关系的第二权值。
步骤S104:基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
这里,由所述初始知识库、所述第一权值和所述第二权值共同组成用户知识库。
在其他实施例中,对于步骤S103,所述确定所述初始知识库中每个第一实体节点的第一权值,包括:
步骤S111:获得所述第一实体节点对应的初始第一权值。
步骤S112:获得所述第一实体节点相关的访问信息,基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
本实施例步骤S111中,所述获得第一实体节点对应的初始第一权值可以包括:获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。作为一种示例,所述第一实体节点相关的初始访问信息可以是用户对所述第一实体节点相关的初始访问历史行为数据,该初始访问信息可以是初始访问记录,该初始访问记录可以是用户的标注情况,例如,现在很多软件在用户首次使用的时候会让用户选择一些标签,当用户访问该软件的相关内容时,该标签便会标注出用户访问该软件的相关内容的情况,作为初始访问记录。该初始访问记录也可以是用户在搜索引擎中的记录。根据用户标注情况和/或用户在搜索引擎中的记录确定所述第一实体节点的初始第一权值。
本实施例步骤S112中,所述访问信息可以是用户访问的所有数据,在此不做限定。所述基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值可以包括:基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值。其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
这里,所述访问信息可以是用户的访问记录,该访问记录可以是用户标注情况,也可以是用户在搜索引擎中的记录。所述访问频率可以是用户针对相关内容进行访问记录的次数;所述访问时间可以是用户针对相关内容进行访问记录最后一次访问的时间。
作为一种示例,当所述访问信息为用户标注情况时,基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间可以是基于用户标注情况确定所述第一实体节点的访问频率和/或访问时间,该标注情况可以是用户通过选择一些标签对用户访问相关内容进行的标注,所述访问频率可以是标签标注用户访问相关内容的次数,所述访问时间可以是标签标注用户最后一次访问相关内容的时间。
作为一种示例,当所述访问信息为用户在搜索引擎中的记录时,基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间可以是基于用户在搜索引擎中的记录确定所述第一实体节点的访问频率和/或访问时间,所述访问频率可以是用户在搜索引擎中搜索相关内容的次数,所述访问时间可以是用户在搜索引擎中最后一次搜索相关内容的时间。
这里,基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;其中,更新所述初始第一权值可以是通过访问频率和/或访问时间重新计算初始第一权值,再将重新计算后的初始第一权值替换重新计算前的初始第一权值,即生成第一权值。以下是生成第一权值的三种实现方式:
方式一:基于访问频率确定第一权值的过程,可以通过如下公式(1)表示:
w″i=w′i+1 (1)
其中,w′i表示更新前的第一权值,w″i表示更新后的第一权值,“1”表示访问频率,既可以表示所述访问频率为1次,也可以表示进行归一化处理后的访问频率,例如访问频率为10次,就归为一。在初始状态下,w′i即为初始第一权值,通过w′i与1进行叠加,确定更新后的第一权值w″i
在公式(1)中计算得出的w″i即为生成的第一权值。
方式二:基于访问时间确定第一权值的过程,作为一种示例,可以基于所述访问时间确定影响因子;再基于所述影响因子和所述初始第一权值确定第一权值,具体的可以基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;基于所述第一影响因子和所述初始第一权值获得第一权值。
这里,主要是随着用户访问时间的推移,符合勒夏特列原理,呈现“快开始,慢衰减”的趋势。用户对某个实体节点的兴趣程度,会随着时间推移,逐渐降低,因此可以基于所述访问时间确定第一影响因子,该第一影响因子可以通过如下公式(2)计算:
Figure BDA0002127217890000111
其中,c为当前日期,而r为用户最后一次访问某个第一实体节点对应的知识的日期,time(c,r)为当前时间与最后一次访问日期时间的时间差,hl为半衰期,即在hl天之后,兴趣度衰减一半,衰减速度先快后慢。hl的值可根据经验确定,也可自行根据实际情况确定。
在公式(2)中计算得出的F即为第一影响因子。
这里,基于所述第一影响因子和所述初始第一权值获得第一权值可以通过所述第一影响因子和所述初始第一权值计算得到第一权值,可以通过如下公式(3)计算:
w″i=F×w′i (3)
其中,其中,w′i表示初始第一权值,F为第一影响因子,w″i表示第一权值。
在公式(3)中计算得出的w″i即为生成的第一权值。
方式三:基于访问频率和访问时间确定第一权值的过程,可以理解为将上面的方式一和方式二组合在一起的情况,这里不再赘述。
在其他实施例中,对于步骤S103,所述确定两个第一实体节点之间的关联关系的第二权值,包括:
步骤S121:确定两个第一实体节点之间的关联关系的初始第二权值。
步骤S122:分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度。
步骤S123:基于所述语义关联度更新所述初始第二权值为第二权值。
本实施例步骤S121中,确定两个第一实体节点之间的关联关系的初始第二权值可以先从初始知识库中获得携带有公共知识库中具有表征关联程度的权值,再基于初始知识库中的权值确定两个第一实体节点之间的关联关系的初始第二权值。为了方便理解,这里结合图1B和图1C进行示例说明,图1B为公共知识库示意图,图1C为初始知识库示意图,在图1B中,实体节点之间的连线表示关联关系,连线中的值表征两个实体节点之间的关联程度的权值,由于图1C是从图1B中抽取用户兴趣信息映射的多个第一实体节点组成的网络子图,即在图1B中携带有公共知识库中具有表征关联程度的权值,因此,确定两个第一实体节点之间的关联关系的初始第二权值可以先从初始知识库中获得携带有公共知识库中具有表征关联程度的权值,再基于初始知识库中的权值确定两个第一实体节点之间的关联关系的初始第二权值。所述基于初始知识库中的权值确定两个第一实体节点之间的关联关系的初始第二权值具体的可以有两种方式。方式一:将初始知识库中的权值作为两个第一实体节点之间的关联关系的初始第二权值;方式二:获取两个第一实体节点的访问文本信息,根据访问文本信息确定文本信息的相似度,基于所述文本信息的相似度确定语义关联度,再基于语义关联度和初始知识库中的权值确定两个第一实体节点之间的关联关系的初始第二权值。
本实施例步骤S122中,分别获得所述两个第一实体节点表征的第一语义和第二语义,其中第一语义和第二语义可以为实体节点的文本信息。基于所述第一语义和第二语义确定语义关联度可以通过实体节点的文本信息确定文本信息的相似度,基于文本信息的相似度确定语义关联度。
本发明实施例提供的知识库的构建方法,其中,通过公共知识库获得第一实体节点确定用户的初始知识库,确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库,相比于向量空间模型,本实施例构建的知识库能够表示用户兴趣的感兴趣程度,以及兴趣之间的关联程度,可以真实的模拟人类思维对知识的理解,也即真实的反映用户的兴趣。
本发明实施例还提供了一种知识库的构建方法,图2为本发明实施例知识库的构建方法又一实现流程示意图,如图2所示,所述方法包括:
步骤S201:获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息;
步骤S202:基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;
步骤S203:确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;
步骤S204:基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库;
步骤S205:基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
本实施例中,步骤S201至步骤S204的详细阐述可参照前述步骤S101至步骤S104的详细阐述,为节省篇幅,这里不再赘述。
这里,由于与第一实体节点具有关联关系的其他第一实体节点的第一权值发生变化时,会影响第一实体节点的第一权值,从而可以基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
本实施例步骤S205中,所述基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值,包括:
步骤S2051:获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度。
步骤S2052:基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
这里,所述第二影响因子可以根据实际情况进行确定,作为一种示例,可以为传播影响因子,该传播影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度,该传播影响因子的大小可以根据实际情况进行确定,优先的取值范围为:0.2~0.5。
这里,更新所述第一实体节点的第一权值,可以是通过所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值重新计算所述第一实体节点的第一权值,将重新计算得到的所述第一实体节点的第一权值替换掉重新计算前所述第一实体节点的第一权值。重新计算所述第一实体节点的第一权值可以通过如下公式(4)计算:
Figure BDA0002127217890000151
其中,w′i+1为与第一实体节点具有关联关系的其他第一实体节点更新前的第一权值,w″i+1为与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值,
Figure BDA0002127217890000152
为传播影响因子,可取值0.2~0.5。
在公式(4)中计算得出的w″i即为更新的所述第一实体节点的第一权值。
本发明实施例提供的知识库的构建方法,其中,通过公共知识库获得第一实体节点确定用户的初始知识库,确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库,基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值,相比于向量空间模型,本实施例构建的知识库能够表示用户兴趣的感兴趣程度,以及兴趣之间的关联程度,并实时更新用户兴趣的感兴趣程度,可以真实的模拟人类思维对知识的理解,也即真实的反映用户的兴趣,以及直观地从网络结构层面对用户兴趣更新。
本实施例提出一种知识库的构建装置,图3A为本发明实施例知识库的构建装置的组成结构示意图,如图3A所示,所述装置300包括:获取单元301和确定单元302,其中:
所述获取单元301,用于获得用户的历史行为数据;基于所述历史行为数据确定所述用户的兴趣信息;基于公共知识库获得所述兴趣信息映射的第一实体节点。
所述确定单元302,用于基于所述获取单元获得的第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
在其他的实施例中,基于上述的知识库的构建装置300,本发明实施例又提出一种知识库的构建装置的组成结构示意图,图3B为本发明实施例又一种知识库的构建装置的组成结构示意图,如图3B所示,所述确定单元302,包括:获取子单元3021和确定子单元3022,其中:
所述获取子单元3021,用于获得所述第一实体节点对应的初始第一权值;还用于获得所述第一实体节点相关的访问信息。
所述确定子单元3022,用于基于所述获取子单元获得所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
在其他的实施例中,所述获取子单元3021,还用于获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
在其他的实施例中,所述确定子单元3022,还用于基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
在其他的实施例中,所述确定子单元3022,还用于基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;基于所述第一影响因子和所述初始第一权值获得第一权值。
在其他的实施例中,所述装置300还包括:更新单元303,用于基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在其他的实施例中,所述更新单元303,还用于获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
在其他的实施例中,所述确定单元302,还包括更新子单元3023,
所述确定子单元3021,还用于确定两个第一实体节点之间的关联关系的初始第二权值。
所述获取子单元3022,还用于分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度。
所述更新子单元3023,用于基于所述获取子单元获得的所述语义关联度更新所述初始第二权值为第二权值。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,本发明实施例中,如果以软件功能模块的形式实现上述的知识库的构建方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台控制服务器(可以是个人计算机、服务器、或者网络服务器等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
对应地,本发明实施例提供一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行上述实施例提供的知识库的构建方法中的步骤。
对应地,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例提供的知识库的构建方法中的步骤。
这里需要指出的是:以上存储介质和服务器实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明存储介质和服务器实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,图4为本发明实施例中电子设备的一种硬件实体结构示意图,如图4所示,该电子设备400的硬件实体包括:处理器401和存储器403,可选地,所述电子设备400还可以包括通信接口402。
可以理解,存储器403可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器403旨在包括但不限于这些和任意其它适合类型的存储器。
上述本发明实施例揭示的方法可以应用于处理器401中,或者由处理器401实现。处理器401可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器401可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器403,处理器401读取存储器403中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,电子设备可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个观测量,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其他形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例的目的。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明实施例上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
本发明是实例中记载的知识库的构建方法、电子设备、电子设备和存储介质只以本发明所述实施例为例,但不仅限于此,只要涉及到该知识库的构建方法、电子设备、电子设备和存储介质均在本发明的保护范围。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本发明所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本发明所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本发明所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本发明的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种知识库的构建方法,其特征在于,所述方法包括:
获得用户的历史行为数据,基于所述历史行为数据确定所述用户的兴趣信息;
基于公共知识库获得所述兴趣信息映射的第一实体节点,基于所述第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;
确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;
基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
2.根据权利要求1所述的方法,其特征在于,所述确定所述初始知识库中每个第一实体节点的第一权值,包括:
获得所述第一实体节点对应的初始第一权值;
获得所述第一实体节点相关的访问信息,基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
3.根据权利要求2所述的方法,其特征在于,所述获得所述第一实体节点对应的初始第一权值,包括:
获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
4.根据权利要求2所述的方法,其特征在于,所述基于所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值,包括:
基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;
基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;
其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
5.根据权利要求4所述的方法,其特征在于,基于访问时间更新所述初始第一权值,生成第一权值,包括:
基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;
基于所述第一影响因子和所述初始第一权值获得第一权值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
7.根据权利要求6所述的方法,其特征在于,所述基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值,包括:
获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;
基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
8.根据权利要求1所述的方法,其特征在于,所述确定两个第一实体节点之间的关联关系的第二权值,包括:
确定两个第一实体节点之间的关联关系的初始第二权值;
分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度;
基于所述语义关联度更新所述初始第二权值为第二权值。
9.一种知识库的构建装置,其特征在于,所述装置包括:获取单元和确定单元,其中:
所述获取单元,用于获得用户的历史行为数据;基于所述历史行为数据确定所述用户的兴趣信息;基于公共知识库获得所述兴趣信息映射的第一实体节点;
所述确定单元,用于基于所述获取单元获得的第一实体节点确定所述用户的初始知识库;其中,所述公共知识库包括多个实体节点;所述多个实体节点中的至少两个实体节点中的任意两个实体节点之间具有关联关系;所述初始知识库包括多个第一实体节点;所述多个第一实体节点中的至少两个第一实体节点中的任意两个第一实体节点之间具有关联关系;确定所述初始知识库中每个第一实体节点的第一权值,以及确定两个第一实体节点之间的关联关系的第二权值;所述第一权值表征用户对所述第一实体节点的兴趣程度;所述第二权值表明对应的两个第一实体节点之间的关联程度;基于所述初始知识库、所述第一权值和所述第二权值确定所述用户的知识库。
10.根据权利要求9所述的装置,其特征在于,所述确定单元,包括:获取子单元和确定子单元,其中:
所述获取子单元,用于获得所述第一实体节点对应的初始第一权值;还用于获得所述第一实体节点相关的访问信息;
所述确定子单元,用于基于所述获取子单元获得所述访问信息和所述初始第一权值确定所述第一实体节点的第一权值。
11.根据权利要求10所述的装置,其特征在于,所述获取子单元,还用于获得所述第一实体节点相关的初始访问信息,基于所述初始访问信息确定所述第一实体节点的初始第一权值。
12.根据权利要求10所述的装置,其特征在于,所述确定子单元,还用于基于所述访问信息确定所述第一实体节点的访问频率和/或访问时间;基于访问频率和/或访问时间更新所述初始第一权值,生成第一权值;其中,所述第一权值伴随所述访问频率的增加而增大;所述第一权值伴随所述访问时间距离当前时间的时长的增加而减小。
13.根据权利要求12所述的装置,其特征在于,所述确定子单元,还用于基于所述访问时间确定第一影响因子;所述第一影响因子伴随所述访问时间距离当前时间的时长的增加而减小;基于所述第一影响因子和所述初始第一权值获得第一权值。
14.根据权利要求9至13任一项所述的装置,其特征在于,所述装置还包括:更新单元,用于基于与第一实体节点具有关联关系的其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
15.根据权利要求14所述的装置,其特征在于,所述更新单元,还用于获得第二影响因子,所述第二影响因子表征所述其他第一实体节点对所述第一实体节点的影响程度;基于所述第二影响因子、所述其他第一实体节点的初始第一权值和所述其他第一实体节点更新后的第一权值更新所述第一实体节点的第一权值。
16.根据权利要求9所述的装置,其特征在于,所述确定单元,还包括更新子单元,
所述确定子单元,还用于确定两个第一实体节点之间的关联关系的初始第二权值;
所述获取子单元,还用于分别获得所述两个第一实体节点表征的第一语义和第二语义,基于所述第一语义和第二语义确定语义关联度;
所述更新子单元,用于基于所述获取子单元获得的所述语义关联度更新所述初始第二权值为第二权值。
17.一种电子设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法中的步骤。
CN201910626294.1A 2019-07-11 2019-07-11 知识库的构建方法、装置、电子设备和存储介质 Pending CN112214664A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910626294.1A CN112214664A (zh) 2019-07-11 2019-07-11 知识库的构建方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910626294.1A CN112214664A (zh) 2019-07-11 2019-07-11 知识库的构建方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112214664A true CN112214664A (zh) 2021-01-12

Family

ID=74047745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910626294.1A Pending CN112214664A (zh) 2019-07-11 2019-07-11 知识库的构建方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112214664A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966013A (zh) * 2021-04-20 2021-06-15 深圳平安智汇企业信息管理有限公司 知识展示方法、装置、设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
秦珍珍: "基于社交网络模型的智能个人知识库构建", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966013A (zh) * 2021-04-20 2021-06-15 深圳平安智汇企业信息管理有限公司 知识展示方法、装置、设备及可读存储介质
CN112966013B (zh) * 2021-04-20 2022-03-11 深圳平安智汇企业信息管理有限公司 知识展示方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
US10642938B2 (en) Artificial intelligence based method and apparatus for constructing comment graph
CN108388559B (zh) 地理空间应用下的命名实体识别方法及系统、计算机程序
WO2021185147A1 (zh) 搜索意图识别
US20190188285A1 (en) Image Search with Embedding-based Models on Online Social Networks
US11861516B2 (en) Methods and system for associating locations with annotations
US20190114362A1 (en) Searching Online Social Networks Using Entity-based Embeddings
CN107291792B (zh) 用于确定相关实体的方法和系统
US7739276B2 (en) Method, system, and medium for retrieving photo using multimodal information
US8880548B2 (en) Dynamic search interaction
CN111539197B (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
US9563850B2 (en) Method and interface for displaying locations associated with annotations
WO2019218660A1 (zh) 文章生成
JP2015511039A (ja) 製品情報の公開
CN107480158A (zh) 基于相似性得分评估内容项目与图像的匹配的方法和系统
JP2009217585A (ja) 情報検索装置、情報検索システム及び情報検索方法
JP5399450B2 (ja) 医療用語の曖昧性を判定するシステム、方法およびソフトウェア
CN116737915B (zh) 基于知识图谱的语义检索方法、装置、设备及存储介质
US8122002B2 (en) Information processing device, information processing method, and program
CN110765348B (zh) 一种热词的推荐方法、装置、电子设备及存储介质
KR20150011261A (ko) 계층적 컨텍스트 모델을 이용하여 컨텐츠를 추천하기 위한 장치 및 그 방법
CN113010640A (zh) 一种业务执行的方法及装置
Choi et al. Multimodal location estimation of consumer media: Dealing with sparse training data
CN112214664A (zh) 知识库的构建方法、装置、电子设备和存储介质
US20150331889A1 (en) Method of Image Tagging for Identifying Regions and Behavior Relationship between Different Objects
CN109145261B (zh) 一种生成标签的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210112

WD01 Invention patent application deemed withdrawn after publication