CN113590736B - 索引管理方法、装置、电子设备和可读存储介质 - Google Patents
索引管理方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN113590736B CN113590736B CN202110924598.3A CN202110924598A CN113590736B CN 113590736 B CN113590736 B CN 113590736B CN 202110924598 A CN202110924598 A CN 202110924598A CN 113590736 B CN113590736 B CN 113590736B
- Authority
- CN
- China
- Prior art keywords
- search
- retrieval
- searching
- search condition
- knowledge point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/328—Management therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种索引管理方法、装置、电子设备和可读存储介质,在获得针对数据库的检索条件时,检测检索条件是否匹配预先生成的索引信息,若未匹配上,则基于检索条件对数据库进行检索获得检索结果,并将检索条件进行记录,在记录的检索条件频次达到预设值时,基于检索条件生成相应的索引信息并存储。本方案,可以根据检索的实际场景,自适应地建立相关的索引信息。以便于后续应对这类不固定的检索条件的检索时,可以提高检索的效率。
Description
技术领域
本申请涉及信息检索技术领域,具体而言,涉及一种索引管理方法、装置、电子设备和可读存储介质。
背景技术
在数据库的检索中,索引体系的管理具有重要作用。例如,常见的数据库包括关系型数据和图数据库,其中,关系型数据一般可采用自建的索引体系,在新增维度的情况下,可以采用增加相应索引字段的方式实现索引管理。
而图数据库是一种针对知识图谱的数据库,知识图谱通过概念、实体、关系将客观系统表示为一种结构化的形式,其结构呈现为网络的形状。知识图谱的检索应用是基于图数据库,图数据库可以采用内部索引或外部索引方式进行检索。其中,在内部索引方式中,图数据库可自建内部索引,通过一个或一组属性组成的固定的属性组合进行等值检索,这些属性需要是预定义且是固定顺序的。而外部索引方式中,可通过外部软件进行索引的构建,可以通过任何预先添加的属性组合构建索引。这种方式中索引信息也是需要预定义的,需要使用索引的查询条件是固定的。可见,知识图谱的检索中,索引信息是需要预先定义的,检索条件是需要与预先定义的索引信息对应,在应对不固定的检索条件时,检索效率低下。
发明内容
本申请的目的包括,例如,提供了一种索引管理方法、装置、电子设备和可读存储介质,其能够自适应建立索引信息,提高检索效率。
本申请的实施例可以这样实现:
第一方面,本申请提供一种索引管理方法,所述方法包括:
在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息;
若未匹配,则基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录;
在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储。
本实施例中,针对不固定的检索条件可自适应生成索引信息不能够存储,提高后续应对不固定检索条件时的检索效率。
在可选的实施方式中,所述数据库包括知识图谱,所述知识图谱由多个两两关联的实体构成;
所述基于所述检索条件对所述数据库进行检索获得检索结果的步骤,包括:
对所述检索条件进行处理以获得至少一个检索知识点,所述至少一个检索知识点与所述知识图谱中的至少一个实体对应;
基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果。
本实施例中,通过获得与知识图谱中实体对应的检索知识点进行检索,可借助针对性的、准确的检索信息,提高检索的精准性和效率。
在可选的实施方式中,所述对所述检索条件进行处理以获得至少一个检索知识点的步骤,包括:
对所述检索条件进行分词处理,拆分为多个检索词;
从所述多个检索词中筛选出至少一个检索知识点。
本实施例中,采用分词、筛选检索知识点的方式,可以得到有效的、针对性的检索信息,可简化检索信息且提高检索效率。
在可选的实施方式中,所述基于所述至少一个检索知识点对所述数据库进行检索得到检索结果的步骤,包括:
基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的至少一个实体;
获得所述至少一个实体的属性信息,作为检索结果。
本实施例中,在确定对应实体后获得其属性信息并反馈给用户,可向用户呈现准确、详细的检索结果。
在可选的实施方式中,所述基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的至少一个实体的步骤,包括:
基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的主要实体;
基于所述知识图谱的关联信息,获得与所述主要实体具有关联关系的备选实体。
本实施例中,结合主要实体和备选实体,可以通过扩展备选实体的方式,丰富检索结果信息的全面性。
在可选的实施方式中,所述数据库还包括多个信息文件,所述基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果的步骤,包括:
基于所述至少一个检索知识点对所述知识图谱进行检索,得到第一检索结果;
基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果;
结合所述第一检索结果和第二检索结果得到最终的检索结果。
本实施例中,结合信息文件和知识图谱的检索结果,保障检索对象的类型多样性,丰富检索结果的类型。
在可选的实施方式中,所述基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果的步骤,包括:
基于所述至少一个检索知识点对所述多个信息文件进行检索,确定与所述至少一个检索知识点具有关联关系的目标信息文件;
获得各所述目标信息文件与所述至少一个检索知识点之间的关联度;
基于所述关联度对所述目标信息文件进行排序,得到第二检索结果。
本实施例中,将信息文件以关联度进行排序后反馈给用户,可提高用户的检索体验、贴合其检索需求。
在可选的实施方式中,所述检索条件以检索知识点进行记录,所述在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储的步骤,包括:
基于预先设置的定时程序定期查询记录的各个检索知识点的频次;
若存在频次达到预设值的检索知识点,则基于频次达到预设值的检索知识点生成相应的索引信息并存储。
本实施例中,以更小粒度的检索知识点进行统计和索引构建,提高检索索引的构建灵活性。
在可选的实施方式中,所述方法还包括:
若所述检索条件与预先生成的索引信息匹配,则基于所述检索条件和匹配的索引信息对所述数据库进行检索,获得检索结果。
本实施例中,在检索条件匹配上索引信息的情况下,基于索引信息进行检索,提高检索效率。
第二方面,本申请提供一种索引管理装置,所述装置包括:
检测模块,用于在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息;
检索模块,用于在检索条件匹配预先生成的索引信息时,基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录;
生成模块,用于在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储。
第三方面,本申请提供一种电子设备,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行前述实施方式中任意一项所述的方法步骤。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时实现前述实施方式中任意一项所述的方法步骤。
本申请实施例的有益效果包括,例如:
本申请提供一种索引管理方法、装置、电子设备和可读存储介质,在获得针对数据库的检索条件时,检测检索条件是否匹配预先生成的索引信息,若未匹配上,则基于检索条件对数据库进行检索获得检索结果,并将检索条件进行记录,在记录的检索条件频次达到预设值时,基于检索条件生成相应的索引信息并存储。本方案,可以根据检索的实际场景,自适应地建立相关的索引信息。以便于后续应对这类不固定的检索条件的检索时,可以提高检索的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的索引管理方法的流程图;
图2为图1中步骤S120包含的子步骤的流程图;
图3为图2中步骤S121包含的子步骤的流程图;
图4为图2中步骤S122包含的子步骤的流程图;
图5为图4中步骤S1221A包含的子步骤的流程图;
图6为图2中步骤S122包含的子步骤的另一流程图;
图7为图6中步骤S1222B包含的子步骤的流程图;
图8为图1中步骤S130包含的子步骤的流程图;
图9为本申请实施例提供的电子设备的结构框图;
图10为本申请实施例提供的索引管理装置的功能模块框图。
图标:110-存储器;120-处理器;130-电源组件;140-通信组件;150-输入/输出接口;160-索引管理装置;161-检测模块;162-检索模块;163-生成模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
请参阅图1,为本申请实施例提供的索引管理方法的流程图,该索引管理方法有关的流程所定义的方法步骤可以由数据管理相关的后台服务器实现。下面将对图1所示的具体流程进行详细阐述。
步骤S110,在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息,若未匹配,则执行以下步骤S120。
步骤S120,基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录。
步骤S130,在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储。
本实施例中,针对数据库中的数据信息,可预先基于数据信息的相关属性、关系等构建相对固定的索引信息。预先定义的索引信息是基于数据库中已有数据信息所构建。若数据库中数据信息出现如扩展、修改等处理,则用户所发起的检索请求中,用户输入的检索条件可能并不能与预先生成的索引信息相匹配。
因此,本实施例中,在检索条件不能与预先生成的索引信息相匹配时,可以基于检索条件直接对数据库进行检索。在无匹配的索引信息的情况下,可以基于检索条件对数据库进行全库检索。这种检索方式相较于基于索引信息进行检索的方式而言,检索速度大大降低。因此,为了提高后续的针对这种情形的检索速度,可将这类检索条件进行记录。也即,将不能与预先生成的索引信息相匹配的检索条件进行记录。
此外,若接收到的检索条件能够与预先生成的索引信息相匹配,则可以执行以下步骤S140。
步骤S140,基于所述检索条件和匹配的索引信息对所述数据库进行检索,获得检索结果。
本实施例中,对于能够匹配上预先生成的索引信息的检索条件,则基于匹配的索引信息进行相应的数据信息的检索,可以大大提升检索的效率。
针对一段时间内的检索请求,对于检索请求中每一个无法与预先生成的索引信息相匹配的检索条件均进行记录。相同的检索条件可分别进行记录频次的统计,在某个检索条件的记录频次达到预设值时,则表明在一段时间内出现大量类似的检索需求。此种情形下,则可以基于检索条件生成相应的索引信息并存储。
对于无法与预先生成的索引信息匹配的检索条件,可以在请求的次数达到一定数量时,动态创建相应的索引信息并存储,如此,基于检索的实际场景自适应建立相关的索引,可提高后续的检索效率,减少人工进行索引管理的滞后性。
相较于关系型数据库,图数据库中由于数据信息以关系网络结构形式构成,因此,在数据信息扩展或修改时,所引起的联动更大。因此,针对图数据库更有必要进行自适应地索引信息的构建。
针对图数据库而言,数据库中包括知识图谱,知识图谱由多个两两关联的实体构成。知识图谱中的多个实体构成网络结构,实体表征的信息可以是例如人名、事件名、物体名、特征等信息,各个实体可携带一个或多个属性信息。在对知识图谱进行信息检索时,实质上为通过对其中实体的定位,以获得其相关信息的过程。因此,请参阅图2,本实施例中,上述基于检索条件对数据库进行检索获得检索结果的步骤中,可以通过以下方式实现:
步骤S121,对所述检索条件进行处理以获得至少一个检索知识点,所述至少一个检索知识点与所述知识图谱中的至少一个实体对应。
步骤S122,基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果。
本实施例中,考虑到检索条件一般由用户输入,用户输入的检索条件在形式上各种各样,很难进行统一规范。因此,需要对检索条件进行处理,从而提取出其中对于检索有用的信息。针对一个检索条件,可提取至少一个检索知识点,也即,在一条检索条件中可包含一个或多个检索知识点。而提取的检索知识点与知识图谱中的实体对应。
如此,通过对检索条件进行处理从而提取与知识图谱中实体对应的检索知识点,在利用检索知识点对数据库进行检索时,可以基于针对性的、准确的检索信息进行检索,大大提高检索的精准性和效率。
本实施例中,考虑到用户输入的检索条件往往是不规范的,一般是基于用户的需求所编辑的文本形式的检索条件。需要对检索条件进行处理提取其中对于检索有用的信息,上述在对检索条件进行处理获得检索知识点的步骤中,可以通过以下方式实现,请参阅图3:
步骤S1211,对所述检索条件进行分词处理,拆分为多个检索词。
步骤S1212,从所述多个检索词中筛选出至少一个检索知识点。
本实施例中,在检索条件为文本形式时,可以对检索条件进行分词处理。在分词处理时,若检索条件中包含标点符号,则标点符号处作为其中一个分词划分位置。对于文本内部,可以根据文本内各个词或字的词性进行划分,例如,若检索条件为“张三的身高”,则分词处理后得到的多个检索词可为“张三”、“的”、“身高”。
拆分后的多个检索词中存在一些检索词对于检索结果并无影响,并且对于检索过程也无帮助的词,例如上述拆分后得到的“的”,而检索词中“张三”和“身高”则是检索主要所需依据的信息。因此,可从该多个检索词中筛选出对于检索有用的检索词,作为检索知识点,例如上述的“张三”、“身高”。
本实施例中,采用分词、筛选检索知识点的方式,可以得到有效的、针对性的检索信息,可简化检索信息且提高检索效率。
请参阅图4,在获得检索知识点的基础上,上述基于检索知识点进行检索的步骤,可以通过以下方式实现:
步骤S1221A,基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的至少一个实体;
步骤S1222A,获得所述至少一个实体的属性信息,作为检索结果。
由上述可知,知识图谱中包含多个实体,而各个实体可表征例如人名、物名、特征等信息,检索条件中检索知识点所针对的信息即为知识图谱中包含的实体,通过对知识图谱中实体的检索定位,从而获得实体相关的信息。
例如,知识图谱中包含的实体可以包括“张三”,“张三”可以是一个人名,该实体可具有多个属性信息,例如该人名有关的家庭信息、身体情况信息、职业信息等。而上述拆分得到的“身高”可以作为实体“张三”的其中一个属性信息,也可以单独作为一个与实体“张三”关联的实体。也就是说,知识图谱中的实体可以包括例如人名这类实体,也可以包括例如特征信息这类实体。
本实施例中,在知识图谱中检索到与检索知识点对应的实体后,可以实体的属性信息作为检索结果,从而向用户呈现准确、详细的检索结果。
由于用户输入的检索条件往往只涉及单方面,不太可能涉及全面的需求,而在向用户呈现检索结果时,为了用户能够获得更为全面的信息,除了向用户反馈直接与其检索条件对应的检索结果外,还可以向用户返回其他的相关信息。详细地,请参阅图5,上述对知识图谱进行全库检索,获得对应的实体的步骤,可以包括以下子步骤:
步骤S12211A,基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的主要实体。
步骤S12212A,基于所述知识图谱的关联信息,获得与所述主要实体具有关联关系的备选实体。
本实施例中,以上述为例,在对检索条件进行处理后若得到的检索知识点为“张三”、“身高”,而知识图谱中包含实体“张三”以及与该实体关联的实体“身高”。则基于检索知识点对知识图谱进行检索后,获得的对应的主要实体为直接与检索知识点匹配的实体,也即,实体“张三”和实体“身高”。
然而,在知识图谱中还包括与实体“张三”关联的其他实体,例如,还包括与实体“张三”关联的实体“职业”、实体“获奖情况”等。这些实体虽然没有与检索知识点直接对应,但是,在用户检索与“张三”有关身高方面的信息时,也可将其他的相关信息反馈给用户,以便用户可以了解到其他方面的信息。
也即,本实施例中,可以将直接与检索知识点对应的实体作为主要实体,再通过知识图谱的关联信息,获得与主要实体具有关联关系的备选实体。后续可将主要实体的属性信息和备选实体的属性信息作为检索结果,一并反馈给用户。如此,可以丰富检索结果信息,使得检索结果更为全面,可使用户了解到更为全面的相关信息。
在将主要实体和备选实体的属性信息反馈给用户时,属性信息的呈现方式可以以列表形式呈现,也可以以图谱形式呈现。
在以列表形式呈现时,可将主要实体的属性信息排列到前面,将备选实体的属性信息排列在后面,如此,按照与用户检索需求的相关度进行排列展示,可以更加贴合用户的需求。
此外,若以图谱形式进行呈现时,可以将主要实体的属性信息展示在图谱的中心位置,将备选实体的属性信息与主要实体的属性信息关联,并以中心位置向外发散的方向进行展示呈现。如此,用户可一目了然地看到中心位置的主要实体的属性信息,满足用户的检索需求。
本实施例中,数据库中还包括多个信息文件,该多个信息文件可以包括网页文件、word文件、文本文件等。在一种可能的实现方式中,可以结合对数据库中的知识图谱的检索和信息文件的检索得到最终的检索结果。因此,作为一种可能的实现方式,请参阅图6,上述基于至少一个检索知识点对数据库进行检索,得到检索结果的步骤,可以通过以下方式实现:
步骤S1221B,基于所述至少一个检索知识点对所述知识图谱进行检索,得到第一检索结果。
步骤S1222B,基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果。
步骤S1223B,结合所述第一检索结果和第二检索结果得到最终的检索结果。
本实施例中,基于检索知识点对知识图谱进行检索得到第一检索结果的具体方式,可以参见上述相关描述,可以通过上述任意一种实现方式获得第一检索结果,本实施例在此不作赘述。
在基于检索知识点对数据库中的信息文件进行检索时,可以以检索知识点作为关键词,搜索各个信息文件中是否包含相关的关键词,若包含相关的关键词,则该信息文件的相关信息可以作为与检索条件匹配的第二检索结果。
如此,可以将基于知识图谱检索得到的第一检索结果和基于信息文件检索得到的第二检索结果,一并反馈给用户。如此,可以保障检索对象的类型多样性,丰富检索结果的类型。
请参阅图7,本实施例中,在基于检索知识点对信息文件进行检索,得到第二检索结果的步骤中,可以通过以下方式实现:
步骤S12221B,基于所述至少一个检索知识点对所述多个信息文件进行检索,确定与所述至少一个检索知识点具有关联关系的目标信息文件。
步骤S12222B,获得各所述目标信息文件与所述至少一个检索知识点之间的关联度。
步骤S12223B,基于所述关联度对所述目标信息文件进行排序,得到第二检索结果。
本实施例中,首先确定出与检索知识点具有关联关系的目标信息文件,也即,目标信息文件包含的内容中具有相关的检索知识点。例如,以上述为例,在获得的检索知识点包含“张三”时,则基于该检索知识点确定的目标信息文件的内容中包含关键词“张三”。可选地,可以是网页文件的内容中包含该关键词,或者是word文件的内容中包含该关键词等。
往往确定出的目标信息文件具有多个,而各个目标信息文件与检索知识点的关联度可能并不相同。其中,关联度的确定方式可以是,以目标信息文件中包含的检索知识点的出现频次的多少作为关联度的高低判断标准,例如,若目标信息文件中检索知识点出现频次越多,则与其检索知识点的关联度越高,反之,则越低。当然,也可以以其他的方式来确定关联度,本实施例在此仅为举例说明。
在确定各个目标信息文件与检索知识点之间的关联度后,为了在呈现时更加贴合用户的检索需求,因此,可基于关联度对目标信息文件进行排序,例如以关联度从高到低的顺序对目标信息文件进行排序。基于排序后的目标信息文件得到第二检索结果,以反馈给用户。如此,用户在浏览检索结果时,可以从关联度最高的目标信息文件开始浏览,提高用户的检索体验、贴合其检索需求。
本实施例中,在用户的检索条件未能与预先生成的索引信息匹配的情况下,通过上述的检索过程得到检索结果的情况下,还需对检索条件进行记录,以便后续满足一定要求的情况下自适应地生成索引信息。请参阅图8,本实施例中,上述步骤S130可以通过以下方式实现:
步骤S131,基于预先设置的定时程序定期查询记录的各个检索知识点的频次。
步骤S132,若存在频次达到预设值的检索知识点,则基于频次达到预设值的检索知识点生成相应的索引信息并存储。
由上述可知,可对检索条件进行处理得到至少一个检索知识点。由于检索条件可能包含多个检索知识点,而多个检索知识点共同限定下的检索需求比较固定、单一,若以检索条件作为单位进行记录,从而生成相应的索引信息,则索引信息仅仅只能对该固定的检索条件对应,不便于检索知识点之间的不同组合下的索引。
因此,本实施例中,针对未能与预先生成的索引信息匹配的检索条件,可以检索条件处理得到检索知识点进行记录。例如,可以分别记录检索知识点“张三”与检索知识点“身高”。
此外,可预先设置定时程序,该定时程序可设置每间隔预设时长,例如一小时、两小时等不限,查询记录的信息。各个检索知识点分别进行记录统计,在查询到某个检索知识点的频次达到预设值时,则可以基于该检索知识点生成相应的索引信息并存储。
本实施例中,以各个检索知识点进行分别统计记录,进而后续生成的对应的索引信息的方式,以更小粒度的信息进行统计和索引构建,可便于后续应对不同检索知识点组成下的检索条件的检索索引,提高检索索引的灵活性。
请参阅图9,本申请实施例还提供一种电子设备。图9是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备可以被提供为一服务器。参照图9,电子设备包括处理器120,其数量可以为一个或多个,以及存储器110,用于存储可由处理器120执行的计算机程序。存储器110中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器120可以被配置为执行该计算机程序,以执行上述的索引管理方法。
另外,电子设备还可以包括电源组件130和通信组件140,该电源组件130可以被配置为执行电子设备的电源管理,该通信组件140可以被配置为实现电子设备的通信,例如,有线或无线通信。此外,该电子设备还可以包括输入/输出接口150。电子设备可以操作基于存储在存储器110的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM等等。
请参阅图10,本申请实施例还提供一种索引管理装置160,该索引管理装置160可以理解为上述电子设备,或电子设备的处理器120,也可以理解为独立于上述电子设备或处理器120之外的在电子设备控制下实现上述索引管理方法的软件功能模块。
如图10所示,上述索引管理装置160可以包括检测模块161、检索模块162和生成模块163。下面分别对该索引管理装置160的各个功能模块的功能进行详细阐述。
检测模块161,用于在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息;
可以理解,该检测模块161可以用于执行上述步骤S110,关于该检测模块161的详细实现方式可以参照上述对步骤S110有关的内容。
检索模块162,用于在检索条件匹配预先生成的索引信息时,基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录;
可以理解,该检索模块162可以用于执行上述步骤S120,关于该检索模块162的详细实现方式可以参照上述对步骤S120有关的内容。
生成模块163,用于在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储。
可以理解,该生成模块163可以用于执行上述步骤S130,关于该生成模块163的详细实现方式可以参照上述对步骤S130有关的内容。
在一种可能的实现方式中,所述数据库包括知识图谱,所述知识图谱由多个两两关联的实体构成;上述检索模块162具体可以用于:
对所述检索条件进行处理以获得至少一个检索知识点,所述至少一个检索知识点与所述知识图谱中的至少一个实体对应;
基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果。
在一种可能的实现方式中,上述检索模块162可以通过以下方式获得至少一个检索知识点:
对所述检索条件进行分词处理,拆分为多个检索词;
从所述多个检索词中筛选出至少一个检索知识点。
在一种可能的实现方式中,上述检索模块162可以通过以下方式获得检索结果:
基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的至少一个实体;
获得所述至少一个实体的属性信息,作为检索结果。
在一种可能的实现方式中,上述检索模块162具体可以用于:
基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的主要实体;
基于所述知识图谱的关联信息,获得与所述主要实体具有关联关系的备选实体。
在一种可能的实现方式中,所述数据库还包括多个信息文件,上述检索模块162具体可以用于:
基于所述至少一个检索知识点对所述知识图谱进行检索,得到第一检索结果;
基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果;
结合所述第一检索结果和第二检索结果得到最终的检索结果。
在一种可能的实现方式中,上述检索模块162可以用于通过以下方式得到第二检索结果:
基于所述至少一个检索知识点对所述多个信息文件进行检索,确定与所述至少一个检索知识点具有关联关系的目标信息文件;
获得各所述目标信息文件与所述至少一个检索知识点之间的关联度;
基于所述关联度对所述目标信息文件进行排序,得到第二检索结果。
在一种可能的实现方式中,所述检索条件以检索知识点进行记录,上述生成模块163具体可以用于:
基于预先设置的定时程序定期查询记录的各个检索知识点的频次;
若存在频次达到预设值的检索知识点,则基于频次达到预设值的检索知识点生成相应的索引信息并存储。
在一种可能的实现方式中,上述检索模块162还可以用于:
若所述检索条件与预先生成的索引信息相匹配,则基于所述检索条件和匹配的索引信息对所述数据库进行检索,获得检索结果。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,例如包括程序指令的存储器110,上述程序指令可由电子设备的处理器120执行以完成上述的索引管理方法。
具体地,该计算机可读存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该计算机可读存储介质上的计算机程序被运行时,能够执行上述选型推荐方法。关于计算机可读存储介质中的及其可执行指令被运行时,所涉及的过程,可以参照上述方法实施例中的相关说明,这里不再详述。
综上所述,本申请实施例提供的索引管理方法、装置、电子设备和可读存储介质,在获得针对数据库的检索条件时,检测检索条件是否匹配预先生成的索引信息,若未匹配上,则基于检索条件对数据库进行检索获得检索结果,并将检索条件进行记录,在记录的检索条件频次达到预设值时,基于检索条件生成相应的索引信息并存储。本方案,可以根据检索的实际场景,自适应地建立相关的索引信息。以便于后续应对这类不固定的检索条件的检索时,可以提高检索的效率。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种索引管理方法,其特征在于,所述方法包括:
在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息;
若未匹配,则基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录;
在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储;
所述数据库包括知识图谱,所述知识图谱由多个两两关联的实体构成,所述基于所述检索条件对所述数据库进行检索获得检索结果的步骤,包括:
对所述检索条件进行处理以获得至少一个检索知识点,所述至少一个检索知识点与所述知识图谱中的至少一个实体对应,基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果;
其中,在基于至少一个检索知识点对所述数据库进行检索时,基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的主要实体,基于所述知识图谱的关联信息,获得与所述主要实体具有关联关系的备选实体。
2.根据权利要求1所述的索引管理方法,其特征在于,所述对所述检索条件进行处理以获得至少一个检索知识点的步骤,包括:
对所述检索条件进行分词处理,拆分为多个检索词;
从所述多个检索词中筛选出至少一个检索知识点。
3.根据权利要求1所述的索引管理方法,其特征在于,所述基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果的步骤,包括:
基于所述至少一个检索知识点对所述知识图谱进行全库检索,获得与所述至少一个检索知识点对应的至少一个实体;
获得所述至少一个实体的属性信息,作为检索结果。
4.根据权利要求1所述的索引管理方法,其特征在于,所述数据库还包括多个信息文件,所述基于所述至少一个检索知识点对所述数据库进行检索,得到检索结果的步骤,包括:
基于所述至少一个检索知识点对所述知识图谱进行检索,得到第一检索结果;
基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果;
结合所述第一检索结果和第二检索结果得到最终的检索结果。
5.根据权利要求4所述的索引管理方法,其特征在于,所述基于所述至少一个检索知识点对所述多个信息文件进行检索,得到第二检索结果的步骤,包括:
基于所述至少一个检索知识点对所述多个信息文件进行检索,确定与所述至少一个检索知识点具有关联关系的目标信息文件;
获得各所述目标信息文件与所述至少一个检索知识点之间的关联度;
基于所述关联度对所述目标信息文件进行排序,得到第二检索结果。
6.根据权利要求1所述的索引管理方法,其特征在于,所述检索条件以检索知识点进行记录,所述在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储的步骤,包括:
基于预先设置的定时程序定期查询记录的各个检索知识点的频次;
若存在频次达到预设值的检索知识点,则基于频次达到预设值的检索知识点生成相应的索引信息并存储。
7.根据权利要求1所述的索引管理方法,其特征在于,所述方法还包括:
若所述检索条件与预先生成的索引信息相匹配,则基于所述检索条件和匹配的索引信息对所述数据库进行检索,获得检索结果。
8.一种索引管理装置,其特征在于,用于实现权利要求1-7任意一项所述的方法,所述装置包括:
检测模块,用于在获得针对数据库的检索条件时,检测所述检索条件是否匹配预先生成的索引信息;
检索模块,用于在检索条件匹配预先生成的索引信息时,基于所述检索条件对所述数据库进行检索获得检索结果,并将所述检索条件进行记录;
生成模块,用于在记录的检索条件频次达到预设值时,基于所述检索条件生成相应的索引信息并存储。
9.一种电子设备,其特征在于,包括一个或多个存储介质和一个或多个与存储介质通信的处理器,一个或多个存储介质存储有处理器可执行的机器可执行指令,当电子设备运行时,处理器执行所述机器可执行指令,以执行权利要求1-7中任意一项所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可执行指令,所述机器可执行指令被执行时实现权利要求1-7中任意一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110924598.3A CN113590736B (zh) | 2021-08-12 | 2021-08-12 | 索引管理方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110924598.3A CN113590736B (zh) | 2021-08-12 | 2021-08-12 | 索引管理方法、装置、电子设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113590736A CN113590736A (zh) | 2021-11-02 |
CN113590736B true CN113590736B (zh) | 2024-05-07 |
Family
ID=78257588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110924598.3A Active CN113590736B (zh) | 2021-08-12 | 2021-08-12 | 索引管理方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590736B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246492A (zh) * | 2008-02-26 | 2008-08-20 | 华中科技大学 | 基于自然语言的全文检索系统 |
CN105550225A (zh) * | 2015-12-07 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 索引构建方法、查询方法及装置 |
CN105893626A (zh) * | 2016-05-10 | 2016-08-24 | 中广核工程有限公司 | 一种用于核电工程的索引库创建方法及其采用其方法的索引系统 |
CN106446162A (zh) * | 2016-09-26 | 2017-02-22 | 浙江大学 | 一种面向领域的本体知识库文本检索方法 |
CN108804642A (zh) * | 2018-06-05 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 检索方法、装置、计算机设备及存储介质 |
CN109255031A (zh) * | 2018-09-20 | 2019-01-22 | 苏州友教习亦教育科技有限公司 | 基于知识图谱的数据处理方法 |
CN110019713A (zh) * | 2017-12-07 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 基于意图理解的数据检索方法和装置、设备及存储介质 |
CN110334178A (zh) * | 2019-03-28 | 2019-10-15 | 平安科技(深圳)有限公司 | 数据检索方法、装置、设备及可读存储介质 |
CN112612901A (zh) * | 2020-12-17 | 2021-04-06 | 李鹏 | 一种医学知识图谱智慧管理检索平台 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6961736B1 (en) * | 2002-05-31 | 2005-11-01 | Adobe Systems Incorporated | Compact color feature vector representation |
US20170124497A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | System for automated capture and analysis of business information for reliable business venture outcome prediction |
-
2021
- 2021-08-12 CN CN202110924598.3A patent/CN113590736B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246492A (zh) * | 2008-02-26 | 2008-08-20 | 华中科技大学 | 基于自然语言的全文检索系统 |
CN105550225A (zh) * | 2015-12-07 | 2016-05-04 | 百度在线网络技术(北京)有限公司 | 索引构建方法、查询方法及装置 |
CN105893626A (zh) * | 2016-05-10 | 2016-08-24 | 中广核工程有限公司 | 一种用于核电工程的索引库创建方法及其采用其方法的索引系统 |
CN106446162A (zh) * | 2016-09-26 | 2017-02-22 | 浙江大学 | 一种面向领域的本体知识库文本检索方法 |
CN110019713A (zh) * | 2017-12-07 | 2019-07-16 | 上海智臻智能网络科技股份有限公司 | 基于意图理解的数据检索方法和装置、设备及存储介质 |
CN108804642A (zh) * | 2018-06-05 | 2018-11-13 | 中国平安人寿保险股份有限公司 | 检索方法、装置、计算机设备及存储介质 |
CN109255031A (zh) * | 2018-09-20 | 2019-01-22 | 苏州友教习亦教育科技有限公司 | 基于知识图谱的数据处理方法 |
CN110334178A (zh) * | 2019-03-28 | 2019-10-15 | 平安科技(深圳)有限公司 | 数据检索方法、装置、设备及可读存储介质 |
CN112612901A (zh) * | 2020-12-17 | 2021-04-06 | 李鹏 | 一种医学知识图谱智慧管理检索平台 |
Non-Patent Citations (3)
Title |
---|
Wen' an Zhou et al..Knowledge Graph Embedding With Interactive Guidance From Entity Descriptions.《IEEE Access》.2015,第7卷156686-156693. * |
基于本体论的Web知识检索及其应用研究;陈森博 等;《电脑知识与技术》;20090625(第18期);394-395 * |
整合数据持久化与全文检索的新方法;王彬 等;《计算机工程》;20090205(第03期);48-50 * |
Also Published As
Publication number | Publication date |
---|---|
CN113590736A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8046363B2 (en) | System and method for clustering documents | |
CN108304444B (zh) | 信息查询方法及装置 | |
US9043360B2 (en) | Display entity relationship | |
US6389412B1 (en) | Method and system for constructing integrated metadata | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US20160078047A1 (en) | Method for obtaining search suggestions from fuzzy score matching and population frequencies | |
JP6299596B2 (ja) | クエリ類似度評価システム、評価方法、及びプログラム | |
CN106095738B (zh) | 推荐表单片段 | |
KR20140128443A (ko) | 관련 엔티티들 | |
JP2008234550A (ja) | 専門家情報検索装置、専門家情報検索方法およびプログラム。 | |
JP2006331117A (ja) | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム | |
JP6185379B2 (ja) | レコメンド装置およびレコメンド方法 | |
JP6219967B2 (ja) | ラベル付非テキスト系アイテムを検索するためのシステム及び方法 | |
JP2008084193A (ja) | インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム | |
JP4375626B2 (ja) | カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法 | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
US20160246794A1 (en) | Method for entity-driven alerts based on disambiguated features | |
CN113590736B (zh) | 索引管理方法、装置、电子设备和可读存储介质 | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP2011103020A (ja) | 検索条件推薦装置、検索条件推薦方法および検索条件推薦プログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2005010848A (ja) | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 | |
TWI484359B (zh) | 文章資訊提供方法以及系統 | |
JP2004259083A (ja) | 情報検索方法、情報検索サーバ、及び情報検索プログラム | |
JP2011022624A (ja) | ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 610000 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan Applicant after: Chengdu shuzhilian Technology Co.,Ltd. Address before: 610000 No.2, 4th floor, building 1, Jule Road intersection, West 1st section of 1st ring road, Wuhou District, Chengdu City, Sichuan Province Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |