CN112835980B - 索引重建方法、装置、设备、计算机可读存储介质及产品 - Google Patents

索引重建方法、装置、设备、计算机可读存储介质及产品 Download PDF

Info

Publication number
CN112835980B
CN112835980B CN202110163140.0A CN202110163140A CN112835980B CN 112835980 B CN112835980 B CN 112835980B CN 202110163140 A CN202110163140 A CN 202110163140A CN 112835980 B CN112835980 B CN 112835980B
Authority
CN
China
Prior art keywords
index
data
reconstructed
updated
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110163140.0A
Other languages
English (en)
Other versions
CN112835980A (zh
Inventor
陈雷
邱永刚
彭天琛
周霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202110163140.0A priority Critical patent/CN112835980B/zh
Publication of CN112835980A publication Critical patent/CN112835980A/zh
Application granted granted Critical
Publication of CN112835980B publication Critical patent/CN112835980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种索引重建方法、装置、设备、计算机可读存储介质及产品,该方法包括:获取索引重建配置信息,索引重建配置信息中包括原索引以及与原索引对应的待重建索引;根据索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中;通过预设的脚本程序获取变更在线数据,将变更在线数据分别写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引;根据更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。从而能够有效地提高索引重建速度,提高用户体验。

Description

索引重建方法、装置、设备、计算机可读存储介质及产品
技术领域
本公开实施例涉及计算机与数据库技术领域,尤其涉及一种索引重建方法、装置、设备、计算机可读存储介质及产品。
背景技术
Elasticsearch(简称ES)是一个分布式、可扩展、实时的搜索与数据分析引擎。索引提供指向存储在表的指定列中的数据值的指针,数据库使用索引以找到特定值,然后顺指针找到包含该值的行。其可以应用在任意一种聚合了多种不同第三方数据的搜索业务场景中。一方面,随着业务的迭代发展,不断有新的字段加入ES中,另一方面,搜索业务需要不断的优化分词算法等并将其快速迭代应用到ES中,这些情况下就需要对ES索引数据和字段进行重建。
为了实现对ES索引的重建操作,现有技术中一般都是设置一个脚本程序,通过该脚本程序定时扫描数据库新增数据更新到ES。当遇到索引字段变更或者分词全部变更时,通常需要启动单独的脚本去遍历数据库,更新完所有数据。
但是,采用上述方法进行索引重建时,采用脚本程序进行离线数据的变更往往需要较长的时间。而由于索引重建的时间较长,用户在采用该索引进行线上搜索时,可能会同时命中新旧索引,导致搜索效果不佳。
发明内容
本公开实施例提供一种索引重建方法、装置、设备、计算机可读存储介质及产品,用于解决现有的索引重建方法所需时间较长导致无法正常使用索引的问题。
第一方面,本公开实施例提供一种索引重建方法,包括:
获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引;
根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中;
通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引;
根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
第二方面,本公开实施例提供一种索引重建装置,包括:
获取模块,用于获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引;
处理模块,用于根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中;
处理模块,还用于通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引;
确定模块,用于根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
本实施例提供的索引重建方法、装置、设备、计算机可读存储介质及产品,该方法首先从分布式数据仓库中直接将与原索引对应的离线数据写入到待重建索引对应的数据存放区域中,并且采用预设的脚本程序将变更在线数据写入至分别写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中。由于将分布式数据仓库内存储的离线数据写入待重建索引所需的时间远远短于采用脚本程序进行离线数据的变更所需的时长,因此,采用上述方法进行索引的重建能够有效地减少索引重建所需的时长。此外,通过同时将在线数据写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中,从而能够在提高索引重建速度的基础上,确保用户在使用该索引进行数据搜索时,不会发生同时命中原索引以及待重建索引的情况,提高用户体验。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本公开基于的系统架构示意图;
图2为本公开实施例一提供的索引重建方法的流程示意图;
图3为本公开实施例二提供的索引重建方法的流程示意图;
图4为本公开实施例提供的消息队列示意图;
图5为本公开实施例提供的应用场景示意图;
图6为本公开实施例三提供的索引重建方法的流程示意图;
图7为本公开实施例四提供的索引重建方法的流程示意图;
图8为本公开实施例提供的又一应用示意图;
图9为本公开实施例五提供的索引重建装置的结构示意图;
图10为本公开实施例六提供的电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例所获得的所有其他实施例,都属于本公开保护的范围。
名词解释:
Hadoop:是一个由Apache基金会所开发的分布式系统基础架构。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System,简称HDFS)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。
Hive/Spark:二者都是开源的数据处理引擎。hive是一个建立在分布式存储系统(这里指HDFS)上的SQL引擎。Spark是用于大规模数据处理的统一分析引擎。
索引:提供指向存储在表的指定列中的数据值的指针,用户可以根据指定的排序顺序对这些指针排序。数据库使用索引以找到特定值,然后顺指针找到包含该值的行。这样可以使对应于表的SQL语句执行得更快,可快速访问数据库表中的特定信息。
TCC:是一个配置管理系统。可以管理配置信息并将配置实时的下发到服务中,提供有接口可以更新配置。
针对上述提及的现有的索引重建方法所需时间较长导致无法正常使用索引的问题,本公开提供了一种索引重建方法、装置、设备、计算机可读存储介质及产品。
需要说明的是,本公开提供索引重建方法、装置、设备、计算机可读存储介质及产品可运用在任意一种聚合了多种不同第三方数据的搜索业务下的索引重建场景中。
在实际应用中,在部分电商平台内添加商品搜索功能往往需要聚合多个不同的第三方平台内的商品数据,以满足用户快速检索并完成添加商品的操作。上述商品搜索操作具体可以基于Elasticsearch(简称ES)实现,Elasticsearch是一个分布式、可扩展、实时的搜索与数据分析引擎。而随着新字段不断添加至ES中以及不断的优化分词算法等操作,为了保证用户能够使用ES正常地实现搜索操作,往往需要对ES索引数据和字段进行重建操作。现有技术中,一般都按照预设的时间间隔采用预设的脚本程序实现对全量数据的写入操作,实现ES索引的重建操作。但是,采用上述方法进行ES索引重建往往耗费的时间较长,从而导致用户在使用ES进行搜索操作时,可能会同时命中旧索引以及重建后的新索引,导致数据搜索效率以及准确率较低,影响用户体验。
在解决上述技术问题的过程中,发明人通过研究发现,通过脚本程序进行数据扫描速度较慢,而直接通过数据仓库导入离线数据速度较快。因此,为了提高ES索引重建的效率,可以直接从分布式数据仓库中将离线数据写入待重建引擎对应的数据存放区域。而针对数据量较少的在线数据,则可以采用脚本程序进行扫描以及写入操作。从而能够在提高索引重建速度的基础上,确保用户在使用该索引进行数据搜索时,不会发生同时命中原索引以及待重建索引的情况,提高用户体验。
图1为本公开基于的系统架构示意图,如图1所示,本公开基于的系统架构至少包括:分布式数据仓库11以及服务器12,其中,该分布式数据仓库11与该服务器12通信连接。该服务器12中设置有索引重建装置。该索引重建装置可以由C/C++、Java、Shell或Python等语言编写;分布式数据仓库11内存储有大量的离线数据。
图2为本公开实施例一提供的索引重建方法的流程示意图,如图2所示,该方法包括:
步骤201、获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引。
本实施例的执行主体为索引重建装置,该索引重建装置可耦合于服务器中。
在本实施方式中,为了实现对索引的重建操作,首先需要获取索引重建配置信息,其中,该索引重建配置信息中可以包括原索引以及与所述原索引对应的待重建索引。
步骤202、根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中。
实际应用中,数据库一般用于在线事务的处理,而数据仓库则是用于离线数据的分析操作。因此,可以将分布式数据仓库中的离线数据写入到待重建索引对应的数据存放区域中。具体地,可以根据该索引重建配置信息,在该分布式数据仓库中确定与原索引对应的离线数据,将该离线数据写入到待重建索引对应的数据存放区域中。
由于将分布式数据仓库内存储的离线数据写入待重建索引所需的时间远远短于采用脚本程序进行离线数据的变更所需的时长,因此,可以有效地提高索引重建的速度。
以实际应用举例来说,当前大数据分析发展迅猛,为了实现对商品数据的分析操作,可以将每日的商品数据导入至Hadoop等离线数据分析平台,通过Hive/Spark进行全量商品数据的离线分析操作。其中,该Hadoop等离线平台中存储的数据可以成为离线数据。
步骤203、通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引。
在本实施例中,除离线数据以外,索引中还可以包括在线数据中数据值的指针。该在线数据具体可以为提供给用户进行线上搜索的数据。
针对该在线数据,可以通过预设的脚本程序,获取发生变更的在线数据,将该变更在线数据分别写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引。
可选地,管理人员可以通过预设的TCC配置中心进行索引重建配置信息的配置操作,双写两个索引。
步骤204、根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
在本实施方式中,在实现离线数据以及在线数据的写入之后,为了保证更新后的待重建索引能够实现与原索引同样的搜索功能,可以确定更新后的原索引以及更新后的待重建索引之间的误差,根据该误差,确定重建后的目标索引。从而后续用户可以根据该目标索引实现搜索操作。
本实施例提供的索引重建方法,首先从分布式数据仓库中直接将与原索引对应的离线数据写入到待重建索引对应的数据存放区域中,并且采用预设的脚本程序将变更在线数据写入至分别写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中。由于将分布式数据仓库内存储的离线数据写入待重建索引所需的时间远远短于采用脚本程序进行离线数据的变更所需的时长,因此,采用上述方法进行索引的重建能够有效地减少索引重建所需的时长。此外,通过同时将在线数据写入原索引对应的数据存放区域以及待重建索引对应的数据存放区域中,从而能够在提高索引重建速度的基础上,确保用户在使用该索引进行数据搜索时,不会发生同时命中原索引以及待重建索引的情况,提高用户体验。
图3为本公开实施例二提供的索引重建方法的流程示意图,在实施例一的基础上,所述索引重建配置信息中还包括所述原索引对应的消息队列信息,如图3所示,步骤103中通过预设的脚本程序获取变更在线数据,包括:
步骤301、通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置。
步骤302、以所述历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,获取所述起点与所述终点之间消息队列中的在线数据。
步骤303、将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据;其中,所述第二时间节点晚于所述第一时间节点。
在本实施例中,为了避免在线变更数据的重复获取,具体可以通过预设的脚本程序,查询消息队列信息中,预设的第一时间节点对应的历史消费位置。其中,该历史消费位置可以为消费者上一次读取到的位置,以及,确定第二时间节点对应的消费位置。以历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,将起点与终点的在线数据作为变更在线数据。其中,该第二时间节点晚于第一时间节点。
以实际应用举例来说,为了避免凌晨0点可能存在的边界问题,该第一时间节点可以为昨天23点,多获取一小时的在线数据。
图4为本公开实施例提供的消息队列示意图,如图4所示,可以确定预设的第一时间节点对应的消息队列信息中的历史消费位置41,以及第二时间节点对应的消费位置42,以该历史消费位置41为起点,该第二时间节点对应的消费位置42为重点,将两个位置中间的在线数据作为变更在线数据43。
图5为本公开实施例提供的应用场景示意图,如图5所示,该应用场景中具体包括分布式数据仓库51、服务器52以及消息队列53。服务器52可以从分布式数据仓库51获取离线数据写入待重建索引53对应的数据存放区域中,并从消息队列53中获取变更在线数据对应的数据存放区域中。获得目标索引。用户可以通过该目标索引实现搜索操作。
进一步地,在上述任一实施例的基础上,步骤301之前,还包括:
按照预设的时间间隔,通过所述消息队列的调用接口,记录每次读取消息队列中的在线数据对应的历史消费位置。
在本实施例中,为了能够实现根据时间节点的消费位置查询操作,可以按照预设的时间间隔,通过该消息队列的调用接口,记录每一次读取消息队列中的在线数据对应的历史消费位置。
可选地,可以将该历史消费位置存储至数据库中,该数据库具体可以为Mysql等。从而后续可以清晰地获取消费者每个预设的时间间隔内消费的位置信息,根据该位置信息,通过预设的调用节点移动消费者位置,可以实现从指定位置的数据消费操作。
具体地,该预设的时间间隔可以为一小时,也可以根据实际场景进行设置,本公开对此不做限制。
进一步地,在上述任一实施例的基础上,步骤303之后,还包括:
确定获取所述起点与所述终点之间消息队列中的在线数据所需的时长。
在所述消息队列信息中,获取所述时长对应的在线数据,将所述时长对应的在线数据以及所述起点与所述终点之间消息队列中的在线数据作为所述变更在线数据。
在本实施例中,由于变更在线数据的写入操作理论上也需要一定的时长,为了保证在索引中写入全部的变更在线数据,可以确定获取该起点与终点之间消息队列中的在线数据所需的时长。在该消息队列信息中,获取时长对应的在线数据,将时长对应的在线数据以及起点与终点之间消息队列中的在线数据作为变更在线数据。
本实施例提供的索引重建方法,通过查询消息队列信息中,预设的第一时间节点对应的历史消费位置,以及,确定第二时间节点对应的消费位置。以历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,将起点与终点的在线数据作为变更在线数据。从而能够精准地确定变更在线数据,避免在线数据的重复获取以及写入,提高索引重建的效率。
图6为本公开实施例三提供的索引重建方法的流程示意图,在上述任一实施例的基础上,如图6所示,步骤102具体包括:
步骤601、获取预设的映射关系表,其中,所述映射关系表中包括分布式数据仓库中离线数据与原索引之间的映射关系。
步骤602、根据所述映射关系表,将所述分布式数据仓库中的与原索引对应的离线数据写入所述待重建索引对应的数据存放区域中。
在本实施例中,分布式数据仓库中记录的离线数据的部分信息与索引中记录的离线数据的部分信息有所不同,举例来说,商品A在分布数据库中的标识可以为商品A,而在索引中的标识则为A’。因此,为了实现离线数据的精准写入操作,可以预先设置映射关系表(ES-Hadoop表),该映射关系表中记录有分布式数据仓库中离线数据与原索引之间的映射关系。
获取到该映射关系表之后,即可以根据该映射关系表,将分布式数据仓库中的与原索引对应的离线数据写入待重建索引对应的数据存放区域中。
进一步地,在上述任一实施例的基础上,步骤101具体包括:
获取索引重建指令,所述索引重建指令中包括所述原索引。
构建所述原索引对应的待重建索引。
在本实施例中,为了实现对原索引的重建操作,首先可以获取索引重建指令,该索引重建指令中包括原索引。构建原索引对应的待重建索引,并完成初始化操作,从而后续能够进行数据的写入操作。
本实施例提供的索引重建方法,通过根据映射关系表,将分布式数据仓库中的数据写入待重建索引对应的数据存放区域中,从而能够实现分布式数据仓库与索引之间差异数据的转换,并且能够提高索引重建的效率。
图7为本公开实施例四提供的索引重建方法的流程示意图,在上述任一实施例的基础上,如图7所示,步骤104具体包括:
步骤701、计算所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差。
步骤702、当检测到所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。
在本实施例中,在实现离线数据以及在线数据的写入之后,可以确定更新后的原索引以及更新后的待重建索引之间的误差,根据该误差,确定重建后的目标索引。从而后续用户可以根据该目标索引实现搜索操作。
具体地,当检测到更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。其中,该误差阈值具体可以为十条,也可以根据实际需求进行设置,本公开对此不做限制。
此外,当检测到更新后的原索引以及更新后的待重建索引对应的数据之间的误差大于预设的误差阈值时,则可以进一步地对该更新后的待重建索引进行优化操作。
进一步地,在上述任一实施例的基础上,步骤104之后,还包括:
通过预设的更名调用接口,将所述原索引对应的别名索引指向所述目标索引。
在本实施例中,针对每一索引,均可以设置一别名索引,该别名索引可以为一种快捷方式,指向一个真实索引。别名索引可以方便地用于切换实际的索引。使用别名索引之后,在重建索引之后,只要在ES中将别名的快捷方式指向新的索引即可,无需对业务代码进行任何改动,无需上线修改代码,进一步地提高了索引重建的效率。
具体地,可以通过预设的更名调用接口,将原索引对应的别名索引指向重建后的目标索引,实现索引的切换操作。从而后续用户可以使用重建后的目标索引进行数据搜索操作。
图8为本公开实施例提供的又一应用示意图,如图8所示,用户可以通过索引别名81访问该索引别名81所指向的目标索引82。
本实施例提供的索引重建方法,通过在实现离线数据以及在线数据的写入之后,可以确定更新后的原索引以及更新后的待重建索引之间的误差,根据该误差,确定重建后的目标索引。从而能够保证更新后的待重建索引能够实现与原索引同样的搜索功能
图9为本公开实施例五提供的索引重建装置的结构示意图,如图9所示,该索引重建装置90包括:获取模块91、处理模块92以及确定模块93。其中,获取模块91,用于获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引。处理模块92,用于根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中。处理模块92,还用于通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引。确定模块93,用于根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
进一步地,在实施例五的基础上,所述索引重建配置信息中还包括所述原索引对应的消息队列信息,所述处理模块用于:通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置。以所述历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,获取所述起点与所述终点之间消息队列中的在线数据。将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据。其中,所述第二时间节点晚于所述第一时间节点。
进一步地,在实施例五的基础上,所述处理模块还用于:按照预设的时间间隔,通过所述消息队列的调用接口,记录每次读取消息队列中的在线数据对应的历史消费位置。
进一步地,在上述任一实施例的基础上,所述处理模块还用于:确定获取所述起点与所述终点之间消息队列中的在线数据所需的时长。在所述消息队列信息中,获取所述时长对应的在线数据,将所述时长对应的在线数据以及所述起点与所述终点之间消息队列中的在线数据作为所述变更在线数据。
进一步地,在上述任一实施例的基础上,所述处理模块用于:获取预设的映射关系表,其中,所述映射关系表中包括分布式数据仓库中离线数据与原索引之间的映射关系。根据所述映射关系表,将所述分布式数据仓库中的与原索引对应的离线数据写入所述待重建索引对应的数据存放区域中。
进一步地,在上述任一实施例的基础上,所述获取模块用于:获取索引重建指令,所述索引重建指令中包括所述原索引。构建所述原索引对应的待重建索引。
进一步地,在上述任一实施例的基础上,所述确定模块,用于:计算所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差。当检测到所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。
进一步地,在上述任一实施例的基础上,所述装置还包括:编辑模块,用于通过预设的更名调用接口,将所述原索引对应的别名索引指向所述目标索引。
本实施例提供的设备,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图10为本公开实施例六提供的电子设备的结构示意图,如图10所示,该电子设备1000可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑(Portable Android Device,简称PAD)、便携式多媒体播放器(Portable Media Player,简称PMP)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,电子设备1000可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(Read Only Memory,简称ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(Random Access Memory,简称RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有电子设备1000操作所需的各种程序和数据。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
通常,以下装置可以连接至I/O接口1005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(Liquid CrystalDisplay,简称LCD)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备1000与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备1000,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从ROM1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
本公开又一实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述任一实施例所述的索引重建方法。
本公开又一实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上述任一实施例所述的索引重建方法
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network,简称LAN)或广域网(Wide Area Network,简称WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
第一方面,根据本公开的一个或多个实施例,提供了一种索引重建方法,包括:获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引。根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中。通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引。根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
根据本公开的一个或多个实施例,所述索引重建配置信息中还包括所述原索引对应的消息队列信息,所述通过预设的脚本程序获取变更在线数据,包括:通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置。以所述历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,获取所述起点与所述终点之间消息队列中的在线数据。将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据。其中,所述第二时间节点晚于所述第一时间节点。
根据本公开的一个或多个实施例,所述通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置之前,还包括:按照预设的时间间隔,通过所述消息队列的调用接口,记录每次读取消息队列中的在线数据对应的历史消费位置。
根据本公开的一个或多个实施例,所述将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据之后,还包括:确定获取所述起点与所述终点之间消息队列中的在线数据所需的时长。在所述消息队列信息中,获取所述时长对应的在线数据,将所述时长对应的在线数据以及所述起点与所述终点之间消息队列中的在线数据作为所述变更在线数据。
根据本公开的一个或多个实施例,所述根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中,包括:获取预设的映射关系表,其中,所述映射关系表中包括分布式数据仓库中离线数据与原索引之间的映射关系。根据所述映射关系表,将所述分布式数据仓库中的与原索引对应的离线数据写入所述待重建索引对应的数据存放区域中。
根据本公开的一个或多个实施例,所述获取索引重建配置信息,包括:获取索引重建指令,所述索引重建指令中包括所述原索引。构建所述原索引对应的待重建索引。
根据本公开的一个或多个实施例,所述根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引,包括:计算所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差。当检测到所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。
根据本公开的一个或多个实施例,所述根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引之后,还包括:通过预设的更名调用接口,将所述原索引对应的别名索引指向所述目标索引。
第二方面,根据本公开的一个或多个实施例,提供了一种索引重建装置,包括:获取模块,用于获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引。处理模块,用于根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中。处理模块,还用于通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引。确定模块,用于根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引。
根据本公开的一个或多个实施例,所述索引重建配置信息中还包括所述原索引对应的消息队列信息,所述处理模块用于:通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置。以所述历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,获取所述起点与所述终点之间消息队列中的在线数据。将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据。其中,所述第二时间节点晚于所述第一时间节点。
根据本公开的一个或多个实施例,所述处理模块还用于:按照预设的时间间隔,通过所述消息队列的调用接口,记录每次读取消息队列中的在线数据对应的历史消费位置。
根据本公开的一个或多个实施例,所述处理模块还用于:确定获取所述起点与所述终点之间消息队列中的在线数据所需的时长。在所述消息队列信息中,获取所述时长对应的在线数据,将所述时长对应的在线数据以及所述起点与所述终点之间消息队列中的在线数据作为所述变更在线数据。
根据本公开的一个或多个实施例,所述处理模块用于:获取预设的映射关系表,其中,所述映射关系表中包括分布式数据仓库中离线数据与原索引之间的映射关系。根据所述映射关系表,将所述分布式数据仓库中的与原索引对应的离线数据写入所述待重建索引对应的数据存放区域中。
根据本公开的一个或多个实施例,所述获取模块用于:获取索引重建指令,所述索引重建指令中包括所述原索引。构建所述原索引对应的待重建索引。
根据本公开的一个或多个实施例,所述确定模块,用于:计算所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差。当检测到所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。
根据本公开的一个或多个实施例,所述装置还包括:编辑模块,用于通过预设的更名调用接口,将所述原索引对应的别名索引指向所述目标索引。
第三方面,根据本公开的一个或多个实施例,提供了一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
第四方面,根据本公开的一个或多个实施例,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
第五方面,根据本公开的一个或多个实施例,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的索引重建方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (12)

1.一种索引重建方法,其特征在于,包括:
获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引;
根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中;
通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引;
根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引;
所述方法还包括:将所述分布式数据仓库中的离线数据写入所述待重建引擎对应的数据存放区域;通过预设脚本程序将在线数据写入所述待重建引擎对应的数据存放区域。
2.根据权利要求1所述的方法,其特征在于,所述索引重建配置信息中还包括所述原索引对应的消息队列信息,所述通过预设的脚本程序获取变更在线数据,包括:
通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置;
以所述历史消费位置为起点,预设的第二时间节点对应的消费位置为终点,获取所述起点与所述终点之间消息队列中的在线数据;
将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据;
其中,所述第二时间节点晚于所述第一时间节点。
3.根据权利要求2所述的方法,其特征在于,所述通过所述脚本程序查询所述消息队列信息中,预设的第一时间节点对应的消息队列信息中的历史消费位置之前,还包括:
按照预设的时间间隔,通过所述消息队列的调用接口,记录每次读取消息队列中的在线数据对应的历史消费位置。
4.根据权利要求2或3所述的方法,其特征在于,所述将所述起点与所述终点之间消息队列中的在线数据确定为所述变更在线数据之后,还包括:
确定获取所述起点与所述终点之间消息队列中的在线数据所需的时长;
在所述消息队列信息中,获取所述时长对应的在线数据,将所述时长对应的在线数据以及所述起点与所述终点之间消息队列中的在线数据作为所述变更在线数据。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中,包括:
获取预设的映射关系表,其中,所述映射关系表中包括分布式数据仓库中离线数据与原索引之间的映射关系;
根据所述映射关系表,将所述分布式数据仓库中的与原索引对应的离线数据写入所述待重建索引对应的数据存放区域中。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述获取索引重建配置信息,包括:
获取索引重建指令,所述索引重建指令中包括所述原索引;
构建所述原索引对应的待重建索引。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引,包括:
计算所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差;
当检测到所述更新后的原索引以及更新后的待重建索引对应的数据之间的误差小于预设的误差阈值时,将所述更新后的待重建索引作为重建后的目标索引。
8.根据权利要求7所述的方法,其特征在于,所述根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引之后,还包括:
通过预设的更名调用接口,将所述原索引对应的别名索引指向所述目标索引。
9.一种索引重建装置,其特征在于,包括:
获取模块,用于获取索引重建配置信息,所述索引重建配置信息中包括原索引以及与所述原索引对应的待重建索引;
处理模块,用于根据所述索引重建配置信息,从预设的分布式数据仓库中获取与原索引对应的离线数据并写入到待重建索引对应的数据存放区域中;
处理模块,还用于通过预设的脚本程序获取变更在线数据,将所述变更在线数据分别写入所述原索引对应的数据存放区域以及所述待重建索引对应的数据存放区域中,获得更新后的原索引以及更新后的待重建索引;
确定模块,用于根据所述更新后的原索引以及更新后的待重建索引之间的误差,确定重建后的目标索引;
所述装置还用于:将所述分布式数据仓库中的离线数据写入所述待重建引擎对应的数据存放区域;通过预设脚本程序将在线数据写入所述待重建引擎对应的数据存放区域。
10.一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-8任一项所述的索引重建方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-8任一项所述的索引重建方法。
12.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8任一项所述的索引重建方法。
CN202110163140.0A 2021-02-05 2021-02-05 索引重建方法、装置、设备、计算机可读存储介质及产品 Active CN112835980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110163140.0A CN112835980B (zh) 2021-02-05 2021-02-05 索引重建方法、装置、设备、计算机可读存储介质及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110163140.0A CN112835980B (zh) 2021-02-05 2021-02-05 索引重建方法、装置、设备、计算机可读存储介质及产品

Publications (2)

Publication Number Publication Date
CN112835980A CN112835980A (zh) 2021-05-25
CN112835980B true CN112835980B (zh) 2024-04-16

Family

ID=75932435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110163140.0A Active CN112835980B (zh) 2021-02-05 2021-02-05 索引重建方法、装置、设备、计算机可读存储介质及产品

Country Status (1)

Country Link
CN (1) CN112835980B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722547A (zh) * 2021-08-27 2021-11-30 深圳市商汤科技有限公司 索引重建方法、装置、设备及计算机存储介质
CN113672630B (zh) * 2021-10-25 2022-01-04 禾多科技(北京)有限公司 混合数据持久化方法、装置、电子设备和计算机可读介质
CN118210799A (zh) * 2023-07-14 2024-06-18 中兴通讯股份有限公司 索引切换方法、装置及计算机可读存储介质
CN117149763B (zh) * 2023-08-08 2024-04-02 广州方舟信息科技有限公司 一种索引切换同步方法、装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750773A (zh) * 2013-12-31 2015-07-01 国际商业机器公司 基于重构与更新比较的索引维护
WO2016029748A1 (zh) * 2014-08-30 2016-03-03 华为技术有限公司 在线重建索引方法及装置
CN111352936A (zh) * 2020-02-06 2020-06-30 福建天泉教育科技有限公司 Es重建索引的方法、存储介质
CN111597403A (zh) * 2020-05-21 2020-08-28 北京字节跳动网络技术有限公司 一种构建图索引的方法、装置、电子设备及存储介质
CN112052247A (zh) * 2020-09-29 2020-12-08 微医云(杭州)控股有限公司 搜索引擎的索引更新系统、方法、装置、电子设备、存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244700B2 (en) * 2010-02-12 2012-08-14 Microsoft Corporation Rapid update of index metadata
US11055268B2 (en) * 2018-03-19 2021-07-06 Fast Technologies, Inc. Automatic updates for a virtual index server

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750773A (zh) * 2013-12-31 2015-07-01 国际商业机器公司 基于重构与更新比较的索引维护
WO2016029748A1 (zh) * 2014-08-30 2016-03-03 华为技术有限公司 在线重建索引方法及装置
CN111352936A (zh) * 2020-02-06 2020-06-30 福建天泉教育科技有限公司 Es重建索引的方法、存储介质
CN111597403A (zh) * 2020-05-21 2020-08-28 北京字节跳动网络技术有限公司 一种构建图索引的方法、装置、电子设备及存储介质
CN112052247A (zh) * 2020-09-29 2020-12-08 微医云(杭州)控股有限公司 搜索引擎的索引更新系统、方法、装置、电子设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Apache Solr: An Introduction;D Shahi等;《Apache Solr: A practical approach to enterprise search》;第1-9页 *

Also Published As

Publication number Publication date
CN112835980A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN112835980B (zh) 索引重建方法、装置、设备、计算机可读存储介质及产品
CN110704751B (zh) 数据处理方法、装置、电子设备及存储介质
CN109656923B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN110634047B (zh) 一种推荐房源的方法、装置、电子设备及存储介质
CN112115153B (zh) 数据处理方法、装置、设备及存储介质
CN111400625B (zh) 页面处理方法、装置、电子设备及计算机可读存储介质
US20210200806A1 (en) Method and apparatus for parallel processing of information
CN111857720B (zh) 用户界面状态信息的生成方法、装置、电子设备及介质
CN111597403B (zh) 一种构建图索引的方法、装置、电子设备及存储介质
CN112100211B (zh) 数据存储方法、装置、电子设备和计算机可读介质
CN111782895B (zh) 检索处理方法、装置、可读介质及电子设备
CN111309988B (zh) 基于编码的字符串检索方法、装置及电子设备
CN111143464B (zh) 数据获取方法、装置和电子设备
CN110598133A (zh) 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110619093B (zh) 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN114040014B (zh) 内容推送方法、装置、电子设备及计算机可读存储介质
CN111984645B (zh) 一种数据处理的方法、装置、介质和电子设备
CN118152432B (zh) 数据库查询方法、设备、存储介质及计算机程序产品
CN111831655B (zh) 一种数据处理的方法、装置、介质和电子设备
CN116821438A (zh) 基于数据库的数据处理方法、装置、介质及设备
CN116340364A (zh) 一种数据的处理方法、装置、设备及存储介质
CN114296977A (zh) 一种内存泄露检测方法、装置、设备及介质
CN117149831A (zh) 数据库的数据读取方法、设备及存储介质
CN118427444A (zh) 推荐内容确定方法、装置、介质、电子设备及程序产品
CN117093703A (zh) 日志信息的查询方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant