CN112115140B - 一种通用的全文搜索引擎实时数据同步方法及装置 - Google Patents
一种通用的全文搜索引擎实时数据同步方法及装置 Download PDFInfo
- Publication number
- CN112115140B CN112115140B CN202010858773.9A CN202010858773A CN112115140B CN 112115140 B CN112115140 B CN 112115140B CN 202010858773 A CN202010858773 A CN 202010858773A CN 112115140 B CN112115140 B CN 112115140B
- Authority
- CN
- China
- Prior art keywords
- data
- change set
- search engine
- text search
- data change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000008859 change Effects 0.000 claims abstract description 114
- 238000004891 communication Methods 0.000 claims abstract description 47
- 238000005538 encapsulation Methods 0.000 claims abstract description 21
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000013507 mapping Methods 0.000 claims description 12
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 10
- 238000011161 development Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种通用的全文搜索引擎实时数据同步方法及装置,用以解决现有方案中的业务侵入性、数据库兼容性及数据实时性的技术问题。方法包括:监听预设数据库的通信端口;抓取并解析通信端口对应的通信数据包,以得到待执行指令;基于预设数据库的类型,解析待执行指令,以得到数据变更集;其中,数据变更集用于指示预设数据库中的待变更数据;对数据变更集进行封装处理,并将封装处理后的数据变更集推送至消息队列中,进而同步至全文搜索引擎中。本申请通过上述方法实现了数据同步过程中能够兼容多种数据库类型且对原有的业务系统编码无侵入,而且保证了数据的实时性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种通用的全文搜索引擎实时数据同步方法及装置。
背景技术
随着信息化的不断发展,各类数据、信息呈现井喷式的增长。在这种数据纷繁复杂的情况下,数据的高性能检索系统成为了一个必然的趋势,催生了一些专业的全文搜索引擎。
现有的全文搜索引擎在进行数据收录时,普遍采用的方法包括业务系统主动推送、外部系统定时监控数据库日志抽取变化等。但业务系统主动推送容易对原有的业务系统造成侵入;定时监控数据库日志抽取变化很难做到多种数据库的兼容,且数据的实时性要求难以满足。
发明内容
本申请实施例提供了一种通用的全文搜索引擎实时数据同步方法及装置,用以解决现有的全文搜索引擎数据同步方法容易对现有业务系统造成侵入、无法兼容多种数据库且数据的实时性无法保证的技术问题。
第一方面,本申请实施例提供了一种通用的全文搜索引擎实时数据同步方法,包括:监听预设数据库的通信端口;抓取并解析通信端口对应的通信数据包,以得到待执行指令;基于预设数据库的类型,解析待执行指令,以得到数据变更集;其中,数据变更集用于指示预设数据库中的待变更数据;对数据变更集进行封装处理,并将封装处理后的数据变更集推送至消息队列中,进而同步至全文搜索引擎中。
本申请实施例提供的一种通用的全文搜索引擎实时数据同步方法,通过建通数据库的通信端口,当有网络通信数据包传输时,对该数据包进行抓取,使得该方法对业务系统原有的数据无侵入;通过对数据包解析得到待执行指令,通过对待执行指令解析得到数据变更集,根据数据库的类型进行解析,实现了兼容多种数据库类型;通过消息阵列将数据变更集同步至全文搜索引擎中,借助消息阵列的高性能处理能力及集群模式,实现数据的实时性处理,保证了数据同步的实时性。
在本申请的一种实现方式中,对数据变更集进行封装处理后,方法还包括:将封装处理后的数据变更集转换映射为全文搜索引擎的索引;对索引进行保存。
在本申请的一种实现方式中,封装处理后的数据变更集中包括数据完整性校验码。
本申请实施例提出的数据同步方法中,在对数据进行封装时,设置完整性校验码,以确保数据变更集得到完整的传输与更新,进而保证了预设数据库中的变更数据与全文搜索引擎保持一致。
在本申请的一种实现方式中,解析待执行指令,以得到数据变更集,具体包括:确定预设数据库的类型;根据预设数据库的类型,确定与之对应的指令解析器;通过指令解析器,对待执行指令进行解析,并根据预设数据库中的数据文件,整理得到数据变更集。
第二方面,本申请实施例还提供了一种通用的全文搜索引擎实时数据同步装置,装置包括:数据库监听器,用于对预设数据库的通信端口进行监听,以抓取与通信端口对应的通信数据包;数据库监听器还用于对通信数据包进行解析,以得到待执行指令;指令解析器,用于解析待执行指令,并根据解析结果确定数据变更集;其中,数据变更集用于指示预设数据库中的待变更数据;消息产生器,用于对数据变更集进行封装处理,并将封装处理后的数据变更集发送至消息队列中;消息处理器,用于将封装处理后的数据变更集同步至全文搜索引擎中。
本申请实施例提供的一种通用的全文搜索引擎实时数据同步装置,由于采用的是网络数据抓包解析的方式,使得整个装置对业务系统编码无侵入,不仅支持新项目开发,也可以支持已建系统的升级;指令解析器可以针对不同的数据库做出切换,实现了多种数据库类型的兼容;在装置部署安装时,可以根据现场实际场景,选装特定数据库类型对应的指令解析器,以便正确执行对应的指令解析工作;消息处理器器为了更好的提供消息处理能力,提高消息产生与处理过程中的系统可扩展性,通过消息队列来对消息的产生与处理解耦,借助消息队列的高性能处理能力及集群模式,实现数据的实时处理,保证了数据同步的实时性。
在本申请的一种实现方式中,指令解析器包括若干解析模块;若干解析模块用于根据所述预设数据库的类型进行切换。
在本申请的一种实现方式中,消息产生器包括数据封装模块;数据封装模块用于将数据变更集封装为预设格式的数据变更集;预设格式的数据变更集用于与全文搜索引擎中的若干索引建立对应关系。
本申请实施例中的数据封装模块将数据变更集封装为统一格式的数据变更集,其意义在于能够使得数据解析过程中获知数据在全文搜索引擎中的影响范围,这样不但达到了增量更新全文搜索引擎中数据,而且还提高了时效性,避免了部分通过轮询方法获取增量数据的延时问题。同时,相较于传统的基于时间戳轮询获取变更数据的方案,本申请实施例中提出的数据同步装置对资源的消耗也得到了明显的改善。
在本申请的一种实现方式中,数据封装模块还用于在预设格式的数据变更集中添加预设字段;预设字段用于支持预设格式的数据变更集进行完整性校验。
本申请实施例提供的数据同步装置中的消息产生器包括数据封装模块,数据封装模块在对数据变更集进行封装处理时,还会增加预设字段,以确保数据变更集得到了完整的传输与更新,保证了数据的完整性,进而保证了预设数据库中的数据变化与全文搜索引擎保持一致。
在本申请的一种实现方式中,数据封装模块还用于配置全文搜索引擎中的待建立索引。该数据封装模块可以进行自定义设置,可以配置全文搜索引擎中将要建立的索引,使得全文搜索引擎能够更加适应业务的需要。
在本申请的一种实现方式中,消息处理器还用于将封装处理后的数据变更集转换映射为全文搜索引擎的索引。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种通用的全文搜索引擎实时数据同步方法流程示意图;
图2为本申请实施例提供的一种通用的全文搜索引擎实时数据同步装置内部结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着企业规模以及信息化的发展,各类企业信息、数据呈现井喷式增长。在这种数据纷繁复杂的场景下,数据的高性能检索系统成为了一个必然趋势,催生了一些专业的全文搜索引擎。
对于全文搜索引擎中数据的收录,目前普遍的做法主要包括业务系统主动推送、外部系统定时监控数据库日志抽取变化等多种方式。然而,通过监控数据库日志的方案很难做到多数据库兼容;定时抽取数据增量的方案无法做到数据实时性要求;且部分业务系统主动推送数据到全文搜索引擎的方案,对原有业务有一定的侵入性,已建立的系统需升级改造。
总而言之,现有的实时数据同步方案一般会存在一些诸如对现有业务系统的侵入、无法兼容多种数据库、很难达到实时数据抽取等弊端,制约了全文搜索引擎的发展。
为解决上述技术问题,本申请实施例提出了一种通用的全文搜索引擎实时数据同步方法及装置,通过监听数据库通信端口,抓取网络通信数据包,并解析其中的数据库待执行指令,生成数据变更集,通过消息队列将数据变更集实时推送到全文搜索引擎中。从而实现了全文搜索引擎同步数据的实时性,且保证了对原有的业务系统无侵入,以及实现了多种类型数据库的兼容性。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
图1为本申请实施例提供的一种通用的全文搜索引擎实时数据同步方法流程示意图。如图1所示,本申请实施例提供的全文搜索引擎实时数据同步过程,主要包括以下步骤:
步骤101、监听预设数据库的通信端口,进行通信数据包的抓取,并解析为待执行指令。
本申请实施例提出的一种通用的全文搜索引擎实时数据同步方法中,首先是建立预设数据库的监听关系,对预设数据库进行监听。在预设数据库的通信端口有网络通信数据包传输时,抓取该通信数据包,并对其进行解析。
进一步地,通信数据包中包含若干条待执行指令,且当若干条待执行指令被执行时,使得预设数据库中的数据进行相应的变化。
在抓取到通信数据包之后,对该通信数据包进行解析,并提取其中包含的待执行指令。
需要说明的是,抓取通信数据包并对抓取到的数据包进行解析,可以通过现有的方法或者设备实现,本申请实施例在此不做赘述。
步骤102、基于预设数据库的类型,解析待执行指令,得到数据变更集。
在解析通信数据包得到待执行指令之后,对待执行指令进行解析,将该待执行指令被执行后的影响结果,整理成数据变更集。
在本申请的一个实施例中,根据预设数据库的类型,选择与之对应的指令解析器,对待执行指令进行解析。
进一步地,结合预设数据库中的数据文件,根据待执行指令被执行后的影响结果,整理得到数据变更集。
需要说明的是,该数据变更集中的数据用于指示预设数据库中的待变更数据。
步骤103、对数据变更集进行封装处理,并推送至消息队列。
在得到数据变更集之后,对数据变更集进行封装处理,将其封装成统一格式的数据变更集,并将该统一格式的数据变更集推送至消息队列中。
在本申请的一个实施例中,将封装后的数据变更集推送至消息队列中可以通过同步方式或者异步方式实现。
在本申请的另一实施例中,将数据变更集封装为统一格式的数据变更集,便于与全文搜索引擎中的索引建立对应关系。
在本申请的一个实施例中,封装处理后的数据变更集中包括数据完整性校验码。通过该数据完整性校验码,确保数据变更集得到了完整的传输与更新,保证了实时数据同步的完整性。
步骤104、解析数据变更集与索引的映射关系,并将数据变更集发送至全文搜索引擎中。
消息队列可以解析封装后的数据变更集与全文搜索引擎中若干索引的映射关系,并根据解析出的映射关系,将数据变更集发送至全文搜索引擎中。
在本申请的一个实施例中,如果消息队列没有解析出与封装后的数据变更集对应的索引,则可以将统一格式的数据变更集转换映射为全文搜索引擎的索引,保存该索引,并将统一格式的数据变更集发送至全文搜索引擎中。
至此,当预设数据库中的数据有相应的变化时,可以实现将待变更数据实时同步至全文搜索引擎中,而不需要侵入原有的业务系统,且能够保证数据同步的实时性。另外,本申请实施例对预设数据库的类型并没有特殊限制,因此,本申请实施例提供的全文搜索引擎实时数据同步方法中可以实现多种数据库类型的兼容性。
基于同样的发明构思,本申请实施例还提供了一种通用的全文搜索引擎实时数据同步装置。其内部结构示意图如图2所示。
图2为本申请实施例提供的一种通用的全文搜索引擎实时数据同步装置内部结构示意图。如图2所示,本申请实施例提供的装置包括:数据库监听器201、指令解析器202、消息产生器203及消息处理器204。
如图2所示,数据库监听器201用于监听业务系统对应数据库的通信端口。当数据库的通信端口有通信数据包进行传输时,数据库监听器201抓取传输的通信数据包。
进一步地,数据库监听器201根据数据库的类型,解析抓取到的通信数据包,并提取其中的待执行指令。
其中,待执行指令被执行时,使得数据库监听器201监听的数据库中的数据发生变更。
如图2所示,指令解析器202用于解析待执行指令,得到数据变更集。
具体地,指令解析器202中包括若干解析模块,且各个解析模块对应一种数据库类型。
进一步地,根据数据库监听器201正在监听的数据库的类型,指令解析器202切换不同的解析模块,以对应正在监听的数据库的类型。解析模块对待执行指令进行解析。
进一步地,根据数据库中的数据文件,通过解析后的待执行指令,整理出数据变更集。其中,数据变更集用于指示数据库中的待变更数据。
如图2所示,消息产生器203用于接收指令解析器202得到的数据变更集,并对其进行封装处理,以得到预设格式数据变更集。
在本申请的一个实施例中,消息产生器203中包括数据封装模块,用于将数据变更集封装为预设格式的数据变更集。
进一步地,将预设格式的数据变更集以同步方式或者异步方式推送至消息队列中。
在本申请的一个实施例中,预设格式的数据变更集用于与全文搜索引擎中的若干索引建立对应关系,以便后续将该预设格式的数据变更集同步至全文搜索引擎中。
在本申请的另一实施例中,消息队列具有高性能处理能力及集群模式,以便实现数据同步的实时性。
更进一步地,数据封装模块在对数据变更集进行封装处理时,还会在数据变更集中添加预设字段。该预设字段用于支持封装处理后的数据变更集进行完整性校验,以保证数据同步的完整性。
在本申请的另一实施例中,该数据封装模块还可以提供用户的自定义设置,可以配置全文搜索引擎中将要建立的索引,以使得全文搜索引擎能够更加适应业务的发展需求。
如图2所示,消息处理器204用于将消息队列中封装处理后的数据变更集同步至全文搜索引擎中。
在本申请的一个实施例中,消息处理器204还用于将封装处理后的数据变更集转换映射为全文搜索引擎对应的索引。
本申请实施例中的消息产生器203将数据变更集进行封装处理为预设格式的数据变更集,以便后续消息处理器204在进行数据同步时能够与全文搜索引擎中的若干索引建立对应关系。而封装处理后的数据变更集中还会有部分数据无法与全文搜索引擎中的若干索引建立对应关系,此时,消息处理器204可以根据数据变更集的内容将其转换映射成全文搜索引擎的索引,并将该数据变更集与转换映射后的索引建立对应关系,然后将数据变更集同步至全文搜索引擎中。
在本申请的一个实施例中,该全文搜索引擎实时数据同步装置可以应用于ERP电子商务平台中采购方与供应商的跨平台信息共享,大数据供应商信息、商机信息检索与匹配等场景。其中,企业信息和商机信息的来源途径是多样化的,一般可以由多个租户内的独立业务系统将数据同步到统一的全文搜索引擎集群中,从而形成公有云的商机中心,大量数据汇集在一起便于平台针对性的进行信息检索、智能推荐、撮合交易。
进一步地,每个租户对应的业务系统中,包括在建系统、已建系统均可以使用该装置进行数据实时同步,数据收录时对原业务系统无任何侵入性,根本不需要对原系统程序进行改造,保障了原有系统业务流程的稳定性。
如果是新建系统,则在开发过程中,部署并运行该装置,通过配置指定的端口号来启动监听。当发现有通信数据包通过网络传输,便会主动触发该装置进行解析并生成数据变更集推送到全文搜索引擎中,以实现数据的同步过程。
如果是原有业务系统的优化升级,原业务系统的业务流程往数据库里的写入过程并不需要修改,部署该装置后,通过配置指定的端口号来启动监听。当发现有指令数据包通过网络传输,便会主动触发该装置进行解析并生成数据变更集并推送到全文搜索引擎中,以实现数据的实时同步。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种通用的全文搜索引擎实时数据同步方法,其特征在于,所述方法包括:
监听预设数据库的通信端口;
在所述预设数据库的通信端口有通信数据包传输时,抓取并解析所述通信端口对应的通信数据包,以得到待执行指令,所述通信数据包中包含有若干条待执行指令,且当若干条待执行指令被执行时,使得所述预设数据库中的数据进行相应的变化;
基于所述预设数据库的类型,选择对应的指令解析器解析所述待执行指令,通过所述预设数据库中的数据文件,根据所述待执行指令被执行后的影响结果,得到数据变更集;其中,所述数据变更集用于指示所述预设数据库中的待变更数据;
对所述数据变更集进行封装处理,并将封装处理后的所述数据变更集推送至消息队列中,进而同步至全文搜索引擎中,包括:将数据变更集封装为统一格式的数据变更集,并与全文搜索引擎中的索引建立映射关系,通过消息队列解析封装后的数据变更集与全文搜索引擎中的索引的映射关系,并根据解析出的映射关系,将封装后的数据变更集发送至全文搜索引擎中。
2.根据权利要求1所述的一种通用的全文搜索引擎实时数据同步方法,其特征在于,对所述数据变更集进行封装处理后,所述方法还包括:
将封装处理后的所述数据变更集转换映射为所述全文搜索引擎的索引;
对所述索引进行保存。
3.根据权利要求1所述的一种通用的全文搜索引擎实时数据同步方法,其特征在于,所述封装处理后的数据变更集中包括数据完整性校验码。
4.根据权利要求1所述的一种通用的全文搜索引擎实时数据同步方法,其特征在于,解析所述待执行指令,以得到数据变更集,具体包括:
确定所述预设数据库的类型;
根据所述预设数据库的类型,确定与之对应的指令解析器;
通过所述指令解析器,对所述待执行指令进行解析,并根据所述预设数据库中的数据文件,整理得到数据变更集。
5.一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述装置包括:
数据库监听器,用于对预设数据库的通信端口进行监听,以在所述预设数据库的通信端口有通信数据包传输时抓取与所述通信端口对应的通信数据包;
所述数据库监听器还用于对所述通信数据包进行解析,以得到待执行指令,所述通信数据包中包含有若干条待执行指令,且当若干条待执行指令被执行时,使得所述预设数据库中的数据进行相应的变化;
指令解析器,用于基于所述预设数据库的类型,选择对应的指令解析器解析所述待执行指令,并通过所述预设数据库中的数据文件,根据所述待执行指令被执行后的影响结果,确定数据变更集;其中,所述数据变更集用于指示所述预设数据库中的待变更数据;
消息产生器,用于对所述数据变更集进行封装处理,并将封装处理后的所述数据变更集发送至消息队列中,包括:将数据变更集封装为统一格式的数据变更集,并与全文搜索引擎中的索引建立映射关系;
消息处理器,用于将封装处理后的所述数据变更集同步至全文搜索引擎中,包括:通过消息队列解析封装后的数据变更集与全文搜索引擎中的索引的映射关系,并根据解析出的映射关系,将封装后的数据变更集发送至全文搜索引擎中。
6.根据权利要求5所述的一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述指令解析器包括若干解析模块;
所述若干解析模块用于根据所述预设数据库的类型进行切换。
7.根据权利要求5所述的一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述消息产生器包括数据封装模块;
所述数据封装模块用于将所述数据变更集封装为预设格式的数据变更集;
所述预设格式的数据变更集用于与全文搜索引擎中的若干索引建立对应关系。
8.根据权利要求7所述的一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述数据封装模块还用于在所述预设格式的数据变更集中添加预设字段;
所述预设字段用于支持所述预设格式的数据变更集进行完整性校验。
9.根据权利要求7所述的一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述数据封装模块还用于配置所述全文搜索引擎中的待建立索引。
10.根据权利要求5所述的一种通用的全文搜索引擎实时数据同步装置,其特征在于,所述消息处理器还用于将封装处理后的所述数据变更集转换映射为所述全文搜索引擎的索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010858773.9A CN112115140B (zh) | 2020-08-24 | 2020-08-24 | 一种通用的全文搜索引擎实时数据同步方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010858773.9A CN112115140B (zh) | 2020-08-24 | 2020-08-24 | 一种通用的全文搜索引擎实时数据同步方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112115140A CN112115140A (zh) | 2020-12-22 |
CN112115140B true CN112115140B (zh) | 2024-03-29 |
Family
ID=73804280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010858773.9A Active CN112115140B (zh) | 2020-08-24 | 2020-08-24 | 一种通用的全文搜索引擎实时数据同步方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115140B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177082A (zh) * | 2013-02-21 | 2013-06-26 | 用友软件股份有限公司 | 主服务器、从服务器、索引同步系统和索引同步方法 |
CN103365873A (zh) * | 2012-03-28 | 2013-10-23 | 阿里巴巴集团控股有限公司 | 业务数据的推送方法及装置 |
CN106294741A (zh) * | 2016-08-10 | 2017-01-04 | 深圳市彬讯科技有限公司 | 一种自动化数据查询同步存储系统 |
CN107402963A (zh) * | 2017-06-20 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 搜索数据的构建方法、增量数据的推送方法及装置和设备 |
CN111367692A (zh) * | 2020-03-09 | 2020-07-03 | 政采云有限公司 | 一种搜索引擎数据处理方法、装置、电子设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7827168B2 (en) * | 2007-05-30 | 2010-11-02 | Red Hat, Inc. | Index clustering for full text search engines |
-
2020
- 2020-08-24 CN CN202010858773.9A patent/CN112115140B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103365873A (zh) * | 2012-03-28 | 2013-10-23 | 阿里巴巴集团控股有限公司 | 业务数据的推送方法及装置 |
CN103177082A (zh) * | 2013-02-21 | 2013-06-26 | 用友软件股份有限公司 | 主服务器、从服务器、索引同步系统和索引同步方法 |
CN106294741A (zh) * | 2016-08-10 | 2017-01-04 | 深圳市彬讯科技有限公司 | 一种自动化数据查询同步存储系统 |
CN107402963A (zh) * | 2017-06-20 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 搜索数据的构建方法、增量数据的推送方法及装置和设备 |
CN111367692A (zh) * | 2020-03-09 | 2020-07-03 | 政采云有限公司 | 一种搜索引擎数据处理方法、装置、电子设备及介质 |
Non-Patent Citations (2)
Title |
---|
基于Java的森林分类经营搜索引擎;祝彦杰;许谭;曹天昊;;农机使用与维修(第04期);全文 * |
基于Zookeeper构建准实时索引更新系统及其监控;邓杰;童孟军;胡文泽;林英杰;胡燚;;计算机时代(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112115140A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414416B (zh) | 数据处理方法、装置、设备和存储介质 | |
CN106982150B (zh) | 一种基于Hadoop的移动互联网用户行为分析方法 | |
CN110457178A (zh) | 一种基于日志采集分析的全链路监控告警方法 | |
CN112291724B (zh) | 一种5g信令可视化方法及装置 | |
CN107169069B (zh) | 分布式分级抽取多应用方法和数据抽取应用器 | |
CN111294235B (zh) | 数据处理方法、装置、网关及可读存储介质 | |
CN112100265A (zh) | 面向大数据架构与区块链的多源数据处理方法及装置 | |
CN104378234A (zh) | 跨数据中心的数据传输处理方法及系统 | |
CN103546343A (zh) | 网络流量分析系统的网络流量展示方法和系统 | |
CN110858192A (zh) | 一种日志查询方法和系统、日志排查系统和查询终端 | |
CN111127250B (zh) | 一种电力数据监控事件分析系统及方法 | |
CN103927314A (zh) | 一种数据批量处理的方法和装置 | |
CN111222547A (zh) | 一种面向移动应用的流量特征提取方法及系统 | |
WO2022216430A1 (en) | Distributed packet capture | |
CN103812688A (zh) | 一种告警确定方法及装置 | |
CN111176662B (zh) | 可在分布式与单体环境自由组装部署的架构实现方法及部署方法 | |
CN112817539A (zh) | 一种工业数据存储方法、系统、电子设备及存储介质 | |
CN113032379A (zh) | 面向配网运检多源数据采集的方法 | |
CN115733894A (zh) | 一种电力系统多协议数据接入管理方法、装置及设备 | |
CN114390033A (zh) | 基于可扩展通信协议的回路状态巡检仪采集系统及方法 | |
CN116974948B (zh) | 业务系统测试方法、系统、设备和介质 | |
CN112115140B (zh) | 一种通用的全文搜索引擎实时数据同步方法及装置 | |
CN112463527A (zh) | 一种数据处理方法、装置、设备、系统及存储介质 | |
CN112687267A (zh) | 一种物联网数据语义处理系统 | |
CN101771578B (zh) | 一种网络性能检测方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240227 Address after: 250000 Langchao Science Park, No. 1036, Langchao Road, high tech Zone, Jinan, Shandong Applicant after: Inspur Genersoft Co.,Ltd. Country or region after: China Address before: 250101 Inspur science and Technology Park, 1036 Inspur Road, hi tech Zone, Jinan City, Shandong Province Applicant before: SHANDONG INSPUR GENESOFT INFORMATION TECHNOLOGY Co.,Ltd. Country or region before: China |
|
GR01 | Patent grant | ||
GR01 | Patent grant |