CN101996246B - 即时索引方法及系统 - Google Patents

即时索引方法及系统 Download PDF

Info

Publication number
CN101996246B
CN101996246B CN2010105365174A CN201010536517A CN101996246B CN 101996246 B CN101996246 B CN 101996246B CN 2010105365174 A CN2010105365174 A CN 2010105365174A CN 201010536517 A CN201010536517 A CN 201010536517A CN 101996246 B CN101996246 B CN 101996246B
Authority
CN
China
Prior art keywords
information
time
index
storehouse
indexed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010105365174A
Other languages
English (en)
Other versions
CN101996246A (zh
Inventor
杨震
陈捷
夏艳
陈正文
俞惠华
沈利锷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN2010105365174A priority Critical patent/CN101996246B/zh
Publication of CN101996246A publication Critical patent/CN101996246A/zh
Application granted granted Critical
Publication of CN101996246B publication Critical patent/CN101996246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种即时索引方法,包括:在获取新的即时信息时,获取所述即时信息的时间要素;建立所述时间框序列处理流程,并在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;对所述待索引信息处理库中的即时信息进行时间要素标注,并分别对每个待索引信息处理库建立包括时间要素的索引;将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为搜索排序重要依据的索引调用。本发明还涉及一种即时索引系统。本发明对新获取的大量即时信息细分成多个信息处理单元,对即时信息进行时间要素的标注,并分别对各个信息处理单元中的即时信息建立索引,从而提供即时信息的快速索引和搜索功能。

Description

即时索引方法及系统
技术领域
本发明涉及搜索引擎应用技术,尤其涉及一种应用于搜索引擎的即时索引方法及系统。
背景技术
传统搜索引擎目前的实现机制主要是基于关键词匹配,相关度计算模型,网页重要性模型等进行搜索结果的排序。但是,信息产生的时间或信息的时间类属性往往对于信息的有效性有重要影响。
当信息源发生重大变化,产生大量信息的时候,如何在极短的时间内对这些大量信息进行索引,使这些信息被用户搜索到,则是一个需要解决的问题。例如,对于例如twitter一类的实时服务,则需要即时索引这些实时产生的信息,以便用户能够即时搜索到这些实时信息。
发明内容
本发明的目的是提出一种即时索引方法及系统,能够实现对新获取的大量信息进行快速索引,以支持新获取信息的搜索服务。
为实现上述目的,本发明提供了一种即时索引方法,包括:
在获取新的即时信息时,获取所述即时信息的时间要素;
建立时间框序列处理流程,并在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;
对所述待索引信息处理库中的即时信息进行时间要素标注,并分别对每个待索引信息处理库建立包括时间要素的索引;
将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为重要搜索排序依据的索引调用。
为实现上述目的,本发明提供了一种即时索引系统,包括:
信息获取单元,用于获取新的即时信息,同时获取所述即时信息的时间要素;
时间框序列建立单元,用于建立时间框序列处理流程;
信息处理库建立单元,用于在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;
时间要素标注单元,用于对所述待索引信息处理库中的即时信息进行时间要素标注;
索引建立单元,用于分别对每个待索引信息处理库建立包括时间要素的索引;
实时索引保存单元,用于将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为重要搜索排序依据的索引调用。
基于上述技术方案,本发明对新获取的大量即时信息采用定时和定长相结合的方式,细分成多个信息处理单元,对即时信息进行时间要素的标注,并分别对各个信息处理单元中的即时信息建立索引,从而提供即时信息的快速索引和搜索功能。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明即时索引方法的一实施例的流程示意图。
图2为本发明即时索引方法的另一实施例的流程示意图。
图3为本发明即时索引系统的一实施例的结构示意图。
图4为本发明即时索引系统的另一实施例的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
传统的搜索引擎的索引更新频率是衡量搜索引擎服务能力的重要指标。“更新”有多种解释:如加入新数据的索引,或是对同一个服务器的再次检查及索引等。不同的搜索引擎的更新频率从每天几次次到一周一次、再到一年一次而不同。由于Internet上的信息资源变化性非常大,所以一个更新频率高的引擎,能提供准确及时的信息服务,接近实时的反映网上资源的动态变化,在查询结果中的无效链接将大大减少,在未来的信息服务中也将越来越重要,及时获得有用信息将会是未来信息服务的核心之一。
更新的及时性能反映搜索引擎的服务性能。其中,如何对新的信息资源建立索引,并且如何能同时处理大量的信息,使新出现的信息能够最快速的被用户搜索到。这其中涉及到几个技术,一个是新建立的索引如何能够加入到正在服务的系统中被用调用,而同时不影响正在服务信息的功能和性能。第二,在数据更新量小的情况下,有些技术方案很容易实现。但当出现大量的信息,如何处理大量的信息,随时加入到搜索服务中,将是对技术开发的核心考验。第三,如何判别新加入的信息,是否与已有的索引信息相互重复,即排重技术,是信息服务客户体验的重要保证。使得最终呈现在用户面前的是及时的,可以以时间维度划分的,信息重复率很低的可供用户使用的信息。
因此本发明从索引的更新角度,和时间要素标准角度,时间要素在搜索中的使用角度来建立搜索引擎服务。
如图1所示,为本发明即时索引方法的一实施例的流程示意图。在本实施例中,即时索引方法的流程包括以下步骤:
步骤101、在获取新的即时信息时,获取所述即时信息的时间要素;
步骤102、建立所述时间框序列处理流程,并在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;
步骤103、对所述待索引信息处理库中的即时信息进行时间要素标注,并分别对每个待索引信息处理库建立包括时间要素的索引;
步骤104、将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为搜索排序依据的索引调用。
在本实施例中,在获取的即时信息的同时,也对即时信息的时间要素进行了获取,这里的即时信息可以为通过信息爬取系统(如网络蜘蛛)抓取的发生剧烈变化的大量的信息资源,也可以是一些即时类服务(例如twitter等)所产生的即时信息。通过对时间要素的获取快速建立索引,使即时消息能够被搜索到,同时也通过时间要素的标注,使得信息在搜索过程中,增加时间要素对结果排序的影响。
这里所提到的时间要素可以包括信息采集的频度、信息产生的时间和信息被用户搜索选择使用的时间及次数等,但不限于这里描述的几种。这几种时间要素均是在获取即时信息的同时获取的,但其中信息被用户搜索选择使用的时间会随着信息的使用量(例如被用户搜索点击)的增加而变化。
下面分别对几种时间要素的作用进行说明:
1、信息采集的频度
信息采集频度通常是由信息爬取系统(如网络蜘蛛等)控制的,但主要由整体的搜索策略决定。在初始阶段,通常是根据信息资源的更新时间、或是对某种信息资源的偏好决定的;当知道信息资源的更新时间时,爬取系统可以相应的设定信息爬取时间。当不知道信息资源的更新时间,则是根据信息资源的重要性分类,由系统设定,例如对重要的信息资源可以采取每小时爬取更新一次,不重要的信息资源半个月爬取更新一次。
在本发明的即时索引方法实施例中,可以采用索引建立完成时间控制爬取时间,即当索引系统处于空闲状态时,向信息爬取系统发出指令,爬取系统根据预先设定,按照信息的重要级别更新爬取信息。这样方式可以保证系统一直处于合理的进程之中,保证被抓取的信息都能被及时的索引、被搜索到,同时不会由于索引模块处理能力的问题,造成大量需要被索引的信息堆积,也不会造成不合理的抓取策略,抓取大量重复的信息,而这些重复信息不能被索引处理和搜索到。
信息采集频度的另一个作用是,给搜索结果排序提供必要的参数输入,信息源的重要程度是表现在信息采集频度上,而这个采集频度在做索引的时候,会加入到索引相关的参数里,在进行搜索结果排序时,考虑到采集频度所代表的信息源重要程度上,因此采集频度越高的信息资源不但表现在引擎会频繁的更新信息资源上,还表现在搜索结果的计算和排序上。这说明如果搜索结果计算上要用到信息采集频度所代表的信息资源重要性参数,就必须在索引中加入相关参数,并进行索引。
2、信息产生的时间
在本发明的即时索引方法实施例中,信息产生的时间将被应用到信息相关度计算中,主要是在排序过程中的计算。与信息更新频度类似,信息产生的时间只是在计算权重上有所不同,也是首先需要被索引到索引文件中,然后被搜索模块所调用进行计算。
3、信息被用户搜索选择使用的时间及次数
信息被用户选择使用,在本发明中可理解为通常意义的用户点击操作,代表一个关键词按照一定搜索算法所计算的搜索结果中,不同信息条目被用户选择使用的差异性,通过大规模的用户使用,可以分辨出这些信息对于这个关键词的相关程度。根据用户点击的不同,反作用于信息的排序。产生的效果是,当用户输入一个关键词,搜索结果排序将会随着时间的不同而存在细微的差异。那些经常被用户点击选择的信息随着用户的使用,排名可能会逐渐靠前。
这里所说的这三个时间要素,作用基本是在搜索排序中被使用,在索引时需要被建立到索引中。
在获得了大量的即时信息后,需要对这些数量庞大的即时消息进行处理,使这些信息能够被索引到,进而被快速搜索到。
在时间框序列处理流程中,需要建立若干个信息处理库。目的是应对大量信息的及时索引和搜索。如果同时由几千万或是上亿的信息需要索引和搜索时,是不可能在一个信息库完成的,需要采用定长处理,把传统的串行处理转化成多个、小的、可控的并行处理过程。
这种方式首先可以通过处理流程和处理流程内信息处理库的扩展,来实现大量的信息的处理,进一步的可根据需要处理的信息量自动扩展处理流程的个数,实现大量的信息的同时并行处理。
在建立待索引信息处理库时,可以选择定长与定时相结合的维度来建立信息处理库。其中,当即时信息的信息量超过预设阈值时,在即时信息的时间框序列处理流程中建立定长模式的多个待索引信息处理库,定长模式为每个时序处理框中支持预设数量的待索引信息处理库。举例来说,如果每个时间框序列处理流程最大支持100个信息处理库,而每个信息处理库最大支持1万条信息处理时,如果出现了1千万的信息需要处理,则要为该即时信息分配10个时间框序列处理流程来处理。
当即时信息的信息量未超过预设阈值,在即时信息的时间框序列处理流程中建立定时模式的多个待索引信息处理库,定时模式为每隔预设时间启动一个时序处理框。举例来说,如果每小时只有10万条信息需要处理,则可以每个小时启动一个时间框序列处理流程来处理信息。启动时序处理框的具体需求可以根据系统服务的具体目标设定,如服务的信息即时性非常强,那么也可以每5分钟或是每一分钟地启动时序处理框,来完成所需任务。
通过以上两种模式,可以对某一时刻的不同数量级别的信息处理进行模式选择。当某一时刻有大量信息需要处理时,可以以定长模式为主建立多个时间框序列处理流程,而每个时间框序列处理流程其中包含多个独立的信息处理库,分别对这些处理信息库进行时间要素的标注和索引建立操作。而当产生的信息不多时,则以定时为主,建立时间框序列处理流程,在时间框序列处理流程中包含若干个独立的信息处理库。
这种定长和定时模式的选择可以很好的适应网络中信息的不均匀性,如果只采用某一种模式,例如只依靠定时处理,如每5分钟截取这期间产生的信息,则会由于信息分布的不均匀,造成不同5分钟内需要处理的信息量不同,造成需要被处理的信息排队。可能后5分钟较少的信息处理完成,而前一个5分钟较多的信息还没处理完。
前文提到的信息处理库即待索引信息处理库,在进行时间要素标注后,每个待索引信息处理库分别独立地进行索引的建立,而建立的索引中包括了时间要素。这些索引好的即时信息被存入针对实时搜索的实时索引库,此时并不与索引数据库中的索引合并,而是直接为用户提供快速索引和搜索功能。这里的索引包括多级索引,首先是对每个时间框序列处理流程中各个待索引信息处理库的即时信息进行索引,之后对时间框序列处理流程所管理的每个待索引信息处理库建立索引,就是所说的二级索引。可选的,在信息量较大,且没有进行索引合并的情况下,搜索引擎系统的总控制单元还可以对各个时间框序列处理流程建立索引,即三级索引。
如图2所示,为本发明即时索引方法的另一实施例的流程示意图。与上一实施例相比,本实施例在步骤104之后,还包括:
步骤105、将实时索引库中的索引与索引数据库中的索引进行合并,统一存放到所述索引数据库中。
在时间框序列处理流程完成之后,可以在每日的固定时刻,或者在系统访问较低、负担较小的时候,将实时索引库中的索引与索引数据库中的搜索用的正常索引合并,同时移除实时索引库中的索引,释放实时索引库的资源空间,以存放新的即时信息的索引。
用户在信息搜索过程中,为了避免新信息与旧信息之间的重复,还包括排重的步骤,即可针对互联网信息资源,考察信息的链接地址,如地址一致则进行排重处理,展现时间要素权重最大的信息,也可以针对数据库内部的信息,如企业内部信息,则采用三重计算规则进行排重,参数为名称、地址、电话。名称、地址、电话相同的完全排重,只展现时间要素权重最大的信息。如果名称相同,地址、电话有任意一个不同的,则做展现排重,即只展现时间要素权重最大的,其余的隐藏在展现信息之下。在实现上,还可以考虑名称权重,如果名称权重最大的,则展现名称权重大的信息。在实际应用中,可以根据具体需求,选择不同的排重要素来建立排重规则。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图3所示,为本发明即时索引系统的一实施例的结构示意图。在本实施例中,即时索引系统包括:信息获取单元1、时间框序列建立单元2、信息处理库建立单元3、时间要素标注单元4、索引建立单元5和实时索引保存单元6。
信息获取单元1负责获取新的即时信息,同时获取所述即时信息的时间要素。时间框序列建立单元2负责建立所述时间框序列处理流程,并在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库。信息处理库建立单元3负责在所述即时信息的时间框序列处理流程中具体建立多个待索引信息处理库4。时间要素标注单元5负责对所述待索引信息处理库中4的即时信息进行时间要素标注。索引建立单元6负责分别对每个待索引信息处理库4建立包括时间要素的索引。实时索引保存单元7负责将索引好的即时信息存入针对实时搜索的实时索引库8,以提供时间要素作为搜索排序依据的索引调用。
搜索单元9可以直接访问实时索引库8来获取快速索引的实时信息。在信息获取单元1获取的即时信息的时间要素可以包括:信息采集的频度、信息产生的时间和信息被用户搜索选择使用的时间及次数等。
在另一实施例中,时间框序列建立单元可具体包括:
定长模式建立模块,用于在所述即时信息的信息量超过预设阈值时,在即时信息的时间框序列处理流程中建立定长模式的多个待索引信息处理库,所述定长模式为每个时序处理框中支持预设数量的待索引信息处理库;
定时模式建立模块,用于当所述即时信息的信息量未超过预设阈值,在即时信息的时间框序列处理流程中建立定时模式的多个待索引信息处理库,所述定时模式为每隔预设时间启动一个时序处理框。
如图4所示,为本发明即时索引系统的另一实施例的结构示意图。与上一实施例相比,本实施例还包括索引合并单元10,该单元在实时索引保存单元7将索引好的即时信息存入针对实时搜索的实时索引库8之后,将实时索引库8中的索引与索引数据库11中的索引进行合并,统一存放到索引数据库11中。
通过上述的多个实施例的描述,可以看出本发明的即时索引方法可以对建立的多个待索引信息处理库进行独立快速索引,并将索引好的信息提供给搜索模块进行即时调用。而在时间框序列处理流程结束的时候,这些索引被合并到正常的索引中供基础搜索调用。系统支持把时间要素进行信息重要性标注,支持大量信息的即时索引和搜索。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (9)

1.一种即时索引方法,包括:
在获取新的即时信息时,获取所述即时信息的时间要素;
建立时间框序列处理流程,并在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;
对所述待索引信息处理库中的即时信息进行时间要素标注,并分别对每个待索引信息处理库建立包括时间要素的索引;
将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为重要搜索排序依据的索引调用。
2.根据权利要求1所述的即时索引方法,其中所述时间要素包括:信息采集的频度、信息产生的时间和信息被用户搜索选择使用的时间及次数。
3.根据权利要求2所述的即时索引方法,其中所述在即时信息的时间框序列处理流程中建立多个待索引信息处理库的操作具体为:
当所述即时信息的信息量超过预设阈值时,在即时信息的时间框序列处理流程中建立定长模式的多个待索引信息处理库,所述定长模式为每个时序处理框中支持预设数量的待索引信息处理库;
当所述即时信息的信息量未超过预设阈值,在即时信息的时间框序列处理流程中建立定时模式的多个待索引信息处理库,所述定时模式为每隔预设时间启动一个时序处理框。
4.根据权利要求2所述的即时索引方法,其中所述分别对每个待索引信息处理库建立包括时间要素的索引的操作具体为:
采用并行方式分别对每个待索引信息处理库建立包括时间要素的索引。
5.根据权利要求2所述的即时索引方法,其中在将索引好的即时信息存入针对实时搜索的实时索引库之后,还包括:
将所述实时索引库中的索引与索引数据库中的索引进行合并,统一存放到所述索引数据库中。
6.一种即时索引系统,包括:
信息获取单元,用于获取新的即时信息,同时获取所述即时信息的时间要素;
时间框序列建立单元,用于建立时间框序列处理流程;
信息处理库建立单元,用于在所述即时信息的时间框序列处理流程中建立多个待索引信息处理库;
时间要素标注单元,用于对所述待索引信息处理库中的即时信息进行时间要素标注;
索引建立单元,用于分别对每个待索引信息处理库建立包括时间要素的索引;
实时索引保存单元,用于将索引好的即时信息存入针对实时搜索的实时索引库,以提供时间要素作为重要搜索排序依据的索引调用。
7.根据权利要求6所述的即时索引系统,其中所述时间要素包括:信息采集的频度、信息产生的时间和信息被用户搜索选择使用的时间及次数。
8.根据权利要求7所述的即时索引系统,其中所述信息处理库建立单元具体包括:
定长模式建立模块,用于在所述即时信息的信息量超过预设阈值时,在即时信息的时间框序列处理流程中建立定长模式的多个待索引信息处理库,所述定长模式为每个时序处理框中支持预设数量的待索引信息处理库;
定时模式建立模块,用于当所述即时信息的信息量未超过预设阈值,在即时信息的时间框序列处理流程中建立定时模式的多个待索引信息处理库,所述定时模式为每隔预设时间启动一个时序处理框。
9.根据权利要求7所述的即时索引系统,其中还包括:
索引合并单元,用于在将索引好的即时信息存入针对实时搜索的实时索引库之后,将所述实时索引库中的索引与索引数据库中的索引进行合并,统一存放到所述索引数据库中。
CN2010105365174A 2010-11-09 2010-11-09 即时索引方法及系统 Active CN101996246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105365174A CN101996246B (zh) 2010-11-09 2010-11-09 即时索引方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105365174A CN101996246B (zh) 2010-11-09 2010-11-09 即时索引方法及系统

Publications (2)

Publication Number Publication Date
CN101996246A CN101996246A (zh) 2011-03-30
CN101996246B true CN101996246B (zh) 2012-11-14

Family

ID=43786400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105365174A Active CN101996246B (zh) 2010-11-09 2010-11-09 即时索引方法及系统

Country Status (1)

Country Link
CN (1) CN101996246B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528367B (zh) * 2014-09-30 2019-06-14 华东师范大学 基于开源大数据对时间敏感数据的存储和近实时查询方法
CN108804477A (zh) * 2017-05-05 2018-11-13 广东神马搜索科技有限公司 动态截断方法、装置及服务器
CN107766452B (zh) * 2017-09-26 2021-07-06 广西电网有限责任公司电力科学研究院 一种适合电力调度数据高速存取的索引系统及其索引方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
WO2006121576A2 (en) * 2005-05-06 2006-11-16 Motorola, Inc. Method and product for searching metadata based on user preferences
CN1877583A (zh) * 2006-07-12 2006-12-13 百度在线网络技术(北京)有限公司 访问标识索引系统及访问标识索引库生成方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006121576A2 (en) * 2005-05-06 2006-11-16 Motorola, Inc. Method and product for searching metadata based on user preferences
CN1858733A (zh) * 2005-11-01 2006-11-08 华为技术有限公司 信息检索系统和检索方法
CN1877583A (zh) * 2006-07-12 2006-12-13 百度在线网络技术(北京)有限公司 访问标识索引系统及访问标识索引库生成方法

Also Published As

Publication number Publication date
CN101996246A (zh) 2011-03-30

Similar Documents

Publication Publication Date Title
CN102521406B (zh) 海量结构化数据复杂查询任务的分布式查询方法和系统
CN102521405B (zh) 支持高速加载的海量结构化数据存储、查询方法和系统
CN110489445B (zh) 一种基于多形态复合的海量数据快速查询方法
CN105528367B (zh) 基于开源大数据对时间敏感数据的存储和近实时查询方法
CN103473260B (zh) 一种面向并发olap的测试数据分层聚簇查询处理系统及方法
Santos et al. Real-time data warehouse loading methodology
JP4856627B2 (ja) 部分的クエリーキャッシング
CN103559300B (zh) 数据的查询方法和查询装置
CN103970902B (zh) 一种大量数据情况下的可靠即时检索方法及系统
CN110046183A (zh) 一种时序数据聚合检索方法、设备及介质
CN103631922B (zh) 基于Hadoop集群的大规模Web信息提取方法及系统
CN104408159B (zh) 一种数据关联、加载、查询方法及装置
CN106777351A (zh) 基于art树分布式系统图存储计算系统及其方法
JP2004518226A (ja) データベースシステムおよびクエリオプティマイザ
CN107943952A (zh) 一种基于Spark框架进行全文检索的实现方法
CN102436494A (zh) 基于实践检验的执行计划优化的装置及方法
CN104035925B (zh) 数据存储方法、装置和存储系统
CN107783985A (zh) 一种分布式数据库查询方法、装置及管理系统
CN109408493A (zh) 一种数据源的迁移方法及系统
CN110147372A (zh) 一种面向htap的分布式数据库智能混合存储方法
CN101093482A (zh) 一种大量信息存储和检索的方法
CN101996246B (zh) 即时索引方法及系统
CN106484694B (zh) 基于分布式数据库的全文搜索方法及系统
CN114329096A (zh) 一种原生图数据库处理方法及系统
CN112232672A (zh) 一种工业机理模型的管理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant