CN101667183A - 一种基于定制的索引建立方法、装置和系统 - Google Patents

一种基于定制的索引建立方法、装置和系统 Download PDF

Info

Publication number
CN101667183A
CN101667183A CN200810214333A CN200810214333A CN101667183A CN 101667183 A CN101667183 A CN 101667183A CN 200810214333 A CN200810214333 A CN 200810214333A CN 200810214333 A CN200810214333 A CN 200810214333A CN 101667183 A CN101667183 A CN 101667183A
Authority
CN
China
Prior art keywords
information
index
field
server
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810214333A
Other languages
English (en)
Other versions
CN101667183B (zh
Inventor
郑小林
唐炜
方勇
陈德人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou wiscom Tower Technology Co. Ltd.
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2008102143339A priority Critical patent/CN101667183B/zh
Publication of CN101667183A publication Critical patent/CN101667183A/zh
Application granted granted Critical
Publication of CN101667183B publication Critical patent/CN101667183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种基于定制的索引建立方法、装置和系统,通过在建立索引过程中增加针对域信息结构的定制以及从不同数据库结构到同一个域结构的映射信息的定制,利用所述定制的映射信息对读取到的数据进行封装,并根据域结构信息将封装后的数据写入到索引服务器后建立索引,从而实现了在不影响检索系统安全性和效率的前提下,增加了检索系统的通用性和适用范围,实现了索引过程中的高度可定制化。

Description

一种基于定制的索引建立方法、装置和系统
技术领域
本发明涉及信息检索技术领域,尤其涉及一种基于定制的索引建立方法、装置和系统。
背景技术
目前,随着网络的发展,越来越多的信息检索系统已经成熟应用于互联网、电子商务等领域中,信息检索系统通常采用搜索引擎流行的倒排索引的检索结构,以服务的方式嵌入到现代服务行业的站点中去,作为站内搜索的有利工具。但是,随着站点业务流程越来越复杂,数据的积累越来越多,对信息检索的高效率要求也就越来越迫切了;其中,要求较高的应用领域主要包括:图书馆数据库、情报数据库、专利数据库、医药数据库、办公自动化、历史资料库、电子出版系统等等。
然而,不同服务行业间的信息检索的数据结构存在着很大的不同,而从不同行业的不同数据库的海量数据中检索到的数据也是有着千差万别的,如果检索服务从一个行业移到另外一个行业,甚至从一个数据库到另外一个数据库,就需要很大的人力来配置和重新开发部署,这就容易造成冗余的成本开销,且不利于服务行业信息检索越来越复杂的需求。
此外,目前的信息检索系统普遍缺乏可定制性;系统的各种域结构以及面向的需要建立索引的数据结构往往固化在整个系统中,整个系统只能针对某一个领域中的某一种特定的数据结构建立索引,使得系统缺乏灵活性;例如新闻域,当用户搜索新闻的时候,往往搜索的是新闻标题、发布时间或者内容,而对于单一的检索系统,系统在设计时将新闻域的各种信息固化在新闻检索系统中;而当用户需要进行人才信息检索的时候,搜索的关键词语可能是人的名字、受教育程度等,这就需要对与新闻完全不同的域结构进行检索,而在传统的将各种域结构固化在系统中的检索系统来讲,显然是不可行的;同时,对于设置好的各种域结构信息,其所对应的同类型数据库定义也千差万别,例如两个完全不同的新闻数据库A和B,A数据库中的新闻信息的表结构以及字段名称与B数据库中的新闻信息的表结构以及字段名称完全不同,在A数据库中以news_title字段代表新闻的标题,而在B数据库中以title字段代表新闻的标题;虽然这两个字段的名称不一样,但是其实质内容毫无差别,均表示新闻标题。
因此,对传统的检索系统来讲,由于其所面向的建立索引的数据结构往往也是固化在系统中的,因此在对这两个不同结构的数据库在同一个域结构上建立索引的过程中,往往需要针对各自不同的数据结构进行重新的系统开发,而重新开发的系统往往具有很多雷同的逻辑操作,例如读取数据库、建立新闻索引等,这就容易造成资源的大量浪费。
发明内容
有鉴于此,本发明解决的问题是提供一种基于定制的索引建立方法、装置和系统,增加了检索系统的通用性和适用范围,实现了索引过程中的高度可定制化。
为解决上述问题,本发明提供的技术方案如下:
一种基于定制的索引建立方法,包括:
接收索引建立请求;
根据所述请求从数据库服务器中读取指定的数据;
根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
利用所述映射信息对读取到的数据进行封装,并根据读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
优选的,所述索引建立请求至少包括各数据库服务器的链接信息和数据库中的定制文件名称。
优选的,根据所述索引建立请求中的数据库服务器的链接信息从各数据库服务器中读取指定的数据;
根据所述索引建立请求中包含的定制文件名称从定制信息服务器中读取所述用户定制数据的域结构信息和所述数据库与该域结构的映射信息。
优选的,所述域结构信息至少包括域名称、域描述、关键词名称链表、标题名称链表、内容字段链表以及字段信息。
优选的,所述字段信息至少包括字段名称、字段描述、字的类型、字段的存储方式以及索引方式。
优选的,该方法还包括:
在定制信息服务器中执行域结构信息的定制操作;所述定制操作至少包括删除、修改和新建。
优选的,所述新建域结构信息具体包括:
设置域的基本结构信息;
建立主键字段并设置主键字段的默认属性;
建立域字段并设置域字段的索引属性和域属性;
将包含新建基本结构和字段信息的域结构信息存储到定制信息服务器。
优选的,所述映射信息的数据结构至少包括标志ID和域名称;
所述映射信息的属性至少包括源数据结构字段、域结构信息字段和源数据结构的主键字段。
优选的,该方法还包括:对定制信息服务器中保存的映射信息进行定制操作;所述定制操作具体包括:
从数据源读取源数据结构;
从定制信息服务器中读取域相应的域结构信息;
指定映射文件的名称;
将源数据结构映射到域结构中;
将映射信息保存到定制信息服务器。
一种基于定制的索引建立装置,包括:接收单元、读取单元和封装单元;其中,所述接收单元用于接收索引建立请求;
所述读取单元用于根据所述请求从数据库服务器中读取指定的数据、根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
所述封装单元用于利用所述读取单元读取的映射信息对读取到的数据进行封装,并根据所述读取单元读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
优选的,所述接收单元接收到的索引建立请求至少包括各数据库服务器的链接信息和数据库中的定制文件名称。
优选的,该装置还包括:用于在定制信息服务器中新建域结构信息的新建单元和对定制信息服务器中保存的映射信息进行定制操作的定制单元。
优选的,所述新建单元包括:设置单元、建立单元和第一写入单元;其中,所述设置单元用于设置域的基本结构信息;
所述建立单元用于建立主键字段并设置主键字段的默认属性、建立域字段并设置域字段的索引属性和域属性;
所述写入单元用于将包含新建基本结构和字段信息的域结构信息写入到定制信息服务器。
优选的,所述订制单元包括:第一处理单元、第二处理单元和第二写入单元;其中,
所述第一处理单元用于从数据源读取源数据结构、从定制信息服务器中读取域相应的域结构信息;
所述第二处理单元用于指定映射文件的名称,并将源数据结构映射到域结构中;
所述第二写入单元用于将映射信息写入并保存到定制信息服务器。
一种基于定制的索引建立系统,包括如上述任意一项所述的装置、定制信息服务器、数据库服务器和索引服务器。
可以看出,采用本发明的方法、装置和系统,在索引建立时,通过对每个源数据与域结构信息进行灵活的映射,实现了从不同的数据源到同一个域中建立索引,以保证系统能对各种不同格式的源数据进行正确的索引操作;且通过域结构信息和映射信息的可定制,提高了在不同的域之间以及不同的源数据格式之间建立索引时的工作效率,节省了大量的人力和时间资源;并通过新建域结构信息或编辑已有的域结构信息,从而能够以自定义定制的方式对不同的源数据格式进行灵活地映射,避免了部署开发过程中的重复步骤,在不影响系统效率和性能的情况下,能够实现灵活的跨行业、跨数据库类型的数据索引的建立。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1的方法流程示意图;
图2是本发明实施例2的新建域结构信息的流程示意图;
图3是本发明实施例中源数据到域结构信息的映射结构示意图;
图4是本发明实施例3的映射信息的定制流程示意图;
图5是本发明实施例4的装置结构示意图;
图6是本发明实施例5的系统结构示意图。
具体实施方式
本发明的基本思想在于通过索引数据结构与检索系统的分离以及数据库数据结构与索引数据的映射,实现了索引数据结构设置与建立索引的耦合;通过对需要建立索引的数据进行动态设置,再将特定的数据库表映射到已经设置的索引数据结构中,即可极大的提高检索系统在不同行业的灵活性。本发明提出在建立索引过程中增加针对域信息结构的定制以及从不同数据库结构到同一个域结构的映射信息的定制,在不影响检索系统安全性和效率的前提下,增加了检索系统的通用性和适用范围,实现了索引过程中的高度可定制化。
信息检索中可定制的包括域信息以及从数据库到索引域信息的映射。域信息指的是信息结构相同或者相似的一类信息的结合,比如所有的新闻信息组成新闻域,所有招商信息组成的招商域。用户定制就要实现可以根据需要方便地进行域信息的增加、查看和删除等定制;映射信息指的是用户将自己已有的数据库字段和域中的字段进行映射,以便对这些数据库内的数据建立索引并进行检索,映射信息的配置包括映射信息的增加和删除等定制操作,在映射定制的基础上进行信息检索索引的建立。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1提供了一种基于定制的索引建立方法,如图1所示,该方法包括:
步骤101:接收索引建立请求;
具体的,首先由具有访问内部网络权限的用户发送索引建立请求,当然也可以在内部网络中输入各种命令来请求建立索引,以使得后续通过读取数据库中的数据和定制信息来完成索引建立;其中,所述请求中包含索引操作类型、域名称、各数据库服务器的链接信息和数据库中的定制文件名称,本发明实施例中的定制文件名称即为定制数据对应的域结构信息以及所述数据库与该域结构的映射信息;
需要注意的是,本发明实施例的索引建立过程中的各个节点通过内部网络相连,因此要求内部网络必须保证安全性,以免造成数据的破坏或者侵入;
步骤102:根据所述请求从数据库服务器中读取指定的数据;
接收到所述索引建立请求后,根据该请求中的数据库服务器的链接信息从各数据库服务器中读取指定的数据;
步骤103:根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
根据所述索引建立请求中包含的定制文件名称从定制信息服务器中读取所述用户定制数据的域结构信息,并根据所述索引建立请求中包含的数据库与域结构的映射信息从定制信息服务器中读取用户定制数据所在的数据库与该域结构的映射信息;
其中,所述的定制信息服务器存放着各种定制信息,包括域结构信息以及不同数据库中的数据结构与域结构的映射信息;具体的,
第一、域结构信息指的是信息结构相同或者相似的一类信息的结合,比如所有的新闻信息组成新闻域、所有招商信息组成的招商域等;其具体包括域名称、域描述、关键词名称链表、标题名称链表、内容字段链表以及若干个字段信息,其中字段信息包括字段名称、字段描述、字的类型、字段的存储方式以及索引方式:其中,
域名称为域在索引中的名称,比如news;域描述为该域的描述信息,例如news的描述信息为新闻域;关键词名称链表为用户关键词检索在该域中的字段链表,例如news域中有ID(主键)、title(标题)、content(内容)以及time(发布时间)字段等,一般用户进行关键词检索时希望在title以及content字段进行检索,所以关键词名称链表至少包括title和content;标题名称链表为标题项显示的字段名称,一般用户的检索结果在进行概要显示时分为标题项和内容项,以新闻内容为例,title为标题项,所以title也位于标题字段链表中;内容字段链表表示除标题字段以外的所有字段组成的字段链表,用于标识上述在内容项显示的字段的名称;
而域中的若干个字段信息的结构如下所示:
字段名称:字段在索引中的名称;
字段描述:字段在索引中的描述;
字段类型:字段在索引中的类型,主要有string、int、float以及date等;
存储方式:表示字段的内容在索引中的存储方式,例如,yes表示以原数据的方式进行存储、compress表示以压缩数据的方式存储(主要针对大量数据,例如文章内容等)、no表示对数据不进行存储(但是仍然可以用于进行检索,只是显示时为null);
索引方式:表示字段的索引方式,例如,tokenized表示将该字段的数据进行分词并索引、un_tokenized表示将该字段的原始数据直接进行索引、no_norms表示对原始数据直接进行索引并且关闭存储过程中的规范化。
此外,还可以对定制信息服务器中保存的域结构信息进行定制操作,主要包括域结构信息的新建、删除和修改以及域中字段信息的增加、删除和修改等;下面以域结构信息的新建为例进行简要说明,如本发明实施例2、图2所示,域结构信息的新建流程主要包括:
S201:设置域的基本结构信息,例如域名称、域描述等;
S202:建立主键字段并设置主键字段的默认属性,如名称、类型、存储方式、索引方式等;
S203:建立域字段并设置域字段的索引属性(如名称、类型、存储方式、索引方式)和域属性(是否关键词选项、是否标题显示等属性);
S204:将包含新建基本结构和字段信息的域结构信息存储到定制信息服务器,其中,该新建域结构信息主要是以xml的格式存储,但并不局限于此;
通过上述步骤,用户即可根据需要方便地进行域结构信息的增加;而其他诸如域结构信息的查看、修改和删除等操作,与上述流程类同,本文不再赘述。
第二、映射信息是指从一定格式的源数据到需要建立索引的域结构的映射,其中源数据包括数据库中的数据以及一定格式的xml数据;由于有多种格式完全不同的源数据映射到同一个域结构信息中,所以每种不同格式的源数据都有其本身特定的映射信息;从源数据到域结构信息的映射结构如图3所示;其中,映射信息的数据结构包括:
标志ID:映射信息的标志,为源数据信息的身份标志,表明该映射信息从属于指定的源数据,具有唯一性;
域名称:表明映射信息所指向的域结构信息;
此外,每个映射信息包含三个属性:
1)、源数据结构字段:源数据结构中需要进行映射的字段名称;
2)、域结构信息字段:域结构信息字段中需要进行映射的字段名称;源数据结构字段与域结构信息字段可进行多对一或者一对一映射,即若干个源数据字段可以映射到同一个域结构信息字段;
3)、源数据结构的主键字段:通过对该字段进行修改来修改或者删除索引数据中作为唯一标识的数据标志;
需要注意的是,还可以对定制信息服务器中保存的映射信息进行定制操作,如本发明实施例3、图4所示,映射信息的定制流程主要包括:
S401:从数据源读取源数据结构;其中,所述的数据源包括数据库数据和以XML及其他格式存储的数据,具体格式本文不再赘述;
S402:从定制信息服务器中读取域相应的域结构信息;
S403:指定映射文件的名称;
S404:将源数据结构映射到域结构中;
S405:将映射信息保存到定制信息服务器。
通过上述步骤用户即可根据需要将已有的源数据字段和域中的字段进行映射信息的配置,以方便为所述数据库内的数据建立索引并进行检索;而相应的,其他映射信息的配置操作,如修改和删除等,介于上述方式类同,本文不再赘述。
步骤104:利用所述映射信息对读取到的数据进行封装,并根据读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
其中,所述的索引服务器用来为数据库中的数据建立索引后存放索引文件数据。
可以看出,采用本发明实施例的方法,在索引建立时,通过对每个源数据与域结构信息进行灵活的映射,实现了从不同的数据源到同一个域中建立索引,以保证系统能对各种不同格式的源数据进行正确的索引操作;且通过域结构信息和映射信息的可定制,提高了在不同的域之间以及不同的源数据格式之间建立索引时的工作效率,节省了大量的人力和时间资源;并通过新建域结构信息或编辑已有的域结构信息,从而能够以自定义定制的方式对不同的源数据格式进行灵活地映射,避免了部署开发过程中的重复步骤,在不影响系统效率和性能的情况下,能够实现灵活的跨行业、跨数据库类型的数据索引的建立。
基于上述思想,本发明实施例4又提出了一种基于定制的索引建立装置,如图5所示,该装置500包括:接收单元510、读取单元520和封装单元530;其中,所述接收单元510用于接收索引建立请求;
所述读取单元520用于根据所述请求从数据库服务器中读取指定的数据、根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
所述封装单元530用于利用所述读取单元读取的映射信息对读取到的数据进行封装,并根据所述读取单元读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
其中,所述接收单元接收到的索引建立请求至少包括各数据库服务器的链接信息和数据库中的定制文件名称。
此外,该装置还包括:用于在定制信息服务器中新建域结构信息的新建单元和对定制信息服务器中保存的映射信息进行定制操作的定制单元。
优选的,所述新建单元包括:设置单元、建立单元和第一写入单元;其中,所述设置单元用于设置域的基本结构信息;
所述建立单元用于建立主键字段并设置主键字段的默认属性、建立域字段并设置域字段的索引属性和域属性;
所述写入单元用于将包含新建基本结构和字段信息的域结构信息写入到定制信息服务器。
优选的,所述订制单元包括:第一处理单元、第二处理单元和第二写入单元;其中,
所述第一处理单元用于从数据源读取源数据结构、从定制信息服务器中读取域相应的域结构信息;
所述第二处理单元用于指定映射文件的名称,并将源数据结构映射到域结构中;
所述第二写入单元用于将映射信息写入并保存到定制信息服务器。
除此之外,本发明实施例5还提供了一种基于定制的索引建立系统,如图6所示,该系统包括如上所述的索引建立装置500、定制信息服务器610、数据库服务器620和索引服务器630;其中,
所述定制信息服务器610用于存放各种定制信息,包括域结构信息以及不同数据库中的数据结构与域结构的映射信息;
所述数据库服务器620用于存储各种数据及其相应的数据结构;
所述索引服务器630用于存放索引文件数据;
采用该系统,可以由定制服务器提供定制向导,引导用户建立域信息,添加、编辑或删除索引域,为建立索引做好可定制的准备工作;并且定制需要建立索引的数据表,使数据表映射到索引域,以在分布式索引服务器上建立索引。
专业人员还可以进一步应能意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。

Claims (15)

1、一种基于定制的索引建立方法,其特征在于,包括:
接收索引建立请求;
根据所述请求从数据库服务器中读取指定的数据;
根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
利用所述映射信息对读取到的数据进行封装,并根据读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
2、根据权利要求1所述的方法,其特征在于:
所述索引建立请求至少包括各数据库服务器的链接信息和数据库中的定制文件名称。
3、根据权利要求2所述的方法,其特征在于:
根据所述索引建立请求中的数据库服务器的链接信息从各数据库服务器中读取指定的数据;
根据所述索引建立请求中包含的定制文件名称从定制信息服务器中读取所述用户定制数据的域结构信息和所述数据库与该域结构的映射信息。
4、根据权利要求1所述的方法,其特征在于:
所述域结构信息至少包括域名称、域描述、关键词名称链表、标题名称链表、内容字段链表以及字段信息。
5、根据权利要求4所述的方法,其特征在于:
所述字段信息至少包括字段名称、字段描述、字的类型、字段的存储方式以及索引方式。
6、根据权利要求5所述的方法,其特征在于,该方法还包括:
在定制信息服务器中执行域结构信息的定制操作;所述定制操作至少包括删除、修改和新建。
7、根据权利要求6所述的方法,其特征在于,所述新建域结构信息具体包括:
设置域的基本结构信息;
建立主键字段并设置主键字段的默认属性;
建立域字段并设置域字段的索引属性和域属性;
将包含新建基本结构和字段信息的域结构信息存储到定制信息服务器。
8、根据权利要求1所述的方法,其特征在于:
所述映射信息的数据结构至少包括标志ID和域名称;
所述映射信息的属性至少包括源数据结构字段、域结构信息字段和源数据结构的主键字段。
9、根据权利要求8所述的方法,其特征在于,该方法还包括:对定制信息服务器中保存的映射信息进行定制操作;所述定制操作具体包括:
从数据源读取源数据结构;
从定制信息服务器中读取域相应的域结构信息;
指定映射文件的名称;
将源数据结构映射到域结构中;
将映射信息保存到定制信息服务器。
10、一种基于定制的索引建立装置,其特征在于,包括:接收单元、读取单元和封装单元;其中,
所述接收单元用于接收索引建立请求;
所述读取单元用于根据所述请求从数据库服务器中读取指定的数据、根据所述请求从定制信息服务器中读取所述用户定制数据的域结构信息以及所述数据库与该域结构的映射信息;
所述封装单元用于利用所述读取单元读取的映射信息对读取到的数据进行封装,并根据所述读取单元读取到的域结构信息将封装后的数据写入到索引服务器后建立索引。
11、根据权利要求10所述的装置,其特征在于:
所述接收单元接收到的索引建立请求至少包括各数据库服务器的链接信息和数据库中的定制文件名称。
12、根据权利要求10所述的装置,其特征在于,该装置还包括:用于在定制信息服务器中新建域结构信息的新建单元和对定制信息服务器中保存的映射信息进行定制操作的定制单元。
13、根据权利要求12所述的装置,其特征在于,所述新建单元包括:设置单元、建立单元和第一写入单元;其中,
所述设置单元用于设置域的基本结构信息;
所述建立单元用于建立主键字段并设置主键字段的默认属性、建立域字段并设置域字段的索引属性和域属性;
所述写入单元用于将包含新建基本结构和字段信息的域结构信息写入到定制信息服务器。
14、根据权利要求12所述的系统,其特征在于,所述定制单元包括:第一处理单元、第二处理单元和第二写入单元;其中,
所述第一处理单元用于从数据源读取源数据结构、从定制信息服务器中读取域相应的域结构信息;
所述第二处理单元用于指定映射文件的名称,并将源数据结构映射到域结构中;
所述第二写入单元用于将映射信息写入并保存到定制信息服务器。
15、一种基于定制的索引建立系统,其特征在于,包括如权利要求10至14任意一项所述的装置、定制信息服务器、数据库服务器和索引服务器。
CN2008102143339A 2008-09-02 2008-09-02 一种基于定制的索引建立方法、装置和系统 Active CN101667183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102143339A CN101667183B (zh) 2008-09-02 2008-09-02 一种基于定制的索引建立方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102143339A CN101667183B (zh) 2008-09-02 2008-09-02 一种基于定制的索引建立方法、装置和系统

Publications (2)

Publication Number Publication Date
CN101667183A true CN101667183A (zh) 2010-03-10
CN101667183B CN101667183B (zh) 2011-12-21

Family

ID=41803800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102143339A Active CN101667183B (zh) 2008-09-02 2008-09-02 一种基于定制的索引建立方法、装置和系统

Country Status (1)

Country Link
CN (1) CN101667183B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104267952A (zh) * 2014-09-25 2015-01-07 山东康威通信技术股份有限公司 一种基于结构化存储的文件打包方法
CN106775742A (zh) * 2016-12-27 2017-05-31 中国建设银行股份有限公司 一种用户定制信息的扩展方法及系统
CN107016019A (zh) * 2015-10-23 2017-08-04 阿里巴巴集团控股有限公司 数据库索引创建方法及装置
CN107463618A (zh) * 2017-07-04 2017-12-12 北京奇艺世纪科技有限公司 一种索引创建方法和装置
CN107590251A (zh) * 2017-09-19 2018-01-16 郑州云海信息技术有限公司 一种数据管理方法及其装置
CN110309151A (zh) * 2019-06-18 2019-10-08 精硕科技(北京)股份有限公司 一种索引建立方法、装置及计算机可读存储介质
CN110489409A (zh) * 2018-09-14 2019-11-22 北京数聚鑫云信息技术有限公司 一种动态扩展数据字段的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136851B2 (en) * 2004-05-14 2006-11-14 Microsoft Corporation Method and system for indexing and searching databases
CN101038648A (zh) * 2006-03-17 2007-09-19 腾讯科技(深圳)有限公司 基于搜索引擎的广告信息投放方法及广告信息发布服务器

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104267952A (zh) * 2014-09-25 2015-01-07 山东康威通信技术股份有限公司 一种基于结构化存储的文件打包方法
CN104267952B (zh) * 2014-09-25 2018-01-09 山东康威通信技术股份有限公司 一种基于结构化存储的文件打包方法
CN107016019A (zh) * 2015-10-23 2017-08-04 阿里巴巴集团控股有限公司 数据库索引创建方法及装置
CN107016019B (zh) * 2015-10-23 2021-02-23 阿里巴巴集团控股有限公司 数据库索引创建方法及装置
CN106775742A (zh) * 2016-12-27 2017-05-31 中国建设银行股份有限公司 一种用户定制信息的扩展方法及系统
CN107463618A (zh) * 2017-07-04 2017-12-12 北京奇艺世纪科技有限公司 一种索引创建方法和装置
CN107590251A (zh) * 2017-09-19 2018-01-16 郑州云海信息技术有限公司 一种数据管理方法及其装置
CN110489409A (zh) * 2018-09-14 2019-11-22 北京数聚鑫云信息技术有限公司 一种动态扩展数据字段的方法及装置
CN110489409B (zh) * 2018-09-14 2020-06-23 北京数聚鑫云信息技术有限公司 一种动态扩展数据字段的方法及装置
CN110309151A (zh) * 2019-06-18 2019-10-08 精硕科技(北京)股份有限公司 一种索引建立方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN101667183B (zh) 2011-12-21

Similar Documents

Publication Publication Date Title
CN101667183B (zh) 一种基于定制的索引建立方法、装置和系统
KR100285265B1 (ko) 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조
US11573941B2 (en) Systems, methods, and data structures for high-speed searching or filtering of large datasets
CN104346357B (zh) 一种嵌入式终端的文件存取方法及系统
CN102110146B (zh) 基于键值key-value存储的分布式文件系统元数据管理方法
CN102122285B (zh) 一种数据缓存系统中的数据查询系统和数据查询方法
US20090240714A1 (en) Semantic relational database
CN107045531A (zh) 一种优化hdfs小文件存取的系统及方法
CN102467521A (zh) 一种易扩展的多级分类检索方法及系统
CN1725220A (zh) 统一的车间模型的时间标签方法
CN100507919C (zh) 一种fat文件系统及其处理方法
CN104462141A (zh) 一种数据存储与查询的方法、系统及存储引擎装置
CN101819602A (zh) 一种数据文件引擎的实现方法
CN106326361A (zh) 一种基于HBase数据库的数据查询方法及装置
CN103026631A (zh) 用于压缩xml文档的方法和系统
CN100449545C (zh) 访问扇区数据的方法和系统
CN103186622A (zh) 一种全文检索系统中索引信息的更新方法以及装置
CN102169497B (zh) 一种通过位图方式管理元数据的方法及装置
CN101963993B (zh) 一种数据库单表记录快速查找的方法
JP3636977B2 (ja) 可変長データベース装置及びアクセス方法
CN102270238A (zh) 构建语文知识点拓展的方法和装置
CN102360359A (zh) 数据管理装置和数据管理方法
CN102541982A (zh) 一种组织和访问元数据文件日志的方法
CN110019306A (zh) 一种基于xml格式文件的sql语句查找方法及系统
CN102799583B (zh) 一种面向对象的存取方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20171101

Effective date of registration: 20171101

Address after: 310012 room 52, building 90, No. 213, Wensanlu Road, Hangzhou, Zhejiang, Xihu District

Patentee after: Hangzhou wiscom Tower Technology Co. Ltd.

Address before: 310058 Xihu District, Zhejiang, Yuhang Tong Road, No. 388, No.

Patentee before: Zhejiang University