CN103514214B - 数据查询方法及装置 - Google Patents
数据查询方法及装置 Download PDFInfo
- Publication number
- CN103514214B CN103514214B CN201210218710.2A CN201210218710A CN103514214B CN 103514214 B CN103514214 B CN 103514214B CN 201210218710 A CN201210218710 A CN 201210218710A CN 103514214 B CN103514214 B CN 103514214B
- Authority
- CN
- China
- Prior art keywords
- data
- identification information
- similar
- database
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000010586 diagram Methods 0.000 description 6
- 241001269238 Data Species 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数据查询方法,创建数据库时,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;所述方法包括:进行数据查询时,对待查询数据按相似性进行分类;按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。本发明同时公开了一种实现上述方法的装置。由于本发明的技术方案在进行数据查询时不必按递归方式进行逐级查询,而是通过待查询数据之间的相似性,通过相似性对应的标识信息即可确定出待查询的数据,查询效率将会大大提高,无论的所查询的数据涉及几级节点,均能快速准确地查询出对应的数据。
Description
技术领域
本发明涉及数据查询技术,尤其涉及一种数据查询方法及装置。
背景技术
目前的数据查询技术中,递归查询是最常见的查询方式。一般而言,递归查询中,服务器接收到查询请求时,进行数据查询,若服务器不能直接查询出相应结果,则在域各树中的各分支的上下进行递归查询,最终将返回查询结果。
递归数据查询技术虽然能实现数据的有效查询,但在查询末节点数据时,需耗费大量的资源,查询运算量相当大,查询效率就会大大降低。
发明内容
有鉴于此,本发明的主要目的在于提供一种数据查询方法及装置,能高效地进行数据查询。
为达到上述目的,本发明的技术方案是这样实现的:
一种数据查询方法,创建数据库时,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;所述方法包括:
进行数据查询时,对待查询数据按相似性进行分类;
按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。
优选地,所述相似的标识信息为专设的独立标识信息,或为数据标识的部分标识信息。
优选地,所述部分标识信息为所述数据标识的部分连续标识信息,或为所述数据标识的部分非连续标识信息。
优选地,所述方法还包括:
相似的数据之间建立关联关系;
所述数据库接收到针对相似标识信息的数据查询请求后,将与所述相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
优选地,所述方法还包括:
在所述数据库中添加数据时,确定待添加数据与所述数据库中已有的数据的相似性为所述待添加数据设置标识信息,并建立与所述数据库中已有的相似数据之间的关联性。
一种数据查询装置,包括创建单元、分类单元和查询单元,其中:
创建单元,用于创建数据库,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;
分类单元,用于对待查询数据按相似性进行分类;
查询单元,用于在进行数据查询时,按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。
优选地,所述相似的标识信息为专设的独立标识信息,或为数据标识的部分标识信息。
优选地,所述部分标识信息为所述数据标识的部分连续标识信息,或为所述数据标识的部分非连续标识信息。
优选地,所述创建单元还用于,在相似的数据之间建立关联关系;
所述查询单元还用于,在接收到针对相似标识信息的数据查询请求后,将与所述相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
优选地,所述创建单元还用于,在所述数据库中添加数据时,确定待添加数据与所述数据库中已有的数据的相似性为所述待添加数据设置标识信息,并建立与所述数据库中已有的相似数据之间的关联性。
本发明在创建数据库时,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;而在进行数据查询时,对待查询数据按相似性进行分类;按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。由于本发明的技术方案在进行数据查询时不必按递归方式进行逐级查询,而是通过待查询数据之间的相似性,通过相似性对应的标识信息即可确定出待查询的数据,查询效率将会大大提高,无论的所查询的数据涉及几级节点,均能快速准确地查询出对应的数据。
附图说明
图1为递归查询数据方法的示意图;
图2为本发明实施例的数据查询方法的示意图;
图3为本发明实施例的数据查询装置的组成结构示意图。
具体实施方式
为使本发明的目的,技术方案和优点更加清楚明白,以下举实例并参照附图,对本发明进一步详细说明。
本发明中,在创建数据库时,为数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;进行数据查询时,对待查询数据按相似性进行分类;按待查询数据的类别对应的相似标识信息在数据库中进行数据查询。
关于相似性,可以是数据的类别相似,例如关于城市数据中,城市人口数据超过千万的为超级城市,将“人口超过千万”作为超级城市的相似性,可以为此类数据设置相同的标识信息,如其标识设置为“100000”,当然,这些超级城市还具有其他属性,如国别,所属地区等,针对国别、所属地区等信息,也可以设置对应的标识,如国别为中国的城市其国别标识设置为“200”,而将广东省的地区属性设置为“30”等,这样,广东省的所有城市的地区属性的相似性标识即为“30”。将为城市设置的所有标识信息组合起来作为该城市的标识信息,但对于具有相似性的城市,其相似性的标识是相同的,例如,不论超级城市属于哪个国家哪个地区,只要是超级城市,其标识信息的对应字段必然具有“100000”的相同标识信息。
当然相似性属性还可以是其他信息,如对于学校这一数据,可以按高等学府、高级中学、初级中学以及小学等属性作为其相似性判断依据。这里不再给出设置标识信息的示例。
由上述示例可知,相似的标识信息可以为专设的独立标识信息,或为数据标识的部分标识信息。当然,部分标识信息可以为数据标识的部分连续标识信息,或为数据标识的部分非连续标识信息。以上述的“超级城市”这一相似性为例,当需要查询中国的超级城市时,就需要国别的相似性标识信息及超级城市的标识信息作为该数据的查询信息,而这两个相似性的标识信息,在城市的相似性标识信息中并不一定是是连续设置的。
为提高本发明的查询效率,在本发明的数据库中,在相似的数据之间建立关联关系;数据库接收到针对相似标识信息的数据查询请求后,将与相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
也就是说,在建立数据库时,提高相似性这一特点,将相关数据关联起来,这样,在进行数据查询时,可将这些具有相同标识信息的关联数据均提供给查询用户。
同样的,在对数据库进行维护时,同样按创建数据库时的方式进行维护,例如,在数据库中添加数据时,确定待添加数据与数据库中已有的数据的相似性为待添加数据设置标识信息,并建立与数据库中已有的相似数据之间的关联性。
下面结合附图对技术方案的实施做作进一步的详细描述,说明本发明的数据查询方法是如何使用相似性(like)查询数据的。
图1为递归查询数据方法的示意图,图1中,数据之间具有递归关系,并且,前一数据是后一数据的父数据;如图1所示,递归查询数据时,需要从第一个数据一步一步查询到最后一个数据,假设通过n步查询后能获取查询结果。
图2为本发明实施例的数据查询方法的示意图,如图2所示,图2中,一组递归数据的id相似,例如,图2所示的各数据之间,均具有相似的标识信息“100”,标识信息“100”即为图2所示的各数据之间的相似性标识信息,对于这些具有相似性的数据,可以用一条查询语句“like ‘100%’”(表示查询含有ID“100”的数据)即可查询出所有递归数据。这样,通过一次查询,即可将图2所示的众多数据查询并且输出给查询人员,理论上而言,图2所示的查询效率是图1所示的递归查询方式的n倍。
本发明的数据查询方法,能完全替代递归查询方法,其数据查询性能得到了极大的提升。
图3为本发明实施例的数据查询装置的组成结构示意图,如图3所示,本发明的数据查询装置包括创建单元30、分类单元31和查询单元32,其中:
创建单元30,用于创建数据库,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息;
分类单元31,用于对待查询数据按相似性进行分类;
查询单元32,用于在进行数据查询时,按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。
其中,所述相似的标识信息为专设的独立标识信息,或为数据标识的部分标识信息。
其中,所述部分标识信息为所述数据标识的部分连续标识信息,或为所述数据标识的部分非连续标识信息。
其中,所述创建单元30还用于,在相似的数据之间建立关联关系;
所述查询单元32还用于,在接收到针对相似标识信息的数据查询请求后,将与所述相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
其中,所述创建单元30还用于,在所述数据库中添加数据时,确定待添加数据与所述数据库中已有的数据的相似性为所述待添加数据设置标识信息,并建立与所述数据库中已有的相似数据之间的关联性。
本领域技术人员应当理解,图3中所示的数据查询装置中的各处理单元的实现功能可参照前述数据查询方法的相关描述而理解。本领域技术人员应当理解,图3所示的数据查询装置中各处理单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (8)
1.一种数据查询方法,其特征在于,创建数据库时,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息,所述相似的标识信息为数据标识的部分标识信息,所述部分标识信息为所述数据标识的部分连续标识信息,或为所述数据标识的部分非连续标识信息;所述方法包括:
进行数据查询时,对待查询数据按相似性进行分类;
按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。
2.根据权利要求1所述的方法,其特征在于,所述相似的标识信息为专设的独立标识信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
相似的数据之间建立关联关系;
所述数据库接收到针对相似标识信息的数据查询请求后,将与所述相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述数据库中添加数据时,确定待添加数据与所述数据库中已有的数据的相似性为所述待添加数据设置标识信息,并建立与所述数据库中已有的相似数据之间的关联性。
5.一种数据查询装置,其特征在于,所述装置包括创建单元、分类单元和查询单元,其中:
创建单元,用于创建数据库,为所述数据库中的数据设置标识信息,其中,相似数据具有相似的标识信息,所述相似的标识信息为数据标识的部分标识信息,所述部分标识信息为所述数据标识的部分连续标识信息,或为所述数据标识的部分非连续标识信息;
分类单元,用于对待查询数据按相似性进行分类;
查询单元,用于在进行数据查询时,按所述待查询数据的类别对应的相似标识信息在所述数据库中进行数据查询。
6.根据权利要求5所述的装置,其特征在于,所述相似的标识信息为专设的独立标识信息。
7.根据权利要求5所述的装置,其特征在于,所述创建单元还用于,在相似的数据之间建立关联关系;
所述查询单元还用于,在接收到针对相似标识信息的数据查询请求后,将与所述相似标识信息对应的、具有关联关系的所有数据作为查询结果输出。
8.根据权利要求5所述的装置,其特征在于,所述创建单元还用于,在所述数据库中添加数据时,确定待添加数据与所述数据库中已有的数据的相似性为所述待添加数据设置标识信息,并建立与所述数据库中已有的相似数据之间的关联性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210218710.2A CN103514214B (zh) | 2012-06-28 | 2012-06-28 | 数据查询方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210218710.2A CN103514214B (zh) | 2012-06-28 | 2012-06-28 | 数据查询方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103514214A CN103514214A (zh) | 2014-01-15 |
CN103514214B true CN103514214B (zh) | 2018-09-21 |
Family
ID=49896947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210218710.2A Expired - Fee Related CN103514214B (zh) | 2012-06-28 | 2012-06-28 | 数据查询方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103514214B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106326309B (zh) * | 2015-07-03 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 一种数据查询方法和装置 |
CN105224609B (zh) * | 2015-09-07 | 2018-09-14 | 北京金山安全软件有限公司 | 一种索引查询方法及装置 |
CN106951452A (zh) * | 2017-02-22 | 2017-07-14 | 中国建设银行股份有限公司 | 用于账务追溯的数据查询方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059814A (zh) * | 2006-04-17 | 2007-10-24 | 株式会社理光 | 图像处理设备与图像处理方法 |
CN102289459A (zh) * | 2010-06-18 | 2011-12-21 | 微软公司 | 自动地生成训练数据 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009044341A2 (en) * | 2007-10-04 | 2009-04-09 | Koninklijke Philips Electronics N.V. | Classifying a set of content items |
CN101226556A (zh) * | 2008-02-19 | 2008-07-23 | 深圳华为通信技术有限公司 | 数据查找方法及装置 |
CN102184230B (zh) * | 2011-05-11 | 2016-08-17 | 北京百度网讯科技有限公司 | 一种搜索结果的展示方法及装置 |
-
2012
- 2012-06-28 CN CN201210218710.2A patent/CN103514214B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059814A (zh) * | 2006-04-17 | 2007-10-24 | 株式会社理光 | 图像处理设备与图像处理方法 |
CN102289459A (zh) * | 2010-06-18 | 2011-12-21 | 微软公司 | 自动地生成训练数据 |
Also Published As
Publication number | Publication date |
---|---|
CN103514214A (zh) | 2014-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102982076B (zh) | 基于语义标签库的多维度内容标注方法 | |
Li et al. | Fine-grained location extraction from tweets with temporal awareness | |
CN105740440B (zh) | 一种加快区块链查询的索引方法 | |
CN103294781B (zh) | 一种用于处理页面数据的方法与设备 | |
Cresci et al. | Crisis mapping during natural disasters via text analysis of social media messages | |
US9317613B2 (en) | Large scale entity-specific resource classification | |
CN103246644B (zh) | 一种网络舆情信息处理方法和装置 | |
CN103186612B (zh) | 一种词汇分类的方法、系统和实现方法 | |
CN105468605A (zh) | 一种实体信息图谱生成方法及装置 | |
CN106708947B (zh) | 一种基于大数据的网络文章转发识别方法 | |
CN112650858B (zh) | 应急协助信息的获取方法、装置、计算机设备及介质 | |
CN105630884A (zh) | 一种微博热点事件的地理位置发现方法 | |
CN106980639B (zh) | 短文本数据聚合系统及方法 | |
Lee et al. | Spatio-temporal provenance: Identifying location information from unstructured text | |
CN103646029A (zh) | 一种针对博文的相似度计算方法 | |
CN103514214B (zh) | 数据查询方法及装置 | |
Li et al. | Extracting fine‐grained location with temporal awareness in tweets: A two‐stage approach | |
CN104615734A (zh) | 一种社区管理服务大数据处理系统及其处理方法 | |
CN115438274A (zh) | 基于异质图卷积网络的虚假新闻识别方法 | |
US20170235835A1 (en) | Information identification and extraction | |
CN111930963B (zh) | 知识图谱生成方法、装置、电子设备及存储介质 | |
Bagdouri et al. | Profession-based person search in microblogs: Using seed sets to find journalists | |
CN105574004A (zh) | 一种网页去重方法和设备 | |
Pei et al. | Critical public opinion location and intelligence theme clustering strategy-based biological virus event detection and tracking model | |
CN112270199A (zh) | 基于CGAN方法的个性化语义空间关键字Top-K查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180921 |