CN106445923A - 基于层叠架构的查询系统及查询方法 - Google Patents

基于层叠架构的查询系统及查询方法 Download PDF

Info

Publication number
CN106445923A
CN106445923A CN201610905944.2A CN201610905944A CN106445923A CN 106445923 A CN106445923 A CN 106445923A CN 201610905944 A CN201610905944 A CN 201610905944A CN 106445923 A CN106445923 A CN 106445923A
Authority
CN
China
Prior art keywords
key word
accurate
fuzzy
input
auxiliary information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610905944.2A
Other languages
English (en)
Inventor
高建强
王登旭
陈光勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Triman Information & Technology Co Ltd
Original Assignee
Shanghai Triman Information & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Triman Information & Technology Co Ltd filed Critical Shanghai Triman Information & Technology Co Ltd
Priority to CN201610905944.2A priority Critical patent/CN106445923A/zh
Publication of CN106445923A publication Critical patent/CN106445923A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Abstract

本发明公开了基于层叠架构的查询系统及查询方法,该系统包括:输入模块,用以输入关键词;辅助信息转换模块,用以将辅助信息转换为关键词;判断模块,用以对关键词进行识别,将关键词拆分成模糊关键词和精确关键词;模糊查询模块,用以根据模糊关键词进行模糊查询;精确查询模块,用以根据精确关键词进行精确查询;结果整合模块,用以综合模糊查询和精确查询的结果,并将结果输出。本发明的基于层叠架构的查询系统及查询方法能够简化特定数据库的查询、检索操作,使得数据库查询不再需要专门人员进行操作。

Description

基于层叠架构的查询系统及查询方法
技术领域
本发明涉及查询系统及查询方法,更具体地说,涉及一种基于层叠架构的查询系统及查询方法。
背景技术
目前,国内外研究大数据的工作主要围绕存储、处理、分析、可视化等环节展开。在大数据存储方面,己有研究主要集中在各类NoSQL和分布式文件系统。随着互联网和云计算的不断发展,各种类型的应用层出不穷,对数据库技术提出了更多要求,主要体现在以下方面:
1)高并发读写需求;
2)海量数据的高效存储和访问需求;
3)高可扩展性和高可用性需求。
为了满足以上几个需求,出现了非关系型数据库(NoSQL)。典型的NoSQL数据库有Redis、Memcached、Cassandra、MongoDB、Neo4j等。NoSQL虽然具有多方面优势,但是其最大的弱点就是不支持SQL查询,这为开发人员带来诸多不便。因此,为了同时满足高性能和支持SQL两方面需求,一种全新的关系数据库产品NewSQL被设计出来,它或者通过将关系模型的优势与分布式体系结构结合,或者将关系数据库的性能提升到不必进行横向扩展的程度。典型的NewSQL有VoltDB、Marklogic、Xeround等;在大数据处理技术方面,最主流的平台是Hadoop。Hadoop由分布式文件系统HDFS、并行计算框架MapReduce和非结构化数据库Hbase组成。HDFS具有高容错性,因此适合部署在价格低廉的硬件上,同时它还适用于具有超大数据集的应用程序;在大数据分析方面,代表性研究有Hive、Pig等。
目前,大数据领域成果斐然,但是依然在大数据检索、分析和可视化等方面存在不足。在数据检索方面,已有的数据服务检索存在对关键字检索支持不足、非结构化数据检索结果准确度较低、不支持面向非结构化数据检索等问题。因此,这样的数据库需要专门培训的人员进行数据库的查询和检索,对于公众而言仍然是一个技术门槛。
发明内容
针对现有技术中存在的数据库需要专门技术人员进行查询操作的问题,本发明的目的是提供一种基于层叠架构的查询系统及查询方法。
为实现上述目的,本发明采用如下技术方案:
一种基于层叠架构的查询系统,包括:输入模块,用以输入关键词;辅助信息转换模块,用以将辅助信息转换为关键词;判断模块,用以对关键词进行识别,将关键词拆分成模糊关键词和精确关键词;模糊查询模块,用以根据模糊关键词进行模糊查询;精确查询模块,用以根据精确关键词进行精确查询;结果整合模块,用以综合模糊查询和精确查询的结果,并将结果输出。
根据本发明的一实施例,辅助信息转换模块识别进行输入操作的人员的数字标签,从数据库读取人员的个人数据,检索个人数据中的辅助信息,并将辅助信息转换为关键词。
根据本发明的一实施例,辅助信息转换模块读取操作人员的输入,在数据库中对输入进行预查询,根据预查询的结果生成关键词。
根据本发明的一实施例,判断模块根据数据库中的关键词标签将关键词拆分成模糊关键词和精确关键词。
根据本发明的一实施例,判断模块对输入的关键词进行文字识别,根据关键词的文字内容将关键词拆分成模糊关键词和精确关键词。
为实现上述目的,本发明还采用如下技术方案:
一种基于层叠架构的查询方法,包括以下步骤:步骤一,输入关键词;步骤二,将辅助信息转换为关键词;步骤三,对关键词进行识别,将关键词拆分成模糊关键词和精确关键词;步骤四,根据模糊关键词进行模糊查询;步骤五,根据精确关键词进行精确查询;步骤六,综合模糊查询和精确查询的结果,并将结果输出。
根据本发明的一实施例,步骤二识别进行输入操作的人员的数字标签,从数据库读取人员的个人数据,检索个人数据中的辅助信息,并将辅助信息转换为关键词。
根据本发明的一实施例,步骤二读取操作人员的输入,在数据库中对输入进行预查询,根据预查询的结果生成关键词。
根据本发明的一实施例,步骤三根据数据库中的关键词标签将关键词拆分成模糊关键词和精确关键词。
根据本发明的一实施例,步骤三对输入的关键词进行文字识别,根据关键词的文字内容将关键词拆分成模糊关键词和精确关键词。
在上述技术方案中,本发明的基于层叠架构的查询系统及查询方法能够简化特定数据库的查询、检索操作,使得数据库查询不再需要专门人员进行操作。
附图说明
图1是本发明基于层叠架构的查询系统的结构示意图;
图2是本发明基于层叠架构的查询方法的流程图。
具体实施方式
下面结合附图和实施例进一步说明本发明的技术方案。
参照图1,本发明首先公开一种基于层叠架构的查询系统,包括输入模块、辅助信息转换模块、判断模块、模糊查询模块、精确查询模块、结果整合模块、数据库。下面来详细说明上述各个模块互相之间执行的查询方法,如图2所示:
S1:利用输入模块输入关键词。
S2:辅助信息转换模块将辅助信息转换为关键词。辅助信息转换模块的转换模式有两种:
S2.1:辅助信息转换模块识别进行输入操作的人员的数字标签,从数据库读取人员的个人数据,检索个人数据中的辅助信息,并将辅助信息转换为关键词。
S2.2:辅助信息转换模块读取操作人员的输入,在数据库中对输入进行预查询,根据预查询的结果生成关键词。
例如,辅助信息转换模块扫描操作人员的ID卡(数字标签),识别出该人员为案件上报员,在数据库中该人员受理的案件信息为A类,则此时辅助信息转换模块将“案件分类=A类”作为关键词添加到查询条件中。
在另一个实施例中,辅助信息转换模块识别出操作人员为普通公众(无数字标签),且数据库中该普通公众在某日期曾经有过案件上报记录,则辅助信息转换模块将“日期”、“案件名称”作为关键词添加到查询条件中。
在第三个实施例中,操作人员利用输入模块输入的关键词包括案件时间,此时辅助信息转换模块根据该时间在数据库中预查询,查询结果得到在该时间仅有B类、C类案件的记录,因此辅助信息转换模块将“案件分类=B类”、“案件分类=C类”作为关键词添加到查询条件中。
在第四个实施例中,操作人员利用输入模块输入的关键词包括案件分类,此时辅助信息转换模块根据该时间在数据库中预查询。数据库内每一个数据均包括关键词标签,此时辅助信息转换模块读取预查询结果中的关键词标签,将这些关键词标签作为关键词添加到查询条件中。
S3:判断模块,用以对关键词进行识别,将关键词拆分成模糊关键词和精确关键词。判断模块的识别方式有2种:
S3.1:判断模块根据数据库中的关键词标签将关键词拆分成模糊关键词和精确关键词。
S3.2:判断模块对输入的关键词进行文字识别,根据关键词的文字内容将关键词拆分成模糊关键词和精确关键词。
作为本发明的一实施例,由于数据库中每个数据均带有关键词标签,因此数据库内预存有关键词标签,判断模块检索关键词(包括通过输入模块输入的关键词和辅助信息转换模块添加的关键词)中是否有与关键词标签匹配的关键词。若有,则将匹配的关键词作为精确关键词,将其他关键词作为模糊关键词。
作为本发明的另一个实施例,判断模块对关键词(包括通过输入模块输入的关键词和辅助信息转换模块添加的关键词)进行文字识别。关键词可能包含的模糊的内容,例如案件描述、情况说明等描述信息,也可能包含精确的信息,例如案件分类、时间等。判断模块根据文字识别的结果将关键词拆分成模糊关键词和精确关键词。
S4:模糊查询模块,用以根据模糊关键词进行模糊查询。
S5:精确查询模块,用以根据精确关键词进行精确查询。
S6:结果整合模块,用以综合模糊查询和精确查询的结果,并将结果输出。
结果整合模块还可以对输出结果进行处理,选择部件标签、事件标签、人员标签、部件标签可以分别对部件、事件、人员、部件进行全文查看。输入部门/事件/人员/部件业务数据重要字段,点击查询按钮,刷新部门/事件/人员/部件信息列表;双击事件信息列表某个事件,弹出事件详细信息。点击部门/事件/人员/部件信息列表右侧的报表导出图标,导出相应的事件/人员/部件信息,存储为Excel文档。点击部门/事件/人员/部件信息列表下方的统计总数按钮可统计相应部门数、事件数、人员数和部件数。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims (10)

1.一种基于层叠架构的查询系统,其特征在于,包括:
输入模块,用以输入关键词;
辅助信息转换模块,用以将辅助信息转换为关键词;
判断模块,用以对关键词进行识别,将关键词拆分成模糊关键词和精确关键词;
模糊查询模块,用以根据模糊关键词进行模糊查询;
精确查询模块,用以根据精确关键词进行精确查询;
结果整合模块,用以综合模糊查询和精确查询的结果,并将结果输出。
2.如权利要求1所述的基于层叠架构的查询系统,其特征在于:
所述辅助信息转换模块识别进行输入操作的人员的数字标签,从数据库读取所述人员的个人数据,检索所述个人数据中的辅助信息,并将所述辅助信息转换为关键词。
3.如权利要求1所述的基于层叠架构的查询系统,其特征在于:
所述辅助信息转换模块读取操作人员的输入,在数据库中对所述输入进行预查询,根据预查询的结果生成关键词。
4.如权利要求1所述的基于层叠架构的查询系统,其特征在于:
所述判断模块根据数据库中的关键词标签将关键词拆分成模糊关键词和精确关键词。
5.如权利要求1所述的基于层叠架构的查询系统,其特征在于:
所述判断模块对输入的关键词进行文字识别,根据关键词的文字内容将关键词拆分成模糊关键词和精确关键词。
6.一种基于层叠架构的查询方法,其特征在于,包括以下步骤:
步骤一,输入关键词;
步骤二,将辅助信息转换为关键词;
步骤三,对关键词进行识别,将关键词拆分成模糊关键词和精确关键词;
步骤四,根据模糊关键词进行模糊查询;
步骤五,根据精确关键词进行精确查询;
步骤六,综合模糊查询和精确查询的结果,并将结果输出。
7.如权利要求6所述的基于层叠架构的查询方法,其特征在于:
所述步骤二识别进行输入操作的人员的数字标签,从数据库读取所述人员的个人数据,检索所述个人数据中的辅助信息,并将所述辅助信息转换为关键词。
8.如权利要求6所述的基于层叠架构的查询方法,其特征在于:
所述步骤二读取操作人员的输入,在数据库中对所述输入进行预查询,根据预查询的结果生成关键词。
9.如权利要求6所述的基于层叠架构的查询方法,其特征在于:
所述步骤三根据数据库中的关键词标签将关键词拆分成模糊关键词和精确关键词。
10.如权利要求6所述的基于层叠架构的查询方法,其特征在于:
所述步骤三对输入的关键词进行文字识别,根据关键词的文字内容将关键词拆分成模糊关键词和精确关键词。
CN201610905944.2A 2016-10-18 2016-10-18 基于层叠架构的查询系统及查询方法 Pending CN106445923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610905944.2A CN106445923A (zh) 2016-10-18 2016-10-18 基于层叠架构的查询系统及查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610905944.2A CN106445923A (zh) 2016-10-18 2016-10-18 基于层叠架构的查询系统及查询方法

Publications (1)

Publication Number Publication Date
CN106445923A true CN106445923A (zh) 2017-02-22

Family

ID=58176609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610905944.2A Pending CN106445923A (zh) 2016-10-18 2016-10-18 基于层叠架构的查询系统及查询方法

Country Status (1)

Country Link
CN (1) CN106445923A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463655A (zh) * 2017-07-27 2017-12-12 无锡雅座在线科技股份有限公司 查询数据的方法、装置和系统
CN113297299A (zh) * 2021-06-23 2021-08-24 南宁学院 财务数据模糊查询方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851700A (zh) * 2005-11-01 2006-10-25 华为技术有限公司 一种查询方法和系统以及一种查询转换装置
US20080010259A1 (en) * 2006-07-10 2008-01-10 Nec (China) Co., Ltd. Natural language based location query system, keyword based location query system and a natural language and keyword based location query system
CN102567423A (zh) * 2010-12-31 2012-07-11 成都致远诺亚舟教育科技有限公司 一种诗词关联搜索方法和系统
CN104537116A (zh) * 2015-01-23 2015-04-22 浙江大学 一种基于标签的图书搜索方法
CN105956047A (zh) * 2016-04-26 2016-09-21 北京橙鑫数据科技有限公司 搜索方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851700A (zh) * 2005-11-01 2006-10-25 华为技术有限公司 一种查询方法和系统以及一种查询转换装置
US20080010259A1 (en) * 2006-07-10 2008-01-10 Nec (China) Co., Ltd. Natural language based location query system, keyword based location query system and a natural language and keyword based location query system
CN102567423A (zh) * 2010-12-31 2012-07-11 成都致远诺亚舟教育科技有限公司 一种诗词关联搜索方法和系统
CN104537116A (zh) * 2015-01-23 2015-04-22 浙江大学 一种基于标签的图书搜索方法
CN105956047A (zh) * 2016-04-26 2016-09-21 北京橙鑫数据科技有限公司 搜索方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463655A (zh) * 2017-07-27 2017-12-12 无锡雅座在线科技股份有限公司 查询数据的方法、装置和系统
CN113297299A (zh) * 2021-06-23 2021-08-24 南宁学院 财务数据模糊查询方法

Similar Documents

Publication Publication Date Title
CN110633292B (zh) 一种异构数据库的查询方法、装置、介质、设备及系统
US8744197B2 (en) Identifying information related to a particular entity from electronic sources, using dimensional reduction and quantum clustering
US8275783B2 (en) Conversion program search system and conversion program search method
US10002142B2 (en) Method and apparatus for generating schema of non-relational database
US20110270882A1 (en) Resource description framework network construction device and method using an ontology schema having class dictionary and mining rule
CN108573045A (zh) 一种基于多阶指纹的比对矩阵相似度检索方法
Murthy et al. Big Data solutions on a small scale: Evaluating accessible high-performance computing for social research
Morshed et al. Thesaurus alignment for linked data publishing
CN111506621A (zh) 一种数据统计方法及装置
CN108241627A (zh) 一种异构数据存储查询方法和系统
CN106339498A (zh) 数据同步方法、装置和系统
CN111950921A (zh) 一种基于离线组网环境的多人协同评审方法
CN105975495A (zh) 大数据的存储、搜索方法及装置
CN111651453A (zh) 用户历史行为查询方法、装置、电子设备及存储介质
CN106126224A (zh) 一种生成程序对象的工具、系统和方法
CN106445923A (zh) 基于层叠架构的查询系统及查询方法
Dias et al. A method for the identification of collaboration in large scientific databases
CN113779349A (zh) 数据检索系统、装置、电子设备和可读存储介质
KR102025813B1 (ko) 사건 흐름 정보를 제공하기 위한 연대순 정보 기반 큐레이션 장치 및 그것의 제어방법
Li et al. Enhancing binary relevance for multi-label learning with controlled label correlations exploitation
CN110781213B (zh) 一种以人员为中心的多源海量数据关联搜索方法和系统
CN107357632A (zh) 一种命令行解析方法及装置
CN108241624A (zh) 一种查询脚本的生成方法及装置
CN113407657A (zh) 基于单级数据库的数据查询方法、装置、设备及存储介质
CN105389295A (zh) 一种卡片个人化的数据处理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222