CN105138674B - 一种数据库访问方法 - Google Patents

一种数据库访问方法 Download PDF

Info

Publication number
CN105138674B
CN105138674B CN201510566163.0A CN201510566163A CN105138674B CN 105138674 B CN105138674 B CN 105138674B CN 201510566163 A CN201510566163 A CN 201510566163A CN 105138674 B CN105138674 B CN 105138674B
Authority
CN
China
Prior art keywords
data
attribute
tree
retrieval
attribute data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510566163.0A
Other languages
English (en)
Other versions
CN105138674A (zh
Inventor
高爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao lianzhongxin cloud Technology Co., Ltd
Original Assignee
Chengdu Boyuan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Boyuan Technology Co Ltd filed Critical Chengdu Boyuan Technology Co Ltd
Priority to CN201510566163.0A priority Critical patent/CN105138674B/zh
Publication of CN105138674A publication Critical patent/CN105138674A/zh
Application granted granted Critical
Publication of CN105138674B publication Critical patent/CN105138674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation

Abstract

本发明提供了一种数据库访问方法,该方法包括:步骤一、通过支持语义的属性数据描述传感器网络获取的数据;步骤二、利用DOM树结构,将所述传感器网络获取的数据存储在MySqL数据库中;步骤三、基于所述属性数据在MySqL数据库中进行检索。本发明提出了一种数据库访问方法,实现了传感器网络数据的压缩存储与快速检索,有效改善了数据存储量大且检索速度慢的问题。

Description

一种数据库访问方法
技术领域
本发明涉及数据检索,特别涉及一种数据库访问方法。
背景技术
物联网的出现为智能家居、智能医疗、智能城市、智能交通等众多应用领域的迅猛发展奠定了基础。在物联网的传感器网络中,拥有射频识别设备、传感器、智能嵌入设备等数目众多的异质设备,运行着用于标识、感知、处理和传送信息的各类服务,因此网络中各传感节点所采用的通信标准和实现技术存在巨大的差异。这将导致分布在不同地点的各节点不断产生大量、非连续且时间敏感的数据。这类具有多维度属性数据对保证产业的正常运转非常重要,但现有的数据管理方法不能有效解决其存储与快速检索问题。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种数据库访问方法,包括:
步骤一、通过支持语义的属性数据描述传感器网络获取的数据;
步骤二、利用DOM树结构,将所述传感器网络获取的数据存储在MySqL数据库中;
步骤三、基于所述属性数据在MySqL数据库中进行检索。
优选地,所述属性数据包括对数据进行宏观描述的基本属性和关联于数据描述领域的扩展属性;当新数据被获取后,从属性数据库中调取属性数据标准来描述该数据,如能完整描述,则直接对其进行描述;如不能够完整描述,则在原有属性数据标准的基础上进行属性数据扩展,生成目标属性数据,然后使用新生成的目标属性数据标准对该类数据进行描述,同时将新生成的属性数据标准添加到属性数据库中,完成属性数据的学习过程;所述基本属性包括:名称、主题、描述、来源、创建者、标识符、日期、类型、格式;所述扩展属性是根据应用领域的特征扩展而成,包括地理数据、媒体数据、状态数据、时间数据。
优选地,所述步骤二利用DOM树结构,将所述传感器网络获取的数据存储在MySqL数据库中,进一步包括:
利用MySqL数据库来存储经属性数据所描述的DOM数据,将MySqL数据库按照数据维度来组织,每一个数据维度映射成一个关系表,DOM文档中的元素、属性与表中的字段相对应,为每个表增加一个标识字段作为外键,以便与其它表建立关联;
对于传感器网络中存在的结构化数据、非结构化数据和半结构化数据采用不同的永久存储策略;对于结构化数据,直接存储到MySqL数据库的表和字段中;对于非结构化数据,将其存储在磁盘的文件系统中;对于半结构化数据,选用MySqL数据库和文件系统相结合的方式,即用MySqL数据库存储数据的结构化部分,用文件系统来存储数据的非结构化部分,并将非结构化数据的索引信息存储在相应的MySqL数据库中;
通过以下过程对MySqL数据库存储内容进行优化:
(1)根据属性数据描述文件,通过递归深度遍历DOM数据来创建属性树和属性数据所描述的数据树;
(2)对属性树进行编码:对文档树中每个节点进行编码,并按照层次顺序进行遍历,每个树节点存储数据信息和编码;编码规则是将根节点编码为1,子节点的编码=父节点的编码+“.”+“i”;
(3)查找空节点,将其消除,合并相似节点。
优选地,所述步骤三基于所述属性数据在MySqL数据库中进行检索,进一步包括:
利用具有语义的描述的属性,当处理检索时,一方面对属性数据进行检索,得到具体的数据集,缩小数据检索的范围;另一方面根据属性数据检索结果,转到MySqL数据库中进行进一步检索,以得到相应的数据,最后将检索结果进行处理和封装,返回给检索请求者;
在数据检索过程中:
(1)首先对检索条件进行预处理,针对带有语义的检索,提取检索元素;
(2)根据检索元素生成DOM查询树和属性树;
(3)将查询树与属性树进行匹配,得到一个中间树;在匹配时,进行两种运算,即添加和消除;对于消除运算,所有数据对象都采用同一个属性数据标准,各数据对象的属性树节点都是同一属性树的一部分,但是属性数据值不同,通过消除运算,消除未匹配到的属性树节点;对于不能完全匹配,但具有语义相关性的维度,可近似匹配的属性数据,对其进行添加运算;
(4)根据MySqL数据库生成关系树,再对步骤(3)中生成的中间树进行编码,然后进行消除匹配得到最终的SQL查询树;
(5)利用经过添加和消除匹配后得到的SQL查询树,构成检索数据集对应的元素和元素属性,产生SQL检索语句,生成对MySqL数据库的检索,执行MySqL数据库检索,并返回一个结果集;
(6)将结果数据进行整理聚合,对检索得到的数据进行分类、排序操作,并将结果返回给请求者。
本发明相比现有技术,具有以下优点:
本发明提出了一种数据库访问方法,实现了传感器网络数据的压缩存储与快速检索,有效改善了数据存储量大且检索速度慢的问题。
附图说明
图1是根据本发明实施例的数据库访问方法的流程图。
具体实施方式
下文与图示本发明原理的附图一起提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
本发明的一方面提供了一种数据库访问方法。图1是根据本发明实施例的数据库访问方法流程图。本发明通过改进的DOM树匹配方法提高了数据检索效率与检索精度,实现了对多维度数据压缩存储与快速检索的优化设计。传统数据结构很难描述具有多维度特征的传感器网络数据。在属性数据结构中使用支持语义的属性数据,成为一种数据描述的可行方案。传感器网络的外延十分广泛,各种应用领域的数据具有不同特征,用一种属性数据标准不能对其进行通用描述。因此,本发明根据不同领域的具体应用进行扩展。扩展属性分为一级扩展和多级扩展。基本属性对数据进行基本的宏观描述,而扩展属性是在基本属性描述的基础上,再对数据进行详细描述,这样就为异质数据的同质描述提供了可能,为传感器网络数据的互操作和资源的共享奠定了基础。
(1)基本属性:用于描述数据的基本特征。本发明保留数据的9个元素:名称、主题、描述、来源、创建者、标识符、日期、类型、格式。
(2)扩展属性:根据各应用领域的特征扩展而成,是对数据的详细描述,如地理数据、媒体数据、状态数据、时间数据等。
随着传感器网络规模、数据种类和数据量的不断膨胀,属性数据需要不断地学习和扩展以适应该情况,当新数据被系统获取后,系统将从属性数据库中调取属性数据标准来描述该数据,如能完整描述,则直接对其进行描述;如不能够完整描述,则在原有属性数据标准的基础上进行属性数据扩展,生成目标属性数据,然后使用新生成的目标属性数据标准对该类数据进行描述,同时将新生成的属性数据标准添加到属性数据库中,完成属性数据的学习过程。
利用MySqL数据库来存储经传感器网络属性数据所描述的DOM数据。将MySqL数据库按照数据维度来组织,每一个数据维度映射成一个关系表,DOM文档中的元素、属性与表中的字段相对应。为每个表增加一个标识字段作为外键,以便与其它表建立关联。
传感器网络中存在的结构化数据、非结构化数据和半结构化数据永久存储策略各不相同。
对于结构化数据,其具有规范的结构,数据的组织比较有规则,可直接存储到MySqL数据库的表和字段中。
对于非结构化数据,一般没有固定的结构,如视频、声音、图像等。这些数据不易在MySqL数据库中存储,因此可将其存储在磁盘的文件系统中。
对于半结构化数据,介于结构化数据与非结构化数据之间的数据。选用MySqL数据库和文件系统相结合的方式对此类数据进行存储。其中用MySqL数据库存储数据的结构化部分,用文件系统来存储数据的非结构化部分,并将非结构化数据的索引信息存储在相应的MySqL数据库中。
若将所有属性数据元素一一映射到MySqL数据库中,必将产生一些无效字段和利用率低的字段。随着存储数据量的增长,这些无用的字段成为沉重的冗余数据,浪费存储空间。所以需要对MySqL数据库模型进行优化,即消除无用字段,合并低效字段。
(1)根据属性数据描述文件,通过递归深度遍历DOM数据来创建属性树和属性数据所描述的数据树。
(2)对属性树进行编码。
对文档树中每个节点进行编码,并按照层次顺序进行遍历。每个树节点存储数据信息和编码。编码规则:将根节点编码为1,子节点的编码=父节点的编码+“.”+“i”。
(3)查找空节点,将其消除,合并相似节点。
传感器网络多维度数据的检索处理,不能直接使用MySqL数据库提供的检索功能,因为表和字段的名字都按照维的属性来建立,可能不是语义良好的。而应用层的检索多数情况下具有语义,是基于事件或面向对象的。本发明借助具有语义描述的属性数据来实现。
属性数据提供具有语义的描述。当处理复杂检索时,一方面可对属性数据进行检索,得到具体的数据集,缩小数据检索的范围;另一方面根据属性数据检索结果,转到MySqL数据库中进行进一步检索,以得到相应的数据,最后将检索结果进行处理和封装,返回给检索请求者。
在数据检索过程中:
(1)首先对检索条件进行预处理,针对带有语义的检索,提取检索元素。
(2)根据检索元素生成DOM查询树和属性树。
(3)将查询树与属性树进行匹配,得到一个中间树。
对文档树编码后,进行查询树与属性树的匹配,以生成中间树。匹配时,需要进行两种运算,即添加和消除。
对于消除运算,所有数据对象都采用同一个属性数据标准,各数据对象的属性树节点都是同一属性树的一部分,但是属性数据值不同。例如描述某地区天气状况的属性树,它可能只有地理维度、状态维度和时间维度的信息,在检索时就没有必要对媒体维度进行检索,需要去除该维。通过对查询树与属性树匹配,进行消除运算,可消除未匹配到的属性树节点(如媒体维度中的节点),从而降低检索冗余,节省检索空间,提高检索效率。
对于不能完全匹配,但有一定的语义相关性的维度,可近似匹配,因此对其做添加运算,以提高查全率。例如在采集电机运行参数时,环境温度和室温两个概念在一定情况下是相同的,在查询树与属性树中,表示这两个概念的节点就可以看做是匹配的,可做添加运算。
(4)中间树与关系树匹配,生成SQL查询树。属性数据定义时除了保证通用性和精简性,还应尽量能够覆盖传感器网络的各领域。而为了减少存储冗余,在映射生成MySqL数据库模式时,将语义相同的字段进行了合并,因此属性数据的规模要比MySqL数据库模型大,在到MySqL数据库的检索转化中,需要进行处理。即,根据MySqL数据库生成关系树,再对步骤(3)中生成的树进行编码,然后进行消除匹配得到最终的SQL查询树。
(5)进行检索转化,生成SQL检索。经过添加和消除匹配后得到的SQL查询树,构成检索数据集对应的元素和元素属性。根据该树进行检索转化,产生SQL检索语句,生成对MySqL数据库的检索。执行MySqL数据库检索,并返回一个结果集。
(6)将结果数据进行整理聚合。对检索得到的数据进行分类、排序等操作,使其语义良好,并将结果返回给请求者。
综上所述,本发明提出了一种数据库访问方法,实现了传感器网络数据的压缩存储与快速检索,有效改善了数据存储量大且检索速度慢的问题。
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算系统来实现,它们可以集中在单个的计算系统上,或者分布在多个计算系统所组成的网络上,可选地,它们可以用计算系统可执行的程序代码来实现,从而,可以将它们存储在存储系统中由计算系统来执行。这样,本发明不限制于任何特定的硬件和软件结合。应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (1)

1.一种数据库访问方法,其特征在于,包括:
步骤一、通过支持语义的属性数据描述传感器网络获取的数据;
步骤二、利用DOM树结构,将所述传感器网络获取的数据存储在MySqL数据库中;
步骤三、基于所述属性数据在MySqL数据库中进行检索;
所述属性数据包括对数据进行宏观描述的基本属性和关联于数据描述领域的扩展属性;当新数据被获取后,从属性数据库中调取属性数据标准来描述该数据,如能完整描述,则直接对其进行描述;如不能够完整描述,则在原有属性数据标准的基础上进行属性数据扩展,生成目标属性数据,然后使用新生成的目标属性数据标准对该数据进行描述,同时将新生成的属性数据标准添加到属性数据库中,完成属性数据的学习过程;所述基本属性包括:名称、主题、描述、来源、创建者、标识符、日期、类型、格式;所述扩展属性是根据应用领域的特征扩展而成,包括地理数据、媒体数据、状态数据、时间数据;
所述步骤三基于所述属性数据在MySqL数据库中进行检索,进一步包括:
利用具有语义的描述的属性数据,当处理检索时,一方面对属性数据进行检索,得到具体的数据集,缩小数据检索的范围;另一方面根据属性数据检索结果,转到MySqL数据库中进行进一步检索,以得到相应的数据,最后将检索结果进行处理和封装,返回给检索请求者;
在数据检索过程中:
(1)首先对检索条件进行预处理,针对带有语义的检索,提取检索元素;
(2)根据检索元素生成DOM查询树和属性树;
(3)将DOM查询树与属性树进行匹配,得到一个中间树;在匹配时,进行两种运算,即添加和消除;对于消除运算,所有数据对象都采用同一个属性数据标准,各数据对象的属性树节点都是同一属性树的一部分,但是属性数据值不同,通过消除运算,消除未匹配到的属性树节点;对于不能完全匹配,但具有语义相关性的维度,可近似匹配的属性数据,对其进行添加运算;
(4)根据MySqL数据库生成关系树,再对步骤(3)中生成的中间树进行编码,然后进行消除匹配得到最终的SQL查询树;
(5)利用经过添加和消除匹配后得到的SQL查询树,构成检索数据集对应的元素和元素属性,产生SQL检索语句,生成对MySqL数据库的检索,执行MySqL数据库检索,并返回一个结果集;
(6)将结果集进行整理聚合,对检索得到的数据进行分类、排序操作,并将结果返回给请求者。
CN201510566163.0A 2015-09-08 2015-09-08 一种数据库访问方法 Active CN105138674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510566163.0A CN105138674B (zh) 2015-09-08 2015-09-08 一种数据库访问方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510566163.0A CN105138674B (zh) 2015-09-08 2015-09-08 一种数据库访问方法

Publications (2)

Publication Number Publication Date
CN105138674A CN105138674A (zh) 2015-12-09
CN105138674B true CN105138674B (zh) 2018-11-02

Family

ID=54724021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510566163.0A Active CN105138674B (zh) 2015-09-08 2015-09-08 一种数据库访问方法

Country Status (1)

Country Link
CN (1) CN105138674B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109561326B (zh) * 2017-09-26 2021-02-12 北京国双科技有限公司 一种数据查询方法及装置
CN107766510B (zh) * 2017-10-23 2020-05-22 中国银行股份有限公司 一种数据处理方法、数据查询方法及装置
CN108197187B (zh) * 2017-12-26 2020-06-16 金蝶软件(中国)有限公司 查询语句的优化方法、装置、存储介质和计算机设备
CN109241007B (zh) * 2018-07-19 2021-08-13 北京亿赛通网络安全技术有限公司 一种网络环境下email大数据的预处理系统及方法
CN112445791B (zh) * 2019-08-30 2023-06-27 金色熊猫有限公司 数据管理方法与装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667200A (zh) * 2009-09-18 2010-03-10 浙江大学 一种p2p环境中的窗口查询方法
US8655913B1 (en) * 2012-03-26 2014-02-18 Google Inc. Method for locating web elements comprising of fuzzy matching on attributes and relative location/position of element
CN103699661A (zh) * 2013-12-26 2014-04-02 乐视网信息技术(北京)股份有限公司 视频资源数据的获取方法及其系统
CN104008372A (zh) * 2014-05-23 2014-08-27 南京邮电大学 一种无线多媒体传感器网络中的分布式人脸识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667200A (zh) * 2009-09-18 2010-03-10 浙江大学 一种p2p环境中的窗口查询方法
US8655913B1 (en) * 2012-03-26 2014-02-18 Google Inc. Method for locating web elements comprising of fuzzy matching on attributes and relative location/position of element
CN103699661A (zh) * 2013-12-26 2014-04-02 乐视网信息技术(北京)股份有限公司 视频资源数据的获取方法及其系统
CN104008372A (zh) * 2014-05-23 2014-08-27 南京邮电大学 一种无线多媒体传感器网络中的分布式人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据融合技术的花木盆景生产基地WSN设计;李可学;《湖北农业科学》;20130720;第52卷(第14期);全文 *

Also Published As

Publication number Publication date
CN105138674A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN105138674B (zh) 一种数据库访问方法
CN106663056B (zh) 文件系统中的元数据索引搜索
CN106528648B (zh) 结合Redis内存数据库的分布式RDF关键词近似搜索方法
JP2017037648A (ja) ハイブリッドデータを保存するためのハイブリッドデータストレージシステム、方法及びプログラム
US8825621B2 (en) Transformation of complex data source result sets to normalized sets for manipulation and presentation
US9229967B2 (en) Efficient processing of path related operations on data organized hierarchically in an RDBMS
CN107451225A (zh) 用于半结构化数据的可缩放分析平台
CN102402507B (zh) 一种soa多消息机制的异构数据集成系统和方法
CN114218400A (zh) 基于语义的数据湖查询系统及方法
CN110390352A (zh) 一种基于相似性哈希的图像暗数据价值评估方法
CN106874425B (zh) 基于Storm的实时关键词近似搜索算法
US20210073196A1 (en) Semantic, single-column identifiers for data entries
CN103412903B (zh) 基于兴趣对象预测的物联网实时搜索方法及系统
CN109166615A (zh) 一种随机森林哈希的医学ct图像存储与检索方法
CN107491476A (zh) 一种适用于多种大数据管理系统的数据模型转换及查询分析方法
Michel et al. Translation of Heterogeneous Databases into RDF, and Application to the Construction of a SKOS Taxonomical Reference
CN104636265B (zh) 一种cimxml文档的高效内存模型组织的访问方法
AU2007275507B2 (en) Semantic aware processing of XML documents
KR101467707B1 (ko) 지식 베이스의 개체 매칭 방법 및 이를 위한 장치
CN108241709A (zh) 一种数据集成方法、装置和系统
Li et al. Aggregate nearest keyword search in spatial databases
Gunaratna et al. Alignment and dataset identification of linked data in semantic web
CN101504660A (zh) 一种纯扩展标记语言数据库的查询管理方法及其系统
Babu et al. Context aware reliable sensor selection in IoT
Choi et al. Building methods of intelligent data catalog based on graph database for data sharing platform

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190530

Address after: 266300 Room 907, Convenient Service Center, Jiaodong Street Office, Qingdao City, Shandong Province

Patentee after: Qingdao Lianzhong Zhixin Technology Co., Ltd.

Address before: 610000 West Section 399 Fucheng Avenue, Chengdu High-tech Development Zone, Sichuan Province, 7 Blocks 3-1208

Patentee before: Chengdu Boyuan Technology Co., Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 266000 airport service building, No.1 Zhanqian Avenue, Qingdao Airport Economic Demonstration Zone, Jiaodong sub district office, Jiaozhou, Qingdao, Shandong Province

Patentee after: Qingdao lianzhongxin cloud Technology Co., Ltd

Address before: 266300 Room 907, Convenient Service Center, Jiaodong Street Office, Qingdao City, Shandong Province

Patentee before: Qingdao Lianzhong Zhixin Technology Co.,Ltd.