CN107402920A

CN107402920A - 确定关系数据库表关联复杂度的方法和装置

Info

Publication number: CN107402920A
Application number: CN201610329065.XA
Authority: CN
Inventors: 许文靖
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2016-05-18
Filing date: 2016-05-18
Publication date: 2017-11-28
Anticipated expiration: 2036-05-18
Also published as: CN107402920B

Abstract

本发明提供一种确定关系数据库表关联复杂度的方法和装置，能够根据基于关系数据库应用系统的日志或配置文件得到应用系统的表关联的复杂程度，不仅为应用系统的质量管理提供量化支持；也为应用系统的优化和质量管理提供客观的决策依据。本发明的方法包括：获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；根据预先保存的表数据词典对每条记录中的多个词进行筛选以得到每条记录的分词序列；根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；计算关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为关系数据库表的关联复杂度。

Description

确定关系数据库表关联复杂度的方法和装置

技术领域

本发明涉及计算机及其软件技术领域，特别涉及一种确定关系数据库表关联复杂度的方法和装置。

背景技术

基于关系数据库的应用系统开发通常采用三层(数据访问层，业务逻辑层和展示层)或多层(业务逻辑层拆分成多个子层)架构，其中数据访问层主要承担基本的数据访问逻辑(增删改查)。在实际应用中，基于关系数据库的应用系统运行的时间越久，新增功能和漏洞修复的次数越多，SQL数据库关联就越多，数据访问层的复杂度越来越高，系统就越难以维护。

可度量的才是可管理的，只有明确了SQL数据库关联复杂程度，才能够及时识别到数据访问层的可维护性恶化并找到改进方案。圈复杂度是一种代码复杂度的衡量标准。在软件测试的概念里，圈复杂度“用来衡量一个模块判定结构的复杂程度，数量上表现为独立线性路径条数，即合理的预防错误所需测试的最少路径条数，圈复杂度大说明程序代码可能质量低且难于测试和维护，根据经验，程序的可能错误和高的圈复杂度有着很大关系”。圈复杂度是以图论为基础的，通用的公式是V(G)＝e–n+2,e代表在控制流图中的边的数量(对应代码中顺序结构的部分)，n代表在控制流图中的节点数量，包括起点和终点。

现有的复杂度计算方法虽然可用于解决程序复杂度度量的问题，但不能直接用于评估表关联复杂度，无法提供数据库表关联复杂程度的量化结果，更无法对系统优化和质量管理提供客观的决策依据。

发明内容

有鉴于此，本发明提供一种确定关系数据库表关联复杂度的方法和装置，能够根据基于关系数据库应用系统的日志或配置文件中提取数据库表的关联指纹，并基于圈复杂度算法度量应用系统的表关联的复杂程度，不仅为应用系统的质量管理提供量化支持，提供数据库表关联复杂程度的量化结果，提供数据库表关联复杂库的定期报告；而且为应用系统的优化和质量管理提供客观的决策依据。

为实现上述目的，根据本发明的一个方面，提供了一种确定关系数据库表关联复杂度的方法。

本发明的确定关系数据库表关联复杂度的方法包括：获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列；所述表数据库词典包括数据库表名和预设的语法关键词；根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度。

可选地，所述获取系统中的日志文件和/或配置文件的步骤之前，还包括：获取数据库中的数据库表名；将所述数据库表名和预设的语法关键词按照设定的格式进行保存以得到表数据词典。

可选地，根据预先保存的表数据词典对所述每条记录中的词进行筛选以得到每条记录的分词序列的步骤包括：将每条记录中的词与所述表数据词典中的词进行比对，将所有存在于所述表数据词典中的词作为该条记录的分词序列。

可选地，根据每一个分词序列生成对应于该分词序列的关联指纹的步骤包括：查找分词序列中的标示关联开始的语法关键词和标示关联结束的语法关键词；根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹。

可选地，根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹的步骤包括：将分词序列的第一对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名去重，然后按照数据库表名的先后顺序记录去重后数据库表名之间的关联关系以得到该分词序列的子关联指纹；将分词序列的第二对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名依次和所述子关联指纹中的数据库表名进行比对，并且在该数据库表名与所述子关联指纹中的数据库表名不重合的情况下记录该数据库表名与所述子关联指纹中处于最后的数据库表名之间的关联关系；按照标示关联开始的语法关键词和标示关联结束的语法关键词出现的顺序处理该分词系列中剩余标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名，从而得到该分词序列的关联指纹。

可选地，根据所得到的关联指纹生成关联图数据结构的步骤包括：统计所有分词序列的关联指纹中的数据库表名，将该数据库表名去重，将去重后剩余的数据库表名记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边，从而得到关联图数据结构。

可选地，计算所述关联图数据结构的复杂度的步骤包括：统计所述关联图数据结构中所包括的顶点和边的个数；根据公式V(G)＝e–n+2计算关联图数据结构的复杂度；其中e为关联图数据结构的边的个数；n为关联图数据结构的顶点的个数；V(G)为关联图数据结构的复杂度。

根据本发明的另一个方面，提供了一种确定关系数据库表关联复杂度的装置。

本发明的确定关系数据库表关联复杂度的装置包括：获取模块，用于获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；筛选模块，用于根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列；所述表数据库词典包括数据库表名和预设的语法关键词；生成模块，用于根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；计算模块，用于计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度。

可选地，还包括数据词典生成模块，用于获取数据库中的数据库表名，然后将所述数据库表名和预设的语法关键词按照设定的格式进行保存以得到表数据词典。

可选地，所述筛选模块还用于：将每条记录中的词与所述表数据词典中的词进行比对，将所有存在于所述表数据词典中的词作为该条记录的分词序列。

可选地，所述生成模块还用于查找分词序列中的标示关联开始的语法关键词和标示关联结束的语法关键词，然后根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹。

可选地，所述生成模块还用于：将分词序列的第一对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名去重，然后按照数据库表名的先后顺序记录去重后数据库表名之间的关联关系以得到该分词序列的子关联指纹；将分词序列的第二对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名依次和所述子关联指纹中的数据库表名进行比对，并且在该数据库表名与所述子关联指纹中的数据库表名不重合的情况下记录该数据库表名与所述子关联指纹中处于最后的数据库表名之间的关联关系；按照标示关联开始的语法关键词和标示关联结束的语法关键词出现的顺序处理该分词系列中剩余标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名，从而得到该分词序列的关联指纹。

可选地，所述生成模块还用于统计所有分词序列的关联指纹中的数据库表名，将该数据库表名去重，将去重后剩余的数据库表名记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边，从而得到关联图数据结构。

可选地，所述计算模块还用于：统计所述关联图数据结构中所包括的顶点和边的个数；根据公式V(G)＝e–n+2计算关联图数据结构的复杂度；其中e为关联图数据结构的边的个数；n为关联图数据结构的顶点的个数；V(G)为关联图数据结构的复杂度。

根据本发明的技术方案，由于能够根据基于关系数据库应用系统的日志或配置文件中提取数据库表的关联指纹，并基于圈复杂度算法度量应用系统的表关联的复杂程度，不仅能为应用系统的质量管理提供量化支持，提供数据库表关联复杂程度的量化结果，提供数据库表关联复杂库的定期报告；而且为应用系统的优化和质量管理提供客观的决策依据。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明实施例的一种确定关系数据库表关联复杂度的装置的示意图；

图2是根据本发明实施例的一种确定关系数据库表关联复杂度的方法的示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图1是根据本发明实施例的一种确定关系数据库表关联复杂度的装置的示意图。如图1所示，本发明实施例的确定关系数据库表关联复杂度的装置10主要包括获取模块11、筛选模块12、生成模块13、以及计算模块14；获取模块11用于获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；筛选模块12用于根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列；所述表数据库词典包括数据库表名和预设的语法关键词；生成模块13用于根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；计算模块14用于计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度；其中，预设的语法关键词可以为SQL语法关键词。

本发明实施例的确定关系数据库表关联复杂度的装置10还可包括数据词典生成模块(图中未示出)，用于获取数据库中的数据库表名，然后将所述数据库表名和预设的SQL语法关键词按照设定的格式进行保存以得到表数据词典。

本发明实施例的确定关系数据库表关联复杂度的装置10的筛选模块12还可用于：将每条记录中的词与所述表数据词典中的词进行比对，如果该词存在于所述表数据词典中，则保留该词；否则，删除该词；然后将所述记录中剩余的词作为该条记录的分词序列。

本发明实施例的确定关系数据库表关联复杂度的装置10的生成模块13还可用于查找分词序列中的标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词，然后根据分词序列每一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间的数据库表名生成该分词序列的关联指纹。

本发明实施例的确定关系数据库表关联复杂度的装置10的生成模块13还可用于：将分词序列的第一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名去重，然后按照数据库表名的先后顺序记录去重后数据库表名之间的关联关系以得到该分词序列的子关联指纹；将分词序列的第二对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名依次和所述子关联指纹中的数据库表名进行比对，并且在该数据库表名与所述子关联指纹中的数据库表名不重合的情况下记录该数据库表名与所述子关联指纹中处于最后的数据库表名之间的关联关系；按照标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词出现的顺序处理该分词系列中剩余标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名，从而得到该分词序列的关联指纹。

本发明实施例的确定关系数据库表关联复杂度的装置10的生成模块13还可用于统计所有分词序列的关联指纹中的数据库表名，将该数据库表名去重，将去重后剩余的数据库表名记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边，从而得到关联图数据结构。

本发明实施例的确定关系数据库表关联复杂度的装置10的计算模块还可用于：统计所述关联图数据结构中所包括的顶点和边的个数；根据公式V(G)＝e–n+2计算关联图数据结构的复杂度；其中e为关联图数据结构的边的个数；n为关联图数据结构的顶点的个数；V(G)为关联图数据结构的复杂度。

图2是根据本发明实施例的一种确定关系数据库表关联复杂度的方法的示意图。如图2所示，本发明实施例的确定关系数据库表关联复杂度的方法的执行主体可以是图1中所提到的确定关系数据库表关联复杂度的装置10，该方法主要包括如下步骤S20至S23。

步骤S20：获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词。在该步骤中所提到的日志文件包括系统日志、SQL日志文件、以及其他包含标准SQL(ANSI SQL92)语句的文本文件等；所提到的配置文件包括配置有SQL的XML文件和程序源码等；在获取到上述的日志文件和/或配置文件后，确定关系数据库表关联复杂度的装置10对文件中的每条记录做分词，从而得到每条分词记录所包括的多个词。

在步骤S20之前，确定关系数据库表关联复杂度的装置10根据数据库中的数据生成表数据词典；即，确定关系数据库表关联复杂度的装置10首先获取关系数据库中的数据库表名，再将所述数据库表名和预设的SQL语法关键词按照设定的格式进行保存以得到表数据词典；其中，表数据词典包括库表元数据词和SQL语法关键词两部分；库表元数据词可以通过人工录入或JDBC接口从关系数据库中抓取库表元数据，并且至少包含表名和视图名；SQL语法关键词至少包括from，where；其中，可设定语法关键词from用于标示表关联的起始，设定语法关键词where用于标示表关联的结束；此处所提到的关系数据库指的是支持ANSI SQL92SQL标准的数据库，例如oracle、db2、informix、以及mysql等；如果关系数据库中的数据库表名进行了更新，比如新增了1张表，那么，确定关系数据库表关联复杂度的装置10重新获取关系数据库中的数据库表名以更新表数据词典。

步骤S21：根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列。在该步骤中，确定关系数据库表关联复杂度的装置10根据预先所保存的表数据词典对步骤S20中得到的每条记录中的词进行筛选，即将每条记录中的词与表数据词典中的词进行比对，如果该词存在于所述表数据词典中，则保留该词；否则，删除该词；然后再将所述记录中剩余的词作为该条记录的分词序列。

步骤S22：根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构。在该步骤中，确定关系数据库表关联复杂度的装置10查找分词序列中的标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词；比如，设定语法关键词from用于标示表关联的起始，设定语法关键词where用于标示表关联的结束；

下面以具体的两个分词序列来进行说明,假设在系统日志文件中有2条SQL日志：

INFO-2016-02-23 13:44:33.094com.demo.Callback::DelEvent–select name,code from T_1,T_2as f where T_1.code＝f.code and exists(select 1from T_3,T_1as g where T_3.type＝f.code and T_3.flag＝g.flag)execute time:257ms；

INFO-2016-02-23 13:45:08.432com.demo.Callback::DelEvent–select count(*)from T_2,T_4where T_2.group＝T_4.groupcode executetime:549ms。

上述两条日志经过表数据词典筛选后得到的分词序列分别为：

分词序列1：[from,T_1,T_2,where,T_1,from,T_3,T_1,where，T_3,T_3]；

分词序列2：[from,T_2,T_4，where，T_2,T_4]。

首先，确定关系数据库表关联复杂度的装置10通过查找分词序列中的SQL语法关键词from和where，从而确定每一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间的数据库表名；通过查找序列1中包括两对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词，第一对语法关键词之间的数据库表名包括T_1和T_2；第二对语法关键词之间的数据库表名包括T_3和T_1；序列2中包括一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词，语法关键词之间的数据库表名包括T_2和T_4；

其次，确定关系数据库表关联复杂度的装置10根据分词序列每一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间的数据库表名生成该分词序列的关联指纹

对于分词序列1来说，将分词序列1的第一对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名去重，由于第一对语法关键词之间包括T_1和T_2，没有重复的数据库表名，只需按照数据库表名的先后顺序记录数据库表名之间的关联关系，即记录数据库表名T_1和T_2之间的关联关系，从而得到分词序列1的子关联指纹；然后将分词序列1的第二对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名依次和所述子关联指纹中的数据库表名进行比对，即依次将数据库表名T_3和T_1子关联指纹中的数据库表名进行比对，将数据库表名T_3与子关联指纹中的数据库表名进行比对时，与数据库表名T_1和T_2都不重合，因而记录数据库表名T_3与子关联指纹中处于最后的数据库表名(即数据库表名T_2)之间的关联关系，再将将数据库表名T_1与子关联指纹中的数据库表名进行比对时，由于T_1与子关联指纹中的T_1重合，因而不作处理；由于分词序列1中所包括的数据库表名已处理完成，因而得到了分词序列1的关联指纹；

对于分词序列2，将分词序列2的标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名去重，由于第一对语法关键词之间包括T_2和T_4，没有重复的数据库表名，只需按照数据库表名的先后顺序记录数据库表名之间的关联关系，即记录数据库表名T_2和T_4之间的关联关系，从而得到分词序列2的关联指纹；

如果分词序列中包括两对以上标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词，则根据处理第二对标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间包括的数据库表名的方法，同时按照标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词出现的顺序处理该分词系列中剩余标示关联开始的SQL语法关键词和标示关联结束的SQL语法关键词之间所包括的数据库表名，从而得到分词序列的关联指纹。

最后，确定关系数据库表关联复杂度的装置10根据所有分词序列的关联指纹得到关联图数据结构。在该实施例中，即统计分词序列1和分词序列2的关联指纹中的数据库表名，并将两个关联指纹中所包括的数据库表名去重；将去重后剩余的数据库表名(即T_1、T_2、T_3和T_4)记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边(即T_1和T_2之间的关联关系记为关联图数据结构的一条边、T_2和T_3之间的关联关系记为关联图数据结构的一条边、T_2和T_4之间的关联关系记为关联图数据结构的一条边)，从而得到关联图数据结构。

步骤S23：计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度。在该步骤中，确定关系数据库表关联复杂度的装置10统计步骤S22中关联图数据结构中所包括的顶点和边的个数(对于本实施例来说，关联图数据结构中包括4个顶点和3条边)，因而，根据公式V(G)＝e–n+2计算得到的本实施例的关联图数据结构的复杂度为1；其中e为关联图数据结构的边的个数；n为关联图数据结构的顶点的个数；V(G)为关联图数据结构的复杂度；因而，本发明实施例技术方案通过采集日志和配置文件得到了可以度量在运行的基于关系数据库的系统的库表关联复杂度。

根据本发明实施例的技术方案，由于能够根据基于关系数据库应用系统的日志或配置文件中提取数据库表的关联指纹，并基于圈复杂度算法度量应用系统的表关联的复杂程度，不仅能为应用系统的质量管理提供量化支持，提供数据库表关联复杂程度的量化结果，提供数据库表关联复杂库的定期报告；而且为应用系统的优化和质量管理提供客观的决策依据。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种确定关系数据库表关联复杂度的方法，其特征在于，包括：

获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；

根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列；所述表数据库词典包括数据库表名和预设的语法关键词；

根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；

计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度。

2.根据权利要求1所述的方法，其特征在于，所述获取系统中的日志文件和/或配置文件的步骤之前，还包括：

获取数据库中的数据库表名；

将所述数据库表名和预设的语法关键词按照设定的格式进行保存以得到表数据词典。

3.根据权利要求1所述的方法，其特征在于，根据预先保存的表数据词典对所述每条记录中的词进行筛选以得到每条记录的分词序列的步骤包括：

将每条记录中的词与所述表数据词典中的词进行比对，将所有存在于所述表数据词典中的词作为该条记录的分词序列。

4.根据权利要求1所述的方法，其特征在于，根据每一个分词序列生成对应于该分词序列的关联指纹的步骤包括：

查找分词序列中的标示关联开始的语法关键词和标示关联结束的语法关键词；

根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹。

5.根据权利要求4所述的方法，其特征在于，根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹的步骤包括：

将分词序列的第一对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名去重，然后按照数据库表名的先后顺序记录去重后数据库表名之间的关联关系以得到该分词序列的子关联指纹；

将分词序列的第二对标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名依次和所述子关联指纹中的数据库表名进行比对，并且在该数据库表名与所述子关联指纹中的数据库表名不重合的情况下记录该数据库表名与所述子关联指纹中处于最后的数据库表名之间的关联关系；

按照标示关联开始的语法关键词和标示关联结束的语法关键词出现的顺序处理该分词系列中剩余标示关联开始的语法关键词和标示关联结束的语法关键词之间所包括的数据库表名，从而得到该分词序列的关联指纹。

6.根据权利要求1至5中任一项所述的方法，其特征在于，根据所得到的关联指纹生成关联图数据结构的步骤包括：

统计所有分词序列的关联指纹中的数据库表名，将该数据库表名去重，将去重后剩余的数据库表名记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边，从而得到关联图数据结构。

7.根据权利要求1至5中任一项所述的方法，其特征在于，计算所述关联图数据结构的复杂度的步骤包括：

统计所述关联图数据结构中所包括的顶点和边的个数；

根据公式V(G)＝e–n+2计算关联图数据结构的复杂度；其中e为关联图数据结构的边的个数；n为关联图数据结构的顶点的个数；V(G)为关联图数据结构的复杂度。

8.一种确定关系数据库表关联复杂度的装置，其特征在于，包括：

获取模块，用于获取基于关系数据库的应用系统的日志文件和/或配置文件，并对获取的文件中的每条记录做分词以得到多个词；

筛选模块，用于根据预先保存的表数据词典对所述每条记录中的所述多个词进行筛选以得到每条记录的分词序列；所述表数据库词典包括数据库表名和预设的语法关键词；

生成模块，用于根据每一个所述分词序列生成对应于该分词序列的关联指纹，再根据所得到的关联指纹生成关联图数据结构；

计算模块，用于计算所述关联图数据结构的复杂度，以及将该关联图数据结构的复杂度作为所述关系数据库表的关联复杂度。

9.根据权利要求8所述的装置，其特征在于，还包括数据词典生成模块，用于获取数据库中的数据库表名，然后将所述数据库表名和预设的语法关键词按照设定的格式进行保存以得到表数据词典。

10.根据权利要求8所述的装置，其特征在于，所述筛选模块还用于：将每条记录中的词与所述表数据词典中的词进行比对，将所有存在于所述表数据词典中的词作为该条记录的分词序列。

11.根据权利要求8所述的装置，其特征在于，所述生成模块还用于查找分词序列中的标示关联开始的语法关键词和标示关联结束的语法关键词，然后根据分词序列每一对标示关联开始的语法关键词和标示关联结束的语法关键词之间的数据库表名生成该分词序列的关联指纹。

12.根据权利要求11所述的装置，其特征在于，所述生成模块还用于：

13.根据权利要求8至12中任一项所述的装置，其特征在于，所述生成模块还用于统计所有分词序列的关联指纹中的数据库表名，将该数据库表名去重，将去重后剩余的数据库表名记为关联图数据结构的顶点；以及将所述剩余的数据库表名之间的关联关系记为关联图数据结构的边，从而得到关联图数据结构。

14.根据权利要求8至12中任一项所述的装置，其特征在于，所述计算模块还用于：

统计所述关联图数据结构中所包括的顶点和边的个数；