CN109241104A - 决策型分布式数据库系统中aisql的解析器及其实现方法 - Google Patents

决策型分布式数据库系统中aisql的解析器及其实现方法 Download PDF

Info

Publication number
CN109241104A
CN109241104A CN201811191135.5A CN201811191135A CN109241104A CN 109241104 A CN109241104 A CN 109241104A CN 201811191135 A CN201811191135 A CN 201811191135A CN 109241104 A CN109241104 A CN 109241104A
Authority
CN
China
Prior art keywords
sql
model
unit
resolver
syntax tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811191135.5A
Other languages
English (en)
Other versions
CN109241104B (zh
Inventor
张德辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aowei Technology Co.,Ltd.
Original Assignee
Beijing Juyun Weizhi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Juyun Weizhi Information Technology Co Ltd filed Critical Beijing Juyun Weizhi Information Technology Co Ltd
Priority to CN201811191135.5A priority Critical patent/CN109241104B/zh
Publication of CN109241104A publication Critical patent/CN109241104A/zh
Application granted granted Critical
Publication of CN109241104B publication Critical patent/CN109241104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明属于支持AI SQL的SQL解析器,特别涉及一种决策型分布式数据库系统中AI SQL的解析器及其实现方法。本发明提供一种新的决策型分布式数据库系统中AI SQL的解析器及其实现方法,该决策型分布式数据库系统中AI SQL的解析器及其实现方法采用AI SQL作为SQL 2011规范的扩展,和二次开发AI分析程序相比,由于SQL语言天生声明性的特征,这使得AI SQL远比其他如Python/Java/C/C++这些要更容易掌握和使用,一般熟练掌握SQL的数据分析师即能掌握,无需增加掌握Python/Java/C/C++这些AI编程开发人员。并且AI SQL使用决策型数据作为执行平台,和二次开发AI分析程序的过程相比,减少了编译、打包、部署的环节,测试工作也更简单,从而降低了AI分析项目的人员成本和实施周期。

Description

决策型分布式数据库系统中AISQL的解析器及其实现方法
技术领域
本发明属于支持AI SQL的SQL解析器,特别涉及一种决策型分布式数据库系统中AI SQL的解析器及其实现方法。
背景技术
现有的SQL解析器支持标准SQL核心语法并且有各自特定的扩展功能语法,但是缺少对AI模型管理和应用相关的操作的语法解析的支持。这使得用户不得不借助于AI开发工具包来弥补这个问题,但是AI工具包均为编程API方式提供给用户,这需要用户具备某种通用编程语言(如C/C++/Python/Java)的开发能力,这些语言学习曲线明显高于声明式查询语言SQL,这对于采用SQL作为主要分析手段的传统数据分析师而言要求过于苛刻。另外AI工具进行二次开发存在编译、打包、测试、部署的问题,其项目实施成本、风险和周期远远高于传统数据分析过程。
发明内容
针对上述问题,本发明提供一种新的决策型分布式数据库系统中AI SQL的解析器及其实现方法,该新的决策型分布式数据库系统中AI SQL的解析器及其实现方法采用新的语法定义来实现AI SQL并且对复杂的数据分析任务能够整体进行优化执行,从而节省了硬件成本。
本发明具体技术方案如下:
本发明提供一种决策型分布式数据库系统中AI SQL的解析器,所述支持AI SQL的SQL解析器包括:
语法定义模块,用于定义实现AI SQL的语法;
AI SQL解析模块,用于解析输入的AI SQL语句,得到一颗解析好的语法树;
逻辑执行计划生成模块,用于根据解析好的语法树新型创建逻辑执行计划。
本发明的有益效果如下:
本发明提供一种新的决策型分布式数据库系统中AI SQL的解析器及其实现方法,该决策型分布式数据库系统中AI SQL的解析器及其实现方法采用AI SQL作为SQL 2011规范的扩展,和二次开发AI分析程序相比,由于SQL语言天生声明性的特征,这使得AI SQL远比其他如Python/Java/C/C++这些要更容易掌握和使用,一般熟练掌握SQL的数据分析师即能掌握,无需增加掌握Python/Java/C/C++这些AI编程开发人员。并且AI SQL使用决策型数据作为执行平台,和二次开发AI分析程序的过程相比,减少了编译、打包、部署的环节,测试工作也更简单,从而降低了AI分析项目的人员成本和实施周期。
附图说明
图1为实施例1决策型分布式数据库系统中AI SQL的解析器的结
构框图;
图2为实施例2语法定义模块的结构框图;
图3为实施例2AI SQL解析模块的结构框图;
图4为实施例3逻辑执行计划生成模块的结构框图;
图5为实施例4AI SQL解析模块的结构框图;
图6为实施例5决策型分布式数据库的结构框图;
图7为实施例6决策型分布式数据库系统中AI SQL的解析器实现
方法的流程图;
图8为实施例7步骤S1的流程图;
图9为实施例7步骤S2的流程图;
图10为实施例8步骤S3的流程图。
具体实施方式
下面结合附图和以下实施例对本发明作进一步详细说明。
实施例1
本发明实施例1提供一种决策型分布式数据库系统中AI SQL的解析器,如图1所示,所述支持AI SQL的SQL解析器包括:
语法定义模块10,用于定义实现AI SQL的语法;
AI SQL解析模块20,用于解析输入的AI SQL语句,得到一颗解析好的语法树;
逻辑执行计划生成模块30,用于根据解析好的语法树新型创建逻辑执行计划。
本发明中采用新的语法定义来实现AI SQL并且AI SQL这种SQL2011标准的扩展SQL,减低了AI使用的门槛以及对AI编程开发人员的需求,节省了AI项目的成本,另外在充分利用整个集群整体资源(GPU,CPU和内存等等)的同时,对复杂的数据分析任务能够整体进行优化执行,相对于现有方案而言,消耗更少的硬件资源,从而节省了硬件成本。
实施例2
一种决策型分布式数据库系统中AI SQL的解析器,如图2所示,与实施例1不同的是:所述语法定义模块10包括:
AI模型创建的语法定义单元101,用于对AI模型创建的语法进行定义,
<model definition>::=CREATE[<model scope>]MODEL<model name>
AS<model constructor name><SQL argument list>
<model scope>::=<global or local>TEMPORARY
<global or local>::=GLOBAL|LOCAL
<model name>::=<local or schema qualified name>
<local or schema qualified name>::=同SQL 2011规范中定义
<model constructor name>::=[<schema name><period>]<qualifiedidentifier>
<schema name>::=同SQL 2011规范中定义
<period>::=.
<qualified identifier>::=同SQL 2011规范中定义
<SQL argument list>::=同SQL 2011规范中定义;
AI模型更新的语法定义单元102,用于对AI模型更新的语法进行定义,
<update model definition>::=UPDATE[<model scope>]MODEL<model name>
AS<model constructor name><SQL argument list>;
AI模型评估的语法定义单元103,用于对AI模型评估的语法进行定义,
<evaluate model definition>::=SELECT<select list>FROM<modelevaluation function name><SQL argument list>
<select list>::=同SQL 2011规范中定义
<model evaluation function name>::=[<schema name><period>]
<qualified identifier>
其中<SQL argument list>必须至少包含一个MODEL的直接名称或构造表达式(比如采用调用DECISION_TREE_TRAIN构造的一个临时匿名的MODEL);
手动指令领域数据类型的语法定义单元104,用于对手动指令领域数据类型的语法进行定义,
<alter column AI-domain type definition>::=ALTER[COLUMN]
<column name>
<alter column AI-domain type clause>
<alter column AI-domain type clause>::=SET AI DOMAIN TYPE
<AI-domain type>
<AI-domain type>::=<basic AI-domain type>|<user defined AI-domaintype>
|<collection AI-domain type>
<basic AI-domain type>::=<qualified identifier>
<user defined AI-domain type>::=<qualified identifier>
<collection AI-domain type>::=<array AI-domain type>|<multiset AI-domain type>
<array AI-domain type>::=<AI-domain type>ARRAY
<multiset AI-domain type>::=<AI-domain type>MULTISET
其中<basic AI-domain type>中均为系统内置在特征知识库中的领域数据类型,比如年龄、地址、邮箱、性别、手机号、身份证号、百分制评分、五分制评分、海拔等等。<userdefined AI-domain type>是用户扩展的领域数据类型;
AI模型应用的语法定义单元105,用于对AI模型应用的语法进行定义,其中AI模型的应用是预测函数根据用户输入的数据集合、选择的建好的模型生成预测结果,所述预测结果包括:分类结果、趋势、关联关系挖掘、推荐结果等等,这些结果也是一个集合,特殊情况下,这个集合可能只有一行数据,
<AI model apply definition>:=SELECT<select list>FROM<model applyfunction name><SQL argument list>
<model apply function name>::=[<schema name><period>]<qualifiedidentifier>;
AI SQL其他语法定义单元106,用于对AL SQL的其他语法进行定义,其他和SQL2011规范语法兼容保持一致。
如图3所示,本实施例中,所述AI SQL解析模块20包括:
词法分析单元201,用于将输入的AI SQL语句解析成令牌流;
语法分析单元202,用于将令牌流解析为语法树;
关系表解析单元203,用于将语法树中的关系表解析为具有存储位置等的元数据信息的关系表信息对象;
AI模型解析单元204,用于将语法树中AI模型解析为具有元数据信息的AI模型信息对象;
算法解析单元205,用于将语法树中函数的名称解析为具有完整类型信息的函数描述对象,所述函数包括AI计算函数;
解析完成单元206,用于根据上述解析得到解析好的语法树。
本发明中对AL SQL实现的语法进行具体的定义,并利用定义后的语法按照上述步骤解析输入的AI SQL语句。
实施例3
一种决策型分布式数据库系统中AI SQL的解析器,如图4所示,与实施例2不同的是:所述逻辑执行计划生成模块30包括:
连接运算步骤生成单元301,用于根据SQL的JOIN操作生成关系代数的连接运算步骤;
集合运算步骤生成单元302,用于根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;
特征工程计算步骤生成单元303,用于根据特征工程处理算法生成对应的特征工程计算步骤,其中,若是采用智能特征工程计算,则构造一通过与支持AI SQL的SQL解析器相通讯的特征工程知识库进行匹配的系列计算步骤;
AI计算步骤生成单元304,用于根据AI计算函数生成对应的AI计算步骤,包括参数的自动转换以及根据AI算法库构造逻辑执行计划的AI计算对象,其中AI算法函数为AI SQL解析模块20解析后得到的具有完整类型信息的函数描述对象;
选择运算生成单元305,用于根据SQL的条件过滤信息生成关系代数选择运算;
投影运算生成单元306,用于根据SQL的<select list>信息生成关系代数投影运算,包括表达式计算的生成;
逻辑执行计划单元307,用于根据上述运算得到一个根据语法树信息创建的逻辑执行计划,所述逻辑执行计划为一系列关系代数运算或AI运算。
本发明中按照上述步骤生成逻辑执行计划,其中对于特征工程计算步骤生成单元,如果里面包含特征工程计算则生成对应特征工程处理算法的运算步骤,其中采用智能特征工程计算的,还需构造一个通过特征知识库进行匹配的系列运算步骤。
实施例4
一种决策型分布式数据库系统中AI SQL的解析器,如图5所示,与实施例3不同的是:所述AI SQL解析模块20还包括:
验证及定位单元207,用于调取与支持AI SQL的SQL解析器相通讯的关系表及AI模型元数据库内存储的信息对AI SQL进行除了语法格式之外的正确性验证及资源对象定位;
重复性检查单元208,用于在创建关系表或AI模型时,进行重复性检查。
在AI SQL解析过程中AI SQL解析器会利用关系表及AI模型元数据库中的信息对AI SQL进行除了语法格式之外的正确性验证以及资源对象(比如某个关系表、某个AI模型、某个AI算法函数等等)定位,如果是创建表或AI模型操作,则AI SQL解析器还需进行重复性检查。
实施例5
一种决策型分布式数据库系统中AI SQL的解析器,如图6所示,与实施例4不同的是:所述支持AI SQL的SQL解析器还通讯连接有执行计划优化器1、支持AI计算的分布式执行器2、AI算法库5以及支持AI模型存储的分布式存储器6;
执行计划优化器1,用于将生成的逻辑执行计划进行优化,并生成执行代价较小的物理执行计划;
支持AI计算的分布式执行器2,用于将物理执行计划分解成多个步骤进行运行;
关系表及AI模型元数据库3,用于存储元数据表信息;
特征工程知识库4,用于存储系统内置的领域数据类型、与领域数据类型相匹配的特征处理算法的关联关系以及存储每个领域数据类型特征数据;
AI算法库5,用于集成多种AI算法以及分布式计算引擎,其中数据在不同编程语言或AI库间高效的转换传输采用Apache Arrow作为公共数据层;
支持AI模型存储的分布式存储器6,用于管理和存储关系表或AI模型的数据信息。
本发明由如上关键组件构成一个基于AI SQL和智能特征工程的决策型分布式数据库,从结构上看,一套决策型数据库就可以胜任了,这样数据不再需要从数据库导出来,也不存在数据导出的安全隐患;从功能上看,决策型数据库具备智能特征工程的能力,这是现有分析型数据库加上二次开发的AI分析程序的方案所不具备的;从成本看,决策型数据库提供AI SQL这种SQL 2011标准的扩展SQL,减低了AI使用的门槛以及对AI编程开发人员的需求,节省了AI项目的成本,另外决策型数据库功能上覆盖了完整的数据/AI模型管理、数据传统OLAP分析,AI复杂分析全过程,在充分利用整个集群整体资源(GPU,CPU和内存等等)的同时,对复杂的数据分析任务能够整体进行优化执行,相对于现有方案而言,消耗更少的硬件资源,从而节省了硬件成本;从效率看,决策型数据库的AI SQL更容易使用,智能特征工程提高了特征工程的效率,从而提高了整个AI项目实施的效率。
实施例6
一种决策型分布式数据库系统中AI SQL的解析器实现方法,如图7所示,所述方法包括:
S1:通过语法定义模块10定义实现AI SQL的语法;
S2:通过AI SQL解析模块20解析输入的AI SQL语句,得到一颗解析好的语法树;
S3:通过逻辑执行计划生成模块30根据解析好的语法树新型创建逻辑执行计划。
本发明中采用新的语法定义来实现AI SQL并且AI SQL这种SQL2011标准的扩展SQL,减低了AI使用的门槛以及对AI编程开发人员的需求,节省了AI项目的成本,另外在充分利用整个集群整体资源(GPU,CPU和内存等等)的同时,对复杂的数据分析任务能够整体进行优化执行,相对于现有方案而言,消耗更少的硬件资源,从而节省了硬件成本。
实施例7
一种决策型分布式数据库系统中AI SQL的解析器实现方法,如图8所示,与实施例6不同的是:步骤S1包括:
S11:通过AI模型创建的语法定义单元101对AI模型创建的语法进行定义;
S12:通过AI模型更新的语法定义单元102对AI模型更新的语法进行定义;
S13:通过AI模型评估的语法定义单元103对AI模型评估的语法进行定义;
S14:通过手动指令领域数据类型的语法定义单元104对手动指令领域数据类型的语法进行定义;
S15:通过AI模型应用的语法定义单元105对AI模型应用的语法进行定义;
S16:通过AI SQL其他语法定义单元106对AL SQL的其他语法进行定义。
如图9所示,本实施例中步骤S2包括:
S21:通过词法分析单元201将输入的AI SQL语句解析成令牌流;
S22:通过语法分析单元202将令牌流解析为语法树;
S23:通过关系表解析单元203将语法树中的关系表解析为具有元数据信息的关系表信息对象;
S24:通过AI模型解析单元204将语法树中AI模型解析为具有元数据信息的AI模型信息对象;
S25:通过算法解析单元205将语法树中函数的名称解析为具有完整类型信息的函数描述对象;
S26:通过解析完成单元206根据上述解析得到解析好的语法树。
本发明中对AL SQL实现的语法进行具体的定义,并利用定义后的语法按照上述步骤解析输入的AI SQL语句。
实施例8
一种决策型分布式数据库系统中AI SQL的解析器实现方法,如图10所示,与实施例6不同的是:步骤S3包括:
S31:通过连接运算步骤生成单元301根据SQL的JOIN操作生成关系代数的连接运算步骤;
S32:通过集合运算步骤生成单元302根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;
S33:通过特征工程计算步骤生成单元303根据特征工程处理算法生成对应的特征工程计算步骤;
S34:通过AI计算步骤生成单元304根据AI计算函数生成对应的AI计算步骤;
S35:通过选择运算生成单元305根据SQL的条件过滤信息生成关系代数选择运算;
S36:通过投影运算生成单元306根据SQL的<select list>信息生成关系代数投影运算;
S37:通过逻辑执行计划单元307根据上述运算得到一个根据语法树信息创建的逻辑执行计划。
本发明中按照上述步骤生成逻辑执行计划,其中对于特征工程计算步骤生成单元,如果里面包含特征工程计算则生成对应特征工程处理算法的运算步骤,其中采用智能特征工程计算的,还需构造一个通过特征知识库进行匹配的系列运算步骤。
以上所述实施例仅仅是本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的权利要求书确定的保护范围内。

Claims (10)

1.一种决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述支持AI SQL的SQL解析器包括:
语法定义模块(10),用于定义实现AI SQL的语法;
AI SQL解析模块(20),用于解析输入的AI SQL语句,得到一颗解析好的语法树;
逻辑执行计划生成模块(30),用于根据解析好的语法树新型创建逻辑执行计划。
2.根据权利要求1所述的决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述语法定义模块(10)包括:
AI模型创建的语法定义单元(101),用于对AI模型创建的语法进行定义;
AI模型更新的语法定义单元(102),用于对AI模型更新的语法进行定义;
AI模型评估的语法定义单元(103),用于对AI模型评估的语法进行定义;
手动指令领域数据类型的语法定义单元(104),用于对手动指令领域数据类型的语法进行定义;
AI模型应用的语法定义单元(105),用于对AI模型应用的语法进行定义,其中AI模型的应用是预测函数根据用户输入的数据集合、选择的建好的模型生成预测结果,所述预测结果包括:分类结果、趋势、关联关系挖掘以及推荐结果;
AI SQL其他语法定义单元(106),用于对AL SQL的其他语法进行定义。
3.根据权利要求2所述的决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述AI SQL解析模块(20)包括:
词法分析单元(201),用于将输入的AI SQL语句解析成令牌流;
语法分析单元(202),用于将令牌流解析为语法树;
关系表解析单元(203),用于将语法树中的关系表解析为具有元数据信息的关系表信息对象,所述元数据信息包括存储位置;
AI模型解析单元(204),用于将语法树中AI模型解析为具有元数据信息的AI模型信息对象;
算法解析单元(205),用于将语法树中函数的名称解析为具有完整类型信息的函数描述对象,所述函数包括AI计算函数;
解析完成单元(206),用于根据上述解析得到解析好的语法树。
4.根据权利要求3所述的决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述逻辑执行计划生成模块(30)包括:
连接运算步骤生成单元(301),用于根据SQL的JOIN操作生成关系代数的连接运算步骤;
集合运算步骤生成单元(302),用于根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;
特征工程计算步骤生成单元(303),用于根据特征工程处理算法生成对应的特征工程计算步骤,其中,若是采用智能特征工程计算,则构造一通过与支持AI SQL的SQL解析器相通讯的特征工程知识库进行匹配的系列计算步骤;
AI计算步骤生成单元(304),用于根据AI计算函数生成对应的AI计算步骤,包括参数的自动转换以及根据AI算法库构造逻辑执行计划的AI计算对象,其中AI算法函数为AI SQL解析模块(20)解析后得到的具有完整类型信息的函数描述对象;
选择运算生成单元(305),用于根据SQL的条件过滤信息生成关系代数选择运算;
投影运算生成单元(306),用于根据SQL的<select list>信息生成关系代数投影运算,包括表达式计算的生成;
逻辑执行计划单元(307),用于根据上述运算得到一个根据语法树信息创建的逻辑执行计划,所述逻辑执行计划为一系列关系代数运算或AI运算。
5.根据权利要求4所述的决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述AI SQL解析模块(20)还包括:
验证及定位单元(207),用于调取与支持AI SQL的SQL解析器相通讯的关系表及AI模型元数据库内存储的信息对AI SQL进行除了语法格式之外的正确性验证及资源对象定位;
重复性检查单元(208),用于在创建关系表或AI模型时,进行重复性检查。
6.根据权利要求5所述的决策型分布式数据库系统中AI SQL的解析器,其特征在于,所述支持AI SQL的SQL解析器还通讯连接有执行计划优化器(1)以及支持AI计算的分布式执行器(2);
执行计划优化器(1),用于将生成的逻辑执行计划进行优化,并生成执行代价较小的物理执行计划;
支持AI计算的分布式执行器(2),用于将物理执行计划分解成多个步骤进行运行;
关系表及AI模型元数据库(3),用于存储元数据表信息;
特征工程知识库(4),用于存储系统内置的领域数据类型、与领域数据类型相匹配的特征处理算法的关联关系以及存储每个领域数据类型特征数据。
7.一种决策型分布式数据库系统中AI SQL的解析器实现方法,其特征在于,所述方法包括:
S1:通过语法定义模块(10)定义实现AI SQL的语法;
S2:通过AI SQL解析模块(20)解析输入的AI SQL语句,得到一颗解析好的语法树;
S3:通过逻辑执行计划生成模块(30)根据解析好的语法树新型创建逻辑执行计划。
8.根据权利要求7所述的决策型分布式数据库系统中AI SQL的解析器实现方法,其特征在于,步骤S1包括:
S11:通过AI模型创建的语法定义单元(101)对AI模型创建的语法进行定义;
S12:通过AI模型更新的语法定义单元(102)对AI模型更新的语法进行定义;
S13:通过AI模型评估的语法定义单元(103)对AI模型评估的语法进行定义;
S14:通过手动指令领域数据类型的语法定义单元(104)对手动指令领域数据类型的语法进行定义;
S15:通过AI模型应用的语法定义单元(105)对AI模型应用的语法进行定义;
S16:通过AI SQL其他语法定义单元(106)对AL SQL的其他语法进行定义。
9.根据权利要求7所述的决策型分布式数据库系统中AI SQL的解析器实现方法,其特征在于,步骤S2包括:
S21:通过词法分析单元(201)将输入的AI SQL语句解析成令牌流;
S22:通过语法分析单元(202)将令牌流解析为语法树;
S23:通过关系表解析单元(203)将语法树中的关系表解析为具有元数据信息的关系表信息对象;
S24:通过AI模型解析单元(204)将语法树中AI模型解析为具有元数据信息的AI模型信息对象;
S25:通过算法解析单元(205)将语法树中函数的名称解析为具有完整类型信息的函数描述对象;
S26:通过解析完成单元(206)根据上述解析得到解析好的语法树。
10.根据权利要求7所述的决策型分布式数据库系统中AI SQL的解析器实现方法,其特征在于,步骤S3包括:
S31:通过连接运算步骤生成单元(301)根据SQL的JOIN操作生成关系代数的连接运算步骤;
S32:通过集合运算步骤生成单元(302)根据SQL的并/交/差/除集合操作生成相应的关系代数并/交/差/除运算步骤;
S33:通过特征工程计算步骤生成单元(303)根据特征工程处理算法生成对应的特征工程计算步骤;
S34:通过AI计算步骤生成单元(304)根据AI计算函数生成对应的AI计算步骤;
S35:通过选择运算生成单元(305)根据SQL的条件过滤信息生成关系代数选择运算;
S36:通过投影运算生成单元(306)根据SQL的<select list>信息生成关系代数投影运算;
S37:通过逻辑执行计划单元(307)根据上述运算得到一个根据语法树信息创建的逻辑执行计划。
CN201811191135.5A 2018-10-12 2018-10-12 决策型分布式数据库系统中aisql的解析器及其实现方法 Active CN109241104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811191135.5A CN109241104B (zh) 2018-10-12 2018-10-12 决策型分布式数据库系统中aisql的解析器及其实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811191135.5A CN109241104B (zh) 2018-10-12 2018-10-12 决策型分布式数据库系统中aisql的解析器及其实现方法

Publications (2)

Publication Number Publication Date
CN109241104A true CN109241104A (zh) 2019-01-18
CN109241104B CN109241104B (zh) 2021-11-02

Family

ID=65052112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811191135.5A Active CN109241104B (zh) 2018-10-12 2018-10-12 决策型分布式数据库系统中aisql的解析器及其实现方法

Country Status (1)

Country Link
CN (1) CN109241104B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079407A (zh) * 2019-12-13 2020-04-28 上海众言网络科技有限公司 对用户输入的内容进行解析的方法和装置
CN111522816A (zh) * 2020-04-16 2020-08-11 云和恩墨(北京)信息技术有限公司 基于数据库引擎的数据处理方法、装置、终端及介质
WO2020233367A1 (zh) * 2019-05-22 2020-11-26 深圳壹账通智能科技有限公司 区块链数据存储和查询方法、装置、设备及存储介质
CN112527794A (zh) * 2020-12-07 2021-03-19 广州海量数据库技术有限公司 实现数据库中集合数据类型的数据处理方法及系统
CN116303372A (zh) * 2023-05-19 2023-06-23 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于Hive的前置知识库优化方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100691261B1 (ko) * 2005-12-01 2007-03-12 한국전자통신연구원 확장성 생성 언어 변경 처리 시스템 및 그 방법
CN101017458A (zh) * 2007-03-02 2007-08-15 北京邮电大学 基于源代码静态分析的软件安全代码分析器及其检测方法
US20100153321A1 (en) * 2006-04-06 2010-06-17 Yale University Framework of hierarchical sensory grammars for inferring behaviors using distributed sensors
CN102609451A (zh) * 2012-01-11 2012-07-25 华中科技大学 面向流式数据处理的sql查询计划生成方法
CN102799622A (zh) * 2012-06-19 2012-11-28 北京大学 基于MapReduce扩展框架的分布式SQL查询方法
CN103793650A (zh) * 2013-12-02 2014-05-14 北京邮电大学 Android应用程序的静态分析方法及装置
CN103870308A (zh) * 2012-12-13 2014-06-18 杭州勒卡斯广告策划有限公司 一种数据处理方法及装置
CN104123374A (zh) * 2014-07-28 2014-10-29 北京京东尚科信息技术有限公司 分布式数据库中聚合查询的方法及装置
CN104679511A (zh) * 2015-02-10 2015-06-03 北京系统工程研究所 基于MDE模型转换的MapReduce代码生成方法
CN105279286A (zh) * 2015-11-27 2016-01-27 陕西艾特信息化工程咨询有限责任公司 一种交互式大数据分析查询处理方法
CN105787044A (zh) * 2016-02-26 2016-07-20 广州品唯软件有限公司 一种基于MySQL的SQL解析器及其解析方法
CN107766107A (zh) * 2017-10-31 2018-03-06 四川长虹电器股份有限公司 基于Xpath 语言的xml文件通用解析器的解析方法
CN107943952A (zh) * 2017-11-24 2018-04-20 北京赛思信安技术股份有限公司 一种基于Spark框架进行全文检索的实现方法
CN108255837A (zh) * 2016-12-28 2018-07-06 中国移动通信集团浙江有限公司 一种sql解析器及方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100691261B1 (ko) * 2005-12-01 2007-03-12 한국전자통신연구원 확장성 생성 언어 변경 처리 시스템 및 그 방법
US20100153321A1 (en) * 2006-04-06 2010-06-17 Yale University Framework of hierarchical sensory grammars for inferring behaviors using distributed sensors
CN101017458A (zh) * 2007-03-02 2007-08-15 北京邮电大学 基于源代码静态分析的软件安全代码分析器及其检测方法
CN102609451A (zh) * 2012-01-11 2012-07-25 华中科技大学 面向流式数据处理的sql查询计划生成方法
CN102799622A (zh) * 2012-06-19 2012-11-28 北京大学 基于MapReduce扩展框架的分布式SQL查询方法
CN103870308A (zh) * 2012-12-13 2014-06-18 杭州勒卡斯广告策划有限公司 一种数据处理方法及装置
CN103793650A (zh) * 2013-12-02 2014-05-14 北京邮电大学 Android应用程序的静态分析方法及装置
CN104123374A (zh) * 2014-07-28 2014-10-29 北京京东尚科信息技术有限公司 分布式数据库中聚合查询的方法及装置
CN104679511A (zh) * 2015-02-10 2015-06-03 北京系统工程研究所 基于MDE模型转换的MapReduce代码生成方法
CN105279286A (zh) * 2015-11-27 2016-01-27 陕西艾特信息化工程咨询有限责任公司 一种交互式大数据分析查询处理方法
CN105787044A (zh) * 2016-02-26 2016-07-20 广州品唯软件有限公司 一种基于MySQL的SQL解析器及其解析方法
CN108255837A (zh) * 2016-12-28 2018-07-06 中国移动通信集团浙江有限公司 一种sql解析器及方法
CN107766107A (zh) * 2017-10-31 2018-03-06 四川长虹电器股份有限公司 基于Xpath 语言的xml文件通用解析器的解析方法
CN107943952A (zh) * 2017-11-24 2018-04-20 北京赛思信安技术股份有限公司 一种基于Spark框架进行全文检索的实现方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NGUYEN A K 等: "Natural language interface construction using semantic grammars", 《PACIFIC RIM INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE. SPRINGER, BERLIN, HEIDELBERG》 *
一见: "ANTLR实现的SQL解析器 - OQL", 《HTTPS://BLOG.CSDN.NET/AQUESTER/ARTICLE/DETAILS/7780772?UTM_SOURCE=BLOGXGWZ2》 *
刘霞 等: "采用语法分析和编辑距离的SQL脚本评阅方法", 《SOFTWARE ENGINEERING AND APPLICATIONS》 *
宋健龙: "面向数据库安全的SQL语句解析与翻译", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020233367A1 (zh) * 2019-05-22 2020-11-26 深圳壹账通智能科技有限公司 区块链数据存储和查询方法、装置、设备及存储介质
CN111079407A (zh) * 2019-12-13 2020-04-28 上海众言网络科技有限公司 对用户输入的内容进行解析的方法和装置
CN111079407B (zh) * 2019-12-13 2021-01-15 上海众言网络科技有限公司 对用户输入的内容进行解析的方法和装置
CN111522816A (zh) * 2020-04-16 2020-08-11 云和恩墨(北京)信息技术有限公司 基于数据库引擎的数据处理方法、装置、终端及介质
CN112527794A (zh) * 2020-12-07 2021-03-19 广州海量数据库技术有限公司 实现数据库中集合数据类型的数据处理方法及系统
CN116303372A (zh) * 2023-05-19 2023-06-23 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于Hive的前置知识库优化方法
CN116303372B (zh) * 2023-05-19 2023-08-04 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) 一种基于Hive的前置知识库优化方法

Also Published As

Publication number Publication date
CN109241104B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN109241104A (zh) 决策型分布式数据库系统中aisql的解析器及其实现方法
US8250529B2 (en) Specification to ABAP code converter
US9317552B2 (en) Reusing existing query plans in a database system
CN107644073A (zh) 一种基于深度优先遍历的字段血缘分析方法、系统及装置
US20100083221A1 (en) System and method for automated re-architectureing of legacy systems using object oriented language
CN110088749A (zh) 自动本体生成
CN101894058B (zh) 针对自动测试系统的测试覆盖性自动分析方法及其装置
CN104662514A (zh) 基于模型关联关系的遗产软件系统的现代化
CN109523423B (zh) 一种应用系统生成方法、装置、设备及存储介质
CN109408493A (zh) 一种数据源的迁移方法及系统
Rabl et al. Just can't get enough: Synthesizing Big Data
Katz et al. Decompiling CODASYL DML into retional queries
Barbosa et al. Towards identifying microservice candidates from business rules implemented in stored procedures
Dragomir et al. Model checking kernel P systems
Carme et al. A model-driven heuristic approach for detecting multidimensional facts in relational data sources
CN109582294B (zh) 一种内嵌式机器学习系统的软件体系结构设计方法
CN110209668A (zh) 基于流计算的维表关联方法、装置、设备及可读存储介质
CN103902677A (zh) 一种跨平台的数据库访问方法
CN109408591A (zh) 支持sql驱动的ai与特征工程的决策型分布式数据库系统
CN109408592A (zh) 一种决策型分布式数据库系统中ai的特征工程知识库及其实现方法
WO2014125430A1 (en) Method for creating specifications of software systems, in particular of the oltp-app type, and device thereof
Boronat et al. Two Experiences in Software Dynamics.
Guidoni et al. Preserving conceptual model semantics in the forward engineering of relational schemas
Fouqué et al. CAESAR: a system for case based software reuse
Mou et al. Visual orchestration and autonomous execution of distributed and heterogeneous computational biology pipelines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 163, 1st Floor, Building 5, No. 8 Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee after: Beijing Aowei Technology Co.,Ltd.

Address before: Room 701, Beichen Taiyue building, building 1, yard a 13, Beiyuan Road, Chaoyang District, Beijing 100101

Patentee before: BEIJING JUYUN WEIZHI INFORMATION TECHNOLOGY Co.,Ltd.