CN112559550B - 基于语义规则和多维模型的多数据源nl2sql系统 - Google Patents

基于语义规则和多维模型的多数据源nl2sql系统 Download PDF

Info

Publication number
CN112559550B
CN112559550B CN202011184962.9A CN202011184962A CN112559550B CN 112559550 B CN112559550 B CN 112559550B CN 202011184962 A CN202011184962 A CN 202011184962A CN 112559550 B CN112559550 B CN 112559550B
Authority
CN
China
Prior art keywords
module
matching
semantic
data
configuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011184962.9A
Other languages
English (en)
Other versions
CN112559550A (zh
Inventor
李智
钱泓锦
刘占亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiyuan Artificial Intelligence Research Institute
Original Assignee
Beijing Zhiyuan Artificial Intelligence Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyuan Artificial Intelligence Research Institute filed Critical Beijing Zhiyuan Artificial Intelligence Research Institute
Priority to CN202011184962.9A priority Critical patent/CN112559550B/zh
Publication of CN112559550A publication Critical patent/CN112559550A/zh
Application granted granted Critical
Publication of CN112559550B publication Critical patent/CN112559550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义规则和多维模型的多数据源NL2SQL系统,包括用于实现NL2SQL的业务层,所述业务层包括:配置模块,用于配置匹配规则;数据模型构建模块,用于构建可利用数据库的表和字段信息生成SQL语句的数据模型;意图识别模块,用于根据所述匹配规则将自然语句解析、匹配得到数据库的表和字段信息,并利用所述数据模型生成可执行的SQL语句。该系统不依赖标注语料和模型,通过界面简单的配置就可以实现基于意图的NL2SQL;通过数据模型构建模块支持多选择嵌套,可以灵活配置;通过意图识别模块降低对数据集的要求,提升SQL生成的成功率。所以,采用本发明提供的系统,能根据不同的项目快速构建业务场景。

Description

基于语义规则和多维模型的多数据源NL2SQL系统
技术领域
本发明涉及智能搜索技术领域,尤其涉及一种基于语义规则和多维模型的多数据源NL2SQL系统。
背景技术
智能化搜索中,计算机理解用户查询意图的过程成为了业界研究的热点,而在理解用户意图之前,首先需要把自然语言转化为计算机可以理解并生成准确表达语句语义的可执行程序式语言。Natural Language to SQL(NL2SQL)是将用户的自然语言语句转换成计算机可读懂、可运行、符合计算机规则语义表示的一种方法。
目前,NL2SQL技术中,需要专业的知识储备进行词典配置,对nlp和模型训练有一定的要求;另外,其对数据集的要求比较高,需要大量标注好的训练集语料和测试集语料和拒识数据(一些自然语言没有对应的SQL语句,模型应该拒绝作出预测)来进行模型训练,环节流程复杂且完成时间长。
所以,现有的NL2SQL技术在实际使用过程中很难推广应用。
发明内容
为了解决现有技术中存在的技术问题,本发明提供了如下技术方案。
本发明提供了一种基于语义规则和多维模型的多数据源NL2SQL系统,包括用于实现NL2SQL的业务层,所述业务层包括:
配置模块,用于配置匹配规则;
数据模型构建模块,用于构建可利用数据库的表和字段信息生成SQL语句的数据模型;
意图识别模块,用于根据所述匹配规则将输入的自然语句解析、匹配得到数据库的表和字段信息,并利用所述数据模型生成可执行的SQL语句。
优选地,所述配置模块包括:
语境配置模块,用于配置语境匹配规则;
用户词典配置模块,用于配置用户词典;
表字段配置模块,用于配置数据库的表、字段、表关系、表和字段关系;
语义片段配置模块,用于配置语义片段匹配规则。
优选地,所述用户词典配置模块包括用户自定义模块和专业词典模块,所述用户自定义模块用于配置用户自定义的同义词、停用词、关键词和/或实体,所述专业词典模块用于配置专业词典。
优选地,所述用户词典配置模块还包括第三方分词和实体识别模型调用模块,用于配置第三方分词和实体识别模型的调用接口。
优选地,所述语义片段匹配规则包括匹配词语、语义规则和要素字段。
优选地,所述意图识别模块包括:
语境匹配模块,用于根据配置的语境匹配规则,将所述自然语句进行语境匹配,得到所述自然语句的语境信息;
标签识别模块,用于根据配置的用户词典,结合所述语境信息,对所述自然语句进行分词和实体识别,得到分词对应的实体类型;
语义片段匹配模块,用于根据配置的语义片段匹配规则进行分词匹配,得到语义片段;
数据库字段关联模块,用于利用所述语义片段匹配配置的数据库的表和字段,得到对应的表和字段信息以及表关系;
SQL语句生成模块,用于根据匹配得到的表和字段信息以及表关系,利用所述数据模型生成可执行的SQL语句。
优选地,所述根据配置的语义片段匹配规则进行分词匹配,得到语义片段包括:
将得到的每个分词与所述语义片段匹配规则中的词语进行匹配,获取语义规则;
根据所述语义规则匹配得到语义片段的要素信息。
优选地,所述将得到的每个分词与所述语义片段匹配规则中的词语进行匹配包括:
将所述分词转换为分词向量,计算所述分词向量与所述语义片段匹配规则中的词语的向量的相似度;若相似度达到阈值,则将所述分词替换为所述语义片段匹配规则中的词语。
优选地,所述数据模型构建模块包括:
表选择模块,用于加载数据表并选择事实表和维度表;
维度选择模块,用于选择维度;
指标选择模块,用于选择指标;
模型建立模块,用于选择统计方法,根据所选择的维度和指标建立数据模型。
优选地,所述系统还包括数据接入层、数据存储层和应用层;
所述数据接入层用于接收用户输入的数据和配置的匹配规则;
所述数据存储层用于数据存储;
应用层用于展示和查询自然语句转换为SQL语句的结果。
本发明的有益效果是:本发明提供的基于语义规则和多维模型的多数据源NL2SQL系统,不依赖标注语料和模型,通过界面简单的配置就可以实现基于意图的NL2SQL;通过数据模型构建模块支持多选择嵌套,可以灵活配置;通过意图识别模块降低对数据集的要求,提升SQL生成的成功率。所以,采用本发明提供的系统,能根据不同的项目快速构建业务场景,支持NoSQL和关系性数据库等多数据源的扩展。
附图说明
图1为本发明所述系统的业务层结构示意图;
图2为本发明所述表字段配置格式的截图;
图3为本发明所述数据模型的结构示意图;
图4为本发明所述数据模型构建流程示意图;
图5为本发明所述业务层实施过程流程示意图;
图6为本发明所述意图识别模块的结构示意图;
图7为本发明所述系统的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
本发明提供的系统可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的系统。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。
存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。存储器可用于存储指令、程序、代码、代码集或指令。
显示屏用于显示各个应用程序的用户界面。
除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。
实施例一
如图1所示,本发明实施例提供了一种基于语义规则和多维模型的多数据源NL2SQL系统,包括用于实现NL2SQL的业务层,所述业务层包括:
配置模块,用于配置匹配规则;
数据模型构建模块,用于构建可利用数据库的表和字段信息生成SQL语句的数据模型;
意图识别模块,用于根据所述匹配规则将输入的自然语句解析、匹配得到数据库的表和字段信息,并利用所述数据模型生成可执行的SQL语句。
其中,在实际使用过程中,配置模块可以以界面的形式展现,用户登录系统打开配置模块后,出现配置界面,在界面中用户可以根据需求配置相应的内容,比如不同的项目或业务领域,配置的内容不相同。具体的,需要配置的内容可以设置在模板中,用户可以在模板中通过选择、拖曳或输入的方式配置相应的内容。
具体的,在本发明实施例中,配置模块包括:
语境配置模块,用于配置语境匹配规则;
用户词典配置模块,用于配置用户词典;
表字段配置模块,用于配置数据库的表、字段、表关系、表和字段关系;
语义片段配置模块,用于配置语义片段匹配规则。
其中,语境配置模块中配置的语境匹配规则,可以在使用过程中,作为确定输入语句语境的依据。而在对输入的自然语句进行处理过程中,首先进行语境的确定,可以为进一步的语句处理过程奠定基础,使得语句的后续处理能够在匹配的语境环境下进行,提高处理效率和召回精准率。作为一个实例,比如:用户需要查询张三的出行记录,可以分析“出行”这一场景的要素,然后提取对应的要素配置规则,比如记录中包括要素人、出行、轨迹等一系列代表出行的特征词,根据该规则完成语境匹配。
用户词典配置模块可以包括用户自定义模块和专业词典模块,所述用户自定义模块用于配置用户自定义的同义词、停用词、关键词和/或实体,所述专业词典模块用于配置专业词典。
对于某个特定的业务专业领域,存在较多的专业语言或新生成的词语,利用常规词典往往无法对专业领域自然语句进行准确的分词处理,为了解决该问题,本发明实施例中,设置了专业词典模块和用户自定义模块,用户可以利用专业词典模块配置专业词典。在专业词典中,包含了对专业语言和/或新生成词语等的解释和实体类型等的说明。另外,用户可以通过自定义同义词、停用词、关键词和/或实体等,对专业语言和/或新生成词语等进行丰富,以辅助专业词典对词语的处理能力。如果一个基准词对应多个同义词或多个停用词等,则将各词之间通过间隔号分开。由于专业词典与专业语句的匹配度更好,所以,采用专业词典进行分词和实体识别的处理,可以提高精度且更符合业务场景。同时,利用用户自身对专业领域的深入认知,通过自定义的同义词、停用词、关键词和/或实体等,对专业词典的内容进行补充,能够进一步的提高分词和实体识别的精度。
在本发明的一个优选实施例中,所述用户词典配置模块还可以包括第三方分词和实体识别模型调用模块,用于配置第三方分词和实体识别模型的调用接口。在实际使用过程中,可以通过接口直接调用第三方分词和实体识别模型,通过模型完成对自然语句的分词和实体识别处理。
在表字段配置模块中,将数据库中要转化为SQL的字段进行配置,具体需要配置的信息有:数据库类型、表名称、表字段名称、类型等。作为一个实例,其配置的格式可如图2所示。
在语义片段配置模块中,通过界面配置的方式配置能够从语义片段并中提取字段信息的内容,比如,包括如下信息:匹配词语、语义规则、语义片段、规则类型和要素字段等。
在本发明的一个实施例中,所述数据模型构建模块包括:
数据源选择模块,用于选择数据源;
表选择模块,用于加载数据表并选择事实表和维度表;
维度选择模块,用于选择维度;
指标选择模块,用于选择指标;
模型建立模块,用于选择统计方法,根据所选择的维度和指标建立数据模型。
其中,构建的数据模型主要包括数据库表和表关系或者表和字段关系,可以是单表,也可以是多表。其中,生成的数据模型的结构可如图3所示。
数据模型构建模块的主要任务是构建一个能生成SQL关系的模型,用户通过拖拽和配置的方式可完成模型的构建。构建的过程如图4所示,包括:选择数据源;加载数据表,选择事实表和维度表;选择维度和指标;选择统计方法,利用所述统计方法基于所选择的维度和指标建立数据模型。
采用本发明提供的数据模型构建模块构建数据模型具有如下的功能特点:
可支持多种数据源选择,包含关系型数据库,如MySQL、Oracle、PostgreSQL等,也可以选择非关系型数据库,如ES、HBase、hive等;数据源选择来源于表字段的配置;
用户在可视化界面上通过拖拽和勾选的方式选择维度字段和指标字段,灵活地构建数据模型;
配置的指标可支持SUM、COUNT、MAX、MIN、AVG、COUNT_DISTINCT等多种方式。
在本发明的一个优选实施例中,意图识别模块包括:
语境匹配模块,用于根据配置的语境匹配规则,将所述自然语句进行语境匹配,得到所述自然语句的语境信息。例如对于输入的自然语句“某人最近1年去A地B地的轨迹”,根据语境匹配规则得到为出行语境。
标签识别模块,用于根据配置的用户词典,结合所述语境信息,对所述自然语句进行分词和实体识别,得到分词对应的实体类型。
语义片段匹配模块,用于根据配置的语义片段匹配规则进行分词匹配,得到语义片段。
数据库字段关联模块,用于利用所述语义片段匹配配置的数据库的表和字段,得到对应的表和字段信息以及表关系。数据库字段关联模块的输出可选地为JSON格式。例如:
Figure GDA0002850118050000091
SQL语句生成模块,用于根据匹配得到的表和字段信息以及表关系,利用所述数据模型生成可执行的SQL语句。可选地,SQL语句生成模块根据所述语境信息从构建的多个数据模型中选择所述数据模型。例如,输出的SQL如下:
Select
*
From
dm_person_locusdm_person_locus,
dm_entity_persondm_entity_person
where
dm_entity_person.id=dm_person_locus.persion_id
and dm_entity_persion.xm like‘%某人%’
and dm_person_locus.cfsj>‘2019-08-23 17:15:07’
and dm_person_locus.cfsj<‘2020-08-23 17:15:07’
and(
dm_person_locus.ddd like‘%A地%’
or dm_person_locus.ddd like‘%B地的%’
)
and(1=1)
在实际应用过程中,意图识别模块结合配置模块中配置的各种匹配规则以及数据模型构建模块中构建的数据模型,完成SQL语句的生成。因此,在业务层中,主要完成了规则的配置和数据模型的构建过程,以及利用规则和模型将输入的自然语句转化为SQL语句的过程。
系统具体的工作流程可如图5所示。
图5中,A-G表示用户配置NL2SQL功能的流程:
A从数据源中选择数据配置表字段;
B根据表字段的配置信息构建数据模型;
C得到构建的数据模型;
D配置用户词典;
E配置意图识别模块中的信息;
F将配置信息和数据模型保存至数据源中;
G将配置信息和数据模型用于意图识别。
①~⑨步骤表示用户输入自然语句查询时转换为SQL语句查询的流程:
①用户输入查询语句,系统根据语境匹配规则,将自然语句匹配到语境配置;
②使用用户词典和实体识别相结合的标签模型进行分词和实体识别;
③将分词后的词进行语义规则匹配,得到语义片段;
④根据语义片段关联数据库字段,完成语义片段映射,得到表和字段信息以及表关系;
⑤⑥按照数据模型的表关联规则拼接成可执行的SQL;
⑦将SQL通过数据适配器进行转换成不同数据库查询语言;
⑧⑨按照SQL规则查询数据库数据,返回查询结果。
其中,意图识别模块的结构可如图6所示。
在本发明的一个实施例中,所述根据配置的语义片段匹配规则进行分词匹配,得到语义片段包括;
将得到的每个分词与所述语义片段匹配规则中的词语进行匹配,获取语义规则;
根据所述语义规则匹配得到语义片段的要素信息。
其中,所述将得到的每个分词与所述语义片段匹配规则中的词语进行匹配包括:
将所述分词转换为分词向量,计算所述分词向量与所述语义片段匹配规则中的词语的向量的相似度;若相似度达到阈值,则将所述分词替换为所述语义片段匹配规则中的词语。
采用这种语义匹配方式,可以极大的提高语义识别的召回率以及泛化能力。
如图7所示,本发明提供的系统还包括数据接入层、数据存储层和应用层;
所述数据接入层用于接收用户输入的数据和配置的匹配规则,比如语境匹配规则、用户词典、数据库的表字段、语义片段匹配规则等;
所述数据存储层用于数据存储,比如存储用户词典、语境配置、数据模型、语义片段、字段关系映射和用户NL2SQL日志等,提供用户配置的规则和数据;
应用层用于展示和查询自然语句转换为SQL语句的结果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种基于语义规则和多维模型的多数据源NL2SQL系统,其特征在于,包括用于实现NL2SQL的业务层,所述业务层包括:
配置模块,用于配置匹配规则,配置模块以界面的形式展现,在界面中用户根据需求配置相应的内容,需要配置的内容设置在模板中,用户在模板中通过选择、拖曳或输入的方式配置相应的内容;
数据模型构建模块,用于构建可利用数据库的表和字段信息生成SQL语句的数据模型,通过拖拽和配置的方式完成模型的构建;
意图识别模块,用于根据所述匹配规则将输入的自然语句解析、匹配得到数据库的表和字段信息,并利用所述数据模型生成可执行的SQL语句;
所述配置模块包括:
语境配置模块,用于配置语境匹配规则;
用户词典配置模块,用于配置用户词典;
表字段配置模块,用于配置数据库的表、字段和表关系;
语义片段配置模块,用于配置语义片段匹配规则;
所述意图识别模块包括:
语境匹配模块,用于根据配置的语境匹配规则,将所述自然语句进行语境匹配,得到所述自然语句的语境信息;
标签识别模块,用于根据配置的用户词典,结合所述语境信息,对所述自然语句进行分词和实体识别,得到分词对应的实体类型;
语义片段匹配模块,用于根据配置的语义片段匹配规则进行分词匹配,得到语义片段;
数据库字段关联模块,用于利用所述语义片段匹配配置的数据库的表和字段,得到对应的表和字段信息以及表关系;
SQL语句生成模块,用于根据匹配得到的表和字段信息以及表关系,利用所述数据模型生成可执行的SQL语句,其中,根据所述语境信息从构建的多个数据模型中选择所述数据模型;
所述根据配置的语义片段匹配规则进行分词匹配,得到语义片段包括:
将得到的每个分词与所述语义片段匹配规则中的词语进行匹配,获取语义规则;
根据所述语义规则匹配得到语义片段的要素信息。
2.如权利要求1所述的系统,其特征在于,所述用户词典配置模块包括用户自定义模块和专业词典模块,所述用户自定义模块用于配置用户自定义的同义词、停用词、关键词和/或实体,所述专业词典模块用于配置专业词典。
3.如权利要求2所述的系统,其特征在于,所述用户词典配置模块还包括第三方分词和实体识别模型调用模块,用于配置第三方分词和实体识别模型的调用接口。
4.如权利要求1所述的系统,其特征在于,所述语义片段匹配规则包括匹配词语、语义规则和要素字段。
5.如权利要求1所述的系统,其特征在于,所述将得到的每个分词与所述语义片段匹配规则中的词语进行匹配包括:
将所述分词转换为分词向量,计算所述分词向量与所述语义片段匹配规则中的词语的向量的相似度;若相似度达到阈值,则将所述分词替换为所述语义片段匹配规则中的词语。
6.如权利要求1所述的系统,其特征在于,所述数据模型构建模块包括:
数据源选择模块,用于选择数据源;
表选择模块,用于加载数据表并选择事实表和维度表;
维度选择模块,用于选择维度;
指标选择模块,用于选择指标;
模型建立模块,用于选择统计方法,根据所选择的维度和指标建立数据模型。
7.如权利要求1所述的系统,其特征在于,所述系统还包括数据接入层、数据存储层和应用层;
所述数据接入层用于接收用户输入的数据和配置的匹配规则;
所述数据存储层用于数据存储;
应用层用于展示和查询自然语句转换为SQL语句的结果。
CN202011184962.9A 2020-10-30 2020-10-30 基于语义规则和多维模型的多数据源nl2sql系统 Active CN112559550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011184962.9A CN112559550B (zh) 2020-10-30 2020-10-30 基于语义规则和多维模型的多数据源nl2sql系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011184962.9A CN112559550B (zh) 2020-10-30 2020-10-30 基于语义规则和多维模型的多数据源nl2sql系统

Publications (2)

Publication Number Publication Date
CN112559550A CN112559550A (zh) 2021-03-26
CN112559550B true CN112559550B (zh) 2021-09-07

Family

ID=75042665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011184962.9A Active CN112559550B (zh) 2020-10-30 2020-10-30 基于语义规则和多维模型的多数据源nl2sql系统

Country Status (1)

Country Link
CN (1) CN112559550B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114168619B (zh) * 2022-02-09 2022-05-10 阿里巴巴达摩院(杭州)科技有限公司 语言转换模型的训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279509A (zh) * 2013-05-17 2013-09-04 北京首钢自动化信息技术有限公司 一种采用动态查询语言的快速查询方法
CN106897270A (zh) * 2017-03-10 2017-06-27 吉林大学 一种文本中知识领域识别方法及系统
US10572485B2 (en) * 2017-04-28 2020-02-25 Oracle International Corporation In-memory denormalized RDF data

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020129069A1 (en) * 2001-01-08 2002-09-12 Zhixun Sun Computerized dictionary for expressive language, and its vocabularies are arranged in a narrative format under each topic and retrievable via a subject-oriented index system
JP2005165958A (ja) * 2003-12-05 2005-06-23 Ibm Japan Ltd 情報検索システム、情報検索支援システム及びその方法並びにプログラム
CN101193071A (zh) * 2007-03-28 2008-06-04 腾讯科技(深圳)有限公司 一种基于即时通信的客服方法、系统及设备
CN101149749A (zh) * 2007-10-29 2008-03-26 浙江大学 一种基于语义的异质异构关系型数据库的数据集成方法
CN101431573B (zh) * 2007-11-08 2013-02-20 上海撼世网络科技有限公司 通过人机交互技术实现自动客户服务的方法和设备
CN101615192A (zh) * 2009-07-09 2009-12-30 河北全通通信有限公司 决策支持系统共享语义层的实现方法
CN104123346B (zh) * 2014-07-02 2017-10-20 广东电网公司信息中心 一种结构化数据搜索方法
CN106933798B (zh) * 2015-12-31 2020-09-08 北京城市网邻信息技术有限公司 信息分析的方法及装置
CN106066895B (zh) * 2016-06-30 2020-01-24 广东亿迅科技有限公司 一种智能查询系统
US10621166B2 (en) * 2017-03-23 2020-04-14 International Business Machines Corporation Interactive dialog in natural language using an ontology
CN107203512B (zh) * 2017-06-02 2021-04-23 上海对岸信息科技有限公司 用于从用户的自然语言输入中提取关键元素的方法
CN107341209B (zh) * 2017-06-26 2020-05-12 清华大学 基于语义检索的bim模型规范检测装置和检测方法
CN107491556A (zh) * 2017-09-04 2017-12-19 湖北地信科技集团股份有限公司 时空全要素语义查询服务系统及其方法
CN107885874B (zh) * 2017-11-28 2020-09-29 上海智臻智能网络科技股份有限公司 数据查询方法和装置、计算机设备及计算机可读存储介质
CN109885660B (zh) * 2019-02-22 2020-10-02 上海乐言信息科技有限公司 一种知识图谱赋能的基于信息检索的问答系统和方法
CN110297829A (zh) * 2019-06-26 2019-10-01 重庆紫光华山智安科技有限公司 一种面向特定行业结构化业务数据的全文检索方法及系统
CN110888897B (zh) * 2019-11-12 2020-07-14 杭州世平信息科技有限公司 一种根据自然语言生成sql语句的方法及装置
CN111177184A (zh) * 2019-12-24 2020-05-19 深圳壹账通智能科技有限公司 基于自然语言的结构化查询语言转换方法、及其相关设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279509A (zh) * 2013-05-17 2013-09-04 北京首钢自动化信息技术有限公司 一种采用动态查询语言的快速查询方法
CN106897270A (zh) * 2017-03-10 2017-06-27 吉林大学 一种文本中知识领域识别方法及系统
US10572485B2 (en) * 2017-04-28 2020-02-25 Oracle International Corporation In-memory denormalized RDF data

Also Published As

Publication number Publication date
CN112559550A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN111753099B (zh) 一种基于知识图谱增强档案实体关联度的方法及系统
US20180210883A1 (en) System for converting natural language questions into sql-semantic queries based on a dimensional model
CN112001188B (zh) 基于向量化语义规则快速实现nl2sql的方法和装置
CN113987212A (zh) 一种数控加工领域工艺数据的知识图谱构建方法
CN107798123B (zh) 知识库及其建立、修改、智能问答方法、装置及设备
CN101539907A (zh) 词性标注模型训练装置、词性标注系统及其方法
CN116737915B (zh) 基于知识图谱的语义检索方法、装置、设备及存储介质
WO2023040493A1 (zh) 事件检测
CN110929498B (zh) 一种短文本相似度的计算方法及装置、可读存储介质
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
CN111190920B (zh) 一种基于自然语言的数据交互查询方法及其系统
CN114153994A (zh) 医保信息问答方法及装置
CN110795932A (zh) 基于地质本体的地质报告文本信息提取方法
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN116303537A (zh) 数据查询方法及装置、电子设备、存储介质
CN117609419A (zh) 基于元学习与知识增强的领域检索方法
CN118093632B (zh) 基于大语言模型和图结构的图数据库查询方法和装置
CN117743543A (zh) 基于大语言模型的语句生成方法、装置及电子设备
CN116306974A (zh) 问答系统的模型训练方法、装置、电子设备及存储介质
CN112559550B (zh) 基于语义规则和多维模型的多数据源nl2sql系统
CN111738008B (zh) 基于多层模型的实体识别方法、装置、设备及存储介质
WO2021135103A1 (zh) 一种语义分析方法、装置、计算机设备及存储介质
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
CN116049376A (zh) 一种信创知识检索回复的方法、装置和系统
CN112560466B (zh) 链接实体关联方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant