CN112559690A - 一种自然语言智能数据建模技术 - Google Patents
一种自然语言智能数据建模技术 Download PDFInfo
- Publication number
- CN112559690A CN112559690A CN202011523491.XA CN202011523491A CN112559690A CN 112559690 A CN112559690 A CN 112559690A CN 202011523491 A CN202011523491 A CN 202011523491A CN 112559690 A CN112559690 A CN 112559690A
- Authority
- CN
- China
- Prior art keywords
- natural language
- nl2sql
- sql
- database
- intelligent data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 24
- 238000000034 method Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000002776 aggregation Effects 0.000 claims description 7
- 238000004220 aggregation Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- ACWBQPMHZXGDFX-QFIPXVFZSA-N valsartan Chemical class C1=CC(CN(C(=O)CCCC)[C@@H](C(C)C)C(O)=O)=CC=C1C1=CC=CC=C1C1=NN=NN1 ACWBQPMHZXGDFX-QFIPXVFZSA-N 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 1
- 238000004321 preservation Methods 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 14
- 238000011160 research Methods 0.000 abstract description 8
- 238000007405 data analysis Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种自然语言智能数据建模技术,涉及智能数据建模技术领域。本发明包括第一NL2SQL、Bert算法、SQL、NLP、第二NL2SQL、Bert框架,第一NL2SQL包括:根据自然语言找到数据库中对应的表、将文本与表结构作为参数,传给已经训练好的model1、model2,得到SQL1、SQL2、将SQL1、SQL2拼接成一个完整的SQL、将SQL传给数据库引擎处理。本发明通过第一NL2SQL(NLPLanguageToSQL)是自然语言处理的新兴研究热点,是将用户输入的自然语言转为可执行的SQL语句,业界关于Text‑to‑SQL、NLIDB研究的核心内容是与第一NL2SQL相类似的,第一NL2SQL是能充当数据库的智能接口,降低数据库查询的门槛,让非专业用户在不需要学习和掌握数据库编程语言的前提下,自由地按需查询数据,比如说话就行。
Description
技术领域
本发明属于智能数据建模技术领域,特别是涉及一种自然语言智能数据建模技术。
背景技术
在互联网高速发展的当下,大数据分析已是潮流,各行各业中都在引用,通过分析能够获取很多智能的、深入的、价值的信息,然而,在日常工作生活中,大数据分析驱动业务增长同样伴随着存在着诸多现实瓶颈,诸如业务发展瓶颈、IT中心瓶颈、大数据应用瓶颈,现代的自助式、探索式BI工具已成趋势,越来越多的企业采购开始偏好现代的、以业务用户为中心的自服务数据分析平台,传统的以IT为主导的,高度集中化的工具正面临替换市场已经从“IT主导的报表模式”往“业务主导的自服务分析模式”转折。
现有的智能数据建模技术,大多查询的门槛较高,不利于非专业用户使用,不能对自然语言进行处理。
发明内容
本发明的目的在于提供一种自然语言智能数据建模技术,通过第一 NL2SQL(NLPLanguageToSQL)是自然语言处理的新兴研究热点,是将用户输入的自然语言转为可执行的SQL语句,业界关于Text-to-SQL、NLIDB研究的核心内容是与第一NL2SQL相类似的,第一NL2SQL是能充当数据库的智能接口,降低数据库查询的门槛,让非专业用户在不需要学习和掌握数据库编程语言的前提下,自由地按需查询数据,比如说话就行,解决了上述现有技术中存在的问题。
为达上述目的,本发明是通过以下技术方案实现的:
一种自然语言智能数据建模技术,包括第一NL2SQL、Bert算法、SQL、 NLP、第二NL2SQL、Bert框架;
第一NL2SQL包括:根据自然语言找到数据库中对应的表、将文本与表结构作为参数,传给已经训练好的model1、model2,得到SQL1、SQL2、将 SQL1、SQL2拼接成一个完整的SQL、将SQL传给数据库引擎处理;
Bert算法包括:读取数据集、数据预处理、模型建模、模型保存。
可选的,根据自然语言找到数据库中对应的表包括:首先根据问题进行中文分词,并将其转为词向量、计算词向量的平均向量作为语句向量S、计算数据库,每张表的向量值T_i、计算S与T_i的相似度,取相似度值最高的作为表。
可选的,读取数据集包括:训练集、测试集、验证集,数据预处理包括:分词、词向量填充、乱序、将词语转为词向量,Embedding操作。
可选的,模型建模包括:将数据预处理中的词向量分别传入Bert1, Bert2进行训练,得到模型1、模型2。
可选的,模型建模包括:model1负责预测表中字段的分类以及表连接条件,cond_conn_op:SQL语句中where后的连接条件{0:””,1:”and”, 2:”or”},agg:字段聚合分类{0:””,1:”AVG”,2:”MAX”,3:”MIN”,4:”COUNT”,5:”SUM”}、conds_op:负责找到表中哪些字段被选择,model2,负责where后面条件运算符的筛选:op_sql_dict={0:”>”,1:”<”,2:”==”,3:”!=”}以及条件值的抽取conds_vals。
可选的,模型保存包括:将模型分别存入hdfs,供调用。
可选的,NLP包括:序列标注、分类任务、句子关系判断、生成任务,第二NL2SQL为NLP技术的一个分支,用NLP的分类任务、句子关系判断技术,第二NL2SQL包括:确定SQL结构、预测字段值,Bert框架包括:句子分类、实体抽取、语言问答。
可选的,序列标注包括:中文分词、词性标注、命名实体识别、语义角色标注,分类任务包括:文本分类、情感计算,句子关系判断包括: Entailment、QA、语义改写,自然语言推理任务,生成任务包括:机器翻译、文本摘要、写诗造句、看图说话。
可选的,第二NL2SQL包括:确定SQL结构:确定SQL的“结构”、预测字段值:根据自然语言问题,选用适当的算法预测出字段、聚合条件、以及where条件连接值(OP)。
可选的,Bert框架包括:句子分类、实体抽取、语言问答。
本发明的实施例具有以下有益效果:
本发明的一个实施例通过第一NL2SQL(NLPLanguageToSQL)是自然语言处理的新兴研究热点,是将用户输入的自然语言转为可执行的SQL语句,业界关于Text-to-SQL、NLIDB研究的核心内容是与第一NL2SQL相类似的,第一NL2SQL是能充当数据库的智能接口,降低数据库查询的门槛,让非专业用户在不需要学习和掌握数据库编程语言的前提下,自由地按需查询数据,比如说话就行。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例的Bert框架流程结构示意图;
图2为本发明一实施例的Bert算法流程结构示意图;
图3为本发明一实施例的Bert算法训练流程结构示意图;
图4为本发明一实施例的SQL结构示意图;
图5为本发明一实施例的自然语言流程结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
为了保持本发明实施例的以下说明清楚且简明,本发明省略了已知功能和已知部件的详细说明。
请参阅图1-5所示,在本实施例中提供了一种自然语言智能数据建模技术,包括:第一NL2SQL、Bert算法、SQL、NLP、第二NL2SQL、Bert框架;
第一NL2SQL包括:根据自然语言找到数据库中对应的表、将文本与表结构作为参数,传给已经训练好的model1、model2,得到SQL1、SQL2、将 SQL1、SQL2拼接成一个完整的SQL、将SQL传给数据库引擎处理;
Bert算法包括:读取数据集、数据预处理、模型建模、模型保存。
本实施例一个方面的应用为:训练数据集有两种json文件,一种为描述表内容文件,一种描述描述“自然语言问题”与SQL映射的文件,根据“自然语言问题”进行与数据库表进行交互,利用“自然语言问题”与表字段进行相似度计算,进而完成“找表”的过程,采用Bert算法,其预训练(pre-training),调优(fine-tuning)训练模式,使模型具有较高的准确率,将NL2SQL预测SQL的划分为2个子任务,一个任务负责预测字段、 where连接条件、聚合函数,一个任务负责预测where后条件值,将两个模型预测结果最后拼接成一个完整的SQL语句,采用此方法的好处是有利于提高模型的准确率,将NL2SQL与大数据技术融合,训练数据集、以及模型保存至HDFS,便于集群资源文件的统一管理以及模型的调用。
通过第一NL2SQL(NLPLanguageToSQL)是自然语言处理的新兴研究热点,是将用户输入的自然语言转为可执行的SQL语句,业界关于 Text-to-SQL、NLIDB研究的核心内容是与第一NL2SQL相类似的,第一 NL2SQL是能充当数据库的智能接口,降低数据库查询的门槛,让非专业用户在不需要学习和掌握数据库编程语言的前提下,自由地按需查询数据,比如说话就行。
本实施例的根据自然语言找到数据库中对应的表包括:首先根据问题进行中文分词,并将其转为词向量、计算词向量的平均向量作为语句向量S、计算数据库,每张表的向量值T_i、计算S与T_i的相似度,取相似度值最高的作为表。
本实施例的读取数据集包括:训练集、测试集、验证集,数据预处理包括:分词、词向量填充、乱序、将词语转为词向量,Embedding操作。
本实施例的模型建模包括:将数据预处理中的词向量分别传入Bert1, Bert2进行训练,得到模型1、模型2。
本实施例的模型建模包括:model1负责预测表中字段的分类以及表连接条件,cond_conn_op:SQL语句中where后的连接条件{0:””,1:” and”,2:”or”},agg:字段聚合分类{0:””,1:”AVG”,2:”MAX”, 3:”MIN”,4:”COUNT”,5:”SUM”}、conds_op:负责找到表中哪些字段被选择,model2,负责where后面条件运算符的筛选:op_sql_dict={0:”>”,1:”<”,2:”==”,3:”!=”}以及条件值的抽取conds_vals。
本实施例的模型保存包括:将模型分别存入hdfs,供调用。
本实施例的NLP包括:序列标注、分类任务、句子关系判断、生成任务,第二NL2SQL为NLP技术的一个分支,用NLP的分类任务、句子关系判断技术,第二NL2SQL包括:确定SQL结构、预测字段值,Bert框架包括:句子分类、实体抽取、语言问答。
本实施例的序列标注包括:中文分词、词性标注、命名实体识别、语义角色标注,分类任务包括:文本分类、情感计算,句子关系判断包括: Entailment、QA、语义改写,自然语言推理任务,生成任务包括:机器翻译、文本摘要、写诗造句、看图说话。
本实施例的第二NL2SQL包括:确定SQL结构:确定SQL的“结构”、预测字段值:根据自然语言问题,选用适当的算法预测出字段、聚合条件、以及where条件连接值(OP)。
本实施例的Bert框架包括:句子分类、实体抽取、语言问答。
技术特点
训练数据集有两种json文件,一种为描述表内容文件,一种描述描述“自然语言问题”与SQL映射的文件;
根据“自然语言问题”进行与数据库表进行交互,利用“自然语言问题”与表字段进行相似度计算,进而完成“找表”的过程;
采用Bert算法,其预训练(pre-training),调优(fine-tuning) 训练模式,使模型具有较高的准确率;
将NL2SQL预测SQL的划分为2个子任务,一个任务负责预测字段、where 连接条件、聚合函数,一个任务负责预测where后条件值,将两个模型预测结果最后拼接成一个完整的SQL语句。采用此方法的好处是有利于提高模型的准确率;
将NL2SQL与大数据技术融合,训练数据集、以及模型保存至HDFS,便于集群资源文件的统一管理以及模型的调用。
在AI、区块链、IoT、AR等高新技术飞速发展的当下,数据库这一宝库似乎被大家遗忘在了角落。数据库存储了大量的个人或者企业的生产运营数据,我们每天都会和数据库产生或多或少的交互。通常,查询数据库中的数据需要通过像SQL这样的程序式查询语言来进行交互,这就需要懂SQL语言的专业技术人员来执行这一操作。为了让非专业用户也可以按需查询数据库,当前流行的技术方案设计了基于条件筛选的专门界面,用户可以通过点选不同的条件来查询数据库。
现状分析
(一)业务发展的瓶颈:
1、数据分析需求得不到及时响应,公司发展仿佛在一片漆黑中前行。缺乏对业务现状的准确把握,报表固定且老化,数据利用率低;市场占有率、用户画像、服务质量、营销ROI等难以量化。
2、缺乏对业务背后逻辑的洞察。数据关联性差,难以多维度观察;季节性波动、竞争格局演变、结构性调整、用户流失等难以捉摸。
3、缺乏对业务未来的可见与预测。缺乏全量数据分析和利用,难以全局判断周期性规划,战略目标制定、业务增长点预测、消费结构升级等难以预测。
(二)IT中心的瓶颈:
1、IT集权下的疲于应对。公司项目需求多,响应慢,IT人员需要经常熬夜加班,身心疲惫;
2、放权下的数据管理混乱。IT中心对外权限开放,会导致数据准确性降低,安全性差;同时会导致内部数据壁垒多。
大数据应用瓶颈:不利用时心慌,利用时迷茫,如何走好“最后一公里”为应对大数据的快速增长时,硬件不断升级,架构不断扩展,但没有最后一公里的充分应用就无法产生价值。
以上瓶颈是一串连锁反应,问题的根源是缺乏有效的工具支撑。实现数据驱动业务增长的理想蓝图,企业需要强有力的BI工具的支撑。
目前数据库依然是企业存储数据的主要方式,尽管有着各色的数据库,但访问和操作数据库的SQL是通用的,人性化的编程语言SQL为开发者在工作中访问数据库提供了便利,但同时也极大地限定了非专业用户按需查询数据库的场景和查询界限,随着人工智能在机器视觉领域取得突破进展,结合了人工智能与NLP的NL2SQL为非专业用户查询数据库提供了新的思路。
上述实施例可以相互结合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施方式能够以除了在这里图示或描述的那些以外的顺序实施。
在本发明的描述中,需要理解的是,方位词如“前、后、上、下、左、右”、“横向、竖向、垂直、水平”和“顶、底”等所指示的方位或位置关系通常是基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,在未作相反说明的情况下,这些方位词并不指示和暗示所指的装置或元件必须具有特定的方位或者以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制;方位词“内、外”是指相对于各部件本身的轮廓的内外。
Claims (10)
1.一种自然语言智能数据建模技术,其包括:第一NL2SQL、Bert算法、SQL、NLP、第二NL2SQL、Bert框架;
第一NL2SQL包括:根据自然语言找到数据库中对应的表、将文本与表结构作为参数,传给已经训练好的model1、model2,得到SQL1、SQL2、将SQL1、SQL2拼接成一个完整的SQL、将SQL传给数据库引擎处理;
Bert算法包括:读取数据集、数据预处理、模型建模、模型保存。
2.如权利要求1所述的一种自然语言智能数据建模技术,其特征在于,根据自然语言找到数据库中对应的表包括:首先根据问题进行中文分词,并将其转为词向量、计算词向量的平均向量作为语句向量S、计算数据库,每张表的向量值T_i、计算S与T_i的相似度,取相似度值最高的作为表。
3.如权利要求1所述的一种自然语言智能数据建模技术,其特征在于,读取数据集包括:训练集、测试集、验证集,数据预处理包括:分词、词向量填充、乱序、将词语转为词向量,Embedding操作。
4.如权利要求3所述的一种自然语言智能数据建模技术,其特征在于,模型建模包括:将数据预处理中的词向量分别传入Bert1,Bert2进行训练,得到模型1、模型2。
5.如权利要求4所述的一种自然语言智能数据建模技术,其特征在于,模型建模包括:model1负责预测表中字段的分类以及表连接条件,cond_conn_op:SQL语句中where后的连接条件conds_op:负责找到表中哪些字段被选择,model2,负责where后面条件运算符的筛选以及条件值的抽取conds_vals。
6.如权利要求5所述的一种自然语言智能数据建模技术,其特征在于,模型保存包括:将模型分别存入hdfs,供调用。
7.如权利要求1所述的一种自然语言智能数据建模技术,其特征在于,NLP包括:序列标注、分类任务、句子关系判断、生成任务,第二NL2SQL为NLP技术的一个分支,用NLP的分类任务、句子关系判断技术,第二NL2SQL包括:确定SQL结构、预测字段值,Bert框架包括:句子分类、实体抽取、语言问答。
8.如权利要求7所述的一种自然语言智能数据建模技术,其特征在于,序列标注包括:中文分词、词性标注、命名实体识别、语义角色标注,分类任务包括:文本分类、情感计算,句子关系判断包括:Entailment、QA、语义改写,自然语言推理任务,生成任务包括:机器翻译、文本摘要、写诗造句、看图说话。
9.如权利要求8所述的一种自然语言智能数据建模技术,其特征在于,第二NL2SQL包括:确定SQL结构:确定SQL的“结构”、预测字段值:根据自然语言问题,选用适当的算法预测出字段、聚合条件、以及where条件连接值。
10.如权利要求9所述的一种自然语言智能数据建模技术,其特征在于,Bert框架包括:句子分类、实体抽取、语言问答。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523491.XA CN112559690A (zh) | 2020-12-21 | 2020-12-21 | 一种自然语言智能数据建模技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523491.XA CN112559690A (zh) | 2020-12-21 | 2020-12-21 | 一种自然语言智能数据建模技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112559690A true CN112559690A (zh) | 2021-03-26 |
Family
ID=75031158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011523491.XA Pending CN112559690A (zh) | 2020-12-21 | 2020-12-21 | 一种自然语言智能数据建模技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559690A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282724A (zh) * | 2021-05-21 | 2021-08-20 | 北京京东振世信息技术有限公司 | 一种智能客服的交互方法和装置 |
CN114168885A (zh) * | 2021-12-03 | 2022-03-11 | 武汉百智诚远科技有限公司 | 一种基于语音识别和nl2sql模型的智能类案检索的方法 |
CN114936271A (zh) * | 2022-06-27 | 2022-08-23 | 阿里云计算有限公司 | 自然语言转换数据库查询语句的方法、设备及介质 |
CN116467347A (zh) * | 2023-03-22 | 2023-07-21 | 天云融创数据科技(北京)有限公司 | 一种股票问答方法 |
CN116737909A (zh) * | 2023-07-28 | 2023-09-12 | 无锡容智技术有限公司 | 基于自然语言对话的表数据处理方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016127740A1 (zh) * | 2015-02-13 | 2016-08-18 | 广州神马移动信息科技有限公司 | 信息查询方法和设备 |
CN108228701A (zh) * | 2017-10-23 | 2018-06-29 | 武汉大学 | 一种实现汉语近自然语言查询接口的系统 |
CA3062071A1 (en) * | 2017-05-18 | 2018-11-22 | Salesforce.Com, Inc. | Neural network based translation of natural language queries to database queries |
CN110888897A (zh) * | 2019-11-12 | 2020-03-17 | 杭州世平信息科技有限公司 | 一种根据自然语言生成sql语句的方法及装置 |
CN111522839A (zh) * | 2020-04-25 | 2020-08-11 | 华中科技大学 | 一种基于深度学习的自然语言查询方法 |
US20200257679A1 (en) * | 2019-02-13 | 2020-08-13 | International Business Machines Corporation | Natural language to structured query generation via paraphrasing |
CN112100200A (zh) * | 2020-09-27 | 2020-12-18 | 四川长虹电器股份有限公司 | 一种基于维度模型自动化生成sql语句的方法 |
-
2020
- 2020-12-21 CN CN202011523491.XA patent/CN112559690A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016127740A1 (zh) * | 2015-02-13 | 2016-08-18 | 广州神马移动信息科技有限公司 | 信息查询方法和设备 |
CA3062071A1 (en) * | 2017-05-18 | 2018-11-22 | Salesforce.Com, Inc. | Neural network based translation of natural language queries to database queries |
CN110945495A (zh) * | 2017-05-18 | 2020-03-31 | 易享信息技术有限公司 | 基于神经网络的自然语言查询到数据库查询的转换 |
CN108228701A (zh) * | 2017-10-23 | 2018-06-29 | 武汉大学 | 一种实现汉语近自然语言查询接口的系统 |
US20200257679A1 (en) * | 2019-02-13 | 2020-08-13 | International Business Machines Corporation | Natural language to structured query generation via paraphrasing |
CN110888897A (zh) * | 2019-11-12 | 2020-03-17 | 杭州世平信息科技有限公司 | 一种根据自然语言生成sql语句的方法及装置 |
CN111522839A (zh) * | 2020-04-25 | 2020-08-11 | 华中科技大学 | 一种基于深度学习的自然语言查询方法 |
CN112100200A (zh) * | 2020-09-27 | 2020-12-18 | 四川长虹电器股份有限公司 | 一种基于维度模型自动化生成sql语句的方法 |
Non-Patent Citations (1)
Title |
---|
胡盼盼: "自然语言处理从入门到实战", 30 June 2020, 北京:中国铁道出版社, pages: 103 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282724A (zh) * | 2021-05-21 | 2021-08-20 | 北京京东振世信息技术有限公司 | 一种智能客服的交互方法和装置 |
CN113282724B (zh) * | 2021-05-21 | 2024-05-28 | 北京京东振世信息技术有限公司 | 一种智能客服的交互方法和装置 |
CN114168885A (zh) * | 2021-12-03 | 2022-03-11 | 武汉百智诚远科技有限公司 | 一种基于语音识别和nl2sql模型的智能类案检索的方法 |
CN114936271A (zh) * | 2022-06-27 | 2022-08-23 | 阿里云计算有限公司 | 自然语言转换数据库查询语句的方法、设备及介质 |
CN116467347A (zh) * | 2023-03-22 | 2023-07-21 | 天云融创数据科技(北京)有限公司 | 一种股票问答方法 |
CN116467347B (zh) * | 2023-03-22 | 2024-04-30 | 天云融创数据科技(北京)有限公司 | 一种股票问答方法 |
CN116737909A (zh) * | 2023-07-28 | 2023-09-12 | 无锡容智技术有限公司 | 基于自然语言对话的表数据处理方法 |
CN116737909B (zh) * | 2023-07-28 | 2024-04-23 | 无锡容智技术有限公司 | 基于自然语言对话的表数据处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559690A (zh) | 一种自然语言智能数据建模技术 | |
US11847422B2 (en) | System and method for estimation of interlocutor intents and goals in turn-based electronic conversational flow | |
US11003863B2 (en) | Interactive dialog training and communication system using artificial intelligence | |
US8892539B2 (en) | Building, reusing and managing authored content for incident management | |
US10747958B2 (en) | Dependency graph based natural language processing | |
CN112527791A (zh) | 一种城市大脑智能大数据系统 | |
US20200143261A1 (en) | Systems and methods for processing content using a pattern language | |
CN104281615A (zh) | 一种投诉处理的方法和系统 | |
Binnig et al. | Towards interactive curation & automatic tuning of ml pipelines | |
CN117474630A (zh) | 一种基于电商应用的人工智能平台 | |
CN117520514A (zh) | 一种问答任务处理方法、装置、设备及可读存储介质 | |
CN117806980B (zh) | 一种基于大语言模型的测试用例自动生成装置 | |
CN113902394A (zh) | 一种实现人工智能产业生态化的服务平台 | |
CN116091045B (zh) | 一种基于知识图谱的通信网络运维方法和运维装置 | |
CN117314140A (zh) | 一种基于事件关系抽取的rpa流程挖掘方法和装置 | |
CN112612481B (zh) | 一种智能中台的系统架构 | |
Sosa-Sánchez et al. | Service discovery using a semantic algorithm in a SOA modernization process from legacy Web applications | |
Das et al. | Customer Relationship Management in a Data-Driven World: Leveraging Data Mining Tools | |
Ackermann et al. | Recent Advances in Data-Driven Business Process Management | |
Lê et al. | Correlating business objectives with services: An ontology-driven approach | |
Fugini et al. | A text analytics architecture for smart companies | |
US20240144916A1 (en) | Machine learning enabled category creation | |
Li et al. | Enterprise precision marketing effectiveness model based on data mining technology | |
Kim et al. | An enterprise architecture framework based on a common information technology domain (EAFIT) for improving interoperability among heterogeneous information systems | |
CN118643071A (zh) | 集成大模型的元数据管理系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |