CN116467347B - 一种股票问答方法 - Google Patents
一种股票问答方法 Download PDFInfo
- Publication number
- CN116467347B CN116467347B CN202310286589.5A CN202310286589A CN116467347B CN 116467347 B CN116467347 B CN 116467347B CN 202310286589 A CN202310286589 A CN 202310286589A CN 116467347 B CN116467347 B CN 116467347B
- Authority
- CN
- China
- Prior art keywords
- natural language
- triplet
- condition
- column
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003058 natural language processing Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 21
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000006403 short-term memory Effects 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 239000011550 stock solution Substances 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 235000020068 maotai Nutrition 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种股票问答方法,涉及数据库技术领域,该方法包括:基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,第一SQL语句成分包括条件列和条件值,第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;将第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标条件列、目标条件值、和目标条件判断符;根据目标三元组关系和第二SQL语句成分,得到自然语言问句对应的SQL语句;基于SQL语句在股票数据库中进行查询,获取自然语言问句对应的查询结果。用于解决对用户输入的股票查询问题进行反馈的查询结果准确度较低的问题。
Description
技术领域
本申请涉及数据库技术领域,尤其涉及一种股票问答方法。
背景技术
自然语言转SQL语句(Structured Query Language,结构化查询语言)的应用场景非常广泛,是智能化语音的关键技术,在对数据库中的数据进行查询时,通常也需要将自然语言转化为SQL语句,从而基于SQL语句完成查询任务。
目前,用户针对包括大量股票数据表的数据库输入关于股票的自然语言问句时,基于现有方法生成自然语言问句对应的反馈结果的准确性较差。
发明内容
为了解决在进行股票问答时,基于现有方法生成反馈结果的准确性较差的问题,本申请提供了一种股票问答方法、装置、电子设备及存储介质。
第一方面,本申请提供了股票问答方法,包括:
基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;
将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;
根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;
基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
作为本申请实施例一种可选的实施方式,在基于自然语言处理模型对自然语言问句进行处理之前,所述方法还包括:
获取所述股票数据库中各数据表的表信息,所述表信息包括:表名、列名、以及所述列名对应的数据的数据类型;
将所述各数据表的表信息与所述自然语言问句拼接,得到第一输入信息输入所述自然语言处理模型。
作为本申请实施例一种可选的实施方式,所述基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分,包括:
对所述第一输入信息进行截断处理,得到多段文本序列;
将所述多段文本序列输入所述自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息;
将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息;
将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分。
作为本申请实施例一种可选的实施方式,所述将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,包括:
获取多个三元组关系,并将所述多个三元组关系分别转换为各三元组关系对应的关系文本,将各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息;
将所述多个第二输入信息输入所述三元组关系预测模型的BERT模块,获取所述多个第二输入信息分别对应的语义信息;
将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系。
作为本申请实施例一种可选的实施方式,所述获取多个三元组关系,包括:
根据所述条件列对应的数据类型和条件判断符字典,获取所述条件列和条件值对应的条件判断符,所述条件判断符字典包括数据类型和条件判断符之间的映射关系;
将所述条件列、所述条件值以及所述条件判断符进行组合,得到多个三元组关系。
作为本申请实施例一种可选的实施方式,所述将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系,包括:
基于所述三元组关系预测模型的全连接层获取每个第二输入信息的得分;
获取所述得分大于预设阈值的第二输入信息对应的三元组关系为所述目标三元组关系。
作为本申请实施例一种可选的实施方式,所述将所述各数据表的表信息与所述自然语言问句拼接,包括:
获取所述自然语言问句中的数字和时间数据,并将所述数字和所述时间数据分别转换成预置格式的数据;
对所述数字和所述时间数据分别转换成预置格式的数据之后的自然语言问句与所述各数据表的表信息进行拼接。
第二方面,本申请提供股票问答装置,包括:
处理模块,用于基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;
预测模块,用于将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;
构建模块,用于根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;
查询模块,用于基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
作为本申请实施例一种可选的实施方式,所述装置还包括:预处理模块,用于获取所述股票数据库中各数据表的表信息,所述表信息包括:表名、列名、以及所述列名对应的数据的数据类型;
将所述各数据表的表信息与所述自然语言问句拼接,得到第一输入信息输入所述自然语言处理模型。
作为本申请实施例一种可选的实施方式,所述处理模块,具体用于对所述第一输入信息进行截断处理,得到多段文本序列;
将所述多段文本序列输入所述自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息;
将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息;
将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分。
作为本申请实施例一种可选的实施方式,所述预测模块,具体用于获取多个三元组关系,并将所述多个三元组关系分别转换为各三元组关系对应的关系文本,将各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息;
将所述多个第二输入信息输入所述三元组关系预测模型的BERT模块,获取所述多个第二输入信息分别对应的语义信息;
将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系。
作为本申请实施例一种可选的实施方式,所述预测模块,具体用于根据所述条件列对应的数据类型和条件判断符字典,获取所述条件列和条件值对应的条件判断符,所述条件判断符字典包括数据类型和条件判断符之间的映射关系;
将所述条件列、所述条件值以及所述条件判断符进行组合,得到多个三元组关系。
作为本申请实施例一种可选的实施方式,所述预测模块,具体用于基于所述三元组关系预测模型的全连接层获取每个第二输入信息的得分;
获取所述得分大于预设阈值的第二输入信息对应的三元组关系为所述目标三元组关系。
作为本申请实施例一种可选的实施方式,所述预处理模块,具体用于获取所述自然语言问句中的数字和时间数据,并将所述数字和所述时间数据分别转换成预置格式的数据;
对所述数字和所述时间数据分别转换成预置格式的数据之后的自然语言问句与所述各数据表的表信息进行拼接。
第三方面,本申请实施例提供一种电子设备,包括:存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于在调用计算机程序时执行第一方面或第一方面任一种可选的实施方式所述的股票问答方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面或第一方面任一种可选的实施方式所述的股票问答方法。
本申请实施例提供的技术方案与现有技术相比具有如下优点:
本申请实施例提供了一种股票问答方法、装置、电子设备及存储介质,其中,该方法包括:基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。在本申请实施例中,首先通过自然语言处理模型根据自然语言问句得到用于构成SQL语句的第一SQL语句成分和第二SQL语句成分,然后三元组关系预测模型根据自然语言问句和第一SQL语句成分对目标三元组关系预测,使得到的目标条件列、目标条件值、和目标条件判断符与自然语言问句的相关性更强,从而可以提高基于目标三元组关系和第二SQL语句成分构成的SQL语句的准确性,进而使得生成自然语言问句对应的反馈结果更加准确。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一个实施例提供的股票问答方法的步骤流程图;
图2为本申请一个实施例提供的生成查询结果的流程示意图;
图3为本申请另一个实施例提供的股票问答方法的步骤流程图;
图4为本申请一个实施例提供的自然语言处理模型的结构示意图;
图5为本申请再一个实施例提供的股票问答的结构示意图;
图6为本申请再一个实施例提供的三元组关系预测模型的结构示意图;
图7为本申请一个实施例提供的股票问答装置的结构框图;
图8为本申请另一个实施例提供的股票问答装置的结构框图;
图9为本申请一个实施例提供的电子设备的内部结构图。
具体实施方式
为使本申请的目的、实施方式和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请实施例提供的股票问答方法可以通过股票问答装置、或本申请实施例提供的电子设备来执行,该电子设备可以为终端设备,但不限于为手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、智能手表、智能手环等终端设备,也可以为其它一些类型的电子设备。本申请对于电子设备的具体类型不做限定。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举可选实施例,并配合所附附图,作详细说明如下。
图1为本申请一个实施例提供的股票问答方法的步骤流程图,参照图1所示,本实施例提供的股票问答方法包括以下步骤:
S110、基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分。
其中,所述自然语言问句为对用户输入的自然语言问句进行预处理后的数据,预处理可包括对用户输入的自然语言问句中的数字和时间数据分别转换成预置格式的数据,如根据正则匹配的方式将中文数字转换为阿拉伯数字。用户输入的自然语言问句可以为文字,也可以为语音,本申请实施例不进行具体限定。
所述第一SQL语句成分包括条件列(where)和条件值,所述第二SQL语句成分包括:分组(group by)、排序(order by)、条件连接符、选择表(from)、选择列(select)、选择列的聚合函数、外键中的一个或多个。选择表指选择数据表的名称,选择列指选择列名,条件列指条件列名。
所述自然语言处理模型为基于BERT的预训练模型,包括BERT模块、LSTM(LongShort-Term Memory,长短期记忆网络)层、以及全连接层。其中,BERT模块用于获取每个输入信息对应的局部语义信息,LSTM层用于根据局部语义信息获取全局语义信息,全连接层用于将LSTM层输出的语义信息进行分类,得到标签结果。
S120、将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系。
其中,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;所述三元组关系预测模型为基于BERT的预测模型。
示例性的,根据自然语言问句预测该自然语言问句对应的所有条件判断符、条件列和条件值,通过对各条件判断符、条件列和条件值进行组合,得到多个三元组关系,每个三元组关系包括一个条件判断符、一个条件列和一个条件值,将多组三元组关系分别与自然语言问句进行拼接作为三元组关系预测模型的输入,获取目标三元组关系,所述目标三元组关系中的条件判断符、条件列和条件值等SQL语句成分为与该自然语言问句相关性最强的SQL语句成分。
S130、根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句。
示例性的,根据SQL语法对分组(group by)、排序(order by)、条件连接符、选择表(from)、选择列(select)、选择列的聚合函数、外键、目标条件列、目标条件值、和目标条件判断符等进行处理,生成该自然语言问句对应的SQL语句。
S140、基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
其中,所述查询结果为向用户进行反馈的结果,可以通过语音的形式向用户进行反馈,也可以通过文字的形式向用户进行反馈,本实施例不进行具体限定。
上述步骤S110至S140的执行过程可结合图2所示,图2为本申请一个实施例中提供的生成查询结果的流程示意图,自然语言处理模型基于条件列、条件值、group by、orderby、条件连接符、选择表、选择列、外键等进行多任务学习,可提高自然语言处理模型的准确率。
本申请实施例提供了一种股票问答方法、装置、电子设备及存储介质,其中,该方法包括:基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。在本申请实施例中,首先通过自然语言处理模型根据自然语言问句得到用于构成SQL语句的第一SQL语句成分和第二SQL语句成分,然后三元组关系预测模型根据自然语言问句和第一SQL语句成分对目标三元组关系预测,使得到的目标条件列、目标条件值、和目标条件判断符与自然语言问句的相关性更强,从而可以提高基于目标三元组关系和第二SQL语句成分构成的SQL语句的准确性,进而使得生成自然语言问句对应的反馈结果更加准确。
在本申请一个实施例中,在步骤S110之前,还包括以下步骤S310至S320,参照图3所示,图3为本申请另一个实施例提供的股票问答方法的步骤流程图。
S310、获取股票数据库中各数据表的表信息。
其中,所述表信息包括:股票信息表名、股票信息列名、以及所述股票信息列名对应的数据的数据类型。
S320、将所述各数据表的表信息与所述自然语言问句拼接,得到第一输入信息输入所述自然语言处理模型。
示例性的,首先获取自然语言问句(用户输入的自然语言问句)中的数字和时间数据,将所述数字和所述时间数据分别转换成预置格式的数据;对所述数字和所述时间数据分别转换成预置格式的数据之后的自然语言问句与所述各数据表的表信息进行拼接。
示例性的,将时间数据“今天”、“昨天”“上周天”转换为“年月日”的时间表达式,将表示数字的词,如“一百”转换为“100”的数字表示。
若无特殊说明,本申请实施例中所述的自然语言问句指将数字和时间数据分别转换成预置格式的数据之后的自然语言问句。
示例性的,将所述各数据表的表信息与所述自然语言问句拼接可通过如下方式实现:确定起始标识符为[CLS],各股票信息表的表名之间的标识符为[SEP][unused70],各股票信息表中股票列的股票列信息之间的标识符为[SEP]。通过在头部(第一个股票信息表的第一个股票列)之前添加[CLS]标识符,每个股票列信息之间通过[SEP]连接,两个股票信息表的表名之间用[SEP][unused70]连接,最后通过[SEP]拼接自然语言问句,在自然语言问句之后添加结束标识符[SEP],得到第一输入信息。例如,
若得到的第一输入信息为文本长度大于512个字符的长文本,则需将第一输入信息进行截断处理,使截断得到的每一部分的字符数量不超过512。
参照图3所示,在步骤S320之后还包括上述步骤S110、基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分的具体实现步骤S330至S360。
S330、对所述第一输入信息进行截断处理,得到多段文本序列。
示例性的,参照下表1所示,N个股票信息表(Table11至TableN)与自然语言问句question进行拼接得到第一输入信息为:[CLS]Table1[SEP][unused70]...TableN[SEP][unused70][SEP]question[SE P],在第一输入信息为文本长度大于512个字符时进行截断处理,本示例以截断为三段文本序列为例进行说明,截断处理后得到如下表1所示的第一段文本序列、第二段文本序列、以及第三段文本序列。
表1
即,进行截断处理指将股票数据表的表信息进行分段,将分段后的表信息与[CLS]、question进行拼接,得到多段文本序列,作为自然语言处理模型的输入。
S340、将所述多段文本序列输入所述自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息。
参照图4所示,图4为本申请一个实施例提供的自然语言处理模型的结构示意图,该自然语言处理模型包括BERT模块、LSTM层、以及全连接层。BERT层对输入的各段文本序列进行语义分析,获取各段文本序列分别对应的语义信息,包括:局部语义信息、局部语义信息对应的标签、自然语言问句question语义信息。
在图4所示输入的多段文本序列中,Ti表示股票信息表名(i为股票信息表的个数,i取值为1至n),股票列信息由Cm_Y和Cm组成,Cm表示股票信息列名(m为股票信息列的个数),Cm_Y表示Cm列的数据类型,qk为自然语言问句的文本序列,其中,k为文本长度。
S350、将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息。
示例性的,结合图4所示,将BERT模块输出的多段文本序列分别对应的局部语义信息进行拼接,然后通过全连接层降为到单个局部语义信息的维度,得到CLS_concat_rf,将BERT模块输出的多段文本序列分别对应的局部语义信息的标签进行拼接,得到Token_concat,将BERT模块输出的question语义信息进行拼接,然后通过全连接层降维到单个question语义信息的维度,得到Question_concat_rf,即拼接处理后得到CLS_concat_rf、Token_concat、Question_concat_rf,作为LSTM层的输入,得到第一输入信息对应的全局语义信息。
S360、将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分。
示例性的,结合图4所示,将LSTM层输出的全局语义信息通过不同的全连接层进行分类,得到标签结果,基于标签结果获取条件列(where)和条件值、分组(group by)、排序(order by)、条件连接符、选择表(from)、选择列(select)、选择列的聚合函数等SQL语句成分。
示例性的,经全连接层进行分类后的股票列及其聚合函数(Select_FC)的分类结果参见图4中的Select_FC的分类结果,根据聚合函数字典{0:"",1:"max",2:"min",3:"sum",4:"avg",5:"distinct",6:"count"},对股票列八分类,其中,0-6表示该列为选择列以及对应的聚合函数,7表示不选择该列。条件列(Conds_FC)的分类结果参见图4中的Conds_FC的分类结果,根据判断条件字典{0:"=",1:">",2:"<",3:">=",4:"<=",5:"!="},对股票列进行七分类,其中,0-5表示该列为条件列,6表示不选择该列。条件列连接符(CLS_FC)的分类结果参见图4中CLS_FC的分类结果,其中,头部[CLS]输出0或1,0代表无连接符;1代表“and”连接符。选择表(Table_FC)的分类结果参见图4中Table_FC的分类结果,其中,对股票信息表输出0或1,1代表选择该表,0代表不选择该表。外键(Foreign_FC)的分类结果参见图4中Foreign_FC的分类结果,对股票列进行二分类,1表示选择该列为外键,0代表不选择该列为外键。分组(group by)和排序(order by)的分类结果参见图4中Order_by_Group_by_FC的分类结果,对股票列进行四分类,其中,0代表对该列order by倒序,1代表对该列order by正序,2代表对该列group by,3代表不选择该列。通过序列标注方法,预测条件列的条件值,条件值(Sequence_FC)的分类结果参见图4中Sequence_FC的标注结果,question的每个字有七种输出,其中,“O”表示无关词,‘T-B’表示时间数据起始位置;T-I’表示时间数据中间位置,‘S-B’表示文本数据起始位置,S-I’表示文本数据中间位;‘R-B’表示数字数据起始位置,R-I’表示数字数据中间位置。基于标签结果和标注结果可得到用于构成sql语句的语句成分。
在本实施例中,在拼接后的第一输入信息为长文本的情况下,进行了截断处理,得到多段文本序列,将得到的多段文本序列通过自然语言处理模型获取语义信息,解决了不能对长文本进行语义分析获取对应的语义信息的问题,因此本申请实施例提供的股票问答方法可应查询存储有大量股票数据表、大量股票数据列的数据库查询中。
在上述任一实施例的基础上,步骤S120、将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,需首先获取多个三元组关系,获取多个三元组关系包括以下步骤S510至步骤S520,参照图5所示,图5为本申请又一个实施例提供的股票问答方法的步骤流程图。
S510、根据所述条件列对应的数据类型和条件判断符字典,获取所述条件列和条件值对应的条件判断符。
其中,所述条件判断符字典包括数据类型和条件判断符之间的映射关系。
示例性的,基于自然语言处理模型输出的条件列和order_by列,可得到条件列对应的数据类型,根据数据类型和条件判断符字典,得到条件判断符。
S520、将所述条件列、所述条件值以及所述条件判断符进行组合,得到多个三元组关系。
示例性的,枚举出符合条件的条件列、条件值以及条件判断符组成的三元组关系,参见下表2所示,表2以三个示例示出,其中,表2对于三元组关系仅以几个示例示出,不进行一一列举。
表2
一个自然语言问句可能匹配多个三元组关系,需要通过三元组关系预测模型筛选出符合预设阈值的三元组关系作为目标三元组关系。获取目标三元组关系可通过如下步骤S530至S550实现,参照图5所示。
S530、将所述多个三元组关系分别转换为各三元组关系对应的关系文本,将各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息。
示例性的,将上表2中所示的三元组关系“(交易日期,=,20220930)”转换为对应的关系文本“交易日期为20220930”;将上表2中所示的三元组关系“(交易日期,>,20220930)”转换为对应的关系文本“交易日期为20220930之后”;将上表2中所示的三元组关系“(收盘价,=,20)”转换为对应的关系文本“收盘价等于20”;将上表2中所示的三元组关系“(收盘价,>,20)”转换为对应的关系文本“收盘价大于20”;将上表2中所示的三元组关系“(收盘价,<,20)”转换为对应的关系文本“收盘价小于20”;将上表2中所示的三元组关系“(交易日期,=,20210801)”转换为对应的关系文本“交易日期为20210801”;将上表2中所示的三元组关系“(交易日期,<,20210801)”转换为对应的关系文本“交易日期为20210801之前”;将上表2中所示的三元组关系“(限制,为,3)”转换为对应的关系文本“限制为3”;将上表2中所示的三元组关系“(股票名,=,贵州茅台)”转换为对应的关系文本“股票名是贵州茅台”;将上表2中所示的三元组关系“(股票名,!=,贵州茅台)”转换为对应的关系文本“股票名不是贵州茅台”。
将得到的各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息,参照下表3所示,将多个第二输入信息作为三元组关系预测模型的输入。
表3
S540、将所述多个第二输入信息输入所述三元组关系预测模型的BERT模块,获取所述多个第二输入信息分别对应的语义信息。
示例性的,参照图6所示,图6为本申请一个实施例提供的三元组关系预测模型的结构示意图,在图6所示的第二输入信息中,qk表示question文本序列,k为文本序列长度;rn表示关系文本序列,n为关系序列长度。BERT模块对输入的第二输入信息进行语义匹配计算,得到各第二输入信息分别对应的语义信息,作为全连接层的输入,经全连接层进行分类,得到标签结果。
S550、将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系。
示例的,基于所述三元组关系预测模型的全连接层获取每个第二输入信息的得分;获取所述得分大于预设阈值的第二输入信息对应的三元组关系为所述目标三元组关系。
得到目标三元组关系之后,接着执行步骤S130至S140,以向用户反馈生成的自然语言问句对应的查询结果。
基于同一发明构思,作为对上述方法的实现,本申请实施例还提供了执行上述实施例提供的股票问答装置,该装置可以执行前述方法实施例对应所述的股票问答方法,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的股票问答装置能够对应实现前述方法实施例中的全部内容。
图7为本申请实施例提供的股票问答装置的结构示意图,如图7所示,本实施例提供的股票问答装置700包括:
处理模块710,用于基于自然语言处理模型对自然语言问句进行处理,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;
预测模块720,用于将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;
构建模块730,用于根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;
查询模块740,用于基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
图8为本申请另一个实施例提供的股票问答装置的结构示意图,参照图8所示,在所述股票问答装置700的基础上,还包括:
预处理模块810,用于获取所述股票数据库中各数据表的表信息,所述表信息包括:表名、列名、以及所述列名对应的数据的数据类型;将所述各数据表的表信息与所述自然语言问句拼接,得到第一输入信息输入所述自然语言处理模型。
作为本申请实施例一种可选的实施方式,所述处理模块710,具体用于对所述第一输入信息进行截断处理,得到多段文本序列;将所述多段文本序列输入所述自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息;将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息;将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分。
作为本申请实施例一种可选的实施方式,所述预测模块720,具体用于获取多个三元组关系,并将所述多个三元组关系分别转换为各三元组关系对应的关系文本,将各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息;将所述多个第二输入信息输入所述三元组关系预测模型的BERT模块,获取所述多个第二输入信息分别对应的语义信息;将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系。
作为本申请实施例一种可选的实施方式,所述预测模块720,具体用于根据所述条件列对应的数据类型和条件判断符字典,获取所述条件列和条件值对应的条件判断符,所述条件判断符字典包括数据类型和条件判断符之间的映射关系;将所述条件列、所述条件值以及所述条件判断符进行组合,得到多个三元组关系。
作为本申请实施例一种可选的实施方式,所述预测模块720,具体用于基于所述三元组关系预测模型的全连接层获取每个第二输入信息的得分;获取所述得分大于预设阈值的第二输入信息对应的三元组关系为所述目标三元组关系。
作为本申请实施例一种可选的实施方式,所述预处理模块,具体用于获取所述自然语言问句中的数字和时间数据,并将所述数810字和所述时间数据分别转换成预置格式的数据;对所述数字和所述时间数据分别转换成预置格式的数据之后的自然语言问句与所述各数据表的表信息进行拼接。
本实施例提供的股票问答装置可以执行上述方法实施例提供的股票问答方法,其实现原理与技术效果类似,此处不再赘述。上述股票问答装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种电子设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例所述的任意一项股票问答方法的步骤。
示例性的,图9为本申请实施例提供的电子设备的结构示意图。如图9所示,本实施例提供的电子设备包括:存储器91和处理器92,存储器91用于存储计算机程序;处理器92用于调用计算机程序时执行上述方法实施例提供的股票问答方法中的步骤,其实现原理和技术效果类似,此处不再赘述。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例所述的任意一项股票问答方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccess Memory,RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,比如静态随机存取存储器(Static Random Access Memory,SRAM)和动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种股票问答方法,其特征在于,包括:
获取股票数据库中各数据表的表信息,所述表信息包括:表名、列名、以及所述列名对应的数据的数据类型;
将所述各数据表的表信息与自然语言问句拼接,得到第一输入信息;
对所述第一输入信息进行截断处理,得到多段文本序列;
将所述多段文本序列输入自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息;
将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息;
将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;
将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;
根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;
基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,包括:
获取多个三元组关系,并将所述多个三元组关系分别转换为各三元组关系对应的关系文本,将各关系文本分别与所述自然语言问句进行拼接,得到多个第二输入信息;
将所述多个第二输入信息输入所述三元组关系预测模型的BERT模块,获取所述多个第二输入信息分别对应的语义信息;
将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系。
3.根据权利要求2所述的方法,其特征在于,所述获取多个三元组关系,包括:
根据所述条件列对应的数据类型和条件判断符字典,获取所述条件列和条件值对应的条件判断符,所述条件判断符字典包括数据类型和条件判断符之间的映射关系;
将所述条件列、所述条件值以及所述条件判断符进行组合,得到多个三元组关系。
4.根据权利要求2或3所述的方法,其特征在于,所述将所述多个第二输入信息分别对应的语义信息输入所述三元组关系预测模型的全连接层,获取目标三元组关系,包括:
基于所述三元组关系预测模型的全连接层获取每个第二输入信息的得分;
获取所述得分大于预设阈值的第二输入信息对应的三元组关系为所述目标三元组关系。
5.根据权利要求1所述的方法,其特征在于,所述将所述各数据表的表信息与所述自然语言问句拼接,包括:
获取自然语言问句中的数字和时间数据,并将所述数字和所述时间数据分别转换成预置格式的数据;
对所述数字和所述时间数据分别转换成预置格式的数据之后的自然语言问句与所述各数据表的表信息进行拼接。
6.一种股票问答装置,其特征在于,包括:
预处理模块,用于获取股票数据库中各数据表的表信息,所述表信息包括:表名、列名、以及所述列名对应的数据的数据类型;将所述各数据表的表信息与自然语言问句拼接,得到第一输入信息;
处理模块,用于对所述第一输入信息进行截断处理,得到多段文本序列;将所述多段文本序列输入自然语言处理模型中的BERT模块,获取所述多段文本序列中每段文本序列对应的语义信息;将所述每段文本序列对应的语义信息进行拼接处理,并输入所述自然语言处理模型中的长短期记忆网络层,得到所述第一输入信息对应的全局语义信息;将所述全局语义信息输入所述自然语言处理模型中的全连接层,获取第一SQL语句成分和第二SQL语句成分;其中,所述第一SQL语句成分包括条件列和条件值,所述第二SQL语句成分包括:分组、排序、条件连接符、选择表、选择列、外键中的一个或多个;
预测模块,用于将所述第一SQL语句成分中的条件列和条件值,以及自然语言问句输入三元组关系预测模型,获取目标三元组关系,所述目标三元组关系包括目标条件列、目标条件值、和目标条件判断符;
构建模块,用于根据所述目标三元组关系和所述第二SQL语句成分,得到所述自然语言问句对应的SQL语句;
查询模块,用于基于所述SQL语句在股票数据库中进行查询,获取所述自然语言问句对应的查询结果。
7.一种电子设备,包括:存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的股票问答方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的股票问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310286589.5A CN116467347B (zh) | 2023-03-22 | 2023-03-22 | 一种股票问答方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310286589.5A CN116467347B (zh) | 2023-03-22 | 2023-03-22 | 一种股票问答方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116467347A CN116467347A (zh) | 2023-07-21 |
CN116467347B true CN116467347B (zh) | 2024-04-30 |
Family
ID=87184871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310286589.5A Active CN116467347B (zh) | 2023-03-22 | 2023-03-22 | 一种股票问答方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116467347B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111522839A (zh) * | 2020-04-25 | 2020-08-11 | 华中科技大学 | 一种基于深度学习的自然语言查询方法 |
CN112559690A (zh) * | 2020-12-21 | 2021-03-26 | 广东珠江智联信息科技股份有限公司 | 一种自然语言智能数据建模技术 |
CN112613582A (zh) * | 2021-01-05 | 2021-04-06 | 重庆邮电大学 | 一种基于深度学习混合模型的争议焦点检测方法及装置 |
CN112783921A (zh) * | 2021-01-26 | 2021-05-11 | 中国银联股份有限公司 | 一种数据库操作方法及装置 |
CN114547072A (zh) * | 2022-02-10 | 2022-05-27 | 招商银行股份有限公司 | 自然语言查询转换sql方法、系统、设备及存储介质 |
CN114880347A (zh) * | 2022-04-27 | 2022-08-09 | 北京理工大学 | 一种基于深度学习的自然语言转化为sql语句的方法 |
CN115048407A (zh) * | 2022-05-20 | 2022-09-13 | 长威信息科技发展股份有限公司 | 一种基于自然语言问句的关系型数据库查询方法及终端 |
CN115422220A (zh) * | 2022-07-11 | 2022-12-02 | 上海通办信息服务有限公司 | 一种基于深度学习模型的自然语言转sql的方法 |
CN115658729A (zh) * | 2022-11-02 | 2023-01-31 | 广东工业大学 | 一种基于预训练模型的自然语言转sql语句的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10747761B2 (en) * | 2017-05-18 | 2020-08-18 | Salesforce.Com, Inc. | Neural network based translation of natural language queries to database queries |
-
2023
- 2023-03-22 CN CN202310286589.5A patent/CN116467347B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111522839A (zh) * | 2020-04-25 | 2020-08-11 | 华中科技大学 | 一种基于深度学习的自然语言查询方法 |
CN112559690A (zh) * | 2020-12-21 | 2021-03-26 | 广东珠江智联信息科技股份有限公司 | 一种自然语言智能数据建模技术 |
CN112613582A (zh) * | 2021-01-05 | 2021-04-06 | 重庆邮电大学 | 一种基于深度学习混合模型的争议焦点检测方法及装置 |
CN112783921A (zh) * | 2021-01-26 | 2021-05-11 | 中国银联股份有限公司 | 一种数据库操作方法及装置 |
CN114547072A (zh) * | 2022-02-10 | 2022-05-27 | 招商银行股份有限公司 | 自然语言查询转换sql方法、系统、设备及存储介质 |
CN114880347A (zh) * | 2022-04-27 | 2022-08-09 | 北京理工大学 | 一种基于深度学习的自然语言转化为sql语句的方法 |
CN115048407A (zh) * | 2022-05-20 | 2022-09-13 | 长威信息科技发展股份有限公司 | 一种基于自然语言问句的关系型数据库查询方法及终端 |
CN115422220A (zh) * | 2022-07-11 | 2022-12-02 | 上海通办信息服务有限公司 | 一种基于深度学习模型的自然语言转sql的方法 |
CN115658729A (zh) * | 2022-11-02 | 2023-01-31 | 广东工业大学 | 一种基于预训练模型的自然语言转sql语句的方法 |
Non-Patent Citations (5)
Title |
---|
Bert-based Text-to-SQL Generation method with question-table content enhancement and template filling;H. Long 等;2021 2nd International Conference on Information Science and Education (ICISE-IE);20220329;969-973 * |
Human Language Question To SQL Query Using Deep Learning;K. Ahkouk 等;2019 Third International Conference on Intelligent Computing in Data Sciences (ICDS);20191227;1-6 * |
一种基于BERT的中文NL2SQL模型;张琰;《中国优秀硕士学位论文全文数据库 信息科技辑》(第12期);I138-185 * |
基于知识图谱的自然语言生成SQL语句模型研究;孙振维;《中国优秀硕士学位论文全文数据库 信息科技辑》(第01期);I138-847 * |
融合LSTM的自然语言转结构化查询语句算法的研究与设计;孙红 等;小型微型计算机系统;20230131;第44卷(第01期);63-67 * |
Also Published As
Publication number | Publication date |
---|---|
CN116467347A (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858010B (zh) | 领域新词识别方法、装置、计算机设备和存储介质 | |
CN110909122B (zh) | 一种信息处理方法及相关设备 | |
US11429834B1 (en) | Neural-based agent assistance interface for providing answers based on a query vector | |
CN111967264B (zh) | 一种命名实体识别方法 | |
CN111209396B (zh) | 实体识别模型的训练方法及实体识别方法、相关装置 | |
CN113239169A (zh) | 基于人工智能的回答生成方法、装置、设备及存储介质 | |
WO2021063089A1 (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN111159412A (zh) | 分类方法、装置、电子设备及可读存储介质 | |
CN111459977A (zh) | 自然语言查询的转换 | |
CN112270188A (zh) | 一种提问式的分析路径推荐方法、系统及存储介质 | |
CN112926308B (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN113127604B (zh) | 基于评论文本的细粒度物品推荐方法及系统 | |
CN114090776A (zh) | 文档解析方法、系统及装置 | |
CN109460450A (zh) | 对话状态跟踪方法、装置、计算机设备和存储介质 | |
CN116304023A (zh) | 一种基于nlp技术的招投标要素抽取方法、系统及存储介质 | |
CN111178080B (zh) | 一种基于结构化信息的命名实体识别方法及系统 | |
CN110826315B (zh) | 使用神经网络系统识别短文本时效性的方法 | |
CN113627194B (zh) | 信息抽取方法及装置、通信消息分类方法及装置 | |
CN116467347B (zh) | 一种股票问答方法 | |
CN114417869A (zh) | 实体识别方法、装置、电子设备及计算机可读存储介质 | |
CN113139558A (zh) | 确定物品的多级分类标签的方法和装置 | |
CN111143558B (zh) | 基于单个分层多任务模型的消息识别方法和系统 | |
CN114328902A (zh) | 文本标注模型构建方法和装置 | |
CN113627189A (zh) | 一种面向保险条款的实体识别信息抽取、存储、展示方法 | |
CN112559739A (zh) | 电力设备绝缘状态数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |