CN114661746A - 语句转换方法、装置、电子设备及存储介质 - Google Patents
语句转换方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114661746A CN114661746A CN202210191341.6A CN202210191341A CN114661746A CN 114661746 A CN114661746 A CN 114661746A CN 202210191341 A CN202210191341 A CN 202210191341A CN 114661746 A CN114661746 A CN 114661746A
- Authority
- CN
- China
- Prior art keywords
- configuration data
- conversion
- engine
- data
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 269
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000006870 function Effects 0.000 claims description 108
- 238000004590 computer program Methods 0.000 claims description 7
- 238000011426 transformation method Methods 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 19
- 238000007405 data analysis Methods 0.000 abstract description 18
- 238000007781 pre-processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 150000003966 selones Chemical class 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本公开关于语句转换方法、装置、电子设备及存储介质,该方法包括:获取待转换的自然语句和转换参数;获取所述转换参数对应的目标配置数据;在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。本公开允许用户在输入自然语句的同时选择转换参数,并对转换参数进行扩充处理,获取到对转换参数增强后的目标配置数据,进一步确定目标转换模型,并根据目标转换模型,自动获取到准确性较高的目标转换语句,提高数据分析效率。
Description
技术领域
本公开涉及自然语言处理技术领域,尤其涉及语句转换方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的不断发展,数据库中存储的数据越来越多,为了更好的利用数据库中存储数据,数据分析引擎变得至关重要。在通过数据分析引擎进行数据分析时,需要通过结构化查询语言与数据库进行交互,如此需要数据分析人员熟练掌握结构化查询语言,对数据分析人员的要求较高,且开发压力较大。目前,在利用数据分析人员开发出的结构化查询语言与数据库进行交互时,因开发出的结构化查询语音的数据结构复杂,可拓展性差,致使数据分析效率较低。
发明内容
本公开提供一种语句转换方法、装置、电子设备及存储介质,以至少解决相关技术中数据分析效率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种语句转换方法,包括:
获取待转换的自然语句和转换参数;
获取所述转换参数对应的目标配置数据;
在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;
将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
可选地,所述获取所述转换参数对应的目标配置数据,包括:
根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;
根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;
对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
可选地,所述方法还包括:
根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;
所述对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:
对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
可选地,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。
可选地,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;
当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据;
当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据;
当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。
可选地,所述对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:
对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;
将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。
根据本公开实施例的第二方面,提供一种语句转换装置,包括:
输入数据获取模块,被配置为获取待转换的自然语句和转换参数;
配置数据获取模块,被配置为获取所述转换参数对应的目标配置数据;
转换模型确定模块,被配置为在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;
转换语句获取模块,被配置将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
可选地,所述配置数据获取模块,包括:
引擎数据获取单元,被配置为根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;
引擎函数获取单元,被配置为根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;
配置数据获取单元,被配置为对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
可选地,所述配置数据获取模块,还包括:
对象数据获取单元,被配置为根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;
所述配置数据获取单元,被配置对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
可选地,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。
可选地,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;
当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。
当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。
当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。
可选地,所述配置数据获取单元,包括:
组成处理子单元,被配置为对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;
转换处理子单元,被配置为将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的语句转换方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由处理器执行时,使得服务器能够执行如第一方面所述的语句转换方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如第一方面所述的语句转换方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开获取待转换的自然语句和转换参数,转换参数为用户指定的对自然语句进行转换时使用的相关参数信息,也就是说在本公开为用户提供参数选择项,用户可以根据自身需求确定转换参数。转换参数的内容较为单一,因此对转换参数进行扩充处理,确定出与转换参数相关的目标配置数据,目标配置数据为包含有转换参数的增强数据。进一步获取与目标配置数据相适应的目标转换模型,进而将待转换的自然语句输入目标转换模型,对待转换的自然语句进行转换,确定出目标转换语句。在本公开提供的技术方案中,用户输入待转换的自然语句和转换参数,即可以获取到目标转换语句,用户利用目标转换语句可以直接对数据库进行数据查询,无需使用数据分析人员开发出的结构化查询语言,进而大大降低专业化门槛,减少开发成本,有效节约开发时间,提高数据分析效率;且通过提供参数选择项,提供多元化的转化途径,避免单一转换模式,提升语句转换的准确性,增加转换语句的拓展性,快速获取到更符合用户要求的目标转换语句,利用该目标转换语句准确的在数据库中进行查询,提升用户体验感。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种语句转换方法的应用环境示意图;
图2是根据一示例性实施例示出的一种语句转换方法的流程图;
图3是根据一示例性实施例示出的一种语句转换方法中客户端转换页面的示意图;
图4是根据一示例性实施例示出的一种语句转换方法中SQL任务解耦图;
图5是根据一示例性实施例示出的一种语句转换装置的框图;
图6是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参阅图1,其所示为根据一示例性实施例示出的一种语句转换方法的应用环境示意图,该应用环境可以包括客户端11和服务器12,该客户端11 与服务器12之间可以通过有线网络或者无线网络连接。
客户端11可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、数字助理、增强现实(augmentedreality,AR)/虚拟现实(virtual reality, VR)设备等类型的电子设备。也可以为运行于上述电子设备的软件,例如应用程序、小程序等。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
服务器12可以为客户端11中的应用程序提供后台服务的服务器。具体的,服务器12可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、 CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
图2是根据一示例性实施例示出的一种语句转换方法的流程图,该语句转换方法可以用于如图1所示服务器中,包括以下步骤。
在步骤S21中,获取待转换的自然语句和转换参数。
在一实施例中,待转换的自然语句为用户于客户端的转换界面输入的需要进行转换的内容,转换参数为用户在客户端的转换界面指定的对自然语句进行转换时使用的相关参数信息,相关参数的内容和数量可以根据实际应用场景进行确定,对此本实施例不作具体限定。
举例来说,图3示出一种客户端转换页面,在该转换页面中存在参数选择项和内容输入项,其中参数选择项包括OLAP(on-Line Analytic Processing,联机分析处理)引擎选择项、语言类型选择项、数据源选择项、业务类型选择项和bert模型(BidirectionalEncoder Representations from Transformer,一种基于Transformer的模型结构)选择项,内容输入项为NL(Natural Language,自然语言)文本,即为待转换的自然语句,OLAP引擎、语言类型、数据源、业务类型和bert模型中用户的选择内容即为转换参数。用户点击开始转换按钮下达转换指令,响应于该转换指令,客户端将待转换的自然语句和转换参数发送至服务端,服务端接收该待转换的自然语句和转换参数。
在步骤S22中,获取所述转换参数对应的目标配置数据。
在一实施例中,因为转换参数的内容为用户的选择结果,因此转换参数的内容较为单一,若直接利用转换参数进行语句转换,转换效率较低,因此对转换参数进行扩充处理,获取到内容较为详实的目标配置数据,目标配置数据为包含有转换参数的增强数据,即目标配置数据不仅包括转换参数,还包含与转换参数相关的扩充数据。
具体的,预先设置参数预处理引擎,在参数预处理引擎中存在参数对应的配置数据,配置数据不仅包括转换页面的参数选择项呈现的各个备选项的内容,还包括各个备选项对应的扩充数据,因此在获取到转换参数后,根据转换参数在参数预处理引擎存储的配置数据中进行查询,获取到含有转换参数的目标配置数据。
在一实施例中,转换参数包括引擎参数,所述步骤22包括:
步骤221,根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据。
在客户端的转换页面设置参数选择项时,设置引擎参数选择项,允许用户在引擎参数选择项的各个备选项中选择出引擎参数。并且预先配置引擎表,具体的可以在参数预处理引擎存储的配置数据中设置配置引擎表,根据转换参数中引擎参数即可定位到配置引擎表,并进一步在配置引擎表中进行查询,查询出与引擎参数对应的引擎配置数据,该引擎配置数据为包含有引擎参数的增强数据,即不仅还有引擎参数,还含有与引擎参数有关的扩充数据。
步骤222,根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据。
不同的数据分析引擎对应不同的计算函数,因此在确定出引擎配置数据后,进一步根据该引擎配置数据在存储的引擎函数表中进行查询,确定出与引擎配置数据对应的引擎函数数据,为使用不同的数据分析引擎提供前提条件。
步骤223,对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在确定出引擎配置数据和引擎函数数据后,为了进一步对引擎配置数据和引擎函数数据进行应用,对引擎配置数据和引擎函数数据进行处理,即组合处理和格式转换处理,以得到处理结果即转换参数对应的目标配置数据。具体的,对引擎配置数据和引擎函数数据按预设数据结构进行组合,得到由引擎配置数据和引擎函数数据组合拼装后的结构化数据,其中预设数据结构为预先确定的数据结构形式,并进一步将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据,其中目标格式为预设转换模型可以识别的数据格式,具体的可以为json格式。
在一些实施例中,预设数据结构根据实际情况设置,本方案不做限定。例如,预设数据结构为按照一定顺序的拼接,比如按照引擎配置数据+引擎函数数据的顺序结构拼接,或按照引擎函数数据+引擎配置数据的顺序结构拼接。
在一种可能的实现方式中,转换参数包括引擎参数和对象关联参数,所述步骤22还包括:
步骤224,根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据。
所述步骤223包括:
步骤223a,对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
对象关联参数与转换页面中设置的引擎参数选择项以外的其他参数选择项相对应,对象关联参数的个数可以是一个也可以是多个,对象关联参数的具体内容可以根据实际应用场景进行设置,通过引入对象关联参数用户可以对更多参数选择项进行指定,提供多元化的选择。具体的,对象关联参数可以为语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个,从语言类型、模型、业务类型和数据源各个精细维度出发,满足用户对各种参数选择项的需求。
预先设置配置对象表,配置对象表存储有其他参数选择项中各个备选项的内容。具体的,若对象关联参数的个数为一个,配置对象表中存储有该一个对象关联参数的各个备选项的内容;若对象关联参数的个数为多个,配置对象表的数量可以为一个,即一个配置对象表中存储有多个对象关联参数的各个备选项的内容,当然配置对象表的数量也可以为多个,与对象关联参数存在一一对应的关系。
根据对象关联参数,在配置对象表中进行查询,获取到对象配置数据,对象配置数据不仅包含对象关联参数,还包括对象关联参数对应的扩充数据。
在确定出引擎配置数据、引擎函数数据和对象配置数据后,为了进一步对引擎配置数据、引擎函数数据和对象配置数据进行应用,对引擎配置数据、引擎函数数据和对象配置数据进行组合处理和格式转换处理,以得到目标配置数据。具体的,对引擎配置数据、引擎函数数据和对象配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据、对象配置数据组合拼装后的结构化数据,其中预设数据结构为预先确定的数据结构形式,并进一步将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据,其中目标格式为预设转换模型可以识别的数据格式,具体的可以为json 格式。通过对引擎配置数据、引擎函数数据和对象配置数据进行组合处理和格式转换处理,获取到目标格式的目标配置数据,有利于后续目标转换模型对目标配置数据的快速识别。
具体的,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据。当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。分别为不同的对象关联参数设置不同的配置对象表,有利于获取到准确的对象配置数据。
在一种可能实现方式中,对象关联参数为语言类型参数,所述配置对象表为配置语言表,所述对象配置数据为语言配置数据,则步骤224具体表现为:根据所述语言类型参数,在配置语言表中进行查询,获取含有所述语言类型参数的语言配置数据。
在客户端的转换页面设置参数选择项时,设置语言类型选择项,允许用户在语言类型选择项的各个备选项中选择出语言类型参数。并且预先在参数预处理引擎存储的配置数据中设置配置语言表,根据转换参数中的语言类型参数即可定位到配置语言表,并进一步在配置语言表中进行查询,查询出与语言类型参数对应的语言配置数据,该语言配置数据为包含有语言类型参数的增强数据,即不仅还有语言类型参数,还含有与语言类型参数有关的扩充数据。
步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述语言配置数据进行组合,目标格式转换,得到所述转换参数对应的目标配置数据。
当对象关联参数为语言类型参数时,即转换参数包括引擎参数和语言类型参数,在确定出引擎配置数据、引擎函数数据和语言配置数据后,对引擎配置数据、引擎函数数据和语言配置数据按预设数据结构进行组合,获取由引擎配置数据、引擎函数数据和语言配置数据组成的结构化数据,将该结构化数据序列化为json格式,得到目标配置数据。
在一种可能的实现方式中,对象关联参数为模型参数,所述配置对象表为配置模型表,所述对象配置数据为模型配置数据,则所述步骤224具体表现为:根据所述模型参数,在配置模型表中进行查询,获取含有所述模型参数的模型配置数据。
在客户端的转换页面设置参数选择项时,设置模型选择项,允许用户在模型选择项的各个备选项中选择出模型参数。并且预先在参数预处理引擎存储的配置数据中设置配置模型表,根据转换参数中的模型参数即可定位到配置模型表,并进一步在配置模型表中进行查询,查询出与模型参数对应的模型配置数据,该模型配置数据为包含有模型参数的增强数据,即不仅还有模型参数,还含有与模型参数有关的扩充数据。
步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述模型配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
当对象关联参数为模型参数时,即转换参数包括引擎参数和模型参数,在确定出引擎配置数据、引擎函数数据和模型配置数据后,对引擎配置数据、引擎函数数据和模型配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据和模型配置数据组成的结构化数据,将结构化数据序列化为json格式,得到目标配置数据。
在一种可能的实现方式中,对象关联参数为语言类型参数和模型参数,转换参数包括引擎参数、语言类型参数和模型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述模型配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为业务类型参数,所述配置对象表为配置业务表,所述对象配置数据为业务配置数据,则所述步骤224具体表现为:根据所述业务类型参数,在配置业务表中进行查询,获取含有所述业务类型参数的业务配置数据。
在客户端的转换页面设置参数选择项时,设置业务类型选择项,允许用户在业务类型选择项的各个备选项中选择出业务类型参数。并且预先在参数预处理引擎存储的配置数据中设置配置业务表,根据转换参数中的业务类型参数即可定位到配置业务表,并进一步在配置业务表中进行查询,查询出与业务类型参数对应的业务配置数据,该业务配置数据为包含有业务类型参数的增强数据,即不仅还有业务类型参数,还含有与业务类型参数有关的扩充数据。
步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述业务配置参数进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
当对象关联参数为业务类型参数时,即转换参数包括引擎参数和业务类型参数,在确定出引擎配置数据、引擎函数数据和业务配置数据后,对引擎配置数据、引擎函数数据和业务配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据和业务配置数据组成的结构化数据,将结构化数据序列化为json格式,得到目标配置数据。
在一种可能的实现方式中,对象关联参数为语音类型参数和业务类型参数,转换参数包括引擎参数、语言类型参数和业务类型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,当对象关联参数为模型参数和业务类型参数时,转换参数包括引擎参数、模型参数和业务类型参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为语音类型参数、模型参数和业务类型参数,转换参数包括引擎参数、语言类型参数、模型参数和业务类型参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述模型配置数据和所述业务配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,所述对象关联参数为所述数据源参数时,所述配置对象表为配置数据源表,所述对象配置数据为数据源配置数据,则所述步骤224具体表现为:根据所述数据源参数,在配置数据源表中进行查询,获取含有所述数据源参数的数据源配置数据。
在客户端的转换页面设置参数选择项时,设置数据源选择项,允许用户在数据源选择项的各个备选项中选择出数据源参数。并且预先在参数预处理引擎存储的配置数据中设置配置数据源表,根据转换参数中的数据源参数即可定位到配置数据源表,并进一步在配置数据源表中进行查询,查询出与数据源参数对应的数据源配置数据,该数据源配置数据为包含有数据源参数的增强数据,即不仅还有数据源参数,还含有与数据源参数有关的扩充数据。
步骤223a具体表现为对所述引擎配置数据、所述引擎函数数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
当对象关联参数为数据源参数时,即转换参数包括引擎参数和数据源参数时,在确定出引擎配置数据、引擎函数数据和数据源配置数据后,对引擎配置数据、引擎函数数据和数据源配置数据按预设数据结构进行组合,得到由引擎配置数据、引擎函数数据、数据源配置数据组成的结构化数据,将该结构化数据序列化为json格式,得到目标配置数据。
在一种可能的实现方式中,对象关联参数为语音类型参数和数据源参数,转换参数包括引擎参数、语言类型参数和数据源参数,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为模型参数和数据源参数,转换参数包括引擎参数、模型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为业务类型参数和数据源参数,转换参数包括引擎参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述业务类型配置数据和所述数据源配置数据进行处理、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为语言类型参数、模型参数和数据源参数,转换参数包括引擎参数、语言类型参数、模型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述模型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为语言类型参数、业务类型参数和数据源参数,转换参数包括引擎参数、语言类型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为模型参数、业务类型参数和数据源参数,转换参数包括引擎参数、模型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述模型配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在一种可能的实现方式中,对象关联参数为语言类型参数、模型参数、业务类型参数和数据源参数,转换参数包括引擎参数、语言类型参数、模型参数、业务类型参数和数据源参数时,在获取转换参数对应的目标配置数据时,对所述引擎配置数据、所述引擎函数数据、所述语言类型配置数据、所述模型配置数据、所述业务类型配置数据和所述数据源配置数据进行组合、目标格式转换,获取所述转换参数对应的目标配置数据。
示例性的,设置参数预处理引擎,参数预处理引擎中存储的配置数据包括但不限于如下主表和维表。
表1参数预处理引擎的主表
其中,数据分析引擎对应引擎参数:存储引擎code,可定位到数据分析引擎的配置引擎表,可以快速定位需要转换的数据分析引擎特定的SQL语句schema(架构),如ClickHouse、Hive等;语言编码对应语言类型参数:存储语言code,对应自然语言的配置语言表,可快速识别需要转换的语言类型,使用不同的分词器,如中文、英文、法文、日语等;bert模型对应模型参数:存储bert模型code,可快速定位后续预设转换模型内部需要使用模型;数据源对应数据源参数:存储可用的bert模型训练数据源,可使bert模型定制化训练,使相关领域词汇转换更精准;业务定制数据对应业务类型参数:存储固定业务相关的定制转换数据词汇,提前获取对应的表和字段信息,例如金融类,建筑类、医疗类等。
表2参数预处理引擎维度—配置引擎表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
引擎编码 | engine_code | varchar(200) | FALSE | FALSE | FALSE | None |
引擎名称 | engine_name | varchar(200) | FALSE | FALSE | FALSE | None |
引擎类型 | engine_type | varchar(200) | FALSE | FALSE | FALSE | None |
引擎版本 | engine_version | varchar(200) | FALSE | FALSE | FALSE | None |
可用状态 | active | varchar(200) | FALSE | FALSE | FALSE | None |
备注 | remark | varchar(200) | FALSE | FALSE | TRUE | None |
其中,引擎编码为开发人员自定义的引擎代码标识信息,例如可以用 CK表征ClickHouse,用hive表征Hive;引擎名称可以为引擎(中文/英文) 名称;引擎类型可以为ClickHouse、Hive、Spark;引擎版本可以为版本号;可用状态可以为是/否。
表3参数预处理引擎维度—配置引擎函数表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
引擎编码 | engine_code | varchar(200) | FALSE | FALSE | FALSE | None |
函数名称 | function_name | varchar(200) | FALSE | FALSE | FALSE | None |
函数类型 | function_type | varchar(200) | FALSE | FALSE | FALSE | None |
函数表达式 | function_exprocession | varchar(200) | FALSE | FALSE | FALSE | None |
函数异常 | function_exception | varchar(200) | FALSE | FALSE | FALSE | None |
函数参数 | function_param | varchar(200) | FALSE | FALSE | TRUE | None |
其中,引擎编码为开发人员自定义的引擎代码标识信息,例如可以用 CK表征ClickHouse,用hive表征Hive,利用引擎编码将配置引擎表和配置引擎函数表进行关联,在根据配置引擎表确定出引擎编码后,将引擎编码作为查询配置引擎函数表的索引,获取到引擎函数数据,其中因为引擎编码的内容较短,在节约存储空间的同时,可以提高查询速度;函数名称可以为sum 求和、max最大值;函数类型可以为聚合函数/算术函数/时间函数等;函数表达式可以为argMax(arg,val)、count(expr)等;函数异常即函数可能发生的异常或可忽略的异常;函数参数为函数可指定的参数,如:*。
表4参数预处理引擎维度—配置语言表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
语言编码 | language_code | varchar(200) | FALSE | FALSE | FALSE | None |
语言名称 | language_name | varchar(200) | FALSE | FALSE | FALSE | None |
语言类型 | language_type | varchar(200) | FALSE | FALSE | FALSE | None |
分词器 | word_analyzer | varchar(200) | FALSE | FALSE | FALSE | None |
备注 | remark | varchar(200) | FALSE | FALSE | TRUE | None |
其中,语言编码为开发人员自定义的语言标识信息,例如可以为CN、 EN等;语言名称可以为简体中文、英文等;语言类型可以为汉语、西语等;分词器可以为中文的IK分词器、日语的MeCab分词器等。
表5参数预处理引擎维度—配置数据源表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
数据源编码 | source_code | varchar(200) | FALSE | FALSE | FALSE | None |
数据源名称 | source_name | varchar(200) | FALSE | FALSE | FALSE | None |
数据源类型 | source_type | varchar(200) | FALSE | FALSE | FALSE | None |
连接url | source_connect_url | varchar(200) | FALSE | FALSE | FALSE | None |
数据源驱动 | source_drive | varchar(200) | FALSE | FALSE | TRUE | None |
用户名 | source_username | varchar(200) | FALSE | FALSE | TRUE | None |
密码 | source_password | varchar(200) | FALSE | FALSE | TRUE | None |
其中,数据源编码为开发人员自定义的数据源标识信息,用于主表关系映射;数据源名称可以为数据库/大数据分析引擎的中/英文名称,如MySql、 Oracle、ClickHouse、Hive、ElasticSearch等;数据源类型可以为数据库/大数据分析引擎类型;连接url可以为连接的url地址;数据源驱动可以为数据源的驱动程序及对应不同语言的驱动程序,如Mysql的java语言的驱动程序、python语言驱动程序等;用户名可以为数据库/大数据分析引擎连接用户名;密码可以为数据库/大数据分析引擎连接密码。
表6参数预处理引擎维度—配置模型表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
模型编码 | bert_model_code | varchar(200) | FALSE | FALSE | FALSE | None |
模型名称 | bert_model_name | varchar(200) | FALSE | FALSE | FALSE | None |
参数 | bert_model_param | varchar(200) | FALSE | FALSE | FALSE | None |
表达式 | expression | varchar(200) | FALSE | FALSE | FALSE | None |
其中,模型编码为开发人员自定义的bert模型标识信息,如哈工大讯飞联合实验室发布的bert-wwm模型及改进模型;模型名称可以为bert-XXX;参数可以为包括的模型参数;表达式为包括的模型表达式。
表7参数预处理引擎维度—配置业务表
字段描述 | 字段名 | 数据类型 | 是否主键 | 是否外键 | 不可为空 | 默认值 |
ID | id | varchar(200) | TRUE | FALSE | TRUE | |
业务编码 | business_code | varchar(200) | FALSE | FALSE | FALSE | None |
业务名称 | business_name | varchar(200) | FALSE | FALSE | FALSE | None |
业务表名 | business_table_name | varchar(200) | FALSE | FALSE | FALSE | None |
字段名 | business_field_name | varchar(200) | FALSE | FALSE | FALSE | None |
其中,业务编码为开发人员自定义业务场景标识信息,内容较短,不同业务编码用于代表不同业务场景;业务名称可以为定制业务场景的名称,如金融网站访问量数据分析;业务表名可以为bert模型可输入的业务数据表名;字段名可以为bert模型可输入的业务数据字段名。
举例来说,用户在如图3所示的转换界面中,在OLAP引擎处选择了 "clickhouse",在语言类型处选择了"CN",在数据源处选择了"hb-source1",在业务类型处选择了"medical",在bert模型处选择了"bert-wmm",转换参数为"language":"CN"、"engine":"clickhouse"、 "bert":"bert-wmm"、"source":"hb-source1"、"business":"medical"。
根据上述转换参数中的language字段定位到表4配置语言表,得到语言配置数据,其中语言配置数据包括:code(与表4中language_code相对应,表征语言编码)、name(与表4中language_name相对应,表征语言名称)、 type(与表4中language_type相对应,表征语言类型)、word_analyzer(表征分词器,包括IK分词器)。具体的,该语言配置数据包括但不限于如下内容:
根据上述转换参数中的engine字段定位到表2配置引擎表,得到引擎配置数据,其中引擎配置数据包括:code(与表2中engine_code相对应,表征引擎编码)、type(与表2中engine_type相对应,表征引擎类型)、version (与表2中engine_version相对应,表征引擎版本)、active(表征可用状态, true表征状态可用)。具体的,该引擎配置数据包括但不限于如下内容:
进一步定位到表3配置引擎函数表,得到引擎函数数据,其中引擎函数数据包括:name(与表3中function_name相对应,表征函数名称)、type(与表3中function_type相对应,表征函数类型)、exprocession(与表3中 function_exprocession相对应,表征函数表达式)、param(与表3中 function_param相对应,表征函数参数)。具体的,引擎函数数据包括但不限于如下内容:
需要说明是,如上仅是对"function"内容的部分截取,实际会返回特定引擎的全部函数及分类。
根据上述转换参数中的source字段定位到表5配置数据源表,得到数据源配置数据,其中数据源配置数据包括:code(与表5中source_code相对应,表征数据源编码)、name(与表5中source_name相对应,表征数据源名称)、type(与表5中source_type相对应,表征数据源类型)、url(与表5 中source_connect_url相对应,表征连接url)、drive(与表5中source_drive 相对应,表征数据源驱动)、username(与表5中source_username相对应,表征用户名)、password(与表5中source_password相对应,表征密码)。具体的,该数据源配置数据包括但不限于如下内容:
根据上述转换参数中的bert_model字段定位到表6配置模型表,得到模型配置数据,其中模型配置数据包括:bert_model_code(表征模型编码)、 bert_model_name(表征模型名称)、bert_model_param(表征参数)。具体的,该模型配置数据包括但不限于如下内容:
根据上述转换参数中的business字段定位到表7配置业务表,得到业务配置数据,其中业务配置数据包括:business_code(表征业务编码)、 business_name(表征业务名称)、business_table(与表6中business_table_name 相对应,表征业务表名)、business_field(与表6中business_field_name相对应,表征字段名)。具体的,该业务配置数据包括但不限于如下内容:
将获取到的引擎配置数据、引擎函数数据、语言配置数据、模型配置数据、业务配置数据、数据源配置数据进行组合,得到结构化数据,将该结构化数据序列化为目标格式,得到转换参数对应的目标配置数据。得到的目标配置数据为对内容单一的转换参数的扩充数据,在后续语句转换过程中可快速定位目标转换模型,提供转换效率。且在确定目标配置数据时,允许客户端对引擎进行选择,并进一步确定引擎对应的引擎函数,可以做到一种语言多引擎的执行,满足用户对数据分析引擎的多种需求,提供多元化的转换手段,提高用户的体验感。
在步骤S23中,在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型。
在预设转换模型中存储着支撑各种转换参数的数据,具体的存储有各种引擎参数、语言类型参数、模型参数、业务类型参数和数据源参数对应的执行数据,例如各个引擎编码、引擎名称、引擎类型和引擎版本对应的执行数据,实现对应引擎功能。进而在确定出目标配置数据后,可在预设转换模型中快速确定出与目标配置数据相适应的目标转换模型,目标转换模型由目标配置数据对应的各个参数的详细信息确定。具体的,目标转换模型为目标配置数据对应的执行数据的组合,用于实现目标配置数据,如目标配置数据中对应bert-XXX,其中bert-XXX为名称层面的内容,目标转换模型对应 bert-XXX,其中bert-XXX为模型具体实现层面内容。
步骤23,将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
在确定出目标转换模型后,将自然语句输入到目标转换模型中,目标转换模型自动将自然语句转换为对应的目标转换语句。具体的,目标转换语句为SQL语句,目标转换模型为基于bert模型获取的模型,其中目标转换模型的模型数量为至少一个。
在一种可能的实现方式中,在进行SQL预测时,将SQL预测任务解耦为6个子任务,包括:sel、agg、cond_conn_op、cond_col、cond_op和cond_val,具体如图4所示,其中,sel表征select选取的列;agg表征select语句所选取的各列做的聚合操作,例如max,min等,与sel一一对应;conds表征WHERE 子句中的各个条件,其中cond_col表征条件对应列,cond_op表征条件运算符,cond_val表征条件目标值;cond_conn_op表征条件之间的关系,例如AND、OR等。
进一步地,目标转换模型可以包括Model-1和Model-2。Model-1主要用于cond_con_op,agg和conds_op的预测;Model-2主要用于对cond_val 的预测,主要是根据Model-1预测出的cond_col结果,将cond_op和cond_val 的组合情况进行逐个枚举,进而生成一系列候选组合,再将这些候选组合与自然语言问句分别拼接起来,输入到bert模型,转化为多个二分类问题,将输出为1的全部组合作为模型的最终输出,并进一步将输出的SQL语句返回至客户端,以使得用户利用得到的SQL语句与数据库进行交互,其中返回至客户端的SQL语句为至少一个可能的结果。
在上述实施例中,获取待转换的自然语句和转换参数,转换参数为用户指定的对自然语句进行转换时使用的相关参数信息,也就是说在本公开为用户提供参数选择项,用户可以根据自身需求确定转换参数。转换参数的内容较为单一,因此对转换参数进行扩充处理,确定出与转换参数相关的目标配置数据,目标配置数据为包含有转换参数的增强数据。进一步获取与目标配置数据相适应的目标转换模型,进而将待转换的自然语句输入目标转换模型对自然语句进行转换,确定出目标转换语句。在本公开提供的技术方案中,用户输入待转换的自然语句和转换参数,即可以获取到目标转换语句,用户利用目标转换语句可以直接对数据库进行数据查询,无需使用数据分析人员开发出的结构化查询语言,进而大大降低专业化门槛,减少开发成本,有效节约开发时间,提高数据分析效率;且通过提供参数选择项,提供多元化的转化途径,避免单一转换模式,提高语句转换的准确性,增加转换语句的拓展性,快速获取到更符合用户要求的目标转换语句,利用该目标转换语句准确的在数据库中进行查询,提升用户体验感。
图5是根据一示例性实施例示出的一种语句转换装置的框图,该装置设置于第一服务器。该装置包括输入数据获取模块51、配置数据获取模块52、转换模型确定模块53、转换语句获取模块54。
输入数据获取模块51,被配置为获取待转换的自然语句和转换参数;
配置数据获取模块52,被配置为获取所述转换参数对应的目标配置数据;
转换模型确定模块53,被配置为在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;
转换语句获取模块54,被配置将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
在本公开一示例性实施例中,所述配置数据获取模块,包括:
引擎数据获取单元,被配置为根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;
引擎函数获取单元,被配置为根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;
配置数据获取单元,被配置为对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在本公开一示例性实施例中,所述配置数据获取模块,还包括:
对象数据获取单元,被配置为根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;
所述配置数据获取单元,被配置对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
在本公开一示例性实施例中,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。
在本公开一示例性实施例中,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;
当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据。
当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据。
当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。
在本公开一示例性实施例中,所述配置数据获取单元,包括:
组成处理子单元,被配置为对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;
转换处理子单元,被配置为将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种电子设备的框图,该电子设备可以是服务器或者类似的运算装置。以电子设备600是服务器为例。参照图6,电子设备600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述语句转换方法。
电子设备600还可以包括一个电源组件626被配置为执行电子设备600 的电源管理,一个有线或无线网络接口650被配置为将电子设备600连接到网络,和一个输入输出(I/O)接口658。电子设备600可以操作基于存储在存储器632的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM, LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器632,上述指令可由电子设备600的处理组件622执行以完成上述关系链标签的实现方法。可选地,计算机可读存储介质可以是 ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现上述的语句转换方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种语句转换方法,其特征在于,包括:
获取待转换的自然语句和转换参数;
获取所述转换参数对应的目标配置数据;
在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;
将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
2.根据权利要求1所述的方法,其特征在于,所述获取所述转换参数对应的目标配置数据,包括:
根据所述转换参数中的引擎参数,在配置引擎表中进行查询,获取含有所述引擎参数的引擎配置数据;
根据所述引擎配置数据,在配置引擎函数表中进行查询,获取所述引擎配置数据对应的引擎函数数据;
对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述转换参数中的对象关联参数,在配置对象表中进行查询,获取含有所述对象关联参数的对象配置数据;
所述对所述引擎配置数据和所述引擎函数数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:
对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据。
4.根据权利要求3所述的方法,其特征在于,所述对象关联参数包括语言类型参数、模型参数、业务类型参数和数据源参数中的至少一个。
5.根据权利要求4所述的方法,其特征在于,当所述对象关联参数包括所述语言类型参数时,所述配置对象表包括配置语言表,所述对象配置数据包括语言配置数据;
当所述对象关联参数包括所述模型参数时,所述配置对象表包括配置模型表,所述对象配置数据包括模型配置数据;
当所述对象关联参数包括所述业务类型参数时,所述配置对象表包括配置业务表,所述对象配置数据包括业务配置数据;
当所述对象关联参数包括所述数据源参数时,所述配置对象表包括配置数据源表,所述对象配置数据包括数据源配置数据。
6.根据权利要求3所述的方法,其特征在于,所述对所述引擎配置数据、所述引擎函数数据和所述对象配置数据进行组合、目标格式转换,得到所述转换参数对应的目标配置数据,包括:
对所述引擎配置数据、所述引擎函数数据和所述对象配置数据按预设数据结构进行组合,得到结构化数据;
将所述结构化数据序列化为目标格式,得到所述转换参数对应的目标配置数据。
7.一种语句转换装置,其特征在于,包括:
输入数据获取模块,被配置为获取待转换的自然语句和转换参数;
配置数据获取模块,被配置为获取所述转换参数对应的目标配置数据;
转换模型确定模块,被配置为在预设转换模型中确定出与所述目标配置数据相适应的目标转换模型;
转换语句获取模块,被配置将所述待转换的自然语句输入所述目标转换模型,获取所述待转换的自然语句对应的目标转换语句。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的语句转换方法。
9.一种存储介质,当所述存储介质中的指令处理器执行时,使得服务器能够执行如权利要求1至6中任一项所述的语句转换方法。
10.一种计算机程序产品,包括计算机程序或计算机指令,其特征在于,所述计算机程序或计算机指令被处理器执行时实现权利要求1至6中任一项所述的语句转换方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191341.6A CN114661746A (zh) | 2022-02-28 | 2022-02-28 | 语句转换方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210191341.6A CN114661746A (zh) | 2022-02-28 | 2022-02-28 | 语句转换方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114661746A true CN114661746A (zh) | 2022-06-24 |
Family
ID=82027387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210191341.6A Pending CN114661746A (zh) | 2022-02-28 | 2022-02-28 | 语句转换方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114661746A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840597A (zh) * | 2022-07-04 | 2022-08-02 | 杭州安恒信息技术股份有限公司 | 一种组件参数格式转换方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111125154A (zh) * | 2019-12-31 | 2020-05-08 | 北京百度网讯科技有限公司 | 用于输出结构化查询语句的方法和装置 |
CN112598289A (zh) * | 2020-12-25 | 2021-04-02 | 平安银行股份有限公司 | 指标配置方法、系统、计算机设备及计算机可读存储介质 |
CN113051286A (zh) * | 2021-04-20 | 2021-06-29 | 中国工商银行股份有限公司 | Sql语句转换模型的生成方法及装置 |
CN113051875A (zh) * | 2021-03-22 | 2021-06-29 | 北京百度网讯科技有限公司 | 信息转换模型的训练方法、文本信息的转换方法和装置 |
CN113704291A (zh) * | 2021-09-03 | 2021-11-26 | 北京火山引擎科技有限公司 | 数据查询方法、装置、存储介质及电子设备 |
-
2022
- 2022-02-28 CN CN202210191341.6A patent/CN114661746A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111125154A (zh) * | 2019-12-31 | 2020-05-08 | 北京百度网讯科技有限公司 | 用于输出结构化查询语句的方法和装置 |
CN112598289A (zh) * | 2020-12-25 | 2021-04-02 | 平安银行股份有限公司 | 指标配置方法、系统、计算机设备及计算机可读存储介质 |
CN113051875A (zh) * | 2021-03-22 | 2021-06-29 | 北京百度网讯科技有限公司 | 信息转换模型的训练方法、文本信息的转换方法和装置 |
CN113051286A (zh) * | 2021-04-20 | 2021-06-29 | 中国工商银行股份有限公司 | Sql语句转换模型的生成方法及装置 |
CN113704291A (zh) * | 2021-09-03 | 2021-11-26 | 北京火山引擎科技有限公司 | 数据查询方法、装置、存储介质及电子设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114840597A (zh) * | 2022-07-04 | 2022-08-02 | 杭州安恒信息技术股份有限公司 | 一种组件参数格式转换方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11948058B2 (en) | Utilizing recurrent neural networks to recognize and extract open intent from text inputs | |
CN109002510B (zh) | 一种对话处理方法、装置、设备和介质 | |
US11966389B2 (en) | Natural language to structured query generation via paraphrasing | |
US11928435B2 (en) | Event extraction method, event extraction device, and electronic device | |
CN111310440B (zh) | 文本的纠错方法、装置和系统 | |
US20240004703A1 (en) | Method, apparatus, and system for multi-modal multi-task processing | |
US10409820B2 (en) | Semantic mapping of form fields | |
WO2019169858A1 (zh) | 一种基于搜索引擎技术的数据分析方法及系统 | |
US20200285636A1 (en) | Context-sensitive cross-lingual searches | |
US11604929B2 (en) | Guided text generation for task-oriented dialogue | |
US11537448B1 (en) | Adapting application programming interfaces with schema mappings | |
CN111639162A (zh) | 信息交互方法和装置、电子设备和存储介质 | |
CN116303537A (zh) | 数据查询方法及装置、电子设备、存储介质 | |
JP2022510818A (ja) | 改良されたデータマッチングのためのデータレコードの字訳 | |
CN117112595A (zh) | 一种信息查询方法、装置、电子设备及存储介质 | |
CN113761923A (zh) | 命名实体识别方法、装置、电子设备及存储介质 | |
CN118202344A (zh) | 用于从文档中提取嵌入式数据的深度学习技术 | |
US11921754B2 (en) | Systems and methods for categorization of ingested database entries to determine topic frequency | |
CN114661746A (zh) | 语句转换方法、装置、电子设备及存储介质 | |
US20230103677A1 (en) | Automated assistant control of non-assistant applications via synonymous term indentification and/or speech processing biasing | |
CN115905490A (zh) | 人机交互对话方法、装置以及设备 | |
CN112735465B (zh) | 无效信息确定方法、装置、计算机设备及存储介质 | |
CN117015781A (zh) | 从图形用户界面生成自然语言界面 | |
CN113535970A (zh) | 信息处理方法和装置、电子设备以及计算机可读存储介质 | |
US20240370764A1 (en) | Generative machine learning framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |