CN115292349A - 一种生成sql的方法、系统及装置 - Google Patents

一种生成sql的方法、系统及装置 Download PDF

Info

Publication number
CN115292349A
CN115292349A CN202210896658.XA CN202210896658A CN115292349A CN 115292349 A CN115292349 A CN 115292349A CN 202210896658 A CN202210896658 A CN 202210896658A CN 115292349 A CN115292349 A CN 115292349A
Authority
CN
China
Prior art keywords
data
sql
text data
language
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210896658.XA
Other languages
English (en)
Inventor
江磊
陈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yunxi Technology Co ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN202210896658.XA priority Critical patent/CN115292349A/zh
Publication of CN115292349A publication Critical patent/CN115292349A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及人工智能和数据库领域,具体提供了一种生成SQL的方法,具有如下步骤:S1、数据输入;S2、数据进行处理;S3、获得文本数据;S4、将语言文本数据通过自然语言翻译器转换为英文语言文本数据;S5、英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句;S6、输出SQL语句。与现有技术相比,本发明,降低了用户使用数据库所必须掌握的数据库技术的门槛,减少了文本输入,提高了输入操作数据库SQL语句的效率。

Description

一种生成SQL的方法、系统及装置
技术领域
本发明涉及人工智能和数据库领域,具体提供一种生成SQL的方法、系统及装置。
背景技术
当前已有的SQL语句生成方法,主要有三种:(1)基于人工智能的英文语句生成SQL语句,例如SeekWell利用OpenAI GPT-3的接口,实现了基于人工智能的英文语句生成SQL语句。(2)基于人工智能的中文问句生成SQL查询语句,例如专利《基于人工智能的SQL语句生成方法、装置、设备及存储介质》,将中文语料模板匹配为英文语料模板,再通过英文语料模板找到槽位进行值填充,进而得到与所述中文问句相对应的多个查询语句,实现了中文问句生成SQL查询语句。(3)句法程序生成SQL查询语句,例如专利《句法程序语言翻译》,将XML查询或变换语言翻译为数据库查询语言,源编程语言主要是XPath/XQuery,编程目标语言是数据库查询语言。
基于上述,要不只能实现英文文本语句生成SQL语句,对于其他语言和其他输入类型无法生成SQL语句。或只能实现中文问句文本生成SQL查询语句,只能生成查询语句,对于其他语言、其他输入类型和其他非问句语法无法生成SQL语句。或只能实现XML查询或变换语言生成数据库查询语言,输入是编程语言,非自然语言,文本格式。该方案对于其他自然语言和其他输入类型无法生成SQL语句。
以上三种现有方案,都只对输入为文本的内容生成SQL语句,对其他的输入类型无法生成SQL语句。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的生成SQL的方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的生成SQL的系统。
本发明进一步的技术任务是提供一种生成SQL的装置。
本发明解决其技术问题所采用的技术方案是:
一种生成SQL的方法,具有如下步骤:
S1、数据输入;
S2、数据进行处理;
S3、获得文本数据;
S4、将语言文本数据通过自然语言翻译器转换为英文语言文本数据;
S5、英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句;
S6、输出SQL语句。
进一步的,在步骤S2中,如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据,进入步骤S4。如果输入数据是图像数据,进入步骤S3。
进一步的,所述ASR处理为将自然语言的声音信号数据转换为文本数据的技术。
进一步的,在步骤S3中,对输入数据进行OCR处理,获得对应语言的文本数据。
作为优选,所述OCR处理为将图像中的文字进行文字识别转换成文本格式数据的技术。
一种生成SQL的系统,首先进行数据输入,再进行数据处理,获取文本数据后,将语言文本数据通过自然语言翻译器转换为英文语言文本数据,英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句,输出SQL语句。
进一步的,如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据;如果输入数据是图像数据,则对输入数据进行OCR处理,获得对应语言的文本数据。
进一步的,所述ASR处理为将自然语言的声音信号数据转换为文本数据的技术;
所述OCR处理为将图像中的文字进行文字识别转换成文本格式数据的技术。
一种生成SQL的装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种生成SQL的方法。
本发明的一种生成SQL的方法、系统及装置和现有技术相比,具有以下突出的有益效果:
本发明对数据库用户输入SQL语句的方式进行了优化,不用像传统数据库操作一样需要专业技术人员输入SQL语句文本,也不用像现有方案中必须输入英文或中文文本类型数据。用户可以直接通过麦克风进行语音输入,或者通过摄像机等设备进行图像输入。
用户输入的语音或图像,可以直接经过本专利所述的方法与装置进行处理,最终输出需要的SQL语句。语音或图像输入,结合人工智能处理,最终生成SQL语句,丰富了用户生成SQL的输入方式,降低了用户使用数据库所必须掌握的数据库技术的门槛,减少了文本输入,提高了输入操作数据库SQL语句的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种生成SQL的方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种生成SQL的方法,在第一种场景,用户通过麦克风输入语音,语音数据经过ASR处理,生成与语音数据对应的自然语言的文本数据。自然语言文本数据再经过自然语言翻译器,生成英文语言的文本数据。英文语言的文本数据,经过基于人工智能算法训练的SQL语句生成器模型,生成最终需要的SQL语句。
第二种场景,用户使用摄像机、照相机等设备对纸质、手绘等文字信息进行拾取获得图像数据,图像数据经过OCR处理,生成与图像数据对应的自然语言的文本数据。自然语言文本数据再经过自然语言翻译器,生成英文语言的文本数据。英文语言的文本数据,经过基于人工智能算法训练的SQL语句生成器模型,生成最终需要的SQL语句。
其中,具体的步骤为:
S1、数据输入,可以是语音数据,也可以是图像数据。
S2、如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据,进入步骤S4。如果输入数据是图像数据,进入步骤S3。
S3、对输入数据进行OCR处理,获得对应语言的文本数据。
S4、将语言文本数据通过自然语言翻译器转换为英文语言文本数据。
S5、英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句。
S6、输出SQL语句。
其中,ASR为自动语音识别技术,将自然语言的声音信号数据转换为文本数据的技术。
自然语言翻译器所表示的是将各种非英语语言的文本数据,转换为英语语言的文本数据。
OCR为光学字符识别技术,将图像中的文字进行文字识别转换成文本格式数据的技术。
基于上述方法,本实施例中的一种生成SQL的系统,首先进行数据输入,再进行数据处理,获取文本数据后,将语言文本数据通过自然语言翻译器转换为英文语言文本数据,英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句,输出SQL语句。
如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据;如果输入数据是图像数据,则对输入数据进行OCR处理,获得对应语言的文本数据。
所述ASR处理为将自然语言的声音信号数据转换为文本数据的技术;
所述OCR处理为将图像中的文字进行文字识别转换成文本格式数据的技术。
一种生成SQL的装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种生成SQL的方法。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种生成SQL的方法、系统及装置权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种生成SQL的方法,其特征在于,具有如下步骤:
S1、数据输入;
S2、数据进行处理;
S3、获得文本数据;
S4、将语言文本数据通过自然语言翻译器转换为英文语言文本数据;
S5、英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句;
S6、输出SQL语句。
2.根据权利要求1所述的一种生成SQL的方法,其特征在于,在步骤S2中,如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据,进入步骤S4。如果输入数据是图像数据,进入步骤S3。
3.根据权利要求1或2所述的一种生成SQL的方法,其特征在于,所述ASR处理为将自然语言的声音信号数据转换为文本数据的技术。
4.根据权利要求3所述的一种生成SQL的方法,其特征在于,在步骤S3中,对输入数据进行OCR处理,获得对应语言的文本数据。
5.根据权利要求5所述的一种生成SQL的方法,其特征在于,所述OCR处理为将图像中的文字进行文字识别转换成文本格式数据的技术。
6.一种生成SQL的系统,其特征在于,首先进行数据输入,再进行数据处理,获取文本数据后,将语言文本数据通过自然语言翻译器转换为英文语言文本数据,英文语言文本数据经过人工智能生成SQL语句模块,转换为SQL语句,输出SQL语句。
7.根据权利要求6所述的一种生成SQL的系统,其特征在于,如果输入数据是语音数据,进行ASR处理,获得对应语言的文本数据;如果输入数据是图像数据,则对输入数据进行OCR处理,获得对应语言的文本数据。
8.根据权利要求7所述的一种生成SQL的系统,其特征在于,所述ASR处理为将自然语言的声音信号数据转换为文本数据的技术;
所述OCR处理为将图像中的文字进行文字识别转换成文本格式数据的技术。
9.一种生成SQL的装置,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至5中任一所述的方法。
CN202210896658.XA 2022-07-28 2022-07-28 一种生成sql的方法、系统及装置 Pending CN115292349A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210896658.XA CN115292349A (zh) 2022-07-28 2022-07-28 一种生成sql的方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210896658.XA CN115292349A (zh) 2022-07-28 2022-07-28 一种生成sql的方法、系统及装置

Publications (1)

Publication Number Publication Date
CN115292349A true CN115292349A (zh) 2022-11-04

Family

ID=83823935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210896658.XA Pending CN115292349A (zh) 2022-07-28 2022-07-28 一种生成sql的方法、系统及装置

Country Status (1)

Country Link
CN (1) CN115292349A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056351A (zh) * 2023-10-07 2023-11-14 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备
CN117056351B (zh) * 2023-10-07 2024-02-09 腾讯科技(深圳)有限公司 Sql语句生成方法、装置及设备

Similar Documents

Publication Publication Date Title
CN111477216B (zh) 一种用于对话机器人的音意理解模型的训练方法及系统
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
US8498857B2 (en) System and method for rapid prototyping of existing speech recognition solutions in different languages
US6862566B2 (en) Method and apparatus for converting an expression using key words
US8131536B2 (en) Extraction-empowered machine translation
US11031009B2 (en) Method for creating a knowledge base of components and their problems from short text utterances
US6374224B1 (en) Method and apparatus for style control in natural language generation
US9697201B2 (en) Adapting machine translation data using damaging channel model
CN107066455A (zh) 一种多语言智能预处理实时统计机器翻译系统
WO1999063456A1 (fr) Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d'enregistrement de programme
Kaur et al. Review of machine transliteration techniques
CN115759119B (zh) 一种金融文本情感分析方法、系统、介质和设备
CN110942767A (zh) 一种asr语言模型识别标注与优化方法及其装置
CN115292349A (zh) 一种生成sql的方法、系统及装置
CN115658898A (zh) 一种中英文本实体关系抽取方法、系统及设备
CN113505609A (zh) 一种一键式多语言会议辅助翻译方法及具有该方法的设备
CN109859746B (zh) 一种基于tts的语音识别语料库生成方法及系统
CN116483314A (zh) 一种自动化智能活动图生成方法
CN112270192B (zh) 一种基于词性和停用词过滤的语义识别方法及系统
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
GB2618903A (en) System and method for identification and verification
KR100908445B1 (ko) 응답 문장 생성 장치 및 방법
CN108877781B (zh) 一种智能语音搜索影片的方法及系统
CN117690415B (zh) 音频描述信息生成方法、装置、电子设备及存储介质
CN117035064B (zh) 一种检索增强语言模型的联合训练方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240729

Address after: Room 305-22, Building 2, No. 1158 Zhangdong Road and No. 1059 Dangui Road, China (Shanghai) Pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Applicant after: Shanghai Yunxi Technology Co.,Ltd.

Country or region after: China

Address before: 250100 Ji'nan hi tech Zone No. 2877, Shandong Province

Applicant before: INSPUR SOFTWARE GROUP Co.,Ltd.

Country or region before: China