CN114661751B - 基于sql知识库的数据生产方法、装置、系统、设备及介质 - Google Patents

基于sql知识库的数据生产方法、装置、系统、设备及介质 Download PDF

Info

Publication number
CN114661751B
CN114661751B CN202210287813.8A CN202210287813A CN114661751B CN 114661751 B CN114661751 B CN 114661751B CN 202210287813 A CN202210287813 A CN 202210287813A CN 114661751 B CN114661751 B CN 114661751B
Authority
CN
China
Prior art keywords
sql
specified
sql template
template
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210287813.8A
Other languages
English (en)
Other versions
CN114661751A (zh
Inventor
王文斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN202210287813.8A priority Critical patent/CN114661751B/zh
Publication of CN114661751A publication Critical patent/CN114661751A/zh
Application granted granted Critical
Publication of CN114661751B publication Critical patent/CN114661751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于SQL知识库的数据生产方法、装置、系统、设备及介质,所述方法包括:通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;其中,所述通用SQL模板存储于SQL知识库;应用本方法实施例提供的数据生产方法,能够降低了数据生产的操作门槛,提高数据生产的质量和效率。

Description

基于SQL知识库的数据生产方法、装置、系统、设备及介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于SQL知识库的数据生产方法、装置、系统、设备及介质。
背景技术
在进行数据生产中,会遇到来源不同的数据源,而来源不同的数据源在表结构和表含义的表征上不尽相同。利用SQL语句对不同数据源进行数据生产时,需要连接不同生产源在表结构和表含义的表征,然后基于表结构和表含义的表征人工拼写对应的SQL语句以进行数据生产,影响数据生产的效率。
发明内容
本申请实施例为了解决背景技术中存在的上述问题,创造性地提供一种基于SQL知识库的数据生产方法、装置、系统、设备及存储介质。
根据本申请实施例第一方面,提供了一种基于SQL知识库的数据生产方法,所述方法包括:通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;其中,所述通用SQL模板存储于SQL知识库。
根据本申请一实施方式,所述通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板,包括:根据所述指定数据源确定对应的标识信息;根据所述标识信息与所述通用SQL模板进行匹配,确定第一SQL模板;确定与所述指定数据源对应的匹配信息;根据所述匹配信息与所述第一SQL模板进行匹配,获得指定SQL模板。
根据本申请一实施方式,所述根据所述匹配信息与所述第一SQL模板进行匹配,获得指定SQL模板,包括:根据所述匹配信息与所述第一SQL模板进行相似度匹配,获得第一相似值;将第一相似值最大的第一SQL模板确定为所述指定SQL模板。
根据本申请一实施方式,在将第一相似值最大的第一SQL模板确定为所述指定SQL模板之前,所述方法还包括:判断所述数值最大的第一相似值是否满足预设匹配阈值;若所述数值最大的第一相似值不满足预设匹配阈值,根据所述通用SQL模板确定第二SQL模板;根据所述匹配信息与所述第二SQL模板进行相似度匹配,获得第二相似值;将第二相似值最大的第二SQL模板确定为所述指定SQL模板。
根据本申请一实施方式,所述根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板,包括:确定所述指定SQL模板的待编辑区域;通过所述指定信息对所述待编辑区域进行编辑,获得所述目标SQL模板。
根据本申请一实施方式,在所述获得目标SQL模板之后,所述方法还包括:判断所述目标SQL模板是否存在语句错误;若判断为所述目标SQL模板不存在语句错误,利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;若判断为所述目标SQL模板存在语句错误,对所述目标SQL模板进行更新,根据更新后的目标SQL模板对所述指定数据源进行数据生产,获得目标数据。
根据本申请一实施方式,在所述获得目标数据之后,所述方法还包括:根据所述目标数据判断所述指定SQL模板是否存在错误;若判断为所述指定SQL模板存在错误,对所述指定SQL模板进行更新,获得更新后的指定SQL模板;根据所述更新后的指定SQL模板对所述SQL知识库进行迭代。
根据本申请一实施方式,所述根据所述目标数据判断所述指定SQL模板是否存在错误,包括:确定所述目标数据是否存在错误日志;若所述目标数据存在错误日志,根据所述错误日志判断所述指定SQL模板是否存在错误。
根据本申请实施例第三方面,还提供了一种基于SQL知识库的数据生产装置,所述装置包括:匹配模块,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;编辑模块,用于根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;生产模块,用于利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;其中,所述通用SQL模板存储于SQL知识库。
根据本申请一实施方式,所述匹配模块,包括:确定子模块,用于根据所述指定数据源确定对应的标识信息;匹配子模块,用于根据所述标识信息与所述通用SQL模板进行匹配,确定第一SQL模板;所述确定子模块,还用于确定与所述指定数据源对应的匹配信息;所述匹配子模块,还用于根据所述匹配信息与所述第一SQL模板进行匹配,获得指定SQL模板。
根据本申请一实施方式,所述匹配子模块,包括:根据所述匹配信息与所述第一SQL模板进行相似度匹配,获得第一相似值;将第一相似值最大的第一SQL模板确定为所述指定SQL模板。
根据本申请一实施方式,所述装置还包括:判断模块,用于判断所述数值最大的第一相似值是否满足预设匹配阈值;确定模块,用于若所述数值最大的第一相似值不满足预设匹配阈值,根据所述通用SQL模板确定第二SQL模板;所述匹配模块,还用于根据所述匹配信息与所述第二SQL模板进行相似度匹配,获得第二相似值;所述确定模块,还用于将第二相似值最大的第二SQL模板确定为所述指定SQL模板。
根据本申请一实施方式,所述编辑模块,包括:确定所述指定SQL模板的待编辑区域;通过所述指定信息对所述待编辑区域进行编辑,获得所述目标SQL模板。
根据本申请一实施方式,所述判断模块,还用于判断所述目标SQL模板是否存在语句错误;所述生产模块,还用于若判断为所述目标SQL模板不存在语句错误,利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;所述装置还包括:更新模块,用于若判断为所述目标SQL模板存在语句错误,对所述目标SQL模板进行更新;所述生产模块,还用于根据更新后的目标SQL模板对所述指定数据源进行数据生产,获得目标数据。
根据本申请一实施方式,所述判断模块,还用于根据所述目标数据判断所述指定SQL模板是否存在错误;所述更新模块,还用于若判断为所述指定SQL模板存在错误,对所述指定SQL模板进行更新,获得更新后的指定SQL模板;所述装置还包括,迭代模块,用于根据所述更新后的指定SQL模板对所述SQL知识库进行迭代。
根据本申请一实施方式,所述判断模块,包括:确定所述目标数据是否存在错误日志;若所述目标数据存在错误日志,根据所述错误日志判断所述指定SQL模板是否存在错误。
根据本申请实施例第三方面,又提供了一种基于SQL知识库的数据生产系统,所述系统包括SQL知识库、数据库和数据生产装置;其中,所述数据生产装置包括:接收模块,用于接收来自数据库的指定数据源和接收来自SQL知识库的指定SQL模板;匹配模块,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;编辑模块,用于根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;生产模块,用于利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;数据库,用于存储数据源;SQL知识库,用于存储通用SQL模板。
根据本申请实施例第四方面,又提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述可实施方式中任一项所述的方法。
根据本申请实施例第五方面,又提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上述可实施方式中任一项所述的方法。
本申请实施例提供的一种基于SQL知识库的数据生产方法、装置、系统、设备及介质,通过指定数据源与存储在SQL知识库中的多种通用SQL模板进行匹配,从通用SQL模板中确定适用于指定数据源的指定SQL模板,再通过指定信息对指定SQL模板进行编辑,获得目标SQL模板,目标SQL模板能够用于指定数据源的数据生产,从而在进行数据生产过程中,无需完全通过人工拼写SQL语句即可通过SQL语句实现数据生产的目的,提高数据生产的效率,降低了数据生产的操作门槛,提高数据生产的质量。
需要理解的是,本申请的教导并不需要实现上面所述的全部有益效果,而是指定的技术方案可以实现指定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图一;
图2示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图二;
图3示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图三;
图4示出了本申请实施例一种基于SQL知识库的数据生产系统的系统架构示意图;
图5示出了本申请实施例一种基于SQL知识库的数据生产装置的实现模块示意图;
图6示出了本申请实施例一种计算机设备的示意框图。
具体实施方式
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为使本申请更加透彻和完整,并能够将本申请的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。
图1示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图一。
参见图1,根据本申请实施例第一方面,提供了一种基于SQL知识库的数据生产方法,方法包括:操作101,通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;操作102,根据与指定数据源对应的指定信息对指定SQL模板进行编辑,获得目标SQL模板;操作103,利用目标SQL模板对指定数据源进行数据生产,获得目标数据;其中,通用SQL模板存储于SQL知识库。
本申请实施例提供的基于SQL知识库的数据生产方法,通过指定数据源与存储在SQL知识库中的多种通用SQL模板进行匹配,从通用SQL模板中确定适用于指定数据源的指定SQL模板,再通过指定信息对指定SQL模板进行编辑,获得目标SQL模板,目标SQL模板能够用于指定数据源的数据生产,从而在进行数据生产过程中,无需完全通过人工拼写SQL语句即可通过SQL语句实现数据生产的目的,降低了数据生产的操作门槛,且由于通过SQL知识库确定的目标SQL模板具有一致性,能够使获得的目标数据也具有一定的一致性,提高数据生产的质量。具体的,本方法可以应用于医院的数据生产设备,通过应用本方法的数据生产设备,医院能够对属于不同厂商业务系统和不同数据库的数据源进行数据生产,以获得有序的、可使用的、具有一致性的目标数据。
本方法可以应用于具有多来源的原始数据源且需要对原始数据源进行数据生产的数据生产设备。数据源可以为不同来源的数据源,例如,来自不同厂商业务系统和不同数据库的数据源。指定数据源为数据源中的任一数据源或多个数据源,数据源以表结构的形式进行体现。由于数据源不同,不同的表结构中,会出现用于表征同一含义的表内容和表字段用不同的文本进行表达,或者出现用于表征不同含义的表内容和表字段用相同的文本进行表达。当数据源属于医疗数据领域的情况下,表内容所对应的含义可以为医嘱内容、费用内容、检验内容、处方内容、通用内容等。表字段含义不同指代同一文本信息在不同数据源中表征不同的含义,例如,在数据源1中,“药物信息”指代患者当次就诊的医生处方信息,在数据源2中,“药物信息”指代患者历史服药信息;或同一含义在不同数据源中通过两种文本进行表示,例如,医生开的处方内容在数据源1中以“处方信息”作为表头,在数据源2中以“药物信息”作为表头。
SQL知识库存储有针对不同数据源的多种通用SQL模板。通用SQL模板包含了通用信息、待修改信息和待填入信息,通过对通用SQL模板的待修改信息和待填入信息进行编辑,以获得用于进行数据生产的目标SQL模板。例如,在患者住院数据的提取场景中。本方法匹配获得与指定数据提供方对应的通用SQL模板。该通用SQL模板中包含指定数据提供方提供的数据表的表名称,如住院患者业务主表。以及同于提取多种患者数据的SQL语句,患者数据可以包括患者的医疗数据、基本数据、检验数据等,如通用SQL模板中包含用于提取患者住院标识、患者住院号、患者唯一标识符、原始医疗机构患者标识、医疗机构代码、患者姓名、患者性别、婚姻状况、出生日期、出生地、住所、国籍、籍贯等的SQL语句。
SQL知识库可以部署在云服务器中为数据生产设备提供服务,也可以集成于数据生产设备中。在一种具体实施场景中,本方法应用于数据生产设备,SQL知识库部署在公有云的linux机器,两者通信连接,以使SQL知识库向数据生产设备提供通用SQL模板。
当数据生产设备需要对指定数据源进行数据生产的情况下,将指定数据源与存储于SQL知识库中的通用SQL模板进行匹配,以获得针对指定数据源进行数据生产的指定SQL模板,即指定SQL模板为通用SQL模板的其中之一。
在获得指定SQL模板之后,本方法根据指定数据源的实际情况对通用SQL模板中不符合指定数据源的内容进行编辑。具体的,本方法根据指定数据源的特定信息对指定SQL模板进行自动地替换、增加或标注,以生成模板SQL模板。根据特定信息对指定SQL模板的编辑,如:将指定SQL模板中的设备标识名称替换或标识成指定数据源对应的设备标识名称或标识、将指定SQL模板中的医院名称或标识替换为指定数据源对应的医院名称或标识。特定信息还可以是与指定数据源对应的厂商名称或标识,目标数据对应的数据表名称或标识、指定数据源对应的数据表的特定字段等。
在获得目标SQL模板之后,本方法可以利用目标SQL模板对指定数据源进行数据生产,获得目标数据。其中,目标数据同样以表结构的形式进行表征。根据不同的数据生产需求,本方法可以将多个来自不同厂商的数据源通过SQL知识库匹配对应的目标SQL模板,通过匹配获得的多个目标SQL模板将多个数据源提取至一个目标数据表中,也可以将单一的数据源通过对应的目标SQL模板提取至对应的目标数据表中。本方法可以应用至多种通过SQL进行数据生产的场景中,以实现不同目的的数据生产。应用本方法,可以通过存储有多种通用SQL模板的知识库为数据生产提供知识库的积累,在进行数据生产时,达到自动生产对应数据源的模板SQL模板的目的,从而进行数据的自动化生产,还能够使获得的目标SQL模板具有标准化和模板化的特点,保障了数据生产的一致性,降低数据生产的门槛,提高数据生产的效率。
图2示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图二。
参见图2,根据本申请一实施方式,操作101,通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板,包括:操作1011,根据指定数据源确定对应的标识信息;操作1012,根据标识信息与通用SQL模板进行匹配,确定第一SQL模板;操作1013,确定与指定数据源对应的匹配信息;操作1014,根据匹配信息与第一SQL模板进行匹配,获得指定SQL模板。
存储于SQL知识库中的通用SQL模板可以根据通用SOL模板的特性进行分类,具体的,可以通过标识信息进行分类,以形成针对不同标识信息的SQL模板集。在一具体实施方式中,可以采用数据源的来源作为标识信息,在SQL知识库中,将通用SQL模板按照不同的数据来源进行分类,即按照不同厂商业务系统或不同数据库进行分类。在实际应用中,由于不同厂商或不同数据库中的数据源对应的表结构和表业务含义和表字段信息不相同,会出现相同信息通过不同的表达方式进行表征的情况,而来自相同厂商和相同数据库的结构对应的表业务含义和表字段信息通常是相同的,因此,本方法将数据来源作为标识信息,能够使指定数据源在SQL知识库中匹配至更为适合的指定SQL模板,进而提高匹配的SQL模板匹配的准确性。根据实际情况,标识信息还可以包括但不限于:表类型、表字段信息、数据生产设备标识等,其中,数据生产设备标识用于指代进行数据生产的设备的唯一标识,如设备001等,通过数据生产设备标识,有利于进行数据生产的溯源。
在本方法操作1011和操作1012中,本方法先在SQL知识库中确定与标识信息对应的多个第一SQL模板,然后再通过指定数据源与多个第一SQL模板进行匹配,通过这种方式,能够使指定数据源无需匹配SQL知识库中的所有通用SQL模板,能够减少匹配次数,提高匹配速度,同时还能够避免存在不同表含义信息的通用SQL模板影响匹配结果,保证匹配的准确性。
本方法在操作1013和操作1014中,通过匹配信息与第一SQL模板进行匹配,从而确定指定SQL模板。其中,匹配信息可以是指定数据源中的特定信息,特定信息包括但不限于与指定数据源对应的目标数据的表结构、指定数据源的表结构、表字段信息等。例如,指定数据源为表A,指定数据源对应的目标数据为表B,将第一SQL模板中对应的数据源为表A、对应目标数据为表B的SQL模板确定为指定SQL模板。
根据本申请一实施方式,操作1014,根据匹配信息与第一SQL模板进行匹配,获得指定SQL模板,包括:首先,根据匹配信息与第一SQL模板进行相似度匹配,获得第一相似值;然后,将第一相似值最大的第一SQL模板确定为指定SQL模板。
本方法可以通过相似度匹配确定适合指定数据源的指定SQL模板。可以理解的是,相似度匹配可以是多维度的相似度匹配,即本方法的匹配信息可以为多维度匹配信息,多维度匹配信息包括但不限于目标数据的表结构、指定数据源的表结构、表字段信息、数据来源标识、数据生产设备标识等多种信息的组合,将多维度匹配信息和第一SQL模板对应的信息进行匹配,以确定对应每一维度的相似值,整合每一维度的相似值,即可确定与每一个第一SQL模板对应的第一相似值,第一相似值可以以数值的形式进行体现,整合方式可以是加和整合、加权加和整合、均值整合、加权均值整合中的任一种;整合每一维度的相似值也可以是绘制对应的多维图,通过多维图确定与每一个第一SQL模板对应的第一相似值。之后,通过对第一相似值进行排序,即可确定数值最大的第一相似值。本方法可以将数值最大的第一相似值对应的第一SQL模板确定为指定SQL模板。
根据本申请一实施方式,在将第一相似值最大的第一SQL模板确定为指定SQL模板之前,方法还包括:首先,判断数值最大的第一相似值是否满足预设匹配阈值;然后,若数值最大的第一相似值不满足预设匹配阈值,根据通用SQL模板确定第二SQL模板;再后,根据匹配信息与第二SQL模板进行相似度匹配,获得第二相似值;之后,将第二相似值最大的第二SQL模板确定为指定SQL模板。
在实际的实施情况中,第一SQL模板可能仍然不适用于指定数据源,本方法在将第一相似值最大的第一SQL模板确定为指定SQL模板之前,还需要对第一相似值最大的第一SQL模板进行判断,以确定该模板是否能够用于进行指定数据源的数据生产。
可以理解的是,第一相似值越小,指定数据源需要的目标数据表结构、指定数据源的表结构、表字段信息与第一SQL模板对应的目标数据表结构数据源的表结构、表字段信息的差异性越大。基于此,本方法可以设置与第一相似值对应的预设匹配阈值,通过判断数值最大的第一相似值是否满足预设匹配阈值,以确定数值最大的第一相似值对应的第一SQL模板是否能够满足数据生产需求。若数值最大的第一相似值满足预设匹配阈值,则可以将第一相似值最大的第一SQL模板确定为指定SQL模板。若数值最大的第一相似值不满足预设匹配阈值,则意味着最为相似的第一SQL模板仍然与指定数据源的数据生产需求具有较大的差异性,基于此,本方法需要在SQL知识库的其他通用SQL模板中确定指定SQL模板。
具体的,若数值最大的第一相似值不满足预设匹配阈值,本方法将通用SQL模板中的非第一SQL模板确定为第二SQL模板。同理,根据相同的匹配信息与第二SQL模板进行一一地相似度匹配,从而确定与每一个第二SQL模板对应的第二相似值。之后,通过对第二相似值进行排序,即可确定数值最大的第二相似值。本方法可以将数值最大的第二相似值对应的第二SQL模板确定为指定SQL模板。对应的,本方法仍然可以将数值最大的第二相似值与预设匹配阈值进行比较,若数值最大的第二相似值仍然小于预设匹配阈值,则设备可以对SQL模板的确定方式进行报警,以提示用户,使用户通过其他方式,如人工方式确定与指定数据源对应的模板SQL模板。需要补充的是,与第一相似值对应的预设匹配阈值和与第二相似值对应的预设匹配阈值可以相同或不同。
根据本申请一实施方式,操作102,根据与指定数据源对应的指定信息对指定SQL模板进行编辑,获得目标SQL模板,包括:首先,确定指定SQL模板的待编辑区域;然后,通过指定信息对待编辑区域进行编辑,获得目标SQL模板。
SQL语句包含通用信息和非通用信息,基于此,指定SQL模板在进行数值生产前,需要将模板中的非通用信息替换为与指定数据源对应的指定信息,其中,指定信息包括但不限于替换指定SQL模板中指定数据源的表名称及特定表字段、目标数据的表名称及特定表字段、数据生产设备的标识信息、数据生产设备对应的库信息等需要进行替换的非通用信息,以获得目标SQL模板。具体的,本方法在SQL知识库中存储通用SQL模板时,就可以对通用SQL模板需要替换的内容进行标记,即确定指定SQL模板的待编辑区域。
图3示出了本申请实施例一种基于SQL知识库的数据生产方法的实现流程示意图三。
参见图3,根据本申请一实施方式,在操作102,获得目标SQL模板之后,方法还包括:操作301,判断目标SQL模板是否存在语句错误;操作302,若判断为目标SQL模板不存在语句错误,利用目标SQL模板对指定数据源进行数据生产,获得目标数据;操作303,若判断为目标SQL模板存在语句错误,对目标SQL模板进行更新,根据更新后的目标SQL模板对指定数据源进行数据生产,获得目标数据。
在获得目标SQL模板之后,由于目标SQL模板是由设备自动生成的,可能存在语法错误,基于此,本方法需要在进行数据生产之前,可以先判断目标SQL模板是否存在语句错误,以避免将具有明显错误的SQL模板用于生产,避免错误的数据生产过程影响数据生产效率。
判断目标SQL模板是否存在语法错误可以通过语法检验工具进行判断,也可以通过人工判断实现。进一步的,在判断目标SQL模板是否存在语法错误的情况下,还可以判断语法错误的原因是针对目标SQL模板的特异性错误,还是针对通用SQL模板的普遍错误,若判断是属于通用SQL模板的普遍错误,则本方法可以对存储SQL知识库中,与目标SQL模板对应的通用SQL模板进行更新,以修正错误。若判断为是属于目标SQL模板的特异性错误,则可以对目标SQL模板进行更新,以符合数据生产的要求。其中,对目标SQL模板和/或通用SQL模板的更新可以通过人工进行更新也可以通过数据生产设备进行智能化编辑进行更新。
根据本申请一实施方式,在操作103,获得目标数据之后,方法还包括:首先,根据目标数据判断指定SQL模板是否存在错误;然后,若判断为指定SQL模板存在错误,对指定SQL模板进行更新,获得更新后的指定SQL模板;根据更新后的指定SQL模板对SQL知识库进行迭代。
在实际应用中,当数据生产完成之后,若数据生产的结果存在错误,则可以认为目标SQL模板存在错误。由于在进行数据生产之前,已经排除了目标SQL模板的特异性错误,即语法错误,可以认为与目标SQL模板对应的指定SQL模板存在错误,基于此,本方法可以对指定SQL模板进行更新,以修正其错误,并将更新后的指定SQL模板替换掉存储于SQL知识库中与指定SQL模板,以实现对SQL知识库迭代。
根据本申请一实施方式,根据目标数据判断指定SQL模板是否存在错误,包括:首先,确定目标数据是否存在错误日志;然后,若目标数据存在错误日志,根据错误日志判断指定SQL模板是否存在错误。
具体的,本方法可以根据与目标数据对应的错误日志判断指定SQL模板是否存在错误。若数据生产获得的目标数据没有对应的错误日志,则说明数据生产过程不存在错误,即确定为指定SQL模板不存在错误。若数据生产获得的目标数据对应的错误日志,则说明数据生产过程中出现了错误,根据错误日志中的错误原因确定是否为指定SQL模板导致的错误,若确定为指定SQL模板导致的错误,则对指定SQL模板进行更新,并通过更新后的指定SQL模板对存储于SQL知识库中与指定SQL模板进行迭代。
根据本申请实施例第二方面,又提供了一种基于SQL知识库的数据生产系统,系统包括SQL知识库、数据库和数据生产装置;其中,数据生产装置包括:接收模块,用于接收来自数据库的指定数据源和接收来自SQL知识库的指定SQL模板;匹配模块,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;编辑模块,用于根据与指定数据源对应的指定信息对指定SQL模板进行编辑,获得目标SQL模板;生产模块,用于利用目标SQL模板对指定数据源进行数据生产,获得目标数据;数据库,用于存储数据源;SQL知识库,用于存储通用SQL模板。
为方便上述可实施方式的理解,以下提供一种基于SQL知识库的数据生产系统的应用场景进行具体说明。
图4示出了本申请实施例一种基于SQL知识库的数据生产系统的系统架构示意图。
参见图4,系统包括了多个数据库401、数据生产设备402和SQL知识库403。其中,数据生产设备402为医院的数据生产设备,数据生产设备通常部署在医院私有云的机器上,如医院里的前置机。由于医院需要部署不同厂家的医疗信息系统,在一种实施场景下,数据生产设备402通信连接对应厂家的数据库401,以获得对应的医疗信息;在另一种实施场景下,医院根据医疗信息系统生成的医疗信息存储在医院本地的私有云中,形成数据库401。数据库401为数据生产设备402提供原始数据源,不同厂家原始数据源包含多种业务表。如包含住院医嘱业务表、门诊医嘱业务表、处方信息业务表等,业务表用于储存业务数据的映射关系和生产转换逻辑。业务表的数据可以存在多个数据库401中,在业务表中进行关系映射组装,供下游业务使用。
在使用数据生产设备402进行数据生产时,在数据生产设备402提供的操作页面上首先根据需要进行数据生产的数据源选择对应的标识信息,例如,若需要对来自数据库1的医嘱业务表进行数据生产,则选择可以选择标识信息为数据库1标识和医嘱标识,需要理解的是,本方法可以一次性选择多个标识也可以一次选择一个标识,根据标识,从厂家的数据库401中获得对应的指定数据源,存储在医院的私有云中。
部署于私有云机器上的数据生产设备402对指定数据源进行信息抽取,以确定匹配信息,然后发送标识信息和匹配信息至存储在公有云机器上的SQL知识库403,通过标识信息确定SQL知识库403中分类至数据库1标识、医嘱标识的第一SQL模板,然后通过匹配信息与第一SQL模板进行相似度匹配,以确定相似度最高的指定SQL模板,从SQL知识库403获得指定SQL模板。若无法在第一SQL模板匹配到合适的指定SQL模板,则在SQL知识库403中通过匹配信息进行全面匹配,以确定数据生产需求的指定SQL模板。
然后,根据指定数据源中的特定信息对指定SQL模板进行编辑,获得目标SQL模板。在确认目标SQL模板无误后,SQL知识库403将指定SQL模板发送至数据生产设备402。数据生产设备402通过目标SQL模板对指定数据源进行数据生产,以获得目标数据。若数据生产过程中对应有错误日志,根据错误日志对存储于SQL知识库中与该目标SQL模板对应的通用SQL模板进行更新迭代,以提高SQL知识库的正确性。
图5示出了本申请实施例一种基于SQL知识库的数据生产装置的实现模块示意图。
参见图5,根据本申请实施例第三方面,还提供了一种基于SQL知识库的数据生产装置,装置包括:匹配模块501,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;编辑模块502,用于根据与指定数据源对应的指定信息对指定SQL模板进行编辑,获得目标SQL模板;生产模块503,用于利用目标SQL模板对指定数据源进行数据生产,获得目标数据;其中,通用SQL模板存储于SQL知识库。
根据本申请一实施方式,匹配模块501,包括:确定子模块5011,用于根据指定数据源确定对应的标识信息;匹配子模块5012,用于根据标识信息与通用SQL模板进行匹配,确定第一SQL模板;确定子模块5011,还用于确定与指定数据源对应的匹配信息;匹配子模块5012,还用于根据匹配信息与第一SQL模板进行匹配,获得指定SQL模板。
根据本申请一实施方式,匹配子模块5012,包括:根据匹配信息与第一SQL模板进行相似度匹配,获得第一相似值;将第一相似值最大的第一SQL模板确定为指定SQL模板。
根据本申请一实施方式,装置还包括:判断模块504,用于判断数值最大的第一相似值是否满足预设匹配阈值;确定模块505,用于若数值最大的第一相似值不满足预设匹配阈值,根据通用SQL模板确定第二SQL模板;匹配模块501,还用于根据匹配信息与第二SQL模板进行相似度匹配,获得第二相似值;确定模块505,还用于将第二相似值最大的第二SQL模板确定为指定SQL模板。
根据本申请一实施方式,编辑模块502,包括:确定指定SQL模板的待编辑区域;通过指定信息对待编辑区域进行编辑,获得目标SQL模板。
根据本申请一实施方式,判断模块504,还用于判断目标SQL模板是否存在语句错误;生产模块503,还用于若判断为目标SQL模板不存在语句错误,利用目标SQL模板对指定数据源进行数据生产,获得目标数据;装置还包括:更新模块506,用于若判断为目标SQL模板存在语句错误,对目标SQL模板进行更新;生产模块503,还用于根据更新后的目标SQL模板对指定数据源进行数据生产,获得目标数据。
根据本申请一实施方式,判断模块504,还用于根据目标数据判断指定SQL模板是否存在错误;更新模块506,还用于若判断为指定SQL模板存在错误,对指定SQL模板进行更新,获得更新后的指定SQL模板;装置还包括,迭代模块507,用于根据更新后的指定SQL模板对SQL知识库进行迭代。
根据本申请一实施方式,判断模块504,包括:确定目标数据是否存在错误日志;若目标数据存在错误日志,根据错误日志判断指定SQL模板是否存在错误。
这里需要指出的是:以上对针对基于SQL知识库的数据生产装置实施例的描述,与前述图1至3所示的方法实施例的描述是类似的,具有同前述图1至3所示的方法实施例相似的有益效果,因此不做赘述。对于本申请基于SQL知识库的数据生产装置实施例中未披露的技术细节,请参照本申请前述图1至3所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。
根据本申请实施例第四方面,又提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如上述可实施方式中任一项的方法。
根据本申请实施例第五方面,又提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如上述可实施方式中任一项的方法。
根据本申请的实施例,本申请还提供了一种计算机设备和一种可读存储介质。
图6示出了可以用来实施本申请的实施例的示例计算机设备600的示意性框图。计算机设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。计算机设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如一种基于SQL知识库的数据生产方法。例如,在一些实施例中,一种基于SQL知识库的数据生产方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的一种基于SQL知识库的数据生产方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一种基于SQL知识库的数据生产方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种基于SQL知识库的数据生产方法,其特征在于,所述方法包括:
通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;
根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;
利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;
其中,所述通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板,包括:
根据所述指定数据源的来源确定对应的标识信息;
根据所述标识信息与所述通用SQL模板集进行匹配,确定第一SQL模板集,所述第一SQL模板集包含多个第一SQL模板;所述通用SQL模板集按照不同厂商业务系统或不同数据库进行分类获得;
确定与所述指定数据源对应的匹配信息;所述匹配信息包括以下信息的至少一种:所述指定数据源对应的目标数据的表结构、指定数据源的表结构、表字段信息、数据来源标识、数据生产设备标识;
根据所述匹配信息与所述多个第一SQL模板进行匹配,获得指定SQL模板。
2.根据权利要求1所述的方法,其特征在于,所述根据所述匹配信息与所述多个第一SQL模板进行匹配,获得指定SQL模板,包括:
根据所述匹配信息与所述第一SQL模板进行相似度匹配,获得第一相似值;
将第一相似值最大的第一SQL模板确定为所述指定SQL模板。
3.根据权利要求2所述的方法,其特征在于,在将第一相似值最大的第一SQL模板确定为所述指定SQL模板之前,所述方法还包括:
判断所述数值最大的第一相似值是否满足预设匹配阈值;
若数值最大的第一相似值不满足预设匹配阈值,根据所述通用SQL模板确定第二SQL模板;
根据所述匹配信息与所述第二SQL模板进行相似度匹配,获得第二相似值;
将第二相似值最大的第二SQL模板确定为所述指定SQL模板。
4.根据权利要求1所述的方法,其特征在于,所述根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板,包括:
确定所述指定SQL模板的待编辑区域;
通过所述指定信息对所述待编辑区域进行编辑,获得所述目标SQL模板。
5.根据权利要求1所述的方法,其特征在于,在所述获得目标SQL模板之后,所述方法还包括:
判断所述目标SQL模板是否存在语句错误;
若判断为所述目标SQL模板不存在语句错误,利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;
若判断为所述目标SQL模板存在语句错误,对所述目标SQL模板进行更新,根据更新后的目标SQL模板对所述指定数据源进行数据生产,获得目标数据。
6.根据权利要求1所述的方法,其特征在于,在所述获得目标数据之后,所述方法还包括:
根据所述目标数据判断所述指定SQL模板是否存在错误;
若判断为所述指定SQL模板存在错误,对所述指定SQL模板进行更新,获得更新后的指定SQL模板;
根据所述更新后的指定SQL模板对所述SQL知识库进行迭代。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标数据判断所述指定SQL模板是否存在错误,包括:
确定所述目标数据是否存在错误日志;
若所述目标数据存在错误日志,根据所述错误日志判断所述指定SQL模板是否存在错误。
8.一种基于SQL知识库的数据生产装置,其特征在于,所述装置包括:
匹配模块,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;
编辑模块,用于根据与所述指定数据源对应的指定信息对所述指定SQL模板进行编辑,获得目标SQL模板;
生产模块,用于利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;
其中,所述匹配模块,包括:
确定子模块,用于根据所述指定数据源的来源确定对应的标识信息;
匹配子模块,用于根据所述标识信息与所述通用SQL模板集进行匹配,确定第一SQL模板集,所述第一SQL模板集包含多个第一SQL模板;所述通用SQL模板集按照不同厂商业务系统或不同数据库进行分类获得;
所述确定子模块,还用于确定与所述指定数据源对应的匹配信息;所述匹配信息包括以下信息的至少一种:所述指定数据源对应的目标数据的表结构、指定数据源的表结构、表字段信息、数据来源标识、数据生产设备标识;
所述匹配子模块,还用于根据所述匹配信息与所述多个第一SQL模板进行匹配,获得指定SQL模板;
其中,所述通用SQL模板存储于SQL知识库。
9.一种基于SQL知识库的数据生产系统,其特征在于,所述系统包括SQL知识库、数据库和数据生产装置;
其中,所述数据生产装置包括:
接收模块,用于接收来自数据库的指定数据源和接收来自SQL知识库的指定SQL模板;
匹配模块,用于通过指定数据源与通用SQL模板进行匹配,确定指定SQL模板;
编辑模块,用于根据与所述指定数据源对应的指定信息对所述指定SQL 模板进行编辑,获得目标SQL模板;
生产模块,用于利用所述目标SQL模板对所述指定数据源进行数据生产,获得目标数据;
所述匹配模块,包括:
确定子模块,用于根据所述指定数据源的来源确定对应的标识信息;
匹配子模块,用于根据所述标识信息与所述通用SQL模板集进行匹配,确定第一SQL模板集,所述第一SQL模板集包含多个第一SQL模板;所述通用SQL模板集按照不同厂商业务系统或不同数据库进行分类获得;
所述确定子模块,还用于确定与所述指定数据源对应的匹配信息;所述匹配信息包括以下信息的至少一种:所述指定数据源对应的目标数据的表结构、指定数据源的表结构、表字段信息、数据来源标识、数据生产设备标识;
所述匹配子模块,还用于根据所述匹配信息与所述多个第一SQL模板进行匹配,获得指定SQL模板;
数据库,用于存储数据源;
SQL知识库,用于存储通用SQL模板。
10.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的方法。
11.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一项所述的方法。
CN202210287813.8A 2022-03-22 2022-03-22 基于sql知识库的数据生产方法、装置、系统、设备及介质 Active CN114661751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210287813.8A CN114661751B (zh) 2022-03-22 2022-03-22 基于sql知识库的数据生产方法、装置、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210287813.8A CN114661751B (zh) 2022-03-22 2022-03-22 基于sql知识库的数据生产方法、装置、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN114661751A CN114661751A (zh) 2022-06-24
CN114661751B true CN114661751B (zh) 2023-01-31

Family

ID=82030677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210287813.8A Active CN114661751B (zh) 2022-03-22 2022-03-22 基于sql知识库的数据生产方法、装置、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN114661751B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488394A (zh) * 2020-03-27 2020-08-04 深圳壹账通智能科技有限公司 一种数据导入方法、装置、计算机设备及存储介质
CN112163000A (zh) * 2020-08-31 2021-01-01 阿里巴巴集团控股有限公司 一种数据查询方法和装置
CN112380240A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 基于语义识别的数据查询方法、装置、设备及存储介质
CN112860725A (zh) * 2021-02-02 2021-05-28 浙江大华技术股份有限公司 Sql自动生成方法和装置、存储介质及电子设备
CN113901075A (zh) * 2021-10-12 2022-01-07 平安医疗健康管理股份有限公司 生成sql语句的方法、装置、计算机设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8615526B2 (en) * 2010-06-21 2013-12-24 Tata Consultancy Services Limited Markup language based query and file generation
CN106980637B (zh) * 2016-09-28 2019-06-07 平安科技(深圳)有限公司 Sql审核方法和装置
CN111209298A (zh) * 2020-01-06 2020-05-29 平安科技(深圳)有限公司 查询数据库数据的方法、装置、设备和存储介质
CN111966707A (zh) * 2020-08-21 2020-11-20 北京明略昭辉科技有限公司 查询语句生成方法、装置、电子设备和计算机可读介质
CN111984719A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 基于数据源的数据调取方法、装置、设备及存储介质
CN112528001B (zh) * 2020-12-23 2023-07-25 北京百度网讯科技有限公司 一种信息查询方法、装置及电子设备
CN112949275A (zh) * 2021-03-12 2021-06-11 中国平安财产保险股份有限公司 将电子表格导入数据库的方法、装置、设备及存储介质
CN112949276A (zh) * 2021-03-31 2021-06-11 中国建设银行股份有限公司 报表生成方法、装置、电子设备及存储介质
CN112989782B (zh) * 2021-04-22 2021-08-27 北京三维天地科技股份有限公司 一种自动化模板配置及报告生成的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488394A (zh) * 2020-03-27 2020-08-04 深圳壹账通智能科技有限公司 一种数据导入方法、装置、计算机设备及存储介质
CN112163000A (zh) * 2020-08-31 2021-01-01 阿里巴巴集团控股有限公司 一种数据查询方法和装置
CN112380240A (zh) * 2020-11-17 2021-02-19 深圳壹账通智能科技有限公司 基于语义识别的数据查询方法、装置、设备及存储介质
CN112860725A (zh) * 2021-02-02 2021-05-28 浙江大华技术股份有限公司 Sql自动生成方法和装置、存储介质及电子设备
CN113901075A (zh) * 2021-10-12 2022-01-07 平安医疗健康管理股份有限公司 生成sql语句的方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN114661751A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN111177231A (zh) 报表生成方法和报表生成装置
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN114595686B (zh) 知识抽取方法、知识抽取模型的训练方法及装置
CN113220835A (zh) 文本信息处理方法、装置、电子设备以及存储介质
CN112612462A (zh) 话术配置调整方法、装置、电子设备及存储介质
CN115905497B (zh) 确定答复语句的方法、装置、电子设备和存储介质
CN114661751B (zh) 基于sql知识库的数据生产方法、装置、系统、设备及介质
CN116414814A (zh) 数据检核方法、装置、设备、存储介质和程序产品
CN114168119B (zh) 代码文件编辑方法、装置、电子设备以及存储介质
CN116185389A (zh) 一种代码生成方法、装置、电子设备及介质
CN115544010A (zh) 一种映射关系确定方法、装置、电子设备及存储介质
CN113553411B (zh) 查询语句的生成方法、装置、电子设备和存储介质
CN115455091A (zh) 数据生成方法、装置、电子设备和存储介质
CN113377924A (zh) 数据处理方法、装置、设备以及存储介质
CN114385829A (zh) 知识图谱创建方法、装置、设备以及存储介质
CN114020888A (zh) 文本生成的方法、装置、设备以及存储介质
CN114860753A (zh) 一种sql语句生成方法、装置、设备、介质及产品
CN114461665A (zh) 用于生成语句转换模型的方法、装置及计算机程序产品
CN113961672A (zh) 信息标注方法、装置、电子设备和存储介质
CN114547085B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112989797B (zh) 模型训练、文本扩展方法,装置,设备以及存储介质
CN112148751A (zh) 用于查询数据的方法和装置
CN116089459B (zh) 数据检索方法、装置、电子设备及存储介质
CN114490709B (zh) 文本生成方法、装置、电子设备及存储介质
CN113344405B (zh) 基于知识图谱生成信息的方法、装置、设备、介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant