CN114116779A - 基于深度学习的电网调控领域信息检索方法、系统和介质 - Google Patents

基于深度学习的电网调控领域信息检索方法、系统和介质 Download PDF

Info

Publication number
CN114116779A
CN114116779A CN202111341702.2A CN202111341702A CN114116779A CN 114116779 A CN114116779 A CN 114116779A CN 202111341702 A CN202111341702 A CN 202111341702A CN 114116779 A CN114116779 A CN 114116779A
Authority
CN
China
Prior art keywords
sql
deep learning
text
module
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111341702.2A
Other languages
English (en)
Inventor
唐俊刺
余建明
乔咏田
王明凯
唐井峰
高梓济
王超
崔岱
李铁
姜枫
姜狄
史东宇
李正文
孙文涛
张津辉
苑经纬
胡博
许静
胡锦景
吕旭明
丛培贤
张宏宇
许小鹏
王爱华
陈刚
高凯
葛延峰
刘淼
何晓洋
李桐
孙茜
王琛
周志
张越
单连飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Beijing Kedong Electric Power Control System Co Ltd
State Grid Liaoning Electric Power Co Ltd
State Grid Electric Power Research Institute
Original Assignee
Harbin Institute of Technology
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Beijing Kedong Electric Power Control System Co Ltd
State Grid Liaoning Electric Power Co Ltd
State Grid Electric Power Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology, State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, Beijing Kedong Electric Power Control System Co Ltd, State Grid Liaoning Electric Power Co Ltd, State Grid Electric Power Research Institute filed Critical Harbin Institute of Technology
Priority to CN202111341702.2A priority Critical patent/CN114116779A/zh
Publication of CN114116779A publication Critical patent/CN114116779A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2445Data retrieval commands; View definitions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于深度学习的电网调控领域信息检索方法、系统和介质,包括训练数据构建模块:构建用于训练深度学习翻译模型的训练数据;模型训练模块:根据从训练数据构建模块获得的训练数据对深度学习翻译模型进行训练;问句解析模块:将用户输入的源语言解析成深度学习翻译模型能识别的源语言文本;SQL后处理模块:将深度学习翻译模型输出的目标语言文本转换成数据库可执行的语句;SQL运行模块:运行从SQL后处理模块获得的数据库可执行的语句,从数据库中检索所要的信息。利用本发明所述的方法和系统,降低了对电网数据库操作的门槛,能使工作人员快速检索所需要的信息,提高了工作效率。同时增加了数据挖掘的深度、提高了数据增值变现能力。

Description

基于深度学习的电网调控领域信息检索方法、系统和介质
技术领域
本发明属于深度学习与电网调控信息检索交叉领域,具体涉及一种基于深度学习的电网调控领域信息检索方法、系统和介质。
背景技术
电网调控系统经多年运行,海量的电网运行数据存储于数据库或文件系统中,呈现出规模大、种类多、范围广等特点,当前查询电网调控信息,通常需要通过像结构化查询语言(Structured Query Language,SQL)这样的程序式查询语言来与数据库(或文件系统)进行交互操作,这就需要懂SQL语言的专业技术人员来执行这一操作。SQL语言的学习门槛比较高,即使对于计算机从业者来说,想要针对不同的数据库和应用场景,编写大量的并保证正确率的SQL语句也是项复杂的工作。近年来,随着电网业务不断发展,电网调控信息领域的数据库表格个数与数据量骤增,给调度人员的查询工作带来一定的挑战,往往只有经验丰富的调度人员才能基于问题快速编写出正确的SQL语句在数据库中查找相关的答案。对于经验少的调度人员极不友好。基于以上现状,需要一种快速的信息检索方法让调度人员在第一时间能根据检索问题快速获取检索答案。
发明内容
本发明针对电网调控系统海量数据分析繁琐低效的问题,利用语义解析技术训练AI智能体,能将自然语言转换成可执行的SQL语句,从而降低了数据查询的门槛,为用户提供更人性化的信息检索服务。
实现本发明目的之一的基于深度学习的电网调控领域信息检索方法,包括如下步骤:
S1、收集多个电网调控领域的自然语言问句与SQL语句的语句对;
S2、将收集的多个自然语言问句转换成可用于训练深度学习翻译模型的源语句;将收集的多个SQL语句转换为用自然语言表述的目标语句;
所述步骤S2的转换过程可以基于现有技术用软件编码实现,其可以将自然语言问句转换成可输入给深度学习翻译模型的源语句文本。
进一步地,所述步骤S2还包括对源语句进行预处理,所述预处理包括分词处理、特殊字符替换处理、增加特殊字符;
进一步地,所述将收集的多个SQL语句转换为用自然语言表述的目标语句包括如下步骤:
S201、构建数据库表名和列名与自然语言的表述映射关系;
S202、根据上述表述映射关系将步骤S1的SQL语句转换为用自然语言表述的目标语句;
所述表述映射关系包括用自然语言所表述的信息与其所在的数据库中表或列名的一一对应的映射,比如“PLANT_BASIC”是数据库中用来存放“发电厂信息的”表,該表中列名为“PLANT_TYPE”的列表示发电厂类型,那么可以得到两个映射关系:“PLANT_BASIC发电厂基本信息”、“PLANT_BASIC.PLANT_TYPE发电厂基本信息.发电厂类型”。
进一步地,所述步骤S202还包括对目标语句进行预处理,所述预处理包括分词处理、特殊字符替换处理、增加特殊字符。
S3、搭建深度学习翻译模型,用步骤S2获得的源语句与目标语句对深度学习翻译模型进行训练,得到Text-to-SQL智能体。
通过上述模型训练,所述Text-to-SQL智能体能将源语句翻译成用目标语句,所述Text-to-SQL智能体可以采用基于Transformer的深度学习翻译模型,相比其它模型能提高SQL生成的准确率。
S4、使用Text-to-SQL智能体将用自然语言表述的问句转换成目标语言文本;
进一步地,所述步骤S4包括如下步骤:
S401、对用户输入的自然语言问句进行转换,得到可输入给Text-to-SQL智能体的源语言文本;
S402、使用Text-to-SQL智能体对源语言文本进行预测,得到目标语言文本。
所述步骤S401中转换过程可以基于现有技术用软件编码实现,其可以将自然语言问句转换成可输入给深度学习翻译模型的源语句文本。
进一步地,所述步骤S401包括如下步骤:
步骤1、根据数据库表名和列名与自然语言的表述映射关系将用户输入的自然语言文本转换为可输入给Text-to-SQL智能体的源语言文本;
步骤2、对可输入给Text-to-SQL智能体的源语言文本进行预处理。
所述预处理包括分词处理、特殊字符替换处理、增加特殊字符。
S5、将步骤S4获得的目标语言文本转换成可执行的SQL语句。
进一步地,所述步骤S5包括如下步骤:
S501、对目标语言文本进行后处理;
所述后处理包括替换或删除特殊字符。
S502、构建数据库表名和列名与自然语言的表述映射关系;
S503、根据上述表述映射关系将步骤S5获得的目标语言文本转换转换成可执行的SQL语句。
S6、运行步骤S5得到的SQL语句对数据库进行检索获取查询信息。
实现本发明目的之二的基于深度学习的电网调控领域信息检索系统,包括:
训练数据构建模块:用于构建用于训练深度学习翻译模型的训练数据;
模型训练模块:用于根据从训练数据构建模块获得的训练数据对深度学习翻译模型进行训练,得到Text-to-SQL智能体;
问句解析模块:用于将用户输入的源语言解析成Text-to-SQL智能体能识别的源语言文本;
SQL后处理模块:用于将Text-to-SQL智能体输出的目标语言文本转换成数据库可执行的语句;
SQL运行模块:用于运行从SQL后处理模块获得的数据库可执行的语句,从数据库中检索所需要的信息。
进一步地,还包括数据预处理模块,用于对输入深度学习翻译模型和/或Text-to-SQL智能体的语句进行预处理,所述预处理包括分词处理、特殊字符替换处理、增加特殊字符。
进一步地,还包括映射关系构建模块,用于构建数据库表名和/或列名与自然语言的表述映射关系。
实现本发明目的之三的一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述基于深度学习的电网调控领域信息检索方法的任一项步骤。
有益效果:
利用本发明所述的方法和系统,降低了对电网数据库进行操作的门槛,实现了电网调控信息领域结构化数据的快速智能检索,节省了大量人工编写SQL的时间,提高了工作效率,同时增加了数据挖掘的深度、提高了数据增值变现能力。
附图说明
图1是本发明所述的系统框图。
具体实施方式
下列具体实施方式用于对本发明权利要求技术方案的解释,以便本领域的技术人员理解本权利要求书。本发明的保护范围不限于下列具体的实施结构。本领域的技术人员做出的包含有本发明权利要求书技术方案而不同于下列具体实施方式的也是本发明的保护范围。
另外,本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合图1讲述本发明所述系统的一个实施例,包括:
训练数据构建模块:用于构建用来训练深度学习翻译模型的训练数据;
模型训练模块:用于根据从训练数据构建模块获得的训练数据对深度学习翻译模型进行训练,得到Text-to-SQL智能体;
问句解析模块:用于将用户输入的源语言解析成Text-to-SQL智能体能识别的源语言文本;
SQL后处理模块:用于将Text-to-SQL智能体输出的目标语言文本转换成数据库可执行的语句;
SQL运行模块:用于运行从SQL后处理模块获得的数据库可执行的语句,从数据库中检索所需要的信息。
进一步地,还包括数据预处理模块,用于对输入深度学习翻译模型和/或Text-to-SQL智能体的语句进行预处理,所述预处理包括分词处理、特殊字符替换处理、增加特殊字符。
进一步地,还包括映射关系构建模块,用于构建数据库表名和/或列名与自然语言的表述映射关系。
上述模块分别应用于不同的阶段,本发明包括两个阶段:模型训练阶段和模型应用阶段,如图1所示,模型训练阶段包括:训练数据构建模块、数据预处理模块、模型训练模块;模型应用阶段包括:问句解析模块、SQL后处理模块、SQL执行模块。
所述模型训练阶段,训练数据构建模块用于对自然语言问句、数据库表结构、SQL语句进行整理,构建多个用于训练深度学习翻译模型的源语句与目标语句;数据预处理模块用于对训练数据构建模块中构建的语句进行预处理;模型训练模块用于根据数据预处理模块得到的数据,训练深度学习翻译模型,得到Text-to-SQL智能体,实现将自然语言问题自动转换为SQL语句。
所述模型应用阶段,问句解析模块用于对用户输入的自然语言问句进行预处理,生成源语言文本;利用模型训练模块的Text-to-SQL智能体将源语言文本自动转换为目标语言文本;SQL后处理模块用于对Text-to-SQL智能体输出的目标语言文本进行后处理,使其转换为可以能够被数据库执行的SQL语句;SQL执行模块用于运行SQL后处理模块得到的SQL语句,在数据库引擎内进行查询,得到用户需要的检索答案。
下面分步骤详细阐述本发明所述方法的其中一个实施例。
S1、收集多个电网调控领域的自然语言问句与SQL语句的语句对;
根据电网调控领域业务场景的需求,收集自然语言问句与SQL语句的语句对。如下所示列举了一对自然语言问句与SQL语句的语句对:
语句对1:
问句:ABC电厂类型是什么
对应SQL语言的查询语句:SELECT PLANT_TYPE FROM PLANT_BASIC WHERE NAME='ABC电厂';
所述自然语言问句与所述SQL语句为一一对应关系,即通过在数据库中运行所述SQL语句可以查询到所述自然语言问句所要查询的信息。
S2、将收集的多个自然语言问句转换成可用于训练深度学习翻译模型的源语句;将收集的多个SQL语句转换为用自然语言表述的目标语句;
将每个自然语言问句与其对应的候选数据库表结构进行建模,构建文本输入特征feature1,此种格式的文本可输入给深度学习翻译模型,作为其源语句,格式如下:<Q>与</Q>之间为原始问题文本,<T>与</T>之间为数据库表结构,<C>之前为数据库名,<C>之后为列名,不同列名通过@字符进行分割,格式如下:
<Q>原始问题文本</Q>|<T>表1名称<C>@字段1@字段2</T><T>表2名称<C>@字段1@字段2</T>……
上述语句对1转换成如下文本:
<Q>ABC电厂类型是什么</Q>|<T>发电厂基本信息<C>@发电厂ID@发电厂名称@发电厂类型……</T><T>变电站基本信息<C>@变电站ID@变电站名称……</T>……
为了提高深度学习模型的预测准确率,还需对上述源语句进行预处理,所述预处理包括分词处理,即对文本输入特征feature1进行分词处理得到文本输入特征feature2,分词时,特殊符号如<Q>、<T>、<C>等不进行分词处理,保留整个字符。上述文本进行分词后得到以下文本,作为深度学习翻译模型的训练语句的源语句:
<Q>ABC电厂类型是什么</Q>|<T>发电厂基本信息<C>发电厂ID@发电厂名称@发电厂类型……</T><T>变电站基本信息<C>@变电站ID@变电站名称……</T>……;
将SQL语句转换为用自然语言表述的目标语句,具体包括如下步骤:
S201、构建数据库表名和列名与自然语言的表述映射关系;
如将“发电厂基本信息”的表名和列名与自然语言的表述进行映射,前面为表名,或者表名.列名,后面为其所代表的自然语言的含义,如下所示:
PLANT_BASIC发电厂基本信息
PLANT_BASIC.NAME发电厂基本信息.发电厂名称
PLANT_BASIC.PLANT_TYPE发电厂基本信息.发电厂类型
在此步骤中需进行预处理,所述预处理包括特殊字符替换,为了避免上述映射关系中的点与SQL语句的WHERE查询条件中的小数点冲突,从而影响深度学习模型的训练,因此需要将上述表述映射关系中的点替换为SQL语句中不会出现的字符,在本实施例中替换为@。
S202、根据上述表述映射关系将步骤S1的SQL语句转换为用自然语言表述的目标语句;
将上述语句对1中的SQL:SELECT PLANT_TYPE FROM PLANT_BASIC WHERE NAME='ABC电厂'进行转换后,如下所示:
处理后的SQL:
SELECT发电厂基本信息@发电厂类型FROM发电厂基本信息WHERE发电厂基本信息@发电厂名称='ABC电厂'
对上述处理后的SQL进行预处理,得到用于输入深度学习翻译模型的目标语句。所述处理包括分词处理,分词时SQL中关键字不进行分词,保留整个字符,如SELECT、WHERE、FROM、JOIN等;对表名和列名进行分词;所述预处理还包括增加特殊字符,SQL中不同成分之间增加分隔符▁。分词处理后如下所示,作为输入深度学习翻译模型的目标语句:
SELECT▁发电厂基本信息@发电厂类型▁FROM▁发电厂基本信息▁WHERE▁发电厂基本信息@发电厂名称▁=▁'ABC电厂'
S3、搭建深度学习翻译模型,用上述步骤获得的源语句与目标语句对深度学习翻译模型进行训练,得到Text-to-SQL智能体。
所述模型采用现有技术中基于Transformer的深度学习翻译模型,相比其它模型能提高SQL生成的准确率,编码器负责对输入序列(即源语句)进行编码,解码器负责生成文本(目标语句),编码器和解码器之间通过自注意力机制进行联系。
所述Text-to-SQL智能体能自主学习,将源语句翻译成用目标语句。
S4、使用Text-to-SQL智能体将用自然语言表述的问句转换成目标语言文本,包括如下步骤:
S401、将用户输入的自然语言问句转换成可输入给Text-to-SQL智能体的源语言文本;
如用户输入自然语言问句:EFG电厂电子邮箱是什么。
步骤1、根据数据库表名和列名与自然语言的表述映射关系将用户输入的自然语言文本转换为可输入给Text-to-SQL智能体的源语言文本;
步骤2、对可输入给Text-to-SQL智能体的源语言文本进行预处理,所述预处理包括分词处理。
转换后的源语言文本如下所示:
<Q>EFG电厂电子邮箱是什么</Q>|<T>发电厂基本信息<C>@发电厂ID@发电厂名称@发电厂类型……</T><T>变电站基本信息<C>@变电站ID@变电站名称……</T>……
S402、使用Text-to-SQL智能体对源语言文本进行预测,得到目标语言文本。所述目标语言文本采用SQL语言的框架,但表名和列名用自然语言表述的伪SQL语句,它是不能被执行的,还需要对其进行进一步处理,将自然语言转换成实际数据库中对应的表或列,并将特殊字符替换成原始字符才能在数据库中被执行。
所述伪SQL语句如下所示:
SELECT▁发电厂基本信息@电子邮箱▁FROM▁发电厂基本信息▁WHERE▁发电厂基本信息@发电厂名称▁=▁'EFG电厂'
S5、将上述步骤获得的目标语言文本转换成可执行的SQL语句,包括如下步骤:
步骤1、对目标语言文本进行后处理,所述后处理包括替换或删除特殊字符。
对上述目标语言文本中的符号▁进行SQL分块处理,不同的SQL块间移除分词分隔符,得到结果语句如下:
SELECT发电厂基本信息@电子邮箱FROM发电厂基本信息WHERE发电厂基本信息@发电厂名称='EFG电厂'
步骤2、根据构建的数据库表名和列名与自然语言的表述映射关系,将结果语句中的表名和列名替换为数据库中原始的英文表述。
所述数据库表名和列名与自然语言的表述映射关系在前述步骤中已经构建。
转换后如下所示:
SELECT PLANT_BASIC.EMAIL FROM PLANT_BASIC WHERE PLANT_BASIC.NAME='EFG电厂'
S6、运行上述步骤得到的SQL语句对数据库进行检索获取查询信息。
将上述可执行的SQL语句在数据库引擎内进行查询,根据数据库的查询结果得到用户需要的检索答案,示例:
EFG_plant@163.com
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时实现所述基于深度学习的电网调控领域信息检索方法的各个步骤,在此不再赘述。
计算机可读存储介质可以是前述任一实施例提供的数据传输装置或者计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmedia card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。
进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储将要输出或己输出的数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种基于深度学习的电网调控领域信息检索方法,其特征在于,包括如下步骤:
S1、收集多个电网调控领域的自然语言问句与SQL语句的语句对;
S2、将收集的多个自然语言问句转换成可用于训练深度学习翻译模型的源语句;将收集的多个SQL语句转换为用自然语言表述的目标语句;
S3、搭建深度学习翻译模型,用步骤S2获得的源语句与目标语句对深度学习翻译模型进行训练,得到Text-to-SQL智能体;
S4、使用Text-to-SQL智能体将用自然语言表述的问句转换成目标语言文本;
S5、将步骤S4获得的目标语言文本转换成可执行的SQL语句;
S6、运行步骤S5得到的SQL语句对数据库进行检索获取查询信息。
2.如权利要求1所述的基于深度学习的电网调控领域信息检索方法,其特征在于,所述步骤S2还包括对源语句进行预处理。
3.如权利要求1所述的基于深度学习的电网调控领域信息检索方法,其特征在于,所述步骤S2包括如下步骤:
S201、构建数据库表名和列名与自然语言的表述映射关系;
S202、根据上述表述映射关系将步骤S1的SQL语句转换为用自然语言表述的目标语句。
4.如权利要求3所述的基于深度学习的电网调控领域信息检索方法,其特征在于,所述步骤S202还包括对目标语句进行预处理。
5.如权利要求1所述的基于深度学习的电网调控领域信息检索方法,其特征在于,所述步骤S4包括如下步骤:
S401、对用户输入的自然语言问句进行转换,得到可输入给Text-to-SQL智能体的源语言文本;
S402、使用Text-to-SQL智能体对源语言文本进行预测,得到目标语言文本。
6.如权利要求5所述的基于深度学习的电网调控领域信息检索方法,其特征在于,所述步骤S401包括如下步骤:
步骤1、根据数据库表名和列名与自然语言的表述映射关系将用户输入的自然语言文本转换为可输入给Text-to-SQL智能体的源语言文本;
步骤2、对可输入给Text-to-SQL智能体的源语言文本进行预处理。
7.一种基于深度学习的电网调控领域信息检索系统,其特征在于,包括:
训练数据构建模块:用于构建用来训练深度学习翻译模型的训练数据;
模型训练模块:用于根据从训练数据构建模块获得的训练数据对深度学习翻译模型进行训练,得到Text-to-SQL智能体;
问句解析模块:用于将用户输入的源语言解析成Text-to-SQL智能体能识别的源语言文本;
SQL后处理模块:用于将Text-to-SQL智能体输出的目标语言文本转换成数据库可执行的语句;
SQL运行模块:用于运行从SQL后处理模块获得的数据库可执行的语句,从数据库中检索所需要的信息。
8.如权利要求7所述的基于深度学习的电网调控领域信息检索系统,其特征在于,还包括数据预处理模块,用于对输入深度学习翻译模型和/或Text-to-SQL智能体的语句进行预处理。
9.如权利要求7所述的基于深度学习的电网调控领域信息检索系统,其特征在于,还包括映射关系构建模块,用于构建数据库表名和/或列名与自然语言的表述映射关系。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述基于深度学习的电网调控领域信息检索方法的步骤。
CN202111341702.2A 2021-11-12 2021-11-12 基于深度学习的电网调控领域信息检索方法、系统和介质 Pending CN114116779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111341702.2A CN114116779A (zh) 2021-11-12 2021-11-12 基于深度学习的电网调控领域信息检索方法、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111341702.2A CN114116779A (zh) 2021-11-12 2021-11-12 基于深度学习的电网调控领域信息检索方法、系统和介质

Publications (1)

Publication Number Publication Date
CN114116779A true CN114116779A (zh) 2022-03-01

Family

ID=80379242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111341702.2A Pending CN114116779A (zh) 2021-11-12 2021-11-12 基于深度学习的电网调控领域信息检索方法、系统和介质

Country Status (1)

Country Link
CN (1) CN114116779A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737909A (zh) * 2023-07-28 2023-09-12 无锡容智技术有限公司 基于自然语言对话的表数据处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737909A (zh) * 2023-07-28 2023-09-12 无锡容智技术有限公司 基于自然语言对话的表数据处理方法
CN116737909B (zh) * 2023-07-28 2024-04-23 无锡容智技术有限公司 基于自然语言对话的表数据处理方法

Similar Documents

Publication Publication Date Title
CN104361127B (zh) 基于领域本体和模板逻辑的多语种问答接口快速构成方法
CN112527997B (zh) 一种基于电网领域调度场景知识图谱的智能问答方法及系统
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN110188345B (zh) 一种电力操作票的智能识别方法与装置
CN110442880B (zh) 一种机器翻译译文的翻译方法、装置及存储介质
CN116719520B (zh) 代码生成方法及装置
CN115525768A (zh) 一种领域知识图谱可视化构建方法及装置
CN116820429A (zh) 代码处理模型的训练方法、装置、电子设备及存储介质
CN107526717B (zh) 一种将结构化流程模型自动生成自然语言文本的方法
CN114116779A (zh) 基于深度学习的电网调控领域信息检索方法、系统和介质
CN111625596B (zh) 新能源实时消纳调度的多源数据同步共享方法及系统
CN112527272B (zh) 对接tvm的方法及相关设备
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
CN112148879B (zh) 一种自动给代码打数据结构标签的计算机可读存储介质
CN115543437B (zh) 一种代码注释生成方法和系统
CN116541533A (zh) 基于多源异构数据的风力发电机多模态工艺图谱建模方法
CN116523041A (zh) 装备领域知识图谱构建方法、检索方法、系统及电子设备
CN117289938A (zh) 一种软件开发用智能辅助系统
CN116108175A (zh) 基于语义解析和数据构造的语言转化方法及系统
CN116483314A (zh) 一种自动化智能活动图生成方法
CN115292448A (zh) 语言转义方法、装置、设备及存储介质
CN109828775B (zh) 一种多语言翻译文本内容的web管理系统及方法
CN107092515B (zh) 一种基于回答集逻辑程序的lpmln推理方法及系统
CN111368091A (zh) 文档翻译方法及装置
CN117252201B (zh) 面向知识图谱的离散型制造行业工艺数据提取方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination